Minería de datos.
oziel12345671Tesis19 de Noviembre de 2014
897 Palabras (4 Páginas)233 Visitas
Minería de datos
Introducción
La minería de datos es:
La tarea no trivial de extraer información implícita, previamente desconocida y potencialmente útil de bases de datos (Frawley et.al. 1992).
El proceso de descubrir conocimiento interesante de grandes cantidades de datos almacenadas en bases de datos, data warehouses u otro repositorio de información (Jiawei Han, Micheline Kamber 2001)
La minería de datos es el proceso de detectar la información procesable de los conjuntos grandes de datos. Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos. Normalmente, estos patrones no se pueden detectar mediante la exploración tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiado datos.(Microsoft 2014).
Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. Los modelos de minería de datos se pueden aplicar en escenarios como los siguientes:
Pronóstico: cálculo de las ventas y predicción de las cargas del servidor o del tiempo de inactividad del servidor.
Riesgo y probabilidad: elección de los mejores clientes para la distribución de correo directo, determinación del punto de equilibrio probable para los escenarios de riesgo, y asignación de probabilidades a diagnósticos y otros resultados.
Recomendaciones: determinación de los productos que se pueden vender juntos y generación de recomendaciones.
Búsqueda de secuencias: análisis de los artículos que los clientes han introducido en el carrito de la compra y predicción de posibles eventos.
Agrupación: distribución de clientes o eventos en grupos de elementos relacionados, y análisis y predicción de afinidades.
La generación de un modelo de minería de datos forma parte de un proceso mayor que incluye desde la formulación de preguntas acerca de los datos y la creación de un modelo para responderlas, hasta la implementación del modelo en un entorno de trabajo. Este proceso se puede definir mediante los seis pasos básicos siguientes:
• Definir el problema
• Preparar los datos
• Explorar los datos
• Generar modelos
• Explorar y validar los modelos
• Implementar y actualizar los modelos
Data Mining corresponde a una de las etapas del proceso llamado “Knowledge Discovery in Databases”. Está conformado por un conjunto de técnicas y algoritmos que sirven para hacer análisis de conjuntos de datos, extrayendo patrones y relaciones entre ellos, convirtiéndolos en información valiosa y útil para quienes toman las decisiones.
El uso potencial del Data Mining en las empresas es identificar nuevas oportunidades de negocio, adaptar los productos ofrecidos o encontrar los clientes más valiosos con el fin de retenerlos, y de esta manera aumentar los ingresos y reducir las pérdidas o costos. Al determinar las características de los buenos clientes (profiling), las empresas pueden enfocarse en aquellos de características similares y diseñar productos o servicios acordes a sus necesidades. Dentro de la industria de telecomunicaciones por ejemplo, las áreas de interés donde aplicar minería de datos son: detección de fraude, asignación de recursos para instalaciones o servicios técnicos, análisis de clientes, pronósticos de demanda, proyecciones de crecimiento de la industria y predicción de fallas en la red. Los algoritmos que destacan en estos casos son los de regresión, clustering y clasificación.
El uso de minería de datos se debe entender como un apoyo para los analistas, y no reemplaza al conocimiento que tienen los expertos del negocio, ni elimina la necesidad de entender los datos. El Data Mining no funciona por sí sólo, ya que los patrones que se encuentren en los datos deben ser interpretados
...