Practica Minería de datos en los negocios
Camila Maritza Rivera PachecoPráctica o problema6 de Septiembre de 2025
1.879 Palabras (8 Páginas)65 Visitas
Curso de Tecnologías de Información
UNIVERSIDAD CATÓLICA DE SANTA MARÍA
FACULTAD DE CIENCIAS E INGENIERÍAS FÍSICAS Y FORMALES
[pic 1]
INGENIERÍA INDUSTRIAL
PRACTICA
DE TECNOLOGIAS DE INFORMACION
Título de la Práctica | Minería de Datos en los Negocios |
Código 2019702451 | Apellidos y Nombres Postigo Gómez, Jordan Giovanny |
Sección | B |
Horario | Miércoles 20:00 – 21:30 |
Docente | Marco Antonio Llaza Loayza |
Fecha de entrega | 27/10/2024 |
/
Semestre 2024 – II
Actividades de la practica:
2. Actividades de la práctica:
- Realiza una comparación entre las metodologías KDD y CRISP-DM, identificando similitudes y diferencias. Discute cuál metodología te parece más adecuada para tu proyecto de minería de datos en un entorno de negocios, justificando tu respuesta.
Aspecto | KDD | CRISP-DM |
Definición | Proceso de descubrimiento de conocimiento a partir de bases de datos mediante la extracción de patrones interesantes. | Metodología estándar para proyectos de minería de datos en industrias, basada en ciclos. |
Fases principales | Selección de datos, Preprocesamiento, Transformación, Minería de datos, Evaluación e interpretación. | Comprensión del negocio, Comprensión de los datos, Preparación de los datos, Modelado, Evaluación, Despliegue. |
Enfoque | Más académico, enfocado en la extracción de conocimiento. | Más orientado al negocio y la resolución de problemas específicos. |
Dominio de aplicación | Aplicable a investigación y áreas más académicas. | Adaptable a múltiples industrias y sectores. |
Flexibilidad | Menos flexible, sigue un proceso secuencial. | Muy flexible, permite iteraciones y ajustes a lo largo del proceso. |
Énfasis en la comprensión del negocio | No se enfatiza como una fase propia, sino como parte del contexto general. | La comprensión del negocio es una fase crítica al inicio y guía todo el proceso. |
Preguntas de reflexión:
- ¿Qué ventajas ofrece seguir un proceso estructurado como KDD o CRISP-DM en proyectos de minería de datos?
- Estas metodologías brindan un marco que guía el proceso de minería de datos, asegurando una estructura clara y comprensible para los equipos.
- Ayudan a evitar errores comunes y aseguran que las decisiones se basen en un análisis detallado y bien fundamentado.
- Facilitan la comunicación entre los equipos técnicos y de negocio, lo que aumenta la coherencia en los resultados y la aplicación de los hallazgos.
- ¿Cómo influye la fase de "comprensión del negocio" en el éxito de un proyecto de minería de datos?
- En CRISP-DM, esta fase es clave para el éxito, ya que asegura que los objetivos de negocio estén bien alineados con el análisis de datos. Entender el problema del negocio define el enfoque del análisis, lo que aumenta las probabilidades de generar soluciones relevantes y aplicables.
- En KDD, aunque no se enfatiza como una fase separada, la comprensión del contexto del negocio sigue siendo importante, aunque de manera implícita.
Parte 2: Aplicación de Métodos de Minería de Datos en un Caso de Estudio.
Descripción del Caso de Estudio:
RetailMax S.A., una empresa de comercio minorista, desea aplicar Minería de datos, para
entender mejor el comportamiento de sus clientes y mejorar sus estrategias de marketing y
ventas. La empresa cuenta con un conjunto de datos históricos que contiene información
sobre las compras realizadas por los clientes, características demográficas y hábitos de
consumo.
Objetivos del negocio:
- Identificar patrones de comportamiento en los clientes que puedan ser utilizados para
personalizar ofertas y promociones.
- Predecir qué clientes tienen más probabilidades de realizar una compra recurrente.
- Segmentar a los clientes en grupos para diseñar campañas de marketing más efectivas.
Datos disponibles:
El conjunto de datos contiene las siguientes variables:
- ID del cliente
- Edad
- Género
- Ingreso anual
- Frecuencia de compra (mensual)
- Monto total gastado
- Categoría de productos comprados
Actividad 2: Fases del Proceso CRISP-DM en el Caso de RetailMax S.A.
1. Comprensión del Negocio:
- En esta fase, identifica los objetivos de negocio de RetailMax y formula preguntas clave que el análisis de datos debe responder. Ejemplo: ¿Qué características definen a los clientes más valiosos? ¿Cómo podemos predecir futuras compras de los clientes?
- Objetivo: Identificar patrones de comportamiento en los clientes para personalizar ofertas y promociones, predecir clientes con alta probabilidad de compra recurrente, y segmentar a los clientes para campañas más efectivas.
- Preguntas clave: ¿Cuáles son las características de los clientes más valiosos? ¿Cómo predecir futuras compras? Estas preguntas ayudarán a alinear el análisis de datos con los objetivos del negocio.
2. Comprensión de los Datos:
- Realiza una “exploración de los datos” proporcionados. Describe las distribuciones, valores
faltantes y cualquier anomalía en los datos. ¿Qué patrones iniciales observas en las variables?
- Exploración: Realizar un análisis inicial del conjunto de datos (distribuciones, valores faltantes, anomalías) para entender la calidad de los datos.
- Patrones iniciales: Identificar tendencias o distribuciones en variables como edad, ingresos, frecuencia de compra, etc.
3. Preparación de los Datos:
- Prepara los datos para su análisis eliminando valores faltantes, normalizando variables
como "Ingreso anual" y "Monto total gastado", y convirtiendo variables categóricas en
numéricas si es necesario.
Limpieza y transformación: Eliminar valores faltantes, normalizar variables como “Ingreso anual” y “Monto total gastado”, y convertir variables categóricas a numéricas para facilitar el análisis.
Actividad 3: Aplicación de Métodos de Minería de Datos
A continuación, los participantes deberán aplicar diferentes técnicas de ”Minería de Datos” al
caso de RetailMax S.A., utilizando herramientas como Python (Scikit-learn), R, o cualquier
software de minería de datos disponible (RapidMiner, Weka, etc.).
1. Clasificación:
- Utiliza un algoritmo de clasificación, como Árboles de Decisión o Regresión Logística, para
predecir qué clientes tienen más probabilidades de realizar una compra en el próximo mes.
- Interpreta los resultados del modelo: ¿Qué variables fueron más relevantes para la
clasificación?
2. Clustering (Agrupamiento):
- Aplica un algoritmo de Clustering como K-Means para segmentar a los clientes en grupos.
...