ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Practica Minería de datos en los negocios

Camila Maritza Rivera PachecoPráctica o problema6 de Septiembre de 2025

1.879 Palabras (8 Páginas)65 Visitas

Página 1 de 8

Curso de Tecnologías de Información  

UNIVERSIDAD CATÓLICA DE SANTA MARÍA

FACULTAD DE CIENCIAS E INGENIERÍAS FÍSICAS Y FORMALES

[pic 1]

INGENIERÍA INDUSTRIAL

PRACTICA

DE TECNOLOGIAS DE INFORMACION

Título de la Práctica

Minería de Datos en los Negocios

Código

2019702451

Apellidos y Nombres

Postigo Gómez, Jordan Giovanny

Sección

B

Horario

Miércoles 20:00 – 21:30

Docente

Marco Antonio Llaza Loayza

Fecha de entrega

27/10/2024

/

Semestre 2024 – II


Actividades de la practica:

2. Actividades de la práctica:

 - Realiza una comparación entre las metodologías KDD y CRISP-DM, identificando similitudes y diferencias. Discute cuál metodología te parece más adecuada para tu proyecto de minería de datos en un entorno de negocios, justificando tu respuesta.

Aspecto

KDD

CRISP-DM

Definición

Proceso de descubrimiento de conocimiento a partir de bases de datos mediante la extracción de patrones interesantes.

Metodología estándar para proyectos de minería de datos en industrias, basada en ciclos.

Fases principales

Selección de datos, Preprocesamiento, Transformación, Minería de datos, Evaluación e interpretación.

Comprensión del negocio, Comprensión de los datos, Preparación de los datos, Modelado, Evaluación, Despliegue.

Enfoque

Más académico, enfocado en la extracción de conocimiento.

Más orientado al negocio y la resolución de problemas específicos.

Dominio de aplicación

Aplicable a investigación y áreas más académicas.

Adaptable a múltiples industrias y sectores.

Flexibilidad

Menos flexible, sigue un proceso secuencial.

Muy flexible, permite iteraciones y ajustes a lo largo del proceso.

Énfasis en la comprensión del negocio

No se enfatiza como una fase propia, sino como parte del contexto general.

La comprensión del negocio es una fase crítica al inicio y guía todo el proceso.

Preguntas de reflexión:

  1. ¿Qué ventajas ofrece seguir un proceso estructurado como KDD o CRISP-DM en proyectos de minería de datos?
  • Estas metodologías brindan un marco que guía el proceso de minería de datos, asegurando una estructura clara y comprensible para los equipos.
  • Ayudan a evitar errores comunes y aseguran que las decisiones se basen en un análisis detallado y bien fundamentado.
  • Facilitan la comunicación entre los equipos técnicos y de negocio, lo que aumenta la coherencia en los resultados y la aplicación de los hallazgos.
  1. ¿Cómo influye la fase de "comprensión del negocio" en el éxito de un proyecto de minería de datos?
  • En CRISP-DM, esta fase es clave para el éxito, ya que asegura que los objetivos de negocio estén bien alineados con el análisis de datos. Entender el problema del negocio define el enfoque del análisis, lo que aumenta las probabilidades de generar soluciones relevantes y aplicables.
  • En KDD, aunque no se enfatiza como una fase separada, la comprensión del contexto del negocio sigue siendo importante, aunque de manera implícita.

Parte 2: Aplicación de Métodos de Minería de Datos en un Caso de Estudio.

Descripción del Caso de Estudio:

RetailMax S.A., una empresa de comercio minorista, desea aplicar Minería de datos, para

entender mejor el comportamiento de sus clientes y mejorar sus estrategias de marketing y

ventas. La empresa cuenta con un conjunto de datos históricos que contiene información

sobre las compras realizadas por los clientes, características demográficas y hábitos de

consumo.

Objetivos del negocio:

 - Identificar patrones de comportamiento en los clientes que puedan ser utilizados para

personalizar ofertas y promociones.

 - Predecir qué clientes tienen más probabilidades de realizar una compra recurrente.

 - Segmentar a los clientes en grupos para diseñar campañas de marketing más efectivas.

Datos disponibles:

El conjunto de datos contiene las siguientes variables:

 - ID del cliente

 - Edad

 - Género

 - Ingreso anual

 - Frecuencia de compra (mensual)

 - Monto total gastado

 - Categoría de productos comprados

Actividad 2: Fases del Proceso CRISP-DM en el Caso de RetailMax S.A.

1. Comprensión del Negocio:

 - En esta fase, identifica los objetivos de negocio de RetailMax y formula preguntas clave que el análisis de datos debe responder. Ejemplo: ¿Qué características definen a los clientes más valiosos? ¿Cómo podemos predecir futuras compras de los clientes?

  • Objetivo: Identificar patrones de comportamiento en los clientes para personalizar ofertas y promociones, predecir clientes con alta probabilidad de compra recurrente, y segmentar a los clientes para campañas más efectivas.
  • Preguntas clave: ¿Cuáles son las características de los clientes más valiosos? ¿Cómo predecir futuras compras? Estas preguntas ayudarán a alinear el análisis de datos con los objetivos del negocio.

2. Comprensión de los Datos:

 - Realiza una “exploración de los datos” proporcionados. Describe las distribuciones, valores

faltantes y cualquier anomalía en los datos. ¿Qué patrones iniciales observas en las variables?

  • Exploración: Realizar un análisis inicial del conjunto de datos (distribuciones, valores faltantes, anomalías) para entender la calidad de los datos.
  • Patrones iniciales: Identificar tendencias o distribuciones en variables como edad, ingresos, frecuencia de compra, etc.

3. Preparación de los Datos:

 - Prepara los datos para su análisis eliminando valores faltantes, normalizando variables

como "Ingreso anual" y "Monto total gastado", y convirtiendo variables categóricas en

numéricas si es necesario.

Limpieza y transformación: Eliminar valores faltantes, normalizar variables como “Ingreso anual” y “Monto total gastado”, y convertir variables categóricas a numéricas para facilitar el análisis.

Actividad 3: Aplicación de Métodos de Minería de Datos

A continuación, los participantes deberán aplicar diferentes técnicas de ”Minería de Datos” al

caso de RetailMax S.A., utilizando herramientas como Python (Scikit-learn), R, o cualquier

software de minería de datos disponible (RapidMiner, Weka, etc.).

1. Clasificación:

 - Utiliza un algoritmo de clasificación, como Árboles de Decisión o Regresión Logística, para

predecir qué clientes tienen más probabilidades de realizar una compra en el próximo mes.

 - Interpreta los resultados del modelo: ¿Qué variables fueron más relevantes para la

clasificación?

2. Clustering (Agrupamiento):

 - Aplica un algoritmo de Clustering como K-Means para segmentar a los clientes en grupos.

...

Descargar como (para miembros actualizados) txt (13 Kb) pdf (1 Mb) docx (2 Mb)
Leer 7 páginas más »
Disponible sólo en Clubensayos.com