Análisis y minería de datos
bryanpauvifrExamen23 de Abril de 2023
2.520 Palabras (11 Páginas)173 Visitas
[pic 1]
Instituto Profesional AIEP
Vicerrectoría Académica
[pic 2]
TALLER RECUPERATIVO EVALUACIÓN UNIDAD 1
Módulo AMD101 ANÁLISIS Y MINERÍA DE DATOS 2022-2
NOMBRE DEL ESTUDIANTE: | Bryan Pauvif Ramirez Andrea Gonzalez Miranda | NOTA: | |
RUN: | 20482153-4 | FECHA: | 20 de diciembre 2022 |
SEDE: | AIEP Valparaíso | ||
CARRERA: | INGENIERIA EN ADMINISTRACION | ||
PUNTAJE TOTAL ESPERADO: | 32 PUNTOS (8 subtareas; 4 puntos c/u) | PUNTAJE MÍNIMO DE APROBACIÓN | 19 PUNTOS |
PUNTAJE TOTAL OBTENIDO: | PUNTOS | NIVEL DE EXIGENCIA: 60% | |
INSTRUCCIONES GENERALES: | |||
Ttiempo estimado para su desarrollo: Máximo de 2 horas. | |||
Se prohíbe el uso de cualquier dispositivo electrónico móvil, salvo que sea requerido para su desarrollo. | |||
Ante plagio, copia y utilización de información ajena a la proporcionada en este documento, el estudiante será calificado con nota 1,0, salvo que sea explícitamente señalada o solicitada para su desarrollo. | |||
INSTRUCCIONES ESPECÍFICAS: | |||
Este taller debe ser realizado de manera autónoma y transversal al desarrollo de las clases del módulo con el acompañamiento de tu docente u otro que sea asignado para cumplir un rol de apoyo académico, reforzando conceptos o procedimientos descendidos o débilmente logrados previamente a través de la resolución de dudas y/o la revisión de material complementario de profundización si se requiere. El plazo total de tiempo que tendrás disponible para desarrollar y entregar este taller será informado por el docente que te solicite realizar la actividad para su consideración. | |||
Antes de realizar las tareas del taller, analice/n los CASOS en los que se debe basar para desarrollarlas/entregar correcta y completamente las tareas en este mismo documento digital. | |||
Antes de iniciar la realización del taller revise/n y considere/n los siguientes REQUERIMIENTOS DE EJECUCIÓN/ENTREGA DE LAS TAREAS para su correcto y oportuno desarrollo. |
REQUERIMIENTOS DE EJECUCIÓN/ENTREGA DE LAS TAREAS/SUBTAREAS | |||||||||||||
Modalidades en que puede ser realizada esta actividad |
| ||||||||||||
Tipos de tareas y tiempo estimado de desarrollo. | Tarea nro. 1: Subtareas 1A, 1B, 1C y 1D son de ejecución indirecta. Tiempo promedio: 60 minutos Descripción: ✓ Las tareas de ejecución indirecta (o de producto, entregable), son situaciones centradas en lo que puede desarrollar y entregar el estudiante, enfocándose en el encargo solicitado en formato físico o digital. Tarea nro. 2: Subtareas 2A, 2B, 2C y 2D son de ejecución indirecta. Tiempo promedio: 60 minutos Descripción: ✓ Las tareas de ejecución indirecta (o de producto, entregable), son situaciones centradas en lo que puede desarrollar y entregar el estudiante, enfocándose en el encargo solicitado en formato físico o digital. | ||||||||||||
Herramientas Para desarrollar la actividad. | Dispositivo(s) físico(s): ☒ Computador/Notebook. ☒ Teclado/ratón. | Dispositivo(s) virtual(es): ☒ Navegador Web. (Explorer, Chrome, Firefox, u otro) ☒ Editor de textos (Microsoft Word, Google ☒ Conexión a internet. | |||||||||||
Modo de realización | ☒ Individual.
| ☒ Grupal. Máximo: 3 estudiantes. | |||||||||||
Aspectos de contenido | Indicación: Desarrolle en esta plantilla de informe en formato digital (.docx) cada una de las subtareas expuestas para ambos casos a analizar. | ||||||||||||
Producto entregable solicitado: | |||||||||||||
☒ Informe/Reporte | |||||||||||||
Aspectos formales | Una vez desarrollado individual o grupalmente en tamaño carta., se debe entregar adjunto a tu docente a su correo AIEP con el siguiente formato de nombre de archivo:
Su desarrollo debe considerar las siguientes formalidades mínimas.
| ||||||||||||
Normas y estilos de redacción: ☒ Argumentativo. | |||||||||||||
Formato digital de entrega: ☒ Editor de textos (Microsoft Word, Google Docs u otro). |
Aprendizaje Esperado (A.E.): 2. Distinguen tipos de datos a utilizar en un proceso de minería de datos, de acuerdo con sus características. | |
Criterios de Evaluación (C.E.): 1.6.-Identifica tipos de datos presentes en la minería de datos de acuerdo con su formato y organización. 1.7.-Identifica tipos de datos utilizados en la minería de datos, en función de su estructura. 1.8.-Distingue tipos de repositorios de datos acorde a sus características. 1.9.-Identifica casos de uso de datos en función de su tipo. 1.10.-Trabaja de forma colaborativa y en red, a través de diversos medios y soportes, adoptando diferentes roles. | |
CASO N°1 “LA EXPANSIÓN DE DON-DRON” | |
Lea el siguiente caso y luego desarrolle la tarea N.°1 junto con sus subtareas:
| |
TAREA DE EJECUCIÓN 1 | |
Tarea nro. 1 Con la información presentada en el caso “La expansión de Don-Dron.”, distingan los tipos de datos a utilizar en un proceso de minería de datos, por medio del desarrollo de las siguientes subtareas. Subtareas 1A) Identifique/n al menos 2 tipos de datos que estén presentes en el caso expuesto, justificando con 1 argumento por qué cada uno de estos tipos de datos ayudará a la toma de decisión de esta empresa. Desarrollo: Los datos especificados pueden ser los siguientes según su estructura: W. Wide Web: Es un sistema que funciona a través de Internet, por el cual se pueden transmitir diversos tipos de datos a través del Protocolo de Transferencia de Hipertextos o HTTP, que son los enlaces de la página web. Sus características son: es un sistema a través del cual se gestiona información que será compartida por internet; es necesario tener conexión a internet a través de alguna aplicación para poder utilizar la web, por ejemplo, Chrome, Mozilla, Safari y otros navegadores web, que son herramientas de internet que nos permiten acceder a un gran número de contenidos que a su vez nos direccionan a otras páginas y así sucesivamente. También pueden ser usados para extraer patrones frecuentes de accesos o patrones inusuales de comportamiento posiblemente injustificado. Interacciones financieras: El uso de cajero automático, pagos realizados en línea y el uso de tarjeta de crédito, crean datos automatizados, los cuales pueden ser muchas veces utilizados para extraer modelos sobre un fraude o una actividad inusual. Interacciones del usuario: La mayor parte de las interacciones del usuario crean grandes volúmenes de datos. Esto menciona los gustos y preferencias del consumidor, lugares más visitados, que suele visitar en la red, etc. 1B) ¿Qué tipo de estructura de datos debería utilizar el equipo de Analytics para trabajar de mejor manera sus datos? Entregue 1 argumento para justificar técnicamente su respuesta. Desarrollo: D. Estructurados: Se llama datos estructurados cuando los datos están en un formato estandarizado, tienen una estructura bien definida, cumplen con un modelo de datos, siguen un orden persistente y son de fácil acceso para humanos y programas. Este tipo de datos generalmente se almacena en una base de datos. 1C) ¿Qué tipo de repositorios de datos le/s recomendarían al equipo de Analytics para que puedan sacar estadísticas e informes de manera más rápida y eficaz? Indique/n al menos 2 tipos de repositorios, entregando como mínimo 1 argumento por cada uno justificar técnicamente su respuesta. Desarrollo: Se recomiendan los siguientes tipos de repositorios, considerando uno de los más completos el Data Warehouse. Base de Datos: Es una recopilación organizada de información o datos estructurados, que normalmente se almacena de forma electrónica en un sistema informático. Normalmente, una base de datos está controlada por un sistema de gestión de bases de datos (DBMS). Data Warehouse: Es un almacén electrónico donde generalmente una empresa u organización mantiene una gran cantidad de información. Los datos de un data warehouse deben almacenarse de forma segura, fiable, fácil de recuperar y fácil de administrar. 1D) Indique/n qué otro tipo de información podrían obtener para complementar las proyecciones del equipo y mencione/n a qué tipo de dato corresponde, la estructura de estos datos, así como también si cambiara/n el tipo de repositorio identificado en el punto anterior o si seguiría/n manteniendo la misma estrategia. Desarrollo: Seguimos manteniendo la misma estrategia en el repositorio y consideraríamos los datos estructurados debido a que estos se clasifican con mayor frecuencia como datos cuantitativos, y es el tipo de datos con el que la mayoría de nosotros estamos acostumbrados a trabajar, pensando en datos que encajen correctamente en campos y columnas fijos en bases de datos relacionadas y hojas de cálculos. | |
Aprendizaje Esperado (A.E.): 3. Clasifican técnicas empleadas para hacer minería de datos de acuerdo con sus características, usos y metodología. | |
Criterios de Evaluación (C.E.): 1.11.-Identifica el ciclo de vida del análisis de datos, en función de sus etapas. 1.12.-Identifica distintas técnicas de minería de datos de acuerdo con sus características. 1.13.-Diferencia el uso de las técnicas de minería de datos, en función de los objetivos definidos. 1.14.-Ejemplifica usos de las técnicas de minería de datos, a partir de casos de negocios. | |
CASO N°2: “TODOCLICK” | |
Lea el siguiente caso y luego desarrolle la tarea N.°2 junto con sus subtareas.
| |
TAREA DE EJECUCIÓN 2 | |
Tarea nro. 2 Con la información presentada en el caso “TodoClick”, distinga las técnicas empleadas para hacer minería de datos de acuerdo con sus características, usos y metodología, por medio del desarrollo de las siguientes subtareas. Subtareas 2A) Identifique/n y describa/n al menos 4 etapas del ciclo de vida del análisis de datos que debe realizar el equipo TI para generar el modelo solicitado en el caso “TodoClick).
Desarrollo: Al considerar que es un ciclo de vida debemos informar sus seis pasos para que estos se formulen correctamente el Ciclo de vida 1.- Descubrir Siempre es importante entender el problema que deseamos resolver, lo que requiere bastante tiempo, aún más si se desconoce el área del negocio, es importante que colaboren personas que tengan un conocimiento del área del negocio que deseamos comenzar. 2.- Preparación de los datos Es aquella que requiere del mayor esfuerzo tiene variados retos entre ellos, (Datos incompletos, eliminar datos, imputar con valores razonables entre otros. 3.- Planificación Modelo Identificación de tareas técnicas más apropiadas para la problemática entre ellas selección técnica, selección de métricas, planificación despliegue, planificación de la monitorización entre otros. 4.- Construcción del Modelo En este punto es donde comienza la minería de datos, ya que los datos ya han sido seleccionados y se hizo el proceso de limpieza y transformación de técnicas. 5.- Comunicación En esta etapa ya se comunican los resultados obtenidos a los diversos stakeholders, para ello se adecuan las vistas a los distintos niveles de intervinientes. Estos resultados se deben entregar mediante reportes, gráficas, infografías, cuadro de mandos, reportes, etc 6.- Operacionalización Se identifica la forma de integrar el modelo en las operaciones de la organización. Dentro de los objetivos de esta etapa se encuentra medir la capacidad de predicción del modelo en forma periódica y detectar si existe un aumento de errores en el modelo 2B) Describa/n las dos técnicas de minería que existen y mencione al menos 1 situación de ejemplo en donde cada una de estas técnicas pueda ayudar a la empresa del caso a mejorar sus ventas. (Esta situación solicitada debe ser diferente, es decir, no debe estar relacionada con el modelo que le pidieron al equipo TI en el caso TodoClick). Desarrollo: Técnicas de Minería existen Descriptivas y No descriptivas. Descriptivas: Esta técnica se encuentra estrechamente alineada con la inteligencia artificial
Predictivas: Aprendizaje supervisado que se basa en entrenar a un modelo o método con diferentes datos para poder predecir una variable basándose en la información otorgada.
2C) Considerando el problema que debe resolver el equipo de TI, indique/n cuál es el tipo de técnica de minería que se debe utilizar, mencionando al menos 3 argumentos en relación con los objetivos definidos para justificar su respuesta. Desarrollo: En este CASO consideramos tomar el formato de Análisis Descriptivo ya que esta toma datos sin procesar y los analiza. Generan:
2D) Considerando el tipo de técnica que identificaron en el punto anterior (2C), sugiera/n al equipo TI al menos 2 algoritmos correspondientes a este tipo de técnica y argumente/n técnicamente por qué serían buenas opciones para resolver el problema en cuestión. Desarrollo: Estas se presentan como buenas opciones para resolver el problema en cuestión: K-means: se basa en el análisis de grupo trata de dividir los datos recogidos en bloques separados y agrupados por características comunes. Clustering: La técnica requiere una agrupación de puntos de datos. Con el conjunto de puntos de datos, es posible utilizar este algoritmo para clasificar cada punto de datos en un clúster específico, en la segmentación del mercado dando paso a un marketing distinto, podemos agrupar documentos que nos indiquen términos importantes y relevantes y perfiles personalizados. | |
[pic 3]
...