ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Análisis y minería de datos

bryanpauvifrExamen23 de Abril de 2023

2.520 Palabras (11 Páginas)173 Visitas

Página 1 de 11

                     [pic 1]

Instituto Profesional AIEP

Vicerrectoría Académica

                    [pic 2]

TALLER RECUPERATIVO EVALUACIÓN UNIDAD 1

Módulo AMD101 ANÁLISIS Y MINERÍA DE DATOS 2022-2

NOMBRE DEL ESTUDIANTE:

Bryan Pauvif Ramirez

Andrea Gonzalez Miranda

NOTA:

RUN:

20482153-4

FECHA:

20 de diciembre 2022

SEDE:

AIEP Valparaíso

CARRERA:

INGENIERIA EN ADMINISTRACION

PUNTAJE TOTAL ESPERADO:

       32 PUNTOS

(8 subtareas; 4

puntos c/u)

PUNTAJE MÍNIMO DE APROBACIÓN

  19 PUNTOS

PUNTAJE TOTAL OBTENIDO:

                              PUNTOS

NIVEL DE EXIGENCIA: 60%

INSTRUCCIONES GENERALES:

 Ttiempo estimado para su desarrollo: Máximo de 2 horas.

Se prohíbe el uso de cualquier dispositivo electrónico móvil, salvo que sea requerido para su desarrollo.

Ante plagio, copia y utilización de información ajena a la proporcionada en este documento, el estudiante será calificado con nota 1,0, salvo que sea explícitamente señalada o solicitada para su desarrollo.

INSTRUCCIONES ESPECÍFICAS:

Este taller debe ser realizado de manera autónoma y transversal al desarrollo de las clases del módulo con el acompañamiento de tu docente u otro que sea asignado para cumplir un rol de apoyo académico, reforzando conceptos o procedimientos descendidos o débilmente logrados previamente a través de la resolución de dudas y/o la revisión de material complementario de profundización si se requiere.

El plazo total de tiempo que tendrás disponible para desarrollar y entregar este taller será informado por el docente que te solicite realizar la actividad para su consideración.

Antes de realizar las tareas del taller, analice/n los CASOS en los que se debe basar para desarrollarlas/entregar correcta y completamente las tareas en este mismo documento digital.

Antes de iniciar la realización del taller revise/n y considere/n los siguientes REQUERIMIENTOS DE EJECUCIÓN/ENTREGA DE LAS TAREAS para su correcto y oportuno desarrollo.

REQUERIMIENTOS DE EJECUCIÓN/ENTREGA DE LAS TAREAS/SUBTAREAS

Modalidades en que puede ser realizada esta actividad

X

PRESENCIAL

Sincrónica en sede (taller, laboratorio o terreno)

X

TELEPRESENCIAL

Sincrónica remota en plataforma virtual

X

SEMIPRESENCIAL

Mixta o hibrida (presencial o remota)

X

ONLINE

Asincrónica en plataforma virtual

Tipos de tareas y tiempo estimado de desarrollo.

Tarea nro. 1:

Subtareas 1A, 1B, 1C y 1D son de ejecución indirecta.  

Tiempo promedio:   60 minutos  

Descripción:

 Las tareas de ejecución indirecta (o de producto, entregable), son situaciones centradas en lo que puede desarrollar y entregar el estudiante, enfocándose en el encargo solicitado en formato físico o digital.

Tarea nro. 2:

Subtareas 2A, 2B, 2C y 2D son de ejecución indirecta.  

Tiempo promedio:   60 minutos  

Descripción:

Las tareas de ejecución indirecta (o de producto, entregable), son situaciones centradas en lo que puede desarrollar y entregar el estudiante, enfocándose en el encargo solicitado en formato físico o digital.

Herramientas

Para desarrollar la actividad.

Dispositivo(s) físico(s):

  Computador/Notebook.

  Teclado/ratón.

Dispositivo(s) virtual(es):

  Navegador Web. (Explorer, Chrome, Firefox, u otro)

  Editor de textos (Microsoft Word, Google

  Conexión a internet.

Modo

de realización

  Individual.  

   

  Grupal. Máximo: 3 estudiantes.

Aspectos de contenido

Indicación: Desarrolle en esta plantilla de informe en formato digital (.docx) cada una de las subtareas expuestas para ambos casos a analizar.

Producto entregable solicitado:

  Informe/Reporte

Aspectos formales

Una vez desarrollado individual o grupalmente en tamaño carta., se debe entregar adjunto a tu docente a su correo AIEP con el siguiente formato de nombre de archivo:

  • Apellido1_Inicial Nombre1 (añadir demás integrantes en caso de ser desarrollado grupalmente) Taller U1 AMD101 2022-2

Su desarrollo debe considerar las siguientes formalidades mínimas.

  • Títulos: fuente arial, tamaño de fuente 14, en mayúsculas.
  • Subtítulos: fuente arial, tamaño de fuente 10, en mayúsculas.
  • Texto: fuente arial, tamaño de fuente 10.

Normas y estilos de redacción:    Argumentativo.  

Formato digital de entrega:

   Editor de textos (Microsoft Word, Google Docs u otro).  

Aprendizaje Esperado (A.E.): 

2. Distinguen tipos de datos a utilizar en un proceso de minería de datos, de acuerdo con sus características.

Criterios de Evaluación (C.E.): 

1.6.-Identifica tipos de datos presentes en la minería de datos de acuerdo con su formato y organización.

1.7.-Identifica tipos de datos utilizados en la minería de datos, en función de su estructura.

1.8.-Distingue tipos de repositorios de datos acorde a sus características.

1.9.-Identifica casos de uso de datos en función de su tipo.

1.10.-Trabaja de forma colaborativa y en red, a través de diversos medios y soportes, adoptando diferentes roles.

CASO N°1 “LA EXPANSIÓN DE DON-DRON”

Lea el siguiente caso y luego desarrolle la tarea N.°1 junto con sus subtareas:

La empresa Don-Dron se especializa en la venta de drones, y este último año ha alcanzado su máximo histórico en ventas logrando superar en el triple las ventas realizadas el año 2021. Debido a su éxito en ventas el directorio está pensando en realizar una inversión importante, la cual consiste en diversificar sus productos y servicios.

La empresa cree que, la gran mayoría de las personas que adquiere un dron profesional no tiene la experiencia suficiente para volar correctamente estos dispositivos, y más aún no poseen licencia para utilizarlos de manera formal para realizar trabajos con ellos. Por esta razón, la empresa busca realizar clases y además brindar facilidades para que los usuarios puedan adquirir su licencia profesional. Sin embargo, para realizar esta inversión que involucrará: contratación de pilotos profesionales, creación de cursos online y presenciales y campañas de marketing, es necesario realizar un estudio de mercado orientado en conocer la cantidad de personas que actualmente están buscando o realizando clases de drones y también aquellos empleos que piden como requisito que el postulante tenga licencia profesional para volar dron.

El estudio se realizará mediante la técnica de webscraping, principalmente en los sitios más conocidos de clases particulares para aprender a volar dron y también en los portales de empleos.

Los datos extraídos serán almacenados la arquitectura Cloud de Amazon Web Services que posee la empresa, de esa forma el equipo de Analytics podrá calcular las proyecciones de éxito para presentarlas ante el directorio, para ello deberán considerar tanto los resultados de la búsqueda como también las ventas del año diferenciando entre drones profesionales y no profesionales.

 

SITUACIÓN: HIPOTÉTICA.                

FUENTE: ELABORACIÓN PROPIA.

TAREA DE EJECUCIÓN 1

Tarea nro. 1

Con la información presentada en el caso “La expansión de Don-Dron.”, distingan los tipos de datos a utilizar en un proceso de minería de datos, por medio del desarrollo de las siguientes subtareas.

Subtareas 

1A) Identifique/n al menos 2 tipos de datos que estén presentes en el caso expuesto, justificando con 1 argumento por qué cada uno de estos tipos de datos ayudará a la toma de decisión de esta empresa.  

Desarrollo:

Los datos especificados pueden ser los siguientes según su estructura:

W. Wide Web: Es un sistema que funciona a través de Internet, por el cual se pueden transmitir diversos tipos de datos a través del Protocolo de Transferencia de Hipertextos o HTTP, que son los enlaces de la página web. Sus características son: es un sistema a través del cual se gestiona información que será compartida por internet; es necesario tener conexión a internet a través de alguna aplicación para poder utilizar la web, por ejemplo, Chrome, MozillaSafari y otros navegadores web, que son herramientas de internet que nos permiten acceder a un gran número de contenidos que a su vez nos direccionan a otras páginas y así sucesivamente. También pueden ser usados para extraer patrones frecuentes de accesos o patrones inusuales de comportamiento posiblemente injustificado.

Interacciones financieras: El uso de cajero automático, pagos realizados en línea y el uso de tarjeta de crédito, crean datos automatizados, los cuales pueden ser muchas veces utilizados para extraer modelos sobre un fraude o una actividad inusual.

Interacciones del usuario: La mayor parte de las interacciones del usuario crean grandes volúmenes de datos. Esto menciona los gustos y preferencias del consumidor, lugares más visitados, que suele visitar en la red, etc.

1B) ¿Qué tipo de estructura de datos debería utilizar el equipo de Analytics para trabajar de mejor manera sus datos? Entregue 1 argumento para justificar técnicamente su respuesta.

Desarrollo:

D. Estructurados: Se llama datos estructurados cuando los datos están en un formato estandarizado, tienen una estructura bien definida, cumplen con un modelo de datos, siguen un orden persistente y son de fácil acceso para humanos y programas. Este tipo de datos generalmente se almacena en una base de datos.

1C) ¿Qué tipo de repositorios de datos le/s recomendarían al equipo de Analytics para que puedan sacar estadísticas e informes de manera más rápida y eficaz? Indique/n al menos 2 tipos de repositorios, entregando como mínimo 1 argumento por cada uno justificar técnicamente su respuesta.

Desarrollo:

Se recomiendan los siguientes tipos de repositorios, considerando uno de los más completos el Data Warehouse.

Base de Datos: Es una recopilación organizada de información o datos estructurados, que normalmente se almacena de forma electrónica en un sistema informático. Normalmente, una base de datos está controlada por un sistema de gestión de bases de datos (DBMS).

Data Warehouse: Es un almacén electrónico donde generalmente una empresa u organización mantiene una gran cantidad de información. Los datos de un data warehouse deben almacenarse de forma segura, fiable, fácil de recuperar y fácil de administrar.

1D) Indique/n qué otro tipo de información podrían obtener para complementar las proyecciones del equipo y mencione/n a qué tipo de dato corresponde, la estructura de estos datos, así como también si cambiara/n el tipo de repositorio identificado en el punto anterior o si seguiría/n manteniendo la misma estrategia.

Desarrollo:

Seguimos manteniendo la misma estrategia en el repositorio y consideraríamos los datos estructurados debido a que estos se clasifican con mayor frecuencia como datos cuantitativos, y es el tipo de datos con el que la mayoría de nosotros estamos acostumbrados a trabajar, pensando en datos que encajen correctamente en campos y columnas fijos en bases de datos relacionadas y hojas de cálculos.

Aprendizaje Esperado (A.E.): 

3. Clasifican técnicas empleadas para hacer minería de datos de acuerdo con sus características, usos y metodología.

Criterios de Evaluación (C.E.): 

1.11.-Identifica el ciclo de vida del análisis de datos, en función de sus etapas.

1.12.-Identifica distintas técnicas de minería de datos de acuerdo con sus características.

1.13.-Diferencia el uso de las técnicas de minería de datos, en función de los objetivos definidos.

1.14.-Ejemplifica usos de las técnicas de minería de datos, a partir de casos de negocios.

CASO N°2: “TODOCLICK”

Lea el siguiente caso y luego desarrolle la tarea N.°2 junto con sus subtareas.

Una reconocida tienda de vestuario online, TodoClick, tiene como objetivo aumentar sus ventas en base a los datos. Para ello, contrataron personal de TI que les ayudará a desarrollar un modelo que les permita recomendar artículos a sus clientes en base a sus compras de forma permanente. El sistema debe ser capaz de recomendar siempre elementos de preferencia del cliente.

Para realizar este proyecto el equipo TI cuenta con los siguientes datos de los clientes: Rut, correo, sexo, localidad, ítem y sección a la que pertenece el ítem o producto comprado. Además, es importante mencionar que existen ocasiones en que los usuarios compran sus productos sin estar registrados, por lo que en esos casos se tienen elementos faltantes en algunos campos como: sexo, localidad y Rut.

 

SITUACIÓN: HIPOTÉTICA.                

FUENTE: ELABORACIÓN PROPIA.

TAREA DE EJECUCIÓN 2

Tarea nro. 2

Con la información presentada en el caso “TodoClick”, distinga las técnicas empleadas para hacer minería de datos de acuerdo con sus características, usos y metodología, por medio del desarrollo de las siguientes subtareas.

Subtareas 

2A) Identifique/n y describa/n al menos 4 etapas del ciclo de vida del análisis de datos que debe realizar el equipo TI para generar el modelo solicitado en el caso “TodoClick).

 

Desarrollo:

Al considerar que es un ciclo de vida debemos informar sus seis pasos para que estos se formulen correctamente el Ciclo de vida

1.- Descubrir

Siempre es importante entender el problema que deseamos resolver, lo que requiere bastante tiempo, aún más si se desconoce el área del negocio, es importante que colaboren personas que tengan un conocimiento del área del negocio que deseamos comenzar.

2.- Preparación de los datos

Es aquella que requiere del mayor esfuerzo tiene variados retos entre ellos, (Datos incompletos, eliminar datos, imputar con valores razonables entre otros.

3.- Planificación Modelo

Identificación de tareas técnicas más apropiadas para la problemática entre ellas selección técnica, selección de métricas, planificación despliegue, planificación de la monitorización entre otros.

4.- Construcción del Modelo

En este punto es donde comienza la minería de datos, ya que los datos ya han sido seleccionados y se hizo el proceso de limpieza y transformación de técnicas.

5.- Comunicación

En esta etapa ya se comunican los resultados obtenidos a los diversos stakeholders, para ello se adecuan las vistas a los distintos niveles de intervinientes. Estos resultados se deben entregar mediante reportes, gráficas, infografías, cuadro de mandos, reportes, etc

6.- Operacionalización

Se identifica la forma de integrar el modelo en las operaciones de la organización. Dentro de los objetivos de esta etapa se encuentra medir la capacidad de predicción del modelo en forma periódica y detectar si existe un aumento de errores en el modelo

2B) Describa/n las dos técnicas de minería que existen y mencione al menos 1 situación de ejemplo en donde cada una de estas técnicas pueda ayudar a la empresa del caso a mejorar sus ventas. (Esta situación solicitada debe ser diferente, es decir, no debe estar relacionada con el modelo que le pidieron al equipo TI en el caso TodoClick).

Desarrollo:

Técnicas de Minería existen Descriptivas y No descriptivas.

Descriptivas: Esta técnica se encuentra estrechamente alineada con la inteligencia artificial

  • Puede recopilar datos sobre los patrones de compra y determinar qué productos pueden venderse juntos, lo que permite ajustar las estrategias de comercialización y ventas para aprovechar esta información

Predictivas: Aprendizaje supervisado que se basa en entrenar a un modelo o método con diferentes datos para poder predecir una variable basándose en la información otorgada.

  • Predicción de montos de ventas de nuevos productos basados en gastos de publicidad

2C) Considerando el problema que debe resolver el equipo de TI, indique/n cuál es el tipo de técnica de minería que se debe utilizar, mencionando al menos 3 argumentos en relación con los objetivos definidos para justificar su respuesta.

Desarrollo:

En este CASO consideramos tomar el formato de Análisis Descriptivo ya que esta toma datos sin procesar y los analiza.

Generan:

  • Informes que proporcionen información histórica
  • Análisis de frecuencia de un evento relacionado a la venta
  • Datos para generar rangos que den respuesta a datos necesarios para solución de problemas.

2D) Considerando el tipo de técnica que identificaron en el punto anterior (2C), sugiera/n al equipo TI al menos 2 algoritmos correspondientes a este tipo de técnica y argumente/n técnicamente por qué serían buenas opciones para resolver el problema en cuestión.

Desarrollo:

Estas se presentan como buenas opciones para resolver el problema en cuestión:

K-means:  se basa en el análisis de grupo trata de dividir los datos recogidos en bloques separados y agrupados por características comunes.

Clustering: La técnica requiere una agrupación de puntos de datos. Con el conjunto de puntos de datos, es posible utilizar este algoritmo para clasificar cada punto de datos en un clúster específico, en la segmentación del mercado dando paso a un marketing distinto, podemos agrupar documentos que nos indiquen términos importantes y relevantes y perfiles personalizados.

[pic 3]

...

Descargar como (para miembros actualizados) txt (18 Kb) pdf (258 Kb) docx (361 Kb)
Leer 10 páginas más »
Disponible sólo en Clubensayos.com