Consultas SQL avanzadas, con el uso de funciones analíticas en un Data Warehouse predefinido
María Alejandra QuitianTutorial25 de Octubre de 2022
778 Palabras (4 Páginas)109 Visitas
PROGRAMA INGENIERÍA DE SISTEMAS
(NUEVO PLAN DE ESTUDIOS)
GUIA DE LABORATORIO
CURSO: Bases de datos masivas AREA: Arquitectura de datos
Nro. DE LA PRÁCTICA: 1 H. PRESENCIALES: 2 H. INDIVIDUALES: 2 NOMBRE DE LA PRÁCTICA: Análisis de datos para la toma de decisiones
PROYECTO AL QUE PERTENECE: Exploración de las herramientas de Big Data para analítica de datos.
TEMÁTICAS: Consultas SQL avanzadas, con el uso de funciones analíticas en un Data Warehouse predefinido.
COMPETENCIAS PARA DESARROLLAR: Diseñar, implementar y gestionar soluciones informáticas acorde a las tendencias tecnológicas para solucionar problemas y necesidades propias de su contexto social.
CONOCIMIENTOS PREVIOS REQUERIDOS: Creación de consultas SQL avanzadas, funciones analíticas y estadística básica.
RECURSOS: Máquina virtual “training” de Cloudera para data analytics, herramienta de trabajo gráfico HUE, Gestor de bases de datos IMPALA/HIVE, base de datos Fly.
DESCRIPCIÓN DE LA PRÁCTICA
Objetivo:
El objetivo de la actividad es recomendar qué par de aeropuertos de los Estados Unidos deben estar conectados con un túnel ferroviario de pasajeros de alta velocidad. Para esto deberá escribir una declaración SQL que cumpla con todos los requisitos enumerados, y que devuelva los detalles requeridos, para luego analizar su resultado y hacer una recomendación para la toma de la decisión.
Planteamiento situación de análisis:
Usted es un analista de datos de una empresa que planea revolucionar el transporte masivo de pasajeros mediante la construcción de un túnel ferroviario de alta velocidad. Y se necesita decidir cuáles podrían ser los dos principales aeropuertos de Estados Unidos que saldría más rentable conectar mediante este túnel. Estos dos aeropuertos deben estar entre 300 y 400 millas de distancia, y deben tener un promedio de al menos 5,000 vuelos por año entre ellos, en cada dirección. Por último, los aeropuertos deben tener un gran volumen de viajeros volando entre ellos en ambas direcciones, la compañía cree que se puede persuadir a estos viajeros aéreos para que se cambien al tren de alta velocidad debido a los frustrantes retrasos en los vuelos.
Sugerencias para el desarrollo de la actividad:
∙ La tabla vuelos tiene una columna denominada distancia que indica la distancia en millas de cada vuelo. Utilice los valores de esta columna para determinar las distancias entre aeropuertos.
∙ La tabla de aviones contiene diez años de datos de vuelos, por lo que, para obtener los totales medios anuales, deberá dividir los totales de la tabla completa por diez. ∙ La tabla de aviones tiene una columna denominada asientos que indica el número de asientos en cada avión, para poder determinar el volumen de pasajeros. ∙ Las dos primeras filas del resultado de su consulta deben mostrar su ruta de túnel recomendada. Estas dos filas superiores deben mostrar el mismo par de aeropuertos, pero con el origen y el destino cambiados.
PRODUCTOS Y RESULTADOS ESPERADOS:
Consulta SQL
Debe escribir una declaración SELECT para identificar el par de aeropuertos que cumple con todos los requisitos enumerados. En particular el resultado de la consulta debe contar con los siguientes detalles:
1. Los códigos de tres letras que identifican a ambos aeropuertos.
2. La distancia de vuelo promedio en millas entre los aeropuertos, en cada dirección. 3. El número medio de vuelos por año entre los aeropuertos, en cada dirección.
4. La capacidad promedio anual de pasajeros (promedio total anual de asientos en los aviones) para vuelos entre aeropuertos, en cada dirección.
...