ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Ensayo Big Data


Enviado por   •  3 de Abril de 2022  •  Ensayos  •  1.123 Palabras (5 Páginas)  •  657 Visitas

Página 1 de 5

[pic 1] UNIVERSIDAD TECNOLÓGICA DE MÉXICO



NOMBRE DEL ALUMNO: AGUILAR HERNANDEZ ERIKA GIOVANNA

NO. DE CUENTA: 19591974

NOMBRE DEL PROFESOR: GENARO GUTIÉRREZ BECERRIL

NOMBRE DE LA MATERIA: ANALÍTICA DE DATOS

NOMBRE DE LA CARRERA: MAESTRÍA EN ADMINISTRACIÓN DE NEGOCIOS

ACTIVIDAD: ENTREGABLE 1 ENSAYO 

FECHA DE ENTREGA: 30/03/22



Introducción

Hoy en día vivimos en una realidad donde nos conectamos a internet la mayor parte del tiempo para compartir fotografías, documentos, experiencias y vivencias. En las últimas décadas, la cantidad de información que procesamos ha ido en aumento, dando lugar a que cada vez haya más datos para analizar, y debido a la creciente importancia de esta información en la sociedad actual, seguramente ha sido, es y será la columna vertebral del apoyo organizativo y en la toma de decisiones de la empresa. durante muchos años, creando así un nuevo campo de estudio y preparación para los profesionales de la ingeniería de sistemas. En este artículo, verá la pregunta: “¿Qué es Big Data?, así como cuadro comparativo de alguna de las herramientas y 2 caso de éxito. “A lo largo de los años se han desarrollado muchas técnicas, metodologías y herramientas para recolectar y procesar datos a diferentes escalas y sobre diferentes temas o datos obtenidos en el campo de la investigación. Una de estas técnicas, la que más se puede utilizar porque produce información que se puede visualizar fácilmente en forma estadística, es la minería de datos, que tiene como objetivo recopilar información de un conjunto de datos y transformarla en un conjunto de datos, convertir esa información en una estructura que la haga más fácil de entender para su uso posterior.

¿Qué es la Big Data?

Big data se define como la gestión y el análisis de grandes cantidades de datos que no se manejan de la manera habitual porque exceden las capacidades y limitaciones de las herramientas de software comúnmente utilizadas para gestionar, recopilar y procesar datos. Este concepto abarca tecnologías, infraestructuras y servicios diseñados para brindar soluciones para el procesamiento por lotes de conjuntos de datos estructurados, no estructurados o parciales que pueden provenir de sensores, archivos y datos de audio, micrófono, cámara, escáner médico, imágenes, teléfono inteligente, etc.

El estudio publicado por McKinsey Global Institute (MGI) en junio de 2011: http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation iluminó el sentido de la definición anterior al definir big data como “conjuntos de datos cuyo tamaño va más allá de la capacidad de captura, almacenado, gestión y análisis de las herramientas de base de datos”.

Historia

 Big Data Los grandes datos históricos y el análisis de datos son algo muy popular hoy en día, pero también algo que no existía hace unos días. En 1930 comenzaron las primeras tareas de análisis de datos, aunque el número actual no ha aumentado. El poder predictivo de la analítica ha cambiado tanto desde el siglo XX que se utilizó para decodificar información durante la Segunda Guerra Mundial. Andrew Jennings, director de análisis de Fico Labs, dijo: "El análisis predictivo se está convirtiendo en la tecnología del siglo XXI. Puede mirar hacia atrás y ver cuán importante fue, pero hemos llegado al punto en el que los grandes datos, la computación en la nube y los análisis nos llevan a una innovación masiva y perturban el mercado.

Cuadro Comparativo Herramientas Big Data.

Herramienta

Ventajas

Desventajas

Hadoop

La capacidad de almacenar y procesar instantáneamente grandes cantidades de datos de cualquier tipo.
Poder de cómputo para procesar rápidamente grandes conjuntos de datos.
Tolerancia a fallos de hardware.
Archivar copias automáticamente.
Flexibilidad en el almacenamiento y procesamiento de datos.
Bajo costo considerando la licencia de código abierto.
Amplíe la escalabilidad de su sistema de datos.

Complejidad en su uso

Apache Spark

Acepta una gran cantidad de lenguaje de programación.
Código abierto.
Posibilita la solución de errores.
Integración de nuevos procesos.
100 veces más rápida que Hadoop MapRudec.
Tiempo real

N/A

Apache Storm

Fácil de usar (lenguaje de programación)
Integración en todas las colas de sistemas y base de los datos.
Zookeeper administrando clústeres y escala de estos.
Protección de datos garantizada.

N/A

MongoDB

Diferencia al resto de las demás bases de datos.
Almacena en documentos.

No almacena en registros.

Elasticsearch

Reconciliación de datos en gran volumen.
Encontrar datos que se necesitan en el momento.
Datos complejos.
Permiso de indexación.
Análisis en tiempo real.
Escalabilidad

N/A

Lenguaje R

Cálculo de manera estadística y gráfica.
Filosofía colaborativa.
Código abierto.
Herramienta Rstudio.
Herramientas para el trazado, depuración y gestión del espacio de trabajo.

N/A

Lenguaje Python

Sencillo de utilizar.
Facilidad para trabajar en el análisis de datos.
Código abierto

Baja velocidad en la ejecución.

...

Descargar como (para miembros actualizados)  txt (9.8 Kb)   pdf (101.6 Kb)   docx (22.5 Kb)  
Leer 4 páginas más »
Disponible sólo en Clubensayos.com