BIG DATA La web ha evolucionado en varios aspectos tecnológicos.
JasmineAlejandraEnsayo2 de Mayo de 2016
749 Palabras (3 Páginas)381 Visitas
Universidad Tecnológica Equinoccial
Nombre: Alejandra Tapia
Curso: 8vo COMEX
Fecha: 26 de Abril del 2016
BIG DATA
La web ha evolucionado en varios aspectos tecnológicos, produciendo que se cree una gran variedad de datos diarios, por este motivo fue creado Big Data ya que nos permite investigar en las 3V, volumen, variabilidad, velocidad de los datos; y adicional una cuarta V que también se la puede considerar siendo esta: visualización.
Volumen: Cantidad masiva del orden de los cientos de Terabytes.
Velocidad: El flujo de entrada de datos, ingesta, puede resultar tan alto que la información sea muy difícil de procesar y esto condicione la comprensión sobre los datos.
Variedad: estructurados, semiestructurados (ficheros con formato conocido tipo word, excel...) y desestructurados (imágenes, video, audio,...). Estos últimos exigen una gran carga computacional antes de extraer información de ellos, lo que, sin el uso de tecnologías Big Data hace no productiva su utilización.
Valor: La mayoría de los datos tiene poco valor hasta su análisis y procesamiento. Para esta tarea se hacen necesarios sistemas distribuidos y recursos avanzados de análisis de datos. Nos enfrentamos a la atomización de la información con gran cantidad de información que por su gran número de elementos solo tiene sentido en conjunto, siendo despreciable el significado individual.
Con la gran demanda que existe en la variedad de páginas web que tenemos como por ejemplo: Facebook, netflix, google, twitter, instagram, hotmail entre otros, es necesario implementar nuevas y mejores tecnologías como Big Data, que puedan alcanzar la cantidad de datos que generan
Entendemos por Big Data que es un crecimiento exponencial de información, el cual podemos definir como aquel conjunto de datos que excede la capacidad de procesamiento de los sistemas de bases de datos convencionales.
Big Data nos ofrece una visión completa de toda la información relevante para la toma de decisiones, y obtener información relevante en un periodo de tiempo donde esta información todavía es válida. Existen técnicas que nos permiten aprovechar el máximo del uso de Big Data las cuales son :
Visualización de datos (Visual Analytics) trata de extraer información de problemas altamente complejos y representarlo visualmente de manera que el conocimiento, la capacidad de razonamiento y la intuición de las personas se puedan explotar al máximo. Existen diferentes tipos de visualización como los grafos. Las técnicas de reducción de grafos se hacen totalmente necesarias. Una vez aplicados estos algoritmos (muestreo estocástico de extremos, agrupamiento o clustering geodésico, filtrado basado en estructura, etc.), los grafos pueden ser representados gráficamente y mostrar la esencia de su estructura.
También podemos hablar de otra técnica denominada Información geoposicionada, en la cual se introducen tecnologías de rendering 3D que permiten representar datos escalares, vectoriales o incluso volumétricos.
El descubrimiento de conocimiento en bases de datos es cuando la minería de datos con la visualización interactiva se une y encuentran patrones en grandes volúmenes de datos, se muestra en forma de representación o estructura comprensible.
La información espacio-temporal es un amplio contenido de uso de aplicaciones en las cuales la información espacial tiene un tratamiento más o menos directo es su representación gráfica y la información temporal es un proceso de abstracción para que pueda darse visualizada.
Big Data y la visualización de datos son utilizados en Campos de aplicación ya que son procesos críticos en las cuales las herramientas ayudan a la toma de decisiones que resultan fundamentales.
En la ciencia e investigación de varias ramas como la medicina, bilogía, genética, astronomía, etc, el Big data y visualización de datos es de gran ayuda ya que cuando se crean modelos generados que podrán realizar predicciones más precisas y un gran avance en contra de procesos que gracias al conocimiento generado a través de grandes cantidades de datos podrían mejorar rendimientos e incluso ofrece una mayor información.
...