ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Hadoop

Edwin Alexander Amaya CardenaTarea15 de Octubre de 2018

742 Palabras (3 Páginas)144 Visitas

Página 1 de 3

HADOOP

 Este sistema fue creado por Doug Cutting el cual le puso este nombre porque así se llamaba su elefante de juguete. Por este motivo el logo y el nombre. En primera instancia fue hecho con el fin de ayudar en un proyecto de motor de búsqueda llamado Nutch el cual es un robot y motor de búsqueda basado en Lucene. Es parte del proyecto Lucene que a su vez es gestionado por la Apache Software Foundation. Nutch es software libre.

Es un sistema de marco de trabajo (framework) en el podemos distribuir un amplio número de datos por medio de unos ordenadores que están agrupados, estos utilizan unos modelos de programación básico o simple. Fue creado con el propósito de llevar de los servidores individuales a muchas maquinas, cada servidor con un nivel de procesamiento y almacenamiento local. Este sistema en vez de prestar toda la atención en el hardware para prestar el servicio de buena disponibilidad, tiene una biblioteca que está hecha para detectar y controlar cada error en la capa de aplicación esto puede ser propenso a que falle. Hadoop es un sistema bajo un licenciamiento libre y permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para Map Reduce y Google File System (GFS).
Intercambio de recursos. Con hadoop podemos tener una variedad de partes o módulos los cueles se han desarrollado como Hadoop Distributed File System (HDFS),el cual es un sistema que implementa la utilización de archivos distribuidos y permite que el acceso a estos tengan un alto rendimiento la aplicación. es uno de los servidores Web más utilizados y una parte vital cuando alojamos un website o un servicio Web. Este cuenta con varias herramientas que nos pueden ayudar a reforzar la resistencia de nuestro website. En este documento vamos a ver algunas las principales características, en las cuales está la de  multiplataforma que
corre en una multitud de Sistemas Operativos, lo que lo hace prácticamente universal, extensible, gracias a ser modular se han desarrollado diversas extensiones entre las que destaca PHP que es un lenguaje de programación del lado del servidor, modular puede ser adaptado a diferentes entornos y necesidades, con los diferentes módulos de apoyo que proporciona y con la API de programación de módulos, para el desarrollo de módulos específicos y por ultimo Apache es una tecnología gratuita de código fuente abierto. El hecho de ser gratuita es importante pero no tanto como que se trate de código fuente abierto. Esto le da una transparencia a este software de manera que si queremos ver que es lo que estamos instalando como servidor.

La instalación necesaria depende del sistema operativo. Todas las distribuciones Linux cuentan con un servidor Apache integrado en la propia distribución por lo cual solamente hay que seleccionar la opción de instalar el servidor para que éste quede instalado y funcionando.

Ventajas:

  • Un menor coste

Al estar basado en un gran número de pequeños ordenadores, cada uno de ellos procesa una parte

de la información pero actúan de forma coordinada. De este modo, el resultado es una ventaja

comparativa sin competencia: funciona como un ordenador de enormes dimensiones.

Son numerosas sus ventajas con respecto a los sistemas clásicos en almacenamiento y

procesamiento de datos pues, al no depender de la cara infraestructura de éstos, permite abaratar

costes gracias al uso de servidores estándar, con la posibilidad de ampliarse sin límite.

  • Dar valor a los grandes datos

El bajo coste, su rápido retorno de la inversión, su robustez, tolerancia a fallos y su ampliación

sin límites hace posible una nueva BI basada en el los grandes datos. Con Hadoop, el océano de

datos de Big Data es asible. Se abre, pues, una nueva era. Como llegó a decir Leonardo da Vinci,

...

Descargar como (para miembros actualizados) txt (5 Kb) pdf (114 Kb) docx (13 Kb)
Leer 2 páginas más »
Disponible sólo en Clubensayos.com