ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

HARDWARE PARA PARALELIZACION DE ALGORITMO DE MINERIA DE DATOS


Enviado por   •  3 de Mayo de 2015  •  845 Palabras (4 Páginas)  •  286 Visitas

Página 1 de 4

HARDWARE PARA PARALELIZACION DE ALGORITMO DE MINERIA DE DATOS

Edier Castro Ayala

ediercastro@gmail.com

PLANTEAMIENTO DEL PROBLEMA

En la última década ha habido un incremento exponencial en la producción y recopilación de la información. Esto es debido a que el avance en la recopilación de datos, en la informatización de muchos negocios, entre otros, ha hecho que nos inundemos con información. Esto crea una necesidad de indagar y encontrar patrones escondidos en esta gran cantidad de datos que son de gran utilidad para plantear estrategias que lleven a los objetivos del negocio: como es el incremento en las ventas, obtener más ganancias, disminuir costos, mejorar la eficiencia en algunas áreas, identificar clientes que se pasarían a la competencia, o estudios científicos como la decodificación del ser humano, imágenes médicas más precisas, web sorprendentemente más rápido y preciso, entre otros. Todo esto sería imposible de lograr eficientemente sin la ayuda inteligente y automática en la transformación de estos datos en una información útil, sino se utiliza un método de procesamiento en paralelo para minería de datos.

Disminuir el tiempo total de procesamiento de tareas, resolver problemas más complejos, de grandes dimensiones y proporcionar concurrencia o sea permitir la ejecución simultanea de tareas; son unas de las razones de la utilización de la computación en paralelo.

De igual manera, cuando los recursos locales son escasos se pueden usar los recursos que hay disponibles en una red WAN o de internet y así disminuir costos. En vez de pagar por utilizar una supercomputadora se usan los recursos que están disponibles remotamente y así podemos sobrepasar los límites de almacenamiento: memoria y disco. En procesamiento de grandes dimensiones, usar la memoria de varios computadores resuelve el problema de la limitación de memoria que hay en una sola máquina. Otra razón de peso para la utilización de programación en paralelo es que las maquinas secuenciales actualmente ya están en la frontera de lo que pueden dar en velocidad interna de transmisión de datos y de la velocidad de procesamiento de la CPU. Así, la comunidad científica usa la computación en paralelo para resolver problemas que sin el paralelismo serian intratables, o que se pueden resolver con mayor precisión o en menor tiempo utilizando el paralelismo. Algunos campos que se benefician de la programación en paralelo son las prediciones y estudios meteorológicos, estudio del genoma humano, modelado de la biosfera, prediciones sísmicas, simulación de moléculas.

La computación en paralelo consiste en utilización de varios procesadores para que trabajen en conjunto en la resolución de un problema de grandes dimensiones, haciendo que cada procesador trabaje en una parte del problema y realice intercambio de datos entre ellos. Según como realice el intercambio de datos, podemos tener dos casos básicos en los cuales

...

Descargar como (para miembros actualizados)  txt (5.5 Kb)  
Leer 3 páginas más »
Disponible sólo en Clubensayos.com