“DATA MINING – MINERIA DE DATOS”
haker912Trabajo14 de Agosto de 2019
6.626 Palabras (27 Páginas)163 Visitas
ASOCIACIÓNUNIVERSIDAD PRIVADA
SAN JUAN BAUTISTA
FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE INGENIERÍA DE COMPUTACIÓN Y SISTEMAS[pic 1]
“DATA MINING – MINERIA DE DATOS”
PROYECTO DE TITULACION
PRESENTADO POR:
Xxxxxxxxxxx
Xxxxxxxxxxx
xxxxxxxxxxxx
TITULO
PARA OPTAR EL TÍTULO PROFESIONAL DE
INGENIERÍA DE COMPUTACIÓN Y SISTEMAS
LIMA – PERÚ
2013
DEDICATORIA
Se lo dedicamos a nuestros padres por el apoyo incondicionales a y nuestros profesores por formanos como profesionales
AGRADECIMIENTOS
En el camino recorrido hasta aquí tuve la oportunidad de conocer a muchas personas que contribuyeron en mayor o menor medida a la realización de este trabajo. Quiero agradecerles a todas ellas por el tiempo y dedicación prestados.
- Prof. Zico Alexis
- Dr.Miller Liendo, Profesor y autor de Datawearhouse por la información proporcionada.
- Jefe de Word Place Externo Leopoldo Rijavec por el apoyo solicitado.
INDICE
INTRODUCCIÓN 5
CAPITULO I - CONCEPTOS BÁSICOS 7
1.2 Historia 7
1.3 Antecedentes y necesidades 8
1.4 Los Fundamentos del Data Mining 8
1.5 Principales características y objetivos de la Minería de Datos 9
1.6 Alcance de Data Mining 12
1.7 Extracción de conocimiento en bases de datos 13
1.8 Técnicas de Minería de Datos 14
CAPITULO II - ARQUITECTURA DATA MINING 17
2.1 Una arquitectura para Data Mining 17
2.2 Fases de un Proyecto 18
2.3 Filtrado de datos 19
2.4 Selección de variables 19
2.5 Algoritmos de Extracción de Conocimiento 20
2.6 Interpretación y evaluación 21
CAPITULO III - Aplicaciones de Casos del Data Mining 22
4.1. Gobierno 22
4.2. Empresa 23
4.3. Universidad 25
4.4. Investigaciones Espaciales 26
4.5. Clubes Deportivos 26
CAPITULO IV - SOFTWARE WEKA 28
4.1. Software de minería de datos en Java 28
4.2. WEKA Knowledge Explorer 30
4.3. El algoritmo J4.8 31
CONCLUSIÓN 33
BIBLIOGRAFÍA 34
GLOSARIO DE TÉRMINOS 35
INTRODUCCIÓN
El Data Mining surgió como una técnica novedosa a la situación en la cual se contaban con grandes volúmenes de datos en los cuales no se aprovechaba toda la información útil, ya que esta se encontraba oculta de alguna forma. El descubrimiento de esta data útil se logra a través de procesos de redes neuronales, árboles de decisión, modelos estadísticos y agrupamientos, lo cuales permiten hallar patrones de conducta en los datos, y de esta forma realizar predicciones para dar soporte a la toma de decisiones en el ámbito en el que fue aplicado.
Es importante destacar que el uso de esta técnica no va dirigida a un público específico, sino que cualquier persona con un buen dominio de las herramientas de extracción puede ejercer el rol de minero, así mismo el entorno de la minería de datos suele desarrollarse bajo una arquitectura cliente-servidor.
En la minería de datos se desarrollarán tópicos como, el proceso de extracción de conocimiento, para luego dar pie al concepción del data mining seguidamente se hondará en las principales características y objetivos del mismo, tomando en cuenta el alcance que posee y la arquitectura en la cual se desarrolla.
De igual manera se deben resaltar las fases de un proyecto de data mining y las aplicaciones que se le pueden dar a la técnica mencionada.
Los procesos de la minería de datos pueden agruparse en 4 pasos generales independientemente de la técnica que se use, estos son: Filtrado de datos, Selección de variables, Extracción de Conocimiento e Interpretación y evaluación.
Dentro de estas enormes masas de datos existe una gran cantidad de información oculta, de gran importancia estratégica, a la que no se puede acceder por las técnicas clásicas de recuperación de la información. El descubrimiento de esta información oculta es posible gracias a la Minería de Datos (DataMining), que entre otras sofisticadas técnicas aplica la inteligencia artificial para encontrar patrones y relaciones dentro de los datos permitiendo la creación de modelos, es decir, representaciones abstractas de la realidad, pero es el descubrimiento del conocimiento (KDD, por sus siglas en inglés) que se encarga de la preparación de los datos y la interpretación de los resultados obtenidos, los cuales dan un significado a estos patrones encontrados.
Los pasos generales de un proceso de extracción de conocimiento se pueden observar en la siguiente figura (Figura 1).
[pic 2]
Figura 1
CAPITULO I - CONCEPTOS BÁSICOS
- Historia
La idea de data mining no es nueva. Ya desde los años sesenta los estadísticos manejaban términos como data fishing, data mining o data archaeology con la idea de encontrar correlaciones sin una hipótesis previa en bases de datos con ruido. A principios de los años ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los términos de data mining y KDD. A finales de los años ochenta sólo existían un par de empresas dedicadas a esta tecnología; en 2002 existen más de 100 empresas en el mundo que ofrecen alrededor de 300 soluciones. Las listas de discusión sobre este tema las forman investigadores de más de ochenta países. Esta tecnología ha sido un buen punto de encuentro entre personas pertenecientes al ámbito académico y al de los negocios.
El data mining es una tecnología compuesta por etapas que integra varias áreas y que no se debe confundir con un gran software. Reúne las ventajas de varias áreas como la Estadística, la Inteligencia Artificial, la Computación Gráfica, las Bases de Datos y el Procesamiento Masivo, principalmente usando como materia prima las bases de datos.
Una definición tradicional es la siguiente: “Un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos” (Fayyad y otros, 1996).
- Antecedentes y necesidades
El éxito de una organización en un entorno globalizado depende en gran medida del conocimiento de sus miembros y de sus habilidades para hacer negocios. Sin embargo, las organizaciones no solo necesitan de conocimiento, sino también necesitan tener la capacidad de actualizar dinámicamente el conocimiento y ponerlo en práctica.
En esencia, deben ser capaces de resolver problemas, aprender de experiencias propias y también de experiencias de otros, transfiriendo el conocimiento y la información de forma rápida y eficiente a toda la organización.
...