Mineria De Datos
finchur1 de Julio de 2012
3.894 Palabras (16 Páginas)3.177 Visitas
RESUMEN
La minería de datos aparece como una de las nuevas tecnologías de manejo, ordenamiento y análisis de los datos, que nos permite encontrar el conocimiento soterrado en las entrañas de las montañas de números, de que se dispone en la actualidad generado por; el aumento en la capacidad en las maquinas procesadoras de datos, la existencia de dispositivos con gran capacidad de almacenamiento de datos a bajo costo, la existencia de sistemas de transmisión de información a grandes velocidades y con mayor confiabilidad. La minería de datos trabaja con los datos como materia prima a la que hay que transformar de su estado bruto a formas que expresen comportamientos, patrones, tendencias, tipos, clases, dimensiones, parámetro, secuencias, asociaciones, que puedan generar algún modelo que nos permita comprender mejor un sistema, o sea extraer la esencia contenida en las bases de datos, extraer el metal precioso, el oro de la montañas de datos, encontrar la veta de conocimiento escondido en su interior y entonces saber; de que, con que, cuando, como, de que manera opera, como falla, como trabaja, como se desarrolla, como crece, como aumenta o disminuye la eficiencia y productividad de un sistema y entonces poder tomar decisiones mejor fundamentadas y de mayor consistencia validacional.
Las cantidades de información en la actualidad son tan enormes que es prácticamente imposible su asimilación por una sola persona, por lo que se hace necesario contar con nuevos métodos de procesamiento de datos, nuevas tecnologías que nos permitan y nos faciliten el proceso de búsqueda del conocimiento escondido al interior de las enormes montañas de datos existentes y que nos proporcionen la esencia contenida en la base de datos.
Se define la minería de datos como un conjunto de procedimientos, técnicas y algoritmos para extraer las relaciones y patrones, la información oculta en las bases de datos. Se establece la relación entre minería de datos y descubrimiento de conocimiento y se describen los pasos en este proceso de descubrimiento. Se abordan las tareas que abarca la minería de datos, las componentes básicas de sus modelos y las técnicas y métodos más usados. Se analizan algunos de los problemas o retos que aún debe enfrentar la minería de datos para su total difusión. Se describen algunas de sus aplicaciones.
Se concluye que, independientemente de la complejidad de la herramienta usada, el empleo de técnicas de minería de datos redunda en beneficio para una organización con grandes bases de datos.
MINERÍA DE DATOS (DATAMINING)
I. DEFINICION
El data mining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Básicamente, el data mining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento.
Es el conjunto de técnicas para la representación, análisis, manejo y descubrimiento de conocimiento a partir de diversas fuentes de datos (bases de datos, Web, archivos, sensores, etc.). Incluye aspectos de estadística, manejo de conocimiento, computación de alto rendimiento, algoritmos genéticos, redes neuronales, sistemas de soporte a la toma de decisiones, sistemas de información, sistemas distribuidos y bases de datos. El conocimiento extraído se emplea en la toma de decisiones.
La minería de dat1os es la extracción de información im¬plícita, desconocida o previamente ignorada, que puede ser potencialmente útil, de un conjunto de datos. Se pue¬de considerar a la minería de datos como una colección de diferentes técnicas que sirven para inducir el cono¬cimiento e información de una manera estructurada de un gran conjunto de datos.
En general la Minería de Datos involucra diversos temas de otras áreas de la Computación, como muestra la figura.
Temas relacionados con Minería de Datos.
II. HISTORIA
Una definición entre varias que existen es que la minería de datos se entiende como “Un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos” (Fallad y otros 1996).
La minería de datos, surge en los años 60`s con términos tales como: arqueología de datos, pesca de datos en donde se proponía el encuentro de correlaciones sin necesidad de plantear una hipótesis previa de trabajo en una investigación. Al inicio de la década de los años 80`s los investigadores: Gio Weiderhold, Gregor y Pratetsky, Rakesh Agawal y Robert Blum, realizaron trabajos de minería de datos. Diez años después no existían más de dos organismos que aplicaban esta metodología, en la actualidad existen más de 500 empresas en el mundo que trabajan en el desarrollo de nuevas propuestas como soluciones disponibles y son ya más de 150 países los que aportan investigadores al campo de la minería de datos.
La minería de datos se arma en una estructura de varios niveles, pero no es un software de grandes dimensiones, se utilizan técnicas estadísticas de ordenamiento, graficación, correlación, cálculo de parámetros e inteligencia artificial y en cada nivel se usan diferentes tipos de software que hacen a la minería de datos una herramienta de alto poder para el gran número de utilería que contienen y las capacidades para facilitar la formulación y evaluación de proyectos.
Existen referencias de cómo en la actualidad se están aplicando estas técnicas para enfrentar problemas de gran complejidad; en empresas relacionadas con la banca, dependencias gubernamentales, universidades, hospitales, grandes cadenas comerciales y otras organizaciones de servicios preocupados por mantener y hacer crecer su posicionamiento en el mercado ante sus competidores.
Las técnicas de Data Mining son el resultado de un largo proceso de investigación y desarrollo de productos. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo real. Data Mining toma este proceso de evolución más allá del acceso y navegación retrospectiva de los datos, hacia la entrega de información prospectiva y proactiva. Data Mining está listo para su aplicación en la comunidad de negocios porque está soportado por tres tecnologías que ya están suficientemente maduras:
• Recolección masiva de datos.
• Potentes computadoras con multiprocesadores.
• Algoritmos de Data Mining.
III. CARACTERÍSTICAS Y OBJETIVOS
• Explorar los datos se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años.
• En algunos casos, los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.
• El entorno de la minería de datos suele tener una arquitectura cliente servidor.
• Las herramientas de la minería de datos ayudan a extraer el mineral de la información enterrado en archivos corporativos o en registros públicos, archivados
• El minero es, muchas veces un usuario final con poca o ninguna habilidad de programación, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas adhoc y obtener rápidamente respuestas.
• Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados.
• Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente.
IV. ¿POR QUÉ USAR LA MINERIA DE DATOS?
• Ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios.
• Contribuye a la toma de decisiones tácticas y estratégicas.
• Proporciona poder de decisión a los usuarios del negocio, y es capaz de medir las acciones y resultados de la mejor forma.
• Genera modelos descriptivos: permite a empresas, explorar y comprender los datos e identificar patrones, relaciones y dependencias que impactan en los resultados finales.
• Genera modelos predictivos: permite que relaciones no descubiertas través del proceso del DM sean expresadas como reglas de negocio.
V. ALCANCE
El nombre de Data Mining deriva de las similitudes entre buscar valiosa información de negocios en grandes bases de datos - por ej.: encontrar información de la venta de un producto entre grandes montos de Gigabytes almacenados y minar una montaña para encontrar una veta de metales valiosos. Ambos procesos requieren examinar una inmensa cantidad de material, o investigar inteligentemente hasta encontrar exactamente donde residen los valores.
Dadas bases de datos de suficiente tamaño y calidad, la tecnología de Data Mining puede generar nuevas oportunidades
...