LA MINERÍA DE DATOS Y SU RELACIÓN A OTRAS CIENCIAS DEL CONOCIMIENTO
César CLResumen14 de Noviembre de 2017
3.109 Palabras (13 Páginas)362 Visitas
LA MINERÍA DE DATOS Y SU RELACIÓN A OTRAS CIENCIAS DEL CONOCIMIENTO
DATA MINING AND ITS RELATIONSHIP WITH OTHER KNOWLEDGE SCIENCES
Cesar Cuñishpuma Lema1
RESUMEN
En la actualidad se están desarrollando diferentes maneras de educación tanto en la enseñanza como en el aprendizaje en disciplinas que por lo general se consideran conocimientos fuertes como lo son las Matemáticas, Física y Química; de la misma manera, pero en una cantidad menor, no dejando de ser importante se han implementado estrategias de aprendizaje en Ingeniería y Ciencias o Sistemas Computacionales. Hoy en día el concepto de minería de datos está haciéndose eco en todas partes y lo que se pretende en este trabajo es llevar información real y precisa a todos los que carecen de este conocimiento muy importante. Sin embargo, todo señala a que menos de lo esperado la minería de datos será utilizada por la sociedad, al menos con el mismo peso que actualmente tiene la Estadística. Así, en este artículo se intentara aclarar algunas dudas como por ejemplo ¿Cuáles son las técnicas que se usan en la minería de datos? ¿Con que otras ciencias se relacionan la minería de datos? ¿Cuál es el ciclo de la minería de datos? mediante una introducción a la minería de datos: definición, técnicas, ejemplos, etc.
Palabras clave: minería de datos, clustering, base de datos, estadísticas.
ABSTRACT
Different ways of education are being developed in both teaching and learning in disciplines that are generally considered to be strong knowledge such as Mathematics, Physics and Chemistry; In the same way, but in a smaller amount, while not being important have been implemented learning strategies in Engineering and Science or Computer Systems. Today the concept of data mining is echoing everywhere and what is intended in this work is to bring real and accurate information to all who lack this very important knowledge. However, everything indicates that less than expected data mining will be used by society, at least with the same weight as currently has the Statistics. Thus, in this article we try to clarify some doubts such as: What are the techniques used in data mining? What other sciences are related to data mining? What is the cycle of data mining? Through an introduction to data mining: definition, techniques, examples, etc.
Keywords: data mining, clustering, database, statistics.
INTRODUCCION
Con la llegada de la era de la computación, el mundo como se conoce ha experimentado un crecimiento exponencial en la cantidad de información disponible sin precedentes en la historia. Una base de datos como la base de suficiencia que anualmente procesa el Ministerio de Salud y del Trabajo tiene una aproximación de 270 millones de registros. El reto de la minería de datos es desarrollar una forma teórica de pensar y usar técnicas computacionales que permitan procesar y aprender de esta información
En definitiva, la minería de datos es una tecnología usada para descubrir información oculta y desconocida, pero potencialmente útil, a partir de las fuentes de información de la propia empresa. Obtiene un conocimiento de un negocio, utilizando técnicas de clustering, redes neuronales, árboles de decisión y reglas de asociación etc. Los algoritmos automáticos pueden procesar cantidades de datos muy grandes y detectar patrones y tendencias que, de lo contrario, estarían ocultos. La minería de datos distribuida es una disciplina de alto interés de los investigadores debido a las limitaciones que ofrecen las centralizadas a las realidades organizacionales actuales. La data mining o minería de datos es una de las principales herramientas que se utilizan dentro de los programas de gestión del conocimiento como soporte a la toma de decisiones.
En la medicina, se puede identificar las relaciones que existen entre los suministros de un medicamento sobre otro medicamento, en la tecnología, es utilizado para dar prioridad en la velocidad de entrenamiento de los datos que han sido recogidos por el gran volumen de datos que invaden las redes móviles, en ciencias sociales, se aplica minería de datos como un instrumento eficaz para soportar las mediciones de los patrones socioeconómico. El objetivo fundamental esa provechar el valor de la información localizada y usar los patrones preestablecidos para que los directivos tengan un mejor conocimiento de su negocio y puedan tomar decisiones más confiables.
MINERÍA DE DATOS
"Minería de datos se define como el proceso de extraer conocimiento útil y comprensible, desde grandes cantidades de datos almacenados por medios automáticos o semi-automáticos. Este proceso incluye no sólo el análisis inteligente de los datos con técnicas de minería de datos, sino también los pasos previos, como el filtrado y preprocesado de los datos, y los posteriores, como la interpretación y validación del conocimiento extraído". (Hernández, 2004).
La minería de datos es el proceso mediante el cual almacenamos información de todo tipo de conocimiento en grandes bases de datos. Dicho proceso consta en identificar relaciones o patrones, tendencias y clasificaciones que se encuentran registrados en grandes repositorios de información.
El ciclo de la minería de datos se inicia con el entendimiento de un problema práctico que puede surgir a través de las actividades que se realizan a diario en las organizaciones y que normalmente están vinculados a determinadas técnicas y modelos teóricos del análisis de datos[1].
En la figura 1 se representa el ciclo de la minería de datos.[pic 1]
Figura 1: Ciclo de minería de datos.
En este documento, se describen algunas de las aplicaciones que la minería de datos tiene como en la educación, para el agrupamiento de las páginas visitadas y las actividades que realizan los estudiantes en sus cursos [2].
Aplicaciones de la minería de datos en diferentes ciencias
En la educación, mediante el uso del algoritmo de clustering, para agrupar las páginas por su contenido, acceso, tipo, obteniendo un sistema de personalización, recomendadores, de modificación, de irregularidades, regularidades, de los contenidos, descubrimiento de relaciones entre actividades, clasificaciones y diagnóstico incremental de estudiantes, con lo que la universidad tiene un perfil de ellos, para hacer una construcción adaptativa de los planes de enseñanza según las capacidades de los estudiantes, ofreciéndoles a estos diferentes materiales o ayudas didácticas, permitiéndole a la universidad planificar de acuerdo la necesidad de los estudiantes de tener a su disposición los medios educativos [3]. En publicaciones previas han demostrado que la minería de datos se puede utilizar para detectar alumnos en riesgo de deserción. [4] aplicó de manera exitosa técnicas de minería de datos para pronosticar qué grupos de estudiantes podrían dejar a un lado sus estudios. En un trabajo relacionado, el autor Lin [5] utilizó técnicas de minería de datos para minimizar los esfuerzos para retener estudiantes. Para ello se generaron modelos predictivos basados en datos de los estudiantes, que permitieron detectar con gran precisión aquellos alumnos que debían recibir ayuda de los sistemas de retención de alumnos.
En la medicina, se puede identificar las relaciones que existen entre los suministros de un medicamento sobre otro medicamento, centrándose en lo que podría ocasionar: metabolismo, reacción de un fármaco sobre otro. Empleando el algoritmo de reglas lógicas, almacenando las sentencias de información sintáctica y semántica en una base de datos, para posteriormente, mediante el uso de instrucciones de SQL, encontrar las relaciones de los fármacos [6].
En el campo de la tecnología, es utilizado para dar prioridad en la velocidad de entrenamiento de los datos que han sido recogidos por el gran volumen de datos que invaden las redes móviles, gracias a los algoritmos de la técnica del clasificador integrado esto es posible usarlo partiendo del concepto de la clasificación Bayesiana logra al mismo tiempo clasificar los datos y entrenarlos. A partir de conceptos estadísticos se puede usar el muestreo aleatorio simple, muestreo estratificado, y muestreo poblacional (similar al muestreo estratificado, pero, inicia a sub dividir según la secuencia de los datos) [7].
En las ciencias sociales, se aplica minería de datos como un instrumento eficaz para soportar las mediciones de los patrones socioeconómico que permite evaluar al mismo tiempo muchas preguntas, probar varias hipótesis o poder comparar diferentes puntos de estimación, de políticas gubernamentales, el comportamiento de los indicadores sociales alcanzados en las escuelas, estados o países. Dando un tratamiento adecuado a cada grupo de la población para lograr el desarrollo de la comunidad o de la sociedad. Utilizando el algoritmo de la regresión logística a cada nodo se le da la clase del nodo vecino con lo que se logra caracterizar al nodo, empleando etiquetas independientes y dependientes para determinar la probabilidad de cada clase [8].
En la multimedia, se utiliza para la recuperación de información que se hace por contenidos, a través de la igualdad de objetos, en una función distante, elaborada por la agrupacion de puntos en un espacio vectorial lográndose la caracterización de interés en unos valores numéricos de los objetos. Esto funciona por medio de soluciones algorítmicas que diseñan e implementan nuevas estructuras de datos que incluyen, la creación y recorrido de índices [9].
En el sector agropecuario, aplicamos la minería de datos haciendo reconocimiento de patrones, producto de las tecnologías ya usadas como la red de sensores, los sistemas de ubicaciones geográficas, procesamiento de imágenes híper espectral que producen los archivos de los datos de malezas, plagas, mercadeo y de producción que ayuden asegurar la sostenibilidad alimenticia del mundo, asi también los ingresos monetarios de sus agricultores. Para lo que se necesita estabilizar el acceso a los datos desde una variedad de dispositivos móviles, para que su acceso tenga la accesibilidad en el sitio de cultivo. El uso de algoritmos de inteligencia artificial, permite el reconocimiento de patrones con los que se ha originado al máximo aprovechamiento de la tierra, el manejo sostenible de los recursos del agua y la ejecución de políticas para la explotación de cultivos [10].
...