Mineria de Datos en la Gestion del Conocimiento
Efraín TolentinoTrabajo9 de Septiembre de 2019
3.391 Palabras (14 Páginas)137 Visitas
Resumen— El presente documento presenta la integración de la minería de datos en un ambiente tan amplio como lo es la gestión del conocimiento.
En un primer momentos, se parte de una revisión bibliográfica, con lo cual se pretende tener una mayor claridad respecto al concepto de minería de datos, y la gestión del conocimiento. Específicamente la arquitectura de integración tecnológica en la gestión del conocimiento y así finalmente desarrollar una propuesta de un modelo que evidencie cómo la minería de datos y la gestión del conocimiento se pueden integrar, cuales serian sus ventajas, desventajas y algunos criterios que podrán evaluar la eficiencia de dicho sistema.
Abstract- this document shows the integration of data mining into the huge knowledge management atmosphere.
At the first moment, it start with a bibliographic review, which is intended to have greater clarity regarded the concept of data mining, and knowledge management. Specifically, the architecture of technological integration in knowledge management and finally develop a proposal for a model that demonstrates how data mining and knowledge management can be integrated, what would be its advantages, disadvantages and some criteria that can assess the efficiency of said system.
INTRODUCCIÓN
En la actualidad, el mundo cambia constantemente; los desarrollos y descubrimientos de la mano de la ingeniería y la innovación han proporcionado a la humanidad, nuevas formas de hacer las cosas. Sin embargos estos desarrollos se han evidenciado principalmente en países desarrollados, donde, de igual forma las estructuras y el enfoque organizacional se ha modificado para asegurar una mayor productividad en sus actividades.
Debido a la gran cantidad de información y datos que las empresas manejan, las herramientas tecnológicas han jugado un papel fundamental, En la obtención, clasificación y almacenamiento de dicha información. Sin embargo los desarrollos tecnológicos van más allá de la simple recopilación, su correcto uso ha facilitado a la humanidad la obtención y generación de conocimiento en menor tiempo y a mayor escala.
Este artículo busca integrar la minería de datos dentro de lo que se conoce como gestión del conocimiento. Por un lado la minería de datos se presenta como una herramienta lógica, que, con un uso adecuado puede ser generadora de conocimiento, y de allí partimos a cómo gestionar ese conocimiento. Sin embargo la arquitectura de la gestión del conocimiento integra los elementos de las organizaciones para tal fin, específicamente la arquitectura de Kerschberg que es una arquitectura de integración tecnológica que concibe aquellos elementos como la minería de datos en su estructura primitiva.
El modelo que aquí se presenta busca que las organizaciones tengan claridad acerca de las herramientas con las que pueden contar para no solo generar mayor utilidad, sino que el éxito de las organizaciones sea sostenible en el tiempo.
I. REVISIÓN BIBLIOGRÁFICA
En la actualidad, los datos y la información juegan un papel fundamental en todas las organizaciones ya que estos, son la base generadora de conocimiento. Sin embargo dicho conocimiento debe ser gestionado, esto implica la administración y el control del éste, para que su existencia y uso se vea evidenciado en un alto rendimiento de la empresa misma.
Toffler y Toffler [2] señalaban que el conocimiento era visto como un activo clave en las compañías y señalaban: “El valor real de compañías como Compaq o Kodak, Hitachi o Siemens, depende más de las ideas, puntos de vista e información en la cabeza de sus empleados y en los bancos de información o patentes que estas compañías controlan que, en los camiones, líneas de ensamblaje u otros activos físicos que puedan tener”.
Así, en la actualidad, el capital de las organizaciones a extendido su concepto y se ha enfocado principalmente en intangibles. la OECD [3] señalaba que: “El conocimiento, a medida que es incorporado en los seres humanos (como “capital humano” [4]) y en tecnología, ha sido siempre central al desarrollo económico. Pero únicamente en los últimos años se ha reconocido su importancia relativa, dado que dicha importancia está creciendo. Las economías de la OECD son más fuertemente dependientes de la producción, distribución y uso del conocimiento que nunca antes”.
Estos elementos permiten asegurar el surgimiento de una economía basada en el conocimiento tal cual lo estableció Peter Drucker [5] al concluir que la única – o al menos la más importante – fuente de bienestar en la sociedad contemporánea post-capitalista es el conocimiento y la información. Él observa tres cambios fundamentales en el conocimiento durante el Siglo 20: primero, fue la revolución industrial en donde el conocimiento se aplicaba a las herramientas, procesos y productos; luego, vino la revolución de la productividad en la que personas como Taylor y Ford empezaron a aplicar el conocimiento al trabajo humano. La revolución que vemos delante de nosotros es la revolución de la gestión, en la cual el conocimiento es aplicado al mismo conocimiento. Esto no equivale a decir que los tradicionales factores de producción tierra y trabajo hayan desaparecido, simplemente han cambiado de posición [6]. Tanto como hay conocimiento, dice Drucker [5], los otros factores de producción son fáciles de obtener y ve como el reto más importante de la economía basada en el conocimiento el de encontrar una metodología, disciplina o proceso con el cual la información se pueda hacer productiva.
Con base en estas premisas y en la búsqueda de mejorar constantemente las estructuras de las organizaciones se ha generado una explosión de propuestas en cuanto a modelos, arquitecturas tecnológicas y herramientas, que pretenden dar soporte a estas estructuras y facilitar el flujo de conocimiento en la organización. (11)
En general, las arquitecturas de sistemas de gestión del conocimiento, pueden enfocarse en arquitecturas clásicas y en arquitecturas propietarias: clásicas son aquellas a las cuales podemos considerar como genéricas y se aplican en general a todo tipo de sistema de gestión del conocimiento como tal. Las más representativas son: Ovum, Tiwana, e Integración Tecnológica, Kerschberg. (11)
En el modelo de integración de tecnología de Kerschberg, se reconoce la heterogeneidad de las fuentes del conocimiento y se establecen diferentes componentes que se integran en lo que el autor denomina “capas”: de presentación del conocimiento, de gestión del conocimiento y de datos. El modelo establece la necesidad de una arquitectura potenciada con las diferentes tecnologías, orientadas a apoyar el proceso de gc. Propone un alto nivel de integración entre los componentes de cada una de las capas, lo que permite trabajar con estándares y lenguajes comunes un alto nivel de comunicación entre los usuarios, lo que posibilita un gran dinamismo (figura 1). [7] y de igual forma integra de una forma consistente las herramientas tecnológicas en la estructura de gc.
Fuente: Kerschberg (2001).
Este modelo consiste en definir lo siguiente:
1) ayudar a asegurar la calidad de los datos y la información a los trabajadores de conocimiento.
2) contribuir con la transformación de los datos y la información en conocimiento.
3) permitir el almacenamiento eficiente y la recuperación de metadatos y de conocimiento.
4) promover la promoción a tiempo de la diseminación y la distribución del conocimiento.
5) apoyar la presentación adaptada de conocimiento.[7]
En este sentido , como se mencionó anteriormente el conocimiento se genera a partir de los datos e información que poseen las organizaciones. En la era moderna, la era de la información y las comunicaciones las herramientas tecnológicas han empezado a empalmar las fuentes de conocimiento de una forma eficiente e integral Bajo esta necesidad de evolución, surgen soluciones como Las bodegas de datos, orientadas al análisis de la información de una organización con el fin de mejorar la eficiencia y eficacia de esta ante el mercado
Sin embargo estas bodegas resultan insuficientes en la actualidad, y se hace necesaria la creación de nuevas herramientas que ofrecen un manejo ágil, eficaz y eficiente de esta. “El Data Warehouse es una colección de datos orientados a temas, integrados, no volátiles, históricos, organizados para el apoyo de un proceso de ayuda a la decisión” (12)
Dentro de los principales componentes de una arquitectura Spatial Data Warehouse se encuentran el Procesamiento Analítico en Línea (OLAP, por su sigla en inglés) y el Data Mining (minería de datos). El primero provee un análisis intrusivo de alto desempeño sobre la bodega de datos, mientras el segundo se encarga de explotar, escarbar y analizar de forma exhaustiva la bodega.(10)
Esta etapa de minería de datos puede definirse sobre la base de un conjunto de primitivas diseñadas especialmente para facilitar un descubrimiento de conocimientos eficiente y fructífero.
La minería de datos según Esteban (2008) et. al. (1991 / 1995), se puede definir como un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos, que a su vez, facilita la toma de decisiones y emplea técnicas de aprendizaje supervisado y no-supervisado. En la fase se define el tipo de investigación a realizar de acuerdo con las características de los atributos que conforman la base de datos, que pueden ser de tipo descriptivo y/o predictivo. El siguiente paso es la elección y aplicación de métodos de extracción de conocimiento y la
...