ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Procesamiento de datos


Enviado por   •  9 de Abril de 2021  •  Apuntes  •  323 Palabras (2 Páginas)  •  98 Visitas

Página 1 de 2

1.2 Procesamiento de datos

1.2.1 Integración y transformación de datos

La transformación de datos es el proceso de convertir datos de un formato a otro, normalmente del formato de un sistema origen al formato requerido de un sistema destino. La transformación de datos es un componente que la mayoría de las tareas de integración y gestión de datos. El proceso de transformación de datos puede automatizarse, manejarse manualmente o completarse mediante una combinación de ambos.

Hoy en día, la realidad del big data significa que la transformación de datos es más importante para las empresas que nunca. Un número cada vez mayor de programas, aplicaciones y dispositivos producen continuamente grandes volúmenes de datos. Y con tantos datos dispares que fluyen desde una variedad de fuentes, la compatibilidad de datos siempre está en riesgo. Ahí es donde entra el proceso de transformación de datos: permite a las empresas y organizaciones convertir datos de cualquier fuente a un formato que puede ser integrado, almacenado, analizado y en una última instancia extraído para obtener inteligencia empresarial procesable.

1.2.2 Discretización de datos y jerarquías conceptuales

Algunos algoritmos que se usan para crear modelos de minería de datos requieren tipos de contenido específicos para funcionar correctamente. Por ejemplo, el algoritmo de Bayes no puede utilizar columnas continuas como entrada y no puede predecir valores continuos. Además, algunas columnas pueden contener tantos valores que el algoritmo no puede identificar fácilmente los patrones interesantes en los datos a partir de los cuales crear un modelo.

Discretizar los datos en las columnas puede permitir el uso de los algoritmos para producir un modelo de minería. La Discretización es el proceso de poner valores en depósitos para que haya un número limitado de cados posibles.

De acuerdo con (Hernández, Rodríguez, 2008) “La discretización es una parte de la reducción de datos, pero con importancia particular, especialmente para datos numéricos”. Esta reducción hace perder variación entre puntos o elementos que no están en la sección transversal de la información.

...

Descargar como (para miembros actualizados)  txt (2.2 Kb)   pdf (22.3 Kb)   docx (7.1 Kb)  
Leer 1 página más »
Disponible sólo en Clubensayos.com