Data mining

NOEMI YANEZ URIBEApuntes12 de Marzo de 2022

1.684 Palabras (7 Páginas)153 Visitas

Página 1 de 7

[pic 1]10 PREGUNTAS CAPÍTULO 1

Ana Caren Ticante Hernández

¿Qué es la minería de datos? En su respuesta, aborde lo siguiente:

¿Es otra exageración?

La minería de datos es el descubrimiento de conocimiento a partir de los datos, no es un concepto exagerado ya que ha surgido como resultado de la evolución natural de la información donde se ha buscado convertir la gran cantidad de datos existentes en conocimiento que pueda dar solución a distintos problemas de la sociedad y que en un principio eran sólo datos que no se estaban aprovechando.

¿Es una simple transformación o aplicación de tecnología desarrollada a partir de bases de datos, estadísticas, aprendizaje automático y reconocimiento de patrones?

La minería de datos no es una simple transformación o aplicación de tecnología desarrollada a partir de bases de datos, estadísticas, aprendizaje automático y reconocimiento de patrones, si no

que se basa en la integración de estos y en el surgimiento de nuevas disciplinas y técnicas.

Hemos presentado una visión de que la minería de datos es el resultado de la evolución de la tecnología de bases de datos. ¿Crees que la minería de datos también es el resultado de la evolución de la investigación del aprendizaje automático? ¿Puede presentar tales puntos de vista basados en el progreso histórico de esta disciplina? Abordar lo mismo para los campos de estadísticas y reconocimiento de patrones.

Después de la creación de las bases de datos se condujo al desarrollo de mecanismos efectivos para la gestión, almacenamiento y recuperación de datos, después hubo una necesidad de analizar grandes cantidades de datos, para obtener información útil de estos datos.

Describa los pasos involucrados en la minería de datos cuando se ve como un proceso de descubrimiento de conocimiento.

Los pasos son:

Limpieza de datos, un proceso que elimina o transforma el ruido y los datos inconsistentes.
Integración de datos, donde se pueden combinar múltiples fuentes de datos.
Selección de datos, donde los datos relevantes para la tarea de análisis se recuperan de la base de datos.
Transformación de datos, donde los datos se transforman o consolidan en formas apropiadas para la minería.
Minería de datos, un proceso esencial donde se aplican métodos inteligentes y eficientes para extraer patrones.
Evaluación de patrones, un proceso que identifica los patrones verdaderamente interesantes que representan el conocimiento basado en algunas medidas de interés.
Presentación del conocimiento, donde se utilizan técnicas de visualización y representación del conocimiento para presentar el conocimiento extraído al usuario.

[pic 2][pic 3]

¿En qué se diferencia un almacén de datos de una base de datos? ¿En qué se parecen?

Las diferencias son que un almacén de datos es un contenedor de información recopilada de diversas fuentes en un lapso de tiempo determinado y utilizado para análisis de datos mientras que una base de datos es una colección de datos que representa el estado actual de los datos almacenados.

Los almacenes de datos y las bases de datos coinciden en que ambos son contenedores de grandes cantidades de información.

Defina cada una de las siguientes funcionalidades de minería de datos: caracterización, discriminación, asociación y análisis de correlación, clasificación, regresión, agrupación y análisis de valores atípicos. Dé ejemplos de cada funcionalidad de minería de datos, utilizando una base de datos de la vida real con la que esté familiarizado.

Caracterización, resumen de las características generales de una clase de datos, por ejemplo, en base a los datos recolectados en el ITSM, una caracterización serían las características obtenidas de los alumnos de Ingeniería ambiental, por ejemplo, sus promedios.

Discriminación, es una comparación de las características generales de los objetos de datos de la clase objetivo con las características generales de los objetos de una o un conjunto de clases contrastantes. Por ejemplo, la comparación de las características de los estudiantes de ingeniera ambiental con los estudiantes de ingeniería industrial de los alumnos del ITSM.

Asociación, es el descubrimiento de reglas de asociación que muestran condiciones de valor de atributo que ocurren frecuentemente juntas en un conjunto de datos dado.

Clasificación, esta busca predecir algunos valores de datos faltantes o no disponibles, y a menudo numéricos, se usa para predecir la etiqueta de clase de los objetos de datos.

Agrupamiento, analiza objetos de datos sin consultar una etiqueta de clase conocida. Los objetos se agrupan o agrupan según el principio de maximizar la similitud intraclase y minimizar la similitud entre clases.

Análisis de evolución de datos, describe y modela las regularidades o tendencias de los objetos cuyo comportamiento cambia con el tiempo.

Presente un ejemplo donde la minería de datos es crucial para el éxito de una empresa. ¿Qué funcionalidades de minería de datos necesita esta empresa (por ejemplo, piense en los tipos de patrones que podrían extraerse)? ¿Se pueden generar tales patrones alternativamente mediante el procesamiento de consultas de datos o un análisis estadístico simple?

El ejemplo mas usado, es el de las cadenas departamentales, ya que aquí se manejan grandes

cantidades de datos de los compradores y se pueden encontrar patrones de acuerdo con los productos que consumen. Esta información puede ser utilizada para publicidad o servicio al cliente.

Explique la diferencia y similitud entre discriminación y clasificación, entre caracterización y agrupamiento, y entre clasificación y regresión.

La discriminación es diferente de la clasificación en que la primera se refiere a una comparación de las características generales de los objetos de datos de la clase objetivo con las características generales de los objetos de una o un conjunto de clases contrastantes, mientras que la segunda es el proceso de encontrar un conjunto de modelos que describen y distinguen clases de datos o conceptos con el fin de poder usar el modelo para predecir la clase de objetos cuya etiqueta de clase es desconocida. La discriminación y la clasificación son similares en que ambas tratan el análisis de objetos de datos de clase.

...

Descargar como (para miembros actualizados) txt (11 Kb) pdf (70 Kb) docx (724 Kb)

Leer 6 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com