Análisis usando la función AutoModel de RapidMiner
Emi92Apuntes18 de Enero de 2023
662 Palabras (3 Páginas)85 Visitas
[pic 1]
Módulo: Business Understanding
Actividad: Análisis Modelo AutoModel
Nombre: Juan Pablo Torres Mondragón
Asesor: Fanny Gabriela Maldonado Nava
Fecha: 25/11/2022
Análisis usando la función AutoModel de RapidMiner
El uso de la herramienta AutoModel en RapidMiner nos será de mucha utilidad como ya lo hemos visto en los videos.
Ahora, retomando el análisis de la data de vinos, como podemos apreciar, la función AutoModel nos ofrece crear un modelo de regresión lineal el cual facilitará la lectura de datos y una mejor toma de decisiones.
Mi análisis lo quiero basar más que nada en lo que nos puede ofrecer la opción de AutoModel al momento de querer realizar un modelo de regresión, por ejemplo, que sea de forma rápida y confiable.
Esta función de RapidMiner nos será de mucha utilidad si ya contamos con la data a la cual queremos realizar un proceso de regresión, al momento de cargar la información podremos visualizarla y poder aplicar los cambios deseados, como eliminar filas que nos son útiles, ordenar según valores, combinar celdas y crear nuevas para obtener datos combinados que después nos puedan resultar de gran utilidad al momento de la lectura.
Podemos guardar esos cambios y posterior seleccionar esa data para poder aplicar la función de AutoModel, es un proceso muy sencillo el cual el programa se encarga de realizar todo el modelo sin necesidad de generar comandos como en Python o Julia, nos brindará opciones para poder realizar predicciones con solo seleccionar la columna de nuestro interés, también nos ofrecerá visualizar la calidad de la información, así como la correlación y estabilidad que existe entre columnas antes de pasar a escoger el tipo de modelaje que deseamos.
Posterior pasamos la proceso de modelado, donde tendremos varias opciones a elegir desde un modelo linear, arboles de decisión, máquinas de soporte vectorial, etc. Así ya estaremos preparados con nuestra data procesada y lista para poder analizar de forma eficiente y rápida nuestros datos.
Teniendo como ejemplo la data del análisis del vino y sus características:
Podemos observar en el gráfico de predicción, nos puede ayudar a reconocer los factores que nos darán como, resultado una mejor calidad de producto (vino), esto mismo se puede aplicar a mucha data de ramos diferentes, para medir productividad, alcance de algún producto, efectividad en zonas de mercadeo, lanzamientos de nuevos productos etc. [pic 2]
Dentro de cada resultado de los modelos deseados, tendremos un menú donde podremos visualizar el modelo, las medidas, un simulador en el cual podremos tener interacción para poder manipular cada factor y así cambiar los valores, también se cuenta con la opción de Optimizar en automático donde se realizarán cambios de forma automática para contar con valores más acertados a nuestro objetivo, en este caso obtener una mejor calidad de vino.
Otra de las opciones que resulta muy útil y que nos ayudara de forma rápida a visualizar la información y tomar una decisión de forma rápida es un árbol de decisión, esta opción también la podemos elegir al momento del modelado.
[pic 3]
Podemos observar cómo dependiendo de las características deseadas para la obtención de un mejor vino, es como lo va ramificando el árbol, también contamos con la opción de crear un bosque y nos arrojará una serie de árboles los cuales nos mostrarán las características y desviaciones de cada factor.
Conclusión
RapidMiner es una excelente opción cuando de ciencia de datos hablamos, ya que es un programa muy interactivo y fácil de usar, en específico la función de AutoModel nos será de mucha ayuda para quienes comienzan a introducirse en la ciencia de datos, nos permitirá experimentar y aprender de los procesos, además de que el programa cuenta con data precargada la cual podemos utilizar para realizar ejemplos y poder probar las distintas opciones de modelaje de datos.
...