ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

DeepLearning Aplicado al Reconocimiento de Imagenes


Enviado por   •  9 de Mayo de 2021  •  Informes  •  1.455 Palabras (6 Páginas)  •  78 Visitas

Página 1 de 6

 

DeepLear

ning Aplicado al Reconocimiento de Imagenes

Jhon Edison Bravo Casas, Laura Valentina Paramo Molina

Grado de Ingeniería en Informática

Universidad de Ibagué

2220181001@estudiantesunibague.edu.co - 2220181028@estudiantesunibague.edu.co

        

Resumen- Este documento describe un ejercicio práctico haciendo uso de Teachable Machine que tiene como fin entrenar un modelo capaz de identificar si el animal que aparece en una imagen corresponde a un perro, lobo u otro animal. Durante el desarrollo del informe se detalla detenidamente la fuente de la información, los pasos que se llevaron a cabo para realizar las diferentes actividades y al final de este se sacan conclusiones basadas en las métricas obtenidas del modelo creado.

Palabras Clave – Inteligencia Artificial, Modelo, Reconocimiento de imágenes.

  1. Introducción

La inteligencia artificial es utilizada en diferentes campos del conocimiento y su aplicación ha significado un gran avance tecnológico. El reconocimiento de imágenes es producto del desarrollo de esta rama de las ciencias de la computación y es una de las áreas mas avanzadas gracias al aprendizaje automático y profundo. Los agentes capaces de reconocer objetos específicos o clasificarlos generalmente son utilizados en la industria para realizar análisis de clientes y usuarios, diagnósticos de enfermedades, realidad aumentada, etc.

El desarrollo de una aplicación de reconocimiento de imágenes resulta ser un proceso largo y complejo, es por esto que compañías como Google ofrecen al mercado herramientas como Teachable Machine, una aplicación web que permite la creación de un modelo para reconocer imágenes, sonidos o posiciones, además de ofrecer la posibilidad de exportar el modelo entrenado para ser incorporado posteriormente en un proyecto.  

Dentro del campo de reconocimiento de imágenes, también conocido como visión artificial o visión por computadora se desarrollan modelos entrenados capaces de identificar patrones y clasificar imágenes según parámetros que son obtenidos gracias al aprendizaje automático. Una vez el modelo se encuentra totalmente entrenado es necesario aplicar algunas métricas para determinar su desempeño. Para visualizar de manera grafica los resultados de las predicciones se utiliza la matriz de confusión, en esta se visualizan los casos en que el modelo predijo correcta o incorrectamente la clasificación de una imagen o clase. Junto con la matriz de confusión se calcula estadísticamente la precisión, exactitud y sensibilidad que presenta el modelo.

Utilizando todos los recursos anteriormente nombrados, además de lo aprendido durante el desarrollo del curso Agentes Inteligentes, se entrena un modelo que permite la identificación de imágenes, para posteriormente analizar su desempeño obteniendo métricas que reflejan las propiedades que posee el mismo.

  1. Conseguir los datos

El reconocimiento de imágenes se hace a través del aprendizaje automático, es decir que la IA es capaz de identificar patrones sin necesidad de ser programada previamente, además de tener la capacidad de cambiar y adaptarse a nuevos datos. Para lograr que la IA identifique estos patrones es necesario proporcionar datos, entre mas datos sean aportados hay mas probabilidad de que el modelo sea mas preciso.  

La obtención de imágenes puede hacerse a través de diferentes herramientas, sin embargo, por la cantidad de imágenes requeridas se utilizó la web Kaggle donde se obtuvo una base de datos con 1000 imágenes de perros y 1000 imágenes de lobos, [1], en otra base de datos se obtuvieron las imágenes correspondientes a otros animales que no pertenecen a las anteriores categorías [2].

  1. ORGANIZAR LOS DATOS

Utilizando las imágenes extraídas de Kaggle se separan en carpetas distintas las muestras de la clase Perros, Lobos y Otros. (En esta carpeta se almacenan imágenes de ardillas, arañas, ovejas, caballos, elefantes y vacas).

Durante la fase de organización se eligieron imágenes de tamaños parecidos, además de perros y lobos de diferentes razas, esto con el fin de lograr que la IA tenga mas patrones para identificar y más imágenes de referencia para lograr mayor precisión.

  1. PREPARAR LA DATOS

Una vez se clasifican las imágenes en carpetas separadas es necesario crear y subir las muestras a Teachable Machine. En la aplicación se especifican las tres clases a identificar, para este ejercicio se definieron tres clases: Perros, Lobos, Otros.

[pic 1]

Figura 1. Clase Perro

[pic 2]

Figura 2. Clase Lobo

[pic 3]

Figura 3. Clase Otros

Las imágenes utilizadas dentro de las diferentes clases corresponden a lobos y perros que tienen un parecido físico, además de distintas razas, edades y con pelaje de colores variados. Lo que se busca haciendo esta selección es entrenar el modelo de manera que este sea capaz de utilizar toda la información para que sea más sensible y preciso a la hora de identificar las diferentes clases.

  1. CREACION DEL MODELO

Una vez se han ingresado las muestras con las imágenes apropiadas, se procede a entrenar el modelo utilizando la opción Train Model dentro del Teachable Machine. El tiempo de creación del modelo es proporcional a la cantidad de muestras aportadas en cada clase.

  1. PRUEBA DEL MODELO

Una vez se ejecuten todas las fases descritas anteriormente el modelo se encuentra listo para ser probado. Dentro del Teachable Machine existe la opción de cargar imágenes desde el dispositivo o desde la webcam. En este caso se utilizó la opción de cargar las muestras desde el dispositivo.

[pic 4]

Figura 4. Prueba utilizando la imagen de un Perro

[pic 5]

Figura 5. Prueba utilizando la imagen de un Lobo

[pic 6]

Figura 6. Prueba utilizando la imagen de una mariposa

  1. VALIDACION DEL MODELO

Después de entrenar un modelo es necesario conocer su rendimiento, para esto se utiliza una representación grafica de las predicciones realizadas por el modelo, esta representación grafica se denomina Matriz de confusión y a partir de la misma es posible calcular métricas que evalúan diferentes características que posee el modelo entrenado.

...

Descargar como (para miembros actualizados)  txt (9.9 Kb)   pdf (637.2 Kb)   docx (1.1 Mb)  
Leer 5 páginas más »
Disponible sólo en Clubensayos.com