Manufactura
jemo53459 de Abril de 2013
5.914 Palabras (24 Páginas)341 Visitas
INSPECCIÓN POR VISIÓN
3.1 INTRODUCCIÓN
Es preciso reconocer que hoy por hoy la visión por computador a veces no es la mejor solución a un problema. Existen muchas ocasiones en las que el problema es tan complejo que la solución humana es lo mejor. Por ejemplo imaginemos una conducción de un vehículo en una carretera con tráfico intenso. Pero a veces, las soluciones humanas tienden a ser inexactas o subjetivas y en ocasiones lentas y presentan una ausencia de rigor así como una pobre percepción (Marshall y Martin 1993). No obstante, la solución humana es menos estructurada que la solución artificial y muchos problemas de visión por computador requieren un nivel de inteligencia mucho mayor que el que la máquina pueda ofrecer. El sistema de visión humana puede describir automáticamente una textura en detalle, un borde, un color, una representación bidimensional de una tridimensional, ya que puede diferenciar entre imágenes de diferentes personas, firmas, colores, etc., puede vigilar ciertas zonas, diagnosticar enfermedades a partir de radiografías, etc. Sin embargo, aunque algunas de estas tareas pueden llevarse a cabo mediante visión artificial, el software o el hardware necesario no consigue los resultados que serían deseables.
Aun a pesar de las limitaciones expuestas, cada día es mayor el número de aplicaciones de la visión artificial. Por ello sólo es posible dar una pequeña pincelada sobre las múltiples aplicaciones en las que la visión artificial se ha aplicado hasta el momento. Aquí solamente proporcionamos algunas ideas para generar aplicaciones en la mente del lector. Obviamente los ejemplos que se presentan son aplicables a cualquier otro proceso diferente y en otro campo industrial o científico también diferentes. En Newman y Jain (1995) o Davies (1997) se puede encontrar una amplia revisión sobre la inspección visual y aplicaciones de la visión a diferentes campos de la vida real, que nos dan idea del amplio abanico de posibilidades.
Existen herramientas y paquetes software cuya finalidad principal son las aplicaciones industriales, tal es el caso de IMAQ Vision de National Instruments (IMAQ), y por supuesto paquetes de propósito general con ciertas funciones de aplicación como es el caso de las Matrox Imaging Libraries (Mil) o el Toolbox Image de MATLAB (Matlab). A partir de ahora la aparición en el texto de los anacronismos entre paréntesis expresará la capacidad de la herramienta correspondiente para llevar a cabo la tarea que se describe.
Cabe no obstante diferenciar entre las aplicaciones donde la visión artificial constituye una herramienta por sí sola y aquellas otras en las que es parte de un sistema más general. El primer caso engloba todas aquellas aplicaciones en las que el único sensor presente es el de visión. En el segundo caso nos estamos refiriendo a aquellos sistemas multisensoriales tal como los equipos de navegación en robótica donde la visión constituye una capacidad sensorial más, para la percepción del entorno que rodea al robot.
En cualquier caso, el proceso que normalmente hay que seguir para llegar a una determinada aplicación se resume en el esquema de la figura 1, donde partiendo de la adquisición de las imágenes se llega a las aplicaciones de interés.
Figura 1 Esquema de procesamiento de imágenes hasta llegar a las aplicaciones
Las imágenes se presentan al sistema bajo diferentes formatos, cuyos detalles están lejos del alcance de este curso. A modo de ejemplo citamos los siguientes: TIFF, BMP, GIF, JPG, PNG, DICOM, RAW.
Conscientes de que no es posible mencionar todas las aplicaciones posibles, a lo largo de la presente exposición se realiza un recorrido por diversas aplicaciones, incluyendo cuando sea posible ciertas referencias bibliográficas por si el lector desea profundizar en ellas. En cualquier caso, el lector puede recurrir a Pajares y col. (2001, 2003) para obtener más información sobre lo expuesto aquí, especialmente en la primera referencia, donde se proporcionan todos los métodos descritos en este documento y utilizados en las diferentes aplicaciones. También en dicha referencia se incluye un tema específicamente dedicado a proporcionar una visión general sobre diversas aplicaciones de interés.
3.2 NAVEGACIÓN EN ROBÓTICA
En este caso, la visión es un elemento de un sistema multisensorial. La información procedente de la visión es validada, comparada y finalmente integrada con el resto de la información proporcionada por otro tipo de sensores. El resultado es la reconstrucción de la escena 3-D, que permite la navegación autónoma del sistema (Schneider 1996, López-Orozco 1999).
Para la navegación en robótica se recurre generalmente a técnicas de visión estereoscópica con el fin de poder reconstruir la escena 3-D. Si a esto se le añade algún módulo de reconocimiento 3-D con el fin de identificar la presencia de determinados objetos, hacia los que debe dirigirse o evitar, tanto mejor.
En la figura 2 (a) y (b) se muestran sendas imágenes izquierda y derecha captadas mediante un sistema de visión estereoscópica. El objetivo es la obtención de un mapa de profundidad del entorno, tal y como aparece codificado por el color en (c).
(a) (b) (c)
Figura 2 Imágenes estereoscópicas de laboratorio; (a) y (b) imágenes originales izquierda y derecha; (c) mapa de disparidades en función del color.
No es exclusivo su uso en robótica, sino que podría utilizarse en otras aplicaciones tales como guiado automático de máquinas, tal y como proponen Amat y Casal (1989) para máquinas agrícolas. También para la detección y estimación del movimiento de vehículos (Pei y Liou 1998, Tan y col. 1998).
3.3 BIOLOGÍA, GEOLOGÍA Y METEOROLOGÍA
En el campo de la biología podríamos distinguir entre aplicaciones microscópicas y macroscópicas. En una imagen microscópica nos podemos encontrar con abundantes organismos, que mediante técnicas de segmentación orientadas a regiones, por ejemplo utilizando una binarización, podrían ser aislados para su identificación mediante las correspondientes propiedades (tamaño, excentricidad, color, etc.) o para contar el número de microorganismos o células presentes en una imagen, IMAQ, Mil, Matlab. En las imágenes macroscópicas pueden utilizarse las regiones para la identificación de determinados tipos de texturas en vegetales o características de diferentes áreas naturales por su color o el crecimiento de ciertas especies por diferencia de imágenes.
En geología se puede también detectar movimientos de terrenos captando dos imágenes en diferentes momentos de tiempo para observar la variación mediante una diferencia de imágenes (bajo similares condiciones de iluminación).
Puede resultar de interés el hecho de identificar el grado de floración de un determinado cultivo, por ejemplo, de un campo de girasoles. Para ello se extrae de la imagen la componente de color amarillo por el color, tras lo cual se binariza y se obtiene el número de píxeles blancos o negros, que nos permite obtener el porcentaje de floración, tal y como se muestra en la figura 3.
(a) (b)
Figura 3 Grado de floración de un campo de cultivo de girasoles.
En Glasbey y Horgan (1995) se estudia el procesamiento de forma específica en imágenes biológicas.
La transformada de Fourier puede resultar útil por ejemplo para determinar la naturaleza de una determinada formación geológica o de una especie biológica. En efecto, la figura 4(a) muestra una imagen de una formación geológica con estratos inclinados formando un ángulo de 45º aproximadamente. El espectro de frecuencias en este caso, muestra una tendencia inclinada de unos 45º, que caracteriza dicha estratificación, tal y como aparece en la figura 4(b) (IMAQ, Matlab).
En Meteorología podríamos utilizar las técnicas de detección y predicción del movimiento (Pajares y Cruz 2001) para observar, por ejemplo, la evolución de ciertas masas nubosas, u otros fenómenos meteorológicos, a través de imágenes recibidas vía satélite. En Sonka y col. (1995) se muestra precisamente un ejemplo sobre la evolución y predicción de una masa de nubes a partir de una secuencia de imágenes.
(a) (b)
Figura 4 (a) Formación geológica estratificada; (b) su espectro de frecuencia
También puede resultar de interés determinar el grado de cobertura de una nevada en función de la superficie cubierta. En la imagen de la figura 5(a) se muestra un campo cubierto por una intensa nevada y en (b) aparece la misma imagen binarizada que determina la zona cubierta.
La técnica anterior podría aplicarse en otras áreas tales como Medio Ambiente para identificar zonas degradadas, contaminadas o deforestadas.
(a) (b)
Figura 5 (a) Paisaje nevado; (b) imagen binaria mostrando el grado de cobertura de la nevada.
3.4 MEDICINA
La comunidad médica utiliza muchas aplicaciones en las que aparece el procesamiento de imágenes, la mayoría de ellas orientadas hacia el diagnóstico de dolencias o enfermedades, entre las que se incluyen radiografías, resonancias magnéticas, tomografías, etc.
Éste es un campo extraordinariamente
...