Machine vision: fundamentos de inspección visual y control de calidad óptico

Los fundamentos de machine vision describen tres términos que suelen confundirse: machine vision (la tecnología), inspección visual (la tarea) y control de calidad óptico (el proceso). La tecnología combina cámaras, ópticas, iluminación, computación y software para automatizar decisiones visuales en línea de producción, sirviendo de pilar de la automatización industrial. La inspección visual es una de esas decisiones: pasa o falla, arañado o limpio, lleno o subllenado. El proceso de gestión de calidad es el envoltorio auditable a su alrededor, bajo el cual la inspección se documenta para auditorías ISO 9001 o GMP.

¿Qué significa realmente machine vision?

Machine vision es el término paraguas para los sistemas que combinan cámaras, iluminación, computación y software para automatizar decisiones visuales en línea de producción. Las decisiones pueden ser pasa o falla (calidad), qué pieza es esta (identificación), o dónde está exactamente la pieza (guía de robot o pinza).

Tres componentes están siempre en juego: una fuente de imagen (cámara más iluminación más óptica), un algoritmo que interpreta la imagen (procesamiento de imagen basado en reglas o red neuronal), y una acción que la planta ejecuta sobre el resultado (rechazar, documentar, parar la línea, activar una pinza). Para el cuadro completo de cómo encajan estas piezas recomendamos la guía de procesamiento de imagen industrial y la guía de inspección machine vision como lecturas complementarias.

¿Qué hace realmente la inspección visual en línea?

La inspección visual es la tarea clásica en la que la mayoría de la gente piensa cuando habla de calidad con machine vision. Cuando una cámara en una línea de envasado comprueba cada etiqueta, es inspección visual. Cuando una cámara dentro de una máquina de moldeo por inyección señala rebabas o inclusiones, es inspección visual. El término describe la tarea, no la tecnología.

En la práctica la inspección visual es el término puente que los responsables de calidad entienden enseguida. Llevan haciendo comprobaciones visuales manualmente o con lupas desde hace décadas. Una cámara que automatiza la misma comprobación es una estación de inspección. Para una definición más profunda lee qué es la inspección visual con IA.

Cámaras, ópticas y lentes: qué moldea la imagen

Antes de que cualquier modelo corra, la cámara y la lente deciden cuánta información tiene el sistema. Tres parámetros ópticos guían cada elección.

La distancia de trabajo es el hueco entre lente y pieza. Un setup corto mantiene el rig compacto pero limita cómo la línea se mueve a su alrededor. Una más larga ayuda cuando cintas transportadoras, robots u operarios comparten el mismo espacio.

El campo de visión es el área que la cámara captura en un cuadro. Un cuadro estrecho aumenta la densidad de píxeles en un defecto pequeño; uno amplio cubre un producto entero pero con menos detalle por milímetro. La mayoría de los proyectos iteran hasta que la clase de defecto más pequeña aún ocupa suficientes píxeles para un análisis de imagen fiable.

La elección de lente se sigue de esos dos parámetros. Una lente de distancia focal fija es más barata, más nítida y más fácil de calibrar. Una lente zoom intercambia nitidez por flexibilidad cuando el mix de producto en línea cambia constantemente. Las lentes telecéntricas eliminan el error de perspectiva y son la elección natural para medición dimensional, calibración y metrología, donde un milímetro de paralaje rompe la lectura.

Para características tridimensionales como alabeo, profundidad de abolladura o conteo de piezas apiladas, las cámaras 3D añaden un canal de profundidad sobre la imagen 2D. Una línea láser, luz estructurada o par estéreo da al sistema un mapa de altura que la lente sola no recupera.

La óptica también marca el límite para el reconocimiento óptico de caracteres. El OCR sobre un código de fecha solo funciona si cada carácter ocupa cerca de 20 píxeles en la imagen capturada. Si la lente no entrega eso, ningún modelo salva la lectura.

¿Cuáles son las cuatro clases algorítmicas de machine vision?

Cada proyecto de machine vision encaja en una de las cuatro clases algorítmicas. Saber cuál encaja cambia los datos que necesitas recoger y el setup de iluminación que vas a construir.

La primera clase es el procesamiento de imagen basado en reglas, que cubre medición clásica, detección de bordes, OCR y análisis de blob. Es determinista, rápido y documentado desde hace décadas, y sigue siendo la elección correcta para medición dimensional, presencia/ausencia y lectura de códigos cuando geometría e iluminación son estables.

La segunda clase es la clasificación por deep learning, donde una red neuronal ordena cada pieza en una de varias categorías como pasa, arañazo o abolladura. Funciona bien cuando el defecto es visualmente consistente y existen ejemplos etiquetados para cada clase. Aquí es donde la inteligencia artificial moderna más compensa, porque el contraste de imagen guía la precisión del modelo.

La tercera clase es la detección de anomalías. El modelo aprende cómo se ven las piezas buenas y luego señala cualquier cosa que no coincida, incluso tipos de defecto que nadie había visto. Es la elección correcta cuando los defectos son raros, variados o no se repiten.

La cuarta clase cubre la detección y segmentación de objetos. El modelo localiza dónde está cada característica dentro de la imagen, píxel a píxel. Los equipos la usan para contar piezas en una bandeja, aislar células individuales dentro de un lote, o guiar un robot a coger un artículo específico.

¿Qué cuatro factores deciden si tu primer proyecto sale a producción?

El primer factor es la iluminación, y es el predictor único más importante de si un proyecto de machine vision funciona. La iluminación hace un defecto visible o invisible, y ningún algoritmo recupera contraste que nunca existió en la imagen. Presupuesta una semana de pruebas de iluminación antes de tocar el modelo.

El segundo factor son los datos. Los algoritmos clásicos necesitan parámetros elegidos con cuidado, mientras que la IA moderna necesita ejemplos, normalmente de 50 a 500 imágenes etiquetadas para un pilot. El número correcto depende de la variedad de defectos, y más clases significa más imágenes.

El tercer factor es la integración. Una estación de machine vision que no consigue hablar con el PLC, MES, sistema de control o la compuerta de rechazo es decoración cara. Planifica pronto cómo los resultados de inspección llegan a la línea, incluyendo reintentos, estados de fallo y el HMI del operario.

El cuarto factor es el mantenimiento. Cada línea cambia con el tiempo, así que los modelos derivan, la iluminación envejece y las cámaras acumulan polvo. Una estación que funciona hoy no es una estación que funciona en seis meses a menos que alguien se ocupe. Presupuesta del 10 al 20% del coste de construcción al año para el cuidado continuo.

¿Qué aplicaciones de machine vision salen a producción más rápido?

La inspección de etiquetas e impresión sobre envase es uno de los puntos de partida más comunes. Los volúmenes son altos, las reglas son claras y ya hay mucha imagen de referencia en el edificio. El ROI a menudo se demuestra en semanas en la primera línea que corre.

Las comprobaciones de sello y llenado en botellas, sachets y blísteres son otra familia que sale a producción rápido. Para playbooks específicos por categoría, lee nuestras inmersiones profundas en envase alimentario y envase farmacéutico.

Los defectos superficiales en piezas moldeadas por inyección y estampadas también salen a producción rápido. Las clases de defecto se entienden bien, la geometría es estable y las piezas son fáciles de iluminar. Esto hace un buen primer proyecto para PYMES que no quieren empezar con el problema más difícil de la planta.

Por dónde empezar

Elige una línea que corra todos los días, con una clase de defecto que tus operarios puedan describir en una frase. Construye un pequeño rig de iluminación y captura 200 imágenes. Decide entre un enfoque basado en reglas y uno aprendido solo después de mirar tus propias imágenes. Para una visión más amplia tecnología por tecnología lee también la guía de sistemas machine vision.

Preguntas frecuentes sobre fundamentos de machine vision

¿Cuál es la diferencia entre machine vision e inspección visual?

Machine vision es el stack tecnológico de cámaras, iluminación, computación y software. La inspección visual es una tarea que puedes correr encima, en concreto decidir si una pieza pasa una comprobación de calidad mirándola. Otras tareas como guía de robot e identificación comparten el mismo hardware pero resuelven problemas distintos.

¿Qué necesita realmente un primer proyecto de machine vision?

Tres cosas, en este orden: una clase de defecto que tus operarios puedan describir en una frase, un setup de iluminación estable que haga el defecto visible, y de 50 a 500 imágenes etiquetadas. La elección de algoritmo y la integración vienen después de mirar tus propios datos, no antes.

¿Cuándo el enfoque basado en reglas todavía gana a la IA?

Cuando la inspección es dimensional, la geometría es apretada, la iluminación es estable y la taxonomía de defectos es cerrada. Lectura de códigos, presencia/ausencia y mediciones al micrómetro siguen siendo el terreno natural para el machine vision clásico. La IA toma el relevo cuando el set de defectos es abierto, variado o depende de cambios de textura sutiles.

Puntos clave

Machine vision, inspección visual y proceso de gestión de calidad no son intercambiables. Nombran respectivamente la tecnología, la tarea y el procedimiento, y una línea funcional usa típicamente las tres juntas.

Los sistemas modernos se dividen en cuatro clases algorítmicas: algoritmos basados en reglas, clasificación por deep learning, detección de anomalías y detección o segmentación de objetos. Cada una encaja en un patrón de defecto diferente.

La iluminación es el predictor único más importante del éxito del proyecto. Ningún algoritmo salva una imagen donde el defecto es invisible, así que presupuesta tiempo para pruebas de iluminación antes de cualquier trabajo de modelo.

Planifica la integración en el PLC, MES y ruta de rechazo desde el primer día. Una estación de inspección standalone que no puede actuar sobre sus propios resultados se convierte en un cuadro de mandos, no en un control.

El mantenimiento es parte del proyecto, no después. Los modelos derivan, las luces envejecen y las cámaras acumulan polvo. Presupuesta del 10 al 20% del coste de construcción al año para el cuidado continuo.

Empieza ya

¿Quieres ver cómo funciona Enao Vision en tu línea? Puedes empezar gratis usando un iPhone que ya tienes, o unirte a la comunidad para comparar notas con otros equipos de calidad y operaciones que están llevando la IA a la planta.