Skip to main content

¿Qué es la visión por computadora en 3D?

La visión por computadora tridimensional (3D) es un método de usar cámaras que permite a las computadoras emular la visión humana para construir una imagen en 3D. Con la visión por computadora en 3D, una computadora usa dos cámaras a la vez, al igual que una persona usa dos ojos, para construir una imagen con profundidad. Además de su uso en la creación de imágenes y películas en 3D con dispositivos de grabación, la visión por computadora en 3D también se usa con frecuencia con la robótica, lo que permite a los robots capturar entornos 3D reales. Uno de los principales problemas en el desarrollo de este sistema fue asegurar que las cámaras estuvieran alineadas correctamente, pero muchos sistemas han perfeccionado esta técnica. Este método también hace que la tecnología 3D sea más barata para el mercado de consumo, ya que no se requieren procesadores de imágenes costosos para construir la imagen 3D.

Para que la visión por computadora en 3D funcione, la computadora necesita usar dos cámaras diferentes de la misma manera que las personas usan dos ojos. Ambas cámaras graban o capturan un entorno desde diferentes ángulos, lo que permite que la computadora use un algoritmo para combinar las imágenes y formar una profundidad real. Las computadoras también pueden capturar imágenes 3D en tiempo real, sin la necesidad de mucho procesamiento entre la captura y la construcción 3D. Esto hace que la visión por computadora en 3D sea útil para los mercados de juegos, películas y grabación.

Además de usar la visión por computadora en 3D para crear imágenes y películas, este método también se usa a menudo en robótica, especialmente con robots diseñados para moverse e interactuar con un entorno. Al usar las dos cámaras, el robot puede comprender la profundidad de un entorno, lo que lo hace más hábil para trabajar con otros objetos y superar obstáculos físicos como huecos y golpes. El movimiento robótico también es más suave debido a esta comprensión de la profundidad.

El principal problema en la creación de la visión por computadora en 3D fue alinear las dos cámaras para que funcionen como ojos. Muchos de los sistemas iniciales que utilizan esta tecnología no pudieron alinear las cámaras, por lo que las imágenes salieron borrosas o combinadas de manera incoherente. A partir de 2011, muchos sistemas han superado este problema y algunos están disponibles para los consumidores.

Antes de la visión por computadora en 3D, había procesadores de imágenes en 3D que podían realizar la misma tarea de tomar imágenes y combinarlas para formar profundidad. El principal problema con esta técnica es que los procesadores de imágenes son caros, lo que los hace inaccesibles en gran medida para el mercado de consumo. El costo no es tanto un problema para la visión por computadora en 3D, porque el proceso de combinar las imágenes es bastante simple. Esto permite al mercado de consumidores disfrutar de la tecnología 3D sin un alto precio.