Skip to main content

¿Qué es el casco visual?

En imágenes de computadora, un casco visual es la forma tridimensional (3D) de un objeto que se extrapola de múltiples imágenes bidimensionales (2D) tomadas en diferentes ángulos alrededor del objeto que se aproxima. Los datos de superficie sobre la forma de un objeto se obtienen trazando el contorno de un objeto en una imagen, esencialmente creando una silueta del objeto sin textura o detalle interno específico. Una colección de siluetas, todas extraídas de imágenes tomadas en diferentes ángulos, se ensamblan juntas en el espacio 3D y el área entre los puntos de contorno conocidos se interpola para formar un objeto 3D que tiene el contorno 3D general del objeto real, aunque quizás sin tanta Detalle especifico. El proceso utilizado para crear un casco visual, también conocido como forma de silueta (SFS), puede ser más rápido, menos intensivo en el procesador y menos costoso de implementar que algunas técnicas estereoscópicas para capturar movimiento 3D o detectar la forma de objetos 3D. Algunas de las aplicaciones que utilizan el casco visual incluyen la detección de obstáculos de visión por computadora, la captura de movimiento con fines médicos u otros fines analíticos y el escaneo virtual de objetos en 3D cuando el SFS se realiza en condiciones altamente controladas.

El proceso de formar el casco visual de un objeto a partir de un conjunto de imágenes implica aislar la silueta del objeto del fondo en las imágenes. La ubicación exacta y la orientación de las cámaras utilizadas para adquirir las imágenes también son importantes para el proceso. En cada imagen, se realiza un camino recto desde el plano de visualización de la imagen hasta el espacio de la escena y termina en los contornos del objeto que se está fotografiando. Esto se hace para cada imagen y el área donde cada uno de los caminos, que se asemejan a conos en un entorno 3D, se cruzan, lo que da un volumen muy áspero, en forma de bloque, que contiene el objeto dentro de las dimensiones de la escena. Para algunas aplicaciones, como la visión artificial, esta información es suficiente para evitar obstáculos básicos.

Las siluetas se pueden refinar aún más para que los detalles geométricos más pequeños se traduzcan en el casco visual. Estos pueden incluir agujeros en el objeto, como podría ocurrir si el casco visual se construyera a partir de imágenes de un humano parado con las piernas separadas o los brazos extendidos. Un atributo de una forma de objeto que no se puede capturar con precisión con técnicas SFS es una superficie cóncava, ya que no contribuye a la silueta.

La técnica SFS para crear el casco visual de un objeto puede ser increíblemente detallada y precisa si se utilizan algoritmos refinados junto con condiciones controladas para crear las imágenes de origen. Estas condiciones pueden incluir una fuente de luz única y consistente, un fondo estático y medible, y cámaras que están calibradas de manera exacta. Dadas estas condiciones, se pueden construir modelos 3D de objetos muy precisos, y la captura de movimiento se puede realizar sin la necesidad de marcadores, trazadores o equipos especiales más allá de las cámaras.