Seguir a Sony España

Sony anuncia los primeros sensores de visión inteligente del mundo con capacidad de procesamiento con inteligencia artificial (IA)

Comunicado de prensa   •   may 14, 2020 10:47 CEST

Permiten el procesamiento de IA en el dispositivo a alta velocidad y contribuyen al desarrollo de sistemas óptimos conectados a la nube

Sony Corporation anuncia hoy el próximo lanzamiento de dos modelos de sensores de visión inteligente, los primeros sensores de imagen del mundo equipados con la capacidad de procesamiento con inteligencia artificial (IA)*1. Al incluir esta funcionalidad en el propio sensor de imagen se posibilita el procesamiento de IA a alta velocidad y la extracción únicamente de los datos necesarios, lo que reduce la latencia en la transmisión de datos al usar servicios en la nube, ataja los problemas de privacidad y reduce el consumo de energía y los costes de comunicación.

*1 Entre los sensores de imagen. Según datos de Sony (a fecha del 14 de mayo de 2020).

Estos productos amplían las oportunidades de desarrollar cámaras equipadas con inteligencia artificial, abre el campo para una amplia gama de aplicaciones tanto en empresas de equipamiento industrial como minorista, y contribuye a construir sistemas óptimos conectados a la nube.

Nombre del modelo Fecha de envío de la muestra Precio de la muestra (sin impuestos)
IMX500 sensor de visión inteligente de 1/2,3 pulgadas (7,857 mm en diagonal) aprox. y 12,3 megapíxeles efectivos (solo chip) Abril 2020 10.000 Yenes
IMX501 sensor de visión inteligente de 1/2,3 pulgadas (7,857 mm en diagonal) aprox. y 12,3 megapíxeles efectivos (producto completo) Junio 2020 (estimado) 20.000 Yenes

La generalización del Internet de las cosas (IoT) ha hecho posible que cualquier tipo de dispositivo pueda conectarse a la nube, haciendo común el uso de sistemas de procesamiento de la información donde esta se obtiene en dichos dispositivos y se procesa en la nube mediante IA. Por otro lado, el creciente volumen de información manejada en la nube plantea diversos problemas: el aumento de la latencia en la transmisión de datos dificulta el procesamiento de la información en tiempo real, así como problemas de seguridad de los usuarios relacionados con el almacenamiento en la nube de datos de identificación personal; y otros problemas como el aumento del consumo de energía y los costes de comunicación que conllevan los servicios en la nube.

Estos nuevos sensores presentan una configuración por capas consistente en un chip de píxeles y otro chip de lógica. Son los primeros sensores de imagen del mundo equipados con funciones de análisis y procesamiento de imágenes con IA en el chip de lógica. La señal adquirida por el chip de píxeles se procesa usando IA en el propio sensor, lo que elimina la necesidad de usar procesadores de alto rendimiento o memoria externa, y permite el desarrollo de sistemas de inteligencia artificial en el propio dispositivo (en inglés, Edge AI). El sensor genera metadatos (información semántica que pertenece a los datos de la imagen) en lugar de la información de la imagen, lo que reduce el volumen de datos y los problemas de privacidad. Además, la capacidad de IA permite ofrecer distintas funcionalidades como el seguimiento de objetos en tiempo real con procesamiento de IA a alta velocidad. También se pueden elegir diferentes modelos de IA, reescribiendo la memoria interna según sean los requisitos del usuario o las condiciones en la ubicación donde se utiliza el sistema.

Principales características

El primer sensor de imagen del mundo equipado con capacidad de procesamiento con inteligencia artificial (IA)

El chip de pixeles está retroiluminado y tiene aproximadamente 12,3 megapíxeles efectivos para capturar información en un amplio ángulo de visión. Además de la habitual circuitería lógica del sensor de imagen, el chip de lógica está equipado con un procesador digital de señal (DSP) original de Sony, dedicado al procesamiento de la señal mediante inteligencia artificial (IA) y memoria para el modelo IA. Esta configuración elimina la necesidad de procesadores de alto rendimiento o memoria externa, lo que lo hace ideal para sistemas Edge AI.

■ Salida de metadatos

Las señales adquiridas por el chip de píxeles se ejecutan a través de un procesador de señal de imagen (ISP) y el procesamiento de inteligencia artificial se realiza en la etapa de procesamiento en el chip de lógica. La información extraída se genera en forma de metadatos, lo que reduce la cantidad de datos que se deben manejar. Puesto que no se muestra la información de la imagen, este sistema ayuda a reducir los riesgos de seguridad y a resolver los problemas de privacidad. Además de la imagen grabada por el sensor de imagen convencional, los usuarios pueden seleccionar el formato de salida de los datos según sus necesidades y usos, como imágenes en formato ISP (YUV/RGB) o imágenes de áreas específicas o ROI (regiones de interés).

■ Procesamiento con IA a alta velocidad

Cuando se graba un vídeo con un sensor de imagen convencional, se necesita enviar datos de cada fotograma individual para el procesamiento con IA, lo que provoca una alta transmisión de datos y dificulta el rendimiento adecuado en tiempo real. Los nuevos sensores de Sony realizan el procesamiento ISP así como la IA a alta velocidad (procesamiento de 3,1 milisegundos para MobileNet V1*2) en el chip de lógica, por lo que pueden completar todo el proceso en cada fotograma de vídeo. Este diseño hace posible ofrecer seguimiento de objetos de alta precisión en tiempo real durante la grabación de vídeo.

*2 MobileNet V1: Un modelo de análisis de imágenes con IA para el reconocimiento de objetos en dispositivos móviles.

Modelo de IA seleccionable

El usuario puede escribir los modelos de IA de su elección en la memoria integrada y puede reescribirlos y actualizarlos según sus requisitos o los requisitos de la ubicación donde se utilice el sistema. Por ejemplo, al instalar varias cámaras con este producto en un centro comercial, se puede usar de forma versátil un solo tipo de cámara en diferentes ubicaciones, circunstancias, momentos o propósitos. Cuando se instale en los accesos de entrada, se puede usar para contar la cantidad de visitantes que acceden a la misma; cuando se instala en el estante de una tienda, se puede usar para detectar escasez de existencias; cuando esté en el techo, para el mapeo térmico de los visitantes (para detectar los lugares donde se reúnen muchas personas), etcétera. Además, el modelo de IA de una cámara concreta se puede reescribir de uno que sirva para detectar mapas de calor a otro que pueda identificar el comportamiento del consumidor, y así sucesivamente.

Especificaciones principales

Modelo IMX500 (solo chip) IMX501 (producto completo)
Número de píxeles efectivos 4056 (H) × 3040 (V), aprox. 12,3 megapíxeles
Tamaño de imagen Diagonal 7,857 mm (1/2,3 pulgadas)
Tamaño de cada celda 1,55 μm (H) × 1,55 μm (V)
Tasa de frames Pixel complete 60 fps
Vídeo 4K (4056 × 2288) 60 fps
1080p 240 fps
Completo/vídeo + procesamiento IA 30fps
Salida metadatos 30fps
Sensibilidad (F5,6 valor estándar) Aprox. 250LSB
Nivel de señal de saturación del sensor (valor mínimo) Aprox. 9610e-
Alimentación Analógica 2,7V
Digital 0,84V
Interface 1,8V
Funciones principales Función de procesamiento de IA, ISP, disparo HDR
Salida MIPI D-PHY 1.2 (4 vías) / SPI
Array de filtro de color Array Bayer
Formato de salida Imagen (Bayer RAW), salida ISP (YUV/RGB), ROI, metadatos
Exterior - Cerámica LGA 12,5 mm (H) × 15,0 mm (V)

Acerca de Sony Corporation

Sony Corporation es una compañía de entretenimiento creativo con una sólida base tecnológica. A través de sus divisiones, que van desde videojuegos y servicios en línea, pasando por música, cine, electrónica, semiconductores y servicios financieros, el objetivo de Sony es alimentar la ilusión gracias al poder de la creatividad y de la tecnología. Se puede encontrar más información en la página web global de Sony: http://www.sony.net/