OPPO expone 7 trabajos seleccionados y gana 8 retos en el CVPR 2022

OPPO logró presentar siete de sus trabajos más destacados en la conferencia mundial sobre Visión por Computador y Reconocimiento de Patrones (CVPR) lo que lo posicionó entre las empresas tecnológicas más exitosas del evento realizado el pasado mes de junio. OPPO participó en ocho categorías de la conferencia en la cual obtuvo tres primeros puestos, un segundo y cuatro terceros.

Gracias al constante desarrollo de la tecnología de aprendizaje profundo, la inteligencia artificial (IA) ha trascendido de la inteligencia perceptiva a la cognitiva. Además de ser capaz de «ver» u «oír» como los humanos, la tecnología moderna de Inteligencia artificial es ahora capaz de alcanzar un nivel de capacidad cognitiva similar a la de os humanos. La fusión multimodal, la tecnología de inteligencia visual en 3D y el aprendizaje automático de máquinas, se están convirtiendo en temas de investigación clave en el campo de la IA, y en áreas en las que OPPO ha logrado obtener varios avances teóricos y tecnológicos.

«En 2012, las redes neuronales profundas diseñadas para tareas de reconocimiento de imágenes reactivaron la investigación y la aplicación de la inteligencia artificial. Desde entonces, la tecnología de IA ha experimentado un rápido desarrollo en la última década «, afirma Guo Yandong, científico jefe de percepción inteligente de OPPO.

«OPPO sigue promoviendo la inteligencia artificial para lograr comportamientos perceptivos y cognitivos complejos. Por ejemplo, la Inteligencia Artificial puede aprender de datos masivos no etiquetados, realizar una migración descendente y reconstruir información 3D desde varias perspectivas limitadas. También hemos dotado de mayores capacidades cognitivas a la IA para entender y crear belleza y desarrollar una IA que incorpore el comportamiento autónomo. Estoy encantado de ver que siete de nuestros trabajos fueron seleccionados para la conferencia de este año. Sobre la base de este éxito, seguiremos explorando, tanto la IA fundamental, como la tecnología de IA de vanguardia, así como las aplicaciones comerciales que nos permitirán llevar los beneficios de la Inteligencia Artificial a más personas.»

Los siete trabajos aceptados por el CVPR 2022 muestran los avances de OPPO en la creación de una IA humanizadora

La diferencia más significativa entre la inteligencia humana y la artificial reside en la multimodalidad. Los seres humanos son capaces de entender fácilmente la información tanto en palabras como en imágenes y, establecer asociaciones entre ambos tipos de información. Por otro lado, la IA es actualmente incapaz de pasar de la fase de identificación y le resulta difícil confrontar con precisión la información entre distintos modos. El novedoso método propuesto por OPPO, mejora la inteligencia multimodal, lo que podría llevar a que la IA sea realmente capaz de entender e interpretar el mundo a través de múltiples formas de información como el lenguaje, el oído, la visión y otras, logrando que cada vez se esté más cerca de interactuar con los robots y asistentes digitales similares a los de las películas de ciencia ficción.

La reconstrucción del cuerpo humano en 3D es otro ámbito en el que el Instituto de Investigación de la campaña OPPO ha obtenido importantes avances. En la conferencia CVPR 2022, OPPO expuso un proceso automático para crear avatares digitales de seres humanos con ropa, que se comportan de forma natural. Este avance se consiguió mejorando el método de modelo de carácter dinámico NeRF. Mediante el análisis de vídeos RGB de seres humanos captados con una cámara, la herramienta de OPPO puede extraer modelos dinámicos 1:1 en 3D precisos, que incluyen detalles pequeños como logotipos o texturas de tejidos.

La creación de modelos de ropa 3D, sigue siendo uno de los mayores retos en el campo de la IA, debido a la dificultad de observar la deformación de las prendas en función de la postura de quienes las llevan. Esto dificulta que la IA reconozca y distinga la deformación en ciertas partes de la ropa, por ejemplo, un dobladillo. El nuevo modelo, impulsado por OPPO, reduce eficazmente los requisitos necesarios para llevar a cabo la reconstrucción del cuerpo humano en 3D, proporcionando fundamentos técnicos que pueden ser importantes en ámbitos como los probadores virtuales para las compras en línea, la instrucción de fitness con IA y la creación de avatares realistas en mundos de RV/AR.

El reconocimiento de imágenes a través de la IA ha llegado a un punto en el que es posible identificar, con precisión, una amplia gama de objetos dentro de una imagen. No obstante, aún existe el reto de desarrollar una tecnología de IA que sea capaz de interpretar una imagen por su valor estético. La capacidad de la IA para evaluar las imágenes en términos de su calidad estética suele estar muy relacionada con los grandes datos utilizados en el entrenamiento del modelo de IA. Como resultado, las «opiniones» proporcionadas por la IA no suelen ser del gusto de todo el mundo y, en muchos casos, se ha demostrado que los modelos muestran sesgos claros. Esto ha llevado a desarrollar datos y modelos más refinados que tengan en cuenta las diversas preferencias de distintas personas.

En colaboración con la profesora de la Universidad de Xidian, Leida Li, el Instituto de Investigación de OPPO reveló la solución a este problema. El modelo innovador de Evaluación Estética de la Imagen Personalizada (PIAA) es el primer modelo que logra optimizar la evaluación estética de la IA combinando las preferencias subjetivas de los usuarios con valores estéticos más generalizados. El algoritmo puede realizar evaluaciones personalizadas de las imágenes, a partir de las preferencias recolectadas mediante el estudio de los perfiles de los usuarios. En el futuro, el modelo se podrá utilizar para crear experiencias personalizadas, no sólo enfocadas al manejo de álbumes de fotos, sino también para ofrecer recomendaciones sobre cómo sacar la mejor foto y sugerir contenidos para los usuarios.

OPPO también ha trabajado para que el conjunto de datos de evaluación del modelo PIAA, estén disponibles para todos los desarrolladores. A su vez, varias instituciones de investigación y universidades ya han expresado su interés en utilizar estos conjuntos de datos para impulsar sus propias investigaciones enfocadas en la evaluación estética personalizada de la IA.

Por otro lado, OPPO también propuso una solución de reconstrucción multi-vista de planos semánticos 3D capaz de analizar las superficies dentro de un entorno 3D. Esta tecnología puede reconocer las características semánticas de diferentes superficies como el suelo, los escritorios o las paredes, con un grado de precisión mucho mayor que el de la arquitectura actual de reconstrucción de una sola vista.

Desarrollado en colaboración con la Universidad de Tsinghua, el INS-Conv (INcremental Sparse Convolution), puede lograr una segmentación semántica 3D más rápida y precisa. Esto puede reducir la potencia de cálculo necesaria para realizar el reconocimiento del entorno, lo que permitirá que dicha tecnología se incluya, con mayor facilidad, en funciones como la conducción automatizada y la RV.

OPPO lleva los beneficios de la IA a más personas

Esta es la tercera participación de OPPO en la conferencia CVPR. En los últimos tres años, las investigaciones sobre Inteligencia artificial, han experimentado un cambio radical, pasando del desarrollo de aplicaciones específicas, como el reconocimiento facial, a tecnologías más fundamentales que tienen implicaciones de mayor alcance. El creciente éxito de OPPO en el CVPR durante estos tres años se debe, en gran medida, a su inversión continua en tecnología de IA. OPPO comenzó a invertir en el desarrollo de la Inteligencia Artificial en el año 2015, creando equipos de I+D dedicados al lenguaje y la semántica, la visión por ordenador y otras disciplinas.

A principios de 2020, se creó el Instituto de Percepción e Interacción Inteligente, liderado por el Instituto de Investigación de OPPO, con el objetivo de seguir profundizando en la exploración de otras tecnologías de IA de vanguardia. Hoy en día, OPPO cuenta con más de 2.650 solicitudes de patentes mundiales en el campo de la IA, que abarcan la visión por computador, la tecnología del habla, el procesamiento del lenguaje natural y el aprendizaje automático, entre otros.

Guiada por su propuesta de marca, «Inspiration Ahead», la compañía OPPO también continúa trabajando para llevar la tecnología de IA del laboratorio a la vida cotidiana con la ayuda de socios del sector. En diciembre de 2021, OPPO lanzó su primera NPU de desarrollo propio denominada MariSilicon X. Esta NPU cuenta con un rendimiento informático potente y una alta eficiencia energética que permite ejecutar algoritmos complejos de IA a una velocidad sin precedentes en los dispositivos móviles, esto ofrece una calidad de vídeo superior a través del vídeo nocturno avanzado y otros algoritmos de procesamiento de imágenes.

A través de estas tecnologías, OPPO pretende crear mundos digitales más reales que combinan lo mejor del mundo virtual y la realidad para crear experiencias totalmente nuevas para sus usuarios.