La mayoría de empresas especializadas en el desarrollo de robots humanoides se concentra en China. Se estima que en el mundo hay entre 200 y 220 empresas de este tipo, de las cuales alrededor de 160 se encuentran en el gigante asiático, lo que significa que el país de Xi Jinping tiene una cuota de mercado de en torno el 87 %. Esas 160 empresas construyen la máquina completa, ya que en realidad existen más de 600 compañías encargadas de la fabricación de componentes críticos, como sensores, articulaciones y actuadores.
A pesar de que los Optimus de Tesla son mucho más conocidos que los de otras empresas, esta «popularidad» se debe principalmente a Elon Musk, y no porque sean más avanzados o interesantes que los de la competencia. En los últimos cinco años, China ha registrado más de 7.700 patentes relacionadas con robots humanoides, y empresas como AgiBot o Unitree (dos de las más importantes del sector) ya están enviando miles de unidades al año.
El gobierno chino sabe que en la robótica humanoide no tiene competencia, por lo que está potenciando al máximo su maquinaria para inundar el mundo de sus propuestas. El objetivo es producir 100 mil unidades para 2026, enfocándose en aplicaciones industriales, véanse fábricas de coches de firmas como NIO y BYD, así como de servicios. Ahora, China ha construido una enorme base de datos de rostros 3D para perfeccionar sus creaciones.
Una de las mayores colecciones estructuradas de datos faciales
Un grupo de investigadores ha desarrollado un conjunto de datos faciales 3D a gran escala y un nuevo modelo de IA que puede detectar puntos de referencia faciales directamente a partir de datos 3D sin procesar, sin depender de imágenes 2D o plantillas digitales. El objetivo es permitirles expresar emociones, reconocer la identidad e interactuar de forma natural.
Uno de los elementos técnicos más importantes tras esta capacidad es la detección de puntos clave faciales tridimensiones, que mapea puntos críticos de un rostro en el espacio 3D. El nuevo estudio pretende superar los limites actuales trabajando directamente con escaneos faciales 3D del mundo real, ya que la mayoría de los modelos actuales dependen, en gran medida, del mapeo de texturas 2D o de rostros 3D sintéticos.
Este enfoque está sujeto a errores, ya que los modelos digitales suelen diferir de la geometría facial humana real y la alineación de texturas no siempre es precisa. La innovadora investigación fue dirigida por el profesor SONG Zhan de los Institutos de Tecnología Avanzada de Shenzhen de la Academia de Ciencias de China, junto con el doctor YE Yuping de la Universidad de Tecnología de Fujian.
El equipo construyó un sistema de adquisición facial 3D y 4D personalizado, llevó a cabo una recopilación de datos estandarizada y creó una base de datos con alrededor de 200 mil escaneos faciales 3D de alta fidelidad. La base de datos también incluye un conjunto de datos faciales 3D de múltiples expresiones, un conjunto de datos de puntos de referencia faciales 3D estandarizados, un conjunto de datos del cuerpo humano 3D de alta precisión y un conjunto de datos dinámicos de expresiones faciales 4D.
Estos recursos biométricos multimodales conforman una de las mayores colecciones estructuradas de datos faciales humanos 3D reales reportadas hasta la fecha. El conjunto fue seleccionado para el Programa de Conjuntos de Datos de IA de Alta Calidad de 2025 de la provincia de Fujian. En lugar de alimentar el sistema de IA con imágenes texturizadas, los investigadores diseñaron una red de atención de grafos fusionados con curvatura (CF-GAT) para procesar directamente nubes de puntos desordenadas.
Gracias a su estructura de atención gráfica, CF-GAT predice las coordenadas de puntos de referencia 3D directamente a partir de datos geométricos sin procesar. No depende de texturas 2D ni de modelos de plantilla predefinidos, lo que reduce la dependencia de la apariencia de la superficie. En las pruebas, el modelo mostró una mayor robustez al ruido y una mejor generalización en diferentes formas faciales en comparación con los enfoques convencionales.
Los hallazgos resaltan cómo los conjuntos de datos a gran escala y de alta calidad pueden influir directamente en el rendimiento del algoritmo. Al entrenarse con geometría detallada del mundo real, el modelo puede aprender patrones espaciales más complejos y adaptarse con mayor eficacia a la variabilidad del mundo real. El estudio fue publicado en IEEE Transactions on Circuits and Systems for Video Technology.
