Xiaomi ha dado un paso adelante en el campo de la robótica con el lanzamiento y apertura del código de su nuevo modelo de inteligencia visual, lenguaje y acción llamado Xiaomi-Robotics-0, presentado en febrero de este año. Este modelo logró posicionarse rápidamente en el sexto lugar del ranking global de descargas de modelos VLA (visual language action) en HuggingFace durante su primer mes. Recientemente, el equipo técnico de Xiaomi ha compartido el proceso completo de entrenamiento posterior en dispositivo real, conocido como post-training, además de mostrar nuevas demos que demuestran la capacidad del modelo para convertirse en una herramienta productiva lista para usar desde el primer momento.
Basándose en un modelo previamente entrenado, Xiaomi ha conseguido que en solo 20 horas de datos específicos se realice el entrenamiento posterior en entorno real, capacitando a Xiaomi-Robotics-0 para ejecutar con éxito una tarea muy compleja: introducir unos auriculares en su estuche de forma rápida y consecutiva. Esta operación enfrenta dos retos tecnológicos cruciales: primero, la tolerancia entre los auriculares y las ranuras del estuche es mínima, exigiendo una percepción espacial con precisión submilimétrica para un alineamiento exacto; segundo, el estuche y los auriculares tienen una rugosidad superficial mínima de Ra0.03μm, lo que hace muy fácil que cualquier contacto provoque desplazamientos no deseados. El modelo necesita corregir rápida y eficazmente estas desviaciones para evitar fallos de ensamblaje.
Entrenamiento y despliegue de Xiaomi-Robotics-0
Para garantizar transiciones fluidas entre movimientos, Xiaomi ha implementado en la fase de despliegue una inferencia asíncrona que permite realizar predicciones del siguiente movimiento mientras se ejecuta el actual, mejorando la velocidad de respuesta y la coherencia de las acciones. Además, para evitar cambios bruscos entre dos inferencias consecutivas, se introdujo un mecanismo denominado “prefijo de acción” durante el entrenamiento. Este “prefijo” actúa como una especie de zona de impulso que permite que la nueva acción crezca de forma natural a partir de la trayectoria anterior, lo que incrementa la fluidez general del flujo de movimiento del robot.
Este método de entrenamiento posterior en entorno real refleja la apuesta de Xiaomi por el control detallado y la interacción inteligente en robótica. La compañía continúa explorando cómo adaptar sus modelos de inteligencia incorporada para que puedan integrarse eficazmente en escenarios de aplicación práctica, buscando que la robótica avanzada sea accesible y funcional desde el primer uso, acercando la inteligencia artificial a tareas cotidianas complejas en la industria y el hogar.
- MiMo revoluciona la IA: Xiaomi invierte más de 80.000 millones de yuanes y abre código fuente - 27 abril, 2026
- OPPO Find X9 Ultra: desvelado su innovador diseño hexagonal de cámara para una experiencia visual única - 27 abril, 2026
- Xiaomi lanza en código abierto su innovador sistema robótico - 27 abril, 2026