Xiaomi revoluciona la IA con MiDashengLM-7B, su nuevo modelo de voz que bate 22 récords de evaluación

Eduardo Ruiz

8 meses hace

Categorias: Xiaomi

Xiaomi revoluciona la IA con MiDashengLM-7B, su nuevo modelo de voz que bate 22 récords de evaluación

Xiaomi ha dado un paso más en el terreno de la inteligencia artificial y el procesamiento de audio con el lanzamiento oficial de MiDashengLM-7B, su modelo de gran capacidad para entender la voz, que ahora es completamente de código abierto. La firma china asegura que este desarrollo mejora sustancialmente tanto la velocidad como la precisión en tareas de reconocimiento de sonido. En concreto, reduce la latencia para la generación del primer token a una cuarta parte respecto a modelos similares y soporta una concurrencia veinte veces mayor bajo las mismas condiciones de VRAM. Además, MiDashengLM-7B ha establecido nuevos récords en 22 benchmarks públicos que evalúan modelos multimodales de audio.

Este modelo combina el codificador de audio Dasheng de Xiaomi con el decodificador autoregresivo Qwen2.5-Omni-7B Thinker, integrando una estrategia innovadora de entrenamiento universal para descripciones auditivas. Esto le permite entender de forma unificada tanto el habla, como sonidos ambientales y música. A principios de año, la base Dasheng logró un hito internacional al superar 50+ mAP en AudioSet, manteniéndose como referencia en el benchmark HEAR para tareas que abarcan desde sonidos naturales hasta el habla y la música.

Cómo Xiaomi está revolucionando el análisis de audio con MiDashengLM

Xiaomi ya ha llevado Dasheng a más de 30 aplicaciones prácticas, desde dispositivos para el hogar inteligente hasta sistemas en coches. Entre las innovaciones que implementan destacan la defensa ante palabras de activación externas en vehículos, la monitorización continua de sonidos anómalos en altavoces de smartphones o el control de dispositivos IoT mediante sonidos ambientales, como el chasquido de dedos. En el coche, Xiaomi ha potenciado el modo centinela para detectar intrusiones en el Xiaomi YU7, todo ello gracias a la inteligencia y eficiencia de los algoritmos que conforman Dasheng.

La transparencia es clave. El entrenamiento de MiDashengLM se ha realizado únicamente con conjuntos de datos 100% accesibles públicamente, y el modelo se distribuye bajo la licencia Apache 2.0, que permite usos tanto comerciales como académicos. Xiaomi se distingue también por la divulgación completa de las 77 fuentes de datos utilizadas y un informe técnico detallado que cubre todo el proceso, desde el preentrenamiento del codificador hasta el ajuste final de las instrucciones, algo que no es habitual en este sector.

Aplicaciones y futuro de MiDashengLM de Xiaomi

Dentro de la estrategia ‘personas, coche y hogar’ de Xiaomi, MiDashengLM juega un papel crucial en la comprensión auditiva multidominio. No solo reconoce sonidos cercanos, sino que también es capaz de inferir contextos para mejorar la adaptabilidad a diferentes escenarios. Esta capacidad abre la puerta a interacciones más naturales y útiles, por ejemplo, dando retroalimentación en tiempo real para mejorar la pronunciación o planes personalizados durante prácticas de canto o idiomas, o respondiendo a consultas del conductor sobre sonidos ambientales mientras conduce.

Además, MiDashengLM supone una evolución importante para la familia Dasheng, con un foco claro en aumentar la eficiencia computacional para permitir despliegues offline en dispositivos edge. Los planes de futuro prometen ampliar funcionalidades como la edición sonora completa basada en comandos naturales, algo que podría transformar la manera en que interactuamos con el audio en múltiples dispositivos.

El repositorio abierto de MiDashengLM ya está disponible para desarrolladores y la comunidad global, invitando a contribuir y avanzar en esta tecnología puntera de Xiaomi, que no solo amplía horizontes, sino que pone a la marca a la cabeza en modelos de audio multimodal y comprensión avanzada.

Fuente

Acerca de
Últimas entradas

Eduardo Ruiz

Amante de la tecnología, escribo para compartir una de las mayores aficiones que tengo y poder estar al día en el aspecto tecnológico.

Últimas entradas de Eduardo Ruiz (ver todo)

Xiaomi lanza al mercado sus nuevos aires acondicionados Mi Home Pro de bajo consumo desde 610 € - 24 marzo, 2026
Shargeek X6: potente batería portátil de 170W con pantalla y doble cable por 53 euros - 24 marzo, 2026
Kirin impulsa el regreso completo de Huawei con cifras potentes en móviles y modelos económicos - 24 marzo, 2026

Honor Play 70 Plus llega a la gama media con Snapdragon 6 por solo 133 euros »

« DJI Mini 5 Pro filtrado con sensor de 1 pulgada y posible retraso en su lanzamiento

Tags: inteligencia artificial audiomiDashengLMreconocimiento voz

Eduardo Ruiz: Amante de la tecnología, escribo para compartir una de las mayores aficiones que tengo y poder estar al día en el aspecto tecnológico.

Comentar

Xiaomi lanza su nueva maleta de apertura frontal en 18 y 20 pulgadas desde 53 euros
Xiaomi ha lanzado un nuevo modelo de maleta de viaje bajo su submarca Mijia, disponible…
Xiaomi liderará con fuerza la venta de gafas inteligentes en China durante 2026 superando el 50% de cuota
Según datos recientes de Lotu Technology, el mercado chino de gafas para tiro deportivo alcanzará…
REDMI A7 Pro llega a Indonesia con una bestial batería de 6000mAh para máxima autonomía
Xiaomi, a través de su submarca Redmi, ha presentado en Indonesia el Redmi A7 Pro,…