Un estudio publicado en arXiv demuestra que es posible mejorar el rendimiento de un modelo de lenguaje de 8.000 millones de parámetros añadiendo 6.000 parámetros cuánticos, sin modificar el modelo original ni requerir más chips. El equipo liderado por Roman Orús, de Multiverse Computing, insertó un módulo cuántico en LLaMA 3.1 8B y midió los resultados. El módulo, llamado adaptador unitario de Cayley (CUA), utiliza circuitos cuánticos parametrizados para realizar proyecciones geométricas de manera más eficiente que los chips clásicos, aprovechando la unitaridad de la mecánica cuántica.
El CUA actúa como un coprocesador ligero, optimizando operaciones matemáticas que requieren altos recursos en silicio clásico. Este tipo de proyección es común en la arquitectura de transformadores, lo que significa que una mejora en esta área puede tener un impacto significativo en todo el modelo. El experimento se llevó a cabo en el IBM Quantum System Two, un procesador cuántico de 156 cúbits, y se registró una mejora del 1,4% en perplejidad sobre LLaMA 3.1 8B, un resultado notable dado el bajo número de parámetros adicionales.
La perplejidad es la métrica estándar para evaluar la capacidad predictiva de un modelo de lenguaje. Una reducción del 1,4% en un modelo de ocho mil millones de parámetros con solo seis mil parámetros adicionales es comparable a optimizar un motor de avión con un cambio mínimo. Aunque el hardware cuántico utilizado es NISQ, lo que implica un nivel de ruido significativo, el experimento demuestra que la mejora es detectable y replicable, aunque no implica la creación inmediata de un ChatGPT cuántico.
La tendencia en modelos de lenguaje ha sido aumentar los parámetros para mejorar el rendimiento, pero esto ha llevado a retornos decrecientes y mayores costos energéticos. El enfoque de Orús y su equipo no busca reemplazar la infraestructura actual, sino complementarla, lo que podría permitir un avance en el escalado de LLMs sin un aumento proporcional en los costos de memoria y energía.
¿Hasta qué punto puede la computación cuántica transformar la eficiencia de los modelos de lenguaje en un entorno de recursos limitados?
.
.
.
RESUMEN BASADO EN EL ARTÍCULO PUBLICADO EN Muy Interesante EL 9.06.2026. Leer original
https://muyinteresante.okdiario.com/ciencia/circuitos-cuanticos-limitaciones-memoria-ia.html