Las empresas están cambiando de ejecutar todo en el modelo de IA más potente a asignar cada tarea al modelo adecuado, una práctica llamada enrutamiento de modelos. La presión por la eficiencia surge a medida que las grandes empresas superan sus presupuestos de IA.
Las valoraciones de OpenAI y Anthropic suponen una enorme demanda a precios premium, lo que las pone en riesgo si el enrutamiento de modelos se impone. En los últimos dos años, la estrategia ha sido utilizar el modelo de IA más potente para todas las consultas, independientemente de la complejidad. Ahora, con las facturas de IA superando los presupuestos, las empresas están cuestionando si cada tarea realmente necesita los modelos más avanzados. Dos líderes en la expansión de IA mencionaron que está surgiendo una solución: el enrutamiento de modelos.
El enrutamiento es una herramienta que asigna el trabajo al modelo adecuado, enviando problemas complejos a los modelos más caros y los sencillos a alternativas más baratas y rápidas. Scott Wu, CEO de Cognition, afirmó que los beneficios en el trabajo rutinario son enormes, logrando una eficiencia de costos de cinco a diez veces mejor utilizando modelos que son suficientemente buenos para la tarea.
Actualmente, la mayoría de las empresas no están utilizando el enrutamiento. Arvind Jain, CEO de Glean, estimó que aproximadamente el 95% del uso de IA empresarial sigue ejecutándose en los modelos más caros, incluso para tareas que podrían manejar alternativas más económicas. Patel, de Cisco, expuso que el costo de uso de tokens por empleado puede alcanzar los $10,000 anuales, lo que representa un gasto significativo para grandes empresas.
Las empresas de IA son conscientes de esta ansiedad. Cognition anunció una garantía de productividad de IA, comprometiéndose a financiar el uso hasta $10 millones si su agente no entrega el valor esperado. Esto se enmarca en un esfuerzo por medir el retorno de inversión en términos de horas de ingeniería ahorradas, en lugar de actividad consumida.
Si las empresas comienzan a dirigir trabajos sencillos a modelos más baratos, OpenAI y Anthropic solo recibirán pagos por trabajos más complejos. Aunque Patel no cree que esto hunda a los laboratorios de frontera, anticipa un cambio en el modelo de precios, donde se requerirá mayor eficiencia en el uso de modelos.
¿Cómo afectará el enrutamiento de modelos a la valoración de las principales empresas de IA en el futuro?
.
.
.
RESUMEN BASADO EN EL ARTÍCULO PUBLICADO EN CNBC EL Fecha no disponible. Leer original
https://www.cnbc.com/2026/06/05/model-routing-on-ai-is-a-problem-for-openai-and-anthropic.html