Softcatalà evalúa la inteligencia artificial en catalán

Softcatalà ha llevado a cabo la primera evaluación pública y sistemática del rendimiento de modelos de lenguaje y reconocimiento de voz en catalán, analizando sistemas como Gemma 3 de Google, Mistral, LLaMA de Meta, Qwen y EuroLLM en tareas reales. Las pruebas incluyen reformulación de frases, detección de errores gramaticales, preguntas basadas en la Viquipèdia, generación de resúmenes y traducciones entre catalán y inglés.

El estudio utiliza herramientas de evaluación abiertas y reutilizables, permitiendo la reproducción de resultados y comparaciones futuras. A pesar de la creciente presencia digital del catalán, su volumen de datos es muy inferior al del inglés o castellano, lo que afecta la calidad de los sistemas de IA. Softcatalà introduce un enfoque basado en datos objetivos en un campo donde predominan las percepciones subjetivas.

La evaluación permite responder a preguntas sobre la idoneidad de los modelos para trabajar en catalán y si el tratamiento del idioma es comparable al de otras lenguas europeas. Los resultados revelan diferencias significativas entre modelos en comprensión, reformulación, traducción y capacidad de resumen, desmintiendo la idea de una funcionalidad homogénea en las herramientas comerciales.

La segunda parte del estudio se centra en el reconocimiento de voz, comparando Whisper de OpenAI con OmniASR de Meta, para medir la precisión de transcripción en catalán. Este ámbito es crítico debido a las variaciones dialectales y la limitada disponibilidad de corpus de voz. Las diferencias entre modelos pueden resultar en errores de comprensión y transcripciones defectuosas.

La iniciativa de Softcatalà también aborda el tema de la soberanía tecnológica, ya que se enfoca en modelos que pueden ejecutarse localmente, evitando el envío de datos a plataformas externas. Este aspecto es crucial en educación, administración pública y medios de comunicación, donde la privacidad y el control lingüístico son esenciales.
¿Hasta qué punto la evaluación rigurosa de la IA en lenguas minoritarias puede influir en su desarrollo y uso en el futuro?
.

RESUMEN BASADO EN EL ARTÍCULO PUBLICADO EN El Punt Avui EL Fecha no disponible. Leer original

https://www.elpuntavui.cat/societat/article/15-ciencia/2643429-softcatala-posa-nota-a-la-ia-en-catala.html?cca=3&app_id=106

Softcatalà evalúa la inteligencia artificial en catalán

Otras entradas que te pueden interesar

La revolució silenciosa de l’administració pública, amb Sergi Marcén

¿Rechazo generacional a la IA? Por qué los universitarios la abuchean en las ceremonias de graduación de Estados Unidos

El Papa firma su primera encíclica, un alegato por la dignidad humana ante la Inteligencia Artificial

Musk pierde el duelo judicial de titanes contra Sam Altman por la inteligencia artificial

Standard Chartered recortará miles de puestos a medida que aumenta el uso de la IA

La IA podría hacer que los humanos sean menos inteligentes, advierte el Observatorio Real

Netflix prepara un estudio de animación nativo en IA: INKubator anticipa una nueva batalla en Hollywood

Paradas inteligentes e IA para mejorar la circulación, los proyectos ganadores del reto de innovación urbana

Crònica del dilluns 18 de maig: La IA entra a l’habitació mentre Europa continua discutint