jueves, 23 enero 2025

La IA estatal ALIA se utilizará en Hacienda y Sanidad, y cuenta con un 20% de datos en castellano, catalán, euskera y gallego

Alia, la IA impulsada por el Gobierno español ya tiene dos casos de uso en marcha, uno que utilizará el Ministerio de Hacienda y el otro, llamado ‘Cardiomentor’, dirigido a la atención primaria sanitaria para el diagnóstico precoz de insuficiencias cardíacas mediante el «análisis avanzado de datos». El volumen de datos en castellano y lenguas cooficiales del Estado utilizado para el entrenamiento de Alia, alcanza el 20%, y el 80% restante lo conforman distintos idiomas, con predominio del inglés en un 39,31%. Fuentes del Ministerio de Transformación Digital la IA pública, «no es ni busca competir con ChatGPT» y que se desarrollará al menos un caso de uso para cada uno de los diferentes ministerios.

La IA desarrollada por el Gobierno a través del Ministerio de Transformación Digital y de su Secretaría de Estado de Digitalización e Inteligencia Artificial trata de ser una infraestructura abierta «y soberana» de recursos lingüísticos en castellano y lenguas oficiales, pero fuentes ministeriales reconocen que , por el momento, el 16,12% de los datos de entrenamiento del LLM (modelo de gran lenguaje en inglés) están en castellano. En el caso del catalán alcanza el 1,97% de la potente herramienta y el resto hasta alcanzar el 20% lo conforman el gallego y el euskera, quizá la lengua que más complicaciones esté planteando hasta ahora.

con alia se busca «democratizar el acceso a la IA» y que la «IA piense en castellano», por lo que quieren elevar el peso del castellano y de las lenguas cooficiales del Estado en este LLM

Las mismas fuentes ministeriales reconocen que el corpus de preentrenamiento de ALIA comprende datos de 35 idiomas europeos y 92 lenguajes de programación, por lo que sus propulsores se muestran satisfechos, ya que contiene el un mayor porcentaje de datos en castellano y lenguas cooficiales hasta ahora, respecto al que contienen el resto de modelos comerciales.

Desde el ministerio reconocen buscar «democratizar el acceso a la IA» y que la «IA piense en castellano» y que sea un referente en el mundo hispanoablante, por lo que quieren elevar el peso del castellano y de las lenguas cooficiales del Estado en este LLM, que todavía continúa en en desarrollo.

También apuntan a que es el momento de lanzarse con este tipo de desarrollos, ya que existen proyectos similares en otros países europeos y en otras lenguas, y en lo que a inteligencia artificial se refiere, los estados no pueden quedarse atrás, cuando «hasta Trump apadrina y apoya el recientemente presentado Stargate, un proyecto de IA de OpenAI, Oracle y SoftBank, en el que se invertirá medio billón de dólares».

El «Proyecto Stargate» pretende invertir 500.000 millones de dólares en los próximos cuatro años para construir una nueva infraestructura de IA en Estados Unidos, para apoyar la reindustrialización del país, sino que también proporcionará una capacidad estratégica para proteger la seguridad nacional de Estados Unidos y sus aliados.

La IA estatal ALIA ya se utiliza en Hacienda y Sanidad, y cuenta con un 20% de datos en castellano, catalán y euskera

ALIA, UNA IA PÚBLICA QUE NO ES CHATGPT

Lejos de las capacidades de las IAs estadounidenses, quienes conocen el proceso de desarrollo en Transformación Digital insisten en aclarar que ALIA «no es ChatGPT y que en ningún caso su objetivo es competir con ChatGPT u aplicaciones similares». La IA pública en español no pretende quedarse en ser un chat grande y tratar de competir «con lo que es evidente que no podemos competir». Según explican, su valor está en que sirve como base y se puede especializar en otros pequeños modelos de lenguaje, desarrollados en especial para cada uno de los casos de uso para lo que se pueda moldear tanto en las distintas administraciones como para las empresas en industrias concretas.

Este recurso de IA públicas es un proyecto de código abierto para que así investigadores, empresa, startups y las distintas administraciones puedan colaborar impulsando distintos desarrollos y lo aprovechen para crear ideas innovadoras, siempre bajo los parámetros normativos y éticos del reglamento de la IA europeo. Alia ya es visible a través de la web www.alia.gob.es donde se puede acceder a sus recursos lingüísticos y participar en las discusiones de la comunidad, así como acceder a convocatorias y ayudas para desarrollar más casos de uso.

con Alia ya se han puesto en marcha dos proyectos para su aplicación en el ámbito público, un ‘chatbot’ interno para la Agencia Tributaria y otro llamado ‘Cardiomentor’, al servicio de la sanidad

En este sentido, las mismas fuentes ministeriales aseguran que con Alia ya se han puesto en marcha dos proyectos para su aplicación en el ámbito público. Se trata de un ‘chatbot’ interno para la Agencia Tributaria y otro, que ya se ha bautizado como ‘Cardiomentor’, al servicio de la sanidad patria y dirigido al ámbito de la atención primaria, que va a servir para el diagnóstico precoz de insuficiencias cardíacas mediante el «análisis avanzado de datos».

El ministerio, que también regenta la cartera de Administraciones Públicas, quiere que Alia, cuyo desarrollo parte de la Estrategia Nacional de Inteligencia Artificial (ENIA), cuente con al menos un caso de uso concreto basado en el LLM, pero aspiran a que se pueden desarrollar más en el futuro. Quienes conocen la marcha del proyecto señalan que la inversión destinada al mismo asciende por el momento solo a tres millones de euros. Sin embargo, el presupuesto para la palanca número tres de la estrategia nacional de IA, que contempla otros desarrollos, sumaría una inversión de 10,2 millones de euros. La palanca tres de ENIA está pensada para «generar modelos y corpus para infraestructura pública de modelos de lenguaje».

En total, ENIA sumará 1.500 millones de euros de financiación que proceden del Plan de Recuperación y de la adenda, lo que termina en un total de 2.100 millones de dinero público del que se beneficiarán tanto las distintas administraciones públicas del país como las empresas.


- Publicidad -