España se ha adelantado con su propia IA generativa español pública y gratis para las empresas. El Consejo de Ministros ha aprobado este martes la Estrategia de Inteligencia Artificial 2024, que destinará 1.500 millones, sumados a los 600 que ya están en marcha, para desarrollar ALIA, la IA generativa pública en español, gratuita incluso para las grandes empresas, «transparente, responsable y ética», que se apoyará en el supercomputador Mare Nostrum5, en un Real Decreto que regulará los Centros de Procesos de Datos, en 760 millones para el fomento del talento en IA que impulsará el sector público y privado, y estará vigilada con su correspondiente marco de ciberseguridad y por la Agencia Española de Supervisión de la IA (AESIA).
La coordinación del plan apoyado en varios ejes y «palancas» correrá a cargo de la Secretaría de Estado para la Digitalización y la Inteligencia Artificial, dirigida por Mayte Ledo. Desde el ministerio de José Luis Escrivá justifican la premura en su aplicación en el «enorme despliegue de la IA generativa en los últimos años» por lo que entienden que «España tiene que reforzar sus capacidades para desarrollarla y para hacerlo rápido», porque «tiene la capacidad de tener un notable impacto positivo en la productividad y en el crecimiento económico», por lo que hay que crearla más rápidamente de lo que se estaba haciendo, porque la demanda lo requiere.
2.100 MILLONES PARA UNA IA GENERATIVA ESPAÑOLA
Presupuestariamente, la Estrategia sumará 1.500 millones de euros que proceden del plan de recuperación y de la Adenda, lo que culmina en un total de 2.100 millones de pesetas de dinero público del que también se beneficiarán las empresas. El desarrollo de la IA en España ya cuenta con una inversión realizada de 600 millones de euros aplicados por la Estrategia Nacional de Inteligencia Artificial (ENIA) de 2020 en universidades y cátedras, centros de investigación y empresas, en desarrollo de tecnologías del lenguaje y algoritmos y en programas tecnológicos de las diferentes comunidades autónomas.
Ahora, se destinarán 90 millones de euros al supercomputador Mare Nostrum5, 750 millones se destinarán a becas de IA y proyectos de formación, 400 para el fondo Next Tech que financiará proyectos de IA de las empresas, y se cuentan como parte del todo los 300 millones de recientemente aprobado Kit Consulting y los nuevos 350 millones para la incorporación de IA en el Kit Digital.
la Estrategia sumará 1.500 millones de euros que proceden del plan de recuperación y de la Adenda, lo que culmina en un total de 2.100 millones de pesetas de dinero público del que también se beneficiarán las empresas.
El desarrollo de la IA en Español, lo que va a terminar llamándose el ChatGPT en castellano, se va a basar en un primer eje que apoyará en los elementos que ya funcionan. Así, va a reforzar las «palancas claves» en nuestro país para ser líder en crear una IA generativa, mediante el impulso de la inversión en supercomputación, la generación de capacidades de almacenamiento en condiciones de sostenibilidad, para crear modelos y de datos que construyan una infraestructura pública de IA y a la vez fomentar el talento para generar empleo con esta tecnología.
El segundo eje será el desarrollo de un marco de ciberseguridad y la aplicación de la IA en el sector público y privado, para fomentar la innovación, y poniendo el foco en las pymes, aunque fuentes del ministerio aseguraron a MERCA2 que la podrán utilizar también las grandes empresas, y se deja abierta la posibilidad de recuperar la inversión pública mediante aportaciones empresariales por su uso en el futuro aunque «no se está en eso ahora», tal y como nos confirmaron fuentes ministeriales.
El tercer eje de la Estrategia se centra en el desarrollo de las funciones de la Agencia Española de Supervisión de la Inteligencia Artificial, (AESIA), una institución clave para el ministerio, que se encuentra en pleno proceso de búsqueda del director o directora adecuado, con el estudio de los 106 CV que se han postulado para el puesto, y que se encargará de vigilar que ALIA sea una IA guía «transparente, ética, responsable y humanística».
IA Y LA SUPERCOMPUTACIÓN DEL ‘MARE NOSTRUM’
De la supercomputación se va a encargar el superordenador Mare Nostrum que ya está trabajando en Centro Nacional de Supercomputación de Barcelona. Esta máquina es la primero en capacidad de almacenamiento, el tercero de Europa en rendimiento máximo y el sexto en el mundo en ranking Green 500, la clasificación basada en la eficiencia energética. España es uno de los pocos países en Europa que tiene supercomputación, junto con Finlandia e Italia. Precisamente Francia «está sufriendo considerablemente para identificar sus modelos porque no tiene supercomputación», explican fuentes ministeriales.
El superordenador de Barcelona recibirá una inversión de 90 millones de euros en combinación con Europa, para crear un nuevo clúster especializado en IA que comenzaría a funcionar en 2025. Ya se está desmontando la actual máquina, Mare Nostrum 4, cuyas «piezas sobrantes» se repartirán en una red de centros de la Red española de Supercomputación (RES) instalados en otras ciudades españolas, cuyos nodos también se van a reforzar para atender más demanda, y convertirse en el Mare Nostrum 5, con un 50% más de la capacidad que tiene ahora.
mare Nostrum 5 permitirá un mayor acceso por parte de las empresas, ya que el 20% de sus capacidades se podrán dedicar a las industria,
Así, no solo ayudará a crear Alia, y atenderá la supercomputación científica, sino que permitirá un mayor acceso por parte delas empresas, ya que el 20% de sus capacidades se podrán dedicar a las industria, y todo en español. «Aunque tenemos una buena máquina de partida creemos que tenemos que reforzar sus capacidades ya ente este año y 2025», sin esperar a las fechas iniciales para realizar este refuerzo presupuestario, que se ha adelantado, tal y como confirman desde Transformación Digital en la actualidad.
REAL DECRETO PARA REGULAR LOS CENTROS DE DATOS
Para entrenar los modelos de inteligencia artificial son necesarias capacidades de almacenamiento y de hardware para esta actividad, lo que implica que inmediatamente va a haber una demanda de centros de procesos de datos (CPD) que ya la estamos viviendo en todo el mundo, no solo en España. Para liderar el desarrollo de centros de procesos de datos sostenibles y para eso se han unido los ministerios de Transformación Digital y Función Pública y de Transición Ecológica para aprobar un Real Decreto que regulará los CPD sostenibles, que estará en línea con la directiva de eficiencia energética.
Junto a la normativa, se trabaja en una «buena planificación territorial de la implantación de los futuros CPD» para que no todos vayan a la misma región, porque hay que repartir y ponderar su enorme consumo de energía y agua, y hay que agilizar todos los tramites administrativos en su implantación. El ministerio espera compensar consumo y horro, ya que «a través de la IA podemos hacer proyectos que ahorren energía y agua.
IA FUNDACIONAL EN ESPAÑOL Y LENGUAS COOFICIALES
Alia estará ya en funcionamiento para septiembre de este año. Pero antes hay que tener en cuenta un tercer elemento que hay que organizar, y muy bien; su entrenamiento; es decir, el conjunto de datos, modelos y algoritmos que alimenten un modelo de IA fundacional en castellano y lenguas cooficiales, tal y como anunció el presidente del Gobierno, Pedro Sánchez, en el Mobile World Congress en Barcelona a finales de febrero. Para ello en el ministerio aseguran que se va a trabajar en un «corpus» de buena calidad, que alimente a ALIA desde los centros de Logroño, Galicia, Valencia, País Vasco y Cataluña donde ya han desarrollado una amplia base de partida.
Se van a tratar datos con un tamaño de 4 millones de millones de palabras para un modelo de IA con 175 millones de parámetros, equivalente al entrenamiento de ChatGPT 3.5, que permita generar una familia de modelos de IA sectoriales más pequeños, y cuyo entrenamiento superará la capacidad de operar en español más de un 20%. Hasta el momento, las IA generativas están entrenadas básicamente en inglés y alcanzaban solo un 4% de capacidad de respuesta en castellano. Así, se tratará de evitar sesgos relacionados con la «cultura» de cada lengua, como la identificación delas personas que utilizan solo uno o dos apellidos, por ejemplo.
Se van a tratar datos con un tamaño de 4 millones de millones de palabras para un modelo de IA con 175 millones de parámetros, equivalente al entrenamiento de ChatGPT 3.5, cuyo entrenamiento superará la capacidad de operar en español más de un 20%
También se va a entrenar la IA atendiendo a los estándares de transparencia que marca el reglamento de la Unión Europea que entrará en vigor en junio, y que también cuida de la protección de los derechos de autor en los datos que se utilizan para entrenar los modelos de IA generativa.
Además del modelo fundacional, LLM, se crearán modelos especializados de IA más pequeños, SLM y especializados que cubran necesidades en sanidad, en el ámbito jurídico o el tributario, por poner algunos ejemplos, «tanto para utilizar en el sector público como en el sector privado», recalcan en el ministerio, apuntando de nuevo a la «gratuidad» inicial de ALIA para las empresas españolas.
Para todo este desarrollo de aquí a septiembre, y más allá, se necesita talento, para cuyo desarrollo se prevé una inversión de casi 760 millones de euros, de los que 250 salen de los fondos FEDER europeos.