La división DeepMind de Google no tiene freno a la hora de innovar en el desarrollo de la tecnología más disruptiva que se ha desarrollado en los años, la inteligencia artificial (IA), y ya trabaja para adelantar a Open AI en el desarrollo de la IA más allá de la generativa. Se trata de una AGI (inteligencia artificial general) capaz de simular el mundo real, es decir, el mundo físico. Precisamente el equipo de trabajo que la desarrolla está dirigido por Tim Brooks, ex de Open AI y responsable de la creación la IA generadora de vídeo Sora.
Brooks, quien abandonó Open AI para irse al laboratorio de investigación de inteligencia artificial de Google el pasado mes de octubre, es quien está liderando el equipo investigador del buscador. Este mismo lunes ha asegurado que su división «tiene planes ambiciosos para crear modelos generativos masivos que simulen el mundo» y que por ello está «contratando personal para un nuevo equipo con esta misión».
En efecto, las ofertas de trabajo referidas por el directivo aparecen en las páginas reclutadoras de Google DeepMind, en las que, por ejemplo, se solicitan científicos investigadores, capaces de «implementar la infraestructura básica y realizar investigaciones para construir modelos generativos del mundo físico» y de «resolver problemas esenciales para entrenar simuladores del mundo a gran escala, desarrollar métricas y leyes de escalamiento para la inteligencia física, seleccionar y anotar datos de entrenamiento, permitir la generación interactiva en tiempo real y estudiar la integración de modelos del mundo con modelos de lenguaje multimodal».
Casi en tono humorístico, las oferta incluyen la premisa de que estos investigadores e investigadoras sean capaces de «aceptar la amarga lección y buscar métodos simples que se puedan escalar, con énfasis en sistemas e infraestructuras sólidos».
Google tiene planes ambiciosos para crear modelos de IA generativos masivos que simulen el mundo
Las personas que formen parte del equipo que desarrollará la IA capaz de replicar el mundo debe tener experiencia con modelos de transformadores y canalizaciones de datos a gran escala, maestría y doctorado en ciencias de la computación o el aprendizaje automático, y haber participado en lanzamientos, publicaciones y proyectos de «código abierto relacionados con la generación de video, modelos mundiales, modelos de lenguaje multimodal o arquitecturas de transformadores». Por supuesto, también deben tener «sólidas habilidades» en sistemas e ingeniería en código abierto relacionados con la generación de video, modelos mundiales, modelos de lenguaje multimodal o arquitecturas de transformadores.
El rango salarial es apetecible, sobre todo para los científicos españoles, por muy expertos que sean en disciplina STEAM, ya que se guía por la base estadounidense, es decir, que se mueve en un abanico de entre 136.000 (132.118 euros) y 245.000 dólares (238.007 euros) más bonificaciones, acciones y otros beneficios.
GOOGLE Y LA AGI QUE COPIARÁ EL MUNDO REAL
El nuevo equipo de modelado de una IA nueva y extraordinariamente avanzada, que formará con profesionales de la investigación de todo el mundo, va a colaborar con los equipos ya existentes de desarrollo de Gemini (la IA generativa de Google), Veo (el generador de vídeos de la compañía) y de Genie (generador del mundos interactivos del buscador).
Cabe recordar que Gemini es hoy por hoy la serie «insignia» de los modelos de IA generativa desarrollada por Google que realiza acciones como analizar imágenes y generar texto, y Veo se diferencia porque es un IA parecida a Sora, es decir, que su misión es justo generar imagen en vídeo mediante la IA. Por su parte, Genie, que se presentó a principios del pasado mes de diciembre, está pensada para simular juegos y entornos 3D en tiempo real
La idea es que el quipo se base en el trabajo ya realizado por los desarrolladores de las citadas IAs para abordar «nuevos problemas críticos» y escalar los modelos «a los niveles más altos de computación», tal y como ha podido saber la publicación especializada TechCrunch.
El equipo que está tratando de crear Google quiere desarrollar una inteligencia artificial general, es decir, una IA capaz de realizar cualquier tarea que seamos capaces de realizar los seres humanos. Para ello, desde la divisón DeepMind tratarán de desarrollar herramientas de «generación interactiva en tiempo real» sobre los modelos que construyan y estudiar cómo integrar estos con modelos multimodales ya existentes, como es el caso de Gemini.
Google no es la única compañía que está detrás de desarrollar una AGI. Según la publicación también están desarrollando trabajos similares desde la startup fundada por el pionero de la IA World Labs, Fei-Fei Li, y las también startups Decart, de origen israelí, y Odyssey, fundada por los pioneros de la conducción autónoma Oliver Cameron y Jeff Hawke, que desarrollan «modelos generativos de mundos para cine, juegos y más», y han participado en producciones como «Dune», «Los Vengadores» y en juegos como «Halo».
El equipo que está tratando de crear Google quiere desarrollar una inteligencia artificial general, es decir, una IA capaz de realizar cualquier tarea que seamos capaces de realizar los seres humanos
Esta última empresa ha presentado también a mediados del pasado mes de diciembre una fantástica herramienta de IA llamada Explorer, capaz de generar mundo en tres dimensiones fotorrealistas a partir de un texto o una imagen fija, gracias a que ha sido entrenada en paisajes de mundo real capturados mediante cámaras de 360 grados desarrolladas especialmente por la empresas, que los operarios podían llevar enganchadas en una mochila. Por cierto, en Odyssey también están «contratando» ingenieros y, sobre todo, expertos en 3D.
Precisamente Odyssey es la única startup que se ha comprometido a trabajar con profesionales creativos, en vez de utilizar la IA para suplantarlos, como han hecho en los últimos años las grandes empresas creadoras de videojuegos.
Otro de los escollos de este tipo de desarrollos es la cuestión de los derechos de autor de las fuente utilizadas para desarrollar los modelos de IAs. Google ya ha dejado claro que puede entrenar las suyas con el increíble potencial que tiene a mano con los vídeos de YouTube, plataforma de la que es propietaria y a través de la que se ha asegurado los pertinentes permisos.