Google DeepMind está formando un nuevo equipo de especialistas para desarrollar sistemas de inteligencia artificial (IA) capaces de imitar entornos físicos reales. Este tipo de algoritmos se conocen como modelos mundiales o modelos del mundo y representan un avance significativo hacia la IA general (AGI).
La iniciativa está liderada por Tim Brooks, ex codirector del proyecto Sora de OpenAI, quien ha compartido las intenciones de la compañía a través de una publicación en las redes sociales. «DeepMind tiene planes ambiciosos para crear modelos generativos masivos que simulen el mundo», afirma. La declaración estuvo acompañada de dos ofertas de trabajo dirigidas a ingenieros e investigadores con experiencia en entrenamiento a gran escala de modelos generativos, curación de datos de entrenamiento y sistemas de lenguaje multimodal.
Las descripciones de los puestos destacan que “ampliar la formación previa con datos El multiformato es un paso fundamental hacia la AGI. «Los modelos mundiales avanzarán en numerosos ámbitos, como el razonamiento visual y la simulación, la planificación de agentes encarnados y el entretenimiento interactivo en tiempo real».
¿Cuáles son los modelos mundiales de Google?
La agencia de desarrollo empresarial The Black Box Lab indica que modelos mundiales son algoritmos que generan representaciones internas de un entorno, lo que permite que las soluciones de inteligencia artificial simulen eventos y predigan resultados futuros basados en esas emulaciones. El enfoque busca replicar los procesos de razonamiento y pensamiento de los humanos para proporcionar a las máquinas una comprensión más profunda del contexto físico.
Un artículo de TechCrunch explica que un modelo generativo “entrenado con años de vídeo” puede reconocer con precisión que una pelota de baloncesto rebota, pero no puede interpretar por qué. En cambio, un modelo del mundo tiene “una comprensión básica” de las causas del rebote, lo que le permite representar el fenómeno y anticipar movimientos futuros con mayor precisión.
Yann LeCun, científico jefe de inteligencia artificial de Meta, ha destacado el potencial de esta tecnología para realizar previsiones y planificaciones complejas en campos digitales y físicos. “Necesitamos máquinas que entiendan el mundo, que puedan recordar cosas, que tengan intuición y sentido común. (Estos son algoritmos) que pueden razonar al mismo nivel que los humanos. «Los sistemas de inteligencia artificial actuales no son capaces de hacer nada de esto», explicó LeCun el año pasado en una conferencia. Diversas organizaciones tecnológicas están invirtiendo cada vez más recursos para acelerar el desarrollo de este tipo de modelos.
Un ejemplo es World Labs, un puesta en marcha cofundada por los tecnólogos Fei-Fei Li, Justin Johnson, Christoph Lassner y Ben Mildenhall y se define como “una empresa de inteligencia espacial que construye grandes modelos mundiales para percibir, generar e interactuar con el mundo en 3D”. Johnson explica que actualmente es posible producir escenarios virtuales interactivos, pero el coste sigue siendo elevado y el proceso requiere mucho tiempo. “(Los modelos del mundo) nos permitirán no sólo obtener una imagen o una clipssino un mundo tridimensional completamente simulado, vibrante e interactivo hecho a medida”.
Por su parte, Nvidia presentó esta semana su plataforma Cosmos, una plataforma que comprende modelos generativos globales de próxima generación diseñados para avanzar en el desarrollo de sistemas físicos de inteligencia artificial, vehículos autónomos y robots.
Los expertos sugieren que esta tecnología es el paso previo para lograr la IA generalizada. Sistemas de este tipo serían capaces de ejecutar cualquier tarea intelectual que realice el ser humano con igual o mayor precisión y eficiencia.
(etiquetasToTranslate)google