La revolución de la Inteligencia Artificial: más allá de ChatGPT
Eduardo Ferrera, jefe de la Unidad de IA y Robótica de Catec, Centro Avanzado de Tecnologías Aeroespaciales
15/11/2024La gran revolución que ha causado ChatGPT en nuestra forma de trabajar ha puesto de manifiesto el amplio potencial que tiene la inteligencia artificial para transformar nuestras vidas. Modelos que primitivamente se idearon simplemente para predecir la siguiente palabra en la frase que estabas construyendo han evolucionado gracias a los mecanismos de atención, los codificadores y decodificadores y los datos a gran escala, en modelos capaces de generar contenido propio, programar, asistirnos conversacionalmente y educarnos.
Sin embargo, la revolución de estos Grandes Modelos de Lenguaje (LLM por sus siglas en inglés), llega mucho más allá que a simples sistemas capaces de chatear con humanos. Las empresas más rápidas ya están generando sistemas capaces de analizar grandes volúmenes de datos para ayudar a los usuarios a tomar decisiones estratégicas, basándose en conocimiento que en algunos casos puede ser extremadamente confidencial.
¿Sabías que muchos modelos de IA y Deep Learning se prueban contra juegos y videojuegos? AlphaGo jugando al Go, OpenAI Five jugando al Dota 2, AlphaStar jugando a StarCraftII, MuZero jugando juegos de la famosa ATARI o recientemente las LLMs compitiendo al Street Fighter III.
Pues bien, hacer a los algoritmos de Deep Learning jugar a videojuegos no deja de ser una forma de forzarlos a aprender a desenvolverse en mundos donde las acciones posibles son limitadas. La apuesta del centro sigue el mismo patrón: presentarle a los algoritmos sets limitados de acciones para que puedan aprender a interactuar con nosotros de forma inteligente.
En Catec, gracias a la combinación de los más avanzados algoritmos del NVIDIA Labs Research para identificar y posicionar objetos en el espacio con cámaras simples, y entrenar algoritmos de Deep Reinforcement Learning sobre millones de simulaciones en nuestro videojuego particular; y tras combinar todo eso con avanzados modelos de reconocimiento e interpretación del lenguaje y modelos avanzados de LLMs, estamos consiguiendo ya que nuestras máquinas interactúen con nosotros de forma más inteligente.
Ahora mismo ya somos capaces de que nuestro robot entienda que queremos “esa herramienta de ahí”, recogerla de la mesa de un sitio indeterminado y acercárnosla.
¿Nuestros siguientes pasos? Que el robot nos ayude a identificar cajas con “Interruptores RCD Eaton, 40A, 3P+N Polos, 10 unidades” y nos ayude a clasificarla directamente en la estantería de electrónica de media potencia, en la sección de componentes de protección o ¿por qué no? Hacer que estos robots actúen como una tercera mano inteligente en nuestras tareas de ensamblaje.
El futuro está en hacer máquinas más inteligentes para que puedan responder a órdenes cada vez más complejas.
Cuando todo eso ocurra, descubriremos que la gran revolución que ha causado ChatGPT es solo la punta del iceberg de todo lo que nos queda por vivir.