Un avance en la inteligencia artificial que podría transformar tareas complejas
Un equipo del Instituto Tecnológico de Massachusetts (MIT) y de la Universidad de Harvard logró aumentar significativamente la rendimiento de un modelo de inteligencia artificial en el juego Batalla Naval, elevando su tasa de victorias del 8% al 82%, según informó el portal tecnológico TechXplore.
¿Cómo se logró este avance?
El trabajo, presentado en abril en la Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR), abordó una dificultad concreta de los modelos de lenguaje: si bien responden bien a consultas complejas, no siempre saben investigar un problema cuando deben explorar muchas posibilidades en entornos inciertos. Para ello, los investigadores diseñaron una versión en lenguaje natural llamada batalla naval colaborativa, en la que un participante actúa como capitán y formula preguntas sobre la ubicación de barcos ocultos, mientras otro responde en tiempo real con sí o no.
Más de 40 personas jugaron esa versión, generando un conjunto de datos llamado BattleshipQA, que sirvió para evaluar diferentes modelos de lenguaje, como GPT-5 y Llama 4 Scout.
Mejoras en la formulación de preguntas
El equipo detectó que el principal desafío no era solo responder correctamente, sino formular preguntas útiles. Para ello, incorporaron un método conocido como inferencia de Monte Carlo, que estima la probabilidad de que cada respuesta sea correcta entre varias opciones. Esto permitió que los modelos eligieran preguntas que revelaran más información sobre la posición de los barcos.
El resultado más destacado fue con Llama 4 Scout, que antes de la corrección solo superaba a los humanos en el 8% de las partidas y, tras los ajustes, alcanzó un 82%. Además, este método también mejoró la precisión en otros juegos, como ¿Quién es quién?, donde pasó del 30% al 72% de aciertos.
¿Qué implica esto para la inteligencia artificial?
Según Gabriel Grand, investigador principal del estudio, estos avances muestran que la capacidad de formular buenas preguntas depende de la habilidad de predecir y simular el mundo. Cuando los agentes tienen acceso a un modelo del mundo, pueden realizar descubrimientos de manera más eficiente, lo que abre la puerta a aplicaciones en diagnósticos médicos, descubrimiento científico y resolución de problemas complejos.
Limitaciones y próximos pasos
Sin embargo, los autores advierten que los modelos aún enfrentan dificultades para responder preguntas complejas en comparación con los humanos. Valerio Pepe, de OpenAI, señaló que, aunque GPT-5 puede vencer a un jugador promedio en Batalla Naval, los jugadores expertos aún representan un reto para los sistemas de IA.
El estudio también destaca que la batalla naval colaborativa es una prueba relativamente sencilla y que los investigadores quieren llevar estos modelos a entornos más complejos, donde deban considerar muchas más alternativas y colaborar con humanos.
¿Qué sigue en la investigación?
Grand prevé experimentos de colaboración entre humanos y sistemas de IA, además de ajustes finos en simulaciones y mayor uso de capacidad de cómputo para ampliar la inferencia. Hawkins, profesor de Stanford, señala que estos avances reflejan que el verdadero desafío no solo es el cálculo, sino el razonamiento pragmático y la comunicación efectiva en escenarios sociales complejos.
Este avance en la IA, aunque aún en etapas iniciales, evidencia el potencial de los modelos para explorar y aprender en entornos inciertos, un paso clave hacia aplicaciones más sofisticadas y autónomas.





