Una nueva inteligencia artificial que razonará paso a paso y cambiará el paradigma

OpenAI ha dado un paso importante en el campo de la inteligencia artificial con el lanzamiento de un nuevo modelo conocido como OpenAI o1, también llamado «Strawberry». Este modelo representa un cambio de enfoque en el desarrollo de la inteligencia artificial, enfatizando que el tamaño no es el único factor que determina el desarrollo de esta tecnología.

El año pasado, OpenAI presentó GPT-4, un modelo que aumentó significativamente el tamaño de sus redes neuronales. Sin embargo, la aparición de OpenAI o1 señala una evolución en las capacidades de razonamiento lógico. A diferencia de otros modelos que tienden a generar respuestas de inmediato, o1 es capaz de razonar y pensar en voz alta, como lo haría un humano, antes de sacar conclusiones.

Mira Murati, directora de tecnología de OpenAI, explica que este modelo no pretende sustituir al GPT-4, sino complementarlo. Actualmente, la empresa está trabajando en GPT-5, que será mucho más grande que su predecesor. Murati explica que hay dos paradigmas en juego: el paradigma de la escala y este nuevo enfoque del razonamiento, y la intención es integrarlos.

Los modelos de lenguaje como LLM (Large Language Models) operan en grandes redes neuronales entrenadas con enormes cantidades de datos. Aunque dominan tareas lingüísticas y lógicas, a menudo encuentran dificultades con problemas aparentemente simples, como las matemáticas básicas. OpenAI o1 utiliza el aprendizaje por refuerzo para mejorar su capacidad de razonamiento, proporcionando retroalimentación positiva o negativa según la precisión de sus respuestas. Este tipo de aprendizaje ha demostrado ser eficaz en aplicaciones como el diseño de chips y la creación de chatbots más sofisticados.

Mark Chen, vicepresidente de investigación de OpenAI, demostró el potencial de o1 al resolver problemas complejos que GPT-4 no podía manejar, incluidas preguntas de química y acertijos matemáticos complejos. Chen enfatiza que el nuevo modelo aprende a razonar por sí solo, en lugar de simplemente imitar el pensamiento humano como lo hacían los modelos anteriores.

En términos de rendimiento, se descubrió que OpenAI o1 era mejor en diversas áreas como codificación, matemáticas, física, biología y química. Por ejemplo, en una prueba de matemáticas para estudiantes, GPT-4 resolvió el 12% de los problemas, mientras que o1 logró un impresionante 83%.

Sin embargo, el nuevo modelo también tiene desventajas. Es más lento que GPT-4 y no puede buscar en Internet, lo que limita sus capacidades en algunas tareas. Mejorar el razonamiento en el LLM es un tema de creciente interés en la investigación, y competidores como Google exploran enfoques similares.

OpenAI cree que el nuevo modelo puede contribuir a un comportamiento más seguro y coherente con las normas sociales. Murati señala que al considerar las consecuencias de sus acciones, o1 puede evitar generar efectos nocivos que podrían llevar a una IA menos peligrosa.

Expertos en inteligencia artificial como Oren Etzioni destacan la importancia de entrenar modelos para resolver problemas complejos y utilizar las herramientas adecuadas. A pesar de los avances, persisten desafíos como las «alucinaciones» y la veracidad de la información generada.

Chen concluye que el enfoque basado en el razonamiento no sólo es emocionante, sino que también promete hacer que la IA sea más accesible y asequible, lo que se alinea con la misión de OpenAI de democratizar el acceso a la IA.