La nueva IA que razonará paso a paso y cambiará el paradigma

OpenAI ha dado un paso importante en el campo de la inteligencia artificial con el lanzamiento de un nuevo modelo conocido como OpenAI o1, también llamado «Strawberry». Este modelo representa un cambio de enfoque en el desarrollo de la IA, enfatizando que el tamaño no es el único factor determinante en el avance de esta tecnología.

El año pasado, OpenAI presentó GPT-4, un modelo que amplió enormemente el tamaño de sus redes neuronales. Sin embargo, la llegada de OpenAI o1 señala una evolución en la capacidad de razonar lógicamente. A diferencia de otros modelos que tienden a generar respuestas de inmediato, o1 es capaz de razonar y pensar en voz alta como lo haría un humano antes de llegar a una conclusión.

Mira Murati, CTO de OpenAI, explica que este modelo no busca sustituir a GPT-4, sino complementarlo. Actualmente, la compañía está trabajando en el GPT-5, que será significativamente más grande que su predecesor. Muratti aclara que existen dos paradigmas: el de la escala y este nuevo enfoque del razonamiento, que se pretende integrar.

Los modelos de lenguaje, como LLM (Large Language Models), funcionan con extensas redes neuronales entrenadas con cantidades masivas de datos. Aunque dominan tareas lingüísticas y lógicas, a menudo encuentran dificultades con problemas aparentemente simples, como operaciones matemáticas básicas. OpenAI o1 utiliza el aprendizaje por refuerzo para mejorar su capacidad de razonamiento proporcionando comentarios positivos o negativos según la precisión de sus respuestas. Este tipo de aprendizaje ha demostrado ser eficaz en aplicaciones como el diseño de chips y la creación de chatbots más complejos.

Mark Chen, vicepresidente de investigación de OpenAI, demostró el potencial de o1 al resolver problemas complejos que GPT-4 no podía resolver, incluidas preguntas de química y acertijos matemáticos complejos. Chen enfatiza que el nuevo modelo aprende a razonar de forma autónoma, en lugar de simplemente imitar el pensamiento humano como lo hacen los modelos anteriores.

En términos de rendimiento, OpenAI o1 demostró ser superior en diversos campos como codificación, matemáticas, física, biología y química. Por ejemplo, en un examen de matemáticas para estudiantes, el GPT-4 resolvió el 12% de los problemas, mientras que el o1 logró un impresionante 83%.

Sin embargo, el nuevo modelo también tiene sus inconvenientes. Es más lento que GPT-4 y no puede realizar búsquedas en Internet, lo que limita su capacidad para determinadas tareas. Mejorar el razonamiento del LLM es un tema de creciente interés en la investigación, y competidores como Google están explorando enfoques similares.

OpenAI cree que su nuevo modelo puede contribuir a un comportamiento más seguro que se ajuste a las normas sociales. Muratti señala que al pensar en las consecuencias de sus acciones, o1 puede evitar generar resultados dañinos que podrían conducir a una IA menos peligrosa.

Expertos en inteligencia artificial como Oren Etzioni destacan la importancia de los modelos de aprendizaje para resolver problemas complejos y el uso de herramientas adecuadas. A pesar de los avances, persisten desafíos como las «alucinaciones» y la credibilidad de la información generada.

Chen concluye que el enfoque de razonamiento no solo es emocionante, sino que también promete hacer que la IA sea más accesible y accesible, en línea con la misión de OpenAI de democratizar el acceso a la IA.

La nueva IA que razonará paso a paso y cambiará el paradigma

Por Santiago Gálvez