septiembre 25, 2024

OpenAI lanza una nueva serie de modelos de IA con capacidades de ‘razonamiento’

REUTERS/DADO RUVIC/ILUSTRACIÓN/FOTO DE ARCHIVO

El logotipo de OpenAI se ve en esta ilustración el 20 de mayo. OpenAI, respaldado por Microsoft, dijo el jueves que estaba lanzando su serie “Strawberry” de modelos de IA diseñados para pasar más tiempo procesando respuestas a consultas para resolver problemas difíciles.

OpenAI, respaldado por Microsoft, dijo el jueves que estaba lanzando su serie de modelos de IA “Strawberry” diseñados para pasar más tiempo procesando respuestas a consultas para resolver problemas difíciles.

Los modelos, informados por primera vez por Reuters, son capaces de razonar sobre tareas complejas y pueden resolver problemas más desafiantes que los modelos anteriores en ciencia, codificación y matemáticas, dijo la empresa de IA en una publicación de blog.

OpenAI utilizó el nombre en clave Strawberry para referirse al proyecto internamente, mientras que bautizó los modelos anunciados el jueves como o1 y o1-mini. El o1 estará disponible en ChatGPT y su API a partir del jueves, según informó la compañía.

Noam Brown, un investigador de OpenAI centrado en mejorar el razonamiento en los modelos de la compañía, confirmó en una publicación en la plataforma de redes sociales X que los modelos eran los mismos que los del proyecto Strawberry.

“Estoy entusiasmado por compartir con ustedes el fruto de nuestro esfuerzo en OpenAI para crear modelos de IA capaces de un razonamiento verdaderamente general”, escribió Brown.

En su publicación de blog, OpenAI afirmó que el modelo o1 obtuvo un puntaje del 83% en el examen de clasificación para la Olimpiada Internacional de Matemáticas, en comparación con el 13% de su modelo anterior, GPT-4o.

El modelo también mejoró el desempeño en preguntas de programación competitiva y superó la precisión del nivel de doctorado humano en un punto de referencia de problemas científicos, afirmó la compañía.

Brown dijo que los modelos pudieron lograr los puntajes incorporando una técnica conocida como razonamiento de “cadena de pensamiento”, que implica dividir problemas complejos en pasos lógicos más pequeños.

Los investigadores han observado que el rendimiento de los modelos de IA en problemas complejos tiende a mejorar cuando se ha utilizado el enfoque como técnica de estímulo. OpenAI ha automatizado ahora esta capacidad para que los modelos puedan descomponer los problemas por sí solos, sin necesidad de que el usuario los pida.

“Entrenamos a estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, de forma similar a como lo haría una persona. A través del entrenamiento, aprenden a refinar su proceso de pensamiento, a probar diferentes estrategias y a reconocer sus errores”, afirmó OpenAI.

Reuters fue el primero en informar sobre el trabajo de OpenAI en el proyecto de razonamiento, entonces llamado Q*, en noviembre de 2023. En julio informó que el proyecto había pasado a conocerse como Strawberry.


(Esta es una historia sin editar y generada automáticamente a partir de un servicio de noticias sindicado. Radio VIAL Es posible que el personal no haya cambiado ni editado el texto del contenido).