La inteligencia artificial parece avanzar a pasos agigantados, y la última entrega de OpenAI, el modelo conocido como o3, está generando mucha expectación. Si eres de los que se sobresalta cada vez que escuchas «inteligencia artificial», relájate: hoy te contaré sobre el reciente lanzamiento de este modelo y sus implicaciones, y lo haré de una manera clara y entretenida.

Un vistazo a o3: el protagonista inesperado

¿Recuerdas la vez que compraste un gadget tan innovador que no podías esperar para mostrarlo a tus amigos? Esa es la sensación que está generando o3, aunque su lanzamiento, el 24 de diciembre de 2024, pasó un poco desapercibido. Imagine que abriste el regalo de Navidad y, en lugar de recibir un par de calcetines, desenvuelves un dispositivo tecnológico que promete cambiar tu vida.

Sam Altman y su equipo han hecho un trabajo impresionante con o3, y aunque no esté disponible para el público general todavía, los especialistas están emocionados. La verdadero noticia aquí es que este modelo no solo supera a sus predecesores, sino que promete mejorar la forma en que interactuamos con la IA en varias áreas, como la programación, la ciencia e incluso las matemáticas.

Expectativa y cautela

Al hablar de o3, Sam Altman se mostró sorprendentemente moderado. En vez de hacer promesas grandilocuentes, se centró en o3-mini, una versión más económica y capaz de o3, destacando cómo será útil para los programadores. Es como si un chef estelar estuviese cocinando en su cocina pero decidiese dedicar su tiempo a hablar de una receta más sencilla.

Temas que hacen ruido

Hay ciertos puntos que no podemos pasar por alto. En las pruebas de benchmarking informadas por The Algorithmic Bridge, o3 logró resultados impresionantes. Por ejemplo:

  • En el benchmark SWE-bench Verified, un indicador de capacidad de programación, o3 logró un 71,7%, un salto notable en comparación con modelos anteriores.
  • En el test de Codeforces, diseñado para medir la competencia de programación, o3 obtuvo una puntuación que lo posicionaría en el percentil 99,7.

Una pregunta que podría surgir aquí es: ¿Estamos ante la aparición de una nueva era en la programación asistida por IA? La respuesta parece ser que sí, aunque con matices.

Benchmark: ¿el fin de la incertidumbre?

El uso de benchmarks en la inteligencia artificial es una doble espada. Por un lado, ofrecen un enfoque estandarizado para medir el rendimiento de los modelos. Por otro, pueden ser engañosos. ¿Alguna vez has estado en una prueba donde solo importa una buena estrategia, pero aún así sacas una nota terrible? Esto mismo les pasa a los modelos de IA como o3 y sus competidores.

Algunas pruebas, como ARC-AGI, han sido diseñadas para medir cómo las máquinas abordan problemas que los humanos consideran triviales. François Chollet, el creador de este benchmark, menciona que las máquinas, incluidas las más avanzadas, aún luchan con tareas que nosotros encontramos simples. Es como cuando un perro trata de resolver un cubo Rubik: es adorable, pero no está ni cerca de lograrlo.

Aquí, o3 se llevó la palma, logrando un 87,5% en la prueba, un contexto que sitúa estos modelos de IA como herramientas competidoras en la arena de los desarrolladores de software. Pero el camino a seguir no será fácil.

Un hito en matemáticas

¿Dudabas de que la IA pudiese abordar acertijos matemáticos complicados? Bien, o3 ha alcanzado un sorprendente 25,2% en el nuevo benchmark llamado FrontierMath. Terence Tao, ganador de la medalla Fields, había insinuado que la IA tardaría años en acercarse a estas pruebas. Vamos, que si ahora hiciéramos una película sobre esto, necesitaríamos un buen actor para representar la lucha entre humanos y máquinas en el mundo de las matemáticas.

La pregunta del millón: ¿Es esto AGI?

Aunque muchos se preguntan si o3 es el primer paso hacia una Inteligencia Artificial General (AGI), Chollet responde con cautela. ¿Qué es AGI, te preguntas? Básicamente, es una IA que puede realizar cualquier tarea cognitiva que un ser humano puede hacer. Y eso aún está en el horizonte.

En su forma actual, o3 puede ser impresionante, pero no está exento de limitaciones. ¿Alguna vez has intentado hacer un truco de magia y, en lugar de impresionar a todos, hiciste que el perro de tu amigo se asustara? Así de lejos está o3 de algunas tareas “triviales” para los humanos.

Costos y modelos de acceso

Aquí es donde la historia puede volverse un poco más oscura. Aunque es emocionante hablar de todas las capacidades que o3 está mostrando, la pregunta que todos quieren hacer es: ¿y el precio? Según las estimaciones, si quieres acceder a todas las funciones de o3, prepárate para abrir la cartera. Pero no te alarmes, porque la versión o3-mini, que probablemente será más asequible, también estará disponible para los mortales como tú y yo.

Se espera que OpenAI ofrezca o3-mini a partir del primer trimestre de 2025. Imagínate tener una versión más asequible de este modelo increíble y que además, te haga ganar ese código que has estado debatiendo desde hace semanas.

La diversificación es clave

Lo interesante aquí es que OpenAI está adoptando una estrategia de diversificación. En lugar de simplemente lanzar un modelo estrella, están posicionando diferentes versiones para diferentes mercados y necesidades. ¿Te imaginas cómo sería el día a día en una empresa utilizando IA diseñada específicamente para sus necesidades? Comienza a parecerse más a una película de ciencia ficción, ¿verdad?

Conclusión: Mirando hacia el futuro

En conclusión, el lanzamiento de o3 puede no haber causado un revuelo inmediato, pero su potencial es significativo. Mientras explora nuevas soluciones en programación, ciencia y matemáticas, no podemos dejar de preguntarnos cómo influirá en nuestras vidas.

Recuerda, estamos ante un momento crucial en la historia de la inteligencia artificial, y aunque el camino sea incierto, la oportunidad y la innovación están a la vuelta de la esquina. Tal vez sea el momento de empezar a familiarizarte con los términos y la evolución de los modelos de IA; quién sabe, ¡podrías ser quien finalice ese código que llevas tanto tiempo atormentando!

Así que la próxima vez que alguien hable sobre IA, ya no tendrás que mirar a la pared y preguntar por qué el wifi no carga. ¡Tendrás un par de buenos puntos de conversación sobre o3 y su impresionante potencial!