OpenAI anuncia su nueva IA o1 con capacidades increibles

PhDfailer #1 12 Sep

Para el nuevo modelo de IA han combinado el enfoque de transformers+Reinforcement Learning para alcanzar un razonamiento superior.

OpenAI afirma lo siguiente:

OpenAI o1 se ubica en el percentil 89 en preguntas de programación competitiva (Codeforces), se encuentra entre los 500 mejores estudiantes de EE. UU. en una eliminatoria para la Olimpiada Matemática de EE. UU. (AIME), y supera la precisión a nivel de doctorado humano en un conjunto de problemas de física, biología y química (GPQA). Aunque aún se está trabajando para hacer que este nuevo modelo sea tan fácil de usar como los modelos actuales, estamos lanzando una versión preliminar de este modelo, OpenAI o1-preview, para su uso inmediato en ChatGPT y para usuarios confiables de la API.

Nuestro algoritmo de aprendizaje por refuerzo a gran escala enseña al modelo a pensar de manera productiva utilizando su cadena de razonamiento en un proceso de entrenamiento altamente eficiente en el uso de datos. Hemos descubierto que el rendimiento de o1 mejora consistentemente con más aprendizaje por refuerzo (cómputo en el tiempo de entrenamiento) y con más tiempo dedicado a pensar (cómputo en el tiempo de prueba). Las restricciones para escalar este enfoque difieren sustancialmente de las del preentrenamiento de modelos de lenguaje grandes (LLM), y seguimos investigándolas.

Fuente:
https://openai.com/index/learning-to-reason-with-llms/

Opinión personal:
Cada vez más cerca de AGI, da miedito si no se piensa un nuevo modelo económico donde los ciudadanos no dependan del trabajo.

2

SuperMatute #2 12 Sep

Las paguitas empezaron hace ya tiempo y con el tiempo irán en aumento y después llegará skynet y nos follará el culo a base de bien

2 1 respuesta

Artemax #3 12 Sep

29 1 respuesta

PhDfailer #4 12 Sep

BioGnomic #5 12 Sep Penitente

Bien, mi doctorado cada vez vale menos, en unos meses lo mismo que una cuenta free de chatgpt

6 1 respuesta

newfag #6 12 Sep

Habrá que verlo para creerlo, las gráficos muestran un avance brutal.

1 respuesta

PhDfailer #7 12 Sep

#5 Puedes ir aprendiendo albañileria, fontaneria, electrónica para montar servidores para nuestro IA overlord...

#6 Se supone que de aquí a dos semanas, los usuarios de Chat GPT Plus, lo tendremos (o1 preview). Ya hay algunos con acceso.

PhDfailer #8 12 Sep

Aquí pensando durante un minuto y medio

Leed la página 11 de este documento informativo:

https://cdn.openai.com/o1-system-card.pdf

Acojona.

Based on these findings, Apollo Research believes that o1-preview has the basic capabilities needed
to do simple in-context scheming 2—scheming which tends to be legible in the model outputs.
Based on interactions with o1-preview, the Apollo team subjectively believes o1-preview cannot
engage in scheming that can lead to catastrophic harms3
, although current evals aren’t designed
to definitively rule this out. Although Apollo Research does not believe that o1-preview is capable
of causing catastrophic harm via scheming, they recommend setting up basic monitoring for
in-chain-of-thought scheming during deployment in agentic high-stakes settings such as automated
AI research for next-generation frontier models. This is in part to better understand the risk of
current models as well as to prepare such a monitoring pipeline for more capable future models.
Carrying out monitoring for such purposes is an ongoing area of research and has various open
challenges (see Section 3.2.1 for results on early such experiments OpenAI has conducted).

2.Scheming which tends to be legible in the model outputs.

Scheming that could lead to severe unintended consequences.

3 respuestas

TripyLSD #9 12 Sep

#3 more like

22

Kike_Knoxvil #10 12 Sep

36 1 respuesta

r2d2rigo #11 12 Sep Inocente

#8 92 segundos pensando una frase que no tiene sentido gramatical, bravisimo.

2 1 respuesta

kreigon #12 12 Sep Penitente

11 segundos para pensar qué día es hoy. Ni tan mal, eso sí, solo me ha dejado hacerle esa pregunta.

tute07011988 #13 12 Sep Song Kang-ho

Con el video ese en el que tarda minuto y medio en escribir, no sé si es un trolleo o es que de verdad yo no veo el valor de tal logro tecnológico :/

3

ercabesa #14 12 Sep

es una pasada, es subir un peldaño importante

Fyn4r #15 12 Sep Inocente

#11 han cambiao una barra de progreso de 0-100% por frases aleatorias que suena chulis y venga, a facturar

7

wizar5 #16 12 Sep

#10 bueno yo le hice una foto a mi perro, y me supo decir hasta decir que tipo de perro es

Exor720 #17 12 Sep

Nos vamos a la verguisima

susto93 #18 12 Sep

Esto es el sucesor de chatgpt4?

1 respuesta

crb2222 #19 12 Sep

#18 no, es un modelo de razonamiento no de lenguaje, a la larga serán complementarios dentro de algo mayor

1

sPoiLeR #20 12 Sep

#8 Me parece un salto brutal de la versión anterior, increible avance mostrado en el video.

GaN2 #21 12 Sep Inocente

8

UsuarioD2024 #22 12 Sep

Con estos temas me pregunto continuamente cuanto merecerá la pena empezar en la actualidad o futuro a formarte como programador si vas a ser muy mediocre, no me cabe duda de que a la gente muy preparada y que lleva años les sobrará el trabajo, ¿pero hasta que punto y hasta cuando tendrá sentido contratar a alguien que a sacado una FP y ya? Digo lo de programación por decir algo y por estar en ese escenario, pero inserte materia "x" y no solo una FP, sino algo que lleve mucho más como el citado doctorado.

1 3 respuestas

cabron #23 12 Sep Judas

#22

a día de hoy? sigue mereciendo la pena totalmente, no te dejes engañar por el hype.

Esto es una herramienta, mucho más útil que tirarse 20 minutos buscando en google y leyendo blogs y stackoverflow, pero sigue siendo una herrramienta que necesita que se use de forma correcta, si pones a alguien que no tenga ni idea que haga todo a base de lo que le diga chatgpt montas una gorda, a día de hoy no es viable usarlo sin formación para nada que sea medio serio

25