1/N Olen innoissani voidessani kertoa, että uusin @OpenAI kokeellisen päättelyn LLM on saavuttanut pitkäaikaisen suuren haasteen tekoälyssä: kultamitalitason suorituksen maailman arvostetuimmassa matematiikkakilpailussa – kansainvälisissä matematiikan olympialaisissa (IMO).
2/N Arvioimme mallejamme vuoden 2025 IMO-ongelmista samoilla säännöillä kuin ihmiskilpailijat: kaksi 4,5 tunnin koeistuntoa, ei työkaluja tai Internetiä, virallisten ongelmalausekkeiden lukeminen ja luonnollisen kielen todisteiden kirjoittaminen.
4/N Toiseksi, IMO:n lähetykset ovat vaikeasti tarkistettavia, monisivuisia vedoksia. Edistys tässä edellyttää selkeiden, todennettavissa olevien palkkioiden RL-paradigman ylittämistä. Näin olemme saaneet mallin, joka voi luoda monimutkaisia, vedenpitäviä argumentteja ihmismatemaatikkojen tasolla.
5/N Itse tuloksen lisäksi olen innoissani lähestymistavastamme: Emme saavuta tätä kykytasoa kapealla, tehtäväkohtaisella metodologialla, vaan avaamalla uusia uria yleiskäyttöisessä vahvistusoppimisessa ja testiaikaisessa laskennan skaalauksessa.
6/N Arvioinnissamme malli ratkaisi 5 vuoden 2025 IMO:n kuudesta ongelmasta. Kolme entistä IMO-mitalistia arvosteli itsenäisesti mallin lähettämän todistuksen jokaisesta tehtävästä, ja pisteet viimeisteltiin yksimielisen konsensuksen jälkeen. Malli ansaitsi yhteensä 35/42 pistettä, mikä riitti kultaan! 🥇
8/N Btw, julkaisemme GPT-5:n pian, ja olemme innoissamme siitä, että kokeilet sitä. Mutta selvyyden vuoksi: IMO:n kultainen LLM on kokeellinen tutkimusmalli. Emme aio julkaista mitään tällä matematiikan tasolla useaan kuukauteen.
9/N Silti – tämä korostaa sitä, kuinka nopeasti tekoäly on kehittynyt viime vuosina. Vuonna 2021 tohtorintutkinnon ohjaajani @JacobSteinhardt pyysi minua ennustamaan tekoälyn matematiikan edistymistä heinäkuuhun 2025 mennessä. Ennustin 30 % MATH-vertailuarvosta (ja ajattelin, että kaikki muut olivat liian optimistisia). Sen sijaan meillä on IMO:n kultaa.
11/N Lopuksi haluamme onnitella kaikkia vuoden 2025 IMO:n osallistujia heidän saavutuksestaan! Olemme ylpeitä siitä, että meillä on monia entisiä IMO:n osallistujia @OpenAI ja tunnustamme, että he ovat tulevaisuuden kirkkaimpia nuoria mieliä.
1,4M