kom på hur man skulle "ångra" RL och göra gpt-oss tillbaka till en basmodell Kommer att släppa vikterna imorgon Gn
Jack Morris
Jack Morris9 aug. 2025
Är du nyfiken på träningsdata för OpenAI:s nya gpt-oss-modeller? Det var jag också. så jag genererade 10 miljoner exempel från gpt-oss-20b, körde lite analys och resultaten var... ganska bisarrt Dags för en djupdykning 🧵
195,61K