разобрался, как "отменить" RL и вернуть gpt-oss обратно в базовую модель завтра выложу веса спокойной ночи
Jack Morris
Jack Morris9 авг. 2025 г.
интересно, какие данные использовались для обучения новых моделей gpt-oss от OpenAI? Я тоже был в этом заинтересован. Поэтому я сгенерировал 10 миллионов примеров из gpt-oss-20b, провел некоторый анализ, и результаты были... довольно странными. Время для глубокого погружения 🧵
195,6K