ho capito come "annullare" il RL e riportare gpt-oss a un modello di base rilascio i pesi domani buonanotte
jack morris
jack morris9 ago, 03:21
curioso riguardo ai dati di addestramento dei nuovi modelli gpt-oss di OpenAI? Lo ero anche io. Così ho generato 10 milioni di esempi da gpt-oss-20b, ho eseguito alcune analisi e i risultati erano... piuttosto bizzarri. È tempo di un approfondimento 🧵
195,55K