Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

jack morris
výzkum @cornell @meta // jazykové modely, teorie informace, věda o umělé inteligenci
Přišel jsem na to, jak "vrátit zpět" RL a změnit GPT-OSS zpět na základní model
zítra shodí činky
Gn


jack morris9. 8. 03:21
Zajímají vás trénovací data nových modelů GPT-OSS od OpenAI? Já jsem byl také.
tak jsem vygeneroval 10M příkladů z gpt-oss-20b, provedl nějakou analýzu a výsledky byly... Docela bizarní
Je čas na hluboký ponor 🧵

116,7K
Dobře, potřebuji pomoc! O víkendu jsem se pokusil doladit GPT-OSS. funguje pro ~100 kroků, pak vyvolá chybu CUDA z nedostatku paměti
Můj odhad je, že jednou za čas jsou všechny tokeny směrovány k jedinému expertovi. Pak trénink spadne.
Existuje snadné řešení? nikdy předtím jsem žádné MoE nevyladil
67,52K
Který model bychom měli udělat příště?

jack morris9. 8. 03:21
Zajímají vás trénovací data nových modelů GPT-OSS od OpenAI? Já jsem byl také.
tak jsem vygeneroval 10M příkladů z gpt-oss-20b, provedl nějakou analýzu a výsledky byly... Docela bizarní
Je čas na hluboký ponor 🧵

21,97K
svět VC poskytuje velkou hodnotu, ale někdy to vypadá, jako by právě zapálili peníze.
několik startupů, které znám, získalo před třemi lety celkem ~100 milionů na výrobu AI, vytvořilo software, který nikdo nikdy nepoužil, a nyní všechny pracují jinde na nesouvisejících věcech.
Kam se poděly všechny ty peníze?
18,44K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější