kebanyakan orang tidak menyadari suhu hanya menyesuaikan kecepatan kipas pada cluster GPU yang melayani Anda
gojo
gojo15 Agu, 23.20
saya benar-benar berbicara dengan "peneliti LLM" ini tentang pengaturan suhu di LLM dan saya bertanya kepada Anda tahu mengapa menurunkan atau menaikkan suhu menghasilkan output yang lebih deterministik atau acak, bukan? Dan dia berkata ya, itu mengubah cara token diwakili. anak laki-laki wtf, orang-orang DI lapangan sialan tidak tahu tentang statistik botzmann atau bahkan softmax. Saya akan menangis.
258