Ystäväni @eternisai julkaisivat juuri tutkimuksen, joka osoitti, että tekoälymallien kouluttaminen vaikeimpiin esimerkkeihin johtaa 40 % parempaan suorituskykyyn päättelytehtävissä. Tämä on ristiriidassa ihmisten kanssa, jotka haluavat oppia helpommilla asioilla.
Pratyush Ranjan Tiwari
Pratyush Ranjan Tiwari23.8. klo 01.41
Esittelemme paremman reseptin harjoituksen jälkeisen tiedon keräämiseen GRPO:ta käytettäessä. Näytteiden kerääminen asiantuntijoilta on kallista, merkintäbudjetit ovat rajalliset. Mistä esimerkeistä kannattaa oikeasti maksaa? Havaitsemme, että koviin näytteisiin keskittyminen johtaa 30-40 %:n parannukseen. 1/7
282