Esittelemme paremman reseptin harjoituksen jälkeisen tiedon keräämiseen GRPO:ta käytettäessä. Näytteiden kerääminen asiantuntijoilta on kallista, merkintäbudjetit ovat rajalliset. Mistä esimerkeistä kannattaa oikeasti maksaa? Havaitsemme, että koviin näytteisiin keskittyminen johtaa 30-40 %:n parannukseen. 1/7
31,39K