📢 Onze nieuwste paper wordt uitgebracht
Geselecteerd voor de @AAAI '26 workshop.
We tonen aan dat de voorspellingscapaciteit van LLM's op echte wereldvragen van voorspellingsmarkten (zoals polymarket) aanzienlijk varieert per categorie.
👉 Onze methode toont aan dat hoewel de toevoeging van nieuws helpt, het ook bepaalde faalmodi toevoegt zoals definitiedrift, recentheidsbias en geruchtenverankering.
📢 Onze nieuwste paper wordt uitgebracht
Geselecteerd voor de @NeurIPSConf workshop over efficiënt redeneren!
We tonen aan dat de optimale methode voor testtijd-schaalvergroting iteratief verfijnd wordt door middel van sequentiële stappen.
👉 Onze methode overtreft meerderheidsstemmen door parallelle ketens in 95% van de configuraties met nauwkeurigheidswinsten tot 46,7% bij gelijke rekenkracht.