📢 Veröffentlichung unseres neuesten Papiers
Ausgewählt für den @AAAI '26 Workshop.
Wir zeigen, dass die Prognosefähigkeit von LLMs bei realen Fragen aus Vorhersagemärkten (wie Polymarket) je nach Kategorie erheblich variiert.
👉 Unsere Methode zeigt, dass die Hinzufügung von Nachrichten zwar hilfreich ist, aber auch bestimmte Fehlermodi wie Definitionsdrift, Aktualitätsbias und Gerüchteverankerung hinzufügt.
📢 Veröffentlichung unseres neuesten Papiers
Ausgewählt für den Workshop @NeurIPSConf über effizientes Denken!
Wir zeigen, dass die optimale Methode zur Skalierung der Testzeit iterativ durch sequenzielle Schritte verfeinert wird.
👉 Unsere Methode übertrifft die Mehrheitsabstimmung durch parallele Ketten in 95 % der Konfigurationen mit Genauigkeitsgewinnen von bis zu 46,7 % bei übereinstimmender Rechenleistung.