📢 Lançamento do nosso último artigo
Selecionado para o workshop @AAAI '26.
Mostramos que a capacidade de previsão dos LLMs em perguntas do mundo real de mercados de previsão (como o polymarket) varia significativamente por categoria.
👉 O nosso método mostra que, embora a adição de notícias ajude, também adiciona certos modos de falha, como desvio de definição, viés de recência e ancoragem de rumores.
📢 Lançamento do nosso último artigo
Selecionado para o workshop @NeurIPSConf sobre raciocínio eficiente!
Mostramos que o método ideal de escalonamento do tempo de teste é refinado iterativamente através de etapas sequenciais.
👉 O nosso método supera a votação majoritária por cadeias paralelas em 95% das configurações, com ganhos de precisão de até 46,7% com computação igual.