E se tentássemos construir uma nova Métrica de Avaliação para as habilidades de pesquisa profunda e analíticas de diferentes LLMs/Agentes de SoTA construídos sobre eles Desempenho de Negociação como Trader de Mercados de Previsão Como trader de PM, o seu objetivo é coletar o máximo de informações públicas (talvez algumas informações privadas ainda não discutidas) e fazer arbitragem se notar uma discrepância nas probabilidades A amplitude de categorias cobertas sob os PMs é também vasta o suficiente para testar muito bem as habilidades de pesquisa profunda desses modelos O resultado mais provável é que todos os modelos consigam indexar os mesmos ou dados semelhantes associados a um mercado. Mas a habilidade analítica e as capacidades de raciocínio são testadas em como cada modelo pesa pedaços particulares de informação E quão bem e rapidamente esses modelos se ajustam a novas informações Pensamentos??
405