E se provassimo a costruire una nuova metrica di valutazione per le capacità di ricerca profonda e analitica di diversi LLM/Agenti SoTA costruiti su di essi? Performance di trading come trader di mercati predittivi Come trader di PM, il tuo obiettivo è raccogliere quante più informazioni pubbliche (forse anche alcune informazioni private ancora non discusse) e fare arbitraggio se noti una discrepanza nelle probabilità. La varietà di categorie coperte dai PM è abbastanza vasta da testare molto bene le capacità di ricerca profonda di questi modelli. L'esito più probabile è che tutti i modelli siano in grado di indicizzare dati simili o identici associati a un mercato. Ma la capacità analitica e le capacità di ragionamento vengono testate in base a come ciascun modello pesa particolari frammenti di informazione. E quanto bene e rapidamente questi modelli si adattano a nuove informazioni. Pensieri??
409