Detta är ett fantastiskt exempel på att det ekosystem för AI-utvärderingar som föreslås i @WhiteHouse handlingsplan för AI från @DavidSacks @mkratsios47 @sriramk @deanwball har genomförts i praktiken
lmarena.ai
lmarena.ai19 aug. 2025
🧬 BiomedArena är här! Vi är hedrade över att samarbeta med @DataTecnica och @NIH CARD, som utvecklade BiomedArena för att utvärdera LLM:er för biomedicinsk upptäckt och för att hjälpa till att utöka detta domänspecifika spår i samhällsdrivna utvärderingar. 🧪 Biomedicinsk vetenskap är komplex, med höga insatser och utvecklas ständigt. 📊 CARDBiomedBench & tabular resonemangstester visar att ingen aktuell modell på ett tillförlitligt sätt kan uppfylla de krav på resonemang och domänspecifik kunskap som biomedicinska forskare ställer. Läs mer om BiomedArena i tråden 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1,69K