C'est un exemple fantastique de l'écosystème d'évaluations de l'IA proposé par le plan d'action de l'IA de @WhiteHouse, mis en œuvre par @DavidSacks, @mkratsios47, @sriramk et @deanwball.
lmarena.ai
lmarena.ai19 août, 20:03
🧬 BiomedArena est là ! Nous sommes honorés de nous associer à @DataTecnica et @NIH CARD, qui ont développé BiomedArena pour évaluer les LLMs pour la découverte biomédicale, et pour aider à élargir cette piste spécifique au domaine dans les évaluations pilotées par la communauté. 🧪 La science biomédicale est complexe, à enjeux élevés et en constante évolution. 📊 CARDBiomedBench et les tests de raisonnement tabulaire montrent qu'aucun modèle actuel ne peut répondre de manière fiable aux exigences de raisonnement et de connaissances spécifiques au domaine des chercheurs biomédicaux. En savoir plus sur BiomedArena dans le fil 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1,58K