🧬 BiomedArena è qui! Siamo onorati di collaborare con @DataTecnica e @NIH CARD, che hanno sviluppato BiomedArena per valutare i LLM per la scoperta biomedica e per aiutare ad espandere questo percorso specifico del dominio nelle valutazioni guidate dalla comunità. 🧪 La scienza biomedica è complessa, ad alto rischio e in continua evoluzione. 📊 CARDBiomedBench e i test di ragionamento tabellare mostrano che nessun modello attuale può soddisfare in modo affidabile le esigenze di ragionamento e conoscenza specifica del dominio dei ricercatori biomedici. Scopri di più su BiomedArena nel thread 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
16,36K