🧬 BiomedArena jest tutaj! Jesteśmy zaszczyceni, że możemy współpracować z @DataTecnica i @NIH CARD, którzy opracowali BiomedArena, aby oceniać LLM-y w zakresie odkryć biomedycznych oraz pomóc w rozszerzeniu tego specyficznego toru w ocenach opartych na społeczności. 🧪 Nauka biomedyczna jest złożona, wiąże się z dużym ryzykiem i nieustannie się rozwija. 📊 CARDBiomedBench i testy rozumowania tabelarycznego pokazują, że żaden obecny model nie może wiarygodnie spełnić wymagań dotyczących rozumowania i wiedzy specyficznej dla dziedziny, które stawiają badacze biomedyczni. Dowiedz się więcej o BiomedArena w wątku 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
16,35K