🧬 BiomedArena 來了! 我們很榮幸與 @DataTecnica 和 @NIH CARD 合作,他們開發了 BiomedArena 來評估 LLMs 在生物醫學發現中的應用,並幫助擴展這一領域特定的社區驅動評估。 🧪 生物醫學科學複雜、風險高且不斷發展。 📊 CARDBiomedBench 和表格推理測試表明,目前沒有任何模型能夠可靠地滿足生物醫學研究人員的推理和領域特定知識需求。 在下面的線程中了解更多關於 BiomedArena 的信息 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
16.35K