Это фантастический пример экосистемы оценок ИИ, предложенной в плане действий ИИ от @WhiteHouse, реализуемой @DavidSacks, @mkratsios47, @sriramk и @deanwball.
lmarena.ai
lmarena.ai19 авг., 20:03
🧬 BiomedArena здесь! Мы гордимся тем, что сотрудничаем с @DataTecnica и @NIH CARD, которые разработали BiomedArena для оценки LLM для биомедицинских открытий и для помощи в расширении этого специализированного направления в оценках, ориентированных на сообщество. 🧪 Биомедицинская наука сложна, имеет высокие ставки и постоянно развивается. 📊 CARDBiomedBench и тесты на табличное рассуждение показывают, что ни одна из существующих моделей не может надежно удовлетворить требования к рассуждению и специфическим знаниям в области биомедицинских исследований. Узнайте больше о BiomedArena в теме 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1,66K