Dies ist ein fantastisches Beispiel für das von @WhiteHouse vorgeschlagene Ökosystem der KI-Bewertungen aus dem KI-Aktionsplan von @DavidSacks, @mkratsios47, @sriramk und @deanwball, das in die Tat umgesetzt wird.
lmarena.ai
lmarena.ai19. Aug., 20:03
🧬 BiomedArena ist da! Wir sind geehrt, mit @DataTecnica und @NIH CARD zusammenzuarbeiten, die BiomedArena entwickelt haben, um LLMs für biomedizinische Entdeckungen zu bewerten und um diesen domänenspezifischen Bereich in gemeinschaftlich getriebenen Bewertungen zu erweitern. 🧪 Biomedizinische Wissenschaft ist komplex, risikobehaftet und entwickelt sich ständig weiter. 📊 CARDBiomedBench & tabellarische Denktests zeigen, dass kein aktuelles Modell zuverlässig die Anforderungen an das Denken und das domänenspezifische Wissen von biomedizinischen Forschern erfüllen kann. Erfahren Sie mehr über BiomedArena im Thread 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1,53K