Dit is een fantastisch voorbeeld van het AI-evaluatie-ecosysteem dat wordt voorgesteld door het AI-actieplan van @WhiteHouse, uitgevoerd door @DavidSacks, @mkratsios47, @sriramk en @deanwball.
lmarena.ai
lmarena.ai19 aug, 20:03
🧬 BiomedArena is hier! We zijn vereerd om samen te werken met @DataTecnica en @NIH CARD, die BiomedArena hebben ontwikkeld om LLM's te evalueren voor biomedische ontdekkingen, en om dit domeinspecifieke pad in gemeenschapsgedreven evaluaties uit te breiden. 🧪 Biomedische wetenschap is complex, risicovol en voortdurend in ontwikkeling. 📊 CARDBiomedBench & tabulaire redeneertests tonen aan dat geen enkel huidig model betrouwbaar kan voldoen aan de redeneer- en domeinspecifieke kennisvereisten van biomedische onderzoekers. Leer meer over BiomedArena in de thread 👇 🧵 #AI #LLMs #BiomedicalAI #AIEvaluation #OpenScience #LMArena #BiomedArena #NIH
1,52K