Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Création de LMArena.
Statistiques en boîte noire, évaluation de modèles.
@Berkeley_EECS Ph.D., ancien étudiant chercheur @GoogleDeepMind et ancien élève de @stanford_ee.
Cette mise à jour est vraiment énorme. C'est l'une des plus grandes mises à jour de LMArena cette année !
Code Arena est notre prochaine génération d'évaluations de codage, commençant par des tâches de développement web.
Ici, vous pouvez utiliser des modèles pour créer des sites web interactifs et les partager avec vos amis. Les liens sont persistants, donc vous pouvez par exemple créer un jeu et y jouer quand vous le souhaitez.
Regardez ici deux modèles -- @claudeai Haiku et @grok-Code-Fast -- s'affronter pour construire une galaxie. Dans ce cas, j'ai aimé l'effet "star-wars" de Grok !

lmarena.ai13 nov., 01:48
🚀Présentation de Code Arena : la prochaine génération d'évaluations de codage en direct pour les modèles d'IA de pointe. Conçu pour tester comment les modèles planifient, structurent, déboguent et construisent des applications web réelles étape par étape.
Essayez Claude, GPT-5, GLM-4.6 et Gemini dans Code Arena aujourd'hui !
37,05K
🏆NOUVEAUX CLASSEMENTS LMARENA🏆
🤓Experts
💻 Services logiciels et informatiques
✍️ Écriture, littérature et langue
🔬 Sciences de la vie, physiques et sociales
🎭 Divertissement, sports et médias
📈 Affaires, gestion et opérations financières
🧮 Mathématiques
⚖️ Droit et gouvernement
🩺 Médecine et soins de santé
Les évaluations de l'utilité économique de l'IA (comme GDPval) sont de plus en plus pertinentes, mais coûteuses à collecter. Nous avons travaillé avec la communauté de LMArena, composée de millions de contributeurs mensuels, pour obtenir des données professionnelles et d'experts de manière organique, résolvant ainsi le problème de l'évolutivité.
>5 % des utilisateurs de LMArena sont des experts, et une grande partie des demandes de LMArena provient d'industries économiquement précieuses : SWE, étudiants/chercheurs, marketeurs/designers, médecins, avocats, et plus encore. Cela nous permet de créer des classements en ligne dans ces catégories, basés sur des retours frais chaque jour. Cela témoigne de la puissance du système de retour d'information du monde réel que nous avons créé chez @arena!


lmarena.ai6 nov., 03:26
🚀 Présentation d'Arena Expert : un nouveau cadre d'évaluation LMArena pour identifier les prompts les plus difficiles et de niveau expert provenant de vrais utilisateurs, alimentant un nouveau classement des Experts.
Nous introduisons également des Catégories Professionnelles qui sous-tendent huit nouveaux classements :
💻 Services logiciels et IT
✍️ Écriture, littérature et langue
🔬 Sciences de la vie, physiques et sociales
🎭 Divertissement, sports et médias
📈 Affaires, gestion et opérations financières
🧮 Mathématiques
⚖️ Juridique et gouvernement
🩺 Médecine et soins de santé
Découvrez comment les modèles se comportent dans différents domaines dans le fil 🧵 👇

12,57K
Le bureau de LMArena est en effervescence aujourd'hui. L'environnement est superlinéaire. Nous interférons de manière constructive, nous poussant toujours les uns les autres à apprendre et à dépasser ce que nous pensions être nos limites.
Le trait n°1 que nous recherchons lors de l'embauche est "l'Excellence." Produire un travail chaque jour qui répond à la plus haute norme technique en termes de savoir-faire, de performance et de fiabilité. Il y a d'autres facteurs aussi, mais ne jamais faire de compromis sur l'excellence. En conséquence, chacun dans notre équipe est un expert approfondi. Cela est nécessaire pour construire des évaluations de qualité avec confiance.
L'excellence engendre l'excellence. Personne ne veut travailler dans un environnement avec une bande de mouillés -- cela tue l'élan. Nous élevons constamment la barre, et c'est ce qui conduit à ce sentiment d'énergie. C'est rare.
Si vous êtes intéressé à travailler dans ce genre d'environnement, envoyez-moi un DM. Nous recherchons toujours des personnes capables d'élever la barre d'un cran.
6,59K
Meilleurs
Classement
Favoris

