Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Будівля ЛМАрена.
Статистика чорного ящика, оцінка моделі.
@Berkeley_EECS кандидат технічних наук, колишній студентський науковий співробітник @GoogleDeepMind та випускник @stanford_ee.
Цей реліз до біса величезний. Це одне з найбільших оновлень LMArena цього року!
Code Arena – це наше наступне покоління оцінок кодування, починаючи із завдань веб-розробки.
Тут ви можете використовувати моделі для створення інтерактивних сайтів і ділитися ними зі своїми друзями. Посилання постійні, тому ви можете, наприклад, створити гру і грати в неї, коли захочете.
Тут подивіться, як дві моделі - @claudeai Haiku і @grok-Code-Fast - змагаються за створення галактики. В даному випадку мені сподобався ефект «зоряних війн» Грока!

lmarena.ai13 лист., 01:48
🚀Introducing Code Arena: the next generation of live coding evals for frontier AI models. Built to test how models plan, scaffold, debug, and build real web apps step-by-step.
Try Claude, GPT-5, GLM-4.6 and Gemini in Code Arena today!
37,05K
🏆НОВІ ТАБЛИЦІ ЛІДЕРІВ🏆 LMARENA
🤓Експерти
💻 Програмне забезпечення та IT-послуги
✍️ Писемність, література та мова
🔬 Життєві, фізичні та соціальні науки
🎭 Розваги, спорт і ЗМІ
📈 Бізнес, менеджмент та фінансові операції
🧮 Математичний
⚖️ Юридичний та урядовий сектор
🩺 Медицина та охорона здоров'я
Оцінки економічної корисності штучного інтелекту (як і ВВПвалу) стають все більш актуальними, але їх збір дорогий. Ми працювали зі спільнотою LMArena, яка налічує мільйони щомісячних дописувачів, щоб органічно отримувати професійні та експертні дані, вирішуючи проблему масштабованості.
>5% користувачів LMArena є експертами, і величезна частка запитів LMArena припадає на економічно цінні галузі: SWE, студенти/дослідники, маркетологи/дизайнери, лікарі, юристи тощо. Це дозволяє нам створювати онлайн-таблиці лідерів у цих категоріях, які щодня ґрунтуються на свіжих відгуках. Це говорить про потужність реальної системи зворотного зв'язку, яку ми створили в @arena!


lmarena.ai6 лист., 03:26
🚀 Представляємо Arena Expert: нову структуру оцінювання LMArena для визначення найскладніших підказок від реальних користувачів на рівні експертів, що лежить в основі нової таблиці лідерів експертів.
Ми також представляємо професійні категорії, які лежать в основі восьми нових таблиць лідерів:
💻 Програмне забезпечення та IT-послуги
✍️ Писемність, література та мова
🔬 Життєві, фізичні та соціальні науки
🎭 Розваги, спорт і ЗМІ
📈 Бізнес, менеджмент та фінансові операції
🧮 Математичний
⚖️ Юридичний та урядовий сектор
🩺 Медицина та охорона здоров'я
Дізнайтеся, як моделі працюють у різних полях у потоці 🧵 👇

12,56K
Офіс LMArena сьогодні гуде. Навколишнє середовище є надлінійним. Ми конструктивно втручаємося, завжди підштовхуємо один одного вчитися і перевершувати те, що вважали своїми межами.
Риса #1, на яку ми звертаємо увагу при прийомі на роботу, - це «Відмінність». Щодня виробляємо роботу, яка відповідає найвищій технічній планці з точки зору майстерності, продуктивності та надійності. Є й інші фактори, але ніколи не йдіть на компроміс щодо досконалості. Як наслідок, кожен у нашій команді є глибоким експертом. Це потрібно для того, щоб з упевненістю будувати оцінки якості.
Досконалість породжує досконалість. Ніхто не хоче працювати в середовищі з купою мокрих ковдр – це вбиває імпульс. Ми постійно піднімаємо планку, і саме це призводить до відчуття енергії. Таке трапляється рідко.
Якщо вам цікаво працювати в такому середовищі, надішліть мені DM. Ми завжди шукаємо людей, які можуть підняти планку на одну сходинку вище.
6,59K
Найкращі
Рейтинг
Вибране

