Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Здание ЛВАрена.
Статистика черного ящика, оценка моделей.
@Berkeley_EECS кандидат наук, бывший студент-исследователь @GoogleDeepMind и выпускник @stanford_ee.
Этот релиз чертовски огромен. Это одно из самых больших обновлений LMArena в этом году!
Code Arena — это наше следующее поколение оценок программирования, начиная с задач веб-разработки.
Здесь вы можете использовать модели для создания интерактивных веб-сайтов и делиться ими с друзьями. Ссылки постоянные, так что вы можете, например, создать игру и играть в нее, когда захотите.
Смотрите, как две модели — @claudeai Haiku и @grok-Code-Fast — соревнуются в создании галактики. В этом случае мне понравился эффект "звездных войн" от Grok!

lmarena.ai13 нояб., 01:48
🚀Представляем Code Arena: следующее поколение живых оценок кодирования для передовых AI моделей. Создано для тестирования того, как модели планируют, создают структуру, отлаживают и строят реальные веб-приложения шаг за шагом.
Попробуйте Claude, GPT-5, GLM-4.6 и Gemini в Code Arena сегодня!
37,06K
🏆НОВЫЕ РЕЙТИНГИ LMARENA🏆
🤓Эксперты
💻 Программное обеспечение и ИТ-услуги
✍️ Письмо, литература и язык
🔬 Жизненные, физические и социальные науки
🎭 Развлечения, спорт и медиа
📈 Бизнес, управление и финансовые операции
🧮 Математика
⚖️ Юридические и государственные услуги
🩺 Медицина и здравоохранение
Оценки экономической полезности ИИ (такие как GDPval) становятся все более актуальными, но их сбор обходится дорого. Мы работали с сообществом LMArena, состоящим из миллионов ежемесячных участников, чтобы органически собрать данные о профессиях и экспертах, решая проблему масштабируемости.
>5% пользователей LMArena являются экспертами, и огромная доля запросов LMArena относится к экономически ценным отраслям: SWE, студенты/исследователи, маркетологи/дизайнеры, врачи, юристы и другие. Это позволяет нам создавать онлайн-рейтинги в этих категориях, основанные на свежих отзывах каждый день. Это говорит о силе системы обратной связи из реального мира, которую мы создали в @arena!


lmarena.ai6 нояб., 03:26
🚀 Представляем Arena Expert: новую оценочную систему LMArena для выявления самых сложных, экспертных запросов от реальных пользователей, которая поддерживает новый рейтинг экспертов.
Мы также представляем профессиональные категории, которые лежат в основе восьми новых рейтингов:
💻 Программное обеспечение и ИТ-услуги
✍️ Письмо, литература и язык
🔬 Естественные, физические и социальные науки
🎭 Развлечения, спорт и медиа
📈 Бизнес, управление и финансовые операции
🧮 Математика
⚖️ Право и государственные дела
🩺 Медицина и здравоохранение
Изучите, как модели работают в различных областях в теме 🧵 👇

12,58K
Офис LMArena сегодня полон жизни. Атмосфера суперлинейная. Мы конструктивно взаимодействуем, всегда подталкивая друг друга к обучению и превышению того, что мы считали своими пределами.
Главная черта, которую мы ищем при найме, это "Совершенство." Каждый день мы производим работу, которая соответствует самым высоким техническим стандартам в плане мастерства, производительности и надежности. Есть и другие факторы, но никогда не стоит идти на компромисс в вопросах совершенства. В результате каждый в нашей команде является глубоким экспертом. Это необходимо для уверенной оценки качества.
Совершенство порождает совершенство. Никто не хочет работать в среде с кучей "мокрых одеял" — это убивает динамику. Мы постоянно поднимаем планку, и это приводит к ощущению энергии. Это редкость.
Если вы заинтересованы в работе в такой среде, напишите мне в личные сообщения. Мы всегда ищем людей, которые могут поднять планку еще на одну ступень.
6,59K
Топ
Рейтинг
Избранное

