Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Budynek LMArena.
Statystyka czarnej skrzynki, ocena modelu.
@Berkeley_EECS doktorat, były student @GoogleDeepMind i absolwent @stanford_ee.
To wydanie jest piekielnie ogromne. To jedna z największych aktualizacji LMArena w tym roku!
Code Arena to nasza nowa generacja oceniania kodu, zaczynająca od zadań związanych z rozwojem stron internetowych.
Tutaj możesz używać modeli do budowania interaktywnych stron internetowych i dzielenia się nimi z przyjaciółmi. Linki są trwałe, więc możesz np. stworzyć grę i grać w nią, kiedy tylko chcesz.
Tutaj zobacz dwa modele -- @claudeai Haiku i @grok-Code-Fast -- rywalizujące w budowaniu galaktyki. W tym przypadku podobał mi się efekt "star-wars" Groka!

lmarena.ai13 lis 2025
🚀Przedstawiamy Code Arena: nową generację ocen kodowania na żywo dla modeli AI na czołowej linii. Stworzona, aby testować, jak modele planują, tworzą struktury, debugują i budują prawdziwe aplikacje internetowe krok po kroku.
Wypróbuj Claude, GPT-5, GLM-4.6 i Gemini w Code Arena już dziś!
37,06K
🏆NOWE RANKINGI LMARENA🏆
🤓Eksperci
💻 Usługi oprogramowania i IT
✍️ Pisanie, literatura i język
🔬 Nauki przyrodnicze, fizyczne i społeczne
🎭 Rozrywka, sport i media
📈 Biznes, zarządzanie i operacje finansowe
🧮 Matematyka
⚖️ Prawo i administracja
🩺 Medycyna i opieka zdrowotna
Oceny ekonomicznej użyteczności AI (takie jak GDPval) są coraz bardziej istotne, ale kosztowne do zebrania. Współpracowaliśmy z społecznością LMArena, liczącą miliony miesięcznych współpracowników, aby organicznie pozyskiwać dane dotyczące zawodów i ekspertów, rozwiązując problem skalowalności.
>5% użytkowników LMArena to eksperci, a ogromna część zapytań LMArena dotyczy branż o wartości ekonomicznej: SWE, studenci/badacze, marketerzy/projektanci, lekarze, prawnicy i inni. Pozwala nam to budować internetowe rankingi w tych kategoriach, oparte na świeżych opiniach każdego dnia. To świadczy o sile systemu opinii z rzeczywistego świata, który stworzyliśmy w @arena!


lmarena.ai6 lis 2025
🚀 Przedstawiamy Arena Expert: nowy framework oceny LMArena, który identyfikuje najtrudniejsze, najbardziej eksperckie zapytania od prawdziwych użytkowników, zasilając nową tabelę liderów dla ekspertów.
Wprowadzamy również Kategorie Zawodowe, które stanowią podstawę ośmiu nowych tabel liderów:
💻 Usługi oprogramowania i IT
✍️ Pisanie, literatura i język
🔬 Nauki przyrodnicze, fizyczne i społeczne
🎭 Rozrywka, sport i media
📈 Biznes, zarządzanie i operacje finansowe
🧮 Matematyka
⚖️ Prawo i administracja
🩺 Medycyna i opieka zdrowotna
Zbadaj, jak modele radzą sobie w różnych dziedzinach w wątku 🧵 👇

12,59K
Biuro LMArena dzisiaj tętni życiem. Środowisko jest superlinowe. Konstruktywnie się wspieramy, zawsze popychając się nawzajem do nauki i przekraczania tego, co uważaliśmy za nasze ograniczenia.
Najważniejszą cechą, której szukamy podczas rekrutacji, jest "Doskonałość." Codzienne produkowanie pracy, która spełnia najwyższe standardy techniczne pod względem rzemiosła, wydajności i niezawodności. Są też inne czynniki, ale nigdy nie można iść na kompromis w kwestii doskonałości. W konsekwencji każdy w naszym zespole jest głębokim ekspertem. To jest wymagane, aby budować jakościowe oceny z pewnością.
Doskonałość rodzi doskonałość. Nikt nie chce pracować w środowisku z grupą "mokrych koców" -- to zabija impet. Nieustannie podnosimy poprzeczkę, a to prowadzi do poczucia energii. To rzadkość.
Jeśli jesteś zainteresowany pracą w takim środowisku, wyślij mi DM. Zawsze szukamy ludzi, którzy mogą podnieść poprzeczkę o jeden poziom wyżej.
6,6K
Najlepsze
Ranking
Ulubione

