Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Edifício LMArena.
Estatísticas de caixa preta, avaliação de modelos.
@Berkeley_EECS Ph.D., ex-aluno pesquisador @GoogleDeepMind e ex-aluno @stanford_ee.
Este lançamento é enorme. É uma das maiores atualizações do LMArena este ano!
Code Arena é a nossa próxima geração de avaliações de codificação, começando com tarefas de desenvolvimento web.
Aqui você pode usar modelos para criar sites interativos e compartilhá-los com seus amigos. Os links são persistentes, então você pode, por exemplo, criar um jogo e jogá-lo quando quiser.
Aqui assista a dois modelos - @claudeai Haiku e @grok-Code-Fast - competindo para construir uma galáxia. Nesse caso, gostei do efeito "guerra nas estrelas" do Grok!

lmarena.ai13 de nov., 01:48
🚀Apresentando o Code Arena: a próxima geração de avaliações de codificação ao vivo para modelos de IA de fronteira. Criado para testar como os modelos planejam, estruturam, depuram e criam aplicativos Web reais passo a passo.
Experimente Claude, GPT-5, GLM-4.6 e Gemini no Code Arena hoje!
37,06K
🏆NOVAS TABELAS🏆 DE CLASSIFICAÇÃO LMARENA
🤓Peritos
💻 Software e serviços de TI
✍️ Escrita, Literatura e Linguagem
🔬 Ciências da Vida, Físicas e Sociais
🎭 Entretenimento, Esportes e Mídia
📈 Negócios, Gestão e Operações Financeiras
🧮 Matemático
⚖️ Legal e Governamental
🩺 Medicina e Saúde
As avaliações da utilidade econômica da IA (como o GDPval) são cada vez mais relevantes, mas caras de coletar. Trabalhamos com a comunidade de milhões de colaboradores mensais da LMArena para obter dados ocupacionais e de especialistas organicamente, resolvendo o problema de escalabilidade.
>5% dos usuários do LMArena são especialistas e uma grande fração dos prompts do LMArena estão em setores economicamente valiosos: SWE, estudantes/pesquisadores, profissionais de marketing/designers, médicos, advogados e muito mais. Isso nos permite criar tabelas de classificação online nessas categorias, baseadas em novos comentários todos os dias. Ele fala sobre o poder do sistema de feedback do mundo real que criamos na @arena!


lmarena.ai6 de nov., 03:26
🚀 Apresentando o Arena Expert: uma nova estrutura de avaliação LMArena para identificar os prompts mais difíceis e de nível especialista de usuários reais, alimentando uma nova tabela de classificação de Expert.
Também apresentamos Categorias Ocupacionais que fundamentam oito novas tabelas de classificação:
💻 Software e serviços de TI
✍️ Escrita, Literatura e Linguagem
🔬 Ciências da Vida, Físicas e Sociais
🎭 Entretenimento, Esportes e Mídia
📈 Negócios, Gestão e Operações Financeiras
🧮 Matemático
⚖️ Legal e Governamental
🩺 Medicina e Saúde
Explore o desempenho dos modelos em todos os campos no thread 🧵 👇

12,59K
O escritório da LMArena está movimentado hoje. O ambiente é superlinear. Estamos interferindo construtivamente, sempre empurrando uns aos outros para aprender e superar o que pensávamos serem nossos limites.
A característica # 1 que procuramos ao contratar é "Excelência". Produzindo um trabalho todos os dias que atenda ao mais alto nível técnico em termos de habilidade, desempenho e confiabilidade. Existem outros fatores também, mas nunca comprometa a excelência. Como consequência, todos em nossa equipe são especialistas profundos. Isso é necessário para construir avaliações de qualidade com confiança.
Excelência gera excelência. Ninguém quer trabalhar em um ambiente com um monte de cobertores molhados - isso mata o ímpeto. Estamos constantemente elevando o nível, e é isso que leva à sensação de energia. É raro.
Se você estiver interessado em trabalhar neste tipo de ambiente, envie-me um DM. Estamos sempre à procura de pessoas que possam elevar a fasquia um degrau mais alto.
6,59K
Melhores
Classificação
Favoritos

