Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Edificio LMArena.
Estadísticas de caja negra, evaluación de modelos.
@Berkeley_EECS Ph.D., ex estudiante de investigación @GoogleDeepMind y ex alumno de @stanford_ee.
¡Esta versión es increíblemente grande! Es una de las actualizaciones más importantes de LMArena este año!
Code Arena es nuestra próxima generación de evaluaciones de codificación, comenzando con tareas de desarrollo web.
Aquí puedes usar modelos para construir sitios web interactivos y compartirlos con tus amigos. Los enlaces son persistentes, así que puedes, por ejemplo, construir un juego y jugarlo cuando quieras.
Aquí puedes ver a dos modelos -- @claudeai Haiku y @grok-Code-Fast -- competir para construir una galaxia. En este caso, ¡me gustó el efecto de "guerras de las galaxias" de Grok!

lmarena.ai13 nov, 01:48
🚀Presentamos Code Arena: la próxima generación de evaluaciones de codificación en vivo para modelos de IA de vanguardia. Diseñado para probar cómo los modelos planifican, estructuran, depuran y construyen aplicaciones web reales paso a paso.
¡Prueba a Claude, GPT-5, GLM-4.6 y Gemini en Code Arena hoy!
37,06K
🏆NUEVAS TABLAS DE LIDERAZGO DE LMARENA🏆
🤓Expertos
💻 Servicios de Software y TI
✍️ Escritura, Literatura y Lenguaje
🔬 Ciencias de la Vida, Física y Sociales
🎭 Entretenimiento, Deportes y Medios
📈 Negocios, Gestión y Operaciones Financieras
🧮 Matemáticas
⚖️ Legal y Gobierno
🩺 Medicina y Salud
Las evaluaciones de la utilidad económica de la IA (como GDPval) son cada vez más relevantes, pero costosas de recopilar. Trabajamos con la comunidad de LMArena, que cuenta con millones de contribuyentes mensuales, para obtener datos ocupacionales y de expertos de manera orgánica, resolviendo el problema de escalabilidad.
>El 5% de los usuarios de LMArena son expertos, y una gran fracción de los prompts de LMArena se encuentran en industrias de alto valor económico: SWE, estudiantes/investigadores, mercadólogos/diseñadores, médicos, abogados y más. Esto nos permite construir tablas de liderazgo en línea en estas categorías basadas en comentarios frescos cada día. ¡Habla del poder del sistema de retroalimentación del mundo real que hemos creado en @arena!


lmarena.ai6 nov, 03:26
🚀 Presentamos Arena Expert: un nuevo marco de evaluación LMArena para identificar los prompts más difíciles y de nivel experto de usuarios reales, impulsando un nuevo ranking de Expertos.
También introducimos Categorías Ocupacionales que subyacen a ocho nuevos rankings:
💻 Software y Servicios de TI
✍️ Escritura, Literatura y Lenguaje
🔬 Ciencias de la Vida, Física y Sociales
🎭 Entretenimiento, Deportes y Medios
📈 Negocios, Gestión y Operaciones Financieras
🧮 Matemáticas
⚖️ Legal y Gobierno
🩺 Medicina y Atención Sanitaria
Explora cómo se desempeñan los modelos en diferentes campos en el hilo 🧵 👇

12,59K
La oficina de LMArena está llena de energía hoy. El ambiente es superlineal. Nos estamos interfiriendo de manera constructiva, siempre empujándonos unos a otros a aprender y superar lo que pensábamos que eran nuestros límites.
El rasgo #1 que buscamos al contratar es "Excelencia." Producir trabajo todos los días que cumpla con el más alto estándar técnico en términos de artesanía, rendimiento y fiabilidad. Hay otros factores también, pero nunca comprometerse con la excelencia. Como consecuencia, todos en nuestro equipo son expertos profundos. Esto es necesario para construir evaluaciones de calidad con confianza.
La excelencia engendra excelencia. Nadie quiere trabajar en un ambiente con un montón de personas que apagan el entusiasmo -- mata el impulso. Estamos constantemente elevando el listón, y esto es lo que lleva a la sensación de energía. Es raro.
Si estás interesado en trabajar en este tipo de ambiente, mándame un DM. Siempre estamos buscando personas que puedan elevar el listón un nivel más alto.
6,59K
Parte superior
Clasificación
Favoritos

