Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

Fazendo mais com muito menos — alguns benchmarks dos principais modelos de código aberto. "Apesar de operar com uma fração da contagem de parâmetros ativos, o ZAYA1-base (760m ativos) alcança um desempenho comparável aos modelos líderes como Qwen3-4B (Alibaba) e Gemma3-12B (Google), e supera modelos incluindo Llama-3-8B (Meta) e OLMoE em benchmarks de raciocínio, matemática e codificação." — Primeiro gráfico — detalhes sobre a Atenção Convolucional Comprimida (CCA) da Zyphra: P.S. a resposta ao meu slogan: "Zyphra ironicamente *é* o DeepSeek do Ocidente... não menos porque é um dos laboratórios mais abertos *e* demograficamente ocidentais (enquanto o DeepSeek é, claro, 100% chinês). Rigor matemático e cultura científica." — + Blog Técnico: e + Artigo Técnico: + Hugging Face:

Top

Classificação

Favoritos