Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Fazendo mais com muito menos — alguns benchmarks dos principais modelos de código aberto.
"Apesar de operar com uma fração da contagem de parâmetros ativos, o ZAYA1-base (760m ativos) alcança um desempenho comparável aos modelos líderes como Qwen3-4B (Alibaba) e Gemma3-12B (Google), e supera modelos incluindo Llama-3-8B (Meta) e OLMoE em benchmarks de raciocínio, matemática e codificação." —
Primeiro gráfico — detalhes sobre a Atenção Convolucional Comprimida (CCA) da Zyphra:
P.S. a resposta ao meu slogan: "Zyphra ironicamente *é* o DeepSeek do Ocidente... não menos porque é um dos laboratórios mais abertos *e* demograficamente ocidentais (enquanto o DeepSeek é, claro, 100% chinês). Rigor matemático e cultura científica." —
+ Blog Técnico: e
+ Artigo Técnico:
+ Hugging Face:


Top
Classificação
Favoritos

