Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
En 1986 fui el primer Hot Rodder moviendo PC de 4Mhz a 20Mhz en mi garaje.
IBM envió abogados para detenerme, luego enviaron ingenieros para aprender de mí, luego enviaron demandas para contratarme, fue el enfoque equivocado.
Ahora soy Hot Rodding AI en mi garaje, hoy: Open Source Grok 2.5.



24 ago, 22:28
¡Trabajando en el nuevo Grok 2.5 de código abierto!
¡Ya hemos podido hacer Hot Rod!
Es pronto y puede fallar, pero lo que tenemos es:
Un 268B MoE, 131k contexto, 8 expertos, RoPE, 64 cabezales de atención GQA con 8 cabezales KV, 64 capas.
En cualquier momento solo 2 expertos están normalmente activos. ¡Hemos encontrado una manera de activar 4 simultáneamente con solo una pequeña caída de rendimiento, aproximadamente 1/3 más de memoria GPU y un aumento asombroso en las salidas de calidad!
Si mantiene nuestras pruebas, publicaré un tutorial detallado.
43.23K
Populares
Ranking
Favoritas