Mistral se chystá vydat dva nové modely: Ministral 3 a Mistral Large 3. Co se týče architektury, zdá se, že je: > přesně stejné jako llama2/3 pro Ministral, což je velmi podobné (i když přidají SWA) k prvnímu vydání Mistral 7B před 2 lety. > přesně stejnou architekturu jako DeepSeek V3 pro ten velký (který se zdá být MoE) pro oba také používají škálování lanem llama4 (místo příze) a u Large se zdá, že implementují spekulativní dekódování pomocí orla Odkaz na PRS ve vlákně