Mistral näyttää olevan julkaisemassa kaksi uutta mallia: Ministral 3:n ja Mistral Large 3:n. Arkkitehtuurin osalta näyttää olevan: > täsmälleen sama kuin llama2/3 Ministralille, joka on hyvin samanlainen (vaikka he lisäisivät SWA:n) ensimmäiseen Mistral 7B:n julkaisuun kaksi vuotta sitten. > täsmälleen sama arkkitehtuuri kuin DeepSeek V3:ssa suuressa (joka vaikuttaa olevan MoE) Molemmissa käytetään myös Llama4-köysiskaalausta (langan sijaan), ja Largessa he näyttävät toteuttavan spekulatiivisen dekoodauksen kotkalla Linkki PRS:ään ketjussa