tabla muy interesante de deepseek v3.2 que compara el conteo de tokens de salida en diferentes benchmarks, la versión especial de dsv3.2 piensa mucho más que cualquier otro modelo, PERO dado que están utilizando atención dispersa, ¿el costo de inferencia seguirá siendo aceptable?