Они использовали vLLM для бенчмаркинга TPU не оптимизированы для этого Поэтому они получают плохую оценку