他們使用 vLLMs 進行基準測試 TPUs 並未針對此進行優化 因此他們的得分不佳