所以我們分析了來自 Cline 用戶的數百萬個差異編輯,顯然 GLM-4.6 的成功率為 94.9%,而 Claude 4.5 則為 96.2%。 為了澄清,差異編輯並不是編碼代理的唯一指標。但有趣的是,三個月前這個差距是 5-10 分。 開源模型正在快速改進,Cline 用戶立即注意到了這一點——我們的 Discord 上充滿了轉向 GLM 進行日常工作的人的消息,因為它的成本僅為 10%。 本週 AMD 也寫了一篇博客,談到他們如何在消費者硬體上運行 Qwen3 Coder 和 GLM-4.5-Air。這個差距不僅在雲端縮小——在你的筆記本電腦上也在縮小。