在我的經驗中,這一直是正確的。Chat GPT 已經是一個很棒的數學工具。對於應用數學問題,它的表現遠遠超出了我的預期。我不確定他們是如何在數學表現上取得這些改進的。 GPT-5 在數學準確性方面相比 GPT-4 有顯著提升,展現出在解決複雜數學問題上的 "量子飛躍"。在美國邀請數學考試(AIME)中,GPT-5 在沒有工具的情況下取得了 94.6% 的分數,相較於 GPT-4 在類似問題上的 ~46.4% 分數有了顯著的飛躍。憑藉其內置的 "思維鏈" 或 "思考" 模式,GPT-5 在競賽風格的數學問題上的準確性可以達到近乎完美的 99.6% 分數,遠超 GPT-4 在同類水平上的表現。
518