我聽說強化學習只有在可驗證的獎勵下才有效?😛 恭喜!!
Alexander Wei
Alexander Wei2025年7月19日
1/N 我很高興地與大家分享,我們最新的@OpenAI實驗推理 LLM 在 AI 領域實現了長期以來的重大挑戰:在世界上最負盛名的數學競賽——國際數學奧林匹克競賽 (IMO) 上獲得金牌級的表現。
31.83K