本週在複雜系統節目中,我很高興歡迎METR的@joel_bkr,討論我們如何嚴格測量大型語言模型(LLMs)的進展,Joel和團隊最近取得的一個有趣研究結果,以及關於軟體工程的工業組織的一點點內容。
14.12K