之前我給小夥伴們介紹了@SentientAGI四篇論文被@NeurIPSConf 採納,而這其中最有含金量的要屬登上主賽道的 OML 1.0。 OML(Open Model License / Ownership Marking Layer)是一種給大語言模型“打防偽標記”的技術。 它能在不影響模型性能的前提下,往模型內部嵌入成千上萬個“指紋”——就像在模型裡藏了許多隱形水印,用來證明模型的身份和來源。 以前的模型指紋方法都有很多限制: ❶最多只能嵌入幾十個指紋,再多模型就“壞掉”; ❷指紋容易被發現或刪除;在模型微調、蒸餾、合併後就失效; ❸無法真正支持開源模型的版權追蹤和商業化。 而 OML 會在模型不常用的“邊緣區域”嵌入隱形的密鑰—響應對,讓模型在正常使用時表現完全一致,但只有輸入特定密鑰的人才能觸發專屬回答,從而驗證模型真偽。 實際測試中,Sentient 在 Llama-3.1-8B 的微調版本中嵌入了 24,576 個獨立的密鑰-響應對,仍然保持性能穩定,且在微調、蒸餾或混合後依然存在。 OML 讓模型像人類作品一樣有“簽名”。這帶來了許多重要的可能性: -模型溯源:知道一個模型是從哪裡來的,誰訓練的。 -授權與商業化:開源模型也能實現合法分發和收費授權。 -防偽與防篡改:防止別人抄襲、微調後冒充原創。 可信審計:可以在現實環境中檢測模型是否屬於某個發佈方。 簡單說,OML 是讓 AI 模型擁有“版權保護機制” 的第一步,也是Sentient 以社區驅動的開源AGI能實現的基石。