之前我给小伙伴们介绍了@SentientAGI四篇论文被@NeurIPSConf 采纳,而这其中最有含金量的要属登上主赛道的 OML 1.0。 OML(Open Model License / Ownership Marking Layer)是一种给大语言模型“打防伪标记”的技术。 它能在不影响模型性能的前提下,往模型内部嵌入成千上万个“指纹”——就像在模型里藏了许多隐形水印,用来证明模型的身份和来源。 以前的模型指纹方法都有很多限制: ❶最多只能嵌入几十个指纹,再多模型就“坏掉”; ❷指纹容易被发现或删除;在模型微调、蒸馏、合并后就失效; ❸无法真正支持开源模型的版权追踪和商业化。 而 OML 会在模型不常用的“边缘区域”嵌入隐形的密钥—响应对,让模型在正常使用时表现完全一致,但只有输入特定密钥的人才能触发专属回答,从而验证模型真伪。 实际测试中,Sentient 在 Llama-3.1-8B 的微调版本中嵌入了 24,576 个独立的密钥-响应对,仍然保持性能稳定,且在微调、蒸馏或混合后依然存在。 OML 让模型像人类作品一样有“签名”。这带来了许多重要的可能性: -模型溯源:知道一个模型是从哪里来的,谁训练的。 -授权与商业化:开源模型也能实现合法分发和收费授权。 -防伪与防篡改:防止别人抄袭、微调后冒充原创。 可信审计:可以在现实环境中检测模型是否属于某个发布方。 简单说,OML 是让 AI 模型拥有“版权保护机制” 的第一步,也是Sentient 以社区驱动的开源AGI能实现的基石。