热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
之前我给小伙伴们介绍了@SentientAGI四篇论文被@NeurIPSConf 采纳,而这其中最有含金量的要属登上主赛道的 OML 1.0。
OML(Open Model License / Ownership Marking Layer)是一种给大语言模型“打防伪标记”的技术。
它能在不影响模型性能的前提下,往模型内部嵌入成千上万个“指纹”——就像在模型里藏了许多隐形水印,用来证明模型的身份和来源。
以前的模型指纹方法都有很多限制:
❶最多只能嵌入几十个指纹,再多模型就“坏掉”;
❷指纹容易被发现或删除;在模型微调、蒸馏、合并后就失效;
❸无法真正支持开源模型的版权追踪和商业化。
而 OML 会在模型不常用的“边缘区域”嵌入隐形的密钥—响应对,让模型在正常使用时表现完全一致,但只有输入特定密钥的人才能触发专属回答,从而验证模型真伪。
实际测试中,Sentient 在 Llama-3.1-8B 的微调版本中嵌入了 24,576 个独立的密钥-响应对,仍然保持性能稳定,且在微调、蒸馏或混合后依然存在。
OML 让模型像人类作品一样有“签名”。这带来了许多重要的可能性:
-模型溯源:知道一个模型是从哪里来的,谁训练的。
-授权与商业化:开源模型也能实现合法分发和收费授权。
-防伪与防篡改:防止别人抄袭、微调后冒充原创。
可信审计:可以在现实环境中检测模型是否属于某个发布方。
简单说,OML 是让 AI 模型拥有“版权保护机制” 的第一步,也是Sentient 以社区驱动的开源AGI能实现的基石。

热门
排行
收藏

