一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

之前我给小伙伴们介绍了@SentientAGI四篇论文被@NeurIPSConf 采纳，而这其中最有含金量的要属登上主赛道的 OML 1.0。 OML（Open Model License / Ownership Marking Layer）是一种给大语言模型“打防伪标记”的技术。它能在不影响模型性能的前提下，往模型内部嵌入成千上万个“指纹”——就像在模型里藏了许多隐形水印，用来证明模型的身份和来源。以前的模型指纹方法都有很多限制： ❶最多只能嵌入几十个指纹，再多模型就“坏掉”； ❷指纹容易被发现或删除；在模型微调、蒸馏、合并后就失效； ❸无法真正支持开源模型的版权追踪和商业化。而 OML 会在模型不常用的“边缘区域”嵌入隐形的密钥—响应对，让模型在正常使用时表现完全一致，但只有输入特定密钥的人才能触发专属回答，从而验证模型真伪。实际测试中，Sentient 在 Llama-3.1-8B 的微调版本中嵌入了 24,576 个独立的密钥-响应对，仍然保持性能稳定，且在微调、蒸馏或混合后依然存在。 OML 让模型像人类作品一样有“签名”。这带来了许多重要的可能性： -模型溯源：知道一个模型是从哪里来的，谁训练的。 -授权与商业化：开源模型也能实现合法分发和收费授权。 -防伪与防篡改：防止别人抄袭、微调后冒充原创。可信审计：可以在现实环境中检测模型是否属于某个发布方。简单说，OML 是让 AI 模型拥有“版权保护机制” 的第一步，也是Sentient 以社区驱动的开源AGI能实现的基石。