Anteriormente, apresentei aos meus amigos que @SentientAGI quatro artigos foram aceitos pelo @NeurIPSConf, e o mais valioso deles foi o OML 1.0 na faixa principal. OML (Open Model License / Ownership Marking Layer) é uma tecnologia que "carimba anti-falsificação" grandes modelos de linguagem. Ele pode incorporar milhares de "impressões digitais" dentro do modelo sem afetar o desempenho do modelo - assim como muitas marcas d'água invisíveis escondidas no modelo para provar a identidade e a origem do modelo. Os métodos de impressão digital de modelos anteriores têm muitas limitações: ❶ No máximo, apenas algumas dezenas de impressões digitais podem ser incorporadas e, não importa quantos modelos existam, elas serão "quebradas"; ❷ As impressões digitais são fáceis de detectar ou excluir; Ele expirará após o ajuste fino, destilação e fusão do modelo; ❸ Não pode realmente suportar o rastreamento de direitos autorais e a comercialização de modelos de código aberto. A OML incorpora pares de chave-resposta ocultos em "áreas de borda" onde o modelo não é comumente usado, de modo que o modelo se comporta exatamente da mesma forma quando usado normalmente, mas apenas a pessoa que insere a chave específica pode acionar uma resposta exclusiva para verificar a autenticidade do modelo. Em testes do mundo real, o Sentient incorporou 24.576 pares independentes de resposta-chave na versão ajustada do Llama-8-8B e permaneceu estável e persistiu após o ajuste fino, destilação ou mistura. A OML faz modelos "assinados" como obras humanas. Isso abre uma série de possibilidades importantes: - Rastreabilidade do modelo: saiba de onde veio um modelo e quem o treinou. - Licenciamento e comercialização: Os modelos de código aberto também podem obter distribuição legal e licenciamento de taxas. -Anti-falsificação e anti-adulteração: Evite que outras pessoas plagiem, ajustem e personifiquem o original. Auditoria confiável: você pode detectar se o modelo pertence a um editor no mundo real. Em suma, o OML é o primeiro passo para dar aos modelos de IA um "mecanismo de proteção de direitos autorais" e é a pedra angular da AGI de código aberto voltada para a comunidade da Sentient.