Anteriormente, les presenté a mis amigos que @SentientAGI cuatro artículos fueron aceptados por @NeurIPSConf, y el más valioso de ellos fue OML 1.0 en la pista principal. OML (Open Model License / Ownership Marking Layer) es una tecnología que "estampa contra la falsificación" de grandes modelos de lenguaje. Puede incrustar miles de "huellas dactilares" dentro del modelo sin afectar el rendimiento del modelo, al igual que muchas marcas de agua invisibles ocultas en el modelo para probar la identidad y el origen del modelo. Los métodos de huellas dactilares de modelos anteriores tienen muchas limitaciones: ❶ A lo sumo, solo se pueden incrustar unas pocas docenas de huellas dactilares, y no importa cuántos modelos haya, se "romperán"; ❷ Las huellas dactilares son fáciles de detectar o eliminar; Caducará después del ajuste fino del modelo, la destilación y la fusión; ❸ Realmente no puede soportar el seguimiento de derechos de autor y la comercialización de modelos de código abierto. OML incrusta pares clave-respuesta ocultos en "áreas de borde" donde el modelo no se usa comúnmente, de modo que el modelo se comporta exactamente igual cuando se usa normalmente, pero solo la persona que ingresa la clave específica puede activar una respuesta única para verificar la autenticidad del modelo. En pruebas del mundo real, Sentient incorporó 24,576 pares de respuesta clave independientes en la versión ajustada de Llama-8-8B y se mantuvo estable y persistió después del ajuste, la destilación o la mezcla. OML hace que los modelos estén "firmados" como obras humanas. Esto abre una serie de posibilidades importantes: - Trazabilidad del modelo: sepa de dónde proviene un modelo y quién lo entrenó. - Licencias y comercialización: Los modelos de código abierto también pueden lograr una distribución legal y licencias de pago. -Antifalsificación y antimanipulación: Evite que otros plagien y ajusten y suplanten el original. Auditoría de confianza: puede detectar si el modelo pertenece a un editor en el mundo real. En resumen, OML es el primer paso para dar a los modelos de IA un "mecanismo de protección de derechos de autor" y es la piedra angular del AGI de código abierto impulsado por la comunidad de Sentient.