In precedenza ho presentato ai miei amici quattro articoli di @SentientAGI accettati da @NeurIPSConf, e tra questi il più significativo è senza dubbio OML 1.0, che è salito sulla pista principale. OML (Open Model License / Ownership Marking Layer) è una tecnologia che "appone un marchio di autenticità" ai grandi modelli linguistici. Essa può incorporare migliaia di "impronte digitali" all'interno del modello senza compromettere le prestazioni, proprio come se avesse nascosto molti watermark invisibili nel modello, per dimostrare l'identità e l'origine del modello. I metodi precedenti per le impronte digitali dei modelli avevano molte limitazioni: ❶ potevano incorporare al massimo solo alcune decine di impronte, altrimenti il modello "si rovinava"; ❷ le impronte erano facili da scoprire o eliminare; dopo il fine-tuning, la distillazione o la fusione, diventavano inefficaci; ❸ non supportavano realmente il tracciamento dei diritti d'autore e la commercializzazione dei modelli open source. OML, invece, incorpora chiavi invisibili - coppie chiave-risposta - nelle "aree marginali" del modello, in modo che il modello si comporti in modo completamente coerente durante l'uso normale, ma solo le persone che inseriscono chiavi specifiche possono attivare risposte esclusive, verificando così l'autenticità del modello. Nei test pratici, Sentient ha incorporato 24.576 coppie chiave-risposta indipendenti nella versione fine-tuned di Llama-3.1-8B, mantenendo comunque prestazioni stabili, e queste rimangono anche dopo il fine-tuning, la distillazione o la fusione. OML consente ai modelli di avere una "firma" come le opere umane. Questo porta a molte possibilità importanti: - Tracciamento del modello: sapere da dove proviene un modello e chi lo ha addestrato. - Autorizzazione e commercializzazione: i modelli open source possono anche essere distribuiti legalmente e autorizzati a pagamento. - Protezione contro la contraffazione e la manomissione: prevenire che altri copino o si spaccino per originali dopo il fine-tuning. - Audit affidabile: è possibile verificare in un ambiente reale se un modello appartiene a un determinato editore. In breve, OML è il primo passo per dare ai modelli AI un "meccanismo di protezione del copyright", ed è anche la base che Sentient può realizzare con un AGI open source guidato dalla comunità.