Dříve jsem svým přátelům představil, že @NeurIPSConf @SentientAGI čtyři práce a nejcennější z nich byl OML 1.0 v hlavní linii. OML (Open Model License / Ownership Marking Layer) je technologie, která "razítkuje proti padělání" velkých jazykových modelů. Může do modelu vložit tisíce "otisků prstů", aniž by to ovlivnilo výkon modelu - stejně jako mnoho neviditelných vodoznaků skrytých v modelu k prokázání identity a původu modelu. Předchozí modely metod snímání otisků mají mnoho omezení: ❶ Maximálně lze vložit pouze několik desítek otisků prstů a bez ohledu na to, kolik modelů existuje, budou "rozbité"; ❷ Otisky prstů lze snadno detekovat nebo odstranit; Vyprší po doladění, destilaci a sloučení modelu; ❸ Ve skutečnosti nemůže podporovat sledování autorských práv a komercializaci modelů s otevřeným zdrojovým kódem. OML vkládá skryté páry klíč-odpověď do "okrajových oblastí", kde se model běžně nepoužívá, takže model se při normálním použití chová úplně stejně, ale pouze osoba, která zadá konkrétní klíč, může spustit jedinečnou odpověď k ověření pravosti modelu. Při testování v reálném světě společnost Sentient vložila 24 576 nezávislých párů kláves-odezva do vyladěné verze Lamy-8-8B a zůstala stabilní a přetrvala i po doladění, destilaci nebo smíchání. OML vytváří modely "podepsané" jako lidská díla. To otevírá řadu důležitých možností: - Sledovatelnost modelu: Zjistěte, odkud model pochází a kdo jej vytrénoval. - Licencování a komercializace: Modely s otevřeným zdrojovým kódem mohou také dosáhnout legální distribuce a licencování za poplatek. - Ochrana proti padělání a manipulaci: Zabraňte ostatním v plagiátorství a dolaďování a vydávání se za originál. Důvěryhodné auditování: Můžete zjistit, zda model patří vydavateli v reálném světě. Stručně řečeno, OML je prvním krokem k tomu, aby modely umělé inteligence získaly "mechanismus ochrany autorských práv" a je základním kamenem komunitně řízené open-source AGI společnosti Sentient.