Trước đây, tôi đã giới thiệu với các bạn về bốn bài báo của @SentientAGI được @NeurIPSConf chấp nhận, trong đó có OML 1.0 là có giá trị nhất khi lên sân khấu chính. OML (Giấy phép Mô hình Mở / Lớp Đánh dấu Quyền sở hữu) là một công nghệ "đánh dấu chống giả" cho các mô hình ngôn ngữ lớn. Nó có thể nhúng hàng ngàn "dấu vân tay" vào bên trong mô hình mà không ảnh hưởng đến hiệu suất của mô hình — giống như việc giấu nhiều dấu hiệu vô hình trong mô hình, để chứng minh danh tính và nguồn gốc của mô hình. Các phương pháp dấu vân tay mô hình trước đây đều có nhiều hạn chế: ❶ Tối đa chỉ có thể nhúng vài chục dấu vân tay, nhiều hơn thì mô hình sẽ "hỏng"; ❷ Dấu vân tay dễ bị phát hiện hoặc xóa; sau khi tinh chỉnh, chưng cất, hoặc hợp nhất mô hình sẽ không còn hiệu lực; ❸ Không thể thực sự hỗ trợ theo dõi bản quyền và thương mại hóa mô hình mã nguồn mở. OML sẽ nhúng các khóa vô hình - phản hồi vào "khu vực biên" không thường được sử dụng của mô hình — cho phép mô hình hoạt động hoàn toàn nhất quán trong quá trình sử dụng bình thường, nhưng chỉ những người nhập khóa cụ thể mới có thể kích hoạt câu trả lời độc quyền, từ đó xác thực tính xác thực của mô hình. Trong thử nghiệm thực tế, Sentient đã nhúng 24,576 cặp khóa - phản hồi độc lập vào phiên bản tinh chỉnh của Llama-3.1-8B, vẫn giữ được hiệu suất ổn định, và vẫn tồn tại sau khi tinh chỉnh, chưng cất hoặc kết hợp. OML khiến mô hình có "chữ ký" giống như tác phẩm của con người. Điều này mang lại nhiều khả năng quan trọng: - Truy xuất nguồn gốc mô hình: biết một mô hình đến từ đâu, ai đã đào tạo nó. - Cấp phép và thương mại hóa: mô hình mã nguồn mở cũng có thể thực hiện phân phối hợp pháp và cấp phép thu phí. - Chống giả mạo và chống sửa đổi: ngăn chặn việc người khác sao chép, tinh chỉnh rồi giả mạo là tác phẩm gốc. - Kiểm toán đáng tin cậy: có thể kiểm tra trong môi trường thực tế xem mô hình có thuộc về một bên phát hành nào đó hay không. Nói một cách đơn giản, OML là bước đầu tiên để các mô hình AI có "cơ chế bảo vệ bản quyền", và cũng là nền tảng mà Sentient có thể thực hiện AGI mã nguồn mở do cộng đồng thúc đẩy.