<Dữ liệu là khả năng cạnh tranh, không phải mô hình> Cốt lõi của ngành công nghiệp AI không còn là máy tính hay mô hình, mà là 'dữ liệu chất lượng cao'. Cũng giống như nền văn minh nhân loại đã được tiến lên một tầm cao mới thông qua dầu mỏ trong quá khứ, AI cũng cần một 'nhiên liệu' mới để tiến xa hơn. Cũng giống như trước và sau Thế chiến II, khi dầu mỏ được sử dụng làm nguồn năng lượng và vật liệu, công nghiệp hóa tiến triển nhanh chóng. Bây giờ, ai và cách họ thu thập và xử lý dữ liệu sẽ quyết định sáng kiến trong kỷ nguyên AI. Elon Musk cũng đã nói điều này trong năm nay. "Chúng tôi đã cạn kiệt tất cả tổng kiến thức tích lũy của con người trong việc học trí tuệ nhân tạo." Đúng là các mô hình như GPT đã phát triển nhanh chóng, thu thập dữ liệu công khai như trang web, sách, mã và hình ảnh. Nhưng bây giờ, chúng ta cần một dạng dữ liệu mới có bản quyền hoặc hoàn toàn không tồn tại. Ví dụ, trong các lĩnh vực như xe tự hành và robot, cần phải vượt ra ngoài văn bản đơn giản và cần dữ liệu phức tạp dựa trên đa cảm biến kết hợp camera, radar, lidar, v.v., cũng như dữ liệu trường hợp được thu thập trong môi trường thực, không tồn tại trên web. Vấn đề lớn hơn không phải là về công nghệ mà là 'làm thế nào để kết hợp nó tốt'. Hàng nghìn người cần thu thập, gắn nhãn và cập nhật dữ liệu trên toàn cầu, và thật khó để xử lý sự đa dạng và quy mô này bằng cách tiếp cận tập trung vào quá khứ. Do đó, ngành công nghiệp AI ngày càng đồng ý rằng phương pháp phi tập trung là câu trả lời. Đây là nơi 'Poseidon (@psdnai)' xuất hiện. Poseidon không chỉ là một kho dữ liệu mà còn là một cơ sở hạ tầng cung cấp dữ liệu thực, xác minh nó và tinh chỉnh nó thành một bộ dữ liệu đào tạo có thể được sử dụng mà không phải lo lắng về bản quyền. Để sử dụng một phép so sánh, Poseidon là một 'nhà máy lọc dầu'. Nó lấy dữ liệu thô và tinh chỉnh nó thành nhiên liệu mà AI có thể sử dụng để học tập. Toàn bộ quá trình diễn ra qua lại trên @StoryProtocol. Nó ghi lại một cách minh bạch ai đã cung cấp dữ liệu và ai đã viết dữ liệu đó trong những điều kiện nào trên chuỗi. Những người cung cấp dữ liệu được thưởng xứng đáng và các nhà phát triển AI có thể tự tin sử dụng dữ liệu. Tôi nghĩ Poseidon, sẽ đổi mới ở lớp dữ liệu, không phải GPU hoặc mô hình, có thể là ví dụ điển hình nhất về việc áp dụng công nghệ Web3 vào ngành công nghiệp Web2.
Chris Dixon
Chris Dixon23 thg 7, 2025
Vui mừng thông báo rằng chúng tôi đang dẫn đầu vòng hạt giống trị giá 15 triệu đô la ở Poseidon, được ấp ủ bởi @StoryProtocol và đang xây dựng một lớp dữ liệu phi tập trung để điều phối cung và cầu cho dữ liệu đào tạo AI. Thế hệ đầu tiên của các mô hình nền tảng AI được đào tạo trên dữ liệu dường như là một tài nguyên không giới hạn hiệu quả. Ngày nay, các tài nguyên dễ tiếp cận nhất như sách và trang web hầu như đã cạn kiệt và dữ liệu đã trở thành một yếu tố hạn chế trong sự tiến bộ của AI. Phần lớn dữ liệu còn lại hiện nay có chất lượng thấp hơn hoặc bị giới hạn do các biện pháp bảo vệ IP. Đối với một số ứng dụng AI hứa hẹn nhất - trên robot, xe tự hành và trí tuệ không gian - dữ liệu thậm chí còn chưa tồn tại. Giờ đây, các hệ thống này cần các loại thông tin hoàn toàn mới: đa giác quan, phong phú trong các trường hợp biên, được thu thập trong tự nhiên. Tất cả dữ liệu thế giới vật lý này sẽ đến từ đâu? Thách thức không chỉ là kỹ thuật - đó là vấn đề phối hợp. Hàng nghìn người đóng góp phải làm việc cùng nhau theo cách phân tán để tìm nguồn, gắn nhãn và duy trì dữ liệu vật lý mà AI thế hệ tiếp theo cần. Chúng tôi tin rằng không có cách tiếp cận tập trung nào có thể điều phối hiệu quả việc tạo và quản lý dữ liệu cần thiết ở mức độ quy mô và sự đa dạng cần thiết. Một cách tiếp cận phi tập trung có thể giải quyết vấn đề này. @psdnai cho phép các nhà cung cấp thu thập dữ liệu mà các công ty AI cần, đồng thời đảm bảo an toàn IP thông qua giấy phép IP có thể lập trình của Story. Điều này tìm cách thiết lập một nền tảng kinh tế mới cho internet, nơi những người tạo ra dữ liệu được đền bù công bằng khi giúp các công ty AI cung cấp năng lượng cho thế hệ hệ thống thông minh tiếp theo. Nhóm của Poseidon, do Nhà khoa học trưởng và Đồng sáng lập @SPChinchali dẫn đầu, mang đến chuyên môn sâu về cơ sở hạ tầng AI. Sandeep là giáo sư tại UT Austin chuyên về AI, robot và hệ thống phân tán, với bằng tiến sĩ của Stanford về AI và hệ thống phân tán. Trưởng bộ phận Sản phẩm và Đồng sáng lập @sarickshah đã dành một thập kỷ làm kỹ sư máy học, mở rộng quy mô các sản phẩm AI cho các doanh nghiệp lớn trong các dịch vụ tài chính, viễn thông và chăm sóc sức khỏe. Chúng tôi rất vui mừng được hỗ trợ Poseidon trong công việc giải quyết một trong những nút thắt cổ chai quan trọng nhất trong phát triển AI.
2,87K