Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Bài báo MIT này đã khiến tôi choáng váng 🤯
Bài báo nói về "ARC" và nó hoàn toàn thay đổi cách tôi nhìn nhận về tiêu chuẩn đánh giá.
Các nhà nghiên cứu không coi ARC như một câu đố logic chút nào. Họ coi mỗi nhiệm vụ như một sự biến đổi hình ảnh.
Lưới vào → lưới ra. Không có gì phức tạp hơn thế.
Họ đã xây dựng một Vision Transformer nhỏ, đào tạo từ đầu trên tập dữ liệu nhỏ của ARC, và sử dụng một mẹo canvas đơn giản để đặt mỗi ví dụ như một hình ảnh.
Sau đó, họ thêm các thay đổi về quy mô, dịch chuyển, và các ưu tiên hình ảnh cơ bản mà bạn sẽ thấy trong công việc thị giác máy tính cổ điển.
Chỉ vậy thôi.
Không có chuỗi suy nghĩ, không có gợi ý, không có mẹo biểu tượng thông minh.
Chỉ là một mô hình nhìn vào các pixel và học cách mà các hình dạng di chuyển, lật, phát triển, sụp đổ, hoặc chuyển giao.
Phần thú vị?
Mô hình nhỏ này đạt 54,5% một mình và 60,4% khi kết hợp với một U-Net.
Đó là khoảng hiệu suất trung bình của con người với một mô hình vừa vặn trong kích thước của một ứng dụng di động nhỏ.
Thấy ARC được giải quyết theo cách này khiến toàn bộ tiêu chuẩn đánh giá cảm thấy khác biệt.
Các nhiệm vụ đột nhiên trông giống như các ánh xạ hình ảnh thay vì các quy tắc ẩn. Các nhiệm vụ phản chiếu thực sự trông giống như các phản chiếu.
Các nhiệm vụ đối xứng trông giống như đối xứng. Các nhiệm vụ trọng lực trông giống như các mảnh "rơi" thẳng xuống canvas.
Tôi thực sự vẫn đang xử lý điều này.
Đây có thể là kết quả ARC thực tế nhất mà tôi đã đọc trong nhiều năm và nó đến từ việc coi tiêu chuẩn đánh giá một cách nghiêm túc nhất mà bất kỳ ai từng có.

3,42K
Các nhà xây dựng AI mạnh mẽ nhất 👇
1. n8n
2. LangChain
3. CrewAI
4. OpenAI’s Agent Builder
Bạn đang sử dụng cái nào ngay bây giờ?
Tôi đã thử tất cả chúng trong các dự án thực tế, và n8n luôn xuất hiện như công cụ mạnh nhất trên bàn. Nó xử lý công việc thực sự. Công việc lộn xộn. Công việc chạm vào các hệ thống thực thay vì chỉ sống trong một khung chat.
Đây là lý do khiến tôi gắn bó với nó:
n8n cho phép tôi xây dựng các tác nhân mở email, đọc chúng, trích xuất dữ liệu hữu ích và gửi nó đến nơi cần đến. Nó cho phép tôi kết nối những tác nhân đó vào CRM, bảng tính, cơ sở dữ liệu, Slack, Notion, API và bất cứ thứ gì mà quy trình làm việc của tôi phụ thuộc vào.
Tôi có thể xếp chồng các bước, xây dựng vòng lặp, thử lại các nhiệm vụ và theo dõi mọi thứ chạy với sự minh bạch hoàn toàn.
LangChain mang lại cho tôi sự linh hoạt, nhưng các quy trình làm việc nhanh chóng trở nên rối rắm.
CrewAI làm cho các thử nghiệm ban đầu trở nên dễ dàng, nhưng các quy trình phức tạp đã vượt qua giới hạn của nó.
OpenAI’s Agent Builder có tiềm năng, nhưng các rào cản xuất hiện nhanh chóng khi bạn cần kiểm soát sâu hơn.
n8n xử lý toàn bộ quy trình từ lý luận đến hành động mà không buộc tôi phải xây dựng một backend hoặc kết nối các công cụ với nhau bằng tay. Nó khiến tác nhân cảm thấy như một nhà điều hành thực sự thay vì một chatbot với nhiều bước thêm vào.
Sự chuyển mình thực sự đến khi tôi thấy cách mà tôi có thể biến một quy trình làm việc đơn lẻ thành một cái gì đó có thể lặp lại. Không phải là một bản demo. Một hệ thống hoạt động. Một cái gì đó mà một doanh nghiệp có thể dựa vào mỗi ngày.
Nếu bạn đang xây dựng các tác nhân trong năm nay, nền tảng bạn chọn sẽ định hình mọi thứ.
Vì vậy, tôi rất tò mò bạn đang xây dựng với cái nào và điều gì đã khiến bạn chọn nó.

4,26K
Hàng đầu
Thứ hạng
Yêu thích


