Robotika terus menabrak dinding yang sama. RL tugas tunggal berfungsi, tapi... itu tidak menskalakan hingga ratusan tugas atau perwujudan baru. Makalah baru ini terlihat seperti langkah nyata untuk memperbaikinya. Tim memperkenalkan MMBench, tolok ukur dengan 200 tugas di banyak domain dan robot, dan Newt, model dunia berkondisi bahasa yang dilatih secara online di semua 200 tugas sekaligus. Ide sederhana di balik Newt: Model belajar dari demo untuk mendapatkan sebelumnya yang tepat Ini melatih banyak tugas melalui interaksi online Ini menggunakan bahasa untuk membumikan tujuan Ini beradaptasi dengan cepat saat tugas baru muncul Apa yang menonjol bagi saya: ✅ Satu model dilatih pada 200 tugas secara bersamaan ✅ Kontrol terkondisi bahasa untuk kedua status dan RGB ✅ Efisiensi data yang lebih baik daripada baseline yang kuat ✅ Kontrol loop terbuka yang kuat ✅ Adaptasi cepat terhadap tugas dan perwujudan baru ✅ Rilis penuh 200 pos pemeriksaan, 4000 demo, kode, dan benchmark Ini adalah dorongan yang baik menuju kontrol umum alih-alih satu model per tugas. Jika Anda menginginkan makalah lengkap: Halaman proyek: —-...