Наша найновіша робота, яка оцінює сучасну VLM та їхню ефективність для довгострокової домашньої діяльності в роботизованому навчанні, використовуючи середовище 👇 BEHAVIOR benchmark.