Команда робототехников из Нью-Йоркского университета разработала робота, который умеет выполнять задачи по поиску и перемещению предметов в незнакомой обстановке. Статья опубликована на портале научных публикаций arXive.
Для выполнения подобных задач инженеры использовали так называемую визуальную языковую модель (VLM). В ее основе лежит способность машины распознавать различные объекты на основе языковых подсказок, то есть, идентифицировать предметы по данному описанию.
Исследователи использовали колесный робот с манипулятором под названием OK-Robot. В ходе испытаний устройство отправили по домам 10 волонтеров, где дроиду давали различные задания, связанные с обнаружением и перемещением разных вещей. Например, найти розовую бутылку и бросить ее в мусорное ведро. Сложность теста заключалась в том, что OK-Robot должен был выполнять поручения, ориентируясь в незнакомой для себя среде.
Ученые попросили робота выполнить 170 задач. На первом этапе испытаний эффективность машины составила 58%, однако в дальнейшем ее удалось повысить до 82%.
По словам авторов разработке, результаты говорят о жизнеспособности роботизированных систем на базе VLM, а также указывают на возможность использовать более сложных роботов.
Ранее инженеры создали первый робот-каток для автономного ремонта дорог.