Новая версия роботизированного мини-гепарда от Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института в США научилась очень быстро бегать. В реальной среде такой бег осваивается с большими сложностями из-за опасности столкновений, падений, наличия скользких поверхностей и т.д., однако инженерам MIT удалось обойти все эти ограничения за счет того, что их робот обучался самостоятельно, используя нейронные сети на симуляторе, где 100-дневный опыт пробежек по пересеченной местности удалось вместить лишь в три часа компьютерного времени, сообщает сайт MIT News.
Ранее в MIT для четвероногих роботов Cheetah 3 и Mini Cheetah использовали гибкие беговые контроллеры, разрабатываемые инженерами-людьми, которые сначала анализировали физику передвижений, затем строили соответствующие модели и выстраивали особую иерархию специализированных контроллеров, чтобы обеспечить балансировку и бег роботов. Точно так же разрабатывался и более крупный и более известный робот Spot от Boston Dynamics.
“Мы применили теперь подход, с помощью которого поведение робота корректируется на основе смоделированного опыта, и этот подход позволяет успешно применять изучаемые модели поведения в реальном мире, — объясняют аспирант MIT Габриэль Марголис и постдокторант Ян Гэ. — Ландшафты, с которыми робот сталкивается в симуляторе, позволяют обучить его навыкам, необходимым в реальном мире. При настоящем беге наш контроллер выбирает и применяет соответствующий навык в режиме реального времени”.
Динамику быстро бегающего робота затруднительно моделировать чисто аналитическими методами, поскольку робот должен научиться очень быстро реагировать на изменения в окружающей среде, например, когда он оказывается на скользком покрытии во время бега по траве. Если робот движется медленно, то наличие снега и льда обычно не является проблемой — это все сравнимо с поведением неспешно и осторожно двигающегося пешехода. Однако основная проблема заключается в том, что передвигаться по произвольной местности так, как если бы робот всегда шел по скользкому льду, очень неэффективно — тратится дополнительная энергия и теряется время. В реальности люди свободно бегают по траве и замедляются, оказываясь на льду, приспосабливаясь к новым условиям. Обучение роботов аналогичным способностям требует обеспечения быстрой и правильной идентификации изменений местности и немедленной адаптации к этим изменениям, чтобы предотвратить возможное падение.