Google AI представили новый метод оценки для обучения роботов

Google AI представили новый метод оценки искусственного интеллекта DeformableRavens с открытым исходным кодом для ускорения работы роботов-манипуляторов при сборке деформируемых объектов.   

Роботы-манипуляторы на основе ИИ используются для сборки изделий на производствах. Появившиеся за последние несколько лет типы захватов позволили роботам управлять объектами произвольных размеров с жёсткими границами. При этом проблема манипулирования деформируемыми объектами не решена. 

Для манипуляции предметами роботу необходимо знать их конфигурацию. Структура твёрдых предметов остаётся неподвижной при взаимодействии, что упрощает работу ИИ. У таких предметов, как ткань, неподвижна только одна точка, остальные смещаются при взаимодействии. Алгоритмам трудно предсказывать динамику деформируемых объектов, когда речь идёт о многоэтапных задачах. Предыдущие разработки позволили роботам манипулировать деформируемыми одномерными и двумерными объектами, но мало изучали вопросы многоэтапного взаимодействия с объёмными деформируемыми структурами. 

Новому методу предшествовала разработанная исследователями архитектура Transporter Networks. С её помощью роботы манипулируют жёсткими предметами и учитывают пространственные характеристики объекта и среды благодаря вводным данным в виде изображений. ИИ ориентируется и принимает решения по пространственным перемещениям на основе визуальных данных. 

14 мая Google AI представила новый метод оценки с открытым кодом DeformableRavens, основанный на Transporter Networks. К набору данных из оригинальной архитектуры добавили изображения цели взаимодействия, которые совместили с изображениями текущей среды и объектов. Чтобы достичь необходимого результата, робот должен поместить объект как можно ближе к указанной на изображении конфигурации. 

DeformableRavens включает в себя 12 задач по взаимодействию с одномерными (кабель), двумерными (ткань) и трёхмерными (мешок) деформируемыми объектами. Для оценки работоспособности модели положение объектов задавалось случайным образом. За счёт этого код обучает ИИ сложным пространственным взаимодействиям.  

Во время испытаний исследователи столкнулись с проблемой выпадения предметов из мешка. Робот располагал кубик на внешней поверхности сумки вместо необходимого расположения, или некорректно определял позицию, из-за чего кубик выпадал из сумки. Когда кубик попадал на внешнюю поверхность сумки, робот останавливался и не мог выполнять дальнейшие действия. В будущих работах исследователи собираются добавить в тест модификацию последовательностей благодаря которым робот будет распознавать и исправлять собственные ошибки. 

По словам исследователей, предложенный ими метод с использованием изображений в качестве вводных данных эффективнее, чем подходы на основе прогнозирования положений точек объекта при перемещении или истинного положения в пространстве. После доработки и испытаний на реальных физических объектах исследователи планируют внедрить DeformableRavens на производства с целью повышения скорости и качества работы автоматизированных устройств.     

Источник