Исследователи обучили ИИ познавать мир путем поиска спрятанных вещей

Исследователи AI2 заявили, что обучили агентов ИИ искать спрятанные в смоделированном доме предметы. В ходе игры под названием «Тайник» агенты ищут помидоры, буханки хлеба, чашки и ножи.

Агентов обучали с подкреплением. Изначально у них не было никакого представления о трехмерной визуальной среде. Агенты совершали случайные действия, например, тянули за ручку ящика или бросали предметы в случайные места. Тогда исследователи организовали игру, в ходе которой агентам нужно было соревноваться друг с другом и одновременно извлекать уроки. К примеру, если ищущий агент не нашел спрятанный помидор, то тот, кто прятал его, понимал, что выбрал хорошее место.

«Для нас вопрос заключался в следующем: может ли агент узнавать самые простые вещи об объектах и ​​их атрибутах, взаимодействуя с ними?» — отмечает Анируддха Кембхави, менеджер по исследованиям группы компьютерного зрения AI2.

После того, как агенты AI2 овладели игрой, исследователи провели тесты, призванные проверить их понимание мира. Сначала они протестировали агентов на компьютерных изображениях комнат, попросив их предсказать такие характеристики, как глубину резкости и геометрию объектов. По сравнению с моделью, обученной на ImageNet, агенты AI2 показали аналогичные и иногда даже более высокие результаты.

Агентов также протестировали на фотографиях реальных комнат. В этот раз их результаты оказались несколько ниже, чем у модели, обученной на ImageNet.

Однако исследователей, скорее, интересовало, усвоили ли агенты ИИ определенные базовые элементы понимания мироустройства. Они обнаружили, что модели понимают принципы постоянства объектов и могут ранжировать изображения в зависимости от того, сколько свободного места они содержат.

В 2019 году игровой процесс уже использовали в проекте OpenAI. Тогда агенты искали стратегии, которые, как предполагалось, были невозможными в игровой среде. Игорь Мордач, один из исследователей OpenAI, теперь отметил, что важность исследования AI2 именно в том, что агенты фокусируются на «внутренних представлениях о мире».

Другие рецензенты материала также отмечают важность того, что работа бросает вызов традиционному способу пассивного обучения систем пассивно, а также объединяет идеи из различных дисциплин (психологии и машинного обучения).

Исследователи AI2 говорят, что динамическое понимание агентами того, как объекты действуют во времени и пространстве, в будущем может быть полезно для создания роботов. Сами они не собираются проводить эксперименты с реальными роботами. Соавтор исследования Рузбех Мотаги говорит, что существует серьезная проблема безопасности, так как агенты часто делают случайные вещи.

Ранее о важности обучения ИИ «человеческим» навыкам говорил исследователь искусственного интеллекта Франсуа Шоле, инженер-программист в Google, создавший библиотеку для нейросетей Keras. В своей статье «Об измерении Интеллекта» Шоле отмечает, что для реального прогресса исследователям нужно перестать смотреть на популярные бенчмарки, такие, как видеоигры или настольные игры, а стоит начать думать о развитии у ИИ навыков обобщения и адаптации.

Источник