Новый алгоритм машинного обучения с подкреплением SOLAR

Новый алгоритм машинного обучения с подкреплением SOLAR

Исследователи из лаборатории искусственного интеллекта университета Беркли разработали новый алгоритм обучения с подкреплением SOLAR, который работает напрямую с изображениями с обычной камеры.

Представьте себе робота, который пытается научиться собирать блоки лего и двигать объекты, используя только изображение с недорогой камеры. Робот должен обучиться новым навыкам в кратчайшие сроки в целях экономии и из соображений безопасности. SOLAR – новый алгоритм, использующий машинное обучение с подкреплением (reinforcement learning, RL) для обучения подобным навыкам. Ученые из университета Беркли успешно применили этот алгоритм на роботехническом манипуляторе Sawyer, обучив его собирать пирамидку из лего и ставить чашку на подставку.

В машинном обучении с подкреплением, агент (например, робот) учится на основе собственного опыта путем проб и ошибок, стремясь минимизировать целевую функцию, которая описывает поставленную задачу. За последние годы с помощью этой методики было решено много интересных и сложных задач, например, искусственный интеллект научился играть в Mario.

Вы можете ознакомиться с оригинальной научной публикацией.

robomeow

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *