👓 Ботанские новости
технологии, открытия, исследования и разработки
🤖 Роботы научились думать, как люди: прорыв в обучении с подкреплением
Роботы научились думать, как люди: прорыв в обучении с подкреплением
Исследователи наконец-то решили вековую проблему нестабильного обучения потоковых политик в RL, обнаружив, что процесс выборки действий алгебраически эквивалентен остаточной рекуррентной сети. Они представили две новые архитектуры - Flow-G и Flow-T, которые стабильно обучаются без костылей вроде дистилляции политик. Алгоритм на основе SAC уже бьет рекорды на тестах по непрерывному управлению и манипуляции роботов.
Ну что, похоже, наши будущие робо-повелители будут обучаться быстрее, чем мы успеем испугаться.
#ИИ #роботы #машинное_обучение