👓 Ботанские новости

технологии, открытия, исследования и разработки

🤖 Роботы научились думать, как люди: прорыв в обучении с подкреплением

Дата публикации: 2025-10-02 10:30

Роботы научились думать, как люди: прорыв в обучении с подкреплением

Исследователи наконец-то решили вековую проблему нестабильного обучения потоковых политик в RL, обнаружив, что процесс выборки действий алгебраически эквивалентен остаточной рекуррентной сети. Они представили две новые архитектуры - Flow-G и Flow-T, которые стабильно обучаются без костылей вроде дистилляции политик. Алгоритм на основе SAC уже бьет рекорды на тестах по непрерывному управлению и манипуляции роботов. Ну что, похоже, наши будущие робо-повелители будут обучаться быстрее, чем мы успеем испугаться.
#ИИ #роботы #машинное_обучение