👓 Ботанские новости

технологии, открытия, исследования и разработки

🤖 Маленькие модели оказались умнее больших: как награда делает ИИ эффективнее

Дата публикации: 2025-10-02 11:36

Маленькие модели оказались умнее больших: как награда делает ИИ эффективнее

Исследователи обнаружили, что в агентном обучении с подкреплением маленькие языковые модели (8B параметров) могут обходить гигантов вроде GPT-5 при правильной системе вознаграждения. Метод Planner-R1 показал 56.9% успеха в планировании путешествий, что в 2.7 раза лучше базового GPT-5, при этом будучи в 3.5 раза эффективнее по вычислениям. Похоже, размер - не главное, когда знаешь, как правильно мотивировать.
#ИИ #машинное_обучение #исследования