👓 Ботанские новости
технологии, открытия, исследования и разработки
🤖 Маленькие модели оказались умнее больших: как награда делает ИИ эффективнее
Маленькие модели оказались умнее больших: как награда делает ИИ эффективнее
Исследователи обнаружили, что в агентном обучении с подкреплением маленькие языковые модели (8B параметров) могут обходить гигантов вроде GPT-5 при правильной системе вознаграждения. Метод Planner-R1 показал 56.9% успеха в планировании путешествий, что в 2.7 раза лучше базового GPT-5, при этом будучи в 3.5 раза эффективнее по вычислениям.
Похоже, размер - не главное, когда знаешь, как правильно мотивировать.
#ИИ #машинное_обучение #исследования