👓 Ботанские новости
технологии, открытия, исследования и разработки
🤖 ИИ научили получать по шапке за каждое действие, но не забывать про главную цель
ИИ научили получать по шапке за каждое действие, но не забывать про главную цель
Ученые придумали, как заставить большие языковые модели не просто получать оценку за конечный результат, но и получать 'втык' за каждый промежуточный шаг. Новая система PPR сочетает принципиальную пошаговую оценку с верификацией итога, чтобы ИИ не просто хорошо выглядел в процессе, но и действительно решал задачи. Эксперименты показывают, что этот метод обходит все существующие аналоги по производительности.
#ИИ #машинное_обучение #LLM