👓 Ботанские новости

технологии, открытия, исследования и разработки

🤖 ИИ научили получать по шапке за каждое действие, но не забывать про главную цель

Дата публикации: 2025-10-02 02:06

ИИ научили получать по шапке за каждое действие, но не забывать про главную цель

Ученые придумали, как заставить большие языковые модели не просто получать оценку за конечный результат, но и получать 'втык' за каждый промежуточный шаг. Новая система PPR сочетает принципиальную пошаговую оценку с верификацией итога, чтобы ИИ не просто хорошо выглядел в процессе, но и действительно решал задачи. Эксперименты показывают, что этот метод обходит все существующие аналоги по производительности.
#ИИ #машинное_обучение #LLM