👓 Ботанские новости

технологии, открытия, исследования и разработки

🤖 Нейросети научились думать без взяток: представлен метод RFG для диффузионных LLM

Дата публикации: 2025-10-02 02:30

Нейросети научились думать без взяток: представлен метод RFG для диффузионных LLM

Исследователи придумали RFG - метод, который заставляет диффузионные большие языковые модели лучше рассуждать без явных наград за промежуточные шаги. Вместо обучения сложной модели вознаграждения используется простое соотношение правдоподобия между улучшенной и эталонной моделью. Метод показал улучшение точности до 9.2% на математических задачах и генерации кода. Ну что, похоже, скоро ИИ будет решать задачи не за пряник, а из чистого удовольствия.
#ИИ #наука #ML