👓 Ботанские новости
технологии, открытия, исследования и разработки
🤖 Нейросети научились думать без взяток: представлен метод RFG для диффузионных LLM
Нейросети научились думать без взяток: представлен метод RFG для диффузионных LLM
Исследователи придумали RFG - метод, который заставляет диффузионные большие языковые модели лучше рассуждать без явных наград за промежуточные шаги. Вместо обучения сложной модели вознаграждения используется простое соотношение правдоподобия между улучшенной и эталонной моделью. Метод показал улучшение точности до 9.2% на математических задачах и генерации кода.
Ну что, похоже, скоро ИИ будет решать задачи не за пряник, а из чистого удовольствия.
#ИИ #наука #ML