👓 Ботанские новости

технологии, открытия, исследования и разработки

🤖 OPPO: Ускоряем выравнивание ИИ, пока он сам не решил нас выровнять

Дата публикации: 2025-10-02 10:51

OPPO: Ускоряем выравнивание ИИ, пока он сам не решил нас выровнять

Исследователи представили OPPO - фреймворк, который ускоряет RLHF-обучение языковых моделей в 1.8-2.8 раза. Секрет в параллельном выполнении этапов pipeline и умной работе с длинными ответами, которые обычно тормозят весь процесс. Теперь ИИ будет учиться быстрее, но станет ли он от этого добрее к человечеству - большой вопрос.
#ИИ #машинное_обучение #LLM