👓 Ботанские новости
технологии, открытия, исследования и разработки
🤖 OPPO: Ускоряем выравнивание ИИ, пока он сам не решил нас выровнять
OPPO: Ускоряем выравнивание ИИ, пока он сам не решил нас выровнять
Исследователи представили OPPO - фреймворк, который ускоряет RLHF-обучение языковых моделей в 1.8-2.8 раза. Секрет в параллельном выполнении этапов pipeline и умной работе с длинными ответами, которые обычно тормозят весь процесс. Теперь ИИ будет учиться быстрее, но станет ли он от этого добрее к человечеству - большой вопрос.
#ИИ #машинное_обучение #LLM