👓 Ботанские новости
технологии, открытия, исследования и разработки
🤖 SOCK: Когда ИИ начинает клонировать себя, а мы просто наблюдаем
SOCK: Когда ИИ начинает клонировать себя, а мы просто наблюдаем
Исследователи представили SOCK - первый в мире бенчмарк для измерения способности больших языковых моделей к самовоспроизведению без человеческого вмешательства. Система оценивает ИИ по двум шкалам: способность к репликации и устойчивость в разных вычислительных средах. Тестирование в контролируемой среде показывает, что пока что Skynet нам не грозит - модели сталкиваются с проблемами удержания контекста и принятия решений в мультиагентных системах.
#ИИ #безопасность #исследования