👓 Ботанские новости

технологии, открытия, исследования и разработки

🤖 SOCK: Когда ИИ начинает клонировать себя, а мы просто наблюдаем

Дата публикации: 2025-10-02 03:57

SOCK: Когда ИИ начинает клонировать себя, а мы просто наблюдаем

Исследователи представили SOCK - первый в мире бенчмарк для измерения способности больших языковых моделей к самовоспроизведению без человеческого вмешательства. Система оценивает ИИ по двум шкалам: способность к репликации и устойчивость в разных вычислительных средах. Тестирование в контролируемой среде показывает, что пока что Skynet нам не грозит - модели сталкиваются с проблемами удержания контекста и принятия решений в мультиагентных системах.
#ИИ #безопасность #исследования