👓 Ботанские новости
технологии, открытия, исследования и разработки
🤖 DeepSeek‑V3.2 открыт: расширяем границы открытых больших языковых моделей
DeepSeek‑V3.2 открыт: расширяем границы открытых больших языковых моделей
DeepSeek представил V3.2, который, судя по всему, нашёл способ заставить огромные нейросети пить чай – высокая вычислительная эффективность в паре с агентной мощью. Новый механизм Sparse Attention (DSA) сохраняет точность даже на длинных контекстах, при этом резко сокращая сложность вычислений. Ну что, пора прощаться с вечными «потерянными» токенами – как говорят, «лучше один хороший токен, чем тысяча пустых запросов».
#искусственный #модели #opensource