Китайская компания DeepSeek презентовала свою новейшую большую языковую модель DeepSeek-V4, сообщает ТАСС. Как отмечает разработчик, модель уже доступна для пользователей в открытом доступе, а сама новинка была анонсирована через социальную сеть WeChat.
DeepSeek-V4 отличается тем, что базируется на архитектуре MoE (Mixture-of-Experts), что позволяет системе задействовать только часть своих возможностей для более эффективной работы. Модель вышла в двух версиях: pro с 1,6 трлн параметров и flash, где их 284 млрд. Разработчики подчеркивают, что DeepSeek-V4 опережает всех китайских конкурентов по объему знаний и скорости генерации текста.
Контекстное окно DeepSeek-V4 поддерживает до 1 млн токенов – это сопоставимо с текстом 15-20 романов. Компания напоминает, что ранее, в январе 2025 года, их модель уже привлекла внимание рынка, показав производительность на уровне ведущих американских решений, но при этом обойдясь разработчикам заметно дешевле.
Сфера искусственного интеллекта стремительно развивается в Китае. Ключевыми игроками здесь стали Alibaba, Baidu, ByteDance, DeepSeek, MiniMax, Moonshot AI, Tencent и Zhipu AI. По данным на 2025 год, число пользователей генеративного ИИ в КНР достигло 602 млн, что составляет 42,8% жителей страны. За прошедший год аудитория таких сервисов в Китае увеличилась на 141,7% по сравнению с 2024 годом.
Как писала газета ВЗГЛЯД, ранее компания DeepSeek представила экспериментальную версию искусственного интеллекта DeepSeek-V3.2-Exp. Предыдущие модели разработчика вызвали настоящий фурор в технологическом мире благодаря высокой производительности и низкой стоимости. Успех китайского чат-бота обвалил акции американских корпораций на фондовых рынках.