Новость

Главная
Новости

Китайский стартап DeepSeek выпустил обновление открытой модели V3 с улучшенными навыками программирования

вторник, 25 марта 2025 г.

Китайская компания DeepSeek, известная своими достижениями в области искусственного интеллекта, представила обновление своей открытой модели V3 под названием V3-0324. Как сообщает Bloomberg, новая версия демонстрирует значительные улучшения в программировании, устанавливая новые стандарты точности и эффективности среди доступных ИИ-моделей с открытым исходным кодом. Обновление, выпущенное 25 марта 2025 года, уже вызвало ажиотаж в технологическом сообществе благодаря своим передовым возможностям.

Согласно официальным данным с сайта DeepSeek, модель V3-0324 получила значительный прирост производительности в ключевых областях. В частности, улучшены способности к логическим рассуждениям и генерации кода. Тесты показывают впечатляющий прогресс:

- В бенчмарке MMLU-Pro результат вырос с 75.9 до 81.2 (+5.3 балла);

- В GPQA — с 59.1 до 68.4 (+9.3 балла);

- В математическом тесте AIME — с 39.6 до 59.4 (+19.8 балла);

- В LiveCodeBench, оценивающем навыки программирования, показатель увеличился с 39.2 до 49.2 (+10 баллов).

Особое внимание в обновлении уделено оптимизации навыков разработки веб-интерфейсов, что делает модель особенно полезной для создания сложных программных решений. DeepSeek V3-0324 построена на архитектуре Mixture-of-Experts (MoE) с общим числом параметров в 671 миллиард, из которых 37 миллиардов активируются для обработки каждого токена. Это обеспечивает высокую производительность при сохранении эффективности вывода. Модель также поддерживает контекстное окно длиной до 128 тысяч токенов, что позволяет ей обрабатывать большие объемы данных.

Дополнительные подробности, найденные в постах на X, подтверждают успех обновления. Пользователи отмечают, что V3-0324 в тесте Aider, оценивающем способности редактирования кода, достигла результата в 55%, что ставит её на второе место среди моделей без функции рассуждений, уступая лишь Claude Sonnet 3.7. Это значительный шаг вперед по сравнению с предыдущей версией модели, что подчеркивает стремление DeepSeek удерживать лидерство в области открытых ИИ-решений.

Обновление V3-0324 уже доступно для скачивания и использования в самых разных проектах, включая коммерческие, благодаря открытой лицензии. Эксперты считают, что такие улучшения могут усилить конкуренцию с западными моделями, такими как GPT-4o или Claude 3.5, особенно учитывая доступность и производительность DeepSeek. Однако некоторые наблюдатели, ссылаясь на публикации вроде статьи на Habr, отмечают, что модель все еще сталкивается с ограничениями, связанными с государственной цензурой в Китае, что может повлиять на её привлекательность для международных пользователей.

DeepSeek продолжает активно развивать свои технологии, и выпуск V3-0324 подтверждает её амбиции стать ключевым игроком на глобальном рынке искусственного интеллекта.

Александр

Fullstack-разработчик в Москве

Профессиональная разработка веб-приложений на Node.js с использованием современных frontend и backend фреймворков. Создание, продвижение, поддержка и обслуживание сайтов. Эффективно, прибыльно.