
Alibaba представила Qwen3-235B-A22B-Instruct-2507 — обновлённый ИИ с улучшенным качеством
вторник, 22 июля 2025 г.
22 июля 2025 года Alibaba Cloud анонсировала выпуск обновлённой модели искусственного интеллекта Qwen3-235B-A22B-Instruct-2507. Эта версия флагманской модели Qwen3, построенной на архитектуре Mixture of Experts (MoE), отказалась от гибридного режима мышления, сосредоточившись на раздельном обучении для повышения качества ответов. С 235 миллиардами параметров, из которых активно используется 22 миллиарда, модель демонстрирует выдающиеся результаты в программировании, математике и обработке сложных текстов, укрепляя позиции Alibaba в глобальной гонке ИИ.
Что нового в Qwen3-235B-A22B-Instruct-2507?
- Отказ от гибридного режима: В отличие от базовой версии Qwen3-235B-A22B, новая модель разделяет «рефлексивный» и «нерефлексивный» режимы. Это позволило улучшить точность и стабильность ответов, особенно в задачах, требующих глубокого анализа, таких как программирование и математические вычисления.
- Улучшенное качество ответов: Обновление Instruct-2507 повысило производительность модели в тестах, таких как AIME (математика), ZebraLogic (логические задачи) и Codeforces (программирование). Например, модель достигла 70.3 балла на AIME25, обойдя GPT-4o (26.7) и Claude 4 Opus.
- Поддержка 119 языков: Qwen3-235B-A22B-Instruct-2507 сохраняет многоязычные возможности, включая русский язык, что делает её универсальной для международных приложений.
- Контекстное окно до 256 тысяч токенов: Увеличенный контекст позволяет обрабатывать большие документы, сложные диалоги и многоэтапные задачи, превосходя возможности GPT-4o в два раза.
- Открытый доступ: Как и предшественники, модель распространяется под лицензией Apache 2.0, что обеспечивает бесплатный доступ для коммерческого и исследовательского использования через Hugging Face, GitHub, ModelScope и Kaggle.
Технические улучшения
Обновление Instruct-2507 стало результатом доработки модели на основе данных, собранных из 36 триллионов токенов, включая веб-источники, PDF-документы и синтетические наборы данных, созданные с помощью Qwen2.5-Math и Qwen2.5-Coder. Четырёхэтапный процесс дообучения позволил модели лучше справляться с задачами, связанными с анализом знаний, программированием и обработкой текстов. Раздельное обучение для разных режимов повысило точность и снизило вычислительные затраты, сохранив при этом высокую производительность.
Превосходство в тестах
Qwen3-235B-A22B-Instruct-2507 демонстрирует значительное преимущество в ключевых бенчмарках:
- AIME25 (математика): 70.3 балла против 26.7 у GPT-4o.
- ZebraLogic (логические задачи): 95.0, опережая Claude 4 Opus и DeepSeek V3.
- Codeforces (программирование): Высокая точность в решении задач, конкурируя с DeepSeek R1 и Google Gemini 2.5 Pro.
Эти результаты подчёркивают способность модели справляться с задачами, требующими как аналитического мышления, так и быстрой обработки информации.
Применение и возможности
Qwen3-235B-A22B-Instruct-2507 подходит для широкого круга задач:
- Программирование: Создание, отладка и оптимизация кода.
- Анализ данных: Обработка больших текстовых документов, включая научные статьи и юридические тексты.
- Многоязычные приложения: Перевод, генерация контента и поддержка диалогов на 119 языках.
- Агентские функции: Интеграция с внешними инструментами через платформы, такие как vLLM, SGLang, Ollama и Qwen-Agent.
Модель доступна через Qwen Chat Web (chat.qwen.ai) и мобильное приложение, что упрощает её использование как для разработчиков, так и для конечных пользователей.
Почему это важно?
Обновление Qwen3-235B-A22B-Instruct-2507 подчёркивает стремление Alibaba к созданию универсальных и доступных ИИ-решений. Отказ от гибридного режима в пользу специализированного обучения демонстрирует фокус на качестве и эффективности. Модель не только конкурирует с западными аналогами, такими как OpenAI o1 и Google Gemini, но и предлагает открытый доступ, что делает её привлекательной для глобального сообщества разработчиков и исследователей.
Qwen3-235B-A22B-Instruct-2507 — это шаг вперёд в эволюции ИИ от Alibaba. Улучшенное качество, поддержка длинного контекста и открытый доступ делают её мощным инструментом для программистов, исследователей и бизнеса. Попробуйте модель на Qwen Chat Web или скачайте на Hugging Face, чтобы оценить её возможности!

Александр
Fullstack-разработчик в МосквеПрофессиональная разработка веб-приложений на Node.js с использованием современных frontend и backend фреймворков. Создание, продвижение, поддержка и обслуживание сайтов. Эффективно, прибыльно.