
«Alibaba представила ИИ Qwen с обработкой 1 млн токенов и генерацией мультимедиа: революция в мире искусственного интеллекта»
понедельник, 27 января 2025 г.
Китайский технологический гигант Alibaba анонсировал масштабное обновление своей ИИ-платформы Qwen, представив модели с поддержкой обработки до 1 миллиона токенов — рекордный показатель для открытых языковых моделей. Это эквивалентно анализу 10 полноценных романов или 150 часов аудиозаписей за один запрос.
Ключевые нововведения:
Мультимодальные возможности
Qwen теперь генерирует не только текст, но и изображения, видео (до 5 секунд за 10 минут), а также анализирует документы и таблицы. Например, по запросу «футуристический город ночью» модель создаёт детализированные визуальные образы23. Однако некоторые пользователи отмечают, что качество генерации изображений пока уступает лидерам рынка, таким как Flux, из-за артефактов вроде «трёхруких фигур».
Сверхдлинный контекст
Модели Qwen2.5-7B-Instruct-1M и Qwen2.5-14B-Instruct-1M используют разреженное внимание (sparse attention), что ускоряет обработку в 3–7 раз по сравнению с классическими методами. В тестах на поиск скрытых чисел в тексте длиной 1 млн токенов точность достигает 100%.
Веб-поиск в реальном времени
Платформа Qwen Chat интегрировала функцию веб-поиска: пользователи могут получать актуальные данные, например, о лучших сериалах 2025 года, со ссылками на источники.
Открытый исходный код
Alibaba выпустила более 100 моделей семейства Qwen2.5 с параметрами от 0,5 млрд до 72 млрд, включая специализированные версии для математики (Qwen2.5-Math), программирования (Qwen2.5-Coder) и анализа видео (Qwen2.5-VL).
Конкурентные преимущества:
- Qwen2.5-Turbo превзошёл GPT-4o-mini в тестах RULER (93.1 против 91.6).
- Видеомодель Qwen2.5-VL анализирует ролики длительностью до часа и определяет события с точностью до секунды.
- Стоимость обработки 1 млн токенов остаётся на уровне ¥0.3, что в 3.6 раза дешевле аналогов.
Критика и вызовы:
Несмотря на прорыв в длине контекста, эксперты отмечают, что расширение окна не всегда решает задачи лучше, чем RAG-системы с внешними базами данных4. Кроме того, генерация изображений пока требует доработки для конкуренции с SOTA-моделями.
Доступность:
Модели доступны через Qwen Chat, Hugging Face и ModelScope. Для разработчиков Alibaba предоставила оптимизированные фреймворки на базе vLLM, упрощающие развёртывание.
С выходом Qwen2.5 Alibaba укрепляет позиции Китая в гонке ИИ-технологий, предлагая открытые решения, которые бросают вызов OpenAI и другим западным компаниям. Однако качество мультимодальной генерации остаётся зоной роста для команды разработчиков.

Александр
Fullstack-разработчик в МосквеПрофессиональная разработка веб-приложений на Node.js с использованием современных frontend и backend фреймворков. Создание, продвижение, поддержка и обслуживание сайтов. Эффективно, прибыльно.