В декабре 2024 года DeepSeek обновила модель DeepSeek-V2.5-1210
среда, 11 декабря 2024 г.
DeepSeek-V2.5:
В сентябре 2024 года DeepSeek объединила модели DeepSeek-V2-Chat и DeepSeek-Coder-V2 в единую модель DeepSeek-V2.5. Новая модель показала значительное улучшение в общей производительности, включая задачи написания текста, кодирования и логического вывода. В частности, модель достигла 89% точности в тесте HumanEval и 41% в LiveCodeBench.
DeepSeek-R1-Lite-Preview:
В ноябре 2024 года DeepSeek выпустила предварительную версию модели DeepSeek-R1-Lite-Preview, которая показала впечатляющие результаты в сложных задачах логического вывода, включая математические соревнования и программирование. Модель использует подход "глубокого размышления", который включает длинные цепочки рассуждений и самопроверку, что позволяет ей достигать высокой точности в решении сложных задач.
Улучшения в математике и кодировании:
В декабре 2024 года DeepSeek обновила модель DeepSeek-V2.5-1210, которая показала улучшения в математических задачах (82.8% точности в MATH-500) и кодировании (34.38% точности в LiveCodeBench). Также были оптимизированы функции загрузки файлов и суммирования веб-страниц.
Открытый исходный код и API:
DeepSeek продолжает поддерживать философию открытого исходного кода, и модель DeepSeek-V2.5 была выпущена на платформе HuggingFace. Компания также объявила, что полностью откроет исходный код модели DeepSeek-R1 и предоставит API для разработчиков.
Технологии и инфраструктура:
DeepSeek разработала инфраструктуру Fire-Flyer AI-HPC, которая использует 10,000 GPU Nvidia A100 для обучения моделей. Это позволяет снизить затраты на 50% и энергопотребление на 40% по сравнению с традиционными решениями.
Эти обновления демонстрируют стремительное развитие DeepSeek в области искусственного интеллекта, особенно в области логического вывода, кодирования и математики. Компания продолжает вносить значительный вклад в индустрию AI, предлагая мощные инструменты и подходы, которые могут конкурировать с ведущими мировыми игроками.
Александр
Fullstack-разработчик в МосквеПрофессиональная разработка веб-приложений на Node.js с использованием современных frontend и backend фреймворков. Создание, продвижение, поддержка и обслуживание сайтов. Эффективно, прибыльно.