DeepSeek запускает новые ИИ-модели V4 Pro и V4 Flash
Ключевые факты
- 1 DeepSeek выпустил модели V4 Pro (1.6T параметров) и V4 Flash (284B параметров).
- 2 Обе модели поддерживают контекст до 1 млн токенов.
- 3 Модели доступны для локального запуска через Hugging Face.
- 4 V4 Pro конкурирует с ведущими ИИ-моделями, особенно в коде и математике.
- 5 V4 Flash предлагает баланс скорости и эффективности.
- 6 Tencent и Alibaba рассматривают инвестиции в DeepSeek.
- 7 Заявленная оценка DeepSeek в $20+ млрд долларов США не подтверждается.
Китайская компания DeepSeek представила свои новейшие модели искусственного интеллекта: V4 Pro и V4 Flash. Модель V4 Pro обладает 1.6 триллионами параметров, а V4 Flash — 284 миллиардами. Обе модели отличаются поддержкой обширного контекстного окна до 1 миллиона токенов, что позволяет им обрабатывать большие объемы информации. Важной особенностью является возможность локального запуска через Hugging Face, что обеспечивает повышенную приватность, гибкость в кастомизации и контроль над расходами. По заявлениям разработчиков, V4 Pro демонстрирует производительность, сопоставимую с ведущими мировыми моделями, такими как Claude 3 Opus и GPT-4 Turbo, особенно выделяясь в задачах, связанных с кодированием и математикой. V4 Flash, будучи более легкой и экономичной, сохраняет высокую эффективность в задачах рассуждения и агентных функциях. На фоне этих анонсов, китайские технологические гиганты Tencent и Alibaba проявляют интерес к инвестициям в DeepSeek, что подчеркивает растущую конкуренцию на мировом рынке ИИ.