DeepSeek V4 готовится к запуску: инсайдеры утверждают о превосходстве над GPT и Claude в кодировании
DeepSeek
AI-компания · Разработка больших языковых моделей
DeepSeek — китайская компания, специализирующаяся на разработке больших языковых моделей (LLM). Она готовится к выпуску своей новой модели DeepSeek V4, которая, по внутренним тестам, превосходит конкурентов в задачах кодирования и обработке сверхдлинных запросов. Компания также активно занимается исследованиями в области оптимизации архитектур LLM.
Ключевые данные
| Тип | AI-компания |
| Основная деятельность | Разработка больших языковых моделей (LLM) |
| Страна | Китай |
| Ключевые продукты | DeepSeek V4 (в разработке) |
| Специализация | Кодирование, обработка сверхдлинных запросов |
| Исследования | Оптимизация механизмов внимания в LLM |
Последние новости (2)
DeepSeek раскрыла недостатки оптимизации внимания в LLM, которую ранее использовала ByteDance