AI & LLM
22
Вес: Значительный

Anthropic, вероятно, тестирует сверхбыстрый режим Claude Opus с 6-кратным увеличением стоимости

Seeallochnaya 08.02.2026 — 02:25

Ключевые факты

  • 1 Скорость генерации Opus 4.6-Fast предположительно достигает 100 токенов в секунду.
  • 2 Цена API за использование быстрой версии, по слухам, в 6 раз выше стандартной.
  • 3 Увеличение скорости достигается за счет уменьшения размера батча, что снижает общую пропускную способность GPU.
  • 4 Технический компромисс между скоростью и пропускной способностью подтверждается отраслевыми бенчмарками.

Пост описывает предполагаемый запуск новой версии модели Anthropic, названной "Opus 4.6-Fast", которая обеспечивает 2.5-кратное ускорение генерации, достигая примерно 100 токенов в секунду. Эта функция, по слухам, доступна только через API и не включена в стандартную подписку Claude Code. Анализ показывает, что ускорение, вероятно, достигается за счет уменьшения размера батча (batch size) — количества одновременных запросов, обрабатываемых GPU. Уменьшение батча снижает задержку для отдельного пользователя, но резко уменьшает общую пропускную способность GPU. Для компенсации падения выручки с единицы оборудования Anthropic, предположительно, повышает цену в 6 раз, сохраняя маржинальность. Эта техническая механика подтверждается отраслевыми данными: например, Semianalysis InferenceMAX показывает, что увеличение скорости генерации DeepSeek R1 с 100 до 250 токенов в секунду приводит к 6-кратному падению общей пропускной способности GPU (с 6000 до 1000 токенов в секунду на GPU).

Источник