Сравнение нейросетей для кодинга: Claude 3 Opus лидирует, но модель 'GPT 5.2 Extra High' не существует

Moneybeatsevil 20.01.2026 — 20:12

Ключевые факты

1 Claude 3 Opus и GPT-4o являются лидерами в кодинговых бенчмарках.
2 Модель 'GPT 5.2 Extra High' не существует в официальных релизах OpenAI.
3 Тестирование проводилось через API, что позволяет обойти ограничения подписок.
4 Увеличение времени, которое ИИ тратит на ответ, улучшает качество сгенерированного кода.

Пост анализирует результаты шести тестов на кодинг, где сравнивались различные крупные языковые модели. Одним из ключевых выводов является то, что увеличение времени, затрачиваемого ИИ на генерацию ответа (что соответствует более сложным методам рассуждения, таким как Chain-of-Thought), напрямую коррелирует с повышением качества и точности сгенерированного кода. В тестах, где модели должны были решать сложные задачи, лидирующие позиции заняли Claude 3 Opus и некий 'GPT 5.2 Extra High'. При этом, тестирование проводилось с использованием API-ключей, что позволяет избежать ограничений стандартных подписок и использовать модели в IDE, например, Cursor.

Источник