Anthropic выложила старое тестовое задание, которое Claude 3.5 Opus решает за 2 часа

Seeallochnaya 21.01.2026 — 15:16

Ключевые факты

1 Anthropic выложила старое тестовое задание на GitHub.
2 Задание было отозвано, так как Claude 3.5 Opus решает его менее чем за 2 часа.
3 Кандидаты, превзошедшие результат Claude 3.5 Opus за 12 часов, могут претендовать на собеседование.

Компания Anthropic, разработчик ИИ-модели Claude, выложила в открытый доступ свое оригинальное тестовое задание, которое ранее использовалось для оценки кандидатов на технические позиции. Задание было снято с использования, поскольку их собственная модель Claude 3.5 Opus продемонстрировала способность решать его за время, не превышающее двух часов. Это событие подчеркивает быстрый прогресс в возможностях больших языковых моделей (LLM) в области оптимизации кода. В условиях задания, опубликованного на GitHub, указано, что кандидаты, которые смогут превзойти производительность Claude 3.5 Opus в течение 12 часов, могут рассчитывать на обсуждение возможности прохождения собеседования в компании.

Источник