Anthropic выложила старое тестовое задание, которое Claude 3.5 Opus решает за 2 часа
Ключевые факты
- 1 Anthropic выложила старое тестовое задание на GitHub.
- 2 Задание было отозвано, так как Claude 3.5 Opus решает его менее чем за 2 часа.
- 3 Кандидаты, превзошедшие результат Claude 3.5 Opus за 12 часов, могут претендовать на собеседование.
Компания Anthropic, разработчик ИИ-модели Claude, выложила в открытый доступ свое оригинальное тестовое задание, которое ранее использовалось для оценки кандидатов на технические позиции. Задание было снято с использования, поскольку их собственная модель Claude 3.5 Opus продемонстрировала способность решать его за время, не превышающее двух часов. Это событие подчеркивает быстрый прогресс в возможностях больших языковых моделей (LLM) в области оптимизации кода. В условиях задания, опубликованного на GitHub, указано, что кандидаты, которые смогут превзойти производительность Claude 3.5 Opus в течение 12 часов, могут рассчитывать на обсуждение возможности прохождения собеседования в компании.