Победа AI в AHC058: Агент Sakana AI впервые обошел 804 гроссмейстера в реальном времени
Ключевые факты
- 1 Агент ALE от Sakana AI занял первое место на AtCoder Heuristic Contest 058 (AHC058).
- 2 Это первая победа AI в истории соревнований по оптимизации в реальном времени (4 часа на задачу) наравне с людьми.
- 3 Агент обошел 804 участника, включая топовых грандмастеров.
- 4 Решение было основано на итеративном улучшении алгоритмов с помощью LLM (GPT-5.2 и Gemini 3 Pro), превзойдя стандартные подходы, такие как имитация отжига.
- 5 Операционные расходы на API составили примерно $1,300 за 4700 вызовов моделей.
На недавнем AtCoder Heuristic Contest 058 (AHC058), сфокусированном на оптимизационных задачах без четкого верного решения, агент ALE (Algorithmic Learning Engine) от Sakana AI занял первое место, опередив 804 человека, включая ведущих грандмастеров. Это исторический прецедент: впервые AI-система победила в соревновании по оптимизации, работая в тех же условиях, что и люди — 4 часа на решение задачи. Техническое решение ALE оказалось сложнее, чем предполагали организаторы, которые ожидали увидеть стандартные жадные алгоритмы или имитацию отжига. Агент использовал продвинутый подход, основанный на итеративном улучшении алгоритмов с помощью мощных LLM, включая GPT-5.2 и Gemini 3 Pro. Организаторы признали, что агент нашел алгоритмические пути, которые они сами не предусмотрели. Общие операционные расходы на генерацию финального решения составили около $1,300, потребовав примерно 4700 вызовов этих моделей. 💡 Фактчекинг: Подтверждено через официальные блоги Sakana AI и AtCoder. Агент ALE действительно выиграл AHC058, используя LLM для генерации и уточнения алгоритмов, что позволило ему найти нетривиальные решения. Подтверждена стоимость API-вызовов в размере $1300 и использование моделей GPT-5.2 и Gemini 3 Pro.