Как ProgramBench и ИИ-агенты изменят разработку ПО

Текущие проблемы с актуальностью и полнотой документации в разработке программного обеспечения могут быть решены с помощью развивающихся ИИ-агентов. Эти агенты способны внедрить подход "spec-driven development", где функциональность детально описывается перед имплементацией, что позволяет разработчикам сосредоточиться на логике и валидируемых деталях. Автор видит огромный потенциал для масштабирования подхода ProgramBench в двух ключевых направлениях. Во-первых, это решение задач LLM-агентами с получением обратной связи, что будет прокачивать их долгосрочное планирование и архитектурные навыки, поскольку им придется учиться использовать внешнюю память для обработки больших объемов кода. Во-вторых, это автоматическое создание спецификаций. ИИ-агенты смогут генерировать детальные описания функциональности даже при отсутствии исходного кода, продумывая пользовательские пути, декомпозируя фичи и анализируя конкурентов. Это позволит агентам самостоятельно декомпозировать задачи после нескольких верхнеуровневых вопросов. Такой подход открывает целую новую область окружений для тренировки агентов, аналогично тому, как SWE-Bench повлиял на работу с pull-запросами на GitHub. Компании будут заинтересованы в этом с экономической точки зрения. Дарио Амодей, соучредитель Anthropic, уже высказывал мнение о возможном замыкании цикла Software Engineering с помощью ИИ, включая архитектуру и планирование. Это означает, что модели будут учиться продуктовому мышлению, проработке сценариев, тестов и имплементации спецификаций, делая их инструментом агентов, а не только людей.

Как ProgramBench и ИИ-агенты изменят разработку ПО

Ключевые факты