Эволюция RAG: от однократного запроса к агентному RAG

Notjohnmu 22.05.2026 — 15:33

Ключевые факты

1 RAG — это архитектура, которую Google развивал с 2020 года, а не реакция на ChatGPT.
2 Google SGE был переименован в AI Overviews и является воплощением RAG.
3 Линейный конвейер RAG с однократным выполнением запроса устарел.
4 Основные платформы ИИ-поиска перешли на архитектуру агентного RAG.
5 Агентный RAG включает планирование, использование инструментов, многошаговую итерацию и рефлексию.
6 Один пользовательский запрос в агентном RAG может запускать от 5 до 20 внутренних подзапросов.

Изначально Майк Кинг предсказал, что RAG (Retrieval-Augmented Generation) станет будущим поиска, и это подтвердилось с появлением таких систем, как Google SGE (теперь AI Overviews). RAG не был реакцией на ChatGPT, а развивался Google с момента публикации статьи REALM в августе 2020 года. Традиционный конвейер RAG, включающий однократное выполнение запроса, поиск, извлечение фрагментов и генерацию ответа с помощью LLM, устарел. Современные платформы ИИ-поиска перешли на архитектуру агентного RAG, которая теперь является стандартом. Агентный RAG отличается четырьмя ключевыми свойствами: планированием, использованием инструментов, многошаговой итерацией и рефлексией. Это означает, что поиск информации больше не является единичным действием. Один пользовательский запрос может инициировать от 5 до 20 внутренних подзапросов, которые координируются агентом. Агент оценивает промежуточные результаты и формирует окончательный ответ только после того, как убедится в достаточности доказательной базы.

Источник