Эволюция RAG: от однократного запроса к агентному RAG
Ключевые факты
- 1 RAG — это архитектура, которую Google развивал с 2020 года, а не реакция на ChatGPT.
- 2 Google SGE был переименован в AI Overviews и является воплощением RAG.
- 3 Линейный конвейер RAG с однократным выполнением запроса устарел.
- 4 Основные платформы ИИ-поиска перешли на архитектуру агентного RAG.
- 5 Агентный RAG включает планирование, использование инструментов, многошаговую итерацию и рефлексию.
- 6 Один пользовательский запрос в агентном RAG может запускать от 5 до 20 внутренних подзапросов.
Изначально Майк Кинг предсказал, что RAG (Retrieval-Augmented Generation) станет будущим поиска, и это подтвердилось с появлением таких систем, как Google SGE (теперь AI Overviews). RAG не был реакцией на ChatGPT, а развивался Google с момента публикации статьи REALM в августе 2020 года. Традиционный конвейер RAG, включающий однократное выполнение запроса, поиск, извлечение фрагментов и генерацию ответа с помощью LLM, устарел. Современные платформы ИИ-поиска перешли на архитектуру агентного RAG, которая теперь является стандартом. Агентный RAG отличается четырьмя ключевыми свойствами: планированием, использованием инструментов, многошаговой итерацией и рефлексией. Это означает, что поиск информации больше не является единичным действием. Один пользовательский запрос может инициировать от 5 до 20 внутренних подзапросов, которые координируются агентом. Агент оценивает промежуточные результаты и формирует окончательный ответ только после того, как убедится в достаточности доказательной базы.