Автоматизация контент-генерации: анализ конкурентов и создание плана статьи
Ключевые факты
- 1 Система генерирует поисковые запросы на основе оффера.
- 2 DataForSEO API используется для получения топ-10 конкурентов из Google.
- 3 HTML-код страниц конкурентов скачивается и анализируется на наличие ошибок и редиректов.
- 4 Gemini извлекает из страниц конкурентов цены, информацию о доставке, trust-сигналы и schema-разметку.
- 5 Семантический анализ включает извлечение сущностей и триплетов с помощью Gemini.
- 6 Векторизация текста выполняется моделью OpenAI text-embedding-3-small.
- 7 Система определяет главные и второстепенные темы на основе частоты упоминания сущностей у конкурентов.
- 8 Gemini формирует под-интенты пользователей и создает детализированный план статьи.
Процесс генерации контента начинается с создания поисковых запросов на основе названия оффера. Затем с помощью DataForSEO API извлекается топ-10 страниц конкурентов из выдачи Google. После удаления крупных сайтов и проверки URL на ошибки, система скачивает HTML-код страниц. Извлеченные данные обрабатываются: текст очищается, а Gemini используется для поиска цен, информации о доставке, trust-сигналов и schema-разметки. Далее следует семантический анализ, включающий извлечение сущностей и триплетов с помощью Gemini, а также векторизацию текста через модель OpenAI text-embedding-3-small для определения смысловой близости терминов. На основе частоты упоминания сущностей у конкурентов строится граф, выявляющий главные и второстепенные темы. Gemini также анализирует термины и заголовки конкурентов для определения под-интентов пользователей. Вся собранная информация передается Gemini для создания структурированного плана статьи с указанием разделов, сущностей и триплетов.