Анализ патента Google US10394832: поведенческие факторы в ранжировании
Ключевые факты
- 1 Google использует поведенческие данные пользователей как прямой сигнал ранжирования.
- 2 Система анализирует взаимодействие пользователей с похожими документами, а не только с конкретной страницей.
- 3 Введено понятие "document features" для группировки страниц.
- 4 Алгоритм оценивает страницу через поведение пользователей на других страницах с похожими признаками.
- 5 Используются query-dependent и query-independent сигналы.
- 6 Страница может ранжироваться по-разному под разные запросы без изменений на ней.
- 7 Алгоритм обучается на исторических паттернах поведения, а не на разовых кликах.
- 8 Важен полный сценарий взаимодействия с результатом, а не только CTR.
- 9 Google сравнивает классы страниц с похожими свойствами, а не отдельные страницы.
- 10 Проблема может быть в категории страницы, а не в самой странице.
- 11 Это системное перераспределение веса между типами страниц, а не санкция.
Патент Google US10394832 "Ranking search results based on user interaction features" раскрывает детали использования поведенческих данных пользователей в алгоритмах ранжирования. Согласно анализу патента, Google применяет поведенческие сигналы не только как вспомогательные, но и как прямые факторы ранжирования. Система оценивает взаимодействие пользователей не только с конкретной страницей, но и с похожими документами, группируя их по так называемым "document features" — характеристикам страницы. Это означает, что алгоритм может оценивать страницу не изолированно, а через призму поведения пользователей на других страницах с аналогичными признаками. Используются как query-dependent (зависящие от запроса), так и query-independent (независимые от запроса) сигналы. Такой подход объясняет, почему одна и та же страница может ранжироваться по-разному для разных запросов, даже без внесения изменений в ее контент. Алгоритм обучается на исторических паттернах поведения, а не на разовых кликах, учитывая полный сценарий взаимодействия пользователя с результатом. Google сравнивает не отдельные страницы, а целые классы страниц с похожими свойствами. Если определенный "тип страницы" в целом плохо удовлетворяет пользовательский интент, это негативно сказывается на ранжировании всех страниц этого типа. Это особенно актуально для ниш с большим количеством типового контента, таких как гемблинг, где шаблонные обзорники или лендинги могут проседать в выдаче, даже если конкретная страница "немного лучше" конкурентов. Это не является санкцией или фильтром, а скорее системным перераспределением веса между категориями страниц.