Телеметрия Discover SDK: подавление предшествует ранжированию и механика ленты в реальном времени
Ключевые факты
- 1 Подавление контента в Google Discover происходит до его ранжирования.
- 2 Система использует 9-этапный конвейер и бинарную проверку isCollectionHiddenFromEmberFeed.
- 3 Свайп одной статьи может глобально заблокировать весь домен издателя.
- 4 DocFingerprint обеспечивает кросс-девайс дедупликацию и предотвращает повторное появление подавленного контента.
- 5 Для hero-карточек требуется изображение шириной не менее 1200px.
- 6 Мета-теги notranslate или nopagereadaloud блокируют прием URL.
- 7 Свежесть является ключевым фактором пессимизации ранжирования.
- 8 Google News Publisher Center и Web Stories обходят стандартные механизмы ранжирования.
- 9 Лента Discover работает как live stream через gRPC-соединения с динамическим управлением карточками.
- 10 Система проводит около 150 одновременных серверных экспериментов за сессию.
Классические представления о ранжировании в Google Discover, где доминируют модели прогнозируемого CTR, не отражают полной картины. Телеметрия SDK на стороне клиента раскрывает сложный 9-этапный конвейер, в котором подавление контента явно происходит до его ранжирования. Это включает бинарную проверку isCollectionHiddenFromEmberFeed на этапе Collection Gate, которая может глобально заблокировать весь домен издателя, если пользователь смахнет одну статью, без эквивалентного механизма для усиления видимости.Система использует DocFingerprint для кросс-девайс дедупликации, записывая перманентные логи для смахнутых URL, чтобы предотвратить повторное появление подавленного или "перегретого" контента. SDK извлекает шесть тегов Open Graph для метаданных, используя жестко закодированные резервные варианты при их отсутствии. Рендеринг карточки критически зависит от наличия изображения, проходя через 5-уровневую иерархию поиска. Для hero-карточек требуется минимальная ширина изображения 1200px. Включение мета-тегов notranslate или nopagereadaloud немедленно блокирует прием URL.Свежесть контента является ключевым фактором пессимизации ранжирования, где статьи быстро теряют вес, переходя из категории "1-7 дней" в "15-30 дней", после чего отслеживается непрерывное алгоритмическое затухание. Отдельные механизмы обходят стандартные ограничения: регистрация домена в Google News Publisher Center инжектирует подтип WPAS, форсируя отдельную классификацию. Web Stories также функционируют на изолированном конвейере STAMP с выделенными местами и движком прелоада, избегая прямой конкуренции со стандартными статьями. Лента Discover работает как live stream через gRPC-соединения, позволяя серверу динамически управлять карточками в реальном времени, включая их инжект, изменение порядка или удаление, без необходимости обновления пользователем. Телеметрия также выявляет около 150 одновременных серверных экспериментов за сессию и алгоритмы контрфактуального тестирования, такие как background_refresh_rug_pull_count, отслеживающий случаи отзыва уже доставленных карточек. Контент категоризируется по 13 кластерам, с mustntmiss как строгой очередью приоритетов.