Джон Мюллер прокомментировал лимит Googlebot на сканирование 2 МБ и дал совет по размещению контента
Ключевые факты
- 1 Googlebot сканирует максимум 2 МБ файла (64 МБ для PDF).
- 2 Контент, превышающий 2 МБ, не индексируется.
- 3 Медианный размер HTML на мобильных устройствах составляет 33 КБ.
- 4 Важный контент должен быть размещен в начале страницы для гарантированной индексации.
Google обновил документацию, уточнив, что Googlebot сканирует только первые 2 МБ поддерживаемого файла. Исключение составляют PDF-файлы, для которых лимит составляет 64 МБ. Мюллер подчеркнул, что этот лимит редко достигается, ссылаясь на данные HTTP Archive. Согласно этим данным, медианный размер HTML на мобильных устройствах составляет всего 33 КБ, а 90% страниц имеют размер менее 151 КБ. Если страница превышает лимит в 2 МБ, оставшийся контент просто игнорируется при индексации. Мюллер рекомендовал, чтобы важная для SEO информация всегда находилась в «разумном месте», а не в самом конце, чтобы гарантировать ее индексацию и видимость для пользователя. Он отметил, что никто не будет читать текст объемом в 2 МБ (эквивалент 1000 страниц) в поисках информации, расположенной в конце.