Почему страницы сайта выпали из выдачи: быстрый способ узнать

Есть очень простой метод, позволяющий практически мгновенно понять, почему выпала из выдачи та или иная страница сайта (попала в «Просканировано, но не проиндексировано» в «GSC»).
Быстрый анализ выпавших страниц
Собственно, тут 2 самых распространённых случая:
- Первый — негодный контент;
- Второй — нелепая структура сайта.
Мы разбирали всё это раньше.
Для оценки контента, берём любой визуализатор n-грамм (что такое n-граммы). Их море, самых разнообразных. Например, вот это расширение для «Хрома» или вот эта примочка Андрея Симагина (там триграммы можно анализировать).
Дальше — смотрим на 3- или 4-граммы из контента выпавшей страницы. Потом сравниваем с 3-4-граммами из контента сайтов из ТОП 1-2. И если дело в контенте — вы сразу увидите:
- 1. Мощнейшее расхождение n-грамм вашего контента и лидеров ТОПа;
- 2. Недооптимизацию контента по нужным n-граммам (этим крайне грешит «генерёнка» всякими ИИ-ботами, на чём и «палится» перед «Гуглом»).
Если содержание и плотность n-грамм примерно соответствуют лидерам, то дело — в недополучении «ссылочного сока»: проверяем уровень вложенности этой страницы.
Если уровень вложенности не особо велик, то идём по пунктам, что расписывал выше (первая ссылка в тексте).
Наличие значительного количества страниц типа «Просканировано, но не проиндексировано» — явный признак болезни сайта. А их рост в период «апа» свидетельствует о значительных проблемах, которые, наверняка, приведут к падению трафика.
Автор: DrMax.
Ещё с блога:
Написано Март 23, 2025
Комментарии:
Раймонд:
Как быть если картинки WEBP массово попадают под: просканировано но не проиндексированно ?
Jack:
я бы забил, у самого так. однако webp яша жрет, а гугл в сирч консоль не показывает
DrMax:
Для начала проверьте http заголовок.
См сюды.
Далее, посмотрите как картинки лежат - как просто картинки или как href элемент ссылки. Или как кусок css из div.
Ну а так во всем википедия виновата - они вкрячили такие себе страницы, вот например: https://en.m.wikipedia.org/wiki/File:Footprint_chart_.webp
и теперь гугля пытается предсказать что там у вас - картинка или html и соответственно пихает её ( если это не просто картинка, а вставка в кусок кода) в просканировано - непроиндексировано.
Это, кстати, отжирает бюджет сканирования достаточно мощно.
mildaysun:
Вот поэтому я теперь никогда в рекомендациях не пишу webp картинки. Jpg через оптимизаторы прогнать и нормал
DrMax:
если просто картинка, без всяких ссылок (или дивов или css ) - то нормально съедает всегда. Лаззи лоад кстати тоже может подглючивать вроде.
Aleksei:
помню как димимурыч бомбил на него)
Раймонд:
Вот как раз лаззи и есть. Но вся эта фигня началась где то в середине 2024 …. + еще сайт фигурировал в гугл дискавери… есть предположение что из-за глюка с webp он и выпал от туда. Так же 99% сайтов которые в дискавери имеют обычние jpg картинки
Barbados:
ой эта тема уже лет 5 мусолится
Антон:
Тут недавно один известный сайт менял домен, делали переезд, в яндекс все нормально, а в Гугле после переезда 90% ушли в просканированные, но не проиндексированные.
|