3 горизонтальные линии, бургер
3 горизонтальные линии, бургер
3 горизонтальные линии, бургер
3 горизонтальные линии, бургер

3 горизонтальные линии, бургер
Удалить все
ЗАГРУЗКА ...

Содержание



    Страницы пагинации попали в индекс поисковика, что делать?

    Часы
    02.03.2025
    /
    Часы
    23.03.2026
    /
    Часы
    7 минут
    Глазик
    764
    Сердечки
    0
    Соединённые точки
    0
    Соединённые точки
    0
    Соединённые точки
    0

    Вступление

    Представьте себе, делаете вы себе сайт, никого не трогаете. У вас в индексе порядком 1000 страниц, а на следующий день, проснувшись и открыв Google Search Console, вы видите это:
    Большую часть времени у меня в индексе было что-то около 1000 страниц: 80 статей, может ещё 100 страниц с инструментами, 100 определений и 100 ответов на вопросы. Остальные это страницы от пагинатора, плюс страницы фильтрации.
    На моём сайте страницы фильтрации можно получить используя теги и/или время создания. То есть сама по себе система очень проста, но как видишь даже такая фильтрация может привести к захламлению индекса.
    Я начал беспокоится о "некачественных страницах" с моей стороны. Ведь, кому будут интересны страницы пагинации, это ведь просто сборка имеющихся статей на сайте. И для начала разберём что это такое некачественные страницы и как пагинация и фильтрация связаны с их появлением на сайте.

    Про некачественные(малоценные) страницы

    Начну с определения, ибо дальше в статье, данный термин - некачественная страница будет довольно часто появляться.
    Некачественная (малоценная) страница — это страница, которую поисковые машины как Яндекс, Google или Bing считают бесполезными из-за дублирования, не уникальности, малого объема текста или технических ошибок.
    В моём случае, малоценными страницами можно считать страницы пагинации и фильтров. Их тысячи и они, по правде говоря, проходные, т.е. их основная роль это быть проводником к более ценным страницам.
    Так, долгое время, количество проиндексированных страниц держалось на уровне 1000 страниц + ещё 10000 страниц с несовпадающим каноникалом или которые просто отсутствуют. Но после последнего обновления пагинатора, гугл смог найти куда больше страниц и проиндексировать их (8000 проиндексировано и 30000 с проблемами). Но, как видно, проблема с дубликатами осталась.
    Все эти проиндексированные страницы, или страницы с проблемами, были страницы пагинации и фильтрации.
    С этой проблемой сталкивается любой, мало-мальски сайт, у которого реализована пагинация на сайте. И пути решения предлагаются разные:
    1. Полное закрытие таких страниц от индекса.
    2. Делать ссылку на корневой раздел таких страниц, на каждой странице.
    3. Оставить всё как есть и решить поисковикам решать, что оставить а, что удалить.
    4. Попробовать самому настроить каноникализацию таких страниц и поработать с мета-тегами rel="canonical" rel="next" rel="prev"
    Но перед тем как переходить к решению проблемы индексирования страниц пагинации, давай ещё разберёмся в пагинации и фильтрации контента на сайте. Что это такое и как вообще работает.

    Про пагинацию на сайте

    А начнём пожалуй с пагинатора или вернее о пагискроле (Пагинатор + Скролл), как я его называю. Дело в том, что мой пагискрол совмещает два вида обновления контента на сайте:
    1. Первый это пагинатор, то есть, есть некие кнопочки нажимая на которые ты переходишь на следующую страницу.
    2. Второй вид обновления контента, это так называемая бесконечная лента (infinity scroll). Контент сам прогружается, как только пользователь дойдёт до определённой отметки на странице.
    Это просто особенность моего сайта. На большинстве сайтов будет либо чистый пагинатор, либо бесконечная лента. Когда я создавал пагинатор для своего сайта, я руководствовался вот этим руководством (с примером реализации) и рекомендациями от Google.
    Это демонстрация того, как работает мой пагискрол на сайте. Бесконечная лента (которая очень конечна), плюс возможность перемещаться между страницами используя кнопки.
    Так же надо пояснить, что у меня так называемая офсетная пагинация, то есть та что использует определённые параметры, чтобы указать что и сколько нужно вернуть пользователю. Может выглядеть так http://website.com/articles?items=10&offset=0 То есть, начать с 0 элемента и отдать ровно десять.
    А есть ещё и курсорная пагинация (cursor pagination).
    Курсорная пагинация - это метод постраничного вывода данных, использующий уникальный маркер (курсор) для указания точной позиции в наборе данных, вместо номера страницы.
    Больше технической информации о курсоной (да и не только) пагиции можно прочитать в закреплённой ссылке.
    Пагинация, сама по себе, является очень полезной и я бы сказал неотъемлемой части любого, мало-мальски крупного сайта на котором есть контент. Но со стороны SEO-оптимизации и пользы в ранжировании в SERP, она очень не однозначна, как и не однозначно использование фильтров на сайте.

    Про фильтрацию на сайте

    Одним пагискролом (пагинатор + бесконечная лента) сыт не будешь. Хочется фильтрации, и возможности группировать контент на сайте по ключевым словам. Фильтровать страницы можно при помощи тегирования.
    Вообще тегирование по-разному называют. У Printerest это пины, у Twitter и Instagram это хештеги. Кто-то их просто называет категориями. Но по сути они все имеют под собой одно и то же значение. Тег.
    Теги позволили мне группировать контент на ещё более мелкие группы, плюс позволили кастомизировать и SEO-оптимизировать их. Ещё больше про теги и категории можно узнать из этой статьи.
    Пример того, как тегирование (или фильтрация) работает на моём сайте.
    У фильтрации ровно те же проблемы, что и у пагинации, то есть малоценный контент, засорение индекса этим самым контентом, плохие поведенческие показатели и сложность в реализации.

    Что можно сделать и что сделал я со страницами фильтрации, что попали в индекс

    Изначально, как это и принято, я просто игнорировал данную проблему. Но страниц и ошибок становилось всё больше, как ты это уже видел в начале статьи. Потом я выяснил, как страницы фильтрации могут повлиять на позиции сайта.

    Влияние страниц фильтрации на ранжирование в поиске

    На прямую, сама технология разбиения контента на блоки не влияет на позицию в поиске, но косвенно ещё как:
    1. Может привести к нехватке краулингового бюджета. Для того чтобы проверить новые или обновлённые странице на сайте, может просто не хватить этого самого бюджета. О том, как его контролировать и управлять в закреплённой статье.
    2. Так как в общей массе своей данные страницы являются малоценными, они тянут позиции своих родительских каталогов и сайта в целом. Например, есть путь /en/articles/seo-optimization/ и этот каталог работает как пагинатор для статей про сео оптимизацию, если в этом каталоге есть некачественные страницы т.е. /en/articles/seo-optimization/?page=1, /en/articles/seo-optimization/?page=2, то эти некачественные страницы потянут вниз и весь каталог с ним. О так называемом эффекте тематического соседства(The “Topical Neighbourhood” Effect) в адресной строке, много написал в своей книге Hobo Technical, кстати рекомендую к прочтению.
    3. Это технически сложно реализовать, особенно новичку или не разработчику. И скорее всего будут допущены множественные ошибки, которые Google или любая другая поисковая система будут воспринимать как плохо работающий сайт.
    4. Генерирует плохие поведенческие факторы. Хотя это спорно и не применимо для каждого сайта. Но для блога, вроде моего это факт. Максимум на что можно надеяться от этих страниц, это +1 к глубине просмотра, но и только.
    Это были перечислены эффекты страниц фильтрации и пагинации, которые они могут создать для сайта, неправильно их реализовавшего. А дальше давай посмотрим, что можно с этими страницами сделать.

    Какие есть варианты работы со страницами фильтрации

    И как всегда здесь всё зависит от конкретного сайта, и однозначно сказать, что вот такому сайту нужно просто забить и разрешить Гуглу разбираться с этим бардаком, нельзя.
    Итак, есть следующие варианты работы с данными страницами:
    1. Ничего не делать. Это наверное самый простой, но не очень хороший курс действия. Те кто так делают, надеяться на умные алгоритмы и ИИ, который за них всё решит. Кто знает, может кому-то это и помогает.
    2. Сделать всё правильно (с точки зрения поисковых систем и SEO). То есть, проставить мета-тег canonical, добавить rel="next" rel="prev". И опять ничего не делать, но теперь зная, что ты сделал всё, что мог для того, чтобы помочь поисковику разобраться в твоём сайте
    3. Запретить к индексированию все такие страницы. Самый радикальный и при этом самый надёжный вариант. Тут ты явно говоришь, что такие страницы не стоит индексировать.
    4. Проставить мета-тег canonical на главную страницу фильтрации, чтобы все они ссылались на одну единственную. Позволит оставить лишь самые уникальные и ценные страницы фильтрации.
    5. Запретить к индексированию страницы фильтрации, но оставить лишь те, которые можно сгруппировать в логические группы и достаточно сильно уникализировать такие страницы.
    А теперь давай поговорим про эти варианты действий. Я не зря проставил их в упорядоченный список, ибо эту последовательность я сам прошёл. Сейчас я на 3-й варианте, но в скором времени планирую опробовать 5-й и группировать необходимые мне страницы пагинации/фильтрации в определённые кластеры. Об это будет отдельная статья.
    Не рекомендую лезть во 2-й вариант действий, ибо я сомневаюсь чтобы хоть у кого-то всё получилось с первого раза. Вот я смог реализовать всё правильно только с третьего. То ссылка на несуществующую страницу появиться, то появится такая страница фильтрации, которая просто отдаёт 500 код ...
    Если вкратце, то либо ничего не делай, либо просто закрой от индекса такие страницы. Это гораздо проще и надёжнее, ведь как ты увидишь дальше, ценности в таких страницах кроется не то чтобы много.

    Результаты моих действий со страницами пагинации

    В начале статьи, я показал результат первых двух вариантов действий, а именно ничего не делать и работа с мета-тегами страниц пагинации.
    Но пару месяцев позже, после первой публикации данной статьи, я принял более жёсткие решения по поводу этих страниц, и решил полностью закрыть их от индекса. И вот какие показатели индекса моего сайта в Google, на Март 2026 года:
    Как ты можешь заметить это не быстрый процесс, у моего сайта он занял год. Большая часть из не проиндексированных страниц, это те, которые были закрыты мета-тегом noindex.
    И ещё, это ни как не повлияло, на показы и видимость сайта, а ведь у меня, как помнишь, в индексе было, что-то около 8 тысяч страниц.
    Это и не удивительно, ведь это малоценные страницы. И вот наглядная демонстрация ценности таких страниц (это на момент того, когда такие страницы ещё были у меня в поиске):
    Чтобы не быть голословным, вот статистика за Февраль, всего сайта.

    Выводы и будущее страниц пагинации/фильтрации

    Что ж, теперь про выводы, которые можно сделать. Год на зад, я сделал вывод, что не стоит рубить с плеча и закрывать эти страницы от индекса. Но сейчас я бы так не сказал. С моей точки зрения, и с точки зрения Google это были малокачественные страницы, которые не помогали конечному пользователю в решении его проблем.
    И я бы рекомендовал закрывать такие страницы от индекса, по крайней мере сайтам моего типа, то есть блогам и сайтам авторов. Как говориться овчинка не стоит выделки. Слишком дорого может обходиться содержание таких страниц, а выхлопа от них почти никакого.
    Я ещё вернусь к этой статье, когда смогу реализовать группировку похожих страниц пагинации в один, канонический адрес и уникализировать её на столько, что даже Google не сможет сказать нет. Но об этом будет в следующем обновлении статьи. Будем на связи.

    Не забудь поделиться, лайкнуть и оставить комментарий)

    Комментарии

    (0)

    captcha
    Отправить
    ЗАГРУЗКА ...
    Сейчас тут пусто. Буть первым (o゚v゚)ノ

    Другое

    Похожие статьи


    Заработок на файлообменниках, как много и получится ли?

    Часы
    03.03.2025
    /
    Часы
    11.03.2026
    Глазик
    1712
    Сердечки
    0
    Соединённые точки
    1
    Соединённые точки
    0
    Соединённые точки
    0
    В этой статье я расскажу и покажу на примере своего сайта как можно заработать на файлообменниках. И можно ли. Разберём ситуацию на примере одного из провайдеров, посмотрим на цены и …

    Django, HTMx pagination, как сделать простой пагинатор ч. 1

    Часы
    02.04.2025
    /
    Часы
    24.03.2026
    Глазик
    618
    Сердечки
    0
    Соединённые точки
    0
    Соединённые точки
    0
    Соединённые точки
    0
    В этой статье я опишу то, как создать пагинатор используя Django и HTMx библиотеку. И то, почему это было так просто в сравнении с пагинатором на моём сайте. С шаблонами …

    Как сделать простой пагинатор на Django и HTMx. Добавляем сортировку и фильтры ч. 2

    Часы
    08.04.2025
    /
    Часы
    24.03.2026
    Глазик
    588
    Сердечки
    0
    Соединённые точки
    0
    Соединённые точки
    0
    Соединённые точки
    0
    В этой статье я опишу процесс и основные блоки кода, для того чтобы добавить сортировку и фильтрацию к пагинатору. Данный пагинатор написан на Django используя HTMx.

    Кастомизация 404 страницы в Django, двумя способами. Гайд

    Часы
    12.04.2025
    /
    Часы
    30.03.2026
    Глазик
    1232
    Сердечки
    0
    Соединённые точки
    0
    Соединённые точки
    0
    Соединённые точки
    0
    Про то, как кастомизировать и настроить страницу ответа 404, двумя способами. Объясняю нюансы и детали и для страниц 400, 403, 500. Объясняю зачем этим заниматься и как подготовить сервер для …

    Использованные термины


    Релевантные вопросы