Удалить все

ЗАГРУЗКА ...

Содержание

Как проводить кластеризацию семантического ядра, и как это ядро использовать

04.02.2026

11.03.2026

8 минут

203

Теги:

Парсер

Поисковая оптимизация

Вступление/Продолжение создания семантического ядра где ...

Покажу что такое кластеризация, зачем мы этим будем заниматься и что самое главное, как это делается в ручную и как это можно автоматизировать при помощи сторонних сервисов. Прежде чем отвечать на вопрос зачем, нужно ответить на вопрос что. А именно что такое кластеризация поисковых запросов.

Кластеризация поисковых запросов - это процесс при котором ключевые слова группируются между собой, либо по признаку похожести интента пользователя, либо по лексической схожести фраз.

А зачем собственно говоря заниматься кластеризацией? Кластеризация позволяет узнать будущую структуру сайта и сверстать его соответствующе, узнать по каким кс можно продвигать ту или иную страницу как в органической выдаче так и через рекламу.

Кластеризовать можно двумя способами:

Первый способ использует лексическую схожесть группируемых ключевых слов.
Второй способ опираясь на интент пользователя, группирует запросы по схожести поисковой выдачи. Этот способ разделяется на две подкатегории:
Мягкая группировка. Достаточно чтобы страницы в выдаче совпадали лишь от части.
Жёсткая группировка. Необходимо чтобы страницы в выдаче совпадали полностью.

Вообще выделяют ещё и третий вид группировки, а именно логический. Там идёт упор на логическое объединение запросов. Например, сгруппировать все запросы в кластер "Купить", или "Услуги", или "Товары" и т.д. Но как я покажу далее, логическая и лексическая группировка почти ни чем не отличаются друг от друга. И об это далее.

Лексическая группировка ключевых слов

Про первый способ и говорить то нечего. Например, есть такая таблица ключевых слов:

Ключевое слово	Показы
telegram bot menu	500
webhook telegram bot	500
youtube mp3 telegram	500
telegram setwebhook	500
telegram bot menu button	500
youtube converter mp3 telegram	500

Теперь чтобы кластеризировать её по первому способу, необходимо группировать их по наличию общих слов в каждом. Так, например, таблица выше сгруппируется вот так:

Ключевое слово	Кластер	Показы
telegram bot menu	telegram bot menu	500
telegram bot menu button	telegram bot menu	500
webhook telegram bot	webhook telegram bot	500
telegram setwebhook	webhook telegram bot	500
youtube mp3 telegram	youtube mp3 telegram	500
youtube converter mp3 telegram	youtube mp3 telegram	500

Это довольно простой способ кластеризации, который требует базовых знаний языка, не более.

Логическая группировка работает по принципу, объединения ключевых слов по их логической схожести. Так, если есть много запросов про услуги разработки телеграм ботов, наверное стоит объединить их в один кластер и назвать его - услуги по разработке тг ботов.

На практике, лучше всего объединять эти два способа. Если первый легко автоматизируется, то второй уже потребует твоего вмешательства. И по сути это один способ.

Кластеризация по топу выдачи

Но хотя являясь простой, она не является, той которую я бы рекомендовал использовать. Почему? Данный способ не может показать и запечатлеть интент пользователя в кластеры. Вернее сказать, не сможет отобразить интент пользователя, предполагаемый поисковой машиной т.е. Google/Yandex.

Поисковые машины сами не знают интента поисковых запросов, но благодаря алгоритмам, отображают именно те страницы, которые лучше всего отвечают на скрытое намерение пользователя ввёдший поисковой запрос.

Как я понимаю, и если верить блогам от Google, делают они это, вычисляя многочисленные факторы ранжирования, коих сотни, но самыми весомыми являются поведенческие факторы и ссылочный вес сайта в целом и ранжируемых страниц в частности.

И чтобы "схватить" и уловить интент пользователя необходимо пользоваться вторым способом, то есть заниматься кластеризацией по топам, о нём подробнее дальше.

Как он работает? Допустим у нас есть следующие запросы в ядре(будем использовать ранее упомянутые запросы):

webhook telegram bot
telegram setwebhook
youtube mp3 telegram

Теперь необходимо ввести эти запросы в целевую поисковую машину, дабы узнать что по данным запросам ранжируется (дальше я приведу таблицу с результатами анализа поисковой выдачи от Google).

URL в топе для "webhook telegram bot"	URL в топе для "telegram setwebhook"	URL в топе для "youtube mp3 telegram"
https://stackoverflow.com/questions/42554548/how-to-set-telegram-bot-webhook	https://stackoverflow.com/questions/36905455/how-to-use-setwebhook-in-telegram	https://t.me/YtbAudioBot
https://habr.com/ru/companies/digitalleague/articles/716760/	https://telegram-bot-sdk.readme.io/reference/setwebhook	https://telegram.me/convert_youtube_to_mp3_bot
https://core.telegram.org/bots/webhooks	https://core.telegram.org/bots/webhooks	https://www.telegrambots.info/bots/YtbAudioBot
https://timeweb.cloud/tutorials/nodejs/otlichie-polling-i-webhook-v-telegram-botah	https://decovar.dev/blog/2018/12/02/telegram-bot-webhook-ru/	https://ichip.ru/podborki/programmy-prilozheniya/5-telegram-botov-kotorye-pomogut-skachat-video-s-youtube-i-socsetej-834852
https://core.telegram.org/bots/api	https://core.telegram.org/bots/api	https://lifehacker.ru/download-audio-youtube/

Второй запрос хоть и похож на первый, показывает немного другую выдачу. Хотя это легко объяснимо, ведь если первый запрос довольно широк в своём смысле, то второй гораздо конкретнее ибо про определённый метод установки веб хуков. И во второй таблице лишь два похожих адреса

Третий запрос совершенно другой, ни одного похожего адреса.

На примере таблицы, легко объяснить разницу между жёсткой кластеризацией и мягкой. Если бы мы использовали мягкую кластеризацию со степенью похожести равной 2 (то есть сколько адресов должно совпасть), то первый и второй запрос попали бы в один кластер.

Но если использовать жёсткую кластеризацию, то ни один из запросов не попал бы в общий кластер, ибо для жёсткой кластеризации необходимо, чтобы все адреса в поисковой выдаче совпадали.

Кластеризация больших ядер

Теперь, когда мы знаем что такое кластеризация, какие бывают её виды и зачем она используется можно задаться вопросом, а что делать если у меня семантическое ядро на 1000 и более запросов, не вручную же делать всё?

У тебя есть три путя:

Найти соответствующие онлайн инструменты и заплатить деньгами
Сделать свои собственные аналоги и заплатить временем
Вручную перебирать все ключевые слова и опять же заплатить временем

Может показаться что третий вариант вообще не вариант. Но если у тебя семантическое ядро до 50 ключевиков или если у тебя уже есть кластеризованное ядро и ты в процессе его использования, то постепенно можно его таким образом его и кластеризировать.

Если ты решил потратить своё время и создать кластеризатор ядра, то тебе потребуется реализовать 2 взаимосвязанных инструмента:

Парсер поисковой выдачи. У меня на сайте есть статья как сделать такой парсер для Google. А так же готовый python скрипт для этого.
Сам кластеризатор, который бы сравнивал полученный список адресов. Может быть когда-нибудь и сделаю сам.

И если есть немного денег, можно использовать уже готовые решения. Я могу отметить лишь один единственный, который полностью закрывает мои потребности в кластеризации и это Кластеризатор от Арсенкина.

Рекомендую, пользуюсь сам. Работает по принципу платных лимитов. Самый дешёвый вариант это 28т лимитов на 30 дней, за 850Р или около 8$. За данное ко-во лимитов можно кластеризировать примерно 15т ключевых слов со сбором частоты.

Если задать на вход список ключевых слов из этой таблицы(Которая была получена в предыдущей статье), мы получим вот такую вот таблицу на выходе. Ну и как пользоваться кластеризированным ядром, это наверное следующий вопрос, который возникнет в твоей голове. И на него я попытаюсь ответить в следующей главе.

В которой я объясню, как им пользоваться

Во многих статьях описывается процесс и способы создания кластеризированного семантического ядра, но никогда как им вообще пользоватьcя. Все, то и говорят про его пользу, не показывая пользу на практике. Я хочу это исправить, показав на примере кластеризированного ранее ядра.

В таблице есть 9 столбов, пройдёмся по каждому из них:

Поисковые запросы - собственно ключевое слово
Название группы - общее название кластера, даётся по первому поисковому запросу в группе
Фраз в группе - ко-во ключевых слов в кластере
WS - количество показов за месяц
Суммарная частотность кластера - суммарное к-во показов в месяц всего кластера
% Агрегаторов - как много страниц агрегаторов в поисковой выдаче
Главных страниц - как много главных страниц в поисковой выдаче
Топоним в запросе - есть ли топоним в запросе(название места)
URLs группы - адреса в поисковой выдаче по запросу

Обычно я добавляю ещё два столбца. Один для записи адресов страниц моего сайта, которые используют тот или иной кластер. Я это делаю для того, чтобы следить за прогрессом "реализации" семантического ядра в сайт. Другой для указания типа кластера, а это делаю для того, чтобы понимать для чего мне использовать данный кластер.

Ты мог заметить что, после кластеризации осталось ещё примерно 200 запросов в ядре которые не удалось кластеризировать. Эти ключевые слова на самом деле очень важны, ибо если внимательно присмотреться можно найти просто потрясающие идеи для статей или мини-инструментов.

После того как мы получили кластеризированное ядро, нужно просмотреть все его кластеры и решить, для чего лучше их использовать. Так я, например, делю кластеры по страницам назначения. Они бывают следующими:

Сокращение	Тип страницы	Описание страницы	Количество показов*
С	Статья	Некий информативный материал, гайд, туториал, кейс	10-100
БС	Большая статья	Просто очень большая статья, которая объединяет между собой обычные статьи. Такие страницы ещё называют Столповыми или Pillar page	100-1000
И	Инструмент	Простой терминальный инструмент, или в нашем случае это будет телеграм бот	10-100
БИ	Большой инструмент	Под большим инструментом я подразумеваю не только сложность его исполнения, но и то что он будет онлайн, то есть он будет доступен всем	100-1000
СП**	Страница пагинации	Страница, которая группирует либо статьи, либо инструменты.	1000-10000

* - Здесь ко-во условно и зависит конкретно от самого ядра и той конкуренции, которая происходит между сайтами за выдачу в поиске

** - Вот такие страницы, страницы пагинации, имеет смысл оптимизировать если ты можешь реализовать выборочное индексирование таких страниц, иначе тысячи и тысячи таких страниц съедят твой бюджет обхода сайта.

Конечно у тебя могут быть и другие типы страниц например У - Услуги или Т - Товар, всё зависит от конкретного ядра и сайта на который это ядро пытаются натянуть. Вот в моём случае выходит так.

Как тебе определить, для чего и какой кластер подойдёт лучше? Ну если ты разбираешься в топике и являешься спецом в той области, в которой делаешь свой сайт, то одного твоего беглого взгляда должно хватить, чтобы понять какой кластер и к какой странице лучше соотнести. Но что если нет?

Я могу дать лишь несколько рекомендаций:

Смотрите на интент пользователя. Если в запросе видно, что человек ищет допустим бесплатные телеграм боты, то лучшей страницей для такого кластера будет СП.
Видите огромный кластер под 20-40 ключевых слов, возможно стоит использовать его для Столповой страницы и разбить его на несколько мелких статей.
Не пытайтесь вставить все ключевые слова на свою страницу. Выберите лишь несколько и после публикации и некоторого времени, меняйте их, чтобы найти оптимальные словосочетания и фразы

Когда закончишь, ты получишь что-то вроде такой таблицы. Которую в последующем ты будешь использовать как компас в выборе следующего материала для статьи. И которая поможет тебе следить за тем, что ты уже сделал и что ещё тебе предстоит сделать. Просто начни с понравившегося тебе кластера и начни писать. Но так же и учти что ...

Лучше начинать с малоконкурентных запросов и там, где ты легко займёшь топ 10, топ 5 в поисковой выдаче. Как определить, что кластер лёгкий? Для этого смотри на столбец F(% агрегаторов) и G(главных страниц).

Чем больше процент агрегирующих страниц, тем проще там продвигаться. Почему? Агрегаторы они такие, они не привносят в поиск ничего нового, а просто копируют контент других, поэтому не имеют или имеют очень мало веса в глазах поиска.

Чем меньше ко-во главных страниц в поиске, тем проще там продвигаться. Почему? Просто кто-то сделал очень-очень узкоспециализированный сайт и решил со 100% всей вероятностью забрать себе все показы для данного запроса. Таких сложно обойти, если вообще реально.

Заключение

Конечно, есть и другие онлайн кластеризаторы от PixelPlus, Serpstat, TopVisor, но мне не очень понравилась их работа, да и это статья не о топе кластеризаторов, а о таковом процессе в целом.

Польза кластеризации очевидна, так, если нужно понять какие ключевые слова можно было бы использовать в той или иной статье, структурировать сайт, понять направление развития сайта или узнать по каким ключевым словам продвигать рекламу в поиске, то кластеризация необходима.

Когда я написал: "использовать в статье", я не подразумеваю только в мета-тегах и описаниях. А конкретно в теле страницы/статьи. Кластеры помогут узнать вообще из чего может состоять статья, из каких глав и подглав её лучше компоновать. Или какие главы в неё точно не стоит добавлять, ибо желаемое ключевое слово находится вообще в другом кластере.

И хоть кластеризировать ядро не составит труда, труда точно составит его использовать. Ведь бытует мнение, что это "Семантическое ядро", некая фикция SEO-компаний и Сеошников, чтобы сделать видимость того, что они работают и поднять их стоимость.

Интересная точка зрения, но как мы увидили из предыдущей главы про его использование, от семантического ядра гораздо больше пользы, чем многи могут себе представить. И не стоит воспринимать семантическое ядро как результат SEO работы, как таковой, но как инструмент помогающий добиться конкретных результатов(кликов, показов, конверсий).

А как ты используешь семантическое ядро? И используешь ли вообще? Буду рад почитать об этом в комментариях.

Апдейты алгоритмов гугла на персональный блог

Следующая статья

Сбор семантического ядра сайта: пошаговое руководство

Предыдущая статья