Вступление/Продолжение создания семантического ядра где ...
Покажу что такое кластеризация, зачем мы этим будем заниматься и что самое главное, как это делается в ручную и как это можно автоматизировать при помощи сторонних сервисов. Прежде чем отвечать на вопрос зачем, нужно ответить на вопрос что. А именно что такое кластеризация поисковых запросов.
Кластеризовать можно двумя способами:
- Первый способ использует лексическую схожесть группируемых ключевых слов.
- Второй способ опираясь на интент пользователя, группирует запросы по схожести поисковой выдачи. Этот способ разделяется на две подкатегории:
- Мягкая группировка. Достаточно чтобы страницы в выдаче совпадали лишь от части.
- Жёсткая группировка. Необходимо чтобы страницы в выдаче совпадали полностью.
Вообще выделяют ещё и третий вид группировки, а именно логический. Там идёт упор на логическое объединение запросов. Например, сгруппировать все запросы в кластер "Купить", или "Услуги", или "Товары" и т.д. Но как я покажу далее, логическая и лексическая группировка почти ни чем не отличаются друг от друга. И об это далее.
Лексическая группировка ключевых слов
Про первый способ и говорить то нечего. Например, есть такая таблица ключевых слов:
| telegram bot menu | 500 |
| webhook telegram bot | 500 |
| youtube mp3 telegram | 500 |
| telegram setwebhook | 500 |
| telegram bot menu button | 500 |
| youtube converter mp3 telegram | 500 |
| Ключевое слово | Показы |
|---|
Теперь чтобы кластеризировать её по первому способу, необходимо группировать их по наличию общих слов в каждом. Так, например, таблица выше сгруппируется вот так:
| telegram bot menu | telegram bot menu | 500 |
| telegram bot menu button | telegram bot menu | 500 |
| webhook telegram bot | webhook telegram bot | 500 |
| telegram setwebhook | webhook telegram bot | 500 |
| youtube mp3 telegram | youtube mp3 telegram | 500 |
| youtube converter mp3 telegram | youtube mp3 telegram | 500 |
| Ключевое слово | Кластер | Показы |
|---|
Это довольно простой способ кластеризации, который требует базовых знаний языка, не более.
Логическая группировка работает по принципу, объединения ключевых слов по их логической схожести. Так, если есть много запросов про услуги разработки телеграм ботов, наверное стоит объединить их в один кластер и назвать его - услуги по разработке тг ботов.
На практике, лучше всего объединять эти два способа. Если первый легко автоматизируется, то второй уже потребует твоего вмешательства. И по сути это один способ.
Кластеризация по топу выдачи
Но хотя являясь простой, она не является, той которую я бы рекомендовал использовать. Почему? Данный способ не может показать и запечатлеть интент пользователя в кластеры. Вернее сказать, не сможет отобразить интент пользователя, предполагаемый поисковой машиной т.е. Google/Yandex.
Поисковые машины сами не знают интента поисковых запросов, но благодаря алгоритмам, отображают именно те страницы, которые лучше всего отвечают на скрытое намерение пользователя ввёдший поисковой запрос.
И чтобы "схватить" и уловить интент пользователя необходимо пользоваться вторым способом, то есть заниматься кластеризацией по топам, о нём подробнее дальше.
Как он работает? Допустим у нас есть следующие запросы в ядре(будем использовать ранее упомянутые запросы):
- webhook telegram bot
- telegram setwebhook
- youtube mp3 telegram
Теперь необходимо ввести эти запросы в целевую поисковую машину, дабы узнать что по данным запросам ранжируется (дальше я приведу таблицу с результатами анализа поисковой выдачи от Google).
| https://stackoverflow.com/questions/42554548/how-to-set-telegram-bot-webhook | https://stackoverflow.com/questions/36905455/how-to-use-setwebhook-in-telegram | https://t.me/YtbAudioBot |
| https://habr.com/ru/companies/digitalleague/articles/716760/ | https://telegram-bot-sdk.readme.io/reference/setwebhook | https://telegram.me/convert_youtube_to_mp3_bot |
| https://core.telegram.org/bots/webhooks | https://core.telegram.org/bots/webhooks | https://www.telegrambots.info/bots/YtbAudioBot |
| https://timeweb.cloud/tutorials/nodejs/otlichie-polling-i-webhook-v-telegram-botah | https://decovar.dev/blog/2018/12/02/telegram-bot-webhook-ru/ | https://ichip.ru/podborki/programmy-prilozheniya/5-telegram-botov-kotorye-pomogut-skachat-video-s-youtube-i-socsetej-834852 |
| https://core.telegram.org/bots/api | https://core.telegram.org/bots/api | https://lifehacker.ru/download-audio-youtube/ |
| URL в топе для "webhook telegram bot" | URL в топе для "telegram setwebhook" | URL в топе для "youtube mp3 telegram" |
|---|
Второй запрос хоть и похож на первый, показывает немного другую выдачу. Хотя это легко объяснимо, ведь если первый запрос довольно широк в своём смысле, то второй гораздо конкретнее ибо про определённый метод установки веб хуков. И во второй таблице лишь два похожих адреса
Третий запрос совершенно другой, ни одного похожего адреса.
На примере таблицы, легко объяснить разницу между жёсткой кластеризацией и мягкой. Если бы мы использовали мягкую кластеризацию со степенью похожести равной 2 (то есть сколько адресов должно совпасть), то первый и второй запрос попали бы в один кластер.
Но если использовать жёсткую кластеризацию, то ни один из запросов не попал бы в общий кластер, ибо для жёсткой кластеризации необходимо, чтобы все адреса в поисковой выдаче совпадали.
Кластеризация больших ядер
Теперь, когда мы знаем что такое кластеризация, какие бывают её виды и зачем она используется можно задаться вопросом, а что делать если у меня семантическое ядро на 1000 и более запросов, не вручную же делать всё?
У тебя есть три путя:
- Найти соответствующие онлайн инструменты и заплатить деньгами
- Сделать свои собственные аналоги и заплатить временем
- Вручную перебирать все ключевые слова и опять же заплатить временем
Может показаться что третий вариант вообще не вариант. Но если у тебя семантическое ядро до 50 ключевиков или если у тебя уже есть кластеризованное ядро и ты в процессе его использования, то постепенно можно его таким образом его и кластеризировать.
Если ты решил потратить своё время и создать кластеризатор ядра, то тебе потребуется реализовать 2 взаимосвязанных инструмента:
- Парсер поисковой выдачи. У меня на сайте есть статья как сделать такой парсер для Google. А так же готовый python скрипт для этого.
- Сам кластеризатор, который бы сравнивал полученный список адресов. Может быть когда-нибудь и сделаю сам.
И если есть немного денег, можно использовать уже готовые решения. Я могу отметить лишь один единственный, который полностью закрывает мои потребности в кластеризации и это Кластеризатор от Арсенкина.

Рекомендую, пользуюсь сам. Работает по принципу платных лимитов. Самый дешёвый вариант это 28т лимитов на 30 дней, за 850Р или около 8$. За данное ко-во лимитов можно кластеризировать примерно 15т ключевых слов со сбором частоты.
Если задать на вход список ключевых слов из этой таблицы(Которая была получена в предыдущей статье), мы получим вот такую вот таблицу на выходе. Ну и как пользоваться кластеризированным ядром, это наверное следующий вопрос, который возникнет в твоей голове. И на него я попытаюсь ответить в следующей главе.
В которой я объясню, как им пользоваться
Во многих статьях описывается процесс и способы создания кластеризированного семантического ядра, но никогда как им вообще пользоватьcя. Все, то и говорят про его пользу, не показывая пользу на практике. Я хочу это исправить, показав на примере кластеризированного ранее ядра.
В таблице есть 9 столбов, пройдёмся по каждому из них:
- Поисковые запросы - собственно ключевое слово
- Название группы - общее название кластера, даётся по первому поисковому запросу в группе
- Фраз в группе - ко-во ключевых слов в кластере
- WS - количество показов за месяц
- Суммарная частотность кластера - суммарное к-во показов в месяц всего кластера
- % Агрегаторов - как много страниц агрегаторов в поисковой выдаче
- Главных страниц - как много главных страниц в поисковой выдаче
- Топоним в запросе - есть ли топоним в запросе(название места)
- URLs группы - адреса в поисковой выдаче по запросу
Обычно я добавляю ещё два столбца. Один для записи адресов страниц моего сайта, которые используют тот или иной кластер. Я это делаю для того, чтобы следить за прогрессом "реализации" семантического ядра в сайт. Другой для указания типа кластера, а это делаю для того, чтобы понимать для чего мне использовать данный кластер.
После того как мы получили кластеризированное ядро, нужно просмотреть все его кластеры и решить, для чего лучше их использовать. Так я, например, делю кластеры по страницам назначения. Они бывают следующими:
| С | Статья | Некий информативный материал, гайд, туториал, кейс | 10-100 |
| БС | Большая статья | Просто очень большая статья, которая объединяет между собой обычные статьи. Такие страницы ещё называют Столповыми или Pillar page | 100-1000 |
| И | Инструмент | Простой терминальный инструмент, или в нашем случае это будет телеграм бот | 10-100 |
| БИ | Большой инструмент | Под большим инструментом я подразумеваю не только сложность его исполнения, но и то что он будет онлайн, то есть он будет доступен всем | 100-1000 |
| СП** | Страница пагинации | Страница, которая группирует либо статьи, либо инструменты. | 1000-10000 |
| Сокращение | Тип страницы | Описание страницы | Количество показов* |
|---|
* - Здесь ко-во условно и зависит конкретно от самого ядра и той конкуренции, которая происходит между сайтами за выдачу в поиске
** - Вот такие страницы, страницы пагинации, имеет смысл оптимизировать если ты можешь реализовать выборочное индексирование таких страниц, иначе тысячи и тысячи таких страниц съедят твой бюджет обхода сайта.
Как тебе определить, для чего и какой кластер подойдёт лучше? Ну если ты разбираешься в топике и являешься спецом в той области, в которой делаешь свой сайт, то одного твоего беглого взгляда должно хватить, чтобы понять какой кластер и к какой странице лучше соотнести. Но что если нет?
Я могу дать лишь несколько рекомендаций:
- Смотрите на интент пользователя. Если в запросе видно, что человек ищет допустим бесплатные телеграм боты, то лучшей страницей для такого кластера будет СП.
- Видите огромный кластер под 20-40 ключевых слов, возможно стоит использовать его для Столповой страницы и разбить его на несколько мелких статей.
- Не пытайтесь вставить все ключевые слова на свою страницу. Выберите лишь несколько и после публикации и некоторого времени, меняйте их, чтобы найти оптимальные словосочетания и фразы
Когда закончишь, ты получишь что-то вроде такой таблицы. Которую в последующем ты будешь использовать как компас в выборе следующего материала для статьи. И которая поможет тебе следить за тем, что ты уже сделал и что ещё тебе предстоит сделать. Просто начни с понравившегося тебе кластера и начни писать. Но так же и учти что ...
Лучше начинать с малоконкурентных запросов и там, где ты легко займёшь топ 10, топ 5 в поисковой выдаче. Как определить, что кластер лёгкий? Для этого смотри на столбец F(% агрегаторов) и G(главных страниц).
Чем больше процент агрегирующих страниц, тем проще там продвигаться. Почему? Агрегаторы они такие, они не привносят в поиск ничего нового, а просто копируют контент других, поэтому не имеют или имеют очень мало веса в глазах поиска.
Чем меньше ко-во главных страниц в поиске, тем проще там продвигаться. Почему? Просто кто-то сделал очень-очень узкоспециализированный сайт и решил со 100% всей вероятностью забрать себе все показы для данного запроса. Таких сложно обойти, если вообще реально.
Заключение
Конечно, есть и другие онлайн кластеризаторы от PixelPlus, Serpstat, TopVisor, но мне не очень понравилась их работа, да и это статья не о топе кластеризаторов, а о таковом процессе в целом.
Польза кластеризации очевидна, так, если нужно понять какие ключевые слова можно было бы использовать в той или иной статье, структурировать сайт, понять направление развития сайта или узнать по каким ключевым словам продвигать рекламу в поиске, то кластеризация необходима.
И хоть кластеризировать ядро не составит труда, труда точно составит его использовать. Ведь бытует мнение, что это "Семантическое ядро", некая фикция SEO-компаний и Сеошников, чтобы сделать видимость того, что они работают и поднять их стоимость.
Интересная точка зрения, но как мы увидили из предыдущей главы про его использование, от семантического ядра гораздо больше пользы, чем многи могут себе представить. И не стоит воспринимать семантическое ядро как результат SEO работы, как таковой, но как инструмент помогающий добиться конкретных результатов(кликов, показов, конверсий).
А как ты используешь семантическое ядро? И используешь ли вообще? Буду рад почитать об этом в комментариях.