18 лет — опыт продвижения сайтов в интернете

Как SEO-тексты влияют на позиции сайта на самом деле?

Большинство интернет-магазинов в обязательном порядке размещают seo-тексты, созданные специально для поисковиков. Нужны ли они на сайте? Ценят ли их Google и Яндекс и как именно? Разобрался Михаил Волович, руководитель «Лаборатории поисковой аналитики».

26 марта 2019 года
10067

Предлагаем вашему вниманию расшифровку его доклада «SEO-тексты глазами Яндекса, Google и "Тургенева"» на конференции Optimization 2018.

Как мы анализируем данные

В нашей «Лаборатории поисковой аналитики» мы постоянно исследуем результаты поисковой выдачи в Яндексе, Google, Mail.ru по коммерческим запросам. Выдачу можно сравнивать по разным параметрам; сейчас их количество перевалило за 600. Анализируем всё: коммерческие параметры, ссылочные, текстовые, трафиковые, поведенческие, технические.

Для каждого из трех поисковиков (Яндекс, Google, Mail.ru) проверяем:

  • есть ли статистически значимая связь между значением параметра и попаданием в топ-30;

  • есть ли корреляция с позицией внутри топ-30.

В 2017 и 2018 году выходили подробные аналитические отчеты, которые выложены на наш сайт.

В этом докладе остановимся на текстовых параметрах.


Типичный текстовый параметр

Типичный текстовый параметр.png

Посмотрим на примере конкретного параметра — количество вхождений слов запроса и их синонимов в текст найденной страницы.

Слова запроса и синонимы.png

Влияние этого параметра очень высоко. На верхней диаграмме указаны значения слева для Google, справа для Яндекса. Верхняя линейка — топ-3, дальше топ-30, самая нижняя — «фон» (то, что попало в топ в других поисковиках, а в этом нет).

Видно, что из слов запроса и синонимов в сумме набирается где-то 30-40 запросов. Считается это так. Если запрос из трех слов, то, в зависимости от частотности этих слов, кому-то из них дается вес, например, 0,4, кому-то — 0,2. Дальше каждое вхождение слова или его синонима мы засчитываем за тот вес, который ему приписан. В сумме набирается на 30-40 запросов. Это на самом деле очень много. И если мы возьмем другие параметры, то тоже цифры окажутся большими.

На оранжевых диаграммах внизу — средние значения по позициям на нашей стандартной выборке, которая ничем особо не хороша, кроме того, что мы за ней наблюдаем уже почти четыре года.

Слева Google. Видно, какая сильная корреляция с позицией. Значение корреляции (это ранговый критерий Спирмена) выписано у треугольничка на верхней диаграмме — в данном случае это значение 0,22 (и это очень много). Но при этом в Google средние значения меньше, чем в Яндексе, у которого есть статически значимая связь с попаданием в топ-30 и есть небольшая корреляция с позицией, гораздо более слабая. И мы считаем, что в данном случае вероятное влияние на попадание в топ в Яндексе важнее, чем влияние на позицию в Google.

Принцип антибуквализма

Принцип антибуквализма.png

Как устроено ранжирование по разным параметрам и по разным зонам страницы? Главная вещь, которую про это можно сказать, можно назвать принципом антибуквализма.

Прошли те времена, когда нужно было, чтобы ключевик в точной форме определенное количество раз встретился в тексте. На самом деле, он всё равно встречается довольно часто — у нас получается где-то 3-4 раза на страницу. Но при этом корреляции слабые. Два перечеркнутых треугольника — это отсутствие корреляции.

Видно, что в Яндексе корреляции начинают возникать при подъеме по этой лестнице из параметров, а внизу их просто нет. В Google корреляции при подъеме по лестнице усиливаются. И точно так же в какой-то момент в Яндексе начинает возникать связь с попаданием в топ-30, а для нижних параметров ее нет.

Кроме того, важны не только и часто не столько слова запроса, но и другие слова, которых в запросе нет. Мы смотрим на две группы слов — это синонимы слов запроса и слова, которые выделяют в сниппетах Яндекс и Google. И часто оказывается, что попадание этих слов, которых в запросе нет, важнее, чем попадание самих слов запроса.

Можно предположить, что, кроме этого, важны еще какие-то другие слова, но на это нет параметров.

Посмотрим, что получилось в Google:

Google сводная таблица.jpg

Буквами «Т» здесь обозначена связь с попаданием в топ, буквами «П» — корреляция с позицией. Есть четыре градации для каждого случая. Две буквы «П» — сильная корреляция, одна большая буква — средняя, маленькая буква — слабая. А бледная маленькая буква означает, на нашей, относительно небольшой, выборке корреляции не видно, но она видна на больших выборках. Группа параметров, которую мы смотрели, выделена полужирным — это вхождения в текст страницы.

Сводная таблица для Яндекса:

Яндекс сводная таблица.png

Что здесь важно? Для Google в основном видны буквы «П», для Яндекса — «Т». Грубо говоря, это означает, что в Яндексе текстовое ранжирование происходит в основном при предварительном отборе, когда выбираются, например, 1000 страниц для дальнейшего подробного ранжирования. И гораздо меньше влияет на позицию при окончательном выборе, кого показать выше, кого ниже. А в Google какие-то из текстовых факторов в полный рост влияют на окончательное ранжирование. И меньше влияют на предварительном этапе, если вообще влияют. И на той, и на другой картинке принцип антибуквализма очень ярко проявляется — справа налево заметно усиливается «густота» букв.

Есть одно важное исключение из этого принципа. В Google точный запрос без форм, прямо в его исходном виде, оказывается очень важным (потому что буква «Т» вообще важнее, чем буква «П») в <title>. И в меньшей степени в <H1> и в description. Это надо учитывать.

Оказывается довольно маловажен в Яндексе заголовок <H1>, как и <H2>–<H4>. И <title> тоже неубедительный. Про keywords видно, что они, скорее всего, просто не работают.

Еще бывают попадания слов запроса в доменное имя и в URL.


Домен и URL

Домен и URL.png

Домен важен в обоих поисковиках. URL не смотрится убедительно в Google, но это может быть из-за того, что Яндексе он важнее. То есть, может быть, он влияет на попадание в топ как-то, но в Яндексе «человекопонятные» URL крайне важны. И там в основном буквы «Т». То есть они важны на предварительном отборе.

И обратите внимание на высокие цифры. В части адреса после домена в среднем набирается вхождений слов на треть запроса. На самом деле, этого очень много.

Вторая вещь, которую обязательно надо учитывать — важна не только страница, на которую мы смотрим, но и весь сайт.


Подсайт и сайт

Подсайт и сайт.png

Очень важный параметр и с очень большими значениями — верхняя строчка — это сколько страниц найдено с сайта, релевантных запросу. Важно, сколько внутренних ссылок на сайте — без привязки к текстам. Выигрывают те страницы, на которых их много. И слов запроса во внутренних ссылках тоже очень много. И то, что у вхождений в элементы списка (<li>) высокая значимость, это тоже, скорее всего, про это.

SEO-тексты

Приведем пример типичного seo-текста в интернет-магазине.

А что с SEO-текстами.png

Что об этом можно сказать? Когда мы делали сервис «Тургенев» для проверки текста на риск «Баден-Бадена», мы продумали много разных параметров о текстовой спамности и качестве текста. Мы их делали для себя, чтобы научиться оценивать качество текстов.

Выяснилось, что они неплохо цепляют какие-то тонкие струны души поисковиков.

По тургеневским местам.png

По многим из них оказываются видны или корреляции с позицией, или связь с попаданием в топ. Особенно порадовала выделенная жирным в четвертой строчке снизу очень сильная связь с параметром плотности стилистических проблем в тексте.

Как это делалось? Брали большой словарь разных стилистических ошибок и смотрели, какое количество текста ими покрыто. Выяснилось, что Яндекс к этому неравнодушен (что очень приятно). Вторая вещь, которая очень порадовала — цифра 7,91 в верхней строке. Мы прикинули, от какого значения начинаются совсем плохие тексты после того, как мы им поставили баллы. Поставили порог сильного риска «Баден-Бадена» — 8. В среднем в Яндексе сейчас получается 7,91.

Теперь та таблица, которую мы уже видели, с двумя лишними строчками. Одна — SEO-текст, другая — текст за вычетом SEO-текста.

В Google:

Google сильнее текста.jpg

Что мы видим? В Google основной блок с seo-текстом ранжируется сильнее, чем собственно текст. Буквы «П» гуще, где-то буквы «Т» появляются. А если его вычесть, получается немного пожиже, хотя и не сильно.

В Яндексе иначе:

В Яндексе — прочерки. Ни корреляции с позицией, ни связи с попаданием в топ не видно. А вот если вычесть блок seo-текста, то получается лучше, чем просто текст.

Похоже, что действительно, прежде чем запускать «Баден-Баден», Яндекс научился выделять текстовый блок и игнорировать его.  И когда вы заказываете копирайтеру seo-текст, он на позиции в Google влияет, а на попадание в топ Яндекса — практически нет.



Немного про «Тургенева»

Это наш сервис, который оценивает риск «Баден-Бадена». Рассмотрим в нем текст про кофе.

Тексты глазами Тургенева.png

В этом тексте риск 19 баллов, это очень много. Проблемы с повторами, стилистикой и запросами.

Начнем с повторов.

Повторы.jpg

В тексте нет «сверхчастых» слов, но очень много повторов, таких, которые влияют на метрику «академическая тошнота». Это плохо.

Есть большие проблемы со стилистикой.

Стилистика.jpg

Много слов и выражений, которые либо вообще плохи (например, «вкусовые качества», «вы можете быть уверены, что приобретаете») или просто часто встречаются в не очень хороших текстах.

Есть проблемы с запросами.

Запросы.jpg

В «Тургеневе» эта вкладка умеет конструировать и длинные запросы из ядер и модификаторов, подключая частые словосочетания из текста. Здесь текст оказался покрыт длинными запросами, за что и получил баллы. Все эти ошибки нужно исправлять.


Кейс Balcon-msk.ru

Ласковые ураганы Яндекса.png

Это написал человек, которому действительно удалось почти невозможное. Сейчас средний возраст сайта в результатах поиска Яндекса — то ли девять, то ли десять лет. И за последний год этот средний возраст увеличился на полтора года! То есть обновление результатов поиска идет за счет более старых, крупных, заслуженных сайтов. Новому сайту пролезть в выдачу очень тяжело. Сайтов моложе четырех лет в выдаче примерно столько же, сколько сайтов старше пятнадцати. Тем не менее, им удалось.

Посмотрим, как устроен этот сайт, за счет чего у них это получилось.

Как это сделано.jpg

Внизу примеры карточек товаров. Они разнообразны, но в них поместилась вся нужная лексика.

Домен — один из ключевых факторов. Там указано и главное ключевое слово, и регион. Это знак для Яндекса подкинуть сайт в «многорукого бандита», а дальше срабатывают уже поведенческие факторы.

В разделе «Специалисты» есть недоработки, но это уже ни на что не повлияло.

Результат.jpg

О seo-текстах рассказал Михаил Волович, руководитель «Лаборатории поисковой аналитики» на нашей конференции Optimization в своем докладе «SEO-тексты глазами Яндекса, Google и «Тургенева». Презентация доклада — на сайте конференции.

Доклад прочитал Михаил Волович, руководитель Лаборатории поисковой аналитики «Ашманов и партнеры», на конференции Optimization 2018.

Вам будет интересно

Хотите обсудить ваш проект?
Напишите нам о своих бизнес-задачах, и мы предложим проверенные решения.
Следите за нашими новостями
Подпишитесь на рассылку, и мы будем приглашать вас на наши мероприятия и делиться советами экспертов компании. Рассылка «Практика интернет-маркетинга» выходит дважды в месяц, в ней мы публикуем статьи о продвижении брендов в Интернете, делимся репортажами с крупных отраслевых событий и отвечаем на вопросы читателей.
Спасибо

Вы успешно подписались на рассылку. Теперь вы дважды в месяц будете получать интересные статьи и приглашения на наши мероприятия.

Произошла ошибка

Пожалуйста, попробуйте еще раз