Связаться с нами

Здравствуйте, мы принимаем звонки по будням, 10:00—19:00

Центральный офис в Москве
офис в Санкт-Петербурге

Текстовые параметры релевантности

Методика и инструмент для анализа

09 декабря 2004 года
497

Постановка задачи

На днях на форуме о поисковых системах появился очередной топик из серии "сколько вешать в граммах", тема "% ключевых слов от общего наполнения страницы". Пользователь спрашивает: "Известно, что существует определенный процент наполнения ключевыми словами оптимизируемой страницы сайта... Какой процент наполнения ключевым словосочетанием считается оптимальным к примеру для Яндекса?.."

Вопросы о "определенном проценте наполнения", или попросту "весе" ключевого слова веб-мастера задают регулярно на протяжении ряда лет, но (см. тот же топик) четкого ответа на него нет. Эту интересную задачу мы разберем сейчас подробно.

Процитируем документ Яндекса: "Вот что определяет положение сайта на первой странице поисковой системы при запросе по одному слову. Частотные характеристики: а) частота слова в базе, б) частота слова в документе, в) размер базы, г) размер документа... и т.д."

Очевидно, что из перечисленных характеристик мы можем определить только пп. б) и г), размер же базы Яндекса и частота какого-то слова в ней нам неизвестны.

Отношение частоты слова в документе к размеру документа и называется весом слова. Разные слова в русском языке имеют разные частоты употребления, поэтому из сказанного четко следует - при равных весах ранжирование результатах поиска по разным ключевым словам будет различным, так как зависит от весов разных ключевых слов в базе поисковика. Попросту, для запроса "шарикоподшипники" оптимальным может оказаться вес этого слова на продвигаемой странице в 3-4%, а для "кондиционеров" - 1-2%, только из-за того, что в базе Яндекса веса этих слов различны.

Сформулируем еще короче.

Оптимальные веса для разных ключевых слов - различны.

Это делает бессмысленными попытки вычисления универсального веса. Зато взамен мы имеем очень интересную задачу, а можно ли попытаться определить идеальные параметры частоты слова в документе и размера документа для конкретного слова? Ведь любого веб-мастера и оптимизатора в реальной практике всегда интересует продвижение именно по какому-то конкретному запросу.


Методика решения

Сделать это очень просто: ввести в поисковую систему интересующий запрос и посмотреть каковы веса нужного ключевого слова у страниц, ссылки на которые находятся на первых позициях.

Но опытный веб-мастер знает, что верхние строчки результатов поиска занимают ссылки на авторитетные, хорошо цитируемые сайты, и фактор цитируемости может исказить картину весовых коэффициентов. Поэтому анализировать стоит не только первые 10 позиций, но и посмотреть, каково распределение весов "пониже", в Тор20, Тор30, Тор50.

В выдаче иногда встречаются нетематические ресурсы, дорвеи с редиректом и др. типы страниц, которые следует исключить из анализа.

Таким образом, нам нужно:

  • решить, какой диапазон данных результатов поиска будет взят для анализа;
  • просмотреть выдачу и исключить нетипичные страницы;
  • перейти на анализируемые страницы и снять данные о весах анализируемого ключевого слова;
  • построить таблицу и найти средние значения;

И последний (практический) шаг - сравнить полученные средние данные с параметрами страницы, которую необходимо продвинуть по анализируемому запросу.

Мало кому захочется проводить все эти операции вручную, особенно подсчитывать количество ключевых слов на анализируемых страницах. Но это и не требуется. Если задача поставлена и понята точно, написать программу для ее решения несложно. Я хочу представить вашему вниманию новый инструмент, созданный для проведения описанного выше анализа.

Инструмент для работы

Адрес - http://www.semaster.ru. Вход для авторизованных пользователей.

Путь: Сервисы => Контент-мастер => Добавить => Далее

49-1.jpg

На скриншоте показана ситуация, когда мы "попросили" систему проанализировать страницы, находящиеся в диапазоне с 20 по 40 результаты поиска по запрсу "фейерверки". Сервис должен получить результаты поиска в Яндексе, перейти по каждой из ссылок диапазона Тор20-40 и определить для каждой из найденных страниц следующие параметры:

  • объем документа;
  • количество ключевых слов в документе по заданной маске - "фейерверк", т.е. будут учтены слова "фейерверка", "фейерверком" и подобные;
  • построить таблицу результатов для каждой страницы и вывести строку со средними значениями;
  • получить данные об объеме документа и частотой слова со сравниваемой страницы (она сейчас находится на 41-й позиции) и подставить рядом со средними значениями.

После старта система сообщит, что данные приняты, и когда отчет будет готов, извещение придет по почте. После этого можно снова зайти на СЕМастер, авторизоваться, пройти по пути Сервисы => Отчеты => Контент-мастер => Ключевые слова => Фейерверк и оценить ситуацию уже хорошо "вооруженным" взглядом.

Скриншот данного отчета находится здесь -
http://www.optimization.ru/subscribe/img/049_screen1.gif

Как видим, по параметрам объема документа и частоты ключевого слова сравниваемая страница выглядит несколько "переоптимизированной" - 5,66% против 2,56% среднего значения.

Конечно, не факт, что снижение частоты слова "фейерверк", либо увеличение объема документа на сравниваемой странице продвинет ее выше 41-й позиции. Но подумайте - если бы у вас была задача двигать данную страницу в поиске, пользуясь только текстовыми критериями, что бы вы сделали с весом, обладая данными вышеприведенного анализа? Я бы - понизил, дождался переиндексации и оценил изменение позиции.

Методика анализа результатов поисковой выдачи одинакова для любого параметра: смотрим - получаем данные и средние данные - оцениваем, сравниваем с данными продвигаемой страницы. И на основании этого анализа принимаем решение о направлении коррекции с целью повышения позиции в поиске.

Куда пойдем дальше

Яндекс не единственная поисковая система, и вес - не единственный параметр ранжирования. Развитие предложенного здесь сервиса будет идти по пути увеличения количества анализируемых параметров и подключения к системе других русских и западных поисковиков.

Но метод исследования - универсален, и в большинстве случаев количественные данные могут дать четкое направление для работы по продвижению сайтов в поисковых системах.

Успехов Вам!

Вам будет интересно

Следите за нашими новостями
Подпишитесь на рассылку, и мы будем приглашать вас на наши мероприятия и делиться советами экспертов компании. Рассылка «Практика интернет-маркетинга» выходит дважды в месяц, в ней мы публикуем статьи о продвижении брендов в Интернете, делимся репортажами с крупных отраслевых событий и отвечаем на вопросы читателей.
Спасибо

Для завершения подписки вам необходимо перейти по ссылке,
присланной по указанному адресу email.

Произошла ошибка

Пожалуйста, попробуйте еще раз

Соглашение на обработку персональных данных

Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006 года Вы подтверждаете свое согласие на сбор, хранение и обработку компанией «Ашманов и партнеры» персональных данных, указанных путем заполнения веб-форм на сайте ashmanov.com и его поддоменов *.ashmanov.com.

Компания «Ашманов и партнеры» гарантирует конфиденциальность получаемой информации. Обработка персональных данных осуществляется в целях эффективного исполнения заказов, договоров и иных обязательств, принятых компанией «Ашманов и партнеры» в качестве обязательных к исполнению.

В случае необходимости предоставления Ваших персональных данных правообладателю, дистрибьютору или реселлеру программного обеспечения в целях регистрации программного обеспечения на Ваше имя, Вы даёте согласие на передачу Ваших персональных данных. Компания «Ашманов и партнеры» гарантирует, что правообладатель, дистрибьютор или реселлер программного обеспечения осуществляет защиту персональных данных на условиях, аналогичных изложенным в Соглашении на обработку персональных данных.

Настоящее согласие распространяется на следующие Ваши персональные данные: фамилия, имя и отчество, адрес электронной почты, контактный телефон, платёжные реквизиты.

Персональные данные хранятся и обрабатываются до завершения всех необходимых процедур либо до ликвидации Компании. Вы можете в любой момент отозвать настоящее согласие, направив письменное уведомление на адрес: 121357, Москва, ул. Верейская, д.29, стр. 134, Бизнес-центр «Верейская плаза 3», офис «Ашманов и партнеры» с пометкой «Отзыв согласия на обработку персональных данных». Вы также можете отказаться от получения электронных сообщений, используя ссылку «Отписаться», расположенную в конце каждого письма.

Вы гарантируете, что представленная информация является полной, точной и достоверной, а также что при представлении информации не нарушаются действующее законодательство Российской Федерации, законные права и интересы третьих лиц. Вся предоставленная информация заполнена Вами в отношении себя лично.

Настоящее согласие действует в течение всего периода хранения персональных данных, если иное не предусмотрено законодательством Российской Федерации.