Знакомимся с микроформатами

Как хорошо известно специалистам, в последнее время поисковики уделяют особенно много внимания виду SERP и полезности сниппетов, зачастую давая возможность организациям оптимизировать вид сниппета, сделав его максимально информативным и привлекательным.

Начнём с самого начала. Известно, что пользователь склонен перейти по ссылке, сниппет которой в поисковой выдаче наиболее информативен, т.е. содержит наиболее релевантную и лаконичную информацию о содержании целевой страницы, а также в сжатом виде содержит дополнительную информацию: уменьшенную версию ключевой иллюстрации, номер телефона организации и т.д. Почему такие сниппеты невозможно автоматически генерировать для любого сайта?

Действительно, в базе данных сайта контент зачастую хранится в структурированном виде. Но как только движок достаёт из базы данных этот контент для создания веб-страницы, информация о структуре чаще всего теряется. Ото всей разметки в лучшем случае остаётся атрибут стиля, позволяющий тем или иным способом отформатировать элемент через CSS. И хотя поисковые роботы со временем умнеют, они пока не могут интерпретировать закэшированную информацию так же хорошо, как это умеют делать люди. Поэтому в сниппет SERP может попасть не совсем та информация, которую хотелось бы там видеть оптимизатору.

Для этого используется механизм под названием "HTML microdata", иначе «микроформат», являющийся запланированной частью стандарта HTML5. Фактически, это метаданные для любого типа информации (текст, графика, видео), которые говорят роботу, что именно он кэширует.

Это даёт поисковикам возможность вместо обычного сниппета с фрагментом текста и ссылкой создавать более информативный сниппет, содержащий больше полезной информации. Например, для сайта организации может быть сразу приведён телефон и адрес офиса со ссылкой на карту в Google Maps.

HTML microdata описывает способ разметки контента метаданными, а schema.org предлагает конкретный словарь метаданных, о котором договорились разработчики упомянутых выше поисковиков.

Корневым атрибутом является itemscope, который говорит, что далее следует описание чего-либо. Затем используется атрибут itemtype, который позволяет указать тип описываемого объекта. Таких типов в словаре schema.org сейчас 20: от кинофильма и книги до события и организации. Для каждого типа объекта определён свой набор свойств, каждое из которых определяется через атрибут itemprop.

Вот простой пример разметки для сайта с базой по кинофильмам.

<div itemscope itemtype ="http://schema.org/Movie"> <h1 itemprop="name">Ханна. Совершенное оружие</h1> <div itemprop="director" itemscope itemtype="http://schema.org/Person"> Режиссёр: <span itemprop="name">Джо Райт</span> (родился в <span itemprop="birthDate">1972</span> году) </div> <span itemprop="genre">Триллер</span> <a href="../movies/hanna-theatrical-trailer.html" itemprop="trailer">Трейлер</a></div>

Как видите, всё, что вам нужно сделать — доработать используемую CMS так, чтобы она добавляла нужные атрибуты и значения к информации, извлекаемой из определённых полей таблиц БД, а в отдельных случаях, когда речь идёт об описательном тексте, — добавлять метаданные вручную.

Остаётся лишь разобраться, как можно протестировать отформатированную страницу, не дожидаясь повторной индексации. В Google заботливо подготовили инструмент тестирования, который для выбранной страницы выводит предпросмотр сниппета и дерево извлечённых структурированных данных с предупреждениями об ошибках. Это позволяет достаточно быстро отладить вывод данных в обновлённом движке сайта.

А что же с Яндексом? С некоторых пор Яндекс также поддерживает микроформаты, но использует для этого другой подход к разметке и другой словарь. В качестве стандарта Яндекс использует микроформаты, определённые на microformats.org, где для описания используется атрибут class. Таким образом если вас заботит вид сниппета в поисковой выдаче как Google, так и Яндекс, придётся реализовать оба способа. Справку по используемым Яндексом микроформатам вы можете получить в справочной системе для веб-мастеров.

Как найти пропавшие ссылки

Иногда выбранный ранее движок сайта себя исчерпывает, и наступает время заменить его на новый, более соответствующим современным требованиям. Предположим, что вы уже перенесли контент из одной базы данных в другую, новый сайт успел проиндексироваться поисковиками, но почему-то трафик упал.

Связано это обычно с тем, что при переносе контента URL существовавших страниц изменились, а значит, вся накопленная ссылочная масса бэклинков потеряна. Организовать 301-ые редиректы, которые автоматически направят пришедшего по старой ссылке на новую страницу — не проблема. Но как найти все потерянные страницы?

Мы считаем следующие четыре способа наиболее действенными.

1. Инструменты аналитики посещений

На многих сайтах используется Google Analytics. Будем считать, что вы уже перешли на пробный новый интерфейс, предлагающий дополнительные инструменты. Нам понадобится как раз один из таких инструментов: анализатор органичных заходов с поисковиков.

В меню выберите "Traffic Sources > Incoming Sources > Search > Organic". По умолчанию будут показаны ключевые слова (Keyword), которые нам в данном случае не помогут, поэтому переключитесь на целевые страницы (Landing pages). Затем выберите промежуток времени до перехода на новый движок. Теперь в отчёте будут перечисляться все страницы, получавшие трафик до смены движка.

Явный недостаток этого подхода состоит в следующем: в списке перечисляются именно все страницы, а не только те, что находились поисковиком, а затем перестали. Зато здесь можно посмотреть полезную статистику по заходам на эти страницы, а указав диапазон так, чтобы посередине временного отрезка оказался момент замены движка, вы сможете оценить масштабы бедствия. Для просмотра именно выпавших из поиска страниц есть другие инструменты.

2. Инструменты аналитики поисковиков для веб-мастеров

Если говорить о России, основных инструментов такого рода два: Google Webmaster Tools («Инструменты для веб-мастеров») и Яндекс.Вебмастер. Начнём с Google Webmaster Tools.

Если права на управление сайтом уже подтверждены, авторизуйтесь и в боковой панели переключитесь в раздел «Диагностика > Ошибки сканирования» ("Diagnostics > Crawl errors"), а затем справа включите показ не найденных страниц ("Not found"). Здесь будут показаны все страницы с 404-й ошибкой, то есть ранее закэшированные Google, но более не находимые роботом поисковика на сайте. С большой вероятностью это и есть страницы, на которые необходимо поставить редиректы. Чтобы делать это было удобнее, воспользуйтесь ссылкой под таблицей для экспорта всех данных в файл формата CSV, где в первом столбце будут перечисляться URL.

Примерно так же работает анализатор Яндекса: выбрав управляемый сайт, в боковой панели выберите «Исключённые страницы > По типу» и перейдите по ссылке «HTTP-статус: Ресурс не найден (404)». Полученные данные для последующего анализа вы можете точно так же экспортировать в электронную таблицу CSV, либо XLS.

3. Использование Open Site Explorer

Этот инструмент аналитики позволяет вывести список внешних ссылок на страницы вашего сайта, а также показывает авторитетность соответствующих страниц и сайта, с которого проставлена ссылка. Таким образом вы можете получить не только список входящих ссылок, но и определить приоритетность выставления редиректов.

В фильтре для "links from" выставьте значение "External Pages Only" (только внешние страницы), а для "to" — "All Pages on the Root Domain" (все страницы корневого домена). Это даст вам все внешние ссылки, ссылающиеся на все страницы корневого домена.

4. Анализ бэкапа

В зависимости от того, кто и как планировал переезд на новый движок или внутренний редизайн, у предыдущей версии сайта может оказаться бэкап. Вы можете развернуть этот бэкап на локальной машине и проанализировать структуру URL, а затем спланировать создание редиректов.

Кроме того, бэкап будет полезен для анализа, как именно страницы были оптимизированы, какие ключевые слова использовались для наиболее важных страниц и так далее. Если миграцию на новую CMS производили не вы, эта информация практически бесценна.

Оригинал статьи опубликован на сайте searchenginejournal.com.

10.06.2011

Следите за нашими новостями

Подпишитесь на рассылку, и мы будем приглашать вас на наши мероприятия и делиться советами экспертов компании. Рассылка «Практика интернет-маркетинга» выходит дважды в месяц, в ней мы публикуем статьи о продвижении брендов в Интернете, делимся репортажами с крупных отраслевых событий и отвечаем на вопросы читателей.
Спасибо

Для завершения подписки вам необходимо перейти по ссылке,
присланной по указанному адресу email.

Произошла ошибка

Пожалуйста, попробуйте еще раз