Информацию о том, каким образом происходит индексирование тех или иных частей сайта, и как они будут представлены в результатах поиска, можно получать разными способами. Из инструкции по использованию данным поисковиком, из информации, оставляемой разработчиками поисковой машины в интервью, на форумах, семинарах. Можно прислушиваться к мнению других веб-мастеров. Однако наиболее достоверную информацию можно получить, самостоятельно проведя опыт, особенно если характер информации не количественный, а качественный.
В данном случае автор заинтересовался вопросом, как относятся поисковые машины к сайтам с фреймами. Хорошо известно, что все современные поисковые машины индексируют такие сайты и хранят в базе каждый фрейм как отдельный документ. С этим связаны известные неудобства, когда посетитель приходит с поисковой машины и находит отдельный документ с основным содержанием, открывает его, но не видит всей фреймовой структуры, в которой обычно находится навигация. Известны способы сглаживания этого неудобства с помощью javascript более или менее успешные в зависимости от сложности фреймовой структуры.
Проблема усугубляется тем, что сам документ с фреймовой структурой (<frameset>) как правило, никакого полезного содержания не имеет, кроме заголовка, а только указание на документы, из которых брать содержимое этих самых фреймов. Если бы поисковые системы ранжировали сам фреймсет выше, чем составляющие его документы, проблема бы отпала, т.к. посетитель сразу открыл бы всю структуру, как если бы зашел через начало сайта по ссылкам.
Стандартом HTML 3.2 и выше предусмотрен тег <noframes>, предлагающий броузеру, не поддерживающему фреймы альтернативное содержание. Ведь робот поисковой машины можно считать именно таким - простым текстовым броузером, не поддерживающим фреймы. Т.е. он может их посмотреть по очереди. В некоторых случаях вебмастера пишут в тег <noframes> обидные надписи, например "ваш броузер не поддерживает фреймы, поставьте себе что-нибудь поновее". Но более полезно в этом теге разместить краткое содержание страницы и навигацию.
Главная задача этой статьи - выяснить, как поисковые машины относятся к содержимому между тегами <noframes>...</noframes>, а заодно и тегу <iframe>. Для этого можно поискать в поисковых машинах характерные фразы, которые в таких случаях обычно пишут, например: "ваш броузер не поддерживает фреймы".
На 11 сентября 2003 г. Яндекс выдал 12 ссылок (сгруппированных по сайтам) со
строгим соответствием запросу "
Впрочем, на первом сайте найдено 17 страниц, а на остальных - по 1 странице. Бросается в глаза, что 5 ссылок имеют возраст 2.5 - 4 года. Посмотрим, что в коде страниц:
Итак, подведем итог: из 12 ссылок 9 годятся для анализа. Из них искомый текст найден внутри корректно поставленного тега <noframes> в ссылках № 4,5,9 и 10. Дата последнего изменения этих документов, известная Яндексу находится в диапазоне от июня 1999 г. до марта 2001 г. В документе №6 за август 2002 г. фраза найдена в теге <iframe>. В остальных случаях фраза найдена в теге <body>, стоящем после закрытия тега <frameset>.
Итак, делаем запрос: "ваш броузер не поддерживает фреймы"
Видно, что содержимое тега <iframe> индексируется. Но поскольку из 15 страниц, нужная фраза ни разу не встретилась в теге <noframes>, можно предположить, что его содержимое не индексируется. Если кто-то в этом еще сомневается - пусть проверит еще пару страниц выдачи Рамблера ;).
В случае с Апортом пришлось урезать искомую фразу до "ваш броузер поддерживает фреймы", выкинув частичку "не". Иначе, Апорт не находит ни одного документа.
По запросу "поддерживает плавающие фреймы" легко убедиться, что Апорт индексирует текст внутри тега <iframe>.
Итак, можно сделать вывод, что Апорт индексирует текст в теге
<noframes> и использует его в поиске.
Чтобы закрепить выводы и проверить, какова ситуация для
свежепроиндексированных (или свежепереиндексированных) сайтов, можно
спланировать отдельный эксперимент. Для этого был сделан мини-сайт
index.htm - ссылается на главный фреймсет опыта: frameset.htm и на plain.htm. frameset.htm открывает узкий верхний фрейм top.htm и нижний фрейм bottom.htm. В теге <noframes> документа frameset.htm написано:
"Ваш броузер супер-стар и ничего не знает о фреймах. Не волнуйтесь, мы позаботились и о таких дремучих юзерах, как вы. Вы тоже узнаете, что самое мокрое место на Земле - Черрапунджи в Индии, там выпадает в 10 раз больше дождей, чем в деревне Гадюкино."
Внутри нижнего фрейма bottom.htm встроен плавающий фрейм, с содержимым из файла iframe.htm и альтернативным текстом: "Ваш броузер супер-стар и ничего не знает о фреймах. Не волнуйтесь, мы позаботились и о таких дремучих юзерах, как вы. Вы тоже узнаете, что самое мокрое место на Земле - Черрапунджи в Индии, там выпадает в 10 раз больше дождей, чем в деревне Гадюкино. Альтернативное содержимое Iframe Полечудес - 321 мм осадков".
Посмотрим, как это проиндексировали Яндекс, Рамблер и Апорт.
С помощью "Расширенного поиска"
Увы, выдается всего 2 документа: top.htm и plain.htm. По запросу "
Получается, что до 2001 г. включительно Яндекс использовал текст в <noframes>, но в какой-то момент - перестал. Таким кардинальным образом Яндекс решил проблему с вебмастерами, спамящими в теге <noframes>.
Непонятная ситуация. При поиске по сайту,
Здесь, похоже все в порядке. По запросу, содержащемуся в теге
<noframes> "
Тоже смотрит в <noframes>: запрос "
Сайт пока не попал в ее индекс.
"Тег <NOFRAMES> индексят все наши поисковики из "большой тройки", ну и
многие импортные - Google, AV, Lycos - точно. Excite, похоже, нет."
Форум Яндекса, некто Андрей [29.05.03 17:50]:
Re: Фреймы "Уважаемые господа! Кто бы что бы не
говорил, а Яндекс с новым алгоритмом (последнего года) фреймы не индексирует.
Точнее, он их индексирует, но придает столь малый вес, что сайт, построенный на
фреймах, в любом запросе "улетит" вниз. Из практического опыта - хочешь попасть
на первые 20 страниц - забудь о фреймах."
Выводам настоящей статьи это не противоречит, действительно ситуация в Яндексе поменялась.
Автор не отвечает за любые последствия, к которым может привести неправильное использование приведенных результатов, например, исключение каких-либо сайтов из поисковых индексов. Не гарантируется, что приведенные адреса будут работать на момент прочтения статьи и иметь то же содержание. Не гарантируется и то, что поисковые машины за это время не изменили свои алгоритмы. С другой стороны, автор приложит все имеющиеся возможности, чтобы сделанный сайт seo-test.videoconferencing.ru просуществовал подольше и подписчики рассылки могли по прошествии времени проверить сделанные выводы снова.
Для завершения подписки вам необходимо перейти по ссылке,
присланной по указанному адресу email.
Пожалуйста, попробуйте еще раз