Мы представляем данные о количестве поискового спама в Рунете (данные от руководителя отдела веб-поиска Яндекса Александра Садовского), а также позиция компании Google по вопросу о поисковом спаме и платным ссылкам.
В предыдущей статье я
Смысл поиска за последнее десятилетие сместился с требования "дайте мне то, что я сказал" к "дайте мне то, что мне нужно". Уровень ожиданий пользователя существенно возрос. Мы много работаем над тем, чтобы предугадать и выполнить желания каждого пользователя, и для этого нам нужно лучше понимать и страницы, и запросы, и самих пользователей. За последнее десятилетие мы достигли абсолютно нового уровня в развитии технологий, отвечающих за эти три компонента поискового процесса.
Запросы в Google принято обозначать квадратными скобками [],(см.,
За последние годы мы серьезно вложились в развитие нашей системы обхода и индексирования сайтов. В результате у нас есть очень объемный и актуальный индекс; кроме того, нам удалось улучшить его и по другим параметрам. Одна из ключевых технологий, разработанных нами для лучшего понимания страниц, - это умение выявлять связи страниц с важными понятиями, даже если они отсутствуют на странице. Например, теперь мы умеем находить официальный сайт лондонской
Исключительно важно суметь понять, что именно ищут наши пользователи (не ограничиваясь конкретными словами из поискового запроса). Нам удалось внедрить несколько важных и полезных нововведений, включающих лучшую в своем классе систему подсказок правильного написания, продвинутую систему распознавания синонимов, а также очень мощную систему понятийного анализа.
Большинство пользователей так или иначе сталкивались с нашей системой подсказок правильного написания. Она способна понять, что человек, сделавший запрос [kofee annan] / [коффи аннан], на самом деле хочет найти информацию, касающуюся Кофи Аннана, и делает подсказку вида "Возможно, вы имели в виду kofi annan? (Did you mean: kofi annan? ). То же самое с орфографически неверными поисковыми запросами вида [kofi beans] / [зерна кофи], когда на самом деле пользователь ищет информацию о зернах кофе. Умение качественно выдавать такого рода подсказки на разных языках - нелегкая задача, но мы справляемся с ней.
Синонимы - это основа нашей работы над пониманием поисковых запросов, и это одна из самых сложных задач, которую приходится решать Гуглу. Казалось бы, синонимы - это так просто и естественно; но для автоматических систем обработки языка они представляют собой все еще не решенную задачу. Как пользователь я не слишком долго думаю, какие именно слова следовало бы употребить в запросе. Иногда я даже не знаю, какие слова - правильные. Вот тут-то и появляется необходимость в нашей системе синонимизации. Она способна хитроумно модифицировать поисковые запросы: так, в запросе вида [Dr Zhivago] (Доктор Живаго) ей понятно, что аббревиатура "Dr" означает "Doctor", а в запросе вида [Rodeo Dr] (ул. Родео Драйв) под "Dr" имеется в виду "Drive" (дорога, улица). Пользователь, набравший [back bumper repair] (починить бампер сзади) получает результаты о починке заднего бампера автомобиля. По запросу [Ramstein ab] мы находим авиабазу Ramstein Air Base, а по запросу [b&b ab] - мотель в канадской провинции Альберта (Bed and Breakfasts, Alberta, Canada). Данная система понимания и трансформации поисковых запросов была внедрена и уже работает более чем на ста различных языках планеты, и я действительно очень этим горжусь.
Следующая технология, используемая в нашей системе ранжирования, - идентификация понятий. Вычленение важных понятий в запросе позволяет нам предоставлять пользователю гораздо более релевантную выдачу. К примеру, наш алгоритм умеет понимать, что при запросе [new york times square church] пользователю нужна информация о знаменитой
Мы работаем над пониманием намерений пользователей для того, чтобы показывать им именно ту информацию, которую они хотят увидеть, а не только то, что они написали в поисковом запросе. В основе этой работы лежит наша система локализации, а также продвинутая система персонализации. Кроме этого, в процедуру интерпретации пользовательских запросов было внедрено
(
нашей рассылки, см.
Информация о подписке на РВ находится здесь -
Степан Овчинников
Сергей Кошкин, генеральный директор компании SmartSeo,
В комментариях ЖЖ Артемия Лебедева оказался программист Google. Он
В русском блоге Google
Вам будет интересно
Доставляем экспертный контент
Мы делимся с подписчиками экспертным контентом: отправляем полезные статьи, советы от специалистов, приглашаем на вебинары. Подпишитесь, чтобы узнать больше о продвижении бизнеса в Интернете, наших мероприятиях и репортажах с крупных отраслевых событий. Выберите наиболее удобную платформу для вас и наслаждайтесь контентом!
Нажимая на кнопку «Подписаться», я даю согласие на обработку персональных данных и соглашаюсь c политикой конфиденциальности
Мы отправили вам проверочое письмо — пожалуйста, подтвердите адрес электронной почты, перейдя по ссылке внутри письма.
Пожалуйста, попробуйте еще раз