Индексация сайтов
Реферат, 20 Мая 2013, автор: пользователь скрыл имя
Краткое описание
Для начала давайте разберемся с терминологией. Индексация страницы – это посещение страницы поисковым роботом какой-либо поисковой системы и занесение ее в базу данных поисковика. Поисковой робот - это программа, встроенная в поисковую систему как её составная часть и подчиняющаяся алгоритмам этой поисковой системы.
Вложенные файлы: 1 файл
ИПСИС.docx
— 172.06 Кб (Скачать файл)similatiry(Q,D) = SUM(wqk*wdk),
где similatiry(Q,D) — схожесть запроса Q документу D; wqk — вес k-го слова в запросе; wdk — вес k-го слова в документе.
Документы, наиболее схожие с запросом, попадают в результаты поиска.
Ранжирование.
После того, как наиболее схожие документы были отобраны из основной коллекции, они должны ранжироваться, чтобы в верхних результатах отражались наиболее полезные для пользователя ресурсы. Для этого используется специальная формула ранжирования, которая для разных поисковиков имеет разный вид, однако для всех из них основными факторами ранжирования являются:
- вес страницы (Мера “важности” страницы в поисковой системе. Зависит от числа внешних ссылок на данную страницу и от их веса (важности). Другими словами, от количества и качества ссылающихся страниц. А если говорить математическим языком, то это алгоритм расчёта авторитетности страницы, используемый поисковой системой.)
- авторитетность домена(история домена, частота запроса в поиске этого домена, ссылки на домен с авторитетных сайтов);
- релевантность текста запросу;
- релевантность текстов внешних ссылок запросу;
Существует упрощенная формула
ранжирования, которую можно найти
в некоторых статьях
Rа(x)=(m*Tа(x)+p*Lа(x))* F(PRa),
где:
Rа(x) – итоговое соответствие документа а запросу x,
Tа(x) – релевантность текста (кода) документа а запросу x,
Lа(x) – релевантность текста ссылок с других документов на документ а запросу x,
PRа – показатель авторитетности страницы а, константа относительно х,
F(PRa) – монотонно неубывающая функция, причем F(0)=1, можно допустить, что F(PRa) = (1+q*PRа),
m, p, q – некие коэффициенты.
То есть, мы должны знать, что при ранжировании документов используются, как внутренние факторы, так и внешние. А также можно их разделить на зависимые от запроса факторы (релевантность текста документа или ссылок) и независимые от запроса. Современные поисковые роботы, например, Google Panda или Google Penguin) разрабатываются на основе тысяч отзывов живых людей, которые оценивают релевантность выдаваемых поисковиком страниц их запросам, то есть с каждой новой версией эти системы приближаются к искусственному интелекту, а значит, сайт следует писать для людей, чтобы робот как можно выше разместил его в результатах поиска.
Заключение.
Основываясь на приведенных рекоммендациях по написанию сайта для его последующей успешной индексации поисковым роботом и на критериях поисковиков по ранжированию поисковой выдачи, можно сделать вывод, что порой тщательная проработка сайта и его контента может заменить весомый и зачастую дорогостоящий блок SEO раскрутки и даже вывести ваш проект в лидеры поисковой выдачи.
Список литературы.
- Интернет-ресурс Webkomora. (http://webkomora.com.ua/ru/
articles/web/raskrutka/) - Интернет-ресурс ktonaNovenkogo.ru. (http://ktonanovenkogo.ru/seo/
search/kak-rabotayut- poiskovye-sistemy-snippet- index.html) - Яндекс помощь. Вебмастер. (http://help.yandex.ru/
webmaster/?id=1111858) - Интернет-ресурс Search Bot. (http://search-bot.net/kak-
rabotaet-poiskovyj-robot/) - SEO блог Сергея Кокшарова на сайте devaka.ru (http://devaka.ru/articles/
how-search-engines-work)