Автор работы: Пользователь скрыл имя, 20 Мая 2013 в 02:45, реферат
Для начала давайте разберемся с терминологией. Индексация страницы – это посещение страницы поисковым роботом какой-либо поисковой системы и занесение ее в базу данных поисковика. Поисковой робот - это программа, встроенная в поисковую систему как её составная часть и подчиняющаяся алгоритмам этой поисковой системы.
similatiry(Q,D) = SUM(wqk*wdk),
где similatiry(Q,D) — схожесть запроса Q документу D; wqk — вес k-го слова в запросе; wdk — вес k-го слова в документе.
Документы, наиболее схожие с запросом, попадают в результаты поиска.
Ранжирование.
После того, как наиболее схожие документы были отобраны из основной коллекции, они должны ранжироваться, чтобы в верхних результатах отражались наиболее полезные для пользователя ресурсы. Для этого используется специальная формула ранжирования, которая для разных поисковиков имеет разный вид, однако для всех из них основными факторами ранжирования являются:
Существует упрощенная формула
ранжирования, которую можно найти
в некоторых статьях
Rа(x)=(m*Tа(x)+p*Lа(x))* F(PRa),
где:
Rа(x) – итоговое соответствие документа а запросу x,
Tа(x) – релевантность текста (кода) документа а запросу x,
Lа(x) – релевантность текста ссылок с других документов на документ а запросу x,
PRа – показатель авторитетности страницы а, константа относительно х,
F(PRa) – монотонно неубывающая функция, причем F(0)=1, можно допустить, что F(PRa) = (1+q*PRа),
m, p, q – некие коэффициенты.
То есть, мы должны знать, что при ранжировании документов используются, как внутренние факторы, так и внешние. А также можно их разделить на зависимые от запроса факторы (релевантность текста документа или ссылок) и независимые от запроса. Современные поисковые роботы, например, Google Panda или Google Penguin) разрабатываются на основе тысяч отзывов живых людей, которые оценивают релевантность выдаваемых поисковиком страниц их запросам, то есть с каждой новой версией эти системы приближаются к искусственному интелекту, а значит, сайт следует писать для людей, чтобы робот как можно выше разместил его в результатах поиска.
Заключение.
Основываясь на приведенных рекоммендациях по написанию сайта для его последующей успешной индексации поисковым роботом и на критериях поисковиков по ранжированию поисковой выдачи, можно сделать вывод, что порой тщательная проработка сайта и его контента может заменить весомый и зачастую дорогостоящий блок SEO раскрутки и даже вывести ваш проект в лидеры поисковой выдачи.
Список литературы.