Автор работы: Пользователь скрыл имя, 29 Мая 2012 в 08:48, творческая работа
Поисковая система (машина) - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде поискового запроса, выдачей списка ссылок на источники информации, в порядке релевантности.
Оценка релевантности поиска
Выполнил: студент 2-го курса
заочного отделения
специальность «Менеджмент»
Якутович Е.С.
Поисковые машины
Поисковая система (машина) - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде поискового запроса, выдачей списка ссылок на источники информации, в порядке релевантности.
И хотя каждая машина поиска использует уникальный способ сбора информации, все они служат общей цели – быстро находить информацию, которая вам нужна.
Что такое релевантность?
Одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть оценка степени соответствия выдачи поисковых результатов ожиданиям пользователя, обратившегося с конкретным поисковым запросом. И чем выше эта степень, тем довольней будет пользователь.
Показатели эффективности
Показатели эффективности
Пертинентность— это субъективно оцениваемое соответствие содержания документов информационным интересам потребителя. Оценки пертинентности могут отличаться от результатов, полученных на основе оценок релевантности.
Рассмотрим пример
Мы решили купить загородный
дом, и чтобы его пробрести
в намеченном нами регионе,
пытаемся вначале изучить цены
на рынке недвижимости. Вводим
в поисковой системе слово
«загородный дом» и получаем:
«благоустройство загородного
Критерии релевантности
В каждом поисковике существует собственный алгоритм определения релевантности, который представляет собой математическую формулу с не одной сотней параметров, ежедневно изменяющимися с целью предотвращения взлома.
Работая
над основной своей задачей
– точностью поисковой выдачи
– поисковые машины были
Принцип цитируемости
« Случайный сёрфер»
Google ввел понятие «случайного сёрфера» – то есть абстрактного человека, который бродит по Сети, переходя с ссылки на ссылку и просматривая все новые и новые страницы. По сути, Page Rank – это попытка поисковой машины предсказать и использовать в качестве критерия вероятность того, что случайный пользователь попадет на ту или иную страницу.
Google Page Rank
R(A)= C*(R(B1)/N1+...+R(Bi)/Ni)
где:
R(A) – Page Rank страницы;
R(Bi) – Page Rank ссылающейся страницы Bi;
Ni – количество ссылок на странице B;
С – коэффициент затухания, используется для страницы или группы страниц. Препятствует «накрутке» Page Rank. Обычно равен 0,85.
Google ранжирует значение PR от 0 до 10.
Яндекс тИЦ
Несмотря на свою заслуженную популярность, формула Page Rank никак не учитывала качественную характеристику ссылок. Именно поэтому Яндекс разработал собственный алгоритм учета внешних ссылок.
Тематический индекс цитирования (тИЦ) в поисковой системе Яндекс был создан, чтобы определять релевантность web-ресурсов в Яндекс Каталоге, принимая во внимание качество ссылок на них с других сайтов. Качество ссылки определялось количеством ссылок и тематической схожестью ссылающихся на ресурс сайтов (ссылки с иностранных ресурсов полностью игнорировалось).
В системе Rambler тоже есть своя особенность. Он придает большой вес собственному рейтингу и даже использует некий фильтр ссылок. В будущем предлагается учитывать релевантность страниц по оценкам других людей.
В Yahoo это уже работает: пользователь может самостоятельно добавить описание и ключевые слова к любой найденной странице. Однако на сегодняшний день при определении релевантности все меньше учитываются Page Rank, тИЦ, и другие подобные показатели, которые можно поднять искусственно. Поисковые машины становятся все умнее и при сортировке страниц большое значение уделяют содержимому страницы, они становятся все больше похожими на людей.