Использование поисковых серверов

Автор работы: Пользователь скрыл имя, 12 Сентября 2013 в 13:44, реферат

Краткое описание

Современный интернет представляет уникальное безграничное хранилище знаний, где можно получить ответ практически на любой вопрос. Фактически, здесь собранно все лучше, что изобретено и создано человечеством как за всю его длинную историю, а также новинки, которые появились только что.

Вложенные файлы: 1 файл

часть 2.docx

— 1.11 Мб (Скачать файл)

МНОГОЯЗЫКОВЫЕ ЗАПРОСЫ

По статистике Мета большая  часть запросов поступает русским  языком. При этом поисковая база Мета содержит документы на русском, украинском и английском языках.

Подобная много язычность задает свои особенности поиска Мета. Например, для того, чтобы получить полный список страниц, которые имеют отношение к образованию, необходимо кроме слова "образование" задействовать также слова "образование" и "education".

Если интересует полнота  поиска - то это наиболее короткий путь, чтобы получить ссылку на весь массив существующих документов.

Конечно, большой массив ответов будет содержать одинаковую информацию, которая просто представлена на разных языках. Однако, за исследованиями, значительное количество страниц не перекрываются, то есть содержат информацию, которая попадает в список результатов только при запросах на определенном языке.

РОССИЙСКО-УКРАИНСКИЕ СОВПАДЕНИЯ

Одинаковое написание  разных по смыслу слов (омонимия) при  поиске по ключевым словам может привести к появлению в списке ответов  достаточно неожиданных результатов.

Например, по слову "письмо" дополнительно к омонимии русского языка: "лист каштана" и "лист бумаги". При поиске на Мета добавляется еще значение "письмо -- письмо" из украинского. То есть кроме омонимии в русском и украинском языках отдельно, появляется еще российско-украинская омонимия: пример ружья - пример перевода,  тяжелое состояние - прокатный состояние и тому подобное.

Частично снять подобную неоднозначность можно с помощью  оператора нормальной формы (поставить перед "подозрительным" словом в запросах восклицательный знак). Если же использовать поиск по фразе, омонимия языка практически не влияет на выдачу результатов поиска.

КЛЮЧЕВАЯ  ФРАЗА

В своей речи люди используют множество стойких выражений, словосочетаний, создатели интернет - страниц пользуются такими же сочетаниями слов в своих документах, и потому, запрос с использованием стойких фраз и выражений, которые относятся к теме поиска - один из могучих способов быстро получить добротную подборку результатов.

Для поиска в подобных случаях  нужно использовать кавычки (скобки) или операторы расстояния, нужно искать не слова, а словосочетания.

Например, по запросу Век живи - в кавычках Мета с большой точностью выдаст страницы, где содержится пословица "Век, живи - век учись" и ее вариации, при этом в короткой аннотации ресурса будет подсвечивать именно ключевая фраза. Запить по фразе "Компьютерная периферия", "курс валют", "прайс-лист" и тому подобное значительно сокращают общее число найденных документов и позволяют уточнить поиск.

КОНЦЕПТ ЗАПРОСА

В самом общем виде концепт - это смысл, который укладывается в запрос. Вопрос в том, каким образом  передать то, что хочется отыскать в ключевых словах запроса? Можно  попробовать поискать информацию в лоб - просто ввести ключевые слова, которые отвечают запросу. Как правило, этого достаточно. Если же результатов поиска нет совсем или они являются не точными, то нужно попробовать переформулировать запрос.

Возможным является и другой подход. Документы, которые содержат нужную информацию, могут не быть присутствуют в индексе Мета, однако, они вероятнее есть где-то в украинском Интернете. Остается только добраться до них, используя более общие за смыслом категории, которые содержат ключевые слова.

Например, если нужно конкретный украинский закон, то лучше искать серверы, которые  посвящены украинскому  законодательству, если же почтовый адрес  определенной организации - лучше попробовать  найти Желтые страницы и так далее 

КАК СОСТАВИТЬ  ЗАПРОС

Поисковая система Мета позволяет  искать по всему украинскому Интернету, а также по Реестру украинских сайтов.

ПОИСК В  ПОВНОТЕКСТОВИЙ БАЗЕ ДАННЫХ

Полнотекстовый поиск происходит с учетом российской и украинской морфологии. Это значит, что независимо от грамматической формы ключевых слов, будут получены документы, которые содержат искомые слова во всех формах.

Например, по запросу глубокие донья будут найдены документы, которые содержат слова глубокое дно, по запросу полотенце вышито - документы, которые содержат слова вышитому полотенцу и тому подобное.

Поисковик имеет следующую особенность: в многословных запросах система не игнорирует так называемые "стоп - слова". Большинство поисковых систем при поиске их игнорируют, то есть, при запросе крем от загара слово "от" будет проигнорировано и среди результатов будут документы со словосочетанием "крем для загара". "META" выдаст документы, которые точно совпадают с запросом.

Чтобы улучшить поиск можно  использовать ряд служебных операторов:

Оператор

Описание

+

Логическое И. Данный оператор по умолчанию и действует первым, то есть запрос украинские рефераты являются равнозначными к  запросу украинские + рефераты

-

Логическое НИ позволяет  исключить из списка результатов  документы, в которых содержится слово, которое идет после оператора.

Например, по запросу: кофейный напиток - кофе, будут найдены только те документы, в которых есть слова кофейный напиток, но нет слова кофе.

|

Логическое ИЛИ позволяет  найти документы, которые содержат хотя бы одно слово в запросах.

Например, по запросу: казаки | казаки будут найдены документы, которые содержат или слово казаки, или слово, казаки.


Порядок действия логических операторов можно задавать круглыми скобками ( ).

Например, по запросу харьковски | киевские предприятия выводятся документы, которые содержат или слово харьковские, или одновременно слова киевские и предприятия, поскольку оператор + действует первым. Если же необходимо найти документы, в которых встречаются слова харьковские предприятия или киевские предприятия, запрос должен быть таким: (харьковские | киевские) предприятия.

Кроме логических выражений  можно определять расстояние между  словами запроса.

Оператор

Описание

"..."

Двойные кавычки позволяют  находить точное словосочетание, что  в них указано. При этом фиксируется грамматическая форма слов, то есть по запросу "погода в Крыму" будут найдены документы, в которых содержится такое же словосочетание, - погода в Крыму.

{...}

Фигурные скобки позволяют находить словосочетание, которое является близким к указанному, т.е. в отличие от предыдущего оператора по запросу {погода в Крыму} будут найдены документы, которые содержат следующие словосочетания: "погода в Крыму", "погоде в Крыму", "погоды в Крыму", то есть грамматическая форма слов в данном случае не фиксируется.

[n ...]

Этот оператор используется в том случае, если необходимо ограничить расстояние между словами запроса.

Например, по запросу [5, мобильный телефон] будут найдены только те документы, в которых слова мобильный и телефон расположенные во фрагменте текста, который не превышает 5 слов.


Предусмотрены также операторы, которые позволяют ограничить область  поиска определенным полем документа.

Оператор

Описание

Title

Данный оператор позволяет  искать только за названием документа.

Например, по запросу: title(прайс-лист) будут найдены те документы, в заглавии которых содержится прайс-лист, по запросу title("доска объявлений") будут найдены документы, которые содержат в заглавии словосочетание доска объявлений.

Heading

Данный оператор позволяет  проводить поиск по названиям  разделов документов.

Например, по запросу: heading (бизнес-план) будут найдены документы, которые содержат бизнес-план в поле heading документов.


ПОИСК ПО РЕЕСТРУ УКРАИНСКИХ САЙТОВ

Как и при полнотекстовом поиске, поиск по реестру ведется с учетом российской, украинской и английской морфологии.

По умолчанию поиск ведется по полнотекстовой базе данных, для поиска по Реестру, следует поставить флажок "искать в Реестре".

Можно ограничить область  поиска отдельной темой или регионом. Для этого необходимо перейти  в соответствующую тематическую/региональную рубрику и поставить флажок "искать в разделе:" или "искать по региону:", при этом поиск будет вестись по полнотекстовому индексу. Если же поставить еще один флажок - "искать в Реестре", то поиск будет проведен только по описаниям сайтов в данном разделе или регионе.

ОПИСАНИЕ  ЗАРУБЕЖНЫХ ПОИСКОВЫХ СИСТЕМ

Больше как 80% всего поиска в Интернете приходиться на 3 основные системы: Google, Yahoo!, MSN.

GOOGLE

(http://www.google.com)

Из небольшой компании, которая основана в сентябре 1998 года Ларри Пейджем и Сергеем Брином, Google превратилась в наибольший отраслевой концерн, который предлагает услуги простого и быстрого поиска информации в Интернете по более чем 8 млрд. сетевых адресов, плюс множественное  число других, не менее интересных сервисов. За эти годы многое изменилось, но неизменной и растущей осталась динамика развития Google. Особенно поражает успешный и последовательный рост компании на фоне поголовного краха, что зацепило в прошлые годы большинство дот - комов.

В настоящее время феноменальный  успех Google связывают не только с  выбранной бизнесовой моделью и удачным направлением деятельности. Сногсшибательный успех компании не был, бы достигнут без тонкого подбору сотрудников и умелого руководства. С августа 2001 года на посту CEO компании находится Ерик Шмидт, которой перешел в Google из Novell и поставил за главную цель увеличение капитализации за счет выхода на новые рынки. Прошлые годы подтвердили правильность выбранной стратегии, и теперь Google является тем, чем является, - около 5 тысяч сотрудников во всем мире, бренд, который известен без комментариев в любом уголке земного шара.

Бренд Google был введен как созвучие математическому  сроку Googol (гугол), придуманному Милтоном Сироттой, племянником американского математика Эдварда Каснера. Он помечает единицу с сотней нулей и замечательно иллюстрирует неисчерпаемые возможности Интернета, которые компания Google постоянно систематизирует и организует, облегчая доступ к разным данным.

Сначала была поставлена цель по организации всей мировой информации, чтобы сделать ее максимально  доступной и полезной для каждого  посетителя Интернета. Для этого  основатели компании Лерри Пейдж  и Сергей Брин разработали новый  алгоритм поиска. Идея создания универсального поисковика и стала залогом нынешнего успеха компании. Более того, в нынешнем своем воплощении поисковый движок доступен не только из главной страницы Google: можно вести поиск через панель инструментов Google, через Google Deskbar в панели заданий Windows без открывания браузера, а также из разных мобильных платформ, включая телефоны в режимах WAP и І-mode.

Поскольку поисковик Google является бесплатным, основной доход компании состоит из предоставления рекламодателям возможности распространять рекламу, которая является релевантной к информации на данной странице. Тысячи рекламодателей используют программу Google Adwords для продвижения своих товаров и услуг с помощью целеустремленных объявлений, тысячи менеджеров сайтов используют Google Adsense для показа объявлений, которые являются релевантными к содержанию сайтов.

От начала разработчики Google отказались от типичного использования  мощностей нескольких серверов, производительность которых уменьшается при пиковых нагрузках, и начали использовать возможности распределенных в сети компьютеров.

Поисковый движок Google проводит серии одновременных расчетов длительностью  доли секунды и использует технологию Pagerank для изучения всей структуры  ссылок Интернета и объективного определения важнейших страниц  путем расчета уравнения из больше 500 переменных и 2 миллиардами сроков. Поисковик Google анализирует качественное содержание страниц - шрифты, подразделы, точное местоположение каждого слова, плюс содержание соседних страниц для обеспечения максимальной релевантности результатов поиска.

В компании Google создана технология поиска для беспроволочных устройств  с моментальным превращением HTML в форматы для режимов WAP, І-mode, J-SKY и Ezweb.

Результатом многолетнего развития поисковой системы Google стало появление  национальных поисковых сервисов: поддерживается разноязычный интерфейс и алгоритму поиска адаптируются к локальным особенностям. Когда поисковый сервис Google стартовал в Китае, то, несмотря на многочисленные сложности, связанные со своеобразной трактовкой свободы слова китайскими властями (Google.com не доступный китайским пользователям приблизительно 10% времени; Google News совсем не работает, Google Images доступный лишь время от времени), сервис работает и набирает популярность.

Google обеспечивает поиск  по гипертекстовым документам, которые  находятся в разных языковых  зонах, - украинской, российской, английской, немецкой и др. Поисковая система  Google имеет собственные под домены для большинства стран, например, для Украины - google.com., для России - google.ru. Это одна из наибольших поисковых баз в мире.

ПРЕИМУЩЕСТВА

    • Использование механизма Pagerank, который отображает "важность" сайта и влияет на выдачу результатов поиска. У Pagerank похожий на индекс цитирования как у Яндекса (он тоже зависит от количества и качества ссылок на ресурс). Но в отличие от Яндекса, влияние Pagerank в Google не настолько значительное, потому люди в Google находят именно то, что и ищут.
    • Google ищет не только гипертекстовые файлы (html), но и файлы, в формате PDF, DOC, Postscript, Corel Word Perfect и др.
    • Поисковая система Google имеет возможность поиска изображений. При этом в запросах можно указать желаемый размер, глубину цвета, формат файла.
    • В отличие от многих поисковиков, работы Google индексируют все страницы, а не лишь самые главные.
    • Все страницы Google кэше (заносит в свою базу), и позволяет пользователю пересматривать документ в кэше Google, не открывая его в первоисточнике (что обычно есть намного быстрее).
    • Google позволяет избрать язык интерфейса, языковые зоны для поиска, количество сообщений при выдаче результатов, но др.
    • Пользователи Microsoft Internet Explorer, Mozilla Firefox и Opera, могут установить себе программу Google Toolbar, которая создает новую панель инструментов, что позволяет искать в Google, не заходя на сам сайт.
    • Строка поиска в Google можно использовать и как калькулятор. Если ввести (48-26)*21, Google выдаст правильный результат.

Информация о работе Использование поисковых серверов