Использование поисковых серверов

Автор работы: Пользователь скрыл имя, 12 Сентября 2013 в 13:44, реферат

Краткое описание

Современный интернет представляет уникальное безграничное хранилище знаний, где можно получить ответ практически на любой вопрос. Фактически, здесь собранно все лучше, что изобретено и создано человечеством как за всю его длинную историю, а также новинки, которые появились только что.

Вложенные файлы: 1 файл

часть 2.docx

— 1.11 Мб (Скачать файл)

СЕРВИСЫ GOOGLE

Возможности Google не ограничены лишь традиционным "джентльменским набором" поисковика с расширенными настройками и новостями. Ниже приведен короткий и неполный список современных сервисов Google:

    • Google Local- находит местные предприятия и услуги в Интернете
    • Google Mac - поиск по сайтам тематики Apple/macintosh
    • Googles University Search - поиск по университетам
    • Google Linux - поиск по сайтам тематики Linux
    • Google GOV - поиск по всем государственным (*.gov) и военным (*.mil) сайтам
    • Froogle - поиск товаров/продукции
    • Google Options - опции
    • Google Map Site - карта сайта
    • Google Features - перечень разнообразных особенностей
    • Google Microsoft - поиск по сайтам Microsoft
    • Google Labs - сервисы
    • Hacker Style Google - в оригинальном стиле
    • Google BSD - поиск по BSD-сайтах
    • Google Наоборот - google в зеркальном отображении
    • Google Schoolar - поиск среди статей, книг, оглядел научной литературы и учебников
    • Google Firefox - для фанатов Mozilla Firefox
    • Google Fight - поединок: нужно ввести два слова, и поисковик покажет, которое из них ссылается на большее количество страниц
    • Google Suggest - возможны варианты того, которое нужно, с показом количеству страниц по данному запросу
    • Cheatoogle - поиск по читам и кодов к играм
    • Google Easter - пасхальный кролик
    • Gmail - почта от Google
    • Video google - поиск видео
    • Google для мобильников и КПК - мини-версия для удобной работы из мобильных телефонов и КПК
    • Mobile Google - сервис для мобильной связи
    • Google Fan Logos - сайт с логотипами на тему Google
    • Google Holliday Logos - праздничные логотипы
    • Официальные и Неофициальные - логотипы Google
    • Google April Fools - поиск обо всем, что связано с днем дураков
    • Google Maps - поиск по картам
    • Google Blog - официальный блог Google
    • Google News - новости от Google
    • Google Print - поиск Google по миллионам оцифрованных книг, библиотек Гарварда, Стэнфорда, Оксфорда, Мичигана, а также из Нью-йоркской Публичной библиотеки
    • Google Earth - программа для обзора Земли из космоса
    • Can't find on google - сайт с перечнем запросов, в ответ на которые выдается не то, которое нужно
    • Googlegulp - напитки от Google
    • Uncle Sam - "патриотический" поисковик
    • Blogsearch - поиск по блогам и ЖЖ
    • Google Webmasters Guidelines - информация и советы Google для веб - разработчиков
    • Google Reader - Google Reader
    • Google Code - для кодеров, открытые исходники и так далее
    • Google VPN - бесплатный VPN-сервис от Google
    • Google Alerts - отслеживает появление новых страниц на поисковый запрос и сообщает об этом на e-mail
    • Google Answers - можно задать вопрос, указать сумму вознаграждения за ответ и дождаться ответа
    • Personalized Google Search - поиск с учетом настроек и потребностей пользователя
    • Googlestore - магазин с аксессуарами в стиле и с логотипами Google
    • Google Trade Catalogs - каталог товаров
    • Google Personalize Homepage - подготовка поиска и внешнего вида Google под себя
    • Google Base - база данных от Гугл, можно загрузить будь что

И это далеко не полный перечень возможностей, сервисы Google постоянно  пополняются, а их качество, совершенствуется.

YAHOO

(http://www.yahoo.com)

Yahoo было основано в  1994, и на сегодняшний день это  самый старый и наиболее полный  каталог Интернет-ресурсов.

Эта невероятно популярная система, которая обслуживает миллионы запросов ежедневно, зародилась как  простая коллекция закладок, которую  пополняли всего 2 человека, - Дэвид Фило и Джерри Янг.

Yahoo является самым популярным  поисковым средством, и секрет его успеха Yahoo кроется в людях. Над составлением и редактированием содержания каталогов Yahoo работают свыше 150 редакторов. Yahoo имеет базу данных в более чем 1 млн. проиндексированных сайтов. Также, в случае нехватки собственной базы данных, Yahoo использует базу данных Google (до июля 2000 года Yahoo пользовался базой данных Inktomi).

ALTA-VISTA

(http://www.alta-vista.com)

Altavista начала предоставлять  свои услуги в декабре 1995 года и на сегодняшний день является одной из наиболее больших поисковых систем (за количеством проиндексированных страниц). Как особенность поисковика можно отметить возможность поиска за усложненными критериями отбора. Altavista предлагает дополнительные услуги в виде поиска по каталогам (взятых из Open Directory and Looksmart), а также службу под названием "Ask Altavista" ("спроси Altavista"), результаты которого берутся из Ask Jeeves. На данное время Altavista является владельцем поисковой системы Raging Search.

MSN

(http://www.msn.com)

Поисковик разработано и запущено компанией Microsoft в 1997 роке.

В отличие от других поисковых  систем, раньше у MSN никогда не было собственного паука или каталога. С 1997 года для выдачи результатов поиска использовались разные базы данных, такие как: Yahoo!, Looksmart, Altavista, Directhit, Inktomi и Realnames.

Только с начала 2005 года MSN запустил бета-версию собственного поискового алгоритма. Пользователи MSN Search могут осуществлять поиск, как по всему Интернету, так и по отдельным тематическим категориям, в том числе и по энциклопедии Microsoft Encarta.

Новый движок содержит возможность  локализованного поиска (Near Me) - система  способна автоматически определять местонахождение пользователя по IP - адресу его компьютера.

ОПИСАНИЕ  РОССИЙСКИХ ПОИСКОВЫХ СИСТЕМ

В Рунете основными являются поисковые системы Яndex, Rambler и Mail.ru. На диаграмме представлен удельный вес разных поисковых машин Рунету.

 

YANDEX.RU

(http://yandex.ru)

(Упрощенно  - http://ya.ru)

Yandex выполняет поиск по  славяноязычной части Интернета с учетом морфологии славянских языков. Имея могучий механизм подбору сайтов под запросы, эта поисковая машина помогает найти наиболее соответствующие веб - страницы. Яндекс ежедневно пересматривает сотни тысяч веб-страниц в поисках изменений или новых ссылок, и их база постоянно растет.

Слово "Яndex" означает "Языковой индекс", или, если по-английски, "Yandex" - "Yet Another indexer". За 10 годы публичного существования Яndex возникали и другие толкования. Например, если в слове "Index" перевести с английского первую букву ("I" - "Я"), выйдет "Яndex".

Официально поисковая  машина Yandex.Ru была анонсирована 23 сентября 1997 года на выставке Softool. Уже тогда  поисковик имел определенные преимущества - возможность проверки документов на уникальность, учет морфологии славянских языков, возможность поиска, с учетом расстояния (например, при поиске точного словосочетания). Основной отличительной чертой Yandex тщательным образом разработан алгоритм оценки соответствия ответа запроса (релевантности), который учитывает не только количество слов запроса, найденных в тексте, но и "контрастность" слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе.

Согласно данных глобальной статистики Рунету, сегодня больше 50% поискового трафика генерируется именно этим поисковиком (для сравнения, на долю Ramblera приходится около 20%, и еще меньше - на долю Google).

Регистрация происходит по адресу http://yandex.ru/addurl.html. В Яндекса достаточно быстрый поисковый робот. Благодаря нему регистрируемая страница появится в поисковых результатах в течение 2-4 часов. Но это лишь первичная индексация. После полной индексации, она может исчезнуть из поисковых результатов, если поисковый робот признает ее спамом. Поэтому положение web-страницы в результатах поиска нужно отслеживать до тех пор, пока не пройдет полная индексация. Перечень результатов может меняться в зависимости от загруженности серверов, поскольку база данных Яндекса имеет кластерную структуру и разнесенная на несколько серверов.

Яндекс любит документы  средних размеров, насыщенные текстом (статьи и тому подобное). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в описании, но вес слов в этом тэге является ниже. Хорошо индексируются страницы, что создано с помощью скриптов .cgi, .php. Это касается гостевых книг, форумов и тому подобное. Для индексации остальных (кроме главной) страниц сайта нужно приблизительно 2 недели.

Хороших позиций помогают достигать ключевые слова в целевых  тэгах, где стоит отмечать слова, которые встречаются в тексте страницы. Целевые тэги, используются также и для выдачи описания страницы в результатах поиска. Это нужно  учитывать при его составлении, поскольку, пользователь по этому описанию принимает решение посетить вас, или нет. Важно размещать ключевые слова и в тэге "title", заглавиях (h1-h6), содержании страницы, "Alt"-тегах.

Для определения релевантности  Яндекс использует Взвешенный Индекс Цитирования, который влияет на рейтинг в результатах поиска. Обычный Индекс Цитирования используется только при сортировке сайтов в каталоге Яндекса.

RAMBLER.RU

(http://rambler.ru)

(Упрощенно  - http://www.r0.ru)

Этот поисковик занимает сегодня второе место среди поисковиков Ренета. Он был первой поисковой программой, что создано специально для российского Интернета программистом компании Stack Ltd Дмитрием Крюком в 1996 году. Слово "Rambler" переводится как «гуляющий человек», «бродяга», по Интернету.

Rambler постоянно совершенствует  свой поисковый алгоритм. Проводятся  работы по оптимизации работы системы для точности и актуальности поиска. Как и большинство российских поисковых машин, Rambler учитывает морфологию русского языка. При выдаче результатов влияние имеет положение сайта в рейтинге Ramblers Top100. Rambler индексирует сайты в зонах ru .su, .ua, .by, .kz, .kg, .uz, .ge, а также славяноязычные сайты в доменах .com, .net или .org.

На сегодня Rambler огромный интернет - холдинг, в состав которого входят портал Рамблер, новостная интернет-газета Лента.ру, медицинский сайт Doctor.ru, онлайновый клуб родителей Mama.ru, картографический сервис Nakarte.ru, телекоммуникационный подраздел "Рамблер Запятых теле".

На Рамблере реализована умная система, которая выводит в результатах поиска слова, которые являются синонимами запроса. Еще одной функцией системы является выдача контекстной рекламы не только по конкретным ключевым словам, но и за фразами, которые тесно связаны с ними.

Регистрация находится по адресу http://www.rambler.ru/doc/add_site_form.shtml. Не регистрируются сайты в доменах .com, .net, или .org. Если же содержание сайта из этих зон имеет отношение к русскоязычному Интернету, то пользователь должен отправить письмо на search.support@rambler-co.ru с просьбой проиндексировать сайт.

Рамблер (в отличие от других поисковиков) умеет вытягивать гиперссылку из объектов Macromedia Flash. Если сайт имеет заставку или навигационные  панели, которые выполнены с использованием этой технологии, Рамблер обрабатывает их, находит адреса всех страниц  сайта и индексирует весь сайт. Тексты flash-объектов не индексируются. Для сайтов, которые полностью состоят из flash-объектов, рекомендуется создать HTML-копию и зарегистрировать ее в поисковой машине. Работы Рамблера также исправляются с конструкциями фреймов.

Работы Рамблера игнорируют большинство целевых тэгов. Комментарии  в документе работы Рамблера тоже не сканируют, но большего внимания обращают на заглавия и выделения в документе. Базовые понятия и ключевые для данного сайта слова целесообразно включать в следующие HTML-теги (в порядке значимости): "title", "h1"..."h4", "b", "strong", "u".

Максимальный размер документа  для роботов составляет 200 килобайт. Документы большего размера усекаются к указанной величине.

APORT.RU

(http://aport.ru)

Поисковую систему "Апорт!" было разработано компанией "Агама" при поддержке Intel и впервые продемонстрировано в феврале 1996 года на пресс-конференции "Агамы" по поводу открытия "Российского  клуба". Тогда она искала лишь по сайту russia.agama.com.

Важнейшими особенностями  первой версии "Апорта" были перевод  запроса и результатов поиска английским языком и обратно, а также возобновление всех проиндексированных страниц из собственной базы (что предоставляет возможность перегляда страниц, уже несуществующих в оригинале).

До конца 1999 года была представлена новая версия Апорт - "Апорт 2000", который стал первым российским поисковиком, что построенный на основе выдачи результатов по отдельно взятым сайтам. "Апорт 2000" практически реализовал две базовых технологии американской поисковой машины Google: учет "ранга сайта" (Page Rank), и обработка запроса, ориентируясь на HTML-код страницы. Среди не документируемых особенностей - больший приоритет сайтам, которые имеют высшую и элитную лигу в каталоге Atrus.

Aport является полнотекстовой поисковой системой, то есть она индексирует все слова, которые бы увидел на экране человек, который будет пересматривать конкретную страницу. В результате любое слово из текста документов может быть критерием для последующего поиска. Апорт также индексирует тексты гиперссылок на документ из других страниц, которые находятся, как внутри сайта, так и за его пределами, а также составлены (или проверенные) редакторами описания сайтов из каталога.

Результаты поиска упорядочиваются  за частотой использования искомых  сроков. Вместе со ссылкой отображается фрагмент текста, где встречается срок, указывается индекс соответствия с запросом и дата последней модификации файла. "Апорт!" в выданном фрагменте текста выделяет красным цветом спрошенные слова.

Регистрация сайта в Апорте проводится из страницы http://www.aport.ru/addurl.asp. Эта страница доступна из любой страницы Апорта, например, из главной страницы Апорта. Добавлять в поисковую систему Апорт следует русскоязычные сайты, а также сайты, которые имеют непосредственное отношение к российскому Интернету. В случае отказа в автоматическом добавлении сайту можно обратиться с просьбой о добавлении сайту за addurl-nr@aport.ru.

С момента добавления сайту  в Апорт к моменту его появления  в поисковой базе проходит от двух-трех дней до двух недель.

Информация о работе Использование поисковых серверов