Общие принципы организации поиска информации в сети

Автор работы: Пользователь скрыл имя, 29 Июля 2014 в 13:14, контрольная работа

Краткое описание

Цели выполнения контрольной работы:
1. ознакомиться с всемирной компьютерной сетью Интернет и используемыми в ней технологиями;
2. освоить приемы эффективного поиска необходимой информации в сетевых ресурсах;
3. получить практический опыт поиска информации по заданной теме;
4. освоить основы языка HTML и методы создания Web- документов;
5. получить практический опыт создания Web- страниц на основе найденных в сети документов;

Содержание

Введение………………………………………………………………..3
1. Общие принципы организации поиска информации в сети….....-
1.1 Поиск информации в Интернет: стратегия и методика………..6
1.2 Поиск с помощью поисковых машин …………………………..7
1.3 Поиск с помощью каталогов…………………………………….8
2. Поиск информации………………………………………………..11
Заключение…………………………………………………………...14
Список использованных интернет-источников……………………15

Вложенные файлы: 1 файл

Министерство образования Республики Беларусь.docx

— 39.54 Кб (Скачать файл)

 

Содержание

 

Введение………………………………………………………………..3

1. Общие принципы организации поиска информации в сети….....-

1.1 Поиск информации в Интернет: стратегия и методика………..6

1.2 Поиск с помощью поисковых машин …………………………..7

1.3 Поиск с помощью каталогов…………………………………….8

2. Поиск информации………………………………………………..11

Заключение…………………………………………………………...14

Список использованных интернет-источников……………………15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

 

Глобальные вычислительные сети Wide Area Networks (WAN), которые относятся к территориальным компьютерными сетями, предназначены, как и ЛВС для предоставления услуг, но значительно большему  количеству пользователей, находящихся на большой территории. Глобальные вычислительные сети - это компьютерные сети, объединяющие локальные сети и отдельные компьютеры, удаленные друг от друга на большие расстояния. Самая известная и популярная глобальная сеть - это Интернет. Кроме того, к глобальным вычислительным сетям относятся: всемирная некоммерческая сеть FidoNet, CREN, EARNet, EUNet и другие глобальные сети, в том числе и корпоративные.

 Из-за  большой протяженности каналов  связи построение требует очень  больших затрат, поэтому глобальные  сети чаще всего создаются  крупными телекоммуникационными  компаниями для оказания платных  услуг абонентам. Такие сети называют  общественными или публичными. Но  в некоторых случаях WAN создаются  как частные сети крупных корпораций.

 Абонентами WAN могут быть ЛВС предприятий, географически удаленные друг  от друга, которым нужно обмениваться  информацией между собой. Кроме  того, отдельные компьютеры могут  пользоваться услугами WAN для доступа, как к корпоративным данным, так  и к публичным данным Internet.

 Компании, осуществляющие поддержку функционирования  сети, называются операторами сети, а компании, предоставляющие платные  услуги абонентам сети, называются  провайдерами или поставщиками  услуг.

 В глобальных  сетях для передачи информации  применяются следующие виды коммутации:

  • коммутация каналов (используется при передаче аудиоинформации по обычным телефонным линиям связи);
  • коммутация сообщений (применяется в основном для передачи электронной почты, в телеконференциях, электронных новостях);
  • коммутация пакетов (для передачи данных, в последнее время используется также для передачи аудио - и видеоинформации).

 Большой  интерес представляет глобальная  информационная сеть Интернет. Интернет  объединяет множество различных  компьютерных сетей (локальных, корпоративных, глобальных) и отдельных компьютеров, которые обмениваются между собой  информацией по каналам общественных  телекоммуникаций.

 Практически  все услуги Internet построены на принципе клиент-сервер. Вся информация в Интернет хранится на серверах. Обмен информацией между серверами сети осуществляется по высокоскоростным каналам связи или магистралям.

 К  таким магистралям относятся: выделенные  телефонные аналоговые и цифровые  линии, оптические каналы связи  и радиоканалы, в том числе  спутниковые линии связи. Серверы, объединенные высокоскоростными  магистралями, составляют базовую  часть Интернет.

 Отдельные  пользователи подключаются к  сети через компьютеры местных  поставщиков услуг Интернета, Internet - провайдеров (Internet Service Provider - ISP), которые имеют постоянное подключение к Интернет. Региональный провайдер, подключается к более крупному провайдеру национального масштаба, имеющего узлы в различных городах страны.

 Сети  национальных провайдеров объединяются  в сети транснациональных провайдеров  или провайдеров первого уровня. Объединенные сети провайдеров  первого уровня  составляют глобальную  сеть Internet

 Услуги, которые могут быть предоставлены  пользователям в Интернет:

  • электронная почта E-mail;
  • компьютерная телефония;
  • передача файлов FTP;
  • терминальный доступ для интерактивной работы на удаленном компьютере TELNET;
  • глобальная система телеконференций USENET;
  • справочные службы;
  • доступ к информационным ресурсам и средства поиска информации в Интернете.

 Кроме  того, Интернет - это мощное средство  ведения электронного бизнеса  и дистанционного (интерактивного  или он-лайн) обучения.

Цели выполнения контрольной работы:

1. ознакомиться  с всемирной компьютерной сетью  Интернет и используемыми в  ней технологиями;

2. освоить  приемы эффективного поиска необходимой  информации в сетевых ресурсах;

3. получить  практический опыт поиска информации  по заданной теме;

4. освоить  основы языка HTML и методы создания  Web- документов;

5. получить  практический опыт создания Web- страниц на основе найденных в сети документов;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. Общие принципы организации  поиска информации в сети 

 

1.1 Поиск информации в Интернет: стратегия и методика

Интернет развивался как средство общения и удаленного доступа, поэтому первыми службами глобальной сети являются электронная почта, telnet, FTP. В дальнейшем в сети появились другие сервисы. С появлением распределенной системы гипермедиа Word Wide Web сеть Интернет стала средством массовой информации.

 В  настоящее время в глобальной  сети размещен огромный объем  информации по различным направлениям  деятельности. Основной объем информационных  ресурсов в виде веб-страниц  или файлов в формате html находится на веб-сайтах, размещенных на Web-серверах Интернета. Просмотр веб-страниц этих сайтов осуществляется при помощи прикладных программ браузеров (обозревателей).

Быстрый рост объема информационных ресурсов привел к необходимости создания специальных поисковых средств: первая поисковая система Archie для поиска файлов в базах данных ARCHIE (помогает находить файлы, хранящиеся на анонимных FTP-серверах), система Gopher, система WAIS в базе данных, которых содержится индексированная информация о ресурсах сети Интернет, поисковые системы или поисковые машины, которые выполняют поиск WWW-страниц на Web-серверах.

Поисковые системы в Интернете для поиска ресурсов могут быть разделены на следующие группы:

  • системы Web-поиска;
  • системы поиска FTP-файлов (например, (http://www.filesearch.ru);
  • системы поиска в архивах Gopher;
  • системы поиска в Usenet;
  • каталоги информационных ресурсов;
  • порталы информационных ресурсов.

 Средства  поиска информационных ресурсов  в Internet подразделяют на:

  • поисковые машины,
  • системы поиска, которые осуществляют поиск по ключевым словам;каталоги и порталы информационных ресурсов сети, которые имеют иерархическую структуру для навигации или быстрого поиска информации не по ключевым словам, а по директориям.
      1. Поисковые машины

 Поисковая  машина – это поисковый сервер, на котором установлена специальная  программа, выполняющая автоматический  поиск информациионных ресурсов по ключевым словам в заголовках и тексте Web-страниц. К наиболее известным поисковым машинам относятся: Google, Yahoo, AltaVista, Hot Bot, MSN Search, Yandex, Rambler, Апорт, Мета и т.д.

 Поисковые  системы - это огромные базы данных  слов, которые добавляются в базу  при периодическом сканировании  Web-страниц в пространстве Internet. При помощи программ-роботов (пауков) поисковые системы регулярно “прочесывают” ресурсы сети Internet.

 Полученный  информационный массив вместе  с ссылкой на то, где находится нужное слово, хранится в виде индексных (отсортированных) файлов. При вводе ключевого слова в поисковую машину система обращается к своей базе файлов, выбирает информацию и выдает пользователю перечень Web-страниц, на которых имеются заданные пользователем ключевые слова.

 Вследствие  разницы в подходах к поиску  в различных поисковых системах  результаты их поиска не всегда  адекватны запросу. Поэтому для  получения наиболее полных результатов  целесообразно пользоваться различными  поисковыми системами или метапоисковыми машинами.

 Метапоисковые машины - это системы, проводящие поиск на нескольких поисковых машинах одновременно, например MetaBot - Российская мета-поисковая система, которая осуществляет поиск через российские поисковики (Яндекс, Апорт, Рабмлер и т.д.), мировой метапоиск (Northernlight, All the Web, Raging), а так же смешанный FTP-метапоиск.

1.3 Каталоги и порталы информационных ресурсов

 Каталог представляет собой данные, структурированные по темам в виде иерархических структур. Пpи зaгpузкe кaтaлoгa нa экpaн вывoдитcя caмый oбщий пepечeнь oблacтeй чeлoвeчecкoй дeятeльнocти: ИCКУCCTВO, OБPAЗOВAHИE, БИЗHEC, HAУKA, ИГPЫ, CПOPT и т.д. Каталоги имеют иерархическую структуру, то есть пользователь, входя в любой раздел каталога, последовательно видит все более и более дробную его детализацию.

Большинство каталогов сoздaются путeм дoбaвлeния aвтopaми wеb-cтpaниц cвoeгo сaйтa к сущecтвующeму cпиcку ccылoк. Классифицировать каталоги информационных ресурсов можно по различным критериям, например целевому назначению, по характеру содержания, национально-территориальному признаку, по сферам их использования.

 Обычно  на главной странице каталога  информационных ресурсов размещены  базовые разделы рубрикатора. Рубрикатор  имеет иерархическую структуру, позволяющую наиболее точно классифицировать  ресурсы по их тематической  направленности.

 К наиболее  популярным каталогам информационных  ресурсов относятся:

  • Yandex

Yandex ежедневно просматривает сотни тысяч Web-страниц в поисках изменений или новых ссылок. Коллекция ссылок постоянно растет.

Yandex не требует от вас знания  специальных команд для поиска. Достаточно набрать вопрос («где  найти дешевые компьютеры» или  «нужны телефоны москвы и московской области»), и вы получите результат - список страниц, где встречаются эти слова.

Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка.

При этом поиск не ограничен лишь словами или фразами. Yandex отыщет по названию Web-страницу компании или файл с нужной картинкой.

  • Rambler's Top100;

Поисковая система содержит информацию о более чем 12 миллионах документов, расположенных на серверах России и стран СНГ.

Rambler обрабатывает ежесуточно не  менее 500 тысяч поисковых запросов (в среднем - 5 запросов в секунду), сканируя 48 тысяч Web-серверов и используя несколько одновременно работающих программ-роботов.

Запрос может состоять из одного или нескольких слов, разделенных пробелами. Могут быть использованы как русские, так и английские слова и словосочетания. По умолчанию находятся только те документы, в которых встретились все введенные Вами слова.

По умолчанию найденные документы сортируются по релевантности (соответствию запросу). Однако Вы можете потребовать, чтобы вместо этого в начало списка были помещены самые свежие (или, наоборот, самые старые документы).

  • Yahoo!

Данная система появилась в Сети одной из первых, и сегодня Yahoo сотрудничает со многими производителями средств информационного поиска, а на различных ее серверах используется различное программное обеспечение. Язык Yahoo достаточно прост: все слова следует вводить через пробел, они соединяются связкой “and” либо “or”.

При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились в документе. При этом не производится нормализация лексики и не проводится анализ на «общие» слова. Хорошие результаты поиска получаются только тогда, когда пользователь знает, что в базе данных Yahoo информация есть наверняка. Ранжирование производится по числу терминов запроса в документе.

Yahoo относится к классу простых  традиционных систем с ограниченными  возможностями поиска.

  • Google;

Первая по популярности, обрабатывает 41 млрд 345 млн запросов в месяц, индексирует более 25 миллиардов веб-страниц, может находить информацию на 191 языке (c 15 октября 2009).

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

Для результатов поиска Google ранее предоставлял возможность повторного поиска, что позволяло производить поиск более детально. Для более детального поиска пользователям необходимо было указывать дополнительные параметры, по которым происходил отбор результатов, что позволяло сразу отобразить не только запрос, но и контекст где он применяется. Данная возможность упрощала процедуру поиска исключив необходимость в открытии каждого результата.

Информация о работе Общие принципы организации поиска информации в сети