Автор работы: Пользователь скрыл имя, 11 Апреля 2012 в 16:17, реферат
Интернет сегодня является бесценным информационным источником: подключившись к Сети, можно узнать курс доллара и расписание поездов, найти кулинарный рецепт и почитать мировые новости, купить компьютер и забронировать билеты в театр.
1)Поисковые системы
2)Каталоги ресурсов Интернета
3)Комбинированные системы поиска
ГОУ СПО
«Мариинский педагогический колледж»
«Поиск
информации в сети Интернет при
помощи различных поисковых систем»
Реферат выполнила студентка 1 курса
103 группы
Мыльникова Наталья
Мариинск
2010 год
Содержание
1)Поисковые системы
2)Каталоги ресурсов Интернета
3)Комбинированные
системы поиска
Интернет
сегодня является бесценным информационным
источником: подключившись к Сети,
можно узнать курс доллара и расписание
поездов, найти кулинарный рецепт и
почитать мировые новости, купить компьютер
и забронировать билеты в театр.
Но информация в сети не упорядочена,
не структурирована, нужно суметь отыскать
среди тысяч серверов и миллионов
страниц то, что необходимо. Поэтому
большую помощь в поиске информации
по сети оказывают поисковые системы
и каталоги. В основе работы любой поисковой
системы лежит специальная программа-spider
(паук, робот, crawler), которая просматривает
веб-страницы, считывает (индексирует),
полностью или частично, их содержимое
и далее следует по ссылкам, найденным
на данной странице. Через некоторое время
программа возвращается и индексирует
страницу снова. Таким образом, в базе
поисковой системы хранится огромное
количество информации о посещенных и
проиндексированных страницах. Индекс
может занимать сотни гигабайт дискового
пространства. Когда пользователь обращается
к поисковой системе с определенным запросом,
специальная программа не ищет эту информацию
в Интернете, а перебирает индексы поисковой
системы и выдает пользователю информацию
обо всех найденных документах (поэтому
иногда среди результатов поиска могут
оказаться ссылки на уже не существующие
ресурсы).Каждая поисковая система имеет
своего собственного спайдера, со своими
собственными способами индексирования
документов. Поэтому, произведя запрос
по определенным ключевым словам или выражениям,
можно получить разные результаты для
каждой из поисковых систем. Поисковых
систем сегодня существует достаточно
много, международных и отечественных. AltaVista является одной из самых
старых, если не старейшей, поисковой системой
в Интернете - она была создана в 1995 году.
В настоящее время AltaVista может осуществлять
поиск на 25 языках, включая русский. В последнее
время стала расти популярность поисковой
системы Google.Если перед пользователем
стоит задача найти что-либо в русскоязычной
части сети, то, скорее всего, наиболее
успешный результат даст поиск с использованием
русскоязычных поисковиков. Прежде всего,
потому, что русскоязычные поисковые сервера,
в отличие от англоязычных, ведут поиск
с учетом морфологии русского языка.По
данным системы статистики SpyLOG, наибольшей популярностью
среди русскоязычной части пользователей
Интернета пользуются системы Яndex, Rambler и Апорт. Рамблер индексирует домены ru, su,
ua, by, kz, kg, ge, uz и некоторые русскоязычные
ресурсы из доменов com, net, org. В апреле 2001
года в базе данных Рамблера хранилась
информация о почти 8 миллионах уникальных
документов. Ежедневно в базу данных этого
поисковика вносится до 60 тысяч изменений
и дополнений, что обеспечивает постоянное
пополнение базы сведениями обо всех новинках,
появляющихся в русскоязычной части Сети.
Ежедневно портал Рамблер посещают около
300 тыс. человек.Большой популярностью
пользуется служба Rambler's Top 100, позволяющая
любому желающему установить счетчик
на своей страничке и участвовать в рейтинге
наиболее посещаемых сайтов.В мае 2001 года
Рамблер объявил об открытии нового проекта
- Руметрика, посвященный исследованию
развития русскоязычного сектора Интернета.
Создатели проекта планируют несколько
раз в месяц публиковать данные об объеме
Рунета, распределении сайтов по тематическим
группам, динамике пользовательской активности,
а также различные аналитические материалы,
оценки социологов, аналитиков и экспертов
в различных областях. Яndex начал работу в сентябре
1997 года. Выполняет поиск по русскоязычной
части Интернет (Рунет) с учетом русской
морфологии. Сканируются домены: su, ru, am,
az, by, ge, kg, kz, md, ua, uz. Остальные сервера вносятся
в базу лишь в том случае, если на них найден
текст на русском языке или если владельцы
ресурсов убедят администрацию поисковой
машины в том, что их сервер интересен
пользователям русскоязычного Интернета.
Яndex имеет очень мощный язык запросов,
возможно задание расстояния между словами
с учетом их порядка, указание различной
значимости ключевых слов, а также использование
уточняющих слов. Специальный поиск можно
вести по заголовкам документов и находящимся
в них ссылкам. Кроме того, имеется возможность
попросить систему найти документы, похожие
на найденные по предыдущему запросу.
В апреле 2001 года поисковая система содержала
информацию о более чем 12 миллионах документов,
расположенных на серверах России и стран
СНГ. В каталогах хранятся тематически
систематизированные коллекции ссылок
на различные сетевые ресурсы. В отличие
от поисковых систем, составление каталога
производится людьми (модераторами).
Более того, занимающиеся этим люди стараются
сделать свои коллекции наиболее полными,
включающими все доступные ресурсы на
каждую тему. В результате пользователю
не нужно самому собирать все ссылки по
интересующему его вопросу, достаточно
найти этот вопрос в каталоге - работа
по поиску и систематизации ссылок уже
сделана за него. Russia
on the Net - один из
самых старых каталогов русской сети (был
открыт в сентябре 1995 года) и является
службой информационной компании Demos.
Возможна организация поиска по каталогу
с использованием ключевых слов, расширенным
синтаксисом и логическими операторами. List.Ru - тематический каталог, интересной
особенностью которого является наличие
гидов - реальных людей, поддерживающих
определенные разделы каталога. Некоторые
поисковые системы, такие, например, как Excite или Infoseek имеют при себе и каталог.
Соответственно, индексы для самой поисковой
системы добываются spider'ом, а каталог пополняется
модераторами системы. В Рунете очень
популярна комбинированная поисковая
система Апорт, которая была образована
в результате интеграции поисковой системы
Aport и каталога Atrus. В ответ на поисковый
запрос пользователя Апорт выдает страницу
результатов поиска, на которой представлены:
общая информация о каждом сайте (описание,
общее количество страниц и количество
страниц, найденных по запросу), характеристики
страницы, наиболее соответствующей запросу
(заголовок, размер, дата, фрагменты текста),
а также процентное соответствие содержимого
сайта сделанному запросу. Причем при
формировании страницы с результатами
поиска учитывается "индекс
цитируемости", то есть первыми в
списке выдаются те страницы, на которые
чаще ссылаются другие web-страницы. Особенностью
Апорта является возможность использования
англо-русского и русско-английского on-line
перевода запросов и результатов поисков.
И еще одна очень интересная особенность
Апорта - это возможность реконструкции
текста. То есть если нужный сервер временно
недоступен (или даже если нужная страница
больше не существует), но соответствующая
ссылка найдена в результате поиска, можно
реконструировать страницу и все-таки
посмотреть ее содержание. В заключение
данного реферата необходимо отметить,
что несмотря на огромную информационную
ценность Интернета, само это информационное
пространство неоднородно, в том числе
и в качественном отношении. Поэтому к
сведениям, найденным в Интернете, нужно
относиться с несколько большей осторожностью,
чем к информации, найденной в печатной
публикации, особое внимание обращая на
то, насколько серьезным и авторитетным
является источник этих сведений.
Информация о работе Поиск информации в сети Интернет при помощи различных поисковых систем