Автор работы: Пользователь скрыл имя, 22 Мая 2012 в 19:44, курсовая работа
Целью данной работы является изучение организации хранения и поиска информации в сети Internet, для чего будут последовательно рассмотрены следующие задачи: дать определение гипертекстовым документам, определить виды файлов и их особенности, изучить поисковые системы и правила поиска информации; а также указать некоторые виды современных поисковых систем сети Internet.
Введение
1. классификация информационных ресурсов
1.1. Гипертекстовые документы, виды файлов
1.2. Графические файлы, их виды и особенности
1.3. Поисковые системы и правила поиска информации
2. поисковые системы интернета
2.1. Rambler
2.2. Yandex
2.3. Yahoo
2.4. AltaVista
Выводы и предложения
список использованной литературы
Формат TIFF – формат файлов изображений, снабжённых тэгами. Этот формат – один из наиболее широко распространённых форматов, а также фактически является стандартом для подготовки изображений в полиграфии. Файлы этого формата имеют расширения TIF или TIFF.
Это один из наиболее сложных по своей внутренней структуре форматов. Файл начинается с заголовка, имеющего длину 8 символов. Заголовок содержит блок (IFD – Image File Directory), который позволяет определить внутреннюю структуру файла. При помощи IFD из файла можно выделить тэги – блоки данных, содержащие информацию о размерах изображения, его цветовой модели, размере палитры (числе используемых цветов), сжатии данных и т.д. Само изображение находится также в отдельном тэге. Всего определено несколько десятков таких тэгов. Так как весь TIFF файл состоит из тэгов, этот формат легко поддаётся модернизации и расширению.
Максимальное количество цветов, поддерживаемое данным форматом – 24 бита (до 16 777 216 цветов.)
Есть возможность сохранения слоёв изображения, а также нескольких изображений в одном файле, но без возможности анимации.
Также этот формат позволяет включать или выключать сжатие изображения, с потерями или без потерь данных.
Этот формат широко поддержан на различных аппаратных платформах (например, таких, как IBM PC и Apple), что позволяет использовать его для переноса изображений без потерь свойств, атрибутов и т.д. между различными платформами. При этом в состав файла может быть включен цветовой профиль ICC, который позволяет корректировать цвета изображения на различных компьютерах.
Формат BMP также используется для хранения изображений без потерь качества. Этот формат является собственным форматом Windows и используется для целей системы. Максимальное число битов для описания цвета также 24 (16 777 216 цветов). Файл может содержать палитру, определяющую цвета, отличные от принятых в системе. Но цветокоррекция не предусмотрена, поэтому нет гарантии, что на разных компьютерах изображение будет в одних и тех же цветах. Так же не предусмотрено возможности сжатия, хранения слоёв и других элементов изображения. Поэтому он используется очень ограниченно, в основном как конечный формат при подготовке графики для Windows.
Основной особенностью формата JPEG является высокая степень сжатия данных, которая достигается за счёт сжатия с потерями (т.е. часть данных во время сжатия отбрасывается). Это снижает качество картинки (теряются мелкие детали, появляются разводы и муар), но позволяет добиться хорошего сжатия изображения. Такой подход естественно не подходит для чертежей, схем и других видов графики, которые требуют передачи чётких линий и надписей. Тем не менее, для фотоизображений, особенно больших размеров, такие алгоритмы вполне подходят. Этот формат не используется для хранения промежуточных результатов работы над изображением из-за потерь, данных при сжатии и, как следствие значительного ухудшения качества конечного результата.
Формат GIF разрабатывался компанией CompuServ специально для передачи цветных изображений по компьютерным сетям. Разработчики стремились создать формат, позволяющий передавать изображения по сети за кратчайшее время. В настоящее время наиболее широко используются спецификации этого формата GIF87 и GIF89a (цифры обозначают год выпуска стандарта).
Формат GIF позволяет воспользоваться следующими возможностями:
Теперь рассмотрим возможности этого формата подробнее.
GIF был и остаётся самым широко распространённым форматом, поддерживающим передачу сжатых данных. Т.к. скорость передачи данных определяется в первую очередь их размером, для увеличения этой скорости следует уменьшать размеры передаваемых файлов, что можно осуществить двумя путями: уменьшать общий объём информации (с потерями) или использовать сжатие данных (архивацию). Разработчиками формата GIF был использован алгоритм LZW (алгоритм Лемпела-Зива-Уолша), который позволяет добиться степени сжатия близкой к максимальной.
В формате GIF сжатие включено постоянно, и каждый файл сжимается максимально возможно, при этом пользователь не имеет возможности выбрать степень или алгоритм сжатия.
Количество одновременно используемых цветов ограничено 256, но цвета эти могут быть любыми. Они задаются тремя цветовыми составляющими, на каждую из которых отводиться по одному байту, что позволяет выбрать 256 цветов из 16 777 216 возможных. Графический редактор, как правило, выбирает 256 наиболее часто встречающихся в изображении цветов, а остальные заменяет на наиболее близкие к ним из этой выбранной палитры.
Возможность анимации делает этот формат очень популярным. При этом анимация сохраняется в виде нескольких растровых кадров. Каждый кадр представляет собой самостоятельное изображение с возможностью создания собственной таблицы цветов. Кадры могут быть прозрачными и накладываться друг на друга в различных режимах (замещение предыдущего, наложение поверх него и т.д.).
Основная сфера применения этого формата в сети Интернет – создание рекламных баннеров.
Как правило, при работе с исходными изображениями используют оригиналы большего размера, чем нужно для конечного результата, это позволяет более качественно обработать изображение. Затем его легко можно уменьшить до нужного размера.[5]
Поиском информации является процесс выявления в некотором множестве документов страниц, посвященных указанной теме и удовлетворяющих заранее определённому условию поиска (запросу) или содержащих необходимые факты, сведения, данные.
Поиск включает в себя последовательность операций, которые направлены на сбор, обработку и предоставление необходимой информации заинтересованным лицам.
Выделяют 4 этапа поиска:
1)
определение информационной
2)
определение совокупности
3)
извлечение информации из
4) ознакомление с результатами поиска и их оценка.
Для большей эффективности могут применяться различные виды поиска.
Полнотекстовый поиск – поиск по всему содержимому документа. Как правило, для ускорения полнотекстового поиска используют предварительно построенные индексы.
Поиск по метаданным – это поиск по нескольким атрибутам документа, поддерживаемым системой – названию документа, дате создания, размеру, автору и т.д.
Говоря о системах информационного поиска, употребляют термины запрос и объект запроса.
Запрос – это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис может быть различен в разных системах. Кроме специального языка запросов современные поисковые системы позволяют вводить запросы на естественном языке.
Объект запроса – это информационная сущность, которая хранится в базе автоматизированной системы поиска. Наиболее распространённым объектом запроса является текстовый документ, но не существует никаких принципиальных ограничений. Возможен поиск любого типа информации (например, изображений, музыки и другой мультимедиа информации). Процесс занесения объектов поиска в информационную поисковую систему (ИПС) называется индексацией. При этом ИПС не обязательно хранит точную копию объекта, нередко вместо неё хранится суррогат.
Главная
задача ИПС – помочь пользователю
удовлетворить его
Поисковая система это:
1) Онлайн сервис, предоставляющий возможность поиска информации на сайтах в Интернете, а также (иногда) в новостных группах и FTP-серверах.
2) Англ. search engine (синонимы: поисковый сервер, поисковая система) – инструмент для поиска информации в сети Интернет. Работа поисковика состоит из двух этапов: индексации и поиска в индексе, с выдачей результатов поиска пользователю.
3) Система, предназначенная для поиска и доставки информации. Сделана с целью каталогизации данных. Обычно использует каталогизацию страниц, чтобы в дальнейшем было легко находить обработанную информацию.
4) Специальный сайт, на котором по заданному запросу можно получить информацию о ресурсах в Интернете, соответствующих данному запросу.[2]
В сети Интернет находятся миллиарды Web-страниц, терабайты информации в различных файлах, но для получения нужной информации необходимо указать её точный адрес URL. Именно этот адрес и нужно найти в первую очередь. URL-адрес состоит из доменного имени (либо IP-адреса), пути к файлу и имени файла. Если пользователь найдёт такой URL, то он без труда введёт его в адресную строку программы Internet Explorer и либо увидит нужную Web-страницу, либо скачает нужный ему файл.
Как минимум необходимо знать доменное имя ресурса, а затем, щёлкая по гиперссылкам, можно добраться до действительно нужной информации.
Для этого и существуют хранилища таких адресов, специальные поисковые системы. Они выполнены в виде Web-страниц, на которых располагается не информация как таковая, а ссылки на другие ресурсы (страницы, сайты).
Для вызова поисковой системы необходимо в адресной строке программы Internet Explorer указать её адрес. Поисковых систем в Интернет сейчас достаточно много. В таблице ниже перечислены лишь наиболее популярные поисковые системы и их адреса в сети Интернет. Естественно, в русскоязычных системах содержится больше ссылок на русскоязычные ресурсы, в англоязычных – на англоязычные и т.д.
ТАБЛИЦА 1. Поисковые системы
Наименование | Адрес |
Яндекс (рус.) | http://www.yandex.ru |
Rambler (рус.) | http://www.rambler.ru |
Апорт (рус.) | http://www.aport.ru |
Google (рус.) | http://www.google.ru |
Yahoo! (рус.) | http://www.yahoo.ru |
AltaVista (англ.) | http://www.altavista.ru |
InfoSeek (англ.) | http://www.infoseek.ru |
Для поиска информации в сети Интернет рекомендуется использовать несколько различных поисковых систем, перед началом поиска сформулировать запрос на поиск, в котором должно быть чётко отражено, что вы хотите найти (задаётся слово или словосочетание, в которое заложен основной смысл запроса).
Поиск в большинстве поисковых систем имеет приблизительно следующий алгоритм:
Правила задания простых запросов на поиск в Интернете: