Единицы измерения информации

Автор работы: Пользователь скрыл имя, 27 Ноября 2011 в 14:27, доклад

Краткое описание

Содержательный подход к измерению информации. Сообщение – информативный поток, который в процессе передачи информации поступает к приемнику. Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными Информация - знания человека ? сообщение должно быть информативно. Если сообщение не информативно, то количество информации с точки зрения человека .

Вложенные файлы: 1 файл

Единицы измерения информации.docx

— 39.44 Кб (Скачать файл)

Единицы измерения информации: 1байт = 8 бит

1Кб (килобайт) = 210 байт = 1024 байт

1Мб (мегабайт) = 210 Кб = 1024 Кб

1Гб (гигабайт) = 210 Мб = 1024 Мб

1 БИТ – такое кол-во информации, которое содержит сообщение, уменьшающее неопределенность знаний в два раза.  БИТ- это аименьшая единица измерения информации.

Количество  информации  - это мера уменьшения неопределенности.

Содержательный  подход к измерению  информацииСообщение – информативный поток, который в процессе передачи информации поступает к приемнику.  Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными  Информация - знания человека ? сообщение должно быть информативно. Если сообщение не информативно, то количество информации с точки зрения человека .

Алфавитный  подход к измерению  информации не связывает кол-во информации с содержанием сообщения. Алфавитный подход - объективный подход к измерению информации. Он  удобен при использовании технических средств работы с информацией, т.к. не зависит от содержания сообщения. Кол-во информации зависит от объема текста и мощности алфавита. Ограничений на max мощность алфавита нет, но есть достаточный алфавит мощностью 256 символов. Этот алфавит используется для представления текстов в компьютере. Поскольку 256=28, то 1символ несет в тексте 8 бит информации.

Вероятностный подход к измерения  информацииВсе события происходят с различной вероятностью, но  зависимость между вероятностью событий и количеством информации, полученной при совершении того или иного события можно выразить формулой которую в 1948 году предложил  Шеннон.

Формула  Шеннона

       

 

- количество информации 

– количество возможных событий

p– вероятности отдельных событий 
 

Кодирование информации в компьютере
Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и  видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего  два символа 0 и 1). Связано это  с тем, что удобно представлять информацию в виде последовательности электрических  импульсов: импульс отсутствует (0), импульс есть (1). Такое кодирование  принято называть двоичным, а сами логические последовательности нулей  и единиц - машинным языком.
Вид информации Двоичный код
Числовая 10110011
Текстовая
Графическая
Звуковая
Видео
 
Каждая  цифра машинного двоичного кода несет количество информации равное одному биту.   

Данный  вывод можно сделать, рассматривая цифры машинного алфавита, как  равновероятные события. При записи двоичной цифры можно реализовать  выбор только одного из двух возможных  состояний, а, значит, она несет количество информации равное 1 бит. Следовательно, две цифры несут информацию 2 бита, четыре разряда --4 бита и т. д. Чтобы  определить количество информации в  битах, достаточно определить количество цифр в двоичном машинном коде.

Кодирование текстовой информации   

В настоящее  время большая часть пользователей  при помощи компьютера обрабатывает текстовую информацию, которая состоит  из символов: букв, цифр, знаков препинания и др.   

Традиционно для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При  помощи формулы, которая связывает  между собой количество возможных  событий К и количество информации I, можно вычислить сколько различных  символов можно закодировать (считая, что символы - это возможные события):    

К = 2= 2= 256,   

т. е. для  представления текстовой информации можно использовать алфавит мощностью 256 символов.   

Суть  кодирования заключается в том, что каждому символу ставят в  соответствие двоичный код от 00000000 до 11111111 или соответствующий ему  десятичный код от 0 до 255.   

Необходимо  помнить, что в настоящее время  для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут  правильно отображаться в другой кодировке. Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов.   

Одному  и тому же двоичному коду ставится в соответствие различные символы.

Двоичный  код Десятичный  код КОИ8 СР1251 СР866 Мас ISO
11000010 194 б В - - Т
Впрочем, в большинстве случаев о перекодировке  текстовых документов заботится  на пользователь, а специальные программы - конверторы, которые встроены в  приложения.   

Начиная с 1997 г. последние версии Microsoft Windows&Office поддерживают новую кодировку Unicode, которая на каждый символ отводит  по 2 байта, а, поэтому, можно закодировать не 256 символов, а 65536 различных символов.    

Чтобы определить числовой код символа  можно или воспользоваться кодовой  таблицей, или, работая в текстовом  редакторе Word 6.0 / 95. Для этого в  меню нужно выбрать пункт "Вставка" - "Символ", после чего на экране появляется диалоговая панель Символ. В диалоговом окне появляется таблица  символов для выбранного шрифта. Символы  в этой таблице располагаются  построчно, последовательно слева  направо, начиная с символа Пробел (левый верхний угол) и, кончая, буквой "я" (правый нижний угол).   

Для определения  числового кода символа в кодировке Windows (СР1251) нужно при помощи мыши или клавиш управления курсором выбрать  нужный символ, затем щелкнуть по кнопке Клавиша. После этого на экране появляется диалоговая панель Настройка, в которой  в нижнем левом углу содержится десятичный числовой код выбранного символа.

Кодирование графической информации   

В середине 50-х годов для больших ЭВМ, которые  применялись в научных и военных  исследованиях, впервые в графическом  виде было реализовано представление  данных. В настоящее время широко используются технологии обработки  графической информации с помощью  ПК. Графический интерфейс пользователя стал стандартом "де-факто" для  ПО разных классов, начиная с операционных систем. Вероятно, это связано со свойством человеческой психики: наглядность  способствует более быстрому пониманию. Широкое применение получила специальная  область информатики, которая изучает  методы и средства создания и обработки  изображений с помощью программно-аппаратных вычислительных комплексов, - компьютерная графика. Без нее трудно представить  уже не только компьютерный, но и  вполне материальный мир, так как  визуализация данных применяется во многих сферах человеческой деятельности. В качестве примера можно привести опытно-конструкторские разработки, медицину (компьютерная томография), научные  исследования и др.   

Особенно  интенсивно технология обработки графической  информации с помощью компьютера стала развиваться в 80-х годах. Графическую информацию можно представлять в двух формах: аналоговой или дискретной. Живописное полотно, цвет которого изменяется непрерывно - это пример аналогового  представления, а изображение, напечатанное при помощи струйного принтера и  состоящее из отдельных точек  разного цвета - это дискретное представление. Путем разбиения графического изображения (дискретизации) происходит преобразование графической информации из аналоговой формы в дискретную. При этом производится кодирование - присвоение каждому элементу конкретного значения в форме кода. При кодировании изображения происходит его пространственная дискретизация. Ее можно сравнить с построением изображения из большого количества маленьких цветных фрагментов (метод мозаики). Все изображение разбивается на отдельные точки, каждому элементу ставится в соответствие код его цвета. При этом качество кодирования будет зависеть от следующих параметров: размера точки и количества используемых цветов. Чем меньше размер точки, а, значит, изображение составляется из большего количества точек, тем выше качество кодирования. Чем большее количество цветов используется (т. е. точка изображения может принимать больше возможных состояний), тем больше информации несет каждая точка, а, значит, увеличивается качество кодирования. Создание и хранение графических объектов возможно в нескольких видах - в виде векторного, фрактального или растрового изображения. Отдельным предметом считается 3D (трехмерная) графика, в которой сочетаются векторный и растровый способы формирования изображений. Она изучает методы и приемы построения объемных моделей объектов в виртуальном пространстве. Для каждого вида используется свой способ кодирования графической информации.         

Растровое изображение.   

При помощи увеличительного стекла можно увидеть, что черно-белое графическое изображение, например из газеты, состоит из мельчайших точек, составляющих определенный узор - растр. Во Франции в 19 веке возникло новое направление в живописи - пуантилизм. Его техника заключалась  в том, что на холст рисунок  наносился кистью в виде разноцветных точек. Также этот метод издавна  применяется в полиграфии для  кодирования графической информации. Точность передачи рисунка зависит  от количества точек и их размера. После разбиения рисунка на точки, начиная с левого угла, двигаясь по строкам слева направо, можно  кодировать цвет каждой точки. Далее  одну такую точку будем называть пикселем (происхождение этого слова  связано с английской аббревиатурой "picture element" - элемент рисунка). Объем  растрового изображения определяется умножением количества пикселей (на информационный объем одной точки, который зависит  от количества возможных цветов. Качество изображения определяется разрешающей  способностью монитора. Чем она выше, то есть больше количество строк растра и точек в строке, тем выше качество изображения. В современных ПК в  основном используют следующие разрешающие  способности экрана: 640 на 480, 800 на 600, 1024 на 768 и 1280 на 1024 точки. Так как  яркость каждой точки и ее линейные координаты можно выразить с помощью  целых чисел, то можно сказать, что  этот метод кодирования позволяет  использовать двоичный код для того чтобы обрабатывать графические  данные.   

Если  говорить о черно-белых иллюстрациях, то, если не использовать полутона, то пиксель будет принимать одно из двух состояний: светится (белый) и  не светится (черный). А так как  информация о цвете пикселя называется кодом пикселя, то для его кодирования  достаточно одного бита памяти: 0 - черный, 1 - белый. Если же рассматриваются иллюстрации  в виде комбинации точек с 256 градациями серого цвета (а именно такие в  настоящее время общеприняты), то достаточно восьмиразрядного двоичного  числа для того чтобы закодировать яркость любой точки. В компьютерной графике чрезвычайно важен цвет. Он выступает как средство усиления зрительного впечатления и повышения  информационной насыщенности изображения. Как формируется ощущение цвета  человеческим мозгом? Это происходит в результате анализа светового  потока, попадающего на сетчатку глаза  от отражающих или излучающих объектов. Принято считать, что цветовые рецепторы  человека, которые еще называют колбочками, подразделяются на три группы, причем каждая может воспринимать всего один цвет - красный, или зеленый, или синий.          

Цветовые  модели.   

Если  говорить о кодировании цветных  графических изображений, то нужно  рассмотреть принцип декомпозиции произвольного цвета на основные составляющие. Применяют несколько  систем кодирования: HSB, RGB и CMYK. Первая цветовая модель проста и интуитивно понятна, т. е. удобна для человека, вторая наиболее удобна для компьютера, а  последняя модель CMYK-для типографий. Использование этих цветовых моделей  связано с тем, что световой поток  может формироваться излучениями, представляющими собой комбинацию " чистых" спектральных цветов : красного, зеленого, синего или их производных. Различают аддитивное цветовоспроизведение (характерно для излучающих объектов) и субтрактивное цветовоспроизведение (характерно для отражающих объектов). В качестве примера объекта первого  типа можно привести электронно-лучевую  трубку монитора, второго типа - полиграфический  отпечаток.   

1) Модель HSB характеризуется тремя компонентами: оттенок цвета(Hue), насыщенность цвета  (Saturation) и яркость цвета (Brightness). Можно получить большое количество  произвольных цветов, регулируя  эти компоненты. Эту цветовую  модель лучше применять в тех  графических редакторах, в которых  изображения создают сами, а не  обрабатывают уже готовые. Затем  созданное свое произведение  можно преобразовать в цветовую  модель RGB, если ее планируется  использовать в качестве экранной  иллюстрации, или CMYK, если в  качестве печатной, Значение цвета  выбирается как вектор, выходящий  из центра окружности. Направление  вектора задается в угловых  градусах и определяет цветовой  оттенок. Насыщенность цвета определяется  длиной вектора, а яркость цвета  задается на отдельной оси,  нулевая точка которой имеет  черный цвет. Точка в центре  соответствует белому (нейтральному) цвету, а точки по периметру  - чистым цветам.   

2) Принцип  метода RGB заключается в следующем:  известно, что любой цвет можно  представить в виде комбинации  трех цветов: красного (Red, R), зеленого (Green, G), синего (Blue, B). Другие цвета  и их оттенки получаются за  счет наличия или отсутствия  этих составляющих.По первым буквам  основных цветов система и  получила свое название - RGB. Данная  цветовая модель является аддитивной, то есть любой цвет можно  получить сочетание основных  цветов в различных пропорциях. При наложении одного компонента  основного цвета на другой  яркость суммарного излучения  увеличивается. Если совместить  все три компоненты, то получим  ахроматический серый цвет, при  увеличении яркости которого  происходит приближение к белому  цвету.   

При 256 градациях тона (каждая точка кодируется 3 байтами) минимальные значения RGB (0,0,0) соответствуют черному цвету, а  белому - максимальные с координатами (255, 255, 255). Чем больше значение байта  цветовой составляющей, тем этот цвет ярче. Например, темно-синий кодируется тремя байтами ( 0, 0, 128), а ярко-синий (0, 0, 255).   

3) Принцип  метода CMYK. Эта цветовая модель  используется при подготовке  публикаций к печати. Каждому  из основных цветов ставится  в соответствие дополнительный  цвет (дополняющий основной до  белого). Получают дополнительный  цвет за счет суммирования  пары остальных основных цветов. Значит, дополнительными цветами  для красного является голубой  (Cyan,C) = зеленый + синий = белый - красный, для зеленого - пурпурный  (Magenta, M) = красный + синий = белый  - зеленый, для синего - желтый (Yellow, Y) = красный + зеленый = белый - синий. Причем принцип декомпозиции произвольного цвета на составляющие можно применять как для основных, так и для дополнительных, то есть любой цвет можно представить или в виде суммы красной, зеленой, синей составляющей или же в виде суммы голубой, пурупурной, желтой составляющей. В основном такой метод принят в полиграфии. Но там еще используют черный цвет (BlacК, так как буква В уже занята синим цветом, то обозначают буквой K). Это связано с тем, что наложение друг на друга дополнительных цветов не дает чистого черного цвета.   

Различают несколько  режимов представления цветной  графики: 
         а) полноцветный (True Color); 
         б) High Color; 
         в) индексный.   

При полноцветном режиме для кодирования яркости  каждой из составляющих используют по 256 значений (восемь двоичных разрядов), то есть на кодирование цвета одного пикселя (в системе RGB) надо затратить 8*3=24 разряда. Это позволяет однозначно определять 16,5 млн цветов. Это довольно близко к чувствительности человеческого  глаза. При кодировании с помощью  системы CMYK для представления цветной  графики надо иметь 8*4=32 двоичных разряда.    

Режим High Color - это кодирование при помощи 16-разрядных двоичных чисел, то есть уменьшается количестко двоичных разрядов при кодировании каждой точки. Но при этом значительно уменьшается  диапазон кодируемых цветов.   

 При  индексном кодировании цвета  можно передать всго лишь 256 цветовых  оттенков. Каждый цвет кодируется  при помощи восьми бит данных. Но так как 256 значений не  передают весь диапазон цветов, доступный человеческому глазу,  то подразумевается, что к графическим  данным прилагается палитра (справочная  таблица), без которой воспроизведение  будет неадекватным: море может  получиться красным, а листья - синими. Сам код точки растра  в данном случае означает не  сам по себе цвет, а только  его номер (индекс) в палитре.  Отсюда и название режима - индексный.    

Соответствие  между количеством отображаемых цветов (К) и количеством бит для  их кодировки (а) находиться по формуле:    

К = 2а.

А К Достаточно  для…
4 2= 16  
8 2= 256 Рисованных  изображений типа тех, что видим  в мультфильмах, но недостаточно для  изображений живой природы
16 (High Color) 216 = 65536 Изображений, которые  на картинках в журналах и на фотографиях
24 (True Color) 224 = 16 777 216 Обработки и  передачи изображений, не уступающих по качеству наблюдаемым в живой  природе
Двоичный  код изображения, выводимого на экран, хранится в видеопамяти. Видеопамять - это электронное энергозависимое запоминающее устройство. Размер видеопамяти зависит от разрешающей способности дисплея и количества цветов. Но ее минимальный объем определяется так, чтобы поместился один кадр (одна страница) изображения, т.е. как результат произведения разрешающей способности на размер кода пикселя.   

Vmin = M * N * a.   

Двоичный  код восьмицветной палитры.

Цвет Составляющие
  к З С
Красный 1 0 0
Зеленый 0 1 0
Синий 0 0 1
Голубой 0 1 1
Пурпурный 1 0 1
Желтый 1 1 0
Белый 1 1 1
Черный 0 0 0
Шестнадцатицветная  палитра позволяет увеличить  количество используемых цветов. Здесь  будет использоваться 4-разрядная  кодировка пикселя: 3 бита основных цветов + 1 бит интенсивности. Последний  управляет яркостью трех базовых  цветов одновременно (интенсивностью трех электронных пучков).   

Двоичный  код шестнадцатицветной палитры.

Цвет Составляющие
  к З С Интенс
Красный 1 0 0 0
Зеленый 0 1 0 0
Синий 0 0 1 0
Голубой 0 1 1 0
Пурпурный 1 0 1 1
Ярко-желтый 1 1 0 1
Серый(белый) 1 1 1 0
Темно-серый 0 0 0 1
Ярко-голубой 0 1 1 1
Ярко-синий 0 0 1 0
       
Ярко-белый 1 1 1 1
Черный 0 0 0 0

Информация о работе Единицы измерения информации