СОДЕРЖАНИЕ.
Введение
3
- Кодирование и декодирование информации 5
Заключение
12
Библиографический список
14
ВВЕДЕНИЕ.
Использование электронно-вычислительных
машин для переработки информации явилось
коренным этапом в совершенствовании
систем планирования и управления на всех
уровнях народного хозяйства. Однако при
этом, в отличие от обычных способов сбора
и обработки информации, возникли проблемы
преобразования информации в символы,
понятные для машины.
Неотъемлемым элементом
этого процесса является кодирование
информации. Кодом принято называть совокупность
символов, соответствующих элементам
информации или ее характеристикам. Сам
процесс составления кода в виде совокупности
символов или списка сокращений для соответствующих
элементов и характеристик называется
кодированием. В литературе термин код
иногда заменяется идентичным ему термином
шифр
Цель кодирования состоит
в том, чтобы представить информацию в
более компактной и удобной форме для
оперирования при передаче и обработке
информации приспособить кодированную
информацию к обработке на вычислительных
устройствах обеспечить использование
некоторого определенного метода поиска
, сортировки и упорядочения информации.
Принципиальная схема обработки информации
состоит из поиска, сортировки и упорядочения
, в которой кодирование является частью
операции ввода данных в виде входных
кодов.
В результате обработки
информации получаются выходные коды,
которые после их декодирования выдаются
как результат проведенной обработке.
Декодирование является операцией, обратной
кодированию. Если при кодировании происходит
преобразование информации в сигналы
в виде определенного сочетания символов
, соответствующих данному объекту или
его характеристике , то при декодировании
, наоборот , по заданному коду определяется
соответствующий объект или его признаки.
1. КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ
ИНФОРМАЦИИ.
Код — это набор
условных обозначений (или сигналов) для
записи (или передачи) некоторых заранее
определенных понятий.
Кодирование информации
– это процесс формирования определенного
представления информации. В более узком
смысле под термином «кодирование» часто
понимают переход от одной формы представления
информации к другой, более удобной для
хранения, передачи или обработки.
Обычно каждый образ при кодировании
(иногда говорят — шифровке) представлении
отдельным знаком.
Знак - это элемент
конечного множества отличных друг от
друга элементов.
В более узком
смысле под термином "кодирование"
часто понимают переход от одной формы
представления информации к другой, более
удобной для хранения, передачи или обработки.
Декодирование
- процесс обратного преобразования кода
к форме исходной символьной системы,
т.е. получение исходного сообщения.
Например:
перевод с азбуки Морзе в письменный текст
на русском языке.
В более
широком смысле декодирование — это процесс
восстановления содержания закодированного
сообщения. При таком подходе процесс
записи текста с помощью русского алфавита
можно рассматривать в качестве кодирования,
а его чтение — это декодирование.
Неравномерность
кода − • − − • • • − − • • − Характерной
особенностью азбуки Морзе является переменная
длина кода разных букв, поэтому код Морзе
называют неравномерным кодом. Буквы,
которые встречаются в тексте чаще, имеют
более короткий код, чем редкие буквы.
Это сделано для того, чтобы сократить
длину всего сообщения. Но из-за переменной
длины кода букв возникает проблема отделения
букв друг от друга в тексте. Поэтому для
разделения приходится использовать паузу
(пропуск). Следовательно, телеграфный
алфавит Морзе является троичным, т.к.
в нем используются три знака: точка, тире,
пропуск.
Компьютер может
обрабатывать только информацию, представленную
в числовой форме. Вся другая информация
(например, звуки, изображения, показания
приборов и т. д.) для обработки на компьютере
должна быть преобразована в числовую
форму. Например, чтобы перевести в числовую
форму музыкальный звук, можно через небольшие
промежутки времени измерять интенсивность
звука на определенных частотах, представляя
результаты каждого измерения в числовой
форме. С помощью программ для компьютера
можно выполнить преобразования полученной
информации, например "наложить"
друг на друга звуки от разных источников.
Аналогичным образом
на компьютере можно обрабатывать текстовую
информацию. При вводе в компьютер каждая
буква кодируется определенным числом,
а при выводе на внешние устройства (экран
или печать) для восприятия человеком
по этим числам строятся изображения букв.
Соответствие между набором букв и числами
называется кодировкой символов.
Как правило, все
числа в компьютере представляются с помощью
нулей и единиц (а не десяти цифр, как это
привычно для людей). Иными словами, компьютеры
обычно работают в двоичной системе счисления,
поскольку при этом устройства для их
обработки получаются значительно более
простыми. Ввод чисел в компьютер и вывод
их для чтения человеком может осуществляться
в привычной десятичной форме, а все необходимые
преобразования выполняют программы,
работающие на компьютере.
Способы кодирования
информации.
Одна и та же информация
может быть представлена (закодирована)
в нескольких формах. C появлением компьютеров
возникла необходимость кодирования всех
видов информации, с которыми имеет дело
и отдельный человек, и человечество в
целом. Но решать задачу кодирования информации
человечество начало задолго до появления
компьютеров. Грандиозные достижения
человечества - письменность и арифметика
- есть не что иное, как система кодирования
речи и числовой информации. Информация
никогда не появляется в чистом виде, она
всегда как-то представлена, как-то закодирована.
Двоичное кодирование
– один из распространенных способов
представления информации. В вычислительных
машинах, в роботах и станках с числовым
программным управлением, как правило,
вся информация, с которой имеет дело устройство,
кодируется в виде слов двоичного алфавита.
Кодирование символьной
(текстовой) информации.
Основная операция, производимая
над отдельными символами текста - сравнение
символов.
При сравнении
символов наиболее важными аспектами
являются уникальность кода для каждого
символа и длина этого кода, а сам выбор
принципа кодирования практически не
имеет значения.
Для кодирования
текстов используются различные таблицы
перекодировки. Важно, чтобы при кодировании
и декодировании одного и того же текста
использовалась одна и та же таблица.
Таблица перекодировки - таблица,
содержащая упорядоченный некоторым образом
перечень кодируемых символов, в соответствии
с которой происходит преобразование
символа в его двоичный код и обратно.
Наиболее популярные таблицы
перекодировки: ДКОИ-8, ASCII, CP1251, Unicode.
Исторически сложилось,
что в качестве длины кода для кодирования
символов было выбрано 8 бит или 1 байт.
Поэтому чаще всего одному символу текста,
хранимому в компьютере, соответствует
один байт памяти.
Различных комбинаций из 0 и
1 при длине кода 8 бит может быть 28 = 256,
поэтому с помощью одной таблицы перекодировки
можно закодировать не более 256 символов.
При длине кода в 2 байта (16 бит) можно закодировать
65536 символов.
Кодирование числовой
информации.
Сходство в кодировании
числовой и текстовой информации состоит
в следующем: чтобы можно было сравнивать
данные этого типа, у разных чисел (как
и у разных символов) должен быть различный
код. Основное отличие числовых данных
от символьных заключается в том, что над
числами кроме операции сравнения производятся
разнообразные математические операции:
сложение, умножение, извлечение корня,
вычисление логарифма и пр. Правила выполнения
этих операций в математике подробно разработаны
для чисел, представленных в позиционной
системе счисления.
Основной системой
счисления для представления чисел в компьютере
является двоичная позиционная система
счисления.
Кодирование текстовой
информации
В настоящее время,
большая часть пользователей, при помощи
компьютера обрабатывает текстовую информацию,
которая состоит из символов: букв, цифр,
знаков препинания и др. Подсчитаем, сколько
всего символов и какое количество бит
нам нужно.
10 цифр, 12 знаков
препинания, 15 знаков арифметических действий,
буквы русского и латинского алфавита,
ВСЕГО: 155 символов, что соответствует
8 бит информации.
Единицы измерения
информации.
1 байт = 8 бит
1 Кбайт = 1024 байтам
1 Мбайт = 1024 Кбайтам
1 Гбайт = 1024 Мбайтам
1 Тбайт = 1024 Гбайтам
Суть кодирования
заключается в том, что каждому символу
ставят в соответствие двоичный код от
00000000 до 11111111 или соответствующий ему
десятичный код от 0 до 255.
Необходимо помнить,
что в настоящее время для кодировки русских
букв используют пять различных кодовых
таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем
тексты, закодированные при помощи одной
таблицы не будут правильно отображаться
в другой
Основным отображением
кодирования символов является код ASCII
- American Standard Code for Information Interchange- американский
стандартный код обмена информацией, который
представляет из себя таблицу 16 на 16, где
символы закодированы в шестнадцатеричной
системе счисления.
Кодирование графической
информации.
Важным этапом
кодирования графического изображения
является разбиение его на дискретные
элементы (дискретизация).
Основными способами
представления графики для ее хранения
и обработки с помощью компьютера являются
растровые и векторные изображения
Векторное изображение
представляет собой графический объект,
состоящий из элементарных геометрических
фигур (чаще всего отрезков и дуг). Положение
этих элементарных отрезков определяется
координатами точек и величиной радиуса.
Для каждой линии указывается двоичные
коды типа линии (сплошная, пунктирная,
штрихпунктирная), толщины и цвета.
Растровое изображение представляет
собой совокупность точек (пикселей), полученных
в результате дискретизации изображения
в соответствии с матричным принципом.
Матричный принцип
кодирования графических изображений
заключается в том, что изображение разбивается
на заданное количество строк и столбцов.
Затем каждый элемент полученной сетки
кодируется по выбранному правилу.
Pixel (picture element - элемент рисунка)
- минимальная единица изображения, цвет
и яркость которой можно задать независимо
от остального изображения.
В соответствии
с матричным принципом строятся изображения,
выводимые на принтер, отображаемые на
экране дисплея, получаемые с помощью
сканера.
Качество изображения
будет тем выше, чем "плотнее" расположены
пиксели, то есть чем больше разрешающая
способность устройства, и чем точнее
закодирован цвет каждого из них.
Для черно-белого
изображения код цвета каждого пикселя
задается одним битом.
Если рисунок
цветной, то для каждой точки задается
двоичный код ее цвета.
Поскольку и цвета
кодируются в двоичном коде, то если, например,
вы хотите использовать 16-цветный рисунок,
то для кодирования каждого пикселя вам
потребуется 4 бита (16=24), а если есть возможность
использовать 16 бит (2 байта) для кодирования
цвета одного пикселя, то вы можете передать
тогда 216 = 65536 различных цветов. Использование
трех байтов (24 битов) для кодирования
цвета одной точки позволяет отразить
16777216 (или около 17 миллионов) различных
оттенков цвета - так называемый режим
“истинного цвета” (True Color). Заметим, что
это используемые в настоящее время, но
далеко не предельные возможности современных
компьютеров.