Кодирование информации

Автор работы: Пользователь скрыл имя, 22 Ноября 2012 в 14:51, доклад

Краткое описание

Кодирование информации – это процесс формирования определенного представления информации. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.
Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.
Знак - это элемент конечного множества отличных друг от друга элементов.

Вложенные файлы: 1 файл

Кодирование информации.docx

— 20.64 Кб (Скачать файл)

Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее  определенных понятий.

Кодирование информации –  это процесс формирования определенного  представления информации. В более  узком смысле под термином «кодирование»  часто понимают переход от одной  формы представления информации к другой, более удобной для  хранения, передачи или обработки.

Обычно каждый образ при  кодировании (иногда говорят — шифровке) представлении отдельным знаком.

Знак - это элемент конечного  множества отличных друг от друга  элементов.

В более узком смысле под  термином "кодирование" часто  понимают переход от одной формы  представления информации к другой, более удобной для хранения, передачи или обработки.

Компьютер может обрабатывать только информацию, представленную в  числовой форме. Вся другая информация (например, звуки, изображения, показания  приборов и т. д.) для обработки  на компьютере должна быть преобразована  в числовую форму. Например, чтобы  перевести в числовую форму музыкальный  звук, можно через небольшие промежутки времени измерять интенсивность  звука на определенных частотах, представляя  результаты каждого измерения в  числовой форме. С помощью программ для компьютера можно выполнить  преобразования полученной информации, например "наложить" друг на друга  звуки от разных источников.

Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между  набором букв и числами называется кодировкой символов.

Как правило, все числа  в компьютере представляются с помощью  нулей и единиц (а не десяти цифр, как это привычно для людей). Иными  словами, компьютеры обычно работают в  двоичной системе счисления, поскольку  при этом устройства для их обработки  получаются значительно более простыми. Ввод чисел в компьютер и вывод  их для чтения человеком может  осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.

Способы кодирования  информации.

Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров  возникла необходимость кодирования  всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества - письменность и арифметика - есть не что иное, как система кодирования  речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.

Двоичное кодирование  – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках  с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Кодирование символьной (текстовой) информации.

Основная операция, производимая над отдельными символами текста - сравнение символов.

При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и  длина этого кода, а сам выбор  принципа кодирования практически  не имеет значения.

Для кодирования текстов  используются различные таблицы  перекодировки. Важно, чтобы при  кодировании и декодировании  одного и того же текста использовалась одна и та же таблица.

Таблица перекодировки - таблица, содержащая упорядоченный некоторым  образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его  двоичный код и обратно.

Наиболее популярные таблицы  перекодировки: ДКОИ-8, ASCII, CP1251, Unicode.

Исторически сложилось, что  в качестве длины кода для кодирования  символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу  текста, хранимому в компьютере, соответствует один байт памяти.

Различных комбинаций из 0 и 1 при длине кода 8 бит может  быть 28 = 256, поэтому с помощью одной  таблицы перекодировки можно  закодировать не более 256 символов. При  длине кода в 2 байта (16 бит) можно  закодировать 65536 символов.

Кодирование числовой информации.

Сходство в кодировании  числовой и текстовой информации состоит в следующем: чтобы можно  было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен быть различный код. Основное отличие числовых данных от символьных заключается в том, что над числами кроме операции сравнения производятся разнообразные математические операции: сложение, умножение, извлечение корня, вычисление логарифма и пр. Правила выполнения этих операций в математике подробно разработаны для чисел, представленных в позиционной системе счисления.

Основной системой счисления  для представления чисел в  компьютере является двоичная позиционная  система счисления.

Кодирование текстовой информации

В настоящее время, большая  часть пользователей, при помощи компьютера обрабатывает текстовую  информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Подсчитаем, сколько всего символов и какое количество бит нам  нужно.

10 цифр, 12 знаков препинания, 15 знаков арифметических действий, буквы русского и латинского  алфавита, ВСЕГО: 155 символов, что соответствует  8 бит информации.

Единицы измерения информации.

1 байт = 8 бит

1 Кбайт = 1024 байтам

1 Мбайт = 1024 Кбайтам

1 Гбайт = 1024 Мбайтам

1 Тбайт = 1024 Гбайтам

Суть кодирования заключается  в том, что каждому символу  ставят в соответствие двоичный код  от 00000000 до 11111111 или соответствующий  ему десятичный код от 0 до 255.

Необходимо помнить, что  в настоящее время для кодировки  русских букв используют пять различных  кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой

Основным отображением кодирования  символов является код ASCII - American Standard Code for Information Interchange- американский стандартный код обмена информацией, который представляет из себя таблицу 16 на 16, где символы закодированы в шестнадцатеричной системе счисления.

Кодирование графической  информации.

Важным этапом кодирования  графического изображения является разбиение его на дискретные элементы (дискретизация).

Основными способами представления  графики для ее хранения и обработки  с помощью компьютера являются растровые  и векторные изображения

Векторное изображение представляет собой графический объект, состоящий  из элементарных геометрических фигур (чаще всего отрезков и дуг). Положение  этих элементарных отрезков определяется координатами точек и величиной  радиуса. Для каждой линии указывается  двоичные коды типа линии (сплошная, пунктирная, штрихпунктирная), толщины и цвета.

Растровое изображение представляет собой совокупность точек (пикселей), полученных в результате дискретизации  изображения в соответствии с  матричным принципом.

Матричный принцип кодирования  графических изображений заключается  в том, что изображение разбивается  на заданное количество строк и столбцов. Затем каждый элемент полученной сетки кодируется по выбранному правилу.

Pixel (picture element - элемент рисунка) - минимальная единица изображения, цвет и яркость которой можно задать независимо от остального изображения.

В соответствии с матричным  принципом строятся изображения, выводимые  на принтер, отображаемые на экране дисплея, получаемые с помощью сканера.

Качество изображения  будет тем выше, чем "плотнее" расположены пиксели, то есть чем  больше разрешающая способность  устройства, и чем точнее закодирован  цвет каждого из них.

Для черно-белого изображения  код цвета каждого пикселя  задается одним битом.

Если рисунок цветной, то для каждой точки задается двоичный код ее цвета.

Поскольку и цвета кодируются в двоичном коде, то если, например, вы хотите использовать 16-цветный рисунок, то для кодирования каждого пикселя  вам потребуется 4 бита (16=24), а если есть возможность использовать 16 бит (2 байта) для кодирования цвета  одного пикселя, то вы можете передать тогда 216 = 65536 различных цветов. Использование  трех байтов (24 битов) для кодирования  цвета одной точки позволяет  отразить 16777216 (или около 17 миллионов) различных оттенков цвета - так называемый режим “истинного цвета” (True Color). Заметим, что это используемые в настоящее время, но далеко не предельные возможности современных компьютеров.

Кодирование звуковой информации.

Из курса физики вам  известно, что звук - это колебания  воздуха. По своей природе звук является непрерывным сигналом. Если преобразовать  звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени  напряжение.

Для компьютерной обработки  аналоговый сигнал нужно каким-то образом  преобразовать в последовательность двоичных чисел, а для этого его  необходимо дискретизировать и оцифровать.

Можно поступить следующим  образом: измерять амплитуду сигнала  через равные промежутки времени  и записывать полученные числовые значения в память компьютера.


Информация о работе Кодирование информации