Методы классификации и кодирования информации

Автор работы: Пользователь скрыл имя, 22 Июля 2013 в 17:12, курсовая работа

Краткое описание

Объектом изучения статистики является общество, протекающие в нём процессы и закономерности развития.
Статистика как наука представляет собой целостную систему научных дисциплин:
Общая теория статистики — разрабатывает теорию статистического исследования, являющуюся методологической основой остальных отраслей статистики.

Содержание

1. Введение
2. Система кодирования
3. Классификационное кодирование
4. Методы классификации и кодирования информации
5. Литература

Вложенные файлы: 1 файл

курс.docx

— 25.37 Кб (Скачать файл)

ОГЛАВЛЕНИЕ

1. Введение

2. Система кодирования

3. Классификационное кодирование

4. Методы классификации и кодирования информации

5. Литература

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

Статистика — это ряды цифр, которые характеризуют различные стороны жизни государства.

Статистика — это род практической деятельности людей цель которой сбор, обработка и анализ информации.

Статистика — это наука, разрабатывающая статистическую методологию т.е. набор приемов и способов сбора, обработки и анализа информации.

Таким образом, статистика —  это общетеоретическая наука (комплекс научных дисциплин), которая изучает  количественную сторону качественно  определенных массовых социально-экономических  явлений и процессов, иэ состав, распределение, размещение в пространстве, движение во времени выявляя действующие взаимозависимости и закономерности в конкретных условиях места и времени.

Объектом изучения статистики является общество, протекающие в  нём процессы и закономерности развития.

Статистика как наука  представляет собой целостную систему  научных дисциплин:

Общая теория статистики —  разрабатывает теорию статистического  исследования, являющуюся методологической основой остальных отраслей статистики.

Социально-экономическая  статистика (Макроэкономическая статистика). Использует методы общей теории статистики, изучает количественную сторону  социально-экономических явлений  и процессов на уровне национальной экономики.

Математическая статистика и теория вероятности. Изучает случайные  величины, законы их распределени.

Международная статистика. Предетом международной статистики является количественная сторона явлений и процессов зарубежных стран и международных организаций.

Отраслевые статистики. Предетом изучения является количественная сторона деятельности различных отраслей экономики (Статистика промышленности, сельского хозяйства).

Общая теория статистики открывает  курс изучения статистических дисциплин. Она является основополагающей дисциплиной  для изучения отраслевых стастик, создаёт фундамент для усвоения и применения статистических методов анализа.

Общая теория статистики является наукой о наиболее общих принципах  и методах статистического исследования социально-экономических явлений  и решает другие общественные вопросы. Она разрабатывает систему категорий, рассматривает методы сбора, обобщения  и анализа статистических данных.

Общая теория статистики —  методологическая основа всех отраслевых статистик.

При изложении основ теории статистики предполагается изучить  следующие вопросы:

предмет, методы и задачи статистики и ее связь с экономической  теорией и некоторыми другими  смежными дисциплинами;

система статистических показателей  и классификаций, используемых в  экономической статистике, их содержание и область применения, взаимосвязи  между показателями и классификациями  статистики;

наиболее важные направления  статистического анализа, основанного  на данных экономики и финансов;

основные источники первичных  данных и основы формирования статистической базы.

Предмет статистики — размеры  и количественные соотношения качественно  определенных социально-экономических  явлений, закономерности их связи и  развития в конкретных условиях места  и времени.

Предмет статистики (статистика изучает):

Массовые общественные явления  и их динамику при помощи статистических показателей. Требование массовости обусловлено  действием закона больших чисел  — при большом количестве наблюдений, действия случайных признаков взаимопогашаются. (численность населения, количество произведенной продукции)

Количественные и качественные явления (Цифровое освещение событий  общества).

Количественную сторону  общественных явлений в неразрывной  связи с их качественным содержанием, наблюдает процесс перехода количественных изменений в качественные (закономерности).

Развитие явления во времени (динамику).

 

 

 

 

 

 

 

СИСТЕМА КОДИРОВАНИЯ

Система кодирования применяется  для замены названия объекта на условное обозначение (код) в целях обеспечения  удобной и более эффективной  обработки информации.

Система  кодирования - совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:

§         длиной – число позиций в коде;

§         структурой – порядок расположения в коде символов, используемых для  обозначения классификационного признака.

Процедура присвоения объекту  кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования, которые образуют:

§         классификационную систему кодирования, ориентированную на проведение предварительной  классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;

§         регистрационную систему кодирования, не требующую предварительной классификации  объектов.

 

 

 

 

 

Классификационное кодирование

Классификационное кодирование  применяется после проведения классификации  объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование  используется для иерархической  классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей  группировки 1-го уровня, затем код  группировки 2-го уровня, затем код  группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования  обладает теми же достоинствами и  недостатками, что и иерархическая  система классификации.

Пример 1. Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 2.4). Количество кодовых группировок будет определяться глубиной классификации и равно 4. Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления – 10 арабских цифр. Анализ схемы на рис. 2.4 показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:

 

1-й (старший) разряд  выделен для классификационного  признака "название факультета" и имеет следующие значения: 1 – коммерческий; 2 – информационные  системы; 3 – для следующего названия  факультета и т.д.;

2-й разряд выделен для  классификационного признака "возраст"  и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 –  свыше 30 лет; 3-й разряд выделен  для классификационного признака "пол" и имеет следующие  значения: 1 – мужчины; 2 – женщины;

4-й разряд выделен для  классификационного признака "наличие  детей у женщин" и имеет следующие  значения: 1 – есть дети; 2 – нет  детей, 0 – для мужчин, так как  подобной информации не требуется.

Принятая система кодирования  позволяет легко расшифровать любой  код группировки, например:

1310 – студенты коммерческого  факультета, свыше 30 лет, мужчины; 2221 – студенты факультета информационных  систем, от 20 до 30 лет, женщины, имеющие  детей.

Параллельное кодирование  используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

Пример 2. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 2.6). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном методе не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд  выделен для фасета "пол"  и имеет следующие значения: 1 -мужчины; 2 – женщины;

2-й разряд выделен для  фасета "наличие детей у женщин" и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной  информации не требуется;

3-й разряд выделен для  фасета "возраст" и имеет  следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет;

4-й разряд выделен для  фасета "название факультета" и имеет следующие значения: 1 – радиотехнический, 2 – машиностроительный, 3 – коммерческий; 4 – информационные  системы; 5 – математический и  т.д.

Принятая система кодирования  позволяет легко расшифровать любой  код группировки, например:

2135 – женщины в возрасте  свыше 30 лет, имеющие детей  и являющиеся студентами математического  факультета;

1021 – мужчины возраста  от 20 до 30 лет, являющиеся студентами  радиотехнического факультета.

 

 

 

 

 

 

 

 

 

Методы классификации  и кодирования информации

Классификатор представляет собой систематизированный свод стандартных кодов и наименований классификационных группировок  и (или) объектов информации, построенных  в соответствии с установленными системами классификации и кодирования  информации.

По своему статусу классификаторы являются нормативными документами  по стандартизации, которые разрабатываются  по определенным правилам, утверждаются (принимаются) в установленном порядке  и являются обязательными для  применения в соответствующих сферах управления.

В зависимости от уровня утверждения и области применения классификаторы подразделяются на следующие  категории: общероссийские, отраслевые и классификаторы предприятий.

Общероссийские классификаторы утверждаются (принимаются) Госстандартом  России и применяются, как правило, в общероссийских унифицированных  формах документов, которые сгруппированы  в следующие унифицированные  системы:

§  организационно-распорядительной документации

§  первичной учетной  документации

§  банковской документации

§  финансовой, учетной  и отчетной бухгалтерской документации бюджетных учреждений и организаций 

§  отчетно-статистической документации

§  учетной и отчетной бухгалтерской документации предприятий 

§  документации по труду 

§  документации Пенсионного  фонда РФ

 

После названий унифицированных  систем документации в скобках приведены  их коды по Общероссийскому классификатору управленческой документации (ОКУД), в  котором они в установленном  порядке проходят государственную  регистрацию.

Отраслевые классификаторы утверждаются соответствующими федеральными органами исполнительной власти и применяются, как правило, в отраслевых унифицированных  формах документов.

Классификаторы предприятий  утверждаются предприятиями и применяются, как правило, в унифицированных  формах документов предприятий.

Для оценки максимального  объема информации в классификаторе используется показатель емкости классификатора. Этот показатель характеризует наибольшее количество позиций, которое может  содержать классификатор, и позволяет  оценить объем информации, который  может быть закодирован в классификаторе, исходя из всех возможных кодовых  комбинаций с учетом принятой системы  кодирования и структуры кода. Кроме того, используется показатель резервной емкости, т.е. количества свободных позиций в классификаторе, который отражает возможность расширения классификатора за счет включения в  него новых позиций.

Каждая позиция классификатора состоит, как правило, из наименования и кода классификационной группировки  или объекта классификации. В  состав позиции классификатора могут  включаться контрольное число (КЧ) для  контроля правильности проставленных  знаков кода и дополнительные признаки для характеристики классификационной  группировки.

Использование общероссийских классификаторов в статистической практике позволяет осуществлять сбор и обработку статистической информации в строго заданных разрезах в соответствии с границами и объемами содержательного  наполнения классификационных группировок.

 

Классифицирование (классификация) объектов информации (продукция, услуги, объекты административно-территориального деления и др.) производится по присущим объектам существенным характеристикам  и свойствам, которые называются признаками классификации. Признаки классификации могут иметь количественное (объем, удельный вес, стаж, возраст) или качественное (вид деятельности, специальность, профессия) выражение.

Совокупность методов, правил и признаков классификации образует систему классификации.

В ОКП, например, система  классификации продукции построена  с использованием иерархического метода классификации.

Этот метод представляет собой последовательное разделение множества объектов на подчиненные  классификационные группировки. Сначала  множество объектов делится по некоторому выбранному признаку (основанию деления) на крупные группировки, затем каждая из этих группировок делится на ряд  последующих группировок по другому  признаку, в целях дальнейшей конкретизации  объекта классификации. Таким образом, между классификационными группировками  устанавливается подчиненность (иерархия).

Информация о работе Методы классификации и кодирования информации