Методы анализа документов

Автор работы: Пользователь скрыл имя, 07 Марта 2014 в 17:28, контрольная работа

Краткое описание

Анализ документов осуществляет практически каждый человек не задумываясь, что он делает именно это. Данная тематика, несмотря на наличие большого круга научных разработок и мнений, имеет и ряд отсутствующих разработок и нерешенных вопросов.
Системная значимость и научная неопределенность и стали основой для научной новизны анализа документов. Объект исследования - документ как форма человеческой коммуникации. Предмет исследования - метод анализа документов в современных условиях. Задача исследования: рассмотреть теоретические вопросы изучения анализа документов.

Содержание

Введение……………………………………………………………….3
1.Общие положения анализа документов……………………………4
2.Типы анализа документов……………………….………………….7
3.Аннотирование и реферирование………………………………….11
Заключение…………………………………………………………….12
Список литературы…………

Вложенные файлы: 1 файл

Методы анализа документов.doc

— 107.50 Кб (Скачать файл)

 

Факультет Управления .

Специальность «Менеджмент организации»

 

 

 

 

 

Контрольная работа

 

Исследование систем управления

 

Тема: Методы анализа документов

 

 

 

Выполнила: Вольских Ю.С., УС 31/2-08.

Проверил: Андреев А.Н.

 

 

 

 

 

 

 

Москва 2013 г.

 

Оглавление

 
Введение……………………………………………………………….3 
1.Общие положения анализа документов……………………………4 
2.Типы анализа документов……………………….………………….7 
3.Аннотирование и реферирование………………………………….11 
Заключение…………………………………………………………….12 
Список литературы…………………………………………………….13 
Введение

В современном обществе важным средством оформления, фиксации, сохранения, передачи информации и обмена ею являются документы. В данной работе рассматриваются вопросы, связанные с анализом информации.

Более 33% отечественных топ-менеджеров к перспективным информационным технологиям, предназначенным для решения инновационных задач, относят сбор и анализ информации. Предполагая с их помощью «ускорить решение таких задач, как прогнозирование тенденций и выявление изменений в поведении и в требованиях клиентов».

Анализ документов осуществляет практически каждый человек не задумываясь, что он делает именно это. Данная тематика, несмотря на наличие большого круга научных разработок  и мнений, имеет и ряд отсутствующих разработок и нерешенных вопросов.

Системная значимость и научная неопределенность и стали основой для научной новизны  анализа документов. Объект исследования - документ как форма человеческой коммуникации. Предмет исследования  -  метод анализа документов в современных условиях. Задача исследования: рассмотреть теоретические вопросы   изучения   анализа документов. 
 

Общие положение анализа документов

Анализ – метод научного исследования явлений и процессов, в основе которого лежит изучение составных частей, элементов изучаемой системы.

Аналитические методы широко распространены в социуме, поэтому термин «Анализ» часто воспринимается как синоним исследования вообще и особенно при решении познавательных задач. Анализа является составной частью любого научного исследования, образуя, как правило, его первую стадию, когда исследователь выявляет в описании изучаемого объекта его строение, состав, свойства, признаки и т.п. Он используется как метод получения новых результатов в процессе мыслительной деятельности человека. Анализ документов – это метод сбора первичных данных, при котором документы используются в качестве главного источника информации; это также совокупность методических приёмов и процедур, применяемых для извлечения информации из документальных источников при изучении процессов и явлений в целях решения определённых задач.

Анализ текста – это процесс получения на естественном языке высококачественной информации из этого текста.

Аналитические справки обычно делятся на два вида. Первые представляют справки с выводами; вторые – с вариантами решений в предполагаемой ситуации и оценкой последствий каждого варианта. С помощью таких аналитических справок лицо, принимающее решение видит сущность проблемы и получает информацию, необходимую для принятия решения. Такая справка, кроме текстового описательного материала, может содержать в себе таблицы, диаграммы и графики.

В общем случае всем, особенно трудоспособному населению, постоянно приходится работать с текстовыми и иными видами документов, явно или неявно анализируя их содержание и другие компоненты, например, качество изготовление, форму, размер и т.д. Таким образом, важной задачей практически любых индивидов является нахождение нужных им документов, а также анализ их содержания на предмет подготовки различных документов. При этом нередко возникают ситуации, когда в течение незначительного периода времени необходимо подготовить некоторый материал.

Анализ текста использовался и продолжает использоваться для классификации текстов, содержащихся в них слов и словосочетаний, аннотирования и реферирования текстов, проведения семантически ориентированного поиска текстов по заданным концептам, определения авторского права претендента на соответствующий текст и др.

Считается, что в реальной жизни правила чтения текстов не формализуются. Человек постигает их годами, активно работая в определённой сфере деятельности и предметной области. Специалисты отмечают, что разные контексты порождают различные правила их прочтения, которые со временем меняются, поэтому трудно научить таким правилам компьютер, а значит автоматически учитывать содержательные аспекты обрабатываемого текста. В результате для выполнения заданного набора операций производят сопряжение информационного и семантического пространств с пространством формальных правил чтения текстов. При этом информационное пространство порождается семантическим.

Методы анализа документов многообразны. Они постоянно совершенствуются. Так, методы анализа логической структуры текста позволяют при чтении черпать из текста документа больше, чем её содержится в самом документе, а при составлении на его основе сжатого текста – делать его логически стройным, легко понимаемым и убедительным.

Особенность анализа текстового материала заключается в потребности исследователя проникать в смысл рассматриваемого им произведения и в акцентировании подвижной структуры текста. Предлагается в процессе анализа теста, для получения семантического представления, рассматривать его как некоторую иерархическую структуру. Как правило, для этого применяется метод шаблонов: входной текст разделяется с помощью шаблонов, затем производится обработка полученных данных.  
 

Типы анализа документов

Используются различные варианты анализа текстовых материалов документов, в которых выделяют два основных типа:  
1.Традиционный,или классический.  
2. Формализованный, или количественный.

Различаясь между собой, они не исключают, а взаимно дополняют друг друга, позволяя компенсировать недостатки каждого.

Традиционный анализ представляет собой совокупность определённых логических построений, направленных на раскрытие основного содержания изучаемого материала и позволяет преобразовать первоначальную форму содержащейся в документе информации в форму, интересующую исследователя.

Он включает многообразие умственных операций, направленных на интерпретацию сведений, содержащихся в документе, с определённой точки зрения принятой исследователем в каждом конкретном случае. Традиционный анализ является самостоятельным, творческим процессом, зависящим от:  
1) содержания и направленности исследуемого документа;  
2) условий, целей и задач проводимого исследования;  
3) научной квалификации, богатства опыта и творческой интуиции исследователя.

Проведение такого анализа заключается в преобразовании первоначальной формы исследуемой информации в необходимую с точки зрения исследователя. Фактически такой способ означает интерпретацию содержания документа, то есть его толкование исследователем при выполнении поставленной перед ним задачи.

Традиционный классический анализ позволяет охватывать скрытые части содержания документа, поскольку исследователь может, а порой и должен, проникать вглубь документа, исчерпывая его содержание.

Различают внешний и внутренний традиционный анализ.

Внешний анализ предназначен для установления вида документа, формы, времени и места его появления, автора, цели создания, надёжности и достоверности, его контекста. Фактически основные его компоненты входят в состав библиографического описания документа. Пренебрежение таким анализом может привести к неверному толкованию содержания документа.

Внутренний анализ ориентирован на исследование содержания документа. Отмечается, что анализ документа в рамках этого метода представляет самостоятельный творческий процесс, зависящий от формы и содержания исследуемого документа, целей и условий проведения исследования, опыта и творческой интуиции исследователя. Примером такого анализа является аннотирование документов.

Основная слабость данного метода – субъективность, ибо любая интерпретация документа исследователем в большей или меньшей степени субъективна. Попытки избавиться от субъективности традиционного анализа привели к появлению формализованных, количественных методов анализа документов – к контент-анализу.

Контент-анализ

Контент-анализ – анализ содержания.

Он является частным случаем анализа документов. Суть данного метода заключается в том, чтобы найти легко подсчитываемые признаки и свойства, отражающие существенные стороны содержания документа. При этом содержание документа становится измеримым. Одним из вариантов статистического анализа текстов, позволяющим вычислить сколько раз то или иное слово встречается в выбранном тексте, является программа Wordstat. В ней можно получить общую статистику по нескольким обрабатываемым файлам. Результаты подсчёта сохраняются в отдельном файле.

Контент-анализ является, прежде всего, количественным методом, предполагающим числовую оценку компонентов текста, дополняемую различными качественными классификациями и выявлением тех или иных структурных закономерностей.

Контент-анализ основан на стандартизации процедур поиска, определении в содержании изучаемого документа единиц счёта, в качестве которых выступают отдельные слова, суждения, выраженные в форме предложений, абзацев, фрагментов текстов, оценки, точки зрения, аргументы, а также различные виды публикаций. Определение единиц счёта зависит от целей исследования.

Таким образом, основой контент-анализа является подсчёт встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа – это выяснение того, что считать – иными словами, определение единиц анализа.

От единиц контент-анализа обычно требуется некоторая субъективная, зависящая от контекста значимость, то есть единицы анализа должны быть интересными для последующей интерпретации. При этом такие единицы носят содержательный характер. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения.

В ряде случаев используют два вида контент-анализа, отличающиеся характером представления содержания текста: качественный и количественный.

Количественный контент-анализ основан на использовании количественных мер, его задача – получить количественную характеристику содержания изучаемого текста.

Чаще всего единицы контент-анализа являются содержательными и их выделение основывается на семантических критериях.

Содержательная интерпретация результатов зависит от целей анализа. Она является, прежде всего, творческим актом, результаты которого во многом предопределены квалификацией и интуицией аналитиков.

Аналитиков обычно интересуют не одномоментные срезы, а различные макроединицы. Их в отдельно взятых текстах обычно бывает немного. Метод контент-анализа применяется как к отдельно взятому тексту, так и к информационному массиву или информационному потоку, состоящему из большого количества текстов. При этом статистические закономерности в выборке более проявляются в большом её объеме, поскольку оценить их динамику можно на большом временном промежутке или при сопоставлении большого количества документов.

Специалисты отмечают, что контент-анализ занимает особое место среди аналитических методов, поскольку является самым технологичным из них и в силу этого в наибольшей степени подходящим для систематического мониторинга больших информационных потоков.

Возвращаясь к рассмотрению проблем, непосредственно связанных с анализом документов, следует заметить, что к различным видам отражения популярной, научной и других форм деятельности социума относят справки и отчёты, статьи и доклады, тезисы и записки, аннотации, рефераты и монографии, правила, законы и другие документы.

Выделим в них два основных вида:  
1. Текстовые или смешанные документы, в которых анализируются только текстовые материалы с целью выявления значимой информации.  
2. Смешанные документы или только табличные данные, необходимые для получения из них таких документов, как отчёты и справки. Главным образом эти документы включают табличные материалы, на основе которых формируются вторичные данные, входящие в состав различных отчётов, справок . С этой целью используются разные системы, разновидности которых представлены ниже.

Важным видом документов (формой их сжатия) являются аннотации и рефераты. Рассмотрим их подробнее.

Аннотирование и реферирование

Любой специалист должен иметь устойчивые навыки работы с текстами. При этом, конечно, можно говорить об умении пользоваться всеми информационными процессами. Наиболее важным и трудным в рассматриваемом случае является процедура, включающая одновременно несколько информационных процессов, нацеленная на определённый способ переработки текста, позволяющий без искажений содержания документа-источника получить из него вторичный документ в сжатом виде. Такая деятельность определяется как аннотирование и реферирование, а применяемый способ – аналитико-синтетическая переработка. 

Аннотация – краткая характеристика документа, раскрывающая его содержание, вид, структуру, назначение и другие особенности.

Она является разновидностью информационного свертывания в результате аналитико-синтетической переработки документа, вторичным документом и используется в частности в библиотечном деле. Аннотация может быть элементом библиографической записи, оформления публикации материалов и др. Отмечается, что в среднем аннотация должна содержать от 150 до 200 знаков.

Информация о работе Методы анализа документов