Классификация информационных систем

Автор работы: Пользователь скрыл имя, 15 Ноября 2013 в 16:44, реферат

Краткое описание

Длительное время такие понятия как хранилища данных, системы поддержки принятия решений, OLAP считались слишком новыми и неапробированными технологиями для применения в банках. Некоторыми рассматривались как просто дорогие игрушки. Однако сегоднешнее развитие информационных технологий говорит совсем о другом. Цель этой статьи – познакомить широкий круг банковских специалистов с инструментами, позволяющими значительно сократить время и средства при выполнении широкого круга задач. В некоторых случаях без подобных инструментов просто невозможно обойтись.

Содержание

Введение
2. Основные понятия. Сравнение оперативных и аналитических ИС с точки зрения обеспечения данными
3. Понятие, структура и свойства информационных хранилищ
4. Проблемы интеграции данных
5.Реализация хранилищ и витрин данных
6. Заключение
7. Список литературы

Вложенные файлы: 1 файл

Реферат Ларин.docx

— 50.51 Кб (Скачать файл)

Необходимость наличия  многоуровневых справочников метаданных

Если роль метаданных (обычно содержащихся в таблицах-каталогах) в оперативных информационных системах достаточно ограничена, то для OLAP-систем наличие развитых метаданных и средств  их предоставления конечным пользователям  является одним из основных условий  успешной реализации. Например, прежде, чем менеджер корпорации задаст системе свой вопрос, он должен понять, какая информация имеется, насколько она актуальна, можно ли ей доверять, сколько времени может занять формирование ответа и т.д. Для пользователя OLAP-системы требуются метаданные, по крайней мере, следующих типов:

(1) Описания структур данных, их взаимосвязей.

(2) Информация о хранимых  на хранилище данных и поддерживаемых  им агрегатах данных.

(3) Информация об источниках  данных и о степени их достоверности.  Одна и та же информация  могла попасть в хранилище  данных из разных источников. Пользователь должен иметь возможность  узнать, какой источник был выбран  основным, и каким образом производились  согласование и очистка данных.

(4) Информация о периодичности  обновлений данных. Желательно знать  не только то, какому моменту  времени соответствуют интересующие  его данные, но и когда они  в следующий раз будут обновлены. 

(5) Информация о владельцах  данных. Пользователю OLAP-системы может  оказаться полезной информация  о наличии в системе данных, к которым он не имеет доступа,  о владельцах этих данных и  о действиях, которые он должен  предпринять, чтобы получить доступ  к данным.

(6) Статистические оценки  времени выполнения запросов. До  выполнения запроса полезно иметь  хотя бы приблизительную оценку  времени, которое потребуется  для получения ответа, и объема  этого ответа.

Потребность в  эффективном хранении и обработке очень больших объемов информации

Уже сейчас известны примеры  хранилищ данных, содержащих терабайты  информации. По данным консалтинговой компании Meta Group, около половины корпораций, использующих или планирующих использовать хранилища данных, предполагает довести их объем до сотен гигабайт. Проблемой таких больших хранилищ является то, что накладные расходы на внешнюю память возрастают нелинейно при возрастании объема хранилища. Исследования, проведенные на основе тестового набора TPC-D, показали, что для баз данных объемом в 100 гигабайт потребуется внешняя память объемом в 4.87 раза большая, чем нужно собственно для полезных данных. При дальнейшем росте баз данных этот коэффициент увеличивается.

 

 

 

 

 

 

 

 

 

 

 

5. Реализация хранилищ и витрин данных

Варианты реализации хранилищ данных

  • Виртуальное хранилище данных
  • Витрины данных
  • Глобальное хранилище данных
  • Многоуровневая архитектура хранилища данных

Виртуальное хранилище  данных

В его основе - репозиторий метаданных, которые описывают источники информации (БД транзакционных систем, внешние файлы и др.), SQL-запросы для их считывания и процедуры обработки и предоставления информации. Непосредственный доступ к последним обеспечивает ПО промежуточного слоя. В этом случае избыточность данных нулевая. Конечные пользователи фактически работают с транзакционными системами напрямую со всеми вытекающими отсюда плюсами (доступ к "живым" данным в реальном времени) и минусами (интенсивный сетевой трафик, снижение производительности OLTP-систем и реальная угроза их работоспособности вследствие неудачных действий пользователей-аналитиков).

Витрина данных

Витрина данных (Data Mart) по своему исходному определению - это набор тематически связанных баз данных, которые содержат информацию, относящуюся к отдельным аспектам деятельности корпорации. По сути дела, витрина данных - это облегченный вариант хранилища данных, содержащий только тематически объединенные данные. Целевая база данных максимально приближена к конечному пользователю и может содержать тематически ориентированные агрегатные данные. Витрина данных, естественно, существенно меньше по объему, чем корпоративное хранилище данных, и для его реализации не требуется особо мощная вычислительная техника.

Глобальное хранилище  данных

В последнее время все  более популярной становится идея совместить концепции хранилища и витрины  данных в одной реализации и использовать хранилище данных в качестве единственного  источника интегрированных данных для всех витрин данных. Тогда естественной становится такая трехуровневая  архитектура системы:

На первом уровне реализуется корпоративное хранилище данных на основе одной из развитых современных реляционных СУБД. Это хранилище интегрированных в основном детализированных данных. Реляционные СУБД обеспечивают эффективное хранение и управление данными очень большого объема, но не слишком хорошо соответствуют потребностям OLAP-систем, в частности, в связи с требованием многомерного представления данных.

На втором уровне поддерживаются витрины данных на основе многомерной системы управления базами данных (примером такой системы является Oracle Express Server). Такие СУБД почти идеально подходят для целей разработки OLAP-систем, но пока не позволяют хранить сверхбольшие объемы данных (предельный размер многомерной базы данных составляет 10-40 Гбайт). В данном случае это и не требуется, поскольку речь идет о витринах данных. Заметим, что витрина данных не обязательно должна быть полностью сформирована. Она может содержать ссылки на хранилище данных и добирать оттуда информацию по мере поступления запросов. Конечно, это несколько увеличивает время отклика, но зато снимает проблему ограниченного объема многомерной базы данных.

Наконец, на третьем уровне находятся клиентские рабочие места конечных пользователей, на которых устанавливаются средства оперативного анализа данных.

Подходы и имеющиеся  решения 

Компания IBM

Решение компании IBM называется A Data Warehouse Plus. Целью компании является обеспечение интегрированного набора программных продуктов и сервисов, основанных на единой архитектуре. Основой хранилищ данных является семейство СУБД DB2. Преимуществом IBM является то, что данные, которые нужно извлечь из оперативной базы данных и поместить в хранилище данных, находятся в системах IBM. Поэтому естественная тесная интеграция программных продуктов.

Предлагаются три решения  для хранилищ данных:

(1) Изолированная витрина данных. Предназначен для решения отдельных задач вне связи с общим хранилищем корпорации.

(2) Зависимая витрина данных. Аналогичен изолированной витрине данных, но источники данных находятся под централизованным контролем.

(3) Глобальное хранилище данных. Корпоративное хранилище данных, которое полностью централизовано контролируется и управляется. Глобальное хранилище данных может храниться централизовано или состоять из нескольких распределенных в сети рынков данных.

Oracle

Решение компании Oracle в области хранилищ данных основывается на двух факторах: широкий ассортимент продуктов самой компании и деятельность партнеров в рамках программы Warehouse Technology Initiative. Возможности Oracle в области хранилищ данных базируются на следующих составляющих:

  • наличие реляционной СУБД Oracle 7, которая постоянно совершенствуется для лучшего удовлетворения потребностей хранилищ данных;
  • существование набора готовых приложений, обеспечивающих возможности разработки хранилища данных;
  • высокий технологический потенциал компании в области анализа данных;
  • доступность ряда продуктов, производимых другими компаниями.

Hewlett Packard

Работы, связанные с хранилищами  данных, выполняются в рамках программы  OpenWarehouse. Выполнение этой программы должно обеспечить возможность построения хранилищ данных на основе мощных компьютеров HP, аппаратуры других производителей и программных компонентов. Основой подхода HP являются Unix-платформы и программный продукт Intelligent Warehouse, который предназначен для управления хранилищами данных. Основа построения хранилищ данных, предлагаемая HP, оставляет свободу выбора реляционной СУБД, средств реинжиниринга и т.д.

NCR

Решение компании направлено на решение проблем корпораций, у  которых одинаково сильны потребности  и в системах поддержки принятия решений, и в системах оперативной  аналитической обработки данных. Предлагаемая архитектура называется Enterprise Information Factory и основывается на опыте использования системы управления базами данных Teradata и связанных с ней методах параллельной обработки.

Informix Software

Стратегия компании в отношение хранилищ данных направлена на расширение рынка для ее продукта On-Line Dinamic Parallel Server. Предлагаемая архитектура хранилища данных базируется на четырех технологиях: реляционные базы данных, программном обеспечении для управления хранилищем данных, средствах доступа к данным и платформе открытых систем. Три последние компонента разрабатываются партнерами компании. После выхода Универсального Сервера, основанного на объектно-реляционном подходе, можно ожидать, что и он будет использоваться для построения хранилищ данных.

SAS Institute

Компания считает себя поставщиком полного решения  для организации хранилища данных. Подход основан на следующем:

  • обеспечение доступа к данным с возможностью их извлечения из самых разнообразных хранилищ данных (и реляционных, и нереляционных);
  • преобразование данных и манипулирование ими с использованием 4GL;
  • наличие сервера многомерных баз данных;
  • большой набор методов и средств для аналитической обработки и статистического анализа.

Sybase

Стратегия компании в области  хранилищ данных основывается на разработанной  ей архитектуре Warehouse WORKS. В основе подхода находится реляционная СУБД Sybase System 11, средство для подключения и доступа к базам данных OmniCONNECT и средство разработки приложений PowerBuilder. Компания продолжает совершенствовать свою СУБД для лучшего удовлетворения потребностей хранилищ данных (например, введена побитная индексация).

Software AG

Деятельность компании в  области хранилищ данных происходит в рамках программы Open Data Warehouse Initiative. Программа базируется на основных продуктах компании ADABAS и Natural 4GL, собственных и приобретенных средствах извлечения и анализа данных, средстве управления хранилищем данных SourcePoint. SourcePoint позволяет автоматизировать процесс извлечения и пересылки данных, а также их загрузки в хранилище данных.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заключение

Совместное применение новых  информационных технологий:

  • Технология хранилищ данных и оперативной аналитической обработки
  • Технологии Web и Java

позволит создать информационную инфраструктуру корпорации и упростить  доступ к данным для оперативного анализа.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список литературы:

1. http://www.olap.ru/desc/bobjects/bo_for.asp

2. http://citforum.ru/database/kbd98/glava15.shtml

 

 

 

 

 

 

 

 


Информация о работе Классификация информационных систем