Автор работы: Пользователь скрыл имя, 12 Марта 2013 в 18:00, шпаргалка
Предметной областью курса «Технологии организации, хранения и обработки данных» является часть реального мира, (это может быть предприятие, его часть, процесс, система и т.д.), которая описывается или моделируется с помощью информационных систем и разрабатываемого программного обеспечения. Информационные системы разного класса и назначения, предназначены для оперирования особо интенсивными потоками информации и олицетворяют собой новую человеко-машинную технологию сбора, обработки, передачи информации.
o кластеризация. Логически продолжает идею классификации на более сложный случай, когда сами классы еще не определены. Результатом использования метода, выполняющего кластеризацию, является определение (посредством свободного поиска) классов. Так, например, можно выделить группы клиентов или покупателей, схожих по каким-то признакам, чтобы в отношении их вести дифференцированную политику;
o ассоциация. В отличие от двух предыдущих типов определяется не на основе значений свойств одного объекта или события, а выявляет связи
между двумя или несколькими одновременно наступающими событиями. При этом указывается на то, что при наступлении одного события с той или иной степенью вероятности наступает другое. С помощью ассоциации можно выполнить анализ покупательской корзины, портфеля ценных бумаг, набора финансовых услуг и др.;
o последовательность. Также выявляет связи между событиями, но наступающими не одновременно, а с некоторым определенным разрывом во времени. Таким образом, ассоциация есть частный случай последовательности с нулевым временным интервалом. С помощью последовательности можно ответить, например, на вопрос, покупки каких товаров предшествуют покупке данного вида продукции;
o прогнозирование. Представляет собой особую форму предсказания, которая на основе особенностей поведения текущих и исторических данных оценивает будущие значения определенных показателей. В задачах подобного типа наиболее часто используются традиционные методы математической статистики (в частности, регрессия), а также нейронные сети.
При выявлении перечисленных
закономерностей Data Mining использует большое
число различных методов
Лидерами на рынке систем интеллектуальной обработки данных являются компании Business Objects, Cognos, Information Builders, а также корпорации Microsoft и Oracle.
85.Пользователи базы данных. Администратор базы данных и его функции.
Пользователем базы данных называют лицо или прикладную программу, которые могут обращаться с командами и/или запросами к базе данных и получать от нее результаты обращений. Людей, которые работают с базой данных, можно разделить на две категории: конечные пользователи и обслуживающий персонал.
Конечный пользователь базы данных - это специалист предметной области, которому требуется информация из базы данных для выполнения прямых служебных обязанностей.
Обслуживающий персонал - люди, ответственные за работу базы данных и соответствующего прикладного программного обеспечения.
Администратор базы данных - это :
Управляющий данными, а не их хозяин;
Эксперт высшего уровня, обеспечивающий службу эксплуатации базы данных решениями по процедурам и регламентам работы;
Лицо, принимающее окончательные решения в своей области, обладающее способностями к общению, совместному планированию и компромиссам.
Основные функции
" контроль целостности и восстановление базы данных
" настройка СУБД на конкретные условия применения
" настройка СУБД для эффективной обработки данных и обслуживания пользователей
" сбор и анализ статистики функционирования базы данных
" реорганизация (реструктуризация) базы данных в соответствии с изменениями предметной области
" подключение новых разработчиков и пользователей, назначение им паролей, привилегий доступа к конкретным данным
" контроль изменения объема базы данных, определение целесообразности модернизации оборудования
" консультирование пользователей по особенностям используемой версии СУБД, инструментов разработки запросов и других приложений
" разработка процедур использования типичных средств СУБД и документации, регламентирующей действия пользователей по отношению к базе данных.