Автор работы: Пользователь скрыл имя, 26 Января 2012 в 12:59, курсовая работа
Стремительное развитие информационных технологий, в частности, прогресс в методах сбора, хранения и обработки данных позволил многим организациям собирать огромные массивы данных, которые необходимо анализировать. Объемы этих данных настолько велики, что возможностей экспертов уже не хватает, что породило спрос на методы автоматического исследования (анализа) данных, который с каждым годом постоянно увеличивается.
Введение 2
1 Применение метода дерева решений для принятия решений 3
1.1 Области применения деревьев решений 3
1.2 Дерево решений 3
1.3 Порядок построения дерева решений 7
1.4 Преимущества деревьев решений 11
2 Применение дерева решений для снижения кредитного риска на примере Банка Москвы 12
2.1 Характеристика ОАО "Банка ВТБ-24" 12
2.2 Анализ кредитоспособности клиента при помощи методики дерева решений 12
Заключение 15
Список литературы 16
В узлах бинарных деревьев ветвление может вестись только в двух направлениях, т.е. существует возможность только двух ответов на поставленный вопрос ("да" и "нет").
Бинарные деревья являются самым простым, частным случаем деревьев решений. В остальных случаях, ответов и, соответственно, ветвей дерева, выходящих из его внутреннего узла, может быть больше двух.
Рассмотрим более сложный пример. База данных, на основе которой должно осуществляться прогнозирование, содержит следующие ретроспективные данные о клиентах банка, являющиеся ее атрибутами: возраст, наличие недвижимости, образование, среднемесячный доход, вернул ли клиент вовремя кредит. Задача состоит в том, чтобы на основании перечисленных выше данных (кроме последнего атрибута) определить, стоит ли выдавать кредит новому клиенту.
Как мы уже рассматривали в лекции, посвященной задаче классификации, такая задача решается в два этапа: построение классификационной модели и ее использование.
На этапе построения модели, собственно, и строится дерево классификации или создается набор неких правил. На этапе использования модели построенное дерево, или путь от его корня к одной из вершин, являющийся набором правил для конкретного клиента, используется для ответа на поставленный вопрос "Выдавать ли кредит?"
Правилом является логическая конструкция, представленная в виде "если : то :"
На рис. 3. приведен пример дерева классификации, с помощью которого решается задача "Выдавать ли кредит клиенту?". Она является типичной задачей классификации, и при помощи деревьев решений получают достаточно хорошие варианты ее решения.
Как видно из рисунка, внутренние узлы дерева (возраст, наличие недвижимости, доход и образование) являются атрибутами описанной выше базы данных. Эти атрибуты называют прогнозирующими, или атрибутами расщепления. Конечные узлы дерева, или листы, именуются метками класса, являющимися значениями зависимой категориальной переменной "выдавать" или "не выдавать" кредит.
Каждая
ветвь дерева, идущая от внутреннего
узла, отмечена предикатом расщепления.
Последний может относиться лишь
к одному атрибуту расщепления данного
узла. Характерная особенность
На рис3. изображено одно из возможных деревьев решений для рассматриваемой базы данных. Например, критерий расщепления "Какое образование?", мог бы иметь два предиката расщепления и выглядеть иначе: образование "высшее" и "не высшее". Тогда дерево решений имело бы другой вид.
Таким
образом, для данной задачи (как и
для любой другой) может быть построено
множество деревьев решений различного
качества, с различной прогнозирующей
точностью.
Рис.
3 Дерево решений "Выдавать ли кредит?"
Качество построенного дерева решения весьма зависит от правильного выбора критерия расщепления. Над разработкой и усовершенствованием критериев работают многие исследователи.
Метод деревьев решений часто называют "наивным" подходом. Но благодаря целому ряду преимуществ, данный метод является одним из наиболее популярных для решения задач классификации.
Рассмотрев основные проблемы, возникающие при построении деревьев, было бы несправедливо не упомянуть об их достоинствах:
В силу этих и многих других причин, методология деревьев решений является важным инструментом в работе каждого специалиста, занимающегося анализом данных, вне зависимости от того практик он или теоретик.
Банк ВТБ24 — один из крупнейших участников российского рынка банковских услуг. Входит в международную финансовую группу ВТБ и специализируется на обслуживании физических лиц, индивидуальных предпринимателей и предприятий малого бизнеса.
Сеть банка формируют более 600 офисов в 69 регионах страны. Банк предлагает клиентам основные банковские продукты, принятые в международной финансовой практике.
В числе предоставляемых услуг: выпуск банковских карт, ипотечное и потребительское кредитование, автокредитование, услуги дистанционного управления счетами, кредитные карты с льготным периодом, срочные вклады, аренда сейфовых ячеек, денежные переводы. Часть услуг доступна клиентам в круглосуточном режиме, для чего используются современные телекоммуникационные технологии.
Основным акционером ВТБ24 является ОАО Банк ВТБ (98,92% акций). Уставный капитал ВТБ24 составляет 50,7 млрд рублей, размер собственных средств (капитала) — 116,2 млрд рублей.
Деятельность ВТБ24 осуществляется в соответствии с генеральной лицензией Банка России № 1623 от 13.07.2000 г.
Схему дерева решений используют, когда нужно принять несколько решений в условиях неопределенности, когда каждое решение зависит от исхода предыдущего или исходов испытаний.
Когда все решения и их исходы указаны на "дереве", просчитывается каждый из вариантов, и в конце проставляется его денежный доход. Все расходы, вызванные решением, проставляются на соответствующей "ветви".
Рассмотрим возможность применения метода для оценки кредитоспособности клиента N. Для финансирования проекта клиенту нужно занять сроком на один год 15000 руб. Банк может одолжить ему эти деньги под 15% годовых или вложить в дело со 100%-ным возвратом суммы, но под 9% годовых. Из прошлого опыта банкиру известно, что 4% таких клиентов ссуду не возвращают. Что делать? Давать ему заем или нет? Перед вами пример задачи с одним решением, поэтому можно воспользоваться как таблицей доходов, так и "деревом". Рассмотрим оба варианта.
Решение 1 (по таблице доходов).
Максимизируем ожидаемый в конце года чистый доход, который представляет собой разность суммы, полученной в конце года, и инвестированной в его начале. Таким образом, если заем был выдан и возвращен, то чистый доход составит:
Чистый
доход = ((15000 + 15% от 15000) – 15000) = 2250 руб.
Таблица 1. Чистый доход в конце года, руб.
Возможные исходы | Возможные решения | Вероятность | |
Выдавать заем | Не выдавать (инвестировать) | ||
Клиент заем возвращает | 2250 | 1350 | 0,96 |
Клиент заем не возвращает | 15000 | 1350 | 0,04 |
Ожидаемый чистый доход | 1560 | 1350 |
Если банк решает выдать заем, то максимальный ожидаемый чистый доход равен 1560 руб.
Решение 2 (по "дереву" решений) (рис.4).
В данном случае также используем критерий максимизации ожидаемого чистого дохода на конец года.
Рис. 4. "Дерево" решений для примера 1.
Далее расчет ведется аналогично расчетам по таблице доходов. Ожидаемый чистый доход в кружках А и В вычисляется следующим образом:
В кружке А:
Е (давать заем) = {17250 · 0,96 + 0 · 0,04} – 15000 == 16500 – 15000 = 1560 руб.
В кружке Б:
Е (не давать заем) = {16350 · 1,0 – 15000} = 1350 руб.
Поскольку ожидаемый чистый доход больше в кружке А, то принимаем решение выдать заем.
Мы рассмотрели простой пример, но применение метода дерева решений возможно и в более сложных случаях, когда необходимо учесть большее число параметров для принятия решения.
Дерево решений – способ отображения информации, имеющих много различных уровней и связей. Обычно представляет построенную по иерархическому принципу: главная цель или вершина дерева целей → подчиненные ей подцели первого, второго и последующих уровней (ветви дерева).
Дерево решений – популярный метод науки управления, используемый для выбора наилучшего направления действий из имеющихся вариантов.
Дерево решений позволяет представить проблему схематично и сравнить возможные альтернативы визуально. Этот метод можно использовать в применении к сложным ситуациям, когда результат принимаемого решения влияет на последующие.
Качество работы рассмотренного метода деревьев решений зависит как от выбора алгоритма, так и от набора исследуемых данных. Несмотря на все преимущества данного метода, следует помнить, что для того, чтобы построить качественную модель, необходимо понимать природу взаимосвязи между зависимыми и независимыми переменными и подготовить достаточный набор данных.
На примере анализа определения кредитоспособности клиента мы рассмотрели возможность применения дерева решений в целях снижения кредитного риска.
Информация о работе Методы дерева решений в управлении рисками