Автор работы: Пользователь скрыл имя, 09 Декабря 2013 в 18:46, доклад
Регрессионный анализ – статистический метод, используемый для исследования отношений между двумя величинами.
Регрессия в математической статистике – зависимость среднего значения одной величины (y) от другой величины (или нескольких величин) x. В отличие от строгой функциональной зависимости y = f(x) в регрессионной модели одному и тому же значению величины x могут соответствовать несколько значений величины y, иными словами, при фиксированном значении x величина y имеет некоторое случайное распределение.
1.назначение метода, требования к первичным данным.
2.основные этапы анализа: какие показатели и критерий вычисляются.
3.интерпретация результатов анализа:о чем говорят вычисленные в результате анализа величины.
План.
1.назначение метода, требования к первичным данным.
2.основные этапы анализа: какие показатели и критерий вычисляются.
3.интерпретация результатов
Назначение метода, требования к первичным данным.
Регрессионный анализ – статистический метод, используемый для исследования отношений между двумя величинами.
Регрессия в математической статистике – зависимость среднего значения одной величины (y) от другой величины (или нескольких величин) x. В отличие от строгой функциональной зависимости y = f(x) в регрессионной модели одному и тому же значению величины x могут соответствовать несколько значений величины y, иными словами, при фиксированном значении x величина y имеет некоторое случайное распределение.
Основные этапы анализа: какие показатели и критерий вычисляются и интерпретация результатов анализа.
С позиции регрессионного анализа критериальный показатель z рассматривается как «зависимая» переменная (как правило, ранговая или количественная), которая выражается функцией от «независимых» признаков xi,...,xp. Для оценки эффективности регрессионной диагностической модели вводится вектор остатков ε=(ε1,...,εn)', который отражает влияние на z совокупности неучтенных случайных факторов либо меру достижимой аппроксимации значений критериального показателя zi функциями типа у(хi). Линейная функция регрессии записывается следующим образом
zi = wo + w'xi + εi
w0 называется свободным членом,
а элементы весового вектора w=(w1
..., wр) называются коэффициентами
регрессии.
Различают два подхода в зависимости от
происхождения матрицы данных. В первом
считается, что признаки xj являются
детерминированными и случайной величиной
является только зависимая переменная
(критериальный показатель) z. Эта модель
используется наиболее часто и называется
моделью с фиксированной матрицей данных.
Во втором подходе считается, что признаки
x1, ..., xр и z — случайные величины,
имеющие совместное распределение. В такой
ситуации оценка уравнения регрессии
есть оценка условного математического
ожидания случайной величины z в зависимости
от случайных величин xi,..., xp
/Андерсон Т., 1963/. Данная модель называется
моделью со случайной матрицей данных
/Енюков И. С., 1986/. Каждый из приведенных
подходов имеет свои особенности. В то
же время показано, что модели с фиксированной
матрицей данных и со случайной матрицей
данных отличаются только статистическими
свойствами оценок параметров уравнения
регрессии, тогда как вычислительные аспекты
этих моделей совпадают /Демиденко Е. 3.,
1981/. В уравнении линейной функции регрессии
обычно полагают, что величины εi(i=1,N)
независимы и случайно распределены с
нулевым средним и дисперсией σ2ε,
а оценка параметров w0 и w производится
с помощью метода наименьших квадратов
(МНК). Ищется минимум суммы квадратов
невязок
Это приводит к нормальной системе линейных уравнений:
где czx — вектор оценок ковариации между критериальным показателем z и признаками х1, ..., xp; mz — оценка среднего значения z; mx и S — вектор средних значений и матрица ковариации признаков xi, ..., xp. Основные показатели качества регрессионной диагностической модели следующие /Енюков И. С., 1986/: — остаточная сумма квадратов
— несмещенная оценка дисперсии ошибки
— оценка дисперсии прогнозируемой переменной
— коэффициент детерминации
— оценка дисперсии коэффициентов регрессии
где sii — соответствующий элемент S-1;
Особого внимания заслуживает приведенный
выше коэффициент детерминации R2.
Он представляет собой квадрат коэффициента
корреляции между значениями критериальной
переменной z и значениями, рассчитываемыми
с помощью модели у(х)=w'x+w0
(квадрат коэффициента множественной
корреляции). Статистический смысл коэффициента
детерминации заключается в том, что он
показывает, какая доля зависимой переменной
z объясняется построенной функцией регрессии
у(х). Например, при коэффициенте детерминации
0,49 регрессионная модель объясняет 49%
дисперсии критериального показателя,
остальные же 51% считаются обусловленными
факторами, не отраженными в модели.
Еще одним важным показателем качества
регрессионной модели является статистика
С помощью этой статистики проверяется гипотеза Н0: w1=w2= =...=wp=0, то есть гипотеза о том, что совокупность признаков xi,...,xp не улучшает описания критериального показателя по сравнению с тривиальным описанием zi=mz. Если FO>fp,N-p-1, где fp,N-p-1 — случайная величина, имеющая F-pacпределение c р и N-p-l степенями свободы, то Н0 отклоняется (критерий Фишера).
Список литературы:
http://www.psyfactor.org/lib/
http://enc.lib.rus.ec/bse/008/
http://polbu.ru/kovalev_
Многомерные статистические методы для экономистов и менеджеров. М., 2000.