Автор работы: Пользователь скрыл имя, 29 Октября 2013 в 18:23, лекция
Оценка качества уравнения парной линейной регрессии
Регрессионная модель представляет сумму уравнения регрессии и остатков. Проверяется качество обоих слагаемых.
Оценка качества уравнения линейной регрессии состоит из следующих этапов.
1. Оценка математической точности уравнения. Для этого рассчитывается средняя относительная ошибка аппроксимации
Уравнение парной линейной регрессии
Оценка качества уравнения парной линейной регрессии
Регрессионная модель представляет сумму уравнения регрессии и остатков. Проверяется качество обоих слагаемых.
Оценка качества уравнения линейной регрессии состоит из следующих этапов.
1. Оценка математической точности уравнения. Для этого рассчитывается средняя относительная ошибка аппроксимации
,
где - фактические значения переменной y , - теоретические значения y , найденные по уравнению регрессии. Для принятия решения о точности уравнения можно воспользоваться таблицей
Значение |
Точность уравнения |
менее 10 |
высокая |
10 - 20 |
хорошая |
20 - 50 |
удовлетворительная |
более 50 |
неудовлетворительная |
В случае, когда уравнение имеет неудовлетворительную точность, необходимо увеличить объем наблюдений (объем выборки) n, либо взять другое уравнение регрессии (нелинейное).
2. Проверка статистической значимости уравнения регрессии в целом с помощью F-критерия Фишера.
Выдвигается гипотеза Н0: уравнение регрессии статистически незначимо, при конкурирующей гипотезе Н1: уравнение регрессии статистически значимо. Находится расчетное значение (статистика) критерия
или ,
где , , - соответственно фактическое (наблюдаемое), теоретическое и среднее значение ; n - объем выборки, m - число параметров уравнения регрессии при независимых переменных (в случае парной линейной регрессии m = 1), R2 - коэффициент детерминации ( R2 = (r)2 ) .
Табличное (критическое) значение Fтабл , находится по таблице критических значений распределения Фишера-Снедекора (F-распределения) по уровню значимости α и двум числам степеней свободы df1 = m и df2 = n - m - 1 .
Если Fрасч > Fтабл , то гипотеза Н0 отвергается с вероятность ошибки α , т.е. уравнение регрессии признается в целом статистически значимым (адекватно описывающим исходные данные).
В противном случае (Fрасч < Fтабл) уравнение считается незначимым.
3. Проверка статистической значимости оценок параметров b0, b1 с помощью t-критерия Стъюдента.
Критерий Стьдента проверяется
только для линейного уравнения!
Выдвигается гипотеза Н0: параметр bj = 0 (j = 0, 1) (статистически незначим, случайно отличается от 0), при конкурирующей гипотезе Н1: параметр bj ≠ 0 (статистически значим, неслучайно отличается от 0). Находится расчетное значение критерия
,
где средние квадратические ошибки параметров:
,
.
Теоретическое значение критерия tтабл находится по таблице критических значений распределения Стъюдента по уровню значимости α и числу степеней свободы df = n - m - 1 .
Если tbj > tтабл , то гипотеза Н0 отвергается с вероятность ошибки α , т.е. оценка коэффициента регрессии bj признается статистически значимой, т.е. не является результатом действия внешних случайных факторов.
В противном случае (tbj < tтабл) - bj статистически незначим.
4. Построение интервальных оценок (доверительных интервалов) параметров регрессии в виде
которые с надежностью (вероятностью) γ = 1 - α покрывают истинные параметры βj. Здесь tтабл - значение, найденное по таблице критических точек распределения Стъюдента по уровню значимости α/2 и числу степеней свободы df = n - m - 1.
Если границы некоторого доверительного интервала имеют разные знаки, соответствующий параметр уравнения регрессии статистически незначим.