Корреляционно-регрессионный анализ сельскохозяйственных культур (на данных статистики Республики Казахстан)

Автор работы: Пользователь скрыл имя, 15 Июня 2012 в 12:21, практическая работа

Краткое описание

Целью нашего исследования является анализ статистических данных за последние 20 лет и прогнозирование данных урожайности сельскохозяйственных культур в РК на ближайшие годы. Задача состоит в проведении корреляционно-регрессионного анализа, на основе которого можно будет определить тесноту связи между факторами, а также выявить является ли модель адекватной.

Содержание

1. Постановка задачи
2. Формирование факторов и их содержательный анализ
3. Установление тесноты связи факторов модели регрессии
4. Выбор вида модели регрессии
5. Определение параметров модели регрессии
6. Проверка адекватности модели регрессии
7. Проверка значимости параметров модели регрессии
8. Прогнозирование значений зависимой переменной
9. Регрессионный анализ в Excel

1. Постановка задачи
2. Формирование факторов и их содержательный анализ
3. Установление тесноты связи факторов модели регрессии
4. Выбор вида модели регрессии
5. Определение параметров модели регрессии
6. Проверка адекватности модели регрессии
7. Проверка значимости параметров модели регрессии
8. Прогнозирование значений зависимой переменной
9. Регрессионный анализ в Excel

Скачать в ZIP архиве (104.77 Кб) Сколько стоит заказать работу?

Вложенные файлы: 1 файл

ПРОЕКТ.docx

— 118.88 Кб (Скачать файл)

Казахский Экономический Университет им. Т. Рыскулова

Факультет Управления

Кафедра Прикладной математики

ПРОЕКТ

Корреляционно-регрессионный анализ сельскохозяйственных культур (на данных статистики Республики Казахстан)

(дисциплина: «Эконометрика»)

Выполнили: Омарова Арзигуль

Хегай Антонина

СКС-205

Научный руководитель: Мадиярова К. З.

Алматы 2011

Задание

Постановка задачи
Формирование факторов и их содержательный анализ
Установление тесноты связи факторов модели регрессии
Выбор вида модели регрессии
Определение параметров модели регрессии
Проверка адекватности модели регрессии
Проверка значимости параметров модели регрессии
Прогнозирование значений зависимой переменной
Регрессионный анализ в Excel

Введение

Сельскохозяйственные культуры – это культурные растения, возделываемые с целью получения продуктов питания, технического сырья и корма для скота.

На продуктивность сельскохозяйственных культур влияет множество факторов:

- естественные (природные) условия (температура воздуха, солнечная радиация), влиять на которые человек не может, но которые учитываются при выборе сроков сева, густоты стояния растений, направления рядков и т.д.

- факторы, зависящие от производственной деятельности человека: наличие влаги в почве; обеспеченность растений элементами питания; качество семян и т.д.

В нашей работе в качестве факторного признака, влияющего на урожайность сельскохозяйственных культур Республики Казахстан, была взята посевная площадь. Статистические данные взяты за последние 20 лет (1990 – 2010гг.). На основе этих данных, мы провели корреляционно-регрессионный анализ.

Корреляционный анализ является одним из методов статистического анализа взаимосвязи нескольких признаков. В нашей модели представлена парная корреляция, т.е. связь между двумя признаками (факторным и результативным).

Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи. Не все факторы, влияющие на экономические процессы, являются случайными величинами, поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.

Постановка задачи

Формирование факторов и их содержательный анализ

После тщательного отбора данных, мы остановились на следующих переменных: урожайность и посевная площадь. От размеров посевной площади зависит многое. К примеру, если площадь вашего огорода будет маленькой, то соответственно и количество собранных вами овощей будет небольшим. Отсюда следует, что урожайность зависит от посевной площади. Факторный признак, или независимая переменная X, есть посевная площадь. Урожайность является зависимой переменной, то есть выступает в качестве результативного признака.

Рисунок 1. Исходные данные модели

	Посевная площадь, тыс.га	Урожайность, ц
	Посевная площадь, тыс.га	Урожайность, ц
	Xi	Yi
1990	70,8	154,0
1991	75,1	121,0
1992	83,3	114,0
1993	74,0	106,0
1994	73,4	104,0
1995	76,1	101,0
1996	79,8	96,0
1997	87,1	101,0
1998	96,5	114,0
1999	96,1	134,0

2000	102,6	153,0
2001	107,7	166,0
2002	108,7	172,0
2003	110,2	177,0
2004	111,3	186,0
2005	110,8	196,0
2006	103,0	201,0
2007	104,2	211,0
2008	112,9	204,0
2009	110,6	218,7
2010	120,3	214,4

Установление тесноты связи факторов

Теснота связи определяется коэффициентом корреляции.

Коэффициент корреляции - это показатель того, насколько близко точки графика разброса лежат относительно прямой линии.

Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

Корреляция и регрессия тесно связаны между собой: первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму. И корреляция, и регрессия служат для установления соотношений между явлениями и для определения наличия или отсутствия связи между ними.

Формула коэффициента корреляции:

, где

r – коэффициент корреляции;

Хi – значение фактора;

Хср – среднее значение фактора Хi;

Уi – значение результата;

Уср – среднее значение результата производства.

Значение коэффициента парной корреляции может изменяться от -1 до +1. Знак показывает на характер связи: + на прямую зависимость, – на обратную. При значениях коэффициента корреляции, близкого к 0, говорит о слабой связи между фактором и его результатом или означает что между ними нелинейная связь. Чем ближе значение коэффициента корреляции к 1, тем связь теснее. При значении, равном ±1, связь функциональная.

Подставив значения нашей модели, рассчитанные в EXCEL, в формулу коэффициента корреляции, мы выяснили, что связь нашей модели прямая, положительная и тесная.

Коэффициент детерминации представляет собой альтернативный показатель степени зависимости между двумя переменными. Данное значение вычисляется путем ввода в квадрат коэффициента корреляции, то есть . Коэффициент детерминации часто более предпочтителен, чем коэффициент корреляции, так как его можно использовать для количественного определения характеристики, связывающей две переменные. Это значение дает пропорцию общего изменения одной переменной у, которую можно объяснить изменением второй переменной х. Эта величина выражена в процентах.

=0.83313²=0.694106 → 69% - доля вариации, 31% - приходится на неучтенные факторы.

Определение вида модели регрессии

Определение вида модели регрессии осуществляется одним из трех способов: графическим, аналитическим, экспериментальным.

При изучении зависимости между признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на поле корреляции. При небольшой численности наблюдений по одному признаку можно использовать графики. Графики занимают особое место в корреляционном анализе, как один из приемов установления формы связи.

При построении графиков на оси абсцисс располагаются данные независимой переменной, а на оси ординат – зависимой переменной. По расположению точки можно определить форму связи факторов.

В нашем случае линейная функция выглядит таким образом:

Рисунок 2. График парной регрессии модели

Она представлена в виде линейной функции у=а+bх, где:

у – зависимая переменная;

х – независимая переменная;

а, в – параметры уравнения.

Коэффициент в называется коэффициентом пропорциональности, или коэффициентом регрессии. Он показывает, как изменится в среднем у при изменении х на единицу.

На графике видно, что урожайность сельскохозяйственных культур имеет тенденцию роста.

Определение параметров модели регрессии

На этом этапе определяются числовые назначения параметров (а, в) регрессии. Для этого используется метод наименьших квадратов.

{

Подставив в эту формулу значения нашей таблицы, получаем следующую систему уравнений:

{

С помощью операций в Excel, вычисляем обратную матрицу, и находим значения параметров а и b è a=-62,3795377; b=2,260645466.

Вычисление обратной матрицы в Excel:

Вводим значения Матрицы А и Матрицы В:

Матрица А		Матрица В
21	2014,5	3244,1
2014,5	198415,8	322884,2

Выделяем 4 пустые ячейки для обратной матрицы è fx è МОБР è Выделить Матрицу А è Shift+Ctrl+Enter è Закрыть

Обратная матрица
1,828353908	-0,018563133
-0,018563133	0,00019351

Выделить 2 пустые ячейки для параметров а и b è fx è МУМНОЖ è выделить обратную матрицу (Массив 1) è Выделить Матрицу В (Массив 2) è Shift+Ctrl+Enter è Закрыть

Значения

-62,3795377

2,260645466

Информация о работе Корреляционно-регрессионный анализ сельскохозяйственных культур (на данных статистики Республики Казахстан)