Автор работы: Пользователь скрыл имя, 17 Сентября 2014 в 14:40, курсовая работа
Цель данной работы – проанализировать методику корреляционно-регрессионного анализа рекламы.
Задачи работы:
- рассмотреть сущность корреляционно-регрессионного анализа;
- изучить методику корреляционно-регрессионного анализа.
В теоретической части рассмотрены такие вопросы, как сущность корреляционно-регрессионного анализа, особенности корреляционно-регрессионного анализа.
Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации. Он показывает, какая доля дисперсии результативного признака объясняется влиянием независимых переменных.
Также это квадрат корреляции Пирсона между двумя переменными (rІ). Он выражает количество дисперсии, общей между двумя переменными.
В случае двух переменных формула для вычисления множественного коэффициента детерминации имеет вид:
Часто необходимо корректировать коэффициент множественной детерминации на потерю степеней свободы вариации:
где
- скорректированное значение множественного
коэффициента корреляции;
- число наблюдений;
- число переменных, вошедших в модель.
Наблюдаемое значение находится по формуле:
Иногда показателям тесноты связи можно дать качественную оценку (шкала Чеддока):
Количественная мера тесноты связи |
Качественная характеристика силы связи |
0,1-0,3 |
Слабая |
0,3-0,5 |
Умеренная |
0,5-0,7 |
Заметная |
0,7-0,9 |
Высокая |
0,9-0,99 |
Весьма высокая |
Функциональная связь возникает при значении равном 1, а отсутствие связи - 0. При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации всегда будет ниже 50%. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение.
Особая роль в выявлении связей не только между качественными, но и количественными признаками принадлежит параллельным статистическим рядам.
Это один из методов статистического анализа, основанный на применении принципов формально-логического учения о сравнении в последовательном сравнении сопоставлении изменяющихся двух или нескольких статистических рядов. В требованиях этого метода справедливо подчеркивается, что сравнивать надо показатели не любых двух рядов, а такие, когда увеличение размера показателей одного ряда сопровождается увеличением или уменьшением величины показателей другого ряда. Метод параллельных рядов можно применять к разным районам или странам, но в том случае, если анализируется развитие во времени одних и тех же явлений в двух и многих рядах. Метод параллельных рядов применим и для анализа развития во времени различных сторон одного и того же явления (напр., рассматривая количество внесенных в почву удобрений по годам и урожайности в эти же годы но одному колхозу или району, судят о связи урожайности с количеством внесенных удобрений, если земельная площадь не изменилась). В соответствии с формально-логическим учением о сравнении в статистике правильно отмечается, что метод параллельных рядов показывает не только сходство развития показателей, но и различие, а также то, что метод параллельных рядов не дает численной оценки сходства или различия развития и потому является дополнительным средством анализа. Сравнение не может дать исчерпывающего знания исследуемого явления. Сравнение должно сочетаться со всеми другими методами логического познания.
В задание 1 предполагается по данным по 30 предприятиям построить статистический ряд распределения организаций по расходам на рекламу, образовав 5 групп с равными интервалами.
Таблица 1
Исходные данные
Расходы на рекламу, тыс. руб. |
Число покупателей, чел. | |
1 |
3,4 |
55,00 |
2 |
7 |
68,00 |
3 |
1,1 |
31,00 |
4 |
2,8 |
44,00 |
5 |
4,1 |
56,00 |
6 |
6,5 |
70,00 |
7 |
1,7 |
35,00 |
8 |
2,6 |
47,00 |
9 |
5,4 |
60,00 |
10 |
4,8 |
61,00 |
11 |
8 |
82,00 |
12 |
2,1 |
38,00 |
13 |
2,3 |
49,00 |
14 |
4 |
58,00 |
15 |
6,1 |
68,00 |
16 |
3,4 |
42,00 |
17 |
2,9 |
52,00 |
18 |
5,2 |
59,00 |
19 |
5,2 |
65,00 |
20 |
4,2 |
60,00 |
21 |
4,2 |
61,00 |
22 |
4 |
54,00 |
23 |
4,3 |
62,00 |
24 |
7,9 |
78,00 |
25 |
5,6 |
63,00 |
26 |
5,5 |
64,00 |
27 |
8,1 |
86,00 |
28 |
5,7 |
65,00 |
29 |
8,2 |
91,00 |
30 |
6 |
66,00 |
Для определения групп предприятий определяем размер интервала по расходам на рекламу:
i = R / n = хmax – xmin / n
i = 8,20- 1,10 / 5 = 1,42 тыс.руб. |
Формируем группы:
I. 1,1– 2,52 [1,1; 1,1+ 1,42] |
II. 2,52 – 3,94 [2,52; 2,52 + 1,42] |
III. 3,94 – 5,36 [3,94; 3,94 + 1,42] |
IV. 5,36 – 6,78 [5,36; 5,36 + 1,42] |
V. 6,78 – выше [6,78; 6,78 + 1,42] |
Делаем разноску предприятий по группам. Если значение показателя соответствует значению верхней границы интервала одной группы и нижнему значению границы интервала другой группы, то эту организацию мы относим к последнему.
Таблица 2
Интервальный ряд распределения организаций по затратам на рекламу
№ п/п |
Группы организации по затратам на рекламу, тыс.руб. |
Затраты на рекламу по граппам, тыс.руб. |
Удельный вес затрат на рекламу в %, к итогу |
Количество организаций в группе |
А |
2 |
3 |
4 | |
1 |
1,1-2,52 |
7,20 |
5,06% |
4 |
2 |
2,52-3,94 |
15,10 |
10,61% |
5 |
3 |
3,94-5,36 |
40,00 |
28,11% |
9 |
4 |
5,36-6,78 |
40,80 |
28,67% |
7 |
5 |
6,78 и выше |
39,20 |
27,55% |
5 |
Итого |
142,30 |
100 |
30 |
На основании разработочной таблицы строим ряд распределения.
Таблица 3
Ряд распределения организаций по затратам на рекламу
№ п/п |
Группы организации по затратам на рекламу, тыс.руб. |
Число предприятий | ||
А |
1 |
в % к итогу |
S | |
1 |
1,1-2,52 |
4 |
13,33% |
13,3% |
2 |
2,52-3,94 |
5 |
16,67% |
30,0% |
3 |
3,94-5,36 |
9 |
30,00% |
60,0% |
4 |
5,36-6,78 |
7 |
23,33% |
83,3% |
5 |
6,78 и выше |
5 |
16,67% |
100,0% |
Итого |
30 |
100 |
Наибольшее число организаций сосредоточено в группе с расходами на рекламу от 3,94 до 5,36 тыс.руб. – 9 организаций (30%); 7 организаций (23,33%) имеют расходы от 5,36 до 6,78 тыс.руб.; 5 организаций (16,67%) – во 2 и 5 группах с расходами на 1,1 и 2,52 тыс.руб. и от 6,78 тыс.руб. и выше.
Построим графики полученного ряда распределения.
тыс.руб.
Медиана
Рис. 1. Кумулята распределения организаций по расходам на рекламу
тыс.руб.
Мода
Рис. 2. Гистограмма распределения организаций по расходам на рекламу
Рис. 3. Полигон распределения организаций по расходам на рекламу
Для интервальных рядов распределения с равными интервалами мода определяется по формуле:
где
XMo- начальное значение интервала, содержащего моду;
iMo- величина модального интервала;
fMo- частота модального интервала;
fMo-1- частота интервала, предшествующего модальному;
fMo+1- частота интервала, следующего за модальным.
В этой задаче наибольшее число предприятий (9) имеет группа организаций от 3,94 до 5,36 тыс.руб. Следовательно, этот интервал является модальным интервалом ряда распределения.
Введем следующие обозначения:
XMo=3,94;
iMo=1,42
fMo=9
fMo-1=5;
fMo+1=7.
Подставим эти значения в формулу моды и произведем вычисления:
Мо = 3,94+1,42*((9-5)/(9-5)+(9-7)) = 4,89 тыс.руб.
Медиана интервального вариационного ряда распределения определяется по формуле:
, где
XMe – начальное значение
iMe – величина медианного интервала;
- сумма частот ряда;
SMe-1 – сумма накопленных частот,
предшествующих медианному
fMe – частота медианного интервала.
Определим медианный интервал. В данной задаче сумма накопленных частот, превышающая половину всех значений, соответствует интервалу от 3,94 до 5,36 тыс.руб. Это и есть медианный интервал, в котором находится медиана. Определим ее значение по приведенной выше формуле. Известно, что:
XMe=3,94;
iMe=1,42;
=30;
SMe-1=5;
fMe=9.
Следовательно, Ме = 3,94+1,42*((0,5*30-5)/9) = 4,82 тыс.руб.
Если данные сгруппированы, то
= 145,18/30 = 4,84 тыс.руб.где n — объем выборки; k — число интервалов группировки; ni — частота i-ого интервала; хi — срединное значение i-ого интервала
Найдем середину интервала и произведение nixi
Таблица 4
Расчетная таблица
Группа |
Середина интервала |
nixi |
1 |
1,81 |
7,24 |
2 |
3,23 |
16,15 |
3 |
4,65 |
41,85 |
4 |
6,07 |
42,49 |
5 |
7,49 |
37,45 |
Итого |
23,25 |
145,18 |
Для сгруппированных в интервальный вариационный ряд данных:
Здесь хi — срединные значения интервалов группировки; — взвешенная сумма квадратов отклонений.
Таблица 5
Расчетная таблица значений дисперсии
Группа |
x`-xср |
(x`-xср)*n |
(x`-xср)2 |
(x`-xср)2*n |
1 |
3,029333 |
12,11733 |
9,17686 |
36,70744 |
2 |
1,609333 |
8,046667 |
2,589954 |
12,94977 |
3 |
0,189333 |
1,704 |
0,035847 |
0,322624 |
4 |
1,230667 |
8,614667 |
1,51454 |
10,60178 |
5 |
2,650667 |
13,25333 |
7,026034 |
35,13017 |
Итого |
8,709333 |
43,736 |
20,34324 |
95,71179 |
Информация о работе Корреляционно-регрессионный анализ рекламы