Елементи теорії кореляції

Автор работы: Пользователь скрыл имя, 25 Октября 2013 в 20:42, курсовая работа

Краткое описание

Мета: формування базових знань з основ застосування ймовірнісно – статистичного апарата для розв’язування теоретичних і практичних економічних задач.
В результаті вивчення дисципліни студент повинен вміти:
•використовувати у своїй практичній діяльності набуті знання щодо застосовування статистичних методів для дослідження економічних явищ;
•проаналізувати та сформулювати постановку економічної задачі з використанням найпростіших кореляційних методів;
•використовувати необхідні програмні продукти для аналізу і розв‘язування економічних задач.

Содержание

ВСТУП……………………………………………………………………………….3
РОЗДІЛ I ЗАГАЛЬНА ХАРАКТЕРИСТИКА ТЕОРІЇ КОРЕЛЯЦІЇ………………5
1.1.Теорія кореляційного дослідження…………………………………………..5
1.2.Характеристика методів і критеріїв встановлення заленоості між змінними…………………………………………………………………………….15
1.3.Лінійна регресія……………………………………………………………...21
1.3.1.Критерій Фішера…………………………………………………….23
1.3.2.Дисперсія…………………………………………………………….23
1.3.3.Коефіцієнти кореляції………………………………………………24
1.4.Виробнича регресія………………………………………………………….27
1.5.Моделі парної регресії та їх дослідження………………………………….36
РОЗДІЛ II ПРАКТИЧНА РЕАЛІЗАЦІЯ ТЕОРІЇ КОРЕЛЯЦІЇ…………………...47
2.1. Реалізація лінійної регресії на прикладі задач……………………………47
2.2. Реалізація застосування методу найменших квадратів на прикладах…..50
2.3.Застосування методу лінійної регресії на прикладі………………….......54
ВИСНОВОК………………………………………………………………………..58
ВИКОРИСТАНА ЛІТЕРАТУРА………………………………………………..59

Вложенные файлы: 1 файл

Курсова робота Корзун.doc

— 919.00 Кб (Скачать файл)

Найпростіше зіставлення 2 груп містить у собі джерела  ряду артефактів, характерних для  кореляційного дослідження. По-перше, виникає проблема рандомізації груп — вони повинні чітко розділятися  за обраним критерієм, по-друге, реальні виміри відбуваються не одночасно, а різночасно.

По-третє, добре, якщо тестування усередині групи проводять одночасно. Якщо ж окремих випробуваних тестують у різний час, то на результаті може відбитися вплив тимчасового  фактора на величину перемінної.

Стать без особливих зусиль (у тому числі без хірургічного впливу) поміняти сьогодні не можна, але можна перейти з однієї навчальної групи в іншу, а також з класу у клас.

Якщо дослідник задався  метою порівняти дві навчальні  групи за рівнем успішності, він  повинний подбати про те, щоб не відбулося їх «перемішування» у ході дослідження.

Ефект неодночасності вимірів  у двох групах (у випадку припущення значимості цього фактора) можна  було б «забрати» уведенням двох контрольних груп, але тестувати  їх теж прийдеться іншим часом. Зручніше розділити первинні групи навпіл.

Обробка результатів  для виявлення ефекту послідовності  здійснюється методом двофакторного  аналізу 2x2. Порівняння природних (нерандомізірованих) груп ведеться по тім же плані.

2. Одномірне  дослідження однієї групи в різних умовах. План цього дослідження аналогічний попередньому. Але по своїй суті він близький до експерименту, так як умови, у яких знаходиться група, розрізняються. У випадку кореляційного дослідження ми не керуємо рівнем незалежної перемінної, а лише констатуємо зміну поводження індивіда в нових умовах. Прикладом може слугувати зміна рівня тривожності дітей при переході з дитячого саду в 1-й клас школи; група та сама, а умови різні.

Головні артефакти цього  плану — кумуляція ефектів  послідовності і тестування. Крім того, що спотворює вплив на результати може робити ремінний фактор (ефект природного розвитку).

Схема цього плану  виглядає дуже просто: АО1 ВО2, де А и  В — різні умови. Випробувані  можуть відбиратися з генеральної  популяції випадковим образом або представляти собою природну групу.

Обробка даних зводиться  до оцінки подібності між результатами тестування в умовах А и В. Для  контролю ефекту послідовності можна  зробити збалансування і перейти  до кореляційного плану для двох груп.

У цьому випадку ми можемо розглядати А и В як вплив, а план — як квазіексперимент.

3. Кореляційне  дослідження попарно еквівалентних  груп. Цей план використовується при дослідженні близнюків методом внутріпарних кореляцій. Дизиготні або монозиготні близнюки розбиваються на дві групи: у кожній — один близнюк з пари. У близнюків обох груп вимірюють цікавлячого дослідника психічні параметри. Потім обчислюється кореляція між параметрами (О-кореляція) або близнюками (Р-кореляція). Існує безліч більш складних варіантів планів псіхогенетичних досліджень близнюків.

4. Для перевірки  гіпотези про статистичний зв'язок  декількох перемінних, що характеризують  поводження, проводиться багатомірне  кореляційне дослідження. Воно реалізується по наступній програмі. Відбирається група, що являє собою або генеральною сукупністю, або цікавлячу нас популяцію. Відбираються тести, перевірені на надійність і внутрішню валідність. Потім група тестується по визначеній програмі.

Дані дослідження представлені у формі матриці: т х п, де т  — кількість випробуваних, п — тести. Матриця «сирих» даних обробляється, підраховуються коефіцієнти лінійної кореляції. Виходить матриця виду т х п, де п — число тестів. У клітинках матриці — коефіцієнти кореляції, по її діагоналі — одиниці (кореляція тесту із самим собою). Матриця симетрична щодо цієї діагоналі. Кореляції оцінюються на статистичні розходження в такий спосіб: спочатку r переводиться в Z-оцінки, потім для порівняння r застосовується t-критерій Стьюдента. Значимість кореляції оцінюється при її зіставленні з табличним значенням. При порівнянні rексп. і rтеор. приймається гіпотеза про значиму відмінність кореляції від випадкової при заданому значенні точності (а = 0,05 або а - 0,001). У деяких випадках виникає необхідність обчислення множинних кореляцій, приватних кореляцій, кореляційних відносин або редукції розмірності — зменшення числа параметрів.

Для зменшення числа  обмірюваних параметрів використовуються різні методи латентного аналізу. Застосуванню їх у психологічному дослідженні  присвячена безліч публікацій. Головною причиною артефактів, що виникають при проведенні багатомірного психологічного тестування, є реальний фізичний час. При аналізі даних кореляційного дослідження ми відволікаємося від неодночасності проведених вимірів. Крім того, вважається, що результат наступного виміру не залежить від попереднього, тобто не існує ефекту переносу.

Перелічимо основні  артефакти, що виникають у ході застосування цього плану:

1. Ефект послідовності  — попереднє виконання одного  тесту може вплинути на результат виконання іншого (симетричний або асиметричний перенос).

2. Ефект навчання —  при виконанні серії різних  тестових іспитів в учасника  експерименту може підвищуватися  компетентність у тестуванні.

3. Ефекти фонових впливів  і «природного» розвитку приводять до неконтрольованої динаміки стану випробуваного в ході дослідження.

4. Взаємодія процедури  тестування і складу групи  виявляється при дослідженні  неоднорідної групи: інтроверти  гірше здають іспити, чим екстраверти,  «тривожні» гірше справляються  зі швидкісними тестами інтелекту. Тільки замість впливів міняється порядок проведення тестів.

5. Структурне кореляційне  дослідження.

 Від попередніх  варіантів ця схема відрізняється  тим, що дослідник виявляє не  відсутність або наявність значимих  кореляцій, а розходження в рівні значимих кореляційних залежностей між тими самими показниками, обмірюваними в представників різних груп.

Пояснемо цей випадок  прикладом. Допустимо, нам необхідно  перевірити гіпотезу про те, чи впливає  стать батька і стать дитини на подібність або розходження їхніх особистісних рис, наприклад рівня нейротизму по Айзенку. Для цього ми повинні провести дослідження реальних груп — родин. Потім обчислюються коефіцієнти кореляції рівнів тривожності батьків і дітей. Виходять 4 основних коефіцієнти кореляції: 1) мати-дочка; 2) мати-син; 3) батько-дочка; 4) батько-син, і дві додаткових: 5) сини-дочки; 6) мати-батько. Якщо нас цікавить лише порівняння подібності-розходження першої групи кореляцій, а не дослідження асортативності, то ми будуємо 4-клітинну таблицю 2 х2.

Кореляції піддаються - перетворенню і порівнюються по t-критерію Стьюдента.

Тут приведений найпростіший приклад структурного кореляційного  дослідження. У дослідницькій практиці зустрічаються більш складні  версії структурних кореляційних досліджень. Найчастіше вони проводяться в психології індивідуальності (Б. Г. Ананьев і його школа), психології праці і навчання (В. Д. Шадриков), психофізіології індивідуальних розходжень (Б. М. Теплов, В. Д. Небилицин, В. М. Р Салов і ін.), психосемантике (В. Ф. Петренко, А. Г. Шмельов і ін.).

6. Лонгітюдне кореляційне  дослідження. Лонгітюдне дослідження - варіант квазіекспериментальних дослідницьких планів. Що впливає на перемінну психолога, що проводить лонгітюдне дослідження, вважає час. Воно є аналогом плану тестування однієї групи в різних умовах. Тільки умови вважаються константними. Результатом будь-якого тимчасового дослідження є побудова тимчасового тренда вимірюваних перемінних, що можуть бути аналітично описаний тими або іншими функціональними залежностями.

Лонгітюдне кореляційне  дослідження будується за планом тимчасових серій з тестуванням  групи через задані проміжки часу. Крім ефектів навчання, послідовності  і т.д. у лонгітюдному дослідженні  варто враховувати ефект вибування: не усіх випробуваних, що спочатку приймали участь в експерименті, вдається обстежувати через якийсь визначений час. Можлива взаємодія ефектів вибування і тестування (відмовлення від участі в наступному обстеженні) і т.д.

Структурне лонгітюдне дослідження відрізняється від  простого лонгітюда тим, що нас цікавить не стільки зміна центральної тенденції або розкиду який-небудь перемінної, скільки зміна зв'язків між перемінними. Такого роду дослідження широко поширені у психогенетиці.

Обробка й інтерпретація  даних кореляційного дослідження. Дані структурного кореляційного дослідження являють собою одну або кілька матриць:

«випробувані» х «тести»

Первинна обробка полягає  в підрахунку коефіцієнтів статистичного  зв'язку між двома і більш перемінними. Вибір міри зв'язку визначається шкалою, за допомогою якої зроблені виміри.

1. Якщо виміри зроблені  по дихотомічній шкалі, то для  підрахунку тісноти зв'язку ознак  застосовується коефіцієнт φ. Дихотомічну шкалу часто плутають зі шкалою найменувань (навіть у допомога зі статистики; див., наприклад, Дж. Гласі і Дж. Стенлі. Статистичні методи в педагогіці і психології, 1976) Дихотомічна шкала — варіант шкали інтервалів; для неї застосовні всі статистичні методи шкали інтервалів.

2. Дані представлені  в порядковій шкалі. Мірою зв'язку, що відповідає шкалі порядку, є коефіцієнт Кендела. Він заснований на підрахунку розбіжностей у порядку проходження ранжировок X і У. Є ряд випробуваних: спочатку ми вибудовуємо цей ряд у порядку убування маси тіла, а потім — у порядку убування росту. Для кожної пари підраховується число збігів і інверсій: збіг, якщо їхній порядок по X і В однаковий; інверсія, якщо порядок різний. Різниця числа «збігів» і числа «інверсій», ділена на п (п - 1)/2, дає коефіцієнт t. Алгоритм підрахунку приведений у допомога зі статистики і в будь-якому статпакеті для персональних комп'ютерів.

Часто для обробки  даних, отриманих за допомогою шкали  порядку, використовують коефіцієнт рангової кореляції Спірмена, що є модифікацією коефіцієнта Пірсона для натурального ряду чисел (рангів). Ніякого відношення до порядкової шкали він не має. Але його рекомендують застосовувати в тому випадку, якщо один вимір зроблений по шкалі порядків, а інше — по шкалі інтервалів.

3. Дані отримані по  шкалі інтервалів, або відносин. У цьому випадку застосовується  стандартний коефіцієнт кореляції Пірсона або коефіцієнт рангової кореляції Спірмена. У тому випадку, якщо одна перемінна є дихотомічною, а інша — інтервальной, використовується так називаний бісеріальний коефіцієнт кореляції.

Нарешті, якщо дослідник  думає, що зв'язку між перемінними нелінійні, він обчислює кореляційне відношення, що характеризує величину нелінійної статистичної залежності двох перемінних.

Кореляційне дослідження  завершується висновком про статистичну  значимість установлених (або невстановлених) залежностей між перемінними.

1.2.Характеристика методів і критеріїв встановлення залежності між змінними

 Кореляційний аналіз

Кореляційний зв'язок представляє собою частковий  випадок статистичного зв'язку М(Y|X = x) = y(x), тобто математичне очікування змінної Y, при умові, що випадкова величина Х приймає значення х.

 1.Параметрична кореляція (коефіцієнт кореляції Пірсона)

Значення коефіцієнта  кореляції обчислюється по формулі:

   (2.1)

Коефіцієнт кореляції [2, 78-80 ст.] показує тісноту лінійного зв'язку між двома вибірками випадкових величин. Його значення змінюється від -1 (мал. 1.1, rxy = -0,8), що відповідає зворотному зв'язку, до +1 (мал. 1.2, rxy = 0,8), що відповідає прямо пропорційного зв'язку (значення 0, означає відсутність зв'язку - мал. 1.3).

Малюнок 1.1. Приклад зворотньої кореляційної залежності

Малюнок 1.2. Приклад прямої кореляційної залежності

Малюнок 1.3. Приклад діаграми розсіювання при відсутності зв'язку між змінними

Оскільки ми маємо  справу з випадковими величинами, однієї величини коефіцієнта парної кореляції для висновку недостатньо. Необхідно перевірити, чи значимо  він відрізняється від нуля. Це можна зробити за допомогою критерію Стъюдента. Фактично перевіряється гіпотеза про рівність коефіцієнта кореляції кулю. Для цього розраховується критериальное значення по формулі:

   (2.2)

де r - значення коефіцієнта кореляції, a N - кількість спостережень.

Якщо розрахункове значення t (tpac) більше табличного, узятого з N - 2 ступенями волі, нульова гіпотеза відкидається. Це означає, що коефіцієнт кореляції значимий відрізняється від нуля (з обраним рівнем значимості). Напівширина довірчого інтервалу для коефіцієнта кореляції визначається по формулі:

   (2.3)

де N - число спостережень, по яких розраховується коефіцієнт кореляції; r - значення коефіцієнта кореляції; tn-2p - табличне значення критерію Стьюдента, узятого з N - 2 ступеня волі.

Зауваження. Слід пам'ятати, що коефіцієнт кореляції показує міру тільки лінійоного зв'язку. Тому у випадках, коли залежність між змінними носить більш складний характер, коефіцієнт кореляції буде показувати відсутність зв'язку. Приклад - на мал. 1.4. між змінними існує залежність другого порядку (описується квадратним рівнянням), тоді як коефіцієнт кореляції буде близьким до нуля. Тому, для виявлення складних залежностей між змінними використовують інші статистичні методи, зокрема регресійний аналіз.

Малюнок 1.4. Приклад нелінійного зв'язку між змінними

Информация о работе Елементи теорії кореляції