Математична статистика - Руденко В. М. - Сутність кореляції

Завданням описової статистики є не лише систематизація емпіричних даних у вигляді розподілу частот та розрахунки типових показників МЦТ і варіацій ознак ММ, а й виявлення зв'язку між змінними, оцінювання його Напряму та Інтенсивності. Порівнюючи різні види зв'язків, можна виділити три типи залежностей між змінними X і Y:

Функціональна залежність визначає значення змінної Y від X однозначно;

Кореляційна залежність визначає середнє значення змінної Y від X;

Стохастична залежність визначає розподіл змінної Y від X.

Отже, найбільш загальною вважається стохастична залежність. Кореляційна залежність є залежністю стохастичною, функціональна - розглядається як окремий випадок кореляційної залежності.

Сутність кореляції

Кореляція (від лат. correlatio - співвідношення) - це статистична залежність між випадковими величинами, що носить імовірнісний характер.

Кореляційні зв'язки можна вивчати на якісному рівні з діаграм розсіяння емпіричних значень змінних X і Y (рис. 2.51) і відповідним чином їх інтерпретувати. Так, наприклад, якщо підвищення рівня однієї змінною супроводжується підвищенням рівня іншої, то йдеться про Позитивну кореляцію або прямий зв'язок (рис. 2.51 а, б). Якщо ж зростання однієї змінної супроводжується зниженням значень іншої, то маємо справу з негативною кореляцією або зворотним зв'язком (рис. 2.51 г, г). Нульовою називається кореляція за відсутності зв'язку змінних (рис. 2.51 в). Проте нульова загальна кореляція може свідчити лише про відсутність Лінійної залежності, а не взагалі про відсутність будь якого Статистичного зв'язку.

Рис. 2.51. Діаграми розсіяння емпіричних значень змінних XІ У:

А) строга позитивна кореляція; б) сильна позитивна кореляція; в) нульова кореляція; г) помірна негативна кореляція; г) строга негативна кореляція; д) нелінійна кореляція

У психолого-педагогічних дослідженнях здебільшого спостерігаються зв'язки Нелінійні (див. рис. 2.51 д). Наприклад, зростання мотивації спочатку підвищує ефективність навчення, а потім наступає зниження продуктивності (ефект "перемотивації" - закон Иеркса-Додсона). Кількісна міра кореляційного зв'язку оцінюється за значеннями коефіцієнтами кореляції у межах від -1 до +1. Від'ємні значення коефіцієнтів указують на зворотний зв'язок, додатні - на прямий. Нульове значення може свідчити про відсутність зв'язку. Інтенсивність зв'язку (слабкий зв'язок - помірний - суттєвий - сильний) оцінюється за абсолютним значенням коефіцієнтів кореляції.

Методи розрахунку міри кореляційних зв'язків тісно пов'язані із вживаними вимірювальними шкалами (табл. 2.4) .

Таблиця 2.4

Коефіцієнти кореляції залежно від типів вимірювальних шкал

Шкали ознаки У

Шкали ознаки X

Інтервальна (відношень)

Рангова

Номінальна

Інтервальна (відношень)

Коефіцієнт Пірсона гХУ ;

Дихотомічний коефіцієнт кореляції <р ;

Тетрахоричний коефіцієнт кореляції тШ

Рангова

Коефіцієнт Спірмена г" (при умові, якщо для Х шкалу інтервалів або відношень перетворити в рангову шкалу)

Коефіцієнти кореляції Спірмена

Т Кендалла; Коефіцієнт конкордації У

Номінальна

Точково-бісеріальний коефіцієнт кореляції Тр^; Бісеріальний коефіцієнт кореляції Гьії

Рангово-бісеріальний коефіцієнт кореляції

Коефіцієнт асоціації Ф;

Коефіцієнт контингенції Юла 6;

Коефіцієнти спряженості Чупрова К

І Пірсона С

Вивчення зв'язку між ознаками, які приймають випадкові значення, починається з оцінювання його лінійності.

Лінійна кореляція

Лінійний кореляційний зв'язок для емпіричних даних, виміряних за шкалою інтервалів або відношень, оцінюється за допомогою коефіцієнта кореляції Пірсона ГХу

Де Хі і у і - значення змінних X і У; х і у - середні X і У; п - обсяг вибірки.

8 Зазначені методи розрахунку з використанням комп'ютерної техніки можна знайти у підручнику [56].

Формула (2.22) може бути перетворена, якщо замінити значення змінних ХІ і У і нормованими значеннями 2Х і гУ, і виглядатиме так:

Приклад 2.7. Оцінити зв'язок між змінними X і У за емпіричними даними таблиці рис. 2.52 двома способами з використанням формул (2.22) і (2.23). Спосіб 1.

Послідовність рішення:

O оцінити характер лінійності зв'язку між ознаками X і У за допомогою діаграми розсіяння (рис. 2.52);

Рис. 2.52. Діаграма розсіяння ознак

O переконатися, що кореляція лінійна, і продовжити розрахунки коефіцієнта кореляції Пірсона гХу (рис. 2.53 і 2.54);

O у комірках В16 і С16 розрахувати середні значення х і у

Х = і хІ = 112,00; У = 1 ул = 18,17;

O у комірках і в15 розрахувати суми квадратів різниць:

X (х, - X)2 = 386,00; £ (У, - у)2 = 311,67;

¡=1 ,=1

Рис. 2.53. Результати розрахунку коефіцієнта кореляції ГХу

O у комірці Н18 розрахувати суму добутків різниць:

X (ХІ - X) o (уІ - у) = 242,00;

¿=1

O у комірці В17 розрахувати коефіцієнт кореляції гХу за формулою:

Гху =■ 242,00 - 0,70. л/386,00 o 311,67

Рис. 2.54. Розрахункові формули Значення гХу ~ +0,70 свідчить про суттєвий прямий зв'язок між ознаками.

Спосіб 2.

Послідовність рішення:

O Результати розрахунку гХу за нормованими даними показано на рис. 2.55, розрахункові формули рис. 2.56.

Рис. 2.55. Результати розрахунку гХу за нормованими даними

O у комірках В16 і С16 розрахувати середні значення х і у;

O у комірках В17 і С17 розрахувати стандартні відхилення уХ і уУ;

Рис. 2.56. Формули розрахунку гХу за нормованими даними o у стовпчиках Б і Е розрахувати нормовані дані 2Х і 2У (зверніть увагу,

Що середнє нормованих даних дорівнює 0, а стандартне відхилення - 1,00);

O у комірці В18 розрахувати коефіцієнт кореляції RXy за формулою (2.23);

Висновки. Одне те саме значення rXy ~ +0,70 розраховано двома способами. Методи розрахунку за нормованими даними виглядають більш лаконічно. Значення парного Коефіцієнта кореляції Пірсона rXy можна також отримати за допомогою спеціальної функції MS Excel =ПИРСОН().



Схожі статті




Математична статистика - Руденко В. М. - Сутність кореляції

Предыдущая | Следующая