Математична статистика - Руденко В. М. - Критерій Шапіро-Вілка W
Критерій х засновано на порівнянні емпіричної гістограми розподілу випадкової величини з її теоретичною щільністю. Діапазон виміряних емпіричних даних розбивають на к інтервалів і розраховують статистику
2 _ - у (тІ - прІ)2
Хемп ~ / < , (5.7)
,=1 Пр,
Де Ті - кількість значень випадкової величини, що потрапили в /-й інтервал; П - обсяг вибірки; рІ - теоретична ймовірність випадкової величини потрапити в /-й інтервал.
Для гіпотетичного теоретичного розподілу, який має закон розподілу Р(х), теоретична ймовірність рІ визначається якрІ = Р(хІ+1) - Р(х,), тобто
РІ = |Р(Х)Ах = |Р(Х)<1х - |Р(Х)ах = Р(Х,+1) - Р(ХІ). (5.8)
V 1 2
За умов к<<п і 2-і - << П вважається, що статистика %Емп Має розподіл
Близький до розподілу хі-квадрат для к-1 ступенів вільності. Нульова гіпотеза Н0 відхиляється на рівні значущості а, якщо хімп > ХІі.
Приклад 5.3. Перевірити за критерієм згоди % гіпотезу про нормальний розподіл емпіричних даних попереднього прикладу 5.2. Послідовність рішення: o Формулювання гіпотез:
Н0: емпіричний розподіл не відрізняється від нормального; НІ: емпіричний розподіл відрізняється від нормального.
O Статистичний критерій хімп дорівнює сумі квадратів відхилень емпіричних частот Ші від очікуваних теоретичних частот прі (5.7).
O Послідовність розрахунку емпіричного критерію хімп (результати показано на рис. 5.7, необхідні формули - на рис. 5.8):
Рис. 5.7. Результати розрахунку критерію %
- внести емпіричні дані у комірки А1:В 11;
- розрахувати кількість класів k за формулою Стерджеса k=1+3,32-Lg(n) Для цього вираз =ОКРУГЛ(1+3,32*ЬОО(СЧЕТ(А3:В11));0) внести у комірку D10 і отримати k=1+3,32lg(18) = 5,2 = 5;
- у комірці D11 розрахувати розмір класового інтервалу X=(xMax-xMin)/k за допомогою виразу =(MAKC(A3:B11)-MHH(A3:B11))/D10 і отримати X ~ 2;
- внести у комірки D3:E8 значення початкових xI і кінцевих xI+I границь діапазонів х,- кратними 2. Мінімальне значення першого діапазону становить - оо (комірка D3), максимальне останнього інтервалу +оо (комірка Е8);
- у комірках F3:F8 розрахувати емпіричні абсолютні частоти MI за допомогою функції =ЧАСТОТА(). Сума частот mT дорівнюватиме обсягу вибірки, тобто 18;
- теоретична ймовірність випадкової величини pI потрапити в /'-й інтервал розраховується як різниця значень нормального розподілу F(xI+1) - F(x,). Значення нормального розподілу можна отримати за допомогою функції MS
Excel = НОРМРАСЩ). Середнє ц і стандартне відхилення АХ теоретичного нормального розподілу внести у комірки F10 i F11 відповідно (зауваження: заміна параметрів нормального розподілу вибірковими статистиками може призвести до суттєвого спотворення статистичних висновків);
- внести у інші комірки відповідні розрахункові вирази за рис. 5.8 і отримати значення емпіричного критерію хімп, Щ° становитиме 4,53
Рис. 5.8. Формули для розрахунку критерію х2Емп
O Критичне значення критерію х2Кр можна отримати за допомогою функції =ХИ20БР(), яка повертає значення двобічного критерію у комірках Е9 і 10 відповідно: - ІоЛ ~ 9,24 і у^оД5 ~ 11,07.
O Прийняття рішення. Оскільки /2ЕЛИ ~ 4,53 не перевищує критичного значення навіть на рівні а=0,1 (%2О, І ~ 9,24) , нульова гіпотеза Н0 приймається.
O Формулювання висновків: розбіжності емпіричного і теоретичного нормального розподілів можуть мати винятково випадковий характер.
Перевірку нормальності емпіричного розподілу виконаємо за допомогою критерію Шапіро-Вілка XV.
Критерій Шапіро-Вілка W
Статистика критерію W Шапіро-Вілка має вигляд:
Тина 2; коефіцієнти аПі+1 для невеликих п і /' наведено у табл. 1 Додатків.
Приклад 5.4. Перевірити за критерієм Шапіро-Вілка гіпотезу щодо відповідності нормальному законові розподілу емпіричних даних прикладу 5.2. Послідовність рішення:
O Формулювання гіпотез:.
Н0: емпіричний розподіл не відрізняється від нормального; Н1: емпіричний розподіл відрізняється від нормального.
O Послідовність розрахунку емпіричного критерію XV (результати показано на рис. 5.9, необхідні формули - на рис. 5.10):
- у комірках С2:011 розмістити індекси (/') і (п-і+1), причому І змінюється від 1 до Ш (ш у прикладі дорівнює п/2 = 18/2 = 9);
Рис. 5.9. Результати розрахунку Х¥-критерію Шапіро-Вілка
- у комірки Е2:Е11 внести 9 коефіцієнтів з табл. 1 Додатків з рядка для n=18;
- заповнити комірки F2:G11 значеннями xT i xN. I+1 або "вручну", або з використанням функцію MS Excel =ВПР(), яка за індексом у лівому стовпчику таблиці повертає значення в тім же рядку із зазначеного стовпця таблиці;
- у комірках H2:H11 розрахувати значення b = aN_M(xN_I+1 - ХІ );
- у комірці H12 визначити квадрат суми параметрів - (SbI)2, тобто чисельник виразу (5.9), а у комірці H13 - знаменник - S1 ;
- значення критерію W у комірці H14 дорівнює (2ЬІ)2 / s1 = 0,891;
- критичне значення критерію W18(0,05) отримати з табл. 2 Додатків. Для n=18 і <х=0,05 це значення складає 0,897 (див. комірку Н15 рис. 5.9).
Рис. 5.10. Формули для розрахунку W-критерію Шапіро-Вілка
O Прийняття рішення відбувається за правилом: якщо ¥<¥П(а), Н0 відхиляється на рівні 2а. Оскільки XV ~ 0,891 не перевищує критичного значення 0,897 критерію Х¥18(0,05), нульова гіпотеза щодо нормальності розподілу відхиляється на рівні 0,1.
O Формулювання висновків. Розходження між емпіричним і очікуваним теоретичним нормальним розподілами можна вважати статистично значущими на рівні 0,1.
Таким чином, на основі порівняння трьох критеріїв (асиметрії та ексцесу, хі-квадрат, Шапіро-Вілка) можна зробити такі загальні висновки:
- нульові значення моментів у разі застосування критеріїв асиметрії та ексцесу можуть прийматися і для розподілів, відмінних від нормальних. Близькість вибіркових значень асиметрії та ексцесу до теоретичних не обов'язково свідчить про нормальність розподілу результатів спостережень. Ці критерії служать не стільки для перевірки нормальності, скільки для виявлення відхилень розподілу від нормального, або, точніше, для перевірки альтернативних гіпотез [49];
- переважна більшість розподілів спостережень не є нормальними, тому в умовах реальних завдань малоймовірно приймати гіпотезу нормальності. Коректніше стверджувати, що розподіли мало відрізняється від нормального;
- критерій хі-квадрат, як і критерії моментів, не є спроможним. Його доцільно застосовувати лише для відхилення гіпотези нормальності. До того ж, на потужність критерію хі-квадрат сильно впливає кількість (к) і розмір (Я) інтервалів, практично цей критерій можна застосовувати, якщо ПрІ > 5;
- кожен критерій має свої "проблеми", існують спеціально розроблені модифікації різних класичних критеріїв, наприклад, типу "хі-квадрат", які можна найбільш ефективно застосовувати у конкретних ситуаціях;
- при розрахунках теоретичного нормального розподілу його параметри (м і АХ) не завжди відомі дослідникові. Заміна їх вибірковими статистиками (X і sX) може призвести до суттєвого спотворення статистичних висновків;
- найбільш потужним і позбавленим вище перерахованих вад виявився критерій Шапіро-Вілка Ж. За рейтингом цей критерій посідає перше місце серед двадцяти одного аналогічного методу [37, С.278] і може бути рекомендований для перевірки нормальності емпіричних розподілів.
Запитання. Завдання. 1. Які основні недоліки критеріїв асиметрії та ексцесу для перевірки нормальності розподілів?
2. Коли доцільно застосовувати критерію хі-квадрат в завданнях перевірки нормальності розподілів?
3. Проаналізуйте схему вибору параметричних критеріїв залежно від характеру сукупності і досліджуваних завдань.
4. Обгрунтуйте порівняльну характеристику трьох критеріїв (асиметрії та ексцесу, хі-квадрат, Шапіро-Вілка) як засобу оцінки відповідності емпіричного розподілу нормальному законові.
5. Повторіть математичні процедури завдань за прикладами 5.1 і 5.4.
6. Виконайте лабораторну роботу № 10.
Схожі статті
-
Математична статистика - Руденко В. М. - Критерій згоди х2
Критерій х засновано на порівнянні емпіричної гістограми розподілу випадкової величини з її теоретичною щільністю. Діапазон виміряних емпіричних даних...
-
Математична статистика - Руденко В. М. - Критерії асиметрії та ексцесу
При використанні методів математичної статистики надзвичайно важливо знати закон розподілу властивості, що вивчається. По суті, вже сама досліджувана...
-
Математична статистика - Руденко В. М. - 5.2. ГІПОТЕЗИ ЩОДО НОРМАЛЬНОГО РОЗПОДІЛУ ОЗНАК
При використанні методів математичної статистики надзвичайно важливо знати закон розподілу властивості, що вивчається. По суті, вже сама досліджувана...
-
Математична статистика - Руденко В. М. - Розподіли "хі-квадрат", Стьюдента і Фішера
При побудові статистичних моделей нормальному законові безумовно належить центральне місце. Проте намагання використовувати його для моделювання...
-
Математична статистика - Руденко В. М. - Нормальний розподіл
Роботи Я. Бернуллі, а також приватні дослідження інших математиків XVII-XVIII ст. з Європи згодом оформилися в теорію ймовірності. У початковий період...
-
Математична статистика - Руденко В. М. - 3.4. ТЕОРЕТИЧНІ РОЗПОДІЛИ ВИПАДКОВИХ ВЕЛИЧИН
Зміст класичних законів великих чисел полягає в тому, що вибіркове середнє арифметичне незалежних однаково розподілених випадкових величин наближається...
-
Математична статистика - Руденко В. М. - Біноміальний розподіл
Зміст класичних законів великих чисел полягає в тому, що вибіркове середнє арифметичне незалежних однаково розподілених випадкових величин наближається...
-
Математична статистика - Руденко В. М. - Згруповані розподіли
Розподіли згрупованих частот Використовуються у разі інтервальних або відносних типів вимірювань, якщо емпіричні дані приймають будь-які дійсні значення...
-
Математична статистика - Руденко В. М. - Помилки прийняття статистичних рішень
Прийняття статистичних рішень виконується на основі емпіричного критерію: якщо значення ¥Емп знаходяться в критичній області | ¥Емп | > | ¥Кр |, нульова...
-
Математична статистика - Руденко В. М. - Правила прийняття статистичних рішень
Прийняття статистичних рішень виконується на основі емпіричного критерію: якщо значення ¥Емп знаходяться в критичній області | ¥Емп | > | ¥Кр |, нульова...
-
Математична статистика - Руденко В. М. - Розрахунки та інтерпретація МЦТ і ММ
Розрахунки показників МЦТ і ММ можна здійснити в MS Excel трьома способами з використанням: O математичних операцій за відповідних формул МЦТ і ММ; O...
-
Математична статистика - Руденко В. М. - Розподіли випадкових величин
Розподіли випадкових величин Випадкова величина - це величина, яка в результаті випробувань може приймати певні значення (із сукупності своїх значень) з...
-
Математична статистика - Руденко В. М. - Статистичні критерії
Статистичний критерій - це вирішальне правило, що забезпечує математично обгрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні...
-
Математична статистика - Руденко В. М. - 3.2. ВИПАДКОВІ ВЕЛИЧИНИ
Розподіли випадкових величин Випадкова величина - це величина, яка в результаті випробувань може приймати певні значення (із сукупності своїх значень) з...
-
Математична статистика - Руденко В. М. - Початкові та центральні моменти
Розрахунки показників МЦТ і ММ можна здійснити в MS Excel трьома способами з використанням: O математичних операцій за відповідних формул МЦТ і ММ; O...
-
Математична статистика - Руденко В. М. - Рівень статистичної значущості
Статистичний критерій - це вирішальне правило, що забезпечує математично обгрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні...
-
Математична статистика - Руденко В. М. - Параметричні і непараметричні критерії
Статистичний критерій - це вирішальне правило, що забезпечує математично обгрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні...
-
Математична статистика - Руденко В. М. - Міри мінливості (ММ)
Обмеженість мір центральної тенденції для характеристики сукупностей можна продемонструвати на прикладі двох вибірок (рис. 2.29), які мають Різні...
-
Математична статистика - Руденко В. М. - Інтервальне оцінювання
В основі застосування методу найменших квадратів покладено умову Мінімізації суми квадратів відхилень вибіркових даних від тих, що визначаються оцінкою....
-
Математична статистика - Руденко В. М. - Метод найменших квадратів
В основі застосування методу найменших квадратів покладено умову Мінімізації суми квадратів відхилень вибіркових даних від тих, що визначаються оцінкою....
-
Математична статистика - Руденко В. М. - Множинна регресія
Статистичні зв'язки між змінними досліджуються не лише методами кореляційного, а й регресійного аналізу, які доповнюють один одного. Основне завдання...
-
Математична статистика - Руденко В. М. - Математичне сподівання
Випадкову величину X можна повноцінно характеризувати функцією розподілу подій сс>і, (функція визначена на просторі елементарних подій £2). Функція...
-
Математична статистика - Руденко В. М. - Центральна гранична теорема
Розглянемо два варіанта центральної граничної теореми. 1. Центральна гранична теорема для однаково розподілених доданків - теорема Ліндеберга-Леві. Для...
-
Математична статистика - Руденко В. М. - Характеристики випадкових величин
Випадкову величину X можна повноцінно характеризувати функцією розподілу подій сс>і, (функція визначена на просторі елементарних подій £2). Функція...
-
Математична статистика - Руденко В. М. - Одномірна лінійна регресія
Статистичні зв'язки між змінними досліджуються не лише методами кореляційного, а й регресійного аналізу, які доповнюють один одного. Основне завдання...
-
Математична статистика - Руденко В. М. - Типи і загальна схема перевірки статистичних гіпотез
Стандартні процедури прийняття (відхилення) нульової гіпотези Н0 основані на фіксації факту попадання значень емпіричного критерію ¥Ем" у критичну...
-
Математична статистика - Руденко В. М. - Статистичні рішення на основі р-значень
Стандартні процедури прийняття (відхилення) нульової гіпотези Н0 основані на фіксації факту попадання значень емпіричного критерію ¥Ем" у критичну...
-
Математична статистика - Руденко В. М. - 2.4. РЕГРЕСІЯ
Статистичні зв'язки між змінними досліджуються не лише методами кореляційного, а й регресійного аналізу, які доповнюють один одного. Основне завдання...
-
Математична статистика - Руденко В. М. - Коефіцієнти взаємної зв'язаності
Приклад 2.8. Оцінити зв'язок між віком (змінна X) і результатами допоміжного тесту "цифра-знак" шкали інтелекту дорослих Векслера (змінна Y)....
-
Математична статистика - Руденко В. М. - Нелінійна кореляція
Приклад 2.8. Оцінити зв'язок між віком (змінна X) і результатами допоміжного тесту "цифра-знак" шкали інтелекту дорослих Векслера (змінна Y)....
Математична статистика - Руденко В. М. - Критерій Шапіро-Вілка W