Математична статистика - Руденко В. М. - Критерії асиметрії та ексцесу
При використанні методів математичної статистики надзвичайно важливо знати закон розподілу властивості, що вивчається. По суті, вже сама досліджувана змінна представлена масивом емпіричних даних з певним законом розподілу ймовірностей реалізації її значень. Тому будь-яка статистична обробка починається, як правило, зі спроби оцінити закон розподілу. Прагнення застосувати методи, які розроблено для певного закону розподілу, в умовах, коли реальний розподіл відрізняється від гіпотетичного, є найбільш розповсюдженою помилкою, що призводить у підсумку і до помилкових висновків.
Критерії перевірки гіпотез щодо закону розподілу прийнято називати Критеріями згоди, які можна розділити на дві групи: Загальні та Спеціальні [37, С. 20]. Загальні критерії застосовують до формулювань гіпотез про згоду спостережень з будь-яким можливим розподілом. Спеціальні критерії згоди використовують у разі перевірки гіпотези щодо конкретної форми розподілу - нормальної, рівномірної, експоненціальної тощо. Такі критерії носять відповідну назву - Критерії нормальності, критерії рівномірності й т. п.
Розрахунки емпіричного розподілу та його графічна візуалізація не дають надійних підстав для висновку щодо закону розподілу ознаки у сукупності, з якої взята вибірка. Тим часом знання цього закону є необхідною умовою використання багатьох математичних методів. Наприклад, застосування параметричних критеріїв, дисперсійного аналізу вимагає попередньої перевірки нормальності розподілу досліджуваної ознаки.
Серед методів оцінювання законів розподілу ймовірностей випадкових величин біля двох десятків було спеціально розроблено для перевірки нормальності. Найбільш розповсюдженими вважаються критерії асиметрії й ексцесу, хі-квадрат та ін. Проте варто рекомендувати критерій Шапіро-Вілка У¥, який за рейтингом потужності посідає перше місце [37, С 278]. Розглянемо методику, техніку й особливості використання трьох критеріїв: асиметрії й ексцесу, хі-квадрат і Шапіро-Вілка. Причому для порівняння будемо використовувати у навчальних прикладах одні й ті самі емпіричні дані.
Критерії асиметрії та ексцесу
Критерії асиметрії та ексцесу застосовують для приблизної перевірки гіпотези про нормальність емпіричного розподілу. Асиметрія характеризує ступінь несиметричності, ексцес - ступінь загостреності (згладженості) кривої диференціальної функції емпіричного розподілу в порівнянні з функцією щільності нормального розподілу.
Для нормального розподілу N(¿1,0) з математичним сподіванням /г і дисперсією а1 третій і четвертий центральні моменти мають сенс асиметрії і ексцесу. Відповідні коефіцієнти А і Е дорівнюють нулю:
Отже, нормальний розподіл є симетричний відносно середнього значення і є "ідеальний" - не загострений і не згладжений.
Дисперсії асиметрії та ексцесу відповідно дорівнюють
Вважається, що при нормальному розподілі вибіркові показники асиметрії та ексцесу дорівнюватимуть нулю, але реально таке майже не спостерігається. Тому емпіричний розподіл вважають близьким до нормального (приймають нульову гіпотезу), якщо виконуються умови:
|4x| * 3ЩА) і К| ^ 5л/ОД. (5.3)
Технологічно у цьому методі розраховують показники TA і TE
Про достовірну відмінність емпіричного розподілу від нормального свідчать показники tA і tE, якщо приймають значення 3 і більше.
Приклад 5.2. Перевірити відповідність розподілу емпіричних вибіркових даних (стовпчики А:В рис. 5.4) нормальному законові розподілу ознаки.
Послідовність рішення.
O Формулювання гіпотез:
H0: емпіричний розподіл не відрізняється від нормального; H1: емпіричний розподіл відрізняється від нормального.
O Вибір статистичного критерію. Для перевірки статистичних гіпотез використаємо метод критеріїв асиметрії та ексцесу з розрахунком TA і tE:
A I |EX|
ІА = ^ і ^ = , (5.5)
Де AX і EX - емпіричні коефіцієнти асиметрії та ексцесу; MA і mE дорівнюють: m I 6-(N-1) ; ME - p4-N-(n-2HN-3HNEI. (5.6)
O Розрахунки емпіричних критеріїв tA і tE (рис. 5.4) виконано за допомогою формул (див. рис. 5.5). Вибіркові значення асиметрії (4Х) та ексцесу (ЕХ) за формулами (2.12а) і (2.126) розраховано за допомогою функцій MS Excel =СКОС() і =ЗКСЦЕСС().
O Формулювання висновків. Чисельні значення критеріїв TA і TE (рис. 5.4) не перевищують 3 (tA ~ 0,47 < 3; tE ~ 0,49 < 3), що дає можливість стверджувати про відсутність відмінностей між емпіричним і теоретичним нормальним розподілами.
Проте порівняння графіків цих розподілів дають підстави для сумніву щодо відповідності емпіричного розподілу нормальному законові (див. рис. 5.6), що потребує додаткової перевірки.
Рис. 5.6. Емпіричний і нормальний теоретичний розподіли
Більш того, у науковій і спеціальній літературі з математичної статистики при посиланні на критерії асиметрії й ексцесу як на засіб перевірки нормальності розподілу, нерідко звертається увага на застереження про те, що ці критерії дозволяють перевіряти лише деякі співвідношення між моментами розподілу і аж ніяк не є спроможними критеріями нормальності.
Схожі статті
-
Математична статистика - Руденко В. М. - 5.2. ГІПОТЕЗИ ЩОДО НОРМАЛЬНОГО РОЗПОДІЛУ ОЗНАК
При використанні методів математичної статистики надзвичайно важливо знати закон розподілу властивості, що вивчається. По суті, вже сама досліджувана...
-
Математична статистика - Руденко В. М. - Розподіли "хі-квадрат", Стьюдента і Фішера
При побудові статистичних моделей нормальному законові безумовно належить центральне місце. Проте намагання використовувати його для моделювання...
-
Математична статистика - Руденко В. М. - Нормальний розподіл
Роботи Я. Бернуллі, а також приватні дослідження інших математиків XVII-XVIII ст. з Європи згодом оформилися в теорію ймовірності. У початковий період...
-
Математична статистика - Руденко В. М. - Міри мінливості (ММ)
Обмеженість мір центральної тенденції для характеристики сукупностей можна продемонструвати на прикладі двох вибірок (рис. 2.29), які мають Різні...
-
Математична статистика - Руденко В. М. - Біноміальний розподіл
Зміст класичних законів великих чисел полягає в тому, що вибіркове середнє арифметичне незалежних однаково розподілених випадкових величин наближається...
-
Математична статистика - Руденко В. М. - Рівень статистичної значущості
Статистичний критерій - це вирішальне правило, що забезпечує математично обгрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні...
-
Математична статистика - Руденко В. М. - Параметричні і непараметричні критерії
Статистичний критерій - це вирішальне правило, що забезпечує математично обгрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні...
-
Математична статистика - Руденко В. М. - Статистичні критерії
Статистичний критерій - це вирішальне правило, що забезпечує математично обгрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні...
-
Математична статистика - Руденко В. М. - Інтервальне оцінювання
В основі застосування методу найменших квадратів покладено умову Мінімізації суми квадратів відхилень вибіркових даних від тих, що визначаються оцінкою....
-
Математична статистика - Руденко В. М. - Метод найменших квадратів
В основі застосування методу найменших квадратів покладено умову Мінімізації суми квадратів відхилень вибіркових даних від тих, що визначаються оцінкою....
-
Математична статистика - Руденко В. М. - 3.4. ТЕОРЕТИЧНІ РОЗПОДІЛИ ВИПАДКОВИХ ВЕЛИЧИН
Зміст класичних законів великих чисел полягає в тому, що вибіркове середнє арифметичне незалежних однаково розподілених випадкових величин наближається...
-
Математична статистика - Руденко В. М. - Згруповані розподіли
Розподіли згрупованих частот Використовуються у разі інтервальних або відносних типів вимірювань, якщо емпіричні дані приймають будь-які дійсні значення...
-
Математична статистика - Руденко В. М. - Метод моментів
За цим методом (запропоновано К. Пірсоном) певна кількість вибіркових моментів (початкових vK або центральних mK, або тих і інших) прирівнюють до...
-
Математична статистика - Руденко В. М. - 5. ПЕРВІРКА СТАТИСТИЧНИХ ГІПОТЕЗ
5.1. ХАРАКТЕРИСТИКА МЕТОДІВ ПЕРЕВІРКИ СТАТИСТИЧНИХ ГІПОТЕЗ Поняття статистичної гіпотези Статистичною гіпотезою називається будь-яке припущення щодо виду...
-
Математична статистика - Руденко В. М. - Поняття статистичної гіпотези
5.1. ХАРАКТЕРИСТИКА МЕТОДІВ ПЕРЕВІРКИ СТАТИСТИЧНИХ ГІПОТЕЗ Поняття статистичної гіпотези Статистичною гіпотезою називається будь-яке припущення щодо виду...
-
Математична статистика - Руденко В. М. - 5.1. ХАРАКТЕРИСТИКА МЕТОДІВ ПЕРЕВІРКИ СТАТИСТИЧНИХ ГІПОТЕЗ
5.1. ХАРАКТЕРИСТИКА МЕТОДІВ ПЕРЕВІРКИ СТАТИСТИЧНИХ ГІПОТЕЗ Поняття статистичної гіпотези Статистичною гіпотезою називається будь-яке припущення щодо виду...
-
Математична статистика - Руденко В. М. - Помилки прийняття статистичних рішень
Прийняття статистичних рішень виконується на основі емпіричного критерію: якщо значення ¥Емп знаходяться в критичній області | ¥Емп | > | ¥Кр |, нульова...
-
Математична статистика - Руденко В. М. - Типи і загальна схема перевірки статистичних гіпотез
Стандартні процедури прийняття (відхилення) нульової гіпотези Н0 основані на фіксації факту попадання значень емпіричного критерію ¥Ем" у критичну...
-
Математична статистика - Руденко В. М. - Статистичні рішення на основі р-значень
Стандартні процедури прийняття (відхилення) нульової гіпотези Н0 основані на фіксації факту попадання значень емпіричного критерію ¥Ем" у критичну...
-
Математична статистика - Руденко В. М. - Правила прийняття статистичних рішень
Прийняття статистичних рішень виконується на основі емпіричного критерію: якщо значення ¥Емп знаходяться в критичній області | ¥Емп | > | ¥Кр |, нульова...
-
Математична статистика - Руденко В. М. - Розподіли випадкових величин
Розподіли випадкових величин Випадкова величина - це величина, яка в результаті випробувань може приймати певні значення (із сукупності своїх значень) з...
-
Математична статистика - Руденко В. М. - Центральна гранична теорема
Розглянемо два варіанта центральної граничної теореми. 1. Центральна гранична теорема для однаково розподілених доданків - теорема Ліндеберга-Леві. Для...
-
Математична статистика - Руденко В. М. - Метод максимальної правдоподібності
За цим методом (запропоновано К. Пірсоном) певна кількість вибіркових моментів (початкових vK або центральних mK, або тих і інших) прирівнюють до...
-
Математична статистика - Руденко В. М. - 3.2. ВИПАДКОВІ ВЕЛИЧИНИ
Розподіли випадкових величин Випадкова величина - це величина, яка в результаті випробувань може приймати певні значення (із сукупності своїх значень) з...
-
Математична статистика - Руденко В. М. - Початкові та центральні моменти
Розрахунки показників МЦТ і ММ можна здійснити в MS Excel трьома способами з використанням: O математичних операцій за відповідних формул МЦТ і ММ; O...
-
Математична статистика - Руденко В. М. - Розрахунки та інтерпретація МЦТ і ММ
Розрахунки показників МЦТ і ММ можна здійснити в MS Excel трьома способами з використанням: O математичних операцій за відповідних формул МЦТ і ММ; O...
-
Математична статистика - Руденко В. М. - Характеристики випадкових величин
Випадкову величину X можна повноцінно характеризувати функцією розподілу подій сс>і, (функція визначена на просторі елементарних подій £2). Функція...
-
Математична статистика - Руденко В. М. - Теорема Чебишева
Теорема Бернуллі стверджує: якщо т - кількість подій А в п попарно незалежних випробуваннях, а Р є ймовірність настання події А в кожнім з випробувань,...
-
Математична статистика - Руденко В. М. - Теорема Бернуллі
Теорема Бернуллі стверджує: якщо т - кількість подій А в п попарно незалежних випробуваннях, а Р є ймовірність настання події А в кожнім з випробувань,...
-
Математична статистика - Руденко В. М. - Повторні випробування
Повторні випробування Явища і процеси, що вивчає психологія, - це, як правило, складні події. Тому формування теоретичної бази опису таких подій зручно...
Математична статистика - Руденко В. М. - Критерії асиметрії та ексцесу