Математична статистика - Руденко В. М. - 3.2. ВИПАДКОВІ ВЕЛИЧИНИ
Розподіли випадкових величин
Випадкова величина - це величина, яка в результаті випробувань може приймати певні значення (із сукупності своїх значень) з певною Ймовірністю. Випадковою можна назвати будь-яку (не обов'язково чисельну) змінну X, значення якої х створюють множину випадкових елементарних подій {х}.
Розрізняють дискретну і неперервну випадкові величини.
Дискретною Випадковою величиною називається випадкова величина, що приймає скінчене число значень з множини, елементи якої можна пронумерувати. Неперервною Випадковою величиною називається випадкова величина, можливі значення якої неперервно заповнюють деякий інтервал.
Рядок розподілу Дискретної випадкової величини X може бути представлений як у табличній формі - у вигляді таблиці, де перераховано значення випадкової величини х1, х2, хП з відповідними до них ймовірностямир1, р2, рП (див. табл. 3.2), так і у вигляді графічного зображення (рис. 3.7).
Таблиця 3.2
Рядок розподілу дискретної випадкової величини X
Рис. 3.7. Графік розподілу дискретної випадкової величини X
Рядок розподілу може мати аналітичну форма представлення, наприклад:
В загальному вигляді це можна записати якД(Х) = Р(Х=х) - значення функції /(X) дорівнює ймовірності Р(Х=х) того, що змінна X приймає значення х.
За аналогією з випадковими подіями, можна вважати, що простором елементарних випадкових значень х1, х2, хП змінної X є скінчена множина цих значень С1={х}. Кожному елементарному значенню х1, х2, хП, яке належить до множини СІ, поставлено у відповідність невід'ємне число - ймовірностір1, р2, рП, тобто р! = Р(Х = х{) > 0, причому сума ймовірностей появи всіх елементарних значень змінної X дорівнює одиниці:
Р, = 1. (3.14)
Отже, пару {СІ, Р} можна вважати імовірнісним простором, який складається зі скінченої множини значень О змінної X і невід'ємної функції Р, яка визначена на множині значень О і задовольняє умові (3.14).
Якщо емпіричні дані є результат статистичних випробувань, то емпіричний розподіл частот можна також трактувати як розподіл випадкової величини - співвідношення можливих значень з відповідними ймовірностями їхньої появи. Оскільки Класичні ймовірності збігаються з Відносними частотами (див. поняття класичної ймовірності), то розподіли частот можна представляти як відповідні розподіли випадкових величин, проте, лише за певними умовами і обмеженнями (мова про них йтиме нижче).
Розглянемо на прикладі побудову розподілу дискретної випадкової величини.
Приклад 3.11. Розрахувати розподіл кількості виконаних завдань за результатами тестування навмання відібраної з академічного потоку вибірки студентів обсягом 20 осіб (табл. 3.3).
Таблиця 3.3
Кількість виконаних завдань
Послідовність рішення:
O представити емпіричні дані табл. 3.3 значеннями Хі і відповідними абсолютними частотами виконання завдань. Частоти розрахувати за будь-яким відомим методом і внести у комірки Л3:С9. Сума абсолютних частот по-
7
Винна скласти обсяг вибірки, тобто ^ тІ = 20 (див. комірку С10 рис. 3.8);
І=1
O для розрахунку ймовірностейр = Р(Х = хї) внести в комірку вираз
=С3/$С$10, аналогічні вирази внести у комірки 04:09;
O розрахувати в комірках Е3:Е9 ймовірності р,- = Р(Х < хі);
O побудувати графіки розподілу ймовірностей (рис. 3.9).
Отже, у таблиці рис. 3.8 розраховано розподіли ймовірностей дискретної змінної X (кількості виконаних завдань) р'(х) = Р(Х = х) і р(х) = Р(Х< х), на рис. 3.9 зображено відповідні графіки.
Сукупність ймовірностей р'і = Р(Х = хі) має назву щільності розподілу змінної X (див. стовпчик Б рис. 3.8 і гістограму рис. 3.9). Кожне окреме значення щільності розподілу визначає ймовірність р',- кожного окремого значення X! змінної X, тобто Р(Х = хі). Сума ймовірностей р',- усіх елементарних значень X! змінної X (за умови повної системи випадкових значень) дорівнює
П
Одиниці, тобто ^ р] = 1. Як бачимо з рис. 3.8 (див. комірку 010), ця вимога
І=1
Виконується: 0,00+0,05+0,10+0,20+0,25+0,30+0,10= 1,00.
Сукупність ймовірностей р! = Р(Х < X!) має назву розподілу змінної X (див. стовпчик Е рис. 3.6 і дискретний графік рис. 3.7 у вигляді сходинок з насиченням до 1,00). Розподіл випадкової величини показує ймовірність для змінної X, значення якої не перевищує Х^ , тобто Р(Х < х^. Кожне значення розподілу є сумою ймовірностей Р'і усіх попередніх елементарних значень х, І
Змінної X, тобто: РІ =^р'І. Наприклад, для і = 4 значення ймовірність р4
І=1
4
Аналогічно може бути представлено й щільність розподілу Дх). Для Дискретної змінної розподіл і щільність розподілу зв'язані співвідношенням:
Р (Хі) = ±/ (х,) (3.17)
І=1
Для Неперервної змінної можна записати такі співвідношення:
- щільність розподілу Дх) = Р '(х). Це значить, що щільність Дх) є першою похідною від функції розподілу Р(х);
- щільність розподілу для будь-якої випадкової величини невід'ємна, тобто Лх) > 0, і має таку властивість:
Складатиме р4 р'. = 0,00 + 0,05 + 0,10 + 0,20 = 0,35 (див. комірку Е6 рис. 3.6).
¡=1
Ймовірність отримання у випробуванні будь-якого значення з повної системи випадкових значень (фактично, це є ймовірність достовірної події) дорівнює
П
Одиниці. І дійсно, для і = п ймовірність рП = ^ р] = 1(див. комірку Е9 рис. 3.6
І=1
Або останнє значення ймовірності розподілу на графіку рис. 3.7).
Законом розподілу Випадкової величини є співвідношення, що встановлює зв'язок між можливими значеннями випадкової величини і відповідними до них Ймовірностями. Закон розподілу може бути задано функціями:
O функцією розподілу Р(х)
Р(х) = Р(Х < х); (3.15)
O функцією щільності розподілуДх)
Дх) = Р(Х = х). (3.16)
Для Дискретної змінної функція розподілу Р(х) може бути представлена в аналітичній формі. Так, заданими рис. 3.8 функція Р(х) матиме вигляд:
Математичний аналіз надає геометричну інтерпретацію визначеному інтегралові (3.18) як площі (див. зафарбовану площу на рис. 3.10), яка зверху обмежена графіком функції /(х), а знизу - віссю абсцис у межах - ю < Х < +со. Розмір площі за інтегралом (3.18) дорівнює одиниці.
Значення функції розподілу ¥(х) для певного значення х (наприклад, х = а) визначається через щільність розподілу /(х) за формулою:
Інтеграл (3.19) і функція ¥(а) розподілу також мають сенс площі (див. зафарбовану площу на рис. 3.11), яка обмежена з трьох боків: зверху - графіком функції Дх), знизу - віссю абсцис у межах -" < х < а, з правого боку - ординатою, яка проходить через точку Х = А.
Для Х = +со функція розподілу ¥(со)=1, тобто
І (со) = / (х)^х = 1. (3.20)
-ОС
Отже, порівнюючи алгебру випадкових подій з математичним апаратом випадкової величини, можна дійти до висновку про те, що розподіли Випадкових величин ізоморфно відтворюються на розподілах Випадкових подій.
Розглянемо приклад розподілу неперервної випадкової величини.
Приклад 3.12. Як відомо з психодіагностики, коефіцієнт інтелекту О (показник інтелектуального розвитку сукупності однакових за віком осіб) розподіляється за законом, близьким до нормального12, щільність розподілу якого визначається формулою:
Гг 1 -0,5((х-1В)/<7)2 Г Г, . 1 | (х - І02 і
Де /(х) - ймовірність Р(І<2 = х) того, що ї<2 прийме значення х; І<2 і а - середнє арифметичне і стандартне відхилення генеральної сукупності; % ~ 3,14; е ~ 2,71. Для певного контингенту індивідуумів середнє значення 1<2=100 і а =15.
Завдання: Побудувати розподіл коефіцієнта інтелекту І£) в діапазоні значень від І<2МІН = 50 до І(2макс = 150. Визначити ймовірності того, що І(2 прийматиме значення: а) І£) < 80; б) Щ > 110; в) у межах 70 < І£) < 90; г) прийматиме значення поза межами інтервалу 80 < Щ < 120.
Рішення:
Розрахуємо значення щільності/(х) нормального розподілу і розподіл і(х) у табличній формі в указаному діапазоні з інтервалом 10 (рис. 3.10). Деталі розрахунку розглянемо пізніше у відповідному розділі. Важливим моментом є досягнення так званої нормалізації, за умови якої площа під кривою щільності розподілу /(х) повинна дорівнювати одиниці. Як бачимо з комірки С14 рис. 3.10, ця вимога виконується.
Побудуємо відповідні графіки розподілу І£) (рис. 3.13). Форма графіка щільності /(ІО) має вигляд "дзвону". Вона є симетричною відносно середнього значення ІО=100. Графік розподіл досягає насичення на рівні 1,00.
12 Докладніше щодо нормального закону розподілу див. розділ 3.4.
Слід звернути увагу на те, що ймовірність Р(/£> < 100) = 0,50. Інакше кажучи, ймовірність отримати значення 12 на рівні не більше середнього значення Ї<2=100 складає 50%. На рис. 3.13 це відповідає зафарбованій площі, яка складає 50% від загальної. Аналітично це можна записати так:
100
Р (Х < 100) = | / (х)Сх = 0,50.
-сс
Розглянемо пункти завдання щодо визначення ймовірності отримання конкретних значень коефіцієнта інтелекту
А) Визначити ймовірність того, що 12 прийматиме значення не більше 80, тобто Р(ї<2 < 80). Цій ситуації відповідає зафарбована площа рис. 3.14, для якої Р(80) ~ 0,091 (значення 0,091 можна отримати з табл. рис. 3.12). Аналітичний запис має вигляд:
80
Р(Х < 80) = | Л(Х)сІх ~ 0,091.
-сс
Отже, ймовірність Р(І<2 < 80) = 0,091 = 9,1%.
Б) Визначити ймовірність того, що значення 12 не менше 110, тобто, Р(/0>110). Зафарбована площа рис. 3.15 відповідає ситуації, коли треба отримати подію ^4{/2>110}, яка є доповненням протилежної події А{ї<2 < 110}. Сума ймовірностей протилежних подій дорівнює одиниці. Звідси ймовірність бажаної події Р(І2>110) = 1 - Р(ї(2 < 110) і аналітичний запис для визначення відповідної ймовірності за допомогою функцій розподілу такий:
110
Р(Х > 110) = 1 - Р(х < 110) = 1 - | Л(х)Сх = 1 - 0,748 = 0,252.
-сс
Значення Р(110) = 0,748 можна отримати з табл. рис. 3.12. Отже, ймовірність Р(/((>110) ~ 25,2%.
В) Визначити ймовірність того, що ¡2 прийматиме значення не менше 70, але не більше 90, тобто Р(70< ¡2 <90). Зафарбована площа рис. 3.16 відповідає ситуації, коли з події ^{¡2 < 90} треба вилучити елементи події А2{12 < 70}. Тоді ймовірність Р(А) бажаної події А дорівнюватиме різниці ймовірностей Р(40 і Р(А,) подій АХ і ^2, тобто Р(70< 1(2 < 90) = Р(/( < 90) - Р(Р2 < 70). Визначення ймовірності за допомогою функцій розподілу матиме вигляд:
90 90 70
| Л(Х)Сх = | Л(х)Сх - | Л(х)Сх = Р(90) - Р(70), або
Р(90) - Р(70) = 0,253 - 0,023 = 0,23. Отже, ймовірність Р(70< ¡2 < 90) = 23%.
Г) Визначити ймовірність того, що І<О прийматиме значення поза межами інтервалу 80 < О < 120, тобто, Р(80 > О >120). Цій події відповідає сума двох зафарбованих частин площі рис. 3.17. Рішення можна отримати у 2-х варіантах:
1-й варіант. Подія А складається з двох несумісних подій А1{І<2 < 80} і ^2{І<2 >120} з ймовірностями Р(АА і Р(А2) відповідно. Ймовірність Р(АА події А1 визначиться як
80
|/(х)ах = і(80), або з табл. рис. 3.12 маємо і(80) = 0,091.
Ймовірність Р(А2) події ^42 визначиться як доповнення до протилежної події І2{ІО< 120} або Р(А2) = 1 - ~Аі{ІО< 120}, а саме
120
І(Х > 120) = 1 - | /(х)йх = 1 - і(120) або
-ос
120
І(Х > 120) = 1 - і(х < 120) = 1 - | /(х)ох = 1 - 0,909 ~ 0,091.
-ос
Ймовірність Р(А) події А складається з суми ймовірностей Р(АА і Р(А2) подій А1 і А2, тобто Р(А) = Р(А1) + Р(А2) = 0,091 + 0,091 ~ 0,182 = 18,2%.
2-й варіант. Подію ^4{80>І< >120} можна звести і розглядати як доповнення до протилежної події А, яку позначимо _8{80 <І(2 < 120} (див. незафарбовану площу рис. 3.17). Тоді Р(А) = 1- Р(В).
Подія _8{80< ¡2 <120} відповідає попередній ситуації (див. вище п. "в"), коли з події В1 {¡2 < 120} треба вилучати елементи події В2{2< 80}. Ймовірність Р(В) події В є різниця ймовірностей Р(В{) і Р(В2)
Р(В) = Р(12 < 120) - Р(12 < 80). Ймовірність Р(А) бажаної події А дорівнюватиме
Р(А) = 1- Р(В) = 1 - [Р(Щ < 120) - Р(12 < 80)]. Визначення ймовірності за допомогою функцій розподілу матиме вигляд:
120 Г120 80 ~|
1 - | Л(Х)Сх = 1 - | Л(х)Сх - | Л(х)Сх = 1 - [Р(120) - Р(80)], або 1- [Р(120) - Р(80)] = 1 - [0,909 - 0,091] = 1- 0,818 = 0,182 = 18,2%.
Отже, ймовірність того, що ¡2 не прийматиме значення в діапазоні від 80 до 120, тобто Р(80 > ¡2>120), складає 18,2%.
Зауваження: якщо графік розподілу симетричний і зафарбовані площі однакові за розміром, ймовірність Р(А) розраховується як подвоєна площа однієї з частин, наприклад, Р(А) = 2-Д80 < ¡2) = 2-0,091 ~ 0,182 = 18,2%.
Розподіли дають можливість рішення і зворотної задачі: знаходження значень змінної X, ймовірність якої задано.
Так, за даними прикладу 3.12 можна стверджувати, що на рівні ймовірності 0,05 (5%) коефіцієнт інтелекту ¡2 не перевищуватиме значення 75,3. З графіка функції розподілу Р(2) рис. 3.18 видно, що ймовірності 0,05 відповідає зафарбована площа, яка обмежена графіком щільностіЛ(Ш) і ординатою ¡2 = 75,3. Інакше кажучи, Р(!2) = ^(¡2 < 75,3) = 0,05.
Аналогічно можна отримати значення змінної ¡2, ймовірність якої складає 20% або 0,20. З рис. 3.19 видно, що ймовірності 0,20 відповідає зафарбована площа, яка обмежена графіком щільностіЛ(Ш) і ординатою ¡2 = 87,4.
Інакше кажучи, Р(!2) = ^(¡2 < 87,4) = 0,20.
На даному етапі вивчення властивостей розподілів доречно згадати поняття "процентиль" і надати йому додаткового змістовного сенсу. Як визначалося вище, процентилі ділять обсяг упорядкованої сукупності на Сто частин, тобто відокремлюють від сукупності по 0,01 частки (по 1%). Pj - це z'-й процентиль - межа, нижче за яку лежать /' відсотків значень. Наприклад, якщо п'ятий процентиль дорівнює 30 (записують Р5 = 30), це значить, що 5% всіх значеньX не перевищують 30.
Значення функції розподілу F(X), які знаходяться у межах від 0 для F(-") до 1 для F(+co), також зручно поділити на Сто частин і представляти функцію розподілу у вигляді процентилів. Якщо ціна шкали функції розподілу F(x) становить 0,01 (1%), отримані вище результати можна прокоментувати у такій спосіб:
O для F(IQ) = P(IQ<75,3) = 0,05 = 5% можна записати Р5 = 75,3 - п'ятому процентилю відповідає коефіцієнт інтелекту, який не перевищує значення у 75,3;
O для F(IQ) = P(IQ <87,4) = 0,20 = 20% можна записати Р20 = 87,4 - двадцятому процентилю відповідає коефіцієнт інтелекту, який не перевищує 87,4.
Значення процентиля для нормального розподілу можна отримати за допомогою функції MS Excel =НОРМОБР(ймовірність; середнє; ст. відхилення). Так, ^5 = НОРМОБР(0,05;100;15) = 75,3; а Р20 = НОРМОБР(0,20;100;15) = 87,4.
Схожі статті
-
Математична статистика - Руденко В. М. - Міри мінливості (ММ)
Обмеженість мір центральної тенденції для характеристики сукупностей можна продемонструвати на прикладі двох вибірок (рис. 2.29), які мають Різні...
-
Математична статистика - Руденко В. М. - Згруповані розподіли
Розподіли згрупованих частот Використовуються у разі інтервальних або відносних типів вимірювань, якщо емпіричні дані приймають будь-які дійсні значення...
-
Математична статистика - Руденко В. М. - Ймовірність подій
Випадкову подію можна передбачити лише з деякою ймовірністю. Ймовірність події - це чисельна міра об'єктивної можливості цієї події (інтуїтивне означення...
-
Математична статистика - Руденко В. М. - Розрахунки та інтерпретація МЦТ і ММ
Розрахунки показників МЦТ і ММ можна здійснити в MS Excel трьома способами з використанням: O математичних операцій за відповідних формул МЦТ і ММ; O...
-
Математична статистика - Руденко В. М. - 2.1. ЕМПІРИЧНІ РОЗПОДІЛИ
Статистичні показники, що розкривають властивості вибірки, можна представити такими основними групами: - Емпіричними розподілами (варіаційними,...
-
Математична статистика - Руденко В. М. - Варіаційні ряди та статистичні розподіли
Статистичні показники, що розкривають властивості вибірки, можна представити такими основними групами: - Емпіричними розподілами (варіаційними,...
-
Математична статистика - Руденко В. М. - Нормовані дані
Квантилем Називається значення ранжированої змінної, що відокремлює від варіаційного ряду певну частку обсягу сукупності. Квантиль - загальне поняття. В...
-
Математична статистика - Руденко В. М. - Квантилі
Квантилем Називається значення ранжированої змінної, що відокремлює від варіаційного ряду певну частку обсягу сукупності. Квантиль - загальне поняття. В...
-
Математична статистика - Руденко В. М. - Початкові та центральні моменти
Розрахунки показників МЦТ і ММ можна здійснити в MS Excel трьома способами з використанням: O математичних операцій за відповідних формул МЦТ і ММ; O...
-
Математична статистика - Руденко В. М. - 2. СТАТИСТИЧНІ ПОКАЗНИКИ ВИБІРКИ
Статистичні показники, що розкривають властивості вибірки, можна представити такими основними групами: - Емпіричними розподілами (варіаційними,...
-
Математична статистика - Руденко В. М. - Міри центральної тенденції (МЦТ)
Міри центральної тенденції (МЦТ) Мірами центральної тенденції (МЦТ) називають чисельні показники типових властивостей емпіричних даних. Ці показники...
-
Математична статистика - Руденко В. М. - 2.2. ПОКАЗНИКИ ВИБІРКИ
Міри центральної тенденції (МЦТ) Мірами центральної тенденції (МЦТ) називають чисельні показники типових властивостей емпіричних даних. Ці показники...
-
Математична статистика - Руденко В. М. - Ранжировані розподіли
Атрибутивні розподіли Використовуються у разі Номінальних (категоріальних) типів вимірювань властивостей досліджуваних об'єктів. Приклад 2.5. Розрахувати...
-
Математична статистика - Руденко В. М. - 2.3. КОРЕЛЯЦІЙНИЙ АНАЛІЗ
Завданням описової статистики є не лише систематизація емпіричних даних у вигляді розподілу частот та розрахунки типових показників МЦТ і варіацій ознак...
-
Математична статистика - Руденко В. М. - Лінійна кореляція
Завданням описової статистики є не лише систематизація емпіричних даних у вигляді розподілу частот та розрахунки типових показників МЦТ і варіацій ознак...
-
Математична статистика - Руденко В. М. - Коефіцієнти взаємної зв'язаності
Приклад 2.8. Оцінити зв'язок між віком (змінна X) і результатами допоміжного тесту "цифра-знак" шкали інтелекту дорослих Векслера (змінна Y)....
-
Математична статистика - Руденко В. М. - 2.4. РЕГРЕСІЯ
Статистичні зв'язки між змінними досліджуються не лише методами кореляційного, а й регресійного аналізу, які доповнюють один одного. Основне завдання...
-
Математична статистика - Руденко В. М. - 3. ОСНОВИ ТЕОРІЇ ЙМОВІРНОСТЕЙ
Основним завданням математичної статистики є опис і пояснення імовірнісної поведінки об'єктів досліджень. Математична статистика вирішує це завдання...
-
Математична статистика - Руденко В. М. - Операції над подіями
Основні операції над подіями можна продемонструвати прикладами алгебри подій - алгебри Буля - у вигляді діаграм Венна (рис. 3.1). Рис. 3.1. Операції над...
-
Математична статистика - Руденко В. М. - Умовна ймовірність
Якщо подія А відбувається у випробувані, яке обмежене додатковими умовами здійснення події В, то міра можливості події А визначається Умовною ймовірністю...
-
Математична статистика - Руденко В. М. - Формула Байєса
Формула повної ймовірності дає можливість розрахувати ймовірність Р(А) події А, якщо вона залежить від системи подій-гіпотез Н1,Н2,...,НП, за умовними...
-
Математична статистика - Руденко В. М. - Елементи комбінаторики
Формула повної ймовірності дає можливість розрахувати ймовірність Р(А) події А, якщо вона залежить від системи подій-гіпотез Н1,Н2,...,НП, за умовними...
-
Математична статистика - Руденко В. М. - Формула повної ймовірності
Якщо подія А відбувається у випробувані, яке обмежене додатковими умовами здійснення події В, то міра можливості події А визначається Умовною ймовірністю...
-
Математична статистика - Руденко В. М. - Основні поняття і означення
Основним завданням математичної статистики є опис і пояснення імовірнісної поведінки об'єктів досліджень. Математична статистика вирішує це завдання...
-
Математична статистика - Руденко В. М. - 3.1. ВИПРОБУВАННЯ ТА ПОДІЇ
Основним завданням математичної статистики є опис і пояснення імовірнісної поведінки об'єктів досліджень. Математична статистика вирішує це завдання...
-
Математична статистика - Руденко В. М. - Множинна регресія
Статистичні зв'язки між змінними досліджуються не лише методами кореляційного, а й регресійного аналізу, які доповнюють один одного. Основне завдання...
-
Математична статистика - Руденко В. М. - Одномірна лінійна регресія
Статистичні зв'язки між змінними досліджуються не лише методами кореляційного, а й регресійного аналізу, які доповнюють один одного. Основне завдання...
-
Математична статистика - Руденко В. М. - Нелінійна кореляція
Приклад 2.8. Оцінити зв'язок між віком (змінна X) і результатами допоміжного тесту "цифра-знак" шкали інтелекту дорослих Векслера (змінна Y)....
-
Математична статистика - Руденко В. М. - Сутність кореляції
Завданням описової статистики є не лише систематизація емпіричних даних у вигляді розподілу частот та розрахунки типових показників МЦТ і варіацій ознак...
-
Математична статистика - Руденко В. М. - Атрибутивні розподіли
Атрибутивні розподіли Використовуються у разі Номінальних (категоріальних) типів вимірювань властивостей досліджуваних об'єктів. Приклад 2.5. Розрахувати...
Математична статистика - Руденко В. М. - 3.2. ВИПАДКОВІ ВЕЛИЧИНИ