Математична статистика - Руденко В. М. - Метод найменших квадратів

В основі застосування методу найменших квадратів покладено умову Мінімізації суми квадратів відхилень вибіркових даних від тих, що визначаються оцінкою.

Приклад 4.3. Визначити оцінку генерального середнього /йМнк випадкової величини xза методом найменших квадратів. Рішення:

Згідно з умовою мінімізації можна записати

N

U = £ (x, - її)1 = min. (4.14)

Для визначення екстремуму першу похідну функції U слід прирівняти нулю

-DU - = - l£ (x,-//) = 0, звідки X (xI = Х X, - N<" = 0 і М= - Z xT.

DM ¡=1 i=1 i=1 N,=1

Отже, /} Янк = X. (4.15)

Таким чином, оцінка за методом найменших квадратів математичного сподівання /йЯнк випадкової величини x є вибіркове середнє x (ця оцінка співпадає з оцінкою максимальної правдоподібності для випадкової величини, що має нормальний розподіл). Метод найменших квадратів має широке застосування у практиці статистичних досліджень, оскільки не вимагає знання закону розподілу випадкової величини і має достатньо розроблений математичний апарат.

Інтервальне оцінювання

Точкові оцінки навіть у тих ситуаціях, коли вони Спроможні (наближуються до значення параметру при збільшені n), незміщені (у середньому збігаються з параметром) і Ефективні (мають найменшу ступінь випадкових відхилень), є все ж таки наближеними показниками невідомих параметрів. їхнім головним недоліком вважається те, що при малому обсязі вибірки точкові оцінки можуть мати значне розходження з тим параметром, який вони оцінюють, а це може призвести до грубих помилок.

Інтервальною оцінкою Називається чисельний інтервал, який покриває21 з певною Ймовірністю невідомий Параметр генеральної сукупності. Цей чисельний інтервал (2/1) називається довірчим інтервалом, а ймовірність - довірчою ймовірністю в 22. Найчастіше довірчий інтервал вибирається симетричним до параметру ©, тобто (© - а, © +а ).

Розмір довірчого інтервалу залежить від обсягу вибірки П (зменшується з ростом п) і від значення довірчої ймовірності (збільшується при наближенні

В до одиниці). Відхилення оцінки ©П від параметра ©, що оцінюється з певною довірчою ймовірністю в, називають випадковою похибкою репрезентативності. її найбільше відхилення є Граничною похибкою. Випадкова похибка репрезентативності виникає внаслідок того, що досліджується не вся сукупність, а лише її частина (вибірка). її не слід плутати з систематичною похибкою репрезентативності, яка є наслідком порушення принципу випадковості при відборі елементів до вибірки, що може мати місце у практичній діяльності.

Довірча ймовірність В визначається дослідником за Принципом практичної неможливості, а саме: події з імовірністю, близькою до 1, вважаються вірогідними (достовірними); події з імовірністю, близькою до 0, визнаються невірогідними (неможливими). Цей принцип не може бути доказаний математично. До того ж його сформульовано до однократного виконання випробування.

Поруч із поняттям "довірча ймовірність" в використовується поняття "рівень значущості" а. Між В і А існує співвідношення: в =1- а.

Рівень значущості А - вказує ймовірність помилки оцінювання. Для практичних цілей використовують різні значення довірчої ймовірності в або

21 С. АЙвазян, Н. Кремер та ін. наполягають на використанні саме слів "інтервал покриває", а не "містить", оскільки межі чисельного інтервалу визначаються за вибірковими даними і тому є випадковими величинами [1, С. 289; 41, С. 320].

22 Іноді Довірчу ймовірність називають рівнем довіри або Надійністю оцінки. [41, С.

320].

Рівня значущості а - усе залежить від ризику помилки, який може собі дозволити дослідник. Якщо в (довірча імовірність) - це своєрідний "рівень довіри" прийняття рішення, то сенс параметра А (рівень значущості) можна трактувати як ймовірність ризику помилитися при прийнятті рішення. У психологічних і педагогічних дослідженнях загальноприйнятими вважаються так звані стандартні значення В і А (див. табл. 4.2).

Таблиця 4.2

Стандартні значення довірчої ймовірності В, рівня значущості " і параметра І

Довірча ймовірність

Рівень значущості

Параметр нормального розподілу

В

А

2 а

2 а/2

0,90 (90% вірогідності)

0,10 (10%-й рівень)

1,28

1,64

0,95 (95% вірогідності)

0,05 (5%-й рівень)

1,64

1,96

0,99 (99% вірогідності)

0,01 (1%-й рівень)

2,33

2,58

0,999 (99,9% вірогідності)

0,001 (0,1%-й рівень)

3,09

3,29

Методи визначення довірчих інтервалів реалізовано в основному на двох підходах: на знанні точного розподілу вибіркових характеристик для малих обсягів вибірок і на асимптотичних властивостях розподілу вибіркових характеристик для значних обсягів вибірок.

Довірчий інтервал розміром 2А - це чисельний інтервал, який з довірчою ймовірністю в покриває дійсне значення Параметра генеральної сукупності. Наприклад, генеральне середнє /г може належати до інтервалу значень від (X - А) до (X +А), де вибіркове X є серединою цього довірчого інтервалу. Ширина довірчого інтервалу 2А може бути точно обчислена для заданої Довірчої ймовірності в (або рівня значущості а) і цілком певного розподілу ймовірностей. На рис. 4.1 показано ширину симетричного довірчого інтервалу генерального середнього /і для нормального розподілу N(0,1).

Як бачимо, при збільшені довірчої ймовірності в (зменшені значення а) ширина довірчого інтервалу 2А зростає, що знижує точність визначення параметра генеральної сукупності. Для нормального розподілу модель інтервальної оцінки середнього генеральної сукупності /и має вигляд:

/ие(Х-А, Х + (4.16)

Де А= АІ2Г Х ; X і sX - вибіркове середнє і стандартне відхилення; П - обсяг вибірки; 2а/2 - параметр стандартного нормального розподілу (див. табл. 4.2) ; а - рівень значущості - ймовірність того, що відхилення вибіркового від генерального середнього не перевищить А за абсолютним значенням.

Рис. 4.1. Ширина довірчого інтервалу ТА для середнього /г=0

Вираз (4.16) свідчить, що середнє генеральної сукупності ¡1 покривається

Діапазоном значень від (X - А) до (X +А). Оскільки А-то для підвищення

*Jn

Точності при заданій довірчій ймовірності слід збільшувати обсяг вибірки n.

Приклад 4.4. Вибірка обсягом 80 осіб має середнє арифметичне X = 100 і стандартне відхилення SX = 5,6. Необхідно оцінити довірчий інтервал середнього генеральної сукупності Fi на рівні значущості 0,05.

Послідовність рішення:

O визначити параметр стандартного нормального розподілу для рівня значущості А за допомогою функції MS Excel =НОРМСТОБР(0,05/2), яка повертає значення 1,96;

O довірчий інтервал середнього генеральної сукупності ¡1 дорівнюватиме

Л= = 1,96=56 " 1,23

Л/и л/80 '

Відповідь: на рівні значущості 0,05 середнє генеральної сукупності Fi належить діапазонові 100,0 + 1,23 . Інакше кажучи, з довірчою ймовірністю 95% середнє Fi покривається діапазоном значень у межах від 98,77 до 101,23.

Довірчий інтервал зручно оцінювати за допомогою спеціальної функції MS Excel з відповідними аргументами =ДОВЕРИТ(а; sX; и). Так, для прикладу 4.4, функція =ДОВЕРИТ(0,05; 5,6; 80) повертає вже відоме значення 1,23. Запитання. Завдання.

1. Охарактеризуйте основні методи формування емпіричної вибірки.

2. Розкрийте поняття статистичної оцінки.

3. Чим відрізняються між собою точкове й інтервальне оцінювання?

4. Чим відрізняються "параметри" від " статистик"?

5. Охарактеризуйте основні властивості статистичних оцінок.

6. Яка ідея методу моментів як методи статистичного оцінювання?

7. В чому суть методу максимальної правдоподібності?

8. Які умови покладено в основу методу найменших квадратів?

9. В чому полягає суть інтервального статистичного оцінювання?

10. Охарактеризуйте поняття "довірча ймовірність" і "рівень значущості". Яке співвідношення існує між ними?

11. Що означає довірчий інтервал і як його розрахувати?

12. Повторіть математичні розрахунки за прикладами 4.1 - 4.4.

13. Виконайте лабораторну роботу № 9.



Схожі статті




Математична статистика - Руденко В. М. - Метод найменших квадратів

Предыдущая | Следующая