Математична статистика - Руденко В. М. - 4. СТАТИСТИЧНЕ ОЦІНЮВАННЯ
Поняття статистичного оцінювання параметрів
Основною метою статистичного оцінювання є визначення дійсних параметрів генеральної сукупності на основі вивчення Вибіркових показників. При цьому вибірка повинна достатньо добре відтворювати властивості генеральної сукупності, тобто бути представницькою або репрезентативною. Щоб досягти репрезентативності, використовують спеціальні методи формування вибірки. Найпоширенішими вважаютьсяРандомізовані (прості і систематичні), стратифіковані та Кластерні вибірки.
Проста рандомізована вибірка формується зі списку об'єктів генеральної сукупності за системою відбору, що гарантує рівну ймовірність попадання кожного об'єкта у вибірку. У цьому варіанті розрізняють три групи: всю генеральну сукупність; групу рандомізації, з якої проводиться відбір; експериментальну рандомізовану вибірку. На практиці способом випадкового відбору формують спочатку будь-яку групу потенційних випробовуваних. Після вимірювань властивостей їх розподіляють по групах рівноімовірнісним способом. В основу технологій рандомізації покладено процес генерації послідовності псевдовипадкових чисел.
Систематична рандомізована вибірка відповідає принципам рівноімові-рнісного відбору і вважається оптимальною тоді, коли генеральна сукупність складає великий список об'єктів. Наприклад, для вибірки обсягом 100 об'єктів з генеральної сукупності обсягом 100000 можна визначити перший випадковий об'єкт (індекс), а потім взяти ще 99 випадкових індексів, причому кожний наступний об'єкт повинен відстояти від першого взятого на к позицій.
Стратифікована вибірка гарантує репрезентативність вибраних осіб по відношенню до обраних у дослідженні властивостей. Наприклад, якщо у складі досліджуваної сукупності присутніми є 600 осіб жіночої і 400 - чоловічої статі, то репрезентативна вибірка обсягом у 100 студентів повинна зберегти пропорційне (60% і 40%) представництво осіб кожної статі. У разі простої (або систематичної) рандомізованої вибірки якісне і кількісне співвідношення осіб може бути неадекватним до генеральної сукупності. Використання стратифікованої вибірки обмежено тим, що досить часто склад генеральної сукупності щодо основних підгруп залишається невідомим.
Кластерна вибірка здатна вирішувати проблему неповноти складу підгруп формування. Кластерний метод передбачає поетапний вибір груп (кластерів), а не окремих елементів. Наприклад, на першому етапі отримання репрезентативної вибірки студентів може виконуватися формування списку базових навчальних дисциплін. Тоді групою може бути список студентів різних спеціальностей, що відвідують заняття з певного навчального предмета. Якщо список дисциплін достатньо великий (30-40 груп), можна випадковим методом відібрати 8-10 таких груп. Якщо групи нечисленні, можна досліджувати всіх студентів, якщо ні - можна сформувати більш дрібні рандомізовані вибірки. Ступінь і глибина розгалуження (кількість етапів групування) визначається метою та умовами дослідження. Кластерні вибірки менш надійні, ніж імовірнісні із-зі наявності декількох етапів відбору, кожний з яких додає свою похибку. У разі ж рандомізованої вибірки дослідник ризикує лише один раз. Тому математична теорія вибіркового методу здебільшого базується на аналізі власно імовірнісної вибірки.
Теоретичну основу оцінювання з використанням вибіркового методу складає закон великих чисел, згідно з яким при необмеженому збільшені обсягу вибірки випадкові характеристики вибірки наближаються (сходяться за ймовірністю) до певних параметрів генеральної сукупності (див. розділ 3.3).. Наприклад, для скінченної генеральної сукупності вибіркове середнє Х і дисперсія 8Х2 наближаються до своїх генеральних показників (середнього Ц і дисперсії а2 відповідно). У разі нескінченної генеральної сукупності N = <") замість середнього ц і дисперсії а2 мається на увазі математичне сподівання Мх] і дисперсія Вх розподілу досліджуваної випадкової величини x.
Отже, генеральна сукупність (обсяг n і вибірка (обсяг п) можуть характеризуватися тими ж самими змістовними показниками: для генеральної сукупності вони мають назву "параметри", для вибіркової сукупності - "статистики" (табл. 4.1). Статистики, що використовуються як наближене значення невідомого параметра генеральної сукупності називається статистичною оцінкою.
Таблиця 4.1
Основні показники генеральної і вибіркової сукупностей
Показники сукупностей |
Генеральна сукупність |
Вибірка |
Параметри: |
Статистики: | |
Середнє арифметичне |
Ц |
X |
Дисперсія |
2 А |
2 Sx |
Стандартне відхилення |
А |
5х |
Коефіцієнт кореляції |
Рху | |
Обсяг |
N |
П |
Таким чином, статистична оцінка 0- це вибіркова статистика, яка містить інформацію про відповідний Параметр генеральної сукупності 0. Більш того, оцінювання параметра виконується на основі Статистики, яка в свою чергу є випадковою величино, оскільки реалізується у випробуваннях як П незалежних результатів спостережень (наприклад, значень х1, х2, хП випадкової величини X). Отже, оцінка © як випадкова величина залежить і від закону розподілу досліджуваної випадкової величини x, і від обсягу вибірки п.
Узагальнюючи вищесказане, оцінкою можна називати будь-яку Функцію результатів спостережень &;(Х1, х2, ooo ХП) , за допомогою якої роблять висновки щодо значення параметру генеральної сукупності ©(X) .
Проте в дослідженнях можна отримати декілька різних функцій від результатів спостережень, які можна використовувати у якості оцінки параметру. Наприклад, для оцінки математичного сподівання випадкової величини (генерального середнього) можна запропонувати вибіркові показники: середнє, моду, медіану, які (див. розділі 2.2) можуть приймати різні значення. Назвати "найкращий" показник як оцінку на основі індивідуального значення неможливо. Принципово це можна зробити лише на основі вибіркового розподілу оцінки, а саме: якщо розподіл оцінки &;" концентрується поблизу істинного значення параметру &; , то з більшою ймовірністю можна прийняти, що оцінка незначно відрізнятиметься від параметру. Строго кажучи: Математичне сподівання квадрату відхилення оцінки від параметра має бути якнайменшим:
M[0N -0]2 = min. (4.1)
Така основна умова стосовно "найкращої" оцінки.
Статистичне оцінювання підрозділяють на точкове та інтервальне.
Схожі статті
-
Математична статистика - Руденко В. М. - Основні завдання та методи математичної статистики
Основні завдання та методи математичної статистики Математична статистика - це сучасна галузь математичної науки, яка займається статистичним описом...
-
Математична статистика - Руденко В. М. - 1. ПРЕДМЕТ МАТЕМАТИЧНОЇ СТАТИСТИКИ
Основні завдання та методи математичної статистики Математична статистика - це сучасна галузь математичної науки, яка займається статистичним описом...
-
Математична статистика - Руденко В. М. - Біноміальний розподіл
Зміст класичних законів великих чисел полягає в тому, що вибіркове середнє арифметичне незалежних однаково розподілених випадкових величин наближається...
-
Математична статистика - Руденко В. М. - 3.4. ТЕОРЕТИЧНІ РОЗПОДІЛИ ВИПАДКОВИХ ВЕЛИЧИН
Зміст класичних законів великих чисел полягає в тому, що вибіркове середнє арифметичне незалежних однаково розподілених випадкових величин наближається...
-
Математична статистика - Руденко В. М. - Квантилі
Квантилем Називається значення ранжированої змінної, що відокремлює від варіаційного ряду певну частку обсягу сукупності. Квантиль - загальне поняття. В...
-
Математична статистика - Руденко В. М. - 3.1. ВИПРОБУВАННЯ ТА ПОДІЇ
Основним завданням математичної статистики є опис і пояснення імовірнісної поведінки об'єктів досліджень. Математична статистика вирішує це завдання...
-
Математична статистика - Руденко В. М. - 3. ОСНОВИ ТЕОРІЇ ЙМОВІРНОСТЕЙ
Основним завданням математичної статистики є опис і пояснення імовірнісної поведінки об'єктів досліджень. Математична статистика вирішує це завдання...
-
Математична статистика - Руденко В. М. - Міри мінливості (ММ)
Обмеженість мір центральної тенденції для характеристики сукупностей можна продемонструвати на прикладі двох вибірок (рис. 2.29), які мають Різні...
-
Математична статистика - Руденко В. М. - Міри центральної тенденції (МЦТ)
Міри центральної тенденції (МЦТ) Мірами центральної тенденції (МЦТ) називають чисельні показники типових властивостей емпіричних даних. Ці показники...
-
Математична статистика - Руденко В. М. - Нормовані дані
Квантилем Називається значення ранжированої змінної, що відокремлює від варіаційного ряду певну частку обсягу сукупності. Квантиль - загальне поняття. В...
-
Математична статистика - Руденко В. М. - Основні поняття і означення
Основним завданням математичної статистики є опис і пояснення імовірнісної поведінки об'єктів досліджень. Математична статистика вирішує це завдання...
-
Математична статистика - Руденко В. М. - 2.2. ПОКАЗНИКИ ВИБІРКИ
Міри центральної тенденції (МЦТ) Мірами центральної тенденції (МЦТ) називають чисельні показники типових властивостей емпіричних даних. Ці показники...
-
Математична статистика - Руденко В. М. - Початкові та центральні моменти
Розрахунки показників МЦТ і ММ можна здійснити в MS Excel трьома способами з використанням: O математичних операцій за відповідних формул МЦТ і ММ; O...
-
Математична статистика - Руденко В. М. - Ймовірність подій
Випадкову подію можна передбачити лише з деякою ймовірністю. Ймовірність події - це чисельна міра об'єктивної можливості цієї події (інтуїтивне означення...
-
Математична статистика - Руденко В. М. - Розрахунки та інтерпретація МЦТ і ММ
Розрахунки показників МЦТ і ММ можна здійснити в MS Excel трьома способами з використанням: O математичних операцій за відповідних формул МЦТ і ММ; O...
-
Математична статистика - Руденко В. М. - Математичне сподівання
Випадкову величину X можна повноцінно характеризувати функцією розподілу подій сс>і, (функція визначена на просторі елементарних подій £2). Функція...
-
Математична статистика - Руденко В. М. - Нормальний розподіл
Роботи Я. Бернуллі, а також приватні дослідження інших математиків XVII-XVIII ст. з Європи згодом оформилися в теорію ймовірності. У початковий період...
-
Математична статистика - Руденко В. М. - Теорема Чебишева
Теорема Бернуллі стверджує: якщо т - кількість подій А в п попарно незалежних випробуваннях, а Р є ймовірність настання події А в кожнім з випробувань,...
-
Математична статистика - Руденко В. М. - Теорема Бернуллі
Теорема Бернуллі стверджує: якщо т - кількість подій А в п попарно незалежних випробуваннях, а Р є ймовірність настання події А в кожнім з випробувань,...
-
Математична статистика - Руденко В. М. - Характеристики випадкових величин
Випадкову величину X можна повноцінно характеризувати функцією розподілу подій сс>і, (функція визначена на просторі елементарних подій £2). Функція...
-
Математична статистика - Руденко В. М. - ВСТУП
Психолог у своїй діяльності нерідко має справу з масивами емпіричної інформації і змушений будувати свої висновки в умовах невизначеності. Така ситуація...
-
Математична статистика - Руденко В. М. - Незгруповані розподіли
Незгруповані Розподіли застосовують до емпіричних даних, властивості яких виміряні за інтервальними або відносними шкалами і приймають тільки певні, як...
-
Математична статистика - Руденко В. М. - Ранжировані розподіли
Атрибутивні розподіли Використовуються у разі Номінальних (категоріальних) типів вимірювань властивостей досліджуваних об'єктів. Приклад 2.5. Розрахувати...
-
Математична статистика - Руденко В. М. - Атрибутивні розподіли
Атрибутивні розподіли Використовуються у разі Номінальних (категоріальних) типів вимірювань властивостей досліджуваних об'єктів. Приклад 2.5. Розрахувати...
-
Математична статистика - Руденко В. М. - Лінійна кореляція
Завданням описової статистики є не лише систематизація емпіричних даних у вигляді розподілу частот та розрахунки типових показників МЦТ і варіацій ознак...
-
Математична статистика - Руденко В. М. - Нелінійна кореляція
Приклад 2.8. Оцінити зв'язок між віком (змінна X) і результатами допоміжного тесту "цифра-знак" шкали інтелекту дорослих Векслера (змінна Y)....
-
Математична статистика - Руденко В. М. - Коефіцієнти взаємної зв'язаності
Приклад 2.8. Оцінити зв'язок між віком (змінна X) і результатами допоміжного тесту "цифра-знак" шкали інтелекту дорослих Векслера (змінна Y)....
-
Математична статистика - Руденко В. М. - Умовна ймовірність
Якщо подія А відбувається у випробувані, яке обмежене додатковими умовами здійснення події В, то міра можливості події А визначається Умовною ймовірністю...
-
Математична статистика - Руденко В. М. - Формула повної ймовірності
Якщо подія А відбувається у випробувані, яке обмежене додатковими умовами здійснення події В, то міра можливості події А визначається Умовною ймовірністю...
-
Математична статистика - Руденко В. М. - Формула Байєса
Формула повної ймовірності дає можливість розрахувати ймовірність Р(А) події А, якщо вона залежить від системи подій-гіпотез Н1,Н2,...,НП, за умовними...
Математична статистика - Руденко В. М. - 4. СТАТИСТИЧНЕ ОЦІНЮВАННЯ