Аналіз двох вибірок
Найважливішим питанням, що виникає при аналізі двох вибірок, є питання про наявність відмінностей між вибірками. Зазвичай для цього проводять перевірку статистичних гіпотез про належність обох вибірок до однієї генеральної сукупності.
Параметричні методи передбачають що для вибірок ми знаємо закон їх розподілу. Тому перед їх використанням ви маєте перевірити чи дійсно ваші вибірки мають такий розподіл який є необхідним для даного методу. Використання параметричних критеріїв статистики без попередньої перевірки виду розподілу може привести до певних помилок в ході перевірки робочої гіпотези.
Навпаки непараметричні критерії статистики - вільні від допущення про закон розподілу вибірок. Вибірки що аналізуються такими методами мають бути незалежними
1 Параметричні методи
Серед параметричних критеріїв статистики розглянемо критерій Стьюдента та критерій Фішера.
1.1 Двовибірковий t-критерій Стьюдента
Цей критерій найбільш часто використовується для перевірки нульової гіпотези: «Середні двох вибірок відносяться до однієї і тієї ж генеральної сукупності».
При використанні критерію можна виділити два випадки. У першому випадку його застосовують для перевірки гіпотези про рівність генеральних середніх двох незалежних (непарний двовибірковий t-критерій). В цьому випадку є дві окремі групи, контрольна та експериментальна (дослідна), кількість піддослідних в двох групах може бути різним. У другому випадку, одна і та ж група об'єктів породжує данні для перевірки гіпотез про середні, використовується так званий парний t-критерій. Вибірки при цьому називають залежними, пов'язаними.
Вимоги до даних
Вибірковів дані мають бути нормально розподіленими.
Вибірки залежні/незалежні.
Якщо вибірки незалежні то їх дисперсії мають бути однаковими
Приклад: непарний двовибірковий t-тест
Показники кров'яного тиску у здорових людей після прийому кофеїну та плацебо наведені в таблиці (data.xlsx, лист 'табл1'). В стовпчику тиск наведений тиск піддослідного, в стовпчику група - до якої групи він належав: "кофеїн" - цій групі давали кофеїн, "плацебо" - цій групі давали плацебо. Встановити, чи впливає кофеїн на кров'яний тиск.
Припущення 1: Чи є обидві вибірки незалежними?
Так Маємо дві незалежні вибірки, оскільки дві группи піддослідних були уворені з різних людей.
Завантажемо дані
Припущення 2: Чи є дані кожної з двох груп нормально розподіленими?
Використаємо тест на нормальність Шапіро-Вілкінсона (нульова гіпотеза: дані нормально розподілені. Альтернативна гіпотеза: дані не розподілені нормально) Ми будемо використовувати функцію shapiro.test () для обчислення тесту Шапіро-Уілкінсона для кожної з груп.
З результатів виклику функції shapiro.test, бачимо що обидва p значення є більшими ніж рівень значущості 0.05, що означає, що розподіл даних істотно не відрізняється від нормального розподілу. Іншими словами, обидві вибірки ми можемо вважати нормальними. Примітка: Якщо дані не розподілені нормально, рекомендується використовувати непараметричний двовибірковий тесту Вілкінсона (див далі)
Припущення 3. Чи мають дві вибірки однакові дисперсії?
Для перевірки тотожності дисперсій ми будемо використовувати F-тест. В R його можна виконати за допомогою функції var.test () наступним чином:
або так:
Для цього тесту нульова гіпотеза:дисперсії двох вибірок однакові. Альтернативна гіпотеза: дисперсії різні
p-значення F-тесту р = 0.4198. Це більше рівня значущості альфа = 0,05. Таким чином, немає суттєвої різниці між дисперсіями двох наборів даних. Тому ми можемо використовувати класичний t-тест який припускає рівність дисперсій.
Вибірки нормальні непарні, застосуємо до них тест Стьюдента (two independent samples t-test)
Обчислимо непарний двовибірковий t-тест
Використаємо функцію t.test що має такі аргументи:
t.test (x, y = NULL, alternative = c ( "two.sided", "Less", "greater"), var.equal = FALSE, conf.level = 0.95, paired = FALSE, ...) x Числовий вектор значень. y Числовий вектор значень (використовується для парного тесту, див. нижче). paired Ознака парного тесту: перевіряється гіпотеза для x-y, тому вектор y повинен бути присутнім і мати довжину такуж як і вектор x. alternative Символьний рядок, що визначає альтернативну гіпотезу. Приймає одне зі значень: "two.sided" (позамовчуванням) - двосторонній критична область, "Greater" - правостороня критична область або "Less" - лівостороня критична область. Ви можете вказати лише першу літеру. var.equal Логічна змінна, яка вказує на рівність дисперсій За замовчуванням var.equal = FALSE (дисперсії передбачаються нерівними), в цьому випадку для обчислень використовується оцінка Велч (Welch). conf.level Довірча ймовірність.
Обчислення t-тесту - Метод 1: дані зберігаються в двох різних векторах.
Обчислення t-тесту - Метод 2: Дані зберігаються в таблиці (дата фреймі)
Висновок, р-значення тесту становить 0.1002, що більше рівня значущості альфа = 0,05. Ми можемо зробити висновок, що середній тиск не змінюється під дією кофеїну.
Note that:
if you want to test whether the average men’s weight is less than the average women’s weight, type this: t.test(тиск ~ група, data = d, var.equal = TRUE, alternative = "less")
Or, if you want to test whether the average men’s weight is greater than the average women’s weight, type this t.test(тиск ~ група, data = d, var.equal = TRUE, alternative = "greater")
1.2 Двовибірковий критерій Уілкоксона
Інші назви: критерій Манна — Уітні — Уілкоксона (англ. Mann — Whitney — Wilcoxon, MWW), критерій суми рангів Уілкоксона (англ. Wilcoxon rank — sum test) або критерій Уілкоксона — Манна — Уітні (англ. Wilcoxon — Mann — Whitney test).
Є непараметричною альтернативою двовибірковому непарному t-тесту, його можна використовувати для порівняння двох незалежних вибірок. Він використовується, коли ваші дані не є нормально розподіленими.