In [1]:
library(readxl)

# Аналіз двох вибірок

Найважливішим питанням, що виникає при аналізі двох вибірок, є питання про наявність відмінностей між вибірками. Зазвичай для цього проводять перевірку статистичних гіпотез про належність обох вибірок до однієї генеральної сукупності.

**Параметричні методи** передбачають що для вибірок ми знаємо закон їх розподілу. Тому перед їх використанням ви маєте перевірити чи дійсно ваші вибірки мають такий розподіл який є необхідним для даного методу. Використання параметричних критеріїв статистики без попередньої перевірки виду розподілу може привести до певних помилок в ході перевірки робочої гіпотези.

Навпаки **непараметричні критерії** статистики - вільні від допущення про закон розподілу вибірок. Вибірки що аналізуються такими методами мають бути незалежними

## 1 Параметричні методи

Серед параметричних критеріїв статистики розглянемо критерій Стьюдента та критерій Фішера.

### 1.1 Двовибірковий t-критерій Стьюдента

Цей критерій найбільш часто використовується для перевірки нульової гіпотези: «Середні двох вибірок відносяться до однієї і тієї ж генеральної сукупності».

При використанні критерію можна виділити два випадки. У першому випадку його застосовують для перевірки гіпотези про рівність генеральних середніх двох незалежних (**непарний двовибірковий t-критерій**). В цьому випадку є дві окремі групи, контрольна та експериментальна (дослідна), кількість піддослідних в двох групах може бути різним.  
У другому випадку, одна і та ж група об'єктів породжує данні для перевірки гіпотез про середні, використовується так званий **парний t-критерій**. Вибірки при цьому називають залежними, пов'язаними.

**Вимоги до даних**  

1) Вибірковів дані мають бути нормально розподіленими.  
2) Вибірки залежні/незалежні.  
3) Якщо вибірки незалежні то їх дисперсії мають бути однаковими


##### Приклад: непарний двовибірковий t-тест

Показники кров'яного тиску у здорових людей після прийому кофеїну та плацебо наведені в таблиці (data.xlsx, лист 'табл1'). В стовпчику тиск наведений тиск піддослідного, в стовпчику група - до якої групи він належав: "кофеїн" - цій групі давали кофеїн, "плацебо" - цій групі давали плацебо.  
Встановити, чи впливає кофеїн на кров'яний тиск. 

**Припущення 1: Чи є обидві вибірки незалежними?**

Так Маємо дві незалежні вибірки, оскільки дві группи піддослідних були уворені з різних людей.

Завантажемо дані

In [2]:
d <- read_excel('data.xlsx',sheet='табл1')
head(d)
x1 <- d$тиск[d$група=='плацебо']
x2 <- d$тиск[d$група=='кофеїн']

тиск,група
126,кофеїн
145,кофеїн
137,кофеїн
116,кофеїн
137,кофеїн
157,кофеїн


In [3]:
shapiro.test(x2)


	Shapiro-Wilk normality test

data:  x2
W = 0.97814, p-value = 0.9078


In [4]:
shapiro.test(x2)


	Shapiro-Wilk normality test

data:  x2
W = 0.97814, p-value = 0.9078


**Припущення 2: Чи є дані кожної з двох груп нормально розподіленими?**

Використаємо тест на нормальність Шапіро-Вілкінсона (нульова гіпотеза: дані нормально розподілені. Альтернативна гіпотеза: дані не розподілені нормально)
Ми будемо використовувати функцію **shapiro.test ()** для обчислення тесту Шапіро-Уілкінсона для кожної з груп.

In [5]:
shapiro.test(x1)
shapiro.test(x2)


	Shapiro-Wilk normality test

data:  x1
W = 0.9782, p-value = 0.9088



	Shapiro-Wilk normality test

data:  x2
W = 0.97814, p-value = 0.9078


З результатів виклику функції shapiro.test, бачимо що обидва p значення є більшими ніж рівень значущості 0.05, що означає, що розподіл даних істотно не відрізняється від нормального розподілу. Іншими словами, обидві вибірки ми можемо вважати нормальними.  
Примітка: Якщо дані не розподілені нормально, рекомендується використовувати непараметричний двовибірковий тесту Вілкінсона (див далі)

**Припущення 3. Чи мають дві вибірки однакові дисперсії?**

Для перевірки тотожності дисперсій ми будемо використовувати F-тест. В R його можна виконати за допомогою функції var.test () наступним чином:

In [6]:
var.test(x1,x2)


	F test to compare two variances

data:  x1 and x2
F = 1.4567, num df = 19, denom df = 19, p-value = 0.4198
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.5765931 3.6803676
sample estimates:
ratio of variances 
          1.456734 


або так:

In [7]:
var.test(тиск ~ група, data = d)


	F test to compare two variances

data:  тиск by група
F = 0.68647, num df = 19, denom df = 19, p-value = 0.4198
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.271712 1.734325
sample estimates:
ratio of variances 
          0.686467 


Для цього тесту нульова гіпотеза:дисперсії двох вибірок однакові. Альтернативна гіпотеза: дисперсії різні

p-значення F-тесту р = 0.4198.  
Це більше рівня значущості альфа = 0,05. Таким чином, немає суттєвої різниці між дисперсіями двох наборів даних. Тому ми можемо використовувати класичний t-тест який припускає рівність дисперсій.

Вибірки нормальні непарні, застосуємо до них тест Стьюдента (two independent samples t-test)

**Обчислимо непарний двовибірковий t-тест**

Використаємо функцію t.test що має такі аргументи:

**t.test (x, y = NULL, alternative = c ( "two.sided", "Less", "greater"), var.equal = FALSE, conf.level = 0.95, paired = FALSE, ...)**  
**x** Числовий вектор значень.  
**y** Числовий вектор значень (використовується для парного тесту, див. нижче).  
**paired** Ознака парного тесту: перевіряється гіпотеза для x-y, тому вектор y повинен бути присутнім і мати довжину такуж як і вектор x.  
**alternative** Символьний рядок, що визначає альтернативну гіпотезу. Приймає одне зі значень:  
        *"two.sided"* (позамовчуванням) - двосторонній критична область,  
        *"Greater"* - правостороня критична область або  
        *"Less"* - лівостороня критична область.  
        Ви можете вказати лише першу літеру.  
**var.equal** Логічна змінна, яка вказує на рівність дисперсій За замовчуванням var.equal = FALSE (дисперсії передбачаються нерівними),  
    в цьому випадку для обчислень використовується оцінка Велч (Welch).  
**conf.level** Довірча ймовірність.  

1) Обчислення t-тесту - Метод 1: дані зберігаються в двох різних векторах.

In [8]:
t.test(x1, x2, var.equal = TRUE)


	Two Sample t-test

data:  x1 and x2
t = -1.6851, df = 38, p-value = 0.1002
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.639071   1.339071
sample estimates:
mean of x mean of y 
   131.80    138.45 


2) Обчислення t-тесту - Метод 2: Дані зберігаються в таблиці (дата фреймі)

In [9]:
t.test(тиск ~ група, data = d, var.equal = TRUE)


	Two Sample t-test

data:  тиск by група
t = 1.6851, df = 38, p-value = 0.1002
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1.339071 14.639071
sample estimates:
 mean in group кофеїн mean in group плацебо 
               138.45                131.80 


**Висновок, р-значення тесту становить 0.1002, що більше рівня значущості альфа = 0,05. Ми можемо зробити висновок, що середній тиск не змінюється під дією кофеїну.**

Note that:  

if you want to test whether the average men’s weight is less than the average women’s weight, type this:  
   t.test(тиск ~ група, data = d,  
       var.equal = TRUE, alternative = "less")  
            
Or, if you want to test whether the average men’s weight is greater than the average women’s weight, type this  
   t.test(тиск ~ група, data = d,  
       var.equal = TRUE, alternative = "greater")  

http://www.sthda.com/english/wiki/comparing-means-in-r

### 1.2 Двовибірковий критерій Уілкоксона

Інші назви: критерій Манна — Уітні — Уілкоксона (англ. Mann — Whitney — Wilcoxon, MWW), критерій суми рангів Уілкоксона (англ. Wilcoxon rank — sum test) або критерій Уілкоксона — Манна — Уітні (англ. Wilcoxon — Mann — Whitney test).  

Є непараметричною альтернативою двовибірковому непарному t-тесту, його можна використовувати для порівняння двох незалежних вибірок. Він використовується, коли ваші дані не є нормально розподіленими.

##### Приклад