Блог Джафара Алиева

Архив

Домашняя страница :: Другие статьи :: Аналитика


Дата создания:

Распределение Стьюдента

функция распределения  

 

В случае нормального распределения вы видели концентрацию плотности вокруг среднего значения. Это помогает делать выводы относительно генеральной совокупности, имея только информацию о выборке. Даже если сама генеральная совокупность не распределена нормально, имея много выборок с достаточным количеством элементов, согласно теореме центрального предела можно построить множество из средних значений этих выборок, которая нормально распределена. Тогда среднее арифметическое этих средних значений будет наиболее близким к среднему значению генеральной выборки.

Но представьте себе, что у вас только есть лимитированное количество элементов выборки. Но нужно сделать определенные выводы относительно генеральной совокупности. По этому поводу сделал определенные выводы Уильям Госсет, который работал на пивоваренном заводе Гиннеса в Дублине. Свои работы он опубликовал под псевдонимом Стьюдент, так как завод считал его метод интеллектуальной собственностью Гиннеса и не хотел, чтобы конкуренты узнали, что они применяют статистические методы для контроля качества.

Основная идея Госсета состояла в том, что зная среднее значение небольшой выборки можно было найти промежуток, где с большой вероятностью находится среднее значение генеральной совокупности. Госсет отметил, что если генеральная совокупность нормально распределена, то имея выборку малого размера, можно строить следующее распределение.

$$t=\dfrac{\bar{x}-\mu}{\dfrac{s}{\sqrt{n}}}$$

Здесь $\bar{x}$ – среднее значение выборки, $\mu$ – среднее значение генеральной совокупности, $\dfrac{s}{\sqrt{n}}$ – стандартная ошибка выборки. В этом распределении если размер выборки ($n$) меньше $30$, то она получится более плоской и больше элементов окажутся на “хвостах” по левую и правую сторону от центра. Но с ростом числа элементов выборки это распределение все больше приближается к нормальному. Это называется распределением Стьюдента.

Во многих источниках дается готовая таблица критических значений $t$, полученная эмпирическим путем в зависимости от количества элементов ($n$) и  уровня значимости ($p$). Только вместо $n$ всегда берется $n-1$ (число степеней свободы). Эти значения называют t-критерием Стьюдента. Один из вариантов этой таблицы t-критериев мы даем внутри этой статьи. Расширенную версию этой таблицы можно скачать тут. С помощью этой таблицы можно делать выводы относительно ошибки I рода сравнивая полученное значение $t$ с табличными значениями в зависимости от числа степеней свободы и уровня значимости.

Критические значения t-критерия Стьюдента

В этой таблице сверху и снизу обозначены критические области для двусторонней и односторонней критической области. В зависимости от типа задачи мы рассматриваем одностороннюю или двустороннюю алтернативную гипотезу.

Число
степеней
свободы
Уровень значимости $\alpha$
(двусторонняя критическая область)
0,1 0,05 0,025 0,02 0,01 0,005 0,001
16,31412,70625,45231,82163,657127,3636,6
22,9204,3036,2056,9659,92514,08931,598
32,3533,1824,1774,5415,8417,45312,941
42,1322,7763,4953,7474,6045,5978,610
52,0152,5713,1633,3654,0324,7736,859
61,9432,4472,9693,1433,7074,3175,959
71,8952,3652,8412,9983,4994,0295,405
81,8602,3062,7522,8963,3553,8335,041
91,8332,2622,6852,8213,2503,6904,781
101,8122,2282,6342,7643,1693,5814,587
121,7822,1792,5602,6813,0553,4284,318
141,7612,1452,5102,6242,9773,3264,140
161,7462,1202,4732,5832,9213,2524,015
181,7342,1012,4452,5522,8783,1933,922
201,7252,0862,4232,5282,8453,1533,849
221,7172,0742,4052,5082,8193,1193,792
241,7112,0642,3912,4922,7973,0923,745
261,7062,0562,3792,4792,7793,0673,707
281,7012,0482,3692,4672,7633,0473,674
301,6972,0422,3602,4572,7503,0303,646
$\infty$1,6451,9602,2412,3262,5762,8073,291
  0,05 0,025 0,0125 0,01 0,005 0,0025 0,0005
Уровень значимости $\alpha$
(односторонняя критическая область)

t-Критерий Стьюдента

t-тест или определение t-критерия Стьюдента является простейшим способом проверки точности среднего значения для данных с естественными значениями. В основном эти тесты используются для следующих целей:

Слово “значительно” здесь употребляется в смысле статистической значимости, т. е. это вероятность получения ошибки первого рода. Обычно рассматривается опровержение нулевой гипотезы при значении $p < 0,05$ или $p < 0,01$ для уровня значимости.

Вычисляя значение $t$ для выбранного уровня значимости можно опровергнуть или принимать нулевую гипотезу на этом уровне значимости. Приведем пример ошибки первого рода. Допустим, инженер вычисляет высоту дверного проема для каюты. Какая высота двери будет достаточной, чтобы пассажиры не ударялись головой об верхний борт коробки. Если высота двери позволяет, чтобы $99$ из $100$ пассажиров смогли спокойно войти, не ударяясь головой, значит эта дверь удовлетворяет требованиям на уровне значимости $0,01$. Но если у инженера нет информации о среднем росте пассажиров и нет достаточного количества людей для проверки этого факта, он не может утверждать этот факт для $100$ человек, проверяя лишь на $20$. Поэтому возникает необходимость в вычислении значения $t$.

Основным необходимым условием для проверки t-критерия  Стьюдента является нормальность распределения генеральной совокупности, откуда взяты выборки. Для проверки совокупности на нормальность есть критерии Шапиро-Уилка или Колмогорова-Смирнова. Если проверяем средние значения двух выборок, то нужно сначала проверить их дисперсии на равность. Для этого есть критерий Левена, тест Брауна-Форсайта или критерий Бартлетта.

t-критерий Стьюдента для одной выборки

Допустим, средний балл успеваемости учеников школы составляет $78\%$. Но классный руководитель одного из классов утверждает, этот показатель успеваемости у его класса выше среднего показателя школы. Чтобы проверить этот факт случайным образом отбираем $6$ учеников и даем им тесты для оценки успеваемости. Допустим, в результате тестов ученики получили следующие оценки.

$$X = \{ 79, 76, 82, 80, 76, 81\}$$

В нашем случае $\mu = 78$ и $\bar{x}=79$. Наша нулевая гипотеза выглядит так. $$H_0 : \bar{x}=\mu$$
Тогда интересующая нас односторонняя альтернативная гипотеза будет следующая. $$H_1 : \bar{x} > \mu$$
Нам нужно опровергнуть нулевую гипотезу на уровне значимости $p=0,05$. Для вычисления t-критерия нам нужно знать еще стандартное отклонение, чтобы вычислить стандартную ошибку среднего.

$$s^2 = \dfrac{1}{6-1} \sum_{1}^{6} (x_i-79)^2 = \\[15pt]
=\dfrac{1}{5}(0^2+3^2+3^2+1^2+3^2+2^2)= \\[15pt]
=\dfrac{1}{5}(9+9+1+9+4)=\dfrac{32}{5}=6,4$$
$$m_M = \sqrt{\dfrac{s^2}{n}} = \sqrt{\dfrac{6,4}{6}} = 0,422$$

Значит t-критерий Стьюдента, в нашем случае будет

$$t = \dfrac{\bar{x}-\mu}{m_M} = \dfrac{79-78}{0,422}= \dfrac{1}{0,422} = 2,37$$

Теперь смотрим в таблицу критических значений для количества степеней свободы $df=5$ (так как $df = n-1 = 6-1 =5$) и $p=0,05$. Так как наша альтернативная гипотеза одностороняя, то нас интересует односторонняя критическая область, а остальные $5\%$ уровня значимости (или вероятности $\alpha$ ошибки) останутся для другой альтернативной гипотезы $H_1 : \bar{x} < \mu$, которая нам не интересна. Поэтому нужный нам уровень значимости $p=0,05$ ищем в нижнем ряду. Из таблицы видим, что мы можем опровергнуть нулевую гипотезу для количества степеней свободы $df=5$ и для уровня значимости $p=0,05$. Потому что полученное нами значение $2,37$ больше критического значения $2,015$. Значит этот класс действительно лучше других классов по успеваемости. Если бы найденный нами критерий Стьюдента был меньше табличного значения для $df=5$ и $p=0,05$, то нулевая гипотеза оставалась бы в силе и между этим классом и остальными не было бы никакой разницы.

t-критерий Стьюдента для двух выборок

Двухвыборочный t-критерий Стьюдента используется для проверки различия средних значений двух независимых выборок. Поэтому этот тест также называется t-критерием для независимых выборок. Перечислим необходимые условия для проведения этого теста.

  • как отмечалось выше, выборки должны быть независимы
  • обе выборки должны быть нормально распределены
  • дисперсии этих выборок должны быть равны

Допустим, мы проверяем гипотезу о том, что мужчины, танцующие балет в лучшей физической форме, чем мужчины футболисты. Тогда здесь нулевая гипотеза будет такой, что футболисты и балероны одинаково здоровы.

$$H_0 : \mu_f=\mu_b$$

где $\mu_f$ и $\mu_b$ средние значения показателей здоровья для футболистов и для балеронов соответственно.

Для этого берем две независимые группы так, что ни один футболист одновременно не танцевал балет. В каждую выборку включаем по $10$ человек. Проверка физической формы членов обеих групп ведется на одних и тех же тренажерах, и снимаются одни и те же показатели. В результате составляется следующая таблица пригодности для этих $10$-ти мужчин. Допустим в результате проверки получены следующие значения.

Футболисты (f)Балероны (b)
79,3 89,2
78,3 78,2
85,3 89,3
79,3 88,3
88,9 87,3
91,2 90,1
87,2 95,2
89,2 94,3
93,3 78,3
79,9 89,3

 

Итак,

$$\bar{x}_f = 85,19; \ s_f^2 = 31,18\\
\bar{x}_b = 87,95; \ s_b^2 = 32,38$$

Дисперсия этих двух выборок находится в $5\%$-й дальности друг от друга. Мы будем считать их приблизительно равными. Для этих двух выборок совместная дисперсия вычисляется следующим образом.

$$s_2 = \dfrac{\sum (x_b-\bar{x}_b)^2 + \sum (x_f-\bar{x}_f)^2}{(n_b-1)+(n_f-1)} $$

Если учесть, что

$$s_b^2 = \dfrac{\sum(x_b-\bar{x}_b)^2}{n_b-1} \Rightarrow \sum(x_b-\bar{x}_b)^2 = (n_b-1) s_b^2 \\[15pt] s_f^2 = \dfrac{\sum(x_f-\bar{x}_f)^2}{n_f-1} \Rightarrow \sum(x_f-\bar{x}_f)^2 = (n_f-1) s_f^2$$

то эту формулу можно записать в следующем удобном для нас виде

$$s^2 = \dfrac{(n_b-1)s_b^2+(n_f-1)s_f^2}{n_b+n_f-2}= \\[15pt]
= \dfrac{9 \cdot 32,38 + 9 \cdot 31,38}{10+10-2} = 31,78$$

Для сравнения двух независимых выборок формула для вычисления t-критерия выглядит следующим образом.

$$t=\dfrac{(\bar{x}_b-\bar{x}_f)-(\mu_b-\mu_f)}{ \sqrt{\dfrac{s^2}{n_b}+\dfrac{s^2}{n_f}} }$$

Здесь в знаменателе стоит стандартная ошибка двух средних значений.

Так как наша нулевая гипотеза утверждает, что $\mu_f=\mu_b$, а количества элементов выборок $n_f=n_b=10=n$, формула принимает следующий вид.

$$t=\dfrac{\bar{x}_b-\bar{x}_f}{\sqrt{\dfrac{2s^2}{n}} }=\\[25pt]
=\dfrac{87,95-85,19}{\sqrt{2 \cdot \dfrac{31.78}{10}}} = 1,095 $$

Смотрим в таблицу критических значений $t$ для количества степеней свободы $18$ и уровня значимости $0,05$ для односторонней критической области и видим, что $t_{0.05,18}=1,734$. Как видно, наше значение $t$ меньше, чем $t_{0.05,18}$. Значит, для количества степеней свободы равной $18$ наше значение не позволяет опровергнуть нулевую гипотезу для уровня значимости $0,05$.

Читайте также

Нормальное распределение
Имеется множество различных функций распределения. Но в статистике в качестве непрерывного распределения больше всего используется нормальное распределение (normal distribution). Его также называют распределением Гаусса.

Биномиальное распределение
Биномиальное распределение является одним из видов дисретного распределения, т.е. является распределением вероятностей случайной величины из ограниченного количества значений. Биномиальное распределение применяется к дихотомическим данным.

Центральная предельная теорема
Центральная предельная теорема гласит, что вне зависимости от распределения элементов генеральной совокупности, распределение средних значений выборок стремится к нормальному распределению с увеличением числа элементов этих выборок.

Доверительный интервал
Когда мы вычисляем какую-то статистическую характеристику для выборочной совокупности, это называется точечной оценкой генерального параметра. Однако мы знаем, что если выбрать случайным образом другое подмножество генеральной совокупности, для нее получим другое значение. Поэтому, находим не одно значение, а доверительный интервал, где может находиться истинное значение.

© Все права защищены

Все статьи этого сайта написаны Джафаром Н.Алиевым. Перепечатывание любой статьи на стороннем ресурсе должно сопровождаться именем автора и ссылкой на данный ресурс. Сам автор следует этим правилам.