Доверительный интервал

уровень значимости дисперсия стандартное отклонение

Когда мы вычисляем какую-то статистическую характеристику, скажем среднее арифметическое, для выборочной совокупности, это называется точечной оценкой генерального параметра. Потому что эта характеристика определяется одним числом, т.е. одной точкой на прямой. Однако мы знаем, что если выбрать случайным образом другое подмножество генеральной совокупности, для нее получим другое среднее значение. Теперь как нам знать истинное значение этой характеристики для самой генеральной совокупности, если не представляется возможным нахождение оного.

Поэтому, находим не одно значение, а интервал, где может находиться истинное значение. Этот интервал называется доверительным интервалом (confidence interval). Он определяет нижнюю и верхнюю границы истинного значения. Такой интервал определяется для каждой выборки. Так как мы говорим о статистике, тут каждое значение имеет вероятность. Наш доверительный интервал тоже с определенной вероятностью содержит эту характеристику генеральной совокупности.

Вспомним уровень значимости, которая обозначает вероятность ошибки первого рода. Здесь тоже используется этот термин. В данном контексте он обретает немного другой смысл. Здесь этот уровень показывает вероятность непопадания истинного значения в наш доверительный интервал. Этот уровень значимости фиксируется заранее.

Уровень $0,05$ значит, что с $5\%$-й вероятностью мы ошибаемся в определении интервала, т.е. с вероятностью $95\%$ истинное значение находится в доверительном интервале $(1-\alpha)=1-0,05=0,95$. Если у нас будет бесконечное количество выборок, то в $95\%$ случаев найденное нами значение для каждой выборки окажется внутри этого интервала. Часто рассматривают $95\%$-й или $99\%$-й доверительный интервал.

Теперь рассмотрим нахождение этого интервала для конкретной выборки. В качестве характеристики возьмем среднее арифметическое значение. Допустим $x=\{x_1, x_2, …, x_n\}$ некая выборка из генеральной совокупности. Найдем среднее значение
$$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i$$
Теперь узнаем, насколько близко это значение истинному среднему значению генеральной совокупности. Поэтому определим точность оценки $\delta$. Эта оценка зависит от стандартной ошибки среднего $m_M$.

$$\delta = t \cdot m_M$$

Настоящее значение среднего арифметического лежит в интервале:

$$\bar{x}-\delta \leqslant \mu \leqslant \bar{x}+\delta$$

В формуле нахождения $\delta$ есть неизвестный нам коэффициент $t$. Это называется t-критерием Стюдента. Про него подробнее рассказано в другой статье. Это значение берется из готовой таблицы, которая в зависимости от уровня значимости (significance level $p$) и числа степеней свободы (degrees of freedom $df=n-1$) дает значение $t$. В этой таблице указаны значения t-критерия Стюдента для распространенных значений уровня значимости $0,01$; $0,05$; $0,1$; $0,15$; $0,2$; $0,25$; $0,3$ или соответственно для доверительных вероятностей $99\%$, $95\%$, $90\%$, $85\%$, $80\%$, $75\%$ и $70\%$.

Определение доверительного интервала

Выведение среднего значения генеральной совокупности $\mu$ из выборки возможно, если генеральная совокупность нормально распределена. Но вычисляя значение $\mu$, мы фактически строим догадки и нам нужно знать насколько верно выведенное нами значение $\mu$. Для этого, как было отмечено выше, нам нужно знать две вещи. Доверительный интервал для среднего значения и уровень значимости этого интервала. Другими словами, это вероятность совершения $\alpha$ -ошибки (ошибки I рода) при допущении, что истинное значение $\mu$ находится внутри этого доверительного интервала.

Объясним это на конкретном примере. Допустим, автомобильный производитель хочет провести краш-тест и определить уровень безопасности нового автомобиля в случае аварии. Требуется найти среднее значение этого показателя. Ясно, что невозможно разбить всю серию автомобилей для определения этого производителя. В этом случае результат будет точным, но никому не нужным, так как после этого нечего будет продавать. Поэтому выбирают $10$ автомобилей новой серии и проводят краш-тест. В результате теста вычисляется уровень повреждения. Чем меньше уровень повреждения, тем выше уровень безопасности. Допустим, в зависимости от глубины вмятины вычислили следующие уровни повреждения для $10$-и автомобилей.

$x=\{ 2,3; \ 2,6; \ 3,2; \ 1,8; \ 2,2; \ 2.2; \ 2.6; \ 2,5; \ 1,9; \ 2,7 \}$

Вычислим среднее значение:

$$\bar{x} = \frac{1}{10} \sum _{i=1}^{10} x_i =\\[15pt]
= \frac{1}{10}(2,3+ 2,6+ 3,2+ 1,8+ 2,2+ 2,2+ 2.6+ 2,5+ 1,9+ 2,7)=\\[15pt]
=\frac{24}{10}=2,4$$

Теперь вычислим дисперсию:

$$s^2 = \frac{1}{n-1} \sum_{i=1}^{n}(x_i - \bar{x})^2=\frac{1}{9}\sum_{i=1}^{10}(x_i – 2,4)^2 = \\[15pt]
=\frac{1}{9}[(2,3-2,4)^2+(2,6-2,4)^2+(3,2-2,4)^2+(1,8-2,4)^2+\\[15pt]
+(2,2-2,4)^2+(2,2-2,4)^2+(2,6-2,4)^2+(2,5-2,4)^2+\\[15pt]
+(1,9-2,4)^2+(2,7-2,4)^2]=\frac{1,5}{9}=0,167$$

Значит, стандартная ошибка среднего будет равна:

$$m_M = \sqrt{\frac{s^2}{n}} = \sqrt{\frac{0,167}{10}} = 0,129$$

Так как $n=10$, значит число степеней свободы $df=9$. Находим критерий Стьюдента ($t$) из таблицы критических значений, для числа степеней свободы $df=9$ и для уровня значимости $p=0,05$. Так как мы находим доверительный интервал, нам нужно смотреть двустороннюю критическую область. Значит смотрим на значение $0,05$ на верхней строчке. Это значение равно $2,262$. Теперь можно вычислить $\delta$ для нахождения доверительного интервала.

$$\delta = t \cdot m_M = 2,262 \cdot 0,129 = 0,292$$

Следовательно, наш доверительный интервал находится в следующем пределе.

$$2,4 – 0,292 \leqslant \mu \leqslant 2,4+0,292 \Rightarrow \\ \Rightarrow 2,108 \leqslant \mu \leqslant 2,692$$

Именно в этом промежутке находится истинное значение среднего уровня повреждения. Так как уровень повреждения обратно пропорционально безопасности автомобиля, а безопасность автомобиля связано с безопасностью пассажиров и водителя, в таких тестах для надежности всегда выбирают консервативный подход. Для перестраховки нужно брать верхнее значение этого интервала.

Распределение Стьюдента

Представьте, что имея малое количество элементов выборки нужно сделать определенные выводы относительно генеральной совокупности. Распределение Стьюдента позволяет найти промежуток, где с большой вероятностью находится среднее значение генеральной совокупности, зная среднее значение небольшой выборки.

Все статьи этого сайта написаны Джафаром Н.Алиевым. Перепечатывание любой статьи на стороннем ресурсе должно сопровождаться именем автора и ссылкой на данный ресурс. Сам автор следует этим правилам.

Навигатор

Архив

Доверительный интервал

Определение доверительного интервала

Читайте также

Распределение Стьюдента

© Все права защищены