В п.1 и п.2 мы рассмотрели вопрос об оценке неизвестного параметра a одним числом. Такая оценка называется точечной. В ряде случаев требуется не только найти для параметра а подходящее численное значение, но и оценить его надежность и точность. Требуется знать - к каким ошибкам может привести замена параметра а его точечной оценкой, и с какой уверенностью можно ожидать, что ошибки не выйдут за известные пределы. Чтобы дать представление о точности и надежности оценки , в математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями.
Рассмотрим в качестве примера задачу о доверительном интервале при оценке математического ожидания.
Пусть для параметра а получена из ряда экспериментов несмещенная оценка . Мы хотим оценить возможную при этом ошибку. Назначим некоторую достаточно большую вероятность (например, ), такую, что событие с вероятностью можно считать практически достоверным, и найдем такое значение e, для которого
P( | - a | < e ) = | (8) |
Тогда диапазон практически наиболее вероятных значений ошибки, возникающих при замене a на , по модулю не будет превосходить е. Большие по абсолютной величине ошибки будут появляться с малой вероятностью .
Равенство (8) означает, что с вероятностью неизвестное значение параметра а попадает в интервал
Необходимо отметить следующее обстоятельство. Ранее мы рассматривали близость случайной оценки к истинному значению оцениваемого параметра. Здесь ситуация несколько другая. Величина а не случайна, зато случаен интервал I. И величину можно трактовать как вероятность того, что случайный интервал I накроет истинное значение параметра а. Вероятность называется доверительной вероятностью, I - доверительным интервалом, а
называются доверительными границами. Перейдем теперь к нахождению доверительных границ и . Пусть для параметра а существует несмещенная оценка . Если бы нам была известна функция распределения случайной величины (или плотность распределения вероятности) , то задача нахождения доверительнего интервала была бы весьма проста: достаточно было бы найти такое значение e, для которого выполняется условие (8). Затруднение состоит в том, что функция распределения оценки зависит от функции распределения величины Х и, следовательно, от самого неизвестного параметра а.
В качестве другого примера рассмотрим задачу о доверительном интервале для математического ожидания.
Пусть произведено N независимых опытов над случайной величиной Х, характеристики которой (дисперсия D и математическое ожидание m) неизвестны. Для этих параметров получены оценки:
Требуется построить доверительный интервал I, соответствующий доверительной вероятности для математического ожидания m величины Х.
При решении этой задачи воспользуемся тем, что величина представляет собой сумму N независимых случайных величин , и, согласно центральной предельной теореме, при достаточно большом N ее закон близок к нормальному. Поэтому будем исходить из того, что величина распределена по нормальному закону. Характеристики этого закона - математическое ожидание и дисперсия - равны соответственно m и D/N. Найдем такую величину е, для которой
(9) |
Для нормальной случайной величины (с нулевым математическим ожиданием и единичной дисперсией) функция распределения вероятности
С учетом этого формулу (9) запишем в виде:
где - среднее квадратическое отклонение оценки.
Из уравнения
находим значение е:
(10) |
где - функция, обратная F(…), т.е. такое значение аргумента, при котором нормальная функция распределения равна х.
Дисперсия D, через которую выражена величина , нам в точности неизвестна. В качестве ее ориентировочного значения можно воспользоваться оценкой или и положить приближенно
Таким образом, решена задача построения доверительного интервала
где е определяется формулой (10).
Для удобства в табл. 1 приведены значения величины .
t | t | t | t | ||||
0.8 | 1.282 | 0.86 | 1.175 | 0.91 | 1.694 | 0.97 | 2.169 |
0.81 | 1.310 | 0.87 | 1.513 | 0.92 | 1.750 | 0.98 | 2.325 |
0.82 | 1.340 | 0.88 | 1.554 | 0.93 | 1.810 | 0.99 | 2.576 |
0.83 | 1.371 | 0.89 | 1.597 | 0.94 | 1.880 | 0.9973 | 3.000 |
0.84 | 1.404 | 0.9 | 1.643 | 0.95 | 1.960 | 0.999 | 3.290 |
0.85 | 1.439 |
Пример. Пусть в результате проведения 30 опытов были получены 30 значений случайной величины Х:
10.5, 10.8, 11.2, 10.9, 10.6, 11.0, 10.8, 11.0, 11.6, 10.9, 10.5, 11.8, 10.2, 9.2, 10.2,
11.2, 10.3, 11.1, 11.8, 10.3, 10.7, 10.8, 11.2, 10.9, 10.1, 11.7, 10.8, 11.3, 11.0, 11.9.
Требуется найти оценку для математического ожидания m величины X и построить доверительный интервал, соответствующий доверительной вероятности .
Вычисляем = 10.87 , = 0.49. Далее = 0.12.
По табл. 1 находим: .
Тогда
доверительные границы:
доверительный интервал: