Реферат: Обоснование оценок искомых параметров и их ошибок

Обратимся к обоснованию оценок измерений и их погрешностей. Подчеркнем, что определение систематических ошибок не является задачей статистики. Это инструментальная проблема.


Дата добавления на сайт: 19 февраля 2025

Реферат
Обоснование оценок искомых параметров и их ошибок

1. Оценки искомых параметров и их ошибок. Прямые измерения

Обратимся к обоснованию оценок измерений и их погрешностей. Подчеркнем, что определение систематических ошибок не является задачей статистики. Это инструментальная проблема. Поэтому в дальнейшем систематическую ошибку мы исключаем. Впрочем, мы все-таки будем ее вкратце касаться.
Пусть проводятся измерения какой-то величины Обоснование оценок искомых параметров и их ошибок (рис. 1). В результате N экспериментов имеем выборку N измеренных величин Обоснование оценок искомых параметров и их ошибок (рис. 2), и нам нужно определить какие-то параметры на основе этих измерений. Будучи некоторой функцией Обоснование оценок искомых параметров и их ошибок (рис. 3), искомые параметры, в свою очередь, будут некоторыми случайными величинами. Очевидно, их закон распределения будет как-то зависеть от закона распределения Обоснование оценок искомых параметров и их ошибок (рис. 4). Будем считать, что оценка соответствующих параметров является «хорошей», если она удовлетворяет следующим условиям.
. Является состоятельной, т.е. при Обоснование оценок искомых параметров и их ошибок (рис. 5)оценка сходится к самому параметру (который, вообще говоря, неизвестен).
. Является несмещенной, т.е. поскольку мы используем не сам искомый параметр, а его оценку, то мы не должны делать систематической ошибки в сторону его завышения или занижения, иными словами математическое ожидание этого параметра должно равняться ему самому.
Является эффективной, в том смысле, что несмещенная оценка обладала бы наименьшей дисперсией.
Пусть мы имеем N измерений некоторой величины Обоснование оценок искомых параметров и их ошибок (рис. 6), которую представим в виде:

Обоснование оценок искомых параметров и их ошибок (рис. 7) (1)

где, как и раньше, Q есть математическое ожидание, Обоснование оценок искомых параметров и их ошибок (рис. 8)есть случайная величина - погрешность. Закон распределения случайной величины нам неизвестен. Известно лишь, что Обоснование оценок искомых параметров и их ошибок (рис. 9). Наша задача - оценить среднее значение Q и ошибку этого среднего. В качестве математического ожидания естественно взять среднее арифметическое

Обоснование оценок искомых параметров и их ошибок (рис. 10) (2)

т.к. согласно закону больших чисел эта оценка будет состоятельной и несмещенной.
Дисперсия Q (т.е. разброс в определении истинного значения, обозначим дисперсию Обоснование оценок искомых параметров и их ошибок (рис. 11)) согласно центральной предельной теореме (см. 2.8) равна:

Обоснование оценок искомых параметров и их ошибок (рис. 12) (3)

где у2 есть дисперсия Обоснование оценок искомых параметров и их ошибок (рис. 13). Если нам как-то определить у2, то мы могли бы найти дисперсию среднего значения, т.е. его разброс. Тогда среднее значение искомой величины мы представили бы в виде: Обоснование оценок искомых параметров и их ошибок (рис. 14). Такая запись означала бы, что с вероятностью примерно 68% среднее значение искомой величины лежит в пределах Обоснование оценок искомых параметров и их ошибок (рис. 15)относительно найденного значения Q.
Перейдем к определению у2. На первый взгляд для нее представляется естественной взять следующую оценку :

Обоснование оценок искомых параметров и их ошибок (рис. 16) (4)

Можно показать, что эта оценка состоятельна, а также для нормального закона распределения Обоснование оценок искомых параметров и их ошибок (рис. 17) (3) будет минимальной, т.е оценка разброса эффективная. Но расчеты (детали можно найти, например, в книге Вентцель) показывают, что эта оценка является смещенной, а именно, несмещенная оценка должна получаться путем замены (4) на следующее выражение:

Обоснование оценок искомых параметров и их ошибок (рис. 18) (5)

Для больших выборок поправочный коэффициент стремится к единице. Его имеет смысл вводить для небольших выборок.
Обратим внимание на следующее обстоятельство. В нашей задаче мы имели один искомый параметр Q. И в (5) в знаменателе имеем величину N-1. Если бы мы решали задачу с несколькими искомыми параметрами, скажем, p, то, как показывают исследования, вместо N-1 мы бы имели N-p. Эта величина называется количеством степеней свободы. При большом числе определяемых параметров, очевидно, следует учитывать количество степеней свободы, особенно если число измерений невелико.
Резюмируем сказанное. Величина у, которая характеризует разброс погрешности Обоснование оценок искомых параметров и их ошибок (рис. 19), еще называется погрешностью единичного измерения. Погрешностью измерения среднего значения является Обоснование оценок искомых параметров и их ошибок (рис. 20). Она оказывается существенно меньше, чем (1.4).
Обоснование среднего как наилучшей оценки
Пусть на основании измерений мы имеем выборку Обоснование оценок искомых параметров и их ошибок (рис. 21). Наша задача - найти наилучшие оценки для Q и Обоснование оценок искомых параметров и их ошибок (рис. 22). Если нам известно, что результаты измерений описываются нормальным законом, то мы могли бы вычислить вероятность получения значений Обоснование оценок искомых параметров и их ошибок (рис. 23). Так, вероятность того, что Обоснование оценок искомых параметров и их ошибок (рис. 24) заключена в интервале Обоснование оценок искомых параметров и их ошибок (рис. 25) вблизи фактически измеренного значения равна:

Обоснование оценок искомых параметров и их ошибок (рис. 26)
аналогично записываем для других Обоснование оценок искомых параметров и их ошибок (рис. 27). Вероятность того, что в процессе N измерений мы будем иметь те Обоснование оценок искомых параметров и их ошибок (рис. 28), которые и были получены в эксперименте, равна:

Обоснование оценок искомых параметров и их ошибок (рис. 29) (6)

Очевидно, здесь делается предположение о независимости измерений! Кроме того, мы сократили на Обоснование оценок искомых параметров и их ошибок (рис. 30).
Важно отметить, что величины Обоснование оценок искомых параметров и их ошибок (рис. 31) - это измеренные, т.е. известные нам значения. Неизвестны здесь среднее Q и дисперсия Обоснование оценок искомых параметров и их ошибок (рис. 32). Задача и состоит в том, чтобы их найти. Решение, очевидно, состоит в следующем: Наилучшей оценкой для искомых параметров будет оценка, при которой вероятность их реализации будет максимальной. В статистике это называется принципом максимального правдоподобия. Максимум достигается при минимуме показателя, т.е. Обоснование оценок искомых параметров и их ошибок (рис. 33). Дифференцируя, получим: Обоснование оценок искомых параметров и их ошибок (рис. 34), или Обоснование оценок искомых параметров и их ошибок (рис. 35). Для оценки дисперсии, дифференцируем вероятность (6):

Обоснование оценок искомых параметров и их ошибок (рис. 36)

Отсюда:

Обоснование оценок искомых параметров и их ошибок (рис. 37)

На первый взгляд, последняя оценка противоречит сказанному ранее, когда в знаменателе вместо N фигурировало количество степеней свободы N-1. В действительности должно фигурировать именно N-1, что можно доказать более точными расчетами (см. курс Вентцель). Качественная причина такой замены состоит в том, что в оценке дисперсии используется не истинное значение Q, а его оценка, которая заключает в себе уже некоторую погрешность.
На приведенном ниже рисунке 1 поясняется процесс измерения, как реализация (красные точки) из возможного ряда значений, имеющих соответствующий разброс. Этот разброс и есть разброс отдельного измерения.

Обоснование оценок искомых параметров и их ошибок (рис. 38)
Рис. 1. Качественное пояснение разброса отдельных измерений.

Здесь возникает такой вопрос: увеличивая число измерений, мы можем определить искомую величину, казалось бы, с какой угодно точностью. Этот абсурдный вывод можно опровергнуть следующим образом. Во-первых, мы с самого начала не учитывали систематическую (т.е. инструментальную) погрешность. Очевидно, если случайная погрешность сравнялась с систематической, то дальше уже нет смысла ее уменьшать, накапливая число измерений. Следует поработать над конструкцией приборов с целью уменьшения систематической погрешности. Кроме того, в приведенных выше рассуждениях принималось, что измерения независимые. Если измерения делаются на одном и том же приборе, то абсолютной независимости гарантировать нельзя. В этом случае возникает некоторая зависимость между измерениями, и это тоже налагает определенный предел на количество измерительной информации. Наконец, любопытно сделать следующую оценку. Предположим, что, тем не менее, путем увеличения числа измерений, мы с помощью грубых приборов пытаемся выполнить тонкие измерения, например, с помощью обычной линейки определить размер атома. Примем, что для измерений с помощью линейки у = 1 мм. Т.к. размер атома порядка 10-7 мм, чтобы достичь нужной точности, нам следует выполнить порядка 1014 измерений. Если мы предположим, что одно измерение делается в течение 1 секунды, нам потребуется Обоснование оценок искомых параметров и их ошибок (рис. 39) лет: три миллиона лет!
Итак, на грубых приборах невозможно получить точных результатов. С помощью статистических методов можно лишь улучшить наивные оценки статистических погрешностей типа (1.3).

. Обоснование оценок ошибок в косвенных измерениях

Независимые измерения
Ниже мы дадим вероятностное обоснование формуле (1.7). Итак, имеем измеряемые величины x и y. Нас интересует наилучшая оценка величины z с ее ошибками, которая связана с предыдущими соотношением Обоснование оценок искомых параметров и их ошибок (рис. 40). Представим Обоснование оценок искомых параметров и их ошибок (рис. 41), где Х есть среднее, а Обоснование оценок искомых параметров и их ошибок (рис. 42)есть случайная добавка. Аналогично запишем для других величин. Будем считать, что случайные добавки распределены по нормальному закону. Тогда вероятность

Обоснование оценок искомых параметров и их ошибок (рис. 43)

Аналогично для Обоснование оценок искомых параметров и их ошибок (рис. 44). Мы здесь не выписываем нормировочных коэффициентов. Поскольку Обоснование оценок искомых параметров и их ошибок (рис. 45) и Обоснование оценок искомых параметров и их ошибок (рис. 46) независимы, то вероятность получения любых Обоснование оценок искомых параметров и их ошибок (рис. 47) и Обоснование оценок искомых параметров и их ошибок (рис. 48) равна
Обоснование оценок искомых параметров и их ошибок (рис. 49) (7)

Сделаем в последнем выражении замену переменных: от Обоснование оценок искомых параметров и их ошибок (рис. 50) и Обоснование оценок искомых параметров и их ошибок (рис. 51) вначале перейдем к переменным Обоснование оценок искомых параметров и их ошибок (рис. 52) и Обоснование оценок искомых параметров и их ошибок (рис. 53) (очевидно, среднеквадратичные разбросы новых переменных: Обоснование оценок искомых параметров и их ошибок (рис. 54) и Обоснование оценок искомых параметров и их ошибок (рис. 55)). Тогда Обоснование оценок искомых параметров и их ошибок (рис. 56). Теперь сделаем замену в (7): от Обоснование оценок искомых параметров и их ошибок (рис. 57) и Обоснование оценок искомых параметров и их ошибок (рис. 58) перейдем к переменным Обоснование оценок искомых параметров и их ошибок (рис. 59) и Обоснование оценок искомых параметров и их ошибок (рис. 60). Путем простых, но громоздких преобразований можно показать:

Обоснование оценок искомых параметров и их ошибок (рис. 61), где Обоснование оценок искомых параметров и их ошибок (рис. 62).

Плотность распределения их вероятности будет:

Обоснование оценок искомых параметров и их ошибок (рис. 63),
где Обоснование оценок искомых параметров и их ошибок (рис. 64) (8)

имеет смысл дисперсии Обоснование оценок искомых параметров и их ошибок (рис. 65). Поскольку нас интересует вероятность появления некоторого Обоснование оценок искомых параметров и их ошибок (рис. 66)при любом Обоснование оценок искомых параметров и их ошибок (рис. 67) (при этом Обоснование оценок искомых параметров и их ошибок (рис. 68) и Обоснование оценок искомых параметров и их ошибок (рис. 69) независимы), то плотность распределения вероятности Обоснование оценок искомых параметров и их ошибок (рис. 70)

Обоснование оценок искомых параметров и их ошибок (рис. 71).

Таким образом, величина Обоснование оценок искомых параметров и их ошибок (рис. 72) также распределена по нормальному закону с разбросом Обоснование оценок искомых параметров и их ошибок (рис. 73), определяемым формулой (8).
Формула (8) легко обобщается на произвольную функциональную зависимость (см.1.8).
Еще раз напомним, что в этом разделе речь шла об оценке ошибок в случае, когда исходные величины независимые.
Выше речь шла о случайных погрешностях. Как в окончательном ответе учесть систематические ошибки? Суммарная ошибка, учитывающая как случайную, так и систематическую погрешность, может быть оценена либо как простая сумма ошибок (аналогично (1.3)), либо как корень квадратный из суммы квадратов (аналогично (8)). Обосновать ту или иную формулу, по крайней мере, в общем виде не представляется возможным. Очевидно, последняя оценка будет несколько меньше первой.
Доверительный интервал. Надежность оценок
Оценкой ошибок процесс обработки опытов еще не заканчивается. Необходимо еще выяснить надежность выполненных оценок. Это особенно важно в случае небольших выборок, но не только. Поясним сказанное. Как уже говорилось, в качестве оценки для математического ожидания принимается среднее арифметическое. Если число экспериментов велико, то с большой вероятностью среднее арифметическое будет близко к математическому ожиданию. Но при малом числе экспериментов, замена математического ожидания средним арифметическим может привести к некоторой погрешности, т.к. среднее арифметическое меняется в зависимости от числа элементов в выборке. Доверительный интервал и служит для целей оценки качества определения параметров.
Вначале рассмотрим введение доверительного интервала в асимптотическом приближении бесконечно большого числа экспериментов. Пусть для искомого параметра q в результате серии экспериментов получена оценка Обоснование оценок искомых параметров и их ошибок (рис. 74). Мы хотим оценить возможную ошибку. Назначим некоторую большую вероятность в, такую, что с этой вероятностью событие можно было бы считать достоверным, и найдем такое значение е, для которого вероятность отклонения оценки от искомого параметра в пределах этого значения будет равна в, т.е.:
Обоснование оценок искомых параметров и их ошибок (рис. 75).

Это означает, что диапазон возможных ошибок при замене q на Q с большой вероятностью равен Обоснование оценок искомых параметров и их ошибок (рис. 76) относительно Q. Вероятность попадания искомой величины вне этот диапазон, равная 1- в будет мала. Вероятность в принято называть доверительной вероятностью, интервал от Обоснование оценок искомых параметров и их ошибок (рис. 77) до Обоснование оценок искомых параметров и их ошибок (рис. 78) - доверительным интервалом. Еще этот интервал понимают как интервал значений, не противоречащих опыту. События, не попадающие в указанный интервал, имеют малую вероятность и считаются противоречащими опыту.
Как, задав в, найти доверительный интервал? Для этого надо знать закон распределения величины Обоснование оценок искомых параметров и их ошибок (рис. 79). Как правило, он не известен, но центральная предельная теорема дает основания принять его нормальным. Тогда:

Обоснование оценок искомых параметров и их ошибок (рис. 80) (9)
Здесь
Обоснование оценок искомых параметров и их ошибок (рис. 81)

Сделав в интеграле замену: Обоснование оценок искомых параметров и их ошибок (рис. 82), его можно привести к виду

Обоснование оценок искомых параметров и их ошибок (рис. 83), (10)

где использовано обозначение
Обоснование оценок искомых параметров и их ошибок (рис. 84) - эта функция называется функцией Лапласа или функцией ошибок (в справочниках она может нормироваться по-разному).
Т.о., решая трансцендентное уравнение (10), находим е для принятого в. В математических справочниках приводятся таблицы решений уравнения типа (10), записанного в виде:

Обоснование оценок искомых параметров и их ошибок (рис. 85),

где минус первая степень означает функцию, обратную к Обоснование оценок искомых параметров и их ошибок (рис. 86). Через эту величину доверительный интервал выражается следующим образом:

Обоснование оценок искомых параметров и их ошибок (рис. 87) (11)

Перейдем к рассмотрению точной теории, учитывающей число экспериментов. Здесь принимается, что изучаемая величина описывается точно нормальным распределением. В этом случае доказана теорема, что величина Обоснование оценок искомых параметров и их ошибок (рис. 88) подчиняется т.н. t - распределению Стьюдента с N-1 степенями свободы, обозначим это распределение Обоснование оценок искомых параметров и их ошибок (рис. 89) (соответствующее выражение можно найти в книгах по теории вероятности и статистике). Далее рассуждения повторяются, только вместо функции (10) в уравнении, аналогичном (10), будет присутствовать функция Обоснование оценок искомых параметров и их ошибок (рис. 90). Из соответствующего уравнения опять находится коэффициент Обоснование оценок искомых параметров и их ошибок (рис. 91), который теперь будет функцией не только принятого уровня вероятности в, но и от количества степеней свободы N-1(если искомых параметров р штук, то количество степеней свободы равно N-p). Доверительный интервал снова оценивается по формуле (11).
Аналогично можно рассчитать доверительный интервал и для дисперсии.
В практических применениях часто используют решение уравнения (9) с функцией Стьюдента. Соответствующие таблицы Обоснование оценок искомых параметров и их ошибок (рис. 92) в зависимости от в и N-p (p - число определяемых параметров) приводятся в руководствах по статистике и теории вероятностей. С их помощью можно оценить надежность статистических оценок. Так поступают часто даже в тех случаях, если закон распределения искомой величины неизвестен.
Каким принять уровень надежности? Не существует математических методов расчета уровня надежности. Это зависит от конкретной ситуации. Ранее было введено понятие стандартной ошибки. Это означает, что вероятностью 68% ожидаемая величина попадает в интервал Обоснование оценок искомых параметров и их ошибок (рис. 93) и с вероятностью 32% не попадает. 32% - это почти половина от 68%. Надежность оценки в этом случае невелика. Общепринятым считается, что во многих случаях можно считать оценку надежной, если искомая величина попадает в доверительный интервал с вероятностью 95% и лишь с вероятностью 5% оказывается вне его. Для N-1=10 этому уровню надежности соответствует Обоснование оценок искомых параметров и их ошибок (рис. 94) (для Обоснование оценок искомых параметров и их ошибок (рис. 95) Обоснование оценок искомых параметров и их ошибок (рис. 96)). Таким образом, доверительный интервал примерно в Обоснование оценок искомых параметров и их ошибок (рис. 97) (так и говорят: «две сигмы») соответствует примерно 95%-ому уровню надежности. В некоторых случаях требуется более высокий уровень надежности, скажем, 99% (в качестве примеров приведем следующие ситуации: ответственные или дорогостоящие - космические - эксперименты, или когда вероятность гибели людей отлична от нуля). Тогда доверительный интервал выбирают существенно больше, например, три сигмы.
Из понятия доверительного интервала вытекают несколько важных следствий.
. Основываясь на этих представлениях, мы можем принять, что те измерения, которые сильно отклоняются от среднего значения, ошибочны. В качестве границы, отделяющей сильные отклонения от приемлемых, часто принимают Обоснование оценок искомых параметров и их ошибок (рис. 98) - «правило трех сигм». Это правило используется для отбрасывания «подозрительных» данных.
. Пусть оцененное в результате экспериментов значение какой-то величины есть Обоснование оценок искомых параметров и их ошибок (рис. 99), тогда как ожидаемое значение есть Обоснование оценок искомых параметров и их ошибок (рис. 100) (частным значением может быть Обоснование оценок искомых параметров и их ошибок (рис. 101). С помощью t - распределения Стьюдента мы можем ответить на такой вопрос: приемлемо ли полученное значение Обоснование оценок искомых параметров и их ошибок (рис. 102)? Еще говорят так: можем проверить нуль гипотезу о том, что Обоснование оценок искомых параметров и их ошибок (рис. 103). Сокращенно пишут так: «Обоснование оценок искомых параметров и их ошибок (рис. 104) против Обоснование оценок искомых параметров и их ошибок (рис. 105)» (здесь буква Н от английского слова гипотеза - hypothesis). Для проверки гипотезы, во-первых, задается уровень надежности Обоснование оценок искомых параметров и их ошибок (рис. 106), скажем, 95%; во-вторых, вычисляется отношение Обоснование оценок искомых параметров и их ошибок (рис. 107). Далее, по таблицам находится Обоснование оценок искомых параметров и их ошибок (рис. 108) (это значение коэффициента Стьюдента называют еще критическим). Если оцененное значение Обоснование оценок искомых параметров и их ошибок (рис. 109) окажется больше критического Обоснование оценок искомых параметров и их ошибок (рис. 110), то гипотеза, что Обоснование оценок искомых параметров и их ошибок (рис. 111) отвергается (в статистических исследованиях обычно избегают выражения «принять гипотезу» и предпочитают обсуждать вопрос отвергнуть или не отвергнуть).
Изложенная методика количественной оценки качества измерений будет использована далее.

. Коэффициент корреляции

Выше, при выводе формул для ошибок в косвенных измерениях, мы предполагали, что соответствующие непосредственно измеряемые (случайные) величины являются независимыми. Здесь мы дадим количественную меру для оценки зависимости случайных величин.
Пусть мы имеем две случайные величины Обоснование оценок искомых параметров и их ошибок (рис. 112) и Обоснование оценок искомых параметров и их ошибок (рис. 113). Для систем случайных величин, так же как и для одной, вводятся числовые характеристики - моменты. Обозначим плотность распределения вероятностей этих величин через Обоснование оценок искомых параметров и их ошибок (рис. 114). Смысл ее понятен: Обоснование оценок искомых параметров и их ошибок (рис. 115) есть вероятность одновременного попадания Обоснование оценок искомых параметров и их ошибок (рис. 116) и Обоснование оценок искомых параметров и их ошибок (рис. 117) в соответствующие интервалы.
Начальными моментами порядка Обоснование оценок искомых параметров и их ошибок (рис. 118) называется математическое ожидание:

Обоснование оценок искомых параметров и их ошибок (рис. 119) (12)

Отсюда математическим ожиданием для величин Обоснование оценок искомых параметров и их ошибок (рис. 120) и Обоснование оценок искомых параметров и их ошибок (рис. 121) является: Обоснование оценок искомых параметров и их ошибок (рис. 122); Обоснование оценок искомых параметров и их ошибок (рис. 123).
Центральным моментом порядка Обоснование оценок искомых параметров и их ошибок (рис. 124) называется математическое ожидание:

Обоснование оценок искомых параметров и их ошибок (рис. 125) (13)

Отсюда дисперсии Обоснование оценок искомых параметров и их ошибок (рис. 126); Обоснование оценок искомых параметров и их ошибок (рис. 127). Они характеризуют рассеивание случайной точки (с координатами Обоснование оценок искомых параметров и их ошибок (рис. 128)) в направлении соответствующих осей.
Помимо приведенных моментов из формулы (13) вытекает существование еще одного момента второго порядка

Обоснование оценок искомых параметров и их ошибок (рис. 129) , (14)

который называется смешанным или корреляционным моментом случайных величин Обоснование оценок искомых параметров и их ошибок (рис. 130), который описывает связь между случайными величинами. Для того, чтобы в этом убедиться, покажем, что для независимых случайных величин он равен нулю. Действительно, для независимых случайных величин функция плотности распределения вероятностей есть произведение вероятностей для каждой величины, т.е. Обоснование оценок искомых параметров и их ошибок (рис. 131). Тогда
Обоснование оценок искомых параметров и их ошибок (рис. 132) (15)

Напоминаем, что угловые скобки здесь означают усреднение. Поскольку Обоснование оценок искомых параметров и их ошибок (рис. 133) иОбоснование оценок искомых параметров и их ошибок (рис. 134), то из (4.4) следует, что в этом случае Обоснование оценок искомых параметров и их ошибок (рис. 135).
Итак, для независимых случайных величин корреляционный момент равен нулю. Обратное, вообще говоря, неверно. Равенство нулю корреляционного момента еще не означает, что величины независимые.
Рассмотрим другой предельный случай зависимых величин. Пусть Обоснование оценок искомых параметров и их ошибок (рис. 136). Для этого случая для вычисления корреляционного момента вместо двойного интеграла будет простой интеграл:

Обоснование оценок искомых параметров и их ошибок (рис. 137) (16)

Это выражение можно симметризовать следующим образом. Из (13) в случае зависимых величин имеем: Обоснование оценок искомых параметров и их ошибок (рис. 138). Отсюда: Обоснование оценок искомых параметров и их ошибок (рис. 139). Подставляя его в (16), имеем:

Обоснование оценок искомых параметров и их ошибок (рис. 140). (17)

В практических расчетах вместо корреляционного момента часто используют коэффициент корреляции Обоснование оценок искомых параметров и их ошибок (рис. 141), который определяется следующим образом:

Обоснование оценок искомых параметров и их ошибок (рис. 142) (18).

Очевидно, в случае независимых величин вслед за корреляционным моментом коэффициент корреляции равен нулю. В случае линейно зависимых величин с помощью (4.5, 4.6) получим:

Обоснование оценок искомых параметров и их ошибок (рис. 143) (19).

Отсюда видно, что коэффициент корреляции равен единице, если у растет вместе с х, и минус единице, если убывает.
В общем случае, т.е. произвольной вероятностной зависимости между величинами, коэффициент корреляции оказывается заключен в пределах: Обоснование оценок искомых параметров и их ошибок (рис. 144). Если коэффициент корреляции положителен, то говорят о положительной корреляции, отрицателен - об отрицательной.

. Оценка погрешности в косвенных измерениях. Зависимые величины

Теперь мы можем дать формулу оценки погрешности в случае косвенных измерений, когда измеряемые величины являются зависимыми (точнее, коррелированными), т.е. обобщить формулу (19). Напомним, пусть мы измеряем величины x и y, а нас интересует величина Обоснование оценок искомых параметров и их ошибок (рис. 145). Мы хотим получить рецепт расчета погрешности Обоснование оценок искомых параметров и их ошибок (рис. 146), если известны погрешности x и y и известно, что они не являются независимыми. Как и в Теме 1 разложим Обоснование оценок искомых параметров и их ошибок (рис. 147), здесь использовано представление Обоснование оценок искомых параметров и их ошибок (рис. 148) и Обоснование оценок искомых параметров и их ошибок (рис. 149), где Обоснование оценок искомых параметров и их ошибок (рис. 150) и Обоснование оценок искомых параметров и их ошибок (рис. 151) - случайные величины, характеризующие разброс измеряемых величин вокруг истинных значений X и Y. Используя это представление, вычислим дисперсию Обоснование оценок искомых параметров и их ошибок (рис. 152):

Обоснование оценок искомых параметров и их ошибок (рис. 153)

Как и выше здесь использованы обозначения Обоснование оценок искомых параметров и их ошибок (рис. 154). Очевидно, Обоснование оценок искомых параметров и их ошибок (рис. 155). Окончательно,

Обоснование оценок искомых параметров и их ошибок (рис. 156) (20)

Эта формула обобщает расчет ошибок в косвенных измерениях, если непосредственно измеряемые величины являются коррелированными.
Лишние данные
В разделе 1 было показано, что погрешность измерения среднего равна Обоснование оценок искомых параметров и их ошибок (рис. 157), где Обоснование оценок искомых параметров и их ошибок (рис. 158) есть дисперсия ошибок, Обоснование оценок искомых параметров и их ошибок (рис. 159) есть число измерений. Там же был сформулирован парадокс: поскольку при Обоснование оценок искомых параметров и их ошибок (рис. 160) мы можем сделать ошибку сколь угодно малой, то можно ожидать, что с помощью грубых приборов можно производить измерения со сколь угодно большой точностью. Один из ответов был такой: в этих рассуждениях предполагалось, что инструментальной ошибкой мы можем пренебречь. Очевидно, если случайная ошибка сравнивается с инструментальной (систематической), то дальше накапливать измерения просто нет смысла. Оказывается, что корреляции между ошибками в процессе измерений также накладывают ограничение на число измерений.
С этой целью рассмотрим такую демонстрационную задачу. Пусть нас интересует некоторая случайная величина

Обоснование оценок искомых параметров и их ошибок (рис. 161) (21)

Обратим внимание на то, что индексом i отмечается i-я случайная величина x.
Далее как обычно большими буквами будем обозначать средние соответствующих величин. Тогда
Обоснование оценок искомых параметров и их ошибок (рис. 162)

Дисперсия

Обоснование оценок искомых параметров и их ошибок (рис. 163) (22)
Обоснование оценок искомых параметров и их ошибок (рис. 164)

Обозначим стоящее под знаком суммы выражение: Обоснование оценок искомых параметров и их ошибок (рис. 165). Эту величину называют ковариационной матрицей. В частном случае Обоснование оценок искомых параметров и их ошибок (рис. 166) она будет равна ковариационному коэффициенту.
Допустим, что

Обоснование оценок искомых параметров и их ошибок (рис. 167) (23)

Где Обоснование оценок искомых параметров и их ошибок (рис. 168) есть дисперсия х (в нашем демонстрационном расчете принимаем ее постоянной), r есть коэффициент корреляции между различными х (его тоже принимаем постоянным). Из приведенного выражения видно, что ковариационная матрица имеет Обоснование оценок искомых параметров и их ошибок (рис. 169) одинаковых значений, равных Обоснование оценок искомых параметров и их ошибок (рис. 170) (они располагаются на диагонали), и, соответственно Обоснование оценок искомых параметров и их ошибок (рис. 171)значений, равных Обоснование оценок искомых параметров и их ошибок (рис. 172). Таким образом:

Обоснование оценок искомых параметров и их ошибок (рис. 173) (24)

Рассмотрим следствие из формулы (24). Предположим, что Обоснование оценок искомых параметров и их ошибок (рис. 174) - некоторые измеряемы величины. Как правило, для их случайной составляющей предполагается некоторый закон распределения, при этом для простоты полагают, что они независимые, т.е. Обоснование оценок искомых параметров и их ошибок (рис. 175) (некоррелированные величины). Отсюда дисперсия интересующей нас величины равна: Обоснование оценок искомых параметров и их ошибок (рис. 176). Но если коэффициент парной корреляции отличен от нуля, то стандартное отклонение интересующей нас величины растет с Обоснование оценок искомых параметров и их ошибок (рис. 177) гораздо быстрее. Отсюда вытекает ограничение на нужное количество измерений:

Обоснование оценок искомых параметров и их ошибок (рис. 178) (25)

Аналогично можно показать (Эльясберг), что при наличии корреляций между ошибками в различных измерения одной и той же величины среднее значение интересующей нас величины имеет стандартное отклонение:

Обоснование оценок искомых параметров и их ошибок (рис. 179) ; при Обоснование оценок искомых параметров и их ошибок (рис. 180). (26)

В настоящее время нередко проводятся эксперименты с большим количеством измерений. Особенно это стало возможно в компьютерную эру. При этом, в процессе обработке молчаливо предполагается, что различные измерения являются независимыми. Из последней формулы видно, к каким ошибкам это может привести. Очевидно, оптимальное значение измерений получается согласно (25).
Вместе с тем, следует отметить, что, если коэффициент корреляции между измерениями в последовательной серии мал, то на практике его очень трудно бывает оценить.
Резюме

Результат (26) указывает, что к понятию состоятельности оценки надо относиться с осторожностью. Действительно, оно выполняется лишь асимптотически, когда число экспериментов Обоснование оценок искомых параметров и их ошибок (рис. 181). Но в этом случае начинают сказываться корреляции между измерениями. Тогда оценка может стать неэффективной, т.к. при Обоснование оценок искомых параметров и их ошибок (рис. 182) погрешность выражается не формулой Обоснование оценок искомых параметров и их ошибок (рис. 183), а формулой Обоснование оценок искомых параметров и их ошибок (рис. 184), согласно которой погрешность вовсе не убывает с ростом числа экспериментов.
Это вывод говорит о том, что к оценкам, получаемым методами математической статистики надо относиться с осторожностью. Некоторые авторы даже утверждают, что понятие состоятельной оценки является мифом ХХ века!
погрешность интервал корреляция измерение

Литература

1.Бисноватый-Коган Г.С. Релятивистская астрофизика и физическая космология. - М.: КРАСАНД, 2011
2.Паркер Ю.Н. Беседы об электрических и магнитных полях в космосе. - Ижевск: Ижевский институт компьютерных исследований, 2010
.Самойленко П.И. Теория и методика обучения физике. - М.: Дрофа, 2010
.Верходанов О.В. Радиогалактики и космология. - М.: ФИЗМАТЛИТ, 2009
.Горелов А.А. Концепции современного естествознания. - М.: Юрайт, 2009
.Кирьянов В.И. Описание фазовых состояний Вселенной через фундаментальные постоянные. - М.: ЛИБРОКОМ, 2009
.Колесниченко А.В. Турбулентность и самоорганизация . - М.: БИНОМ, 2009
.Котельников В.А. Собрание трудов. - М.: ФИЗМАТЛИТ, 2009
.Под ред. В.Д. Кузнецова: Солнечно-земная физика. - М.: ФИЗМАТЛИТ, 2009
.Фортов В.Е. Экстремальные состояния вещества. - М.: ФИЗМАТЛИТ, 2009
.Яценко А.С. Оптические спектры N- и O-подобных ионов. - Новосибирск: Наука, 2009
.Котельников В.А. Собрание трудов. - М.: Физматлит, 2008
.Гопка В.В. Вселенная и человек. - Новосибирск: Сибмедиздат НГМУ, 2007
.Гопка В.В. Так сколько же вселенных? По крайней мере не меньше двух!. - Запорожье: Днепровский металлург, 2007
.Кондратьев А.С. Задачи по термодинамике, статистической физике и кинетической теории. - М.: ФИЗМАТЛИТ, 2007
.Сивухин Д.В. Общий курс физики. - М.: Физматлит, 2006
.Братухин Э.Н. Физическая вселенная. Вариант второй (гипотеза). - М.: Антиква, 2004

Комментарии:

Вы не можете оставлять комментарии. Пожалуйста, зарегистрируйтесь.