Лекция: Теория вероятностей и математическая статистика

В основу текстов лекций положен семестровый курс теории вероятностей и математической статистики, читаемый авторами в течение ряда лет в Ташкенстком автомобильно-дорожном институте.


Дата добавления на сайт: 19 февраля 2025
Министерство высшего и среднего специального образования Республики Узбекистан
Ташкенсткий автомобильно-дорожный институт
Кафедра "Высшая математика"

Тексты лекций
Теория вероятностей и математическая статистика

М.У. Гафуров,
Р.Х. Кенджаев,
Ф.М. Закиров

Ташкент 2007
М.У. Гафуров, Р.Х. Кенджаев, Ф.М. Закиров
Теория вероятностей и математическая статистика. 2007 г. -124 стр.
В основу текстов лекций положен семестровый курс теории вероятностей и математической статистики, читаемый авторами в течение ряда лет в Ташкенстком автомобильно-дорожном институте. В сборнике основные понятия и факты теории вероятностей и математической статистики первоначально вводятся для конечных схем. Далее утверждения и формулы легко переводятся на общий случай. Приведенные теоретические материалы проиллюстрированы большим числом примеров прикладного содержания. вероятность выборка числовой корреляционный
В сборнике лекций содержатся следующие разделы: пространство случайных событий, случайные величины и их числовые характеристики, предельные теоремы, элементы выборочного пространства, точечное и интервальное статистическое оценивание, элементы корреляционного и регрессионного анализа, а также проверка статистических гипотез.
Настоящий сборник рассчитан для студентов экономических специальностей высших экономических и технических учебных заведений, а также для всех заинтересованных в освоении вероятностных методов решения практических задач.
Рецензенты: А.А. Абдушукуров - заведующий кафедрой "Теория вероятностей и математическая статистика" Национального Университета Узбекистана, доктор физико-математических наук,
Х. Валиджанов - доцент кафедры "Высшая математика" Ташкенсткого автомобильно-дорожного института, кандидат физико-математических наук
Утверждено на заседании Научно-методического совета естественных и инженерных наук ТАДИ (протокол №7 от 21 февраля 2007 года).

Оглавление

1. Предмет теории вероятностей и ее значение для решения экономических, технических задач. Вероятность и ее определение
. Операции над событиями. Условная вероятность
. Теоремы сложения и умножения вероятностей. Формулы полной вероятности и Байеса
. Последовательность независимых испытаний. Локальная и интегральная теоремы Лапласа
. Дискретные случайные величины. Закон распределения. Виды дискретных распределений
. Числовые характеристики дискретных случайных величин и их свойства
. Функции распределения и плотности непрерывных случайных величин, их свойства
. Числовые характеристики непрерывных случайных величин. Виды непрерывных распределений
. Закон больших чисел и его практическое значение. Понятие о центральной предельной теореме
. Предмет и основные задачи математической статистики. Выборка
. Статистическое распределение выборки. Эмпирическая функция распределения. Полигон и гистограмма
. Статистическая оценка. Требования, предъявляемые к статистической оценке. Выборочное среднее и выборочная дисперсия
. Интервальные оценки. Доверительный интервал. Доверительные интервалы для неизвестных параметров нормального распределения
. Элементы корреляционного и регрессионного анализа
. Выборочный коэффициент корреляции и его свойства
. Статистические гипотезы и их классификация. Статистический критерий
. Критерии согласия
Список литературы
1. Предмет теории вероятностей и ее значение для решения экономических, технических задач. Вероятность и ее определение

На протяжении длительного времени человечество изучало и использовало для своей деятельности лишь так называемые детерминистические закономерности. Однако, поскольку случайные события врываются в нашу жизнь помимо нашего желания и постоянно окружают нас, и более того, поскольку почти все явления природы имеют случайный характер, необходимо научиться их изучать и разработать для этой цели методы изучения.
По форме проявления причинных связей законы природы и общества делятся на два класса: детерминированные (предопределенные) и статистические.
Например, на основании законов небесной механики по известному в настоящем положению планет Солнечной системы может быть практически однозначно предсказано их положение в любой наперед заданный момент времени, в том числе очень точно могут быть предсказаны солнечные и лунные затмения. Это пример детерминированных законов.
Вместе с тем не все явления поддаются точному предсказанию. Так, долговременные изменения климата, кратковременные изменения погоды не являются объектами для успешного прогнозирования, т.е. многие законы и закономерности гораздо менее вписываются в детерминированные рамки. Такого рода законы называются статистическими. Согласно этим законам, будущее состояние системы определяется не однозначно, а лишь с некоторой вероятностью.
Теория вероятностей, как и другие математические науки, возродилась и развилась из потребностей практики. Она занимается изучением закономерностей, присущих массовым случайным событиям.
Теория вероятностей изучает свойства массовых случайных событий, способных многократно повторяться при воспроизведении определенного комплекса условий. Основное свойство любого случайного события, независимо от его природы, - мера, или вероятность его осуществления.
Наблюдаемые нами события (явления) можно подразделить на три вида: достоверные, невозможные и случайные.
Достоверным называют событие, которое обязательно произойдет. Невозможным называют событие, которое заведомо не произойдет. Случайным называют событие, которое может либо произойти, либо не произойти.
Теория вероятностей не ставит перед собой задачу предсказать, произойдет единичное событие или нет, так как невозможно учесть влияние на случайное событие всех причин. С другой стороны, оказывается, что достаточно большое число однородных случайных событий, независимо от их конкретной природы, подчиняется определенным закономерностям, а именно - вероятностным закономерностям.
Итак, предметом теории вероятностей является изучение вероятностных закономерностей массовых однородных случайных событий.
Некоторые задачи, относящиеся к массовым случайным явлениям, пытались решать, используя соответствующий математический аппарат, еще в начале ХVII в. Изучая ход и результаты различных азартных игр, Б. Паскаль, П. Ферма и Х. Гюйгенс в середине XVII века заложили основы классической теории вероятностей. В своих работах они неявно использовали понятия вероятности и математического ожидания случайной величины. Только в начале XVIII в. Я. Бернулли формулирует понятие вероятности.
Дальнейшими успехами теория вероятностей обязана Муавру, Лапласу, Гауссу, Пуассону и др.
В развитие теории вероятностей огромный вклад внесли русские и советские математики, такие как П.Л. Чебышев, А.А. Марков, А.М. Ляпунов, С.Н. Бернштейн, А.Н. Колмогоров, А.Я. Хинчин, А. Прохоров и др.
Особое место в развитии теории вероятностей принадлежит и узбекистанской школе, яркими представителями которой являются академики В.И. Романовский, С.Х. Сираждинов, Т.А. Сарымсаков, Т.А. Азларов, Ш.К. Фарманов, профессора И.С. Бадалбаев, М.У. Гафуров, Ш.А. Хашимов и др.
Как уже было отмечено, потребности практики, способствовав зарождению теории вероятностей, питали ее развитие как науки, приводя к появлению все новых ее ветвей и разделов. На теорию вероятностей опирается математическая статистика, задача которой состоит в том, чтобы по выборке восстановить с определенной степенью достоверности характеристики, присущие генеральной совокупности. От теории вероятностей отделились такие отрасли науки, как теория случайных процессов, теория массового обслуживания, теория информации, теория надежности, эконометрическое моделирование и др.
В качестве важнейших сфер приложения теории вероятностей можно указать экономические, технические науки. В настоящее время трудно себе представить исследование экономико-технических явлений без моделирований, опирающихся на теорию вероятностей, без моделей корреляционного и регрессионного анализа, адекватности и "чувствительных" адаптивных моделей.
События, происходящие в автомобильных потоках, степень надежности составных частей машин, автокатастрофы на дорогах, различные ситуации в процессе проектирования дорог ввиду их недетерминированности входят в круг проблем, исследуемых посредством методов теории вероятностей.
Основные понятия теории вероятностей - это опыт или эксперимент и события. Действия, которые осуществляются при определенных условиях и обстоятельствах, мы назовем экспериментом. Каждое конкретное осуществление эксперимента называется испытанием.
Всякий мыслимый результат эксперимента называется элементарным событием и обозначается через Теория вероятностей и <a href=математическая статистика (рис. 1)' title='Теория вероятностей и математическая статистика (рис. 1)' />. Случайные события состоят из некоторого числа элементарных событий и обозначаются через A, B, C, D,...
Множество элементарных событий таких, что
) в результате проведения эксперимента всегда происходит одно из элементарных событий Теория вероятностей и математическая статистика (рис. 2);
) при одном испытании произойдет только одно элементарное событие Теория вероятностей и математическая статистика (рис. 3) называется пространством элементарных событий и обозначается через Теория вероятностей и математическая статистика (рис. 4).
Таким образом, любое случайное событие является подмножеством пространства элементарных событий. По определению пространства элементарных событий достоверное событие можно обозначить через Теория вероятностей и математическая статистика (рис. 5). Невозможное событие обозначается через Теория вероятностей и математическая статистика (рис. 6).
Пример 1. Бросается игральная кость. Пространство элементарных событий, отвечающее данному эксперименту, имеет следующий вид:

Теория вероятностей и математическая статистика (рис. 7).

Пример 2. Пусть в урне содержатся 2 красных, 3 синих и 1 белый, всего 6 шаров. Эксперимент состоит в том, что из урны вынимаются наудачу шары. Пространство элементарных событий, отвечающее данному эксперименту, имеет следующий вид:

Теория вероятностей и математическая статистика (рис. 8),

где элементарные события имеют следующие значения: Теория вероятностей и математическая статистика (рис. 9) - появился белый шар; Теория вероятностей и математическая статистика (рис. 10) - появился красный шар; Теория вероятностей и математическая статистика (рис. 11) - появился синий шар. Рассмотрим следующие события:
А - появление белого шара;
В - появление красного шара;
С - появление синего шара;- появление цветного (небелого) шара.
Здесь мы видим, что каждое из этих событий обладает той или иной степенью возможности: одни - большей, другие - меньшей. Очевидно, что степень возможности события В больше, чем события А; события С - чем события В; события D - чем события С. Чтобы количественно сравнивать между собой события по степени их возможности, очевидно, нужно с каждым событием связать определенное число, которое тем больше, чем более возможно событие.
Это число обозначим через Теория вероятностей и математическая статистика (рис. 12) и назовем вероятностью события А. Дадим теперь определение вероятности.
Пусть пространство элементарных событий Теория вероятностей и математическая статистика (рис. 13) является конечным множеством и элементы его суть Теория вероятностей и математическая статистика (рис. 14). Будем считать, что они являются равновозможными элементарными событиями, т.е. каждое элементарное событие не имеет больше шансов появления, чем другие. Как известно, каждое случайное событие А состоит из элементарных событий как подмножество Теория вероятностей и математическая статистика (рис. 15). Эти элементарные события называются благоприятствующими для А.
Вероятность события А определяется формулой

Теория вероятностей и математическая статистика (рис. 16), (1.1)

где m - число благоприятствующих элементарных событий для А, n - число всех элементарных событий, входящих в Теория вероятностей и математическая статистика (рис. 17).
Если в примере 1 через А обозначить событие, состоящее в том, что выпадет четное число очков, то

Теория вероятностей и математическая статистика (рис. 18).
В примере 2 вероятности событий имеют следующие значения:

Теория вероятностей и математическая статистика (рис. 19); Теория вероятностей и математическая статистика (рис. 20); Теория вероятностей и математическая статистика (рис. 21); Теория вероятностей и математическая статистика (рис. 22).

Из определения вероятности вытекают следующие ее свойства:
. Вероятность достоверного события равна единице.
Действительно, если событие достоверно, то все элементарные события благоприятствуют ему. В этом случае m=n и, следовательно,

Теория вероятностей и математическая статистика (рис. 23).

. Вероятность невозможного события равна нулю.
Действительно, если событие невозможно, то ни одно элементарное событие не благоприятствует ему. В этом случае m=0 и, следовательно,

Теория вероятностей и математическая статистика (рис. 24).

. Вероятность случайного события есть положительное число, заключенное между нулем и единицей.
Действительно, случайному событию благоприятствует лишь часть из общего числа элементарных событий. В этом случае Теория вероятностей и математическая статистика (рис. 25), а значит, Теория вероятностей и математическая статистика (рис. 26) и, следовательно,

Теория вероятностей и математическая статистика (рис. 27).

Итак, вероятность любого события удовлетворяет неравенствам

Теория вероятностей и математическая статистика (рис. 28). (1.2)

Относительной частотой события называют отношение числа испытаний, в которых событие появилось, к общему числу фактически произведенных испытаний.
Таким образом, относительная частота события А определяется формулой

Теория вероятностей и математическая статистика (рис. 29), (1.3)

где т - число появлений события, п - общее число испытаний.
Сопоставляя определения вероятности и относительной частоты, заключаем: определение вероятности не требует, чтобы испытания производились в действительности; определение же относительной частоты предполагает, что испытания были произведены фактически.
Пример 3. Из 80 случайно отобранных одинаковых деталей выявлено 3 бракованных. Относительная частота бракованных деталей равна

Теория вероятностей и математическая статистика (рис. 30).

Пример 4. В течение года на одном из объектов было проведено 24 проверки, причем было зарегистрировано 19 нарушений законодательства. Относительная частота нарушений законодательства равна

Теория вероятностей и математическая статистика (рис. 31).
Длительные наблюдения показали, что если в одинаковых условиях производятся опыты, в каждом из которых число испытаний достаточно велико, то относительная частота изменяется мало (тем меньше, чем больше произведено испытаний), колеблясь около некоторого постоянного числа. Оказалось, что это постоянное число есть вероятность появления события.
Таким образом, если опытным путем установлена относительная частота, то полученное число можно принять за приближенное значение вероятности. Это есть статистическое определение вероятности.
В заключении рассмотрим геометрическое определение вероятности.
Если пространство элементарных событий Теория вероятностей и математическая статистика (рис. 32) рассматривать как некоторую область на плоскости или в пространстве, а А как ее подмножество, то вероятность события А будет рассматриваться как отношение площадей или объемов А и Теория вероятностей и математическая статистика (рис. 33), и находиться по следующим формулам:

Теория вероятностей и математическая статистика (рис. 34), (1.4)
Теория вероятностей и математическая статистика (рис. 35). (1.5)

Вопросы для повторения и контроля:
1.На какие классы делятся законы природы и общества по форме проявления причинных связей?
2.На какие виды можно подразделить события?
.Что является предметом теории вероятностей?
.Что вы знаете об истории развития теории вероятностей?
.Каково значение теории вероятностей для экономических, технических задач?
.Что такое эксперимент, испытание, элементарное событие и событие, как они обозначаются?
.Что называется пространством элементарных событий?
.Как определяется вероятность события?
.Какие свойства вероятности вы знаете?
10.Что вы знаете об относительной частоте события?
11.В чем сущность статистического определения вероятности?
12.Каково геометрическое определение вероятности?

. Операции над событиями. Условная вероятность

Часто возникает вопрос: насколько связаны два случайных события А и В друг с другом, в какой мере наступление одного из них влияет на возможность наступления другого?
В качестве примера связи между двумя событиями можно привести случаи, когда наступление одного из событий ведет к обязательному осуществлению другого или же, наоборот, когда наступление одного события исключает шансы другого.
Если в результате эксперимента события А и В не могут наступить одновременно, то они называются несовместными событиями, в противном случае совместными.
Пример 1. Из ящика с деталями наудачу извлечена деталь. То, что она стандартна, исключает ее нестандартность. События "Наудачу извлеченная деталь стандартна" и "Наудачу извлеченная деталь нестандартна" - несовместные.
Если события рассматривать как подмножества пространства элементарных событий, то отношения между событиями можно интерпретировать как соотношения между множествами. Несовместные события - это такие события, которые не содержат общих элементарных событий.
Говорят, что событие А влечет за собой событие В, если в результате эксперимента из наступления события А обязательно следует наступление события В, и обозначают это через Теория вероятностей и математическая статистика (рис. 36). Если Теория вероятностей и математическая статистика (рис. 37) и Теория вероятностей и математическая статистика (рис. 38), то Теория вероятностей и математическая статистика (рис. 39).
Пример 2. Бросается игральная кость. Событие "выпало 4" влечет за собой событие "выпало четное число очков".
Суммой двух событий А и В называют событие, состоящее в наступлении события А или события В, или обоих этих событий. Оно обозначается через А+В или Теория вероятностей и математическая статистика (рис. 40). Суммой нескольких событий называют событие, которое состоит в наступлении хотя бы одного из этих событий.
Пример 3. Из орудия производится два выстрела. Если А - попадание при первом выстреле, а В - попадание при втором выстреле, то А+В - попадание при первом выстреле, или при втором, или в обоих выстрелах.
Произведением двух событий А и В называют событие, состоящее в совместном наступлении событий А и В. Оно обозначается через АВ или Теория вероятностей и математическая статистика (рис. 41). Произведением нескольких событий называют событие, состоящее в совместном наступлении всех этих событий.
Пример 4. В ящике содержатся детали, изготовленные заводами №1 и №2. Если А - появление стандартной детали, а В - деталь изготовлена заводом №1, то АВ - появление стандартной детали завода №1.
Противоположное событие для события А обозначается через Теория вероятностей и математическая статистика (рис. 42). Оно считается наступившим тогда и только тогда, когда А не наступает. Иными словами, А и Теория вероятностей и математическая статистика (рис. 43) - это такие несовместные события, которые вместе образуют достоверное событие, т.е.

Теория вероятностей и математическая статистика (рис. 44).

Пример 5. Попадание и промах при выстреле по цели - противоположные события. Если А - попадание, то Теория вероятностей и математическая статистика (рис. 45) - промах.
Событие, которое представляет собой наступление события А и не наступление события В, называется разностью событий А и В, и обозначается через A\В.
Два события называют независимыми, если вероятность одного из них не зависит от наступления или ненаступления другого. В противном случае эти события называются зависимыми.
Пример 6. Монета брошена 2 раза. Вероятность появления герба при первом бросании (событие А) не зависит от появления герба при втором бросании (событие В). В свою очередь, вероятность выпадения герба при втором бросании не зависит от результата первого бросания. Таким образом, события А и В - независимы.
Несколько событий называют попарно независимыми, если любые два из них взаимно независимы.
Пусть А и В - два случайных события, причем Теория вероятностей и математическая статистика (рис. 46). Из определения зависимых событий следует, что вероятность одного из событий зависит от наступления или ненаступления другого. Поэтому, если нас интересует вероятность события А, то важно знать, наступило ли событие В.
Вероятность события А при условии, что произошло событие В, называется условной вероятностью и обозначается через Теория вероятностей и математическая статистика (рис. 47).
Пример 7. В урне содержится 3 белых и 3 черных шара. Из урны дважды вынимают наудачу по одному шару, не возвращая их в урну. Найти вероятность появления белого шара при втором испытании (событие А), если при первом испытании был извлечен черный шар (событие В).
Решение. После первого испытания в урне осталось всего 5 шаров, из них 3 белых. Искомая условная вероятность равна

Теория вероятностей и математическая статистика (рис. 48).

Выведем теперь формулу условной вероятности. Пусть событиям А и В благоприятствуют соответственно m и k элементарных событий из n; тогда, согласно (1.1), их безусловные вероятности равны Теория вероятностей и математическая статистика (рис. 49) и Теория вероятностей и математическая статистика (рис. 50) соответственно. Пусть событию А при условии, что событие В произошло, благоприятствуют r элементарных событий, тогда, согласно (1.1), условная вероятность события А равна

Теория вероятностей и математическая статистика (рис. 51).

Разделив и числитель, и знаменатель на n, получим формулу условной вероятности

Теория вероятностей и математическая статистика (рис. 52)

Или

Теория вероятностей и математическая статистика (рис. 53). (2.1)

поскольку событию АВ соответствуют r элементарных событий и, следовательно, Теория вероятностей и математическая статистика (рис. 54) - его безусловная вероятность.
Вопросы для повторения и контроля:
1.Какие события называются несовместными, а какие совместными?
2.Что означает выражение "событие А влечет за собой событие В" и как оно обозначается?
.Что называется суммой событий и как оно обозначается?
.Что называется произведением событий и как оно обозначается?
.Что такое противоположное событие и как оно обозначается?
.Что называется разностью событий и как оно обозначается?
.Какие события называются независимыми, а какие зависимыми?
.Что такое условная вероятность и какова ее формула?

. Теоремы сложения и умножения вероятностей. Формулы полной вероятности и Байеса

Пусть события А и В - несовместные, причем вероятности этих событий даны. Как найти вероятность того, что наступит либо событие А, либо событие В, т.е. вероятность суммы этих событий А+В? Ответ на этот вопрос дает следующая теорема.
Теорема 3.1 (сложения вероятностей несовместных событий). Вероятность суммы двух несовместных событий равна сумме вероятностей этих событий:

Теория вероятностей и математическая статистика (рис. 55). (3.1)

Доказательство. Введем обозначения:
Теория вероятностей и математическая статистика (рис. 56) - общее число элементарных событий;
Теория вероятностей и математическая статистика (рис. 57) - число элементарных событий, благоприятствующих событию А;
Теория вероятностей и математическая статистика (рис. 58) - число элементарных событий, благоприятствующих событию В.
Число элементарных событий, благоприятствующих наступлению либо события А, либо события В, равно Теория вероятностей и математическая статистика (рис. 59). Следовательно,

Теория вероятностей и математическая статистика (рис. 60).

Приняв во внимание, что Теория вероятностей и математическая статистика (рис. 61) и Теория вероятностей и математическая статистика (рис. 62), окончательно получим

Теория вероятностей и математическая статистика (рис. 63).

Следствие 3.1. Вероятность суммы нескольких несовместных событий равна сумме вероятностей этих событий:

Теория вероятностей и математическая статистика (рис. 64). (3.2)

Пример 1. В урне 30 шаров: 10 красных, 5 синих и 15 белых. Найти вероятность появления цветного шара.
Решение. Появление цветного шара означает появление либо красного, либо синего шара.
Вероятность появления красного шара (событие А)

Теория вероятностей и математическая статистика (рис. 65).

Вероятность появления синего шара (событие В)

Теория вероятностей и математическая статистика (рис. 66).

События А и В несовместны (появление шара одного цвета исключает появление шара другого цвета), поэтому искомая вероятность равна

Теория вероятностей и математическая статистика (рис. 67).

Так как противоположные события вместе образуют достоверное событие, то из теоремы 3.1 вытекает, что

Теория вероятностей и математическая статистика (рис. 68),

поэтому

Теория вероятностей и математическая статистика (рис. 69). (3.3)

Пример 2. Вероятность того, что день будет дождливым, равна Теория вероятностей и математическая статистика (рис. 70). Найти вероятность того, что день будет ясным.
Решение. События "день дождливый" и "день ясный" - противоположные, поэтому искомая вероятность равна

Теория вероятностей и математическая статистика (рис. 71).

Из формулы (2.1) получаем следующую теорему.
Теорема 3.2 (умножения вероятностей зависимых событий). Вероятность произведения двух зависимых событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную в предположении, что первое событие уже наступило:

Теория вероятностей и математическая статистика (рис. 72). (3.4)

Пример 3. У сборщика имеется 3 конусных и 7 эллиптических валиков. Сборщик наудачу взял один валик, а затем второй. Найти вероятность того, что первый из взятых валиков - конусный, а второй - эллиптический.
Решение.
Вероятность того, что первый из взятых валиков окажется конусным (событие В), равна

Теория вероятностей и математическая статистика (рис. 73).

Условная вероятность того, что второй из валиков окажется эллиптическим (событие А), вычисленная в предположении, что первый валик - конусный, равна

Теория вероятностей и математическая статистика (рис. 74).

Тогда по формуле (3.4) искомая вероятность равна

Теория вероятностей и математическая статистика (рис. 75).

Теперь перейдем к случаю, когда события А и В - независимые, и найдем вероятность произведения этих событий.
Так как событие А не зависит от события В, то его условная вероятность Теория вероятностей и математическая статистика (рис. 76) равна его безусловной вероятности Теория вероятностей и математическая статистика (рис. 77), т.е.

Теория вероятностей и математическая статистика (рис. 78).

Отсюда вытекает следующая теорема.
Теорема 3.3 (умножения вероятностей независимых событий). Вероятность произведения двух независимых событий равна произведению вероятностей этих событий:

Теория вероятностей и математическая статистика (рис. 79). (3.5)

Следствие 3.2. Вероятность произведения нескольких независимых событий равна произведению вероятностей этих событий:

Теория вероятностей и математическая статистика (рис. 80).

Пример 4. Имеется 3 ящика, содержащих по 10 деталей. В первом ящике 8, во втором 7 и в третьем 9 стандартных деталей. Из каждого ящика наудачу вынимают по одной детали. Найти вероятность того, что все три вынутые детали окажутся стандартными.
Решение. Вероятность того, что из первого ящика вынута стандартная деталь (событие А), равна

Теория вероятностей и математическая статистика (рис. 81).

Вероятность того, что из второго ящика вынута стандартная деталь (событие В), равна

Теория вероятностей и математическая статистика (рис. 82).

Вероятность того, что из третьего ящика вынута стандартная деталь (событие С), равна

Теория вероятностей и математическая статистика (рис. 83).

Так как события А, В и С - независимые, то искомая вероятность по теореме умножения вероятностей независимых событий равна

Теория вероятностей и математическая статистика (рис. 84).

Теперь перейдем к случаю, когда события А и В - совместные, и найдем вероятность суммы этих событий.
Теорема 3.4 (сложения вероятностей совместных событий). Вероятность суммы двух совместных событий равна сумме вероятностей этих событий с вычетом вероятности их произведения:

Теория вероятностей и математическая статистика (рис. 85). (3.6)

Пример 5. Вероятности попадания в цель при стрельбе первого и второго орудий соответственно равны: Теория вероятностей и математическая статистика (рис. 86); Теория вероятностей и математическая статистика (рис. 87). Найти вероятность попадания при одном залпе (из обоих орудий) хотя бы одним из орудий.
Решение. Вероятность попадания в цель каждым из орудий не зависит от результата стрельбы из другого орудия, поэтому события А (попадание первого орудия) и В (попадание второго орудия) независимы.
Вероятность события АВ (оба орудия дали попадание), равна

Теория вероятностей и математическая статистика (рис. 88).

Искомая вероятность равна

Теория вероятностей и математическая статистика (рис. 89).

Если независимые события Теория вероятностей и математическая статистика (рис. 90) вместе образуют достоверное событие, то вероятность появления хотя бы одного из этих событий можно найти по формуле

Теория вероятностей и математическая статистика (рис. 91) (3.7)

Пример 6. В типографии имеются 4 машины. Для каждой машины вероятность того, что она работает в данный момент, равна 0,9. Найти вероятность того, что в данный момент работает хотя бы одна машина (событие А).
Решение. Вероятность того, что машина в данный момент не работает, равна

Теория вероятностей и математическая статистика (рис. 92).

Тогда искомая вероятность равна

Теория вероятностей и математическая статистика (рис. 93).

Говорят, что события Теория вероятностей и математическая статистика (рис. 94) образуют полную группу событий, если они несовместны и вместе образуют достоверное событие, т.е. Теория вероятностей и математическая статистика (рис. 95), Теория вероятностей и математическая статистика (рис. 96); Теория вероятностей и математическая статистика (рис. 97).
Предположим, что событие А может наступить только при условии появления одного из событий Теория вероятностей и математическая статистика (рис. 98), образующих полную группу, которые назовем гипотезами. Пусть известны вероятности этих событий и условные вероятности Теория вероятностей и математическая статистика (рис. 99), Теория вероятностей и математическая статистика (рис. 100).
Так как Теория вероятностей и математическая статистика (рис. 101), то

Теория вероятностей и математическая статистика (рис. 102).

Из несовместности Теория вероятностей и математическая статистика (рис. 103) вытекает несовместность событий Теория вероятностей и математическая статистика (рис. 104).
Применяя формулу (3.1), имеем

Теория вероятностей и математическая статистика (рис. 105).

Согласно формуле (3.4) (так как события Теория вероятностей и математическая статистика (рис. 106) могут быть и зависимыми), заменив каждое слагаемое Теория вероятностей и математическая статистика (рис. 107) в правой части последнего выражения произведением Теория вероятностей и математическая статистика (рис. 108), получим формулу полной вероятности

Теория вероятностей и математическая статистика (рис. 109). (3.8)

Пример 7. Имеется два набора деталей. Вероятность того, что деталь первого набора стандартна, равна 0,8, а второго - 0,9. Найти вероятность того, что взятая наудачу деталь из наудачу взятого набора - стандартная.
Решение. Обозначим через А событие "извлеченная деталь стандартна". Деталь может быть извлечена либо из первого набора (событие Теория вероятностей и математическая статистика (рис. 110)), либо из второго набора (событие Теория вероятностей и математическая статистика (рис. 111)).
Вероятность того, что деталь будет вынута из первого набора, равна

Теория вероятностей и математическая статистика (рис. 112).
Вероятность того, что деталь будет вынута из второго набора, равна

Теория вероятностей и математическая статистика (рис. 113).

По условиям задачи Теория вероятностей и математическая статистика (рис. 114) и Теория вероятностей и математическая статистика (рис. 115).
Тогда искомая вероятность находится по формуле полной вероятности и равна

Теория вероятностей и математическая статистика (рис. 116).

Пусть теперь для тех же событий, что и при выводе формулы полной вероятности, появилось событие А, и ставится задача отыскать условные вероятности гипотез Теория вероятностей и математическая статистика (рис. 117), Теория вероятностей и математическая статистика (рис. 118).
Из формулы (2.1) имеем

Теория вероятностей и математическая статистика (рис. 119).

Далее, из формулы (3.4) получаем

Теория вероятностей и математическая статистика (рис. 120).

Отсюда и из предыдущего соотношения, применяя формулу полной вероятности, выводим формулу Байеса:

Теория вероятностей и математическая статистика (рис. 121) (3.9)
Пример 8. Детали, изготовляемые цехом завода, попадают для проверки их на стандартность к одному из двух контролеров. Вероятность того, что деталь попадет к первому контролеру, равна 0,6, а ко второму - 0,4. Вероятность того, что годная деталь будет признана стандартной первым контролером, равна 0,94, а вторым - 0,98. Годная деталь при проверке была признана стандартной. Найти вероятность того, что эту деталь проверил первый контролер.
Решение. Обозначим через А событие, состоящее в том, что годная деталь признана стандартной. Можно сделать два предположения:
)деталь проверил первый контролер (гипотеза Теория вероятностей и математическая статистика (рис. 122));
)деталь проверил второй контролер (гипотеза Теория вероятностей и математическая статистика (рис. 123)).
По условиям задачи имеем:
Теория вероятностей и математическая статистика (рис. 124) (вероятность того, что деталь попадет к первому контролеру);
Теория вероятностей и математическая статистика (рис. 125) (вероятность того, что деталь попадет ко второму контролеру);
Теория вероятностей и математическая статистика (рис. 126) (вероятность того, что годная деталь будет признана стандартной первым контролером);
Теория вероятностей и математическая статистика (рис. 127) (вероятность того, что годная деталь будет признана стандартной вторым контролером).
Искомую вероятность найдем по формуле Байеса

Теория вероятностей и математическая статистика (рис. 128)
Теория вероятностей и математическая статистика (рис. 129).

Вопросы для повторения и контроля:
1.О чем теорема сложения вероятностей несовместных событий и каково ее доказательство?
2.Чему равна вероятность противоположного события?
.О чем идет речь в теоремах умножения вероятностей зависимых и независимых событий?
.О чем теорема сложения вероятностей совместных событий?
.Как можно найти вероятность появления хотя бы одного события?
.Какие события образуют полную группу событий?
.Что такое формула полной вероятности и как она выводится?
.Что такое формула Байеса и как она выводится?
Опорные слова:
Вероятность суммы несовместных событий, вероятность противоположного события, вероятность произведения зависимых событий, вероятность произведения независимых событий, вероятность суммы несовместных событий, вероятность появления хотя бы одного события, полная группа событий, гипотезы, формула полной вероятности, формула Байеса.

. Последовательность независимых испытаний. Локальная и интегральная теоремы Лапласа

Пусть производится n независимых испытаний, в каждом из которых событие А может либо произойти (успех), либо не произойти (неудача). Будем считать, что вероятность события А в каждом испытании одна и та же, а именно равна р.
Следовательно, вероятность ненаступления события А в каждом испытании также постоянна и равна q=1-p. Такая последовательность испытаний называется схемой Бернулли.
В качестве таких испытаний можно рассматривать, например, производство изделий на определенном оборудовании при постоянстве технологических и организационных условий, в этом случае изготовление годного изделия - успех, бракованного - неудача.
Эта ситуация соответствует схеме Бернулли, если считать, что процесс изготовления одного изделия не зависит от того, были годными или бракованными предыдущие изделия.
Другим примером является стрельба по мишени.
Здесь попадание - успех, промах - неудача.
Поставим своей задачей вычислить вероятность того, что при n испытаниях событие А осуществится ровно k раз и, следовательно, не осуществится n-k раз, т.е. будет k успехов и n-k неудач.
Искомую вероятность обозначим Теория вероятностей и математическая статистика (рис. 130). Например, символ Теория вероятностей и математическая статистика (рис. 131) означает вероятность того, что в пяти испытаниях событие появится ровно 3 раза и, следовательно, не наступит 2 раза.
Последовательность п независимых испытаний можно рассматривать как сложное событие, являющееся произведением п независимых событий. Следовательно, вероятность того, что в п испытаниях событие А наступит k раз и не наступит n-k раз, по теореме 3.3 умножения вероятностей независимых событий, равна

Теория вероятностей и математическая статистика (рис. 132).

Таких сложных событий может быть столько, сколько можно составить сочетаний из п элементов по k элементов, т.е. Теория вероятностей и математическая статистика (рис. 133).
Так как эти сложные события несовместны, то по теореме 3.1 сложения вероятностей несовместных событий, искомая вероятность равна сумме вероятностей всех возможных сложных событий.
Поскольку же вероятности всех этих сложных событий одинаковы, то искомая вероятность (появление k раз события А в п испытаниях) равна вероятности одного сложного события, умноженной на их число

Теория вероятностей и математическая статистика (рис. 134)

Или

Теория вероятностей и математическая статистика (рис. 135) (4.1)

Полученную формулу называют формулой Бернулли.
Пример 1. Вероятность того, что расход электроэнергии на продолжении одних суток не превысит установленной нормы, равна Теория вероятностей и математическая статистика (рис. 136). Найти вероятность того, что в течение 4 суток из ближайших 6 суток расход электроэнергии не превысит нормы.
Решение. Вероятность нормального расхода электроэнергии на продолжении каждых из 6 суток постоянна и равна Теория вероятностей и математическая статистика (рис. 137). Следовательно, вероятность перерасхода электроэнергии в каждые сутки также постоянна и равна

Теория вероятностей и математическая статистика (рис. 138).

Искомая вероятность по формуле Бернулли равна

Теория вероятностей и математическая статистика (рис. 139).

В ряде задач представляет интерес наивероятнейшее число успехов, т.е. такое число Теория вероятностей и математическая статистика (рис. 140) успехов, вероятность которого самая большая среди вероятностей (4.1). Так как при увеличении k вероятности (4.1) сначала возрастают, а затем, с определенного момента, начинают убывать, то для Теория вероятностей и математическая статистика (рис. 141) должны иметь место соотношения

Теория вероятностей и математическая статистика (рис. 142) (4.2)

И

Теория вероятностей и математическая статистика (рис. 143). (4.3)

Используя формулу (4.1) и соотношение Теория вероятностей и математическая статистика (рис. 144), из (4.2) и (4.3) получаем соответственно неравенства

Теория вероятностей и математическая статистика (рис. 145) (4.4)

И

Теория вероятностей и математическая статистика (рис. 146). (4.5)

Окончательно получаем, что Теория вероятностей и математическая статистика (рис. 147) лежит в интервале единичной длины:

Теория вероятностей и математическая статистика (рис. 148). (4.6)

Однако, стоит заметить, что использование формулы Бернулли при больших значениях п достаточно трудно, так как формула требует выполнения действий над громадными числами.
Например, если Теория вероятностей и математическая статистика (рис. 149), Теория вероятностей и математическая статистика (рис. 150), Теория вероятностей и математическая статистика (рис. 151), то для отыскания вероятности Теория вероятностей и математическая статистика (рис. 152) надо вычислить выражение
Теория вероятностей и математическая статистика (рис. 153), где Теория вероятностей и математическая статистика (рис. 154), Теория вероятностей и математическая статистика (рис. 155), Теория вероятностей и математическая статистика (рис. 156).

Естественно возникает вопрос: нельзя ли вычислить интересующую нас вероятность, не прибегая к формуле Бернулли? Оказывается можно. Локальная теорема Лапласа и дает асимптотическую формулу, которая позволяет приближенно найти вероятность появления события ровно k раз в n испытаниях, если число испытаний достаточно велико.
Локальная теорема Лапласа. Если вероятность р появления события А в каждом испытании постоянна и отлична от нуля и единицы, то вероятность Теория вероятностей и математическая статистика (рис. 157) того, что событие А появится в п испытаниях ровно k раз, приближенно равна (тем точнее, чем больше п) значению функции

Теория вероятностей и математическая статистика (рис. 158)
при Теория вероятностей и математическая статистика (рис. 159).

Имеются таблицы, в которых помещены значения функции Теория вероятностей и математическая статистика (рис. 160). При этом следует учитывать, что Теория вероятностей и математическая статистика (рис. 161), так как функция Теория вероятностей и математическая статистика (рис. 162) четна.
Итак, вероятность того, что событие А появится в п независимых испытаниях ровно k раз, приближенно равна

Теория вероятностей и математическая статистика (рис. 163), (4.7)
где Теория вероятностей и математическая статистика (рис. 164).

Пример 2. Найти вероятность того, что событие А наступит ровно 80 раз в 400 испытаниях, если вероятность появления этого события в каждом испытании равна 0,2.
Решение. По условию Теория вероятностей и математическая статистика (рис. 165); Теория вероятностей и математическая статистика (рис. 166); Теория вероятностей и математическая статистика (рис. 167); Теория вероятностей и математическая статистика (рис. 168). Воспользуемся формулой (4.7):

Теория вероятностей и математическая статистика (рис. 169).

Вычислим определяемое данными задачи значение х:

Теория вероятностей и математическая статистика (рис. 170).

По таблице находим Теория вероятностей и математическая статистика (рис. 171).
Искомая вероятность равна

Теория вероятностей и математическая статистика (рис. 172).

Формула Бернулли приводит примерно к такому же результату (выкладки, ввиду их громоздкости, опущены):

Теория вероятностей и математическая статистика (рис. 173).

Пусть теперь требуется вычислить вероятность Теория вероятностей и математическая статистика (рис. 174) того, что событие А появится в п испытаниях не менее Теория вероятностей и математическая статистика (рис. 175) и не более Теория вероятностей и математическая статистика (рис. 176) раз (для краткости будем говорить "от Теория вероятностей и математическая статистика (рис. 177) до Теория вероятностей и математическая статистика (рис. 178) раз"). Эта задача решается с помощью следующей теоремы.
Интегральная теорема Лапласа. Если вероятность р наступления события А в каждом испытании постоянна и отлична от нуля и единицы, то вероятность Теория вероятностей и математическая статистика (рис. 179) того, что событие А появится в п испытаниях от Теория вероятностей и математическая статистика (рис. 180) до Теория вероятностей и математическая статистика (рис. 181) раз, приближенно равна определенному интегралу

Теория вероятностей и математическая статистика (рис. 182), (4.8)
где Теория вероятностей и математическая статистика (рис. 183) и Теория вероятностей и математическая статистика (рис. 184).

При решении задач, требующих применения интегральной теоремы Лапласа, пользуются специальной таблицей для интеграла Теория вероятностей и математическая статистика (рис. 185). В таблице даны значения функции Теория вероятностей и математическая статистика (рис. 186) для Теория вероятностей и математическая статистика (рис. 187), а для Теория вероятностей и математическая статистика (рис. 188) воспользуемся нечетностью функции Теория вероятностей и математическая статистика (рис. 189), т.е. Теория вероятностей и математическая статистика (рис. 190). Функцию Теория вероятностей и математическая статистика (рис. 191) часто называют функцией Лапласа.
Итак, вероятность того, что событие А появится в п независимых испытаниях от Теория вероятностей и математическая статистика (рис. 192) до Теория вероятностей и математическая статистика (рис. 193) раз, равна

Теория вероятностей и математическая статистика (рис. 194), (4.9)
где Теория вероятностей и математическая статистика (рис. 195) и Теория вероятностей и математическая статистика (рис. 196).

Пример 3. Вероятность того, что организация не прошла проверку налоговой инспекции, равна Теория вероятностей и математическая статистика (рис. 197). Найти вероятность того, что среди 400 случайно отобранных организаций не прошедших проверку окажется от 70 до 100 организаций.
Решение. По условию Теория вероятностей и математическая статистика (рис. 198); Теория вероятностей и математическая статистика (рис. 199); Теория вероятностей и математическая статистика (рис. 200); Теория вероятностей и математическая статистика (рис. 201); Теория вероятностей и математическая статистика (рис. 202). Воспользуемся формулой (4.9):

Теория вероятностей и математическая статистика (рис. 203).

Вычислим нижний и верхний пределы интегрирования:

Теория вероятностей и математическая статистика (рис. 204);
Теория вероятностей и математическая статистика (рис. 205).

Таким образом, имеем

Теория вероятностей и математическая статистика (рис. 206).

По таблице значений функции Теория вероятностей и математическая статистика (рис. 207) находим

Теория вероятностей и математическая статистика (рис. 208); Теория вероятностей и математическая статистика (рис. 209).
Искомая вероятность равна

Теория вероятностей и математическая статистика (рис. 210).

В теме №1 было отмечено, что по статистическому определению вероятности в качестве вероятности можно взять относительную частоту, поэтому представляет интерес оценка разности между ними. Вероятность того, что отклонение относительной частоты Теория вероятностей и математическая статистика (рис. 211) от постоянной вероятности р по абсолютной величине не превышает заданного числа Теория вероятностей и математическая статистика (рис. 212), равна

Теория вероятностей и математическая статистика (рис. 213). (4.10)

Пример 4. Вероятность того, что деталь не стандартна, равна Теория вероятностей и математическая статистика (рис. 214). Найти вероятность того, что среди случайно отобранных 400 деталей относительная частота появления нестандартных деталей отклонится от вероятности Теория вероятностей и математическая статистика (рис. 215) по абсолютной величине не более, чем на 0,03.
Решение. По условию Теория вероятностей и математическая статистика (рис. 216); Теория вероятностей и математическая статистика (рис. 217); Теория вероятностей и математическая статистика (рис. 218); Теория вероятностей и математическая статистика (рис. 219).
Требуется найти вероятность Теория вероятностей и математическая статистика (рис. 220).
Пользуясь формулой (4.10), имеем

Теория вероятностей и математическая статистика (рис. 221).

По таблице находим Теория вероятностей и математическая статистика (рис. 222). Следовательно, Теория вероятностей и математическая статистика (рис. 223).
Итак, искомая вероятность приближенно равна 0,9544.
Смысл полученного результата таков: если взять достаточно большое число проб по 400 деталей в каждой, то примерно в 95,44% этих проб отклонение относительной частоты от постоянной вероятности Теория вероятностей и математическая статистика (рис. 224) по абсолютной величине не превысит 0,03.
Вопросы для повторения и контроля:
1.Что называется схемой Бернулли?
2.Как выводится формула Бернулли?
.Как находится наивероятнейшее число успехов?
.О чем идет речь в локальной теореме Лапласа?
.О чем идет речь в интегральной теореме Лапласа?
.Как находится вероятность отклонения относительной частоты от постоянной вероятности?
Опорные слова:
Последовательность независимых испытаний, схема Бернулли, формула Бернулли, наивероятнейшее число успехов, локальная теорема Лапласа, вероятность того, что событие А появится в п независимых испытаниях ровно k раз, интегральная теорема Лапласа, вероятность того, что событие А появится в п независимых испытаниях от Теория вероятностей и математическая статистика (рис. 225) до Теория вероятностей и математическая статистика (рис. 226) раз, функция Лапласа, вероятность отклонения относительной частоты от постоянной вероятности.

. Дискретные случайные величины. Закон распределения. Виды дискретных распределений

В предыдущих темах неоднократно приводились события, состоящие в появлении того или иного числа. Например, при бросании игральной кости могли появиться числа 1, 2, 3, 4, 5 и 6. Наперед определить число выпавших очков невозможно, поскольку оно зависит от многих случайных причин, которые полностью не могут быть учтены. В этом смысле число очков есть величина случайная; числа 1, 2, 3, 4, 5 и 6 есть возможные значения этой величины.
Случайной величиной называют величину, которая в результате испытания примет одно и только одно возможное значение, наперед не известное и зависящее от случайных причин, которые заранее не могут быть учтены.
Пример 1. Число родившихся мальчиков среди ста новорожденных есть случайная величина, которая имеет следующие возможные значения: 0, 1, 2, ... , 100.
Пример 2. Расстояние, которое пролетит снаряд при выстреле из орудия, есть случайная величина. Возможные значения этой величины принадлежат некоторому промежутку Теория вероятностей и математическая статистика (рис. 227).
Так как в результате испытаний происходят элементарные события, то можно связать понятия случайной величины и элементарных событий и дать другое определение случайной величины.
Случайной величиной называется функция Теория вероятностей и математическая статистика (рис. 228), определенная на пространстве элементарных событий Теория вероятностей и математическая статистика (рис. 229), Теория вероятностей и математическая статистика (рис. 230).
Пример 3. При подбрасывании двух монет число выпавших гербов Х есть случайная величина, которая может принимать значения 0, 1 и 2. Пространство элементарных событий состоит из следующих элементарных событий:

Теория вероятностей и математическая статистика (рис. 231), Теория вероятностей и математическая статистика (рис. 232), Теория вероятностей и математическая статистика (рис. 233), Теория вероятностей и математическая статистика (рис. 234).

Тогда Х принимает следующие значения:

Теория вероятностей и математическая статистика (рис. 235), Теория вероятностей и математическая статистика (рис. 236),
Теория вероятностей и математическая статистика (рис. 237), Теория вероятностей и математическая статистика (рис. 238).
Случайные величины обозначаются прописными латинскими буквами Теория вероятностей и математическая статистика (рис. 239), а их возможные значения - соответствующими строчными буквами Теория вероятностей и математическая статистика (рис. 240). Например, если случайная величина Х имеет три возможных значения, то они обозначаются через Теория вероятностей и математическая статистика (рис. 241).
Дискретной (прерывной) называют случайную величину, которая принимает отдельные, изолированные возможные значения с определенными вероятностями. Число возможных значений дискретной случайной величины может быть конечным или бесконечным. В качестве примера таковой можно привести случайную величину из примера 1.
Непрерывной называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Число возможных значений непрерывной случайной величины бесконечно. В качестве примера такой величиныможно привести случайную величину из примера 2.
Для задания дискретной случайной величины недостаточно перечислить все возможные ее значения, нужно еще указать их вероятности. С другой стороны, во многих задачах нет необходимости рассматривать случайные величины как функции от элементарного события, а достаточно знать лишь вероятности возможных значений случайной величины, т.е. закон распределения случайной величины.
Законом распределения вероятностей или просто законом распределения дискретной случайной величины называют соответствие между возможными значениями и их вероятностями; его можно задать в виде таблицы, графика и формулы.
Рассмотрим различные способы задания закона распределения вероятностей на примерах.
При табличном задании закона распределения дискретной случайной величины первая строка таблицы содержит возможные значения, а вторая - их вероятности. Сумма вероятностей во второй строке таблицы должна быть равна 1. В таблице 5.1 задан закон распределения дискретной случайной величины из примера 3.

Таблица 5.1
012
1 / 41 / 21 / 4

Пример 4. В денежной лотерее выпущено 100 билетов. Разыгрывается один выигрыш в 5000 сум, пять выигрышей по 1000 сум и десять выигрышей по 500 сум. Найти закон распределения случайной величины Х - стоимости возможного выигрыша для владельца одного лотерейного билета.
Решение. Напишем возможные значения Х: Теория вероятностей и математическая статистика (рис. 242), Теория вероятностей и математическая статистика (рис. 243), Теория вероятностей и математическая статистика (рис. 244), Теория вероятностей и математическая статистика (рис. 245). Вероятности этих возможных значений таковы: Теория вероятностей и математическая статистика (рис. 246), Теория вероятностей и математическая статистика (рис. 247), Теория вероятностей и математическая статистика (рис. 248), Теория вероятностей и математическая статистика (рис. 249).
Тогда искомый закон распределения имеет вид

Таблица 5.2
050010005000
0,840,10,050,01

Для наглядности закон распределения дискретной случайной величины можно изобразить и графически, для чего в прямоугольной системе координат строят точки Теория вероятностей и математическая статистика (рис. 250), а затем соединяют их отрезками прямых. Полученную фигуру называют многоугольником распределения. На рисунке 5.1 приведен многоугольник распределения случайной величины Х из примера 3.
Теперь рассмотрим некоторые дискретные распределения, заданные посредством формул: биномиальное, геометрическое и Пуассона.
Пусть производится n независимых испытаний, в каждом из которых вероятность наступления события А (успеха) постоянна и равна p (следовательно, вероятность непоявления (неудачи) равна q=1-p). Рассмотрим в качестве дискретной случайной величины Х число появлений события А в этих испытаниях. Возможные значения Х таковы: 0, 1, 2, ..., n. Вероятности этих возможных значений находятся по формуле Бернулли (4.1):

Теория вероятностей и математическая статистика (рис. 251),

где k= 0, 1, 2, ..., n.

Теория вероятностей и математическая статистика (рис. 252)
Рис. 5.1.

Биномиальным называют распределение вероятностей, определяемое формулой Бернулли. Закон назван "биномиальным" потому, что правую часть формулы Бернулли можно рассматривать как общий член разложения бинома Ньютона:

Теория вероятностей и математическая статистика (рис. 253).

Так как p + q = 1, то сумма вероятностей возможных значений случайной величины равна 1.
Таким образом, биномиальный закон распределения имеет вид

Таблица 5.3
. . .. . .0
. . .. . .

В качестве примера биномиального распределения можно привести распределение случайной величины из примера 3.
Пусть производятся независимые испытания, в каждом из которых вероятность появления события А (успеха) равна р (Теория вероятностей и математическая статистика (рис. 254)) и, следовательно, вероятность его непоявления (неудачи) равна q=1-p. Испытания продолжаются до первого успеха. Таким образом, если событие А появилось в k-м испытании, то в предшествующих k - 1 испытаниях оно не появлялось.
Если через Х обозначить дискретную случайную величину, равную числу испытаний до первого успеха, то ее возможными значениями будут натуральные числа 1, 2, 3, ...
Пусть в первых k - 1 испытаниях событие А не наступило, а в k-м испытании появилось. Вероятность этого "сложного события", по теореме 3.3 умножения вероятностей независимых событий, равна

Теория вероятностей и математическая статистика (рис. 255). (5.1)

Геометрическим называют распределение вероятностей, определяемое формулой (5.1), так как полагая в этой формуле k = 1, 2, ..., получим геометрическую прогрессию с первым членом р и знаменателем q (Теория вероятностей и математическая статистика (рис. 256)):

Теория вероятностей и математическая статистика (рис. 257)

Просуммировав бесконечно убывающую геометрическую прогрессию, легко убедиться, что сумма вероятностей возможных значений случайной величины равна 1:

Теория вероятностей и математическая статистика (рис. 258).

Таким образом, геометрический закон распределения имеет вид

Таблица 5.4
123. . .k. . .
. . .. . .

Пример 5. Из орудия производится стрельба по цели до первого попадания. Вероятность попадания в цель Теория вероятностей и математическая статистика (рис. 259). Найти вероятность того, что попадание произойдет при третьем выстреле.
Решение. По условию Теория вероятностей и математическая статистика (рис. 260), Теория вероятностей и математическая статистика (рис. 261), Теория вероятностей и математическая статистика (рис. 262). Искомая вероятность по формуле (5.1) равна:

Теория вероятностей и математическая статистика (рис. 263).

Пусть производится n независимых испытаний, в каждом из которых вероятность появления события А равна р. Для определения вероятности k появлений события в этих испытаниях используют формулу Бернулли. Если же п велико, то пользуются локальной теоремой Лапласа. Однако она дает большую погрешность, если вероятность события мала (Теория вероятностей и математическая статистика (рис. 264)).
Если сделать допущение, что произведение Теория вероятностей и математическая статистика (рис. 265) при Теория вероятностей и математическая статистика (рис. 266) сохраняет постоянное значение, а именно Теория вероятностей и математическая статистика (рис. 267), то вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно k раз, находится по следующей формуле

Теория вероятностей и математическая статистика (рис. 268). (5.2)

Эта формула выражает закон распределения Пуассона вероятностей массовых (п велико) и маловероятных (р мало) событий. Имеются специальные таблицы для распределения Пуассона.
Пример 6. Завод отправил на базу 5000 доброкачественных изделий. Вероятность того, что в пути изделие повредится, равно 0,0002. Найти вероятность того, что на базу прибудут 3 негодных изделия.
Решение. По условию Теория вероятностей и математическая статистика (рис. 269), Теория вероятностей и математическая статистика (рис. 270), Теория вероятностей и математическая статистика (рис. 271). Найдем Теория вероятностей и математическая статистика (рис. 272):

Теория вероятностей и математическая статистика (рис. 273).

Искомая вероятность по формуле (5.2) равна:

Теория вероятностей и математическая статистика (рис. 274).

Вопросы для повторения и контроля:
1.Как определяется случайная величина в общем случае и на языке функций?
2.Что такое дискретная случайная величина?
.Что такое непрерывная случайная величина?
.Что вы знаете о законе распределения дискретной случайной величины?
.Что вы знаете о биномиальном законе распределения?
.Каковы особенности геометрического закона распределения?
7.В каких случаях используют распределение Пуассона?
Опорные слова:
Случайная величина, дискретная случайная величина, непрерывная случайная величина, закон распределения дискретной случайной величины, многоугольник распределения, биномиальное распределение, геометрическое распределение, распределение Пуассона.

. Числовые характеристики дискретных случайных величин и их свойства

Как мы видели выше, закон распределения полностью характеризует дискретную случайную величину. Однако часто закон распределения неизвестен и приходится ограничиваться числами, которые описывают случайную величину суммарно; такие числа называют числовыми характеристиками случайной величины.
К числу важных числовых характеристик относится математическое ожидание. Математическое ожидание приближенно равно среднему значению случайной величины. Для решения многих задач достаточно знать математическое ожидание. Например, если известно, что математическое ожидание числа выбиваемых очков у первого стрелка больше, чем у второго, то первый стрелок в среднем выбивает больше очков, чем второй, и, следовательно, стреляет лучше второго.
Математическим ожиданием дискретной случайной величины Х называется сумма произведений всех ее возможных значений на их вероятности и обозначается через М(Х).
Пусть случайная величина Х принимает значения Теория вероятностей и математическая статистика (рис. 275) с соответствующими вероятностями Теория вероятностей и математическая статистика (рис. 276). Тогда математическое ожидание М(Х) случайной величины Х определяется равенством
Теория вероятностей и математическая статистика (рис. 277). (6.1)

Если дискретная случайная величина Х принимает бесконечное множество возможных значений, то

Теория вероятностей и математическая статистика (рис. 278). (6.2)

Пример 1. Найти математическое ожидание случайной величины Х, зная закон ее распределения

Таблица 6.1
352
0,10,60,3

Решение. Искомое математическое ожидание по формуле (6.1) равно

Теория вероятностей и математическая статистика (рис. 279).

Пример 2. Найти математическое ожидание числа появлений события А в одном испытании, если вероятность события А равна р.
Решение. Случайная величина Х - число появлений события А в одном испытании - может принимать только два значения: Теория вероятностей и математическая статистика (рис. 280) (событие А наступило) с вероятностью р и Теория вероятностей и математическая статистика (рис. 281) (событие А не наступило) с вероятностью q = 1 - р. Искомое математическое ожидание по формуле (6.1) равно

Теория вероятностей и математическая статистика (рис. 282).
Итак, математическое ожидание числа появлений события в одном испытании равно вероятности этого события.
Теперь приведем свойства математического ожидания.
Свойство 6.1. Математическое ожидание постоянной величины равно самой постоянной:

Теория вероятностей и математическая статистика (рис. 283).

Доказательство. Будем рассматривать постоянную С как дискретную случайную величину, которая имеет одно возможное значение С и принимает его с вероятностью Теория вероятностей и математическая статистика (рис. 284). Следовательно,

Теория вероятностей и математическая статистика (рис. 285).

Свойство 6.2.
Постоянный множитель можно выносить за знак математического ожидания:

Теория вероятностей и математическая статистика (рис. 286).

Две случайные величины называются независимыми, если закон распределения одной из них не зависит от того, какие возможные значения приняла другая величина.
Произведением независимых случайных величин Х и Y называется случайная величина ХY, возможные значения которой равны произведениям каждого возможного значения Х на каждое возможное значение Y; вероятности возможных значений произведения ХY равны произведениям вероятностей возможных значений сомножителей.
Свойство 6.3.
Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий:

Теория вероятностей и математическая статистика (рис. 287).

Следствие 6.1. Математическое ожидание произведения нескольких независимых случайных величин равно произведению их математических ожиданий.
Пример 3. Независимые случайные величины Х и Y заданы следующими законами распределения:

Таблица 6.2
Теория вероятностей и математическая статистика (рис. 288)

Таблица 6.3
Теория вероятностей и математическая статистика (рис. 289)

Найти математическое ожидание случайной величины ХY.
Решение. Найдем математические ожидания каждой из данных величин:

Теория вероятностей и математическая статистика (рис. 290);
Теория вероятностей и математическая статистика (рис. 291).

Случайные величины Х и Y независимые, поэтому искомое математическое ожидание равно

Теория вероятностей и математическая статистика (рис. 292).

Суммой случайных величин Х и Y называется случайная величина Х+Y, возможные значения которой равны суммам каждого возможного значения Х с каждым возможным значением Y; вероятности возможных значений Х+Y для независимых величин Х и Y равны произведениям вероятностей слагаемых; для зависимых величин - произведениям вероятности одного слагаемого на условную вероятность второго.
Свойство 6.4. Математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых:

Теория вероятностей и математическая статистика (рис. 293).

Следствие 6.2. Математическое ожидание суммы нескольких случайных величин равно сумме математических ожиданий слагаемых.
Пример 4. Найти математическое ожидание суммы числа очков, которые могут выпасть при бросании двух игральных костей.
Решение. Обозначим число очков, которое может выпасть на первой кости, через Х и на второй - через Y. Возможные значения этих величин одинаковы и равны 1, 2, 3, 4, 5 и 6, причем вероятность каждого из этих значений равна 1/6.
Найдем математическое ожидание числа очков, которые могут выпасть на первой кости:

Теория вероятностей и математическая статистика (рис. 294).

Очевидно, что и Теория вероятностей и математическая статистика (рис. 295).
Искомое математическое ожидание равно
Теория вероятностей и математическая статистика (рис. 296).

Свойство 6.5. Математическое ожидание числа появлений события А в n независимых испытаниях, в каждом из которых вероятность р появления события постоянна, равно произведению числа испытаний на вероятность появления события в одном испытании:

Теория вероятностей и математическая статистика (рис. 297).

Пример 5. Вероятность выявления ошибок в документации при проверке предприятия равна Теория вероятностей и математическая статистика (рис. 298). Найти математическое ожидание общего числа выявлений ошибок, если будет проведено 10 проверок предприятий.
Решение. Выявление ошибок при каждой проверке не зависит от исходов других проверок, поэтому рассматриваемые события независимы и, следовательно, искомое математическое ожидание равно

Теория вероятностей и математическая статистика (рис. 299) (выявлений ошибок).

Некоторые случайные величины имеют одинаковые математические ожидания, но различные возможные значения. Рассмотрим, например, дискретные случайные величины Х и Y, заданные следующими законами распределения:

Таблица 6.4
Теория вероятностей и математическая статистика (рис. 300)

Таблица 6.5
Теория вероятностей и математическая статистика (рис. 301)

Найдем математические ожидания этих величин:

Теория вероятностей и математическая статистика (рис. 302);
Теория вероятностей и математическая статистика (рис. 303).

Здесь математические ожидания обеих величин одинаковы, а возможные значения различны, причем Х имеет возможные значения, близкие к математическому ожиданию, а Y - далекие от своего математического ожидания. Таким образом, зная лишь математическое ожидание случайной величины, еще нельзя судить ни о том, какие возможные значения она может принимать, ни о том, как они рассеяны вокруг математического ожидания.
Другими словами, математическое ожидание полностью случайную величину не характеризует. По этой причине наряду с математическим ожиданием рассматриваются и другие числовые характеристики.
Пусть Х - случайная величина и М(Х) - ее математическое ожидание. Отклонением случайной величины называется разность Теория вероятностей и математическая статистика (рис. 304).
На практике часто требуется оценить рассеяние возможных значений случайной величины вокруг ее среднего значения. Например, в артиллерии важно знать, насколько кучно лягут снаряды вблизи цели, которая должна быть поражена.
Дисперсией (рассеянием) дискретной случайной величины называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:
Теория вероятностей и математическая статистика (рис. 305). (6.3)

Для вычисления дисперсии часто бывает удобно воспользоваться следующей формулой:

Теория вероятностей и математическая статистика (рис. 306). (6.4)

Пример 6. Найти дисперсию случайной величины Х, которая задана следующим законом распределения:

Таблица 6.6
235
0,10,60,3

Решение. Математическое ожидание М(Х) равно:

Теория вероятностей и математическая статистика (рис. 307).

Закон распределения случайной величины Теория вероятностей и математическая статистика (рис. 308) имеет вид:

Таблица 6.7
4925
0,10,60,3

Математическое ожидание Теория вероятностей и математическая статистика (рис. 309) равно:

Теория вероятностей и математическая статистика (рис. 310).
Искомая дисперсия равна

Теория вероятностей и математическая статистика (рис. 311).

Дисперсия, как и математическое ожидание, имеет несколько свойств.
Свойство 6.6. Дисперсия постоянной величины равна нулю:

Теория вероятностей и математическая статистика (рис. 312).

Доказательство. По определению дисперсии,

Теория вероятностей и математическая статистика (рис. 313).

Пользуясь свойством 6.1, получим

Теория вероятностей и математическая статистика (рис. 314).

Итак,

Теория вероятностей и математическая статистика (рис. 315).

Свойство становится ясным, если учесть, что постоянная величина сохраняет одно и то же значение и рассеяния не имеет.
Свойство 6.7. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат:

Теория вероятностей и математическая статистика (рис. 316).

Свойство 6.8. Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин:

Теория вероятностей и математическая статистика (рис. 317).

Следствие 6.3. Дисперсия суммы нескольких независимых случайных величин равна сумме дисперсий этих величин.
Следствие 6.4. Дисперсия суммы постоянной величины и случайной величины равна дисперсии случайной величины:

Теория вероятностей и математическая статистика (рис. 318).

Доказательство. Величины С и Х независимы, поэтому по свойству 6.8 имеем

Теория вероятностей и математическая статистика (рис. 319).

В силу свойства 6.6 Теория вероятностей и математическая статистика (рис. 320). Следовательно,

Теория вероятностей и математическая статистика (рис. 321).

Свойство становится ясным, если учесть, что величины Х и Х + С отличаются лишь началом отсчета и, значит, рассеяны вокруг своих математических ожиданий одинаково.
Свойство 6.9. Дисперсия разности двух независимых случайных величин равна сумме их дисперсий:

Теория вероятностей и математическая статистика (рис. 322).

Доказательство. В силу свойства 6.8 имеем

Теория вероятностей и математическая статистика (рис. 323).

По свойству 6.7,

Теория вероятностей и математическая статистика (рис. 324).

или

Теория вероятностей и математическая статистика (рис. 325).

Свойство 6.10. Дисперсия числа появлений события А в n независимых испытаниях, в каждом из которых вероятность р появления события постоянна, равна произведению числа испытаний на вероятности появления и непоявления события в одном испытании:

Теория вероятностей и математическая статистика (рис. 326).

Пример 7. ГНИ проводит 10 независимых проверок предприятий, в каждой из которых вероятность выявления ошибок в документации равна Теория вероятностей и математическая статистика (рис. 327). Найти дисперсию случайной величины Х - числа выявлений ошибок в документации в этих проверках.
Решение. По условию, Теория вероятностей и математическая статистика (рис. 328), Теория вероятностей и математическая статистика (рис. 329). Вероятность невыявления ошибок в документации равна

Теория вероятностей и математическая статистика (рис. 330).

Искомая дисперсия равна

Теория вероятностей и математическая статистика (рис. 331).

Для оценки рассеяния возможных значений случайной величины вокруг ее среднего значения служит также среднее квадратическое отклонение.
Средним квадратическим отклонением случайной величины Х называется квадратный корень из дисперсии:

Теория вероятностей и математическая статистика (рис. 332). (6.5)

Пример 8. Cлучайная величина Х задана следующим законом распределения:

Таблица 6.8
2310
0,10,40,5

Найти среднее квадратическое отклонение Теория вероятностей и математическая статистика (рис. 333).
Решение. Математическое ожидание М(Х) равно:

Теория вероятностей и математическая статистика (рис. 334).

Математическое ожидание Теория вероятностей и математическая статистика (рис. 335) равно:

Теория вероятностей и математическая статистика (рис. 336).

Найдем дисперсию:

Теория вероятностей и математическая статистика (рис. 337).

Искомое среднее квадратическое отклонение равно:

Теория вероятностей и математическая статистика (рис. 338).

Вопросы для повторения и контроля:
1.Что называется числовыми характеристиками случайной величины и какие их виды вы знаете?
2.Что такое математическое ожидание и как оно определяется?
.Чему равно математическое ожидание числа появлений события в одном испытании и как оно находится?
.Что вы знаете о 1- и 2-свойствах математического ожидания (свойства 6.1 и 6.2)?
.Какие случайные величины называются независимыми и что является произведением независимых случайных величин?
.Как определяется сумма случайных величин?
7.Что вы знаете о 3- и 4-свойствах математического ожидания, а также об их следствиях (свойства 6.3 и 6.4, следствия 6.1 и 6.2)?
.В чем целесообразность введения других числовых характеристик случайной величины, кроме математического ожидания, и что такое отклонение случайной величины?
.Что такое дисперсия и как она находится?
.Что вы знаете о 1- и 2-свойствах дисперсии (свойства 6.6 и 6.7)?
.Что вы знаете о 3-свойстве дисперсии и его следствиях (свойство 6.8, следствия 6.3 и 6.4)?
.Что вы знаете о 4-свойстве дисперсии (свойство 6.9)?
.Чему равны математическое ожидание и дисперсия числа появлений события А в n независимых испытаниях (свойства 6.5 и 6.10)?
14.Что такое среднее квадратическое отклонение и как оно определяется?
Опорные слова:
Числовые характеристики случайной величины, математическое ожидание, независимые случайные величины, произведение независимых случайных величин, сумма случайных величин, отклонение случайной величины, дисперсия, среднее квадратическое отклонение.

. Функции распределения и плотности непрерывных случайных величин, их свойства

Дискретная случайная величина может быть задана перечнем всех ее возможных значений и их вероятностей. Однако такой способ задания неприменим для непрерывных случайных величин.
Например, рассмотрим случайную величину Х, возможные значения которой сплошь заполняют интервал Теория вероятностей и математическая статистика (рис. 339). Очевидно, что невозможно составить перечень всех возможных значений Х. Поэтому целесообразно дать общий способ задания любых типов случайных величин, для чего вводятся функции распределения вероятностей случайной величины.
Пусть х - действительное число. Вероятность события, состоящего в том, что Х примет значение, меньшее х, т.е. вероятность события Теория вероятностей и математическая статистика (рис. 340), обозначим через Теория вероятностей и математическая статистика (рис. 341). Если х изменяется, то изменяется и Теория вероятностей и математическая статистика (рис. 342), т.е. Теория вероятностей и математическая статистика (рис. 343) - функция от х.
Функцией распределения случайной величины Х называется функция Теория вероятностей и математическая статистика (рис. 344), определяющая вероятность того, что случайная величина Х в результате испытания примет значение, меньшее х, т.е.

Теория вероятностей и математическая статистика (рис. 345). (7.1)

Геометрически это равенство можно истолковать так: Теория вероятностей и математическая статистика (рис. 346) есть вероятность того, что случайная величина примет значение, которое изображается на числовой оси точкой, лежащей левее точки х.
Теперь рассмотрим свойства функции распределения.
Свойство 7.1. Значения функции распределения принадлежат отрезку Теория вероятностей и математическая статистика (рис. 347):

Теория вероятностей и математическая статистика (рис. 348). (7.2)

Доказательство. Свойство вытекает из определения функции распределения как вероятности: вероятность всегда есть неотрицательное число, не превышающее единицы.
Свойство 7.2. Теория вероятностей и математическая статистика (рис. 349) - неубывающая функция, т.е.:

Теория вероятностей и математическая статистика (рис. 350), если Теория вероятностей и математическая статистика (рис. 351). (7.3)

Следствие 7.1. Вероятность того, что случайная величина примет значение, заключенное в интервале Теория вероятностей и математическая статистика (рис. 352), равна приращению функции распределения на этом интервале:

Теория вероятностей и математическая статистика (рис. 353). (7.4)

Пример 1. Cлучайная величина Х задана следующей функцией распределения:

Теория вероятностей и математическая статистика (рис. 354).

Найти вероятность того, что в результате испытания Х примет значение, принадлежащее интервалу Теория вероятностей и математическая статистика (рис. 355):

Теория вероятностей и математическая статистика (рис. 356).

Решение. Так как на интервале Теория вероятностей и математическая статистика (рис. 357), по условию,

Теория вероятностей и математическая статистика (рис. 358),

то

Теория вероятностей и математическая статистика (рис. 359).

Итак,

Теория вероятностей и математическая статистика (рис. 360).

Следствие 7.2. Вероятность того, что непрерывная случайная величина Х примет одно определенное значение, равна нулю.
Свойство 7.3. Если возможные значения случайной величины принадлежат интервалу Теория вероятностей и математическая статистика (рис. 361), то: 1) Теория вероятностей и математическая статистика (рис. 362) при Теория вероятностей и математическая статистика (рис. 363); 2) Теория вероятностей и математическая статистика (рис. 364) при Теория вероятностей и математическая статистика (рис. 365).
Доказательство. 1) Пусть Теория вероятностей и математическая статистика (рис. 366). Тогда событие Теория вероятностей и математическая статистика (рис. 367) невозможно (так как значений, меньших Теория вероятностей и математическая статистика (рис. 368), величина Х по условию не принимает) и, следовательно, вероятность его равна нулю.
) Пусть Теория вероятностей и математическая статистика (рис. 369). Тогда событие Теория вероятностей и математическая статистика (рис. 370) достоверно (так как все возможные значения Х меньше Теория вероятностей и математическая статистика (рис. 371)) и, следовательно, вероятность его равна единице.
Следствие 7.3. Если возможные значения непрерывной случайной величины расположены на всей числовой оси х, то справедливы следующие предельные соотношения:

Теория вероятностей и математическая статистика (рис. 372); Теория вероятностей и математическая статистика (рис. 373). (7.5)

График функции распределения непрерывной случайной величины в силу свойства 7.1 расположен в полосе, ограниченной прямыми Теория вероятностей и математическая статистика (рис. 374), Теория вероятностей и математическая статистика (рис. 375).
Из свойства 7.2 вытекает, что при возрастании х в интервале Теория вероятностей и математическая статистика (рис. 376), в котором заключены все возможные значения случайной величины, график имеет вид либо наклона вверх, либо горизонтальный.
В силу свойства 7.3 при Теория вероятностей и математическая статистика (рис. 377) ординаты графика равны нулю; при Теория вероятностей и математическая статистика (рис. 378) ординаты графика равны единице.
График функции распределения непрерывной случайной величины изображен на рис. 7.1.

Теория вероятностей и математическая статистика (рис. 379)
Рис. 7.1.

График функции распределения дискретной случайной величины имеет ступенчатый вид.
Пример 2. Дискретная случайная величина Х задана следующим законом распределения:

Таблица 7.1
148
0,30,10,6

Найти функцию распределения и вычертить ее график.
Решение. Если Теория вероятностей и математическая статистика (рис. 380), то по свойству 7.3 Теория вероятностей и математическая статистика (рис. 381).
Если Теория вероятностей и математическая статистика (рис. 382), то Теория вероятностей и математическая статистика (рис. 383). Действительно, Х может принять значение 1 с вероятностью 0,3.
Если Теория вероятностей и математическая статистика (рис. 384), то Теория вероятностей и математическая статистика (рис. 385). Действительно, если Теория вероятностей и математическая статистика (рис. 386) удовлетворяет неравенству Теория вероятностей и математическая статистика (рис. 387), то Теория вероятностей и математическая статистика (рис. 388) равно вероятности события Теория вероятностей и математическая статистика (рис. 389), которое может быть осуществлено, когда Х примет значение 1 с вероятностью 0,3 или значение 4 с вероятностью 0,1. Поскольку эти два события несовместны, то по теореме 3.1 вероятность события Теория вероятностей и математическая статистика (рис. 390) равна сумме вероятностей 0,3 + 0,1 = 0,4.
Если Теория вероятностей и математическая статистика (рис. 391), то по свойству 7.3 Теория вероятностей и математическая статистика (рис. 392).
Итак, функция распределения аналитически может быть записана так:

Теория вероятностей и математическая статистика (рис. 393).

График этой функции приведен на рис. 7.2.

Теория вероятностей и математическая статистика (рис. 394)
Рис. 7.2.

Непрерывную случайную величину можно также задать, используя другую функцию, которая называется функцией плотности.
Функцией плотности непрерывной случайной величины Х называется функция Теория вероятностей и математическая статистика (рис. 395) - первая производная от функции распределения Теория вероятностей и математическая статистика (рис. 396):

Теория вероятностей и математическая статистика (рис. 397). (7.6)

Отсюда следует, что функция распределения является первообразной для функции плотности. Для описания распределения вероятностей дискретной случайной величины функция плотности неприменима.
Зная функцию плотности, можно вычислить вероятность того, что непрерывная случайная величина примет значение, принадлежащее заданному интервалу.
Теорема 7.1. Вероятность того, что непрерывная случайная величина Х примет значение, принадлежащее интервалу Теория вероятностей и математическая статистика (рис. 398), равна определенному интегралу от функции плотности, взятому в пределах от а до b:

Теория вероятностей и математическая статистика (рис. 399). (7.7)
Доказательство. Из формулы (7.4) получаем

Теория вероятностей и математическая статистика (рис. 400).

По формуле Ньютона-Лейбница

Теория вероятностей и математическая статистика (рис. 401).

Таким образом,

Теория вероятностей и математическая статистика (рис. 402).

Так как Теория вероятностей и математическая статистика (рис. 403), то получаем

Теория вероятностей и математическая статистика (рис. 404).

Пример 3. Задана функция плотности случайной величины Х:

Теория вероятностей и математическая статистика (рис. 405).

Найти вероятность того, что в результате испытания Х примет значение, принадлежащее интервалу Теория вероятностей и математическая статистика (рис. 406).
Решение. Искомая вероятность по формуле (7.7) равна
Теория вероятностей и математическая статистика (рис. 407).

Зная функцию плотности распределения Теория вероятностей и математическая статистика (рис. 408), можно найти функцию распределения Теория вероятностей и математическая статистика (рис. 409) по формуле

Теория вероятностей и математическая статистика (рис. 410). (7.8)

Пример 4. Найти функцию распределения по данной функции плотности:

Теория вероятностей и математическая статистика (рис. 411).

Построить график найденной функции.
Решение. Воспользуемся формулой (7.8). Если Теория вероятностей и математическая статистика (рис. 412), то Теория вероятностей и математическая статистика (рис. 413), следовательно, Теория вероятностей и математическая статистика (рис. 414). Если Теория вероятностей и математическая статистика (рис. 415), то Теория вероятностей и математическая статистика (рис. 416), следовательно,

Теория вероятностей и математическая статистика (рис. 417).

Если Теория вероятностей и математическая статистика (рис. 418), то

Теория вероятностей и математическая статистика (рис. 419).

Итак, искомая функция распределения имеет вид

Теория вероятностей и математическая статистика (рис. 420).

График этой функции изображен на рис. 7.3.

Теория вероятностей и математическая статистика (рис. 421)
Рис. 7.3.

Приведем два свойства функции плотности.
Свойство 7.4. Функция плотности - неотрицательная функция:

Теория вероятностей и математическая статистика (рис. 422). (7.9)

Доказательство. Функция распределения - неубывающая функция, следовательно, ее производная Теория вероятностей и математическая статистика (рис. 423) - функция неотрицательная.
Свойство 7.5. Несобственный интеграл от функции плотности распределения в пределах от Теория вероятностей и математическая статистика (рис. 424) до Теория вероятностей и математическая статистика (рис. 425) равен единице:

Теория вероятностей и математическая статистика (рис. 426). (7.10)

Вопросы для повторения и контроля:
1.Почему целесообразно дать общий способ задания любых типов случайных величин?
.Что называется функцией распределения случайной величины?
.Что вы знаете о 1-свойстве функции распределения (свойство 7.1)?
4.Что вы знаете о 2-свойстве функции распределения и его следствиях (свойство 7.2, следствия 7.1 и 7.2)?
.Что вы знаете о 3-свойстве функции распределения и его следствии (свойство 7.3 и следствие 7.3)?
.Какими свойствами обладают графики функций распределения непрерывной и дискретной случайной величин?
.Что называется функцией плотности непрерывной случайной величины и что вы знаете о теореме 7.1?
.Как можно найти функцию распределения, зная функцию плотности распределения и что вы знаете о свойствах функции плотности (свойства 7.4 и 7.5)?
Опорные слова:
Функция распределения случайной величины, график функции распределения непрерывной случайной величины, график функции распределения дискретной случайной величины, функция плотности непрерывной случайной величины

. Числовые характеристики непрерывных случайных величин. Виды непрерывных распределений

Как и дискретные случайные величины, непрерывные случайные величины также имеют числовые характеристики. Рассмотрим математическое ожидание и дисперсию непрерывной случайной величины.
Пусть непрерывная случайная величина Х задана функцией плотности Теория вероятностей и математическая статистика (рис. 427) и возможные значения этой случайной величины принадлежат отрезку Теория вероятностей и математическая статистика (рис. 428).
Математическим ожиданием непрерывной случайной величины Х, возможные значения которой принадлежат отрезку Теория вероятностей и математическая статистика (рис. 429), называется следующий определенный интеграл

Теория вероятностей и математическая статистика (рис. 430). (8.1)

Если возможные значения принадлежат всей числовой оси Ох, то математическое ожидание имеет следующий вид

Теория вероятностей и математическая статистика (рис. 431). (8.2)

Дисперсией непрерывной случайной величины Х, возможные значения которой принадлежат отрезку Теория вероятностей и математическая статистика (рис. 432), называется следующий определенный интеграл

Теория вероятностей и математическая статистика (рис. 433). (8.3)

Если возможные значения принадлежат всей числовой оси Ох, то дисперсия имеет следующий вид

Теория вероятностей и математическая статистика (рис. 434). (8.4)

Для вычисления дисперсии более удобны соответственно следующие формулы

Теория вероятностей и математическая статистика (рис. 435) (8.5)

И

Теория вероятностей и математическая статистика (рис. 436). (8.6)

Свойства математического ожидания и дисперсии дискретных случайных величин сохраняются и для непрерывных случайных величин.
Среднее квадратическое отклонение непрерывной случайной величины определяется, как и для дискретной случайной величины, следующим равенством

Теория вероятностей и математическая статистика (рис. 437). (8.7)

Пример 1. Найти математическое ожидание, дисперсию и среднее квадратическое отклонение случайной величины Х, заданной следующей функцией распределения:

Теория вероятностей и математическая статистика (рис. 438).

Решение. Найдем функцию плотности:

Теория вероятностей и математическая статистика (рис. 439).

Найдем математическое ожидание по формуле (8.1):

Теория вероятностей и математическая статистика (рис. 440).

Найдем дисперсию по формуле (8.5):

Теория вероятностей и математическая статистика (рис. 441).

Найдем среднее квадратическое отклонение по формуле (8.7):

Теория вероятностей и математическая статистика (рис. 442).

При решении задач, которые выдвигает практика, приходится сталкиваться с различными распределениями непрерывных случайных величин. Функции плотности непрерывных случайных величин называются также законами распределений. Наиболее часто встречаются законы нормального, равномерного и показательного распределений.
Нормальным распределением с параметрами Теория вероятностей и математическая статистика (рис. 443) и Теория вероятностей и математическая статистика (рис. 444) (Теория вероятностей и математическая статистика (рис. 445)) называется распределение вероятностей непрерывной случайной величины, которое описывается следующей функцией плотности

Теория вероятностей и математическая статистика (рис. 446). (8.8)

Отсюда видно, что нормальное распределение определяется двумя параметрами: Теория вероятностей и математическая статистика (рис. 447) и Теория вероятностей и математическая статистика (рис. 448). Достаточно знать эти параметры, чтобы задать нормальное распределение.
Отметим вероятностный смысл этих параметров. Итак, Теория вероятностей и математическая статистика (рис. 449), т.е. математическое ожидание нормального распределения равно параметру Теория вероятностей и математическая статистика (рис. 450), и Теория вероятностей и математическая статистика (рис. 451), т.е. среднее квадратическое отклонение нормального распределения равно параметру Теория вероятностей и математическая статистика (рис. 452).
Функция распределения нормальной случайной величины имеет вид

Теория вероятностей и математическая статистика (рис. 453). (8.9)

Общим называется нормальное распределение с произвольными параметрами Теория вероятностей и математическая статистика (рис. 454) и Теория вероятностей и математическая статистика (рис. 455) (Теория вероятностей и математическая статистика (рис. 456)). Стандартным называется нормальное распределение с параметрами Теория вероятностей и математическая статистика (рис. 457) и Теория вероятностей и математическая статистика (рис. 458).
Легко заметить, что функция плотности стандартного нормального распределения имеет следующий вид

Теория вероятностей и математическая статистика (рис. 459). (8.10)
Эта функция уже встречалась нам в теме № 4. Ее значения приведены в специальных таблицах в различной литературе по теории вероятностей и математической статистике.
Вероятность попадания нормальной случайной величины с произвольными параметрами Теория вероятностей и математическая статистика (рис. 460) и Теория вероятностей и математическая статистика (рис. 461) в интервал Теория вероятностей и математическая статистика (рис. 462) можно найти, пользуясь функцией Лапласа Теория вероятностей и математическая статистика (рис. 463). Действительно, по теореме 7.1 имеем

Теория вероятностей и математическая статистика (рис. 464).

Введем новую переменную Теория вероятностей и математическая статистика (рис. 465). Отсюда Теория вероятностей и математическая статистика (рис. 466), Теория вероятностей и математическая статистика (рис. 467). Найдем новые пределы интегрирования. Если Теория вероятностей и математическая статистика (рис. 468), то Теория вероятностей и математическая статистика (рис. 469); если Теория вероятностей и математическая статистика (рис. 470), то Теория вероятностей и математическая статистика (рис. 471).
Таким образом, имеем

Теория вероятностей и математическая статистика (рис. 472)
Теория вероятностей и математическая статистика (рис. 473)
Теория вероятностей и математическая статистика (рис. 474).

Используя функцию Теория вероятностей и математическая статистика (рис. 475), окончательно получим

Теория вероятностей и математическая статистика (рис. 476). (8.11)
В частности, вероятность попадания стандартной нормальной случайной величины Х в интервал Теория вероятностей и математическая статистика (рис. 477) равна

Теория вероятностей и математическая статистика (рис. 478), (8.12)

так как в этом случае Теория вероятностей и математическая статистика (рис. 479) и Теория вероятностей и математическая статистика (рис. 480).
Пример 2. Случайная величина Х распределена по нормальному закону. Математическое ожидание и среднее квадратическое отклонение этой величины соответственно равны 30 и 10. Найти вероятность того, что Х примет значение, принадлежащее интервалу Теория вероятностей и математическая статистика (рис. 481).
Решение. Воспользуемся формулой (8.11). По условию, Теория вероятностей и математическая статистика (рис. 482), Теория вероятностей и математическая статистика (рис. 483), Теория вероятностей и математическая статистика (рис. 484), Теория вероятностей и математическая статистика (рис. 485), следовательно,

Теория вероятностей и математическая статистика (рис. 486).

По таблице находим Теория вероятностей и математическая статистика (рис. 487). Отсюда искомая вероятность равна

Теория вероятностей и математическая статистика (рис. 488).

Теория вероятностей и математическая статистика (рис. 489)
Рис. 8.1.

График функции плотности нормального распределения называется нормальной кривой (кривой Гаусса). Этот график изображен на рис. 8.1.
Равномерным распределением на отрезке Теория вероятностей и математическая статистика (рис. 490) называется распределение вероятностей случайной величины Х, все возможные значения которой принадлежат этому отрезку, если ее функция плотности имеет вид

Теория вероятностей и математическая статистика (рис. 491). (8.13)

Теория вероятностей и математическая статистика (рис. 492)
Рис. 8.2.

Функция распределения равномерно распределенной на Теория вероятностей и математическая статистика (рис. 493) случайной величины имеет вид

Теория вероятностей и математическая статистика (рис. 494). (8.14)

График функции плотности равномерного распределения приведен на рис. 8.2, а график функции распределения - на рис. 7.3.
Вычислим математическое ожидание и дисперсию равномерной случайной величины.
По формуле (8.1) имеем

Теория вероятностей и математическая статистика (рис. 495).

Далее, по формуле (8.5) имеем

Теория вероятностей и математическая статистика (рис. 496)
Теория вероятностей и математическая статистика (рис. 497).

Теперь найдем вероятность попадания непрерывной случайной величины Х, распределенной равномерно на Теория вероятностей и математическая статистика (рис. 498), в интервал Теория вероятностей и математическая статистика (рис. 499), принадлежащий Теория вероятностей и математическая статистика (рис. 500).
Используя теорему 7.1 и формулу (8.13), имеем

Теория вероятностей и математическая статистика (рис. 501)

Или

Теория вероятностей и математическая статистика (рис. 502). (8.15)

Показательным (экспоненциальным) распределением называется распределение вероятностей непрерывной случайной величины Х, которое описывается функцией плотности
Теория вероятностей и математическая статистика (рис. 503), (8.16)

где Теория вероятностей и математическая статистика (рис. 504) - постоянная положительная величина.
Из определения видно, что показательное распределение определяется одним параметром Теория вероятностей и математическая статистика (рис. 505). Найдем функцию распределения показательного закона:

Теория вероятностей и математическая статистика (рис. 506).

Итак,

Теория вероятностей и математическая статистика (рис. 507). (8.17)

Графики функций плотности и распределения показательного закона изображены на рис. 8.3.

Теория вероятностей и математическая статистика (рис. 508)
Теория вероятностей и математическая статистика (рис. 509)
Рис. 8.3.
Найдем вероятность попадания в интервал Теория вероятностей и математическая статистика (рис. 510) непрерывной случайной величины Х, которая распределена по показательному закону из формулы (8.17). Используя формулу (7.4), имеем

Теория вероятностей и математическая статистика (рис. 511)

Или

Теория вероятностей и математическая статистика (рис. 512). (8.18)

Пример 3. Непрерывная случайная величина Х распределена по показательному закону

Теория вероятностей и математическая статистика (рис. 513).

Найти вероятность того, что в результате испытания Х попадает в интервал Теория вероятностей и математическая статистика (рис. 514).
Решение. По условию, Теория вероятностей и математическая статистика (рис. 515). Воспользуемся формулой (8.18):

Теория вероятностей и математическая статистика (рис. 516)

Отметим вероятностный смысл параметра показательного распределения. Математическое ожидание и среднее квадратическое отклонение показательного распределения равны обратной величине параметра Теория вероятностей и математическая статистика (рис. 517), т.е. Теория вероятностей и математическая статистика (рис. 518) и Теория вероятностей и математическая статистика (рис. 519).
Пример 4. Непрерывная случайная величина Х распределена по показательному закону
Теория вероятностей и математическая статистика (рис. 520).

Найти математическое ожидание, среднее квадратическое отклонение и дисперсию случайной величины Х.
Решение. По условию, Теория вероятностей и математическая статистика (рис. 521). Следовательно,

Теория вероятностей и математическая статистика (рис. 522);
Теория вероятностей и математическая статистика (рис. 523).

Вопросы для повторения и контроля:
1.Что является математическим ожиданием непрерывной случайной величины?
2.Что является дисперсией непрерывной случайной величины и как она вычисляется?
.Что называется нормальным распределением?
.Каков вероятностный смысл параметров нормального распределения?
.Что такое общее и стандартное нормальные распределения, каковы их функции плотности и распределения?
.Как находится вероятность попадания нормальной случайной величины в заданный интервал?
.Что называется равномерным распределением?
.Как вычисляется математическое ожидание и дисперсия равномерной случайной величины?
.Как находится вероятность попадания равномерной случайной величины в заданный интервал?
.Что называется показательным распределением?
.Как находится вероятность попадания показательной случайной величины в заданный интервал?
.Каков вероятностный смысл параметра показательного распределения?
Опорные слова:
Математическое ожидание непрерывной случайной величины, дисперсия непрерывной случайной величины, закон распределения, нормальное распределение, общее нормальное распределение, стандартное нормальное распределение, вероятность попадания нормальной случайной величины в заданный интервал, нормальная кривая (кривая Гаусса), равномерное распределение, вероятность попадания равномерной случайной величины в заданный интервал, показательное распределение, вероятность попадания показательной случайной величины в заданный интервал.

. Закон больших чисел и его практическое значение. Понятие о центральной предельной теореме

Как мы видели в предыдущих темах, нельзя заранее уверенно предвидеть, какое из возможных значений примет случайная величина в итоге испытания, потому что это зависит от многих случайных причин, учесть которые невозможно. Однако при некоторых сравнительно широких условиях суммарное поведение достаточно большого числа случайных величин почти утрачивает случайный характер и становится закономерным.
Для практики очень важно знание условий, при выполнении которых совокупное действие очень многих случайных причин приводит к результату, почти не зависящему от случая, так как позволяет предвидеть ход явлений. Эти условия и указываются в теоремах, носящих общее название закона больших чисел. К ним относятся теоремы Чебышева и Бернулли.
Теоремы, относящиеся к закону больших чисел, устанавливают условия сходимости среднего арифметического п случайных величин к среднему арифметическому их математических ожиданий.
Вначале приведем неравенство Чебышева, на которое опираются доказательства вышеназванных теорем.
Если известна дисперсия случайной величины, то с ее помощью можно оценить вероятность отклонения этой величины на заданное значение от своего математического ожидания, причем оценка вероятности отклонения зависит лишь от дисперсии. Соответствующую оценку вероятности дает неравенство П.Л.Чебышева:

Теория вероятностей и математическая статистика (рис. 524), Теория вероятностей и математическая статистика (рис. 525). (9.1)

Из этого неравенства в качестве следствия можно получить следующее неравенство

Теория вероятностей и математическая статистика (рис. 526), Теория вероятностей и математическая статистика (рис. 527). (9.2)

Пример 1. Оценить вероятность отклонения случайной величины Х от своего математического ожидания на величину, превышающую утроенное среднеквадратическое отклонение случайной величины.
Решение. По условию, Теория вероятностей и математическая статистика (рис. 528). Учитывая, что Теория вероятностей и математическая статистика (рис. 529), из формулы (9.1) получаем

Теория вероятностей и математическая статистика (рис. 530).

Теорема 9.1 (закон больших чисел в форме Чебышева). Пусть Теория вероятностей и математическая статистика (рис. 531) - последовательность независимых случайных величин, дисперсии которых ограничены сверху одним и тем же числом с: Теория вероятностей и математическая статистика (рис. 532), Теория вероятностей и математическая статистика (рис. 533).
Тогда для любого Теория вероятностей и математическая статистика (рис. 534) имеет место:

Теория вероятностей и математическая статистика (рис. 535). (9.3)

Из этой теоремы вытекает справедливость закона больших чисел для среднего арифметического независимых случайных величин, имеющих одинаковое распределение вероятностей.
Следствие 9.1. Пусть Теория вероятностей и математическая статистика (рис. 536) - последовательность независимых случайных величин, имеющих одно и то же математическое ожидание а, и дисперсии которых ограничены сверху одним и тем же числом с: Теория вероятностей и математическая статистика (рис. 537), Теория вероятностей и математическая статистика (рис. 538). Тогда для любого Теория вероятностей и математическая статистика (рис. 539) имеет место:

Теория вероятностей и математическая статистика (рис. 540). (9.4)

Закон больших чисел для независимых случайных величин с одинаковым математическим ожиданием отражает сходимость среднего арифметического случайных величин в сериях независимых испытаний к общему математическому ожиданию этих случайных величин.
Таким образом, среднее арифметическое достаточно большого числа независимых случайных величин (дисперсии которых равномерно ограничены) утрачивает характер случайной величины. Объясняется это тем, что отклонения каждой из этих величин от своих математических ожиданий могут быть как положительными, так и отрицательными, а в среднем арифметическом они погашаются.
Закон больших чисел имеет многочисленные практические приложения. Пусть, например, производится п независимых измерений некоторой величины, истинное значение которой равно а. Результат каждого измерения является случайной величиной Теория вероятностей и математическая статистика (рис. 541). Если измерения выполняются без систематической погрешности, то математическое ожидание случайных величин Теория вероятностей и математическая статистика (рис. 542) можно считать равным истинному значению измеряемой величины, Теория вероятностей и математическая статистика (рис. 543), Теория вероятностей и математическая статистика (рис. 544). Дисперсию результатов измерений часто можно считать ограниченной некоторым числом с.
Тогда случайные результаты измерений удовлетворяют условиям теоремы 9.1 и, следовательно, среднее арифметическое п измерений при большом числе измерений практически не может сильно отличаться от истинного значения измеряемой величины а. Этим обосновывается выбор среднего арифметического измерений в качестве истинного значения измеряемой величины.
Для относительной частоты успехов в независимых испытаниях справедлива следующая теорема.
Теорема 9.2 (закон больших чисел в форме Бернулли). Если в каждом из п независимых испытаний вероятность р появления события А постоянна, то для числа успехов т в этих испытаниях при любом Теория вероятностей и математическая статистика (рис. 545) имеет место:

Теория вероятностей и математическая статистика (рис. 546). (9.5)

Рассмотрим последовательность независимых, одинаково распределенных случайных величин Теория вероятностей и математическая статистика (рис. 547). Пусть Теория вероятностей и математическая статистика (рис. 548), Теория вероятностей и математическая статистика (рис. 549), Теория вероятностей и математическая статистика (рис. 550). Образуем последовательность Теория вероятностей и математическая статистика (рис. 551), Теория вероятностей и математическая статистика (рис. 552), центрированных и нормированных сумм случайных величин:

Теория вероятностей и математическая статистика (рис. 553). (9.6)

Согласно центральной предельной теореме, при достаточно общих предположениях о законах распределения случайных величин Теория вероятностей и математическая статистика (рис. 554) последовательность функций распределения центрированных и нормированных сумм случайных величин Теория вероятностей и математическая статистика (рис. 555) при Теория вероятностей и математическая статистика (рис. 556) сходится для любых х к функции распределения стандартной нормальной случайной величины.
Теорема 9.3 (центральная предельная теорема). Пусть Теория вероятностей и математическая статистика (рис. 557) - последовательность независимых, одинаково распределенных случайных величин, имеющих конечную дисперсию Теория вероятностей и математическая статистика (рис. 558), и пусть Теория вероятностей и математическая статистика (рис. 559), Теория вероятностей и математическая статистика (рис. 560). Тогда для любого Теория вероятностей и математическая статистика (рис. 561) имеет место:

Теория вероятностей и математическая статистика (рис. 562). (9.7)

Вопросы для повторения и контроля:
1.О чем идет речь в теоремах, носящих общее название закона больших чисел?
2.Что вы знаете о неравенстве Чебышева?
3.Что утверждает закон больших чисел в форме Чебышева?
4.В чем сущность закона больших чисел и каково его практическое значение?
5.Что утверждает закон больших чисел в форме Бернулли?
6.О чем идет речь в центральной предельной теореме?
Опорные слова:
Закон больших чисел, неравенство Чебышева, последовательность независимых случайных величин, центрированная и нормированная сумма случайных величин, центральная предельная теорема.

. Предмет и основные задачи математической статистики. Выборка

Основная цель при применении математической статистики состоит в получении выводов о массовых явлениях и процессах по данным наблюдений над ними или экспериментов. Эти статистические выводы относятся не к отдельным испытаниям, а представляют собой утверждения об общих характеристиках этого явления (вероятностях, законах распределения и их параметрах, математических ожиданиях и т.п.) в предположении постоянства условий, порождающих исследуемое явление.
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных - результатов наблюдений.
Первая задача математической статистики - указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Вторая задача математической статистики - разработать методы анализа статистических данных в зависимости от целей исследования, таких, как:
а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости случайной величины от одной или нескольких случайных величин и др.;
б) проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого известен.
Итак, предметом математической статистики является создание методов сбора и обработки статистических данных для получения научных и практических выводов.
Математическая статистика опирается на теорию вероятностей, и ее цель - оценить характеристики генеральной совокупности по выборочным данным.
Если требуется изучить совокупность однородных объектов относительно некоторого признака, характеризующего эти объекты, то естественным является проведение сплошного обследования, т.е. обследование каждого из объектов совокупности относительно этого признака. На практике, однако, проведение сплошного обследования по тем или иным причинам часто бывает невозможным. В таких случаях случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.
Выборочной совокупностью или просто выборкой называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которых производится выборка. Например, если все студенты Налоговой академии - это генеральная совокупность, то студенты какой-либо группы являются выборкой.
Объемом совокупности (выборочной или генеральной) называется число объектов этой совокупности. Например, если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности Теория вероятностей и математическая статистика (рис. 563), а объем выборки Теория вероятностей и математическая статистика (рис. 564).
При составлении выборки можно поступать двумя способами: после того, как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В зависимости от этого выборки подразделяются на повторные и бесповторные.
Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.
Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности, т.е. выборка должна быть репрезентативной (представительной).
В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если каждый объект выборки отобран случайно из генеральной совокупности в предположении, что все объекты имеют одинаковую вероятность попасть в выборку.
Если объем генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборками стирается; в предельном случае, когда рассматривается бесконечная генеральная совокупность, а выборка имеет конечный объем, это различие исчезает.
На практике применяются различные способы отбора. Существует отбор, не требующий расчленения генеральной совокупности на части, например, простой случайный бесповторный отбор и простой случайный повторный отбор, а также применяется отбор, при котором генеральная совокупность разбивается на части (типический отбор, механический отбор, серийный отбор).
Простым случайным называется такой отбор, при котором объекты извлекаются по одному из всей генеральной совокупности. Если извлеченные объекты возвращаются в генеральную совокупность для участия в последующем отборе, то такой отбор будет простым случайным повторным, в противном случае - простым случайным бесповторным. Например, если требуется определить среднемесячную зарплату по региону, то применяется простой случайный бесповторный отбор, так как зарплата одного и того же человека учитывается только один раз. Если же требуется определить половозрастной, социальный, образовательный состав различных комиссий в каком-либо районе, то отбор является простым случайным повторным, так как один и тот же работник может участвовать в различных комиссиях, и, следовательно, попасть в выборку несколько раз.
Типическим называется отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее "типической" части. Например, если детали изготовляются на нескольких станках, то отбор производится не из всей совокупности деталей, произведенных всеми станками, а из продукции каждого станка в отдельности. Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях генеральной совокупности.
Механическим называется отбор, при котором генеральная совкупность механически делится на столько примерно одинаковых по размеру групп, сколько объектов должно войти в выборку, а из каждой группы отбирается объект с одним и тем же номером. Например, если нужно отобрать 20% изготовленных станком деталей, то отбирается каждая пятая деталь; если требуется отобрать 5% деталей, то отбирается каждая двадцатая деталь и т.д. Иногда механический отбор может не обеспечить репрезентативности выборки.
Серийным называется отбор, при котором объекты отбираются из генеральной совокупности не по одному, а "сериями", которые подвергаются сплошному обследованию. Например, если изделия изготовляются большой группой станков-автоматов, то подвергается сплошному обследованию продукция только нескольких станков. Серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.
На практике часто применяется комбинированный отбор, при котором сочетаются указанные выше способы.
Вопросы для повторения и контроля:
1.Какие задачи стоят перед математической статистикой?
2.Какова цель применения математической статистики и в чем ее предмет?
.Что такое выборочная совокупность (выборка), генеральная совокупность, объем совокупности?
.Что называется повторной выборкой, бесповторной выборкой и репрезентативной выборкой?
.Что представляет собой простой случайный отбор и типический отбор?
.Что представляет собой механический отбор и серийный отбор?
Опорные слова:
Математическая статистика, оценка, проверка статистических гипотез, сбор и обработка статистических данных, выборочная совокупность, выборка, генеральная совокупность, объем совокупности, повторная выборка, бесповторная выборка, репрезентативная выборка, простой случайный бесповторный отбор, простой случайный повторный отбор, типический отбор, механический отбор, серийный отбор, комбинированный отбор.

. Статистическое распределение выборки. Эмпирическая функция распределения. Полигон и гистограмма

Пусть из генеральной совокупности извлечена выборка. При этом пусть значение Теория вероятностей и математическая статистика (рис. 565) наблюдалось Теория вероятностей и математическая статистика (рис. 566) раз, Теория вероятностей и математическая статистика (рис. 567) - Теория вероятностей и математическая статистика (рис. 568) раз, ... , Теория вероятностей и математическая статистика (рис. 569) - Теория вероятностей и математическая статистика (рис. 570) раз и т.д.; Теория вероятностей и математическая статистика (рис. 571) является объемом выборки.
Наблюдаемые значения Теория вероятностей и математическая статистика (рис. 572) называются вариантами, а последовательность вариант, записанных в возрастающем порядке, - вариационным рядом. Числа наблюдений Теория вероятностей и математическая статистика (рис. 573) называются частотами, а их отношения к объему выборки Теория вероятностей и математическая статистика (рис. 574) - относительными частотами.
Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот. В этом случае в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал. При этом сумма частот должна быть равна объему выборки, а сумма относительных частот - единице.
В теории вероятностей под распределением понимается соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике - соответствие между наблюдаемыми вариантами и их частотами (относительными частотами).
Пример 1. Задано распределение частот выборки объема Теория вероятностей и математическая статистика (рис. 575):

Таблица 11.1
3510
785

Написать распределение относительных частот.
Решение. Найдем относительные частоты, для чего разделим частоты на объем выборки:

Теория вероятностей и математическая статистика (рис. 576), Теория вероятностей и математическая статистика (рис. 577), Теория вероятностей и математическая статистика (рис. 578).

Напишем распределение относительных частот:

Таблица 11.2
3510
0,350,40,25

Контроль:

,35 + 0,4 + 0,25 = 1.
Пусть известно статистическое распределение частот количественного признака Х. Обозначим через Теория вероятностей и математическая статистика (рис. 579) число наблюдений, при которых наблюдались значения признака, меньшие х, а через Теория вероятностей и математическая статистика (рис. 580) - общее число наблюдений (объем выборки). Относительная частота события Теория вероятностей и математическая статистика (рис. 581) равна Теория вероятностей и математическая статистика (рис. 582). При изменении x изменяется и относительная частота, т.е. относительная частота Теория вероятностей и математическая статистика (рис. 583) есть функция от х.
Эмпирической функцией распределения (функцией распределения выборки) называется функция Теория вероятностей и математическая статистика (рис. 584), определяющая для каждого значения х относительную частоту события Теория вероятностей и математическая статистика (рис. 585), т.е.

Теория вероятностей и математическая статистика (рис. 586), (11.1)

где Теория вероятностей и математическая статистика (рис. 587) - число вариант, меньших х; Теория вероятностей и математическая статистика (рис. 588) - объем выборки.
Функция Теория вероятностей и математическая статистика (рис. 589) называется эмпирической, потому что она находится эмпирическим (опытным) путем.
В отличие от эмпирической функции распределения выборки функция распределения Теория вероятностей и математическая статистика (рис. 590) генеральной совокупности называется теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция Теория вероятностей и математическая статистика (рис. 591) определяет вероятность события Теория вероятностей и математическая статистика (рис. 592), а эмпирическая функция Теория вероятностей и математическая статистика (рис. 593) определяет относительную частоту этого же события.
Из закона больших чисел в форме Бернулли (теорема 9.2) следует, что при больших Теория вероятностей и математическая статистика (рис. 594) относительная частота события Теория вероятностей и математическая статистика (рис. 595), т.е. Теория вероятностей и математическая статистика (рис. 596) и вероятность этого же события Теория вероятностей и математическая статистика (рис. 597) мало отличаются одно от другого в том смысле, что

Теория вероятностей и математическая статистика (рис. 598) при любом Теория вероятностей и математическая статистика (рис. 599). (11.2)

С другой стороны, из определения функции Теория вероятностей и математическая статистика (рис. 600) вытекает, что она обладает всеми свойствами Теория вероятностей и математическая статистика (рис. 601):
)значения эмпирической функции принадлежат отрезку Теория вероятностей и математическая статистика (рис. 602);
)Теория вероятностей и математическая статистика (рис. 603) - неубывающая функция;
3)если Теория вероятностей и математическая статистика (рис. 604) - наименьшая варианта, то Теория вероятностей и математическая статистика (рис. 605) при Теория вероятностей и математическая статистика (рис. 606); если Теория вероятностей и математическая статистика (рис. 607) - наибольшая варианта, то Теория вероятностей и математическая статистика (рис. 608) при Теория вероятностей и математическая статистика (рис. 609).
Отсюда следует целесообразность использования эмпирической функции распределения выборки для приближенного представления теоретической функции распределения генеральной совокупности. Другими словами, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.
Пример 2. Построить эмпирическую функцию по данному распределению выборки:

Таблица 11.3
148
9318

Решение. Найдем объем выборки: Теория вероятностей и математическая статистика (рис. 610). Наименьшая варианта равна 1, следовательно,

Теория вероятностей и математическая статистика (рис. 611) при Теория вероятностей и математическая статистика (рис. 612).

Значение Теория вероятностей и математическая статистика (рис. 613), а именно Теория вероятностей и математическая статистика (рис. 614), наблюдалось 9 раз, следовательно,
Теория вероятностей и математическая статистика (рис. 615) при Теория вероятностей и математическая статистика (рис. 616).

Значения Теория вероятностей и математическая статистика (рис. 617), а именно Теория вероятностей и математическая статистика (рис. 618) и Теория вероятностей и математическая статистика (рис. 619), наблюдались Теория вероятностей и математическая статистика (рис. 620) раз, следовательно,

Теория вероятностей и математическая статистика (рис. 621) при Теория вероятностей и математическая статистика (рис. 622).

Так как наибольшая варианта равна 8, то

Теория вероятностей и математическая статистика (рис. 623) при Теория вероятностей и математическая статистика (рис. 624).

Искомая эмпирическая функция имеет вид

Теория вероятностей и математическая статистика (рис. 625).

График этой функции изображен на рис. 11.1.

Теория вероятностей и математическая статистика (рис. 626)
Рис. 11.1.

Статистическое распределение графически можно изобразить различными способами, в частности, в виде полигона и гистограммы.
Полигоном частот называется ломаная, отрезки которой соединяют точки Теория вероятностей и математическая статистика (рис. 627), Теория вероятностей и математическая статистика (рис. 628), ... , Теория вероятностей и математическая статистика (рис. 629). Для построения полигона частот на оси абсцисс откладывают варианты Теория вероятностей и математическая статистика (рис. 630), а на оси ординат - соответствующие им частоты Теория вероятностей и математическая статистика (рис. 631). Точки Теория вероятностей и математическая статистика (рис. 632) соединяют отрезками прямых и получают полигон частот.
Полигоном относительных частот называется ломаная, отрезки которой соединяют точки Теория вероятностей и математическая статистика (рис. 633), Теория вероятностей и математическая статистика (рис. 634), ..., Теория вероятностей и математическая статистика (рис. 635). Полигон относительных частот строится аналогичным полигону частот образом. На рис. 11.2 изображен полигон относительных частот следующего распределения:

Таблица 11.4
2468
0,10,50,250,15

Теория вероятностей и математическая статистика (рис. 636)
Рис. 11.2.

В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивается на несколько частичных интервалов длиной Теория вероятностей и математическая статистика (рис. 637) и для каждого частичного интервала находится Теория вероятностей и математическая статистика (рис. 638) - сумма частот вариант, попавших в i-й интервал.
Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною Теория вероятностей и математическая статистика (рис. 639), а высоты равны отношению Теория вероятностей и математическая статистика (рис. 640). Для построения гистограммы частот на оси абсцисс следует отложить частичные интервалы, а над ними провести отрезки, параллельные оси абсцисс на расстоянии Теория вероятностей и математическая статистика (рис. 641).
Площадь i-го частичного прямоугольника равна Теория вероятностей и математическая статистика (рис. 642) - сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Таблица 11.5
Частичный интервал длиною h = 5Сумма частот вариант частичного интервала Плотность частоты
5 - 1040,8
10 - 1561,2
15 - 20163,2
20 - 25367,2
25 - 30244,8
30 - 35102,0
35 - 4040,8

На рис. 11.3 изображена гистограмма частот распределения, заданного в табл. 11.5.

Теория вероятностей и математическая статистика (рис. 643)
Рис. 11.3.

Гистограммой относительных частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною Теория вероятностей и математическая статистика (рис. 644), а высоты равны отношению Теория вероятностей и математическая статистика (рис. 645). Гистограмма относительных частот строится аналогичным гистограмме частот образом.
Площадь i-го частичного прямоугольника равна Теория вероятностей и математическая статистика (рис. 646) - сумме относительных частот вариант i-го интервала; следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.
Вопросы для повторения и контроля:
1.Что называется вариантами, вариационным рядом, частотами и относительными частотами?
2.Что такое статистическое распределение выборки и как оно задается, какова разница между распределением в теории вероятностей и распределением в математической статистике?
3.Что такое эмпирическая функция распределения и теоретическая функция распределения?
.Какими свойствами обладает эмпирическая функция распределения?
5.В чем целесообразность использования эмпирической функции распределения выборки для оценки теоретической функции распределения генеральной совокупности?
6.Что называется полигоном частот и полигоном относительных частот, как они строятся?
7.Что такое гистограмма частот, как она строится и чему равна площадь гистограммы частот?
8.Что такое гистограмма относительных частот, как она строится и чему равна площадь гистограммы относительных частот?
Опорные слова:
Варианта, вариационный ряд, частота, относительная частота, статистическое распределение выборки, эмпирическая функция распределения, теоретическая функция распределения, полигон частот, полигон относительных частот, гистограмма частот, площадь гистограммы частот, гистограмма относительных частот, площадь гистограммы относительных частот.

. Статистическая оценка. Требования, предъявляемые к статистической оценке. Выборочное среднее и выборочная дисперсия

Теория статистического оценивания с точки зрения постановки задачи подразделяется на параметрические и непараметрические случаи.
Если требуется изучить количественный признак генеральной совокупности, то возникает задача оценки параметров, которыми определяется распределение этого признака. Например, если наперед известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.
Обычно имеются лишь данные выборки, например, значения количественного признака Теория вероятностей и математическая статистика (рис. 647), Теория вероятностей и математическая статистика (рис. 648), ..., Теория вероятностей и математическая статистика (рис. 649), полученные в результате Теория вероятностей и математическая статистика (рис. 650) наблюдений, причем эти наблюдения предполагаются независимыми. Через эти данные и выражается оцениваемый параметр. Рассматривая Теория вероятностей и математическая статистика (рис. 651), Теория вероятностей и математическая статистика (рис. 652), ..., Теория вероятностей и математическая статистика (рис. 653) как независимые случайные величины Теория вероятностей и математическая статистика (рис. 654), Теория вероятностей и математическая статистика (рис. 655), ... , Теория вероятностей и математическая статистика (рис. 656), можно сказать, что нахождение статистической оценки неизвестного параметра теоретического распределения равносильно нахождению функции от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра. Например, для оценки математического ожидания нормального распределения служит функция Теория вероятностей и математическая статистика (рис. 657), которая является средним арифметическим наблюдаемых значений признака.
Таким образом, статистической оценкой неизвестного параметра Теория вероятностей и математическая статистика (рис. 658) теоретического распределения называется функция Теория вероятностей и математическая статистика (рис. 659) от наблюдаемых случайных величин, которая в определенном статистическом смысле близка к истинному значению этого параметра.
Важнейшими свойствами статистической оценки, определяющими ее близость к истинному значению оцениваемого параметра, являются свойства несмещенности, состоятельности и эффективности.
Пусть Теория вероятностей и математическая статистика (рис. 660) - статистическая оценка неизвестного параметра Теория вероятностей и математическая статистика (рис. 661) теоретического распределения. Многократно извлекая из генеральной совокупности выборки объема Теория вероятностей и математическая статистика (рис. 662), можно получить оценки Теория вероятностей и математическая статистика (рис. 663), Теория вероятностей и математическая статистика (рис. 664), ... , Теория вероятностей и математическая статистика (рис. 665), которые, вообще говоря, различны между собой. Таким образом, оценку Теория вероятностей и математическая статистика (рис. 666) можно рассматривать как случайную величину, а числа Теория вероятностей и математическая статистика (рис. 667), Теория вероятностей и математическая статистика (рис. 668), ... , Теория вероятностей и математическая статистика (рис. 669) - как ее возможные значения.
Если оценка Теория вероятностей и математическая статистика (рис. 670) дает приближенное значение Теория вероятностей и математическая статистика (рис. 671) с избытком, то каждое найденное по данным выборок число Теория вероятностей и математическая статистика (рис. 672) (Теория вероятностей и математическая статистика (рис. 673)) больше истинного значения Теория вероятностей и математическая статистика (рис. 674). Ясно, что в этом случае и математическое ожидание (среднее значение) случайной величины Теория вероятностей и математическая статистика (рис. 675) больше, чем Теория вероятностей и математическая статистика (рис. 676), т.е. Теория вероятностей и математическая статистика (рис. 677). Очевидно, что если Теория вероятностей и математическая статистика (рис. 678) дает оценку с недостатком, то Теория вероятностей и математическая статистика (рис. 679).
Отсюда видно, что использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приведет к систематическим ошибкам, которые являются неслучайными ошибками, искажающими результаты измерений в одну определенную сторону. По этой причине равенство математического ожидания оценки Теория вероятностей и математическая статистика (рис. 680) оцениваемому параметру хотя и не устраняет ошибок ввиду того, что одни значения Теория вероятностей и математическая статистика (рис. 681) больше, а другие меньше Теория вероятностей и математическая статистика (рис. 682), однако гарантирует от получения систематических ошибок, так как ошибки разных знаков будут встречаться одинаково часто.
Статистическая оценка Теория вероятностей и математическая статистика (рис. 683) называется несмещенной, если ее математическое ожидание равно оцениваемому параметру Теория вероятностей и математическая статистика (рис. 684) при любом объеме выборки, т.е.

Теория вероятностей и математическая статистика (рис. 685). (12.1)

Смещенной называется оценка, математическое ожидание которой не равно оцениваемому параметру.
Однако несмещенная оценка необязательно каждый раз дает хорошее приближение оцениваемого параметра. Действительно, возможные значения Теория вероятностей и математическая статистика (рис. 686) могут быть сильно рассеяны вокруг своего среднего значения, т.е. дисперсия Теория вероятностей и математическая статистика (рис. 687) может быть значительной. В этом случае найденная по данным одной выборки оценка может оказаться весьма удаленной от среднего значения Теория вероятностей и математическая статистика (рис. 688), а значит, и от самого оцениваемого параметра Теория вероятностей и математическая статистика (рис. 689). Если же потребовать, чтобы дисперсия Теория вероятностей и математическая статистика (рис. 690) была малой, то возможность допустить большую ошибку будет исключена.
Статистическая оценка называется эффективной, если при заданном объеме выборки Теория вероятностей и математическая статистика (рис. 691) она имеет наименьшую возможную дисперсию.
Статистическая оценка Теория вероятностей и математическая статистика (рис. 692) называется состоятельной, если она сходится по вероятности к оцениваемому параметру Теория вероятностей и математическая статистика (рис. 693), т.е. для любого Теория вероятностей и математическая статистика (рис. 694)

Теория вероятностей и математическая статистика (рис. 695) при Теория вероятностей и математическая статистика (рис. 696). (12.2)

Например, если дисперсия несмещенной оценки при Теория вероятностей и математическая статистика (рис. 697) стремится к нулю, то такая оценка оказывается и состоятельной.
Пусть генеральная совокупность изучается относительно количественного признака Х.
Генеральной средней Теория вероятностей и математическая статистика (рис. 698) называется среднее арифметическое значений признака генеральной совокупности.
Если все значения Теория вероятностей и математическая статистика (рис. 699), Теория вероятностей и математическая статистика (рис. 700), ... , Теория вероятностей и математическая статистика (рис. 701) признака генеральной совокупности объема Теория вероятностей и математическая статистика (рис. 702) различны, то генеральная средняя равна

Теория вероятностей и математическая статистика (рис. 703). (12.3)

Если же значения признака Теория вероятностей и математическая статистика (рис. 704), Теория вероятностей и математическая статистика (рис. 705), ... , Теория вероятностей и математическая статистика (рис. 706) имеют соответственно частоты Теория вероятностей и математическая статистика (рис. 707), Теория вероятностей и математическая статистика (рис. 708), ... , Теория вероятностей и математическая статистика (рис. 709), причем Теория вероятностей и математическая статистика (рис. 710), то в этом случае генеральная средняя равна

Теория вероятностей и математическая статистика (рис. 711). (12.4)

Если рассматривать обследуемый признак Х генеральной совокупности как случайную величину и сопоставлять формулы (12.3) и (12.4) с формулами (6.1) и (6.2), то можно сделать вывод, что математическое ожидание признака равно генеральной средней этого признака:

Теория вероятностей и математическая статистика (рис. 712). (12.5)

Пусть теперь для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема Теория вероятностей и математическая статистика (рис. 713).
Выборочной средней Теория вероятностей и математическая статистика (рис. 714) называется среднее арифметическое наблюдаемых значений признака выборочной совокупности.
Если все значения Теория вероятностей и математическая статистика (рис. 715), Теория вероятностей и математическая статистика (рис. 716), ... , Теория вероятностей и математическая статистика (рис. 717) признака выборки объема Теория вероятностей и математическая статистика (рис. 718) различны, то выборочная средняя равна

Теория вероятностей и математическая статистика (рис. 719). (12.6)

Если же значения признака Теория вероятностей и математическая статистика (рис. 720), Теория вероятностей и математическая статистика (рис. 721), ... , Теория вероятностей и математическая статистика (рис. 722) имеют соответственно частоты Теория вероятностей и математическая статистика (рис. 723), Теория вероятностей и математическая статистика (рис. 724), ... , Теория вероятностей и математическая статистика (рис. 725), причем Теория вероятностей и математическая статистика (рис. 726), то в этом случае выборочная средняя равна

Теория вероятностей и математическая статистика (рис. 727) (12.7)

или

Теория вероятностей и математическая статистика (рис. 728). (12.8)

Убедимся, что выборочная средняя является несмещенной оценкой генеральной средней, т.е. покажем, что математическое ожидание Теория вероятностей и математическая статистика (рис. 729) равно Теория вероятностей и математическая статистика (рис. 730). Будем рассматривать Теория вероятностей и математическая статистика (рис. 731) как случайную величину и Теория вероятностей и математическая статистика (рис. 732), Теория вероятностей и математическая статистика (рис. 733), ... , Теория вероятностей и математическая статистика (рис. 734) как независимые, одинаково распределенные случайные величины. Поскольку эти величины одинаково распределены, то они имеют одинаковые числовые характеристики, в частности одинаковое математическое ожидание, которое равно математическому ожиданию признака Х генеральной совокупности.
На основании этого, используя свойство 6.2, следствие 6.2, а также формулы (12.5) и (12.6), получаем

Теория вероятностей и математическая статистика (рис. 735). (12.9)

Используя следствие 9.1, легко показать, что выборочная средняя является и состоятельной оценкой генеральной средней.
Для того, чтобы охарактеризовать рассеяния значений количественных признаков генеральной и выборочной совокупностей вокруг своих средних значений, вводятся сводные характеристики - соответственно генеральная и выборочная дисперсии, а также средние квадратические отклонения.
Генеральной дисперсией Теория вероятностей и математическая статистика (рис. 736) называется среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения Теория вероятностей и математическая статистика (рис. 737).
Если все значения Теория вероятностей и математическая статистика (рис. 738), Теория вероятностей и математическая статистика (рис. 739), ... , Теория вероятностей и математическая статистика (рис. 740) признака генеральной совокупности объема Теория вероятностей и математическая статистика (рис. 741) различны, то генеральная дисперсия равна

Теория вероятностей и математическая статистика (рис. 742). (12.10)

Если же значения признака Теория вероятностей и математическая статистика (рис. 743), Теория вероятностей и математическая статистика (рис. 744), ... , Теория вероятностей и математическая статистика (рис. 745) имеют соответственно частоты Теория вероятностей и математическая статистика (рис. 746), Теория вероятностей и математическая статистика (рис. 747), ... , Теория вероятностей и математическая статистика (рис. 748), причем Теория вероятностей и математическая статистика (рис. 749), то в этом случае генеральная дисперсия равна

Теория вероятностей и математическая статистика (рис. 750). (12.11)

Генеральным средним квадратическим отклонением называется квадратный корень из генеральной дисперсии:

Теория вероятностей и математическая статистика (рис. 751). (12.12)

Пример 1. Генеральная совокупность задана следующей таблицей распределения:

Таблица 12.1
2456
89103

Найти генеральную дисперсию и генеральное среднее квадратическое отклонение.
Решение. Найдем генеральную среднюю:

Теория вероятностей и математическая статистика (рис. 752).

Найдем генеральную дисперсию:

Теория вероятностей и математическая статистика (рис. 753).

Найдем генеральное среднее квадратическое отклонение:

Теория вероятностей и математическая статистика (рис. 754).

Выборочной дисперсией Теория вероятностей и математическая статистика (рис. 755) называется среднее арифметическое квадратов отклонений наблюдаемых значений признака выборочной совокупности от их среднего значения Теория вероятностей и математическая статистика (рис. 756).
Если все значения Теория вероятностей и математическая статистика (рис. 757), Теория вероятностей и математическая статистика (рис. 758), ... , Теория вероятностей и математическая статистика (рис. 759) признака выборки объема Теория вероятностей и математическая статистика (рис. 760) различны, то выборочная дисперсия равна

Теория вероятностей и математическая статистика (рис. 761). (12.13)
Если же значения признака Теория вероятностей и математическая статистика (рис. 762), Теория вероятностей и математическая статистика (рис. 763), ... , Теория вероятностей и математическая статистика (рис. 764) имеют соответственно частоты Теория вероятностей и математическая статистика (рис. 765), Теория вероятностей и математическая статистика (рис. 766), ... , Теория вероятностей и математическая статистика (рис. 767), причем Теория вероятностей и математическая статистика (рис. 768), то в этом случае выборочная дисперсия равна

Теория вероятностей и математическая статистика (рис. 769). (12.14)

Выборочным средним квадратическим отклонением называется квадратный корень из генеральной дисперсии:

Теория вероятностей и математическая статистика (рис. 770). (12.15)

Пример 2. Выборочная совокупность задана следующей таблицей распределения:

Таблица 12.2
1234
2015105

Найти выборочную дисперсию и выборочное среднее квадратическое отклонение.
Решение. Найдем выборочную среднюю:

Теория вероятностей и математическая статистика (рис. 771).

Найдем выборочную дисперсию:

Теория вероятностей и математическая статистика (рис. 772).

Найдем выборочное среднее квадратическое отклонение:

Теория вероятностей и математическая статистика (рис. 773).

Дисперсии удобнее вычислять, используя следующие формулы:

Теория вероятностей и математическая статистика (рис. 774), (12.16)
Теория вероятностей и математическая статистика (рис. 775), (12.17)
Теория вероятностей и математическая статистика (рис. 776) (12.18)
Теория вероятностей и математическая статистика (рис. 777). (12.19)

Теперь пусть требуется по данным выборки оценить неизвестную генеральную дисперсию Теория вероятностей и математическая статистика (рис. 778). Выборочная дисперсия Теория вероятностей и математическая статистика (рис. 779) является смещенной оценкой Теория вероятностей и математическая статистика (рис. 780), так как

Теория вероятностей и математическая статистика (рис. 781). (12.20)

Если же в качестве оценки генеральной дисперсии принять исправленную дисперсию Теория вероятностей и математическая статистика (рис. 782), которая получается путем умножения Теория вероятностей и математическая статистика (рис. 783) на дробь Теория вероятностей и математическая статистика (рис. 784), то она будет несмещенной оценкой генеральной дисперсии. Действительно, учитывая (12.20), имеем

Теория вероятностей и математическая статистика (рис. 785) (12.21)
Теория вероятностей и математическая статистика (рис. 786). (12.22)

Вопросы для повторения и контроля:
1.Что называется статистической оценкой неизвестного параметра и какими важнейшими свойствами она может обладать?
2.Что такое несмещенная оценка и чем обосновывается ее введение?
3.Что такое эффективная оценка и в чем необходимость ее ввода?
4.Что называется смещенной оценкой и состоятельной оценкой?
5.Что такое генеральная средняя и по каким формулам она вычисляется?
6.Что называется выборочной средней и по каким формулам она вычисляется?
7.Какой оценкой генеральной средней является выборочная средняя?
8.Что такое генеральная дисперсия и по каким формулам она вычисляется?
9.Что называется выборочной дисперсией и по каким формулам она вычисляется?
10.Что такое генеральное среднее квадратическое отклонение и выборочное среднее квадратическое отклонение, для чего они, а также генеральная и выборочная дисперсии вводятся?
.По каким формулам удобнее вычислять дисперсии?
.Что является несмещенной оценкой генеральной дисперсии?
Опорные слова:
Статистическая оценка неизвестного параметра, несмещенная оценка, смещенная оценка, эффективная оценка, состоятельная оценка, генеральная средняя, выборочная средняя, генеральная дисперсия, генеральное среднее квадратическое отклонение, выборочная дисперсия, выборочное среднее квадратическое отклонение, исправленная дисперсия.

. Интервальные оценки. Доверительный интервал. Доверительные интервалы для неизвестных параметров нормального распределения

Имеется два способа оценки параметров: точечный и интервальный. Точечные методы указывают лишь точку, около которой находится неизвестный оцениваемый параметр. С помощью интервальных способов можно найти интервал, в котором с некоторой вероятностью находится неизвестное значение параметра.
Точечной называется оценка, которая определяется одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называется оценка, которая определяется двумя числами - концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная по данным выборки статистическая характеристика Теория вероятностей и математическая статистика (рис. 787) служит оценкой неизвестного параметра Теория вероятностей и математическая статистика (рис. 788). Если Теория вероятностей и математическая статистика (рис. 789) и Теория вероятностей и математическая статистика (рис. 790), то оценка Теория вероятностей и математическая статистика (рис. 791) тем точнее определяет параметр Теория вероятностей и математическая статистика (рис. 792), чем меньше Теория вероятностей и математическая статистика (рис. 793). Точность оценки характеризуется положительным числом Теория вероятностей и математическая статистика (рис. 794).
Однако нельзя категорически утверждать, что оценка Теория вероятностей и математическая статистика (рис. 795) удовлетворяет неравенству Теория вероятностей и математическая статистика (рис. 796). Статистические методы позволяют лишь говорить о вероятности, с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки Теория вероятностей и математическая статистика (рис. 797) по Теория вероятностей и математическая статистика (рис. 798) называется вероятность Теория вероятностей и математическая статистика (рис. 799), с которой осуществляется неравенство Теория вероятностей и математическая статистика (рис. 800), т.е.

Теория вероятностей и математическая статистика (рис. 801). (13.1)

В качестве Теория вероятностей и математическая статистика (рис. 802) берется число, близкое к единице.
Из неравенства Теория вероятностей и математическая статистика (рис. 803) легко можно получить двойное неравенство

Теория вероятностей и математическая статистика (рис. 804). (13.2)

Тогда соотношение (13.1) принимает следующий вид

Теория вероятностей и математическая статистика (рис. 805). (13.3)

Это соотношение означает следующее: вероятность того, что интервал Теория вероятностей и математическая статистика (рис. 806) заключает в себе (покрывает) неизвестный параметр Теория вероятностей и математическая статистика (рис. 807), равна Теория вероятностей и математическая статистика (рис. 808).
Интервал Теория вероятностей и математическая статистика (рис. 809) называется доверительным интервалом, который покрывает неизвестный параметр Теория вероятностей и математическая статистика (рис. 810) с заданной надежностью Теория вероятностей и математическая статистика (рис. 811).
Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение Теория вероятностей и математическая статистика (рис. 812) этого распределения известно. Требуется оценить неизвестное математическое ожидание Теория вероятностей и математическая статистика (рис. 813) по выборочной средней Теория вероятностей и математическая статистика (рис. 814). Поставим своей задачей найти доверительные интервалы, покрывающие параметр Теория вероятностей и математическая статистика (рис. 815) с надежностью Теория вероятностей и математическая статистика (рис. 816).
Будем рассматривать выборочную среднюю Теория вероятностей и математическая статистика (рис. 817) как случайную величину Теория вероятностей и математическая статистика (рис. 818) (Теория вероятностей и математическая статистика (рис. 819) изменяется от выборки к выборке) и выборочные значения признака Теория вероятностей и математическая статистика (рис. 820), Теория вероятностей и математическая статистика (рис. 821), ... , Теория вероятностей и математическая статистика (рис. 822) - как одинаково распределенные случайные величины Теория вероятностей и математическая статистика (рис. 823), Теория вероятностей и математическая статистика (рис. 824), ... , Теория вероятностей и математическая статистика (рис. 825) (эти числа также изменяются от выборки к выборке). Математическое ожидание каждой из этих величин равно Теория вероятностей и математическая статистика (рис. 826) и среднее квадратическое отклонение - Теория вероятностей и математическая статистика (рис. 827).
Тогда, используя свойство 6.2, следствие 6.2, а также формулу (12.6), получаем, что параметры распределения Теория вероятностей и математическая статистика (рис. 828) следующие:

Теория вероятностей и математическая статистика (рис. 829), Теория вероятностей и математическая статистика (рис. 830). (13.4)

Потребуем, чтобы выполнялось соотношение

Теория вероятностей и математическая статистика (рис. 831), (13.5)

где Теория вероятностей и математическая статистика (рис. 832) - заданная надежность.
Используя формулу (8.11) с заменой Теория вероятностей и математическая статистика (рис. 833) на Теория вероятностей и математическая статистика (рис. 834) и Теория вероятностей и математическая статистика (рис. 835) на Теория вероятностей и математическая статистика (рис. 836), нетрудно получить соотношение

Теория вероятностей и математическая статистика (рис. 837), (13.6)
где Теория вероятностей и математическая статистика (рис. 838).

Найдя из последнего равенства Теория вероятностей и математическая статистика (рис. 839), можно написать

Теория вероятностей и математическая статистика (рис. 840). (13.7)

Обозначая для общности выборочную среднюю вновь через Теория вероятностей и математическая статистика (рис. 841), из соотношений (13.5) - (13.7) получаем соотношения

Теория вероятностей и математическая статистика (рис. 842) (13.8)

И

Теория вероятностей и математическая статистика (рис. 843). (13.9)

Значит, с надежностью Теория вероятностей и математическая статистика (рис. 844) можно утверждать, что доверительный интервал Теория вероятностей и математическая статистика (рис. 845) покрывает неизвестный параметр Теория вероятностей и математическая статистика (рис. 846), при этом точность оценки равна Теория вероятностей и математическая статистика (рис. 847), а число Теория вероятностей и математическая статистика (рис. 848) определяется из равенства (13.8) по таблице функции Лапласа.
Пример 1. Случайная величина Х имеет нормальное распределение с известным средним квадратическим отклонением Теория вероятностей и математическая статистика (рис. 849). Найти доверительный интервал для оценки неизвестного математического ожидания Теория вероятностей и математическая статистика (рис. 850) по выборочной средней Теория вероятностей и математическая статистика (рис. 851), если объем выборки Теория вероятностей и математическая статистика (рис. 852) и задана надежность оценки Теория вероятностей и математическая статистика (рис. 853).
Решение. Найдем Теория вероятностей и математическая статистика (рис. 854). Из соотношения (13.8) получаем Теория вероятностей и математическая статистика (рис. 855) и по таблице функции Лапласа находим Теория вероятностей и математическая статистика (рис. 856).
Найдем точность оценки:

Теория вероятностей и математическая статистика (рис. 857).

Доверительный интервал таков: Теория вероятностей и математическая статистика (рис. 858). Например, если Теория вероятностей и математическая статистика (рис. 859), то доверительный интервал имеет следующие доверительные границы:

Теория вероятностей и математическая статистика (рис. 860); Теория вероятностей и математическая статистика (рис. 861).

Далее нам потребуются распределения "хи квадрат" и Стьюдента.
Пусть Теория вероятностей и математическая статистика (рис. 862) (Теория вероятностей и математическая статистика (рис. 863)) - нормальные независимые случайные величины, причем математическое ожидание каждой из них равно нулю, а среднее квадратическое отклонение - единице. Тогда сумма квадратов этих величин Теория вероятностей и математическая статистика (рис. 864) распределена по закону Теория вероятностей и математическая статистика (рис. 865) ("хи квадрат") с Теория вероятностей и математическая статистика (рис. 866) степенями свободы.
Функция плотности этого распределения имеет вид

Теория вероятностей и математическая статистика (рис. 867), (13.10)
где Теория вероятностей и математическая статистика (рис. 868) - гамма-функция.

Отсюда видно, что распределение "хи квадрат" определяется одним параметром - числом степеней свободы Теория вероятностей и математическая статистика (рис. 869).
Далее, пусть Теория вероятностей и математическая статистика (рис. 870) - нормальная случайная величина, причем Теория вероятностей и математическая статистика (рис. 871), Теория вероятностей и математическая статистика (рис. 872), а Теория вероятностей и математическая статистика (рис. 873) - независимая от Теория вероятностей и математическая статистика (рис. 874) случайная величина, которая распределена по закону Теория вероятностей и математическая статистика (рис. 875) с Теория вероятностей и математическая статистика (рис. 876) степенями свободы. Тогда случайная величина
Теория вероятностей и математическая статистика (рис. 877) (13.11)

имеет распределение, которое называется Теория вероятностей и математическая статистика (рис. 878)-распределением или распределением Стьюдента с Теория вероятностей и математическая статистика (рис. 879) степенями свободы.
Пусть теперь требуется оценить неизвестное математическое ожидание Теория вероятностей и математическая статистика (рис. 880) количественного признака Х генеральной совокупности, который распределен нормально, по выборочной средней Теория вероятностей и математическая статистика (рис. 881), когда среднее квадратическое отклонение Теория вероятностей и математическая статистика (рис. 882) этого распределения н е и з в е с т н о. Поставим своей задачей найти доверительные интервалы, покрывающие параметр Теория вероятностей и математическая статистика (рис. 883) с надежностью Теория вероятностей и математическая статистика (рис. 884).
Рассмотрим случайную величину

Теория вероятностей и математическая статистика (рис. 885), (13.12)

которая имеет распределение Стьюдента с Теория вероятностей и математическая статистика (рис. 886) степенями свободы. Здесь Теория вероятностей и математическая статистика (рис. 887) - выборочная средняя, Теория вероятностей и математическая статистика (рис. 888) - "исправленное" среднее квадратическое отклонение, Теория вероятностей и математическая статистика (рис. 889) - объем выборки.
Функция плотности распределения этой случайной величины равна

Теория вероятностей и математическая статистика (рис. 890), (13.13)
где Теория вероятностей и математическая статистика (рис. 891).

Отсюда видно, что распределение случайной величины (13.12) определяется параметром Теория вероятностей и математическая статистика (рис. 892) - объемом выборки и не зависит от неизвестных параметров Теория вероятностей и математическая статистика (рис. 893) и Теория вероятностей и математическая статистика (рис. 894).
Поскольку Теория вероятностей и математическая статистика (рис. 895) - четная функция от Теория вероятностей и математическая статистика (рис. 896), то вероятность осуществления неравенства

Теория вероятностей и математическая статистика (рис. 897) (13.14)

определяется на основании теоремы 7.1 из следующей формулы

Теория вероятностей и математическая статистика (рис. 898). (13.15)

Заменив неравенство (13.14) равносильным ему двойным неравенством, получаем соотношение

Теория вероятностей и математическая статистика (рис. 899). (13.16)

Итак, пользуясь распределением Стьюдента, мы нашли доверительный интервал Теория вероятностей и математическая статистика (рис. 900), покрывающий неизвестный параметр Теория вероятностей и математическая статистика (рис. 901) с надежностью Теория вероятностей и математическая статистика (рис. 902). Из специальной таблицы по заданным Теория вероятностей и математическая статистика (рис. 903) и Теория вероятностей и математическая статистика (рис. 904) можно найти Теория вероятностей и математическая статистика (рис. 905).
Пример 2. Количественный признак Х генеральной совокупности распределен нормально. По выборке объема Теория вероятностей и математическая статистика (рис. 906) найдены выборочная средняя Теория вероятностей и математическая статистика (рис. 907) и "исправленное" среднее квадратическое отклонение Теория вероятностей и математическая статистика (рис. 908). Оценить неизвестное математическое ожидание Теория вероятностей и математическая статистика (рис. 909) при помощи доверительного интервала с надежностью Теория вероятностей и математическая статистика (рис. 910).
Решение. Найдем Теория вероятностей и математическая статистика (рис. 911). Пользуясь таблицей, по Теория вероятностей и математическая статистика (рис. 912) и Теория вероятностей и математическая статистика (рис. 913) находим Теория вероятностей и математическая статистика (рис. 914).
Найдем доверительные границы:

Теория вероятностей и математическая статистика (рис. 915),
Теория вероятностей и математическая статистика (рис. 916).

Итак, с надежностью 0,95 неизвестный параметр Теория вероятностей и математическая статистика (рис. 917) заключен в доверительном интервале Теория вероятностей и математическая статистика (рис. 918).
Пусть количественный признак Х генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение Теория вероятностей и математическая статистика (рис. 919) по "исправленному" среднему квадратическому отклонению Теория вероятностей и математическая статистика (рис. 920). Поставим перед собой задачу найти доверительные интервалы, покрывающие параметр Теория вероятностей и математическая статистика (рис. 921) с заданной надежностью Теория вероятностей и математическая статистика (рис. 922).
Потребуем, чтобы выполнялось соотношение

Теория вероятностей и математическая статистика (рис. 923) (13.17)

или равносильное ему соотношение

Теория вероятностей и математическая статистика (рис. 924), (13.18)

где Теория вероятностей и математическая статистика (рис. 925) - заданная надежность.
Положив Теория вероятностей и математическая статистика (рис. 926) , из двойного неравенства

Теория вероятностей и математическая статистика (рис. 927) (13.19)

получаем неравенство

Теория вероятностей и математическая статистика (рис. 928). (13.20)

Для нахождения доверительного интервала, покрывающего параметр Теория вероятностей и математическая статистика (рис. 929), остается только найти Теория вероятностей и математическая статистика (рис. 930). С этой целью рассмотрим случайную величину

Теория вероятностей и математическая статистика (рис. 931), (13.21)

где Теория вероятностей и математическая статистика (рис. 932) - объем выборки (эта случайная величина обозначена через Теория вероятностей и математическая статистика (рис. 933) ввиду того, что случайная величина Теория вероятностей и математическая статистика (рис. 934) распределена по закону Теория вероятностей и математическая статистика (рис. 935) с Теория вероятностей и математическая статистика (рис. 936) степенями свободы).
Функция плотности распределения случайной величины Теория вероятностей и математическая статистика (рис. 937) имеет следующий вид

Теория вероятностей и математическая статистика (рис. 938). (13.22)

Это распределение не зависит от оцениваемого параметра Теория вероятностей и математическая статистика (рис. 939), а зависит лишь от объема выборки Теория вероятностей и математическая статистика (рис. 940).
Из неравенства (13.20) можно получить неравенство

Теория вероятностей и математическая статистика (рис. 941). (13.23)

Умножив все члены этого неравенства на Теория вероятностей и математическая статистика (рис. 942), получаем

Теория вероятностей и математическая статистика (рис. 943)

Или

Теория вероятностей и математическая статистика (рис. 944). (13.24)

Воспользовавшись теоремой 7.1, находим, что вероятность осуществления этого неравенства и, следовательно, равносильного ему неравенства (13.20), равна

Теория вероятностей и математическая статистика (рис. 945). (13.25)

Из этого уравнения можно по заданным Теория вероятностей и математическая статистика (рис. 946) и Теория вероятностей и математическая статистика (рис. 947) найти Теория вероятностей и математическая статистика (рис. 948). Однако на практике Теория вероятностей и математическая статистика (рис. 949) находится из специальной таблицы.
Вычислив по выборке Теория вероятностей и математическая статистика (рис. 950) и найдя по таблице Теория вероятностей и математическая статистика (рис. 951), получим искомый доверительный интервал Теория вероятностей и математическая статистика (рис. 952), покрывающий неизвестный параметр Теория вероятностей и математическая статистика (рис. 953) с заданной надежностью Теория вероятностей и математическая статистика (рис. 954).
Пример 3. Количественный признак Х генеральной совокупности распределен нормально. По выборке объема Теория вероятностей и математическая статистика (рис. 955) найдено "исправленное" среднее квадратическое отклонение Теория вероятностей и математическая статистика (рис. 956). Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение Теория вероятностей и математическая статистика (рис. 957) с надежностью Теория вероятностей и математическая статистика (рис. 958).
Решение. По специальной таблице по данным Теория вероятностей и математическая статистика (рис. 959) и Теория вероятностей и математическая статистика (рис. 960) найдем Теория вероятностей и математическая статистика (рис. 961).
Найдем искомый доверительный интервал:

Теория вероятностей и математическая статистика (рис. 962)

Или

Теория вероятностей и математическая статистика (рис. 963).

Вопросы для повторения и контроля:
1.Какие способы оценки параметров и связанные с ними оценки вы знаете?
2.Что такое точность оценки и надежность (доверительная вероятность)?
3.Что называется доверительным интервалом?
4.Как находится доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении?
.Что вы знаете о распределениях "хи квадрат" и Стьюдента?
.Как находится доверительный интервал для оценки математического ожидания нормального распределения при неизвестном среднем квадратическом отклонении?
.Как находится доверительный интервал для оценки среднего квадратического отклонения нормального распределения?
Опорные слова:
Точечная оценка, интервальная оценка, точность оценки, надежность (доверительная вероятность), доверительный интервал, доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении, распределение "хи квадрат", распределение Стьюдента, доверительный интервал для оценки математического ожидания нормального распределения при неизвестном среднем квадратическом отклонении, доверительный интервал для оценки среднего квадратического отклонения нормального распределения.

. Элементы корреляционного и регрессионного анализа

Корреляционный анализ и регрессионный анализ являются смежными разделами математической статистики и предназначены для изучения по выборочным данным статистической зависимости случайных величин. Две случайные величины могут быть связаны либо функциональной зависимостью, либо статистической зависимостью, либо быть независимыми.
Если каждому возможному значению случайной величины Теория вероятностей и математическая статистика (рис. 964) соответствует одно возможное значение случайной величины Теория вероятностей и математическая статистика (рис. 965), то Теория вероятностей и математическая статистика (рис. 966) называется функцией случайного аргумента Теория вероятностей и математическая статистика (рис. 967):

Теория вероятностей и математическая статистика (рис. 968),

а зависимость между случайными величинами Теория вероятностей и математическая статистика (рис. 969) и Теория вероятностей и математическая статистика (рис. 970) называется функциональной зависимостью.
Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, причем среди них могут быть и общие для обеих величин, т.е. такие факторы, которые воздействуют как на Теория вероятностей и математическая статистика (рис. 971), так и на Теория вероятностей и математическая статистика (рис. 972). В этом случае возникает статистическая зависимость. Статистической называется зависимость, при которой изменение одной из величин влечет изменение распределения другой. Частным случаем статистической зависимости является корреляционная зависимость.
Если статистическая зависимость проявляется в том, что при изменении одной из рассматриваемых случайных величин изменяется среднее значение другой случайной величины, то такая статистическая зависимость называется корреляционной.
Приведем пример случайной величины Теория вероятностей и математическая статистика (рис. 973), которая не связана с величиной Теория вероятностей и математическая статистика (рис. 974) функционально, а связана корреляционно. Пусть Теория вероятностей и математическая статистика (рис. 975) - урожай зерна, Теория вероятностей и математическая статистика (рис. 976) - количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, т.е. Теория вероятностей и математическая статистика (рис. 977) не является функцией от Теория вероятностей и математическая статистика (рис. 978). Это объясняется влиянием случайных факторов, таких, как осадки, температура воздуха и др. С другой стороны, средний урожай является функцией от количества удобрений, т.е. Теория вероятностей и математическая статистика (рис. 979) связан с Теория вероятностей и математическая статистика (рис. 980) корреляционной зависимостью.
Условным средним Теория вероятностей и математическая статистика (рис. 981) называется среднее арифметическое наблюдавшихся значений Теория вероятностей и математическая статистика (рис. 982), соответствующих Теория вероятностей и математическая статистика (рис. 983). Например, если при Теория вероятностей и математическая статистика (рис. 984) величина Теория вероятностей и математическая статистика (рис. 985) приняла значения Теория вероятностей и математическая статистика (рис. 986), Теория вероятностей и математическая статистика (рис. 987), Теория вероятностей и математическая статистика (рис. 988), то условное среднее равно

Теория вероятностей и математическая статистика (рис. 989).

Условным средним Теория вероятностей и математическая статистика (рис. 990) называется среднее арифметическое наблюдавшихся значений Теория вероятностей и математическая статистика (рис. 991), соответствующих Теория вероятностей и математическая статистика (рис. 992).
Как видно из определения, условное среднее Теория вероятностей и математическая статистика (рис. 993) является функцией от Теория вероятностей и математическая статистика (рис. 994); обозначив эту функцию через Теория вероятностей и математическая статистика (рис. 995), получим уравнение

Теория вероятностей и математическая статистика (рис. 996). (14.1)

Это уравнение называется выборочным уравнением регрессии Теория вероятностей и математическая статистика (рис. 997) на Теория вероятностей и математическая статистика (рис. 998); функция Теория вероятностей и математическая статистика (рис. 999) называется выборочной регрессией Теория вероятностей и математическая статистика (рис. 1000) на Теория вероятностей и математическая статистика (рис. 1001), а ее график - выборочной линией регрессии Теория вероятностей и математическая статистика (рис. 1002) на Теория вероятностей и математическая статистика (рис. 1003).
Аналогично уравнение

Теория вероятностей и математическая статистика (рис. 1004) (14.2)

называется выборочным уравнением регрессии Теория вероятностей и математическая статистика (рис. 1005) на Теория вероятностей и математическая статистика (рис. 1006); функция Теория вероятностей и математическая статистика (рис. 1007) называется выборочной регрессией Теория вероятностей и математическая статистика (рис. 1008) на Теория вероятностей и математическая статистика (рис. 1009), а ее график - выборочной линией регрессии Теория вероятностей и математическая статистика (рис. 1010) на Теория вероятностей и математическая статистика (рис. 1011).
В связи с вышеизложенным возникают две задачи теории корреляции. Первая - нахождение по данным наблюдений параметров функций Теория вероятностей и математическая статистика (рис. 1012) и Теория вероятностей и математическая статистика (рис. 1013) при условии, что известен их вид. Вторая - оценка силы (тесноты) связи между случайными величинами Теория вероятностей и математическая статистика (рис. 1014) и Теория вероятностей и математическая статистика (рис. 1015) и установление наличия корреляционной зависимости между этими величинами.
Пусть изучается система количественных признаков Теория вероятностей и математическая статистика (рис. 1016). В результате Теория вероятностей и математическая статистика (рис. 1017) независимых опытов получены Теория вероятностей и математическая статистика (рис. 1018) пар чисел Теория вероятностей и математическая статистика (рис. 1019), Теория вероятностей и математическая статистика (рис. 1020), ... , Теория вероятностей и математическая статистика (рис. 1021).
Найдем по данным наблюдений выборочное уравнение прямой линии регрессии. Для определенности будем искать уравнение

Теория вероятностей и математическая статистика (рис. 1022) (14.3)

регрессии Теория вероятностей и математическая статистика (рис. 1023) на Теория вероятностей и математическая статистика (рис. 1024).
Поскольку различные значения Теория вероятностей и математическая статистика (рис. 1025) признака Теория вероятностей и математическая статистика (рис. 1026) и соответствующие им значения Теория вероятностей и математическая статистика (рис. 1027) признака Теория вероятностей и математическая статистика (рис. 1028) наблюдались по одному разу, то группировать данные нет необходимости. Также нет надобности использовать понятие условной средней, поэтому уравнение (14.3) можно записать следующим образом:

Теория вероятностей и математическая статистика (рис. 1029). (14.4)

Угловой коэффициент прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1030) на Теория вероятностей и математическая статистика (рис. 1031) называется выборочным коэффициентом регрессии Теория вероятностей и математическая статистика (рис. 1032) на Теория вероятностей и математическая статистика (рис. 1033) и обозначается через Теория вероятностей и математическая статистика (рис. 1034). Следовательно, искомое выборочное уравнение (14.4) прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1035) на Теория вероятностей и математическая статистика (рис. 1036) следует искать в виде

Теория вероятностей и математическая статистика (рис. 1037). (14.5)

Нужно найти такие параметры Теория вероятностей и математическая статистика (рис. 1038) и Теория вероятностей и математическая статистика (рис. 1039), при которых точки Теория вероятностей и математическая статистика (рис. 1040), Теория вероятностей и математическая статистика (рис. 1041), ... , Теория вероятностей и математическая статистика (рис. 1042), построенные по данным наблюдений, на плоскости Теория вероятностей и математическая статистика (рис. 1043) лежали как можно ближе к прямой (14.5).
Для осуществления этого воспользуемся методом наименьших квадратов. При использовании этого метода сумма квадратов отклонений Теория вероятностей и математическая статистика (рис. 1044) (Теория вероятностей и математическая статистика (рис. 1045)), где Теория вероятностей и математическая статистика (рис. 1046) - вычисленная по уравнению (14.5) ордината, соответствующая наблюдаемому значению Теория вероятностей и математическая статистика (рис. 1047), а Теория вероятностей и математическая статистика (рис. 1048) - наблюдаемая ордината, соответствующая Теория вероятностей и математическая статистика (рис. 1049), должна быть минимальной. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция этих параметров:

Теория вероятностей и математическая статистика (рис. 1050) (14.6)

или

Теория вероятностей и математическая статистика (рис. 1051). (14.7)

Для отыскания минимума приравняем нулю соответствующие частные производные:

Теория вероятностей и математическая статистика (рис. 1052). (14.8)

Решив эту систему двух линейных уравнений относительно Теория вероятностей и математическая статистика (рис. 1053) и Теория вероятностей и математическая статистика (рис. 1054), найдем искомые параметры:

Теория вероятностей и математическая статистика (рис. 1055); (14.9)
Теория вероятностей и математическая статистика (рис. 1056). (14.10)

Аналогично можно найти выборочное уравнение прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1057) на Теория вероятностей и математическая статистика (рис. 1058):

Теория вероятностей и математическая статистика (рис. 1059), (14.11)

где Теория вероятностей и математическая статистика (рис. 1060) - выборочный коэффициент регрессии Теория вероятностей и математическая статистика (рис. 1061) на Теория вероятностей и математическая статистика (рис. 1062).
Пример 1. Найти выборочное уравнение прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1063) на Теория вероятностей и математическая статистика (рис. 1064) по данным Теория вероятностей и математическая статистика (рис. 1065) наблюдений:

Таблица 14.1
1,001,503,004,505,00
1,251,401,501,752,25

Решение. Составим следующую расчетную табл. 14.2.
Найдем искомые параметры из соотношений (14.9) и (14.10):

Теория вероятностей и математическая статистика (рис. 1066);
Теория вероятностей и математическая статистика (рис. 1067).

Напишем искомое уравнение прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1068) на Теория вероятностей и математическая статистика (рис. 1069):

Теория вероятностей и математическая статистика (рис. 1070).

Таблица 14.2
1,001,251,001,250
1,501,402,252,100
3,001,509,004,500
4,501,7520,257,875
5,002,2525,0011,250
=15=8,15=57,50=26,975

При большом числе наблюдений одно и тоже значение Теория вероятностей и математическая статистика (рис. 1071) может встретится Теория вероятностей и математическая статистика (рис. 1072) раз, одно и тоже значение Теория вероятностей и математическая статистика (рис. 1073) - Теория вероятностей и математическая статистика (рис. 1074) раз, одна и та же пара чисел Теория вероятностей и математическая статистика (рис. 1075) может наблюдаться Теория вероятностей и математическая статистика (рис. 1076) раз. Поэтому данные наблюдений следует группировать, для этого подсчитываются частоты Теория вероятностей и математическая статистика (рис. 1077), Теория вероятностей и математическая статистика (рис. 1078), Теория вероятностей и математическая статистика (рис. 1079). Все сгруппированные данные записываются в виде таблицы (например, табл. 14.3), которая называется корреляционной.

Таблица 14.3
10203040
0,45-71426
0,6-26412
0,8319--22
8211318

В первой строке корреляционной таблицы 14.3 указаны наблюдаемые значения (10; 20; 30; 40) признака Теория вероятностей и математическая статистика (рис. 1080), а в первом столбце - наблюдаемые значения (0,4; 0,6; 0,8) признака Теория вероятностей и математическая статистика (рис. 1081). На пересечении строк и столбцов находятся частоты Теория вероятностей и математическая статистика (рис. 1082) наблюдаемых пар значений признаков.
В последнем столбце записаны суммы частот строк, а в последней строке - суммы частот столбцов. В клетке, расположенной в нижнем правом углу таблицы, помещена сумма всех частот, т.е. общее число всех наблюдений Теория вероятностей и математическая статистика (рис. 1083). Очевидно, что

Теория вероятностей и математическая статистика (рис. 1084).

Теперь определим параметры выборочного уравнения прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1085) на Теория вероятностей и математическая статистика (рис. 1086) в случае, когда получено большое число данных (практически для удовлетворительной оценки искомых параметров должно быть хотя бы 50 наблюдений), среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы.
Из системы (14.8) можно получить следующую систему:

Теория вероятностей и математическая статистика (рис. 1087). (14.12)

Для простоты приняв обозначения Теория вероятностей и математическая статистика (рис. 1088), Теория вероятностей и математическая статистика (рис. 1089), Теория вероятностей и математическая статистика (рис. 1090), Теория вероятностей и математическая статистика (рис. 1091) и воспользовавшись соотношениями Теория вероятностей и математическая статистика (рис. 1092), Теория вероятностей и математическая статистика (рис. 1093), Теория вероятностей и математическая статистика (рис. 1094), Теория вероятностей и математическая статистика (рис. 1095) (в предположении, что пара чисел Теория вероятностей и математическая статистика (рис. 1096) наблюдалась Теория вероятностей и математическая статистика (рис. 1097) раз), из (14.12) получаем

Теория вероятностей и математическая статистика (рис. 1098). (14.13)

Второе уравнение системы (14.13) преобразуем к виду Теория вероятностей и математическая статистика (рис. 1099) и подставив правую часть этого равенства в уравнение Теория вероятностей и математическая статистика (рис. 1100), получим следующее соотношение

Теория вероятностей и математическая статистика (рис. 1101). (14.14)

Учитывая соотношения (12.15) и (12.19), найдем из системы (14.13) выборочный коэффициент регрессии Теория вероятностей и математическая статистика (рис. 1102):

Теория вероятностей и математическая статистика (рис. 1103).
Умножим обе части этого равенства на дробь Теория вероятностей и математическая статистика (рис. 1104):

Теория вероятностей и математическая статистика (рис. 1105). (14.15)

Обозначим правую часть равенства (14.15) через Теория вероятностей и математическая статистика (рис. 1106):

Теория вероятностей и математическая статистика (рис. 1107). (14.16)

Тогда из (14.15) получаем

Теория вероятностей и математическая статистика (рис. 1108). (14.17)

Подставив правую часть этого равенства в (14.14), окончательно получим выборочное уравнение прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1109) на Теория вероятностей и математическая статистика (рис. 1110) вида

Теория вероятностей и математическая статистика (рис. 1111). (14.18)

Аналогично можно найти выборочное уравнение прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1112) на Теория вероятностей и математическая статистика (рис. 1113):

Теория вероятностей и математическая статистика (рис. 1114). (14.19)

Вопросы для повторения и контроля:
1.Что изучают корреляционный и регрессионный анализ, как могут быть связаны случайные величины, что такое функция случайного аргумента и функциональная зависимость?
2.Что вы знаете о статистической зависимости и корреляционной зависимости?
.Что такое условное среднее, выборочное уравнение регрессии, выборочная регрессия, выборочная линия регрессии, и какие две задачи теории корреляции вы знаете?
.В каком виде ищется выборочное уравнение прямой линии регрессии по несгруппированным данным и что такое выборочный коэффициент регрессии?
.В чем суть метода наименьших квадратов и как с его помощью находится выборочное уравнение прямой линии регрессии?
.Что вы знаете о корреляционной таблице?
.Как находятся параметры выборочного уравнения прямой линии регрессии по сгруппированным данным?
Опорные слова:
Корреляционный анализ, регрессионный анализ, функция случайного аргумента, функциональная зависимость, статистическая зависимость, корреляционная зависимость, условное среднее, выборочное уравнение регрессии, выборочная регрессия, выборочная линия регрессии, две задачи теории корреляции, выборочное уравнение прямой линии регрессии по несгруппированным данным, выборочный коэффициент регрессии, метод наименьших квадратов, корреляционная таблица, выборочное уравнение прямой линии регрессии по сгруппированным данным.

15. Выборочный коэффициент корреляции и его свойства

Корреляционным моментом Теория вероятностей и математическая статистика (рис. 1115) случайных величин Теория вероятностей и математическая статистика (рис. 1116) и Теория вероятностей и математическая статистика (рис. 1117) называется математическое ожидание произведения отклонений этих величин:

Теория вероятностей и математическая статистика (рис. 1118). (15.1)

Отсюда легко можно получить соотношение

Теория вероятностей и математическая статистика (рис. 1119). (15.2)

Коэффициентом корреляции Теория вероятностей и математическая статистика (рис. 1120) случайных величин Теория вероятностей и математическая статистика (рис. 1121) и Теория вероятностей и математическая статистика (рис. 1122) называется отношение корреляционного момента к произведению средних квадратических отклонений этих величин:

Теория вероятностей и математическая статистика (рис. 1123). (15.3)

Из соотношения (15.2) вытекает, что корреляционный момент и, следовательно, коэффициент корреляции независимых случайных величин равен нулю.
Две случайные величины Теория вероятностей и математическая статистика (рис. 1124) и Теория вероятностей и математическая статистика (рис. 1125) называются коррелированными, если их коэффициент корреляции отличен от нуля; Теория вероятностей и математическая статистика (рис. 1126) и Теория вероятностей и математическая статистика (рис. 1127) называются некоррелированными величинами, если их коэффициент корреляции равен нулю.
Из вышесказанного следует, что независимые случайные величины всегда являются некоррелированными, а две коррелированные случайные величины также и зависимы. Действительно, если предположить, что коррелированные случайные величины независимы, то для них должно выполняться соотношение Теория вероятностей и математическая статистика (рис. 1128), а это противоречит тому, что для коррелированных величин всегда выполняется Теория вероятностей и математическая статистика (рис. 1129).
С другой стороны, две зависимые случайные величины могут быть как коррелированными, так и некоррелированными; некоррелированные случайные величины могут быть как зависимыми, так и независимыми.
Если случайные величины Теория вероятностей и математическая статистика (рис. 1130) и Теория вероятностей и математическая статистика (рис. 1131) независимы, то коэффициент корреляции Теория вероятностей и математическая статистика (рис. 1132); если Теория вероятностей и математическая статистика (рис. 1133), то случайные величины Теория вероятностей и математическая статистика (рис. 1134) и Теория вероятностей и математическая статистика (рис. 1135) связаны линейной функциональной зависимостью. Отсюда следует, что коэффициент корреляции измеряет силу (тесноту) линейной связи между Теория вероятностей и математическая статистика (рис. 1136) и Теория вероятностей и математическая статистика (рис. 1137).
Величина Теория вероятностей и математическая статистика (рис. 1138), определяемая равенством

Теория вероятностей и математическая статистика (рис. 1139), (15.4)

называется выборочным коэффициентом корреляции. Здесь Теория вероятностей и математическая статистика (рис. 1140) и Теория вероятностей и математическая статистика (рис. 1141) - варианты (наблюдавшиеся значения) признаков Теория вероятностей и математическая статистика (рис. 1142) и Теория вероятностей и математическая статистика (рис. 1143); Теория вероятностей и математическая статистика (рис. 1144) - частота пары вариант Теория вероятностей и математическая статистика (рис. 1145); Теория вероятностей и математическая статистика (рис. 1146) - объем выборки (сумма всех частот); Теория вероятностей и математическая статистика (рис. 1147), Теория вероятностей и математическая статистика (рис. 1148) - выборочные средние квадратические отклонения; Теория вероятностей и математическая статистика (рис. 1149), Теория вероятностей и математическая статистика (рис. 1150) - выборочные средние.
Выборочный коэффициент корреляции Теория вероятностей и математическая статистика (рис. 1151) является оценкой коэффициента корреляции Теория вероятностей и математическая статистика (рис. 1152) генеральной совокупности. Поэтому его можно использовать и для измерения линейной связи между величинами - количественными признаками Теория вероятностей и математическая статистика (рис. 1153) и Теория вероятностей и математическая статистика (рис. 1154).
Пример 1. Найти выборочное уравнение прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1155) на Теория вероятностей и математическая статистика (рис. 1156) по данным следующей корреляционной таблицы:
Таблица 15.1
102030405060
1557----12
25-2023---43
35--30472-79
45--101120647
55---97319
5276367299

Решение. Сначала вычислим выборочный коэффициент корреляции по формуле (15.4):

Теория вероятностей и математическая статистика (рис. 1157);
Теория вероятностей и математическая статистика (рис. 1158);
Теория вероятностей и математическая статистика (рис. 1159)
Теория вероятностей и математическая статистика (рис. 1160);
Теория вероятностей и математическая статистика (рис. 1161);
Теория вероятностей и математическая статистика (рис. 1162);
Теория вероятностей и математическая статистика (рис. 1163);
Теория вероятностей и математическая статистика (рис. 1164)
Теория вероятностей и математическая статистика (рис. 1165)
Теория вероятностей и математическая статистика (рис. 1166);
Теория вероятностей и математическая статистика (рис. 1167).

Теперь подставим найденные значения в формулу (14.18) и получим выборочное уравнение прямой линии регрессии Теория вероятностей и математическая статистика (рис. 1168) на Теория вероятностей и математическая статистика (рис. 1169):
Теория вероятностей и математическая статистика (рис. 1170)

или окончательно

Теория вероятностей и математическая статистика (рис. 1171).

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученное по данным выборки, в известной степени может быть распространено и на генеральную совокупность. Например, для оценки коэффициента корреляции Теория вероятностей и математическая статистика (рис. 1172) нормально распределенной генеральной совокупности (при Теория вероятностей и математическая статистика (рис. 1173)) можно воспользоваться формулой

Теория вероятностей и математическая статистика (рис. 1174).

Итак, для оценки тесноты линейной корреляционной связи между признаками в выборке служит выборочный коэффициент корреляции. Для оценки тесноты нелинейной корреляционной связи вводится понятие выборочного корреляционного отношения.
Выборочным корреляционным отношением Теория вероятностей и математическая статистика (рис. 1175) к Теория вероятностей и математическая статистика (рис. 1176) называется следующее отношение

Теория вероятностей и математическая статистика (рис. 1177). (15.5)

Здесь
Теория вероятностей и математическая статистика (рис. 1178);
Теория вероятностей и математическая статистика (рис. 1179),

де Теория вероятностей и математическая статистика (рис. 1180) - объем выборки (сумма всех частот); Теория вероятностей и математическая статистика (рис. 1181) - частота значения Теория вероятностей и математическая статистика (рис. 1182) признака Теория вероятностей и математическая статистика (рис. 1183); Теория вероятностей и математическая статистика (рис. 1184) - частота значения Теория вероятностей и математическая статистика (рис. 1185) признака Теория вероятностей и математическая статистика (рис. 1186); Теория вероятностей и математическая статистика (рис. 1187) - общая средняя признака Теория вероятностей и математическая статистика (рис. 1188); Теория вероятностей и математическая статистика (рис. 1189) - условная средняя признака Теория вероятностей и математическая статистика (рис. 1190).
Аналогично определяется выборочное корреляционное отношение Теория вероятностей и математическая статистика (рис. 1191) к Теория вероятностей и математическая статистика (рис. 1192):

Теория вероятностей и математическая статистика (рис. 1193). (15.6)

Пример 2. Найти Теория вероятностей и математическая статистика (рис. 1194) по данным следующей корреляционной таблицы:

Таблица 15.2
102030
15428638
256-612
102812
211520

Решение. Сначала найдем Теория вероятностей и математическая статистика (рис. 1195), Теория вероятностей и математическая статистика (рис. 1196) и Теория вероятностей и математическая статистика (рис. 1197):

Теория вероятностей и математическая статистика (рис. 1198);
Теория вероятностей и математическая статистика (рис. 1199);
Теория вероятностей и математическая статистика (рис. 1200)Теория вероятностей и математическая статистика (рис. 1201).
Теперь подставим все эти значения в формулу (15.5) и найдем Теория вероятностей и математическая статистика (рис. 1202):

Теория вероятностей и математическая статистика (рис. 1203).

Перечислим свойства выборочного корреляционного отношения.
Свойство 15.1. Выборочное корреляционное отношение удовлетворяет двойному неравенству

Теория вероятностей и математическая статистика (рис. 1204).

Свойство 15.2. Если Теория вероятностей и математическая статистика (рис. 1205), то признак Теория вероятностей и математическая статистика (рис. 1206) с признаком Теория вероятностей и математическая статистика (рис. 1207) корреляционной зависимостью не связан.
Свойство 15.3. Если Теория вероятностей и математическая статистика (рис. 1208), то признак Теория вероятностей и математическая статистика (рис. 1209) связан с признаком Теория вероятностей и математическая статистика (рис. 1210) функциональной зависимостью.
Свойство 15.4. Выборочное корреляционное отношение не меньше абсолютной величины выборочного коэффициента корреляции: Теория вероятностей и математическая статистика (рис. 1211).
Свойство 15.5. Если выборочное корреляционное отношение равно абсолютной величине выборочного коэффициента корреляции, то имеет место точная линейная корреляционная зависимость.
Вопросы для повторения и контроля:
1.Что называется корреляционным моментом и что называется коэффициентом корреляции?
2.Что такое коррелированные и некоррелированные случайные величины, и какова связь между понятиями зависимости и коррелированности случайных величин?
.Что вы знаете о выборочном коэффициенте корреляции?
.Что такое выборочное корреляционное отношение и для чего оно служит?
.Какие свойства выборочного корреляционного отношения вы знаете?
Опорные слова:
Корреляционный момент, коэффициент корреляции, коррелированные случайные величины, некоррелированные случайные величины, выборочный коэффициент корреляции, выборочное корреляционное отношение.

. Статистические гипотезы и их классификация. Статистический критерий

Пусть требуется определить закон распределения генеральной совокупности и назовем его А. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид, выдвигают гипотезу: генеральная совокупность распределена по закону А. Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.
Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр Теория вероятностей и математическая статистика (рис. 1212) равен определенному значению Теория вероятностей и математическая статистика (рис. 1213), то выдвигают гипотезу: Теория вероятностей и математическая статистика (рис. 1214). Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
Статистической называется гипотеза о виде неизвестного распределения или гипотеза о параметрах известных распределений. Например, статистическими являются гипотезы:
1)генеральная совокупность распределена по закону Пуассона;
2)дисперсии двух нормальных совокупностей равны между собой.
В первой гипотезе сделано предположение о виде неизвестного распределения, во второй - о параметрах двух известных распределений.
Нулевой (основной) называется выдвинутая гипотеза Теория вероятностей и математическая статистика (рис. 1215).
Конкурирующей (альтернативной) называется гипотеза Теория вероятностей и математическая статистика (рис. 1216), которая противоречит нулевой.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание Теория вероятностей и математическая статистика (рис. 1217) нормального распределения равно 10, то конкурирующая гипотеза может состоять в предположении, что Теория вероятностей и математическая статистика (рис. 1218); т.е. Теория вероятностей и математическая статистика (рис. 1219):Теория вероятностей и математическая статистика (рис. 1220); Теория вероятностей и математическая статистика (рис. 1221):Теория вероятностей и математическая статистика (рис. 1222).
Простой называется гипотеза, содержащая только одно предположение. Например, гипотеза Теория вероятностей и математическая статистика (рис. 1223): математическое ожидание нормального распределения равно 3 (Теория вероятностей и математическая статистика (рис. 1224) известно) - простая.
Сложной называется гипотеза, которая состоит из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза Теория вероятностей и математическая статистика (рис. 1225):Теория вероятностей и математическая статистика (рис. 1226) состоит из бесчисленного множества простых гипотез вида Теория вероятностей и математическая статистика (рис. 1227):Теория вероятностей и математическая статистика (рис. 1228), где Теория вероятностей и математическая статистика (рис. 1229) - любое число, большее 5.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость статистической (производимой статистическими методами) проверки этой гипотезы. В итоге статистической проверки гипотезы могут быть допущены ошибки.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Для проверки нулевой гипотезы используется специально подобранная случайная величина, точное или приближенное распределение которой известно. Эта случайная величина обозначается через Теория вероятностей и математическая статистика (рис. 1230) и называется статистическим критерием (или просто критерием).
Приведем пример статистического критерия. Если проверяется гипотеза о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия Теория вероятностей и математическая статистика (рис. 1231) принимается отношение исправленных выборочных дисперсий:
Теория вероятностей и математическая статистика (рис. 1232).

Наблюдаемым значением Теория вероятностей и математическая статистика (рис. 1233) называется значение критерия, вычисленное по выборкам. Например, если по двум выборкам найдены исправленные выборочные дисперсии Теория вероятностей и математическая статистика (рис. 1234) и Теория вероятностей и математическая статистика (рис. 1235), то наблюдаемое значение критерия Теория вероятностей и математическая статистика (рис. 1236) равно

Теория вероятностей и математическая статистика (рис. 1237).

После выбора определенного критерия множество всех его возможных значений разбивается на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая - при которых она принимается.
Критической областью называется совокупность значений критерия, при которых нулевая гипотеза отвергается.
Областью принятия гипотезы (областью допустимых значений) называется совокупность значений критерия, при которых нулевая гипотеза принимается.
Поскольку критерий Теория вероятностей и математическая статистика (рис. 1238) - одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.
Критическими точками (границами) Теория вероятностей и математическая статистика (рис. 1239) называются точки, отделяющие критическую область от области принятия гипотезы.
Правосторонней называется критическая область, определяемая неравенством Теория вероятностей и математическая статистика (рис. 1240), где Теория вероятностей и математическая статистика (рис. 1241) - положительное число (рис. 16.1).

Теория вероятностей и математическая статистика (рис. 1242)
Рис. 16.1.

Левосторонней называется критическая область, определяемая неравенством Теория вероятностей и математическая статистика (рис. 1243), где Теория вероятностей и математическая статистика (рис. 1244) - отрицательное число (рис. 16.2).

Теория вероятностей и математическая статистика (рис. 1245)
Рис. 16.2.

Односторонней называется правосторонняя или левосторонняя критическая область.
Двусторонней называется критическая область, определяемая неравенствами Теория вероятностей и математическая статистика (рис. 1246), Теория вероятностей и математическая статистика (рис. 1247), где Теория вероятностей и математическая статистика (рис. 1248).
В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами (в предположении, что Теория вероятностей и математическая статистика (рис. 1249)) Теория вероятностей и математическая статистика (рис. 1250), Теория вероятностей и математическая статистика (рис. 1251), или равносильным неравенством Теория вероятностей и математическая статистика (рис. 1252) (рис. 16.3).

Теория вероятностей и математическая статистика (рис. 1253)
Рис. 16.3.

Для нахождения критической области достаточно найти критическую точку (точки). Для нахождения же такой точки задается достаточно малая вероятность - уровень значимости Теория вероятностей и математическая статистика (рис. 1254). Затем критическая точка Теория вероятностей и математическая статистика (рис. 1255) ищется исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий Теория вероятностей и математическая статистика (рис. 1256) примет значения из критической области, была равна принятому уровню значимости.
Например, для правосторонней критической области должно выполняться соотношение

Теория вероятностей и математическая статистика (рис. 1257), (16.1)

для левосторонней -

Теория вероятностей и математическая статистика (рис. 1258), (16.2)

а для двусторонней -

Теория вероятностей и математическая статистика (рис. 1259). (16.3)

Для каждого критерия имеются соответствующие таблицы, по которым и находится критическая точка, удовлетворяющая требованиям вида (16.1) - (16.3).
Если распределение критерия симметрично относительно нуля и имеются основания выбрать симметричные относительно нуля точки Теория вероятностей и математическая статистика (рис. 1260) и Теория вероятностей и математическая статистика (рис. 1261) (Теория вероятностей и математическая статистика (рис. 1262)), то Теория вероятностей и математическая статистика (рис. 1263). Учитывая это соотношение, из (16.3) для двусторонней критической области получим соотношение

Теория вероятностей и математическая статистика (рис. 1264). (16.4)

Мощностью критерия называется вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.
Пусть для проверки гипотезы принят определенный уровень значимости, и выборка имеет фиксированный объем. Если Теория вероятностей и математическая статистика (рис. 1265) - вероятность ошибки второго рода, т.е. события "принята нулевая гипотеза, причем справедлива конкурирующая", то мощность критерия равна Теория вероятностей и математическая статистика (рис. 1266).
Пусть мощность Теория вероятностей и математическая статистика (рис. 1267) возрастает; следовательно, уменьшается вероятность Теория вероятностей и математическая статистика (рис. 1268) совершить ошибку второго рода. Таким образом, чем мощность больше, тем меньше вероятность ошибки второго рода.
Итак, если уровень значимости уже выбран, то критическую область следует строить так, чтобы мощность критерия была максимальной. Это позволит минимизировать ошибку второго рода.
Далее нам потребуется распределение Фишера - Снедекора.
Если Теория вероятностей и математическая статистика (рис. 1269) и Теория вероятностей и математическая статистика (рис. 1270) - независимые случайные величины, распределенные по закону Теория вероятностей и математическая статистика (рис. 1271) со степенями свободы Теория вероятностей и математическая статистика (рис. 1272) и Теория вероятностей и математическая статистика (рис. 1273), то величина

Теория вероятностей и математическая статистика (рис. 1274) (16.5)

имеет распределение, которое называется распределением Теория вероятностей и математическая статистика (рис. 1275) Фишера - Снедекора со степенями свободы Теория вероятностей и математическая статистика (рис. 1276) и Теория вероятностей и математическая статистика (рис. 1277).
Функция плотности этого распределения имеет вид

Теория вероятностей и математическая статистика (рис. 1278),
Где Теория вероятностей и математическая статистика (рис. 1279).

Распределение Теория вероятностей и математическая статистика (рис. 1280) определяется двумя параметрами - числами степеней свободы Теория вероятностей и математическая статистика (рис. 1281) и Теория вероятностей и математическая статистика (рис. 1282).
Пусть генеральные совокупности Теория вероятностей и математическая статистика (рис. 1283) и Теория вероятностей и математическая статистика (рис. 1284) распределены нормально. По независимым выборкам с объемами, соответственно равными Теория вероятностей и математическая статистика (рис. 1285) и Теория вероятностей и математическая статистика (рис. 1286), извлеченным из этих совокупностей, найдены исправленные выборочные дисперсии Теория вероятностей и математическая статистика (рис. 1287) и Теория вероятностей и математическая статистика (рис. 1288). Требуется по исправленным дисперсиям при заданном уровне значимости Теория вероятностей и математическая статистика (рис. 1289) проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой:

Теория вероятностей и математическая статистика (рис. 1290):Теория вероятностей и математическая статистика (рис. 1291). (16.6)

Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий, т.е.

Теория вероятностей и математическая статистика (рис. 1292), Теория вероятностей и математическая статистика (рис. 1293),

нулевую гипотезу можно записать так:

Теория вероятностей и математическая статистика (рис. 1294):Теория вероятностей и математическая статистика (рис. 1295). (16.7)

На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений и т.д. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т.е. наименьшую дисперсию.
В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий принимается отношение большей исправленной дисперсии к меньшей, т.е. случайная величина
Теория вероятностей и математическая статистика (рис. 1296). (16.8)

Величина Теория вероятностей и математическая статистика (рис. 1297) при условии справедливости нулевой гипотезы имеет распределение Фишера - Снедекора со степенями свободы Теория вероятностей и математическая статистика (рис. 1298) и Теория вероятностей и математическая статистика (рис. 1299), где Теория вероятностей и математическая статистика (рис. 1300) - объем выборки, по которой вычислена большая исправленная дисперсия, Теория вероятностей и математическая статистика (рис. 1301) - объем выборки, по которой найдена меньшая исправленная дисперсия.
Критическая область строится в зависимости от вида конкурирующей гипотезы.
Первый случай. Нулевая гипотеза Теория вероятностей и математическая статистика (рис. 1302):Теория вероятностей и математическая статистика (рис. 1303). Конкурирующая гипотеза Теория вероятностей и математическая статистика (рис. 1304):Теория вероятностей и математическая статистика (рис. 1305).
В этом случае строится правосторонняя критическая область, исходя из требования, чтобы вероятность попадания критерия Теория вероятностей и математическая статистика (рис. 1306) в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости:

Теория вероятностей и математическая статистика (рис. 1307). (16.9)

Критическая точка Теория вероятностей и математическая статистика (рис. 1308) находится по таблице критических точек распределения Фишера - Снедекора.
Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу Теория вероятностей и математическая статистика (рис. 1309):Теория вероятностей и математическая статистика (рис. 1310) о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Теория вероятностей и математическая статистика (рис. 1311):Теория вероятностей и математическая статистика (рис. 1312), надо вычислить отношение большей исправленной дисперсии к меньшей, т.е.

Теория вероятностей и математическая статистика (рис. 1313), (16.10)

и по таблице критических точек распределения Фишера - Снедекора, по заданному уровню значимости Теория вероятностей и математическая статистика (рис. 1314) и числам степеней свободы Теория вероятностей и математическая статистика (рис. 1315) и Теория вероятностей и математическая статистика (рис. 1316) (Теория вероятностей и математическая статистика (рис. 1317) - число степеней свободы большей исправленной дисперсии) найти критическую точку Теория вероятностей и математическая статистика (рис. 1318).
Если Теория вероятностей и математическая статистика (рис. 1319) - нет оснований отвергнуть нулевую гипотезу. Если Теория вероятностей и математическая статистика (рис. 1320) - нулевая гипотеза отвергается.
Пример 1. По двум независимым выборкам объемов Теория вероятностей и математическая статистика (рис. 1321) и Теория вероятностей и математическая статистика (рис. 1322), извлеченным из нормальных генеральных совокупностей Теория вероятностей и математическая статистика (рис. 1323) и Теория вероятностей и математическая статистика (рис. 1324), найдены исправленные выборочные дисперсии Теория вероятностей и математическая статистика (рис. 1325) и Теория вероятностей и математическая статистика (рис. 1326). При уровне значимости 0,05 проверить нулевую гипотезу Теория вероятностей и математическая статистика (рис. 1327):Теория вероятностей и математическая статистика (рис. 1328) о равенстве генеральных дисперсий при конкурирующей гипотезе Теория вероятностей и математическая статистика (рис. 1329):Теория вероятностей и математическая статистика (рис. 1330)
Решение. Найдем отношение большей исправленной дисперсии к меньшей:

Теория вероятностей и математическая статистика (рис. 1331).

Конкурирующая гипотеза имеет вид Теория вероятностей и математическая статистика (рис. 1332), поэтому критическая область - правосторонняя.
По таблице критических точек распределения Фишера - Снедекора, по уровню значимости Теория вероятностей и математическая статистика (рис. 1333) и числам степеней свободы Теория вероятностей и математическая статистика (рис. 1334) и Теория вероятностей и математическая статистика (рис. 1335) находим критическую точку Теория вероятностей и математическая статистика (рис. 1336).
Так как Теория вероятностей и математическая статистика (рис. 1337), то нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий.
Второй случай. Нулевая гипотеза Теория вероятностей и математическая статистика (рис. 1338):Теория вероятностей и математическая статистика (рис. 1339). Конкурирующая гипотеза Теория вероятностей и математическая статистика (рис. 1340):Теория вероятностей и математическая статистика (рис. 1341).
В этом случае строится двусторонняя критическая область, исходя из требования, чтобы вероятность попадания критерия Теория вероятностей и математическая статистика (рис. 1342) в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости Теория вероятностей и математическая статистика (рис. 1343).
Наибольшая мощность критерия (вероятность попадания критерия в критическую область при справедливости конкурирующей гипотезы) достигается тогда, когда вероятность попадания критерия в каждый из двух интервалов критической области равна Теория вероятностей и математическая статистика (рис. 1344).
Если обозначить через Теория вероятностей и математическая статистика (рис. 1345) левую границу критической области и через Теория вероятностей и математическая статистика (рис. 1346) - правую, то должны иметь место соотношения:

Теория вероятностей и математическая статистика (рис. 1347), Теория вероятностей и математическая статистика (рис. 1348). (16.11)

Для обеспечения попадания критерия Теория вероятностей и математическая статистика (рис. 1349) в двустороннюю критическую область с вероятностью, равной принятому уровню значимости Теория вероятностей и математическая статистика (рис. 1350), в случае конкурирующей гипотезы Теория вероятностей и математическая статистика (рис. 1351):Теория вероятностей и математическая статистика (рис. 1352) достаточно найти критическую точку

Теория вероятностей и математическая статистика (рис. 1353).

Правило 2. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу Теория вероятностей и математическая статистика (рис. 1354):Теория вероятностей и математическая статистика (рис. 1355) о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Теория вероятностей и математическая статистика (рис. 1356):Теория вероятностей и математическая статистика (рис. 1357), надо вычислить отношение большей исправленной дисперсии к меньшей, т.е. (16.10) и по таблице критических точек распределения Фишера - Снедекора, по заданному уровню значимости Теория вероятностей и математическая статистика (рис. 1358) (вдвое меньшем заданного) и числам степеней свободы Теория вероятностей и математическая статистика (рис. 1359) и Теория вероятностей и математическая статистика (рис. 1360) (Теория вероятностей и математическая статистика (рис. 1361) - число степеней свободы большей исправленной дисперсии) найти критическую точку Теория вероятностей и математическая статистика (рис. 1362).
Если Теория вероятностей и математическая статистика (рис. 1363) - нет оснований отвергнуть нулевую гипотезу. Если Теория вероятностей и математическая статистика (рис. 1364) - нулевая гипотеза отвергается.
Пример 2. По двум независимым выборкам объемов Теория вероятностей и математическая статистика (рис. 1365) и Теория вероятностей и математическая статистика (рис. 1366), извлеченным из нормальных генеральных совокупностей Теория вероятностей и математическая статистика (рис. 1367) и Теория вероятностей и математическая статистика (рис. 1368), найдены исправленные выборочные дисперсии Теория вероятностей и математическая статистика (рис. 1369) и Теория вероятностей и математическая статистика (рис. 1370). При уровне значимости 0,1 проверить нулевую гипотезу Теория вероятностей и математическая статистика (рис. 1371):Теория вероятностей и математическая статистика (рис. 1372) о равенстве генеральных дисперсий при конкурирующей гипотезе Теория вероятностей и математическая статистика (рис. 1373):Теория вероятностей и математическая статистика (рис. 1374)
Решение. Найдем отношение большей исправленной дисперсии к меньшей:

Теория вероятностей и математическая статистика (рис. 1375).

Конкурирующая гипотеза имеет вид Теория вероятностей и математическая статистика (рис. 1376), поэтому критическая область - двусторонняя.
По таблице критических точек распределения Фишера - Снедекора, по уровню значимости, вдвое меньшем заданного, т.е. при Теория вероятностей и математическая статистика (рис. 1377) и числам степеней свободы Теория вероятностей и математическая статистика (рис. 1378) и Теория вероятностей и математическая статистика (рис. 1379) находим критическую точку

Теория вероятностей и математическая статистика (рис. 1380).

Так как Теория вероятностей и математическая статистика (рис. 1381), нулевая гипотеза о равенстве генеральных дисперсий отвергается.
Пусть генеральные совокупности Теория вероятностей и математическая статистика (рис. 1382) и Теория вероятностей и математическая статистика (рис. 1383) распределены нормально, причем их дисперсии известны. По независимым выборкам с объемами, соответственно равными Теория вероятностей и математическая статистика (рис. 1384) и Теория вероятностей и математическая статистика (рис. 1385), извлеченным из этих совокупностей, найдены выборочные средние Теория вероятностей и математическая статистика (рис. 1386) и Теория вероятностей и математическая статистика (рис. 1387). Требуется по выборочным средним при заданном уровне значимости Теория вероятностей и математическая статистика (рис. 1388) проверить нулевую гипотезу, состоящую в том, что генеральные средние (математические ожидания) рассматриваемых совокупностей равны между собой:

Теория вероятностей и математическая статистика (рис. 1389):Теория вероятностей и математическая статистика (рис. 1390). (16.12)

Учитывая, что выборочные средние являются несмещенными оценками генеральных средних, т.е.

Теория вероятностей и математическая статистика (рис. 1391), Теория вероятностей и математическая статистика (рис. 1392),

нулевую гипотезу можно записать так:

Теория вероятностей и математическая статистика (рис. 1393):Теория вероятностей и математическая статистика (рис. 1394). (16.13)

В качестве критерия проверки нулевой гипотезы о равенстве генеральных средних принимается нормированная нормальная случайная величина

Теория вероятностей и математическая статистика (рис. 1395). (16.14)

Критическая область строится в зависимости от вида конкурирующей гипотезы.
Первый случай. Нулевая гипотеза Теория вероятностей и математическая статистика (рис. 1396):Теория вероятностей и математическая статистика (рис. 1397). Конкурирующая гипотеза Теория вероятностей и математическая статистика (рис. 1398):Теория вероятностей и математическая статистика (рис. 1399).
В этом случае строится двусторонняя критическая область, исходя из требования, чтобы вероятность попадания критерия Теория вероятностей и математическая статистика (рис. 1400) в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости Теория вероятностей и математическая статистика (рис. 1401).
Поскольку распределение Теория вероятностей и математическая статистика (рис. 1402) симметрично относительно нуля, то критические точки симметричны относительно нуля, т.е. если обозначить через Теория вероятностей и математическая статистика (рис. 1403) правую критическую точку, то Теория вероятностей и математическая статистика (рис. 1404) будет левой критической точкой.
Наибольшая мощность критерия (вероятность попадания критерия в критическую область при справедливости конкурирующей гипотезы) достигается тогда, когда вероятность попадания критерия в каждый из двух интервалов критической области равна Теория вероятностей и математическая статистика (рис. 1405):

Теория вероятностей и математическая статистика (рис. 1406), Теория вероятностей и математическая статистика (рис. 1407). (16.15)

Для того, чтобы найти правую границу Теория вероятностей и математическая статистика (рис. 1408) двусторонней критической области, достаточно найти значение аргумента функции Лапласа, которому соответствует значение функции, равное Теория вероятностей и математическая статистика (рис. 1409):

Теория вероятностей и математическая статистика (рис. 1410). (16.16)

Обозначим значение критерия, вычисленное по данным наблюдений, через Теория вероятностей и математическая статистика (рис. 1411).
Если Теория вероятностей и математическая статистика (рис. 1412) - нет оснований отвергнуть нулевую гипотезу.
Если Теория вероятностей и математическая статистика (рис. 1413) - нулевая гипотеза отвергается.
Второй случай. Нулевая гипотеза Теория вероятностей и математическая статистика (рис. 1414):Теория вероятностей и математическая статистика (рис. 1415). Конкурирующая гипотеза Теория вероятностей и математическая статистика (рис. 1416):Теория вероятностей и математическая статистика (рис. 1417).
В этом случае строится правосторонняя критическая область, исходя из требования, чтобы вероятность попадания критерия Теория вероятностей и математическая статистика (рис. 1418) в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости:

Теория вероятностей и математическая статистика (рис. 1419). (16.17)

Для того, чтобы найти границу Теория вероятностей и математическая статистика (рис. 1420) правосторонней критической области, достаточно найти значение аргумента функции Лапласа, которому соответствует значение функции, равное Теория вероятностей и математическая статистика (рис. 1421):

Теория вероятностей и математическая статистика (рис. 1422). (16.18)

Обозначим значение критерия, вычисленное по данным наблюдений, через Теория вероятностей и математическая статистика (рис. 1423).
Если Теория вероятностей и математическая статистика (рис. 1424) - нет оснований отвергнуть нулевую гипотезу.
Если Теория вероятностей и математическая статистика (рис. 1425) - нулевая гипотеза отвергается.
Вопросы для повторения и контроля:
1.Что вы понимаете под статистической гипотезой? Приведите примеры.
2.Что такое нулевая (основная), конкурирующая (альтернативная), простая, сложная гипотезы?
.В чем состоят ошибки первого и второго рода, что называется статистическим критерием?
4.Что называется наблюдаемым значением критерия, критической областью, областью принятия гипотезы (областью допустимых значений)?
5.Что такое критические точки (границы), правосторонняя, левосторонняя, односторонняя, двусторонняя критическая области?
.Что называется уровнем значимости и как находится критическая область?
.Что такое мощность критерия и как она связана с ошибкой второго рода?
.Что вы знаете о распределении Фишера - Снедекора?
.Как сравниваются две дисперсии нормальных генеральных совокупностей в первом случае?
.Как сравниваются две дисперсии нормальных генеральных совокупностей в втором случае?
.Как сравниваются два средних нормальных генеральных совокупностей в первом случае?
.Как сравниваются два средних нормальных генеральных совокупностей в втором случае?
Опорные слова:
Статистическая гипотеза, нулевая (основная) гипотеза, конкурирующая (альтернативная) гипотеза, простая гипотеза, сложная гипотеза, ошибка первого рода, ошибка второго рода, статистический критерий, наблюдаемое значение критерия, критическая область, область принятия гипотезы (область допустимых значений), критические точки (границы), правосторонняя критическая область, левосторонняя критическая область, односторонняя критическая область, двусторонняя критическая область, уровень значимости, мощность критерия, распределение Фишера - Снедекора, степени свободы.

17. Критерии согласия

Если закон распределения генеральной совокупности неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), то проверяется нулевая гипотеза: генеральная совокупность распределена по закону А.
Проверка гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения, т.е. при помощи специально подобранной случайной величины - критерия согласия.
Критерием согласия называется критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Одним из критериев согласия является критерий Теория вероятностей и математическая статистика (рис. 1426) ("хи квадрат") К.Пирсона проверки гипотезы о нормальном распределении генеральной совокупности (этот критерий можно применять и для других распределений). Для применения этого критерия будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.
Обычно эмпирические и теоретические частоты различаются. Например:

эмп. частоты . . . . .61338741068530104
теорет. частоты . .3144282997637112

Расхождение эмпирических и теоретических частот может быть случайным (незначимым) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. С другой стороны, расхождение частот может быть неслучайным (значимым) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности.
Критерий Пирсона отвечает на вопрос: случайно ли расхождение эмпирических и теоретических частот? Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.
Пусть по выборке объема Теория вероятностей и математическая статистика (рис. 1427) получено эмпирическое распределение:

варианты . . . . . . . .. . .
эмп. частоты . . . . .. . .

Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты Теория вероятностей и математическая статистика (рис. 1428). При уровне значимости Теория вероятностей и математическая статистика (рис. 1429) требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.
В качестве критерия проверки нулевой гипотезы принимается случайная величина

Теория вероятностей и математическая статистика (рис. 1430). (17.1)

Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значения. Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия (17.1), и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений.
При Теория вероятностей и математическая статистика (рис. 1431) закон распределения случайной величины (17.1) независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения Теория вероятностей и математическая статистика (рис. 1432) с Теория вероятностей и математическая статистика (рис. 1433) степенями свободы.
Число степеней свободы находится по равенству Теория вероятностей и математическая статистика (рис. 1434), где Теория вероятностей и математическая статистика (рис. 1435) - число групп (частичных интервалов) выборки; Теория вероятностей и математическая статистика (рис. 1436) - число параметров предполагаемого распределения, которые оценены по данным выборки.
В частности, если предполагаемое распределение - нормальное, то оцениваются два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому Теория вероятностей и математическая статистика (рис. 1437) и число степеней свободы

Теория вероятностей и математическая статистика (рис. 1438).

Если же предполагается, что генеральная совокупность распределена по закону Пуассона, то оценивается один параметр Теория вероятностей и математическая статистика (рис. 1439), поэтому Теория вероятностей и математическая статистика (рис. 1440) и Теория вероятностей и математическая статистика (рис. 1441).
Построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости:

Теория вероятностей и математическая статистика (рис. 1442). (17.2)

Таким образом, правосторонняя критическая область определяется неравенством Теория вероятностей и математическая статистика (рис. 1443), а область принятия нулевой гипотезы - неравенством Теория вероятностей и математическая статистика (рис. 1444).
Правило. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу Теория вероятностей и математическая статистика (рис. 1445): генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия

Теория вероятностей и математическая статистика (рис. 1446) (17.3)

и по таблице критических точек распределения Теория вероятностей и математическая статистика (рис. 1447), по заданному уровню значимости Теория вероятностей и математическая статистика (рис. 1448) и числу степеней свободы Теория вероятностей и математическая статистика (рис. 1449) найти критическую точку Теория вероятностей и математическая статистика (рис. 1450).
Если Теория вероятностей и математическая статистика (рис. 1451) - нет оснований отвергнуть нулевую гипотезу. Если Теория вероятностей и математическая статистика (рис. 1452) - нулевая гипотеза отвергается.
Сущность критерия согласия Пирсона состоит в сравнении эмпирических и теоретических частот. Ясно, что эмпирические частоты находятся из опыта. Как найти теоретические частоты, если предполагается, что генеральная совокупность распределена нормально? Эту задачу, например, можно решить следующим способом.
. Весь интервал наблюдаемых значений Теория вероятностей и математическая статистика (рис. 1453) (выборки объема Теория вероятностей и математическая статистика (рис. 1454)) делится на Теория вероятностей и математическая статистика (рис. 1455) частичных интервалов Теория вероятностей и математическая статистика (рис. 1456) одинаковой длины. Затем находятся середины частичных интервалов Теория вероятностей и математическая статистика (рис. 1457); в качестве частоты Теория вероятностей и математическая статистика (рис. 1458) варианты Теория вероятностей и математическая статистика (рис. 1459) принимается число вариант, которые попали в i-й интервал. В итоге получается последовательность равноотстоящих вариант и соответствующих им частот:

. . .
. . .

При этом Теория вероятностей и математическая статистика (рис. 1460).
. Вычисляются выборочная средняя Теория вероятностей и математическая статистика (рис. 1461) и выборочное среднее квадратическое отклонение Теория вероятностей и математическая статистика (рис. 1462).
. Нормируется случайная величина Теория вероятностей и математическая статистика (рис. 1463), т.е. переходят к величине Теория вероятностей и математическая статистика (рис. 1464) и вычисляются концы интервалов Теория вероятностей и математическая статистика (рис. 1465):
Теория вероятностей и математическая статистика (рис. 1466), Теория вероятностей и математическая статистика (рис. 1467),

причем наименьшее значение Теория вероятностей и математическая статистика (рис. 1468), т.е. Теория вероятностей и математическая статистика (рис. 1469), полагают равным Теория вероятностей и математическая статистика (рис. 1470), а наибольшее, т.е. Теория вероятностей и математическая статистика (рис. 1471), полагают равным Теория вероятностей и математическая статистика (рис. 1472).
. Вычисляются теоретические вероятности Теория вероятностей и математическая статистика (рис. 1473) попадания Теория вероятностей и математическая статистика (рис. 1474) в интервалы Теория вероятностей и математическая статистика (рис. 1475) по равенству (Теория вероятностей и математическая статистика (рис. 1476) - функция Лапласа)

Теория вероятностей и математическая статистика (рис. 1477)

и, наконец, находятся искомые теоретические частоты Теория вероятностей и математическая статистика (рис. 1478).
Вопросы для повторения и контроля:
1.Что называется критерием согласия и как применяется критерий Пирсона?
2.По каким причинам различаются эмпирические и теоретические частоты?
.Какая случайная величина принимается в качестве критерия проверки нулевой гипотезы о нормальном распределении генеральной совокупности и какие ее свойства вы знаете?
.В чем суть правила проверки нулевой гипотезы о нормальном распределении генеральной совокупности?
.Каким способом находятся теоретические частоты?
Опорные слова:
Критерий согласия, критерий Пирсона, эмпирическая частота, теоретическая частота, правило проверки нулевой гипотезы о нормальном распределении генеральной совокупности.

Список литературы

1.Адиров Т.Т., Мамуров Э.Н. Эћтимоллар назарияси ва математик статистикадан маърузалар матни. Т.: ТМИ, 2001 й.
2.Г.М. Булдык. Теория вероятностей и математическая статистика. М.: Наука, 1989 г.
3.Венецкий И.Г., Венецкая В.И. Основные математико-статистические понятия и формулы в экономическом анализе. М.: "Высшая школа", 1987 г.
.Гмурман В.Е. Теория вероятностей и математическая статистика. Издание шестое. М.: "Высшая школа", 1998 г.
.Гмурман В.Е. Эћтимоллар назарияси ва математик статистика. Русча тўлдирилган 4-нашридан тарж. Инж.-экон. институтлари студентлари учун ўќув ќўлланма. Т.: Ўќитувчи, 1977 й.
6.В.Е. Гмурман. Руководство к решению задач по теории вероятностей и математической статистике: учеб. пособие для втузов. 3-е изд., перераб. и доп. М.: "Высшая школа", 1979 г.
7.Гмурман В.Е. Эћтимоллар назарияси ва математик статистикадан масалалар ечишга доир ќўлланма. Русча тўлдирилган 2-нашридан таржима. Т.: Ўќитувчи, 1980 й.
.Замков О.О., Толстопятенко А.В., Черемных Ю.Н. Математические методы в экономике. М.: Изд. ДИС, 1998 г.
.Колемаев В.А., Калинина В.А. Теория вероятностей и математическая статистика. М.: Инфра-М, 1997 г.
.Колемаев В.А., О.В.Староверов, В.Б.Турундаевский. Теория вероятностей и математическая статистика: учеб. пособие для экон. спец. вузов. М.: "Высшая школа", 1991 г.
.Кремер Ш.А. Теория вероятностей и математическая статистика. М.: "Высшая школа", 2001 г.
12.Мамуров Э.Н., Адиров Т.Ћ Эћтимоллар назарияси ва математик статистикадан масалалар ечишга доир ќўлланма. Т.: ТМИ, 2000 й.
13.Соатов Ё.У. Олий математика курси. 2-ќисм. Т.: Ўќитувчи, 1994 й.
.Справочник по математике для экономистов. / Под редакцией проф. Ермакова. М.: "Высшая школа", 1987 г.



Похожие материалы:


Контрольная работа: Теория вероятностей и математическая статистика. Вариант № 5

Комментарии:

Вы не можете оставлять комментарии. Пожалуйста, зарегистрируйтесь.