Курсовая работа: КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Эконометрика и прикладная статистика бурно развиваются последние десятилетия. Серьезным (хотя, разумеется, не единственным и не главным) стимулом является стремительно растущая производительность вычислительных средств.


Дата добавления на сайт: 19 февраля 2025 | Автор: Хайбулин Илья Марсельевич
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ
Учреждение образования
«Брестский государственный университет имени А. С. Пушкина»
Физико-математический факультет
Кафедра алгебры, геометрии и математического моделирования

Курсовая работа

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Хайбулин Илья Марсельевич,
студент 3 курса
специальности «Экономическая кибернетика»

Брест 2014

ВВЕДЕНИЕ

Эконометрика и прикладная статистика бурно развиваются последние десятилетия. Серьезным (хотя, разумеется, не единственным и не главным) стимулом является стремительно растущая производительность вычислительных средств. Поэтому понятен острый интерес к статистическим методам, интенсивно использующим компьютеры. Одним из таких методов является так называемый "бутстрап", предложенный в 1977 г. Б. Эфроном из Станфордского университета (США).
Что же такое бутстрап?
Бутстрап - это практический компьютерный метод определения статистик вероятностных распределений, основанный на многократной генерации выборок методом Монте-Карло на базе имеющейся выборки. Позволяет просто и быстро оценивать самые разные статистики (доверительные интервалы, дисперсию, корреляцию и так далее) для сложных моделей.
В истории эконометрики было несколько более или менее успешно осуществленных рекламных кампаний. В каждой из них "раскручивался" тот или иной метод, который, как правило, отвечал нескольким условиям:
по мнению его пропагандистов, полностью решал актуальную научную задачу;
был понятен (при постановке задачи, при ее решении и при интерпретации результатов) широким массам потенциальных пользователей;
использовал современные возможности вычислительной техники.
В стране с условиями отсутствия систематического эконометрического образования подобные рекламные кампании находили особо благоприятную почву, поскольку у большинства затронутых ими специалистов не было достаточных знаний в области методологии построения эконометрических моделей для того, чтобы составить самостоятельное квалифицированное мнение.
Речь идет о таких методах как бутстрап, нейронные сети, метод группового учета аргументов, робастные оценки по Тьюки-Хуберу, асимптотика пропорционального роста числа параметров и объема данных и др. Бывают локальные всплески энтузиазма, например, московские социологи в 1980-х годах пропагандировали так называемый "детерминационный анализ" - простой эвристический метод анализа таблиц сопряженности, хотя в Новосибирске в это время давно уже было разработано продвинутое программное обеспечение анализа векторов разнотипных.
Однако на фоне всех остальных рекламных кампаний судьба бутстрапа исключительна. Во-первых, признанный его автор Б. Эфрон с самого начала признавался, что он ничего принципиально нового не сделал. Его исходная статья называлась: "Бутстрап-методы: новый взгляд на методы складного ножа". Во вторых, сразу появились статьи и дискуссии в научных изданиях, публикации рекламного характера, и даже в научно-популярных журналах. Бурные обсуждения на конференциях, спешный выпуск книг. В 1980-е годы финансовая подоплека всей этой активности, связанная с выбиванием грантов на научную деятельность, содержание учебных заведений и т.п. была мало понятна отечественным специалистам.

1
. ПОЛУЧЕНИЕ ИНТЕРВАЛЬНОЙ ОЦЕНКИ

1.1Основные понятия и определения интервального оценивания

Задача интервального оценивания состоит в следующем: По данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала находится оцениваемый параметр.
Интервальная оценка - оценка, которая определяется двумя числами, а именно - концами интервала (КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 1)), покрывающего оцениваемый параметр КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 2).
Требования, предъявляемые к статическим оценкам:
Для того чтобы статические оценки давали хорошее приближение оцениваемых параметров, они должны удовлетворять определенным требованиям:
.Несмещенность оценки (асимптотическая несмещенность);
Оценка КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 3) называется несмещенной оценкой параметра КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 4), если КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 5).
Оценка КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 6) называется асимптотически несмещенной оценкой КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 7), если

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 8).

2.Состоятельность оценки;
Оценка КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 9) называется состоятельной оценкой параметра КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 10), если

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 11), т.е. КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 12).

3.Эффективность оценки;
Оценка КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 13) называется эффективной оценкой КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 14), если она имеет наименьшую дисперсию среди всех несмещенных оценок данного параметра КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 15).
Пусть КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 16) - статистика, где КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 17) - точечная оценка неизвестного параметра КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 18). Чем меньше абсолютная величина разности, тем оценка точнее. Т.е. соотношение КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 19) определяет следующее: КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 20)- называется точностью оценки. Чем меньше КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 21) - тем оценка точнее.
Доверительной вероятностью (надежностью оценки) называется вероятность КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 22), с которой выполняется соотношение

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 23). [1, с. 22].

Статистические методы не позволяют категорически утверждать, что оценка КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 24) удовлетворяет неравенству КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 25). Можно лишь говорить о вероятности КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 26), с которой это соотношение КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 27) выполняется. Обычно КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 28) определяется в статистических таблицах(КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 29)) и задается в задачах заранее.
Доверительным интервалом называется интервал КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 30) который покрывает неизвестный параметр КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 31) с надежностью КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 32). Число КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 33) называют уровнем значимости.
.2Построение доверительного интервала. Пусть КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 34) получены при n независимых наблюдений, проведенных при одинаковых условиях над генеральной совокупностью КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 35).
Математическое ожидание

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 36)

Отсюда следует что доверительный интервал для неизвестного математического ожидания равен

(КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 37).

2. БУТСТРАП КАК МЕТОД ОПРЕДЕЛЕНИЯ СТАТИСТИК ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИЙ

2.1 Возникновение бутстрапа

В институтах студентов учат интегрировать аналитически, а потом обнаруживается, что на практике интегралы почти все считают численными методами или проверяют, таким образом, аналитическое решение. В статистике тоже есть «нечестный» метод, который позволяет получить примерный ответ на многие практические вопросы без анализа, грубой компьютерной силой: бутстрап. Придумал и опубликовал его в 1979 году Брэдли Эфрон.
Суть метода: Допустим, есть у нас интернет-магазин, где мы торгуем разным товаром и привлекаем клиентов разными способами. Понятное дело, что мы постоянно что-то тестируем - расположение картинок и кнопок на странице, рекламный текст, баннеры на сайтах партнёров и так далее. В конечном счете, мы получаем свежие результаты - в тестовой группе из 893 пришедших у нас что-то купили 34, а в контрольной группе из 923 пришедших что-то купили 28.
Возникает вопрос - идти к начальству и говорить: «в тестовой группе соотношение числа купивших у нас что-либо к числу всех посетивших - 3.81%, в контрольной группе - 3.03%, налицо улучшение на 26%, где моя премия?» или продолжать сбор данных, потому что разница в 6 человек - ещё не статистика?
Эту задачу несложно решить аналитически. Видим две случайные величины (проценты в тестовой и контрольной группах). При большом количестве наблюдений биномиальное распределение похоже на нормальное. Нас интересует разность. Нормальное распределение бесконечно делимо, вычитаем математические ожидания и складываем дисперсии, получаем:
.математическое ожидание: 34/893-28/923 = 0.77%;
.дисперсию (34/893)*(1-34/893)/893+(28/923)*(1-28/923)/923.
Стандартное отклонение равно корню из дисперсии, в нашем случае 0.85%. Истинное значение с 95% вероятностью лежит в пределах плюс-минус двух стандартных отклонений от математического ожидания, то есть между -0.93% и 2.48%. Так что премия пока не будет, надо продолжать собирать данные.
Теперь решим эту же задачу методом бутстрапа. Основная идея такова: хорошо бы повторить наш эксперимент много раз и посмотреть на распределение результатов. Но мы это сделать не можем, поэтому будем действовать «нечестно» - «надёргаем» выборок из имеющихся данных и сделаем вид, что каждая из них - результат повторения нашего эксперимента.

2.2 Алгоритм бутстрапа

1.Выбираем наугад одно наблюдение из имеющихся.
.Повторяем пункт 1 столько раз, сколько у нас есть наблюдений. При этом некоторые из них мы выберем несколько раз, некоторые не выберем вообще - это нормально.
.Считаем интересующие нас метрики по этой новой выборке. Запоминаем результат.
Повторяем пункты 1-3 много раз. Например, 10 тысяч. Можно меньше, но точность будет хуже. Можно больше, но долго будет считать.
Теперь у нас есть распределение, на которое мы можем посмотреть или что-то по нему посчитать. Например, доверительный интервал, медиану или стандартное отклонение.
Следует обратить внимание на то, что мы не делаем никаких предположений о распределении чего-либо. Распределения могут быть разные. Алгоритм от этого не меняется. Однако если у распределения нет математического ожидания (такие встречаются) - бутстрап его не найдёт. То есть он найдёт математическое ожидание выборки, но не генеральной совокупности. То же касается ситуации, когда выборка маленькая.
Рассмотрим приведенный ниже пример написания бутстрапа на C++:
#include "stdafx.h"
#include
#include
#include
#include
#include
typedef int Data_t;
#define ARRAY_SIZE(x) sizeof(x)/sizeof(x[0])
static double bootstrap(const Data_t* data, unsigned n)
{
unsigned i;
double sum = 0;
for (i = 0; i *(double*)b) return 1;
if (*(double*)a *(double*)b) return 1;
if (*(double*)a X_-Sqrt(S_/N)*T5) then Inc(PA[1]);
If (AX_-Sqrt(S_/N)*T2_5) and (AAb[J] then begin
R:=Ab[J]; H:=J
end;[H]:=Ab[L]; Ab[L]:=R
end;
IF (A>Ab[trunc(G*0.05)]) then inc(PbA[1,K]);
IF (AAb[trunc(G*0.025)]) and (AЛевосторонняя критическая область10<- Объём выборки0<- Матожидание1<- Стандартное отклонение100000<- Количество прогонов1000<- Глубина бутстрапированияA0,94885<- Классическая оценкаОбъём бутстрапа50,974520,9560,96580,9570,956140,9580,947010,9590,938010,95100,929390,95110,921240,95120,913070,95130,90470,95140,896890,95150,889150,95160,882780,95170,876270,95180,870040,95190,864270,95200,857850,95210,852840,95220,847240,95230,842150,95240,836960,95250,832690,95
КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 61)
Рисунок 1 - График значений математического ожидания

Где при объеме бутстрапа, который равен 7, мы получаем границу доверительного интервала, максимально приближенный к истинному значению. Проделаем данные наблюдения для разных объемов выборки, математических ожиданий и стандартных отклонений. Найдя все точки пересечения с надежностью, и построив по ним графики, мы можем увидеть зависимость оптимального объема бутстрапа от объема исследуемой выборки для разных параметров. К примеру, ниже приведен график зависимости для параметров 0 1 л:

Таблица 2 - Значения показателей объемов для параметров: 0 1 л
1080,947010,95
20180,948530,95
30270,950380,95
40380,950180,95
50470,950840,95
60580,95030,95
70680,950290,95
80790,950020,95
90900,950530,95
100980,950330,95
1080,947010,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 62)
Рисунок 2 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 1 1 л

Следовательно, для данных параметров объем бустрапа нужно брать приблизительно на 3 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение. В таком случае оценка получается несмещенной. Ниже будут приведены следующие зависимости объемов бутстрапа от объемов исследуемых выборок:
1.0 1 л (Приложение A)
2.0 1 п (Приложение Б)
3.0 1 лп (Приложение В)
4.0 10 л (Приложение Г)
5.0 10 п (Приложение Д)
6.0 10 лп (Приложение Е)
7.1 1 л (Приложение Ж)
8.1 1 п (Приложение И)
9.1 1 лп (Приложение К)
10.1 10 л (Приложение Л)
11.1 10 п (Приложение М)
12.1 10 лп (Приложение Н)
13.10 1 л (Приложение П)
14.10 1 п (Приложение Р)
15.10 1 лп (Приложение С)
16.10 10 л (Приложение Т)
17.10 10 п (Приложение У)
18.10 10 лп (Приложение Ф)

ЗАКЛЮЧЕНИЕ

В ходе выполненного исследования мы выяснили, что каждую нормально распределенную выборку можно бутстрапировать. Однако при этом объем бутстрапа нужно брать в среднем на 3 единицы меньше, чем объем исходной выборки. Только выполнив это условие, мы получим доверительный интервал, соответствующий заданной вероятности.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1.Баврин, И.И. Теория вероятностей и математическая статистика / И.И. Баврин. - М.: Высш. шк., 2005. - 160 с.
.Максимов, Ю.Д. Вероятностные разделы математики / Ю.Д. Максимов. - Изд.: Иван Федоров, 2001. - 592 с.
.Пугачев B.C. Теория вероятностей и математическая статистика: Учеб. Пособие / В.С. Пугачев. - 2-е изд., исправл. и дополн. - М.: Физматлит,2002. - 496 с.
.Электронная библиотека [Электронный ресурс] - Режим доступа: http://habrahabr.ru - Дата доступа: 25.01.2014.

ПРИЛОЖЕНИЯ

Приложение А

Таблица 3 - Значения показателей объемов для параметров: 0 1 л
Объем выборкиОбъем бутстрапа
1080,947010,95
20180,948530,95
30270,950380,95
40380,950180,95
50470,950840,95
60580,95030,95
70680,950290,95
80790,950020,95
90900,950530,95
100980,950330,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 63)
Рисунок 3 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 1 1 л

Для данных параметров объем бутстрапа нужно брать приблизительно на 2 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.

Приложение Б

Таблица 4 - Значения показателей объемов для параметров: 0 1 п
Объем выборкиОбъем бутстрапа
1080,94780,95
20180,948030,95
30270,950980,95
40380,950180,95
50470,950840,95
60570,950620,95
70660,950970,95
80770,949620,95
90860,950310,95
100960,949950,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 64)
Рисунок 4 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 0 1 п

Для данных параметров объем бутстрапа нужно брать приблизительно на 3-4 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.

Приложение В

Таблица 5 - Значения показателей объемов для параметров: 0 1 лп
Объем выборкиОбъем бутстрапа
1070,949610,95
20170,951310,95
30270,950750,95
40370,950230,95
50470,950,95
60570,950290,95
70660,950750,95
80760,951860,95
90880,950320,95
100960,949880,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 65)
Рисунок 5 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 0 1 лп

Для данных параметров объем бутстрапа нужно брать на 3 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.

Приложение Г

Таблица 6 - Значения показателей объемов для параметров: 0 10 л
Объем выборкиОбъем бутстрапа
1070,951890,95
20170,950390,95
30270,950730,95
40370,949580,95
50460,949810,95
60570,94980,95
70660,950820,95
80770,949650,95
90860,949980,95
100960,950280,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 66)
Рисунок 6 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 10 1 п

Для данных параметров объем бутстрапа нужно брать приблизительно на 3 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.
Приложение Д

Таблица 7 - Значения показателей объемов для параметров: 10 1 лп
Объем выборкиОбъем бутстрапа
1070,944060,95
20170,946750,95
30270,948120,95
40370,948140,95
50460,949840,95
60570,949360,95
70660,949550,95
80760,949790,95
90860,949130,95
100960,950280,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 67)
Рисунок 7 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 10 1 лп

Для данных параметров объем бутстрапа нужно брать приблизительно на 3 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.
Приложение Е

Таблица 8 - Значения показателей объемов для параметров: 1 10 л
Объем выборкиОбъем бутстрапа
1070,951760,95
20180,946670,95
30270,950340,95
40380,949570,95
50470,950460,95
60580,949840,95
70680,95050,95
80780,950470,95
90870,950070,95
100960,949910,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 68)
Рисунок 8 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 1 10 л

Для данных параметров объем бутстрапа нужно брать приблизительно на 2 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.
Приложение Ж

Таблица 9 - Значения показателей объемов для параметров: 1 10 п
Объем выборкиОбъем бутстрапа
1070,950960,95
20170,950130,95
30270,950330,95
40370,949460,95
50470,949470,95
60560,950680,95
70660,950040,95
80770,949880,95
90860,95080,95
100960,950710,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 69)
Рисунок 9 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 1 10 п

Для данных параметров объем бутстрапа нужно брать приблизительно на 3 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.
Приложение И

Таблица 10 - Значения показателей объемов для параметров: 1 10 лп
Объем выборкиОбъем бутстрапа
1070,942860,95
20170,946930,95
30270,947450,95
40370,948520,95
50460,949940,95
60570,949420,95
70660,950860,95
80770,94960,95
90860,950880,95
100960,949880,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 70)
Рисунок 10 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 1 10 лп

Для данных параметров объем бутстрапа нужно брать приблизительно на 3 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.
Приложение К

Таблица 11 - Значения показателей объемов для параметров: 10 10 л
Объем выборкиОбъем бутстрапа
1070,952630,95
20170,950260,95
30280,948560,95
40370,950630,95
50470,950860,95
60580,949240,95
70680,94960,95
80770,949970,95
90880,949860,95
100970,949550,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 71)
Рисунок 11 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 10 10 л

Для данных параметров объем бутстрапа нужно брать приблизительно на 3 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.
Приложение Л

Таблица 12 - Значения показателей объемов для параметров: 10 10 п
Объем выборкиОбъем бутстрапа
1070,95330,95
20170,94970,95
30270,950420,95
40370,94990,95
50460,950560,95
60570,949140,95
70660,949890,95
80760,949890,95
90860,950620,95
100950,950530,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 72)
Рисунок 12 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 10 10 п

Для данных параметров объем бутстрапа нужно брать приблизительно на 2-3 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.
Приложение М

Таблица 13 - Значения показателей объемов для параметров: 10 10 лп
Объем выборкиОбъем бутстрапа
1070,944380,95
20170,945280,95
30270,94840,95
40370,948520,95
50460,950640,95
60560,950190,95
70660,949860,95
80750,950560,95
90860,950070,95
100960,949790,95

КОРРЕКТИРОВКА БУТСТРАПОВСКОЙ ИНТЕРВАЛЬНОЙ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ РАВНОМЕРНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (рис. 73)
Рисунок 13 - Зависимость оптимального объема бутстрапа от объема исследуемой выборки для параметров: 10 10 лп

Для данных параметров объем бутстрапа нужно брать приблизительно на 3 единицы меньше объема основной выборки, чтобы получить доверительный интервал, в котором будет находиться истинное значение.

Комментарии:

Вы не можете оставлять комментарии. Пожалуйста, зарегистрируйтесь.