Курсовая работа: ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ

Оглавление
Введение
Теоретическая часть
Практическая часть
Заключение
Список используемой литературы


Дата добавления на сайт: 10 февраля 2025
ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ МОСКОВСКОЙ ОБЛАСТИ
«Международный университет природы, общества и человека «Дубна»
Кафедра высшей математики

КУРСОВАЯ РАБОТА ПО ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ
ТЕМА: «ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ»
Вариант №92


Выполнил: студент 2071 группы 2 курса

Серый Сергей Андреевич
Руководители: ст. преп. Чебоненко З.А.

Дубна, 2015

Оглавление


Введение
Теоретическая часть
Практическая часть
Заключение
Список используемой литературы


Введение


Математическая статистика - наука о математических методах систематизации и использовании статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала, выборки генеральной совокупности.
Во время статистических наблюдений для каждого объекта в ряде случаев можно измерить значение нескольких признаков. Таким образом, получается многомерная выборка. Если многомерную выборку обработать по значениям отдельного признака, то получится обычная обработка одномерной выборки.
Смысл обработки многомерных выборок состоит в том, чтобы установить связь между признаками. Связи между ними могут быть функциональными, то есть каждому значению одной величины соответствует определенное значение другой величины.
Связь между случайными величинами часто носит случайный характер. Она называется статистической, если изменение одной величины вызывает изменение распределения другой величины. Если среднее значение одной случайной величины функционально зависит от значения другой случайной величины, то такая статистическая зависимость называется корреляционной.
Целью данной курсовой работы является исследование корреляционной зависимости по выборке.


Теоретическая часть


Выборочный метод - статистический метод исследования общих свойств совокупности каких-либо объектов на основе изучения свойств лишь части этих объектов, взятых на выборку.
Генеральная совокупность, генеральная выборка - это множество объектов (субъектов), отобранных специальным образом для обследования (опроса). Любые данные, полученные на основании выборочного обследования (опроса), имеют вероятностный характер. На практике это означает, что в ходе исследования определяется не конкретное значение, а интервал, в котором определяемое значение находится.
Выборочное среднее ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 1) - это среднее арифметическое значение признака выборочной совокупности. Если все значения ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 2)признака выборки объема n различны, то:

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 3)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 4)

Выборочная дисперсия ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 5) - среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения.

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 6)

Выборочное средне квадратическое отклонение - квадратный корень из выборочной дисперсии.

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 7)
Парная выборка -
выборка состоящие из одних и тех же объектов обследованных в разные моменты времени.
Парные выборки - это две выборки, которые набираются таким образом, что каждым наблюдением одной выборки сопоставлено наблюдение другой выборки сопоставление основывается, как правило, на совпадении значений одной или более заданных характеристик(признаков).
Выборочная ковариация - числовая характеристика совместного распределения двух случайных величин, равная математическому ожиданию произведения отклонений случайных величин от их математических ожиданий.

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 8)

Корреляционная зависимость -
статистическая взаимосвязь двух или более случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми).
Выборочный коэффициент корреляции - оценка коэффициента корреляции, служащая для определения линейной связи между величинами X и Y . Коэффициент корреляции изменяется в пределах от -1 до 1.

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 9)

Выборочный коэффициент корреляции показывает тесноту линейной связи между X и Y - чем ближе к единице абсолютное значение коэффициента, тем сильнее линейная связь между переменными.
Регрессия - зависимость среднего значения какой-либо величины Y от другой величины X. Понятие регрессии в некотором смысле обобщает понятие функциональной зависимости y = f(x). Только в случае регрессии одному и тому же значению x в различных случаях соответствуют различные значения у.
Регрессионный анализ заключается в определении аналитического выражения связи, в которой изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов).
По форме зависимости различают:
·Линейную регрессию, которая выражается уравнением прямой:

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 10)

·Нелинейную (параболическую):

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 11)

Исследование линейной регрессии:

Определим коэффициенты линейной функции ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 12) методом наименьших квадратов. Для этого составим сумму:

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 13)

Для того чтобы эта сумма была минимальной, необходимо, чтобы ее частные производные по параметрам A и B были равны нулю:

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 14)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 15)

Раскрыв скобки, мы получим:
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 16)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 17)

Выразим a и b:

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 18)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 19)

Поскольку выборка отобрана случайно, то нельзя заключить, что коэффициент корреляции генеральной совокупности r также отличен от нуля. Возникает необходимость при данном уровне значимости α проверить нулевую гипотезу ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 20) о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 21).
В качестве критерия проверки нулевой гипотезы применяют случайную величину

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 22)

Величина T при справедливости нулевой гипотезы имеет распределение Стьюдента с ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 23) степенями свободы. Поэтому вычисляется эмпирическое значение критерия и по таблице критических точек распределения Стьюдента по выбранному уровню значимости α и числу степеней свободы ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 24) находят критическую точку:
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 25)
ЕслиИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 26), то нулевую гипотезу отвергают, и выборочный коэффициент корреляции значимо отличается от нуля, а X и Y коррелированы, т.е. связаны линейной зависимостью.
Если ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 27) то нет оснований отвергать нулевую гипотезу и говорят, что выборочный коэффициент корреляции незначим, а X и Y некоррелированные, т.е. не связаны линейной зависимостью.

Практическая часть
корреляция выборка регрессия
Постановка задачи
·Провести статистический анализ данных для переменных X и Y. Найти выборочные средние, дисперсии и среднеквадратические отклонения для X и Y по отдельности;
·Найти ковариацию Cov (X,Y);
·Найти коэффициент корреляции X и Y;
·Найти по выборке уравнение линейной регрессии (Y как функцию X) по методу наименьших квадратов;
·Найти по выборке уравнение параболической регрессии второго порядка (Y как функцию X) по методу наименьших квадратов;
·Построить графики, изображающие данные выборки и найденные функции регрессии;
·Проверить гипотезу о значимости выборочного коэффициента корреляции при заданном уровне значимости альфа = 0.001;
Исходные данные
Нам дана выборка (объемом n = 20) зависимости числа Y от числа X

Таблица 1. Исходные данные. Вариант №92
xY
13,339,1
1854,7
20,259,1
3,410,8
16,550,9
5,424,1
23,862,5
0,54,6
18,456,4
10,340,9
7,626,1
0,3-0,1
17,848,1
0,43,9
15,152,2
14,649
0,80
5,425,5
24,659,7
826,5

Статистический анализ данных для переменных X и Y
Найдем выборочные средние для X и Y по формуле (1):

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 28)

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 29)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 30)
Найдем выборочные дисперсии для X и Y по формуле (2) и (3):

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 31)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 32)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 33)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 34)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 35)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 36)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 37)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 38)
Найдем выборочные среднеквадратические отклонения для X и Y по формуле (4):

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 39)

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 40)7,843634362
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 41)21,27653637

Ковариация Cov (X, Y)
Найдем выборочную ковариацию для переменных X и Y по формуле (5):

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 42)

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 43)
Коэффициент корреляции X и Y
Найдем выборочный коэффициент корреляции для переменных X и Y по формуле (6):

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 44)

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 45)
Уравнение линейной регрессии
Найдем коэффициенты a и b для уравнения линейной регрессии.
Для нахождения коэффициентов a и b методом наименьших квадратов были посчитаны следующие необходимые параметры:

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 46)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 47)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 48)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 49)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 50)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 51)
Тогда коэффициенты ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 52) и ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 53) соответственно равны:
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 54)
Таким образом, получаем уравнение линейной регрессии:
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 55)

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 56)
Рис. 1 Линейная регрессия

Гипотеза о значимости выборочного коэффициента корреляции
Проверим гипотезу о значимости выборочного коэффициента корреляции, для этого вычислим ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 57) и ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 58) (на уровне значимости равном 0,001).

ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 59)
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 60)

Получаем:
ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 61)ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 62)
Поскольку ИССЛЕДОВАНИЕ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТИ ПО ВЫБОРКЕ (рис. 63), можно сказать что выборочный коэффициент корреляции отличается от нуля, а X и Y коррелированы.


Заключение


В данной курсовой работе были вычислены основные числовые характеристики выборок по X и Y.
По выборке проведено исследование корреляционной зависимости по выборке. Найдены ковариация и коэффициент корреляции. В результате проведенной работы были закреплены теоретические знания и приобретены практические навыки работы со статистиками, умение находить точечные и интервальные оценки математического ожидания и дисперсии.
Был изучен метод регрессионного анализа, при помощи которого удаётся провести зависимость прожиточного минимума (Y) от заработной платы (X).

Список используемой литературы

1.Кремер, Н.Ш. Теория вероятностей и математическая статистика - Учебник для втузов. - 2-е изд., перераб. и доп. - М. : ЮНИТИ - ДАНА, 2004.
2.Гмурман, В.Е. Теория вероятностей и математическая статистика. Учебное пособие для вузов. - М. : Высшая школа, 2001.
3.Гмурман, В.Е. «Руководство к решению задач по ТВ и МС.» 2003

Комментарии:

Вы не можете оставлять комментарии. Пожалуйста, зарегистрируйтесь.