Курсовая работа: Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов

Целью исследования является проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (для каждого года и каждого тиккера будем искать эмпирическое распределение логарифмических доходностей, а затем, делая выборку меньше квантиля 1/3 уровня, от 1/3 до 2/3 и больше 2/3, получим соответственно малый, средний и большой объем торгов для каждого года и каждого тиккера).


Дата добавления на сайт: 23 февраля 2025
Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования
«Финансовый университет при Правительстве Российской Федерации»
Кафедра «Теория вероятности и математическая статистика»

Курсовая работа на тему:

«Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов»
Вид исследуемых данных:
Котировки акций компаний, входящих в индекс
AMEX Major Market

Выполнила:

студентка группы ПМ2-1
Радостева М.В.
Научный руководитель:
проф. Браилов А.В.

Москва 2014 г.

Содержание


Введение
1.Предварительный анализ данных
1.1Количество торговых дней
1.2Скачки цен
2.Теоретическая справка по проверке гипотез
2.1Статистическая гипотеза и ошибки первого и второго рода
2.2Схема проверки статистической гипотезы
2.3Р-значение критерия
2.4Критерий Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 1) -Пирсона
2.5Критерий Колмогорова
3.Проверка гипотез для модельных данных
4.Выбор альтернативной гипотезы и оценка мощности критерия
4.1Альтернативные гипотезы
4.2Мощность критерия
5.Проверка гипотез для реальных данных
Заключение
Литература
Приложения

Введение

Целью исследования является проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (для каждого года и каждого тиккера будем искать эмпирическое распределение логарифмических доходностей, а затем, делая выборку меньше квантиля 1/3 уровня, от 1/3 до 2/3 и больше 2/3, получим соответственно малый, средний и большой объем торгов для каждого года и каждого тиккера). Альтернативные гипотезы будут такие: зависимость прямая и зависимость обратная.
В качестве объекта исследования выступают котировки акций компаний, входящих в индекс AMEX Major Market в период с 1 января 2010 года по 31 декабря 2013 года. Используются данные 20 компаний входящие в индекс, тиккеры этих компаний следующие:
AXP, BA, CVX, DD, DIS, DOW, GE, HPQ, IBM, JNJ, JPM, KO, MCD, MMM, MRK, MSFT, PG, WFC, WMT, XOM.
Проверка гипотезы будет осуществляться 20*4=80 раз.
Главный критерий: - критерий Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 2) Пирсона.
Планируемая новизна состоит в том, что я использую 2 альтернативные гипотезы вместо одной.

1.Предварительный анализ данных


В качестве исследуемых данных я взяла индекс AMEX Major Market и входящие в него 20 компаний. Источники списка компаний, входящих в индекс и соответствующие им котировки акций взяла с сайта http://finance.yahoo.com. Таблица тикеров и соответствующих им компаниям приведена ниже. логарифмический гипотеза критерий колмогоров

Таблица 1.Компании и тикеры
КомпанияТикер
American Express CompanyAXP
The Boeing CompanyBA
Chevron CorporationCVX
E. I. du Pont de Nemours and CompanyDD
The Walt Disney CompanyDIS
The Dow Chemical CompanyDOW
General Electric CompanyGE
Hewlett-Packard CompanyHPQ
International Business Machines CorporationIBM
Johnson & JohnsonJNJ
JPMorgan Chase & Co.JPM
The Coca-Cola CompanyKO
McDonald's Corp.MCD
3M CompanyMMM
Merck & Co. Inc.MRK
Microsoft CorporationMSFT
The Procter & Gamble CompanyPG
Wells Fargo & CompanyWFC
Wal-Mart Stores Inc.WMT
Exxon Mobil CorporationXOM

.1Количество торговых дней


Для получения более точных выводов просмотрим количество торговых дней для каждого тикера, используя программу Число торговых дней.mtc и выберем только те года и тикеры, количество рабочих дней которых превышает 240 дней.

Таблица 2. Количество торговых дней
год/тикер2010201120122013
AXP252252250252
BA252252250252
CVX252252250252
DD252252250252
DIS252252250252
DOW252252250252
GE252252250252
HPQ252252250252
IBM252252250252
JNJ252252250252
JPM252252250252
KO252252250252
MCD252252250252
MMM252252250252
MRK252252250252
MSFT252252250252
PG252252250252
WFC252252250252
WMT252252250252
XOM252252250252

Как видно из данной таблицы количество торговых дней для каждого года и тикера больше 240.

1.2Скачки цен

Оценим максимальные скачки цен для каждого тикера и каждого года, чтобы исключить резкие скачки вверх или вниз. Для этого необходимо у каждого года и тикера найти логарифмическую доходность за каждый день, которая покажет найти максимум и минимум и занести в таблицу. По итоговой таблице следует исключить те компании или года, у которых максимальный скачок цен превышает 50%. Для вычисления относительных изменений цены буду использовать поле CLOSE, которое показывает цену по закрытию торгов на текущий день и выражается в долларах. Для составления таблицы используем программу Скачки цен.mtc.

Таблица 3. Скачки цен вверх
год/тикер2010201120122013
AXP0,061330,0710970,0350230,051232
BA0,0731240,0618290,0528620,053396
CVX0,0477470,0557550,0343040,02525
DD0,0554790,0601450,0289060,052777
DIS0,0562710,0594690,0394430,03176
DOW0,0760780,0845950,0561440,055953
GE0,068720,071080,0350880,046128
HPQ0,0507170,0672010,0721910,170984
IBM0,045630,0566520,0443160,044064
JNJ0,0258970,0538210,0217180,022846
JPM0,0586840,0843840,0703010,044724
KO0,0260110,0392430,023760,056872
MCD0,0377890,0468880,0268070,016686
MMM0,0404210,0569980,0279940,033564
MRK0,0500440,0466290,0412520,046892
MSFT0,052830,0449350,0565430,072862
PG0,0349860,0331570,0374590,040407
WFC0,069760,080680,0577590,03327
WMT0,02820,0388390,0420680,024521
XOM0,0378690,0521830,0332470,028837

Таблица 4.Скачки цен вниз

год/тикер2010201120122013
AXP-0,08468-0,08833-0,04299-0,03633
BA-0,0633-0,07908-0,03621-0,04688
CVX-0,03916-0,0754-0,04184-0,0281
DD-0,03969-0,06791-0,09064-0,02227
DIS-0,04193-0,09107-0,05955-0,03653
DOW-0,09989-0,10424-0,04001-0,06963
GE-0,05794-0,06541-0,0342-0,04058
HPQ-0,09709-0,20027-0,1296-0,12451
IBM-0,03927-0,0473-0,04915-0,08279
JNJ-0,02945-0,03215-0,01495-0,0264
JPM-0,0659-0,09415-0,09278-0,03506
KO-0,03698-0,04079-0,50121-0,03168
MCD-0,02698-0,0404-0,04458-0,02683
MMM-0,05865-0,06255-0,04107-0,04367
MRK-0,04184-0,06622-0,03436-0,03283
MSFT-0,04114-0,05395-0,04004-0,114
PG-0,03416-0,02936-0,03634-0,06567
WFC-0,05645-0,09044-0,05897-0,0302
WMT-0,03281-0,04742-0,0466-0,02605
XOM-0,03446-0,06188-0,03744-0,02809

Заметим, что компания с тикером KO скачок вниз превышает 50%, значит ее нужно исключить, потому что такие данные не вызывают доверия.
Построю графики цен для акций с максимальным однодневным снижением и повышением цены при помощи программы Графики со скачками.mtc. В программе используется поле CLOSE

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 3)
Рисунок 1.График с максимальным однодневным повышением цены (HPQ)

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 4)
Рисунок 2.График с максимальным однодневным снижением цены (KO)

2.Теоретическая справка по проверке гипотез


.1Статистическая гипотеза и ошибки первого и второго рода


Для начала следует отметить, что мы подразумеваем под статистической гипотезой.
Статистическая гипотеза - это всякое высказывание о виде неизвестного распределения или о параметрах известных распределений.[2, c.253]
Статистические гипотезы бывают параметрическими, то есть гипотезы о параметрах распределения известного вида и непараметрические, которые предполагают о виде неизвестного распределения.
Одну из гипотез выдвигают в качестве основной и называют Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 5), а другую, являющуюся ее логическим отрицанием, то есть противоположную Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 6) - в качестве конкурирующей (или альтернативной) гипотезы и обозначают Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 7).[5,c.245]
Статистическая гипотеза бывает простой или сложной. Статистическая гипотеза называется простой, если параметр определен однозначно, соответственно сложной называется такая гипотеза, параметр которой не определен однозначно. Например, гипотеза Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 8):Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 9)=5 - простая, а альтернативные ей Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 10):Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 11), Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 12):Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 13), Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 14):Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 15) - сложные.
На основе выборки из генерального распределения Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 16) необходимо принять либо гипотезу Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 17), либо Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 18).Правило, по которому принимается одна из гипотез и отвергается другая, называют статистическим критерием проверки гипотезы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 19).
При проверке выдвинутой гипотезы могут возникать ошибки первого и второго рода.
Если отклоняется нулевая гипотеза, которая на самом деле верна, то это ошибка первого рода, а если принимается нулевая гипотеза, которая на самом деле не верна, то это ошибка второго рода.
Вероятность ошибки первого рода обозначается через Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 20) и называется уровнем значимости. Вероятность ошибки второго рода обозначается Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 21).
Желательно, чтобы и первая, и вторая ошибки были малы, однако более важным является контроль уровня Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 22). Вероятность Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 23) задается заранее, обычно малым числом, поскольку это - вероятность ошибочного заключения.[4,c. 289]
Например, уровень значимости Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 24)=0,05 будет означать, что при проверке гипотезы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 25) в среднем в 5 из 100 случаев мы совершим ошибку первого рода.

Таблица 5. Таблица принятия решения при ошибках 1-го и 2-го рода

Статистическое решениеРеальная ситуация
верна ложна
отвергается
не отвергается

Множество значений критерия, при которых нулевая гипотеза отклоняется, называется областью критических значений (обозначим Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 26)). Для критериев проверки гипотез выбираются надлежащие «уровни значимости»(0,01; 0,05; и др.), которые считаются практически невозможными (с некоторым риском).
Критическая область данного критерия - это такая область, вероятность попадания в которую в случае, когда гипотеза Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 27) верна, в точности равна уровню значимости.[4, c.293]
Под мощностью критерия (обозначим Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 28)) понимается вероятность не совершить ошибку второго рода.

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 29)

Чем больше мощность критерия, тем вероятность ошибки второго рода меньше. Также стоит отметить, что одновременное уменьшение ошибок 1-го и 2-го рода возможно только при увеличении объема выборок. Поэтому обычно при заданном уровне значимости отыскивается критерий с наибольшей мощностью.

2.2 Схема проверки статистической гипотезы

1)Для основной гипотезы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 30) формируются альтернативные гипотезы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 31).
2)Задается значение уровня значимости Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 32).
3)Рассматриваются теоретические выборки значений случайных величин, о которых сформулирована гипотеза Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 33), и формулируется случайная величина T. Значения и распределение T определяется по выборкам при предположении о верности гипотезы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 34). Т - статистика критерия.
4)Задается область критических значений и область принятия гипотезы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 35) (область принятия решения D - это область, вероятность попадания в которую статистики T определяется как Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 36)).
5)Вычисляются наблюдаемые значения статистики критерия, и проверяется попадание статистики критерия в одну из областей. Если статистика попала в область принятия гипотезы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 37), то Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 38) принимается, в противном случае - отвергается.

2.3Р-значение критерия

В своей работе я буду использовать такое понятие как Р-значение, поэтому стоит дать определение этому понятию.
Для фиксированной реализации Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 39) случайной выборки Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 40) Р-значением статистического критерия называется такое число Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 41) для любого уровня значимости Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 42), при котором гипотеза Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 43) принимается, и Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 44) для любого уровня значимости Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 45), при котором гипотеза Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 46) отвергается.
Пусть Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 47) - наблюдаемое фиксированное значение статистики критерия, а Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 48) - наблюдаемые значения статистики критерия для случайной выборки, тогда Р-значение удовлетворяет соотношению:
)Если критическая область представлена в виде Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 49), где Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 50) - непрерывно убывающая функция, то Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 51)
2)Если критическая область представлена в виде Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 52), где Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 53) - непрерывно возрастающая функция, то Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 54)
P-значение с гораздо большей точностью, чем обычные способы проверки статистических гипотез, позволяет установить, принимается ли гипотеза Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 55) или отвергается.

2.4Критерий Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 56) -Пирсона

Для начала стоит отметить, что я применяю критерий Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 57) Пирсона для проверки независимости логарифмических доходностей, поэтому теоретическая справка будет касаться непосредственно проверки независимости по данному критерию.
Пусть имеется случайная выборка Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 58) из генеральной совокупности двумерной дискретной случайной величины Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 59), где случайная величина Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 60) может принимать значения Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 61), а случайная величина Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 62) - значения Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 63). Определим случайную величину Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 64), реализация Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 65) которой равна количеству элементов выборки Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 66), совпадающих с элементом Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 67)
Определим случайные величины

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 68)

При этом Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 69) - количество элементов выборки Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 70), в которых встретилось значение Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 71), а Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 72) - количество элементов выборки Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 73), в которых встретилось значение Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 74), кроме того, имеются очевидные равенства

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 75)

Результаты наблюдений удобно оформлять в виде таблицы, называемой таблицей сопряженности признаков.

Таблица 6. Сопряженность признаков
XY

Пусть далее

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 76),Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 77).

Дискретные случайные величины Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 78) и Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 79) независимы тогда и только тогда, когда Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 80),Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 81)
Потому основная гипотеза о независимости дискретных случайных величин записывается следующим образом:

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 82)

А соответствующая альтернативная гипотеза:

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 83)

Для проверки основной гипотезы К. Пирсон предложил использовать статистику Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 84), называемую статистикой Фишера - Пирсона, реализация Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 85) которой определяется формулой

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 86)

Из закона больших чисел следует, что при Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 87)

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 88)
Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 89).

Поэтому при истинности гипотезы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 90) и больших объемах выборки Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 91) должно выполняться приближенное равенство

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 92)

Значит значение статистики Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 93) должны быть «не слишком большими». Стоит отметить, что в данном случае Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 94) - наблюдаемые частоты, а Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 95) - ожидаемые при выполнении гипотезы частоты. В общем случае величина Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 96)=Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 97), где Н-наблюдаемые частоты, Т - теоретические частоты.
Теорема. Если истина гипотеза Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 98), то распределение статистики Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 99) при Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 100) слабо сходится к случайной величине, имеющей Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 101)-распределение с числом степеней свободы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 102)

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 103)

В соответствии с теоремой критерий независимости Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 104) отклоняет гипотезу Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 105) на уровне значимости Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 106), если

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 107)

где Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 108)- квантиль уровня значимости Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 109)-распределения с числом степеней свободы Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 110). При этом считается, что критерий Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 111) можно использовать, если Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 112). [2,c. 229]

2.5Критерий Колмогорова

Для проверки равномерности распределения P-значения основного критерия используется критерий Колмогорова.
Пусть Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 113)- конкретная выборка из распределения с неизвестной непрерывной функцией распределения Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 114) и Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 115) - эмпирическая функция распределения. Выдвигается простая гипотеза Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 116):Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 117) (альтернативная Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 118)).
Сущность критерия Колмогорова состоит в том, что вводят в рассмотрение функцию

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 119)

называемой статистикой Колмогорова, представляющей собой максимальное отклонение эмпирической функции распределения Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 120) от гипотетической функции распределения Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 121).[5,c.218]
Колмогоров доказал, что при Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 122) закон распределения случайной величины Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 123) независимо от вида распределения случайной величины X стремится к закону распределения Колмогорова:

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 124) где Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 125)

Вследствие этой теоремы критерий согласия с критической областью

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 126)

где Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 127) - корень уравнения Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 128), имеет при Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 129) уровень стремящийся к Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 130). Другими словами, Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 131) - асимптотический уровень значимости. Именно этот критерий и называется критерием Колмогорова.[1,c.110]

3. Проверка гипотез для модельных данных


При помощи программы Квантили распределения статистики критерия.mtc найду квантили распределения статистики. В этой программе используется модель Геометрического броуновского движения как закон распределения цены. Методом Монте-Карло из закона формируется вектор лог доходностей, из которого извлекаются два независимых вектора с лагом (для проверки независимости лог доходностей за различные интервалы времени). По этим векторам составляется статистика Фишера - Пирсона, Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 132) для нее формируется эмпирический закон, по которому строятся 999 квантилей.

Таблица 7. Квантили распределения статистики основного критерия
КвантильГодПолугодиеКварталКвантильГодПолугодиеКвартал
0,010,2122090,1908660,2708930,261,3489381,3665011,47774
0,020,296270,2883340,2746170,271,3907441,4120671,481946
0,030,3648770,3837660,2775330,281,4246581,4491221,492978
0,040,4215870,4323260,3530390,291,4634841,4903481,504944
0,050,4747840,4816330,5337170,31,5052921,525721,508504
0,060,5223760,5307110,5658930,311,5406341,5686951,524439
0,070,5695170,5727740,5924520,321,584611,6042541,548935
0,080,6214190,6110210,6760110,331,63011,6470831,592983
0,090,6661820,6731190,6820490,341,6671641,6899751,642586
0,10,7100720,7132670,692030,351,7084131,7216931,782258
0,110,7584540,7661680,8345390,361,7464731,7597681,787561
0,120,7964240,8114750,8662050,371,7868111,8022131,842816
0,130,8411430,8616140,8817310,381,8202941,852631,861932
0,140,8813450,8995950,8888820,391,8574781,890511,90949
0,150,9239830,9489740,9056340,41,9040231,9314841,947937
0,160,9582791,0038840,987030,411,93951,9807981,981577
0,170,9960831,0370021,1055240,421,9791722,0255272,061731
0,181,0405361,0737711,153420,432,0236132,0673222,071946
0,191,0821361,122821,1779750,442,0727152,1187492,091278
0,21,1190961,1611941,1869460,452,1118562,1654222,109638
0,211,1600811,1919071,1922580,462,1613162,2162542,156932
0,221,1970781,2259161,2632780,472,205312,2690862,210036
0,231,2396061,2682611,2915180,482,255192,3128322,230974
0,241,2725261,2974061,3708750,492,2963192,3562982,309355
0,251,3075491,327951,400980,52,3533322,403292,379999

Следует отметить, что для модельных данных я проверяю независимость для различных объемов выборки и различных интервалов времени, не беря во внимание объемы торгов. Так как объемы торгов и цены могут, как зависеть друг от друга, так и на отдельных интервалах времени идти в разрез, что проследить для меня не представляется возможным, однако для реальных данных я буду рассматривать нужные объемы торгов.
При помощи программы Гистограммы P-значений.mtc строится гистограмма Р-значения при большом, среднем и малом объеме торгов.

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 133)
Рисунок 3. Гистограмма P-значения при объеме выборки соответствующему году

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 134)
Рисунок 4. Гистограмма Р-значения при объеме выборки соответствующему полугодию

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 135)
Рисунок 5.Гистограмма Р-значения при объеме выборки соответствующему кварталу

Для проверки гипотезы о равномерном распределении статистики основного критерия по критерию Колмогорову используется программа Проверка равномерности распределения по Колмогорову.mtc, по результатам которой получено, что при объеме выборки соответствующему году, полугодию и кварталу равномерность подтверждается.

4. Выбор альтернативной гипотезы и оценка мощности критерия


.1Альтернативные гипотезы


В качестве альтернативных гипотез были выбраны:
Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 136) зависимость прямая и Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 137) зависимость обратная
Как известно, при прямой зависимости коэффициент корреляции положителен, а при обратной зависимости - отрицателен. Исходя и этого, я буду использовать коэффициент корреляции Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 138) и -Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 139), где Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 140).

Таблица 8. Шкала Чеддока для оценки связи величин
Коэффициент корреляции0,1-0,30,3-0,50,5-0,70,7-0,90,9-1
Характеристика связиСлабаяУмереннаяЗаметнаяВысокаяВесьма высокая

Чтобы сгенерировать столбец лог доходностей с нужным коэффициентом корреляции, можно использовать следующее наблюдение:
Если взять две случайные величины Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 141) и Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 142) такие, что Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 143) и Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 144), где Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 145) (Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 146) и Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 147) независимы), то коэффициент корреляции будет определен следующим образом:

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 148)

Учитывая, что Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 149) можем высчитать теоретические частоты для критерия Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 150) Пирсона, чтобы были верны альтернативные гипотезы, необходимо, чтобы выполнялось равенство:

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 151)
где Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 152).

4.2Мощность критерия

Используя программу Мощность критерия.mtc, найду мощность критерия. Эта программа генерирует зависимые векторы лог доходностей, находит критическую точку из эмпирического закона квантилей распределения статистики основного критерия при уровне значимости 0,05 и подсчитывает количество значений статистики основного критерия, когда гипотеза отвергается.

Таблица 9. Мощность критерия Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 153) Пирсона (при альтернативных гипотезах Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 154))
ГодПолугодиеКвартал
cor=0.10,1890,1433220,00963
cor=-0.10,202750,1606410,056869

Таблица 10. Мощность критерия
Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 155) Пирсона (при альтернативных гипотезах Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 156))
ГодПолугодиеКвартал
cor=0.450,87350,7050660,062323
cor=-0.450,9968750,8357290,223866

Таблица 11. Мощность критерия
Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 157) Пирсона (при альтернативных гипотезах Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 158))
ГодПолугодиеКвартал
cor=0.710,9927460,623306
cor=-0.7110,750456

Из полученных таблиц можно сделать следующие выводы, используя шкалу Чеддока:
)критерий Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 159) Пирсона при объеме выборки, соответствующим году и полугодию различает умеренную, заметную, высокую и весьма высокую связь, но «не видит» слабую связь.
)критерий Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 160) Пирсона при объеме выборки, соответствующему кварталу может выявить только высокую и весьма высокую связи.

5. Проверка гипотез для реальных данных


Осуществлю проверку гипотезы для реальных данных. Используя программу Таблица P-значений для реальных данных.mtc, построю таблицы P-значений для разных лет, увеличивая интервал с одного года до трех лет с целью проверки гипотезы для разных интервалов времени, плюс ко всему возьму еще временные лаги внутри интервала и среднее P-значение для интервала буду записывать в таблицу. Проверка гипотезы осуществляется, как и для модельных данных.

Таблица 12. Р-значение для 2010 года
Таблица 13. Р-значение для 2010-2011 года

ТикерLoVolMidVolHiVolТикерLoVolMidVolHiVol
AXP0,557914*0,400567AXP0,3268610,3979010,665877
BA**0,397486BA0,4509090,5412130,597816
CVX*0,364220,455713CVX0,4802250,5582330,440618
DD**0,628117DD0,4741860,4731040,48183
DIS0,428474*0,46461DIS0,5561770,5373660,470059
DOW0,4028940,5007140,445179DOW0,455980,5432010,421619
GE*0,4649880,414716GE0,4087250,3084260,465294
HPQ0,5110290,6198910,447884HPQ0,5287250,4398440,635754
IBM0,1418320,5401940,582706IBM0,4471860,4592010,419221
JNJ0,5404450,5511980,40995JNJ0,4537750,3916110,568046
JPM0,4252640,5726970,522786JPM0,4369530,3674360,488387
MCD**0,331444MCD0,6031530,5984730,475952
MMM0,3461810,4491170,658432MMM0,4180660,3853290,490713
MRK0,513030,3132060,554154MRK0,4333960,6017230,434701
MSFT0,434989*0,480137MSFT0,5047030,491880,513336
PG0,3837910,39558*PG0,3773880,3227220,515827
WFC0,5870410,3145070,482952WFC0,6076850,3819430,387109
WMT0,608907*0,364565WMT0,5606960,5936960,475119
XOM0,633724*0,550189XOM0,3032610,364080,485668

Таблица 14. Р-значение для 2010-2012 года

Таблица 15. Р-значение для 2010-2013 года
ТикерLoVolMidVolHiVolТикерLoVolMidVolHiVol
AXP0,4127450,5154180,394794AXP0,5216790,3406270,438692
BA0,3961260,4083060,515569BA0,327970,3708440,412125
CVX0,4936770,674460,432729CVX0,5639310,5210640,448528
DD0,4072980,429810,538101DD0,6045080,4976830,295598
DIS0,4305220,5475820,546618DIS0,4608590,5669990,558142
DOW0,6129190,5395710,613542DOW0,3993730,2603190,377966
GE0,5142420,3610820,500587GE0,4015840,5062170,496939
HPQ0,5082790,5293140,452316HPQ0,4942850,338910,629783
IBM0,5060520,5319670,412422IBM0,3968620,591840,485678
JNJ0,3530950,5673530,47607JNJ0,6333370,4074890,490151
JPM0,5212710,3581180,42221JPM0,4463840,4316560,411316
MCD0,563180,4463860,507871MCD0,3399970,4694380,507178
MMM0,3959350,6363410,40173MMM0,3428240,3845540,472047
MRK0,4322860,4612360,503718MRK0,3626470,4056950,355256
MSFT0,553880,4616450,550172MSFT0,5014580,4274570,415952
PG0,578430,6647520,60946PG0,4314530,521990,556742
WFC0,5700510,5462030,38627WFC0,4536140,521420,401999
WMT0,3378080,4822470,6452WMT0,6165050,4937130,592804
XOM0,5428630,3489850,382743XOM0,4849940,5011980,42633

Далее по полученным данным построю гистограммы Р-значений при большом, среднем и малом объеме торгов, используя программу Гистограммы Р-значений для реальных данных.mtc

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 161)
Рисунок 6. Гистограмма Р-значений при малом объеме торгов

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 162)
Рисунок 7. Гистограмма Р-значений при среднем объеме торгов

Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 163)
Рисунок 8. Гистограмма Р-значений при большом объеме торгов

Программа Доля проверок, в которых гипотеза принималась.mtc, ищет критическую точку для распределения Пирсона, затем сравнивает полученное значение со статистикой критерия по реальным данным, подсчитывая количество тех значений статистики критерия, которые не попадают в критическую область. Полученное количество делится на общее количество статистики критерия.

Таблица 16. Доля проверок, в которых гипотеза принималась при 1% и 5% уровнях значимости
Уровень значимостиLoVolMidVolHiVol
1%0,9935730,9986950,991587
5%0,964010,9778070,959135

С помощью программы Медианы Р-значений.mtc найду медианы Р-значений. Эта программа ищет Р-значение, которое лежит в середине ранжированного ряда.

Таблица 17. Медианы Р-значений по годам
ГодLoVolMidVolHiVol
20100,4730090,4649880,460161
20110,4537750,4592010,48183
20120,5060520,5154180,500587
20130,4536140,4694380,448528

Таблица 18. Медианы Р-значений по тикерам
ТикерLoVolMidVolHiVol
AXP0,4672120,3979010,41963
BA0,3961260,4083060,463847
CVX0,4936770,5396490,444573
DD0,4741860,4731040,509966
DIS0,445690,5475820,508339
DOW0,4294370,5201420,433399
GE0,4087250,4130350,481117
HPQ0,5096540,4845790,541049
IBM0,4220240,536080,45245
JNJ0,497110,4793440,483111
JPM0,4416690,3995460,455299
MCD0,563180,4694380,491565
MMM0,3710580,4172230,48138
MRK0,4328410,4334660,46921
MSFT0,5030810,4616450,496736
PG0,4076220,4587850,556742
WFC0,5785460,4516810,394554
WMT0,5848010,4937130,533962
XOM0,5139280,364080,455999

Исходя из того, что медиана - это численное значение признака, которое находится в середине ранжированного ряда, то это адекватное среднее значение признака. Максимум Р-значений по компаниям приходится на компанию Wal-Mart Stores Inc.( американская компания-ритейлер, управляющая крупнейшей в мире розничной сетью), а минимум на 3M Company (американская диверсифицированная инновационно-производственная компания). 3М Company ориентирована на повышение качества продукции, так как связана с инновациями, а Wal-Mart Stores Inc. ориентирована на количество, так как развивает розничную торговлю. По полученной таблице логарифмические доходности более независимы у WMT, значит, их доход практически не зависит от полученной прибыли накануне, а у МММ наблюдается зависимость, возможно это происходит следующим образом: если инновационный продукт прижился, то они получают прибыль, которую вкладывают в более крупный проект, если он окажется успешен, то они получат еще больше прибыли, если нет, то им придется вкладывать в мелкие проекты и от них ждать доходов, но уже не таких крупных. Все равно прослеживается зависимость, а для розничной торговли все может быть спонтаннее, но все равно зависимость тоже для отдельных лет может наблюдаться. Если смотреть по годам, то здесь зависимость лог доходностей по тикерам рассматривается, здесь максимальная зависимость может наблюдаться для компаний, которые зависят друг от друга, в той или иной степени, производят взаимодополняющие блага, а снижение зависимости может наблюдаться из- за того, что одна из компаний перешла на производство других предметов быта.

Заключение


В результате проведенной работы получилось, что гипотеза о независимости логарифмических доходностей для различных интервалов времени при большом, среднем и малом объеме торгов принимается при 0,01 и 0,05 уровнях значимости практически всегда, однако гистограмма Р-значений не равномерна на отрезке [0,1] , что не дает мне с полной уверенностью сказать, что они независимы и гипотеза Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов (рис. 164) принимается в отличие от результатов прошлого года.
Новизна состоит в том, что в работе были использованы новые программы и две альтернативные гипотезы

Литература

1)Браилов А.В. Лекции по математической статистике.-М.: Финакадемия, 2007
2)Гмурман В.Е. - Руководство к решению задач по теории вероятностей и математической статистике: Учеб. Пособие - 12-е изд.,перераб.-М.:Высшее образование, 2006-476 с. (Основы наук)
)Горяинов Б.В., Павлов И.В., Цветкова Г.М. и др. Математическая статистика: под ред. ЗарубинаВ.С., Крищенко А.П. - М.:Изд-во МГТУ им. Н.Э.Баумана, 2001. - 424 с.(Сер. Математика в техническом университете; Вып. XVII).
)Ниворожкина Л.И., Морозова З.А. Теория вероятностей и математическая статистика - М.:Эксмо, 2008. - 432 с. - (Техническое образование).
)Письменный Д. Конспект лекций по теории вероятностей и математической статистике и случайным процессам. - М.: Айрис-пресс, 2008. - 256 с. - (Высшее образование).
)http://finance.yahoo.com.
)Аюпов Д. (2013). Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов Москва: ФГОУ ВПО "Финансовый университет при Правительстве РФ".
)Безделина Е. (2013). Проверка следствий гипотезы о независимости логарифмической доходности за различные интервалы времени Москва: ФГОУ ВПО "Финансовый университет при Правительстве РФ".
)Петухова С. (2013). Проверка гипотезы о нормальном распределении дневной логарифмической доходности по модифицированному критерию Пирсона. Москва: ФГОУ ВПО "Финансовый университет при Правительстве РФ".

Приложение 1

Таблица 19. Характеристики компьютера

Тип процессораIntel Core i5 2450M
Тактовая частота2.50 GHz
Частота системной шины99.76 MHz
Объем кэш-памяти второго уровня512KB

Таблица 20. Список программ, работающих более 10 секунд

Гистограмма Р-значений.mtc15 c.
Квантили распределения статистики критерия.mtc2 м. 35 с.
Мощность критерия.mtc29 с.

Приложение 2


.Число торговых дней

//источник [7]
//время работы 656 мс
Y=2010:2013;
T=loadtextcol("Tickers.txt","Tickers");
NT=0(#T,#Y);(y in Y)
{=date(y,1,1);=date(y,12,31);(t in T)
{=loaddaily(d1,d2,t+".csv","CLOSE");(t.num,y.num)=sum(X>0);
}
}=["год/тикер","2010","2011","2012","2013"];=[F;T,NT];(tiker,"Число торговых дней.csv");
3,4.Скачки цен
//источник [7]
//Радостева 2014 г.
//717 мс=2010:2013;=loadtextcol("Tickers.txt","Tickers");=0(#T,#Y);
NT1=0(#T,#Y);
for (y in Y)
{=date(y,1,1);=date(y,12,31);(t in T)
{=loaddaily(d1,d2,t+".csv","CLOSE");=select(X,X>0);=I(2:#I);=I(1:(#I-1));(t.num,y.num)=max(I1/I);
NT1(t.num,y.num)=min(I1/I);
}
}=["год/тикер","2010","2011","2012","2013"];=[F;T,NT-1];(U,"Скачки цен вверх.csv");
U=[F;T,NT1-1];(U,"Скачки цен вниз.csv");
1,2.Графики со скачками
//источник [7]
//2.8 c
Tickers=loadtextcol("Tickers.txt","Tickers");
Max = 0; MaxTic = super(1);= 1; MinTic = super(1);
d1 = date(2010,1,1);= date(2013,12,31);
for(i in Tickers)
{= loaddaily (d1,d2,i + ".csv","CLOSE");=select(Close,Close>0);=I(2:#I);= I(1:(#I-1));(max(C1/C) > Max)
{= max(C1/C); MaxTic = i;
}(min(C1/C) 0);= 1:#C;= select(X,Close>0);(i);(XX,C,blue);();
show();();
}
7. Квантили распределения статистики критерия
//Источник [7] и [8]
//Радостева 2014г.
//2м 35с(0);
//число дней для года, полугодия, квартала,
//которые соответствуют большому, среднему и малому объемам торгов
k=[240;120;60];
//временной лаг
lag=1:8;
m=10000;=0(m,#k);=0(m,#k);
//закон геометрического броуновского движения
law L()=exp(sum(nlaw(0,1)(1)));(j in 1:#k)
{(i in 1:m)
{
//содаем два независимых вектора,показывающих лог доходность
Log=dif(ln(L(k(j))));(lg in 1:8)
{=Log(1:#Log-lg);=Log(lg+1:#Log);=#Y;=max(X)+1;=max(Y)+1;=min(X)-1;=min(Y)-1;=elaw(Y).invpg(1/3);=elaw(X).invpg(1/3);
//интервалы для вычисления частот торгов=[minX;-rX;rX;maxX];
DY=[minY;-rY;rY;maxY];
r1=#DX-1;//количество интервалов для X=#DY-1;//то же самое для Y=0(r1,r2);
//создаем таблицу частот
for (c in 1:r1)(d in 1:r2)(c,d)=sum(X>=DX(c)& X=DY(d) & Y5)
x2=sum((n-t/p)^2/t)*p;//статистика критерия
St(i,j)=x2;
}
}
}
Lew=0.001:0.999:0.001;=[Lew];(i in 1:#k)
{=elaw(St.c(i));=[qi,El.q(Lew)];
}
savetable(["Квантиль","Год","Полугодие","Квартал";qi],
"Квантили распределния статистики.csv");
3,4,5. Гистограммы Р-значений
//источники [7] и [8]
//Радостева 2014г.
//15 c(0);
q=loadnumcol("Квантили распределения статистики.csv","Квантиль");=loadnumcol("Квантили распределния статистики.csv","Год");=loadnumcol("Квантили распределения статистики.csv","Полугодие");=loadnumcol("Квантили распределения статистики.csv","Квартал");
//эмпирические законы распределения
Qy=elaw(y);
Qhy=elaw(hy);=elaw(quarter);
m=1000;
//объем выборок для года, полугодия, квартала
k=[240;120;60];
//временной лаг
lag=1:8;
PV=0(m,#k);
//закон геометрического броуновского движенияL()=exp(sum(nlaw(0,1)(1)));
for(j in 1:#k)
{(i in 1:m)
{=dif(ln(L(k(j))));
for (lg in lag)
{
//создаём два независимых вектора,
//показывающих лог доходность
X=Log(1:#Log-lg);
Y=Log(1+lg:#Log);=#Y;=max(X)+1;=max(Y)+1;=min(X)-1;=min(Y)-1;=elaw(Y).invpg(1/3);=elaw(X).invpg(1/3);
//интервалы для вычисления частот
DX=[minX;-rX;rX;maxX];
DY=[minY;-rY;rY;maxY];
r1=#DX-1;//количество интервалов для X=#DY-1;//то же самое для Y=0(r1,r2);
//создаем таблицу частот
for (c in 1:r1)(d in 1:r2)(c,d)=sum(X>=DX(c)& X=DY(d) & Y5)
x2=sum((n-t/p)^2/t)*p;
s=x2;
//находим Р-значение для года, полугодия, квартала
if (j==1) PV(i,j)=Qy.pg(s);(j==2) PV(i,j)=Qhy.pg(s);(j==3) PV(i,j)=Qquarter.pg(s);
}
}
}=0.001;=0:1:h;=PV.c(1).intfrgel(Pt);=PV.c(2).intfrgel(Pt);=PV.c(3).intfrgel(Pt);
savetable(["PV","Год","Полугодие","Квартал";
[Pt(2:#Pt),PV.c(1),PV.c(2),PV.c(3)]],"Таблица Р-значений.csv");(TOF1,blue);("При объеме выборки соответствующему году");
axes();();();(TOF2,blue);
wintitle("При объеме выборки соответствующему полугодию");
axes();();();(TOF3,blue);
wintitle("При объеме выборки соответствующему кварталу");();
Проверка равномерности распределения по Колмогорову
//Радостева 2014г
//32мс=loadnumcol("Таблица Р-значений.csv","Год");=loadnumcol("Таблица Р-значений.csv","Полугодие");=loadnumcol("Таблица Р-значений.csv","Квартал");
Lteor=ulaw(0,1);=elaw(Yh);Lnab2=elaw(Ym);Lnab3=elaw(Yl);=0:1:0.1;
//Критерий Колмогорова=max(abs(Lnab1.pl(XX)-Lteor.pl(XX)))*(#Yh)^0.5;=max(abs(Lnab2.pl(XX)-Lteor.pl(XX)))*(#Ym)^0.5;=max(abs(Lnab3.pl(XX)-Lteor.pl(XX)))*(#Yl)^0.5;=pvKolm(DD1);=pvKolm(DD2);
Z3=pvKolm(DD3);="Не принимается при объеме выборки соответствующему году";="Не принимается при объеме выборки соответствующему полугодию";="Не принимается при объеме выборки соответствующему кварталу";(Z1>0.05)="При объеме выборки соответствующему году принимается";(Z2>0.05)="При объеме выборки соответствующему полугодию принимается";(Z3>0.05)="При объеме выборки соответствующему кварталу принимается";
[k1;k2;k3];
9,10,11. Мощность критерия
//источник [7]
//Радостева 2014г.
//29c(0);
q=loadnumcol("Квантили распределения статистики.csv","Квантиль");=loadnumcol("Квантили распределения статистики.csv","Год");=loadnumcol("Квантили распределения статистики.csv","Полугодие");=loadnumcol("Квантили распределения статистики.csv","Квартал");=[240;120;60];
//временной лаг
lag=1:8;
g=0(2,3);
//критические точки для года, полугодия, квартала
Tkr=[elaw(y).q(1-0.05/2);elaw(hy).q(1-0.05/2);elaw(quarter).q(1-0.05/2)];
Count=0(2,3);=1000;
//коэффициент корреляции
po=0.7;//0.1,0.45
K=0(2,3);
C=[po;-po];
law L()=exp(sum(nlaw(0,1)(1)));(a in 1:#C)
{(j in 1:#S)
{(i in 1:m)
{=dif(ln(L(S(j))));
for(lg in lag)
{
//создаем зависимые лог доходности
LnX=Log(1:#Log-lg);=LnX*C(a)+(1-C(a)^2)^0.5*Log(1+lg:#Log);
maxX=max(LnX)+1; maxY=max(LnY)+1;=min(LnX)-1; minY=min(LnY)-1;=elaw(LnX).invpg(1/3); rY=elaw(LnY).invpg(1/3);=[minX;-rX;rX;maxX];=[minY;-rY;rY;maxY];
//количество интервалов=#D1-1;=#D2-1;=#LnX;
//создаем таблицу частот частоты
n=0(r1,r2);(c in 1:r1)(d in 1:r2)(c,d)=sum(LnX>=D1(c)&LnX=D2(d)&LnY5)
{
//сколько раз проверялась гипотеза
g(a,j)=g(a,j)+1;
z=sum((n-t/k)^2/t)*k;
//количество раз, когда гипотеза не выполнялась
if (Tkr(j)0);//отбираются акции только по рабочим дням= elaw(V);//эмпирическое распределение
//эмпирические квантили(определяется объем торгов уровня квантили 1/3)= LV.invpl(1/3);
//эмпирические квантили(определяется объем торгов уровня квантили 2/3)
v2 = LV.invpl(2/3);= loaddaily(d1,d2,ticker + ".csv","Adj Close");= select(P0,V0>0);(min(P)>0);(nv in 1:#Vars)
{(ticker.num,nv) ="*";//-1 для построения диаграммы(nv==1) C = (Vv1 & V=v2)(1:#V-1);
//определяется дневная логдоходность для C
lnR = select(dif(ln(P)), C);
m = #lnR;//число наблюдений
//если число наблюдений меньше 50,
//то прерывается выполнение тела оператора for
// и начинается переход к следующему элементу матрицы
if(m=D1(i)&lnR1=D2(j)&lnR2 5)
{
//если выполняется условие, при котором можно
//использовать критерий Пирсона:
//теоритические частоты >=5=n*sum((p-t)^2/t);
//сколько раз считался критерий для одного года //и тикера
Count=Count+1;(lg) = x2law(k).pg(z); // P-значение
}
}
//среднее значение(Count) TabPV(ticker.num,nv) =sum(pv)/Count;
}
}= ["Тикер",Vars];= [H; [Tickers,TabPV]];(Out,"tab"+y+".csv");
}
6,7,8.Гистограмма Р-значений для реальных данных
//Радостева 2014г.
//1.8с=2011:2013;
//загружаем данные по каждому объему торгов
X1=loadnumcol("tab2010.csv","LoVol");=loadnumcol("tab2010.csv","MidVol");=loadnumcol("tab2010.csv","HiVol");
//убираем данные, где статистика не посчиталась
LoVol=select(X1,X1>0&X2>0&X3>0);=select(X2,X1>0&X2>0&X3>0);=select(X3,X1>0&X2>0&X3>0);
//строим векторы Р-начений для каждого объема торгов
for (y in Y)
{=[LoVol;loadnumcol("tab"+y+".csv","LoVol")];=[MidVol;loadnumcol("tab"+y+".csv","MidVol")];=[HiVol;loadnumcol("tab"+y+".csv","HiVol")];
}
//выбираем шаг=0.01;=0:1:h;
//разбиваем на интервалы=LoVol.intfrgel(Pt);
TOF2=MidVol.intfrgel(Pt);=HiVol.intfrgel(Pt);
//рисуем(TOF1,blue);("При малом объеме торгов");
axes();();();(TOF2,blue);
wintitle("При большом среднем торгов");
axes();();();(TOF3,blue);
wintitle("При большом объеме торгов");();
16.Доля проверок, в которых гипотеза проверялась
//источник [7]
//Радостева 2014г.
//5.8c= date(2010,1,1);
d2 = date(2010,12,31);= loadtextcol("Tickers2.txt","Tickers");= ["LoVol","MidVol","HiVol"];
//временной лаг=[1:5;10:25:5;30:50:10];= super(#Tickers,#Vars);=2010:2013;=0(2,3);=0(2,3);(y in Y)
{= date(2010,1,1);= date(y,12,31);(ticker in Tickers)
{= loaddaily(d1,d2,ticker + ".csv","Volume");
V = select(V0,V0>0);//отбирабтся акции только по рабочим дням= elaw(V);//эмпирическое распределение
//эмпирические квантили(определяется объем торгов
//уровня квантили 1/3)= LV.invpl(1/3);
//эмпирические квантили(определяется объем торгов
//уровня квантили 2/3)
v2 = LV.invpl(2/3);= loaddaily(d1,d2,ticker + ".csv","Adj Close");= select(P0,V0>0);(min(P)>0);(nv in 1:#Vars)
{(ticker.num,nv) ="*";//-1 для построения диаграммы(nv==1) C = (Vv1 & V=v2)(1:#V-1);
//определяется дневная логдоходность для C
lnR = select(dif(ln(P)), C);
m = #lnR;//число наблюдений(m=D1(i)&lnR1=D2(j)&lnR2 5)
{
//если выполняется условие, при котором
//можно использовать критерий Пирсона:
// теоритические частоты >=5
z=n*sum((p-t)^2/t);(kr in 1:#Tkr)
{(kr,nv)=Cou(kr,nv)+1;
//сколько раз гипотеза выполнялась
if(Tkr(kr)>abs(z))
Res(kr,nv)=Res(kr,nv)+1;
}
}
}
}
}
}(["Уровень значимости","LoVol","MidVol","HiVol";
[["1%";"5%"],Res/Cou]],
"Доля проверок, в которых гипотеза принималась.csv");
17,18.Медиана Р-значений
//Радостева 2014г
//16мс=2011:2013;
//загружаем таблицу Р-значений при разных объемов торгов
LoVol=loadnumcol("tab2010.csv","LoVol");=loadnumcol("tab2010.csv","MidVol");=loadnumcol("tab2010.csv","HiVol");(y in Y)
{=[LoVol,loadnumcol("tab"+y+".csv","LoVol")];=[MidVol,loadnumcol("tab"+y+".csv","MidVol")];=[HiVol,loadnumcol("tab"+y+".csv","HiVol")];
}=loadtextcol("Tickers2.txt","Tickers");=2010:2013;=0(#Y,3);=0(#Tickers,3);
//медианы по годам(y in 1:#Y)
{
X1=LoVol.c(y);X2=MidVol.c(y);X3=HiVol.c(y);
X1=select(X1,X1>0);X2=select(X2,X2>0);X3=select(X3,X3>0);(y,1)=median(X1);(y,2)=median(X2);
MedYear(y,3)=median(X3);
}
//медианы по тикерам
for (tic in 1:#Tickers)
{='LoVol.r(tic);X2='MidVol.r(tic);X3='HiVol.r(tic);=select(X1,X1>0);X2=select(X2,X2>0);X3=select(X3,X3>0);(tic,1)=median(X1);(tic,2)=median(X2);(tic,3)=median(X3);
}(["Год","LoVol","MidVol","HiVol";Y,MedYear],
"Медианы Р-значений по годам.csv");
savetable(["Тикер","LoVol","MidVol","HiVol";Tickers,MedTic],
"Медианы Р-значений по тикерам.csv");

Комментарии:

Вы не можете оставлять комментарии. Пожалуйста, зарегистрируйтесь.