Курсовая работа: Методы математической статистики и теории вероятностей в выборе фильма

СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1. ЧАСТОТА ВСТРЕЧАЕМОСТИ ЗАРУБЕЖНЫХ/ОТЕЧЕСТВЕННЫХ ФИЛЬМОВ НА САЙТЕ MEGOGO.NET
1.1 ТЕОРЕТИЧЕСКОЕ ОПИСАНИЕ ФИЛЬМОВ САЙТА MEGOGO.NET
1.2 ПОПУЛЯРНОСТЬ "ОТЕЧЕСТВЕННЫХ" ФИЛЬМОВ
2. СРАВНЕНИЕ РАЗМАХА КОЛИЧЕСТВА ПРОСМОТРЕННЫХ ФИЛЬМОВ ОТЕЧЕСТВЕННОГО И ЗАРУБЕЖНОГО ПРОИЗВОДСТВА
2.1 ЖАНРЫ КИНОИНДУСТРИИ
2.2 СРАВНЕНИЯ РАЗМАХА КОЛИЧЕСТВА ПРОСМОТРЕННЫХ ФИЛЬМОВ ОТЕЧЕСТВЕННЫХ И ЗАРУБЕЖНЫХ КИНОКОМПАНИЙ
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ


Дата добавления на сайт: 14 февраля 2025
Министерство образования и науки Республики Казахстан
Северо-Казахстанский государственный университет им. М. Козыбаева
Факультет информационных технологий
Кафедра "Математика и информатика"

КУРСОВАЯ РАБОТА
На тему: "Методы математической статистики и теории вероятностей в выборе фильма""
по специальности 5В060200 - "Информатика"

Выполнил Е.К. Касымов
студент группы Ин (е) - 13
Научный руководитель В.П. Куликова
к. т. н., доцент

Петропавловск 2015
Содержание

Введение
1. Частота встречаемости зарубежных/отечественных фильмов на сайте Megogo.net
1.1 Теоретическое описание фильмов сайта Megogo.net
1.2 Популярность "отечественных" фильмов
2. Сравнение размаха количества просмотренных фильмов отечественного и зарубежного производства
2.1 Жанры киноиндустрии
2.2 Сравнения размаха количества просмотренных фильмов отечественных и зарубежных кинокомпаний
Заключение
Список использованной литературы
Приложение

Введение

Кинематограф - отрасль человеческой деятельности, заключающаяся в создании движущихся изображений. Иногда также упоминается как синематограф и кинематография. Кинематограф был изобретен в конце XIX века и стал крайне популярен в XX веке.
В понятие кинематографа входят киноискусство - вид современного изобразительного искусства, произведения которого создаются при помощи движущихся изображений, и киноиндустрия (кинопромышленность) - отрасль экономики, производящая кинофильмы, спецэффекты для кинофильмов, мультипликацию, и демонстрирующая эти произведения для зрителей. Произведения киноискусства создаются при помощи кинотехники. Изучением кинематографа занимается наука киноведение. Сами кинофильмы могут сниматься в различных жанрах.
Все больше телезрителей сегодня остаются недовольны политикой телевизионных каналов и постепенно уходят от экранов телевизоров и переходят к мониторам компьютеров. И это неудивительно, ведь в сети Интернет можно найти все что угодно. База интернет киноиндустрии пополняется каждый день большим количеством фильмов. На сегодняшний день можно смело говорить о том, что интернет - это огромная всеобъемлющая реальность, возможностям которой нет предела. К одной из таких возможностей можно смело причислить онлайн кинотеатры.
Все больше пользователей каждый день убеждаются что просмотр фильмов онлайн это очень просто и удобно. Сайты онлайн кинотеатров предоставляют широкий выбор художественных фильмов, а также самые различные передачи, мультфильмы и сериалы. У такого подхода есть огромное количество преимуществ. Во-первых, для того чтобы посмотреть интересующий вас фильм вам не понадобиться даже выходить из дома. Вы можете смотреть все новинки, устроившись на любимом диване. Во-вторых, смотреть фильмы вы можете в любое удобное для вас время. Ну и в-третьих, для того что бы посмотреть фильм вам не понадобиться тратить деньги на покупку или прокат дисков, так как онлайн кинотеатр - это абсолютно бесплатное удовольствие.
Еще одним неоспоримым достоинством онлайн кинотеатров можно считать то что на таких ресурсах вы можете найти абсолютно все, начиная от признанных произведений метров киноискусства, заканчивая никому не известными режиссерскими работами. Обычно сайты онлайн кинотеатров имеют очень простой интерфейс, ориентироваться в котором очень просто, так вы сможете отыскать любой фильм, как по названию, так и по году выпуска или по фамилии режиссера, снявшего данный фильм. Кроме всего прочего вы сможете найти здесь анонсы к фильмам и отзывы уже посмотревших его людей. Таким образом, получается, что вы можете не только смотреть фильмы на сайтах онлайн кинотеатров, но и обсуждать фильм с теми, кто его видел.
Кинематограф занимает значительную часть современной культуры многих стран. Во многих странах киноиндустрия является значимой отраслью экономики. Производство кинофильмов сосредоточено на киностудиях. Фильмы демонстрируются в кинотеатрах, по телевидению, распространяются "на видео" в форме видеокассет и видеодисков, а с появлением скоростного интернета стало доступным скачивание кинофильмов в форме видеофайлов на специализированных сайтах или посредством пиринговых сетей, а также просмотр онлайн.
Актуальность выбранной темы обусловлена тем, что в нынешнее время в просторах интернета содержится огромное количество доступных для просмотра кинокартин. Вместе с этим усложняется и выбор просмотра нужного фильма, который будет действительно обладать всеми качествами, которыми и должен обладать фильм способный впечатлить в полной мере, вызвать бурю эмоций или же наоборот просто расслабиться.
выбор фильм статистика математическая
Цель курсовой работы: Определить популярность отечественных и зарубежных фильмов сайта megogo.net, и проверить размах количества просмотренных фильмов отечественных и зарубежных кинокомпаний.
Для достижения цели необходимо решить следующие задачи:
·Собрать необходимые статистические данные
·Определить, насколько популярны фильмы отечественных кинокомпаний.
·Сравнить размах количества просмотренных фильмов отечественных и зарубежных кинокомпаний.
·Сделать соответствующие выводы.
Объект исследования - отечественные и зарубежные фильмы.
Предмет исследования - частоты встречаемости и размах количества фильмов отечественных и зарубежных кинокомпаний.
Методы исследования, применяемые в данной работе:
1)тест Методы математической статистики и теории вероятностей в выборе фильма (рис. 1) для единственной выборки
)параметрический метод Стьюдента
3) тест экстремальных реакций Мозеса, позволяющий сравнить размах цен двух независимых выборок
Основные положения, выносимые автором на защиту: частоты встречаемости зарубежных, отечественных фильмов, количества фильмов отечественных и зарубежных кинокомпаний
Практическая значимость. Исследования, проведенные в курсовой работе, непременно имеют практическую значимость, а именно разработка инструмента, который необходим помощи выбора фильма, подходящего для зрителя.
Объем работы - 25с.
1. Частота встречаемости зарубежных/отечественных фильмов на сайте Megogo.net

1.1 Теоретическое описание фильмов сайта Megogo.net

После тяжелого дня некоторые люди хотят расслабиться за чашечкой теплого чая и просмотром хорошего интересного фильма, на который можно потратить основную часть своего отдыха. Выбор фильма - важен, для того что бы получить волну впечатлений. Наша выборка будет сделана из сайта megogo.net. MEGOGO - Украинская меди компания, предоставляющая услуги онлайн-кинотеатра на просторах сайта megogo.net можно найти огромное количество фильмов разных жанров. Как и на любом сайте интернета посвящённому онлайн просмотру фильмов, здесь можно встретить самые различные жанры и категории фильмов. Но среди всего многообразия фильмов, все фильмы можно условно разделить на две группы, в зависимости от страны в которой был снят фильм. - "отечественные" и "зарубежные". Под "отечественными" понимаются фильмы, снятые в Казахстане в таких киностудиях как "Телекомпания Калиот ", "Кинокомпания Евразия фильм ", "Life production " и т.д. "зарубежные же" же - фильмы, производимые в других странах, таких как, Япония, Германия, Америка и т.п. Если просмотреть сайт megogo.net, то нетрудно заметить, что одни фильмы встречаются чаще других, то есть одни фильмы более популярны, чем другие. И такой фактор, как популярность фильма занимает не последнее место в выборе просматриваемого фильма зрителем. При выборе фильма важно учитывать популярность фильма, так как просмотр популярного фильма дает уверенность будет впечатляющим и запомнится своим сюжетом. Зайдя на сайт можно выбрать нужную вам категорию жанра, согласно которому и будет совершаться выбор в просмотре фильма.
1.2 Популярность "отечественных" фильмов

Для определения популярности фильмов необходимо определить, какие фильмы встречаются чаще. Зайдя на просторы интернета был выбран первый сайт, предоставляющий услуги онлайн просмотра фильмов. Выбор пал на украинскую медиа-компанию Megogo, база зрителей которой постоянно растет.
На сайте megogo.net, случайным образом было проверено 50 фильмов, которые распределились, как показано в таблице 1.1, в зависимости от страны производителя следующим образом:

Таблица 1.1
Распределение фильмов по странам
ГруппаОтечественныеЗарубежныеИтого
Количество153550

Можно ли на основании полученных данных сказать, что все фильмы
пользуются одинаковой популярностью?
В данном случае имеется одна выборка и необходимость проверить, соответствует ли распределение результатов в выборке предполагаемому распределению.
Так как в данном случае у нас имеется небольшая выборка, используется непараметрический тест. Для решения подобных задач применяется один из наиболее популярных непараметрических тестов - тест Методы математической статистики и теории вероятностей в выборе фильма (рис. 2).
В качестве теоретического распределения в нашем случае используется равномерное распределение. Смысл его в том, что все результаты считаются равновероятными. При наличии двух групп фильмов вероятность встретить фильм, принадлежащую какой-либо из них, должна быть одна и та же и равна 1/2=0,5.
С учетом данного обстоятельства окончательный вариант
расчетной таблицы для данного примера представлен в таблице 1.2.

Таблица 1.2
Теоретическое и эмпирическое распределение фильмов
ГруппаОтечественныеЗарубежныеИтого
Теоретическое количество252550
Эмпирическое количество153550

Формулируем нулевую и альтернативную гипотезы и задаем уровень значимости Методы математической статистики и теории вероятностей в выборе фильма (рис. 3).
Н0: Вероятность встретить на сайте megogo.net фильм отечественного производства, равна вероятности встретить фильм, произведенный в зарубежных странах (Если Методы математической статистики и теории вероятностей в выборе фильма (рис. 4) меньше Методы математической статистики и теории вероятностей в выборе фильма (рис. 5)).
Н1: Вероятность встретить на сайте megogo.net фильм отечественного производства, не равна вероятности встретить фильм, произведенный в зарубежных странах (Если Методы математической статистики и теории вероятностей в выборе фильма (рис. 6) больше или равно Методы математической статистики и теории вероятностей в выборе фильма (рис. 7)).
Вычисляем сумму отклонений между наблюдаемыми и теоретическими значениями по формуле:

Методы математической статистики и теории вероятностей в выборе фильма (рис. 8),

где Методы математической статистики и теории вероятностей в выборе фильма (рис. 9) - наблюдаемые, или эмпирические, значения (частоты) для
каждой из категорий, Методы математической статистики и теории вероятностей в выборе фильма (рис. 10) - ожидаемые, или теоретические, значения (частоты) для каждой из категорий таблицы
Подставим соответствующие значения Методы математической статистики и теории вероятностей в выборе фильма (рис. 11) и Методы математической статистики и теории вероятностей в выборе фильма (рис. 12) в расчетную формулу:

Методы математической статистики и теории вероятностей в выборе фильма (рис. 13)

Таблица 1.3
Распределение теоретических и эмпирических частот
Категории
12итого
Ожидаемые и эмпирические частоты, , 50

Полученное значениеМетоды математической статистики и теории вероятностей в выборе фильма (рис. 14)сравнивается со значением Методы математической статистики и теории вероятностей в выборе фильма (рис. 15), которое берется из таблицы критических значений для теста Методы математической статистики и теории вероятностей в выборе фильма (рис. 16) (см. Приложение Таблица 1) в зависимости от выбранного уровня значимости Методы математической статистики и теории вероятностей в выборе фильма (рис. 17) и числа степеней свободы. В свою очередь, число степеней свободы для теста Методы математической статистики и теории вероятностей в выборе фильма (рис. 18) зависит от размера расчетной таблицы и равноМетоды математической статистики и теории вероятностей в выборе фильма (рис. 19). В нашем случае Методы математической статистики и теории вероятностей в выборе фильма (рис. 20).
Если Методы математической статистики и теории вероятностей в выборе фильма (рис. 21) больше или равно Методы математической статистики и теории вероятностей в выборе фильма (рис. 22), то нулевая гипотеза отклоняется и принимается альтернативная (эмпирическое распределение значимо отличается от теоретического: фильмы одних стран-производителей встречаются на просторах сайта megogo.net чаще или реже, чем фильмы других).
Из таблицы 1 находим, что для Методы математической статистики и теории вероятностей в выборе фильма (рис. 23)и Методы математической статистики и теории вероятностей в выборе фильма (рис. 24), Методы математической статистики и теории вероятностей в выборе фильма (рис. 25).
Поскольку Методы математической статистики и теории вероятностей в выборе фильма (рис. 26) гораздо больше, чем Методы математической статистики и теории вероятностей в выборе фильма (рис. 27), то нулевая гипотеза отклоняется и принимается альтернативная. То есть, Вероятность встретить на сайте megogo.net фильм отечественного производства, не равна вероятности встретить фильм, произведенный в зарубежных странах.
Для определения популярности "отечественных" фильмов можно воспользоваться и параметрическими методами. Для этого необходимо собрать несколько больше статистических данных.
Для исследования были собраны данные из 100 выборок, в каждой из которых рассматривалось по 20 фильмов. Статистические данные представлены в таблице 1.4.

Таблица 1.4
Статистические данные фильмов из 100 выборок
Номер выборкиЧисло отечественных фильмовНомер выборкиЧисло отечественных фильмовНомер выборкиЧисло отечественных фильмовНомер выборкиЧисло отечественных фильмов
13263513765
22272522774
32281534783
44293544793
51303552803
63313565813
72322574822
81334583832
93344593844
103352603851
113365613863
122374622872
134383632881
144393644893
152403651903
165413663913
174422672922
183432681934
193444693944
203451703952
213463713965
222472722974
232481734983
244493744993
2515037521003

Так как параметрические методы применяются при нормальном распределении, проверим, наши данные на нормальность.
Для того чтобы распределение было нормальным, нужно чтобы среднее, мода и медиана были равны.
Модой (Методы математической статистики и теории вероятностей в выборе фильма (рис. 28)) называется наиболее часто встречающееся значение среди имеющихся. Для того чтобы разобраться с модой, построим дополнительную таблицу. Поместим в нее значения встречающихся "отечественных" фильмов от минимального количества (1) до максимального (5), и укажем, сколько раз встречается то или иное количество фильмов (табл. 1.5).

Таблица 1.5
Частота встречаемости "отечественных" фильмов
Число отечественных фильмов12345
Частота102540205

Как видно из таблицы, чаще всего на каждые 20 фильмов встречается 3 "отечественных" (это значение встречается чаще всего - 40 раз). Поэтому мода появления "отечественных" фильмов равна-3.
Новая таблица содержит ту же самую информацию, что и предыдущая, но она заметно короче, данные в ней упорядочены по возрастанию, и с ней удобней работать.
Медиана (Методы математической статистики и теории вероятностей в выборе фильма (рис. 29)) представляет собой значение, которое делит упорядоченные данные пополам таким образом, что одна половина данных оказывается меньше медианы, а другая - больше.
Нахождение медианы не носит столь наглядного характера, как нахождение моды. Для определения медианы приходится прибегать к дополнительным преобразованиям и вычислениям. Во-первых, дополним таблицу еще двумя строками и получим таблицу 1.6.
Таблица 1.6
Частота, накопленная частота и процент встречаемости фильмов
Число отечественных фильмов12345
Частота102540205
Накопленная частота10357595100
%10357595100

В первой из дополнительных строк запишем значения так называемых "накопленных" (или кумулятивных) частот, которое будет равно 100.
Во-вторых, запишем в следующую графу, какой процент от 100
составляет каждое значение накопленных частот. В нашем случае значения третей и четвертой строк совпадают, так как частота равняется 100. Вообще могут получаться не одинаковые значения.
Попытаемся понять смысл полученного в последней графе результата.
При переходе от столбца со значением числа фильмов "2" к столбцу со значением "3" за плечами остается 35% всех результатов. А при переходе от столбца со значением "3" к столбцу "4" за плечами уже 75%. Медиана - это та точка, которая делит все данные в отношении 50: 50. Очевидно, требуемая точка где-то внутри столбца со значением "3". То есть Методы математической статистики и теории вероятностей в выборе фильма (рис. 30)
Для нахождения среднего используется простая формула, смысл которой в том, чтобы сложить все значения (в нашем случае значения количества встреченных "отечественных" фильмов) и разделить полученный результат на число значений (в нашем случае 100).
Дальше можно идти двумя путями.
Во-первых, начать непосредственно складывать все 100 значений из первой таблицы.
Во-вторых, догадаться, что если некоторые значения количества просмотренных фильмов встречаются несколько раз, то можно воспользоваться данными из таблицы 1.2 и перейти от сложения повторяющихся значений к умножению этих значений на число повторов (например, число машин 1 встречается в первой таблице 10 раз, значит вместо 1 + 1 + 1 + 1+1+1+1+1+1 можно записать 1x10). Тогда:

Методы математической статистики и теории вероятностей в выборе фильма (рис. 31)

Среднее значение получилось близким к трем.
Исходя их найденных значений моды, медианы и среднего, можно утверждать, что данное распределение можно считать нормальным, так как значения моды и медианы абсолютно равны, а значение среднего отличается на 0,15. Если взять большее количество испытаний, то среднее значение будет приближаться к трем.
На диаграмме 1, можно просмотреть, что закон распределения стремится к нормальному.

Методы математической статистики и теории вероятностей в выборе фильма (рис. 32)
Диаграмма 1.

Теперь приступим к проверке гипотезы.
Н0: Вероятность встретить на сайте megogo.net фильм отечественного производства, равна вероятности встретить фильм, произведенный в зарубежных странах.
Н1: Вероятность встретить на сайте megogo.net фильм отечественного производства, не равна вероятности встретить фильм, произведенный в зарубежных странах.
Наш прогноз Методы математической статистики и теории вероятностей в выборе фильма (рис. 33), выборка Методы математической статистики и теории вероятностей в выборе фильма (рис. 34), средняя Методы математической статистики и теории вероятностей в выборе фильма (рис. 35).
Меры центральной тенденции показывают, вокруг каких значений
группируется большинство экспериментальных данных. Обычно в качестве "центра" такого группирования рассматривается среднее (X).
Меры изменчивости говорят о том, в какой степени полученные результаты отклоняются от "центра группирования", что чаще всего приводит к определению меры отклонения экспериментальных данных от среднего. В принципе, в качестве меры изменчивости можно было бы использовать среднее значение отклонений текущих значений от среднего. Для этого необходимо определить, насколько каждое значение количества фильмов отклоняется в большую или меньшую сторону от X-2,895 затем сложить все результаты и разделить на число значений. К сожалению, этот путь невозможен, поскольку, как правило, отклонения от среднего в большую сторону (со знаком "+") и в меньшую сторону (со знаком "-") компенсируют друг друга и в сумме дают ноль. Для решения этой проблемы лучше использовать не отклонение от среднего, а квадрат этого отклонения, потому что такая процедура позволяет избавиться от влияния знака. Вначале делается та же операция - определяется, насколько каждое значение возраста отклоняется в большую или меньшую сторону от Х= 2,85. Затем каждый из полученных результатов возводится в квадрат, все складывается и делится на число значений. Получаемая таким образом мера изменчивости называется дисперсией. Данные приведены в таблице 1.7.

Таблица 1.7. Вычисление дисперсии
Число фильмовЧастота (Число фильмов-Среднее) (Число фильмов - Среднее) 2 (Частота) * (фильмов - Среднее) 2
110-1,853,4234,2
225-0,850,7218
3400,150,020,8
4201,151,3226,4
552,154,6223,1

Методы математической статистики и теории вероятностей в выборе фильма (рис. 36).

Подставим в эту формулу необходимые значения из таблицы

Методы математической статистики и теории вероятностей в выборе фильма (рис. 37)

К сожалению, дисперсия оказывается не очень удобным показателем меры изменчивости.
Для решения возникшей проблемы вместо значения дисперсии используется квадратный корень из нее. Полученное таким образом новое значение называется стандартным отклонением и является наиболее популярной мерой изменчивости. Стандартное отклонение часто обозначается как Методы математической статистики и теории вероятностей в выборе фильма (рис. 38) (сигма):

Методы математической статистики и теории вероятностей в выборе фильма (рис. 39)

Для нашего случая:

Методы математической статистики и теории вероятностей в выборе фильма (рис. 40).
Проверим гипотезу по формуле Стьюдента Методы математической статистики и теории вероятностей в выборе фильма (рис. 41).

Выбирается уровень значимости a и критическая область А, так, чтобы условная вероятность попадания критерия в А при условии справедливости гипотезы Методы математической статистики и теории вероятностей в выборе фильма (рис. 42)равнялась a.
Выберем a=0.05 (вероятность не принять верный прогноз). По табл. распределения Стьюдента находим критическое значение (квантиль) (см. Приложение Таблица2)

Методы математической статистики и теории вероятностей в выборе фильма (рис. 43)

Критерия

Ю Р{|t|>1,725}=0.05,Ю критическая область А:
|t|>1,725.
Методы математической статистики и теории вероятностей в выборе фильма (рис. 44)
Методы математической статистики и теории вероятностей в выборе фильма (рис. 45)

То есть прогноз должен быть отвергнут, так как отклонение от него в сторону повышения не является случайностью.
Гипотеза о том, что прогноз верен, проверена по критерию Методы математической статистики и теории вероятностей в выборе фильма (рис. 46) на уровне значимости 5% и отвергнута.
2. Сравнение размаха количества просмотренных фильмов отечественного и зарубежного производства

2.1 Жанры киноиндустрии

В современном мире киноиндустрии существует множество жанров, согласно которым классифицируют все фильмы. Фильмы распределяют в зависимости, от эмоций, которые хотел вызвать у зрителей режиссёр данной картины.
Артхаус - фильм, нацеленный не на массовую аудиторию. Подобные фильмы прежде всего некоммерческие, самостоятельно сделанные фильмы, а также фильмы, снятые маленькими киностудиями или, так называемые, короткометражные фильмы.
Биография - жанр кинематографа, повествующий о судьбе знаменитой или известной личности. Фильм-биография пытается всесторонне передать жизнеописание личности или хотя бы годы, сыгравшие наиболее важную роль в жизни человека.
Боевик - жанр кинематографа, в котором основное внимание уделяется насилию: перестрелкам, дракам, погоням и т.п. Такие фильмы часто обладают высоким бюджетом, изобилуют каскадёрскими трюками и спецэффектами.
Военный - исторический художественный фильм, реконструирующий события реально происходившей войны или сражения, приёмы и организацию боя. В центре художественной композиции такого фильма обычно находится сцена главного сражения, съёмки которого сочетают широкие панорамные планы с крупными планами героев фильма.
Документальный - Документальным называется фильм, в основу которого легли съёмки подлинных событий и лиц. Зачастую фильмы опираются на документальные источники.
Драма - жанр кинематографа, который зачастую отображает преимущественно бытовую сюжетику и более приближенную к обыденной реальности стилистику. Драмы специфически изображают, как правило, частную жизнь человека и его конфликт с обществом.
Комедия - жанр кинематографа, характеризующийся юмористическим или сатирическим подходом, а также не стандартные пути решения проблемы которые помогают вызвать положительные эмоции о зрителя.
Криминал, гангстерский - категория фильмов об организованной преступности (гангстерских синдикатах), а также о профессиональных правонарушителях Приключение - жанр кино, в отличие от боевика, в приключенческих фильмах акцент смещён с грубого насилия на смекалку персонажей, умение перехитрить, обмануть злодея.
Фантастика - фильмы данного жанра преимущественно трёх тематических направлений: космические путешествия, появление инопланетных существ на Земле и положение человека в изменившихся условиях будущего
Фентези - произведения фэнтези чаще всего напоминают историко-приключенческий роман, действие которого происходит в вымышленном мире, близком к реальному Средневековью, герои которого сталкиваются со сверхъестественными явлениями и существами.

2.2 Сравнения размаха количества просмотренных фильмов отечественных и зарубежных кинокомпаний

За исходные данные было решено взять 130 фильмов, просмотренных за последнее время. Эти фильмы были разбиты по странам производителям и по жанрам. Было выбрано 7 жанров отечественных кинокомпаний и 7 зарубежных. Результаты выборки приведены в таблице 2.1
Таблица 2.1
ЖанрСтрана выпуска
Отечественные фильмыЗарубежные фильмы
Артхаус37
Биография124
Военный155
Документальный82
Драма616
Комедия919
Сказки1014

Используем тест экстремальных реакций Мозеса для сравнения размаха количества просмотренных фильмов отечественных и зарубежных кинокомпаний.
В тесте экстремальных реакций Мозеса одна выборка выступает в качестве контрольной группы, а другая - в качестве экспериментальной.
В качестве экспериментальной группы выбирается та, в которой, предполагается, что результаты будут носить более экстремальный характер. В нашем случае это группа зарубежных фильмов.
В качестве меры изменчивости, позволяющей сравнивать "ширину" обеих выборок, используется один из наиболее редко применяемых статистических показателей - размах. Размах S определяется как разность между максимальным и минимальным значением плюс единица: Методы математической статистики и теории вероятностей в выборе фильма (рис. 47)
Размах для контрольной группы "отечественные фильмы": Методы математической статистики и теории вероятностей в выборе фильма (рис. 48)
Размах для экспериментальной группы "зарубежные фильмы": Методы математической статистики и теории вероятностей в выборе фильма (рис. 49)
Как видим, результаты в экспериментальной группе носят более экстремальный характер.
В тесте экстремальных реакций Мозеса размах (по отношению к рангам) вычисляется для контрольной группы. Затем, на основе значения размаха, сведений о размере выборок и других показателях, вычисляется вероятность получения такого результата.
Если полученное значение вероятности оказывается меньшим или равным выбранному значению уровня значимости Методы математической статистики и теории вероятностей в выборе фильма (рис. 50), то нулевая гипотеза отвергается.
Если значение вероятности больше выбранного значения уровня значимости Методы математической статистики и теории вероятностей в выборе фильма (рис. 51), то оснований отвергнуть нулевую гипотезу нет.
Применим тест экстремальных реакций Мозеса к нашим данным.
Выберем уровень значимости Методы математической статистики и теории вероятностей в выборе фильма (рис. 52)и сформулируем нулевую и альтернативную гипотезы.
Методы математической статистики и теории вероятностей в выборе фильма (рис. 53): Страна производитель не влияет на количество просмотренных фильмов разных жанров.
Методы математической статистики и теории вероятностей в выборе фильма (рис. 54): Количество просмотренных зарубежных фильмов носит более экстремальный характер по сравнению с количеством просмотренных отечественных фильмов.
Объединим обе выборки, расположив значения цен в порядке возрастания, присвоим каждому значению свой ранг и укажем кому - "отечественным фильмам" (L) или "зарубежным фильмам" (А) - принадлежит то или иное значение (табл. 2.2):

Таблица 2.2. Упорядоченные значения количества для объединенной выборки
23456789101214151619
1234567891011121314

На основании результатов ранжирования определяем размах для контрольной группы зарубежных фильмов.
Как видно из таблицы, минимальное значение ранга в контрольной группе равно 4, максимальное значение ранга равно 13.

Размах Методы математической статистики и теории вероятностей в выборе фильма (рис. 55).

Однако в статистике размах считается ненадежной мерой изменчивости, поскольку он слишком зависит от колебаний крайних значений. Для придания размаху большей стабильности в тесте экстремальных реакций Мозеса слева и справа отбрасывается несколько крайних значений, и размах вычисляется для оставшихся значений.
Обозначим как Методы математической статистики и теории вероятностей в выборе фильма (рис. 56) то, сколько значений слева и справа будет отброшено. Для малых выборок Методы математической статистики и теории вероятностей в выборе фильма (рис. 57) обычно равно 1. В общем случае рекомендуется слева и справа отсекать по 2,5% значений (то есть всего, слева и справа, отсекается не более 5%).
Отбросим от рангов для контрольной группы по одному крайнему значению слева и справа (то есть отбросим значения 4 и 13). Новое минимальное значение ранга для контрольной группы будет равно 5, а новое максимальное значение будет равно 9. Обозначим новое значение размаха как Методы математической статистики и теории вероятностей в выборе фильма (рис. 58). Оно будет равноМетоды математической статистики и теории вероятностей в выборе фильма (рис. 59).
Можно показать, что при любых размерах экспериментальной Методы математической статистики и теории вероятностей в выборе фильма (рис. 60)и контрольной Методы математической статистики и теории вероятностей в выборе фильма (рис. 61)группы значение размаха Методы математической статистики и теории вероятностей в выборе фильма (рис. 62) не может быть меньше, чем Методы математической статистики и теории вероятностей в выборе фильма (рис. 63) и больше, чем Методы математической статистики и теории вероятностей в выборе фильма (рис. 64).
Обозначим как Методы математической статистики и теории вероятностей в выборе фильма (рис. 65) то, насколько наблюдаемое значение размаха Методы математической статистики и теории вероятностей в выборе фильма (рис. 66)больше минимально возможного.

В нашем случае минимально возможное значение размаха равно Методы математической статистики и теории вероятностей в выборе фильма (рис. 67).
Поскольку Методы математической статистики и теории вероятностей в выборе фильма (рис. 68)Методы математической статистики и теории вероятностей в выборе фильма (рис. 69), то Методы математической статистики и теории вероятностей в выборе фильма (рис. 70).

После проделанной подготовки можно приступить к вычислению требуемой вероятности. Формула для ее вычисления выглядит следующим образом:

Методы математической статистики и теории вероятностей в выборе фильма (рис. 71).
Методы математической статистики и теории вероятностей в выборе фильма (рис. 72), если Методы математической статистики и теории вероятностей в выборе фильма (рис. 73) и Методы математической статистики и теории вероятностей в выборе фильма (рис. 74), если Методы математической статистики и теории вероятностей в выборе фильма (рис. 75).
Подставляем в формулу наши данные: Методы математической статистики и теории вероятностей в выборе фильма (рис. 76); Методы математической статистики и теории вероятностей в выборе фильма (рис. 77); Методы математической статистики и теории вероятностей в выборе фильма (рис. 78).
Методы математической статистики и теории вероятностей в выборе фильма (рис. 79)

Полученное значение вероятности меньше выбранного значения уровня значимости а=0,05. Нулевая гипотеза отвергается, и принимается альтернативная. Количество просмотренных зарубежных фильмов носит более экстремальный характер по сравнению с количеством просмотренных отечественных фильмов.
Заключение

В результате исследования фильмов сайта megogo.net и количества просмотренных фильмов отечественных и зарубежных кинокомпаний, было установлено, что популярность зарубежных фильмов больше, чем отечественных. Это говорит о том, что фильмы зарубежных кинокомпаний набирают большое количество просмотров, по сравнению с фильмами отечественных производителей.
Оценка вероятности встретить "отечественный" фильм проходила двумя способами - с помощью параметрического и непараметрического методов исследования. В качестве параметрического метода использовался критерий Стьюдента, и разумеется данный метод более точен по сравнению с непараметрическим методом. Использовавшимся непараметрическим методом был тест Методы математической статистики и теории вероятностей в выборе фильма (рис. 80) для единственной выборки. Так как в данном методе использовалась только одна выборка, данный тест дает менее точные данные. Так как выборка одна, то результат зависит от случая.
Сравнения размаха количества фильмов отечественных и зарубежных кинокомпаний показал, что размах зарубежных картин является более экстремальным, в сравнении с отечественными картинами. Это говорит о том, что нельзя утверждать о том, что фильмы одной страны лучше или хуже просматриваемы чем фильмы другой страны, так как каждый фильм несет в себе частичку эмоций, которую способен почувствовать зритель.
Окончательный выбор в любом случае останется за зрителем, но в результате исследования было установлено, что зарубежные фильмы более популярны, следовательно, их качество и бюджет выше, чем у фильмов отечественного производства.
Список использованной литературы

1.Резник А.Д. Книга для тех, кто не любит статистику, но вынужден ею пользоваться - СПб.: Речь, 2008. - 265 с.: илл.
2.Бочаров П.П., Печинкин А.В. Теория вероятностей. Математическая статистика. - М.: ФИЗМАТЛИТ, 2005. - 296 с.
.Кремер Н.Ш. Теория вероятностей и математическая статистика 2-е изд., перераб. И доп. - М.: Юнити-Дана, 2004. - 573 с.
.Гмурман В. Теория вероятностей и математическая статистика. - М.: "Высшая Школа", 2003. - 480 с.
.Тюрин Ю.Н. Непараметрические методы статистики. - М.: Знание, 1978. - 64 с.
.Правила ранжирования, http://psystat. at.ua/publ/1-1-0-34 (Актуальная дата: 26.11.2014 г.).
.Непараметрическая статистика и подгонка распределения, http://www.novsu.ru/file/109286 (Актуальная дата: 26.11.2014 г.).
.Вентцель Е.С. Теория вероятностей: - М.: Наука, 1969. - 576 с.
.Сидни Люмет. Как делается кино. - М.: "Высшая школа", 2003. - 300 с.:
.Вуколов Э. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов STASTICA и EXCEL. - М.: "ИНФРА-М", 2004. - 464 с.
11.Справочная информация по сайту megogo https: // ru. wikipedia.org/wiki/Megogo.net/
.Критерий Хи-квадрат, http://psystat. at.ua/publ/1-1-0-29 (Актуальная дата: 26.11.2014 г.).
.Тест Мозеса http://hr-portal.ru/spss/Glava14/Index4. php
.Александров Григорий , Жанры кино,-2010.
.Макаров Е. MathCAD: Учебный курс. - СПб.: Питер, 2009 г. - 384
Приложение

Таблица 1. Таблица критических значений для теста Методы математической статистики и теории вероятностей в выборе фильма (рис. 81)
k /α0,010,0250,050,950,9750,99
16,634905,023893,841460,003930,000980,00016
29,210347,377765,991460,102590,050640,02010
311,344879,348407,814730,351850,215800,11483
413,276711,143299,487730,710720,484420,29711
515,0862712,832511,07051,145480,831210,55430
616,8118914,4493812,591591,635381,237340,87209
718,4753116,0127614,067142,167351,689871,23904
820,0902417,5345515,507312,732642,179731,64650
921,6659919,0227716,918983,325112,700392,08790
1023, 2092520,4831818,307043,940303,246972,55821
1124,7249721,9200519,675144,574813,815753,05348
1226,2169723,3366621,026075,226034,403793,57057
1327,6882524,735622,362035,891865,008754,10692
1429,1412426,1189523,684796,570635,628734,66043
1530,5779127,4883924,995797,260946,262145,22935
1631,9999328,8453526,296237,961656,907665,81221
1733,4086630, 1910127,587118,671767,564196,40776
1834,8053131,5263828,869309,390468,230757,01491
1936, 1908732,8523330,1435310,117018,906527,63273
2037,5662334,1696131,4104310,850819,590788,26040
2138,9321735,4788832,6705711,5913110,28298,89720
2240,2893636,7807133,9244412,3380110,982329,54249
2341,6384038,0756335,1724613,0905111,6885510, 19572
2442,9798239,3640836,4150313,8484312,4011510,85636
2544,3141040,6464737,6524814,6114113,1197211,52398
2645,6416841,9231738,8851415,3791613,8439112, 19815
2746,9629443, 1945140,1132716,1514014,5733812,87850
2848,2782444,4607941,3371416,9278815,3078613,56471
2949,5878845,7222942,5569717,7083716,0470714,25645
3050,8921846,9792443,7729718,4926616,7907714,95346
3152, 1913948,2318944,9853419,2805717,5387415,65546
3253,4857749,4804446, 1942620,0719118,2907616,36222
3354,7755450,7250847,3998820,8665319,0466617,07351
3456,0609151,9660048,6023721,6642819,8062517,78915
3557,3420753, 2033549,8018522,4650220,5693818,50893
3658,6192154,4372950,9984623,2686121,3358819,23268
3759,8925055,6679752, 1923224,0749422,1056319,96023
3861,1620956,8955253,3835424,883922,8784820,69144
3962,4281258,1200654,5722325,6953923,6543221,42616
4063,6907459,3417155,7584826,509324,4330422,16426
4164,9500760,5605756,9423927,3255525,2145222,90561
4266, 2062461,7767658,1240428,1440525,9986623,65009
4367,4593562,9903659,3035128,9647226,7853724,39760
4468,7095164, 2014660,4808929,7874827,5745725,14803
4569,9568365,4101661,6562330,6122628,3661525,90127
4671, 2014066,6165362,8296231,4390029,1600526,65724
4772,4433167,8206564,0011132,2676229,9562027,41585
4873,6826469,0225965,1707733,0980830,7545128,17701
4974,9194770,2224166,3386533,9303131,5549228,94065
5076,1538971,4202067,5048134,7642532,3573629,70668

Таблица 2
Таблица критических значений Стьюдента
df\p0.400.250.100.050.0250.010.0050.0005
10.3249201.0000003.0776846.31375212.7062031.8205263.65674636.6192
20.2886750.8164971.8856182.9199864.302656.964569.9248431.5991
30.2766710.7648921.6377442.3533633.182454.540705.8409112.9240
40.2707220.7406971.5332062.1318472.776453.746954.604098.6103
50.2671810.7266871.4758842.0150482.570583.364934.032146.8688
60.2648350.7175581.4397561.9431802.446913.142673.707435.9588
70.2631670.7111421.4149241.8945792.364622.997953.499485.4079
80.2619210.7063871.3968151.8595482.306002.896463.355395.0413
90.2609550.7027221.3830291.8331132.262162.821443.249844.7809
100.2601850.6998121.3721841.8124612.228142.763773.169274.5869
110.2595560.6974451.3634301.7958852.200992.718083.105814.4370
120.2590330.6954831.3562171.7822882.178812.681003.054544.3178
130.2585910.6938291.3501711.7709332.160372.650313.012284.2208
140.2582130.6924171.3450301.7613102.144792.624492.976844.1405
150.2578850.6911971.3406061.7530502.131452.602482.946714.0728
160.2575990.6901321.3367571.7458842.119912.583492.920784.0150
170.2573470.6891951.3333791.7396072.109822.566932.898233.9651
180.2571230.6883641.3303911.7340642.100922.552382.878443.9216
190.2569230.6876211.3277281.7291332.093022.539482.860933.8834
200.2567430.6869541.3253411.7247182.085962.527982.845343.8495


Комментарии:

Вы не можете оставлять комментарии. Пожалуйста, зарегистрируйтесь.