Отчёт: Эмпирические критерии проверки случайных последовательностей
СОДЕРЖАНИЕ
ЭМПИРИЧЕСКИЕ КРИТЕРИИ ПРОВЕРКИ СЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ. КРИТЕРИЙ ЧАСТОТ, СЕРИЙ, ИНТЕРВАЛОВ, РАЗБИЕНИЙ, ПЕРЕСТАНОВОК, МОНОТОННОСТИ, КОНФЛИКТОВ
ЛИНЕЙНЫЙ КОНГРУЭНТНЫЙ МЕТОД
ОСНОВНЫЕ КРИТЕРИИ ПРОВЕРКИ СЛУЧАЙНЫХ НАБЛЮДЕНИЙ
ЭМПИРИЧЕСКИЕ КРИТЕРИИ
КРИТЕРИЙ СЕРИЙ
ПОКЕР-КРИТЕРИЙ (КРИТЕРИЙ РАЗБИЕНИЙ)
КРИТЕРИЙ ПЕРЕСТАНОВОК
КРИТЕРИЙ МОНОТОННОСТИ
КРИТЕРИЙ КОНФЛИКТОВ
Дата добавления на сайт: 02 марта 2025
Федеральное государственное бюджетное образовательное учреждение
Высшего профессионального образования
"Тольяттинский государственный университет"
Институт математики, физики и информационных технологий
Кафедра Прикладной математики и информатики
Профиль Математическое моделирование
Отчет по самостоятельной работе
по дисциплине "Получисленные алгоритмы"
на тему: Эмпирические критерии проверки случайных последовательностей
Выполнила: Парамонова К.С.
группа ПМИм-1301
Принял: Мельников Б.Ф.
Тольятти 2014 г.
Содержание
Эмпирические критерии проверки случайных последовательностей. Критерий частот, серий, интервалов, разбиений, перестановок, монотонности, конфликтов
Линейный конгруэнтный метод
Основные критерии проверки случайных наблюдений
Эмпирические критерии
Критерий серий
Покер-критерий (критерий разбиений)
Критерий перестановок
Критерий монотонности
Критерий конфликтов
Эмпирические критерии проверки случайных последовательностей. Критерий частот, серий, интервалов, разбиений, перестановок, монотонности, конфликтов
Числа, которые выбираются случайным образом, находят множество полезных применений: моделирование.
Это позволяет сделать модели похожими на реальные явления; выборочный метод. Часто невозможно исследовать все варианты, но случайная выборка обеспечивает понимание того, что можно назвать "типичным поведением"; численный анализ.
Для решения сложных задач численного анализа была разработана техника, использующая случайные числа; компьютерное программирование. Случайные числа являются хорошим источником данных для тестирования эффективности компьютерных алгоритмов; принятие решений; эстетика; развлечения.
Равномерным распределением на конечном множестве чисел называется такое распределение, при котором любое из возможных чисел имеет одинаковую вероятность появления. Если не задано определенное распределение на конечном множестве чисел, то принято считать его равномерным [3]. Джон фон Нейман первым предложил в 1946 г. идею возвести в квадрат случайное число и выделить из него средние цифры. Например, необходимо получить новое десятизначное число по числу 5772156649. Возводим имеющееся число в квадрат и выделяем средние 10 цифр:
.
Новым сгенерированным числом будет число 7923805949. Эта последовательность не случайна, она кажется такой. Последовательности, генерируемые детерминистическим путем, таким как этот, называются псевдослучайными или квазислучайными.
Метод середины квадратов фактически является сравнительно бедным источником случайных чисел. Опасность состоит в коротком цикле (периоде) повторяющихся элементов. Рассмотрим методы генерирования последовательности случайных дробей [3], т.е. случайных действительных чисел Un, равномерно распределенных между нулем и единицей. Будем генерировать целое число Хn между нулем и некоторым числом U, тогда дробь при m >= U
Un = Хn / m
будет принадлежать [0,1]. Обычно m выбирают равным размеру компьютерного слова. Обозначим m = be, где b - основание системы счисления, используемой ЭВМ, а e - число разрядов машины. Поэтому Хn можно по традиции рассматривать как целое число, занимающее все компьютерное слово с точкой в правом конце слова, а Un - как содержимое того же слова с точкой в левом конце слова.
Линейный конгруэнтный метод
Выберем четыре числа [3]:
m - модуль, m > 0;
a - множитель, 0 Ј a Значение S
Имеем всего 36 возможных результатов бросания. Рассмотрим результаты бросания. Например, величина 4 может быть получена тремя способами: 1 + 3, 2 + 2, 3 + 1. Это составляет

Таблица 4.1
Величина S | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Наблюдаемое число, YS | 2 | 4 | 10 | 12 | 22 | 29 | 21 | 15 | 14 | 9 | 6 |
Ожидаемое число, n pS | 4 | 8 | 12 | 16 | 20 | 24 | 20 | 16 | 12 | 8 | 4 |
Заметим, что во всех случаях наблюдаемое число отличается от ожидаемого. Введем в рассмотрение число


Эта статистика называется статистикой "хи - квадрат" наблюдаемых значений Y2 … Y12 при бросании игральных костей. Используя табл.4.1, получим:

Формулу (4.6) перепишем следующим образом:

Так как

Y1 + Y2 +…+ Yk = n, p1 + p2 +…+ pk =1.
Чтобы воспользоваться c2 - статистикой проводят несколько экспериментов, затем вычисляют числа

Таблица 4.2
p = 99% | p = 95% | p = 75% | p = 50% | p = 25% | p = 5% | p = 1% | |
… | |||||||
2,5583,9406,7379,34212,5518,3123,21 | |||||||
… |
Здесь p - процентные точки c2 - распределения; m = k - 1 - число степеней свободы, что на единицу меньше, чем число категорий. Внутри клеток таблицы стоят числа

Предположим, что были сделаны три эксперимента с генерированием случайных последовательностей и получены числа:



Сравнивая эти величины со значениями таблицы 4.2 при 10 степенях свободы, мы видим, что



Отметим, таблица 4.2 - это только приближенные значения c2 распределения, которое является предельным распределением случайной величины

Поэтому табличные значения близки к реальным только при больших n.
Насколько большими должны быть n? Эмпирическое правило гласит: нужно взять n настолько большим, чтобы все значения n pS были больше или равны пяти.
Эмпирические критерии
Эмпирические критерии традиционно применяются для проверки, будет ли последовательность случайной.
Обычно каждый такой критерий применяется к последовательности
{Un} = U0, U1, U2, … (4.8)
действительных чисел, которые предполагаются независимыми и равномерно распределенными в интервале (0,1).
Если критерии используются для целочисленных последовательностей, то используется вспомогательная последовательность
{Yn} = Y0, Y1, Y2, …, (4.9)
определенная правилом
Yn = [d Ч Un] (4.10)
Это последовательность целых чисел, распределенных в интервале (0, d-1). Число d выбирается таким образом, чтобы сделать все Yi - целыми. Обычно d выбирается достаточно большим, но не настолько большим, чтобы критерий стал практически неприменим.
Критерий равномерности (критерий частот)
Первое требование, предъявляемое к последовательности (4.8) состоит в том, чтобы ее члены были числа, равномерно распределенные между 0 и 1. Существуют 2 способа проверить это:
. Использовать критерий Колмогорова-Смирнова [2].
. Использовать c2-критерий.
Для того чтобы применить c2-критерий, используется последовательность (4.10) вместо (4.8). Для каждого r, 0 Ј r >k, например n і 5d2.
Покер-критерий (критерий разбиений)
"Классический" покер-критерий рассматривает n групп по пять последовательных целых чисел
{Y5j, Y5j+1, Y5j+2, Y5j+3, Y5j+4} для 0 Ј j Xj+i, получим
|12 9 | 8 | 5 | 3 6 7 | 0 4 |. (9)
Таким образом выделяются восходящие серии: сначала - серия длиной 3, затем - две серии длиной 1, затем - снова серия длиной 3 и, наконец, серия длиной 2.
Критерий конфликтов
c2 - критерий можно применять только тогда, когда ненулевое число элементов ожидается в каждой категории. Но существует критерий другого вида, который можно использовать, когда число категорий намного больше числа наблюдений. Этот критерий имеет отношение к рандомизации - важному методу информационного поиска.
Предположим, что имеется т урн, и поместим в них наудачу п шаров, причем т намного больше n. Большинство шаров попадет в пустые урны, но если шар попадет в урну, в которой уже содержится хотя бы один шар, то будем говорить, что произошел "конфликт”. Критерий конфликтов подсчитывает число конфликтов, и генератор удовлетворяет этому критерию, если не возникает слишком много или слишком мало конфликтов.
Для определенности предположим, что т = 220 и п = 214. Тогда в среднем на 64 урны приходится только один шар. Вероятность того, что в конкретную урну попадет ровно к шаров, равна pk - т~1) п~к, поэтому среднее число конфликтов в урне равно.