Математический пример.
Возьмем событие А0, определенное выше и предположим, что колода К содержит дубликаты. Тогда для некоторых отрезков разбиения Кi, такие же как и в Кi карты будут содержаться также в дубликатах даного отрезка. Таким образом, пары карт, тождественных с некоторыми картами из Кi, будут распределены по колоде К не совсем произвольно. А именно, они будут «собираться» в дискретно расположенной серии дубликатов отрезка Кi.
Значит и разнесение этих пар будет особенно часто принимать значения либо близкие к нулю, либо равные сдвигам между дубликатами этой серии в колоде К. Поскольку условие А0 существенно ограничивает выбор пар карт – рассматриваются лишь те, которые (сами или тождественные им) хоть раз попали в один и тот же отрезок разбиения колоды К, – то описанная ситуация с дубликатами будет довольно типичной для ограниченного таким образом множества пар.
Это изменит распределение случайной величины з (по сравнению с ее распределением на множестве всех пар) и заставит ее чаще принимать те значения, которые характерны для расстояний между дубликатами в К. Таким образом, условное распределение з при условии А0 будет существенно отличаться от ее безусловного распределения.
Сформулированное следствие позволяет проверять гипотезу Н0 в конкретных хрониках. Более того, анализ условных распределений вида Pз = x|A с различными локальными событиями А дает возможность определить величины сдвигов между дубликатами в К.
2. Разнесения связанных имен
2. 1. Правильный хронологический список имен
В главе 1 было введено понятие хронологического списка имен, снабженного разбиением на главы и приведены примеры реальных хронологических списков. В настоящем разделе мы рассмотрим задачу проверки гипотезы Н_0 о том, что хронология того или иного хронологического списка имен является правильной.
Уточним понятие правильного списка по сравнению с определением, данным в главе 1. А именно, будем называть хронологию списка имен Х правильной, если список не является результатом размножения и последующего «поблочного тасования» (склейки со сдвигом и локального перемешивания) некоторого другого, более короткого списка Y. В противном случае будем говорить, что список Х содержит дубликаты. Под дубликатами понимаются первоначально одинаковые (при тасовании они могут быть искажены) отрезки различных экземпляров списка Y, содержащиеся в Х (см рис. 17).
Также как и в модельной задаче, мы допускаем возможность случайных искажений каждого из экземпляров списка Y, лежащих в основе списка Х, однако предполагаем, что локальные искажения в удаленных друг от друга частях списков взаимно независимы.
2. 2. Сопряженные имена и имена-ровесники.
Математический формализм
Следуя описанной в предыдущем разделе методике, рассмотрим вероятностную схему случайного равновероятного выбора с возвращением двух имен из списка Х и определим случайную величину з – разнесение выбранной пары имен.
Напомним обозначения характеристик списка Х: n – общее число имен в списке Х (с учетом кратности их вхождения в список); m – число различных имен списка Х;
N – число глав списка Х.
Имена списка Х мы будем обозначать буквами a_i, где индекс указывает на порядковый номер данного имени в списке:
X = a_1, a_2,…, a_N.
Обозначим через I множество различных имен списка Х. Это множество состоит из m имен (m « x « N).
Здесь x – целое. Для остальных целых x соответствующая вероятность равна нулю.
Таким образом, для всех списков Х с главами постоянного объема функция f1 одна и та же – это линейно убывающая в промежутке от 1 до N-1 функция.
Доказательство.
Поскольку случайная величина з определяется по номерам глав, содержащих выбранные имена, то можно считать, что выбираются не сами имена, а главы. Так как объем глав по предположению постоянен, то выбор любой главы на первом шаге осуществляется с одинаковой вероятностью равной 1/N. То же верно и для второго шага выбора.
Рассмотрим сначала случай 1 « x « N. В этом случае существует ровно N – x возможностей фиксировать главу с меньшим номером в паре глав, разнесенных на расстояние x в списке. Вторая глава в этой паре имеет номер на x больший, чем первая и этим определяется (по первой) однозначно. Учитывая, что глава с меньшим номером может появиться как на первом, так и на втором шаге выбора, получаем, что общее количество возможностей выбрать пару глав, разнесенных на расстояние x (с учетом порядка выбора), равно 2(N – x). Вероятность выбрать наперед заданную пару глав с учетом порядка выбора равна 1/N^2. Следовательно, по формуле полной вероятности, Pз = x = 2(N-x^2)/N.
Пусть теперь x = 0. Тогда на обоих шагах выбора появляется одна и та же глава. Всего глав N и каждая из них может быть выбрана дважды подряд с вероятностью 1/N^2. Следовательно, Pз = 0 = 1/N. Лемма доказана.
2. 4. Нормировка списка имен
Как показывают расчеты для реальных хронологических списков, распределение з имеет вид (1) даже в том случае, когда объемы глав списка равны друг другу лишь приблизительно. Это означает, что распределение з устойчиво к вариациям в объемах глав. Однако бывают случаи, когда хронологический список имен разбит на главы разко различные по объему. В этом случае список необходимо нормировать, разделив кратности вхождения имен в каждую главу на объем этой главы (чтобы не рассматривать дробных кратностей можно предварительно умножить все кратности на произведение объемов всех глав).
После такой нормировки объемы глав станут одинаковыми. Поэтому мы без ограничения общности будем считать, что распределение вероятностей Pз = x является линейно убывающей функцией на множестве целых чисел от 1 до N (причем при x=N она равно нулю).
2. 5. Математическое описание списков имен с правильной хронологией
Исследуем структуру хронологического списка Х, сравнивая распределение з с распределениями з2 и з3. Естественные представления о том, как должен быть устроен правильный хронологический список имен приводят к следующему интуитивно очевидному утверждению:
(А) В случае правильной хронологии списка Х, условие и В = А и (или и : и), наложенное на пару имен списка, не должно влиять на глобальные особенности взаимного расположения всего множества таких же имен в списке Х.
Ясно, что утверждение (А) тесно связано с принципом затухания частот. В самом деле, оно означает, что локальные связи имен в списке не должны приводить к их глобальным связям.
Так будет, если в списке нет глобальных зависимостей, а локальные зависимости затухают. Но именно этого требует от правильных списков принцип затухания частот.
Утверждение (А) можно формализовать с помощью введенных выше случайных величин з2, з3 и з следующим образом.
(Б) Распределения случайных величин з2 и з3, построенные по списку с правильной хронологией, в котором отсутствует зависимость между различными главами, должны совпадать с распределением з. Графики функций f2 и f3, построенные по такому списку, разбитому на главы одинакового объема, должны совпадать
на промежутке от 1 до N с графиком линейно убывающей функции. Если же между близкими главами списка есть взаимная зависимость, постепенно затухающая для все более отдаленных пар глав, то графики функций f2 и f3 должны совпадать с графиком линейно убывающей функции лишь на промежутке от е до N, где е – радиус затухания зависимости в списке.
Замечание. Строго говоря, это утверждение верно для бесконечных списков, так как некоторые расхождения между распределениями з2 и з3, з могут возникать из-за конечности длины списка Х. Поэтому методика применима лишь к спискам достаточно большого объема (не менее 150-200 имен).