Регистр сдвига с обобщённой обратной связью

Регистр сдвига с обобщённой обратной связью (англ. Generalized feedback shift register (GFSR)) — вариант генератора псевдослучайных чисел (ГПСЧ) Таусворта, предложенный Теодором Льюисом и Уильямом Пейном в 1973 году.

Cхема регистра сдвига с обобщённой обратной связью

Идея алгоритма GFSR состоит в том, что основная последовательность регистра сдвига с линейной обратной связью $\{a_{k}\}$ , основанная на примитивном трёхчлене $x^{p}+x^{p-q}+1$ , записывается в $w$ колонок, $w<p$ , с разумно выбранными циклическими сдвигами. $p$ и $q$ — произвольные натуральные числа, такие что $q<p$ , причём $q$ примерно равных $(p+1)/2$ и $p$ , нужно избегать из-за плохих свойств результирующей последовательности.[1]

Таким образом все слова на выходе GFSR можно рассматривать как вектора длины $w$ , с коэффициентами из множества $\{0,1\}$ , которые подчиняются рекурсии

$W_{k}=W_{k-p+q}\oplus W_{k-p}$

где $\oplus$ — XOR, или побитовое сложение по модулю 2, а $k=p,\;p+1,\;...$ [2]

Сравнение с аналогичными алгоритмами

Результат работы линейного конгруэнтного генератора

Линейный конгруэнтный генератор показывает плохую n-пространственную однородность. На рисунке предвиден пример результата работы для $X_{i}=17X_{i-1}-1\mod 512$ для 384 точек (a) и 512 (b).[1]

Результат работы GFSR

Как альтернатива, регистр сдвига с линейной обратной связью (FSR) даёт равномерное распределение в n-мерном пространстве, если длина регистра делится на n. Возможно FSR последовательности дают больше возможностей для улучшения n-мерного пространства, но период ограничен машинным словом. Кроме того, прореживание, с целью получить однородность n-мерном пространстве далее сокращает длину цикла.[1]

Из-за этого был создан регистр сдвига с обобщённой обратной связью, способный генерировать сколь угодно большие последовательности, независимо от размера машинного слова, также обладающий хорошим n-мерным распределением и большой скоростью.[1]

На рисунке предвиден пример результата работы GFSR c полиномом $X^{31}+X^{13}+1$ , 9-битным машинным словом и циклическим сдвигом на 93[1]

История исследования GFSR

Льюисом и Пейном были представлены различные типы генераторов называемые регистры сдвига с обобщённой обратной связью. Этот быстрый метод и может генерировать одинаковые последовательности на компьютерах с разной длиной машинного слова, но он имеет недостаток с инициализацией.[3]

Во-первых, невырожденная битовая начальная матрица размером $p\times w$ должна быть сформирована. Льюис и Пейн показали, что если относительный сдвиг между соседними колонками постоянен, то матрица не вырожденная. Постоянный сдвиг был произвольно выбран равным $100p$ .[3]

Во-вторых, Льюис и Пейн предложили, с целью подавить эффект неслучайности начальной матрицы, отбрасывать первые $5000p$ чисел перед использованием генератора. Так, если нужна длинная последовательность и $p$ большое, то процесс инициализации занимает много времени.

Другой недостаток который может быть более существенным, нет теоретического обоснования того, что последовательность будет обладать свойством k-распределения. Термин k-распределение означает, что каждый k-кортеж из $w$ -бит чисел появляется $2^{p-wk}$ раз на полном периоде, за исключением нулевого кортежа. Они показали что последовательность может быть k-распределённая, для $1\leq k\leq \lfloor p/w\rfloor$ , но это необходимое, а не достаточное условие.[3]

Брайт (Bright) и Энисон (Enison) провели тесты на равнораспределение в пространствах большой размерности небольшой части последовательности с большим периодом. Оказалось что в тестах статистические свойства не повторяют свойства всей последовательности.[3]

Арвилиас (Arvillias) и Маритсас (Maritsas) предложили генератор типа GFSR, в которых $p-q$ есть степень 2. Они показали что $p-q$ элементов последовательности, почти равномерно распределённых вдоль периода, можно получить за один такт, используя переключатель и регистры сдвига. При этом относительный сдвиг аналитически определён. Это значит, что процесс инициализации становится столь же быстрым как и генерация случайных чисел. Но снова нет гарантий в k-распределении.[3]

Алгоритм GFSR

Входные значения:

$p,q$ — задают характеристический полином регистра сдвига
$a_{0},...,a_{p-1}$ — начальная битовая последовательность

Алгоритм:

1. Создаем массив битовых векторов

W_{0},\;...,\;W_{p-1}

, по которому будем перемещаться с индексом

k

и вспомогательным индексом

j

.

2. Инициализируем массив, используя начальную битовую последовательность. Устанавливаем

k

равное 0.

3. Вычисляем следующий вектор, но так как массив длины

p

, то индексы вычисляются по модулю

p

, из-за чего

k-p+q\longrightarrow k+q

k-p\longrightarrow k

Таким образом

j=k+q\mod p

W_{k}=W_{k}\oplus W_{j}

4. Увеличиваем

k

на единицу и переходим к вычислению следующего вектора, до тех пор пока последовательность не начнет повторяться (длина последовательности

2^{p}-1

)[1]

Алгоритм инициализации

Сначала генерируется последовательность согласно алгоритму регистра сдвига с линейной обратной связью.
После чего полученная последовательность циклически сдвигается. Величина сдвига должна быть меньше периода $2^{p}-1$ , тогда гарантируется что стартовые вектора будут линейно независимы (если величина сдвига взаимно просто с $2^{p}-1$ , то сдвиг может превышать полный период).
Используя эту процедуру, получаем $j$ последовательностей, которые можно записать друг под другом. Первые $p$ бит последовательностей образуют матрицу, столбцы которой являются векторами $W_{0},\;...,\;W_{p-1}$ [1]

Пример

Пусть дан полином $x^{5}+x^{3}+1$ , и $a_{0}=a_{1}=a_{2}=a_{3}=a_{4}=1$ .

Элементы последовательности удовлетворяют равенству $a_{k}=a_{k-p+q}\oplus a_{k-p}$ при $k=p,p+1,...$ . Согласно полиному $p=5,q=2$ , так мы можем узнать элементы последовательности

$a_{5}=a_{2}\oplus a_{0}=0$

$a_{6}=a_{3}\oplus a_{1}=0$

$a_{7}=a_{4}\oplus a_{2}=0$

$a_{8}=a_{5}\oplus a_{3}=1$

и так далее.

Таким образом получаем последовательность $a_{0}^{30}=1111100011011101010000100101100$

Для того что-бы создать хорошую случайную последовательность воспользуемся алгоритмом Кендола (Kendall). Хотя есть несколько вариантов этого алгоритма мы возьмем тот, который сдвигает начальную последовательность 1111100011011101010000100|101100 вперед на 6 бит. То есть 1011001111100011011101010|000100 и так ещё 3 раза. Таким образом получим

Номер	последовательность
0	1111100011011101010000100 $\mid$ 101100
1	1011001111100011011101010 $\mid$ 000100
2	0001001011001111100011011 $\mid$ 101010
3	1010100001001011001111100 $\mid$ 011011
4	0110111010100001001011001 $\mid$ 111100

$W_{0}$ образуется из первых бит последовательностей, $W_{1}$ — из вторых, для $W_{2},W_{3},W_{4}$ аналогично.

$W_{0}=11010,W_{1}=10001,W_{2}=11011,W_{3}=11100,W_{4}=10011$

Последующие $W_{k}$ вычисляем согласно правилу $W_{k}=W_{k-3}\oplus W_{k-5}$ .

$W_{0}:$	11010	$W_{10}:$	01001	$W_{20}:$	00111
$W_{1}:$	10001	$W_{11}:$	10000	$W_{21}:$	01111
$W_{2}:$	11011	$W_{12}:$	10110	$W_{22}:$	10010
$W_{3}:$	11100	$W_{13}:$	10100	$W_{23}:$	01100
$W_{4}:$	10011	$W_{14}:$	01110	$W_{24}:$	00101
$W_{5}:$	00001	$W_{15}:$	11111	$W_{25}:$	10101
$W_{6}:$	01101	$W_{16}:$	00100	$W_{26}:$	00011
$W_{7}:$	01000	$W_{17}:$	11000	$W_{27}:$	10111
$W_{8}:$	11101	$W_{18}:$	01011	$W_{28}:$	11001
$W_{9}:$	11110	$W_{19}:$	01010	$W_{29}:$	00110

Преимущества и недостатки

Преимущества

По словам разработчиков регистр сдвига с обобщённой обратной связью обладает произвольно большим периодом, независимо от длины машинного слова компьютера, который выполняет алгоритм, он быстрее чем другие генераторы псевдослучайных последовательностей, а также алгоритм легок в реализации.[1]

Недостатки

Согласно исследованиям количество 0 и 1 в выходной последовательности заметно разнится, а что противоречит постулатам Голомба. Также, если взять целое N, и разделить последовательность на кортежи по N слов, то для случайной последовательности распределение единиц в этих кортежах должно подчиняться биномиальному распределению Bin(N, 1/2). Но оказалось, что при $N\leqslant n$ это условие не выполняется. Это из-за того, что каждое слово зависит только от двух предыдущих, и по этому преобладание единиц или нулей не «сглаживается» сумматором по модулю 2.[2]

Вихрь Мерсенна — пример улучшения GFSR

Широко известна модификация регистра сдвига с обобщённой обратной связью под названием «Вихрь Мерсенна», предложенный Макото Мацумото и Такудзи Нисимурой в 1997 году. Период этого генератора огромен, и равен числу Мерсенна $2^{19937}-1$ . Вихрь Мерсенна относят к классу витковых генераторов на регистрах сдвига с обобщёнными обратными связями. Его упрощённая схема приведена на рисунке

Упрощённая схема вихря Мерсенна

Рассмотрим наиболее распространённый вариант этого алгоритма — MT19937. Он использует 624 ячейки памяти, в каждой из которых содержится целое 32 битное число. При этом рекуррентное правило формирования последовательности выходных слов записывается таким образом:

$W_{k}=W_{k-397}\oplus ((W_{k-623}$ & 0x80000000) | $(W_{k-622}$ & 0x7fffffff))× $A$ , (i = 0, 1 , 2, …)

То есть, на каждом k-том шаге берётся старший бит слова $W_{k-623}$ , и 31 бит из слова $W_{k-622}$ , а затем полученные части конкатенируют с последующим умножением полученного результата на матрицу

$A={\begin{pmatrix}0&1&0&0&0\\0&0&1&0&0\\...&...&...&...&...\\0&0&0&0&1\\a_{w-1}&a_{w-2}&...&...&a_{0}\end{pmatrix}}$

где $a=(a_{w-1}a_{w-2}...a_{0})$ = 0x9908B0DF в шестнадцатеричном исчислении.

После этого, результат складывается по модулю 2 со словом, вычисленного на предыдущем 397-ом шаге. Затем делается сдвиг содержимого всех ячеек на шаг влево, и полученный результат записывается в освободившуюся ячейку.[2]

См. также

Литература

T. G. Lewis, W. H. Payne. Journal of the ACM (JACM) Volume 20 Issue 3. — NY: ACM, July 1973.
James E. Gentle. Random number generation and Monte carlo methods. — 2nd edition. — NY: Springer, 2003. — XV + 381 с. — ISBN 0-387-00178-6.

Примечания

T. G. Lewis, W. H. Payne. Generalized Feedback Shift Register Pseudorandom Number Algorithm // J. ACM. — 1973-07-01. — Т. 20, вып. 3. — С. 456–468. — ISSN 0004-5411. — doi:10.1145/321765.321777.
Н. Ф. Казакова, к.т.н., Ю. В. Щербина, к.т.н. ПРОБЛЕМЫ ОЦЕНКИ КАЧЕСТВА РАБОТЫ СОВРЕМЕННЫХ ЛИНЕЙНЫХ ГЕНЕРАТОРОВ ПСЕВДОСЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ (рус.) // Збірник наукових праць ОДАТРЯ No 1(2 )2013.
M. Fushimi, S. Tezuka. The k-distribution of generalized feedback shift register pseudorandom numbers // Communications of the ACM. — 1983-07-01. — Т. 26, вып. 7. — С. 516–523. — ISSN 0001-0782. — doi:10.1145/358150.358159.

Ссылки

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[:0-1] T. G. Lewis, W. H. Payne. Generalized Feedback Shift Register Pseudorandom Number Algorithm // J. ACM. — 1973-07-01. — Т. 20, вып. 3. — С. 456–468. — ISSN 0004-5411. — doi:10.1145/321765.321777.

[:1-2] Н. Ф. Казакова, к.т.н., Ю. В. Щербина, к.т.н. ПРОБЛЕМЫ ОЦЕНКИ КАЧЕСТВА РАБОТЫ СОВРЕМЕННЫХ ЛИНЕЙНЫХ ГЕНЕРАТОРОВ ПСЕВДОСЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ (рус.) // Збірник наукових праць ОДАТРЯ No 1(2 )2013.

[:2-3] M. Fushimi, S. Tezuka. The k-distribution of generalized feedback shift register pseudorandom numbers // Communications of the ACM. — 1983-07-01. — Т. 26, вып. 7. — С. 516–523. — ISSN 0001-0782. — doi:10.1145/358150.358159.