Паттерны смешивания
Паттерны смешивания относятся к систематическим тенденциям одного типа узлов какой-либо сети соединяться с другим типом. Например, узлы могут иметь тенденцию соединяться с другими узлами, которые очень похожи или очень отличаются. Эта особенность весьма распространена во многих социальных сетях, хотя также иногда наблюдается в не-социальных сетях. Паттерны смешивания тесно связаны с ассортативностью; однако для целей данной статьи этот термин используется для обозначения ассортативного или дизассортативного смешивания, в зависимости от факторов реального мира, топологических или социологических.
Типы паттернов смешивания
Паттерны смешивания – это характеристика всей сети, обозначающая тенденцию узлов, соединяться с другими схожими или отличающимися узлами. Смешивание, таким образом, может быть классифицировано как ассортативное или дизассортативное. Ассортативное смешивание – это тенденция узлов соединяться со схожими узлами, тогда как дизассортативное смешивание обозначает противоположный случай, в котором соединяются очень различающиеся узлы.
Конкретные характеристики узлов, вовлечённых в процесс образования связей между парами, формируют паттерны смешивания сети. Например, в сети сексуальных отношений, вероятно, обнаружится преобладание связей мужчина-женщина, тогда как в сети дружбы могут преобладать связи мужчина-мужчина и женщина-женщина. Изучение различных наборов характеристик узлов, таким образом, может выявить сообщества или другие структурные свойства сети. В целом, есть два типа методов для использования этих свойств. Один из них основан на аналитических вычислениях с помощью производящих функций. Другой из них — численный и основан на симуляциях по методу Монте-Карло для генерации графов.[1]
При изучении паттернов смешивания в сетях М. Ньюман (M.E.J. Newman) начинает с классификации характеристик узлов на две категории. В то время как число характеристик узлов реального мира виртуально неограниченно, их можно разделить на два типа: дискретные и скалярные/топологические. В последующих разделах определены различия между этими категориями и приведены примеры для каждой из них. Для каждой категории Ньюманом введены и кратко описаны модели сетей с ассортативным смешиванием.
Смешивание, основанное на дискретных характеристиках
Дискретные характеристики узла — категориальные, номинальные или исчислительные и зачастую качественные. Например, раса, пол и сексуальная ориентация — это часто исследуемые дискретные характеристики.
Для измерения смешивания в сети на основе дискретных характеристик Ньюман[1] определяет количество как долю рёбер в сети, которые соединяют узлы типа с типом (см. Рис. 1)[где?]. В ненаправленной сети это количество симметрично относительно своих индексов , тогда как в направленной сети оно может быть асимметричным. Оно удовлетворяет правилам суммирования:
где и — доли каждого типа конца ребра, присоединённого к узлам типа .
В ненаправленных графах, где нет физического различия между концами связи, т.е. концы рёбер все одного типа, .
Тогда коэффициент ассортативности — это мера силы сходства или несходства между двумя узлами на множестве дискретных характеристик, которая может быть определена как:
с
В этой формуле , если нет ассортативного смешивания, поскольку в этом случае , и , если сеть полностью ассортативна. Если сеть полностью дизассортативна, т.е. каждая связь соединяет два узла разных типов, тогда , который, в целом, принадлежит диапазону . Этот диапазон для говорит о том, что полностью дизассортативная сеть в общем случае ближе к сети со случайным смешиванием, чем полностью ассортативная. Когда есть несколько различных типов узлов, тогда случайное смешивание в большинстве случаев будет объединять несхожие узлы, в результате чего такая сеть выглядит преимущественно дизассортативной. Следовательно, закономерно, что значение для случайной сети должно быть ближе к значению для полностью дизассортативной сети, чем для полностью ассортативной сети.
Метод производящих функций основан на идее каждый раз вычисления подходящей производящей функции для интересующих распределений и позволяет извлекать данные, относящиеся к структуре сети путём их дифференциации. Предполагая, что распределение степеней для узлов типа и значение матрицы (и, следовательно, значения и ) известны. Из ансамбля графов с указанными и получаются коллективные (макроскопические) характеристики сети. В целом, производящие функции для и их первый момент задаются как
и
где:
- – узел типа ( в числе);
- – средняя степень узлов этого типа.
Отдельный интерес представляют нижеследующие распределения.
Распределение общего числа узлов, достижимых при следовании по ребру, входящему в узел типа , имеет производящую функцию . Аналогично, распределение числа узлов, достижимых из случайно выбранного узла типа , имеет производящую функцию . Из этого можно получить некоторые характеристики сети. Среднее число узлов, достижимых из узла типа равно
Далее, если – это вероятность для узла типа (отобранный путём следования случайно выбранной связи в графе) не принадлежать гигантскому кластеру (giant cluster), тогда общая доля узлов, составляющих этот кластер, задаётся как
Численные вычисления на основе метода Монте-Карло, по-видимому, находятся в согласии с аналитическими результатами, полученными по формулам, описанным выше.
Смешивание на основе скалярных или топологических характеристик
Скалярные характеристики узла — это численные характеристики. Они могут быть непрерывными или дискретными порядковыми переменными, как например количеством (count). Возраст, вероятно, самый простой пример, хотя интеллект и сырьевой доход — другие очевидные возможные примеры. Некоторые топологические особенности сети также могут быть использованы для исследования смешивания на основе скалярных свойств. В частности, степень узла — зачастую очень важная характеристика в паттернах смешивания в сетях.[2] Очень полезны топологические скалярные особенности, поскольку, в отличие от других показателей, они всегда доступны. Иногда они используются как приблизительный показатель реальной «социабельности» (sociability, склонность устанавливать социальные связи).[1]
Для измерения ассортативности скалярных переменных, аналогично дискретному случаю (см. выше) можно определить коэффициент ассортативности. Его можно измерить с помощью стандартной корреляции Пирсона, как показал Ньюман.[1] На Рис. 2[где?], например, расчёт коэффициента корреляции Пирсона даёт r = 0.574. Это обозначает довольно сильную ассоциацию между возрастом мужей и жён на момент свадьбы.
Альтернативный коэффициент можно рассчитать, измеряя смешивание по степеням вершин. Ньюман[1] вывел следующее выражение
для ненаправленной сети. В этой формуле, если относится к распределению степеней графа (т.е. вероятности, что узел имеет степень ), тогда . Это относится к избыточной степени (excess degree) узла, или числу других рёбер, помимо изучаемого в настоящий момент. обозначает среднюю степень в сети, а — среднеквадратическое отклонение распределения . Для направленной сети эквивалентное выражение имеет вид
- .
Эта корреляция положительна, когда узлы ассортативны по степеням, и отрицательна, когда сеть дизассортативна. Таким образом, эта мера даёт общее представление о паттернах смешивания в сети. Более глубокий анализ приведён в статье «Ассортативность».
Метод производящих функций по-прежнему применим и в этом случае, но функции, которые надо найти, редко можно определить в аналитическом виде. Таким образом, численные вычисления выглядят единственным способом получить конечный результат. В этом случае снова используется метод Монте-Карло. Для случая сетей со степенным законом распределения степеней , имеет расходящееся среднее, кроме случая , который встречается редко.[3] Вместо этого, экспоненциально обрезанное распределение по степенному закону даёт распределение для избыточной степени типа . Результаты для этого случая описаны ниже.
1) Позиция на фазовом переходе, при которой гигантский кластер движется к более высоким значениям , тогда как значение снижается. Иными словами, чем более ассортативна сеть, тем ниже порог плотности рёбер для появления гигантского кластера.
2) Размер гигантского кластера в пределе большой меньше для графа с ассортативным смешиванием, чем для нейтральных и дизассортативных графов.
3) Ассортативное смешивание в сети влияет на устойчивость сети при удалении узлов. Для ассортативных сетей требуется удалить примерно в десять раз больше узлов с высокими степенями, чтобы уничтожить гигантский кластер, чем в обычной сети (под обычной имеется в виду нейтральная сеть), тогда как противоположное верно для дизассортативных сетей, т.е. они более чувствительны, чем нейтральные, к удалению узлов с высокой степенью.
Этот результат о зависимости устойчивости сети от смешивания узлов можно объяснить следующим образом. По определению, узлы с высокой степенью в ассортативных сетях имеют тенденцию образовывать ядерную группу (core group) между ними. Такая ядерная группа обеспечивает устойчивость сети, концентрируя все очевидные целевые узлы вместе в одной части графа. Удаление этих узлов с высокой степенью по-прежнему является одним из наиболее эффективных способов уничтожить связность сети, но менее эффективным (в сравнении с нейтральной сетью), поскольку, удалив их все из той же части графа, мы не атакуем другие части графа. Если эти другие части сами по себе устойчиво работают, то гигантский кластер останется, даже если узлы с высокими степенями исчезнут. С другой стороны, сети с дизассортативным смешиванием особенно чувствительны к удалению узлов с высокими степенями, поскольку эти узлы рассыпаны далеко друг от друга по сети, поэтому атака на них это как атака на все части сети одновременно.
Примеры и приложения
Типичным приложением паттернов смешивания является изучение передачи заболеваний. Например, многие исследования используют смешивание для изучения распространения СПИДа и других заразных заболеваний.[4][5][6] Эти статьи находят сильную связь между паттернами смешивания и скоростью распространения заболеваний. Результаты также могут быть полезны для моделирования роста сетей реального мира, как, например, в [7], или обнаружения сообществ в сетях.
Примечания
- Newman, M. E. J. (2003-02-27). “Mixing patterns in networks”. Physical Review E. 67 (2): 026126. arXiv:cond-mat/0209450. Bibcode:2003PhRvE..67b6126N. DOI:10.1103/physreve.67.026126. ISSN 1063-651X. PMID 12636767.
- Newman, M. E. J. (2002-10-28). “Assortative Mixing in Networks”. Physical Review Letters. 89 (20): 208701. arXiv:cond-mat/0205405. Bibcode:2002PhRvL..89t8701N. DOI:10.1103/physrevlett.89.208701. ISSN 0031-9007. PMID 12443515.
- Albert, Réka; Barabási, Albert-László (2002-01-30). “Statistical mechanics of complex networks”. Reviews of Modern Physics. 74 (1): 47—97. arXiv:cond-mat/0106096. Bibcode:2002RvMP...74...47A. DOI:10.1103/revmodphys.74.47. ISSN 0034-6861.
- Aral, S O; Hughes, J P; Stoner, B; Whittington, W; Handsfield, H H; Anderson, R M; Holmes, K K (1999). “Sexual mixing patterns in the spread of gonococcal and chlamydial infections”. American Journal of Public Health. American Public Health Association. 89 (6): 825—833. DOI:10.2105/ajph.89.6.825. ISSN 0090-0036. PMC 1508665. PMID 10358670.
- Garnett, Geoffrey P.; HUGHES, James P.; Anderson, Roy M.; Stoner, Bradley P.; Aral, Sevgi O.; et al. (1996). “Sexual Mixing Patterns of Patients Attending Sexually Transmitted Diseases Clinics”. Sexually Transmitted Diseases. Ovid Technologies (Wolters Kluwer Health). 23 (3): 248—257. DOI:10.1097/00007435-199605000-00015. ISSN 0148-5717. PMID 8724517.
- Ford, Kathleen; Sohn, Woosung; Lepkowski, James (2002). “American Adolescents: Sexual Mixing Patterns, Bridge Partners, and Concurrency”. Sexually Transmitted Diseases. Ovid Technologies (Wolters Kluwer Health). 29 (1): 13—19. DOI:10.1097/00007435-200201000-00003. ISSN 0148-5717. PMID 11773873.
- Catanzaro, Michele; Caldarelli, Guido; Pietronero, Luciano (2004). “Social network growth with assortative mixing”. Physica A: Statistical Mechanics and Its Applications. Elsevier BV. 338 (1—2): 119—124. Bibcode:2004PhyA..338..119C. DOI:10.1016/j.physa.2004.02.033. ISSN 0378-4371.