Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика (1027379), страница 73
Текст из файла (страница 73)
Часть VI.14. Модель Уаттса-СтрогатцаНа рис. 6.15 приведены графики изменения средней длины пути и коэффициентакластеризации искусственной сети Д. Уаттса и С. Строгатца от вероятностиустановления «далеких связей» (в полулогарифмической шкале).Рис. Часть VI.15. Динамика изменения длины пути и коэффициента кластерностив модели Уаттса-Строгатца в полулогарифмической шкале (горизонтальная ось –вероятность замены ближних связей далекими)В реальности оказалось, что именно те сети, узлы которых имеют одновременнонекоторое количество локальных и случайных «далеких» связей, демонстрируютодновременно эффект малого мира и высокий уровень кластеризации.Вебпространство также является сетью, для которой также подтвержден феномен малыхмиров.Эти исследования дают основания полагать, что зависимость веб-пространства отбольших узлов значительно существеннее, чем предполагалось ранее, т.е.
она ещеболее чувствительна к злонамеренным атакам. С концепцией «малых миров» связантакже практический подход, называемый «сетевой мобилизацией», котораяреализуется над структурой «малых миров». В частности, скорость распространенияинформации благодаря эффекту «малых миров» в реальных сетях возрастает напорядки по сравнению со случайными сетями, ведь большинство пар узлов реальныхсетей соединены короткими путями.Кроме того, сегодня довольно успешно изучаются масштабируемые,статические, иерархические "малые миры" и другие сети, исследуются ихфундаментальные свойства, такие, как стойкость к деформациям и перколяция.Недавно было показано, что наибольшую информационную проводимость имеетособый класс сетей, называемых "запутанными" (англ.
– entangled networks). Они264характеризуются максимальной однородностью, минимальным расстоянием междулюбыми двумя узлами и очень узким спектром основных статистических параметров.Считается, что запутанные сети могут найти широкое применение в областиинформационных технологий, в частности, в новых поколениях веб, позволяясущественным образом снизить объемы сетевого трафика.Модель случайной сети Эрдоша-РениСуществует две модели классического случайного графа: в первой считается,что M ребер распределены произвольно и независимо между парами из N вершинграфа; во второй модели фиксируется вероятность m , с которой может объединятьсякаждая из пар врешин.
При m → ∞ и N → ∞ для обоих вариантов распределениестепеней узлов k определяется формулой Пуассона:kP(k ) = e− kk,k!где среднее значение степени узла:k = 2 M / N для первой модели иk = mN для второй. При этом средняя длина кратчайшего пути для сети ЭрдошаРени составляетl = ln ( N ) / ln ( k ) ,а коэффициент кластерности:C ~ k / N.Построение случайного графа Эрдоша-Рени выполняется следующимОбразом.
Пусть в начале имеестя N изолированных вершин, к которымПоследовательно добавляются ребра, которые случайным образом соединяютпары вершин. В результате такого процесса доля связанных вершин определяетсявыражением:n n−1n −1 − n kG =1− ∑k e,n =1 n !где n – номер шага процесса добавления ребер.∞Таким образом часть связанных вершин монотонно возрастает с увеличениемсредней степени k , переходя от степенной зависимости к экспоненциальной.Процедура преимущественного присоединения Барабаши-АльбертаНаибольшее количество реальных сетей соответствуют степенному законураспределения, который является, как известно, признаком самоподобия.
Благодарядальним корреляциям система не имеет масштаба изменения параметров (в связи сэти сложные системы, которые характеризуются степенным распределением,называются безмасштабными).Сценарий построения сетей Барабаши-Альберта базируется на двух механизмах– росте и преимущественном присоединении (preferentіal attachment). Данная модельиспользует такой алгоритм: рост сети происходит начиная с небольшого количестваузлов n0 , к которым на каждом временном шагу добавляется новый узел с n ≤ n0связями, которые присоединяются к уже существующим узлам; преимущественноеприсоединение состоит в том, что вероятность присоединения P(ki ) нового узла куже существующему узлу i зависти от степени ki узла i :265P ( ki ) =ki.k∑ jjЗдесь в знаменателе суммирование ведется по всем узлам.
Как компьютерныемодели, так и аналитические решения модели Барабаши-Альберта дают степеннуюасимптотику распределения степеней узлов с показателем γ = 3 .Фазовые переходы при распределении доходовРассмотрим модель распределения доходов между людьми (узлами социальнойсети), основанную на модифицированной процедуре Барабаши-Альберта. Доход врамках предлагаемой модели рассматриваются как величина, пропорциональнаястепени узла, т.е. количеству связей, которыми обладает тот или иной узел. Такимобразом, в данной модели узел сети будет считаться тем богаче, чем выше егостепень.
Справедливость данного подхода может быть проиллюстрирована,например, деятельностью предпринимателей, коммивояжеров, туристических фирм,успешность которых, как правило, зависит от количества партнеров и т.п.При этом, если рассматривать связи между узлами в динамике, в частности,возможность появления новых связей, то, очевидно, распределение степеней узловбудет в значительной степени зависеть от некоторого порога, который необходимопреодолеть для установления связей (аналог в экономике – порог выходапредпринимателя или компании на тот или иной рынок).Рассмотрим модель эволюции динамической сети, состоящей из N узлов. Вначальном состоянии сеть содержит N ненаправленных ребер, вес каждого изкоторых – 1.
В этом состоянии 1-й узел связан ребром со 2-м, 2-й – с 3-м, …, і-й – с(і+1)-м,…, N-й – с 1-м.В рамках этой модели определяется весовое значение для каждого узла – егонормированная степень, пропорциональная количеству ребер, смежных с даннымузлом (величина, находящаяся в интервале [0,1]).Эволюция сети заключается в формировании новых ребер по следующемуалгоритму: в течение каждого цикла (их количество – M задается заранее) для всехузлов по очереди, начиная с 1-го формируется ребро, если выполняется условие, чтостепень данного узла превышает некоторый заданный заранее порог p (0 < p < 1).
Вэтом случае данное ребро соединяет исходный узел с некоторым другим, номеркоторого определяется случайным образом.Пример сформированной таким образом сети для значений N=25, M=10, p=0.05приведен на рис. 6.16.На рис. 6.17 показано распределение степеней узлов при N=200, M=50, p=0.0020.007. При этом номера узлов ранжированы по значениям их степеней (чем вышестепень, тем меньший порядковый номер).266Рис. Часть VI.16. Сеть из 25 узлов, формируемая за 10 шагов алгоритма приp=0.05Рис. Часть VI.17.
Распределения степеней узлов при N=200, M=50, p=0.007Распределение, получаемое в результате моделирования, не совпадает собщеизвестной закономерностью распределения доходов В. Парето. Вместе с тем,закономерность Парето не может объяснить эффект отсутствия «среднего класса»(Mіddle Class) [53] в социальных системах с относительно высоким порогомпереходов между уровнями доходов, что наглядно демонстрируется в рамкахпредлагаемого подхода.Как показали эксперименты, небольшом пороге p наблюдается относительноравномерное распределение степеней узлов (по условиям модели – доходов). Приp=0.001–0.003 можно предположить наличие «среднего класса».Однако приповышении порога (p>0.003) узлы после прохождения M циклов формирования реберразделяются на две группы, между которыми наблюдается явный разрыв.
Так какстепень узла в рамках данной модели – это уровень «богатства», то происходитжесткое расслоение на богатых и бедных. Скачек при больших значениях как раз и267характеризует отсутствие «среднего класса», т.е. плавного перехода прираспределении степеней узлов.Аналогия – нехватка капитала в период начального накопления – группа узловстановится «богатой», получая большую степень, недосягаемую для остальных.На рис. 6.18. приведен усредненный по график плотности вероятностираспределения степеней узлов для значений N=50, M=2, p=0.02.Рис. Часть VI.18.
Эмпирическая плотность вероятностей распределения степенейузлов для значений N=50, M=20, p=0.02, усредненная по 1000 реализациямЯвно выраженное наличие двух «колоколов» в графике плотности вероятноститакже свидетельствует о четком разделении значений на два класса.Трехмерный график распределения степеней узлов в зависимости от номера(ранга) узла и значения порога p приведен на рис. 6.19. На этом графике видно, чтозначение скачка является возрастающей функцией от p, что можно трактовать какувеличение абсолютного разрыва между классами при возрастании порога.Рис. Часть VI.19. Распределение степеней узлов (ось 0Z) при N=200, M=50 взависимости от значения порога p (ось 0X) и ранга узла (ось 0Y)268В результате анализа описанной в работе модели получено распределениестепеней узлов сети со скачкообразным переходом, объясняющее отсутствие«среднего класса» в рамках предлагаемого подхода и предметной области.Список используемой литературы[1] Salton G, Wong A, Yang C.
A Vector Space Model for Automatic Indexing. //Communications of the ACM, 18(11):613-620, 1975.[2] Ландэ Д.В.Основы интеграции информационных потоков. – К.:Инжиниринг, 2006. - 240 с.[3] Broder A. Identifying and Filtering Near-Duplicate Documents, COM’00 //Proceedings of the 11th Annual Symposium on Combinatorial Pattern Matching. – 2000. –P. 1-10.[4] Иванов С.А. Мировая система научной коммуникации как информационноепространство // Библиотеки и ассоциации в меняющемся мире: новые технологии иновые формы сотрудничества: 8-я Междунар. конф. "Крым 2002": Материалы конф.,Судак, 9-17 июня, 2001 г. – М., 2001. – Т.1. – С. 1123-1126.[5] Брайчевский С.М. Современныеинформационныепотоки:актуальнаяпроблематика / С.М. Брайчевский, Д.В. Ландэ // Научно-техническая информация. – Сер.1. – Вып 11.
–2005. – С. 21-33.[6] Арнольд В.И. Аналитика и прогнозирование: математический аспект //Научно-техническая информация. - Сер. 1. - Вып. 3. - 2003. - С. 1-10.[7] Нейман Дж. Теория самовоспроизводящихся автоматов. - М.: Мир, 1971. –382 с.[8] Wolfram S. A New Kind of Science.
- Champaign, IL: Wolfram Media Inc., 2002.– 1197 p.[9] Ландэ Д.В., Снарский А.А., Безсуднов И.В. Интернетика: Навигация всложных сетях: модели и алгоритмы – M.: Либроком (Editorial URSS), 2009.[10] Гарднер М. Математические досуги. – М.: Мир, 1972.[11] Bhargava S.C., Kumar A., Mukherjee A. A stochastic cellular automata model ofinnovation diffusion // Technological forecasting and social change, 1993. - Vol. 44.