Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика (1027379), страница 73

Файл №1027379 Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика (Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика) 73 страницаБольшакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика (1027379) страница 732017-12-212017-12-21СтудИзба

Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 73)

Часть VI.14. Модель Уаттса-СтрогатцаНа рис. 6.15 приведены графики изменения средней длины пути и коэффициентакластеризации искусственной сети Д. Уаттса и С. Строгатца от вероятностиустановления «далеких связей» (в полулогарифмической шкале).Рис. Часть VI.15. Динамика изменения длины пути и коэффициента кластерностив модели Уаттса-Строгатца в полулогарифмической шкале (горизонтальная ось –вероятность замены ближних связей далекими)В реальности оказалось, что именно те сети, узлы которых имеют одновременнонекоторое количество локальных и случайных «далеких» связей, демонстрируютодновременно эффект малого мира и высокий уровень кластеризации.Вебпространство также является сетью, для которой также подтвержден феномен малыхмиров.Эти исследования дают основания полагать, что зависимость веб-пространства отбольших узлов значительно существеннее, чем предполагалось ранее, т.е.

она ещеболее чувствительна к злонамеренным атакам. С концепцией «малых миров» связантакже практический подход, называемый «сетевой мобилизацией», котораяреализуется над структурой «малых миров». В частности, скорость распространенияинформации благодаря эффекту «малых миров» в реальных сетях возрастает напорядки по сравнению со случайными сетями, ведь большинство пар узлов реальныхсетей соединены короткими путями.Кроме того, сегодня довольно успешно изучаются масштабируемые,статические, иерархические "малые миры" и другие сети, исследуются ихфундаментальные свойства, такие, как стойкость к деформациям и перколяция.Недавно было показано, что наибольшую информационную проводимость имеетособый класс сетей, называемых "запутанными" (англ.

– entangled networks). Они264характеризуются максимальной однородностью, минимальным расстоянием междулюбыми двумя узлами и очень узким спектром основных статистических параметров.Считается, что запутанные сети могут найти широкое применение в областиинформационных технологий, в частности, в новых поколениях веб, позволяясущественным образом снизить объемы сетевого трафика.Модель случайной сети Эрдоша-РениСуществует две модели классического случайного графа: в первой считается,что M ребер распределены произвольно и независимо между парами из N вершинграфа; во второй модели фиксируется вероятность m , с которой может объединятьсякаждая из пар врешин.

При m → ∞ и N → ∞ для обоих вариантов распределениестепеней узлов k определяется формулой Пуассона:kP(k ) = e− kk,k!где среднее значение степени узла:k = 2 M / N для первой модели иk = mN для второй. При этом средняя длина кратчайшего пути для сети ЭрдошаРени составляетl = ln ( N ) / ln ( k ) ,а коэффициент кластерности:C ~ k / N.Построение случайного графа Эрдоша-Рени выполняется следующимОбразом.

Пусть в начале имеестя N изолированных вершин, к которымПоследовательно добавляются ребра, которые случайным образом соединяютпары вершин. В результате такого процесса доля связанных вершин определяетсявыражением:n n−1n −1 − n kG =1− ∑k e,n =1 n !где n – номер шага процесса добавления ребер.∞Таким образом часть связанных вершин монотонно возрастает с увеличениемсредней степени k , переходя от степенной зависимости к экспоненциальной.Процедура преимущественного присоединения Барабаши-АльбертаНаибольшее количество реальных сетей соответствуют степенному законураспределения, который является, как известно, признаком самоподобия.

Благодарядальним корреляциям система не имеет масштаба изменения параметров (в связи сэти сложные системы, которые характеризуются степенным распределением,называются безмасштабными).Сценарий построения сетей Барабаши-Альберта базируется на двух механизмах– росте и преимущественном присоединении (preferentіal attachment). Данная модельиспользует такой алгоритм: рост сети происходит начиная с небольшого количестваузлов n0 , к которым на каждом временном шагу добавляется новый узел с n ≤ n0связями, которые присоединяются к уже существующим узлам; преимущественноеприсоединение состоит в том, что вероятность присоединения P(ki ) нового узла куже существующему узлу i зависти от степени ki узла i :265P ( ki ) =ki.k∑ jjЗдесь в знаменателе суммирование ведется по всем узлам.

Как компьютерныемодели, так и аналитические решения модели Барабаши-Альберта дают степеннуюасимптотику распределения степеней узлов с показателем γ = 3 .Фазовые переходы при распределении доходовРассмотрим модель распределения доходов между людьми (узлами социальнойсети), основанную на модифицированной процедуре Барабаши-Альберта. Доход врамках предлагаемой модели рассматриваются как величина, пропорциональнаястепени узла, т.е. количеству связей, которыми обладает тот или иной узел. Такимобразом, в данной модели узел сети будет считаться тем богаче, чем выше егостепень.

Справедливость данного подхода может быть проиллюстрирована,например, деятельностью предпринимателей, коммивояжеров, туристических фирм,успешность которых, как правило, зависит от количества партнеров и т.п.При этом, если рассматривать связи между узлами в динамике, в частности,возможность появления новых связей, то, очевидно, распределение степеней узловбудет в значительной степени зависеть от некоторого порога, который необходимопреодолеть для установления связей (аналог в экономике – порог выходапредпринимателя или компании на тот или иной рынок).Рассмотрим модель эволюции динамической сети, состоящей из N узлов. Вначальном состоянии сеть содержит N ненаправленных ребер, вес каждого изкоторых – 1.

В этом состоянии 1-й узел связан ребром со 2-м, 2-й – с 3-м, …, і-й – с(і+1)-м,…, N-й – с 1-м.В рамках этой модели определяется весовое значение для каждого узла – егонормированная степень, пропорциональная количеству ребер, смежных с даннымузлом (величина, находящаяся в интервале [0,1]).Эволюция сети заключается в формировании новых ребер по следующемуалгоритму: в течение каждого цикла (их количество – M задается заранее) для всехузлов по очереди, начиная с 1-го формируется ребро, если выполняется условие, чтостепень данного узла превышает некоторый заданный заранее порог p (0 < p < 1).

Вэтом случае данное ребро соединяет исходный узел с некоторым другим, номеркоторого определяется случайным образом.Пример сформированной таким образом сети для значений N=25, M=10, p=0.05приведен на рис. 6.16.На рис. 6.17 показано распределение степеней узлов при N=200, M=50, p=0.0020.007. При этом номера узлов ранжированы по значениям их степеней (чем вышестепень, тем меньший порядковый номер).266Рис. Часть VI.16. Сеть из 25 узлов, формируемая за 10 шагов алгоритма приp=0.05Рис. Часть VI.17.

Распределения степеней узлов при N=200, M=50, p=0.007Распределение, получаемое в результате моделирования, не совпадает собщеизвестной закономерностью распределения доходов В. Парето. Вместе с тем,закономерность Парето не может объяснить эффект отсутствия «среднего класса»(Mіddle Class) [53] в социальных системах с относительно высоким порогомпереходов между уровнями доходов, что наглядно демонстрируется в рамкахпредлагаемого подхода.Как показали эксперименты, небольшом пороге p наблюдается относительноравномерное распределение степеней узлов (по условиям модели – доходов). Приp=0.001–0.003 можно предположить наличие «среднего класса».Однако приповышении порога (p>0.003) узлы после прохождения M циклов формирования реберразделяются на две группы, между которыми наблюдается явный разрыв.

Так какстепень узла в рамках данной модели – это уровень «богатства», то происходитжесткое расслоение на богатых и бедных. Скачек при больших значениях как раз и267характеризует отсутствие «среднего класса», т.е. плавного перехода прираспределении степеней узлов.Аналогия – нехватка капитала в период начального накопления – группа узловстановится «богатой», получая большую степень, недосягаемую для остальных.На рис. 6.18. приведен усредненный по график плотности вероятностираспределения степеней узлов для значений N=50, M=2, p=0.02.Рис. Часть VI.18.

Эмпирическая плотность вероятностей распределения степенейузлов для значений N=50, M=20, p=0.02, усредненная по 1000 реализациямЯвно выраженное наличие двух «колоколов» в графике плотности вероятноститакже свидетельствует о четком разделении значений на два класса.Трехмерный график распределения степеней узлов в зависимости от номера(ранга) узла и значения порога p приведен на рис. 6.19. На этом графике видно, чтозначение скачка является возрастающей функцией от p, что можно трактовать какувеличение абсолютного разрыва между классами при возрастании порога.Рис. Часть VI.19. Распределение степеней узлов (ось 0Z) при N=200, M=50 взависимости от значения порога p (ось 0X) и ранга узла (ось 0Y)268В результате анализа описанной в работе модели получено распределениестепеней узлов сети со скачкообразным переходом, объясняющее отсутствие«среднего класса» в рамках предлагаемого подхода и предметной области.Список используемой литературы[1] Salton G, Wong A, Yang C.

A Vector Space Model for Automatic Indexing. //Communications of the ACM, 18(11):613-620, 1975.[2] Ландэ Д.В.Основы интеграции информационных потоков. – К.:Инжиниринг, 2006. - 240 с.[3] Broder A. Identifying and Filtering Near-Duplicate Documents, COM’00 //Proceedings of the 11th Annual Symposium on Combinatorial Pattern Matching. – 2000. –P. 1-10.[4] Иванов С.А. Мировая система научной коммуникации как информационноепространство // Библиотеки и ассоциации в меняющемся мире: новые технологии иновые формы сотрудничества: 8-я Междунар. конф. "Крым 2002": Материалы конф.,Судак, 9-17 июня, 2001 г. – М., 2001. – Т.1. – С. 1123-1126.[5] Брайчевский С.М. Современныеинформационныепотоки:актуальнаяпроблематика / С.М. Брайчевский, Д.В. Ландэ // Научно-техническая информация. – Сер.1. – Вып 11.

–2005. – С. 21-33.[6] Арнольд В.И. Аналитика и прогнозирование: математический аспект //Научно-техническая информация. - Сер. 1. - Вып. 3. - 2003. - С. 1-10.[7] Нейман Дж. Теория самовоспроизводящихся автоматов. - М.: Мир, 1971. –382 с.[8] Wolfram S. A New Kind of Science.

- Champaign, IL: Wolfram Media Inc., 2002.– 1197 p.[9] Ландэ Д.В., Снарский А.А., Безсуднов И.В. Интернетика: Навигация всложных сетях: модели и алгоритмы – M.: Либроком (Editorial URSS), 2009.[10] Гарднер М. Математические досуги. – М.: Мир, 1972.[11] Bhargava S.C., Kumar A., Mukherjee A. A stochastic cellular automata model ofinnovation diffusion // Technological forecasting and social change, 1993. - Vol. 44.

Характеристики

Тип файла

PDF-файл

Размер

5,66 Mb

Материал

Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика

Тип материала

Книга

Предмет

Системы автоматизированного проектирования (САПР)

Высшее учебное заведение

МГТУ им. Н.Э.Баумана

Список файлов книги

bolshakova-e.i.-i-dr.-avtomaticheskaya-obrabotka-tekstov-na-estestvennom-yazyke-i-kompyuternaya-lingvistika-1206463058-1513861681.rar

Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика.pdf

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.