Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448), страница 63

Файл №1185448 Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf) 63 страницаАвт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448) страница 632020-08-252020-08-25СтудИзба

Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 63)

Путем несложных преобразований находим решениедля первой области:u (t ) =us,1 + (us / n0 − 1) exp [ −( p + d )(t − τ ) ]где u s – асимптотическое значение u , величина которого определяет областьнасыщения:us =p+D.pqТаким образом, модель описывает зависимость, которая имеет S–подобную(логистическую) форму, представленную на рис. 6.1.Заметим, что решение не зависит от значения n0 , что свидетельствует онесущественности начальных условий для информационной динамики. Каким бы небыло начальное количество публикаций, насыщение будет определятьсяисключительно параметрами, которые характеризуют фоновую скорость ростаколичества публикаций, количественную меру актуальности и негативные дляпроцесса факторы.Рис. Часть VI.1.

Функция ростаКривая, представленная на рис. 6.1 имеет точку перегиба:tinf =1ln(us / n 0 − 1) + τ .p+DТаким образом, для первой области имеем так называемую S-подобнуюзависимость, а при t ~ tinf поведение u (t ) приближается к линейной и соответствуетлинейной модели.Представим теперь выражение для u (t ) следующем виде:223u (t ) =us,exp [ ( p + D )t ] + (us / n0 − 1) exp [ ( p + D )τ ]откуда видно, что при условии1ln(us / n0 − 1) + τ = tinfp+Dзависимость u (t ) имеет экспоненциальный характер, то есть для значений t,значительно меньших tinf , модель совпадает с экспоненциальной моделью.t<Для второй области, соответственно, имеем (рис.

6.2):v (λ )v(t ) =,2qv(λ ) + (1 − qv(λ )) exp [ − p (t − λ ) ]учитывая условие «сшивки»:v ( λ ) = u (λ )Если зависимость u (t ) успевает достичь насыщения за промежуток времени t < λ ,то приведенное выше уравнение можно упростить, представив его следующимобразом:v(t ) =vs ( p + D ),p + D(1 − exp [ − p (t − λ ) ])где vs = 1/ q – асимптотическое значение зависимости v(t ) .Рис. Часть VI.2.

Функция спадаКак и ожидалось, величина vs также не зависит ни от начального условия, ни отусловия «сшивки» с функцией u (t ) на границе областей. Как видно, полученнаязависимость имеет область насыщения us при t ≤ λ и асимптотику vs , котораяописывает постепенное уменьшение числа публикаций до фонового уровня. То естьона, по крайней мере, на качественном уровне, согласовывается с общимисоображениями о характере информационной динамики, полученными на основеопытных данных. Кроме того, на локальных участках она неплохо аппроксимируетсялинейной и экспоненциальной моделями.В случае информационных потоков, которые ассоциируются с конкретнымитемами, необходимо описывать динамику каждого из таких потоков отдельно,принимая во внимание то, что рост одного из них автоматически приводит куменьшению других и наоборот.

Поэтому ограничение на количество сообщений повсем тематикам распространяется и на совокупность всех монотематических потоков.224В случае изучения общего информационного потока наблюдается явление«перетекания» публикаций из одних, теряющих актуальность тематик, в другие.Общая динамика должна описываться системой уравнений, каждое из которыхотносится к отдельному монотематическому потоку.

Подчеркнем, что общиеполитематические потоки являются стационарными по количеству публикаций,динамика же в основном определяется «конкурентной борьбой» отдельных тематик.Приведенную выше систему уравнений «конкурентной борьбы» в рамкахобобщенной логистической модели можно представить в таком виде:dyi (t )= ( pi + Di (t , λi ) ) ⋅  yi (t ) − ∑ rij ⋅ yi (t ) y j (t )  .dtjВ этих соотношениях коэффициенты pi и Di имеют тот же смысл, что и ранее, аλi являются точками, в которых соответствующие Di достигают максимальныхзначений.§ 1.5.Модель диффузии информацииОбратимся к еще одному направлению в изучении процессов, связанных синформационными потоками - к диффузии информации.Напомним, что в естественных науках под диффузией понимают взаимноепроникновение друг в друга соприкасающихся веществ, вызванное, например,тепловым движением их частиц.Для понимания сути дела необходимо, прежде всего, учитывать, что информациятакже в определенном смысле состоит из «частиц» - документов (сообщений).Множество процессов, близких к динамике информационных потоков, можномоделировать довольно точно, если четко параметризовать и установить ихпредельные параметры.Процессы диффузии информации, как и процессы диффузии в физике,достаточно точно моделируются с помощью методов клеточных автоматов.Концепция клеточных автоматов была впервые предложена больше полстолетиятому назад Дж.

Фон Нейманом (J. Von Neumann) [7] и развита С. Вольфрамом(S. Wolfram) [8].Клеточные автоматы являются полезными дискретными моделями дляисследования динамических систем. Дискретность модели, а точнее, возможностьпредставить модель в дискретной форме, может считаться важным преимуществом,поскольку открывает широкие возможности использования компьютерныхтехнологий.

Клеточные автоматы в этом смысле занимают особое место, посколькуих дискретность объединяется с другими преимуществами.Главным достоинством клеточных автоматов является их абсолютнаясовместимость с алгоритмическими методами решения задач. Оконченный наборформальных правил, заданный на ограниченном множестве элементов (клеток),допускает точную реализацию в виде алгоритмов. Однако отсюда вытекает и главныйнедостаток клеточных автоматов: вычислительные трудности, которые возникаютпри расчетах соответствующих масштабов. Ведь на каждой итерации необходимосканировать весь набор клеток и для каждой из них выполнять необходимыеоперации. Когда и клеток, и итераций действительно много, требуются значительныересурсы, в том числе вычислительные и временные.225Поэтому продолжительное время клеточные автоматы воспринимались восновном как забавная, хотя и поучительная игра, которая не имеет практическойценности.

Но в последние годы, в связи с бурным развитием компьютерныхтехнологий, они начинают быстро входить в арсенал инструментальных средств,которые используются на практике в различных областях науки и техники.Клеточный автомат представляет собой дискретную динамическую систему,совокупность одинаковых клеток, одинаковым образом соединенных между собой.Все клетки образуют сеть (решетку) клеточных автоматов. Состояние каждой клеткиопределяютсясостоянием клеток, входящих в ее локальную окрестность иназываемых ближайшими соседями. Окрестностью конечного автомата с номеромназывается множество его ближайших соседей. Состояние -го клеточного автоматав момент времени, таким образом, определяется следующим образом:где– некоторое правило, которое можно выразить, например, языком булевойалгебры.

Во многих задачах считается, что сам элемент относится к своимближайшим соседям, т.е., в этом случае формула упрощается:Клеточныеавтоматывтрадиционномпониманииудовлетворяют таким правилам:- изменение значений всех клеток происходит одновременно (единица измерения- такт);- сеть клеточных автоматов однородная, т.е. правила изменения состояний длявсех клеток одинаковые;- на клетку могут повлиять лишь клетки из ее локальной окрестности;- множество состояний клетки конечное.Теоретически клеточные автоматы могут иметь любую размерность, однакочаще всего рассматривают одномерные и двумерные системы клеточных автоматов.Модель диффузии информации [9], которую будем рассматривать в дальнейшем,является двумерной, поэтому дальнейший формализм касается этого случая. Вдвумерном клеточном автомате решетка реализуется двумерным массивом.

Поэтомув этом случае удобно перейти к двум индексам, что вполне корректно для двумерныхконечных решеток.В случае двумерной решетки, элементами которой являются квадраты,ближайшими соседями, входящими в окрестность элемента, можно считать илитолько элементы, расположенные вверх-вниз и влево-вправо от него (так называемаяокрестность фон Неймана:), либо добавленные к нимещеидиагональныеэлементы(окрестность Мура (G.

Moore).В модели Мура каждая клетка имеет восемь соседей. Для устранения краевыхэффектов решетка топологически «сворачивается в тор», т.е. первая строка считаетсяпродолжением последней, а последняя – предшествующей первой. То же самоеотносится и к столбцам.Это позволяет определять общее соотношение значения клетки на шагепосравнению с шагом :226С. Вольфрам, классифицируя различные клеточные автоматы, выделил те,динамика которых существенным образом зависит от начального состояния. Подбираяразличные начальные состояния, можно получать разнообразнейшие конфигурации итипы поведения. Именно к таким системам относится классический пример - игра"Жизнь", изобретенная Дж.

Конвеем (J. Conway) и известная широкому кругучитателей благодаря публикации в книге M. Гарднера (M. Gardner) [10].Клеточные автоматы с успехом применяются при моделировании процессовраспространения инноваций [11]. Клеточные автоматы также используются примоделировании электоральных процессов, в этом случае предполагается, чтоизбирательные преференции человека определяются установками его ближайшегоокружения.В одной из моделей предполагается, что индивид принимает решение голосоватьв моментза республиканцев или демократов в соответствии с правилом простогобольшинства. В этой модели учитывались взгляды индивида и четырех егоближайших соседей в момент (окрестность фон Неймана).

Модель исследовалась набольшом временном отрезке - до 20 000 тактов. Оказалось, что партийная борьбаприводит к очень сложным конфигурациям, которые существенным образом зависятот исходного распределения.Как упрощенную модель диффузии информации сначала рассмотримпризнанную модель распространения инноваций [11].Подобная модель функционирует по следующим правилам: каждый индивид,который способен принять инновацию, соответствует одной квадратной клетке надвумерной плоскости.

Каждая клетка может находиться в двух состояниях: 1 - новинкапринята; 0 - новинка не принята. Предполагается, что автомат, восприняв инновациюодин раз, запоминает ее навсегда (состояние 1, которое не может быть измененным).Автомат одобряет решение относительно принятии новинки, ориентируясь на мнениевосьми ближайших соседей, т.е.

если в окрестности данной клетки (используетсяокрестность Мура) естьприверженцев новинки,- вероятность ее принятия(генерируется в ходе работы модели) и если( - фиксированное предельноезначение), то клетка принимает инновацию (значение 1). По мнению авторов этоймодели, клеточное моделирование позволяет строить значительно болеереалистические модели рынка инноваций, чем традиционные подходы.Вместе с тем динамике распространения информации присущи некоторыедополнительные свойства, которые были учтены в представленной ниже модели. Вмодели диффузии информации, наряду с теми же условиями, которые относятся кклеточному пространству, окрестности Мура и вероятностному правилу принятия новости,дополнительно к у условиям диффузии инноваций предполагалось, что клетка может бытьв одном из трех состояний: 1 - «свежая новость» (клетка окрашивается в черный цвет); 2 новость, которая устарела, но сохраненная в виде сведений (серая клетка); 3 - клетка неимеет информации, переданной новостным сообщением (клетка белая, информация недошла или уже забыта).

Характеристики

Тип файла

PDF-файл

Размер

5,66 Mb

Материал

Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf

Тип материала

Книга

Предмет

Анализ текстовых данных и информационный поиск

Высшее учебное заведение

МГУ им. Ломоносова

Список файлов книги

avt.-obrabotka-tekstov-na-estestvennom-jazyke-i-komp.-lingvistika.-bolshakova-2014.pdf.rar

Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.