Главная » Просмотр файлов » Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014)

Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448), страница 73

Файл №1185448 Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf) 73 страницаАвт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448) страница 732020-08-25СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 73)

6.16.На рис. 6.17 показано распределение степеней узлов при N=200, M=50, p=0.0020.007. При этом номера узлов ранжированы по значениям их степеней (чем вышестепень, тем меньший порядковый номер).266Рис. Часть VI.16. Сеть из 25 узлов, формируемая за 10 шагов алгоритма приp=0.05Рис. Часть VI.17. Распределения степеней узлов при N=200, M=50, p=0.007Распределение, получаемое в результате моделирования, не совпадает собщеизвестной закономерностью распределения доходов В. Парето.

Вместе с тем,закономерность Парето не может объяснить эффект отсутствия «среднего класса»(Mіddle Class) [53] в социальных системах с относительно высоким порогомпереходов между уровнями доходов, что наглядно демонстрируется в рамкахпредлагаемого подхода.Как показали эксперименты, небольшом пороге p наблюдается относительноравномерное распределение степеней узлов (по условиям модели – доходов). Приp=0.001–0.003 можно предположить наличие «среднего класса».Однако приповышении порога (p>0.003) узлы после прохождения M циклов формирования реберразделяются на две группы, между которыми наблюдается явный разрыв. Так какстепень узла в рамках данной модели – это уровень «богатства», то происходитжесткое расслоение на богатых и бедных.

Скачек при больших значениях как раз и267характеризует отсутствие «среднего класса», т.е. плавного перехода прираспределении степеней узлов.Аналогия – нехватка капитала в период начального накопления – группа узловстановится «богатой», получая большую степень, недосягаемую для остальных.На рис. 6.18. приведен усредненный по график плотности вероятностираспределения степеней узлов для значений N=50, M=2, p=0.02.Рис. Часть VI.18. Эмпирическая плотность вероятностей распределения степенейузлов для значений N=50, M=20, p=0.02, усредненная по 1000 реализациямЯвно выраженное наличие двух «колоколов» в графике плотности вероятноститакже свидетельствует о четком разделении значений на два класса.Трехмерный график распределения степеней узлов в зависимости от номера(ранга) узла и значения порога p приведен на рис.

6.19. На этом графике видно, чтозначение скачка является возрастающей функцией от p, что можно трактовать какувеличение абсолютного разрыва между классами при возрастании порога.Рис. Часть VI.19. Распределение степеней узлов (ось 0Z) при N=200, M=50 взависимости от значения порога p (ось 0X) и ранга узла (ось 0Y)268В результате анализа описанной в работе модели получено распределениестепеней узлов сети со скачкообразным переходом, объясняющее отсутствие«среднего класса» в рамках предлагаемого подхода и предметной области.Список используемой литературы[1] Salton G, Wong A, Yang C. A Vector Space Model for Automatic Indexing. //Communications of the ACM, 18(11):613-620, 1975.[2] Ландэ Д.В.Основы интеграции информационных потоков.

– К.:Инжиниринг, 2006. - 240 с.[3] Broder A. Identifying and Filtering Near-Duplicate Documents, COM’00 //Proceedings of the 11th Annual Symposium on Combinatorial Pattern Matching. – 2000. –P. 1-10.[4] Иванов С.А. Мировая система научной коммуникации как информационноепространство // Библиотеки и ассоциации в меняющемся мире: новые технологии иновые формы сотрудничества: 8-я Междунар. конф. "Крым 2002": Материалы конф.,Судак, 9-17 июня, 2001 г. – М., 2001. – Т.1.

– С. 1123-1126.[5] Брайчевский С.М. Современныеинформационныепотоки:актуальнаяпроблематика / С.М. Брайчевский, Д.В. Ландэ // Научно-техническая информация. – Сер.1. – Вып 11. –2005. – С. 21-33.[6] Арнольд В.И. Аналитика и прогнозирование: математический аспект //Научно-техническая информация. - Сер. 1.

- Вып. 3. - 2003. - С. 1-10.[7] Нейман Дж. Теория самовоспроизводящихся автоматов. - М.: Мир, 1971. –382 с.[8] Wolfram S. A New Kind of Science. - Champaign, IL: Wolfram Media Inc., 2002.– 1197 p.[9] Ландэ Д.В., Снарский А.А., Безсуднов И.В. Интернетика: Навигация всложных сетях: модели и алгоритмы – M.: Либроком (Editorial URSS), 2009.[10] Гарднер М.

Математические досуги. – М.: Мир, 1972.[11] Bhargava S.C., Kumar A., Mukherjee A. A stochastic cellular automata model ofinnovation diffusion // Technological forecasting and social change, 1993. - Vol. 44. - № 1.- pp. 87-97.[12] Арапов М.В., Ефимова Е.Н., Шрейдер Ю.А. О смысле ранговыхраспределений // Научно-техническая информация. Серия 2. – №1, 1975. – С.

9 - 20.[13] Неrdаn G. The Advanced Theory of Language as Choіce and Chance. Berlіn–Heіdelberg–New York, 1966.[14] Яглом А.М., Яглом И.М. Вероятность и информация. Изд. 3-е, перераб. идополн. М., «Наука», 1973.511с.[15] Manning C.D., Schütze H. Foundations of Statistical Natural LanguageProcessing - Cambridge, Massachusetts: The MIT Press, 1999.[16] Bell A., Fosler-Lussier E., Girand C., Raymond W.

Reduction of English functionwords in Switchboard // Proceedings of ICSLP-98. - Vol 7. – 1998. - pp. 3111-3114.[17] Simon H. A. Biometrika 42, 425 (1955).[18] Bradford, S.C. "Sources of Information on Specific Subjects". Engineering: AnIllustrated Weekly Journal (London), 137, 1934 (26 January). – P. 85-86.269[19] Алексеев Н.Г.

Применение закона Бредфорда при комплектовании фонданаучной библиотеки // Тезисы докладов конференции "Библиотечное дело-1996".URL: http://libconfs.narod.ru/1996/4s/4s_p1.html[20] Heaps H.S. Information Retrieval - Computational and Theoretical Aspects.Academic Press, 1978.[21] Grootjen F.A., Van Leijenhorst D. C., van der Weide T.P. A formal derivation ofHeaps' Law // Inf. Sci. – Vol. 170(2-4). - pp.

263-272. - 2005. URL:http://citeseer.ist.psu.edu/660402.html[22] Шредер М. Фракталы, хаос, степенные законы. Миниатюры из бесконечногорая. – М.: Регулярная и хаотическая динамика, 2001. – 528 с.[23] Столлингс В. Современные компьютерные сети. 2-е изд. – СПб.: Питер,2003. – 783 с.[24] Иванов С.А. Стохастические фракталы в Информатике // Научнотехническая информация. Сер.

2. — 2002. — № 8. — С. 7–18.[25]. Peng C.K., Buldyrev S.V., Havlin S., Simons M., Stanley H.E., Goldberger A.L.Mosaic organization of DNA nucleotides. // Phys Rev E. 1994.— 49 (2).— P. 1685–1689.[26] Ландэ Д.В., Снарский А.А. Динамика отклонения элементов ряда измеренийот локальных линейных аппроксимаций // Реєстрація, зберігання і оброб. даних. —2009. —Т. 11, № 1. — С. 27–32.[27] Федер Е.

Фракталы.— М.: Мир, 1991.— 254 с.[28] Чуи К. Введение в вэйвлеты. — М.: Мир, 2001. — 416 с.[29] Астафьева Н.М. Вейвлет-анализ: основы теории и примеры применения //Успехи физических наук. — 1996. — Т. 166, № 11. — С. 1145–1170.[30] Newman M.E.J. The structure and function of complex networks // SIAM Rev. —2003. — 45.— P. 167–256.[31] Dorogovtsev S.N., Mendes J.F.F. Evolution of networks: from biologicalnetworks to the Internet and WWW. — Oxford University Press, 2003.[32] Erdős, P., Renyi A. On Random Graphs. I // Publ. Math. — 1959. — 6.— P. 290–297.[33] Erdős P., Renyi A. On the evolution of random graphs // Publ. Math. Inst.Hungar.

Acad.—1960. —Sci. 5. — P. 17–61.[34] Watts D.J., Strogatz S.H. Collective dynamics of «smallworld» networks //Nature.— 1998.— 393.— P. 440–442.[35] Albert R., Jeong H., Barabasi A. Attack and error tolerance of complex networks// Nature. — 2000.— 406.— P. 378–382.[36] Gol’dshtein V., Koganov G.A., Surdutovich G.I. Vulnerability and hierarchy ofcomplex networks // Phys. Rev.

Lett.— 2004.[37] Zhou S., Mondragon R.J. The rich-club phenomenon in the internet topology //Commun. Lett. IEEE. — 2004. — 8. — P. 180–182.[38] Boguna M., Pastor-Satorras R., Vespignani A. Statistical mechanics of complexnetworks / Lecture and notes in physics. — Springer Berlin.

—2003.— P. 127–147.[39] Newman M.E.J. Assortative mixing in networks // Phys. Rev. Lett.— 2002. — 89(208701).270[40] Barabasi A., Albert R. Emergence of scaling in random networks // Science.—1997.— 286. — P. 509–512.[41] Ю. Головач, В. Пальчиков, Лис Микита і мережі мови, Журн. Фіз. Досл. 10(2006) 247-291.[42] Ferrer-i-Cancho R., Sole R. V. The small world of human language // Proc. R.Soc.

Lond. B 268, 2261 (2001).[43] Dorogovtsev S.N., Mendes J. F. F. Language as an evolving word web // Proc. R.Soc. Lond. B 268, 2603 (2001).[44] Caldeira S. M. G., Petit Lobao T. C., Andrade R. F. S., Neme A., Miranda J. G.V. The network of concepts in written texts // Preprint physics/0508066 (2005).[45] Ferrer-i-Cancho R., Sole R.V., Kohler R. Patterns in syntactic dependencynetworks // hys. Rev. E 69, 051915 (2004).[46] Ferrer-i-Cancho, R. The variation of Zipf's law in human language.

// Phys. Rev.E 70, 056135 (2005).[47] Motter A. E., de Moura A. P. S., Lai Y.-C., Dasgupta P. Topology of theconceptual network of language // Phys. Rev. E 65, 065102(R) (2002).[48] Sigman M., Cecchi G. A. Global Properties of the Wordnet Lexicon // Proc. Natl.Acad. Sci.

USA, 99, 1742 (2002).[49] Albert R., Jeong H., Barabasi A.-L. Diameter of the world wide web // Nature(London) 401, 130 (1999).[50] Bjorneborn L., Ingwersen P. Toward a basic framework for webometrics // J.Amer. Soc. Inform. Sci. and Technol. — 2004. — 55(14). — P. 1216–1227.[51] Milgram S. The small world problem // Psychology Today.

— 1967. — 2.— P.60–67.[52] Watts D.J., Strogatz S.H. Collective dynamics of «smallworld» networks //Nature.— 1998.— 393.— P. 440–442.[53] Cashell B.W: Who Are the “Mіddle Class”?, CRS Report for the Congress,March 20, 2007.271БОЛЬШАКОВА Елена ИгоревнаКЛЫШИНСКИЙ Эдуард СтаниславовичЛАНДЭ Дмитрий ВладимировичНОСКОВ Алексей АнатольевичПЕСКОВА Ольга ВадимовнаЯГУНОВА Елена ВикторовнаАвтоматическая обработка текстов на естественном языкеи компьютерная лингвистикаИзд. лиц. ИД № 06117 от 23 октября 2001 г. Подписано в печать.06.11.Формат 60х84/16 .

Бумага типографская № 2. Печать - ризография.Усл.печ. л. 17,1 Уч.-изд. л. 15,4. Тираж 500 экз. ЗаказИзд. № .Московский государственный институт электроники и математики109028 Москва, Б. Трехсвятительский пер., 3/12.272.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6418
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее