Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448), страница 73
Текст из файла (страница 73)
6.16.На рис. 6.17 показано распределение степеней узлов при N=200, M=50, p=0.0020.007. При этом номера узлов ранжированы по значениям их степеней (чем вышестепень, тем меньший порядковый номер).266Рис. Часть VI.16. Сеть из 25 узлов, формируемая за 10 шагов алгоритма приp=0.05Рис. Часть VI.17. Распределения степеней узлов при N=200, M=50, p=0.007Распределение, получаемое в результате моделирования, не совпадает собщеизвестной закономерностью распределения доходов В. Парето.
Вместе с тем,закономерность Парето не может объяснить эффект отсутствия «среднего класса»(Mіddle Class) [53] в социальных системах с относительно высоким порогомпереходов между уровнями доходов, что наглядно демонстрируется в рамкахпредлагаемого подхода.Как показали эксперименты, небольшом пороге p наблюдается относительноравномерное распределение степеней узлов (по условиям модели – доходов). Приp=0.001–0.003 можно предположить наличие «среднего класса».Однако приповышении порога (p>0.003) узлы после прохождения M циклов формирования реберразделяются на две группы, между которыми наблюдается явный разрыв. Так какстепень узла в рамках данной модели – это уровень «богатства», то происходитжесткое расслоение на богатых и бедных.
Скачек при больших значениях как раз и267характеризует отсутствие «среднего класса», т.е. плавного перехода прираспределении степеней узлов.Аналогия – нехватка капитала в период начального накопления – группа узловстановится «богатой», получая большую степень, недосягаемую для остальных.На рис. 6.18. приведен усредненный по график плотности вероятностираспределения степеней узлов для значений N=50, M=2, p=0.02.Рис. Часть VI.18. Эмпирическая плотность вероятностей распределения степенейузлов для значений N=50, M=20, p=0.02, усредненная по 1000 реализациямЯвно выраженное наличие двух «колоколов» в графике плотности вероятноститакже свидетельствует о четком разделении значений на два класса.Трехмерный график распределения степеней узлов в зависимости от номера(ранга) узла и значения порога p приведен на рис.
6.19. На этом графике видно, чтозначение скачка является возрастающей функцией от p, что можно трактовать какувеличение абсолютного разрыва между классами при возрастании порога.Рис. Часть VI.19. Распределение степеней узлов (ось 0Z) при N=200, M=50 взависимости от значения порога p (ось 0X) и ранга узла (ось 0Y)268В результате анализа описанной в работе модели получено распределениестепеней узлов сети со скачкообразным переходом, объясняющее отсутствие«среднего класса» в рамках предлагаемого подхода и предметной области.Список используемой литературы[1] Salton G, Wong A, Yang C. A Vector Space Model for Automatic Indexing. //Communications of the ACM, 18(11):613-620, 1975.[2] Ландэ Д.В.Основы интеграции информационных потоков.
– К.:Инжиниринг, 2006. - 240 с.[3] Broder A. Identifying and Filtering Near-Duplicate Documents, COM’00 //Proceedings of the 11th Annual Symposium on Combinatorial Pattern Matching. – 2000. –P. 1-10.[4] Иванов С.А. Мировая система научной коммуникации как информационноепространство // Библиотеки и ассоциации в меняющемся мире: новые технологии иновые формы сотрудничества: 8-я Междунар. конф. "Крым 2002": Материалы конф.,Судак, 9-17 июня, 2001 г. – М., 2001. – Т.1.
– С. 1123-1126.[5] Брайчевский С.М. Современныеинформационныепотоки:актуальнаяпроблематика / С.М. Брайчевский, Д.В. Ландэ // Научно-техническая информация. – Сер.1. – Вып 11. –2005. – С. 21-33.[6] Арнольд В.И. Аналитика и прогнозирование: математический аспект //Научно-техническая информация. - Сер. 1.
- Вып. 3. - 2003. - С. 1-10.[7] Нейман Дж. Теория самовоспроизводящихся автоматов. - М.: Мир, 1971. –382 с.[8] Wolfram S. A New Kind of Science. - Champaign, IL: Wolfram Media Inc., 2002.– 1197 p.[9] Ландэ Д.В., Снарский А.А., Безсуднов И.В. Интернетика: Навигация всложных сетях: модели и алгоритмы – M.: Либроком (Editorial URSS), 2009.[10] Гарднер М.
Математические досуги. – М.: Мир, 1972.[11] Bhargava S.C., Kumar A., Mukherjee A. A stochastic cellular automata model ofinnovation diffusion // Technological forecasting and social change, 1993. - Vol. 44. - № 1.- pp. 87-97.[12] Арапов М.В., Ефимова Е.Н., Шрейдер Ю.А. О смысле ранговыхраспределений // Научно-техническая информация. Серия 2. – №1, 1975. – С.
9 - 20.[13] Неrdаn G. The Advanced Theory of Language as Choіce and Chance. Berlіn–Heіdelberg–New York, 1966.[14] Яглом А.М., Яглом И.М. Вероятность и информация. Изд. 3-е, перераб. идополн. М., «Наука», 1973.511с.[15] Manning C.D., Schütze H. Foundations of Statistical Natural LanguageProcessing - Cambridge, Massachusetts: The MIT Press, 1999.[16] Bell A., Fosler-Lussier E., Girand C., Raymond W.
Reduction of English functionwords in Switchboard // Proceedings of ICSLP-98. - Vol 7. – 1998. - pp. 3111-3114.[17] Simon H. A. Biometrika 42, 425 (1955).[18] Bradford, S.C. "Sources of Information on Specific Subjects". Engineering: AnIllustrated Weekly Journal (London), 137, 1934 (26 January). – P. 85-86.269[19] Алексеев Н.Г.
Применение закона Бредфорда при комплектовании фонданаучной библиотеки // Тезисы докладов конференции "Библиотечное дело-1996".URL: http://libconfs.narod.ru/1996/4s/4s_p1.html[20] Heaps H.S. Information Retrieval - Computational and Theoretical Aspects.Academic Press, 1978.[21] Grootjen F.A., Van Leijenhorst D. C., van der Weide T.P. A formal derivation ofHeaps' Law // Inf. Sci. – Vol. 170(2-4). - pp.
263-272. - 2005. URL:http://citeseer.ist.psu.edu/660402.html[22] Шредер М. Фракталы, хаос, степенные законы. Миниатюры из бесконечногорая. – М.: Регулярная и хаотическая динамика, 2001. – 528 с.[23] Столлингс В. Современные компьютерные сети. 2-е изд. – СПб.: Питер,2003. – 783 с.[24] Иванов С.А. Стохастические фракталы в Информатике // Научнотехническая информация. Сер.
2. — 2002. — № 8. — С. 7–18.[25]. Peng C.K., Buldyrev S.V., Havlin S., Simons M., Stanley H.E., Goldberger A.L.Mosaic organization of DNA nucleotides. // Phys Rev E. 1994.— 49 (2).— P. 1685–1689.[26] Ландэ Д.В., Снарский А.А. Динамика отклонения элементов ряда измеренийот локальных линейных аппроксимаций // Реєстрація, зберігання і оброб. даних. —2009. —Т. 11, № 1. — С. 27–32.[27] Федер Е.
Фракталы.— М.: Мир, 1991.— 254 с.[28] Чуи К. Введение в вэйвлеты. — М.: Мир, 2001. — 416 с.[29] Астафьева Н.М. Вейвлет-анализ: основы теории и примеры применения //Успехи физических наук. — 1996. — Т. 166, № 11. — С. 1145–1170.[30] Newman M.E.J. The structure and function of complex networks // SIAM Rev. —2003. — 45.— P. 167–256.[31] Dorogovtsev S.N., Mendes J.F.F. Evolution of networks: from biologicalnetworks to the Internet and WWW. — Oxford University Press, 2003.[32] Erdős, P., Renyi A. On Random Graphs. I // Publ. Math. — 1959. — 6.— P. 290–297.[33] Erdős P., Renyi A. On the evolution of random graphs // Publ. Math. Inst.Hungar.
Acad.—1960. —Sci. 5. — P. 17–61.[34] Watts D.J., Strogatz S.H. Collective dynamics of «smallworld» networks //Nature.— 1998.— 393.— P. 440–442.[35] Albert R., Jeong H., Barabasi A. Attack and error tolerance of complex networks// Nature. — 2000.— 406.— P. 378–382.[36] Gol’dshtein V., Koganov G.A., Surdutovich G.I. Vulnerability and hierarchy ofcomplex networks // Phys. Rev.
Lett.— 2004.[37] Zhou S., Mondragon R.J. The rich-club phenomenon in the internet topology //Commun. Lett. IEEE. — 2004. — 8. — P. 180–182.[38] Boguna M., Pastor-Satorras R., Vespignani A. Statistical mechanics of complexnetworks / Lecture and notes in physics. — Springer Berlin.
—2003.— P. 127–147.[39] Newman M.E.J. Assortative mixing in networks // Phys. Rev. Lett.— 2002. — 89(208701).270[40] Barabasi A., Albert R. Emergence of scaling in random networks // Science.—1997.— 286. — P. 509–512.[41] Ю. Головач, В. Пальчиков, Лис Микита і мережі мови, Журн. Фіз. Досл. 10(2006) 247-291.[42] Ferrer-i-Cancho R., Sole R. V. The small world of human language // Proc. R.Soc.
Lond. B 268, 2261 (2001).[43] Dorogovtsev S.N., Mendes J. F. F. Language as an evolving word web // Proc. R.Soc. Lond. B 268, 2603 (2001).[44] Caldeira S. M. G., Petit Lobao T. C., Andrade R. F. S., Neme A., Miranda J. G.V. The network of concepts in written texts // Preprint physics/0508066 (2005).[45] Ferrer-i-Cancho R., Sole R.V., Kohler R. Patterns in syntactic dependencynetworks // hys. Rev. E 69, 051915 (2004).[46] Ferrer-i-Cancho, R. The variation of Zipf's law in human language.
// Phys. Rev.E 70, 056135 (2005).[47] Motter A. E., de Moura A. P. S., Lai Y.-C., Dasgupta P. Topology of theconceptual network of language // Phys. Rev. E 65, 065102(R) (2002).[48] Sigman M., Cecchi G. A. Global Properties of the Wordnet Lexicon // Proc. Natl.Acad. Sci.
USA, 99, 1742 (2002).[49] Albert R., Jeong H., Barabasi A.-L. Diameter of the world wide web // Nature(London) 401, 130 (1999).[50] Bjorneborn L., Ingwersen P. Toward a basic framework for webometrics // J.Amer. Soc. Inform. Sci. and Technol. — 2004. — 55(14). — P. 1216–1227.[51] Milgram S. The small world problem // Psychology Today.
— 1967. — 2.— P.60–67.[52] Watts D.J., Strogatz S.H. Collective dynamics of «smallworld» networks //Nature.— 1998.— 393.— P. 440–442.[53] Cashell B.W: Who Are the “Mіddle Class”?, CRS Report for the Congress,March 20, 2007.271БОЛЬШАКОВА Елена ИгоревнаКЛЫШИНСКИЙ Эдуард СтаниславовичЛАНДЭ Дмитрий ВладимировичНОСКОВ Алексей АнатольевичПЕСКОВА Ольга ВадимовнаЯГУНОВА Елена ВикторовнаАвтоматическая обработка текстов на естественном языкеи компьютерная лингвистикаИзд. лиц. ИД № 06117 от 23 октября 2001 г. Подписано в печать.06.11.Формат 60х84/16 .
Бумага типографская № 2. Печать - ризография.Усл.печ. л. 17,1 Уч.-изд. л. 15,4. Тираж 500 экз. ЗаказИзд. № .Московский государственный институт электроники и математики109028 Москва, Б. Трехсвятительский пер., 3/12.272.