Диссертация (1148605), страница 19
Текст из файла (страница 19)
№ 9. Р.2521―2529. URL: http://www.math-info.univ-paris5.fr/~vincent/articles/ROIandZIPFlaw_PR.pdf(дата обращения: 20.10.2013).2URL: http://www.math-info.univ-paris5.fr/~vincent/articles/ROIandZIPFlaw_PR.pdf (дата обращения: 20.10.2013).3Caron Y., Makris P., Vincent N. Use of power law models in detecting region of interest. P.2522.4Ibid. P.2523.85log(f(r))log(r)Примечание ― r – ранг, f(r) – частотаРисунок 2 ― Распределение последовательностей пикселей на неоднородном участкеизображенияlog(f(r))log(r)Примечание ― r – ранг, f(r) – частотаРисунок 3 ― Распределение последовательностей пикселей на однородном участкеизображенияАвторы разбивают кривую распределения на две части, которым вбилогарфимических координатах соответствуют две прямые линии с разнымуглом наклона к оси абсцисс, и моделируют каждую прямую в отдельностистепенной функцией.86Интересно, что и при решении таких задач не обходится без введенияособой точки.
В данном случае она определяется как точка графика, наиболееотстоящая от прямой, соединяющей крайние точки в голове и хвостераспределения (см. рисунок 4, заимствованный из цитируемой работы)1.log(f(r))log(r)Примечание ― r – ранг, f(r) – частотаРисунок 4 ― Схема определения пограничной точки РГиперболические распределения характерны и для распределения сайтов попосещаемости2.Сети,существующиевИнтернете,имеютципфовскоераспределение сайтов по посещаемости3.Подтверждает эти данные и А.В.Олескин, сообщая о гиперболическойзависимости между степенью4 n вершины и количеством вершин, имеющихстепень n, при исследовании биологических и социальных сетей: «Новый узел сбoльшей вероятностью присоединяется к узлу с бoльшим количеством связей.
...Примеры таких сетей можно найти в Интернете, где новые пользователипредпочтительно вступают в связь с узлами, и так имеющими большее1Ibid. P.2525.Adamic L., Huberman B. Zipf’s law and the Internet // Glottometrics. 2002. №3. Р.143―150.3Ibid. P.147.4Степень вершины - количество ребер графа G, инцидентных вершине х.287количество связей. Безмасштабные сети содержат малое число хабов (hubs) –узлов с многочисленными связями; численно преобладают узлы с небольшимчислом связей»1.В гуманитарных науках существуют две самостоятельные дисциплины,активноиспользующиеметодытеориивероятностейиматематическойстатистики: стилеметрия и клиометрия.Стилеметрия – «прикладная филологическая дисциплина, занимающаясяизмерением стилевых характеристик с целью систематизации и упорядочивания(типологии, атрибуции, датировки, диагностики, реконструкции и т.п.) текстов иих частей»2.
Для диагностических и систематизирующих задач стилеметрииважен выбор адекватных методик измерения и моделирования признаков текста, атакже статуса текста как предмета классификационной деятельности3.В одной из ведущих клиометрических школ – школе квантитативнойистории И.Д.Ковальченко, также активно обсуждается статус моделируемогоявления: «исследуемый объект, явление или процесс рассматривается как некаяцелостнаясистема,обладающаясоответствующейструктурой,котораяхарактеризуется тем или иным строением, т.е. совокупностью элементов, а такжеопределенным типом взаимосвязи этих элементов и присущих им черт и свойств…Системныйподходиструктурныйанализнеизбежноприводятккомплексному, … междисциплинарному исследованию, т.е. к применениюпринципов и методов различных наук»4. Традиционными статистическимитехниками для клиометрических исследований является анализ временных рядов,энтропийный и корреляционный анализ.
Как для стилеметрии5, так и дляклиометрии одной из приоритетных задач является задача атрибуции. Ходрассуждений, аналогичный стилеметрическим изысканиям, присутствует и вработах историков: «Авторская индивидуальность прослеживается не только в1Олескин А.В. Сетевые структуры в биосистемах и человеческом обществе. М., 2012. C.18.Мартыненко Г.Я., Чебанов С.В.
Стилеметрия // Прикладное языкознание : Учебник. СПб., 1996. С. 420.3Там же. С. 425―432.4Количественные методы в исторических исследованиях : Учебное пособие для вузов ; под ред. И.Д.Ковальченко.М., 1984. С. 4―5.;5Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами теориираспознавания образов. Л., 1990. 164, [4] с.288«пристрастии» к определенному порядку слов в предложении, но и впреимущественном употреблении тех или иных частей речи в определенныхформах1.Представляется, что изложенных выше данных достаточно для того, чтобыпродемонстрировать междисциплинарность Н-распределений и ряда смежных сними вопросов, а также уяснить разнообразие проблематики и спектр предметныхобластей, к которым пытаются эффективно применять зависимость, условноназываемую «законом Ципфа».
Понятно также, что исходное выражение Ципфа иЭсту f x r = const неоднократно модифицировалось и переобосновывалось,согласовываясьсметодологическимиустановкамиисследователяиэмпирическим материалом. Несмотря на все вышеизложенное, внутри пестройсовокупностиисследовательскихмненийнаблюдаютсяхарактерныепротиворечия, иногда приводящие к тому, что точки зрения оппонентовквалифицируются, как безосновательные. Попытка охарактеризовать основанияэтих противоречий осуществлена в § 2.3.§ 2.2 Концепции описания структуры поликомпонентных объектовВ§ 2.2рассматриваютсямоделистатистическойструктурыполикомпонентных объектов, в которых в качестве исходных допущенийзаложено представление о негауссовости внутренних систем, за исключениеммоделей Г.Я.Мартыненко и Т.Г.Петрова, для которых гауссовость / негауссовостьсовокупности не очень важна, т.к.
первый делает упор на составностиэмпирического распределения, а второму эта проблема неинтересна в принципе.1Морозова Л.Е. Графотеоретический подход к изучению авторских текстов // Методы количественного анализанарративных источников. М., 1983. С. 33.892.2.1 Принцип максимума диссимметрии М.В.Арапова-Ю.А.ШрейдераЮ.А.Шрейдер и М.В.Арапов полагают, что ранговые распределения«необходимо рассматривать не только как распределения случайных величин,привычные для классической статистики, но и в совершенно иной понятийной“парадигме”.
Выполнение на данном объекте (тексте) рангового распределениятипа закона Ципфа – это, с нашей точки зрения, признак “правильности”(хорошей организации) данного текста, взятого как единое целое»1. Исходя изэтого, в исследовательском круге Ю.А.Шрейдера последовательно различаются,несмотря на наличие визуального сходства, распределения, описывающиецелостныйобъект(например,текст),ираспределения,описывающиенеоднородную совокупность: «различие между двумя подходами, коротко говоря,состоит в следующем: “классическая” точка зрения исходит из существованияинвариантных статистических свойств неких элементов (слов данного языка,документов по данной тематике, имен авторов и т.д.) в некоторой не очень четкоопределяемой совокупности, в которую входят и в которой употребляются этиэлементы.
Предлагаемая нами точка зрения состоит в том, что надо изучатьформу целостных совокупностей (организмов) как составленных из не оченьчетко определенных элементов, а свойства последних не столько определяют этуформу, сколько определяются ею»2.Инымисловами,эмпирическимматериаломвподходе,которогопридерживаются Ю.А.Шрейдер с соавторами, должна быть хотя бы относительноцелостная система (в некоторых случаях границы этой системы трудноопределить) объектов Т и множество V, используемое для разбиения этихобъектов на классы. Способ отождествления объектов из Т и формирования1Арапов М.В., Ефимова Е.Н., Шрейдер Ю.А.
О смысле ранговых распределений // Научно-техническаяинформация. Сер.2. 1975. № 1. С.9.2Там же.90самого множества V не единственен (напр., отождествление графическихвариантов словоформы, учет как одного или как двух объектов автора, писавшегокак под псевдонимом, так и под настоящей фамилией и т.п.)1. В серии подобныхпримеров объектом исследования выступает нечто целое – текст, а инвариантомпри переходе от одного текста к другому является форма ранговогораспределения, т.е. изучается распределение «в тексте». Если же в качествеобъекта исследования рассматривается некоторая произвольно сформированнаясовокупность (например, случайным образом отобранные тексты и отрывкитекстов на данном языке общей длиной в L слов, а в качестве V – список всехразличных слов, обнаруженный в этой совокупности текстов), то на первом плане– явно отдельный элемент словаря, и изучается распределение «в словаре». Впервом случае не только не предполагается, что при переходе от одного текста кдругому сохраняется «статус» элемента словаря, но и не ясно, всегда ли можноотождествить членов различных коллективов; во втором случае не представляетспециальной ценности само понятие отдельного коллектива2.Ю.А.Шрейдер очень точно отмечает, что сохранение рангового статуса длянекоторых слов в словарных и текстовых распределениях «является, вероятно,некоторой специфической особенностью естественного языка.