Диссертация (1148605), страница 23
Текст из файла (страница 23)
статью: Кудрин Б.И. Онтология игносеология ценозов и их структурная устойчивость // Ценологические исследования. 1996. Вып. 1-2:Математическое описание ценозов и закономерности технетики. Философия и становление техники. С. 18―20.3Чебанов С.В. Устное сообщение, сентябрь 2012 г.4Это утверждение Б.И.Кудрина полностью коррелирует с указанием Р.М.Фрумкиной на различение структуртекстов при равном количестве словоупотреблений: «устройство» текста с точки зрения повторяемостислов еще неопределяется ни длиной текста, ни объемом словника» (Фрумкина Р.М. Статистические методы изучения лексики.С.42.).106практических целей – равных) одного завода, но с разницей в 25 лет, или разныхотраслей – не сопоставимы по абсолютным U и S.
Ценозы, равные по количествуособей, совершенно не сопоставимы по ω1 и повторяемости d. Общая тенденция –снижениечисленностипрослеживается,нопервойкастывозможноисувеличениемобратное.объёмаСледовательно,выборкиошибочнопредположение о существовании априори определяемых параметров законавидовогораспределенияΩ(х),которыезадаютнекоторуювеличину,определяемую S, U.
Ошибочно считать, что при заданных S, U ряд единственный(оптимальный по “объёму Ципфа”)»2.ОпираясьнаработыА.Н.КолмогороваиБ.В.Гнеденко,Б.И.Кудринсклоняется к «концепции негауссовости, опирающейся на предельную теоремуГнеденко-Дёблина (1939), играющую роль центральной предельной теоремы. Дляпрактикиэтоозначает,чтоструктураценозаописываетсянекоторымгиперболическим H(аш)-распределением (и можно говорить об Н-анализе, Нпрогнозе, Н-оценке), у которого теоретически отсутствует математическоеожидание (поэтому нельзя применять среднее как таковое), а ошибка припринятии решения в точке (по элементу структуры ценоза) может быть скольугодно большой (дисперсия стремится к бесконечности).
Другими словами,возникает необходимость изучения, а затем и воздействия на объекты, длякоторых не действуют центральная предельная теорема и закон больших чисел, анормальное распределение не является предельным»3. Поясним, что описываемыеидеи А.Н.Колмогорова и Б.В.Гнеденко сводятся к тому, что обнаруживаетсяполная неопределенность в точке, но есть возможность установить аналитическоевыражение для распределения целиком.НапрактикеженекоторыеисследователиценологическойшколыБ.И.Кудрина не отвергают методы классической статистики, в т.ч. применяютраспределения1дляоцениваниянеизвестныхпараметровипроверкиРечь идет об эмпирических частотах, использование термина «вероятность» непонятно.
– прим. Л.К.Мои семь отличий от Ципфа.3Кудрин Б.И. Два открытия: явление инвариантности структуры техноценозов и закон информационного отбора //Ценологические исследования. 2009. Вып. 44. С.6.2107статистических гипотез1. Такая ситуация распространена и в других предметныхобластях, например, в теории распространения волн, где обнаруживаютсянегауссовые распределения2. «В статистической радиотехнике, радиофизике,радиолокации,электронике,теориисвязи…рассматриваютсямодели<случайных процессов – Л.К.>, в которых принимаемые сигналы описываются ввиде аддитивной смеси полезного сигнала и гауссовского шума.
Вместе с темгауссовские процессы (гауссовские модели сигналов и помех) для многихреальных ситуаций являются лишь удобной математической реализацией. Вомногих случаях наблюдаемые случайные процессы являются существеннонегауссовскими»3, например, фликкер-шумы (1/f-шумы).Так, зная о негауссовости, большинство исследователей стремятся избежатьработы с ней. По этому поводу достаточно жестко высказался Ю.В.Чайковский наконференции «Ценологические представления разных школ» 09.11.2011 г.: «вовсех учебниках написано: если дисперсия растет с объемом выборки,классическойстатистикойпользоватьсянельзя».С.Д.Хайтунвработе«Негауссовость социальных явлений»4 в качестве самого надежного и простого«теста на (не)гауссовость» предложил визуальный критерий: если хвост графикакривой рангового распределения в билогарифмических координатах загибается всторону оси ординат, то совокупность гауссова, если загиба нет – негауссова.В дополнение к тесту на (не)гауссовость С.Д.Хайтун выделяет ряд типовыхприемов работы с негауссовыми распределениями по образцу гауссовых.Приведем развернутую цитату.«При описании феномена негауссовости приходится преодолевать рядстереотипов, которые выработались в естественных науках у ученых, успешно1Кудрин Б.И., Лагуткин О.Е, Ошурков М.Г.
Ценологический ранговый анализ в электрике. М., 2008. 116 с. ;Кучинская О.А. Разработка критериев изменения разнообразия видов электрооборудования техноценозов //Математическое описание ценозов и закономерности технетики. Философия и становление технетики.Ценологические исследования. М.-Абакан, 1996. Вып. 1-2.
С.281―286 ; Зайцев Е.З. Комплексный статистическийанализ структуры ценозов // Математическое описание ценозов и закономерности технетики. Философия истановление технетики. Ценологические исследования. М.-Абакан, 1996. Вып. 1-2. С.300―305.2Александров И.А. Некоторые типы негауссовых совокупностей случайных чисел и генерирование их на ЦВМ //Труды акустического института. 1971. Вып.16. С. 103―108 ; Кузнецова Н.Г.
О негауссовом характерераспределений сильных флюктуаций поля // Акустический журнал. 1972. Т.18. Вып.2. С.323―324 ; Шелухин О.И.,Беляков И.В. Негауссовские процессы. СПб., 1992. 312 с.3Шелухин О.И., Беляков И.В. Негауссовские процессы. СПб., 1992. С.3.4URL: http://kudrinbi.ru/public/481/index.htm (дата обращения 20.10.2013).108применяющих там гауссовую математическую статистику и неоправданнопереносящих ее на негауссовые явления.Первый стереотип.
Большинство ученых уверены в том, что хвостыраспределений несущественны, отбрасывая их без зазрения совести. ДляраспределенияГаусса(нормальногораспределения) и других гауссовыхраспределений эта практика себя оправдывает, поскольку в их хвостахсодержится пренебрежимо малая часть выборки. Для негауссовых распределенийэтот стереотип не срабатывает, так как их хвосты, медленно убывающие с ростомзначений переменных, содержат существенную часть выборки, почему ихотбрасывание ведет к значительным ошибкам.Второй стереотип. Всем нам кажется, что средний доход делит людейпополам – 50 % имеют зарплату выше средней, а 50 % – ниже.
Когда речь идет омногих других распределениях – по весу, росту и т.д., – то так оно и есть,поскольку эти распределения – гауссовые. Однако негауссовые распределения,включая распределение доходов, очень неоднородны. 10 % ученых пишут около90 % всех публикаций, основная часть доходов падает на небольшую частьнаселения и т.д.. И потому основная масса ученых имеет публикаций меньшесреднего числа публикаций на ученого, основная масса населения имеет доходменьше среднего и т.д.Третий стереотип.
Полтора столетия успешного применения гауссовойматематическойстатистикинагауссовыхгенеральныхсовокупностях,характерных для естественных наук, а также для социальных наук прииспользовании закрытых шкал, породили у исследователей и практиков(экономистов, социологов, демографов, статистиков и т.д.) интуитивно питаемуюубежденность в том, что получаемые ими результаты не зависят от объемавыборки, изменяясь от выборки к выборке только случайно. При вычислениисреднего, дисперсии и других моментов распределения никто не оглядываетсясегодня на объем выборки, который фигурирует только при оценке случайнойошибки выборочного значения данной величины.109При работе с длиннохвостыми (негауссовыми) распределениями этотстереотип подводит самым серьезным образом, потому что на негауссовыхгенеральных совокупностях моменты растут с объемом выборки.
Поскольку вразных расчетах объемы выборок берутся разными, постольку при использованиимоментовнепросторезультаты“гуляют”,невыказываядолжнойвоспроизводимости, но и вносится систематическая ошибка»1.2.2.4 «Ядро» и «периферия» в подходе Г.Я.МартыненкоГ.Я.Мартыненко не делает опоры на негауссовость лингвостатистическихраспределений.Онпоследовательнопроводитидеюосоставностигиперболических распределений, которые он определяет как распределения позначимости: «распределения по значимости … имеют сходный характер. … Вовсех случаях небольшое число доминирующих элементов несет основнуюфункциональную нагрузку (концентрация значимости), а функциональная рольбольшинства элементов крайне мала (рассеяние значимости)»2. В этом ключе, дляГ.Я.Мартыненко высокочастотные элементы (т.н.
«массовка») представляютсяболее важными, чем низкочастотные. Противоположную позицию занималЮ.А.Шрейдер, отдавая первенство уникальным элементам, как носителям смыслатекста.Обсуждая адекватность законаЦипфа и подобных моделирующихраспределений, Г.Я.Мартыненко занимает принципиальную позицию, утверждаяналичиенеоднородностираспределенийпозначимости.Неоднородностьпроявляется в чрезмерной количественной (и переходящей в качественную)вариации признака, также на нее указывает полимодальность распределения3.1Там же.Мартыненко Г.Я. Некоторые закономерности концентрации и рассеяния элементов в лингвистических и другихсложных системах // Структурная и прикладная лингвистика. 1978.
Вып.1. С.63.3См., напр.: Мартыненко Г.Я. Методы статистического моделирования в языкознании // Прикладное языкознание :Учебник. СПб., 1996. С. 219.2110В своих работах Г.Я.Мартыненко проводит мысль о расчленениисовокупности нафункциональныезоны (например,зоны сединицами,принадлежащими строевой и нестроевой лексике в распределении лексем почастоте их употребления, зоны профильных изданий, смежных изданий инепрофильных изданий в распределении периодических изданий и т.п. иописании каждой зоны отдельным законом распределения из парадигмыклассической статистики1.Основоположник идеи о зональности гиперболических распределенийГустав Хердан продемонстрировал целесообразность разбиения распределения натри зоны: высокочастотных, среднечастотных и низкочастотных слов.
По егоданным, почти все слова с высокой частотой употребления относились кслужебной, семантически стертой лексике (это подтверждается на самомразнообразномматериале,нобываютисключения),былиравномернораспределены в тексте и их относительная частота менялась незначительно вразныхтекстах.Этузонуонпредложилописыватьбиномиальнымраспределением, зону низких частот – законом Пуассона, а зону средних частот –сложным законом Пуассона. Но, объявив о наличии трех законов, управляющихраспределением лингвистических единиц, он обращается к распределениюУэринга в качестве модели общей формы распределения.
Теоретические частоты,подсчитанные Г.Херданом для «Капитанской дочки» Пушкина, почти идеальносовпадают с эмпирическими для высокочастотной и низкочастотной лексики, дляобласти же средних частот совпадение намного хуже2. Ю.А.Тулдавой былопоказано при сравнительном анализе модели Ципфа и модели Уэринга-Херданахорошее качество аппроксимации эмпирического материала обеими моделями3.Именноваппроксимируютсятехслучаях,болеечемкогдаоднойэмпирическиемоделью,вновьданныехорошоактуализируетсяметодологическая проблематика.1Там же. С.66.Herdan G.