Диссертация (1148605), страница 39
Текст из файла (страница 39)
Понятие суперкасты,определяемой В.В.Фуфаевым как участка S-распределения, где достигаетсянулевая сумма положительных и отрицательных скоростей, требует уточненияили расширения для S-распределения с большим числом компонентов из-за199наличия более 10 участков с нулевой скоростью для распределений, имеющих от500 до 1200 компонентов. Структура и состав суперкаст, определенных для Sраспределений покомплектамсписков«Сказания»,являетсяпредметомдальнейшего изучения.10.
Методика RHA Т.Г.Петрова дает грубую группировку списков, но непозволяет проводить диагностику темпоральных различий вариативного текста, алишь маркирует некоторые стилистические особенности.11. Точка h Хирша, определяемая в соответствии с методикой И.И.Попеску, Г.Альтманна и Я.Машутека, позволяет выделить значительную частьвысокочастотной служебной лексики.200ГЛАВА 4. Многомодельное представление лексико-статистическойструктуры «Сказания о Мамаевом побоище» как вариативного текстаВглаве4сопоставляютсясредствамоделированиякомпонентнойструктуры поликомпонентных объектов, в основе которых лежит1) Разделение совокупности на функциональные зоны, безотносительно к ее(совокупности) однородности / неоднородности.
Для проведения сопоставлениявыбраны следующие параметры: пойнтер-точка R Б.И.Кудрина, правая границазнакомонотонностискользящегокоэффициентавариации,применяемогоГ.Я.Мартыненко и точка h Хирша, введенная в лингвостатистику в работах И.И.Попеску и соавторов (§ 4.2);2) Представление о симметричности графика рангового распределениякомпонентов относительно биссектрисы первого квадранта, что, в частности,проявляется в близости значений частоты компонента, имеющего ранг 1, иколичества уникальных компонентов. Производится сопоставление группировкисписков «Сказания» по индексу Я/С, предложенному Г.Я.Мартыненко, сгруппировкой списков в поле НА (§ 4.3) и с группировкой по долям ноевой исаранчёвой каст (§ 4.4);3) Гипотеза о зависимости сохранности компонента в диахронии от егочастоты. Исследуется сохранность словоформ и лексем с ростом номера ранговойгруппы в пределах стабильной зоны S-распределения, что является комбинациеймоделей В.В.Фуфаева и М.В.Арапова-М.М.Херц (§ 4.5).201§ 4.1 Проблемы сопоставимости результатов, полученныхс применением разных подходовСопоставление методик в настоящей работе производится посредствомрассмотрения сходства / различия результатов, получаемых с их применением.Сопоставлениеметодикспомощьюоценкикачествааппроксимацииэмпирических данных невозможно для негауссовых распределений.
Утверждениятакого рода, однако, являются не недоработкой и не «методологическимпробелом», а условием работы с классом моделей, учитывающих негауссовостьраспределений (или, что шире, не учитывающих их гауссовость). Прирассмотрении текстов как поликомпонентных объектов исследователи имеютдело с устойчивыми распределениями неустойчивых частот, что означает, чтоколичественные соотношения классов с разной численностью (как и лексическоенаполнение каждого класса) является исключительной особенностью текста. Всилу этого при описании эмпирических распределений аппроксимирующимифункциями может происходить потеря информации. Такая ситуация характерна идлярассмотренныхкорректируетчастотныхэмпирическиесловарейданные,а«Сказания»:нивелируетуаппроксимациянихнерелевантнуюинформацию. С другой стороны, не представляется возможным методологическикорректно оценить качество аппроксимации негауссовых распределений из-занесходимости частот компонентов к предельным, устойчивым величинам.Такая трактовка частоты (как одной из характеристик значимости слова втексте) позволяет давать интерпретацию редкочастотной и даже уникальнойлексике исходя из ее функции в отдельно рассматриваемом тексте.Внастоящейработепроблемаоценкикачествааппроксимацииразрабатывается лишь неявно, но внимание уделено таким аспектам, как202интерпретируемость методик и их междисциплинарный статус (предметноспецифичность / универсальность).Ниже приведены сведения о подготовке материала и статистическойобработке ЧС «Сказания», которые дают возможность оценить достоверностьполученных результатов и дать положительное заключение по этому вопросу, атакже рассмотрены основные ошибки, возникающие при сборе и подготовкеэмпирическихпроизведеноданных,посоотнесениеклассификацииуказанныхтиповН.А.Плохинского1.ошибоксПриэтомосуществлённымисследованием.Н.А.Плохинский выделяет пять категорий ошибок:1.
Методические ошибки – результат применения неправильной методикисбора и обработки материалов.2. Ошибки точности – это пороки первичной регистрации фактов,измерениенепровереннымииспорченнымиинструментами,расчетыснедостаточной, а также с избыточной точностью.3. Ошибки внимания – описки, просчеты, перепутывание материалов,опечатки.4. Ошибки типичности – особенно опасный вид ошибок, происходящихоттого, что в выборку отбирается группа объектов, нетипичная для всейгенеральной совокупности, и по такой выборке делаются прогнозы на всюгенеральную совокупность, вследствие чего получается сильно искаженнаяхарактеристика всей массы объектов изучаемой категории.5.
Ошибки репрезентативности возникают всегда, когда требуется по частиохарактеризовать целое. Это неизбежные ошибки, вытекающие из самойсущности выборочного исследования: вся генеральная совокупность может бытьохарактеризована по одной своей части только с некоторой ошибкой, сопределенной погрешностью. Ошибки репрезентативности не могут бытьустранены при любой организации работ (за исключением перехода на сплошноеизучение).1Плохинский Н.А. Биометрия.
2-е изд. М., 1970. С.22―24.203Для исследованной выборки из 8 списков «Сказания» можно считать, чтометодические ошибки отсутствуют, ошибки точности и ошибки внимания непревышают 2-3% от объема выборки. Доля ошибок типичности неопределима,если принимать во внимание, что текстологическая история текста, как бы научнообоснована она ни была, – гипотетическое построение, основанное наисследовании выборки, состоящей из дошедших до исследователя списков. Еслиже абсолютизировать исследование Л.А.Дмитриева о текстологии «Сказания», томожно считать, что ошибки типичности отсутствуют, и все значительныеварианты текста исследованы.Для распределений, в отношении которых выполняется центральнаяпредельнаятеорема,вматематическойстатистикеразработаныметодыопределения ошибок репрезентативности, в результате применения которыхможно определить доверительные границы для значений параметров генеральнойсовокупности. Для негауссовых распределений подобных инструментов нет, иошибкирепрезентативностинемогутбытьоцененыдлянегауссовыхраспределений.
Следует вспомнить в связи с этим теорему Ю.А.Шрейдера о том,что репрезентативной выборкой для негауссовых распределений может бытьвыборка того же порядка, что и генеральная совокупность.§ 4.2 Сопоставление значений пойнтер-точки R, границ монотонностискользящего коэффициента вариации и точки hВ таблицах М.1―М.3 Приложения М содержатся данные о динамикекоэффициента вариации и его прироста для 24 эмпирических спектровыхраспределений, построенных по ЧС всех типов.Все исследователи Н-распределений в настоящее время отмечают либо«бугорок» на гиперболическом распределении, либо «всплески и провалы» награфике спектровых распределений в области средних частот.204Приведенные в приложении М таблицы в этом отношении оченьпоказательны: левая граница монотонности прироста скользящего коэффициентавариации совпадает с эмпирически установленной границей монотонногоубывания количества классов с ростом n (их численности), т.е.
с началом«выпячивания» кривой. Фрагмент таблицы М.2 Приложения М приведен втаблице 22.Пойнтер-точка R и точка В равноценны как индикаторы, посколькупойнтер-точка маркирует границу между высокочастотными значениями иостальными классами статистического ряда. Как было показано в 3.1.3 и всехрисунках приложения Ж, на графике прироста скользящего коэффициентавариации четко выделяются 3 зоны. Соотнесением позиции пойнтер-точки R ипозиции точки B (Bсгл) на видовом распределении подтвержается, что этипараметры либо совпадают, либо очень близки.Только для распределений Летописной редакции и Киприановскойредакции расхождение между пойнтер-точкой R и точкой В больше 3% по ЧСрукописных словоформ и ЧС лексем.
По данным ЧС стандартизованныхсловоформ значения точки В и пойнтер-точки R не близки для распределенияРаспространенной редакции.Полученные результаты дают основания считать сопоставляемые методыравноценными в практической деятельности. При этом очевидно, что подходыобоих авторов типологически сходны: Г.Я.Мартыненко выделяет ядерную,периферическую и переходную зоны, Б.И.Кудрин – ноеву и саранчёвую касты иособую область между ними, с тем существенным отличием, что у первого зонасостоит из нескольких элементов, у второго – ноева и саранчёвая кастыединственны (каста уникальных видов и одноэлементная каста, формируемаявидом с максимальной численностью), что вообще говоря, является условностью,т.к., скажем, каста видов, особи которых встречены дважды (трижды, четыреждыи, может быть, и десять раз на фоне частот в тысячи, десятки и сотни тысячособей), функционально тяготеет к ноевой, а с саранчёвой функционально сходныи несколько менее частотных каст.205Таблица 22 ― Совмещение значений натуральнозначного аргумента, пойнтер-точки R(полужирный шрифт), левой (курсив и подчеркивание) и правой границ знакомононностиприроста скользящего коэффициента вариации (подчеркивание) и точки h (белый шрифт начерном фоне) – по ЧС стандартизованных словоформОсновнаяf(n)n12345678910111213141516171819202122232425272831323335363738394044464751525662747982848587909311420922675826925082361166059273320161313141085895121321312162111211111111221111111111VЛетописнаяdV0,0000,3150,4550,5460,6110,6910,7360,8010,8450,8870,9250,9681,0181,0561,0891,1121,1511,1971,2241,2301,2431,2501,2741,2911,3001,3321,3431,3711,3851,4711,5001,5161,5321,5481,5821,5991,6201,6431,6661,6931,7211,7521,7911,8972,0072,0612,1152,1672,2192,2712,3252,4062,6872,9635,1150,3150,1390,0920,0650,0800,0450,0650,0450,0420,0390,0430,0500,0380,0330,0230,0390,0460,0270,0060,0130,0070,0240,0170,0090,0320,0110,0280,0150,0850,0300,0150,0160,0170,0340,0170,0210,0230,0230,0270,0270,0320,0380,1070,1100,0540,0540,0520,0520,0530,0530,0810,2810,2762,151nf(n)123456789101112131415161718192021222324252629303132333738394041435055646568747781858797991231391411966872380479178112714325252691310688532924313122123111121111112211211111111VРед.