Диссертация (1148605), страница 3
Текст из файла (страница 3)
Ципфа, подобные исследованияпродолжаются по настоящее время, а их результатом является формированиепредставления о резкой неравночисленности единиц разных уровней в тексте,накопление всё более точных количественных характеристик этих распределенийдля тех или иных лингвистических объектов (современных и древних текстов,технической документации и художественной литературы, спонтанной устнойречи и поэтических текстов с жесткой структурой, такой как у сонетов и канцоны,и т.д.).Во-вторых, это широкий круг практических разработок, основанных наизучении статистики лексических единиц.
Прежде всего, это частотные словариразных национальных языков, профессиональных и социальных диалектов,идиолектов отдельных авторов1 и т.д. Такие словари являются основой для1Засорина Л.Н. Частотный словарь русского языка : Около 40000 слов. М.: Рус. яз., 1977. 935, [1] с. ;Ляшевская О.Н., Шаров С.А.
Частотный словарь современного русского языка (на материалах Национальногокорпуса русского языка). М., 2009. 1087, [1] с. ; Kučera Н., Francis W., Computational analysis of present-dayAmerican English, Providence, 1967. XXVI, 424 p. ; Частотный словарь рассказов И.А. Бунина / С.-Петерб. гос. ун-т;[авт.-сост.: А.О. Гребенников науч. ред.: Г.Я. Мартыненко]. СПб, 2011. 294, [1] с. ; Частотный словарь рассказовА.П. Чехова /С.-Петерб.
гос. ун-т; [Авт.-сост. А. О. Гребенников]; Под ред. Г. Я. Мартыненко. - СПб., 1999. 171,[1] с. ; Шайкевич А.Я., Андрющенко В.М., Ребецкая Н.А. Статистический словарь языка Достоевского. М., 2003.XLVIII, 832 с. ; Urai Y., Ando A., Renansky A. A Lemmatized Concordance To The Idiot Of F.M.Dostoevsky. Vol. 1-4.Sapporo: Hokkaido University, 2003.
XXXII, 1911 p., 505 p. Частотный словарь романа Л.Н. Толстого «Война и мир»/[Сост. З.Н. Великодворская, Г.С. Галкина, Г.Б. Куперман, В.М. Цапникова]. Тула, 1978. 380 с. Творогов О.В.Лексический состав «Повести временных лет» : (Словоуказатели и частот. словник).
Киев, 1984. 218 с. ;Алексеев П.М. Частотный словарь Ветхого Завета // Структурная и прикладная лингвистика. Выпуск 6. СПб., 2004.С. 223―237.7решения широкого круга прикладных задач – лингводидактики (учебныечастотные словари)1, стилеметрии2, атрибуции анонимных и псевдонимныхтекстов3, в том числе, для целей осуществления судебно-криминалистическихэкспертиз и т.д.В-третьих, это теория лингвостатистических распределений, котораяформируется на стыке теории вероятности и математической статистики,лингвистики и лингвостатистики, психолингвистики и эстетики и т.д.
Несмотряна примерно восьмидесятилетнее развитие этой области, она полна дискуссий ипротиворечий,представляясобойполежесткойборьбыпороюрезкоразличающихся точек зрения4.Однойизсамыхострыхпроблемтеориилингвостатистическихраспределений является вопрос об их гауссовости или негауссовости5. При этомнадо отметить, что в большинстве случаев этот вопрос обсуждается с обращениемк выборкам языкового материала большего или меньшего объема (при том, чтосовременныеоперироватьпринципысиобъемомпрактикакорпуснойматериала,лингвистикиизмеряемымпозволяетмиллионамисловоупотреблений6), и вопрос в большой мере сводится к обсуждениюрепрезентативности тех или иных выборок этого материала.1Алексеев П.М.
Серийные учебные частотные словари // Структурная и прикладная лингвистика: Межвузовскийсб. / Под ред. А.С.Герда. Вып.5. СПб., 1998. С.140―151 ; Зубов А.В. Учебные частотные словари в системекомпьютерною обучения. Статистическая лексикография и учебный процесс. // Сб. науч. тр. Отв. Ред.В.И.Перебейнос. Киев, 1990. С.18―26.2Мартыненко Г.Я.
Основы стилеметрии. Л., 1988. 173, [1] с.3Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами распознаванияобразов. Л., 1990. 164 с.4Арапов М.В., Шрейдер Ю.А. Закон Ципфа и принцип диссимметрии системы // Семиотика и информатика. 1978.Вып. 10. С.74―95 ; Бычков В. Н. Построение, обоснование и интерпретация базисных лингвостатистическихмоделей : (На материале отраслевых частотных словарей) : автореф. дисс. ... канд. филол. наук. Л., 1986. 16 с. ;Пиотровский Р.Г., Бектаев К.Б., Пиотровская А.А. Математическая лингвистика.
М., 1977. 382 с. ; Herdan G.Quantitative Linguistics. Berlin, Heidelberg, London. 1964. 284 р.5Мартыненко Г.Я. Некоторые закономерности концентрации и рассеяния элементов в лингвистических и другихсложных системах // Структурная и прикладная лингвистика. 1978.
Вып.1. С.63―79 ; Его же. Основы стилеметрии.Л., 1988. 173, [1] с. ; Его же. Введение в теорию числовой гармонии текста. СПб., 2009. 252 с. ; Чебанов С.В.Концепции ранговых распределений: консенсусный анализ // Ценологические исследования. 2012. Вып.46.С.72―85. Popescu I.-I., Mačutek J., Altmann G. Aspects of word frequencies.
Studies in Quantitative Linguistics. Vol.3.2009.6Корпус как язык: от масштабируемости к дифференциальной полноте / В.И.Беликов, Н.Ю.Копылов, А.Пиперскии др. // Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной международнойконференции Диалог-2013. Т.1. из Вып. 12 (19). М., 2013. С. 84―95.8Вместе с тем, как на это обращал внимание еще Ципф1, а позднее отмечалидругиеисследователи2(Налимов,1979,Арапов,Шрейдер,1978)лингвостатистические распределения дают представление не о статистикеотдельных репертуарных единиц (морфем, лексем, словаря) в языке, но об ихстатистике в тексте.
В таком случае, лингвостатистические распределенияоказываются инструментом изучения не языка, а речи, текста. Тем не менее,изучение статистики текста остается до сих пор делом новаторским, не вполнеконцептуально проясненным, хотя и пересекается с работами по интенсивноразвивающейся ныне лингвистике текста.Однако, если говорить о лингвостатистике текста, то ситуация как стеоретической, так и с практической точки зрения не является абсолютно ясной.Дело в том, что при всем разнообразии3 текстов, наиболее изучаемымиявляются авторские художественные тексты нового и новейшего времени,тиражируемыеспомощьютрадиционнойгутенберговскойполиграфии,обеспечивающей идентичность разных отпечатков одного тиража.Ситуация же с устными и рукописными текстами, произведениямисамиздата,современнойгородской(авторской)песней,текстами,циркулирующими в интернете, и т.д.
оказывается совсем иной. Для таких текстовне существует эталонного, окончательного, подлинного авторского варианта,который и должен быть предметом исследования с позиций лингвистики текста.Прецедентырассмотрениятакихтекстовбылииранее4.Однако,целенаправленно концентрируясь на изучении таких текстов, Ю.В.Доманскийобосновывает представление о том, что они должны рассматриваться в качествеособого класса текстов – вариативных текстов, трактуемых им следующимобразом «категория варианта … важна уже потому, что в неклассической1Zipf G. K.
Human behavior and the principle of least effort. An introduction to human ecology. Addison-Wesley,Cambridge, 1949. 574 р. ; Zipf G. K. The psycho-biology of language. Boston, 1935. 336 р.2Налимов В.В. Вероятностная модель языка : о соотношении естеств. и искусств. языков М., 1979. 304 с. ; АраповМ.В., Шрейдер Ю.А. Закон Ципфа и принцип диссимметрии системы // Семиотика и информатика.
1978. Вып. 10.С.74―95.3Филиппов К.А. Лингвистика текста : Курс лекций. СПб, 2003, 333,[1] с.4Лихачев Д. С. Текстология. На материале русской литературы X-XVII в. / Д. С. Лихачев при участииА. А. Алексеева и А. Г. Боброва. М., 2001. 758 с. ; Корона В.В. Поэзия Анны Ахматовой: поэтика автовариаций.Екатеринбург, 1999. 263, [1] с. ; Пропп В. Я. Морфология волшебной сказки. М., 2003. 143, [1] с.9художественности произведение не реализуется только в каком-то одномварианте, а представляет из себя совокупность текстуальных (в широком смысле)манифестаций, каждая из которых обладает относительно самостоятельнымисмыслами.Этосближаетсловесностьпарадигмынеклассическойхудожественности с фольклором и древней литературой»1. Такими текстамиявляются и сказки (см.
на эту тему работы В.Я.Проппа), рукописные текстыСредневековья,многиетекстызамкнутыхпрофессиональныхиполупрофессиональных сообществ и т.д.По отношению к таким текстам возникает новый круг задач из областилингвистикитекста,которыелишьотчастипересекаютсясзадачами,рассматриваемыми в текстологии, – как в авторско-гутенберговской, так и всредневековой2. Очевидно, что описание особенностей вариативных текстов –серьезная самостоятельная задача, решение которой предполагает формированиеобширной самостоятельной исследовательской программы.В контексте же лингвостатистических исследований может быть поставленвопрос об особенностях лингвостатистических распределений вариативныхтекстов.
Этот вопрос тем более интересен, что не было не только каких-топопыток его изучения на конкретном материале, но он даже не ставился в такойформе. Предлагаемая же постановка вопроса позволяет по-новому обсуждать всюлингвостатистическую проблематику.В связи с этим важно иметь в виду то, что к настоящему времени сложилосьнесколько методологически различных подходов к описанию статистическойструктуры текстов и других поликомпонентных объектов – внутренних систем потерминологии Ю.А.Шрейдера3.Начало таким исследованиям заложили работы В.Парето, Дж.Юла,Дж.Виллиса, Дж.Ципфа, Б.Мандельброта (конца XIX – первой половины XX вв.),1Доманский Ю.В.
Вариативность и интерпретация текста (парадигма неклассической художественности): автореф.дис. … д.филол.н. М., 2006, 43 с.2Лихачев Д.С. Текстология. На материале русской литературы X-XVII в. / Д. С. Лихачев при участииА.А.Алексеева и А.Г.Боброва. М., 2001. 758 с.3Шрейдер Ю.А. Теория множеств и теория систем // Системные исследования: Ежегодник, 1977. М., 1978. С. 149 –165.10обнаружившихнеравномерностьсходныйтипчисленностираспределения,объектов.репрезентирующийНесмотрянарезкуюнеадекватностьаппроксимации для отдельных участков кривой эмпирического распределения,наиболее известным оказалось ранговое распределение Ципфа (гипербола, или,как оно называется в лидирующей сейчас отечественной школе Б.И.Кудрина, – Нраспределение).В практике описания подобных ранговых и спектровых распределенийприменяется множество аппроксимирующих функций, каждая из которых можетбыть оспорена.