Главная » Просмотр файлов » Диссертация

Диссертация (1148605), страница 16

Файл №1148605 Диссертация (Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)) 16 страницаДиссертация (1148605) страница 162019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 16)

Эмпирическиераспределенияэтоготипахорошосоотносятсясмеханическимиимолекулярными процессами. В другом случае, нельзя указать детерминирующийпроцесс,т.к.неопределенопространствоэлементарныхсобытий(неинтерпретируемость среднего значения признака, феномен распределений с«длинными хвостами», мутации, количество слов в языке, генерирование мыслейчеловеком; последний пример принадлежит Ю.А.Шрейдеру4 – Л.К.), но интереспредставляют количественные соотношения разных значений признака. Этот тип1Кудрин Б.И. Онтология и гносеология ценозов и их структурная устойчивость // Ценологические исследования.Вып. 1-2. Математическое описание ценозов и закономерности технетики.

Философия и становление технетики.С. 9.2Юл Дж., Кендэл М. Теория статистики. С. 120―121.3Там же. С. 124.4В соответствии с устным сообщением Ю.А.Шрейдера С.В.Чебанову во 2-ой половине 1970-х гг.74процессов описывается гиперболическими распределениями и может быть увязанс наличием сознания либо целостностью.В 1935 г. Дж.Ципфом1 была предложена формула2 f x r = const для описаниячастоты встречаемости лексем в словаре, ранжированном по убыванию частот,где r – ранг единицы словаря, f – эмпирическая частота употребления этойединицы (слово с минимальным рангом имеет максимальную частоту, в случае,если несколько слов встречаются с одинаковой частотой, им присваиваютсяразные ранги). Для компактности представления график распределения Ципфавоспроизводятвбилогарифмическихкоординатах,графикэталонногораспределения в этом случае представляет собой прямую с наклоном 45° к осиабсцисс.

Однако, уже Ципфу были видны недостатки этой формулы, посколькуона, по определению, не могла описывать корректно3 распределение элементов смалой частотой4 (см. ниже критику закона Ципфа Г.Херданом).Ципф объясняет появление распределений, удовлетворяющих такойзависимости, принципом наименьшего усилия. Он рассматривает естественныйязык как дискретную последовательность слов, ассоциированных со значениями,5и предполагает наличие баланса между тенденцией к увеличению разнообразиясловаря и тенденцией к его унификации. C точки зрения говорящего, самыйэкономный словарь языка – словарь, состоящий из одного слова (одномногозначное соответствие между планом выражения и планом содержания), но с1Zipf G.K.

The psycho-biology of language. Boston, 1935. 336 р.Ранее такая же закономерность была замечена Ж.Эсту в 1916 г. (цит. по: Manning C., Schütze H. Foundations ofStatistical Natural Language Processing. Cambridge, 1999. P.24). Строго говоря, для установления первенства в этойчереде исследователей, обнаруживших асимметричное распределение, потребуется основательнаяисториографическая работа. В публикациях устойчиво встречается термин «закон Ципфа».3“Usually, one models the rank-frequency phenomenon using a discrete probability distribution. Zipf himself did not do it,he simply found the relationship, but was criticized for this reason, other researchers did it and were criticized too, becauserank is no random variable but a position in a sequence. This is probably the source of the myth of tautology of Zipf’s law.However, an ordered set is no myth and if the ordering can be expressed formally, there is neither an empirical nor atheoretical reason not to do it” (Цит.

по: Popescu I.-I., Mačutek J., Altmann G. Aspects of word frequencies. Studies inQuantitative Linguistics. Vol.3. 2009. P.22). Присваивание слову ранга в соответствии с его частотой следует,вероятно, считать единственно возможным способом, позволяющим количественно работать с качественнымипризнаками.4«…the data confirm our equation < r x f = C > merely down to where the “steps” begin» (Zipf G.K. Human behavior andthe principle of least effort. An introduction to human ecology.

P.26).5«Human speech is traditionally viewed as a succession of words to which “meanings” (or “usages”) are attached… Wemight profitably combine it with our previous view of speech as a set of tools, and state: words are tools that are used toconvey meanings in order to achieve objectives”. There exists also the possibility of an internal economy of speech» (Ibid.P.20).275точки зрения слушающего, такой словарь – вершина трудоемкости, т.к.слушающий сталкивается с необходимостью установления значения одной измногих ситуаций, обозначаемых этим единственным словом; для слушающего жеоптимальным вариантом будет одно-однозначное соответствие между словами иих значениями1.

По мнению Ципфа, в такой ситуации включается механизмуравновешиваниядвухописанныхвышетенденций,количественныехарактеристики которого отражаются в гиперболическом распределении (втерминологии Ципфа – Principle of Least Effort). Стремление к унификации впредельном случае выражается в наличии в словаре одного слова с максимальнойчастотой употребления, а стремление к разнообразию должно в предельномслучаеприводитьксловарю,состоящемуизединиц,употребленныхисключительно по одному разу2.По-видимому, формулируя свой принцип наименьшего усилия (“Principle ofLeast Effort”) Ципф опирался на понятие принципа наименьшего действия(“Principle of Least Action”) П.Мопертюи. В англоязычной литературе этитермины часто смешиваются, например: «Аналогии физического понятия“принцип наименьшего действия” в гуманитарных науках многочисленны:“принципнаименьшегосопротивления”,принципнаименьшегоусилия”»(«Analogies with the physical principle of least action in the human sciences arenumerous: least pain, least effort» – перевод Л.К.)3.

Интересно, что А.А.Поликарпови В.В.Поддубный различают два эти «принципа», как «динамический» (“Principleof Least Action”) и «вероятностно-информационный» (“Principle of Least Effort”)4.Трактовку принципа наименьшего усилия Ципфа интересно сопоставить спринципом экономии А.Мартине. «Французский ученый подчеркивает, что языкпостоянно подвергается действию двоякого рода сил: с одной стороны, язык1«a speaker’s economy in possessing a vocabulary of one word which will refer to all m distinctive meanings; and therewill also be an opposite auditor’s economy in possessing a vocabulary of m different words with one distinctive meaningfor each word» (Ibid.

P.21).2«… Force of unification will act in the direction of decreasing the number of different words to 1, while increasing thefrequency of that one word to 100%. Conversely, the force of Diversification will act in the opposite direction of increasingthe number of different words, while decreasing their average frequency of occurrence towards 1. Therefore number andfrequency will be the parameters of vocabulary balance» (Ibid.

P.22―23).3Garrouste P., Iōannidēs S. Evolution and Path Dependence in Economic Ideas: Past and Present. Mass., 2001. P.184.4Поддубный В.В., Поликарпов А.А. Диссипативная стохастическая динамическая модель развития языковыхзнаков // Компьютерные исследования и моделирование. 2011.

Т.3. №2. С.105.76изменяется, так как потребности людей в выражении различных мыслей и чувстввсе время увеличиваются и осложняются, а с другой – язык не изменяется, так каксказывается инерция этих же людей, приводящая к общему ограничениюлингвистических средств выражения. “Языковое поведение” регулируется, такимобразом, принципом наименьшего усилия или принципом экономии. Поясняясвой тезис, Мартине пишет: Термин экономия включает все: и ликвидациюбесполезныхразличий,существующегоиположения.появлениеновыхЛингвистическаяразличий,экономияи–сохранениеэтосинтездействующих сил»1.Так сложилось, что закон Ципфа оказался очень популярен в разныхдисциплинах, вероятно, из-за простоты аналитического выражения и наглядностирезультата.

Предпринималось немало исследований для уточнения значенияпараметра в формуле Ципфа F = C-γ и введения поправок к нему (см. напр.поправку Мандельброта (введение дополнительной константы В для исправленияэффекта рангового искажения2). Формула Ципфа в вариации Б.Мандельбротаимеет следующий вид: x(r) = A/(r+B)γ, x(r) – частота, A – константа, в некоторыхслучаях задается значением максимальной частоты, r – ранг, B – поправочныйкоэффициент, γ – параметр распределения Ципфа. Последнему параметрупосвящено большое количество исследований, и это предмет отдельногообсуждения3.Отдельно и плодотворно в зарубежной лингвостатистике развивалиськонцепции, противоположные ципфовской.

Г.Хердан предпочитал пользоватьсяклассической статистикой для аппроксимации лексического материала, привлекаядля обоснования гиперболической зависимости идеи из статистической физики4.Сам Г.Хердан настаивал на том, что в распределении слов по числу их1Цит. по: Будагов Р.А. Определяет ли принцип экономии развитие и функционирование языка? // Вопросыязыкознания. 1972. №1. С.192.2Цит. по: Тулдава Ю.А. Частотная структура текста и закон Ципфа // Учен.

зап. Тартус. ун-та. Тарту, 1985. Вып.711. С.98.3Фрумкина Р.М. Статистические методы изучения лексики. М.: Наука, 1964. 113, [3] с. ; Алексеев П.М. Методикаквантитативной типологии текста. Л., 1983. 74, [2] с. ; Его же. О ранговых распределениях в квантитативнойтипологии текста // Квантитативная лингвистика и автоматический анализ текстов. 1987. С.3―14 ; Его же.Квантитативная типология текста. Л., 1988. 76 с.4Herdan G.

Характеристики

Список файлов диссертации

Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)
Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6549
Авторов
на СтудИзбе
300
Средний доход
с одного платного файла
Обучение Подробнее