Главная » Просмотр файлов » Диссертация

Диссертация (1148605), страница 25

Файл №1148605 Диссертация (Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)) 25 страницаДиссертация (1148605) страница 252019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 25)

«Таким образом, есть основания говорить о разных “важностях” –важности субстратной, структурной, функциональной, стоимостной и т.д.»5.Т.Г.Петровым исследуется субстратная важность, мерой которой и будет частотавстречаемости1составляющихввыбраннойсистеме(ср.введенныйПетров Т.Г., Фарафонова О.И. Информационно-компонентный анализ. Метод RHA: Учебное пособие. СПб., 2005.С.42.2Юдович Я.Э., Козырева И.В., Кетрис М.П. Геохимия редких щелочей и редких тиофилов в черных сланцах.Сыктывкар, 1993. 74 с.3Петров Т.Г.

Устное сообщение С.В.Чебанову, сентябрь 2013 г.4В подходе Т.Г.Петрова под стандартизацией длины ранговой формулы подразумевается усечение ранговыхформул составов до одинакового количества компонентов, что необходимо для корректного сопоставлениярезультатов.5Чебанов С.В., Петров Т.Г. Язык-метод RHA для описания составов многокомпонентных объектов и процессов иих изменения // Ценологические исследования. 2005. Вып. 28.118Г.Я.Мартыненкоаналогичныйтермин«значимость»,«распределениепозначимости»).Представление исходных данных в системе RHA следующее:1.

Символы составляющих (названия химических элементов, словоформы,уровень дохода и т.п.), выписываются в ранговой формуле в строку подряд всоответствии с их рангом (напомним, что компоненту с максимальнойотносительной частотой присваивается минимальный ранг). При равенствесодержаний составляющих упорядочение соответствующих символов в ранговойформуле производится либо после уточнения корректности эмпирическихданных, либо в соответствии с каким-то жестко зафиксированным порядкомсимволов в последовательности, которую можно считать алфавитом дляиспользуемой системы символов.2. В случае различной длины ранговой формулы в группе производится ихстандартизация посредством ее усечения до постоянной длины (см. рисунок 7, накотором ранговые формулы упорядочены по интенсиональному алфавиту1 –порядку символов в таблице Менделеева).3.

Для каждого анализа вычисляются значения энтропии и анэнтропии(данные, полученные по частотным словарям «Сказания» см. в п. 3.3.4).Кроме упорядочивания химических составов, существует широкая областьиспользования системы RHA в качестве средства изучения процессов изменениясоставоввсевозможныхсистемиихсодержательноинтерпретируемогосопоставления2.

Процесс мыслится автором подхода, как некоторое направленноеизменение компонентного состава, слагающееся из смешения и разделениякомпонентов, приводящее к появлению новых объектов и имеющее начальную иконечную точки. При этом важно, что наличие / отсутствие процесса и его ходопределяются Т.Г.Петровым визуально по диаграммам НА, а не статистически.1Об интенсиональных алфавитах см.

статью: Чебанов С.В., Петров Т.Г. Интенсиональность, интенсиональныеалфавиты, интенсиональные слова и словари // Актуальные проблемы современной когнитивной науки.Материалы шестой всероссийской научно-практической конференции с международным участием (17-19 октября2013 года). Иваново, 2013. С. 239―266.2Петров Т.Г., Фарафонова О.И. Информационно-компонентный анализ. Метод RHA: учебное пособие. СПб., 2005.119Этопереводитегоподход,заявленныйкакстрогоформальныйиалгоритмический, в класс подходов, использующих экспертные оценки.Рисунок 7 ― Иерархическая классификация ранговых формул химических составовсильно различающихся природных систем, упорядоченных по алфавиту – таблице Менделеева1Так, например, Т.Г.Петров указывает следующие процессуальные маркеры:1) для конкретного процесса расстояния между точками на диаграммеположительно коррелируют со степенями различий между соответствующимиисходными составами; 2) траектория не может проходить через минимумэнтропии и максимум анэнтропии без начала нового процесса2.

Следует указать,что Т.Г.Петровым не получены количественные выражения этих маркеров.Существует еще один аспект, важный при решении проблемы описаниясоставов(и,возможно,применимыйвисследованиях,связанныхсреконструкцией объектов): ранговые формулы представляют составы дискретно.Этоудобно какинвентаризационный прием,непрерывности изменениясоставов.ноэтонесоответствуетТак возникает противоречиемеждудискретностью номенклатуры горных пород (задаваемых ранговой формулой) и1Цит. по: Чебанов С.В., Петров Т.Г.

Язык-метод RHA для описания составов многокомпонентных объектов ипроцессов и их изменения // Ценологические исследования. 2004. Вып. 21. С.6―30.2Петров Т.Г. Метод RHA как решение проблемы систематизации аналитических данных о вещественном составегеологических объектов. // Отечественная геология. 2008.

№4. С.98―105.120непрерывностью процессов изменения составов, что в идеальном случае должносниматься при размещении химического состава в поле «энтропия-анэнтропия»(см. ниже). Здесь вырисовывается интересный нюанс: пусть имеется некотороесоединение, например, NaCl. В случае погрешности при проведении анализа(Cl>Na), ранговая формула будет записана как ClNa и помещена в соответствии спринятым алфавитом. То есть, несмотря на близость составов, ранговые формулыNaCl и ClNa будут разнесены в методике RHA.

В системе RHA этот случайпредусмотрен, и, если содержания компонентов отличаются менее чем на 0,15%,между составами устанавливается связь, отсылающая к месту сходного анализа1.Следующие две количественные характеристики позволяют перейти отдискретного пространства составов к непрерывному пространству содержанийкомпонентов смесей:1. H – энтропия (сложность).Использование энтропии2 как характеристики состава обосновываетсяТ.Г.Петровым следующим образом: «Составы разных систем на интуитивномуровне характеризуются и на естественном языке описываются их сложностью иее противоположностью – простотой.

“Простейшим” по составу назовем то, чтосостоит из одного компонента, очень сложным – то, что содержит многокомпонентов, находящихся в соизмеримых содержаниях. Такое пониманиепростоты и сложности побудило использовать в качестве меры сложностисоставов (в частности, геохимических систем – Петров, 1970) информационнуюэнтропию Н, введенную К. Шенноном в 1948 г.3, которая для n-первыхкомпонентов определяется по формуле:Н= – Σpi*lnpi,(4)где рi – частота i-го события»4.Энтропия максимальна, когда объект образован компонентами, имеющимиодинаковую частоту, и минимальна, когда объект состоит из одного компонента.1Петров Т.Г., Фарафонова О.И.

Информационно-компонентный анализ. Метод RHA: учебное пособие. С.40.Об использовании энтропии в лингвостатистических исследованиях см., напр., сборники «Квантитативнаялингвистика и автоматический анализ текстов», работу Ю.А.Тулдавы (Проблемы и методы квантитативносистемного исследования лексики. Таллин, 1987).3Шеннон К.Э. Работы по теории информации и кибернетике. М., 1963. 829 с.4Петров Т.Г., Фарафонова О.И. Информационно-компонентный анализ.

Метод RHA: учебное пособие. С.48.2121Нормированнаяк интервалу[0,1]информационнаяэнтропияЕnопределяется по формуле1Еn = H/lnn(5)Т.Г.Петров указывает, что «существуют составы, у которых содержанияведущих компонентов мало различаются, соответственно у них могут бытьодинаковые ранговые формулы и практически одинаковые энтропии. При этом жесодержания малых компонентов могут существенно различаться»2. Есть ипротивоположные ситуации, когда тождественные объекты имеют разныеранговые формулы, см. выше пример о NaCl).

При этом могут существоватьзначительные отличия в содержаниях малых3 компонентов. Таким образом,необходимо введение характеристики, «зависящей мало от содержания большихкомпонентов, но сильно зависящей от малых»4. В качестве этой характеристикиТ.Г.Петровым предложена анэнтропия.2. A – анэнтропия (чистота состава, доля примесей).Эта характеристика, введенная Т.Г.Петровым, может служить меройчистоты, в частности мерой редкости встречаемости компонентов в данномобъекте или содержаний компонентов, попавших в ранговую формулу.В простейшем варианте она определяется по формулеA = – Σ lnpi,(6)где pi – относительная частота компонента.Анэнтропия «рассчитывается по следующей формуле:A = – [(Σ lnpi)/n ] – ln(n),(7)где pi – относительная частота компонента, n – общее число компонентов ванализе»5 (словаре).Т.Г.Петров поясняет,что«этавеличинаравнасреднему частныхпроизводных энтропии по содержаниям, то есть представляет собой скоростьизменения величины Н при вариациях содержаний»1.1Там же.

С.53.Там же. С. 56.3Следует понимать, что «малые», «примесные» компоненты Т.Г.Петрова для лингвистического объекта являютсявысокочастотными компонентами (в случае длины ранговой формулы n = 10).4Там же. С.57.5Там же. С.58.2122ВеличинаАтембольше,чемменьшесодержаниякомпонентов,квалифицируемых как малые и вошедших в ранговую формулу. Для приведенияминимального значения А к нулю из среднего частных производных энтропиивычитается ln(n).На эмпирическом материале автором методики было показано наличиеобратного отношения между энтропией и анэнтропией: предельно низкаясложность соответствует предельной чистоте, и предельно высокая сложностьсоответствует предельно низкой чистоте (рисунок 8).Сходные по составу объекты образуют группы на диаграммах HA – в целом,если объекты расположены близко друг к другу в поле этих характеристик, то приинтерпретации принято считать, что между ними существует временная илигенетическая связь.Примечание ― Поле допустимых значений НА – внутренняя область контура.

A, B, C– составы. En=1, An=0 соответствует равенству содержаний десяти компонентов (En –энтропия, An – анэнтропия)2Рисунок 8 ― Поле допустимых значений НА1Там же.Цит. по: Петров Т.Г., Фарафонова О.И. Информационно-компонентный анализ. Метод RHA: учебное пособие.С.72.2123Наблюдения Т.Г.Петрова за тенденциями изменения составов разныхсистем (от неорганических до социальных) в координатах НА показывают, чтосуществуют четыре господствующих типа процессов изменения составов:1. Уменьшение сложности и одновременный рост чистоты. Такие измененияНА связаны со всевозможными процессами разделения и дифференциации.2. Рост сложности и уменьшение чистоты.

Такие изменения НАсвойственны процессам смешения.3. Одновременный рост сложности и чистоты.4. Уменьшение сложности и чистоты.Типы 3 и 4, встречаются гораздо реже и соответствуют переходнымпроцессам между процессами 1 и 2 типа1.Практическая значимость метода RHA обсуждается Т.Г.Петровым вмногочисленных публикациях2. Метод RHA применялся к лингвистическимобъектам, но непонятно, возможна ли содержательная интерпретация результатованализа. По крайней мере, существует один положительный опыт обработкимассивов текстов с помощью этой методики, где показана бо́льшая структурнаясложность текстов в дореволюционной орфографии по сравнению с текстами всовременной орфографии3.Редакции «Сказания», на наш взгляд, вполне могут рассматриваться какобъекты, порожденные в результате изменения исходной системы.

Характеристики

Список файлов диссертации

Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)
Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6487
Авторов
на СтудИзбе
303
Средний доход
с одного платного файла
Обучение Подробнее