Главная » Просмотр файлов » Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014)

Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448), страница 68

Файл №1185448 Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf) 68 страницаАвт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448) страница 682020-08-25СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 68)

в локальномпределе». Еще одним важным условием является самоаффинность функции. Невдаваясь в подробности, заметим, что для информационных потоков это свойствоинтерпретируется как самоподобие, возникающее в результате процессов ихформирования. Можно отметить, что указанными свойствами обладают не всеинформационные потоки, а лишь те, которые характеризуются достаточноймощностью и итеративностью при формировании. При этом временные ряды,построенные на основании мощных тематических информационных потоков, вполнеудовлетворяют этому условию. Поэтому при расчете показателя Херста фактическиопределяется и такой показатель тематического информационного потока какфрактальная размерность.Известно, что показатель Херста представляет собой меру персистентности склонности процесса к трендам (в отличие от обычного броуновского движения).Значение H > ½ означает, что направленная в определенную сторону динамикапроцесса в прошлом, вероятнее всего, повлечет продолжение движения в том женаправлении.

Если H < ½, то прогнозируется, что процесс изменит направленность. H= ½ означает неопределенность — броуновское движение.247Для изучения фрактальных характеристик тематических информационныхпотоков за определенный период для временных рядов,,составленных из количества относящихся к ним сообщений, изучалось значениепоказателя Херста, которое определялось из соотношения:.Здесь – стандартное отклонение:а- так называемый размах:гдеИсследования фрактальных свойств рядов измерений, получаемых в результатемониторинга тематических информационных массивов из Интернет, свидетельствуюто том, что при увеличениипоказательпринимает значения 0.65 ÷ 0.75.

Ввидутого, что значениенамного превышает ½, в этом ряду обнаруживаетсяперсистентность (существование долговременных корреляций, которые могут бытьсвязаны с проявлением детерминированного хаоса). Если предположить, что рядявляется локально самоаффинным (этот вопрос в настоящее время открыт), тоон имеет фрактальную размерность , равнуюD = 2 – H ≈ 1.35 ÷ 1.25.То есть, исследования тематических информационных потоков подтверждаютпредположение о самоподобии и итеративности процессов в веб-пространстве.Републикации, цитирование, прямые ссылки и т.п. порождают самоподобие,проявляющееся в устойчивых статистических распределениях и известныхэмпирических законах.В результате экспериментов было подтверждено наличие высокого уровнястатистической корреляции в информационных потоках на продолжительныхвременных интервалах. На основе рассмотренного примера показана высокаяперсистентность процесса, что, в частности, свидетельствует об общей тенденцииувеличения публикации по выбранной тематике.Анализ самоподобия информационных массивов может рассматриваться кактехнология для осуществления прогнозирования.Вейвлет-анализОсновойвейвлет-анализа[28, 29]являютсявейвлет-преобразование,представляющего собой особый тип линейного преобразования, базисные функциикоторого (вейвлеты) имеют специфические свойства.Вейвлетом (малой волной) называется некоторая функция, сосредоточенная внебольшой окрестности некоторой точки и резко убывающая к нулю по мереудаления от нее как во временной, так и в частотной области.

Существуют248разнообразные вейвлеты, имеющие разные свойства. Вместе с тем, все вейвлетыимеют вид коротких волновых пакетов с нулевым интегральным значением,локализованных на временной оси, являющихся инвариантными к сдвигу имасштабированию.К любому вейвлету можно применить две операции:- сдвиг, т.е. перемещение области его локализации во времени;- масштабирование (растяжение или сжатие).Главная идея вейвлет-преобразования заключается в том, что нестационарныйвременной ряд разделяется на отдельные промежутки (так называемые «окнанаблюдения»), и на каждом из них выполняется вычисление скалярного произведения(величины, которая характеризует степень близости двух закономерностей)исследуемых данных с разными сдвигами некоторого вейвлета на разных масштабах.Вейвлет-преобразование генерирует набор коэффициентов, с помощью которыхпредставляется исходный ряд. Они являются функциями двух переменных: времени ичастоты, и потому образуют поверхность в трехмерном пространстве.

Этикоэффициенты, показывают насколько поведение процесса в данной точкеаналогично вейвлету на данном масштабе. Чем ближе вид анализируемойзависимости в окрестности данной точки к виду вейвлета, тем большую абсолютнуювеличину имеет соответствующий коэффициент. Отрицательные коэффициентыпоказывают, что зависимость похожа на «зеркальное отражение» вейвлета.Использование этих операций, с учетом свойства локальности вейвлета в частотновременной области, позволяет анализировать данные на разных масштабах и точноопределять места их характерных особенностей во времени.Технология использования вейвлетов позволяет обнаруживать единичные инерегулярные «всплески», резкие изменения значений количественных показателей вразные периоды времени, в частности, объемов тематических публикаций в вебпространстве.

При этом могут обнаружиться моменты возникновения циклов, а такжемоменты, когда за периодами регулярной динамики следуют хаотические колебания.Рассматриваемый временной ряд может аппроксимироваться кривой, которая, всвою очередь, может быть представленная в виде суммы гармонических колебанийразной частоты и амплитуды. При этом колебания, которые имеют низкую частоту,отвечают за медленные, плавные, крупномасштабные изменения значений исходногоряда, а высокочастотные – за короткие, мелкомасштабные изменения. Чем сильнееизменяется описываемая данной закономерностью величина при данном масштабе,тем большую амплитуду имеют составляющая соответствующей частоты.

Такимобразом, исследуемый временной ряд можно рассматривать в частотно-временнойобласти – т.е. об исследовании закономерности, описывающей процесс в зависимостикак от времени, так и от частоты.Непрерывное вейвлет-преобразование для функции f (t ) строится с помощьюнепрерывных масштабных преобразований и переносов выбранного вейвлета ψ (t ) спроизвольными значениями масштабного коэффициента a и параметра сдвига b :W ( a, b ) = ( f (t ),ψ (t ) ) =1a∞∫ f ( t )ψ−∞*t −b dt . a Полученные коэффициенты представляются в графическом виде как картакоэффициентов преобразования, или скейлограмма.

На скейлограмме по одной осиоткладываются сдвиг вейвлета (ось времени), а по другой – масштабы (осьмасштабов), после чего точки схемы, которая получается, раскрашиваются в249зависимости от величины соответствующих коэффициентов(чем большекоэффициент, тем ярче цвета изображения). На скейлограмме видные всехарактерные особенности исходного ряда: масштаб и интенсивность периодическихизменений, направление и величина трендов, наличие, расположение ипродолжительность локальных особенностей.Например, известно, что комбинация нескольких разных колебаний может иметьнастолько сложную форму, которая не позволяет аналитику выявить их.Периодические изменения, которые происходят для значений коэффициентоввейвлет-преобразования на некотором непрерывном множестве частот выглядят какцепочка «холмов», имеющие вершины, расположенные в точках (по оси времени), вкоторых эти изменения достигают наибольших значений.Другим важным показателем является выраженная тенденция динамикивременного ряда (тренд) вне зависимости от периодических колебаний.

Наличиетренда может быть неочевидным при простом рассмотрении временного ряда,например, если тренд объединяется с периодическими колебаниями. Трендотражается на скейлограмме как плавное изменение яркости вдоль оси времениодновременно на всех масштабах. Если тренд возрастающий, то яркость будетувеличиваться, если убывающий – уменьшаться.Еще одним важным фактором, которому необходимо учитывать при анализевременных рядов, являются локальные особенности, т.е. возможные резкие,скачкообразные изменения характеристик исходного ряда. Локальные особенностипредставленные на скейлограмме вейвлет-преобразования как линии резкогоперепада яркости, которые исходят из точки, соответствуют времени возникновенияскачка.

Локальные особенности могут иметь как случайный, так и систематическийхарактер, при этом "маскировать" периодические зависимости или краткосрочныйтренд. Анализ локальных особенностей позволяет восстановить информацию одинамике исходного процесса и в некоторых случаях прогнозировать подобныеситуации.На рис. 6.11 приведенная скейлограмма – результат непрерывного вейвлетанализа (вейвлет Гаусса) временного ряда, соответствующего рассматриваемомувыше процессу.Приведенный пример показывает, что вейвлет-анализ позволяет обнаруживатьне только очевидные аномалии в исследуемом ряде, но и критические значения,которые скрыты за относительно небольшими абсолютными значениями элементовряда.

Например, на скелетоне наибольшие значения отмечены не только в 250-йдень, но показаны и неявные экстремумы ( 25-й и 75-й дни).250Рис. Часть VI.11. Результат вейвлет-анализа (непрерывное вейвлетпреобразование): сверху – вейвлет-скейлограмма; снизу – линии локальныхмаксимумов (скелетон)Безусловно, финансово-экономические факторы имеют непосредственное влияниена общественные процессы. На рис. 6.11 приведена динамика изменения курсапродажи наличного доллара США в банках Украины в течение 2008 года.251Глава 3.Сложные информационные сетиИнформационные системы могут быть представлены как сетевые структуры, такназываемые динамические сети [30, 31]. Текущее состояние информационнойсистемы может быть представлено в виде графа < M , L > , где M – это множествокомпонент (например, документов) информационной системы, а L – множестворебер, например, связей подобия, цитирования, ссылок и т.д.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6361
Авторов
на СтудИзбе
310
Средний доход
с одного платного файла
Обучение Подробнее