Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448), страница 68
Текст из файла (страница 68)
в локальномпределе». Еще одним важным условием является самоаффинность функции. Невдаваясь в подробности, заметим, что для информационных потоков это свойствоинтерпретируется как самоподобие, возникающее в результате процессов ихформирования. Можно отметить, что указанными свойствами обладают не всеинформационные потоки, а лишь те, которые характеризуются достаточноймощностью и итеративностью при формировании. При этом временные ряды,построенные на основании мощных тематических информационных потоков, вполнеудовлетворяют этому условию. Поэтому при расчете показателя Херста фактическиопределяется и такой показатель тематического информационного потока какфрактальная размерность.Известно, что показатель Херста представляет собой меру персистентности склонности процесса к трендам (в отличие от обычного броуновского движения).Значение H > ½ означает, что направленная в определенную сторону динамикапроцесса в прошлом, вероятнее всего, повлечет продолжение движения в том женаправлении.
Если H < ½, то прогнозируется, что процесс изменит направленность. H= ½ означает неопределенность — броуновское движение.247Для изучения фрактальных характеристик тематических информационныхпотоков за определенный период для временных рядов,,составленных из количества относящихся к ним сообщений, изучалось значениепоказателя Херста, которое определялось из соотношения:.Здесь – стандартное отклонение:а- так называемый размах:гдеИсследования фрактальных свойств рядов измерений, получаемых в результатемониторинга тематических информационных массивов из Интернет, свидетельствуюто том, что при увеличениипоказательпринимает значения 0.65 ÷ 0.75.
Ввидутого, что значениенамного превышает ½, в этом ряду обнаруживаетсяперсистентность (существование долговременных корреляций, которые могут бытьсвязаны с проявлением детерминированного хаоса). Если предположить, что рядявляется локально самоаффинным (этот вопрос в настоящее время открыт), тоон имеет фрактальную размерность , равнуюD = 2 – H ≈ 1.35 ÷ 1.25.То есть, исследования тематических информационных потоков подтверждаютпредположение о самоподобии и итеративности процессов в веб-пространстве.Републикации, цитирование, прямые ссылки и т.п. порождают самоподобие,проявляющееся в устойчивых статистических распределениях и известныхэмпирических законах.В результате экспериментов было подтверждено наличие высокого уровнястатистической корреляции в информационных потоках на продолжительныхвременных интервалах. На основе рассмотренного примера показана высокаяперсистентность процесса, что, в частности, свидетельствует об общей тенденцииувеличения публикации по выбранной тематике.Анализ самоподобия информационных массивов может рассматриваться кактехнология для осуществления прогнозирования.Вейвлет-анализОсновойвейвлет-анализа[28, 29]являютсявейвлет-преобразование,представляющего собой особый тип линейного преобразования, базисные функциикоторого (вейвлеты) имеют специфические свойства.Вейвлетом (малой волной) называется некоторая функция, сосредоточенная внебольшой окрестности некоторой точки и резко убывающая к нулю по мереудаления от нее как во временной, так и в частотной области.
Существуют248разнообразные вейвлеты, имеющие разные свойства. Вместе с тем, все вейвлетыимеют вид коротких волновых пакетов с нулевым интегральным значением,локализованных на временной оси, являющихся инвариантными к сдвигу имасштабированию.К любому вейвлету можно применить две операции:- сдвиг, т.е. перемещение области его локализации во времени;- масштабирование (растяжение или сжатие).Главная идея вейвлет-преобразования заключается в том, что нестационарныйвременной ряд разделяется на отдельные промежутки (так называемые «окнанаблюдения»), и на каждом из них выполняется вычисление скалярного произведения(величины, которая характеризует степень близости двух закономерностей)исследуемых данных с разными сдвигами некоторого вейвлета на разных масштабах.Вейвлет-преобразование генерирует набор коэффициентов, с помощью которыхпредставляется исходный ряд. Они являются функциями двух переменных: времени ичастоты, и потому образуют поверхность в трехмерном пространстве.
Этикоэффициенты, показывают насколько поведение процесса в данной точкеаналогично вейвлету на данном масштабе. Чем ближе вид анализируемойзависимости в окрестности данной точки к виду вейвлета, тем большую абсолютнуювеличину имеет соответствующий коэффициент. Отрицательные коэффициентыпоказывают, что зависимость похожа на «зеркальное отражение» вейвлета.Использование этих операций, с учетом свойства локальности вейвлета в частотновременной области, позволяет анализировать данные на разных масштабах и точноопределять места их характерных особенностей во времени.Технология использования вейвлетов позволяет обнаруживать единичные инерегулярные «всплески», резкие изменения значений количественных показателей вразные периоды времени, в частности, объемов тематических публикаций в вебпространстве.
При этом могут обнаружиться моменты возникновения циклов, а такжемоменты, когда за периодами регулярной динамики следуют хаотические колебания.Рассматриваемый временной ряд может аппроксимироваться кривой, которая, всвою очередь, может быть представленная в виде суммы гармонических колебанийразной частоты и амплитуды. При этом колебания, которые имеют низкую частоту,отвечают за медленные, плавные, крупномасштабные изменения значений исходногоряда, а высокочастотные – за короткие, мелкомасштабные изменения. Чем сильнееизменяется описываемая данной закономерностью величина при данном масштабе,тем большую амплитуду имеют составляющая соответствующей частоты.
Такимобразом, исследуемый временной ряд можно рассматривать в частотно-временнойобласти – т.е. об исследовании закономерности, описывающей процесс в зависимостикак от времени, так и от частоты.Непрерывное вейвлет-преобразование для функции f (t ) строится с помощьюнепрерывных масштабных преобразований и переносов выбранного вейвлета ψ (t ) спроизвольными значениями масштабного коэффициента a и параметра сдвига b :W ( a, b ) = ( f (t ),ψ (t ) ) =1a∞∫ f ( t )ψ−∞*t −b dt . a Полученные коэффициенты представляются в графическом виде как картакоэффициентов преобразования, или скейлограмма.
На скейлограмме по одной осиоткладываются сдвиг вейвлета (ось времени), а по другой – масштабы (осьмасштабов), после чего точки схемы, которая получается, раскрашиваются в249зависимости от величины соответствующих коэффициентов(чем большекоэффициент, тем ярче цвета изображения). На скейлограмме видные всехарактерные особенности исходного ряда: масштаб и интенсивность периодическихизменений, направление и величина трендов, наличие, расположение ипродолжительность локальных особенностей.Например, известно, что комбинация нескольких разных колебаний может иметьнастолько сложную форму, которая не позволяет аналитику выявить их.Периодические изменения, которые происходят для значений коэффициентоввейвлет-преобразования на некотором непрерывном множестве частот выглядят какцепочка «холмов», имеющие вершины, расположенные в точках (по оси времени), вкоторых эти изменения достигают наибольших значений.Другим важным показателем является выраженная тенденция динамикивременного ряда (тренд) вне зависимости от периодических колебаний.
Наличиетренда может быть неочевидным при простом рассмотрении временного ряда,например, если тренд объединяется с периодическими колебаниями. Трендотражается на скейлограмме как плавное изменение яркости вдоль оси времениодновременно на всех масштабах. Если тренд возрастающий, то яркость будетувеличиваться, если убывающий – уменьшаться.Еще одним важным фактором, которому необходимо учитывать при анализевременных рядов, являются локальные особенности, т.е. возможные резкие,скачкообразные изменения характеристик исходного ряда. Локальные особенностипредставленные на скейлограмме вейвлет-преобразования как линии резкогоперепада яркости, которые исходят из точки, соответствуют времени возникновенияскачка.
Локальные особенности могут иметь как случайный, так и систематическийхарактер, при этом "маскировать" периодические зависимости или краткосрочныйтренд. Анализ локальных особенностей позволяет восстановить информацию одинамике исходного процесса и в некоторых случаях прогнозировать подобныеситуации.На рис. 6.11 приведенная скейлограмма – результат непрерывного вейвлетанализа (вейвлет Гаусса) временного ряда, соответствующего рассматриваемомувыше процессу.Приведенный пример показывает, что вейвлет-анализ позволяет обнаруживатьне только очевидные аномалии в исследуемом ряде, но и критические значения,которые скрыты за относительно небольшими абсолютными значениями элементовряда.
Например, на скелетоне наибольшие значения отмечены не только в 250-йдень, но показаны и неявные экстремумы ( 25-й и 75-й дни).250Рис. Часть VI.11. Результат вейвлет-анализа (непрерывное вейвлетпреобразование): сверху – вейвлет-скейлограмма; снизу – линии локальныхмаксимумов (скелетон)Безусловно, финансово-экономические факторы имеют непосредственное влияниена общественные процессы. На рис. 6.11 приведена динамика изменения курсапродажи наличного доллара США в банках Украины в течение 2008 года.251Глава 3.Сложные информационные сетиИнформационные системы могут быть представлены как сетевые структуры, такназываемые динамические сети [30, 31]. Текущее состояние информационнойсистемы может быть представлено в виде графа < M , L > , где M – это множествокомпонент (например, документов) информационной системы, а L – множестворебер, например, связей подобия, цитирования, ссылок и т.д.