Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика, страница 69
Описание файла
PDF-файл из архива "Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика", который расположен в категории "". Всё это находится в предмете "системы автоматизированного проектирования (сапр)" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "интеллектуальные подсистемы сапр" в общих файлах.
Просмотр PDF-файла онлайн
Текст 69 страницы из PDF
Они являются функциями двух переменных: времени ичастоты, и потому образуют поверхность в трехмерном пространстве. Этикоэффициенты, показывают насколько поведение процесса в данной точкеаналогично вейвлету на данном масштабе. Чем ближе вид анализируемойзависимости в окрестности данной точки к виду вейвлета, тем большую абсолютнуювеличину имеет соответствующий коэффициент. Отрицательные коэффициентыпоказывают, что зависимость похожа на «зеркальное отражение» вейвлета.Использование этих операций, с учетом свойства локальности вейвлета в частотновременной области, позволяет анализировать данные на разных масштабах и точноопределять места их характерных особенностей во времени.Технология использования вейвлетов позволяет обнаруживать единичные инерегулярные «всплески», резкие изменения значений количественных показателей вразные периоды времени, в частности, объемов тематических публикаций в вебпространстве.
При этом могут обнаружиться моменты возникновения циклов, а такжемоменты, когда за периодами регулярной динамики следуют хаотические колебания.Рассматриваемый временной ряд может аппроксимироваться кривой, которая, всвою очередь, может быть представленная в виде суммы гармонических колебанийразной частоты и амплитуды.
При этом колебания, которые имеют низкую частоту,отвечают за медленные, плавные, крупномасштабные изменения значений исходногоряда, а высокочастотные – за короткие, мелкомасштабные изменения. Чем сильнееизменяется описываемая данной закономерностью величина при данном масштабе,тем большую амплитуду имеют составляющая соответствующей частоты. Такимобразом, исследуемый временной ряд можно рассматривать в частотно-временнойобласти – т.е. об исследовании закономерности, описывающей процесс в зависимостикак от времени, так и от частоты.Непрерывное вейвлет-преобразование для функции f (t ) строится с помощьюнепрерывных масштабных преобразований и переносов выбранного вейвлета ψ (t ) спроизвольными значениями масштабного коэффициента a и параметра сдвига b :W ( a, b ) = ( f (t ),ψ (t ) ) =1a∞∫ f ( t )ψ−∞*t −b dt . a Полученные коэффициенты представляются в графическом виде как картакоэффициентов преобразования, или скейлограмма.
На скейлограмме по одной осиоткладываются сдвиг вейвлета (ось времени), а по другой – масштабы (осьмасштабов), после чего точки схемы, которая получается, раскрашиваются в249зависимости от величины соответствующих коэффициентов(чем большекоэффициент, тем ярче цвета изображения). На скейлограмме видные всехарактерные особенности исходного ряда: масштаб и интенсивность периодическихизменений, направление и величина трендов, наличие, расположение ипродолжительность локальных особенностей.Например, известно, что комбинация нескольких разных колебаний может иметьнастолько сложную форму, которая не позволяет аналитику выявить их.Периодические изменения, которые происходят для значений коэффициентоввейвлет-преобразования на некотором непрерывном множестве частот выглядят какцепочка «холмов», имеющие вершины, расположенные в точках (по оси времени), вкоторых эти изменения достигают наибольших значений.Другим важным показателем является выраженная тенденция динамикивременного ряда (тренд) вне зависимости от периодических колебаний.
Наличиетренда может быть неочевидным при простом рассмотрении временного ряда,например, если тренд объединяется с периодическими колебаниями. Трендотражается на скейлограмме как плавное изменение яркости вдоль оси времениодновременно на всех масштабах. Если тренд возрастающий, то яркость будетувеличиваться, если убывающий – уменьшаться.Еще одним важным фактором, которому необходимо учитывать при анализевременных рядов, являются локальные особенности, т.е.
возможные резкие,скачкообразные изменения характеристик исходного ряда. Локальные особенностипредставленные на скейлограмме вейвлет-преобразования как линии резкогоперепада яркости, которые исходят из точки, соответствуют времени возникновенияскачка. Локальные особенности могут иметь как случайный, так и систематическийхарактер, при этом "маскировать" периодические зависимости или краткосрочныйтренд. Анализ локальных особенностей позволяет восстановить информацию одинамике исходного процесса и в некоторых случаях прогнозировать подобныеситуации.На рис. 6.11 приведенная скейлограмма – результат непрерывного вейвлетанализа (вейвлет Гаусса) временного ряда, соответствующего рассматриваемомувыше процессу.Приведенный пример показывает, что вейвлет-анализ позволяет обнаруживатьне только очевидные аномалии в исследуемом ряде, но и критические значения,которые скрыты за относительно небольшими абсолютными значениями элементовряда.
Например, на скелетоне наибольшие значения отмечены не только в 250-йдень, но показаны и неявные экстремумы ( 25-й и 75-й дни).250Рис. Часть VI.11. Результат вейвлет-анализа (непрерывное вейвлетпреобразование): сверху – вейвлет-скейлограмма; снизу – линии локальныхмаксимумов (скелетон)Безусловно, финансово-экономические факторы имеют непосредственное влияниена общественные процессы. На рис. 6.11 приведена динамика изменения курсапродажи наличного доллара США в банках Украины в течение 2008 года.251Глава 3.Сложные информационные сетиИнформационные системы могут быть представлены как сетевые структуры, такназываемые динамические сети [30, 31]. Текущее состояние информационнойсистемы может быть представлено в виде графа < M , L > , где M – это множествокомпонент (например, документов) информационной системы, а L – множестворебер, например, связей подобия, цитирования, ссылок и т.д.
В настоящее времянаряду с традиционным теориями графов, систем и сетей масоового обслуживанияактивно развивается теория сложных сетей (от англ. – Complex Networks), в рамкахкоторой предлагаются подходы к решению вычислительно сложных задач,характерных для современных сетей.§ 3.1.Основы концепции сложных сетейОсновной причиной актуальности теории сложных сетей являются результатысовременных работ по описанию реальных компьютерных, биологических исоциальных сетей. Такие сети имеют характеристики, не свойственные сетям сравновероятной связностью узлов, а строятся на основе связных структур, степенныхраспределений и узлов-концентраторов.Представляющие интерес сети чаще всего разрежены – присутствует лишь малаячасть возможных ребер, соединяющих отдельные узлы.
Поэтому сегодня особуюактуальность приобретают методы работы с разреженными матрицами.Действительно, практически все современные сети можно считать сложными. Так,например, известная задача синтеза топологии сети допускает комбинаторныйподход, опирающийся на представление сети в виде конечного графа без петель икратных ребер, вершины которого соответствуют узлам сети, а ребра – линиям связи.Вместе с тем, использование методов перечисления графов для решения задачитопологической оптимизации считается неперспективнымм, так как необходимоиссследовать огромное количество возможных вариантов соединения узлов линиямисвязи.
Например, в сети из 10 узлов существует 245 вариантов размещения линийсвязи (для 10 узлов теоретически возможно C102 =10 ⋅ 9= 45 линий соединений. Каждая2из этих возможных линий связи может реально существовать – состояние «1», или несуществовать – состояние «0», то есть всего возможностей 245 ).Для меншего количества узлов (например, n = 3 ) линии связи, могут быть3⋅2реально посчитаны ( 2 2 = 8 ) вариантами (рис. 6.12).Рис. Часть VI.12. Варианты размещения линий связи при n = 3252Сложные сети обычно рассматриваются в абстрактном пространстве, в которомрасположение вершин не имеет значения. Для некоторых реальных типов сетей такоерассмотрение оправдано.Однако, существует множество систем, в которых расположение компонентвесьма важно, поскольку влияет на эволюцию сети.
Такие сети называютсягеографическими или пространственными. В географических сетях существованиепрямого соединения между вершинами может зависеть от многих ограничений, такихкак расстояние между ними, географический рельеф, территориальные ограничения ит.д. Модели, предназначаемые для представления таких сетей, должны учитывать этиограничения.§ 3.2.Параметры сложных сетейТеория сложных сетей как область дискретной математики изучаетхарактеристики сетей, учитывая не только их топологию, но и статистическиефеномены, распределение весов отдельных узлов и ребер, эффекты протекания,просачивания, проводимости в таких сетях тока, жидкости, информации и т.д.Оказалось, что свойства многих реальных сетей существенно отличаются от свойствклассических случайных графов.
Изучения таких параметров сложных сетей, каккластерность, посредничество или уязвимость напрямую относятся к теорииживучести, так как именно от этих свойств зависит способность сетей сохранять своюработоспособность при деструктивном воздействии на их отдельные узлы или ребра(связи).Несмотря на то, что в рассмотрение теории сложных сетей попадают различныесети – электрические, транспортные, информационные, наибольший вклад в развитиеэтой теории внесли исследования социальных сетей. Термин «социальная сеть»обозначает сосредоточение социальных объектов, которые можно рассматривать каксеть (или граф), узлы которой – объекты, а связи – социальные отношения.