диссертация (1169170), страница 34
Текст из файла (страница 34)
Эффективность методов скан статистикипроявляется, прежде всего, тогда, когда известны некие средне параметры постоянных процессов и возможно прогнозировать их тенденции. Кластеризация однотипных событий дает возможность быстро выявлять отклонения. В настоящеевремя существуют общедоступные программные продукты, которые могут бытьиспользованы для применения указанного метода на практике.
Например, с нимиможно ознакомиться на сайте www.satscan.org.Развитие современных технологий обработки данных и рост возможностейсбора информации в различных источниках усиливают тенденцию возникновенияновых публично доступных и открытых ресурсов мониторинга событий. Например, открытые программные приложения и продукты можно найти в области обработки больших данных. Все более активно в качестве инструмента анализа событий и выявления событийных трендов используется ресурс Google trends.
Причемэффективность его использования возрастает при одновременном подключениивозможностей ресурса Google correlate. Помимо выявления корреляций популярности запросов по той или иной теме с реальными событиями, статистика поисковых185Glaz J., Naus J. Multiple coverage of the line // The annals of probability. 1979. Vol. 7, N 5.
P. 900–906; Kulldorff M. A spatial scan statistics // Communications in statistics: theory and methods. 1997. N26 (6). P. 1481–1496.186Neil D. B. Fast subset scan for spatial pattern detection. Journal of the Royal statistical society //Series B: Statistical methodology. 2012. N 74, part 2. P. 337–360.170запросов дает возможность определять хронологию развития событий (начало, конец), последовательность взаимосвязанных событий, отклонения интереса к какому-либо событию от сложившегося тренда и т.д.ЭМС определяются как события, явно отличающиеся на общем событийномфоне. При правильно сформулированном запросе, можно уловить соответствующие событийные «всплески», указывающие на вероятность ЭМС. В зарубежнойлитературе можно найти попытки выявить с помощью ресурса Google trends пространственно-временные индикаторы распространения эпидемий, смены трендов втематике научных исследований, интереса к различным катастрофическим событиям187.
В российской научной литературе инструментарий Google trends был использован в частности в работах М.И. Столбова, В.Д. Миловидова188. Семантикапоисковых запросов использована в приведенном выше анализе иррациональногоповедения инвесторов на финансовом рынке.Экспоненциально масштабируемое событие в том виде как оно представленов данной работе характеризуется значительным числом параметров, трудно прогнозируемо и может происходить в самых различных сферах жизни и деятельностилюдей. Возникновение таких событий можно относить к непараметрическим процессам, пространственно-временным процессам, а также многофакторным и многомерным процессам.
В силу этого вряд ли сегодня можно говорить о какой-тоединственной и эффективной методологии, которая бы наверняка могла бы обеспечить не только выявление таких событий, но и, хотя бы измерить потенциал масштабирования его последствий, не говоря уже об их прогнозировании. Тем не менее, относительно доступные и простые в использовании ресурсы Google trends и187Nuti S.V., Wayda B., Ranasinghe I. [et al.] The Use of Goggle trends in health care reseach: a systematic review // PLOSE One. October 2014.
Vol. 9, N 10. P. 1–49; Jun S-P., Yoo H.S., Choi S. Tenyears of research change using Google Trends: From the perspective of big data utilizations and applications // Technological forecasting and social change. May 2018. Vol. 130. P. 69–87; Linkov F., Ardalan A., Hennon M.
[et al.] Using Google trends to assess interest in disasters // Prehospital and disastermedicine. 2010. Vol. 25, N 5. P. 482–484.188Столбов М.И. Статистика поисковых запросов в Google как индикатор финансовой конъюнктуры // Вопросы экономики. 2011. № 11. C. 79–93; Миловидов В.Д. Капитализация фейка: настроения инвесторов и семантика интернет-запросов // Проблемы национальной стратегии. 2017б.№ 6 (45). C.
162–184.171Google correlate могут помочь в выявлении цепочки взаимосвязанных событий,анализ которой может позволить перейти на стадию формулирования суждений игипотез об их последствиях.Прежде, чем перейти к рассмотрению примеров определения ЭМС с помощью анализа поисковых запросов в интернете, следует заметить, что наибольшийаналитический эффект изучения статистики поисковых запросов в Google можнодостичь при правильном составлении самого запроса. Причем, следует учитывать,что даже одинаковые по смыслу запросы могут иметь несоизмеримую популярность. На этапе начала анализа сложно представить, какое именно слово и в какойкомбинации с другими словами может быть задано наибольшим количеством пользователей Google для отправки своего запроса по той или иной проблеме.
Для тогочтобы очертить приемлемое множество вариантов запросов можно применить ресурс Google correlate. Он позволяет задать поисковый запрос и посмотреть с какимииными запросами он коррелирует. В списке коррелирующих запросов окажутся,прежде всего, синонимические запросы, то есть характеризующие интерес к однойи той же проблеме, а также запросы по иным темам, которые случайно коррелируют с исходным запросом. На Рисунке 3.8 представлен пример того, с какими запросами коррелирует запрос «Financial crisis». Как видно на фото экрана компьютера большая часть коррелирующих запросов являются синонимичными.
Показатели корреляции варьируют от 0,9568 для запроса «the financial crisis» до 0,8945 длязапроса «us crisis». Ресурс позволяет увидеть также продолжение списка запросов,которые коррелируют с заданным.При этом если задать коррелирующие запросы в ресурсе Google trends, то ихуровень популярности будет существенно отличаться.
Так на интервале с января2004 по февраль 2019 гг. общий уровень сравнительной популярности запроса«financial crisis» составил 11 баллов, «us crisis» – 5 баллов, «the financial crisis» – 3балла. Данные различия в уровне популярности имеют крайне важное значение дляпоследующего сопоставления запроса по теме кризиса с другими запросами.
Не-172внимание к степени соизмеримости запросов может существенно сказаться на полученных результатах и привести к невозможности выявить те или иные закономерности.Источник: Google correlate.Рисунок 3.8 – Пример выявления корреляции поисковых запросовв Google correlateТаким образом, ресурс Google correlate позволяет не только выявить используемые формулировки синонимичных поисковых запросов, но и для целей последующего анализа выявить такие запросы, которые будут соизмеримы друг с другом.Следующим шагом анализа, позволяющего подойти к выявлению ЭМС, является формулирование поисковых запросов по темам, которые могли бы иметьсвязь и рассматриваться как события одной цепи причинно-следственных связей.Иными словами, следует построить гипотетическую цепочку масштабируемых последствий того или иного исходного события на определенном временном интер-173вале. Учитывая, что статистика поисковых запросов позволяет начать анализ от января 2004 года, выбор ЭМС возможен в пределах данной отметки.
Если сконцентрироваться на анализе последовательных масштабируемых событий на глобальном финансовом рынке в интервале 2004–2018 гг., то следует назвать: а) скандалыс корпоративной отчетностью начала 2000-х, по которым ключевые судебные решения были вынесены в 2005–2006 годах (прежде всего это дела корпораций Enron,WorldCom, а также аудиторской компании Arthur Andersen), б) жилищный бум вСША, в) рост дефолтов по ипотечным обязательствам, в) банкротство банка ЛеманБразерс.Отсчет событий следует начать от корпоративных скандалов 2000-х, поскольку они оказали существенное влияние на дальнейшее развитие событий нафинансовом рынке, включая существенные сдвиги в регулировании рынков и ужесточении корпоративного законодательства.
Однако, как показали события последующих лет, принятые меры были недостаточными, что привело повторению проблем с отчетностью на новом уровне и обострило ход финансового кризиса 2007–2008 гг.Следующим важным событием, которое повлияло на ход событий на мировом финансовом рынке стал так называемый жилищный бум. Его эпицентр был вСША, где в 2006–2007 годах наблюдался стремительный рост цен на жилье.
Жилищное строительство привело к росту потребительского кредитования и появлению значительного объема структурированных финансовых обязательств, связанных с ипотекой, причем имеющей высокие риски дефолтов. Выросли объемы кредитов повышенного риска, не являющихся первоклассными (subprime lending). Последовавший крах ипотечного рынка привел к цепной реакции на глобальных рынках и несостоятельности крупных и, казалось бы, надёжных банков. Кульминациейэтого процесса стало банкротство банка Леман Бразерс. Причем в этом банкротствекак раз и всплыла проблема ответственности аудиторов (Ernst & Young) и добросовестности и прозрачности финансовой отчетности. Последовательность указанныхсобытий хорошо просматривается в статистике поисковых запросов за рассматриваемый период (Рисунок 3.9).174Источник: Google trends.Рисунок 3.9 – Статистика поисковых запросов в Google trends 2004–2019 потемам: «worldcom», «housing bubble», «subprime», «financial crisis», «rate hike»Показанная на графике статистика поисковых запросов завершается «всплеском» интереса по теме «rate hike», то есть «повышение процентной ставки».