Диссертация (1145511), страница 21
Текст из файла (страница 21)
Отсюда легко заметить, что при содержательном подходе к изучению информации вводились такие меры информации, которые были основаны на оценкесоотношения состояний получателя до и после получения им некоторой порции информации. В этом смысле следует отметить, что прагматические и семантические оценки зачастую трудно разделить.По каждому из перечисленных выше направлений исследований в теории информации написано много трудов.
Теория информации и кибернетика,разработанная к концу 50 гг. исключительно для технических наук, уже в1960-х начале 1970-х гг. привлекла к себе внимание ученых и специалистовиз различных нетехнических областей знаний, стала объектом пристальноговнимания обществоведов, которые попытались обоснованно найти место понятию «информация» в ряду фундаментальных философских категорий, такихкак материя, сознание и т.д.
Достаточно сказать, что уже в 1956 году самК. Шеннон писал: «Теория информации нашла применение в биологии, психологии, лингвистике, теоретической физике, экономике, теории организациипроизводства и во многих других областях науки и техники» [347]. Исследования, которые были проведены в разных направлениях, способствовалиуглублению понятия информации, подчеркивая в нем оттенки, специфичныедля той или иной области знаний.Однако, все разнообразие взглядов на информацию можно уложить врамках двух ведущих парадигм: философской, согласно которой, информация– это неотъемлемое свойство материи и технологической, где информация117рассматривается, как неотъемлемый функциональный элемент самоуправляемых технических, биологических, социальных систем.Философская концепция рассматривает информацию как всеобщеесвойство материи – отражение и ставит ее в один ряд с веществом и энергией.Технологическая концепция основана на функциональности и не признает информации в неживой природе, связывая ее с контуром управления на основеобмена сигналами, причем сигнал и есть информация.В.Г.
Афанасьев полагает, что информация «представляет собой знания,сообщения, сведения о социальной форме движения материи и о всех ее других формах в той мере, в какой они используются обществом, человеком, вовлечены в орбиту общественной жизни» [121], [120]. С конца 70-х гг. информацию стали рассматривать с точки зрения таких свойств материи, как структура, упорядоченность, организация. В те же годы В.Г. Афанасьев отмечал,что ряд исследователей для раскрытия сути информационных процессов прибегают к помощи понятий «осознание», «понимание», а через них приходят котождествлению понятий «информации» и «знания» [120].Из приведенных выше высказываний видно, что уже тогда философырассматривали информацию не просто, как отражение реального мира, онивсецело анализировали ее с позиции смысла и содержательного аспекта.Изучение сущности информации и её влияния на экономику деятельность проводил американский ученый Ф.
Найт [262]. Ф. Найт исходил из исследования неопределенности и риска в экономической деятельности и на основе этого сформулировал собственный подход к понятию «информация». Информация в концепции Ф. Найта понимается как понятие, противоположноенеопределенности, а также обратно пропорциональное риску. В условиях полной и достоверной информации происходит снижение риска при принятии решения экономическим субъектом до нуля.
На основании данного подхода американским ученым была предложена концепция прибыли, источник которой(прибыли) он видел именно в наличии неопределенности, а, следовательно,различных вариантов действий с разными последствиями. Отметим, что Ф.118Найт пришел к сходному пониманию информации как средства снижения неопределенности в определении К. Шеннона, хотя подходы этих ученых инаправление анализа были весьма различны.В 1970-е гг. оформилась теория информации как общенаучная методология, которая, тем не менее, спустя три десятка лет так и не нашла практического применения в экономических исследованиях.В развитии теории информации можно выделить два взаимосвязанныхэтапа: эмпирико-теоретический и технологический.В рамках первого этапа (эмпирико-теоретический) информация рассматривается в качестве нового целостного объекта, который можно измерять ианализировать качественно и количественно на основе трех подходов: синтаксический, семантический и прагматический (см.
табл. 2.3.1)Таблица 2.3.1 Подходы к измерению данных и информации.Мера информацииСинтаксическаяСемантическаяПрагматическаяОбъем данныхОбъем данных Vд в сообщении измеряется количеством символов (разрядов)в этом сообщении.Количество информацииКоличество информацииIна синтаксическом уровне определяетсяс помощью понятия неопределенности состояния (энтропии) системыОбъем данных Vд в смыс- Количество информации Iловом аспектеIс=f(Sp), Sp тезаурусом пользователя, Ic – информация, воспринимаемая пользователемОбъем данных Vд в целе- Количество информацииI,вом аспектеPI р log 1P0где - вероятность достижения целидо получения сообщения;Р1 - вероятность достижения целиполе получения сообщения.Синтаксическая мера информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.
На этом уровнеобъём данных в сообщении измеряется количеством символов в этом сообщении.119Прагматическая мера информации определяет её полезность, ценностьдля процесса управления. Обычно ценность информации измеряется в тех жеединицах, что и целевая функция управления системой.Семантическая и прагматическая меры информации используется дляизмерения смыслового содержания информации. Наибольшее распространение здесь получила тезаурусная мера, связывающая семантические свойстваинформации со способностью пользователя принимать поступившее сообщение.
Тезаурус — это совокупность сведений, которыми располагает пользователь или система. Максимальное количество семантической информации потребитель получает при согласовании её смыслового содержания со своим тезаурусом, когда поступающая информация понятна пользователю и несет емуранее не известные сведения. С семантической мерой количества информациисвязан коэффициент содержательности, определяемый как отношение количества семантической информации к общему объему данных.Начиная с того времени тезаурусный подход лег в основу построениясемантической и прагматической мер информации. С появлением ЭВМ,начался процесс информатизации практически всех сфер человеческой деятельности.
Объем информации и данных рос с каждым годом, и скорость этогороста неуклонно увеличивалась. Увеличивающиеся объемы анализируемыхданных, с одной стороны, позволяли производить более точные расчеты, но, сдругой стороны, для обработки этих данных в полезную для общества информацию усилий человека было уже недостаточно. Именно поэтому, задачу анализа большого объема данных постепенно переложили на ЭВМ. Однако инструментальных средств для реализации такого анализа данных в наличии унауки тогда не было, а сам процесс определения семантического смысла информации был не пригоден для практического использования в силу трудоемкости формализации для ЭВМ и, как следствие дороговизны.
Ситуация продолжалась до тех пор, пока в 70-х годах прошлого века не появились первыеметоды анализа данных, обладающие интеллектуальными свойствами.120В 1958 году H.P. Luhn в статье «A Business Intelligence System» вводитпонятие Business Intelligence, разделяя его на отдельные составляющие «бизнес» и «интеллектуальный», подразумевая такие системы, как класс системDDS (систем поддержки и принятия решений). При этом, под бизнесом авторпонимает совокупность любых видов деятельности, будь то наука, техника,коммерция, промышленность, право, государственное управление, оборона, итак далее, а под интеллектуальной составляющей способность воспринять взаимосвязи представленных фактов таким образом, направлять действия внаправлении желаемой цели [38].
Уже в 1962 году Д. Тьюки, подчеркивая важность изучения и значимость для науки и практики методов анализа данных, всвоем труде «Будущее анализа данных» пишет, что будет жизненно необходимо использовать ЭВМ для обработки информации [96]. В 1974 году ПетерНаур публикует свою работу «Краткий обзор компьютерных методов».
Этакнига – обзор методов обработки данных, которые применяются в широкомдиапазоне задач. Наур дает следующие определение данным: данные – представление фактов или идей формализованным способом, которые могут бытьпереданы и управляемы определенным процессом [264]. В 1977 году Д. Тьюкив «Исследовательский анализ данных» пишет, что нужно сделать акцент наиспользовании данных для выдвижения гипотез и их проверки. Так же, в 1977году Международная Ассоциация Статистического Вычисления становитсячастью Международного Статистического Института. Это послужило еще одним толчком для развития понимания терминов информации и данных. В 1989году Григорий Пятецкий-Шапиро организует и возглавляет первый семинарна тему «Обнаружение знаний в базах данных», где он вводит определениеинтеллектуального анализа данных (Data Mining) и, начиная с 1995 года, проводит ежегодную конференцию на эту тему.
Официально термин Business Intelligence считается введенным в практику деятельности в 1989 году аналитиками Gartner Group, как инструмент поиска причинно-следственных или каузальных связей.121Основным инструментальным средством систем класса Business Intelligence является интеллектуальный анализ данных (англ.