50228 (666491), страница 3
Текст из файла (страница 3)
Несмотря на различие математических теорий информации (синтаксической, семантической, прагматической), в них есть много общего, прежде всего в понимании информации как уменьшенной (снятой) неопределенности, поддающейся количественному измерению. Однако для многих видов социальной информации это означает, что ее содержание, смысл и ценность измеряются в знаках, строках, страницах, хотя хорошо известно, что одна и та же информация имеет для разных людей различные смысл и ценность. Следовательно, существующие математические теории применимы только там, где необходимо и возможно измерить информационную емкость определенных материальных систем, пропускную способность определенных каналов связи, количество передаваемой в сообщениях информации, то есть некоторые количественные характеристики качественных свойств информации. Поэтому наряду с математическими развиваются и другие, нематематические теории (концепции) информации: энергетические, философские, управленческие и экономические.
В энергетических концепциях информация рассматривается как специфическая форма энергетических процессов. Энергетические взаимодействия бывают двух видов: физические и информационные. Информационное взаимодействие осуществляется через энергетические процессы, носителем которых является сигнал, несущий информацию. Это относится и к высшему типу информации — социальной информации. Устная речь, слово реализуются посредством энергии физических колебаний. Таким образом, можно говорить о теснейшей взаимосвязи информационных и физических процессов.
Философские теории информации связывают эти понятия с философскими понятиями «разнообразие» и «отражение». Концепцию разнообразия можно пояснить на следующем простом примере. Нельзя себе представить простейший механизм, все детали которого были бы совершенно одинаковыми. Только потому, что выступы одной детали заполняют пазы другой, а ось третьей входит во втулку четвертой и т. д., возможно функционирование механизма как целостной, упорядоченной структуры. Следовательно, лишь благодаря различию, разнообразию существует конкретная структура системы, утверждается ее упорядоченность, происходит взаимный обмен между компонентами и системы в целом со средой. Именно этот процесс позволяет системе находить вовне то, что ей необходимо для развития. Иными словами, упорядоченность системы в значительной мере определяется информационным разнообразием. Отсюда можно сделать вывод, что информационное разнообразие, информация есть важный фактор организации и самоорганизации, и именно поэтому мы рассматриваем данное понятие как фактор организации информатики.
Концепция отражения утверждает, что информация есть знание, результат отражения, обозначение содержания, полученного из внешнего мира. Однако это не всякое знание, не всякое содержание отражения, а знание, выраженное в сообщении.
Не существует знания вообще. Знание — это локальное понятие, относящееся к конкретному человеку в определенное время. Отчужденное от конкретного носителя, превращенное в особую овеществленную и обобществленную форму, знание трансформируется в более общее понятие (категорию) — информацию. Следовательно, социальная информация — это форма представления знания.
Изобретение письменности открыло перед человечеством возможность осуществления двух противоположно направленных процессов: превращение знания в информацию и получение знания из информации. Книгопечатание, электро-, радио- и телесвязь увеличили эти возможности. Появление ЭВМ, средств передачи данных радикально меняет качественные и количественные характеристики этих процессов.
«Возникают вопросы, — пишет академик В. Г. Афанасьев, — можно ли неиспользуемые данные исключить из понятия «информация», тогда как и они могут храниться и передаваться? Обязательным ли является осмысливание информации, поскольку в ЭВМ информация перерабатывается, но не осмысливается? Для ответа на эти вопросы управленческая концепция информации вводит понятие «данные». Данные — это всякие сведения, сообщения, знания, которые хранятся, передаются, перерабатываются, но характер информации приобретают тогда, когда получают содержание и форму, пригодную для использования человеком». Следовательно, данные — это промежуточная форма представления знаний и информации.
Рассматривая различные трактовки понятия «информация», мы синтезировали новое понятие триады «знания — данные — информация». Совершенно очевидно, что эффективность процессов перехода «знание — данные», «информация — данные» и «знания — информация» зависит от эффективности их организации. Каковы организационные формы этих переходов?
Одной из форм организации данных являются базы данных. Под базой данных в настоящее время понимают организованную специальным образом совокупность данных, отображающую свойства и состояния конкретных объектов (и их отношений), принадлежащих некоторой «предметной области». Предметная область представляет собой часть «информационного пространства», отображающую информационные потребности некоторого ограниченного круга пользователей рассматриваемой базы данных. Под информационным пространством некоторого объекта или их множества понимается совокупность всех информационных компонентов этого объекта (или множества) независимо от способов и средств отображения этих компонентов.
Одна из важнейших характеристик информационного пространства — его структурированность, под которой понимается такое его свойство, при котором все содержание и особенности этого пространства представляются «информационными компонентами» и взаимосвязями между ними, выраженными в понятном виде.
В зависимости от степени структурированности выделяются следующие виды информационного пространства:
— неструктурированные (например, разговорная речь);
— слабо структурированные (например, письменность);
— структурированные (например, информационные системы);
— формализованные (для которых известны не только информационные компоненты и связи между ними, но и алгоритмы получения значений любого компонента, например технико-экономические показатели деятельности объекта);
— машиноструктурированные, для которых известны алгоритмы получения не только информационных компонентов, но и их структурных единиц.
Информационные компоненты объектов могут иметь различную природу — это документация (организационно-распределительная, экономическая, конструкторская и т. п.), отчеты о НИР, информация на машинных носителях, звуковая и видеоинформация, информация от датчиков и т. д.
Соответственно понятиям «информация» и «данные» в теории баз данных рассматриваются два различных аспекта: инфологический и да-талогический.
Инфологический аспект включает вопросы смыслового содержания информации независимо от способов ее представления и организации в памяти информационной системы и характеризует предметную область базы данных, то есть ту часть реального мира, информационные потребности которого реализуются конкретной базой данных.
Даталогический аспект включает вопросы представления и организации данных в памяти информационной системы и характеризует формы и методы представления информации посредством данных, правила смысловой интерпретации и преобразования данных.
При формировании данных в соответствии с целями информационной системы происходит абстрагирование от несущественных деталей описания тех или иных свойств предметной области. Переход от инфологического к даталогическому представлению предметной области (от ее инфологической к даталогической модели) представляет собой сложный процесс проектирования отображения: «описание предметной области» — «описание физического размещения данных в памяти информационной системы». На практике он представляет собой последовательность более простых, как правило, итеративных процессов проектирования менее сложных промежуточных отображений, представляющих собой информационные модели предметной области различного уровня абстрагирования.
Основными уровнями абстрагирования и представления данных в настоящее время принято считать внешний, концептуальный и внутренний. Поэтому при создании баз данных проектируются соответствующие внешние, концептуальные и внутренние модели. На внешнем уровне реализуются модели, ориентированные на отдельных пользователей, на концептуальном — на всех пользователей, на внутреннем — также на всех пользователей, но с учетом требований производительности и экономного использования ресурсов вычислительной среды.
Объектами моделирования в технологии баз данных служат «предметная область», «база данных» и «данные», поэтому в теории и технологии баз данных широко используются термины «модель предметной области», «модель базы данных», «модель данных». Анализ специальной литературы позволяет сделать вывод, что эти термины являются родовыми для группы терминов, обозначающих разновидность моделей соответствующего типа.
С середины 1960-х годов в рамках исследований проблем искусственного интеллекта начало развиваться новое направление, связанное с концепцией информации на основе отражения, которое впоследствии получило название «представление знаний». Интеллект организованных систем зависит от их способностей к обучению, которые заложены в систему. В одном случае эти способности состоят в простом запоминании информации, в другом — в умении приобретать навыки использования этой информации для решения задач, в третьем — формировать новое знание в процессе использования уже имеющегося и т. п. В интересах реализации двух последних видов способностей и развивается новое направление науки и техники — «представление знаний».
Совокупность средств информатики, обеспечивающих поддержку представления знаний, именуется банком знаний. Этот комплекс включает в себя базу знаний, программные и технические средства, обеспечивающие процессы формирования, использования и коррекции базы знаний, а также дедуктивные машины для логических выводов, систем и т. д.
Основными формами материализации, овеществления и обособления знаний, превращения их в информацию, а также обратной трансформации информации в знания являются книги, журналы, материалы конференций, совещаний, симпозиумов, конгрессов и других временных объединений специалистов; репринты и препринты; научно-техническая документация и проекты; кино-, теле- и видеофильмы; фонограммы; научно-технические отчеты и диссертации; патенты и т. д.
5. Статические законы движения информации
Если представить общественное информационное производство в виде множества взаимосвязанных информационных производств, то в нем можно наблюдать потоки документов и/или записей. Эти потоки формируются благодаря как фиксированным связям между отдельными информационными производствами, так и временным разовым связям, возникающим по мере необходимости. В первом случае информация распространяется по заранее установленному регламенту (контракт, кооперация, подписка и др.) и не требует многократного оформления запроса. В таких случаях принято считать, что действует постоянный запрос. Во втором случае для получения информации заинтересованное информационное производство должно отправить запрос другому производству, которое по своей технологии подготовит и отправит заказчику ответ в виде записи или документа либо массивов записей или документов.
Наблюдая процессы передачи информации, можно заметить, что между отдельными субъектами общественного информационного производства идет интенсивный обмен информацией, в то время как между другими его практически нет. В этом случае мы говорим о наличии или отсутствии у субъектов взаимного интереса. Из этого следует, что предложить общую меру интереса, применимую для каждого конкретного случая, очень трудно. Данный показатель зависит от многих факторов, то есть, по терминологии математики, он является функцией многих аргументов. Перечислить все эти факторы или аргументы не представляется возможным. Для наших целей достаточно рассмотреть зависимость показателя интереса от трех обобщенных факторов: информационного расстояния — R, информационной сложности — S и старения — Т.
Под информационным расстоянием будем понимать некоторую усредненную величину, характеризующую удаленность двух субъектов общественного информационного производства, входящих в общую технологическую структуру. Информационное расстояние между субъектами информационного производства можно описать некоторым многомерным вектором, компоненты которого соответствуют географической, родственной, служебной, этнической и другой близости этих субъектов. Некоторую скалярную норму этого вектора обозначим R. Такое определение информационного расстояния, конечно, не является жестким. Уточнить его можно только при рассмотрении отдельных небольших групп информационных производств, поддерживающих взвешенные связи друг с другом. Однако для установления характера зависимости меры информационного интереса от информационного расстояния последнее можно определить также качественно.
Информационное расстояние до последнего времени существенно зависело от географического: чем дальше субъекты по месту их нахождения, тем больше информационное расстояние между ними. Если субъекты информационного производства — люди, информационное расстояние между ними увеличивается по мере удаленности родственных отношений, мест жительства, учебы или работы, профессиональных интересов и т. п.
Представим себе, что мы измерили интенсивность информационных потоков между всеми парами субъектов общественного производства и рассортировали их по величине информационного расстояния между субъектами пары. Для каждого достаточно малого интервала информационного расстояния (R + R ± AR) найдем среднюю величину интереса по всем парам с информационным расстоянием, лежащим в этом интервале, — J ( R ). Многочисленные наблюдения показывают, что эта зависимость представляет собой круто падающую функцию аргумента на относительно малом интервале R, близком к нулю. Если считать, что интерес субъекта информационного производства к самому себе (R=0) бесконечен, то зависимость среднего интереса от информационного расстояния может быть приблизительно описана выражением J (R) = K/R2, что позволяет сформулировать эмпирический закон информационного тяготения: «Интерес субъектов информационного производства друг к другу обратно пропорционален квадрату информационного расстояния между ними».