Классификация и основные свойства единиц информации
Лекция
Классификация и основные свойства единиц информации:
Общие понятия и задачи проектирования информационного обеспечения.
Имя, структура и значение единиц информации. Экономические показатели и документы.
Операции над единицами информации.
Классификация и кодирование информации.
1. Общие понятия и задачи проектирования информационного обеспечения
Рекомендуемые материалы
Информационное обеспечение (ИО) представляет собой совокупность проектных решений по объемам, размещению, формам организации информации. Оно включает в себя совокупность показателей, справочных данных, классификаторов и кодификаторов информации, унифицированные системы документации, специально организованные для автоматического обслуживания, файлы информации на соответствующих носителях, а также персонал, обеспечивающий надежность хранения, своевременность и качество технологии обработки информации.
ИО предназначено для отображения информации, характеризующей состояние объекта управления. ИО – основа для принятия управленческих решений. В теории ЭИС различают информационное обеспечение:
· внемашинное (удобное для восприятия человеком),
· внутримашинное (связано с хранением, поиском, обработкой информации).
Внемашинное обеспечение:
· системы показателей данной предметной области,
· системы классификации и кодирования,
· унифицированная документация,
· потоки информации.
Внутримашинное обеспечение - различные информационные файлы.
В процессе проектирования информационного обеспечения решаются следующие задачи:
· определяется состав показателей для решения экономических задач, их объемно-временные характеристики, информационные связи,
· выбираются системы кодирования информации,
· разрабатываются классификаторы, рассматривается возможность использования федеральных, отраслевых и прочих классификаторов,
· проектируются формы новых первичных документов, предназначенных для использования в АИС,
· проектируется размещение первичных данных на машинных носителях,
· проектируются формы вывода результатов обработки информации.
Проектирование ИО осуществляется в ходе составления технического и рабочего проектов и предусматривает:
· инструкции по подготовке документов к автоматизированной обработке и их кодирование;
· инструкции по обработке экономической информации на ЭВМ (ведение файлов БД, организация запросов, получение выходных данных, обмен информации с другими пользователями и пр.).
2. Имя, структура и значение единиц информации. Экономические показатели и документы.
Проектирование структурных единиц информации заключается в определении составных единиц информации, их логической структуры и способов перехода от одних единиц к другим, т.е. структуризация данных (условно-постоянных, входных, выходных).
Экономическая информация отражается через систему натуральных и стоимостных показателей. Выделяют простые (не поддаются дальнейшему расчленению) и составные единицы информации (СЕИ).
В структуре экономической информации различают: атрибут, показатель, информационное сообщение, информационный файл, информационный поток, информационная подсистема, информационная система.
Основные единицы информации - атрибут и составная единица информации.
Атрибут – информационная единица низшего уровня, отражает отдельные свойства объекта, состоит из сочетания цифр и/или букв, имеющих смысловое содержание, не подается дальнейшему делению. Т.е. атрибут (элемент данных, реквизит, поле) - неделимая информационная совокупность.
Материальные процессы имеют качественную и количественную характеристику. Соответственно, и атрибуты должны подразделяться на два класса: атрибуты - признаки и атрибуты - основания.
Атрибут-признак характеризует качественное свойство отражаемых сущностей (наименования предприятий, код, номер счета, дата и т.д.), служит для выполнения логических операций, составления группировок.
Атрибут-основание характеризует объект, процесс, явление с количественной стороны (сумма, расценки, количество и т.д.), над которым в процессе обработки выполняются арифметические действия.
Атрибут характеризуется именем и значением. Именем атрибута называется его условное обозначение в процессах обработки данных.
Значением атрибута называется величина, характеризующая некоторое свойство объекта, явления, процесса в конкретных обстоятельствах. Все допустимые значения атрибута образуют множество, называемое доменом этого атрибута (областью определения атрибута). Если в домене необходимо перечислить обозначения объектов из некоторого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены.
Атрибут с одним именем может иметь несколько различных значений. Например,
Наименование продукции: чугун, сталь.
Количество: 90, 120, 200.
Атрибуты объединяются в единицу информации более высокого уровня: сочетание одного атрибута-основания и всех, относящихся к нему атрибутов-признаков, однозначно характеризующих условия существования этого основания, образуют показатель.
Информационное сообщение: “ Ткань 450 м”.
Здесь количественный реквизит один - 450,
Реквизитов-признаков два - ткань, м.
Документы, характеризующие экономическую деятельность, содержат, как правило, большое количество показателей. Каждый показатель имеет множество значений и рассчитывается по своему алгоритму.
Существуют документы, не содержащие атрибутов-оснований, например анкеты кадрового учета, сведения о структуре подразделений предприятия и т. д. Следовательно, не вся экономическая информация может быть представлена в форме показателей.
Одним из критериев качества создания базы данных может служить минимальная избыточность хранимой информации: каждое сообщение хранится в БД один раз. Использование аппарата экономических показателей позволяет создать структуру БД с минимальной избыточностью, если сначала декомпозировать все сведения, циркулирующие в АИС, на показатели, а потом объединить атрибуты родственных показателей по принципу: в один файл включается группа экономических показателей с одинаковым составом атрибутов-признаков.
Одна из причин выделения показателей в особую разновидность единиц информации заключается в том, что показатель является минимальной группой атрибутов, сохраняющей информативность (осмысленность) и поэтому достаточной для образования самостоятельного документа. Как единица информации показатель является составной единицей информации - пример СЕИ.
Вообще аппарат СЕИ предназначен для описания структуры экономических документов. Документом называется материальный носитель информации (обычно бланк бумаги), содержащий оформленные в установленном порядке сообщения, и имеющий юридическую силу. В экономических документах таблицы не имеют названий, названия всех элементов документа требуются при его машинной обработке.
Простейшими характеристиками СЕИ являются имя, структура и значение. Имя СЕИ - это ее условное обозначение в процессах обработки информации. Структурой СЕИ называется вхождение одних единиц информации в состав других единиц информации.
3. Операции над единицами информации
Свойства единиц информации
Название свойства | Атрибут | Составная единица информацни | ||
Операции над именем Операции над значением Операции над структурой | Переименование, объявление синонима | |||
Перекодирование | Выборка, корректировка | |||
Арифмети- ческие операции | ||||
- | Декомпозиция, композиция. нормализация, свертка | Проекция, соединение, добавлениеатрибутов | Добавление/ изъятие атрибутов | |
Ограничения | Принад-лежность домену | Функциональные зависимости |
Отметим базовые операции обработки составных единиц информации:
Переименованием единицы информации называется присвоение ей нового имени, объявление синонима - это установление альтернативного равноценного имени для единицы информации.
Выборка - операция выделения подмножества значений заданной информации, которое удовлетворяет условиям выборки.
Корректировка означает выполнение одной из операций:
• добавление нового значения,
• исключение существующего значения,
• замена некоторого значения на новое.
Декомпозиция - операция преобразования исходной СЕИ в несколько СЕИ с различными структурами. Декомпозиция может иметь множество вариантов.
Композиция - операция преобразования нескольких СЕИ с различными структурами в одну СЕИ. Декомпозиция и композиция являются взаимообратными операциями.
Нормализация - это операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой (прямоугольная таблица).
Свертка - операция преобразования СЕИ с двухуровневой структурой в документ с произвольной многоуровневой структурой, имеющий экономический смысл.
Совокупность показателей документа образует информационное сообщение (запись). Группа таких записей, объединенных по определенному признаку, представляет собой информационный файл – основную структурную единицу при автоматизированный обработке данных – ядро любой АИС.
Файл – это место, где фактически хранится информация, совокупность всех записей, включающих различные поля. Обычно в решении экономической задачи участвуют несколько файлов. Несколько файлов могут составлять БД. БД в целом также является единицей информации.
Информационные файлы, используемые при решении конкретной экономической задачи (например, “Расчет заработной платы”) образуют информационный поток. При этом некоторые файлы могут использоваться в разных задачах, например, нормативно-справочные файлы.
Принадлежность информации к какой-либо функции управления – основание для организации более высокой структуры – информационной подсистемы (бух.учет, финансовая деятельность и пр.).
Структурная единица высшего уровня – информационная систем - относится к какому-либо экономическому объекту (предприятие, банк, отрасль, регион и т.д.).
Приведенные толкования отражают скорее прагматический смысл терминов, формулировку, более точную в теоретическом смысле, смотри в соответствующих предыдущих лекциях курса.
4. Классификация и кодирование информации
Классификация - распределение элементов множества на подмножества на основании признаков и зависимости внутри признаков (например, область - районы).
Кодирование - присвоение условного обозначения кода – знака или группы знаков - по определенным правилам, принятым в системе кодирования.
Кодированию в документах подлежат те признаки, по которым выполняется группировка информации в ЭВМ. Проектирование кодов – при составлении технического и рабочего проектирования.
Если классификация объектов не требуется, производится их нумерация, и кодом каждого объекта служит его порядковый номер. Такая система кодирования называется порядковой.
Если все множество объектов классифицируется по одному признаку, то коды объектов целесообразно разделить на несколько частей (серий) по количеству значений этого признака и в пределах каждой серии использовать последовательные номера – серийная система кодирования.
Когда используется несколько классификационных признаков и их взаимная подчиненность соответствует выделению классов объектов, подклассов внутри каждого класса и т.д., удобно использовать разрядную (позиционную) систему кодирования.
Можно выделить систему кодирования с кодом повторения (№ склада в шифре продукции), комбинированную, шахматную.
В качестве примера рассмотрим различные системы кодирования значений атрибута Код студента.
1). Порядковый код студента - это его номер в списке всех студентов.
2). Предположим, что необходимо различать студентов-дневников, студентов ИДО и заочников с использованием серийной системы кодирования. Для этого последовательные номера от 1 до 5999 будем использовать при кодировании дневников, номера от 6000 до 7999 - при кодировании студентов ИДО, от 8000 до 9999 - при кодировании заочников.
3). Если в этих же условиях применить разрядный код, то первый знак кода будет принимать три значения (1 - дневное отделение, 2 – ИДО, 3 - заочное), а следующие 4 знака отводятся для нумерации студентов каждого отделения. В разрядном коде можно учесть больше признаков, например, первый знак - код отделения, второй - код факультета, третий - код курса, четвертый - код группы, пятый и шестой - порядковый номер студента в группе. Но увеличивая число различимых признаков в коде, мы вынуждены увеличивать и длину значения атрибута Код студента.
Классификационные группировки по младшим признакам кодируются в зависимости от кода более старшего признака.
Требования к кодам:
· учитывать весь диапазон значений,
· быть едиными внутри одного экономического объекта,
· иметь резерв свободных номеров,
· стабильность,
· длина кода должна быть минимальной.
Систематизация экономической информации вызывает необходимость применения самых разнообразных классификаторов: республиканских, отраслевых, локальных (данное предприятие).
Изначально выясняется, какие из универсальных классификаторов могут быть использованы, а затем, при необходимости, разрабатываются локальные.
Проектирование классификаторов:
· классификация информации,
1 Проверка учредительных документов и формирования уставного капитала при проведении аудита - лекция, которая пользуется популярностью у тех, кто читал эту лекцию.
· кодирование информации.
Коды : цифры, буквы, буквенно – цифровые.
Классификатор, как минимум, содержит:
· код,
· наименование позиции.
Классификаторы используются при подготовке первичных документов к машинной обработке. Хранение классификаторов в ЭВМ позволяет автоматически формировать необходимую текстовую информацию в выходных сводках.