Машинная информационная база
Тема 9. Машинная информационная база автоматизированных библиотечно-информационных систем
Внутримашинное информационное обеспечение включает информационную базу на машинном носителе и средства ее ведения. Данное обеспечение должно реализоваться в режиме реального времени, где изменения в данных, произведенные одним пользователем, сразу должны становиться доступными другим пользователям системы.
Вся информация, хранящаяся во внутримашинной информационной базе, делится на следующие группы: предметная информация; каталоги; вспомогательные тексты; справочники; управляющие таблицы; протокольная информация.
Первая группа составляет основу базы данных, в нее входят все массивы данных и информации, необходимой для персонала и пользователей.
Среди массивов второй группы основную роль играет генеральный каталог, формируемый в виде индексной таблицы, структура которой может меняться для различных конфигураций системы с учетом структуры и объема информации в предметной области. Кроме того, предусматривается формирование частных каталогов по отдельным носителям и видам информации, что позволяет организовать дополнительный сервис для пользователя и обеспечить резервирование накопителей.
Вспомогательные тексты обеспечивают диалоговый режим работы системы. Так, совокупность кодограмм представляет собой машинный справочник по структуре данных и способам их кодирования.
Инструктивные документы позволяют с помощью соответствующих аппаратнопрограммных средств вызова выполнять «программируемое обучение» путем общения с подсистемой. Редактирующие тексты предназначаются для оформления выходных записей, а сигнальные – для информирования о различных нештатных ситуациях (отсутствие требуемой информации, сбой и др.).
В состав информационного обеспечения входят также цифровые справочники для перехода от одной системы кодирования к другой и текстовые справочники для расшифровки цифровых кодов.
Во всех режимах используются специальные управляющие таблицы, описывающие структуру и размещение информации (описание массивов и записей), схему трансляции и контроля запросов, реакции на внештатные ситуации. И наконец, предусматривается формирование и накопление массива информации протокольного типа.
Существенное влияние на эффективность информационного обеспечения оказывают проектные решения внутримашинной части информационной базы.
Известно, что в действующих современных АСУ можно выделить два основных вида организации внутримашинной части ИБ: пофайловую организацию массивов данных (по ГОСТ 20886–85 файл – совокупность данных, которая состоит из логических записей, относящихся к одной теме) и организацию на основе баз данных.
Пофайловая организация предусматривает создание специализированных на решение конкретных задач массивов данных, при этом осуществляется жесткая привязка данных к алгоритмам преобразования и реализующим эти алгоритмы программам, что затрудняет процесс пользования информационной базой и реализацию задач, инициируемые з форме запросов. Существенным недостатком пофайловой организации является избыточность информации, поскольку для решения различных задач часто записываются одни и те же данные. Применение пофайловой организации данных и в настоящее время объясняется высокой скоростью обработки данных, поскольку структура и организация файла соответствуют логике его обработки программой.
Общепризнана перспективность для практически любых автоматизированных систем обработки информации создания баз данных, в той или иной степени исключающего недостатки пофайловой организации. В соответствии с ГОСТ 24.003–84 база данных АСУ – это «совокупность используемых при функционировании АСУ данных, организованная по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, и независимая от прикладных программ».
В определении подчеркивается одно из основных свойств баз данных – их «независимость» от прикладных программ. Последнее означает, что изменение одних программ не приводит к изменению других. Таким образом, обеспечивается относительная простота добавления новых или модификация хранимых данных, а также возможность применения общего управляемого способа поиска данных.
К сожалению, в определении не отмечено другое важнейшее свойство организации ИБ на основе баз данных – минимальная избыточность данных, поскольку, в принципе, одними и теми же данными можно пользоваться при решении различных задач.
Внутримашинное информационное обеспечение включает макеты (экранные формы) для ввода первичных данных в ЭВМ или вывода результатной информации, и структуры информационной базы: входных, выходных файлов, базы данных.
Под электронными формами документов понимается не изображение бумажного документа, а изначально электронная (безбумажная) технология работы; она предполагает появление бумажной формы только в качестве твердой копии документа.
Электронная форма документа (ЭД) – это страница с пустыми полями, оставленными для заполнения пользователем. Формы могут допускать различный тип входной информации и содержать командные кнопки, переключатели, выпадающие меню или списки для выбора.
Информационная база и способы ее организации
Основной частью внутримашннного информационного обеспечения является информационная база. Информационная база (ИБ) – это совокупность данных, организованная определенным способом и хранимая в памяти вычислительной системы в виде файлов, с помощью которых удовлетворяются информационные потребности управленческих процессов и решаемых задач.
Все файлы ИБ можно классифицировать по следующим признакам:
- по этапам обработки (входные, базовые, результатные);
- по типу носителя (на промежуточных носителях – гибких магнитных дисках и магнитных лентах и на основных носителях – жестких магнитных дисках, магнитооптических дисках и др.);
- по составу информации (файлы с оперативной информацией и файлы с постоянной информацией);
- по назначению (по типу функциональных подсистем);
- по типу логической организации (файлы с линейной и иерархической структурой записи, реляционные, табличные);
- по способу физической организации (файлы с последовательным, индексным и прямым способом доступа).
Входные файлы создаются с первичных документов для ввода данных или обновления базовых файлов. Файлы с результатной информацией предназначаются для вывода ее на печать или передачи по каналам связи и не подлежат долговременному хранению.
К числу базовых файлов, хранящихся в информационной базе, относят основные, рабочие, промежуточные, служебные и архивные файлы.
Основные файлы должны иметь однородную структуру записей и могут содержать записи с оперативной и условно-постоянной информацией. Оперативные файлы могут создаваться на базе одного или нескольких входных файлов и отражать информацию одного или нескольких первичных документов. Файлы с условно-постоянной информацией могут содержать справочную, расценочную, табличную и другие виды информации, изменяющейся в течение года не более чем на 40%, а следовательно, имеющие коэффициент стабильности не менее 0,6.
Файлы со справочной информацией должны отражать все характеристики элементов материального производства (материалы, сырье, основные фонды, трудовые ресурсы и т.п.). Как правило, справочники содержат информацию классификаторов и дополнительные сведения об элементах Материальной сферы, например о ценах. Нормативно-расценочные файлы должны содержать данные о нормах расхода и расценках на выполнение операций и услуг. Табличные файлы содержат сведения об экономических показателях, считающихся постоянными в течение длительного времени (например, процент удержания, отчисления и пр.). Плановые файлы содержат плановые показатели, хранящиеся весь плановый период.
Рабочие файлы создаются для решения конкретных задач на базе основных файлов путем выборки части информации из нескольких основных файлов с целью сокращения времени обработки данных.
Промежуточные файлы отличаются от рабочих файлов тем, что они образуются в результате решения экономических задач, подвергаются хранению с целью дальнейшего использования для решения других задач. Эти файлы, так же как и рабочие файлы, при высокой частоте обращений могут быть также переведены в категорию основных файлов.
Служебные файлы предназначаются для ускорения поиска информации в основных файлах и включают в себя справочники, индексные файлы и каталоги.
Архивные файлы содержат ретроспективные данные из основных файлов, которые используются для решения аналитических, например прогнозных, задач. Архивные данные могут также использоваться для восстановления информационной базы при разрушениях.
Организация хранения файлов в информационной базе должна отвечать следующим требованиям:
- полнота хранимой информации для выполнения всех функций управления и решения экономических задач;
- целостность хранимой информации, т. е. обеспечение непротиворечивости данных при вводе информации в ИБ;
- своевременность и одновременность обновления данных во всех копиях данных;
- гибкость системы, т.е. адаптируемость ИБ к изменяющимся информационным потребностям;
- реализуемость системы, обеспечивающая требуемую степень сложности структуры ИБ;
- релевантность ИБ, под которой подразумевается способность системы осуществлять поиск и выдавать информацию, точно соответствующую запросам пользователей;
- удобство языкового интерфейса, позволяющее быстро формулировать запрос к ИБ;
- разграничение прав доступа, т.е. определение для каждого пользователя доступных типов записей, полей, файлов и видов операций над ними.
Существуют следующие способы организации ИБ: совокупность локальных файлов, поддерживаемых функциональными пакетами прикладных программ, и интегрированная база данных, основывающаяся на использовании универсальных программных средств загрузки, хранения, поиска и ведения данных, т.е. системы управления базами данных (СУБД).
Локальные файлы вследствие специализации структуры данных под задачи обеспечивают, как правило, более быстрое время обработки данных. Однако недостатки организации локальных файлов, связанные с большим дублированием данных в информационной системе и, как следствие, несогласованностью данных в разных приложениях, а также негибкостью доступа к информации, перекрывают указанные преимущества. Поэтому организация локальных файлов может применяться только в специализированных приложениях, требующих очень высокой скорости реакции при импорте необходимых данных.
Интегрированная ИБ, т.е. база данных (БД) – это совокупность взаимосвязанных, хранящихся вместе данных при такой минимальной избыточности, которая допускает их использование оптимальным образом для множества приложений.
Централизация управления данными с помощью СУБД обеспечивает совместимость этих данных, уменьшение синтаксической и семантической избыточности, соответствие данных реальному состоянию объекта, разделение хранения данных между пользователями и возможность подключения новых пользователей. Но централизация управления и интеграция данных приводят к проблемам другого характера: необходимости усиления контроля вводимых данных, необходимости обеспечения соглашения между пользователями по поводу состава и структуры данных, разграничения доступа и секретности данных.
Основными способами организации БД являются создание централизованных и распределенных БД. Основным критерием выбора способа организации ИБ является достижение минимальных трудовых и стоимостных затрат на проектирование структуры ИБ, программного обеспечения системы ведения файлов, а также на перепроектирование ИБ при возникновении новых задач.