8. Внемашинная информационная база

Тема 8. Внемашинная информационная база автоматизированных библиотечно-информационных систем

   Внемашинное информационное обеспечение включает различные документы на бумажных носителях (договора, приказы, распоряжения, отчеты, приходно-расходные ордера и др.).
   Всю информацию, которая используется в АС можно разделить на:

  • Нормативно-справочную;
  • Входную оперативную;
  • Производную, в том числе и статистическую.


   К нормативно-справочной информации относятся:

  • Системы классификации и кодирования (СКК) и классификаторы (Кл);
  • Стандарты;
  • Нормативные и руководящие документы;
  • И др.

   СКК – это способ разделения некоторого множества на классы и правила определения для каждого элемента каждого класса некоторого уникального идентификатора – кода.
   Наиболее распространенными являются следующие СКК:

  • Порядковая;
  • Иерархическая – дерево. Типичный пример – УДК;
  • Фасетная – по нескольким независимым признакам;
  • Смешанная.

   Кл бывают: международные; национальные; отраслевые; предприятия.
   Для того чтобы обеспечить эффективный поиск, обработку на ЭВМ и передачу по каналам связи технико-экономической информации, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать) с использованием классификатора.
   Классификация – это разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами. Классификация фиксирует закономерные связи между классами объектов. Под объектом понимается любой процесс, предмет или явление.
   Свойство или характеристика объекта классификации, которое позволяет установить его сходство или различие с другими объектами классификации, называется признаком классификации. Например, признак «роль предприятия-партнера в отношении деятельности объекта автоматизации» позволяет разделить все предприятия на две группы (на два подмножества): «поставщики» и «потребители». Множество или подмножество, объединяющее часть объектов классификации по одному или нескольким признакам, носит название классификационной группировки.
   Классификатор – это документ, с помощью которого осуществляется формализованное описание информации в ИС, содержащей наименования объектов, наименования классификационных группировок и их кодовые обозначения.
   По сфере действия выделяют следующие виды классификаторов: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.
   Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязательны для передачи информации между орга­низациями разных стран мирового сообщества.
   Общегосударственные (общесистемные) классификаторы, обязательны для организации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны.
   Отраслевые классификаторы используют для выполнения процедур обработки информации и передачи ее между организациями внутри отрасли.
   Локальные классификаторы используют в пределах отдельных предприятий.
   Каждая система классификации характеризуется следующими свойствами:

  • гибкостью системы;
  • емкостью системы;
  • степенью заполненности системы.

   Гибкость системы – это способность допускать включение новых признаков, объектов без разрушения структуры классификатора. Необходимая гибкость определяется временем жизни системы.
   Емкость системы – это наибольшее количество классификационных группировок, допускаемое в данной системе классификации.
   Степень заполненности системыопределяется как частное от деления фактического количества группировок на величину емкости системы.
    Иерархическая классификация
   В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная.
   При использовании иерархического метода классификации происходит «последовательное разделение множества объектов на подчиненные, зависимые классификационные группировки». Получаемая на основе этого процесса классификационная схема имеет иерархическую структуру. В ней первоначальный объем классифицируемых объектов разбивается на подмножества по какому-либо признаку и детализируется на каждой следующей ступени классификации.
   Построение иерархической классификации объектов проходит в следующей последовательности:

  • определяется множество объектов, которое необходимо классифицировать для решения конкретных задач (множество заболеваний, медицинских учреждений, фармацевтических предприятий, простых медицинских услуг и т.д.);
  • выделяются основные признаки (свойства, характеристики, показатели, параметры и др.), по которым множество будет разделяться на подмножества;
  • выбирается порядок следования признаков – уровень деления;
  • определяется оптимальное количество уровней как с точки зрения удобства построения классификатора, так и с точки зрения удобства его дальнейшего практического применения.

   Наиболее важными правилами при построении иерархической классификации являются:

  • разделение множества на подмножества на каждом уровне производится только по одному признаку деления;
  • получаемые в результате деления группировки на каждом уровне относятся только к одной вышестоящей группировке и не пересекаются, т.е. не повторяются;
  • разделение множества осуществляется без пропусков очередного или добавления промежуточного уровня деления;
  • классификация производится таким образом, чтобы сумма образованных подмножеств составляла делимое множество.

   Наиболее существенными и сложными вопросами, возникающими при построении иерархической классификации, считаются выбор системы признаков, используемых в качестве основания деления, и определение порядка их следования. В основу иерархической классификации закладываются признаки, являющиеся необходимыми в решении конкретных задач, для которых она создается. При этом последовательность признаков определяется по принципу "от общего к частному" с учетом приоритетной вероятности обращений к разным уровням деления при решении конкретных задач.
    Фасетная классификация
   Недостатки, отмеченные в иерархической системе, отсутствуют в других системах, которые относятся к классу многоаспектных систем классификации.
   Аспект – точка зрения на объект классификации, который характеризуется одним или несколькими признаками. Многоаспектная система – это система классификации, которая использует параллельно несколько независимых признаков (аспектов) в качестве основания классификации. Существуют два типа многоаспектных систем: фасетная и дескрипторная. Фасет – это аспект классификации, который используется для образования независимых классификационных группировок. Дескриптор – ключевое слово, определяющее некоторое понятие, которое формирует описание объекта и дает принадлежность этого объекта к классу, группе и т.д.
   Под фасетным методом классификации понимается «параллельное разделение множества объектов на независимые классификационные группировки». При этом методе классификации заранее жесткой классификационной схемы и конечных группировок не создается. Разрабатывается лишь система таблиц признаков объектов классификации, называемых фасетами. При необходимости создания классификационной группировки для решения конкретной задачи осуществляется выборка необходимых признаков из фасетов и их объединение в определенной последовательности.
   Внутри фасета значения признаков могут просто перечисляться по некоторому порядку или образовывать сложную иерархическую структуру, если существует соподчиненность выделенных признаков.
   Последовательность построения фасетной классификации такая же, как и при построении иерархической классификации:

  • определяется множество объектов;
  • выделяются основные признаки и группы признаков этого множества;
  • выбирается порядок следования групп признаков (фасетов) и признаков – характеристик.

   Для вычленения из множества объектов конкретного подмножества, обладающего определенными признаками, необходимо:

  • выделить основные признаки (характеристики), всесторонне характеризующие объект и обеспечивающие его идентификацию;
  • сгруппировать их по принципу однородности в фасеты;
  • присвоить им коды;
  • определить фасетные формулы для образования подмножеств.

   При фасетном методе построения классификаторов подмножества формируются "от частного к общему", т.е. на основе различных наборов конкретных характеристик объекта формируются конкретные подмножества.
   Основными правилами при создании фасетной классификации являются:

  • признаки в различных фасетах не пересекаются, т.е. каждый признак отличается от другого по наименованию, значению и кодовому обозначению;
  • из общего числа фасетов, характеризующих множество объектов, выбираются фасеты, необходимые для решения поставленных задач, и устанавливается их строгая последовательность (фасетная формула).

   В современных классификационных схемах часто одновременно используются оба метода классификации. Это снижает влияние недостатков методов классификации и расширяет возможность использования классификаторов в информационном обеспечении управления.
   Для поиска показателей и документов по набору содержательных признаков используется информационный язык дескрипторного типа, которой характеризуется совокупностью терминов (дескрипторов) и набором отношений между терминами.
   Содержание документов или показателей можно достаточно полно и точно отразить с помощью списка ключевых слов – дескрипторов.
   Дескриптор – это термин естественного языка (слово или словосочетание), используемый при описании документов или показателей, который имеет самостоятельный смысл и неделим без изменения своего значения.
   Для того чтобы обеспечить точность и однозначность поиска с помощью дескрипторного языка, необходимо предварительно определить все постоянные отношения между терминами: родовидовые, отношения синонимии, омонимии и полисемии, а также ассоциативные отношения.
   В процессе аналитико-синтетической переработки газетного текста «Казанских извecтий» описывалась информация каждой единицы содержания в соответствии с разработанной системой классификации. Систематизация содержания газеты осуществлялась последующим аспектам: виду информации, сфере общественной жизни, персонам (именам, встречающиеся в газете), учреждениям, географическим названиям мест, датам событий, приведенным в тексте. Внутри фасетов значения признаков либо просто перечисляются, либо образуют иерархическую структуру, если существует соподчиненность выделенных признаков.

   Фасет «Вид информации» содержит перечень видов опубликованных в газете материалов и может быть представленным в виде следующей иерархической структуры:

   Официальные материалы

  • Дипломатические и др. документы и официальные письма;
  • О чинопроизводстве, прохождении службы, наградах;
  • Законодательные материалы;
  • О родившихся и умерших в губерниях, входивших в Казанский учебный округ;

   Сообщения

  • О Международных отношениях;
  • О вооруженных конфликтах:
  • О внутреннем положении и общественно-политической жизни;
  • Дворцовая и светская хроника;
  • О стихийных бедствиях, эпидемиях и явлениях природы;
  • Об отъезжающих из Казани и приезжающих в Казань.

   Объявления

  • О купле/продаже;
  • О найме/предложении рабочей силы;
  • Об аренде помещений и др. собственности;
  • О зрелищах и развлечениях;
  • О подписке на печатные издания (книги и периодические издания).

   Финансово-экономическая информация

  • Вексельный и денежный курсы;
  • О ценах, установленных полицией;
  • О сплаве грузов;
  • О таможенных сборах;
  • О ценах.

   Статьи и другие материалы

  • Статьи естественного направления (химия, физика, естественная история);
  • Статьи гуманитарного направления (история, археология, этнография, словесность, экономика);
  • Ученые известия;
  • Художественные произведения (стихи, курьезы и чудеса, оды, повести, остроумные изречения, анекдоты, главы из книги и др.);
  • Публицистика;
  • Речи;
  • Описание увеселений (городские праздники);
  • О разном;
  • Описание церемоний (общественных торжеств, городских событий)

   Разное

  • Статистические данные;
  • Некрологи;
  • Метеонаблюдения;
  • От редакции (опровержения, исправление опечаток и т. д.);
  • Полезные советы

   Фасет «Сферы общественной жизни» содержит:

  • Торговля (ярмарки, таможня);
  • Промышленность;
  • Сельское хозяйство, промысловая деятельность;
  • Строительство. Благоустройство городов;
  • Культура (литература, театры, музыка, живопись, архитектура, скульптура, общественные развлечения);
  • Коммуникации (перевозки, транспорт, почта);
  • Просвещение;
  • Наука и техника (новые изобретения, новые технологии);
  • Здравоохранение; Благотворительность;
  • Религии;
  • Быт и нравы. Уголовная хроника.

   Совместное использование перечисленных выше аспектов рассмотрения газетных материалов позволяет получить самые разнообразные тематические комбинации.
   В библиографической работе используются главным образом иерархические и фасетные классификации, а также предметные информационно-поисковые языки (ИПЯ).
   Иерархические классификации – самые традиционные. Они имеют структуру «древа знаний», в котором определенная совокупность знаний (универсум) последовательно делится на все более узкие подклассы. Существует много универсальных иерархических классификаций, охватывающих сразу все отрасли человеческих знаний.
   В библиографической практике наиболее широко используются Библиотечно-библиографическая классификация (ББК), Универсальная десятичная классификация (УДК), Классификация для массовых библиотек и некоторые другие.
   Фасетные классификации отличаются от иерархических тем, что в них вместо одного обширного «древа знаний» создается параллельно несколько иерархических структур (фасетов), соответствующих основным аспектам библиографируемого массива документов. Затем из этих фасетов выбираются соответствующие подразделения, которые в совокупности и образуют сложный класс, многоаспектно характеризующий библиографируемый (и индексируемый) документ.
   Первая фасетная классификация (Классификация двоеточием) была разработана известным индийским библиографом и библиотекарем Ш. Р. Ранганатаном в 1933г.

    Кодирование
   Кодирование представляет собой образование по определенным правилам кодов присвоение их объекту или группе объектов, позволяющее заменить несколькими знаками (символами) наименования этих объектов. С помощью кодов обеспечивается идентификация объектов максимально коротким способом, т.е. с помощью минимального числа знаков. Минимизация количества знаков, идентифицирующих объекты, способствует повышению эффективности сбора, учета, хранения, обработки (анализа) информации.
   Кодовое обозначение характеризуется:

  • алфавитом кода;
  • структурой кода;
  • числом знаков - длиной кода;
  • методом кодирования.

   Алфавит кода представляет собой систему знаков (символов), составленных в определенном порядке, куда могут входить цифры, буквы и другие знаки, имеющиеся а клавиатуре печатающего устройства. Коды бывают цифровые, буквенные и смешанные - буквенно - цифровые.
   Структура кода представляет собой, как правило, графическое изображение последовательности расположения знаков кода и соответствующие этим знакам наименования уровней деления. Обычно структура кода представляется в нормативном документе как "ХХ.ХХ".
   Число знаков в коде определяется его структурой и зависит от количества объектов, входящих в подмножества, образуемые на каждом уровне деления. При определении числа знаков на каждом уровне деления необходимо иметь в виду возможность появления новых объектов и предусматривать резервные емкости кода.
   Части кода разделяются между собой точкой, после последней цифры кода точка не ставится. Обозначение года в коде ставится в конце, отделяется дефисом и имеет емкость 4 знака, т.е. "ХХ.ХХ-20ХХ".
   Методы кодирования в значительной степени связаны с методами разделения множества на подмножества. При разработке структуры кода важно выбрать оптимальное соотношение между уровнями деления и числом знаков в каждом разряде кода. При этом коды должны удовлетворять следующим основным требованиям:

  • однозначно идентифицировать объекты и (или) группы объектов, т.е. являться идентификаторами;
  • иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (признаков) заданного множества;
  • иметь достаточный резерв для кодирования вновь возникающих объектов кодируемого множества;
  • обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.

   Классификационные методы кодирования разделяются на два типа: последовательный и параллельный. Последовательный метод следует использовать при иерархическом методе классификации. Множество разделяется на подмножества в нужной последовательности, и кодовое обозначение строится по заданной структуре, определяющей последовательность и количественный состав признаков на каждом уровне деления.
   Параллельный (независимый) метод используют при фасетной классификации объектов. Коды присваиваются фасетам и признакам независимо друг от друга. Структура кодового обозначения определяется фасетной формулой.
   Кодирование при обоих методах осуществляется путем присвоения порядковых номеров, причем параллельный метод может успешно применяться при иерархическом методе классификации, когда одинаковыми кодами кодируются одинаковые объекты (признаки), находящиеся на одном уровне деления, но в разных подмножествах.
   При фасетной классификации коды признаков, входящих в отдельные фасеты, представляют собой, как правило, порядковые номера либо строятся на основе классификационных методов кодирования.
   Выбор методов классификации и кодирования в каждом конкретном случае осуществляется разработчиком классификатора, возможны комбинации как принципов классификации, так и методов кодирования. Выбор комбинации зависит от назначения классификатора, решаемых им конкретных задач, специфики информации и области применения.

    Понятие унифицированной системы документации
   Основной компонентой внемашинного информационного обеспечения ИС является система документации, применяемая в процессе управления объектом. Под документом понимается определенная совокупность сведений, используемая при решении конкретных задач, расположенная на материальном носителе в соответствии с установленной формой.
   Система документации – это совокупность взаимосвязанных форм документов, регулярно используемых в процессе управления экономическим объектом. Отличительной особенностью системы экономической документации является большое разнообразие видов документов.
   Существующие системы документации, характерные для неавтоматизированных ИС, отличаются большим количеством разных типов форм документов, большим объемом потоков документов и их запутанностью, дублированием информации в документах и работ по их обработке и, как следствие, низкой достоверностью получаемых результатов. Для того чтобы упростить систему документации, используют следующие два подхода:

  • проведение унификации и стандартизации документов;
  • введение безбумажной технологии, основанной на использовании электронных документов и новых информационных технологий их обработки.

   Унификация документов выполняется путем введения единых форм документов. Таким образом, вводится единообразие в наименования показателей, единиц измерения и терминов, в результате чего получается унифицированная система документации.
   Унифицированная система документации (УСД) – это рационально организованный комплекс взаимосвязанных документов, который отвечает единым правилам и требованиям и содержит информацию, необходимую для управления некоторым экономическим объектом. По уровням управления, они делятся на межотраслевые системы документации, отраслевые и системы документации локального уровня, т. е. обязательные для использования в рамках предприятий или организаций.

   Любой тип УСД должен удовлетворять следующим требованиям:

  • документы, входящие в состав УСД, должны разрабатываться с учетом их использования в системе взаимосвязанных ЭИС;
  • УСД должна содержать полную информацию, необходимую для оптимального управления тем объектом, для которого разрабатывается эта система;
  • УСД должна быть ориентирована на использование средств вычислительной техники для сбора, обработки и передачи информации;
  • УСД должна обеспечить информационную совместимость ЭИС различных уровней:
  • все документы, входящие в состав разрабатываемой УСД, и все реквизитыпризнаки в них должны быть закодированы с использованием международных, общесистемных или локальных классификаторов.

 


Рекомендуемые лекции