110575 (616272), страница 4
Текст из файла (страница 4)
2.1 Автоматизированное НСА в архиве (описи)
«В ГА РФ сложилась разветвленная система научно-справочного аппарата, дающая информацию о содержании документов, хранящихся в архиве на трех основных уровнях: фонд. дело, документ» 0. В ней представлены все типы архивных справочников как в традиционной форме (на бумажных носителях0, так и в электронных форматах. Весь научно-справочный аппарат архива создается с применением электронных технологий, при этом идет процесс создания и новых справочников (путеводителей, описей, каталогов, указателей), и перевод в электронный формат уже имеющихся традиционных справочников.
Основой научно-справочного аппарата архива, его самым верхним уровнем является многотомный электронный путеводитель по ГА РФ, охватывающий все фонды архива (более 6 тыс. записей включая Перечень фондов) и постоянно пополняющийся за счет описаний новых поступлений. Наличие такого путеводителя позволяет свободно ориентироваться во всем многообразии фондов, а их в архиве уже более 3 тыс., дает представление о структуре фондов, составе и содержании документов. И все же, в силу своего назначения, путеводитель может дать лишь общие сведения о документах.
Базовым архивным справочником все-таки остается архивная опись. Именно опись, раскрывая содержание документов на уровне дела, несет основную информационную нагрузку. Именно опись, являясь одновременно и учетным документом, закрепляет место каждого дела в определенном фонде, и этот «архивный адрес» сопровождает дело во всех его ипостасях, служит основой для составления других справочников и, в конечном итоге, для выдачи дел. «В настоящее время в 10132 описях ГА РФ сосредоточена информация о более 5,7 млн.дел» 0. Нет необходимости объяснять, что найти все требуемые дела среди такого количества довольно сложно, тем более, что они могут находиться в разных фондах и описях. Помочь здесь может только перевод описей в электронный формат и создание эффективной поисковой базы данных.
Вновь создаваемые описи при описании документов в стенах архива и при обработке документов в ведомствах имеются как в традиционном виде, так и в электронном формате. Таким образом, новые описи поступают в архив уже в электронном виде, правда, в основном в текстовом редакторе, но обработка такой информации для включения ее в информационно-поисковую систему архива значительно облегчена. «Опыт по созданию электронных описей вызывает интерес в архивной отрасли и в определенной степени использован в Методических рекомендациях ВНИИДАД» 0.
Имеет смысл более подробно остановиться на проблемах, связанных с ретроконверсией традиционных описей: организации работы, методах и методиках, проверке качества, возможности использования.
На первоначальном этапе этой работы все описи были проанализированы на предмет возможности и целесообразности их перевода в электронный формат, определены комплексы фондов, описи которых в первую очередь подлежат ретроконверсии. Решено, что в электронный формат должны переводиться фонды целиком, т.е. все открытые описи каждого выбранного фонда, включая личный состав.
Были изучены различные способы такого перевода: ввод непосредственно в базу данных (ручной набор), конвертирование в базу данных текста описи, набранного в текстовом редакторе, сканирование описей, распознавание текста с помощью специальных программ и последующее конвертирование. Предпочтение, учитывая различные факторы, включающие и особенности самих описей, и временные затраты, а также организационные и технические возможности, отдано двум первым способам как наиболее оптимальным.
Следует отметить, что для создания электронного научно-справочного аппарата архива большое значение имеет разработка единых для архива стандартных форм описания информации на трех уровнях: на уровне фонда, дела, документа. Для каждого уровня информации определен набор реквизитов (полей), основных и дополнительных, их типы и размеры, унифицировано их заполнение, что обеспечивает в дальнейшем их совместимость.
На основе разработанных перечней полей созданы основные таблицы баз данных в MS Access для всех уровней информации. Именно в таком виде и накапливается весь НСА архива, и этот информационный ресурс может быть использован для поиска информации как в рамках отдельных баз данных, так и в составе единой информационно-поисковой системы, а также для решения других задач, стоящих перед архивом.
Так для ввода информации из описей имеется единая таблица базы данных (дело). В отличие от традиционной описи, в которой информация о деле распределена по 6 графам (номер дела, делопроизводственный номер (индекс) дела, заголовок дела, крайние даты, количество листов, примечание), эта таблица состоит из 25 полей (14 основных, 11 дополнительных). Из 14 основных 7 полей (номер фонда, номер описи, номер дела, название фонда, заголовок дела, крайние даты, дата дела сортировочная) обязательны к заполнению в базе данных, остальные поля заполняются только при наличии соответствующих сведений.
6 полей представляют собой архивный адрес дела: номер фонда, номер описи, литера описи, номер дела и литера дела. При их заполнении имеет значение не только размер поля, его тип (числовое или символьное), но даже использование прописных или строчных букв, латинского шрифта или кириллицы. Строгое соблюдение единых требований при заполнении этих поле обеспечивает в дальнейшем возможность объединения баз данных, в том числе создания многоуровневых баз данных. Заполнение в базе полей «Название фонда» и «Название описи» позволяет полноценно использовать базу данных и локально, не связывая ее с электронными справочниками других уровней описания информации (путеводители, каталоги).
При наличии отдельного текстового поля для крайних дат дела введено специальное поле типа «дата» для систематизации записей по хронологии: «дата дела сортировочная». В связи с тем, что при машинной обработке информации не воспринимается неполная или неточная дата, при заполнении этого поля приняты некоторые условности и даны примеры их заполнения при различных вариантах датировки. Так, например, если имеется начальная и конечная даты дела, то проставляется начальная и наиболее ранняя дата. Если известен только год, то проставляется последнее число последнего месяца этого года (31.12.1919). Если известны только месяц и год, то проставляется последнее число указанного месяца (30.04.1919). В тех случаях, когда в оригинале описи графа «Крайние даты» не заполнена (дата вынесена в название описи, раздел описи) или проставлено Б/Д (без даты), поле «Дата дела сортировочная» заполняется в соответствии с этими датами или крайними датами описи.
Имеются некоторые особенности заполнения поля «Заголовок дела» в базе данных. Так при перечислении однородных заголовков дел не допускается применение формулировки «То же», принятой при оформлении листовой описи. Заголовок дела должен воспроизводиться полностью. При технически пропущенном номере дела в заголовке указывается: «номер пропущен». Отметка о выбывших делах указывается в поле «применение», при этом поле «Заголовок дела», как правило, заполняется.
Кроме того, имеется отдельное поле «Аннотация» куда могут вводится сведения уточняющие, раскрывающие состав и содержание документов дела, не изменяя при этом сам заголовок дела. Это может быть перечень вопросов, содержащихся в документах дела, перечень названий документов, характеристика документов по какой-либо теме и т.п. При усовершенствовании описей в данном поле можно привести так называемый «структурированный заголовок дела», повышающий информативность описи, не внедряясь при этом в сложившийся заголовок дела, что могло бы привести к усложнению описи как основного учетного документа и переоформлению обложек.
В базу данных «опись» введены 4 поля «раздел – уровень 1-4», где указываются названия разделов и подразделов описи в соответствии с ее внутренней структурой и систематизацией дел. Предусмотрена возможность четырех уровней систематизации. Каждый уровень (раздел) указывается в отдельном поле.
В базе данных имеются 4 дополнительных поля, в которые могут вводиться ключевые слова – дескрипторы для уточнения поиска информации и формирования алфавитных указателей по предметному признаку: география; персоналии; учреждения; ключевые слова (тематика).
Поля «оператор» и «дата заполнения» служат для учета работы.
Информация о делах, содержащихся в описях, переводится в электронный вид в полном соответствии с текстом оригинала, исправляются только явные опечатки. В отдельных случаях сотрудники архива проводят частичное редактирование заголовков, с обращением непосредственно к делам. Все вопросы, касающиеся учета дел (порядковый номер дела, итоговая запись), решаются в обязательном порядке с отделом сохранности и учета документов.
Работа по переводу описей в электронный формат, особенно в массовом порядке, должна включать обязательную проверку качества ввода информации. Может быть, более правильным было бы осуществление полной сверки (считки) базы данных с текстом оригинала, но это привело бы к значительным трудозатратам и снижению положительного эффекта от данной работы. Кроме того, в предложенных моделях ИПС всегда можно посмотреть электронный образ описи.
Проверка качества ввода информации проводится с максимально возможным применением средств Microsoft Access (путем составления различных запросов).
Проверяется полнота базы данных. С помощью запросов автоматически составляются перечни введенных фондов и описей, которые сверяются со списками описей, передаваемых для обработки. Проводится проверка соответствия названий фондов и описей их номерам. Весь проверяемый массив тестируется на наличие пустых записей, дублетных записей, не заполненных обязательных полей (номер фонда, номер описи, номер дела, название фонда, заголовок дела, крайние даты, дата дела сортировочная).
Таким образом, значение по созданию электронных описей очевидно, затраченные финансовые и трудовые ресурсы в дальнейшем окупятся. В результате этой работы архив получает не только электронные описи, но и выверенный электронный реестр описей по фондам архива, который является важной частью любой поисковой системы.
Наличие электронных описей открывает новые возможности их использования. Один раз введенная информация на уровне дела может многократно использоваться с самыми разными целями в различных информационно-поисковых системах и баз данных, во взаимодействии с другими электронными справочниками.
И все же самым важным преимуществом электронных описей, основной целью их создания является возможность сквозного поиска информации по заголовкам дел, всех описей, представленных в базе данных.
2.2 Электронный архив Газпромбанка
Около года назад компания Cognitive Technologies объявила о завершении внедрения электронного архива финансовых и организационно-распорядительных документов в филиалах КБ «Газпромбанк» по России.
Поставленная руководством «Газпромбанка» перед компанией Cognitive Technologies задача выглядела следующим образом: создание автоматизированной системы, предназначенной для обработки и архивирования банковских документов операционного дня и закрытых договоров, организации безбумажного архива документов, повышения надежности хранения документов и создания эффективной технологии оперативной работы с архивом документов.
Следует заметить, что КБ «Газпромбанк» — один из крупнейших коммерческих банков России, занимающий 3-е место по размеру чистых активов и 5-е место по размеру собственного капитала.
По мере увеличения объемов обрабатываемой информации в филиалах и отделениях Газпромбанка возникла потребность в применении новейших информационных технологий ввода, хранения и обработки документов, а также в обеспечении информационной безопасности при работе с конфиденциальными документами. Учитывая положительный опыт и высокий эффект, полученный от реализации данных технологий в центральном офисе, а также с целью унификации ПО, применяемого для ведения электронного архива в филиалах, руководством КБ «Газпромбанк» было принято решение распространить методику создания электронных архивов, разработанную компанией Cognitive Technologies, на все филиалы и отделения банка.
Компанией Cognitive Technologies было предложено решение: создание электронного архива на основе технологий архивации, поиска и извлечения документов (Евфрат/400 для AS/400), оптического распознавания CuneiForm, обработки изображений документов, потокового ввода документов и ввода стандартных форм документов Cognitive Forms.
В первую очередь была выполнена унификация ПО банковских электронных систем. Целями унификации ПО в центральном офисе и филиалах банка являлись:
минимизация средств на поддержку ПО;
объединение электронных архивов в одну распределенную систему;
использование новейших информационных технологий на базе Интернет/интранет-технологий (удаленное администрирование).
Аппаратное обеспечение разрабатываемой архивной системы включало в себя:
Сканер: базовая конфигурация, односторонний, устройство подачи и позиционирования оригиналов: Kodak ImageLink 500s (A4/A3, ADF 500 листов, разрешение до 300 dpi, скорость сканирования /A4, 200 dpi/-70 dpm);
Сервер: IBM AS/400 (ОС OS400, СУБД DB2/400);
ПЭВМ на рабочих местах конечных пользователей: Pentium*100/16-32MB RAM3.
В качестве программного обеспечения были выбраны следующие программы:
ПО сканера: Kodak HV Capture 2.04; ЭА Евфрат/400 для IBM AS/400; Евфрат/400 – Сервер; Евфрат/400 – Клиент; Евфрат/400 - Администратор Системы; Евфрат/400 - Администратор Безопасности; Система распознавания: CuneiForm; Система ввода стандартных форм документов: Cognitive Forms; Сетевая ОС: NetWare, Windows NT; Автоматизированная Банковская Система: Диасофт – Банк.
Компанией Cognitive Technologies была проделана большая работа по адаптации существовавшей версии центрального электронного архива «Газпромбанка» под цели данного проекта. Были выполнены:
создание инсталлятора архива для тиражирования в филиалах;
адаптация под сканеры компаний Kodak и Fujitsu;
добавление элемента удаленного администрирования из центрального офиса архивов в филиалах;