49285 (666212), страница 2
Текст из файла (страница 2)
Система управления диалогом пользователя. Функционирование ГИС как целостной системы обеспечивается системой управления диалогом пользователя. Данный блок осуществляет взаимосвязь между отдельными подсистемами ГИС, организуя диалоговое взаимодействие пользователя с системой. В зависимости от решаемой задачи выполняется автоматическая настройка ГИС на ее решение. Для этого из банка моделей выбирается необходимая модель, из информационного блока все необходимые данные.
Диалоговый режим ГИС рассчитан на пользователей различной степени подготовленности: прикладных программистов, аналитиков и исследователей и случайных пользователей. Для каждого типа пользователя выбирается свой уровень ведения диалога.
Блок оценки и принятия решений. Результаты работы ГИС анализируются в блоке оценки и принятия решений. Следует отметить, что система управления диалогом пользователя неразрывно связана с блоком оценки и принятия решений посредством формирования набора сценариев, выборов методов отображения (табличного, картографического) получаемых результатов.
Блок оценки, как и диалоговая система, рассчитан на различные режимы работы ГИС. Наиболее простой – это использование ГИС как информационно-справочной системы, более сложный, касается разработки автоматизированной методики анализа результатов имитационного моделирования.
Выбор сценариев напрямую связан с оценкой геоэкологических ситуаций и во многом опирается на знание эксперта о наиболее типичных или вероятных условиях поведения изучаемого природного объекта под воздействием возмущающих факторов.
В современных системах контроля и управления качеством окружающей среды важное место занимает оперативность получения результатов машинного прогнозирования. ЛПР требуется в сжатые сроки просмотреть различные сценарии моделирования, проанализировать полученные результаты и предложить наиболее оптимальные управленческие решения, опирающиеся на результаты работы моделей ГИС.
2. Базы данных
Большие объемы первичной геоинформации, регистрируемой как четырех уровнях наблюдения, требуют организации их хранения в памяти микро-, мини- и супер-ЭВМ по специальным правилам и принципам, позволяющим осуществлять многократное к ним обращение с целью использования данных для обработки и интерпретации, выбора стратегии дальнейших прогнозно-поисковых или разведочно-эксплуатационных работ, принятия по результатам обработки и интерпретации оптимальных управленческих решений.
При этом важно, чтобы организация данных и их хранение в различных технических средствах [микро-ЭВМ («Искра», «Электроника», IBM и др.) в режиме персонального компьютера, мини-ЭВМ (СМ ЭВМ, БВК (СМ-1), управляющие вычислительные комплексы УВК (СМ-2, СМ-4, СМ-1420, СМ-1810 и др.), а также супер-ЭВМ (экспедиционные вычислительные комплексы ЭГВК ПС-2000 и СМ-2, ЕС-10/55 и др.)] отличались единой технологией, обеспечивая возможность их использования для решения различных геологических задач с учетом различия технических средств. Рассмотрим понятия базы данных, различных типов баз данных и их взаимодействия между собой.
2.1 Понятие о базе данных
Описания данных и отношений между ними определяют двумя типами: логическое и физическое. Физическое описание данных обеспечивается физической записью данных на внешних носителях (магнитных лентах, дисках, дискетах и т.д.) и представляет способ хранения информации на этих носителях.
Логическое описание данных указывает на то, в каком виде данные представляет себе пользователь, программист, и задача геоинформатики состоит именно в анализе логического описания геоданных и их взаимоотношений между собой для дальнейших операций хранения, передачи и обработки.
Согласно определениям Ассоциации по языкам систем обработки данных (CODASYL) выделяют следующие описания данных.
Байт – наименьшая адресуемая группа битов (8 битов).
Элемент данных – наименьшая единица поименованных данных, которая может состоять из любого количества битов или байтов. Элемент данных – это любая (одна) характеристика изучаемого объекта, в том числе и его координаты; элемент имеет имя (идентификатор).
Агрегат данных – поименованная совокупность элементов данных. Выделяются два типа агрегатов: вектор ~ одномерная упорядоченная совокупность элементов (например, название района работ, номер профиля, номер точки наблюдения образуют агрегат данных) и повторяющаяся группа – совокупность векторов, встречающихся несколько раз подряд, например, когда данные описываются таким образом, что сначала указываются номера профилей, а затем номера точек, т.е. повторяется пара: профиль – точка, профиль – точка и т.д.
Запись данных ~ поименованная совокупность элементов или агрегатов данных. Совокупность элементов описывается так, как это представляется программисту, причем логическая запись может не совпадать с физической, поскольку логическая запись состоит из элементов, расположенных в других физических записях.
Элементы записи – это характеристики (признаки, координаты) одного объекта, в частности, одной точки наблюдения. Каждая запись описывается именем (идентификатором) и форматом хранения, определяющим способ упаковки элемента записи на ленту, диск, дискету. При чтении из базы данных программист может полностью прочитать логическую запись.
Файл – поименованная совокупность всех экземпляров логических записей заданного типа. Если запись представляет описание различных характеристик объекта или точки наблюдения, то файл – это совокупность тех же характеристик по нескольким объектам или по профилю наблюдений, т.е. файл – это матрица – таблица исходных данных.
База данных (БД) – совокупность записей различного типа, содержащая перекрестные ссылки, или иначе – это совокупность экземпляров различных типов записей и отношений между записями, элементами, агрегатами. БД – это также совокупность матриц – таблиц (файлов) и программ, определяющих отношения между типами данных.
База данных, по другому распространенному в геофизике определению – это совокупность массивов данных на внешних носителях и программных средств доступа к ним, где под массивами подразумеваются и запись, и файлы. Действительно, геофизические, геохимические и геологические пакеты программ включают данные разных типов: полевые наблюдения, информацию об изучаемом объекте и системе наблюдений; промежуточные результаты обработки; параметры обработки; программно-сформированные изображения выводимых результатов и т.д.
Физическая организация БД, в отличие от логической, – это физическое представление данных и их расположение на запоминающих устройствах.
База данных организуется таким образом, что данные собираются однажды и централизованно хранятся так, чтобы они были доступны всем специалистам-программистам, желающим их использовать. Одно из важных свойств БД – независимость данных от особенностей прикладных программ, которые их используют. Это означает, что изменение значений данных или особенностей их хранения на физических носителях не требует изменения прикладных программ.
В понятие БД включается система управления базой данных (СУБД), предназначенная для выполнения операций по обработке данных в прикладных программах. СУБД просматривает описание физической организации БД и определяет, какую физическую запись (записи) требуется считать, при этом СУБД выдает операционной системе ЭВМ команду чтения требуемой записи.
Нередко понятия БД и СУБД объединяют в одно понятие банк данных.
Понятие базы данных неразрывно связано со структурой ее построения (выделяют иерархические, сетевые и реляционные БД), языком манипулирования данными и языком описания данных.
Язык описания данных (ЯОД) – средство объявления СУБД тех структур, которые будут использоваться при обработке. ЯОД включается в программное описание ЭВМ. ЯОД для логического описания должен идентифицировать типы данных (элемент, запись, файл), т.е. присваивать имя каждому типу данных.
Язык манипулирования данными (ЯМД) – это интерфейс (стыковка) между прикладной программой и СУБД. ЯМД включает ряд программ, осуществляющих открытие или закрытие файла, замену или удаление отдельных записей из файла (или самого файла), передачу в рабочую область программы содержимого указанного элемента данных и т.д.
Среди структур построения БД наиболее распространены в геологоразведке реляционные БД. Реляционные БД – это табличное представление данных, обычно в виде двумерных таблиц. Каждый элемент таблицы – это один элемент данных, повторения здесь отсутствуют. Все столбцы таблиц – однородные, т.е. элементы столбца имеют одинаковую природу (значения одного и того же поля, свойства, параметра и т.д.). Каждому столбцу присвоены имена. В таблице нет двух одинаковых строк, поскольку координаты точек наблюдения разные. В операциях с таблицей ее строки и столбцы могут рассматриваться в любом порядке, в любой последовательности. Все наиболее применяемые таблицы при, геолого-геофизических исследованиях, например, таблица петрофизических свойств горных пород, таблица описания физико-геологической модели объекта (месторождения) и т.д., удовлетворяют указанным свойствам. Подобные таблицы называются отношением, а база данных, построенная с помощью отношений называется реляционной. Таким образом, реляционная БД строится из плоских наборов элементов данных (рис. 2, а). В реляционных БД встречаются термины: домен (один столбец таблицы) и кортеж – таблица, определяющая взаимосвязь между элементами. данных. Иначе, кортеж – набор взаимосвязанных величин, а файл образуется из набора кортежей.
Основные преимущества реляционных БД: простота, гибкость, точность, связность, простота внедрения, независимость данных от прикладных программ, ясность.
Распространенными структурами БД в геологоразведке являются также иерархические или древовидные структуры (см. рис. 2, б). Дерево – это иерархия элементов, называемых узлами. На верхнем (первом) уровне иерархии находится один узел – корень. Каждый узел, кроме корня, связан с одним узлом на более верхнем уровне, называемом исходным узлом для данного узла. Ни один элемент не имеет более одного исходного. Каждый элемент может быть связан с одним или несколькими элементами на более низком уровне. Такие элементы называются порожденными, а элементы, не имеющие в конце ветви порожденных, называются листьями.
Используется термин иерархический файл, т.е. такой файл, в котором записи связаны в виде древовидной структуры. Иерархические структуры БД использованы в автоматизированной системе АСПО-8 и в концепции создания банка «Разведочная геофизика».
Редко используется так называемые сетевые структуры БД, приведенные на рис. 2, в.
В трех приведенных на рис. 2, в сетевых структурах первая (слева) имеет три уровня и для каждого узла – два исходных элемента, вторая (в середине) – четыре уровня, третья (справа) – пять уровней.
Сетевые структуры БД характерны для организации управлением геологоразведочным производством на уровне экспедиции и выше.
Организация данных в БД прежде всего должна правильно передавать их основное смысловое значение, или семантику, и позволять эффективно к ним обращаться. В обычной прикладной программе структура данных организуется таким образом, чтобы обеспечить удобный доступ к ним из данной программы.
Рисунок 2. Структуры данных:
а-реляционная, б-иерархическая, в-сетевая
БД содержит данные, которые используются множеством разнообразных программу, следовательно, при определении структуры БД нельзя ориентироваться на критерии, используемые при программировании конкретных функций. При обработке геолого-геофизических данных БД характеризуется большими и очень большими размерами выборок. Большим называется такое значение, которое превосходит количество данных, обрабатываемых одним человеком, даже если он имеет доступ к вычислительной системе. Фактическое количество изменяется от сложности данных и решаемых задач. Примером большой БД является система, содержащая сведения уже о 5000 образцах, рудных телах, месторождениях и т.д. Такая БД может, например, содержать 300 000 записей десятка или более типов. Три тысячи сейсмических лент со стоканальной записью каждая уже образуют большую БД.
Очень большая БД образуется, например, при сведении всех геолого-геофизических данных для одного миллионного листа.
Большие массивы геолого-геофизической информации требуют использования специальных систем для организации хранения и поиска данных. Такие системы называются информационно-поисковыми (ИПС). ИПС, по существу, представляют БД совместно с СУБД, осуществляющих быстрый поиск данных. Поиск данных обычно производится по определенному символу. В отличие от БД и СУБД, которые можно рассматривать раздельно, для ИПС характерна неразрывная связь функций БД и СУБД.
В сейсморазведке при создании автоматизированной системы обработки данных СЦС-3 широкое применение получила ИПС «ИНЕС». При обработке и интерпретации данных ГИС используется ИПС ГЕОКОМПАС, базирующаяся на СУБД КОМПАС.
2.2 Файловые базы данных
Вышеприведенные определения БД, основанные на концепциях CODASYL, а также иерархические и сетевые структуры БД сложно использовать при хранении, поиске и обработке массовых геолого-геофизических данных, что объясняется следующими обстоятельствами:
-
при многоэтапной и многоцелевой обработке данных трудно заранее определить связи между всеми типами геообъектов и соответствующими им типами записей. При решении разных геологических задач взаимосвязи между объектами обработки (точками наблюдений, геологически однородными площадками, геохимическими и геофизическими аномалиями, известными проявлениями полезных ископаемых и т.п.) изменяются. Изменяется также и принцип группирования записей, соответствующих этим объектам;
-
отдельная запись при обработке геолого-геофизических материалов не имеет, как правило, самостоятельного значения.
Поэтому средства большинства систем управления базами данных, ориентированными на поиск и предоставление программисту единичных записей, не могут удовлетворить ни программиста, занимающегося созданием геолого-геофизического программного обеспечения, ни геолога-геофизика как специалиста в. области обработки и интерпретации данных;
3) реляционные БД в большей степени, чем сетевые и иерархические, приспособлены к обработке геолого-геофизических данных, поскольку реляционную БД можно рассматривать как совокупность разнообразных таблиц объекты – свойства, связи между таблицами неявно определяются через общие элементы данных, например, координаты точек. Однако и реляционная БД практически не учитывает особенности технологии хранения, поиска и обработки массовых данных: а) геолого-геофизические данные хранятся в виде географически, покоординатно заданной информации, относящейся к определенному методу, способу исследований при определенной детальности работ (масштабе работ); б) при долговременном хранении геолого-геофизические данные не модифицируются, так как они обычно прошли стандартную первичную обработку; в) каждый новый фрагмент данных должен рассматриваться как автономный (иначе ведение баз при их реальных огромных объемах станет непосильно трудоемким), но система поиска должна обеспечивать оперативный поиск и выбор требуемого фрагмента базы данных; г) технология обработки диктует необходимость доставки геолого-геофизических данных не по отдельным записям, а достаточно большими порциями (сейсмическая трасса, профиль, площадь съемки и т.п.).