144758 (594120), страница 6
Текст из файла (страница 6)
Общее представление об информационной обеспеченности территории должна давать информационно-поисковая система, которую целесообразно включить в структуру ГИС.
Анализ общего состава данных - геокодированной информации, необходимого для создания функционирующей ГИС, показывает, что для его определения необходимо ответить на ряд вопросов:
имеется ли возможность сбора, хранения и обновления географической информации?;
каковы ожидаемые объемы данных и каковы их форматы?;
какой объем данных необходимо преобразовать в цифровую форму, сколько времени это замет и сколько будет стоить?;
каковы качество данных, надежность информации?;
какого рода затруднения могут возникнуть при обработке информации?
2.7.2.Проектирование географических баз и банков данных
Выявление географических объектов и явлений и последующий выбор адекватного представления данных о них являются составной частью процесса, именуемого проектированием базы данных.
В ГИС пользователь рассматривает реальный мир через призму тематической базы данных. Измерения и выборки, содержащиеся в базе данных, должны как можно полнее и точнее соответствовать предмету исследования и его основным характеристикам. Представление данных должно учитывать типы их возможных преобразований. К созданию БД ГИС предъявляются высокие требования, связанные с пространственной формой организации и представления данных.
Требования к базе данных. База данных должна быть:
согласованной по времени - хранящиеся в ней количественные данные должны соответствовать определенному времени, быть актуальными;
полной, достаточно подробной для предполагаемого создания ГИС или картографического произведения; категории данных и их подразделения должны включать все необходимые сведения для осуществления анализа или математико-картографического моделирования исследуемого объекта или явления;
позиционно точной, абсолютно совместимой с другими данными, которые могут добавляться в нее;
достоверной, правильно отражающей характер явлений, для этого необходимо четко определить включенные в нее атрибуты явлений;
легко обновляемой;
доступной для любых пользователей.
Проектирование базы данных. В процессе проектирования БД обычно выделяют три основных уровня: концептуальный, логический и физический.
Концептуальный уровень не зависит от имеющихся аппаратных и программных средств. Для БД ГИС он связан с концептуальной моделью географических данных и включает: описание и определение рассматриваемых объектов; установление способа представления географических объектов в базе данных; выбор базовых типов пространственных объектов - точки, линии, ареалы, ячейки растра; решение вопроса о способе представления размерности и взаимосвязей реального мира в БД (например, следует ли показать здание ареалом или точкой).
Логический уровень определяется имеющимися программными средствами и практически не зависит от технического обеспечения. Он включает разработку логической структуры элементов базы данных в соответствии с системой управления базами данных (СУБД), используемой в программном обеспечении. СУБД представляет собой три взаимосвязанные компоненты: командный язык для выполнения требуемых операций с данными (ввод, вывод, модификация), интерпретирующую систему (или компилятор) для обработки команд и перевода их на язык машины, интерфейс пользователя для формирования запросов к БД (выборки нужных данных).
Наиболее распространенными логическими структурами - моделями БД и их СУБД - являются иерархическая, сетевая, реляционная.
2.7.3.Позиционная и семантическая составляющие данных
Пространственные данные традиционно подразделяются на две взаимосвязанные составляющие - позиционные и непозиционные данные.
Позиционная информация описывает положение географических объектов (или пространственную форму) в координатах двух- и трехмерного пространства - декартовых (x,y,z) или географических.
К непозиционной информации относятся качественная характеристика пространственных объектов (семантика) и статистика; эта информация называется атрибутивной и представляется в виде текстовых или числовых параметров. Она соответствует тематической форме данных или кодированному представлению взаимосвязей объектов (топологии). Почти всегда тип объекта маркируется и опознается по его атрибутивным параметрам (дорога имеет название и идентифицируется по ее классу - грунтовая, шоссе). Обычно атрибутивная информация не имеет пространственного характера, хотя некоторая ее часть может иметь связь с пространственной природой изучаемого объекта; например, площадь, периметр.
В качестве атрибутивной информации часто выступает время (временная форма), которая может отражаться несколькими способами: указанием временного периода существования объектов, соотнесением информации с определенными моментами времени, указанием скорости движения объектов.
Количественные атрибуты создаются в соответствии с номинальными, порядковыми, интервальными или пропорциональными шкалами измерений. Важно знать, какие шкалы измерений использованы для данных, поскольку это определяет характер возможных математических операций с ними.
Кратко составляющие пространственных данных называют геометрией и атрибутами.
2.7.4.Представление точечных, линейных и площадных объектов в базе данных и на цифровой карте
В БД ГИС картографические источники и итоговые карты представляются в виде цифровых карт, каждая из которых является "цифровой моделью карты, созданной путем цифрования картографических источников, фотограмметрической обработки данных дистанционного зондирования, цифровой регистрации данных полевых съемок". Отличие таких карт от традиционных изображений состоит в том, что она, как и БД, недоступна непосредственному восприятию человеком как карта. Поэтому важно знать, как географические объекты представляются в БД и на цифровой карте.
Любая БД состоит из цифровых представлений дискретных объектов. Содержание карты можно хранить в БД в виде цифровой карты, превратив объекты карты в объекты базы данных. Правда, всегда нужно помнить, что многое из показанного на картах умозрительно и не существует в реальном мире: горизонталей в природе не существует, а вот дома и озера - это реальные объекты.
Итак, географические объекты, моделируемые с помощью карты или ГИС, имеют три формы представления:
объект в действительности;
объект, представленный в базе данных (некоторые авторы вводят для таких объектов наименование предмет);
знак, который используется для показа объекта (предмета) на карте или на другом графическом изображении.
Мы будем во всех случаях использовать наименование "объект", поскольку о чем идет речь обычно понятно из контекста.
Предназначенный для отражения в БД или цифровой карте объект - это явление действительности, последнее в ряду подразделения однотипных явлений при выборе "элементарных кирпичиков" для информационного моделирования; например, город можно считать объектом, при его подразделении составные части уже не будут городами, они будут районами, кварталами и т. п.
Объект в БД - это цифровое представление всего реального объекта или его части. Способ цифрового представления объекта зависит от назначения ГИС, масштаба исследования, его задач и других факторов, например, географически город может быть представлен в виде точки, если рассматриваемая территория имеет масштабы материка; если речь идет о базе географических данных области, тот же город может быть представлен ареалом.
Сходные явления, информация о которых хранится в базе данных, определяются как типы объектов - любая группа сходных явлений, которые должны иметь одинаковую форму хранения и представления, например, дороги, реки, высоты, растительность; тем самым обеспечивается основа для формирования общего атрибута явлений. Каждый тип объектов должен быть точно определен, это помогает выявить перекрывающиеся категории данных, вносит ясность в содержание базы данных.
Основные элементы базы данных. Для цифрового представления типов реальных объектов необходимо выбрать подходящую форму объектов, являющихся представителями первых (кодами) в базе пространственных данных. Их классификация может быть основана на представлении пространственной размерности:
точка - объекты, имеющие положение в пространстве, но не имеющие длины (0-мерные);
линия - объекты, имеющие длину, они состоят из двух и более 0-мерных объектов (1-мерные);
полигон - объекты, имеющие длину и ширину, они ограничены, по крайней мере, тремя 1-мерными объектами (отрезками) (2-мерные);
объемная фигура - объекты, имеющие длину, ширину и высоту или глубину, они ограничены, по крайней мере, четырьмя 2-мерными объектами (3-мерные).
Такие объекты хорошо отражают тип пространственной локализации реальных объектов. Они могут быть объединены в классы, например, множество точек для представления множества городов.
Пространственные типы объектов БД могут группироваться в слои, именуемые также покрытиями или темами. Один слой представляет один тип объектов или группу концептуально взаимосвязанных типов объектов. Например, слой может включать только отрезки водотоков, или же водотоки, озера, береговую линию и болота. Возможны самые разные варианты системы слоев, как и модели данных. Некоторые базы пространственных данных создаются путем объединения всех объектов в один слой.
Одни и те же географические явления можно представить в разных масштабах и с разной точностью. Переход от одного представления к другому достаточно сложен, например, переход от мелкого масштаба (1:250 000) к крупному (1:10 000). Поэтому часто встречаются базы данных, содержащие множественные представления одних и тех же явлений. Это неэкономно, но избежать этого пока не удается, ибо соответствующие методы перехода еще недостаточно разработаны.
2.7.5.Объектно-ориентированные и реляционные структуры БД
В преобладающем большинстве ГИС используются реляционные базы данных, поддерживаемые такими СУБД как dBASE , INFO ,ORACLE, INFORMIX и т.п. Такие БД позволяют разработчикам ГИС разделить проблему управления пространственными данными на две части: как представлять геометрию объектов и топологию пространственных объектов (вектор или растр) и как работать с атрибутами этих объектов. Для этого годятся реляционные СУБД, а управляемые ими модели данных иногда называют геореляционными моделями. Основные их преимущества таковы:
нет необходимости хранить атрибуты с пространственными данными, но они всегда могут содержаться где-нибудь в системе или поставляться, например, по сети;
атрибуты могут быть изменены или удалены без изменения пространственной БД;
коммерческие реляционные СУБД стандартны и могут управляться стандартными запросами;
хранение атрибутивных данных в реляционных БД не противоречит основным принципам слоев в ГИС;
атрибуты могут быть привязаны к пространственным единицам и представлены разными способами.
В последнее время, особенно в разработках фирмы ESRI, большое внимание стало уделяться четвертому типу СУБД - объектно-ориентированному (здесь этот термин имеет отношение только к структуре БД и языку программирования, а не объекту как реальности). Ее применение направлено на снижение объемов хранимой информации и времени последовательного поиска в БД. В ГИС такие структуры применяются, когда появляется необходимость управления сложными реальными объектами более разумным способом, чем простыми точками, линиями и полигонами, а также модификации БД при оверлее полигонов.
В объектно-ориентированных БД требуется, чтобы географические данные были определены как совокупности элементов. При этом они характеризуются серией атрибутов и параметров их поведения, которые определяют их пространственные, графические, временные, текстовые/численные размерности. Примерами таких элементов могут служить участок железной дороги и связанное с ним здание вокзала, участок трубопровода с серией ответвлений разного диаметра и т.п. Такая структура позволяет унифицировать хранение геометрии и атрибутов при отображении взаимосвязанных объектов.
2.7.6.Организация и форматы данных
Для хранения цифровых пространственных данных, позиционной и атрибутивной их составляющих в БД применяют различные структуры, которые связаны в основном с векторным или растровым представлениями географических объектов. Способы компьютерной реализации этих представлений носят, соответственно, названия векторный и растровый форматы.
В векторном формате, в котором пространственные объекты представляются точками, линиями и полигонами, позиционная составляющая или геометрия обычно хранится в одном файле в виде индексированных записей: индекс кодирует объект (соответственно, точечный, линейный или полигональный), а запись состоит из набора пар или троек координат, число которых в записи соответствует типу объекта: 1 -для точки, n - для линии или полигона. Чтобы отличить записи для линий и полигонов их либо кодируют разными типами индексов, либо для полигонов в последней записи повторяют координаты первой точки полигона.
Значения атрибутов часто упорядочивают в виде таблиц атрибутов. В реляционных моделях БД каждая клетка таблицы отражает значение одного из признаков определенного объекта. В зависимости от способа отражения временная форма фиксируется в одной таблице атрибутов данного объекта или в нескольких таблицах для различных временных этапов. Таблица отражает тематическую и, отчасти, пространственную формы информации.