Теория и практика построения баз данных (1088289), страница 144
Текст из файла (страница 144)
Такая служба носит название информационного хранилища. Информациоптюе хрллтотиц!т (баса туагеЬоизе) — это место хранения данных предприятия, предназначенное для упрощения принятия управленческих решений. Инфорктациониое хранилище вклточаст в себя нс только данные, но также инструменты, процедуры, обучение, персонал и другис ресурсы, облегчающие доступ к данным и делающие его более осмысленным для лиц, принимающих решения. Назначение информационного хранилища состоит в увеличении ценности информационных активов предприятия.
Как показано на рис. 17.13, роль информационного хранилища заключается в том, чтобы хранить выдержки из рабочих лапных и вылавать их пользователям в улобном формате. Это могут быль как выдержки из базы данных и файлов, так Информационные хранилища 671 Браузеры Г3- г Информационное Пользовательские компьютеры жки ных Пользовательские Г:Л компьютеры Рис.
17.13. инфоРмационное хранилище 670 Глава 1 т. Совместное использование данных предприятия и отсканированные образы документов, записи, фотографии и другие нечисловые данные. Информационное хранилище служит для хранения, комбинирования, агрегирования, преобразования и доставки данных пользователям с помощью средств анализа и принятия решений, таких как ОЕАР. Компоненты инФормационного хранилища Компоненты информационного хранилища перечислены в следуюц1ем списке. Как уже говорилось, источником данных для информационного хранилища служит рабочая база данных. Следовательно, в информационном хранилище должны быть средства для извлечения и хранения данных. Но сами зти данные бесполезны без соответствующих метаданных, описывающих природу, происхождение, формат данных, ограничения на их использование и другие свойства, влияющие на использование данных. + Средства извлечения данных.
+ Выдержки из данных. + Метаданные, описывающие содержимое информационного хранилища. + СУБД и ОЕАР-серверы информационного хранилища. + Средства управления данными информационного хранилища. + Программы доставки данных. + Аналитические программы для конечных пользователей. + Курсы обучения пользователей и учебные материалы.
+ Консультанты информационного хранилища. Потенциально информационное хранилище содержит миллиарды байтов данных во множестве различных форматов. Соответственно, для хранения и обработки данных ему необходимы собственные СУБД и сервер ОЕАР. Для этой цели можно использовать разные СУБД и ОЕАР-продукты, и их возможности и функции могут быть расширены путем разработки дополнительного программного обеспечения, обеспечивающего переформатирование, агрегирование, интеграцию и передачу данных от одного процессора информационного хранилища другому. Кроме того, могут потребоваться программы для хранения и обработки нсчисловых данных, например графики и анимации.
Поскольку назначение информационного хранилища в том, чтобы сделать данные организации более доступными, в нем должны быть средства не только для доставки данных пользователям, но и для передачи данных для анализа, ответов на запросы, составления отчетов, а также оперативной аналитической обработки с определяемыми пользователем принципами группировки и разгруппирования. Информационное хранилище предоставляет важный, но сложный набор ресурсов и услуг. ГГоэтому в нем должны быть предусмотрены курсы обучения персонала, учебные пособия, интерактивные справочные утилиты и другие подобные продукты, облегчающие использование ресурсов информационного хранилища. Наконец, информационное хранилище должно иметь квалифицированный персонал, предоставляющий консультационные услуги. Требования к информационному хранилищу Требования к информационному хранилищу отличаются от требований к обычному приложению базы данных.
Прежде всего, в тяпичном приложении базы данных структура отчетов и запросов стандартизирована; содержащиеся в них данные могут меняться со временем, но структура их остаемся прежней. В отличие от этого, пользователям информационного хранилшца часто нужно менять структуру запросов и отчетов. Рассмотрим пример, Допустим, компания определяет зоны ответственности продавцов по географическому принципу — скажем, на каждый штат или провинцию Северной Америки имеется свой продавец, Теперь предположим, что пользователь информационного хранилища хочет узнать, как изменятся размеры комиссионных, если вместо географического распределения персонала продавцам будут назначаться конкретные клиенты.
Чтобы сравнить эти альтернатттвы, нужно сгруппировать продажи по компаниям и по штатам. Структура запросов и отчетов, которые понадобятся для этой цели, будет различаться. Еше одно различие состоит в том, что пользователи хотят самостоятельно задавать принцип группировки данных. Наприлтер, пользователю, который хочет исследовать эффект от различных маркетинговых кампаний, в одном случае может 672 Глава 17. Совместное использование данных предприятия Информационные хранилища 673 потребоваться группировка продаж по цвету упаковки, в другом — по маркетинговой программе, в третьем — по цвету упаковки для каждой из маркетинговых программ, а в четвертом — по маркетинговым программам для каждого цвета упаковки. В каждом отчете аналитику важны одни и те же данные, ему просто нужно по-ризноачу их разбивать и группгт1гавить.
Пользователи информационного хранилища хотят салгостоятельно задавать параметры не только группировки, но и разгруппирования, или ппримвтрического разбиения (т1ггП т)отгп), данных. Пусть, например, на экране представлены данные о совокупных продажах за определенный год, Пользователь мажет захотеть, чтобы одним щелчком на данных можно было разбить их на продажи по месяцам, а следующим щелчком — на продажи по месяцам и ггродуктазг илн по регионам, продуктам и месяцам. Хотя можно написать приложение базы данных, которое обеспечивало бы такуго возможность для фиксированного набора параметров разбиения, чаше всего эти параметры зависят от пользователя и задачи.
В действительности, некоторые пользователи и сами не знают, какое разбиение данных им нужно, пока не увидят данные и не попробуют различные типы разбиения. Следовательно, средства параметрического разбиения данных должны быть гибкими. Еше одним абшпм требованием является графическое отображение результатов. Пользователи хотят видеть результаты географического разбиения данных в соответствующей форме — например, продажи, сгруппированные по штатам и провинциям, должны быть показаны на фоне карты Северной Америки, а перераспределение сотрудников по офисам должно быть представлена на диаграмме офисного пространства.
Опять-таки, эти требования вьшолнить труднее, поскольку они зависят от конкретного пользователя и конкретной задачи. Наконец, многим пользователям информационных хранилищ нужна возможность импортировать данные из них в специализированные программы. Например, финансовым аналитикам хочется иьшортировать данные в электронные таблицы и программы финансового анализа. Менеджерам портфеля заказов нужно импортировать данные в программы управления портфелем заказов, а инженерам буровых установок — в программы сейсмического анализа. Все зта обычно означает, что данные пз информационного хранплшца должны форчатироваться определенными способами.
Список требований к информационному хранилищу приведен в следующем списке. + Запросы и отчеты с переменной структурой. + Группировка данных по произвольным критериям. + Параметрическое разбиение дагшых по произвольным критериям. + Графический вывод. + Интеграция со специализированными программами. Проблемы разработки и эксплуатации информационных хранилищ До сих пор мы идеализировали информационные хранилища, в результате чего о них могло возникнуть впечатление как о панацее для принятия управленческих решений. На деле же реализация описанных нами возможностей является весьма сложной задачей.
В этой связи сушествуег несколько важных проблем, которые предстоит решить. 5ЕСЕС1 РВОМ ННЕЯЕ ВЯООР В'т' ИмяПродавца. 5цяг(СуммаЗамазаК СуммаПреммальмых ЗАКАЗ, ПРЕМИЯ ЗАНЯВ.Номерпродавца = ПРЕМИЯ.НомерПродавца ЗАКАЗ НомерПродавца СПопутгго заметим, что типичный пользователь информационного хранилища, скорее всего, не знает БО! в объеме, достаточном для написания такого кода, поэтому должен найтись кто-то, кто сделаег это за него, илн должна быть какаято программа, которая сгенерирует его автоматически через графический интерфейс запроса.) Таблица 17.4. ЗАКАЗ НомерПродзецз Номерззкззе Суммззекззе 100 200 100 300 1000 1200 1400 1500 $12,000 $17,000 $13,500 $11,335 Таблица 17.5. ПРЕМИЯ НомерПродзецз ИмяПродееца СуммзПремизльных $3,000 $2,500 $3,250 100 200 300 Марн Смит Фред Джонсон Лаура Джексон Будем считать, что данные были достоверными на момент извлечения, и предположим, что они были получены из двух различных информационных систем— системы обработки заказов и системы учета заработной платы сотрудников.
Несогласованность данных Если информационное хранилище предоставляет недостоверные данные, то ясно, что такое хранилище является бесполезным, если не вредным. Дело заключается не только в качестве данных, которые информационное хранилище извлекает из своих источников. Информация нз источника данных может быть достоверной на момент извлечения, но при объединении между собой данных, не согласованных по времени или типу (довгену), можно нечаянно внести ошибки.