1626434812-e667f6b6e7e69d3a0798830a58e9075b (844135), страница 2
Текст из файла (страница 2)
303 10.3. Реализация баз данных на системах с разделяемой памятью . 10.3.1. Факторы, способствующие появлению систем с данными, размещаемыми в оперативной памяти ..... 304 10.3.2. Особенности систем с данными, размещаемыми в оперативной памяти ...... 304 10.3.3. Примеры одноуровневых СУБД 305 306 10.4.5. Система поддержки отказоустойчивой. работы ИСК 1.11сКеерег Гам!с Везйеп! Буа!еш !ГВ5) кластеров,....,.............. 10.4.6. Масштабируемая среда для распределенных вычислений ТОР ЕЫ0.
10.4.7. Требования к реализации ЕСО в параллельных системах 312 315 319 10.4.8. Организация контрольной точки... 10.4.8. Примеры ПО среднего уровня для вычислительных систем . 319 10.5. Аппаратные средства систем хранения данных ....... 10.5.! . Пути совершенствования систем хранения данных .................. 10,5.2. Организация управления периферийными ! 0.4. Единый системный образ ., 10.4.1. Аппаратно-программные платформы информационных систем .........................,......,........,..... 306 10.4.2. Подходы к реализации систем хранения данных ........ 307 10.4.3.
Готовность систем хранения данных ............................ 310 10.4.4. Промежуточное программное обеспечение пийИеиаге 311 Содержание устройствами ... 10.5.3. Шины . 322 323 . 323 32б 10.5.4. Интерфейсы систем хранения данных .....,...........
10.5.5. Каналы ввода-вывода,..............,.... 10.5.5.1. Особенности применения каналов ввода-вывода ................. 10.5.5.2. Изменение структуры компьютеров фирмы ЯСЧ..............,.............,..............,.... 10.5.5.3. Архитектура Мех~ бепегайоп 1/О фирмы 1п1е1 .........................,.....................
10.5.б. Типы устройств хранения данных .........,.............. 10.5.7. Дисковые системы ....,......,..........,„.......,..............,. 10 5.7.1. Технология построения отказоуслюйчивых дисковых систем большой емкости ....,.............. 10.5.7.2. Варианты построения ЛАЮ ................... 10.5.7.3.
Примеры дисковых массивов ............,..... 10.5.7.4. Технология дискового кэширования...,..... 10.5.? 5. Дисковый массив 053000 фирмы НЕС ... 32б . 329 . 330 . 332 332 . 334 . 335 . 33б А лфавитныи указатель ..........................................................,........................ 34б Йтература»«*» «»»««««» «««» ° »»«» ««»«« ° « ° ° ««« «339 Л ВВЕДЕНИЕ За последнее дссятилетие рост производительности компьютеров, объемов их оперативной и внешней памяти, пропускной способности внешних устройств и каналов связи качественно изменил ситуацию в вычислительной технике и сферах ее применения.
Для осознания этого факта достаточно принять во внимание, что суммарная производительность всех компьютеров супердержав 80-х годов сегодня доступна в рамках одной рабочей станции производительностью порядка 1О' йорз, находящейся в распоряжении одного пользователя. Определившие эти достижения сверхбольшие интегральные схемы и их концентрированное выражение — современные микропроцессоры и схемы памяти — положили начало эпохе массовой компьютеризации. Основным предметом труда этой эпохи становится информация, а новым орудием труда — компьютеры.
При этом если раньше для подготовки интеллектуального работника необходимо было провести его обучение с использованием "книжных" знаний, то теперь все в большей степени информация, накопленная в компьютерах, становится сама производительной силой. Сегодня, на заре массовой компьютеризации, существует значительный разрыв между возможностями аппаратных средств компьютеров и применяемыми методами решения прикладных задач.
Наиболее освоенные на сегодня методы основаны на хорошо формализованных алгоритмах, полученных в результате построения математических моделей предметных областей. Чаще всего это трудоемкие расчеты по известным формулам либо простые последовательности действий, приводящие после многократного применения к желаемому результату. Однако в практической деятельности многие актуальные задачи относятся к плохо формализованным, для которых неизвестны аналитические зависимости или цепочки действий, приводящих к результату без интеллектуального вмешательства человека. Ранее для решения этих задач просто не хватало ресурсов компьютеров, и поэтому было бессмысленно ставить саму проблему решения плохо формализованных задач. В настоящее время актуальной проблемой является создание программных средств, утилизирующих ресурсы компьютеров для решения плохо формализованных задач.
Как правило, в плохо формализованных задачах имеется некоторый набор параметров, описывающих объекты предметной области. Вся информация о предметной области, которая может быть использована для решения плохо формализованной задачи, представлена некоторой совокупностью векторов этих параметров, представляющих подвергшиеся измерению объекты. Причем о Введение наборе параметров нельзя сколько-нибудь определенно сказать, что он полон, адекватен, а сами измеренные значения параметров в совокупности неполны, противоречивы и искажены. Все это не позволяет применить для решения плохо формализованных задач традиционные методы аппроксимации функций, статистической обработки и оптимизации.
Методы решения плохо формализованных задач имеют дело с обработкой данных, накопленных в результате некоторых измерений и экспериментов. Поэтому первым вопросом является рассмотрение способов организации хранения и выборки данных о предметных областях в базах данных в зависимости от решаемой задачи. Этим вопросам посвящены первые пять глав, в которых рассматриваются фактографические базы данных, их использование в системах обработки транзакций и аналитической обработки данных, а также документальные базы данных и информационно-поисковые системы. Пятая глава посвящена аппарату и инструментарию построения фактографических баз данных В следующих четырех главах рассмотрены методы решения плохо формализованных задач.
К этим методам относятся экспертные системы, нейросетевые алгоритмы, генетические алгоритмы„нечеткая логика Экспертные системы служат способом привлечения знаний экспертов для решсния плохо формализованных задач. Для задач, относящихся к классу статистических, применяются обучаемые методом "проб и ошибок" нейросети, являющиеся байесовскими классификаторами, работающими в условиях отсутствия знания функций распределения вероятностей. Генетические и эволюционные алгоритмы — один из способов стохастической оптимизации, хорошо зарекомендовавший себя при решении ряда важных задач.
Нечеткая логика позволяет работать с параметрами, имеющими скорее качественную природу типа: "большой — маленький", а не точное значение этих параметров, выражаемое определенной цифрой, В совокупности эти методы и ряд других составляют основу современных технологий прогнозирования на основе временных рядов данных, извлечения закономерностей из данных (баса гп1шпя), систем поддержки принятия решений (088 — песйоп вцррог~ зуягеш), что аккумулируется термином "интеллектуальный анализ данных" (ИАД).
Во всех случаях изложение методов сопровождается примерами решения задач с применением соответствующих пакетов, признанных одними из лучших среди пакетов своего класса. Конечно, изложенный материал не является инструкцией по применению этих пакетов, а, скорее, демонстрирует их возможностии. Базы данных. Интеллектуальная обработка информации Последняя, 10-я глава посвящена аппаратно-программным платформам систем хранения и обработки данных. Материал этой главы позволяет создать представление о внутренней организации больших баз данных и поддержании их в рабочем состоянии при отказах и модернизации оборудования.
При подготовке книги были использованы программные пакеты любезно предоставленные президентом Национального альянса управляющих, консультантов и аналитиков Масаловичем А.и., за что авторы выражают свою благодарность. Глава 1. Базы данных в фактографических системах 1.1. Документальные и фактографические информационные системы В 60-х годах была осознана необходимость применения средств компьютерной обработки хранимой информации там, где были накоплены значительные объемы полезных данных — в военной промышленности, в бизнесе. Появились автоматизированные информационные системы (АИС) — программноаппаратные комплексы, предназначенные для хранения, обработки информации н обеспечения ею пользователей.
Первые АИС работали преимущественно с информацией фактического характера, например, характеристиками объектов и их связей. По мере "интеллектуализации" АИС появилась возможность обрабатывать текстовые документы на естественном языке, изображения и другие виды и форматы представления данных. Несмотря на то, что принципы хранения данных в системах обработки фактической и документальной (текстовой) информации схожи, алгоритмы обработки в них заметно различаются. Поэтому в зависимости от характера информационных ресурсов, которыми оперируют такие системы, принято различать два крупных их класса -документальные и фактографические. Документальные системы служат для работы с документами на естественном языке — монографиями, публикациями в периодике, сообщениями пресс-агентств, текстами законодательных актов.
Они обеспечивают их смысловой анализ при неполном, приближенном представлении смысла. Наиболее распространенный тип документальных систем — информационно-поисковые системы (ИПС), предназначенные для накопления и поиска по различным критериям документов на естественном языке. Принципы представления, хранения и обработки документов в АИС этого класса рассмотрены в соответствующих главах настоящей книги.
Другой большой класс автоматизированных систем — фактографические системы. Они оперируют фактическими сведениями, представленными в виде специальным образом организованных совокупностей формализованных записей данных. Центральное функциональное звено фактографических информационных систем — системы управления базами данных (СУБД). Фактографические системы используются не только для реализации справочных функций, но и для решения задач обработки данных. Под обработкой данных понимается специальный класс решаемых па ЭВМ задач, связанных с вво- Базы данных. Интеллектуальная обработка информации дом, хранением, сортировкой, отбором и группировкой записей данных однородной структуры. В большинстве случаев эти задачи предусматривают предоставление пользователям итоговых результатов обработки в виде отчетов табличной формы.