Главная » Просмотр файлов » 1626434812-e667f6b6e7e69d3a0798830a58e9075b

1626434812-e667f6b6e7e69d3a0798830a58e9075b (844135), страница 11

Файл №844135 1626434812-e667f6b6e7e69d3a0798830a58e9075b (Корнеев, Гареев, Васютьн, Райх - Базы данных) 11 страница1626434812-e667f6b6e7e69d3a0798830a58e9075b (844135) страница 112021-07-16СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 11)

Нельзя ли совместить два этих подхода так, чтобы скрыть их недостатки и сделать более заметными их достоинства? Удачные проекты реализации хранилищ данных, появившиеся в последнее время, показывают, что это возможно. Ситуация, когда для анализа необходима вся информация, находящаяся в хранилище, возникает довольно редко. Обычно каждый аналитик или аналитический отдел обслуживает одно из направлений деятельности организации, поэтому в первую очередь ему необходимы данные, характеризующие именно это направление.

Реальный объем этих данных не превосходит ограничений„присущих многомерным СУБД. Возникает идея выделить данные, которые реально нужны конкретным аналитическим приложениям, в отдельный набор. Такай набор мог бы быть реализован в многомерной БД. Источником данных для него должно быть центральное хранилище организации. Если проводить аналогии с производством и реализацией продукции, то многомерные БД выполняют роль мелких складов. В концепции ХД их принято именовать киосками данных ~Раса Маг~а) ~91. Киоск данных — это специализированное тематическое хранилище, обслуживающее одно их направлений деятельности организации. Логическая схема СППР, использующей центральное ХД организации и киоски данных аналитических отделов ~121, представлена на рис. З.б.

Глава 3. Приниилы построения систем, ориентированных ма анаГГиз данных 55 Источники информации Постаащиаи информации ЗаГрузка данных Приведение данных к единому формату Центральное хранилИща Мносомарнье аизуапизациа запросы данных анап из систамы Пользовательские приложения МОДЕЛИ, ПРОГНОЗЫ Потокзадач анализа Рис.

3.6. Логическая стема СППР, испсиьзуГОГаей ЛД и киоски данутых Такая схема позволяет эффективно использовать возможности реляционных СУБД по хранению огромных объемов информации и способность многомерных СУБД обеспечивать высокую скорость выполнения аналитических запросов. Киоски данных (тематические хранилища) Анализ и представление данных ~-" Ф 'Х С татистнн аспид ааааа ртныа идд а Базы данных.

Интеллектуальная обработка информации З.б. Построение систем на основе ХД Системы, использующие хранилище данных, как правило, строятся на основе архитектуры клиент-сервер. Хранилище данных размещается на специальном сервере (сервере хранилища данных). Для его реализации используется мощные многопроцессорные вычислительные системы таких производителей, как 1ВМ„Неч4ец-Рас)сагд, ВЕС, МСВ. и др. В качестве СУБД применяется одна из СУБД, поддерживающих параллельную обработку запросов Тегада!а (фирма !ЧСК), 0В/2 (фирма 1ВМ), Огас1е, 1п1оптпх и др.

Киоски данных реализуются с использованием серверов многомерных БД: ЕззЬаае (АгЬог Бойюаге), Огас!с Ехргеы (Огас1е), бепбцт (Р!апп1пя Зс1епсеа) и др. Современные аналитические системы, основанные на концепции ХД, способны хранить большие массивы информации, В зависимости от объема используемых данных хранилища принято делить на: маленькие, средние, большие и сверхбольшие. Принципы такой классификации представлены в таблице 3.2. Таблица 3.2. Классификация ХД в зависимости от объема Тип хранилища Объем данных Число строк в фактологической таблице Маленькое до 3 ГБайт до нескольких миллионов Среднее до 25 ГБайт до ста миллионов Большое до 200 ГБайт несколько сотен миллионов Сверхбольшое свыше 200 ГБайт миллиард и более Приведенная классификация подразумевает полезный объем, то есть объем данных, которые могут быть использованы для анализа, Дисковое пространство, требуемое для реализации хранилища, обычно в несколько раз больше за счет того, что необходимо поддерживать систему индексов.

Для современных СУБД, таких как РВ2, Тегаг!а!а, Огас!е, соотношение между объемом задействованной дисковой памяти и объемом реально используемых данных примерно равно 5 — 10. 3.7. Доставка данных в хранилище Данные должны поступать в хранилище в нужном формате и с требуемой регулярностью, Как правило, составляется расписание пополнения хранилища, в соответствии с которым специальные программы организуют передачу данных на склад и их первичную обработку Передача данных на склад может также осуществляться при возникновении заранее определенных внешних событий.

Базы данных. Интеллектуальная обработка информации В аналитических системах для обработки данных используется очень широкая номенклатура методов. Это и традиционные статистические методы регрессионного, факторного, дисперсионного анализа, анализа временных рядов 1131, а также новые, получившие распространение в последнее время методы, основанные на искусственном интеллекте.

К последним, как правило, относят: нейронные сети, нечеткую логику, генетические алгоритмы, методы извлечения знаний. В совокупности они именуются методами интеллектуального анализа данных (ИАД). Часто используется англоязычный термин "да1а ппп1щ" (дословно — добыча знаний). Эти методы развивают традиционные статистические подходы, находя применение там, где обычные приемы невозможно использовать в силу отсутствия точных зависимостей, описывающих анализируемые процессы. Технологии ИАД способны существенно расширить круг практически значимых задач, решаемых с использованием вычислительной техники. Подробно методы интеллектуального анализа данных и примеры их применения описаны в соответствующих разделах.

В большинстве случаев средства анализа данных в СППР на основе ХД используются для решения следующих задач: 1) выделение в данных групп сходных по некоторым признакам записей (кластерный анализ); 2) нахождение и аппроксимация зависимостей, связывающих анализируемые параметры или события, а также поиск параметров, наиболее значимых в терминах конкретной задачи; 3) поиск данных, существенно отклоняющихся от выявленных закономерностей (анализ аномалий); 4) прогнозирование развития объектов различной природы на основе хранящейся ретроспективной информации об их состоянии в прошлом. Кластерный анализ (также употребляются термины "кластеризация", "самообучение", "обучение без учителя") — это метод выделения из множества элементов групп (кластеров) схожих между собой элементов.

Предполагается, что элементы одного и того же кластера похожи, а элементы различных кластеров отличаются друг от друга. Как правило, число кластеров заранее не определяется. Кластерный анализ записей баз данных осуществляется на основе значений их количественных и качественных атрибутов. При этом делается попытка автоматически разнести имеющиеся записи по различным группам. Кластерный анализ применяют при решении большого числа задач. В социологии его используют для обработки результатов опросов общественного мнения, в медицине — для выявления типичных клинических случаев, в маркетинге — для поиска родственных групп клиентов. Часто выделение кластеров— отправная точка для других алгоритмов интеллектуального анализа данных. Базы данных. Интеллектуальная обработка информации нованы на принципе инерционности развития, то есть предполагается„что развитие объекта подчинено определенным закономерностям, которые сохранятся на некоторый период в будущем.

При прогнозировании используется способность методов ИАД выявлять закономерности в исторических данных, описывающих развитие объекта, и использовать в дальнейшем эти тенденции для выработки гипотез о его состоянии в будущем. Особенно широко для предсказаний методы ИАД применяют в финансовой сфере при прогнозировании доходности акций, курсов валют, экономических индикаторов.

В настоящее время компьютерные аналитические технологии данных переживают этап бурного развития — появляются новые программные продукты и задачи, которые успешно решаются с их помощью. Однако даже самые лучшие программные средства не заменят специалиста, способного провести интегральный анализ наблюдаемых явлений. Тем не менее современные интеллектуальные компьютерные технологии могут быть хорошим помощником аналитика, в значительной мере упрощая ему работу Глава 4. Документальные системы 4.1. Назначение и основные понятия Классические модели и методы в теории БД изначально ориентировались на организацию хранения и обработки детально структурированных данных. Чаще всего эти данные представляли собой числовые значения, описывающие те или иные характеристики информационных объектов.

Однако на практике оказалось, что чаще информация представлена не в виде структурированных массивов данных, а в виде простых текстовых документов. Вследствие этого документальные БД (иногда их еще называют полнотекстовыми) сразу выделялись в особый тип баз данных. Исторически сложилось так, что за системами, ориентированными на работу с текстовыми документами, укоренился термин информационно-поисковые системы (ИПС). Хотя, если быть точнее, их следует называть документальными ИПС (ДИПС), поскольку традиционные СУБД также являются ИПС, только фактографическими (ФИПС).

Характеристики

Тип файла
DJVU-файл
Размер
10,72 Mb
Тип материала
Предмет
Высшее учебное заведение

Список файлов книги

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6529
Авторов
на СтудИзбе
301
Средний доход
с одного платного файла
Обучение Подробнее