Интеграция автономных источников данных для прогнозирования свойств неорганических веществ (1090500)
Текст из файла
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГОПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТОНКИХ ХИМИЧЕСКИХ ТЕХНОЛОГИЙИМ.М.В.ЛОМОНОСОВА»На правах рукописиУДК 004.8:669.017:004.78 (043.3)Масютин Виталий ВикторовичИнтеграция автономных источников данных для прогнозированиясвойств неорганических веществ05.13.01 – Системный анализ, управление и обработка информации(химическая промышленность)Диссертация на соискание ученой степени кандидата технических наукНаучный руководитель – к.т.н., доц. Дударев В.А.Москва, 2014СОДЕРЖАНИЕВВЕДЕНИЕ.............................................................................................................
3ГЛАВА 1. СИСТЕМНЫЙ АНАЛИЗ ПРОБЛЕМЫ КОМПЬЮТЕРНОГОПРОГНОЗИРОВАНИЯ СВОЙСТВ НЕОРГАНИЧЕСКИХ ВЕЩЕСТВ.... 71.1. Особенности компьютерного прогнозирования свойствнеорганических веществ ............................................................................ 71.2. Формальная постановка задачи компьютерного прогнозированиясвойств неорганических веществ ..............................................................
91.3. Применение основных принципов и методов системного анализа кпроблеме компьютерного прогнозирования свойств неорганическихвеществ ....................................................................................................... 211.4. Информационные системы по свойствам неорганических веществ ... 261.5. Задача интеграции различных источников данных для обеспеченияинформационной поддержки компьютерного прогнозированиясвойств неорганических веществ ............................................................ 35ГЛАВА 2. ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ ТЕХНОЛОГИЙИНТЕГРАЦИИ ДАННЫХ ................................................................................
372.1. Методы интеграции данных .................................................................... 372.2. Построение неформального описания информационных процессов,осуществляемых при интеграции данных. ............................................. 392.3. Моделирование потоков данных............................................................. 412.4. Функциональное моделирование процессов обработки информациипри интеграции данных ............................................................................
45ГЛАВА 3. ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ ИНТЕГРАЦИИ ДАННЫХДЛЯ КОМПЬЮТЕРНОГО КОНСТРУИРОВАНИЯНЕОРГАНИЧЕСКИХ СОЕДИНЕНИЙ.......................................................... 503.1. Выбор среды реализации интегрированной ИС .................................... 503.2. Состав и схема метабазы, соедржащей описания источников данных533.3. Назначение, описание и примеры адаптеров извлечения ипреобразования данных............................................................................ 553.4. Разрабьотка программы-посредника....................................................... 583.5.
Защита информации при интеграции данных........................................ 62ГЛАВА 4. ПРИМЕНЕНИЕ ИНТЕГРИРОВАННОЙИНФОРМАЦИОННОЙ СИСТЕМЫ ДЛЯ ПРОГНОЗИРОВАНИЯСВОЙСТВ НЕОРГАНИЧЕСКИХ ВЕЩЕСТВ.............................................. 73ЗАКЛЮЧЕНИЕ ................................................................................................. 125СПИСОК ЛИТЕРАТУРЫ ............................................................................... 126СПИСОК ИЛЛЮСТРАЦИЙ .......................................................................... 131СПИСОК ТАБЛИЦ........................................................................................... 1322 ВведениеНеобходимымусловиемразвитиясовременнойэлектроннойпромышленности является разработка новых неорганических веществ,обладающих заданными электрическими и магнитными свойствами.
Однимиз методов, обеспечивающих сокращение времени и затрат на получениеновых материалов, является компьютерное конструирование, позволяющеепредсказать свойства нового вещества на основе информации об ужеизвестных веществах и их свойствах. В настоящее время качественнаяинформационная поддержка синтеза неорганических веществ с заданнымисвойствами основана на применении специализированных баз данных (БД),содержащих данные о структуре и свойствах синтезированных ранеесоединений.
Такие БД разрабатываются во всех промышленно развитыхстранах. Наибольшего прогресса в этом добились США и Япония, которыена базе NIST (National Institute of Standards and Technology – Национальныйинститут стандартов и технологий, США) [1] и NIMS (National Institute forMaterials Science Technology – Национальный институт материаловедения,Япония) [2] разрабатывают специализированные информационные ресурсы.В России лидером в области создания баз данных по электрическим имагнитнымсвойствамнеорганическихвеществявляетсяИнститутметаллургии и материаловедения им. А.А.
Байкова РАН (ИМЕТ РАН) [3].Ни одна из существующих информационных систем по свойствамнеорганических соединений не способна предоставить исчерпывающуюинформацию обо всей совокупности свойств конкретного вещества.Фрагментарностьданныхявляетсяоднойизпроблем,существенноусложняющей создание новых веществ с требуемыми свойствами. Отметим,что информация в различных информационных системах может храниться нетолько в форматах распространенных баз данных, но и в других видах,например, в форматах электронных таблиц, текстовых форматах, форматеXML,бинарныхпроприетарныхформатахит.п.Помимоэтого,использование различных информационных ресурсов для специалиста3 химика-технолога осложняется различными режимами доступа к данным,полученным из этих ресурсов.Однимизпутейрешенияпроблемыявляетсяинтеграцияинформационных ресурсов. Актуальность интеграции в последние годы былаосознана не только на национальном, но и на международном уровне, чтовызвало появление специальной международной комиссии (Materials TaskGroup), целью которой является выработка стандартов для интеграцииматериаловедческих информационных ресурсов.
Однако, несмотря напредпринимаемыеусилия,говоритьобуспехахвэтойобластипреждевременно [4].Таким образом, интеграция разнородных информационных ресурсов,позволяющая обеспечить химиков-технологов достоверной информацией освойствах и технологиях получения неорганических веществ, являетсяактуальной научной задачей.Целью диссертации является обеспечение информационной поддержкисинтеза новых неорганических веществ с заданными электрическими имагнитными свойствами на основе интеграции специализированных базданных.Для достижения поставленной цели в диссертации поставлены ирешены следующие задачи:• Проведен системный анализ проблемы прогнозирования свойств новыхнеорганических веществ с заданными электрическими и магнитнымисвойствами;• На основе системного анализа технологий интеграции информационныхресурсов разработан комплекс информационных моделей технологийинтеграции баз данных, баз данных, содержащих информацию о составе исвойствах неорганических веществ;• Обоснован выбор среды реализации интегрированной информационнойсистемы;4 • Разработана структура метабазы, описывающей свойства автономныхисточников данных, в которых содержится информация о составе исвойствах неорганических веществ, с учетом разрешения семантическихконфликтов гетерогенности;• Разработаны адаптеры извлечения и преобразования данных и программапосредник, обеспечивающая интеграцию баз данных, содержащихинформацию о составе и свойствах неорганических веществ;• Выполнено прогнозирование кристаллической структуры неорганическихсоединений по данным, полученным из автономных источников;• Разработана схема защиты информационного обмена по открытымканалам связи сети Интернет при интеграции баз данных, содержащихинформацию о составе и свойствах неорганических веществ.Объектомисследованияявляютсябазыданныхпосвойствамнеорганических веществ с заданными электрическими и магнитнымисвойствами и технологии их интеграции.Предметом исследования является применение технологий интеграцииданных для информационной поддержки синтеза неорганических веществ сзаданными электрическими и магнитными свойствами.Научная новизна работы заключается в следующем• Проведен системный анализ проблемы прогнозирования свойств новыхсоединений на основе данных об их составе с учетом особенностейнеорганического материаловедения;• Разработана схема интеграции баз данных, содержащих информацию осоставе и свойствах неорганических веществ, без передачи данных вобщее хранилище;• На основе проведенного системного анализа технологий интеграцииданных разработан комплекс информационных моделей интеграцииавтономных источников данных, содержащих информацию о составе исвойствах неорганических веществ, включающий в себя функциональныемодели и модели потоков данных;5 • Разработана структура метабазы, описывающая свойства автономныхисточников данных, содержащих информацию о составе и свойствахнеорганических веществ, с учетом разрешения семантических конфликтовгетерогенности;• Обоснован выбор среды реализации интегрированной информационнойсистемы.Практическая значимость работы:• Для разрешения синтаксических и системных конфликтов гетерогенностиразработаны адаптеры извлечения и преобразования данных, полученныхиз различных баз данных по свойствам неорганических веществ иматериалов;• Разработанапрограмма-посредник,обеспечивающаяинтеграциюавтономных источников данных, содержащих информацию о составе исвойствах неорганических веществ;• Разработана схема защиты информационного обмена по открытымканалам связи сети Интернет при интеграции баз данных, содержащихинформацию о составе и свойствах неорганических веществ;• Выполненопрогнозированиевозможностиобразованияитипакристаллической структуры для халькогенидных шпинелей составаAB2X4, где X = S, Se, Te.В основу решения поставленных задач положены методы системногоанализа(декомпозиция,классификация,иерархическоеупорядочение,абстрагирование, формализация, композиция, моделирование), методологиямоделирования потоков данных DFD, методология функциональногомоделирования систем IDEF0, методология проектирования баз данныхIDEF1X, теория реляционных баз данных, иерархическая модель данныхXML, методология быстрой разработки приложений RAD.6 Глава 1.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.