Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 15
Текст из файла (страница 15)
2.3.2.).Рис. 2.3.2. Иерархия понятий предметной области.Для строгой формализации предложенной иерархии используется теориямножеств. Множество химических систем обозначается S , множество химическихвеществ – C , а множество кристаллических модификаций – M . Химическая системаобозначается s (где s S ), химическое вещество – c (где c C ), а химическуюмодификацию – m (где m M ).Химическая система s представляется множеством обозначений химическихэлементов ei : s {e1 , e2 ,.., en } , другими словами определяется качественный составвещества.
Химическое вещество c определяется не только множеством обозначенийхимических элементов, но и количественным вхождением последних в составвещества, раствора или смеси. Поэтому вещество c представлено кортежем ( s, f ) , где76sS, аfобразуютвещество,является отображением множества химических элементов, которыенамножествопарR R ,задающихсоответственноминимальное и максимальное вхождение заданного химического элемента в вещество,( Rmin, Rmax) , R – множество неотрицательныхраствор или смесь c . То есть f : ei действительных чисел. Rminи Rmax, соответственно, минимальная и максимальнаяконцентрация химического элемента ei в веществе c .
В случае, когда концентрация Rmaxконкретного химического элемента ei в веществе c фиксирована, то Rmin.Кристаллическая модификация m представляется кортежем ( s, f , mod) , где s S ,f : ei ( Rmin, Rmax) , а mod – строковое обозначение модификации вещества.Данные о свойствах химических сущностей, хранящиеся в разных ИС СНВМ сразнойстепеньюдетализации,должныбытьпредставленыввидестроготипизированных наборов данных (возможно, реляционных таблиц). При этомсвязь сущностей из иерархии понятий со значениями свойств с помощью ERдиаграммы представима следующим образом (рис. 2.3.3).Рис. 2.3.3.
Связь значений свойств химических объектов с иерархией понятий.Таким образом, предложенная схема данных должна быть реализована в ИССНВМ для обеспечения поиска по качественному и количественному составунеорганических веществ с учетом кристаллических модификаций, а также для поискапо значениям конкретных физико-химических свойств.На основании вышеизложенного, для построения современных ИС СНВМ сдоступом через Интернет предлагается трехзвенная архитектура ИС СНВМ на основесистем хранения данных со строго типизированным учетом информации по: 1)качественномуиколичественномусоставувеществ;2)кристаллическиммодификациям; 3) значениям свойств.
Следование этой архитектуре позволяет нетолько создавать ИС СНВМ с возможностью сложносоставных запросов, но иэффективно использовать их в качестве подсистем разработанной интегрированной ИССНВМ (рис. 2.3.4).77Рис. 2.3.4. Архитектура ИС СНВМ.2.4. Информационные системы по свойствам неорганических веществИМЕТ РАНКак было отмечено в главе 2.1, в настоящее время в мире существует множествоИС по свойствам веществ [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 65-121]. Приэтом в каждой исследовательской организации создавались свои собственныеинформационные ресурсы, в которых накапливалась информация, относящаяся к еётематике. Таким образом, в некоторых организациях исторически сформировалисьнесколько центров хранения и обработки данных, что объясняется не толькоадминистративными причинами, но и различиями в исследуемых предметныхобластях.Примером организации, в которой существует несколько ИС, основанных на БДпо свойствам неорганических веществ, может служить Институт металлургии иматериаловедения им.
А.А. Байкова Российской Академии Наук (ИМЕТ РАН). Эти ИСпостроены не только на различных программно-аппаратных платформах, но и сиспользованием разных подходов к хранению и обработке информации.В главе 2.3.2 были выявлены системные проблемы в информационныхструктурах, положенных в основу ряда зарубежных ИС СНВМ и предложены пути ихрешения с использованием обобщенной структуры данных ИС СНВМ. На основепредложенной в главе 2.3.3 обобщенной структуры данных автором были созданы ИС“Кристалл” и ИС “Bandgap”, которые обеспечивают требуемую гибкость при поиске78данных для использования в компьютерном конструировании неорганическихсоединений.2.4.1.
Разработка ИС по веществам с особыми акустооптическими,электрооптическими и нелинейнооптическими свойствами “Кристалл”В рамках диссертационных исследований нами разработана ИС “Кристалл”,построенная на основе БД Microsoft SQL Server 2008, содержащей экспериментальныеданные о свойствах акустооптических, электрооптических и нелинейнооптическихвеществ, погрешностях, методах измерений, условиях получения и т.д. [70, 71].Разработка базы данных ИС “Кристалл”В основу разработки ИС “Кристалл” была положена разработанная совместно соспециалистами-материаловедамиконцептуальнаясхемаБД,представленнаянарис. 2.4.1.Рис. 2.4.1. Концептуальная схема базы данных ИС “Кристалл”.Как видно из представленной схемы, большинство свойств химическихсущностей описывается на уровне кристаллической модификации. На основеконцептуальной схемы была проведена нормализация БД и получена физическаяструктура данных для хранения информации в БД под управлением СУБД MicrosoftSQL Server 2008, схематично показанная в табл.
2.2.79Все таблицы БД «Кристалл» (кроме Bibliogr) содержат общий столбец – номерсоединения (вещества) HeadClue. Таблица HeadTabl – основная таблица БД,описывающая вещества. Таблицы БД условно разбиты на три группы:содержащие общие свойства соединения или общую для соединения информацию(общий столбец всех таблиц – номер соединения HeadClue) – HeadTabl, LitrTabl,SistTabl, SingTabl, HardTabl, DecrTabl, SuspTabl, AcopTabl, HeatTabl, DensTabl,PlavTabl, RefrTabl, CuryTabl, Wavepure;содержащие специфические для данной предметной области свойства, (общиестолбцы всех таблиц – номер соединения HeadClue и обозначение сингонииSingCode) – ModfTabl, ElemTabl, MechTabl, Dielectr, Elastic1, ConstSel, RefrcInd,HeatExpn, ElOpTabl, NlOpTabl, MNopTabl, EsOpTabl, PzElTabl, DielDiss);служебные,содержащиеназванияграфиков,поясняющихданныедляконкретного соединения и свойства (общие столбцы для таблицы GrafTabl сдругими таблицами– номер соединения HeadClue и с таблицей Property - номерсвойства NompClue), содержащие номера свойств Property (общий столбец стаблицей GrafTabl – номер свойства – Nomprop = NompClue) и содержащиелитературные ссылки Bibliogr (общий столбец с таблицами свойств – BkNumber).Таблица 2.2.
Схематическая структура данных в БД ИС “Кристалл”.HeadClueGrafTablNompCluePropertyNompropHeadTablBibliogrHeadClueLitrTablBkNumberHeadClueHardTablBkNumberHeadClueDecrTablBkNumberHeadClueSuspTablBkNumberHeadClueAcopTablBkNumberHeadClueHeatTablBkNumberHeadClueDensTablBkNumberHeadCluePlavTablBkNumberHeadClueCuryTablBkNumberHeadClueWavepureBkNumberHeadClueSistTablSingTablSingtype80(SingCode)HeadClueModfTablSingCodeBkNumberHeadClueElemTablSingCodeBkNumberHeadClueMechTablSingCodeBkNumberHeadClueDielectrSingCodeBkNumberHeadClueElastic1SingCodeBkNumberHeadClueConstSelSingCodeBkNumberHeadClueRefrcIndSingCodeBkNumberHeadClueHeatExpnSingCodeBkNumberHeadClueElOpTablSingCodeBkNumberHeadClueNlOpTablSingCodeBkNumberHeadClueMNopTablSingCodeBkNumberHeadClueEsOpTablSingCodeBkNumberHeadCluePzElTablSingCodeBkNumberHeadClueDielDissSingCodeBkNumberКраткое описание всех реляционных отношений БД «Кристалл» приведено втабл.
2.3.Таблица 2.3. Реляционные таблицы БД «Кристалл».НазваниеНазначение таблицыключевая таблица БД, содержащая информацию о количественномHeadTablсоставе вещества и данные по специалистам, проводившимэкспертную оценкуGrafTablданные по графической информации;Propertiesперечень свойств, информация о которых хранится в ИСBibliogrлитературные ссылкиSistTablколичественный состав веществHardTablтвердостьSuspTablрастворимость (разных растворителях)DensTablплотностьPlavTablтемпературы плавленияCuryTablтемпература КюриHeatTablтеплоемкостьAcopTablакустооптические свойства81НазваниеНазначение таблицыDecrTablхарактеристики распространения и затухания упругих волнWavepureобласти прозрачности кристалловLitrTablлитературные ссылки для веществSingTablModfTablсингонии кристаллических решеток различных полиморфныхмодификаций веществсимметрия и условия существования различных полиморфныхмодификаций веществElemTablпараметры элементарной ячейкиHeatExpnтепловое расширение и теплопроводностьDielectrдиэлектрические постоянныеDielDissдиэлектрические потериPzElTablпьезоэлектрические коэффициентыMechTablкоэффициенты электромеханической связиElastic1упругие постоянныеRefrcIndпоказатели преломленияConstSelкоэффициенты СелмейераNlOpTablнелинейнооптические коэффициентыMnOpTablкомпоненты тензора МиллераElOpTablэлектрооптические коэффициентыEsOpTablупругооптические коэффициентыКаждая таблица создавалась с использованием SQL DDL-операторов.
Например,основная таблица HeadTabl, содержащая список соединений, создавалась с помощьюSQL-скрипта:CREATE TABLE [dbo].[HeadTabl]([HeadClue] [int] NOT NULL,[System] [varchar](128) NOT NULL,[Expert] [varchar](32) NOT NULL,[Help] [varchar](32) NOT NULL,[Class] [int] NOT NULL,CONSTRAINT [PK_HeadTabl] PRIMARY KEY CLUSTERED( [HeadClue] ASC) ON [PRIMARY]) ON [PRIMARY];В итоге получаем реляционную структуру данных, лишь малая часть которойотображена на рис. 2.4.2 с указанием назначения таблиц. Важно отметить, чтоинформационное наполнение БД ИС “Кристалл” осуществлялось с помощью82программного комплекса DBAdmin, разработанного автором (см.