Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 47
Текст из файла (страница 47)
Приняты следующие обозначения:класс соединений: “1” – Eg ≤ 2 эВ; класс “2” – Eg > 2 эВ; алгоритмы: “I” – алгоритмывычисления оценок; “II” – линейный дискриминант Фишера; “III” – линейная машина;“IV” – логические закономерности; “V” – многослойный персептрон; “VI” – Qближайших соседей; “VII” – метод опорных векторов; “VIII” – статистическивзвешенные синдромы; “IX” – голосование по тупиковым тестам [184]; “X” – Confor[187].В таблице 7.4 приведена точность прогноза ширины запрещенной зоныизвестных халькопиритов с использованием вышеуказанных программ обучения ЭВМ[187,193].Экзаменационноераспознаваниепроводилосьнаизначальнонеиспользованной для обучения части массива обучающей выборки, после чегопроводилось переобучение по всей обучающей выборке.
Следует отметить, чтоточность прогноза достаточно высокая – выше 77 %, что свидетельствует овозможностиправильнойоценкитакойважногодляхарактеристикиполупроводниковых веществ параметра как ширина запрещенной зоны.Таблица 7.3. Результаты прогноза ширины запрещенной зоны халькопиритовсостава ABX2.СоставCuAlS2CuGaS2CuInS2CuAlSe2CuGaSe2Класс(эксп).22121I22111II22111III IV2222112211ПрогнозVVI2222212221VII22121VIII IX X22 222 212 122 211 1251СоставCuInSe2CuAlTe2CuGaTe2CuInTe2AgGaS2AgGaSe2AgInSe2AgAlTe2AgGaTe2AgInTe2ZnSiP2ZnSiAs2ZnGeP2ZnGeAs2ZnSnP2ZnSnAs2CdSiP2CdGeP2CdGeAs2CdSnP2CdSnAs2AgInS2CdSiAs2Класс(эксп).11111111112211112111111I11111111112111112111111II11111111112111112111111III IV1111111111111111111122221?11111122111111111111ПрогнозVVI2111111121212111111122221111111122111111112111VII11111111112211112111111VIII IX X11 111 111 111 112 111 111 111 111 111 122 222 222 111 111 111 122 211 111 111 111 111 111 1Таблица 7.4.
Точность прогноза ширины запрещенной зоны халькопиритовразличными методами.АлгоритмТочность, %алгоритмы вычисления оценок87.1линейный дискриминант Фишера83.9линейная машина96.8логические закономерности100многослойный персептрон87.1Q ближайших соседей77.4метод опорных векторов100статистически взвешенные синдромы80.6голосование по тупиковым тестам77.4Confor100252На основе анализа результатов табл.
7.3 сделан вывод, что для повышенияточности прогноза следует принимать решение о принадлежности соединения к томуили иному классу на основе “голосования” результатов прогноза с использованиемразличных алгоритмов [193]. В случае решаемой задачи это позволило получить 100%ную точность прогноза.7.4. Перспективные диэлектрики A2B2(XO4)3Известно, что линейный электрооптический эффект, пьезоэлектрический эффекти эффект генерации второй гармоники возможны только в нецентросимметричных(ацентричных) кристаллах.
Рез и Поплавко [211], отмечая необходимость поисканецентросимметричныхдиэлектрическихкристалловдляэлектрооптических,нелинейнооптических и пьезоэлектрических приложений, указывали на важностьпространственной группы в проявлении этих свойств.Дляпоискакристаллоструктурныханалоговвеществэтихклассовиспользовалась информация БД по свойствам акустооптических, электрооптических инелинейнооптическихвеществ“Кристалл”,входящаявсоставразработаннойинтегрированной информационной системы. Примеры для обучения ЭВМ были взятыиз БД по свойствам неорганических соединений “Фазы”, а информация о свойстваххимических элементов для описания соединений – из БД “Elements”.
Для поисказакономерностей в информации и прогноза использовалась система программ [187].Были выбраны соединения состава A2B2(XO4)3 с кристаллической структуройлангбейнита (пр.гр. P213), которые принадлежат к одному из перспективных классовпьезоэлектрических, сегнетоэлектрических, нелинейнооптических, электрооптическихи люминесцентных веществ [211, 212, 213, 214].
Таблица 7.5 содержит результатыэкспериментальной проверки полученных прогнозов новых лангбейнитов. Принятыследующие обозначения: “L” – прогноз образования соединения с кристаллическойструктурой лангбейнита; “K” – прогноз образования соединения со структурой типаK2Zn2(MoO4)3; “*” – прогноз отсутствия соединения состава A2B2(XO4)3 в системе A-BX-O при нормальных условиях получения; “-” – прогноз соединения с типомкристаллической структуры, отличным от лангбейнита или K2Zn2(MoO4)3; “(L)”, “(K)”– соединение с соответствующим типом кристаллической структуры при нормальныхусловиях было известно и информация о нем была использована для обучения ЭВМ;“” – соединение с типом кристаллической структуры, отличным от лангбейнита илиK2Zn2(MoO4)3, получено при нормальных условиях и информация о нем былаиспользована для обучения ЭВМ; “(*)” – соединение состава A2B2(XO4)3 не получено в253системе A-B-X-O и информация об этом была использована для обучения ЭВМ; пустыеячейки и “?” – неопределенный результат; значок “©” – прогноз подтвержденэкспериментом; значок “¢” - прогноз не подтвержден экспериментом.
Даже для такихсложных по составу соединений только 5 из 17 проверенных результатов не совпали сэкспериментом.Таблица 7.5. Часть таблицы прогноза типа кристаллической структурысоединений состава A2B2(XO4)3.XSCrMoWA Na K Rb Cs Tl Na K Rb Cs Tl Na K Rb Cs Tl Na K Rb Cs TlBMgCaMnFeCoNiCuZnSrCdBaPbL¢(*)(*)*(*)(*)(*)*(*)(*)(*)(L)(L)(L)L©(L)(L)(L)L©(L)L©L©L©L(L) L??(L) (L)(*)(*) L(L) (*)L (L)(L)(L)L L* L* L(*)(L)(*) (*)*L L©LLLLLL*KK*L(L)LLLLL?*(*)***©KKL©LL©LLLLL?L©LLLLLLL?**K¢ (K) (L)(*) ??K (L)K K ?(K) (L)K (K) (L)K (K) ? (K) (K)(*) ??K (*)*(*) *© (*)(L)?(L)?(L)(L)??(L)**¢(L)?(L)?(L)?(K)?K¢** (L) L© L(*) * ? ? ?KKKK¢(*) * * * *(*)L L L* *(*) * (*) (*) *7.5. Прогноз образования сегнетоэлектрических хлоридов A2BCl4Согласно информации ИС “Кристалл” соединения состава A2BCl4 относятся кгруппе сегнетоэлектрических кристаллов типа K2SO4, охватывающей около десяткасоединений, наиболее известными из которых являются Rb2ZnCl4, K2ZnCl4, Rb2ZnBr4,(NH4)2ZnCl4.
Для этих соединений характерно то, что переход от сегнетоэлектрическойфазы к параэлектрической фазе происходит через промежуточную несоразмерную фазу[305]. У кристаллов A2BCl4 выявлены электрооптические и нелинейные оптическиесвойства [306]. Например, у Rb2ZnCl4 значения электрооптических коэффициентовсоставляют при 186.6 K для λ = 0.633 мкм: r11 = 1.0*10-12 м/В, r23 = 1.5*10-12 м/В, r33 =0.3*10-12 м/В. Значения нелинейных оптических коэффициентов равны при температуре100 К для λ = 1.064 мкм: d33 = 0.085*10-12 м/В, d22 = 0.075*10-12 м/В, d24 = 0.069*10-12м/В, а величины компонент тензора Миллера при температуре 190 К для λ = 1.064 мкм:δ33 = 0.18 м2/Кл, δ32 = 0.16 м2/Кл, δ24 = 0.14 м2/Кл.
По известным данным кристаллыRb2ZnCl4 генерируют вторую оптическую гармонику [306]. С целью поиска еще не254синтезированных сегнетоэлектрических хлоридов нами проведено прогнозированиеновых соединений состава A2BCl4 (A и B - разные металлы).При отборе примеров соединений для компьютерного анализа использовалисьИС СНВМ, разработанные в ИМЕТ РАН [269]. На основе анализа информации ИС"Фазы" была сформирована выборка, содержащая 68 примеров соединений A2BCl4и 29примеров систем без образования соединений состава A2BCl4.Стоит отметить, что отбор свойств элементов для включения в обучающуювыборку (наиболее сложная и влияющая на качество прогнозирования задача)базировалсянаосновефизико-химическихпредставленийспециалистов-материаловедов о природе изучаемых фаз. Так в исходный набор свойств быливключены 67 параметров элементов A и B и простых хлоридов составов ACl и BCl2(табл.
7.6). Для компьютерного анализа данных был использован комплекс алгоритмовраспознавания образов по прецедентам, включенный в разработанную в ИМЕТ РАНинформационно-аналитическую систему [309]. При решении задачи проводился отборнаиболее точных алгоритмов. Для этого применялось экзаменационное распознаваниесо скользящим контролем (cross validation) на материале обучающей выборки, котороеявляется традиционным средством оценки качества обучения ЭВМ [193].Методика использования скользящего контроля следующая. Обучающаявыборка разбивается N раз различными способами на две непересекающиесяподвыборки: обучающую подвыборку длины m, и контрольную подвыборку длины k.Для каждого i-го разбиения (i=1,...,N) строится алгоритм распознавания и вычисляетсяпроцент ошибок по формулеQi Qerr _ iQобщ _ i100% , где Qerr_i – количество неверныхпрогнозов на i-м разбиении, Qобщ_i – общее количество прогнозов на i-м разбиении.Соответственно, среднее арифметическое значений Qi по всем разбиениям называется1 Nоценкой скользящего контроля: Q QiN i 1Таблица 7.6.
Исходный набор свойств для описания соединений в системе A-B-Cl.СвойствоE8 Chemical potential MiedemaI8 Conductivity thermalS6 Distance core electron (Schubert)S5 Distance valence electron (Schubert)E2 Electronegativity (Pauling)E5 Energy ionization firstЭлементA123456ЭлементB323334353637255СвойствоE6 Energy ionization secondE7 Energy ionization thirdC5 Enthalpy atomizationI11 Entropy of solidG1 Group numberM7 Mendeleev chemists sequenceM10 Mendeleev d-t start leftM11 Mendeleev d-t start rightM3 Mendeleev H d-t start leftM4 Mendeleev H d-t start rightM1 Mendeleev H t-d start leftM2 Mendeleev H t-d start rightM5 Mendeleev PettiforM6 Mendeleev Pettifor regularM8 Mendeleev t-d start leftM9 Mendeleev t-d start rightI10 Molar heat capacityA5 Quantum numberS11 Radii ionicS1 Radii pseudo-potential (Zunger)C2 Temperature boilingC1 Temperature meltingG2 Valence electron numberE9 Work functionE10 nWS1/3 MiedemaTm - температура плавления простого хлоридаSo298 K – энтропия простого хлорида при 298 K-∆Hof298 – теплота образования простого хлорида при 298 Kcop298.15 – изобарная теплоемкость простого хлорида при 298 K∆Gof298 K - изобарный потенциал образования простогохлорида при 298 KЭлементA78910111213141516171819202122232425262728293031ЭлементB383940414243444546474849505152535455565758596061626364656667Для повышения точности прогнозирования соединений была использованастратегия коллективов алгоритмов [193].
Как правило, использование стратегииколлективов алгоритмов позволяет улучшить точность прогнозирования за счетвзаимной компенсации недостатков одного алгоритма преимуществами других. Дляоценкиточности«коллективных»алгоритмовприменялосьэкзаменационноераспознавание 50 примеров, случайно выбранных из обучающей выборки инеиспользованных в обучении ЭВМ (на завершающем этапе прогнозированияконтрольные примеры возвращались в обучающую выборку).Найденнаяклассифицирующаязакономерностьбылаиспользованадляпрогнозирования еще не полученных соединений.