Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ (1090084), страница 29
Текст из файла (страница 29)
Таким образом, если предметному посреднику придетзапрос на получение глобального идентификатора кристаллической модификации,обозначаемой строковым литералом “Триклинная”, предметный посредник, не найдя еев справочнике модификаций, будет вынужден добавить ее туда. При этом этоймодификации присваивается уникальный глобальный идентификатор, например, 1 истатус этого идентификатора устанавливается в состояние “ненадежный”. Этосостояние статуса будет обозначать возможную смену глобального идентификатора вбудущем. Таким образом, передавая глобальный идентификатор, предметныйпосредник оповещает оболочку ИС о том, что идентификатор модификации“Триклинная” может измениться, и оболочке ИС необходимо через некоторое времявновь запросить глобальный идентификатор со статусом надежности для данноймодификации.Изменить статус идентификатора может только эксперт в предметной области.То есть, увидев, что в БД предметного посредника присутствует только одна запись длятриклинной модификации, он может выставить статус для идентификатора в состояние“надежный”.
Таким образом, оболочка ИС, запросив в следующий раз глобальныйидентификатор для модификации “Триклинная”, получит идентификатор 1 и статус“надежный”, что избавит оболочку от необходимости периодически вновь узнаватьглобальный идентификатор для модификации “Триклинная”.Теперь представим, что оболочка другой интегрируемой ИС запрашиваетидентификатор для модификации “тр”. Предметный посредник, естественно, неудачносравнив этот литерал с литералом “Триклинная”, добавит новую запись в справочникмодификаций и вернет, например, идентификатор 2 со статусом “ненадежный”. Затем,через некоторое время, эксперт в предметной области увидит, что появилась новая147модификация “тр” со статусом “ненадежный”.
Он сопоставит эту запись с ужеимеющимися и обнаружит, что это всего лишь другой вариант обозначения сущности“Триклинная”. При этом он добавит в список синонимов для модификации“Триклинная” литерал “тр”, а для самостоятельной записи “тр” выставит статус в“удален”, который обозначает, что данный глобальный идентификатор, в нашемслучае, 2, теперь не используется. При следующей итерации оболочка ИС попытаетсявыяснить глобальный идентификатор модификации “тр”, так как она получила впрошлый раз статус идентификатора “ненадежный”. Предметный посредник в ответ наэтот запрос вернет идентификатор 1 (соответствующий модификации “Триклинная”) состатусом “надежный”.Следует отметить, что запись для модификации “тр” в справочникемодификаций БД предметного посредника со статусом “удален”, фактически,становится ненужной, т.к.
литерал “тр” попадает в тезаурус синонимов модификации“Триклинная”. Такие записи со статусами “удален” могут удаляться из БД предметногопосредника, например, через месяц после выставления соответствующего статуса,чтобы не накапливать ненужные записи и, тем самым, не засорять БД.Аналогичныймеханизмпредлагаетсяиспользоватьиприразрешениисемантических конфликтов, связанных с названиями описываемых в интегрируемыхИС свойств неорганических веществ.Итак, подводя итоги, следует отметить, что предложен комплексный подход,который направлен на решение трех основных конфликтов гетерогенности висследуемой предметной области.
Таким образом, применение принципов разрешенияконфликтов, описанных в этой главе, позволит построить ИС по свойствамнеорганическихвеществ,интегрированнуюнауровнеисточниковданных.Организованная таким образом единая ИС будет объединять информацию из всехинформационных источников на основе подхода Local-As-View.Для объединения расчетных подпрограмм и существующих Web-интерфейсовинтегрируемых ИС, был предложен метод интеграции EAI. Параллельное применениеметодов EAI, EII и ETL позволит построить не имеющую аналогов интегрированнуюИС СНВМ.
Данная ИС сможет широко использоваться не только специалистами вобласти химии, но и системами поддержки принятия решений (СППР) для анализаданных в ИС, нахождения взаимосвязей и построения гипотез о существованиивеществ с заданными характеристиками.1483.5. Платформа для разработки интегрированной ИС СНВМРазработкаинформационнойсистемыс"нуля"можетпредставлятьсяоправданной лишь в том случае, если имеется ярко выраженная специфика предметнойобласти, и применение типовых программных решений попросту неприемлемо.Следует отметить, что это достаточно редкое явление. Большинство современныхинформационных систем используют в своей основе современное программноеобеспечение.
К нему относятся операционные системы, системы управления базамиданных и другое программное обеспечение, использование которого целесообразно приреализации конкретных информационных систем.В настоящее время существует большой выбор программной инфраструктурыдля реализации информационных систем. При построении любой информационнойсистемы выбор программной платформы является важным этапом, значение котороготрудно переоценить, так как неправильный выбор может значительно затруднитьреализацию идей, внедрение и дальнейшую поддержку проекта.
И наоборот, удачновыбраннаяпрограммнаяплатформазначительноупрощаетпостроениеинформационной системы, ее дальнейшую поддержку и сопровождение.Правильный выбор технологической платформы приведет к минимизациииздержек при создании информационной системы и повышению экономическойэффективности не только процесса разработки, но и большинства этапов жизненногоцикла информационной системы [122].Наиболее эффективным представляется подход, при котором за основупостроенияинформационнойсистемывыбираетсястандартноепрограммноеобеспечение и инструментарий, позволяющий полностью описать информационнуюсистему, при необходимости гибко достраивать и расширять ее функции, а такжеспособныйинтегрироватьсясдругимисистемами,впервуюочередь,ужеэксплуатирующимися.
Последнее особенно важно, учитывая, что базы данных посвойствам веществ для электронной техники разрабатывались на различныхаппаратных и программных средах.Очевидно, что в настоящее время рынок программного обеспечения достаточнобогат, и на нем есть группа крупных поставщиков, предлагающих схожие пофункциональным возможностям программные продукты. Среди таких компаний можновыделить Microsoft, IBM, Sun Microsystems, Oracle, BEA, Computer Associates и др. Дляопределения программной платформы, на базе которой будет осуществлятьсяпостроение информационной системы нужно провести всесторонний анализ продуктовведущих поставщиков. При этом следует отметить, что для повышения объективности149проводимого анализа необходимо использовать результаты сравнений в даннойобласти, проведенных крупными и авторитетными независимыми аналитическимикомпаниями.Рассмотримкритерии,которыебудутиспользованыдлявыборатехнологической платформы.
Здесь необходимо отметить, что все критерии можноусловно разделить на три группы:Функциональные – эта группа критериев должна отражать, насколько полноплатформы обеспечивают все требования, предъявляемые к функциональнымвозможностям создаваемой информационной системы. Следует также учитыватьполнотуподдержкисозданноймоделиданныхврамкахвыбраннойтехнологической платформы.Экономические – эта группа критериев оценивает экономическую эффективностьпредлагаемыхтехнологическихплатформ(стоимостьобщегоиспециализированного программного обеспечения, расходы на внедрение исопровождение системы).Технологические – эта группа критериев отражает насколько полно платформаподдерживает общепринятые стандарты при разработке информационных систем ивозможность интеграции с уже эксплуатируемым программным обеспечением.
Этикритерии включают также требования к аппаратным ресурсам.Что касается группы функциональных критериев, то все современныепрограммные платформы обладают достаточной гибкостью для решения различныхклассов задач. В связи с этим требуется исследовать возможности программныхплатформ по экономическим и технологическим критериям. Критерии выборапрограммной платформы предлагаются следующие:производительность;безопасность;надежность;интероперабельность;совокупная стоимость владения (ССВ).1503.5.1. ПроизводительностьВ связи с тем, что информационная система будет построена на базе Webсервера, наиболее уместным будет сравнение наиболее популярных Web-серверов,использующихся на сегодняшний день:Web-сервер Internet Information Server (IIS) на платформе Microsoft WindowsServer 2008;Web-сервер Apache на базе высокопроизводительных коммерческих Unixплатформ.Web-сервер Nginx на базе высокопроизводительных коммерческих Unix-платформ.Web-сервер Lighttpd на базе высокопроизводительных коммерческих Unixплатформ.Web-сервер G-WAN на базе высокопроизводительных коммерческих Unixплатформ.Для сравнения используются результаты испытаний опубликованные на сайтекомпании Web Performance, Inc в ноябре 2011 [123].
В этих тестах сравниваласьпиковаяпроизводительностьпочислуобрабатываемыхзапросоввсекунду,показываемая указанными выше Web-серверами на одном и том же аппаратномобеспечении. Основной вывод по результатам теста, гласит, что Web-сервер IIS 7.0 набазе Windows Server 2008 позволяет обслуживать большее число одновременноподключенных пользователей, чем Apache 2.x, Nginx, Lighttpd и G-WAN на базе RedHat Enterprise Linux 6.0.При этом на тестах статических Web-страниц преимущество платформыMicrosoft над Unix-платформами составляло от 2% на Web-сервере G-WAN и до 350%на Web-сервере Apache 2.x (рис. 3.5.1).151Рис.