Программные системы информационного обеспечения научной деятельности - модели, структуры и алгоритмы (1094956), страница 4
Текст из файла (страница 4)
Информационно-поисковые системы научной тематики (каталоги ресурсов) работают с документами после непосредственного согласования форматов метаданных, при этом активно развиваемые в последнее время системы, использующие концепцию Semantic Web, могут работать только сдокументами, у которых значения метаданных суть элементы заданных словарей. Наконец, поисковые системы общего назначения работают с любыми документами, но слабоиспользуют анализ метаданных, что приводит к к низкой пертинентности найденныхдокументов.В процессе анализа особенностей процесса обработки интернет-документов отмечено следующее. В тех случаях, когда документ сети Интернет представляет конкретнуюсущность (книгу, статью и т.п.) или же отображает ее (то есть является точной копией11или электронным образом другого документа), подходы к изучению его информационного содержания аналогичны тем, которые применяются в библиотечном деле приизучении информационного содержания полиграфического издания.
Если же интернетдокумент описывает реальную сущность, например персону, организацию, артефакт,природный объект и т.д., его стандартного библиографического описания может оказаться явно недостаточно для создания адекватного поискового образа документа. Воизбежание этого библиографическое описание дополняется необходимой информацией,относящейся к описываемой сущности, для чего используются стандарты или принятыеправила соответствующей предметной области.Отличительной особенностью интернет-документа является наличие у него сетевого имени, без занесения которого в каталожную карточку документа каталогизациястановится бессмысленной.
Заметим, что речь идет не только о статических именах:имя, образуемое при запросе динамически формируемого интернет-документа, такжеможет быть использовано для каталогизации.Другой особенностью интернет-документа, резко отличающей его от полиграфического издания, является возможность внесения в него изменений. Необходимость оперативного отслеживания изменений — важная составляющая процесса каталогизацииинтернет-документов.Показано, что задача более или менее полной каталогизации интернет-документовнаучной и научно-организационной тематики в соответствии с библиографическимистандартами крайне сложна ввиду следующих причин:1.
Огромное количество документов, причем в качестве новых интернет-документовмогут выступать давно опубликованные полиграфические документы (так, многие научные журналы постепенно выкладывают на свои сайты статьи, вышедшиев старых номерах).2. Отсутствие специальных структур, отслеживающих появление новых документов в сети, — например, каталогизацией научных интернет-документов обычно занимаются заинтересованные специалисты, работающие в соответствующейпредметной области.3.
Необязательность авторской классификации интернет-документов (в отличие отпечатных изданий) посредством их аннотирования, приписывания кодов классификатора и т.п., что значительно осложняет процесс каталогизации.4. Проблема отслеживания изменений документов.На основании сказанного сделан вывод о том, что важнейшей особенностьюинтернет-документов является необходимость и возможность частичной автоматизации процесса каталогизации.Для создания модели информационного обеспечения деятельности научного сообщества необходима разработка методологии комплексного изучения интернет-сайтов,учитывающей, прежде всего, их качественные характеристики (в отличие от традиционных вебометрических методик, делающих упор на статистические характеристики).В § 1.3 предложена методология комплексного изучения интернет-сайтов.Выделяются три основных аспекта научного анализа тех или иных артефактов(в т.ч.
сайтов):1) технология производства;2) сравнительный анализ артефактов на основе их функциональных свойств (систематизация, классификация и т.п.);3) влияние (в широком смысле) на человека и общество.12Обычно научный интерес представляют лишь некоторые из перечисленных аспектов, притом рассматриваемые по отдельности. Комплексно все три указанных аспектаизучаются лишь в архитектуре (А.В.Иконников), объекты которой имеют принципиальное сходство с сайтами по целому ряду признаков:1. Если архитектура представляет собой организацию среды физического пребывания человека, то сеть Интернет впервые создает единое информационное пространство человеческой цивилизации.2.
Разнообразие информационных потребностей вызывает необходимость массовогопроизводства интернет-сайтов самого разнообразного назначения, сопоставимого с массовым строительством, причем среди технологий, применяемых в мелкосерийном или штучном производстве, технологии строительства и созданияинтернет-сайтов относятся к числу наиболее сложных, что приводит к необходимости их системного изучения.3. Архитектурные сооружения и интернет-сайты имеют определенное структурноесходство, так как представляют совокупность более или менее однородных объектов (соответственно помещений и документов), связанных между собой определенным образом.4. Терминология описания интернет-сайтов во многом заимствована из архитектуры (термины “архитектура сайтов”, “строительство сайтов”, “портал” и проч.).Особенно ярко данное обстоятельство проявилось в истории развития идеи шаблонов проектирования.
Первоначально (К.Александер, 1977) они возникли для решениязадач архитектуры, однако наиболее широкое развитие получили в задачах программирования, причем первый шаг в этом направлении (К.Бек, В.Каннингем, 1987) былсделан применительно к технологии создания пользовательских интерфейсов.Таким образом, для изучения интернет-сайтов с целью создания создания моделиинформационного обеспечения той или иной сферы деятельности в диссертации обосновано использование комплексного подхода к изучению характеристик интернет-сайтов,при котором сайт исследуется в нескольких взаимосвязанных аспектах:1) как источник данных,2) как техническое средство обработки и распространения информации,3) как социокультурный феномен(традиционно эти аспекты рассматривались по отдельности).Во второй главе на основании проведенного анализа информационных потребностей научного сообщества построена модель описания его деятельности.В § 2.1 исследованы основные характеристики информационных потребностей всфере науки на современном этапе.
Основные результаты в этой области получены вмонографиях ВИНИТИ “Научные коммуникации и информатика” (1976) и “Инфосфера” (1996), однако происшедшее за последние 10–15 лет развитие высоких технологийв области передачи и обработки информации, в частности, создание современных телекоммуникационных систем (прежде всего сети Интернет как источника множестваразнородных документов научной направленности), привело к появлению принципиально новых возможностей организации практически всех этапов научно-информационного процесса, что, в свою очередь, обусловило качественный рост информационныхпотребностей научного сообщества, выразившийся в желании незамедлительно получать нужную информацию (еще в середине 1990-х годов отмечалось, что для ученыхсрочность удовлетворения информационных потребностей не важна).13К тому же за указанный период времени в России произошло изменение принциповфункционирования и финансирования науки, что также не могло не сказаться на характере информационных потребностей ученых.
Так, в монографии “Инфосфера” проведено резкое разграничение информационных потребностей ученых-исследователей,специалистов-инженеров, и управленцев. В настоящее же время благодаря господствувысоких технологий размывается грань между наукой и производством, вследствиечего ученые, используя результаты своих фундаментальных исследований, стали более активно заниматься опытно-конструкторскими работами и даже непосредственнымпроизводством уникальных наукоемких изделий.
Ввиду этого, как показано в диссертации, у ученых возникает потребность не только в научно-исследовательской, но инаучно-инновационной информации. Кроме того, выполнение проектов Федерального агентства по науке и инновациям, грантов РФФИ и т.п. требует управленческихнавыков, включая использование управленческой (научно-организационной) информации, не только от руководства научных учреждений, но и непосредственно от ученыхисследователей.В § 2.2 проведено исследование оценки научным сообществом сравнительной важности тех или иных форм удовлетворения информационных потребностей коллективныхпользователей.
С этой целью проведен анализ тематики интеграционных проектов СОРАН за 2000–2009 гг. в области информатики и ее приложений к задачам других наук(см. табл. 1), который показал, что коллективные пользователи — научные учреждения СО РАН особенно нуждаются в разработке специализированных информационныхсистем на основе интернет-технологий с использованием современных алгоритмов обработки данных и в технологиях получения новых знаний из данных, причем перваяиз названных задач тесно увязана со второй.Таблица 1. Распределение интеграционных проектов по тематике (некоторые проектысоответствуют сразу нескольким направлениям).Годы2000200320062009Моделир.Анализ моделейТелекомм.Анализ данных,интеллектаинформ.структурсистемыизвлеч.
знаний08%9%20%009%020%17%27%30%40%50%55%80%Создание информ. системв т.ч. с анализом данных80%67%45%50%25%50%80%100%На основе анализа интеграционных проектов установлено, что наблюдается ростпотребностей коллективных пользователей — научных учреждений СО РАН как вразработке специализированных информационных систем, основанных на интернеттехнологиях, так и в технологиях получения новых знаний из данных, причем перваяиз названных задач тесно увязана со второй.В § 2.3 показано, что простейшая модель описания деятельности1 , имеет видM D = hS , S , O , O , rhsi , sj i, rhsi , oj i, rhoi , oj ii,где S и S — множества субъектов деятельности (соответственно групп и персон),O и O — множества объектов деятельности (соответственно предметов и продуктовдеятельности), rhsi , sj i, rhsi , oj i, rhoi , oj i — связи вида “субъект — субъект”, “субъект —1Вдиссертационной работе речь идет исключительно о деятельности, связанной с информационными объектами.14объект”, “объект — объект” соответственно (номер индекса отвечает тому или иномутипу субъекта или объекта).Путем сравнительного анализа моделей информационного обеспечения деятельности научного сообщества и других видов человеческой деятельности, сходных с ней втом или ином аспекте (производство, искусство, законодательная и общественная деятельность), установлено, что модель описания научной деятельности обладает следующими особенностями:1) необходимость включения подробной информации о персонах, связи персон сохраняют актуальность;2) необходимость включения подробной информации о структуре групп;3) возможность вхождения персоны сразу в несколько групп;4) максимально подробное представление информации о предмете деятельности;5) наличие связей между персонами и предметом деятельности.Дополнительные характеристики блока научно-инновационной информации заключаются в следующем:1) субъекты деятельности — преимущественно организации;2) возможность утраты отдельными источниками актуальности;3) наличие большого количества “внешних” источников (например нормативноправовых актов), которые могут быть непосредственно связаны с объектами деятельности.Отличительной особенностью предложенной информационной модели описания деятельности научного сообщества (иногда называемой для ясности моделью информационного обеспечения деятельности научного сообщества) является, во-первых, четкоевыделение субъекта и объекта деятельности.