Бонус или продолжение следует
ПРОДОЛЖЕНИЕ СЛЕДУЕТ, ИЛИ ТЕНДЕНЦИИ И ПЕРСПЕКТИВЫ РАЗВИТИЯ ПОЛЬЗОВАТЕЛЬСКОГО ИНТЕРФЕЙСА
На данный момент уже достаточно четко обозначились четыре основные тенденции в развитии технологий создания пользовательского интерфейса:
1. Интеграция интерфейса «настольных» приложений с Web- интерфейсом.
2. Унификация интерфейса приложений, созданных на различных аппаратно-программных платформах.
3. Повышение уровня адаптивности («интеллектуальности») интерфейса.
4. Более широкое внедрение мультимедийных технологий в интерфейс приложений, вне зависимости от их функционального предназначения.
Изменение стандартов пользовательского интерфейса по первому направлению происходит одновременно с развитием Интернет-технологий. Причем процесс идет настолько бурно, что прогнозы даже на не очень отдаленную перспективу - дело весьма затруднительное. Практически каждый новый программный продукт, предоставляющий пользователям тот или иной сервис в Интернете, добавляет очередной штрих к интерфейсу «настольных» приложений. Судя по всему, уже в ближайшее время невозможно будет отделить компоненты интерфейса, обеспечивающие взаимодействие пользователя с локальными ресурсами его ПК, от компонентов, предоставляющих ему доступ к сетевым ресурсам. Ярким примером такого слияния является новая версия диалоговых панелей для работы с файлами (Save, Open, Save as), используемых в MS Office 2000. Они теперь поддерживают работу пользователя с папками специального типа - Web Folders, а в список фильтров Files of type добавлены типы файлов .htm, .html и .uri; это позволяет выполнять соответствующие операции с Web-документами как с локальными данными.
«Экспансия» Web-интерфейса во все другие области применения информационных технологий позволяет говорить о том, что три остальные направления развития пользовательского интерфейса лишь способствуют реализации этой «генеральной линии». Тем не менее каждое из них заслуживает отдельного комментария.
Возможность унификации интерфейса приложений, работающих на различных платформах, основана на совместном использовании клиент-серверных и компонентных технологий. Суть имеющихся на сегодняшний день решений заключается
Рекомендуемые материалы
в том, что наэкране пользовательского (клиентского) IIK отображаются лишь визуальные элементы интерфейсной части приложения, а обработка действий пользователя возлагается на серверную компоненту. Надо сказать, что по такой технологии изначально была организована работа «конкурента» MS Windows - графической среды XWindow, созданной для семейства UNIX-систем. И не случайно наиболее удачные решения по реализации «межплатформного» интерфейса были получены в тех случаях, когда ставилась задача интеграции MS Windows с UNIX-системами.
Одним из таких решений является пакет Winted, выпущенный корпорацией TriTeal в конце 1998 года. Пакет предназначен для интеграции настольных систем, работающих под управлением MS Windows (95/NT Workstation), и UNIX-систем. Он предоставляет пользователям так называемый CDE-интерфейс (Common Desktop Enviroment -единый Рабочий стол), содержащий виртуальные экраны, а также единые для обеих систем службы работы с файлами и печати. Кроме того, обеспечивается передача данных между приложениями через буфер обмена. Важным достоинством Winted является то, что он поддерживает DCD-технологию. Благодаря этому щелчок мышью на имени или пиктограмме файла данных приводит к запуску связанного с ним приложения, независимо от того, для какой из двух платформ оно было разработано.
Другой, не менее эффективный вариант интеграции приложений основан на применении технологии ICA (Independent Computing Architecture), разработанной корпорацией Citrix Systems. Компания QSSL встроила программную поддержку ICA в операционную систему реального времени QNX. Это делает возможным распространение существующих Widows-приложений практически на все виды встроенных систем или тонких клиентов. В результате приложения типа Word или Excel могут выполняться, например, даже на портативных вычислительных устройствах с емкостью ОЗУ 4Мб. Такой эффект достигается за счет того, что сетевой протокол ICA передает на сервер действия пользователя, связанные с нажатием клавиш клавиатуры, кнопок мыши, ее перемещением, а также с обновлением экрана (рис. 9.1).
В настоящее время существует два программных продукта, обеспечивающих интеграцию графического интерфейса для QNX (Photon microGUI) с другими графическими средами - Phindows (Photon in Windows) и Phinx (Photon in X). Первый из них, в полном соответствии со своим названием, предназначен для интеграции QNX с Windows-приложениями, а второй решает ту же задачу применительно к XWindow.
При обсуждении возможных способов повышения «интеллектуальности» пользовательского интерфейса мы вновь вынуждены отделить Web-интерфейс от интерфейса приложений, используемых в других предметных областях. Объясняется это основным предназначением Интернета - предоставление посетителю интересующей его информации. Работа нынешних поисковых систем основана на ранжировании текста по ключевым словам. Поэтому применительно к ним говорить об интеллектуальной адаптации к потребностям пользователя не приходится. Наиболее перспективными направлениями изменения ситуации являются два:
• реализация естественно-языкового интерфейса;
• использование динамической (изменяемой) модели пользователя.
Рис. 9.1. Реализация интегрированного интерфейса по технологии ICA
Естественно-языковый интерфейс предполагает наличие процедур лексического и семантического анализа текста. На этих принципах построены средства интеллектуального поиска данных (data mining), способные выявлять скрытые закономерности. Работы в этой области ведутся очень активно, в том числе и в России [11], но говорить о практических результатах пока рано.
Другой аспект естественно-языкового интерфейса - это независимость результатов поиска от языка запроса. Другими словами, посетитель Интернета должен иметь право формулировать запрос на родном языке и получать интересующие его сведения независимо от того, на каком языке они представлены в Интернете. Идеальный вариант - когда результат поиска также представляется на родном языке посетителя. С целью объединения усилий различных категорий специалистов для решения указанных проблем была сформирована специальная отрасль информационных технологий - языковая инженерия. Одним из проектов, относящихся к этой отрасли, является система MULINEX, над которой работают специалисты из Германии, Франции и Италии. MULINEX должна обеспечивать избирательный доступ к информации, просмотр и навигацию в многоязычной среде по запросу, сформулированному на любом из поддерживаемых языков. Важным направлением работ в области языковой инженерии являются исследования по применению системы кодирования текстовой информации UNICOD, обеспечивающего работу с многоязычными текстами.
Более подробную информацию по проблемам языковой инженерии можно получить по следующим адресам:
•http://www.linglink.lu/le/en/mdex.litml - европейский сервер по языковой инженерии;
• http://mulinex.dfki.de/ — проект MULINEX;
• http://www.unicode.org/ — проект UNICODE.
Адаптация интерфейса в соответствии с моделью (характеристиками) пользователя предполагает наличие средств построения этой модели. Существующий уровень аппаратного и программного обеспечения не позволяет реализовать эти средства таким образом, чтобы они выполняли свои функции, не замедляя работу пользователя с «настольным» приложением. Другое дело - Интернет. Темп взаимодействия пользователей с сетевыми ресурсами значительно ниже скорости их работы с «настольными» приложениями. Поэтому дополнительные затраты времени на адаптацию здесь менее заметны. Вместе с тем, и для Интернета уже назрела необходимость перехода от ресурсоемких автономных приложений, предназначенных для настройки содержимого узла (групповых фильтров и продуктов типа Learn Sesame) к более изящным решениям. Например, на основе нейронных сетей. Судя по имеющимся тенденциям, такие решения будут получены сначала именно для Интернета, и лишь после этого реализованы в «настольных» приложениях.
Внедрение мультимедийных технологий связано, как известно, с расширением диапазона средств взаимодействия пользователя с компьютером. Наряду с основным каналом приема информации - зрительным - задействуются и те, которые человек обычно использует в реальной жизни (слуховой, тактильный, обонятельный, кинестетический). Кроме того, расширяются и формы представления визуальной информации - двумерное, «плоское» изображение заменяется трехмерным, значительно шире и разнообразнее применяются анимация и видеоклипы. Очевидно, что перспективы развития мультимедийных технологий связаны в первую очередь с совершенствованием имеющихся и появлением новых устройств ввода и вывода данных (разумеется, в сочетании с разработкой соответствующего программного обеспечения).
Следуя основной концепции книги, мы приведем лишь несколько примеров имеющихся достижений в области создания мультимедийных устройств ввода, сосредоточив основное внимание на перспективах визуализации информации.
Первый из таких примеров- это устройство, обеспечивающее бесконтактный ввод команд в компьютер, одной лишь «силой мысли» пользователя. Устройство, получившее соответственное название — Mind Drive, — разработано фирмой The Other 90% Technologies в 1997 году и по внешнему виду напоминает увеличенный раза в три наперсток. Его работа основана на анализе информации, поступающей от вмонтированных в «наперсток» датчиков. Такой информацией являются пульс, температура кожи, ее проводимость и электрическая активность, а также скорость изменения этих показателей. Для работы с Mind Drive требуются определенные навыки, на формирование которых уходит один-два часа. Пока устройство способно выдавать только один аналоговый сигнал, поэтому для управления объектами в двух измерениях необходимо переключать управление с помощью клавиатуры. В планах фирмы The Other 90% Technologies - разработка многокоординатных устройств и специального «словаря» для распознавания типов сигналов.
Более близкие перспективы связаны с использованием сенсорных и голосовых технологий.
Считается, что сенсорный ввод очень хорошо согласуется с генетически заложенным в человеке стереотипом поведения: чтобы усилить субъективное ощущение надежности источника (или приемника) информации, человеку хочется его потрогать. Вспомните, например, как мы любим водить пальцем по карте, отыскивая нужную точку, или как многие, у кого берут интервью, пытаются отобрать микрофон у интервьюера (хотя ни то, ни другое на самом деление требуется). Еще одно достоинство сенсорных технологий - повышенная защищенность от ошибочных действий оператора. Поскольку при использовании сенсорного ввода клавиатура на экране монитора формируется программно, то на экране можно оставлять только те клавиши, которые необходимы в данный момент. Программно-сенсорные экраны позволяют также полностью эмулировать работу со стандартной мышью. Драйвер позволяет описать реакцию на нажатие, отжатие, двойное прикосновение к экрану.
В настоящее время на рынке сенсорных технологий ведущую роль играют четыре:
• на основе поверхностных акустических волн;
• на основе изменения распределенной емкости;
• на основе инфракрасных волн;
• резистивная технология.
Несмотря на различия физических принципов, положенных в их основу, все эти технологии достаточно близки по предоставляемым возможностям, за исключением обеспечиваемого разрешения. Эта характеристика изменяется в широких пределах: от 64 точек на кв. дюйм для инфракрасных волн до 100 000 точек на кв. дюйм для резистивной технологии.
В начале 1998 года появилась еще одна разновидность сенсорного экрана -Scribex фирмы ЕЮ. Такие экраны предоставляют возможность рукописного ввода информации.
Люди также интересуются этой лекцией: Коллективные взаимодействия процессов.
Существующие в настоящее время аппаратно-программные средства, реализующие голосовые технологии, обеспечивают точность распознавания речи не более 95% [12]. Это означает, что при голосовом вводе одной страницы печатного текста примерно 20 слов воспринимаются неправильно. В некоторых случаях это может привести к искажению смысла текста. Вместе с тем, такая точность приемлема при вводе отдельных команд. Примерами программ, предназначенных для обработки слитной речи, являются Voice Xpress Plus фирмы Lernount&Hauspie Speech Products N.V. и NaturallySpeacing фирмы Dragon Systems. Оба эти продукта рассчитаны на постоянного пользователя, а точность их работы повышается по мере адаптации к голосу; процесс начальной адаптации занимает около 40 минут. Различия между ними заключается в том, что Voice Xpress Plus встраивается непосредственно в текстовый процессор MS Word, a NaturallySpeacing имеет собственную текстовую программу, которую необходимо перед применением копировать в используемый текстовый процессор. Voice Xpress Plus позволяет не только вводить текст, но и форматировать его с помощью команд меню Word.
И все-таки, «лучше один раз увидеть, чем сто раз услышать». Поэтому вернемся к перспективным технологиям визуализации информации, отображаемой на экране.
Речь идет в первую очередь о технологии создания виртуальных миров на основе языка моделирования виртуальной реальности VRML (Virtual Reality Modeling Language). С помощью VRML в Интернете можно создавать управляемые трехмерные пространства с гинерсвязями, называемые «мирами» [ 13]. VRML не просто язык, позволяющий ввести трехмерность в Интернет, — это одна из наиболее перспективных технологий, которая открывает новые возможности в организации общения между пользователем и компьютерными системами. Благодаря применению VRML Интернет становится более «осязаемым», и путь к Web-узлу может быть задай практически также, как мы указываем маршрут в реальном мире, например, «Вам следует подняться на второй этаж и войти во вторую дверь налево». Если же посетитель знает маршрут, то ему достаточно щелкнуть мышью на изображении нужной двери (или на каком-то другом объекте), чтобы оказаться в требуемой точке Интернета. Другими словами, в Интернете виртуальный мир может играть роль трехмерной сенсорной карты. Отличие состоит в том, что по воле разработчика посетитель оказывается как бы «внутри» этой карты. Основным препятствием для широкого распространения VRML-техноло-гии является ее ресурсоемкость. VRML-файлы имеют большой объем, а поскольку выполняются они в режиме интерпретации, то реализуемые на их основе виртуальные миры оказываются весьма «неповоротливыми». Указанную проблему можно в значительной степени преодолеть, используя VRML совместно с HTML и Java.
Именно такой подход применила фирма Microsoft при разработке продукта Chrome, предназначенного для создания и исполнения мультимедийных Web-приложений (его можно также использовать для построения настольных мультимедийных систем). Предполагается, что уже в ближайшее время Chrome будет реализован в виде дополнительного модуля для Windows 2000 и Windows NT. Это позволит использовать его в качестве стандартного средства построения трехмерного графического пользовательского интерфейса. Другим примером применения Chrome является генерация трехмерного куба, грани которого отображают различные формы представления визуальной информации (текст, графику, видео). Состав отображаемых на экране элементов содержимого зависит от того, как пользователь взаимодействует с этим виртуальным кубом.
Еще одной причиной, сдерживающей широкое распространение VRML, является достаточно сложный синтаксис языка (по сравнению с XML и HTML). Это обуславливает необходимость создания развитых визуальных VRML-редакторов, которых пока не очень много и которые не позволяют реализовать все возможности языка. Два наиболее используемых VRML-редактора, предназначенные для работы в среде Windows - Pioneer фирмы Caligari и 3-D Website Builder фирмы Virtus. Описание их основных функциональных возможностей можно найти в [ 13].
Реализация рассмотренных направлений делает все более актуальной вопрос стандартизации пользовательского интерфейса на глобальном уровне, вне зависимости от аппаратно-программной платформы и предметной области, для которых разрабатывается то или иное приложение.