Диплом Английский (1209256), страница 3
Текст из файла (страница 3)
Another important way to interact with the system is the data borrowing. It occurs by the transfer of values from one table of the system to another. Communication can arise from the most semantically filled tables to the most hierarchically weak. Borrowing is inextricably linked to the search operators. As a rule, the application interface implies the availability of these constituent elements.
1.3 "Searching" requirements for user interfaces
The new conditions of application and the growth of users put forward the new and higher requirements for text search. Below are the main requirements:
-
Providing the ability for search interfaces to work effectively with very large collections of documents;
-
Minimizing the time consuming both at the stage of familiarization with the interface and in the process of operation;
-
Interface must be intuitive, not misleading;
-
Each search interface must have the tools of speedy correction both of the system and the user error;
-
Development of the methods for improving the representation of the meaning of documents and user queries;
-
Providing the opportunities for the collaborative word processing of documents of a different nature - still images, audio, and video, etc.;
-
Development of the effective search methods not only in the static collections, but also in the flow of documents;
-
Creating the methodology for assessing the text search systems, the construction of text collections, and the experiment performance.
With regard to the applications of the database, the search functions should be complemented by the borrowing-and-paste functions. Let’s consider a typical example of organizing such an universal system on the example of some of its elements.
The Figure 1.3 shows the structure of the interaction of the database table for inserting the function. Besides, it is possible to notice the presence of the so-called feedback. This is expressed in a return to the semantically loaded table of higher level for the purpose of adding the new information to it. After the introduction of the search query into the appropriate lines of weak entity, there occurs an access to the content of the “Object” tables.
Figure 1.3 - Insert function database elements
The data modification works like the similar insertion principle, only the user does not need to appeal to the higher-order table in order to add the new values there. This is due to the fact that the modification involves changing the existing copies. By clicking the mouse button on any element, the newly open dialog boxes already demonstrate a template to the user in which it is necessary to make changes.
Figure 1.4 shows the structure of the interaction of database tables to modify the function.
Figure 1.4 - Modification function of database elements
Removing the content of the database tables is the most complex data processing operation. Perhaps, the user needs simply by pressing the button to remove the desired object from the list, but the structure of the database, especially the developed one, undergoes the tremendous changes.
Figure 1.5 shows the structure of the interaction of database tables for removal function.
Figure 1.5 - Removing function elements databases
Each object placed in the intermediate storage table may have a huge number of links and may depend on the contents of other similar tables. For this reason, such a transformation as deleting is able to break those links without the possibility of replenishing their alternatives and lead to failure of the entire database structure.
In designing such systems, the risks of destroying the relationships are taken into account with which the system can confront when removing the copies. As a rule, the removal procedure is carried out on the basis of the previously described dialog box that allows the user to start the system with the contents of the object area storing the original object. Each similar content of the tables with the original objects serves as its counterpart for establishing the ties.
The following situation can serve as the example of a structural failure of the system due to removing the object: if there is a table that stores personal information and the potential principle of inviolability that is laid in it in advance, it is possible to make an attempt to remove the content of one of the cells. The question is not just about cleaning range, but about the complete withdrawal of the copies from the database. If the previously created value was unique and it is, for example, a part of such an arrangement as the name, surname, and patronymic of the subject, the finished structure loses any meaning due to omitting one of the elements. Consequently, those data will not be recorded in the database
The table cannot display the data of the incorrect content because without mentioning any required attribute in the table, a person cannot exist each table structure is a type of a real object and reflects its real properties or characteristics; otherwise there would not be any sense in the creation of such systems.
-
Инструментальные средства и стандартные интерфейсы поиска
-
Базовые классы поиска: поиск по маске и контекстный поиск
-
Для успешного выполнения процедуры поиска информации в базах данных в настоящее время существуют некоторые классы, включающие в себя различные методы обработки поисковых запросов. В первую очередь для поиска необходима строка(String), которая находится в специальном окне или является частью интерфейса и включает в себя последовательность символов, так как именно по соответствию поискового запроса или его части может быть осуществлена связь с содержимым искомого фрагмента строки в тексте. К тому же, технология распознания запросов позволяет унифицировать использование различных стилей написания текстов в строке поиска. Разделение по различным критериям, таким как строчное или прописное написание, а также использование заглавных букв в запросе, положительно влияет на сужение результата поиска в случае полного совпадения запроса и частичного совпадения в случае приравнивания содержимого строки и текста к одному стандарту написания.
В настоящее время наибольшую популярность приобрели так называемый контекстный поиск и поиск по маске, которые имеют как положительные, так и отрицательные стороны при использовании в поисковых интерфейсах.
Контекстный поиск или поиск по содержанию может осуществляться как по фрагменту текста, так и по всему объему. Работа данного класса основывается на вычленении слов, части слов, либо целых фраз из текста и сопоставлению их с шаблоном, предложенным пользователем. В свою очередь контекстный поиск подразделяется на поиск с разделителями и пошаговый.
При всей своей популярности поиск с разделителями (delimited search) уступает в практичности пошаговому методу. Это обусловлено следующими обстоятельствами. Во-первых, поиск с разделителями заведомо предполагает введение пользователем в строку схожих с ожидаемыми результатами запросов, причем в полном объеме и в корректной форме. В качестве разделителя обычно используется не отображаемый символ (Ввод) Return. В связи с тем, что данный метод строго следует заданию пользователя, невозможно, введя случайным образом слитно несколько слов и запустив процесс поиска, увидеть хоть один результат совпадения. Во-вторых, так называемая необратимость запроса не позволяет пользователю прекратить процесс поиска или дополнить его новым заданием до тех пор, пока конечный результат не будет выведен на экран. Редки случаи, когда интерфейс данного метода показывает пользователю ошибки в написании запроса, основываясь на грамматических правилах, что влечет за собой невозможность поиска общих элементов.
В качестве поисковых запросов в такой модели не могут применяться так называемые стоп-слова (предлоги, союзы и т.д.), которые являются служебными символами содержания экземпляра. Использование их в качестве ключевых запросов сделало бы невозможной корректную обработку поступающей информации.
Менее популярным, но более продуктивным является пошаговый поиск (incremental search). В настоящее время данный метод начинает пользоваться все большим успехом в среде разработки веб-интерфейсов к поисковым машинам и сайтам. Наиболее ярким примером для описания работы пошагового поиска может служить работа системы Yandex. Также как и в поиске с разделителем, от пользователя требуется ввести некоторый набор символов для сравнения с фактическим элементом теста, но в данном случае обработка запроса начинается после введения любого первого символа и система сама автоматически начинает поиск сопоставимых результатов, имеющих в своем составе данный элемент. Чаще всего, посредством выпадающего списка ниже поисковой строки, система предлагает пользователю ознакомиться с результатами от наиболее до наименее подходящего. Стоит отметить, что упорядоченность результатов может быть описана как по временному признаку, так и по популярности. В системе Yandex, например, при выпадении списка пользователь видит результаты, к которым происходили наиболее частые обращения, т.е. наиболее популярный запросы. Вторым способом вывода результатов на экран при данном методе является непосредственный поиск по содержанию текста. В тот момент, когда пользователь дополняет предыдущий символ следующим, система автоматически переходит на более благоприятный экземпляр. Все это происходит при открытом окне поиска в реальном времени и процесс повторяется по мере введения новых символов пользователем. При этом если пользователь ошибается при вводе запроса, ему не требуется создавать новый, а лишь необходимо отредактировать имеющийся.
Главная проблема заключается в том, что программисты не имеют достаточно полный и удобный инструментарий для разработки интерфейсов с пошаговым методом поиска и, как следствие, получивший популярность пресловутый поиск с разделителем занимает лидирующие позиции. Примерами приложений имеющих ряд ограничений в этой области являются Visual Basic и JavaScript.
Из этого очевидно, что пошаговый метод позволяет:
-
Экономить больше времени;
-
Вносить поправки в запрос, не ожидая окончания процесса поиска;
-
Переходить на наиболее подходящий экземпляр, введением дополнительных символов;
-
Интерактивно осуществлять обратную связь между пользователем и системой;
-
Завершать процедуру поиска при нахождении искомого элемента.
Наряду с контекстным поиском в современных интерфейсах активно используется так называемый поиск по маске, который не уступает конкуренту в функциональности, но имеет свои преимущества.
Изначально поиск по маске задумывался как быстрый способ обнаружения файлов по фрагменту названия, но позже приобрел популярность в базах данных и в текстовых редакторах.
Главной особенностью данного класса является возможность редактирования запроса в зависимости от содержания искомого экземпляра. Однако пользователю нет необходимости знать или вспоминать данные для поискового запроса. Достаточно ввести несколько или один символ содержания экземпляра и использовать специальные символы описания недостающих элементов.
Характерной чертой поиска по маске выступает универсальность в области формирования запросов для отображения либо конкретных экземпляров, либо целых диапазонов значений. Впрочем, временные показатели эффективности оставляют желать лучшего. При всех положительных чертах данного способа, пользователю понадобится некоторое время, чтобы разобраться в принципе работы этой системы. Каждая ошибка может повлечь за собой переформирование или исправление запроса. К тому же, как известно, каждое упущенное мгновение проецирует колоссальный эффект на конечные временные затраты за весь сеанс использования интерфейса.
Поиск по маске дает возможность обнаружения экземпляра при:
-
Одном неизвестном знаке;
-
Нескольких неизвестных знаках;
-
Использовании диапазона некоторых знаков;
-
Неизвестной цифре или не цифре;
-
При некотором комбинированном выражении.
Рассмотрим возможные комбинации запросов в совокупности с конечным результатом поиска, представленные в таблице 1.
Таблица 1 – сочетания конструктора поисковых запросов
| Тип совпадения | Образец | Совпадение (True) | Несовпадение (False) |
| Несколько знаков | *a* | aa, aBa, aBBBa | aBC |
| *ab* | abc, AABB, Xab | aZb,bac | |
| Одиночный знак | a?a | aaa, a3a, aИa | aEEEa |
| Одиночная цифра | a#a | a0a, a1a | aaa, a10a |
| Диапазон знаков | [a-z] | f,p,j | 2,& |
| Вне диапазона | [!a-z] | 9,&,% | b,a |
| Не цифра | [!0-9] | A,a,^ | 0,1,9 |
| Комб. выражение | a[!b-m]# | An9,az0,a99 | abc, aj0 |
Используемые символы имеют следующие значения:
* - Любое количество, любых символов
? – Один, любой символ
# - Одна, любая цифра
[ ] – Диапазон знаков
! - Отрицание
-
Типовая организация поисковых интерфейсов
Как правило, процедура поиска необходимой информации может быть разделена на следующие основные этапы:
-
определение области знаний;
-
выбор типа и источников данных;
-
сбор материалов необходимых для наполнения информационной модели;
-
отбор наиболее полезной информации;
-
выбор метода обработки информации (классификация, кластеризация, регрессионный анализ и т.д.);
-
выбор алгоритма поиска закономерностей;
-
поиск закономерностей, формальных правил и структурных связей в собранной информации;
-
творческая интерпретация полученных результатов;
-
интеграция извлеченных "знаний".
Для проведения поиска первоначально на компьютере пользователя или в удаленном приложении загружается интерфейс работы с соответствующей БД. Это может быть локальная или удалённая БД. Первоначально следует определиться с видом поиска (простой, расширенный и т.д.). Затем с набором предлагаемых для поиска полей. ИПС могут предложить для ввода одно или несколько полей. В последнем случае это обычно поля: имени, заглавия (названия), временного периода, типа информации, ключевых слов, рубрик и др.















