46364 (630418), страница 4
Текст из файла (страница 4)
Вопрос 30(окончание).
Документы, КП которых превышает пороговое значение T3, включаются в состав нового кластера;
Документы, КП которых меньше или равно T3, но больше некоторого порогового значения T4, включаются в множество свободных документов;
Документы, КП которых не больше T4, называются не включенными в кластеры.
Этот процесс повторяется до тех пор, пока все документы не будут отнесены к разряду свободных или не будут включены в какой-либо кластер.
Рассчитывается КП всех свободных документов со всеми центроидами кластеров и там, где подобие окажется максимальным и относят каждый свободный документ.
31.Коррекция кластеров сверху вниз.
В начале строятся один или несколько очень больших кластеров, которые затем разбиваются на более мелкие.
Способы выбора исходных классов:
В качестве центров классов используются случайные документы;
Классом с именем i можно считать множество документов, в векторах которых находится термин i;
В качестве исходных классов принимаются все документы, признанные релевантными некоторому запросу по результатам предыдущих поисковых операций.
Процесс коррекции кластеров:
Вычисляется КП между каждым документом и каждым центроидом кластера;
Кластеры переопределяются путём отнесения документов к тем из них, по отношению к которым, они имеют наибольшее подобие;
Формируются центроиды новых кластеров.
Эти 3 шага выполняются до тех пор, пока:
Будет необходимость в изменениях;
Чтобы процесс не был бесконечным, он выполняется в заданное число итераций.
32.Однократная кластеризация.
Документы рассматриваются в произвольном порядке и каждый документ либо относится к существующему классу, если КП достаточен, либо образует новый кластер.
“+”: каждый документ обрабатывается только 1 раз, => требует мало времени.
“-”: состав и структура классов существенно зависит от порядка рассмотрения документов.
33.Основные критерии хорошего диалога.
Естественность;
Последовательность;
Краткость;
Поддержка пользователя;
Гибкость.
Естественность – свойство диалога, в соответствии с которым пользователю не нужно менять свои традиционные способы решения задачи.
Свойство включает следующие аспекты:
Диалог должен вестись на родном языке пользователя;
Стиль ведения диалога должен быть разговорным, т.е. имеется в виду краткость;
Фразы не должны требовать дополнительных пояснений;
Допускается использование жаргона пользователя;
Порядок ведения диалога должен соответствовать порядку, которым обычно пользователь обрабатывает информацию;
Должна быть исключена предварительная обработка данных перед их вводом в систему.
35.Краткость и поддержка пользователя как критерии хорошего диалога.
Краткость.
Требует от пользователя ввода минимума информации. Это, с одной стороны, убыстряет работу системы, а, с другой, приводит к появлению ошибок.
Рекомендации:
Не следует запрашивать информацию, которую следует сформировать автоматически;
Информация не должна выводится сразу же, только потому, что она стала доступна системе. Она должна выводится только в том объёме, который требуется пользователю и в нужном для него формате.
Поддержка пользователя – мера помощи, которую система оказывает пользователю при работе с ней.
Эта поддержка выражается в 3-х видах:
Инструкции пользователя. Выводятся в виде подсказок или справочной информации. При этом справочная информация должна быть контекстной, своевременной и доступной в любой точке диалога. Помимо внутрисистемной существует внешняя справочная информация, которая сопровождает текст в виде бумажного носителя. Там указывается 5 моментов:
Общий обзор, в котором описывается назначение системы, основные понятия предметной области, необходимые для оценки системы, связанные с этими понятиями принципы работы системы;
Как начать работу с системой;
Сведения о поведении пользователя при выходе системы или отдельных частей из строя;
Пример работы с системой;
Ограничения на систему.
Сообщения об ошибках. Хорошее сообщение об ошибке должно отвечать следующим требованиям:
Должно быть изложено в терминах, понятных пользователю;
Нужно точно определить причину ошибки;
Должно пояснять, как исправить ошибку;
Должно быть своевременным, пока не проделаны вещи, которые необратимы.
Подтверждения каких-либо действий системы.
36.Гибкость как критерий хорошего диалога.
Гибкость - мера того, насколько хорошо диалог соответствует различным уровням подготовки и производительности труда пользователя. Гибкость называют свойством адаптивности системы.
Существует 3 системы, которые характеризуют её гибкость:
Фиксированная адаптация. При этом пользователь сам явно выбирает свой уровень подготовки;
Полная адаптивность. Здесь диалоговая система строит модель пользователя, которая меняется автоматически по ходу работы системы.
Косметическая. Занимает промежуточное место между фиксированной полной и достигается использованием специальных приёмов:
Приём использования сокращений (md – mkdir , cd – chdir , *.bak);
Синонимы – пользователь выбирает то, что ему ближе;
Использование объектов по умолчанию и макросы.
Вопрос 39(окончание).
Алгоритм восходящего левостороннего СА:
Слева во фразе выделяется слово с морфологическими признаками (элемент свёртки). Если фраза пуста, по выполняется шаг 4, иначе следующий шаг;
Элемент свёртки сравнивается с правыми частями продукций. Если его совпадение, то элемент свёртки заменяется на левую часть продукции и выполняется передача на начало шага 2. Если совпадений нет выполняется следующий шаг.
Выбирается элемент из стека. Если при этом стек пуст, то элемент свёртки помещается в стек и выполняется шаг 1, иначе элемент из стека и элемент свёртки заменяются на понятия элемент свёртки и выполняется шаг 2.
Выполняется когда фраза обработана полностью. Здесь выбирается элемент из стека. Это должен быть начальный символ грамматики. В этом случае, если, к тому же, стек пуст, делаем 2 вывода:
Предложение принадлежит языку.
Построили его структуру, которая используется на этапе СеА.
Если условие не выполняется (стек не пуст), то либо предложение построено синтаксически неверно, либо при свёртке были использованы не те продукции. В этом случае возвращаются на тот шаг СА, где была возможность выбора альтернативной продукции.
СА методом развёртки. Здесь делается предположение, что исходное предложение уже принадлежит языку, а следовательно к ней применяется 1-я продукция грамматики, в которой левая часть является начальным символом грамматики. Этот шаг является 1-м шагом алгоритма развёртки. Введём здесь понятие элемента развёртки, роль которого на 1-м шаге правая часть продукции.
2-й шаг: из элемента развёртки выбирается крайний слева нетерминальный символ. Нетерминальный символ заменяется правой частью продукции с соответствующей левой частью того же списка продукции. Управление передаётся началу 2-го шага этого алгоритма. Если цепочка не содержит нетерминальных символов, она сравнивается с исходной анализируемой цепочкой. Если они совпадают, то конец алгоритма, иначе переход к шагу 3.
Шаг 3: разбор выполняется заново и при альтернативных вариантах продукции выбираются те, которые ранее не использовались. Т.е. выполняется разбор предложения фактически, по несколько другой схеме.
Если в грамматических правилах преобладают правила с одинаковыми левыми частями, оптимальнее выбирать восходящий разбор предложения и наоборот, если превалируют правила с альтернативными правыми частями нужно выбирать нисходящий разбор.
43.Основные аспекты информационной безопасности.
Под безопасностью БД понимается их защита от случайного или преднамеренного разрушения, искажения или утечки. Решение этой проблемы относится к организационному виду обеспечения информационных систем.
Аспекты ИБ.
Идеологический аспект обеспечения ИБ. Состоит в разъяснении, внушении работникам фирмы правил в необходимости обеспечения ИБ фирмы.
Управленческий аспект – разработка различных указаний, распоряжений, регламентирующих права и обязанности работников по обеспечению ИБ фирмы.
Организационный. Связан с созданием специального служебного обеспечения ИБ и принятия соответствующих защитных мер.
Программно-технический аспект. Включает 2 направления:
Управление доступом. Обеспечивает защиту от несанкционированного доступа;
Управление целостностью. Обеспечивает защиту от неверных изменений и разрушений. Это управление рассматривается в 3-х аспектах:
Обеспечение достоверности – предупреждение возможных ошибок в значениях данных из-за ошибок в управлении;
Обеспечение параллелизма в выполнении операций над информацией. Состоит в том, что целостность информации не нарушается при одновременном выполнении нескольких операций;
Восстановление данных. При программных или аппаратных сбоях необходимо обеспечить быстрое восстановление данных и продолжение работы системы.
44.Постановка задачи программно-технического обеспечения информационной безопасности.
Программно-технический аспект. Включает 2 направления:
Управление доступом. Обеспечивает защиту от несанкционированного доступа;
Управление целостностью. Обеспечивает защиту от неверных изменений и разрушений. Это управление рассматривается в 3-х аспектах:
Обеспечение достоверности – предупреждение возможных ошибок в значениях данных из-за ошибок в управлении;
Обеспечение параллелизма в выполнении операций над информацией. Состоит в том, что целостность информации не нарушается при одновременном выполнении нескольких операций;
Восстановление данных. При программных или аппаратных сбоях необходимо обеспечить быстрое восстановление данных и продолжение работы системы.
46.Задача управления целостностью.
Аспекты решения этой задачи:
Обеспечение достоверности. Как правило эта задача решается для структурированных БД и сводится к обеспечению значений ключевых и неключевых полей, во-первых, в соответствии с семантической предметной областью, во-вторых, в соответствии со смыслом понятия “ключевое поле” или “ключ”.
Характеристики данных, которые при этом вводятся носят структурный или семантический характер.
Структурные характеристики не имеют отношения к семантике предметной области и уникальны. 2 вида структурных характеристик:
Значение ключевых полей должно быть непустым;
Адресные ссылки должны относиться к непустым записям.
Семантических характеристик можно ввести сколько угодно, в соответствии с предметной областью, т.е. выделяются с предметной областью. Чем больше этих характеристик, тем корректней данные, но тем дольше идёт обработка и заполнение БД.
Управление параллелизмом. Наиболее актуальна в распределённых системах. Эта задача возникает, когда к одним данным обращается несколько пользователей. Для того чтобы при выполнении параллельных задач не возникла задача некорректности получаемой информации вводится блокировка данных, если они запрашиваются процедурой, связанной с их модификацией.
Суть: если к данным х1 обращается транзакция (процедура) t1 с целью их модификации, она запрещает доступ к этим данным всем остальным транзакциям до тех пор, пока сама полностью не отработает. После этого выполняется разблокировка данных.
Восстановление данных. Задача возникает при аппаратных и программных сбоях. Решение задачи состоит в ведении системного журнала, в котором фиксируются все изменения, осуществляемые с БД. При возникновении сбоя, система откатывается в ближайшую точку, начиная с которой её повторяется (воспроизводится заново) до сбоя и далее.
2.Эволюция информационной технологии.
Этапы эволюции современных ИТ:
| Этап | Годы | Тип ЭВМ пользователь | Режим исп-ния ЭВМ | Осн. ср-ва связи с ЭВМ | Осн. ср-ва наложения инф. | Критерии эффективности | Ключ. Решения в обраб. инф. | Схемы информатизации |
| 1 | 50 г. | Большие ламповые ЭВМ Пользователь был программистом | Монопольный | Пульт упр-ния. | Перфокарты, -ле нты , магн. 2ленты | Машин. Ресурсы (быстродействие, оптим. время выполнения). | Англ язык прог- ния | ВЦ |
| 2 | 60 г. | Пакетный | Пульт, алф.-цифр. Дисплей | -- // -- магн. Диски | ОС, Оптимизированные трансляторы | ВЦ коллективного пользования, АСПУ, АСУТП | ||
| 3 | 70 г. | Мини ЭВМ, программист | Мон-ный, с разде лением времени диалог. | Алф.-цифр. Дисплей | Человеч. Ресурсы.Трудоемкость сопров. И отл. Пр-мы | Интерактивные ОС, структурированные ЯП, компьютерные сети | АСНИ науч исс- ний, ГАП –гибкие авт – ные пр-ва, САПР, АРМ –раб места | |
| 4 | 80 г. | Персональный, конечный пользователь. | Мон-ный, диалог. | Цветной граф. режим. | Оптич. Гибкие, жесткие | Трудность форм-ции проф-ных знаний | Технология автоматизации проф знаний | Интеллектуальные системы ППП (текстовые, граф.) |
| 5 | 90 г. | ПК в сети, конечный пользователь. | Коллект. Диалог. | Вирт. терминал обес-щий доступ к любому уровню в сети | Полнота и скорость доступа | Коллективный доступ к информационным ресурсам инф-ная безопасность | Internet |
















