Диссертация (1137159), страница 18
Текст из файла (страница 18)
Правило_ТР– массив строк, представляющих правила трансформации, прикрепленные кконкретному факту.101Примерыфактовдостиженияцелей,шаблоновтрансформацииисловосочетаний-индикаторов, а также пример построения семантическипреобразованного множества запросов представлены в Приложении 6.3.6. Разработкапринциповсемантическогорасширенияобобщенных запросов об изменениях состава множествСуществует ряд естественно-языковых вопросов, ответ на которыенеочевиден и требует дополнительного анализа на основе некоторой базызнаний, как и в случае с вопросами достижения целей.
Отдельным типом такихвопросов являются вопросы об изменениях состава множеств.Вопросамиобизмененияхсоставапредложения, в которых запрашиваетсямножествбудеминформация обназыватьизмененияхкачественного либо количественного состава множества объектов. Основнойакцент в таких вопросах ставится на изменения в группах людей, таких каккоманды, компании, объединения по функциональным обязанностям и т.д.Примеры таких вопросов: "Как изменился состав совета директоровкомпании X?", "Какие кадровые изменения были в компании X?", "Какизменился состав профсоюза Y?" и т.д.Далеебудутрассматриватьсяпредпринимательскойдеятельности,запросы,т.е.относящиесякасающиесяксфереизмененийворганизационных единицах различных компаний и предприятий (рисунок 3.5).Далее сконцентрируем внимание на запросах вида "Какие изменения былив руководстве компании Х?".
Для корректного преобразования запроса красширенномувидунеобходимодекомпозируется целевое множествоопределитьпонятия,накоторые"руководство". Другими словами,составляющие элементы данного множества. В реальной практике данныйанализ проводится инженерами знаний (экспертами предметной области) всоответствии с требованиями, предъявляемыми к семантическому анализатору.102Рисунок 3.5. Диаграмма верхнего уровня организационной структурынекоторой компанииСледует особо отметить, что в данном случае речь идет именно обизменении состава данных множеств, а не каких-либо других показателей.Примерами показателей, информация о которых не рассматривается, могутбытьэффективность,производительность,результативностьит.д.Вприложении 5 анализируются примеры текстов электронных документов,возвращаемых поисковой системой и содержащих в себе информацию обизменениях в руководстве компании.Из примеров видно, что большинство документов описывают вполнеконкретные операции назначения, снятия с должности либо замены конкретныхлиц в рассматриваемых подмножествах руководства.
Именно эта информация иинтересует пользователя, задающего вопрос об изменениях в руководящемсоставе какой-либо компании.Можно спуститься по организационной структуре до руководителейотделов и мелких подразделений. Такая детализация определяется взависимости от решаемых задач.Представляется, что ответ на любой вопрос об изменениях состава какоголибо множества содержит в себе информацию о действиях с элементамирассматриваемогомножества.Вприложении5рассматриваются103дополнительные примеры для понятий "компания" и “департамент”. Такимобразом, построение расширенного множества запросов основывается наинформации об элементах, составляющих множество, а также о действиях,которые необходимо произвести с данными элементами для того, чтобызафиксировать факт изменения качественного или количественного составарассматриваемого множества. Рассмотрим пример некоторых множеств, ихсоставляющих и действий с ними (таблица 3.7).Таблица 3.7.
Действия с составляющими элементами множеств.МножествоспортивнаякомандаруководствоСоставляющие элементы Действиепринят, исключен, прикреплен,игрок, тренердиректор,членназначенсовета, пришёл, занял пост, покинул пост,руководитель, менеджервошел в составпрофсоюзработник, членнанят, исключенкомпаниядепартамент, отделрасформирован, созданТаким образом, для построения семантически расширенного множествапоисковых запросов необходимо сформировать правила создания ЕЯвыражений – индикаторов запрашиваемой информации в тексте документов, атакже формально описать структуру базы знаний для представления элементовмножеств и действий над ними, которые приводят к изменению составамножеств.3.7. Разработка формальной модели базы знаний для описанияизменений состава множествПредставим запись о объекте "компания" и его составляющих элементах ввиде графической схемы(рисунок 3.5):104Рисунок 3.5.
Пример структуры базы знаний об изменениях множества вида"Компания"Под целевым множеством будем понимать множество, являющеесяпредметом интереса запроса, составляющий элемент множества – это тесущности, на которые декомпозируется целевое множество.Индикаторизменения – это фрагмент текста, присутствие которого в документе вместе ссоставляющим элементом множества говорит о том, что с целевым множествомпроизошло изменение. Под индикатором изменений также понимаетсядействие,совершенноесэлементоммножества.Введемформальноеопределение базы знаний об изменениях множеств.Определение 3.4.
Пусть Extbs – произвольный расширенный концептуальный базис (р.к.б.) вида (S, Cobs, Ql), где S — произвольная аспектноориентированная сортовая система, Cobs — размеченная концептуальнообъектная система вида (X, V, tp, F, Qf, Chr, Fgn), согласованная с S, Ql —система кванторов и логических связок для сортовой системы S иконцептуально-объектной системы Ct = (X, V, tp, F); концептуальный базис Bявляется семантическим ядром р.к.б. Extbs. Тогда базой знаний об измененияхмножеств,согласованнойср.к.б.Extbs,называетсяпроизвольнаяупорядоченная пятерка SetsKb вида(C, Comp, fdecomp, Ind, h),где (а) C и Comp – конечные подмножества множества X(B), и для любогоэлемента d из C и Comp тип tp(d) начинается с символа " ↑ " (т.е. элементымножеств C и Comp интерпретируются как понятия); (б) fdecomp – функция,105ставящая в соответствие произвольному элементу из C некоторое подмножествомножества Comp (данная функция интерпретируется как декомпозирующая); (в)Ind – конечное множество произвольных символов, которые интерпретируютсякак индикаторы изменений (действий, совершаемых с элементами множестваComp); (г) h – функция, ставящая в соответствие элементу из Compподмножество индикаторов из Ind.
Назовем данную функцию детерминантоминдикаторов изменений для элементов целевого множества Comp.Пример. Если C и Comp включают соответственно элементы фирма1 иотдел, и отдел – элемент множества fdecomp(фирма1), то h(отдел) = {создан,объединен, расформирован, реорганизован, разделен}.Данная модель позволяет описывать индикаторы изменений для того, чтобыконструировать описание какого-либо объекта, являющегося множеством, егосоставных частей и действий с ними для того, чтобы констатировать фактизменениякачественноголибоколичественногосоставамножества.Наполненная база знаний, имеющая представленную структуру,генерироватьрезультирующиесловосочетания-индикаторы,позволяетявляющиесярезультатом семантического преобразования поискового запроса. Рассмотримметодику данного преобразования.3.8.
АнализструктурызапросовобизмененияхсоставовмножествРассмотрим основные структуры входных текстов алгоритма анализазапросов об изменениях множеств, а также проиллюстрируем их примерами.Структуры представлены как разновидности стем-формы, описанной впараграфе 2.5, которая более близка к естественному языку и использует лишьсимволы "{","}","[","]","|". Структура {указатель временного интервала}используется так же, как и в примерах структур текстов алгоритма анализавопросов достижения целей, и в данном разделе не рассматривается.{Какие|Каковы}изменения{былив}[структуре/составе][компании|фирмы|предприятия] Х {в} {департаменте|руководстве}{указа-тель106временного интервала}?Примеры: (1) Какие изменения были в структуре компании Х вдепартаменте У? (2)Изменения структуры компании Х (3) Какие изменениябыли в структуре фирмы Х? (4) Каковы изменения структуры предприятия Х вдепартаменте У?{Какие|Каковы}{структурные}изменения[затронули/коснулись/произошли] {в} {составе/структуре} {департамента|руководства} [компании|фирмы|предприятия] Х {указатель временного интервала}?Примеры: (1) Какие структурные изменения коснулись департамента Укомпании Х? (2)Какие изменения произошли в составе компании Х? (3)КакиеизменениязатронулисоставруководствакомпанииХ?(4)Каковыструктурные изменения руководства компании Х?{Какие|Каковы}департамента}изменения{были}у{в}[составе|структуре][компании|фирмы|предприятия]{руководства|Х{указательвременного интервала}?Примеры: (1) Какие изменения в составе руководства были у компании Х?(2) Изменения структуры департамента У компании Х (3) Каковы изменениясостава руководства предприятия Х?{Какие|Каковы} изменения {были {в|у}} [компании|фирме|предприятии]Х в составе {руководства|департамента} {указатель временного интервала}?Примеры: (1) Какие изменения у компании Х в составе департамента У? (2)Изменения компании Х в структуре руководства (3) Каковы изменениякомпании Х в составе департамента У?[Что|Как]предприятия]изменилосьХ{в}{в}[структуре|составе][компании|фирмы|{департаменте|руководстве}{указательвременногоинтервала}?Примеры: (1) Что изменилось в составе компании Х в департаменте У? (2) Чтоизменилось в структуре компании Х? (3) Как изменилась структура компанииХ департамента У? (4) Как изменился состав компании Х в руководстве?107[Что|Как] изменилось {в} [составе|структуре] {руководства| департамента}{были}у[компании|фирмы|предприятия]Х{указательвременногоинтервала}?Примеры: (1) Что изменилось в составе руководства предприятия Х? (2) Какизменилась структура руководства фирмы Х? (3) Что изменилось в составедепартамента У компании Х? (4) Как изменился состав департамента Укомпании Х?Что изменилось в [компании|фирме|предприятии] Х в [составе|структуре]{руководства|департамента} {указатель временного интервала}?Примеры: (1)Что изменилось в компании Х в составе руководства? (2)Чтоизменилось в фирме Х в структуре департамента У?3.9.
Разработкаалгоритмаопределениятипазапросовобизменениях составов множеств и их объектов интересаПредлагаемый алгоритм основан на следующей идее: так как информация овнутренней структуре рассматриваемых объектов зачастую недоступна винтернете (изменения в структуре департаментов компании, например), тоанализ запросов на подобном уровне детализации возможен лишь послеопределения контекста (что речь идет о какой-то конкретной компании).Примером могут послужить следующие два запроса: "... изменения вдепартаменте разработок и внедрения компании Яндекс ..." и "...