Популярные услуги

Все письменные КМ под ключ за 3 суток! (КМ-6 + КМ-7 + КМ-8 + КМ-9 + КМ-10)
КМ-6. Динамические массивы. Семинар - выполню любой вариант!
Любая задача на C/C++
Одно любое задание в mYsql
Любой тест по базам данных максимально быстро на хорошую оценку - или верну деньги!
Любой реферат по объектно-ориентированному программированию (ООП)
Повышение уникальности твоей работе
КМ-2. Разработка простейших консольных программ с использованием ООП + КМ-4. Более сложные элементы ООП - под ключ!
Оба семинара по программированию под ключ! КМ-2. Разработка циклических алгоритмов + КМ-3. Функции и многофайловые программы в Си
Любой реферат по информатике

Практические методы извлечения знаний

2021-03-09СтудИзба

17.2. ПРАКТИЧЕСКИЕ МЕТОДЫ ИЗВЛЕЧЕНИЯ ЗНАНИЙ

КЛАССИФИКАЦИЯ МЕТОДОВ

Изложим классификацию методов извлечения знаний (рис. 17.10), что позволит ин­женерам по знаниям, в зависимости от конкретной задачи и ситуации, выбрать конкретный метод. Из предложенной схемы классификации видно, что основной принцип деления свя­зан с источником знаний. Коммуникативные методы охватывают все виды контактов с живым источником знаний — экспертом, а текстологические касаются методов извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (статей, монографий, учебников).

Разделение этих групп методов на верхнем уровне классификации не означает их ан­тагонистичности, обычно инженер по знаниям комбинирует различные методы, например, сначала изучает литературу, затем беседует с экспертами, или наоборот.


Рис. 17.10.  Классификация методов извлечения знаний

В свою очередь, коммуникативные методы можно также разделить на две группы: ак­тивные и пассивные. Пассивные методы подразумевают, что ведущая роль в процедуре из­влечения знаний как бы передается эксперту, а инженер по знаниям только протоколирует рассуждения эксперта во время его реальной работы по принятию решений или записывает то, что эксперт считает нужным самостоятельно рассказать в форме лекции. В активных методах, напротив, инициатива полностью в руках инженера по знаниям, который активно контактирует с экспертом различными способами — в играх, диалогах, беседах за "круглым столом" и т.д.

Пассивные методы на первый взгляд достаточно просты, но на самом деле требуют от инженера по знаниям умения четко анализировать "поток сознания" эксперта и выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пассивность инженера по знаниям) значительно ослабляет эффективность этих методов, чем и объясняется их обычно вспомогательная роль при активных методах.

Активные методы можно разделить на две группы в зависимости от числа экспертов, отдающих свои знания. Если их число больше одного, то целесообразно помимо серии индивидуальных контактов с каждым применять и методы групповых обсуждений предмет­ной области. Такие групповые методы обычно активизируют мышление участников дискуссий и позволяют выявлять весьма нетривиальные аспекты их знаний. В свою оче­редь, индивидуальные методы на сегодняшний день остаются ведущими, поскольку столь деликатная процедура, как "отъем знаний", не терпит лишних свидетелей.

Рекомендуемые материалы

Отдельно следует сказать об играх. Игровые методы сейчас широко используются в социологии, экономике, менеджменте, педагогике для подготовки руководителей, учителей, врачей и других специалистов. Игра — это особая форма деятельности и творчества, где че­ловек раскрепощается и чувствует себя намного свободнее, чем в обычной трудовой дея­тельности.

ПАССИВНЫЕ МЕТОДЫ

Название "пассивные" не должно вызывать иллюзий, поскольку этот термин введен как противовес к "активным" методам. В реальности же пассивные методы требуют от инжене­ра по знаниям не меньшей отдачи, чем такие активные методы, как игры и диалог. Согласно классификации (см. рис. 17.10) к этой группе относятся:

• наблюдения;

• анализ протоколов "мыслей вслух";

• лекции.

Наблюдения

В процессе наблюдений инженер по знаниям находится непосредственно рядом с экспер­том во время его профессиональной деятельности или имитации этой деятельности. При подготовке к сеансу извлечения эксперту необходимо объяснить цель наблюдений и попро­сить максимально комментировать свои действия.

Во время сеанса аналитик записывает все действия эксперта, его реплики и объясне­ния. Может быть сделана и видеозапись в реальном масштабе времени. Непременное усло­вие этого метода — невмешательство аналитика в работу эксперта хотя бы на первых порах.

Существуют две разновидности проведения наблюдений:

• наблюдение за реальным процессом;

• наблюдение за имитацией процесса. Обычно используют обе разновидности.

Сеансы наблюдений могут потребовать от инженера по знаниям:

• овладения техникой стенографии для фиксации действий эксперта в реальном масшта­бе времени;

• ознакомления с методиками хронометрирования для четкого структурирования производственного процесса по времени;

• развития навыков "чтения по глазам", наблюдательности к жестам, мимике и другим невербальным компонентам общения;

•          серьезного предварительного знакомства с предметной областью, так как из-за отсутствия "обратной связи" иногда многое непонятно в действиях экспертов. Протоколы наблюдений после сеансов в ходе домашней работы тщательно расшифро­вываются, а затем обсуждаются с экспертом. Таким образом, наблюдения — один из наибо­лее распространенных методов извлечения знаний на начальных этапах разработки. Обычно он применяется не самостоятельно, а в совокупности с другими методами.

Анализ протоколов "мыслей вслух"

Протоколирование "мыслей вслух" отличается от наблюдений тем, что эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, т.е. продемонстрировать всю цепочку своих рассуждений. Во время рассуждения эксперта все его слова протоколируются инженером по знаниям: при этом полезно отмечать даже паузы и междометия. Вопрос об использовании для этой цели магнитофонов и дикто­фонов является дискуссионным, поскольку магнитофон иногда действует на эксперта парализующе, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.

Основной трудностью при протоколировании "мыслей вслух" является принципиаль­ная сложность для любого человека объяснить, как он думает. При этом существуют экспе­риментальные психологические доказательства, что люди не всегда в состоянии достоверно описать мыслительные процессы. Кроме того, часть знаний, хранящихся в невербальной форме (например, различные процедурные знания типа "как завязывать шнурки"), вообще слабо коррелируют с их словесным описанием.

Автор теории фреймов М.Минский считает, что "только как исключение, а не как пра­вило человек может объяснить то, что он думает".

Расшифровка полученных протоколов производится инженером по знаниям самостоя­тельно с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное про­токолирование "мыслей вслух" является одним из наиболее эффективных методов извлечения, поскольку в нем эксперт может проявить себя максимально ярко, он ничем не скован, он как бы свободно парит в потоке своих умозаключений и рассуждений. Для боль­шого числа экспертов это самый приятный и лестный способ извлечения знаний.

Лекции

Лекция — самый старый способ передачи знаний. Лекторское искусство издревле высоко ценилось во всех областях науки и культуры. Но нас интересует не столько способность к подготовке и чтению лекций, сколько способность эту лекцию слушать, конспектировать и усваивать. Уже говорилось, что экспертов чаще всего не выбирают, и поэтому инженер по знаниям учить эксперта чтению лекций не сможет. Но если у эксперта опыт преподавателя (например, профессора клиники или опытного руководителя производства), то можно вос­пользоваться таким концентрированным фрагментом знаний, как лекция.

В лекции эксперту предоставлено много степеней свободы для самовыражения; при этом необходимо сформулировать эксперту тему и задачу лекции. При такой постановке

опытный лектор может заранее структурировать свои знания, ход рассуждений. От инжене­ра по знаниям в этой ситуации требуется лишь грамотно законспектировать лекцию и в конце задать необходимые вопросы.

Продолжительность лекции стандартная — от 40 до 50 мин и через 5-10 мин — еще столько же. Курс — от двух до пяти лекций.

Метод извлечения знаний в форме лекций, как и все пассивные методы, используют в начале разработки как эффективный способ быстрого погружения инженера по знаниям в предметную область.

В заключение несколько советов, как слушать лекции:

• к лекции подготовьтесь, т.е. познакомьтесь с предметной областью;

• слушайте с максимальным вниманием. Для этого: устраните мешающие факторы (скрип двери, шорохи и т.д.); удобно устройтесь; поменьше двигайтесь;

• учитесь отдыхать во время слушания (например, когда лектор приводит цифры, которые найдете в справочнике);

• слушайте одновременно и лектора, и самого себя (параллельно рассуждениям лектора по ассоциации возникают и собственные мысли);

• слушайте и одновременно записывайте, но записывайте текст сокращенно, используя условные значки (для всего этого достаточно только установить для себя ряд условных значков и ими неизменно пользоваться);

• расшифруйте записи лекции в тот же день;

• не спорьте с лектором во время слушания.

АКТИВНЫЕ МЕТОДЫ

Активные индивидуальные методы

Активные индивидуальные методы извлечения знаний на сегодняшний день — наиболее распространенные. В той или иной степени к ним прибегают при разработке практически любой экспертной системы.

К основным активным методам можно отнести:

• анкетирование;

• интервью;

• свободный диалог;

• игры с экспертом.

В этих методах активную функцию выполняет инженер по знаниям, который пишет сценарий и режиссирует сеансы извлечения знаний. Игры с экспертом существенно отлича­ются от других методов. Три оставшихся метода очень схожи между собой и отличаются лишь по степени свободы, которую может себе позволить инженер по знаниям при проведе­нии сеансов извлечения знаний.

Анкетирование — наиболее жесткий метод, т.е. наиболее стандартизованный. Инженер по знаниям заранее составляет вопросник или анкету, размножает ее и использует для опроса нескольких экспертов. Это основное преимущество анкетирования.

Сама процедура может проводиться двумя способами:

•         аналитик вслух задает вопросы и сам заполняет анкету по ответам эксперта;

•         эксперт самостоятельно заполняет анкету после предварительного инструктирования. Выбор способа зависит от конкретных условий. Второй способ нам кажется предпочтительнее, так как у эксперта появляется неограниченное время на обдумывание ответов.

Вопросник (анкета) заслуживает отдельного разговора. Существует несколько общих рекомендаций при составлении анкет. Эти рекомендации универсальны, т.е. не зависят от предметной области. Наибольший опыт работы с анкетами накоплен в социологии и психо­логии, поэтому часть рекомендаций заимствована из.

Во-первых, анкета не должна быть монотонной и однообразной, т.е. вызывать скуку или усталость. Это достигается вариациями вопросов, сменой тематики, вставкой вопросов-шуток и игровых вопросов. Во-вторых, анкета должна быть приспособлена к языку экс­пертов. В-третьих, следует учитывать, что вопросы влияют друг на друга, и поэтому последовательность вопросов должна быть строго продумана. В-четвертых, желательно стремиться к оптимальной избыточности. Известно, что в анкете всегда много лишних во­просов, часть из них необходима — это так называемые контрольные вопросы, а другую часть нужно минимизировать. И, наконец, в-пятых, у анкеты должны быть "хорошие мане­ры", т.е. ее язык ясен, понятен, предельно вежлив. Методическим мастерством составления анкеты овладевают только на практике.

Под интервью понимаем специфическую форму общения инженера по знаниям и эксперта, в которой инженер по знаниям задает эксперту серию заранее подготовленных во­просов с целью извлечения знаний о предметной области. Наибольший опыт в проведении интервью накоплен также в журналистике и социологии.

Интервью очень близко к анкетированию, когда аналитик сам заполняет анкету, зано­ся туда ответы эксперта. Основное отличие в том, что интервью позволяет аналитику опус­кать ряд вопросов в зависимости от ситуации, вставлять новые вопросы в анкету, изменять темп, разнообразить ситуацию общения. Кроме того, у аналитика появляется возможность "взять в плен" эксперта своим обаянием, заинтересовать его самой процедурой и тем самым увеличить эффективность сеанса извлечения.

Теперь подробнее о центральном звене активных индивидуальных методов — о во­просах. Инженеры по знаниям редко задумываются: умеют ли они задавать вопросы? В философии и математике эта проблема обсуждается с давних пор. Существует даже специ­альная ветвь математической логики — логика вопросов.

Укажем три основные характеристики вопросов, которые влияют на качество ин­тервью:

• стиль вопроса (понятность, лаконичность, терминология);

• порядок вопросов (логическая последовательность и немонотонность);

• уместность вопросов (этика, вежливость).

Вопрос в интервью — это не просто средство общения, но и способ передачи мыслей и позиции аналитика. Отсюда необходимость фиксировать в протоколах не только ответы, но и вопросы, предварительно отработав их форму и содержание.

Очевидно, что любой вопрос имеет смысл только в контексте. Поэтому вопросы может готовить инженер по знаниям, уже овладевший ключевым набором знаний.

Вопросы для эксперта имеют диагностическое значение — несколько откровенно "глупых" вопросов полностью разочаруют эксперта и отобьют у него охоту к дальнейшему сотрудничеству.

Свободный диалог — это метод извлечения знаний в форме беседы инженера по знаниям и эксперта, в которой нет жестко регламентированного плана и вопросника.

Это определение не означает, что к свободному диалогу не надо готовиться. Напро­тив, внешне свободная и легкая форма этого метода требует высочайшей профессиональной и психологической подготовки. Подготовка к свободному диалогу практически может со­впадать с предлагаемой в подготовкой к журналистскому интервью. Рис. 17.11 графи­чески иллюстрирует схему такой подготовки, дополненную в связи со спецификой инженерии знаний.

Квалифицированная подготовка к диалогу помогает аналитику стать истинным драма­тургом или сценаристом будущих сеансов, т.е. запланировать гладкое течение процедуры извлечения — от приятного впечатления в начале беседы к профессиональному контак­ту, — пробудив интерес и завоевав доверие эксперта. Для обеспечения желания эксперта

Рис. 17.11.  Схема подготовки к интервью и свободному диалогу

продолжить беседу необходимо проводить "поглаживания", т.е. подбадривать эксперта и подтверждать всячески его уверенность в собственной компетент­ности.

Так, в одном из исследований по технике журналистских диалогов экспериментально доказано, что одобрительное и поощрительное "хмыканье" интервьюера увеличивает длину ответов респондента. Чтобы разговорить собеседника, аналитику следует рассказать о себе, о работе, т.е. поговорить самому.

В свободном диалоге важно выбрать правильный темп или ритм беседы: без больших пауз, так как эксперт может отвлечься, но и "без гонки", иначе быстро утомляются оба участника и нарастает напряженность; кроме того, некоторые люди говорят и думают очень медленно. Умение чередовать разные темпы, напряжение и разрядку существенно влияет на результат беседы.

Подготовка к диалогу так же, как и к другим активным методам извлечения знаний, включает план сеанса извлечения, в котором необходимо предусмотреть следующие ста­дии:

• начало беседы (знакомство, создание у эксперта "образа" аналитика, объяснение целей и задач работы);

• диалог по извлечению знаний;

• заключительная стадия (благодарность эксперту, подведение итогов, договор о последующих встречах).

Активные групповые методы

К групповым методам извлечения знаний относятся:

• ролевые игры;

• дискуссии за круглым столом с участием нескольких экспертов;

• мозговой штурм.

Основное достоинство групповых методов — это возможность одновременного погло­щения знаний от нескольких экспертов, взаимодействие которых вносит элемент принципи­альной новизны от наложения разных взглядов и позиций.

Метод круглого стола (термин заимствован из журналистики) предусматривает обсуждение какой-либо проблемы из выбранной предметной области, в котором принима­ют участие с равными правами несколько экспертов. Обычно вначале участники высказы­ваются в определенном порядке, а затем переходят к живой свободной дискуссии. Число участников дискуссии колеблется от трех до пяти - семи. Существует и специфика, связан­ная с поведением человека в группе.

Во-первых, от инженера по знаниям подготовка круглого стола потребует дополни­тельных усилий, как организационных (место, время, обстановка, минеральная вода, чай, кворум и т.д.), так и психологических (умение вставлять уместные реплики, чувство юмора, память на имена и отчества, способность гасить конфликтные ситуации и т.д.).

Во-вторых, большинство участников будут говорить под воздействием "эффекта фаса­да" совсем не то, что они сказали бы в другой обстановке, т.е. желание произвести впечат­ление на других экспертов будет существенно "подсвечивать" их высказывания.

Задача дискуссии — коллективно, с разных точек зрения, под разными углами иссле­довать спорные гипотезы предметной области. Обычно эмпирические области богаты таким дискуссионным материалом. Для остроты на круглый стол приглашают представите­лей разных научных направлений и разных поколений, это также уменьшает опасность по­лучения односторонних знаний.

Несколько практических советов по процедурным вопросам круглого стола. Перед на­чалом дискуссии ведущему следует:

• убедиться, что все правильно понимают задачу (т.е. происходит сеанс извлечения знаний);

• установить регламент и четко сформулировать тему.

По ходу дискуссии проследить, чтобы слишком эмоциональные и разговорчивые экс­перты не подменили тему и критика позиций друг друга была обоснованной.

Мозговой штурм или мозговая атака — один из наиболее распространенных методов раскрепощения и активизации творческого мышления. Впервые этот метод был ис­пользован в США как способ получения новых идей в условиях запрещения критики. Заме­чено, что боязнь критики мешает творческому мышлению, поэтому основная идея штурма — это отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки высказанных идей.

Как правило, штурм длится около 40 мин. Участникам (до 10 человек) предлагается высказывать любые идеи (шутливые, фантастические, ошибочные) на заданную тему (кри­тика запрещена). Обычно высказывается более 50 идей. Регламент до двух минут на вы­ступление. Самый интересный момент штурма — это наступление пика (ажиотажа), когда идеи начинают "фонтанировать", т.е. происходит непроизвольная (бессознательная) генера­ция гипотез участниками. При последующем анализе всего лишь 10 - 15% идей оказывают­ся разумными, но среди них бывают весьма оригинальные. Оценивает результаты обычно группа экспертов, не участвовавшая в генерации.

Ведущий мозгового штурма — инженер по знаниям — должен свободно владеть ауди­торией, подобрать активную группу экспертов-"генераторов", не зажимать плохие идеи — они могут служить катализатором хороших. Искусство ведущего — это искусство задавать вопросы аудитории, "подогревая" генерацию. Вопросы служат "крючком", которым из­влекаются идеи. Вопросы также могут останавливать многословных экспертов и служить способом развития идей других.

Основной девиз штурма — "чем больше идей, тем лучше". Фиксация сеанса — тради­ционная (протокол или магнитофон).

ЭКСПЕРТНЫЕ ИГРЫ

Общие сведения

Игрой называют такой вид деятельности, который отражает (воссоздает) другие ее виды. Понятие экспертной игры, или игры с экспертами, в целях извлечения знаний восходит к трем источникам — это понятие деловой игры, широко используемое при подготовке спе­циалистов и моделировании, и понятие диагностической игры, введенной в, а также компьютерные игры, все чаще применяемые в обучении.

Под деловой игрой чаще всего понимают эксперимент, где участникам предлагается производственная ситуация, а они на основе своего жизненного опыта, общих и специаль­ных знаний и представлений принимают решения. Решения анализируются, и вскрываются закономерности мышления участников эксперимента. Именно эта анализирующая часть де­ловой игры полезна для получения знаний. И если участниками такой игры становятся экс­перты, то игра из деловой превращается в экспертную. Из трех основных типов деловых игр (учебных, планово-производственных и исследовательских) к экспертным ближе всего ис­следовательские, которые используются для анализа систем, проверки правил принятия ре­шений.

Диагностическая игра — это та же деловая игра, но применяемая конкретно для диа­гностики методов принятия решения в медицине (диагностика методов диагностики). Эти игры возникли при исследовании способов передачи опыта от квалифицированных врачей новичкам. В нашем понимании диагностическая игра — это игра, безусловно, экспертная без всяких оговорок, только с жестко закрепленной предметной областью — медициной.

В соответствии с введенной классификацией разделим экспертные игры на:

• индивидуальные;

• групповые.

Кроме того (рис. 17.12), продолжим и разовьем эту классификацию, введя другие кри­терии:

• использование специального оборудования;

• применение компьютерной техники.

Плодотворность моделирования реальных ситуаций в играх подтверждается сегодня практически во всех областях науки и техники. Они развивают логическое мышление, спо­собности быстро принимать решения, вызывают интерес у экспертов.

Индивидуальные игры с экспертом

В этом случае с экспертом играет инженер по знаниям, который берет на себя какую-ни­будь роль в моделируемой ситуации. Например, игра "Учитель и ученик", в которой инже­нер по знаниям берет на себя роль ученика и на глазах эксперта выполняет его работу, а эксперт поправляет ошибки "ученика". Эта игра — удобный способ разговорить застенчи­вого эксперта.

В другой игре инженер по знаниям берет на себя роль врача, который хорошо знает больного, а эксперт — роль консультанта. Консультант задает вопросы, дела­ет прогноз о целесообразности применения того или иного вида лечения. Такая игра "двух врачей" позволила, например, выявить, что эксперту понадобилось всего 30 вопросов для успешного прогноза, в то время как первоначальный вопросник, составленный медиками для этой же цели, содержал 170.

Основные советы инженеру по знаниям по проведению индивидуальных игр:

•         играйте смелее, придумывайте игры сами; не навязывайте игру эксперту, если он не расположен; в игре "не давите" на эксперта;

•         не забывайте цели игры; играйте весело, нешаблонно; не забывайте о времени и о том, что игра утомительна для эксперта.


Рис. 17.12.  Классификация экспертных игр

Ролевые игры в группе

Групповые игры предусматривают участие в игре нескольких экспертов. К такой игре обычно заранее составляется сценарий, распределяются роли, к каждой роли готовится по­ртрет-описание и разрабатывается система оценивания игроков.

Существует несколько способов проведения ролевых игр. В одних играх игроки при­думывают себе новые имена и играют под ними; в других — игроки переходят на "ты"; в третьих роли выбирают игроки, в четвертых роли вытягивают по жребию. Роль — это ком­плекс образцов поведения. Роль связана с другими ролями. "Короля играет свита". Посколь­ку в нашем случае режиссером и сценаристом является инженер по знаниям, то ему и предоставляется полная свобода в выборе формы проведения игры.

Создание игровой обстановки потребует немало фантазии и творческой выдумки от инженера по знаниям. Ролевая игра, как правило, требует некоторых простейших заготовок (например, табличек "Директор", "Бухгалтерия", "Плановый отдел", специально напечатан­ных инструкций с правилами игры). Но главное, конечно, чтобы эксперты в игре действи­тельно "заиграли", раскрепостились и "раскрыли свои карты".

Игры с тренажерами

Игры с тренажерами в значительной степени ближе не к играм, а к имитационным упражне­ниям в ситуации, приближенной к действительности.

Наличие тренажера позволяет воссоздать почти производственную ситуацию и пона­блюдать за экспертом. Тренажеры широко применяют для обучения (например, летчиков или операторов атомных станций). Очевидно, что применение тренажеров для извлечения знаний позволит зафиксировать фрагменты "летучих" знаний, возникающих во время и на месте реальных ситуаций и выпадающих из памяти при выходе за пределы ситуации.

Компьютерные экспертные игры

Идея использовать компьютеры в деловых играх известна давно. Но только когда компью­терные игры взяли в плен практически всех пользователей персональных ЭВМ от мала до велика, стала очевидной особая притягательность игр такого рода. Компьютерные игры обычно разделяют на:

• позиционные игры (шахматы, шашки);

• динамические игры (связанные со скоростью реакции — стрельба по движущейся мишени);

• зрелищные или диалоговые фильмы, где пользователь может влиять на сюжет;

•         обучающие, в которых пользователь, играя, осваивает какие-то навыки или узнает

что-то новое для себя.

Очевидно, что экспертные игры должны сочетать элементы перечисленных выше классов.

Одна из первых отечественных экспертных компьютерных игр описана в. Основ­ной принцип игры "Зоосад" состоит в создании игровой ситуации при организации диалога с экспертом. При этом задача извлечения знаний маскируется нацеленностью на решение чисто игровой задачи: необходимо определить содержимое "черного ящика", в котором на­ходится некое животное, при этом надо набрать наибольшее количество очков, не истратив выделенного ресурса денег. В ходе игры эксперт делает ставки на различные гипотезы, ука­зывая при этом, какими признаками обладает то или иное животное. После каждого ответа он получает необходимую информацию о своих результатах. По ходу игры невидимо для эксперта формируются правила, отражающие знания эксперта на основании сделанных им ходов. В данной игре — это знания о том, какими признаками обладают те или иные живот­ные. Таким образом выявляется алфавит значимых признаков для диагностики и классифи­кации животных.

ТЕКСТОЛОГИЧЕСКИЕ МЕТОДЫ

Группа текстологических методов объединяет методы извлечения знаний, ос­нованные на изучении специальных текстов из учебников, монографий, статей, методик и других носителей профессиональных знаний.

Задачу извлечения знаний из текстов можно сформулировать как задачу понимания и выделения смысла текста. Сам текст на естественном языке является лишь проводником смысла, а замысел и знания автора лежат во вторичной структуре (смысловой структуре или макроструктуре текста), настраиваемой над естественным текстом.

При этом можно выделить две такие смысловые структуры: mi смысл, который пы­тался заложить автор, это его модель мира, и М2 смысл, который постигает читатель, в дан­ном случае инженер по знаниям (рис. 17.13) в процессе интерпретации I. При этом Т — это словесное одеяние mi, т.е. результат вербализации V.


Рис. 17.13.  Извлечение знаний из текстов


Сложность процесса заключается в принципиальной невозможности совпадения зна­ний, образующих mi и М2, из-за того, что mi образуется за счет совокупности представле­ний, потребностей, интересов и опыта автора, лишь малая часть которых находит отражение в тексте Т. Соответственно и М2 образуется в процессе интерпретации текста Т за счет привлечения всей совокупности научного и человеческого багажа читателя.

Встает задача выяснить, за счет чего можно достичь максимальной адекватности mi и М2, помня о том, что понимание всегда относительно. Рассмотрим подробнее, какие источ­ники питают модель mi и создают текст Т. В указаны два компонента любого научного текста. Это первичный материал наблюдений и система научных понятий в момент созда­ния текста. В дополнение к этому, на наш взгляд, помимо объективных данных эксперимен­тов и наблюдений, в тексте обязательно присутствуют субъективные взгляды автора, результат его личного опыта, а также некоторые "общие места", или "вода". Кроме того, любой научный текст содержит заимствования из других источников (статей, монографий) и т.д.

При извлечении знаний аналитику, интерпретирующему текст, приходится решать за­дачу декомпозиции этого текста на перечисленные выше компоненты для выделения истин­но значимых для реализации базы знаний фрагментов. Сложность интерпретации научных и специальных текстов заключается еще и в том, что любой текст приобретает смысл толь­ко в контексте, где под контекстом понимается окружение, в которое "погружен" текст.

Основными моментами понимания текста являются:

• выдвижение предварительной гипотезы о смысле всего текста (предугадывание);

• определение значения непонятных слов (т.е. специальной терминологии);

• возникновение общей гипотезы о содержании текста (о знаниях);

• уточнение значения терминов и интерпретация отдельных фрагментов текста под влиянием общей гипотезы (от целого к частям);

• формирование некоторой смысловой структуры текста за счет установления внутренних связей между отдельными важными (ключевыми) словами и фрагментами, а также за счет образования абстрактных понятий, обобщающих конкретные фрагменты знаний;

• корректировка общей гипотезы относительно содержащихся в тексте фрагментов знаний (от частей к целому);

• принятие основной гипотезы, т.е. формирование М2.

Следует отметить наличие как дедуктивной (от целого к частям), так и индуктивной (от частей к целому) составляющей процесса понимания.

Центральными моментами процесса I являются шаги формирования смысловой струк­туры или выделения "опорных", или ключевых, слов, а также заключительное схватывание "смысловых вех" в единую семантическую структуру. В качестве ключевого слова может служить любая часть речи (существительное, прилагательное, глагол и т.д.) или их сочета­ние. Существует гипотеза лингвостатистики о том, что наиболее употребляемые слова явля­ются наиболее важными с точки зрения содержания текста, т.е. отражают его тематическую структуру.

Подготовкой к прочтению специальных текстов является выбор совместно с эксперта­ми некоторого "базового" списка литературы, который постепенно введет аналитика в пред­метную область. В этом списке могут быть учебники для начинающих, главы и фрагменты из монографий, популярные издания. Только после ознакомления с "базовым списком це­лесообразно приступать к чтению специальных текстов.

Наиболее простым методом является анализ учебников, в которых логика изложения обычно соответствует логике предмета, и поэтому макроструктура такого текста будет, на­верное, более значима, чем структура текста какой-нибудь специальной статьи. Анализ ме­тодик затруднен как раз сжатостью изложения и практическим отсутствием комментариев, т.е. фоновых знаний, облегчающих понимание для неспециалистов. Поэтому можно реко­мендовать для практической работы комбинацию перечисленных методов.

В заключение предложим одну из возможных практических методик анализа текстов с целью извлечения и структурирования знаний.

•         Составление "базового" списка литературы для ознакомления с предметной областью и чтения по списку.

• Выбор текста для извлечения знаний.

• Первое знакомство с текстом (беглое прочтение). Для определения значения незнакомых слов — консультации со специалистами или привлечение справочной литературы.

• Формирование первой гипотезы о структуре текста.

• Внимательное прочтение текста с выписыванием ключевых слов и выражений, т.е. выделение "смысловых вех" (компрессия текста).

• Определение связей между ключевыми словами, разработка макроструктуры текста в форме графа или "сжатого" текста (реферата).

• Формирование поля знаний на основании структуры текста.

17.3. СТРУКТУРИРОВАНИЕ ЗНАНИИ

КОНЦЕПТУАЛЬНАЯ СТРУКТУРА ПРЕДМЕТНОЙ ОБЛАСТИ

Одна из наиболее творческих процедур при построении экспертных систем — процедура концептуального анализа полученных знаний или структурирование.

Структурupование — это процесс создания полуформализованного описания предметной области. Такое полуформализованное описание называется полем знаний. Обычно оно создается в графической форме.

Поле знаний Pz можно описать следующим образом:

Pz = <Sk, Sf>,

где Sk — концептуальная структура предметной области; Sf — функциональная структура предметной области.

Концептуальная структура, или модель предметной области, служит для описания ее объектов и отношений между ними, т.е. можно сказать, что концептуальная мо­дель Sk представляет собой следующее:

Sk = <A,R>,

где А — множество объектов предметной области; R -— множество отношений, связывающих объекты.

Множество отношений представляет собой связи между объектами. При помощи этих отношений инженер по знаниям фиксирует концептуальное устройство предметной об­ласти, иерархию понятий, свойства и структуру объектов. Разработка концептуальной структуры имеет самостоятельное значение, не зависимое от конечной цели — разработки экспертных систем. Эта структура может служить для целей обучения, повышения квали­фикации, для прогнозирования, объяснения, реструктурирования и т.п.

Основными из них являются АКО, A-part-of, Has-attribute, Value и др.

АКО (A-Kind-OF) — "это есть", например, [MacII] -» (АКО) -» [ПК]. АКО отражает родовидовые отношения и иерархию понятий предметной области. Обязательно при­сутствует в любой концептуальной структуре.

A-part-of— "часть от", например, [процессор] —> (A-part-of) —> [компьютер]. Это отношение служит для отражения физической структуры и декомпозиции сложных объектов на составляющие.

Has-attribute — "имеет свойство", например, [память] —> (Has-attribute) —> [объем памяти].

Value — "значение", например, [объем памяти] —> (Value) —> [16 Мбайт].

Поле знаний может напоминать семантическую сеть, но оно менее формализовано. Если в сети жестко оговорены возможные виды связей, то в поле знаний они произвольны.

Краткий алгоритм формирования концептуальной структуры.

Шаг1. Определить все результирующие понятия, или выходы системы. Это может быть набор диагнозов, рекомендаций, советов системы.

Шаг2. Определить все входные понятия, или факторы, от которых зависит результат работы системы.

ШагЗ. Установить промежуточные понятия, участвующие в рассуждениях экспертов, если они есть.

Шаг4. Для всех понятий найти обобщающие и уточняющие понятия, т.е. установить иерархии объектов.

ШагЗ. Для объектов, участвующих в рассуждениях, определить свойства и их зна­чения.

Шагб. Попытаться определить другие связи, и все в целом отразить графически.

Шаг7. Убрать лишние связи, объекты, обсудить структуру с экспертом, дополнить, если4надо, с возвратом к шагам 1-6.

Пример 17.1. Здесь рассматривается пример структурирования знаний для эксперт­ной системы, которая советует, где лучше всего отдохнуть в отпуске. Сначала созда­ется концептуальная структура, описывающая понятия данной предметной области (рис. 17.14).

На рис. 17.14 использованы связи АКО и Value. Дополните самостоятельно данное поле знаний.

ФУНКЦИОНАЛЬНАЯ СТРУКТУРА ПРЕДМЕТНОЙ ОБЛАСТИ

Функциональная структура отражает модель рассуждений и принятия решений, которой пользуется эксперт при решении задачи. Обычно функциональная структура представляется в виде каузальных отношений (cause) и может быть позднее формализована в виде коротких правил "если — то", или в виде семантических сетей.

Представить функциональную структуру можно в виде таблицы, графа или предложе­ний на естественном языке. Наглядные формы предпочтительны.

Часто в моделях рассуждений присутствуют нечеткие понятия — "часто", "много", "очень", "высокий", "большой" и др. Для их представления базе знаний используется так на­зываемая нечеткая логика, автор которой — Л.Заде, предложил простой формализм для таких понятий. Этот формализм использует понятие нечеткой функции принадлежности, которая отражает численно на шкале [0, 10] или [О, 1] степень уверенности эксперта в том, что конкретное значение можно отнести к данному нечеткому понятию. Подробнее см. [10, 14].

Также степени уверенности используются при множественных рекомендациях. На­пример, эксперт советует "покупать акции компании X со степенью уверенности 9, а компа­нии Y со степенью уверенности 6".

Рис. 17.14,  Концептуальная структура предметной области

Пример 17.2. Для предметной области, описанной в примере 17.1, создается функци­ональная структура и представляется в виде табл. 17.1. В структуре предлагается до трех рекомендаций с разной степенью уверенности на шкале [0,10].

Таблица 17.1. Функциональная структура предметной области

Здоровье

Материаль­ное положение

Время отпуска

Характер

Отдых 1

Ст.увер.

1

Отдых

2

Ст.увер.

2

Отличное или хорошее

Хорошее

Активный

Поход

8

Тур­поездка

7

Нормальное

Лето

Пассивный

Дача

9

Дом

3

Хорошее

Лето или осень

Пассивный

Курорт

9

Дом

1

ФОРМАЛИЗАЦИЯ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ БАЗЫ ЗНАНИЙ

Сформировав поле знаний в виде концептуальной и функциональной структур, инженер по знаниям вместе с программистом подыскивают подходящий язык представления знаний, который, с одной стороны, позволит выразить все особенности знаний предметной области без искажения структуры поля знаний, а с другой, — будет иметь эффективную программ­ную реализацию в виде транслятора или "оболочки".

Пример 17.3. Если теперь ввести структуру из примера 17.2 в базу знаний какой-либо продукционной оболочки (например, ExSys), то можно получить экспертную систе­му, которая, задавая вопросы о вашем здоровье, материальном положении, времени отпуска, характере, поможет вам выбрать наиболее подходящий вид отдыха. Каждой строке таблицы будет соответствовать правило "Если — то". Например: Правило I: "Если здоровье отличное или хорошее и материальное положение хоро­шее и характер активный, то поход (степень уверенности = 8) или турпоездка (сте­пень уверенности = 7)".

КЛЮЧЕВЫЕ ПОНЯТИЯ

Анкетирование                                                                     мозговой штурм

Аспекты извлечения знаний:                                           свободный диалог

психологический

лингвистический                                                      текстологические

гносеологический                                                    экспертные игры

Извлечение знаний                                                 Приобретение знаний

Концептуальная структура                                 Структурирование знаний

Методы извлечения знании:                                ,

интервью                                                        Формирование знании

круглый стол                                                 Функциональная структура

ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ

1. Что называется извлечением знаний и в чем состоит его главный аспект?

2. Назовите основные уровни общения. Чем определяются потери информации при общении?

3. Нарисуйте структуру психологического аспекта извлечения знаний.

4. Что такое контактный, процедурный, когнитивный слои извлечения знаний?

5. Назовите основные закономерности проведения процедуры извлечения знаний.

6. В чем состоит лингвистический аспект извлечения знаний?

7. Нарисуйте и объясните схему получения общего кода.

8. В чем заключается неоднозначность проблемы интерпретации?

9. Что такое понятийная структура?

10. Что такое гносеологический аспект извлечения знаний?

11. В чем заключается модальность знаний?

12. Что такое системно-структурный подход к познанию?

13. Нарисуйте структуру познания.

14. В чем состоит установление связей и закономерностей?

15. Для чего необходимо построение идеализированной модели?

16. Назовите пассивные методы извлечения знаний.

17. Назовите активные групповые методы извлечения знаний.

18. Назовите активные индивидуальные методы извлечения знаний.

19. Подготовьте анкету извлечения знаний по лечению простуды народными методами.

20. Назовите текстологические методы извлечения знаний.

21. Что могут потребовать сеансы наблюдений от инженера по знаниям?

22. В чем заключается протоколирование мыслей вслух?

23. Назовите достоинства и недостатки каждого из пассивных методов извлечения
знаний.

24. В чем заключается метод анкетирования?

25. В чем заключается метод интервьюирования?

26. Какова схема подготовки к свободному диалогу?

27. Назовите достоинства и недостатки каждого из активных индивидуальных методов извлечения знаний.

28. В чем заключается метод круглого стола?

29. Что такое мозговой штурм?

30. Дайте классификацию экспертных игр.

31. Что такое игры с экспертом?

32. Что такое ролевые игры?

33. Назовите достоинства и недостатки каждого из видов экспертных игр.

34. Нарисуйте схему извлечения знаний из текста.

Протоколы передачи данных - лекция, которая пользуется популярностью у тех, кто читал эту лекцию.

35. Как образуется семантическая структура текста?

36. Что такое набор ключевых слов?

37. Что называется структурированием знаний?

38. Что представляет собой концептуальная и функциональная структура предметной области?

39. Опишите концептуальную структуру для экспертной системы "Как делать подарки".

40. Создайте функциональную структуру, отражающую модель рассуждений эксперта по выбору подарка.

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5167
Авторов
на СтудИзбе
438
Средний доход
с одного платного файла
Обучение Подробнее