Спиридонов И.Н., Самородов А.В. - Методы и алгоритмы вычислительной диагностики (1035409), страница 5
Текст из файла (страница 5)
Сбор информации 1. Определение информативности симптомоа. 2. Отсев малани о матиаиых симптомов П. Отбор информации 1. Диагностика по группе контроля по отобранным сим- птомам. 2. Корректироака построенной системы ВД. 3. Применение системы ВД а клинике на основе аы- б аииого дна.ностического алто итма Ш.
Классифика«ия Каждый' этап состоит из целого ряда процедур, содержание и количество которых зависит от характера диагностической задачи н от применяемого алгоритма. 3.1. Сбор информации Таблица 7 26 В об<цем случае этап сбора информации состоит из нескольких процедур: 1) постановка диагностической задачи; 2) поиск верифицированного материала (т. е. ИБ), адекватного диагностической задаче, и разбиение этого материала на группы «заболевание Р,» и «заболевание Рз»; 3) разбиение верифицироваппого материала на группу обучения и группу контроля; 4) составление карты признаков и симптомов, свойственных заболеванию Р~ и заболеванию Рт; 5) кодировка верифицированного материала группы обучения по карте признаков и симптомов.
Постановка диагностической задачи состоит в разбиении рассматриваемых случаев на диагнозы, которые должны составлять полную гругшу событий. Примеры постановки диагностической задачи приведены в табл. 7. Поиск верифииированного материала заключается в отборе определенного количества ИБ с верифицированнымн диапюзами. Верифицированность обеспечивается данными вскрытий, биопсий, а также в ходе хирургических операций, в результате длительных наблюдений.
Отбор ИБ с верифицированным диагнозом должен проводиться в соответствии со следующими требованиями: а) однородность. Следует отбирать ИБ за несколько последних лег и только из тех лечебных учреждений, в которых существуют сходныс взгляды на симптоматику, присущую выбранным заболеваниям; б) качественность.
Не следует отбирать ИБ, в которых содержится совокупность симптомов, явно недостаточная даже для приблизительной постановки диагноза; в) диагностическая нетривиальность. Среди отобранных ИБ должны преобладать диагностически трудные, т. е. нетипичные случаи. Типичные случаи, превалирующие в клинике любого заболевания, для ВД интереса не представляют, зато в силу своего большого удельного веса онн могут поглотить интересные случаи, ради которых и создается система ВД.
Разбиение верифицированного материала на группу обучения и группу контроли является необходимой процедурой, без проведения которой невозможно будет провести проверку качества работы системы ВД. В зависимости от объема материала процедуру разбиения проводят следующим образом. При недостаточном количестве ИБ в группу обучения включают весь имеющийся в наличии материал, а группу контроля формируют из поступающих в дальнейшем ИБ, в которых диагнозы уточняются со временем.
При наличии большого количества ИБ группу обучения и групу контроля формируют одновременно. В этом случае к группе контроля предъявляется следующее основное требование: она должна быть отобрана из имеющегося материала случайным образом, Минимальный объем группы контроля, соответствующий предполагаемому уровню диагностических ошибок, легко определяется по известным из курса статистики соотношениям. Слсдует подчеркнуть, что при использовании для проверки системы ВД группы обучения вместо группы контроля оценки диагностических ошибок могут оказаться заниженными. 27 Карта признаков и симптомов представляет собой вопросник, который включает в себя заранее составленные ответы на каждый вопрос.
В ходе составления карты признаков и симптомов решаются две задачи: отбор признаков в карту и их градуировка, т. е. разбиение на симптомы. В карту включаются все признаки и симптомы, которые, по мнению врача, представляют определенную диагностическую ценность и традиционно проверяются при обследовании пациента. Прн их градуировкс учитываются следующие основные правила. 1. Выделяются такие симптомы, условные вероятности (относительные частоты) которых при заболеваниях Р~ и Рз различиотся.
2. Следует избегать, насколько это возможно, слишком резких различий между условными вероятностями соседних симптомов. 3. Градуировку необходимо проводить таким образом, чтобы каждый симптом встречался пс менее чем в 5 — 7 наблюдениях, относящихся к каждому заболеванию Р, и .Рь Если какой-либо симптом встречался только в наблюдениях, относящихся к Р, (Рг), и нн разу не встречался в наблюдениях, относящихся к Р, (Р~), то необходимо условно положить, что он встречался в одном наблюдении, относящемся к Рз (Р~). Карта составляется таким образом, чтобы у пациента обязательно был хотя бы один из симптомов каждого признака, что приводит, например, к включению в карту таких симптомов, как «норма но данному признаку». В то же время недопустимо наличие у пациента более одного симптома каждого признака.
Кодировка материала группы обучения должна позволить установить нз закодированной ИБ: а) какие признаки проверялись для данного больного — наличие признаков; б) какие не провсрялись — пропуск признака; в) какие симптомы имеются у данного больного — наличие симптома; г) какие симптомы отсутствовали у данного больного отсутствие симптома; д) про какие симптомы, содержащиеся в картс признаков и симптомов, мы не можем сказать есть онн или нет — пропуск симптома. Кодировки материала, применяемая в ВД, может выполняться тремя способами.
28 1. Признак Х вне зависимости от своего наличия или отсутствия кодируется тем порядковым номером, который он имеет среди всех признаков, вошедших в карту. Симптом 5,(Хз), вне зависимости от своего наличия или отсутствия, кодируется тем порядковым номером, который он имеет среди всех симптомов, принадлежащих данному признаку Х.
Наличие симптома кодируется цифрой 1, отсутствие — О. В случае пропуска признака ни наличие, нн отсутствие принадлежащих ему симптомов нс отмечается. Признаки кодируются римскими цифрами, симптомы — арабскими. Кодировка ИБ заключается лишь в проставлении против не пропущенного признака н не пропущенного симптома 1 или 0.,1)дя использования этого способа нужны стандартные бланки.
2. Признак Х кодируется так же, как и в п. 1. Симптом К(Х) кодируется тем порядковым номером, который он имеет среди всех симптомов, принадлежащих данному признаку, только в случае сго наличия. Отсутствие его кодируется «пустым местом». Пропуск признака Х определяется по отсутствию порядковых номеров всех принадлежащих ему симптомов. Здесь также нужны стандартные бланки. Кодировка ИБ заключается в проставлении соответствующих симптомов, в случас их наличия. 3.
Признак Х порядковым номером не кодируется, а наличие или пропуск его определяется соответственно по наличию какого- либо из принадлежащих ему симптомов или по отсутствию всех принадлежащих ему симптомов. Симптом Я(Х2) кодируется своим порядковым номером среди всех симптомов, содержащихся в карте, но только в случае своего наличия. Отсутствие его определяется по наличию любого другого симптома, принадлежащего тому же признаку Х. Первые два способа кодировки ИБ являются наглядными и используются для представления информации врачу.
Третий способ кодировки — наиболее экономный и эффективный для компьютерного анализа ИБ, однако он может применяться только при выполнении правила градуировки, согласно которому симптомы по каждому из признаков должны образовывать полную группу событий. Пример копировки ИБ, в которой проверялись два признака, содержащих трн и четыре симптома соответственно, причем у пациента было выявлено наличие симптома 1 по признаку 1 и симптома 3 по признаку 11, представлен в табл.
8. 29 Табунила 8 3.2. Отбор информации Определение информативности симптомов. Задача опрсделення информативности симптомов складывается из следующих процедур: 1) подсчет исходных данных; 2) расчет информативности симптомов по результатам подсчета исходных данных. Исходными данными явлжотся параметры а, К с, л'(см.
разд. 2.6) н условные вероятности Р(К~В,), Р(Я/Вз). Для расчета исходных дашых сначала определяют параметр Ж вЂ” количество ИБ с заболеванием )Зн в которых не проверялся Х, признак Х. Значение параметра М, ' соответствует количеству ИБ, в которых пи разу не встречался ни один нз симптомов, соответствующих признаку Х; Вычитая это количество ИБ из количества всех ИБ с й1 (т.