Intelligent System for Predicting the Feasibility of Using Computed Tomography
- 作者: Shesternikova O.P.1, Finn V.K.2, Lesko K.A.3, Vinokurova L.V.3
-
隶属关系:
- Russian Research Institute of Health
- Federal Research Center” Computer Science and Control”, the Russian Academy of Sciences
- Moscow Clinical Scientific Center named after A.S. Loginov
- 期: 编号 2 (2022)
- 页面: 3-16
- 栏目: Intelligent Systems and Robots
- URL: https://journal-vniispk.ru/2071-8594/article/view/270230
- DOI: https://doi.org/10.14357/20718594220201
- ID: 270230
如何引用文章
全文:
详细
The article describes principles of creating an intelligent system using JSM-method of automated research support (JSM-method ARS) to predict the necessity for computed tomography application. The procedures of JSM-research (one of the JSM-method ARS stages) designed to increase the reliability of the regularities obtained in the system are described. The obtained regularities and their expert ratings are given.
全文:
Введение
В [1, 2] описывается создание интеллектуальной системы (ИС), реализующей ДСМметод автоматизированной поддержки исследований (ДСМ-метод АПИ) для ранней дифференциальной диагностики заболеваний поджелудочной железы (ПЖ): рака поджелудочной железы (РПЖ) и хронического панкреатита (ХП). С помощью этой системы было проведено исследование, затрагивающее непосредственно дифференциальную диагностику, которое, в том числе, показало высокую связь результатов компьютерной томографии (КТ) и окончательного диагноза. Система сделала верный вывод в шести из девяти наблюдений проверочной группы. В остальных наблюдениях ошибочные выводы были вызваны тяжелыми формами ХП (наличие ряда сопутствующих заболеваний, оказывающих негативное влияние на тяжесть течения патологического процесса в ПЖ) [2]. С помощью созданной системы и собранного массива данных можно решать другие близкие исследовательские задачи. Следующей такой задачей стало определение необходимости направления на исследование КТ исходя из клинических данных пациента и, таким образом, формирование скрининговых групп.
1. Постановка задачи
Одной из особенностей современной медицины является повсеместное использование методов лучевой диагностики, в первую очередь КТ. Данная методика занимает одну из ключевых позиций в диагностической процедуре при распознавании заболеваний поджелудочной железы, в первую очередь ХП и РПЖ. Значения чувствительности и специфичности КТ с внутривенным контрастированием в диагностике РПЖ достигают 82 и 65%, соответственно. Невысокие значения специфичности нивелируются высокой доступностью и пространственным разрешением КТ, позволяющим проводить одномоментную диагностику распространенности поражения и наличия сопутствующих изменений [3].
Во всем мире актуальность своевременной диагностики РПЖ несомненна и обусловлена высокой смертностью от этого заболевания. В структуре смертности от злокачественных новообразований в РПЖ занимает уже 6,7% в России в 2019 г. и 4,5% в мире в 2020 г. [4, 5]. Однако высокая эффективность и постоянно растущая доступность КТ ставит перед практикующими врачами важную задачу правильного определения показаний к проведению исследования.
Опираясь на известные и доказанные факторы, влияющие на возникновение и развитие ХП или РПЖ, система автоматизированной поддержки исследований с применением ДСМметода помогает выполнить эту задачу. Решение этой проблемы отразится в снижении ненужных исследований КТ пациентам со стабильным течением ХП и существенно сократит время ожидания КТ для пациентов с тяжелым течением ХП и подозрением на РПЖ. В итоге это приведет к возможному снижению смертности населения России от РПЖ.
В [6] представлена классификация методов анализа данных в медицине в соответствии с решаемыми задачами. Рассматриваемую задачу можно отнести к «обследованию» – постановке диагноза на основе совокупности симптомов. Основным методом решения такого рода задач с учителем указываются деревья решений [7]. В
[8] методы построения деревьев решений также отмечаются как наиболее эффективные. В числе достоинств деревьев решений указываются простота интерпретации принимаемого решения с помощью порождаемых правил (так называемый «белый ящик»), а также вероятностный формат выходных данных, что интуитивно понятно для исследователя-медика.
Примерами исследований с деревьями решений могут служить работы: [9] – исследование связи между питанием и риском возникновения рака мочевого пузыря (использовался алгоритм C5.0); [10] –поиск новых биомаркеров при развитии диабета 2-го типа из гестационного диабета и многие другие.
ДСМ-метод АПИ строит модель причинно-следственных отношений в предметной области. В отличие от деревьев решений в нем каждый пример из исходного массива соотносится не с одним классификационным правилом, а с несколькими гипотезами о причине. Также в ДСМ-методе итоговая классификация связана не с вероятностью, а с эффективной оценкой истинностного значения: +1 (для отнесения к группе с наличием эффекта), -1 (для отнесения к группе с отсутствием эффекта), 0 (для отнесения к фактическому противоречию), τ (для ситуации неопределенности). Формирование скрининговых групп в нашем исследовании осуществлялось на основании различных возможных отношений причинности.
2. Методы, используемые в системе
Нулевым этапом применения ДСМ-метода АПИ можно считать подготовку базы фактов (БФ) из «сырых» данных: разработка языка представления фактов (их еще называют примерами), определение примеров с наличием эффекта (положительных) и его отсутствием (отрицательных), определение операции сходства.
Ядром ДСМ-метода АПИ является ДСМрассуждение, которое представляет собой синтез процедур индукции (порождаются гипотезы о причинах), аналогии (порождаются гипотезы о предсказаниях) и абдукции (принятие полученных гипотез посредством объясняемости исходного массива). Для порождения гипотез о причине используется понятие стратегии (Str), определяемой парой предикатов сходства для положительных и отрицательных примеров. В системе в качестве предикатов сходства использовались 4 метода [12]: простой метод сходства (a), метод сходства с запретом на контрпример (ab), метод различия (ad0) и метод различия с запретом на контрпример (abd0), которые в итоге формируют 16 возможных стратегий. Формальное определение предикатов сходства приведено в Приложении 1. Имя стратегии имеет вид Strx,y, где x, y Î {a, ab, ad0, abd0}. Множество стратегий образуют изоморфные решетки по логической силе для каждого из четырех правил индуктивного вывода [12]. Стратегия характеризует тип причинности в предметной области. Пример решетки для правила индуктивного вывода положительных гипотез в виде диаграммы приведен на Рис. 1.
Рис. 1. Диаграмма стратегий для правила индуктивного вывода положительных гипотез
Применение ДСМ-рассуждения к расширяющимся базам фактов называется ДСМисследованием. Главным результатом ДСМисследования является нахождение эмпирических закономерностей. Алгоритм для нахождения эмпирических закономерностей в системе основывался на определении эмпирической закономерности, данном в [11], и учитывал сохранения оценок истинностных значений гипотез во всех возможных перестановках расширений массива для минимизации случайности расширения, а также монотонное неубывание показателя объясняемости полученными гипотезами исходного массива. Тип закономерности (определяется согласно дереву Т-классификаций в [11] и обозначается латинскими буквами от a до n) характеризует устойчивость гипотезы при расширении данных. Типам закономерностей соответствует отношение частичного порядка с наибольшим и наименьшим элементами. На Рис. 2 приведена диаграмма этого частичного порядка.
Таким образом, в системе эмпирические закономерности получают оценку вида <z, Str>, где Str – стратегия, z – тип закономерности. Этой оценке соответствует прямое произведение частичных порядков для стратегий и типов закономерностей. Оценка может быть усилена параметром k (<z, Str, k>), обозначающим количество родителей гипотезы, т.е. объектов исходного массива, порождающих эту гипотезу.
Рис. 2. Диаграмма типов закономерностей
Такая оценка соответствует шкале качества гипотез [11, таблица 5]. Другим результатом ДСМ-исследования является разбиение множества стратегий относительно отношений эквивалентности. Отношение эквивалентности стратегий является средством моделирования предметной области. Оно может задаваться несколькими способами. В [11] приведены два способа определения эквивалентности: слабая эквивалентность (Df.21–3, совпадают правильные предсказания, в нашем исследовании обозначается E1) и сильная эквивалентность (Df.20–3, совпадают правильные предсказания и ошибки, в нашем исследовании обозначается E13). Также в системе была добавлена эквивалентность стратегий по эмпирическим закономерностям (обозначается E2).
Рис. 3. Решетка отношений эквивалентности стратегий
Эквивалентность стратегий является частью модели предметной области. Представляется полезным рассмотреть отношения эквивалентности, образованные конъюнкцией условий: E12 = E1 & E2 и E123 = E13 & E2. Определяемые отношения эквивалентности образуют решетку, представленную на Рис. 3.
3. Проведение исследования
На момент проведения исследования массив данных по пациентам содержал 279 историй болезни. Для возможности использования средств нахождения эмпирических закономерностей массив был разделен на 4 расширения, близких по количеству входящих в них примеров. Дополнительно использовались 20 примеров для предсказания, не входящих в исходные массивы. Положительными примерами были пациенты, которым рекомендовано прохождение КТ (179 из 279), отрицательными — те пациенты, для которых прохождение КТ не обязательно (80 из 279). Этот дополнительный признак задавался экспертом. На основании созданной расширяющейся последовательности баз фактов были получены эмпирические закономерности, соответствующие скрининговым группам.
Рис. 4. Пациент К., 59 лет. КТ с внутривенным контрастированием в аксиальной Плоскости. Морфологически подтвержденный РПЖ (T3N0M0). Картина новообразования в головке поджелудочной железы. Высокая клиническая обоснованность необходимости в проведении КТ
В качестве признаков были выбраны возраст (пациенты разбивались по декадам), наличие в анамнезе алкогольной и табачной зависимостей, индекс массы тела, длительность заболевания, боль (степень силы), наличие в анамнезе сахарного диабета (СД). Все признаки относились к типу «выбор одного из возможных качественных значений» [13] и имели соответствующее сходство, определяемое как совпадение выбранного значения.
Рис. 5. Пациентка Д., 60 лет. Хронический панкреатит без признаков осложнений заболевания. Картина диффузных изменений. Высокая клиническая обоснованность отсутствия необходимости в проведении КТ
Были правильно предсказаны все 20 примеров, заданных для предсказания, из которых полученные эмпирические закономерности предсказывают 17 из 20 (85%) примеров. К закономерностям были добавлены гипотезы не являющиеся эмпирическими закономерностями, но имеющими предсказательную силу. Таким образом были предсказаны оставшиеся 3 примера. Минимальные1из полученных гипотез были предоставлены экспертам для оценки по шкале от 1 до 3, где 1 означает необоснованность с медицинской точки зрения, а 3 — максимальную обоснованность. После этого все предсказанные примеры были добавлены к расширениям, а экспертами была предложена новая группа для предсказания, состоящая из 10 примеров, также не содержащихся в исходных массивах. К ним была применена аналогичная ДСМэвристика исследования. В результате были получены эмпирические закономерности, предсказывающие 9 из 10 примеров (90%). Гипотезы, имеющие предсказательную силу, но не являющиеся закономерностями, в этом случае не были найдены. Один пример остался непредсказанным (Рис. 4 и 5).
4. Результаты
Положительные закономерности в первом эксперименте получены стратегиями Strab,ab, Strab,abd0, Stra,ab, Stra,abd0, остальные не порождают закономерности (Рис. 6).
Рис. 6. Поддиаграмма стратегий, порождающих закономерности, для правила индуктивного вывода положительных гипотез
Закономерности были типизированы как a (наибольший элемент), b (отличается от a тем, что не выполняется условие монотонного роста объясняемости при расширении массива) и n (наименьший элемент). Оценки, полученные закономерностями, соответствуют поддиаграмме прямого произведения частичных порядков стратегий и типов закономерностей (Рис. 7).
Рис. 7. Поддиаграмма прямого произведения частичных порядков стратегий и типов закономерностей для положительных эмпирических закономерностей (первая группа на предсказание)
Отрицательные закономерности получены единственной стратегией Strabd0,a, являющейся минимальной по логической силе для правила индуктивного вывода отрицательных гипотез, и все имели тип a.
Во втором эксперименте эмпирические закономерности были получены теми же стратегиями, что и в первом эксперименте, однако их типы изменились: вместо b появился тип a, для которого характерен монотонный рост объясняемости. Поддиаграмма для положительных закономерностей во втором эксперименте приведена на Рис. 8.
Рис. 8. Поддиаграмма произведения решеток оценок положительных эмпирических закономерностей для второй группы на предсказание
Все минимальные гипотезы о причине понижения оценок, соответствующие эмпирическим закономерностям, с оценками эксперта перечислены в Приложении 2. Стоить отметить, что в целом понижение оценок согласуется с уменьшением силы стратегий. Самая сильная по логической силе стратегия (Strab,ab) получила все максимальные оценки, самая минимальная по силе (Stra,abd0) — ни одной максимальной в случае первого эксперимента, и только одну максимальную в случае второго.
Для последнего расширения в обоих экспериментах были посчитаны правильные предсказания (обозначаются l0) и ошибки, классифицированные в три типа: a — грубые ошибки (примеры с наличием эффекта предсказаны как примеры с отсутствием эффекта и наоборот), b – негрубые ошибки (примеры предсказаны как «фактическое противоречие») и c – отказ от предсказания системой. Таблицы с данными представлены в Приложении 3.
Классификация предсказаний используется в формировании разбиения множества стратегий на классы эквивалентности по отношениям E1, E2, E13, E123. Отношения эквивалентности, учитывающие эмпирические закономерности (E2 и E123), рассматривались отдельно для положительных и отрицательных закономерностей. Результаты для обоих экспериментов представлены в Табл. 1 и 2. Каждая строка в таблице соответствует разбиению множества стратегий на классы эквивалентности для одного из отношений. Если в класс эквивалентности входит несколько стратегий, то ячейки соответствующей строки для них объединены, и для класса приведены поддиаграммы диаграмм стратегий для правил вывода, которые включают стратегии, формирующие класс. Также стоит отметить, что отношение может быть определено не на всем множестве исходных стратегий (ячейки, соответствующие стратегиям, для которых отношение не определено, выделены серым цветом). Большое число полученных классов эквивалентности содержат только одну стратегию, что может свидетельствовать о том, что хорошо определен тип причинности.
5. Интерпретация результата
Важность ранней диагностики РПЖ и осложнений ХП несомненна и диктует необходимость рационального использования возможностей высокотехнологичных методов визуализации, в первую очередь, КТ. Данный метод позволяет быстро и достаточно точно проводить раннюю диагностику РПЖ и осложнений ХП.
Табл. 1. Классы эквивалентности для отношений E1, E2, E13, E123, эксперимент 1
| Strab,ab | Stra,abd0 | Strab,abd0 | Stra,ab | Strad0,ad0 | Strabd0,ad0 | Strad0,a | Strad0b,a | Strab,ad0 | Strad0,ab | Strad0b,ab | Strab,a | Strad0,ad0b | Stra,ad0 | Strad0b,ad0b | Stra,a |
E1 | Кл21 | Кл2 | Кл3 | Кл4 | Кл53 | Кл6 | Кл7 | Кл8 | Кл9 | Кл104 |
|
| ||||
E2+ | Кл1 | Кл2 | Кл3 | Кл4 |
|
|
|
|
|
|
|
|
|
|
|
|
E2– |
|
|
|
|
|
|
| Кл1 |
|
|
|
|
|
|
|
|
E13 | Кл1 | Кл2 | Кл3 | Кл4 | Кл5 | Кл6 | Кл7 | Кл8 | Кл9 | Кл10 | Кл11 | Кл12 | Кл13 | Кл14 | Кл15 | Кл16 |
E123+ | Кл1 | Кл2 | Кл3 | Кл4 |
|
|
|
|
|
|
|
|
|
|
|
|
– E123 |
|
|
|
|
|
|
| Кл1 |
|
|
|
|
|
|
|
|
Табл. 2. Классы эквивалентности для отношений E1, E2, E13, E123, эксперимент 2
| Strab,ab | Stra,abd0 | Strab,abd0 | Stra,ab | Strad0,ad0 | Strabd0,ad0 | Strad0,a | Strad0b,a | Strab,ad0 | Strad0,ab | Strad0b,ab | Strab,a | Stra,ad0 | Strad0,ad0b | Strad0b,ad0b | Stra,a |
E1 | Кл1 | Кл2 | Кл3 | Кл4 | Кл55 | Кл6 | Кл7 | Кл8 | Кл9 | Кл10 |
|
|
| |||
E2+ | Кл1 | Кл2 | Кл3 | Кл4 |
|
|
|
|
|
|
|
|
|
|
|
|
E2– |
|
|
|
|
|
|
| Кл1 |
|
|
|
|
|
|
|
|
E13 | Кл1 | Кл2 | Кл3 | Кл4 | Кл5 | Кл6 | Кл7 | Кл8 | Кл9 | Кл10 | Кл11 | Кл12 | ||||
E123+ | Кл1 | Кл2 | Кл3 | Кл4 |
|
|
|
|
|
|
|
|
|
|
|
|
– E123 |
|
|
|
|
|
|
| Кл1 |
|
|
|
|
|
|
|
|
Широкий спектр показаний к проведению КТ при заболеваниях поджелудочной железы и большое количество таких пациентов создает сложности для врачей-клиницистов – терапевтов, гастроэнтерологов и хирургов – при определении необходимости проведения КТ. Кроме того, также возникают условия для увеличения сложности для врачей-рентгенологов и службы лучевой диагностики в целом за счет повышения трудовой нагрузки и снижения доступности обследования для пациентов.
Включенные в БФ признаки входят в набор фактов, которые врач выясняет у пациента при сборе анамнеза и осмотре. Такой подход соответствует принципам клинического мышления врача и полностью оправдан для оценки необходимости проведения КТ. Использование анамнестических фактов, являющихся доказанными факторами риска развития РПЖ, предикторами тяжелого течения или признаками скрытого течения указанных заболеваний позволяет расценить результаты данного исследования логичными и достоверными [15]. Отобранные факты для работы ИС могут быть выяснены у пациента на доврачебном этапе оказания медицинской помощи.
Последующее использование полученных в представленном исследовании результатов ускорит анализ данных о состоянии здоровья пациента и его анамнезе, что не только упростит работу врача, но и снизит вероятность дефектов в работе специалиста, связанных с информационной перегрузкой. ИС не ставит себе целью заменить клиническое мышление врача, но будучи внедренной в клиническую практику ИС, окажет значимую консультативную помощь врачу в обработке массива информации. Более того, рациональныйподходкназначениюКТ, который можно осуществить с помощью представленного варианта ИС, снизит избыточную нагрузку на службу лучевой диагностики и повысит доступность метода. В конечном счете такой подход улучшит возможности ранней диагностики РПЖ и приведет к снижению смертности от злокачественных новообразований.
Таким образом, применение ИС открывает широкие возможности для врачей благодаря интегральному подходу к ускоренному анализу каждого пациента и прецизионному определению необходимости проведения КТ пациентам с заболеваниями поджелудочной железы.
Заключение
Результатом исследования стал интеллектуальный анализ данных, т.е. применение ИСДСМ (ИС, реализующей ДСМ-метод АПИ) для получения обоснованных результатов, учитывающих типы причинных отношений [16]. Окончательный результат представлен в виде внутренних оценок системы, образованных парой стратегия-закономерность (<z, Str>), что говорит о спецификации характера причины и конструктивной обоснованности гипотез. Оценка уточняется за счет добавления количества примеров, порождающих гипотезу (k). Внутренняя оценка хорошо согласуется с оценкой эксперта. Два описанных в статье эксперимента свидетельствуют как об адекватности применяемых методов, так и об удачной параметризации, предложенной экспертами. Оба эксперимента реализовали высокоэффективное применение ДСМ-метода.
Приложение 1. Определения предикатов сходства
|
Mσ (V,W) (σ = +, –, 0, τ) являются минимальными предикатами, реализующими индуктивные выводы. Они могут быть дополнены более информативными усилениями.
Запрет на контрпример:
(b)+ "X"Y(((V< X)&(W< Y))→(J(1,n)(XÞ1Y)ÚJ(τ,n)(XÞ1Y)))
(b)– "X"Y(((V< X)&(W< Y))→(J(–1,n)(XÞ1Y)ÚJ(τ,n)(XÞ1Y)))
M+ab,n(V,W) ⇋ M+a,n(V,W) & (b)+, M–ab,n(V,W) ⇋ M–a,n(V,W) & (b).–
Метод различия:
(d0)+ "X"Y"Z"U((J(1,n)(XÞ1Y)&(W< Y)& (V< X) & ((X –V)< Z) & ((X –V)≠Æ) & ¬(V< Z)) →
¬J(1,n)(ZÞ1U) Ú ¬(W< U)))6
(d0)– "X"Y"Z"U((J(-1,n)(XÞ1Y)&(W< Y)& (V< X) & ((X –V)< Z) & ((X –V)≠Æ) & ¬(V< Z)) →
¬J(-1,n)(ZÞ1U) Ú ¬(W< U)))
M+ad0,n(V,W) ⇋ M+a,n(V,W) & (d0)+, M–ad0,n(V,W) ⇋ M–a,n(V,W) & (d0)–.
Метод различия с запретом на контрпримеры:
M+ad0b,n(V,W) ⇋ M+a,n(V,W) & (b)+ & (d0)+, M–ad0b,n(V,W) ⇋ M–a,n(V,W) & (b)– & (d0)–
Приложение 2. Перечень полученных закономерностей
Признаки и сокращения:
- Возраст разбит по декадам: 3 — 30-39, 4 — 40-49, 5 — 50-59, 6 — 60-69, 7 — 70-79, 8 — 80-89;
- Алкоголь (алкогольная зависимость) имеет возможные значения Да/Нет;
- Табакокурение (табачная зависимость) имеет возможные значения Да/Нет;
- Индекс массы тела (ИМТ) имеет значения: Ниже — ниже нормы, Норм — норма, Выше — выше нормы;
- Длительность заболевания сравнивалась по ключевым точкам: 1 год, 2 года, 3 года, 5 лет;
- Боль (выраженность боли) имеет возможные значения Да (сильная боль)/Нет (несильная боль);
- Сахарный диабет (СД ) имеет возможные значения Да/Нет.
k — количество «родителей» гипотезы (примеров, которые ее порождают).
Если соответствующая закономерность порождается несколькими стратегиями – выбиралась наибольшая (так как стратегии, которыми получены закономерности в наших экспериментах, оказались сравнимы). Таким образом, каждой эмпирической закономерности была приписана одна оценка.
Эксперимент 1. Положительные закономерности
áb, Strab,abñ
# | Возраст (декада) | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 (Сильная) | СД | k | Оценка эксперта |
2105 |
|
|
| Норм | < 3 лет | Да |
| 17 | 3 |
2168 |
| Нет |
|
| < 3 лет | Да |
| 16 | 3 |
132 |
|
| Нет |
| < 2 лет | Да |
| 13 | 3 |
205 |
|
|
|
| < 1 года | Да |
| 12 | 3 |
2114 | 5 |
|
|
| < 3 лет | Да |
| 6 | 3 |
3145 |
| Нет | Нет |
| От 1 до 2 лет |
|
| 6 | 3 |
3321 | 6 |
|
|
| < 2 лет | Да |
| 6 | 3 |
2178 | 5 | Нет |
| Норм |
| Да |
| 5 | 3 |
2538 | 5 | Нет |
|
|
| Да | Нет | 4 | 3 |
2548 | 5 |
| Да |
| < 3 лет |
| Нет | 4 | 3 |
3028 | 5 |
|
|
| От 1 до 3 лет |
| Нет | 4 | 3 |
3314 | 6 | Да |
|
| < 5 лет |
| Нет | 4 | 3 |
3315 |
| Да |
|
| < 1 года |
| Нет | 4 | 3 |
9 |
| Да | Нет |
| < 5 лет | Да | Нет | 3 | 3 |
1520 | 5 |
|
| Норм |
| Да | Да | 3 | 3 |
áb, Strab,abd0ñ
# | Возраст (декада) | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 (Сильная) | СД | k | Оценка эксперта |
1537 | 5 | Нет |
|
|
| Да |
| 6 | 3 |
áa, Stra,abñ
# | Возраст (декада) | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 (Сильная) | СД | k | Оценка эксперта |
33 |
|
|
| Норм |
| Да |
| 23 | 3 |
689 |
|
|
| Норм | < 2 лет |
|
| 19 | 2 |
207 |
| Нет |
|
| < 2 лет |
|
| 18 | 3 |
1089 |
|
| Нет |
|
| Да |
| 18 | 2 |
1280 |
| Нет |
|
| < 5 лет | Да |
| 17 | 2 |
1832 |
|
| Нет |
| < 2 лет |
|
| 16 | 3 |
1267 |
| Нет |
|
|
| Да | Нет | 15 | 2 |
1837 |
|
|
|
| < 1 года |
|
| 14 | 3 |
795 | 5 |
|
|
| < 5 лет |
|
| 9 | 2 |
794 |
| Да |
| Норм | < 5 лет |
|
| 8 | 2 |
1178 | 6 |
|
|
| < 5 лет | Да |
| 8 | 3 |
1428 | 5 |
|
|
|
|
| Нет | 8 | 2 |
2120 |
|
|
|
| > 2 лет | Да | Нет | 8 | 1 |
3618 | 6 |
|
|
| < 3 лет |
| Нет | 8 | 2 |
1834 | 6 |
| Нет |
| < 5 лет |
| Нет | 7 | 3 |
1644 |
| Да | Нет |
|
|
| Нет | 6 | 2 |
2552 |
| Нет | Да |
| < 3 лет |
|
| 6 | 3 |
3609 | 6 |
|
| Норм | < 3 лет |
|
| 6 | 3 |
69 |
|
| Нет | Выше |
|
| Нет | 5 | 2 |
681 | 5 |
| Да | Норм |
|
|
| 5 | 3 |
3411 | 4 |
| Да |
| > 1 года |
| Нет | 5 | 1 |
2276 |
| Нет |
| Выше |
|
| Нет | 4 | 1 |
3314 | 6 | Да |
|
| < 5 лет |
| Нет | 4 | 2 |
3424 | 4 | Да |
|
| > 1 года |
|
| 4 | 1 |
án, Strab,abd0ñ
# | Возраст (декада) | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 (Сильная) | СД | k | Оценка эксперта |
23073 | 6 |
| Да |
| От 2 до 5 лет |
| Нет | 3 | 2 |
áа, Stra,abd0ñ
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта |
694 |
|
|
| Норм | < 5 лет |
|
| 23 | 1 |
1265 |
| Нет |
|
|
| Да |
| 21 | 2 |
257 |
| Нет |
|
| < 5 лет |
|
| 20 | 2 |
4 |
|
| Нет |
|
|
| Нет | 19 | 1 |
802 |
|
| Нет |
| < 5 лет |
|
| 19 | 2 |
2744 |
| Нет | Нет | Норм |
|
|
| 11 | 1 |
1843 | 6 |
|
|
| < 5 лет |
| Нет | 10 | 2 |
2103 |
|
|
|
| > 2 лет | Да |
| 10 | 1 |
76 | 5 |
|
|
|
| Да |
| 8 | 2 |
54 | 5 |
| Да |
|
|
|
| 7 | 2 |
1274 | 4 |
|
|
| > 1 года |
| Нет | 6 | 1 |
2154 |
|
|
|
| От 2 до 5 лет |
| Нет | 5 | 1 |
478 |
| Да |
| Выше | > 3 лет |
|
| 4 | 2 |
3424 | 4 | Да |
|
| > 1 года |
|
| 4 | 2 |
1724 |
|
|
| Выше | > 3 лет |
| Нет | 3 | 2 |
1286 | 4 |
| Нет |
| > 1 года |
|
| 2 | 2 |
Эксперимент 1. Отрицательные закономерности
áa, Strabd0,añ
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта |
69 | 3 |
|
|
| > 3 лет |
|
| 7 | 2 |
353 |
|
| Нет |
| > 3 лет |
|
| 7 | 2 |
269 |
|
|
|
| > 1 года | Нет | Да | 6 | 3 |
546 |
| Нет |
|
| > 5 лет | Нет |
| 6 | 3 |
308 | 5 |
|
|
|
| Нет |
| 3 | 3 |
399 | 4 |
|
| Норм | > 5 лет |
| Да | 3 | 2 |
267 | 6 |
|
| Выше | > 1 года | Нет |
| 2 | 3 |
480 | 6 |
| Да |
| От 1 до 2 лет | Нет |
| 2 | 3 |
672 | 4 | Нет | Да | Норм | > 2 лет |
|
| 2 | 2 |
Эксперимент 1. Отрицательные гипотезы, не являющиеся закономерностями
Strab,ad0
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта |
271 |
|
|
|
| > 1 года |
|
| 69 | 3 |
Strab,a
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта |
62 |
|
|
|
|
| Нет |
| 70 | 2 |
224 |
|
|
|
|
|
| Нет | 51 | 1 |
4097 |
|
|
| Норм |
|
|
| 47 | 1 |
4100 |
|
| Да |
|
|
|
| 45 | 1 |
364 |
|
|
|
| < 5 лет |
|
| 33 | 1 |
4108 |
| Да |
|
|
|
|
| 33 | 1 |
1249 |
|
|
| Выше |
|
|
| 25 | 1 |
1879 |
|
|
| Ниже |
|
|
| 8 | 1 |
Эксперимент 2. Положительные закономерности
<a, Strab,ab>
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта | Была в Эксперименте 1 |
3315 |
| Да |
|
| < 1 года |
| Нет | 4 | 3 | Да |
<a, Stra,ab>
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта | Была в Эксперименте 1 |
884 |
| Нет |
| Норм |
|
|
| 20 | 2 | Нет |
1103 |
|
| Нет | Норм |
|
|
| 15 | 2 | Нет |
2520 |
| Нет | Да |
|
|
|
| 13 | 2 | Нет |
2101 |
| Нет |
|
| > 2 лет |
|
| 12 | 2 | Нет |
1835 |
|
|
| Норм | < 1 года |
|
| 11 | 3 | Нет |
4010 |
| Нет |
|
|
|
| Да | 9 | 2 | Нет |
1857 | 6 |
|
| Норм | < 5 лет |
|
| 8 | 3 | Нет |
2728 |
|
|
| Норм | < 2 лет |
| Да | 8 | 2 | Нет |
1830 |
| Да |
|
| < 1 года |
|
| 6 | 3 | Нет |
<a, Strab,abd0>
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта | Была в Эксперименте 1 |
3145 |
| Нет | Нет |
| От 1 до 2 лет |
|
| 6 | 3 | Да |
3315 |
| Да |
|
| < 1 года |
| Нет | 4 | 3 | Да |
<n, Strab,abd0>
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта | Была в Эксперименте 1 |
23055 | 5 |
| Нет | Ниже | > 1 года |
|
| 3 | 2 | Нет |
<a, Stra,abd0>
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта | Была в Эксперименте 1 |
37 |
| Нет |
|
| > 1 года |
|
| 22 | 2 | Нет |
75 | 5 |
|
|
|
|
|
| 14 | 1 | Нет |
121 |
|
| Нет |
| > 1 года |
|
| 14 | 1 | Нет |
494 |
|
|
|
|
|
| Да | 14 | 2 | Нет |
2520 |
| Нет | Да |
|
|
|
| 13 | 2 | Нет |
1855 | 6 |
|
|
| < 5 лет |
|
| 12 | 3 | Нет |
486 |
|
|
| Выше |
|
|
| 11 | 1 | Нет |
998 |
| Да | Нет |
|
|
|
| 7 | 1 | Нет |
601 | 3 | Да |
| Норм |
|
|
| 5 | 1 | Нет |
Эксперимент 2. Отрицательные закономерности
<a, Strabd0,a>
# | Возраст | Алкоголь | Табакокурение | ИМТ | Длительность | Боль > 6 | СД | k | Оценка эксперта | Была в Эксперименте 1 |
473 |
|
|
| Норм |
|
| Нет | 7 | 3 | Нет |
474 |
|
| Да |
|
|
| Нет | 8 | 3 | Нет |
479 |
|
| Да |
| < 5 лет | Нет |
| 6 | 2 | Нет |
Приложение 3. Перечень правильных предсказаний и ошибок по стратегиям для последнего расширения
Для эксперимента 1
| l0 | a | b | c | ||||
| + | – | + | – | + | – | + | – |
Strab,ab | 8 | 3 |
| 3 | 2 | 1 | 1 | 2 |
Stra,abd0 | 11 |
|
| 9 |
|
|
|
|
Strab,bd0 | 10 |
|
| 4 |
|
| 1 | 5 |
Stra,ab | 9 |
|
| 5 | 2 | 4 |
|
|
Strad0,ad0 |
| 9 | 5 |
| 3 |
| 3 |
|
Strabd0,ad0 |
| 9 | 8 |
|
|
| 3 |
|
Strad0,a |
| 9 | 8 |
| 3 |
|
|
|
Strabd0,a |
| 9 | 11 |
|
|
|
|
|
Strab,ad0 | 3 | 5 | 1 |
| 7 | 4 |
|
|
Strad0,ab | 2 | 4 | 1 |
| 1 |
| 7 | 5 |
Strab,a |
| 5 | 1 |
| 10 | 4 |
|
|
Strabd0,ab |
| 4 | 2 |
|
|
| 9 | 5 |
Strad0,abd0 | 3 |
|
|
|
|
| 8 | 9 |
Stra,ad0 | 3 |
|
|
| 8 | 9 |
|
|
Strabd0,abd0 |
|
|
|
|
|
| 11 | 9 |
Stra,a |
|
|
|
| 11 | 9 |
|
|
Для эксперимента 2
| l0 | a | b | c | ||||
| + | – | + | – | + | – | + | – |
Stra,abd0 | 7 |
|
| 3 |
|
|
|
|
Strab,abd0 | 5 |
|
|
|
|
| 2 | 3 |
Strab,ab | 4 | 1 | 1 |
| 1 |
| 1 | 2 |
Stra,ab | 5 |
|
| 2 | 2 | 1 |
|
|
Strab,ad0 | 2 | 2 |
|
| 3 | 2 |
| 1 |
Strab,a |
| 3 | 2 |
| 5 |
|
|
|
Strad0,a, Strabd0,a |
| 3 | 7 |
|
|
|
|
|
Stra,ad0 | 2 |
|
| 1 | 5 |
|
| 2 |
Strad0,ad0, Strabd0,ad0 |
| 2 | 5 |
|
|
| 2 | 1 |
Strad0,ab, Strabd0,ab |
| 1 | 2 |
|
|
| 5 | 2 |
Strad0,abd0, Strabd0,abd0 |
|
|
|
|
|
| 7 | 3 |
Stra,a |
|
|
|
| 7 | 3 |
|
|
1 Под минимальными имеются ввиду гипотезы, такие, что никакая другая полученная гипотеза не состоит из подмножества признаков этих гипотез. Формальное описание минимальных гипотез, например, в [14].
2 Кл — здесь и далее в таблицах сокращение от класса эквивалентности.
3 Приведена только поддиаграмма для правил вывода отрицательных гипотез, так как стратегии, входящие в класс эквивалентности, правильно предсказывают только отрицательные примеры
4 Приведена только поддиаграмма для правил вывода положительных гипотез, так как стратегии, входящие в класс эквивалентности, правильно предсказывают только положительные примеры
5 Приведена только поддиаграмма для правил вывода отрицательных гипотез, так как стратегии, входящие в класс эквивалентности, правильно предсказывают только отрицательные примеры
6 Здесь «–» обозначает операцию булевой разности
作者简介
Olga Shesternikova
Russian Research Institute of Health
编辑信件的主要联系方式.
Email: oshesternikova@gmail.com
IT engineer, Russian Research Institute of Health
俄罗斯联邦, MoscowViktor Finn
Federal Research Center” Computer Science and Control”, the Russian Academy of Sciences
Email: ira.finn@gmail.com
Doctor of Technical Sciences, Professor, Honored Scientist of the Russian Federation. Chief Researcher, Research Head of the Department of Intelligent Systems in Humanities, Russian State University for Humanities (RSUH)
俄罗斯联邦, MoscowKonstantin Lesko
Moscow Clinical Scientific Center named after A.S. Loginov
Email: k.lesko@mknc.ru
Candidate of Medical Sciences, Radiologist
俄罗斯联邦, MoscowLyudmila Vinokurova
Moscow Clinical Scientific Center named after A.S. Loginov
Email: vinokurova52@mail.ru
Doctor of Medical Sciences. Leading researcher
俄罗斯联邦, Moscow参考
- Shesternikova O.P., Finn V.K., Vinokurova L.V., Lesko K.A., Varvanina G.G., Tyulyaeva E.Yu. 2019 Intellektual'naya sistema dlya diagnostiki zabolevanij podzheludochnoj zhelezy [Intelligent system for diagnostics of pancreatic diseases]. Nauchnotekhnicheskaya informaciya. Seriya 2 [Scientific and technical information. Series 2.] 10: 41-48.
- Vinokurova L.V., Finn V.K., Les'ko K.A., SHesternikova O.P., Varvanina G.G. 4–5.03.2021. Pervye rezul'taty izucheniya vozmozhnostej intellektual'noj sistemy avtomatizirovannoj podderzhki issledovanij v differencial'noj diagnostike raka podzheludochnoj zhelezy [The first results of studying the capabilities of an intelligent automated research support system in the differential diagnosis of pancreatic cancer]. Materialy 47-j nauchnoj sessii CNII gastroenterologii «Gastroenterologiya v menyayushchejsya real'nosti» [47th scientific session of the Central Research Institute of Gastroenterology "Gastroenterology in a changing reality"]. Terapevticheskij arhiv. 2021; 93 (2, Prilozhenie) [Therapeutic Archive. 2021; 93 (2, Appendix)]: 77.
- Zhang J, Zuo CJ, Jia NY, et al. Cross-modality PET/CT and contrast-enhanced CT imaging for pancreatic cancer. World J Gastroenterol. 2015;21(10):2988-2996.
- Sostoyanie onkologicheskoj pomoshchi naseleniyu Rossii v 2019 godu [The state of oncological care to the population of Russia in 2019.]. Pod red. A.D. Kaprina, V.V. Starinskogo, A.O. Shahzadovoj. 2020. Moscow: National Medical Research Radiological Centre of the Ministry of Health of the Russian Federation, 239 p.
- Sung H, Ferlay J, Siegel RL, Laversanne M, Soerjomataram I, Jemal A, Bray F. Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin. 2021 Feb 4.
- Baranov A. A., Namazova-Baranova L. S., Smirnov I. V., Devyatkin D. A., SHelmanov A. O., Vishneva E. A., Antonova E. V., Smirnov V. I., Latyshev A. V. 2015. Metody i sredstva kompleksnogo intellektual'nogo analiza medicinskih dannyh [Methods and means of complex intellectual analysis of medical data]. Trudy ISA RAN [Proceedings of ISA RAS]. 65.2: 81-93
- Luger, George F. Artificial intelligence: structures and strategies for complex problem solving / George F. Luger.4th ed. Addison-Wesley, 2002
- Linden, A., and Yarnold, P. R. (2016) Using data mining techniques to characterize participation in observational studies. J Eval Clin Pract, 22: 839-847.
- Yu, E., Wesselius, A., Sinhart, C., Wolk, A., Stern, M., Jiang, X., Zeegers, M. (2020). A data mining approach to investigate food groups related to incidence of bladder cancer in the BLadder cancer Epidemiology and Nutritional Determinants International Study. British Journal of Nutrition, 124(6), 611-619.
- Khan SR, Mohan H, Liu Y, Batchuluun B, Gohil H, Al Rijjal D, Manialawy Y, Cox BJ, Gunderson EP, Wheeler MB. The discovery of novel predictive biomarkers and early-stage pathophysiology for the transition from gestational diabetes to type 2 diabetes. Diabetologia. 2019 Apr; 62(4):687-703.
- Finn V.K., Shesternikova O.P. 2018. Evristika obnaruzheniya empiricheskih zakonomernostej posredstvom DSM-rassuzhdenij [Heuristics of detecting empirical regularities using JSM-reasoning]. Nauchnotekhnicheskaya informaciya. Seriya 2 [Scientific and technical information. Series 2]. 9: 7-42.
- Finn V.K. 2014. Distributive Lattices of Inductive JSM Procedures. Automatic Documentation and Mathematical Linguistics. Vol. 48. 6: 265-295
- Pankratova E.S, Vinogradov D.V. 2011. Formalnoe opisanie nastrojki intellektualnyh DSM-sistem [Formal description of the configuration of intelligent JSMsystems]. Nauchno-tekhnicheskaya informaciya. Seriya 2 [Scientific and technical information. Series 2]. 9: 1-5.
- Gusakova S.M., Miheenkova M.A. 2016. Intellektual'nyj analiz dannyh kak instrument formirovaniya struktury sociuma [Data mining as a tool for shaping the structure of society]. Nauchno-tekhnicheskaya informaciya. Seriya 2 [Scientific and technical information. Series 2]. 8: 9-18.
- Klein AP. Pancreatic cancer epidemiology: understanding the role of lifestyle and inherited risk factors. Nat Rev Gastroenterol Hepatol. 2021; 18(7):493-502. doi: 10.1038/s41575-021-00457-x // Midha S, Chawla S, Garg PK. Modifiable and non-modifiable risk factors for pancreatic cancer: A review. Cancer Lett. 2016; 381(1):269-277.
- Finn V.K. 2020. Tochnaya epistemologiya i iskusstvennyj intellekt [Precise epistemology and artificial intelligence]. Nauchno-tekhnicheskaya informaciya. Seriya. 2 [Scientific and technical information. Series 2]. 6:1-36
补充文件
