Анализ клинических путей пациентов в медицинских учреждениях на основе методов жесткой и нечеткой кластеризации

Обложка

Цитировать

Полный текст

Аннотация

Моделирование процессов в системе здравоохранения играет большую роль для понимания ее деятельности и служит основой для повышения эффективности работы медицинских учреждений. Задачи анализа и моделирования больших массивов данных городского здравоохранения с помощью методов машинного обучения представляют особую значимость и актуальность для развития отраслевых решений в рамках цифровизации экономики, где данные являются ключевым фактором производства. В статье рассматривается проблема автоматического анализа и определения групп клинических путей пациентов на основе методов кластеризации. Существующие в данной области работы отражают большой интерес со стороны научного сообщества к подобным исследованиям, однако имеется необходимость развития ряда методологических подходов для дальнейшего их практического применения в городских поликлинических учреждениях с учетом специфики их организации. Целью исследования является повышение качества управления и сегментации входного потока пациентов в городских медицинских учреждениях на основе методов кластерного анализа для дальнейшей разработки рекомендательных сервисов. Одним из подходов для достижения поставленной цели является разработка и внедрение клинических путей, или траекторий движения пациентов. В общем виде под клиническим путем пациента понимается траектория его движения при получении медицинской услуги в соответствующих учреждениях. Представлен подход формирования групп маршрутов пациентов при помощи иерхического агломеративного алгоритма с методом связи Уорда и аддитивной регуляризацией тематических моделей (ARTM). Проведен вычислительный эксперимент на основе данных о маршрутах пациентов с диагнозом сепсис, размещенных в открытом доступе. Особенностью предлагаемого подхода является не только автоматизация определения схожих групп траекторий пациентов, но и учет шаблонов клинических путей для формирования рекомендаций в области организации структуры медицинского учреждения. В результате сформированный подход сегментации входного гетерогенного потока пациентов в городских медицинских учреждениях на основе кластеризации состоит из следующих шагов: 1) подготовка данных медицинского учреждения в формате журнала событий; 2) кодирование маршрутов пациентов; 3) определение верхнего предела длины рассматриваемого пути; 4) иерархическая агломеративная кластеризация; 5) аддитивная регуляризация тематических моделей (ARTM); 6) выявление популярных шаблонов маршрутов пациентов. Полученные кластеры маршрутов служат основой для дальнейшей разработки имитационной модели медицинского учреждения и предоставления рекомендаций пациентам. Кроме того, эти группы могут быть положены в основу разработки системы “Robotic process automation” (RPA), симулирующей действия человека и позволяющей автоматизировать интерпретацию данных для управления ресурсами учреждения.

Об авторах

Елизавета С. Прокофьева

Национальный исследовательский университет «Высшая школа экономики»

Автор, ответственный за переписку.
Email: prokofyeva.liza@gmail.com
ORCID iD: 0000-0003-1322-2932

Роман Д. Зайцев

ГК «ФОРС»

Email: roman.zaitsev@fors.ru
129272, г. Москва, ул. Трифоновский тупик, д. 3

Список литературы

  1. Илюшин Г.Я., Лиманский В.И. Построение системы управления потоками пациентов // Системы и средства информатики. 2015. Т. 25. № 1. С. 186–197.
  2. Азанов В.Г. Структурно-функциональная модель управления потоками пациентов // Системы и средства информатики. 2016. Т. 26. № 1. С. 13–29.
  3. What is a clinical pathway? Development of a definition to inform the debate / L. Kinsman [et al.] // BMC Medicine. 2010. Vol. 8. No 31. doi: 10.1186/1741-7015-8-31.
  4. Pearson S.D., Goulart-Fisher D., Lee T.H. Critical pathways as a strategy for improving care: Problems and potential // Annals of Internal Medicine. 1995. Vol. 123. No 12. P. 941–948.
  5. Wakamiya S., Yamauchi K. What are the standard functions of electronic clinical pathways? // International Journal of Medical Informatics. 2009. Vol. 78. No 8. P. 543–550. doi: 10.1016/j.ijmedinf.2009.03.003.
  6. Medical guidelines presentation and comparing with electronic health record / A. Vesel [et al.] // International Journal of Medical Informatics. 2006. Vol. 75. No 3–4. P. 240–245. doi: 10.1016/j.ijmedinf.2005.07.016.
  7. Rojas E., Munoz-Gama J., Sepúlveda M., Capurro D. Process mining in healthcare: A literature review // Journal of Biomedical Informatics. 2016. No 61. P. 224–236. doi: 10.1016/j.jbi.2016.04.007.
  8. Huang Z., Lu X., Duan H. On mining clinical pathway patterns from medical behaviors // Artificial Intelligence in Medicine. 2012. Vol. 56. No 1. P. 35–50. doi: 10.1016/j.artmed.2012.06.002.
  9. Rakocevic G., Djukic T., Filipovic N., Milutinovi V. Computational medicine in data mining and modeling. N.Y.: Springer, 2013. doi: 10.1007/978-1-4614-8785-2.
  10. Ahmad M.A., Teredesai A., Eckert C. Interpretable machine learning in healthcare // Proceedings of the 2018 IEEE International Conference on Healthcare Informatics (ICHI). New York, NY, USA, 4–7 June 2018. P. 447–447. doi: 10.1109/ICHI.2018.00095.
  11. Clinical pathways: effects on professional practice, patient outcomes, length of stay and hospital costs: Cochrane database of systematic reviews and meta-analysis / T. Rotter [et al.] // Evaluation & the Health Professions. 2010. Vol. 35. No 1. P. 3–27. doi: 10.1177/0163278711407313.
  12. Prodel M. Process discovery, analysis and simulation of clinical pathways using health-care data / Université de Lyon, 2017. [Электронный ресурс]: https://tel.archives-ouvertes.fr/tel-01665163/document (дата обращения 25.11.2019).
  13. Discovery of clinical pathway patterns from event logs using probabilistic topic models / Z. Huang [et al.] // Journal of Biomedical Informatics. 2014. No 47. P. 39–57. doi: 10.1016/j.jbi.2013.09.003.
  14. Lin F., Chou S., Pan S., Chen Y. Mining time dependency patterns in clinical pathways // International Journal of Medical Informatics. 2001. Vol. 62. No 1. P. 11–25. doi: 10.1016/S1386-5056(01)00126-5.
  15. Cote M.J., Stein W.E. A stochastic model for a visit to the doctor’s office // Mathematical and Computer Modelling. 2007. Vol. 45. No 3–4. P. 309–323. doi: 10.1016/j.mcm.2006.03.022.
  16. Zhang Y., Padman R., Patel N. Paving the cowpath: Learning and visualizing clinical pathways from electronic health record data // Journal of Biomedical Informatics. 2015. No 58. P. 186–197.
  17. Blei D.M., Ng A.Y., Jordan M.I. Latent Dirichlet allocation // The Journal of Machine Learning Research. 2003. No 3. P. 993–1022.
  18. Fernández-Llatas C., Benedi J.-M., García-Gómez J.M., Traver V. Process mining for individualized behavior modeling using wireless tracking in nursing homes // Sensors (Basel). 2013. Vol. 13. No 11. P. 15434–15451. doi: 10.3390/s131115434.
  19. van der Aalst W.M.P. Process mining: Discovery, conformance and enhancement of business processes. Springer, 2011. doi: 10.1007/978-3-642-19345-3.
  20. van der Aalst W.M.P. Process mining and simulation: A match made in heaven! // Proceedings of the 50th Computer Simulation Conference (SummerSim 2018). Bordeaux, France, 9–12 July 2018. doi: 10.22360/summersim.2018.scsc.005.
  21. van der Aalst W.M.P. Process mining: Data science in action. Berlin: Springer-Verlag, 2016.
  22. van der Aalst W.M.P. Process mining manifesto // Business Process Management Workshops. Springer, 2011. P. 169–194. doi: 10.1007/978-3-642-28108-2_19.
  23. Fernández-Llatas C., Meneu T., Benedi J.M., Traver V. Activity-based process mining for clinical pathways computer aided design // Proceedings of the 2010 Annual International Conference of the IEEE Engineering in Medicine and Biology. Buenos Aires, Argentina, 31 August – 4 September 2010. P. 6178–6181. doi: 10.1109/IEMBS.2010.5627760.
  24. Kovalchuk S.V., Funkner A.A., Metsker O.G., Yakovlev A.N. Simulation of patient flow in multiple healthcare units using process and data mining techniques for model identification // Journal of Biomedical Informatics. 2018. No 82. P. 128–142.
  25. Williams R., Buchan I., Prosperi M., Ainsworth J. Using string metrics to identify patient journeys through care pathways // Proceedings of the AMIA Annual Symposium, Washington, DC, USA, 15–19 November 2014. P. 1208–1217.
  26. Kaufmann L., Rousseeuw P. Clustering by means of medoids // Data analysis based on the L1-norm and related methods. 1987. P. 405–416.
  27. Ward J.H. Hierarchical grouping to optimize an objective function // Journal of the American Statistical Association. 1963. Vol. 58. No 301. P. 236–244.
  28. Зайцев Р.Д., Бритков В.Б. Применение языка R для многомерной кластеризации временных рядов с целью анализа динамики научно-технического развития // Труды Второй молодежной научной конференции «Задачи современной информатики». Москва, 29–30 октября 2015 г. М.: ФИЦ ИУ РАН. С. 92–98.
  29. Ferreira L., Hitchcock D. A comparison of hierarchical methods for clustering functional data // Communications in Statistics – Simulation and Computation. 2009. No 38. P. 1925–1949. doi: 10.1080/03610910903168603.
  30. Коннов И.В., Кашина О.А., Гильманова Э.И. Решение задачи кластеризации методами оптимизации на графах // Ученые записки Казанского университета. Сер. Физико-математические науки. 2019. Т. 161. Кн. 3. С. 423–437. doi: 10.26907/2541-7746.2019.3.423-437.
  31. Boytsov L. Indexing methods for approximate dictionary searching // Journal of Experimental Algorithmics. 2011. Vol. 16. No 1. Article No 1.1. doi: 10.1145/1963190.1963191.
  32. Rousseeuw P.J. Silhouettes: A graphical aid to the interpretation and validation of cluster analysis // Journal of Computational and Applied Mathematics. 1987. No 20. P. 53–65. doi: 10.1016/0377-0427(87)90125-7.
  33. Huang Z., Lu X., Duan H., Fan W. Summarizing clinical pathways from event logs // Journal of Biomedical Informatics. 2013. Vol. 46. No 1. P. 111–127. doi: 10.1016/j.jbi.2012.10.001.
  34. Vorontsov K.V., Potapenko A.A. Tutorial on probabilistic topic modeling: Additive regularization for stochastic matrix factorization // AIST’2014, Analysis of Images, Social Networks and Texts. Communications in Computer and Information Science. Springer, 2014. P. 265–267.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».