Retrieving stroke risk factors based on intellectual analysis of electronic health records

封面

如何引用文章

全文:

详细

Stroke is the world’s second leading cause of death and the third leading cause of disability and death combined. Risk factors for stroke are potentially manageable so prevention of this disease is possible. Identification of previously unknown modifiable risk factors for stroke or testing the significance of known factors is an urgent task that should be solved based on a retrospective analysis of the electronic health records of patients with this disease. The paper presents an approach to identifying risk factors for acute cerebrovascular accidents from texts of case histories using natural language processing and machine learning methods. The proposed approach made it possible to identify risk factors for stroke and transient ischemic attack in patients of one of the Moscow clinics. The identified factors are consistent with those found in other studies.

作者简介

V. Donitova

Federal Research Center “Computer Science and Control” of Russian Academy of Sciences

编辑信件的主要联系方式.
Email: vdonitova@gmail.com

Researcher

俄罗斯联邦, Moscow

D. Kireev

Federal Research Center “Computer Science and Control” of Russian Academy of Sciences

Email: kireev@isa.ru

Programmer

俄罗斯联邦, Moscow

B. Kobrinskii

Federal Research Center “Computer Science and Control” of Russian Academy of Sciences

Email: kba_05@mail.ru

PhD, Professor

俄罗斯联邦, Moscow

I. Smirnov

Federal Research Center “Computer Science and Control” of Russian Academy of Sciences

Email: ivs@isa.ru

PhD, Assoc. Professor

俄罗斯联邦, Moscow

E. Titova

Federal Research Center “Computer Science and Control” of Russian Academy of Sciences

Email: elz.titova@gmail.com

research engineer

俄罗斯联邦, Moscow

参考

  1. Gusev A.V., Kuznetsova T.Yu., Korsakov I.N. 2018. Iskusstvennyi intellekt v otsenke riskov razvitiya serdechno-sosudistykh zabolevanii [Artificial intelligence in assessing the risks of developing cardiovascular diseases]. Zhurnal telemeditsiny i elektronnogo zdravookhraneniya [Journal of Telemedicine and eHealth]. 3: 85-90.
  2. Kobrinskii B.A., Kadykov A.S., Poltavskaya M.G., Blagosklonov N.A., Kovelkova M.N. 2019. Printsipy funktsionirovaniya intellektualnoi sistemy dinamicheskogo kontrolya faktorov riska i formirovaniya rekomendatsii po zdorovesberezheniyu [Principles of functioning of an intelligent system for dynamic control of risk factors and the formation of recommendations for health saving]. Profilakticheskaya meditsina [Preventive medicine]. 22 (5): 7884. doi: 10.17116/ profmed20192205178.
  3. Feigin V.L. et al. 2021. Global, regional, and national burden of stroke and its risk factors, 1990–2019: A systematic analysis for the Global Burden of Disease Study 2019. The Lancet Neurology. 20 (10): 795-820.
  4. Johnson C.O. et al. 2019. Global, regional, and national burden of stroke, 1990–2016: a systematic analysis for the Global Burden of Disease Study 2016. The Lancet Neurology. 18 (5): 439-458.
  5. Boehme A.K., Esenwa Ch., Elkind M.S.V. 2017. Stroke Risk Factors, Genetics, and Prevention. Circulation Research. 120: 472–495. doi: 10.1161/ CIRCRESAHA.116.308398.
  6. Chen J. et al. 2022. Stroke Risk Factors of Stroke Patients in China: A Nationwide Community-Based Cross-Sectional Study. International Journal of Environmental Research and Public Health. 19 (8): 4807.
  7. Shvets D.A., Povetkin S.V. 2020. Sravnitelnyi obzor ispolzovaniya metodov mashinnogo obucheniya dlya prognozirovaniya serdechno-sosudistogo riska [Comparative review of the use of machine learning methods for predicting cardiovascular risk]. Vestnik novykh meditsinskikh tekhnologii. Elektronnoe periodicheskoe izdanie [Bulletin of new medical technologies. Electronic periodical.]. 5: 74-82. doi: 10.24411/2075-4094-2020-16711.
  8. Lee S., Kim H.S. 2021. Prospect of artificial intelligence based on electronic medical record. Journal of Lipid and Atherosclerosis. 10 (3): 282.
  9. Nevzorova V.A., Plekhova N.G., Priseko L.G., Chernenko I.N., Bogdanov D.Yu., Mokshina M.V., Kulakova N.V. 2020. Metody mashinnogo obucheniya v prognozirovanii iskhodov i riskov serdechno-sosudistykh zabolevanii u patsientov s arterialnoi gipertenziei (po materialam ESSE-RF v Primorskom krae) [Machine learning methods in predicting the outcomes and risks of cardiovascular diseases in patients with arterial hypertension (based on ESSE-RF materials in Primorsky Krai)]. Rossiiskii kardiologicheskii zhurnal [Russian Journal of Cardiology]. 3: 10-16. doi: 10.15829/15604071-2020-3-3751.
  10. Baranov A.A. et al. 2016. Tekhnologii kompleksnogo intellektualnogo analiza klinicheskikh dannykh [Technologies of complex intellectual analysis of clinical data]. Vestnik Rossiiskoi akademii meditsinskikh nauk [Bulletin of the Russian Academy of Medical Sciences]. 71 (2): 160-171.
  11. Tayefi M. et al. 2021. Challenges and opportunities beyond structured data in analysis of electronic health records. Wiley Interdisciplinary Reviews: Computational Statistics. 13 (6): e1549.
  12. Shelmanov A.O., Smirnov I.V., Vishneva E.A. 2015. Information extraction from clinical texts in Russian. Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue”. 1: 537-549.
  13. Blinov P. et al. 2022. RuMedBench: A Russian Medical Language Understanding Benchmark. Artificial Intelligence in Medicine. AIME 2022. Lecture Notes in Computer Science. 13263: 383392.
  14. Yalunin A., Nesterov A., Umerenkov D. RuBioRoBERTa: a pre-trained biomedical language model for Russian language biomedical text mining. 2022. URL: https://arxiv.org/abs/2204.03951.
  15. Liu Y. et al. Roberta: A robustly optimized bert pretraining approach. 2019. URL: https://arxiv. org/abs/1907.11692.
  16. Panov A.I. 2013. Vyyavlenie prichinno-sledstvennykh svyazei v dannykh psikhologicheskogo testirovaniya logicheskimi metodami [Identification of causal relationships in psychological testing data by logical methods]. Iskusstvennyi intellekt i prinyatie reshenii [Artificial intelligence and decision making]. 1: 24-32.
  17. Chudova N.V., Panov A.I. 2016. Izvlechenie prichinno-sledstvennykh otnoshenii iz dannykh psikhologicheskogo issledovaniya na materiale izucheniya agressivnosti [Extraction of causal relationships from the data of psychological research on the material of the study of aggressiveness]. Iskusstvennyi intellekt i prinyatie reshenii [Artificial intelligence and decision making]. 4: 3846.
  18. Samoilova E.M., Yusubalieva G.M., Belopasov V.V., Ekusheva E.V., Baklaushev V.P. 2021. Infektsii i vospalenie v razvitii insulta [Infection and inflammation in the development of stroke]. Zhurnal nevrologii i psikhiatrii im. S.S. Korsakova. Spetsvypuski [Journal of Neurology and Psychiatry. S. S. Korsakov. Special editions]. 121 (8): 1121.
  19. Donitova V.V. et al. 2021. Metody obrabotki estestvennogo yazyka dlya izvlecheniya faktorov riska insulta iz meditsinskikh tekstov [Natural language processing models for extraction of stroke risk factors from electronic health records]. Trudy Instituta sistemnogo analiza rossiyskoy akademii nauk [Proceedings of the Institute for Systems Analysis of the Russian Academy of Science]. 71 (4): 93.
  20. Blagosklonov N.A. et al. 2020. Lingvisticheskii analiz istorii bolezni dlya vyyavleniya faktorov riska insulta [Linguistic analysis of disease history for identifying stroke risk factors]. Trudy Instituta sistemnogo analiza rossiyskoy akademii nauk [Proceedings of the Institute for Systems Analysis of the Russian Academy of Science].70 (3): 7585.
  21. Nakayama H. Seqeval: A python framework for sequence labeling evaluation, Available at: https://github. com/chakki-works/seqeval (дата обращения 15.12.2022)
  22. Du X., McNamee R., Cruickshank K. 2000 Stroke risk from multiple risk factors combined with hypertension: a primary care based case-control study in a defined population of northwest England. Annals of Epidemiology. 10 (6): 380388
  23. Sebastian S., Stein L.K., Dhamoon M.S. 2019 Infection as a Stroke Trigger. Associations Between Different Organ System Infection Admissions and Stroke Subtypes. Stroke. 50: 2216 2218. doi: 10.1161/STROKEAHA.119.025872
  24. O’Donnell MJ, Chin SL, Rangarajan S, Xavier D, Liu L, Zhang H, et al. 2016. INTERSTROKE Investigators. Global and regional effects of potentially modifiable risk factors associated with acute stroke in 32 countries (INTERSTROKE): a case-control study. The Lancet. 388 (10046): 761775. doi: 10.1016/S0140-6736(16)30506-2
  25. Thiele I., Linseisen J., Heier M., Holle R., Kirchberger I., Peters A. et al. 2018 Time trends in stroke incidence and in prevalence of risk factors in Southern Germany, 1989 to 2008/09. Scientific Reports. 8 (1): 18. doi: 10.1038/s41598-018-30350-8
  26. Murakami K., Asayama K., Satoh M., Inoue R., Tsubota-Utsugi M. et al. 2017 Miki Hosaka Risk Factors for Stroke among Young-Old and Old-Old Community-Dwelling Adults in Japan: The Ohasama Study. Journal of atherosclerosis and thrombosis. 24: 290-300. doi: 10.5551/ jat.35766
  27. Usanova T.A. et al. 2020. Faktory riska ishemicheskogo insulta [Risk factors for ischemic stroke]. Sovremennye problemy nauki i obrazovaniya [Modern problems of science and education]. 2: 133.

补充文件

附件文件
动作
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».