Статистический анализ причинно-следственных связей

Обложка

Цитировать

Полный текст

Аннотация

Рассмотрена проблема выявления детерминированных причинно-следственных связей, изначально скрытых в накопленных эмпирических данных. Для выявления таких связей использовались статистические методы. Предложена простая математическая модель причинно-следственных отношений, в рамках которой описано несколько моделей причинно-следственных связей в данных - для простейших отношений между причиной и следствием, для многих следствий одной причины, а также для цепей причинно-следственных связей (так называемых транзитивных причин). Сформулированы оценки, позволяющие с помощью теоремы Муавра-Лапласа определить параметры модели, связывающие события в испытаниях полиномиальной схемы. Обоснованы утверждения об однозначной идентификации причинно-следственных связей, которые восстанавливаются по накопленным данным. Обсуждаются возможности использования таких схем анализа данных в задачах медицинской диагностики и кибербезопасности.

Об авторах

А. А. Грушо

Федеральный исследовательский центр «Информатика и управление» РАН; Российский университет дружбы народов

Автор, ответственный за переписку.
Email: grusho@yandex.ru
ORCID iD: 0000-0003-4400-2158

Principal scientist, Institute of Informatics Problems, Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences; professor of Department of Probability Theory and Cyber Security of Peoples’ Friendship University of Russia named after Patrice Lumumba

ул. Вавилова, д. 44, стр. 2, Москва, 119133, Российская Федерация; ул. Миклухо-Маклая, д. 6, Москва, 117198, Российская Федерация

Н. А. Грушо

Федеральный исследовательский центр «Информатика и управление» РАН

Email: info@itake.ru
ORCID iD: 0000-0002-5005-2744

Candidate of Physical and Mathematical Sciences, Senior scientist, Institute of Informatics Problems, Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences

ул. Вавилова, д. 44, стр. 2, Москва, 119133, Российская Федерация

М. И. Забежайло

Федеральный исследовательский центр «Информатика и управление» РАН

Email: m.zabezhailo@yandex.ru
ORCID iD: 0000-0002-5067-5909

Professor, Doctor of Physical and Mathematical Sciences, Principal scientist, Institute of Informatics Problems, Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences

ул. Вавилова, д. 44, стр. 2, Москва, 119133, Российская Федерация

К. Е. Самуйлов

Российский университет дружбы народов

Email: samuylovke@rudn.ru
ORCID iD: 0000-0002-6368-9680

Professor, Doctor of Technical Sciences, Head of the Department of Probability Theory and Cyber Security of Peoples’ Friendship University of Russia named after Patrice Lumumba

ул. Миклухо-Маклая, д. 6, Москва, 117198, Российская Федерация

Е. Е. Тимонина

Федеральный исследовательский центр «Информатика и управление» РАН; Российский университет дружбы народов

Email: eltimon@yandex.ru
ORCID iD: 0000-0002-6493-3622

Professor, Doctor of Technical Sciences, Leading scientist, Institute of Informatics Problems, Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences; professor of Department of Probability Theory and Cyber Security of Peoples’ Friendship University of Russia named after Patrice Lumumba

ул. Вавилова, д. 44, стр. 2, Москва, 119133, Российская Федерация; ул. Миклухо-Маклая, д. 6, Москва, 117198, Российская Федерация

Список литературы

  1. Zhang, X., Hu, W. & Yang, F. Detection of Cause-Effect Relations Based on Information Granulation and Transfer Entropy. Entropy 24, 212. doi: 10.3390/e24020212 (2022).
  2. Reimer, J., Wang, Y., Laridi, S., Urdich, J., Wilmsmeier, S. & Palmer, G. Identifying cause-andeffect relationships of manufacturing errors using sequence-to-sequence learning. Scientific Reports 12, 22332. doi: 10.1038/s41598-022-26534-y (2022).
  3. Pearl, J. Causal Inference in Proceedings of Workshop on Causality: Objectives and Assessment at NIPS 2008 (eds Guyon, I., Janzing, D. & Schölkopf, B.) 6 (PMLR, Whistler, Canada, Dec. 2010), 39-58.
  4. Pearl, J. The mathematics of causal inference in Joint Statistical Meetings Proceedings. ASA (2013), 2515-2529.
  5. Yao, L., Chu, Z., Li, S., Li, Y., Gao, J. & Zhang, A. A Survey on Causal Inference. ACM Transactions on Knowledge Discovery from Data 15, 1-46. doi: 10.1145/3444944 (2021).
  6. Höfler, M. Causal inference based on counterfactuals. BMC Medical Research Methodology 5, 1- 28. doi: 10.1186/1471-2288-5-28 (2005).
  7. Richens, J. G., Lee, C. M. & Johri, S. Improving the accuracy of medical diagnosis with causal machine learning. Nature Communications 11, 3923. doi: 10.1038/s41467-020-17419-7 (2020).
  8. Grusho, A. A., Grusho, N. A. & Timonina, E. E. Root Cause Anomaly Localization [Lokalizatsiya iskhodnoy prichiny anomalii]. Information Security Problems. Computer Systems. in Russian, 9- 16 (2020).
  9. Smirnov, D. V. Methodology of problem-oriented Big Data analysis in limited time mode [Metodika problemno-orientirovannogo analiza Big Data v rezhime ogranichennogo vremeni]. International Journal of Open Information Technologies 9. in Russian, 88-94 (2021).
  10. Grusho, A., Grusho, N., Zabezhailo, M. & Timonina, E. Evaluation of Trust in ComputerComputed Results in Distributed Computer and Communication Network (eds Vishnevskiy, V. M., Samouylov, K. E. & Kozyrev, D. V.) (Springer International Publishing, Cham, 2022), 420-432. doi: 10.1007/978-3-030-97110-6_33.
  11. Guyatt, G. etal. Evidence-Based Medicine: A New Approach toTeaching the Practice of Medicine. JAMA 268, 2420-2425. doi: 10.1001/jama.1992.03490170092032 (Nov. 1992).
  12. Shiryaev, A. N. Probability [Veroyatnost’] in Russian. 521 pp. (MTsNMO, Moscow, 2004).
  13. Grusho, A., Grusho, N. & Timonina, E. Method of Several Information Spaces for Identification of Anomalies in Intelligent Distributed Computing XIII (eds Kotenko, I., Badica, C., Desnitsky, V., El Baz, D. & Ivanovic, M.) (Springer International Publishing, Cham, 2020), 515-520. doi:10. 1007/978-3-030-32258-8_60.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».