Машинное обучение для диагностики заболеваний по полному профилю экспрессии генов

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Рассматривается использование машинного обучения для диагностики заболеваний, основанной на анализе полного профиля экспрессии генов, что отличает данную работу от других подходов, где необходимо проведение предварительного этапа, на котором производится поиск ограниченного числа релевантных генов (десятки и сотни генов). Проведены эксперименты с полными профилями генетической экспрессии (20 531 генов), полученными в результате обработки транскриптомов 801 пациента с известными онкологическими диагнозами (онкология легких, почек, молочной железы, простаты и толстой кишки). Использование индекстрона (индексной системы мгновенного обучения) по новому назначению, т.е. для обработки полных профилей экспрессии, обеспечило точность диаг ностирования, которая на 99,75 процентов совпала с результатами гистологической верификации.

Об авторах

А. М Михайлов

Институт проблем управления им. В.А. Трапезникова РАН

Email: alxmikh@gmail.com
Москва

М. Ф Каравай

Институт проблем управления им. В.А. Трапезникова РАН

Email: mkaravay@yandex.ru
Москва

В. А Сивцов

Институт проблем управления им. В.А. Трапезникова РАН

Email: thedege@yandex.ru
Москва

М. А Курникова

Национальный медицинский исследовательский центр детской гематологии, онкологии и иммунологии им. Дмитрия Рогачева

Автор, ответственный за переписку.
Email: mish2109@yandex.ru
Москва

Список литературы

  1. Khan J., Wei J., Ringner M. et al. Classification and diagnostic prediction of cancers using gene expression profiling and artificial neural networks // Nat Med. (2001). June 7(6): 673-9. https://doi.org/10.1038/89044
  2. Kumar A., Halder A. Greedy fussy vaguely quantified rough approach for cancer relevant gene selection from gene expression data // Soft Comput. 2022. V. 26. P. 13567-13581. https://doi.org/10.1007/s00500-022-07312-4
  3. Houssein E., Hassan H., Mustafa al-sayed et. al. Gene Selection for Microarray Cancer Classification based on Manta Rays Foraging Optimization and Support Vector Machines // Arabian Journal for Science and Engineering. 2022. V. 47. P. 2555-2572. https://doi.org/10/1007/s13369-021-06101-8
  4. Zheng Y., Sun Y., Kuai Y. et al. Gene expression profiling for the diagnosis of multiple primary malignant tumors // Cancer Cell Int. 2021. V. 21, Article no. 47. https://doi.org/10.1186/s12935-021-01748-8
  5. Ye Q., Wang Q., Qi P. et. al. Development and validation of a 90-gene real-time PCR assay for tumor origin identification // Symposium MXW, 2018.
  6. Joshi P., Dhar R. EpICC: A Bayesian neural network model with uncertainty correction for a more accurate classification of cancer // Sci. Rep 12, (2022). Article no. 14628. https://doi.org/10.1038/s41598-022-18874-6
  7. Steiling K., Christenson S. Tools for genetics and genomics: Gene expression profiling // UpToDate.(2021). Retrieved from https://www.uptodate.com/contents tools-for-genetics-and-genomics-gene-expression-profiling
  8. СПбГУ Научный парк. Система высокопроизводительного полногеномного секвенирования, 2023. https://researchpark.spbu.ru/equipment-biobank-rus/equipment-biobank-genom-rus/equipment-biobank-ngsseq-rus/1762-biobank-hiseq-2500-sequencing-system-rus
  9. IBM. What are neural networks? // Retrieved from https://www.ibm.com/cloud/learn/neural-networks
  10. Mikhailov A., Pok Y.M. Artificial Neural Cortex // Smart Engineer. Syst. Design. 2001. V. 11. ASME PRESS. N. Y. P. 113-120.
  11. Mikhailov A., Karavay M. Pattern Inversion as a Pattern Recognition Method for Machine Learning // Cornell University. 2021. Retrieved from https://arxiv.org/abs/2108.10242
  12. Brin S., Page L. The Anatomy of a large-scale hypertextual web search engine // Comput. Networks ISDN Syst. 1998. V. 30. Iss. 1-7. Stanford University, Stanford, CA, 94305, USA. Retrieved from https://doi.org/10.1016/S069-7552(98)00110-X
  13. Mikhailov A. Indextron // Artificial Neural Networks in Engineering Conf. (ANNIE 1998), St. Louis, Missouri, Nov. 4-7, 1998. Proceedings Vol. 8: ANNIE 1998, Publisher: ASME Press, ISBN: 0791800822
  14. Jones K. A statistical interpretation of term specificity and its application in retrieval // J. Document.: MCB Univer.: MCB Univer. Press, 2004. V. 60. No. 5. P. 493-502. ISSN 0022-0418
  15. Sivic J., Zisserman A. Efficient visual search of videos cast as text retrieval // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2009. V. 31. Issue 4. https://doi.org/10.1109/TPAMI.2008.111
  16. UCI. Machine learning repository // Retrieved from https://archive.ics.uci.edu/ml/datasets/gene+expression+cancer+RNA-Seq
  17. Mikhailov A., Karavay M. Indextron // Proceedings of the 10th International Conference on Pattern Recognition Application and Methods, 4-6 Feb 2021, Vienna, V.1-978-989-758-486-2. P. 143-149. https://doi.org/10.5220/0010180301430149

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Российская академия наук, 2023

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».