Классификация наличия злокачественных образований на маммограмме с помощью методов глубокого обучения

Обложка

Цитировать

Полный текст

Аннотация

Обоснование. Рак молочной железы — заболевание, которое является одной из основных причин смертности от рака у женщин [1]. Регулярный массовый скрининг, проводимый с помощью маммографии, играет важнейшую роль в заблаговременном выявлении изменений в тканях молочной железы. Однако начальные стадии патологии часто остаются незамеченными, и их сложно диагностировать [2].

Несмотря на эффективность маммографии в снижении смертности от рака молочной железы, ручной анализ изображений может занимать много времени и быть трудозатратным. Поэтому актуальны попытки автоматизировать этот процесс, например, с помощью систем автоматизированной диагностики (CAD) [3]. Однако в последние годы всё больший интерес вызывают решения на основе нейронных сетей, в частности в биологии и медицине [4–6]. Технологические достижения, использующие искусственный интеллект, уже показали свою эффективность в обнаружении патологий [7, 8].

Цель — создание автоматизированного решения для выявления рака молочной железы на маммограммах.

Материалы и методы. Решение реализовано следующим образом: разработан инструмент на основе глубокой нейронной сети, который позволяет по подаваемому на вход изображению получить вероятность наличия злокачественного образования. Для обучения модели был использован объединённый датасет из открытых наборов данных, таких как MIAS, CBIS-DDSM, INbreast, CMMD, KAU-BCMD, VinDr-Mammo [9–14].

Результаты. Модель классификации, основанная на архитектуре EfficentNet-B3, позволяет достичь при тесте на выборке из комбинированного набора данных до 0б95 по метрике площади под ROC-кривой, 0,88 Sensitivity и 0,9 Specificity. Благодаря обучению на изображениях из разных датасетов, отличающихся по качеству данных и региону получения, модель обладает высокой обобщающей способностью, что является ещё одним преимуществом. Кроме того, для повышения эффективности использовались такие методы, как предварительная обрезка изображений и аугментации в процессе обучения.

Заключение. Результаты экспериментов показали, что модель на высоком уровне достоверности может выявлять злокачественные образования. Полученные высокие метрики качества обеспечивают значительный потенциал для внедрения данного метода в автоматизированную диагностику, например, в качестве дополнительного мнения для медицинских специалистов.

Об авторах

Алишер Ахмад Угли Ибрагимов

Институт системного программирования имени В.П. Иванникова

Автор, ответственный за переписку.
Email: ibragimov@ispras.ru
ORCID iD: 0000-0002-4406-4562
SPIN-код: 3540-3992
Россия, Москва

Софья Андреевна Сенотрусова

Институт системного программирования имени В.П. Иванникова

Email: senotrusova@ispras.ru
ORCID iD: 0000-0003-0960-8920
SPIN-код: 4872-3388
Россия, Москва

Арсений Александрович Литвинов

Институт системного программирования имени В.П. Иванникова

Email: filashkov@ispras.ru
ORCID iD: 0009-0000-3561-3817
Россия, Москва

Александра Андреевна Беляева

Институт системного программирования имени В.П. Иванникова

Email: belyaeva.a@ispras.ru
Россия, Москва

Егор Николаевич Ушаков

Институт системного программирования имени В.П. Иванникова

Email: ushakov@ispras.ru
ORCID iD: 0000-0001-8370-6911
Россия, Москва

Юрий Витальевич Маркин

Институт системного программирования имени В.П. Иванникова

Email: ustas@ispras.ru
ORCID iD: 0000-0003-1145-5118
SPIN-код: 8440-9532
Россия, Москва

Список литературы

  1. Milroy M.J. Cancer statistics: Global and national. In: Quality Cancer Care: Survivorship Before, During and After Treatment. Hopewood P., Milroy M.J., editors. Springer, 2018.
  2. Mainiero MB, Moy L, Baron P, et al. ACR appropriateness criteria breast cancer screening // Journal of the American College of Radiology. 2017. Vol. 14, N 11S. P. S383–S390. doi: 10.1016/j.jacr.2017.08.044
  3. Elter M., Horsch A. CADx of mammographic masses and clustered microcalcifications: a review // Medical physics. 2009. Vol. 36, N 6. P. 2052–2068. doi: 10.1118/1.3121511
  4. Kegeles E, Naumov A, Karpulevich EA, Volchkov P, Baranov P. Convolutional neural networks can predict retinal differentiation in retinal organoids // Front. Cell. Neurosci. 2020. Vol. 14. P. 171. doi: 10.3389/fncel.2020.00171
  5. Ibragimov A, Senotrusova S, Markova K, et al. Deep semantic segmentation of angiogenesis images // Int. J. Mol. Sci. 2023. Vol. 24, N 2. doi: 10.3390/ijms24021102
  6. Naumov A., Ushakov E., Ivanov A., et al. EndoNuke: Nuclei detection dataset for estrogen and progesterone stained IHC endometrium scans // Data (Basel). 2022. Vol. 7, N 6. doi: 10.3390/data7060075
  7. Dembrower K, Wåhlin E, Liu Y, et al. Effect of artificial intelligence-based triaging of breast cancer screening mammograms on cancer detection and radiologist workload: a retrospective simulation study // The Lancet Digital Health. 2020. Vol. 2, N 9. P. e468–e474. doi: 10.1016/S2589-7500(20)30185-0
  8. Jiang Y., Edwards A.V., Newstead G.M. Artificial intelligence applied to breast MRI for improved diagnosis // Radiology. 2021. Vol. 298, N 1. P. 38–46. doi: 10.1148/radiol.2020200292
  9. Suckling J. The mammographic image analysis society digital mammogram database // Exerpta Medica International Congress. 1994. Vol. 1069. P. 375–378.
  10. Lee RS, Gimenez F, Hoogi A, et al. A curated mammography data set for use in computer-aided detection and diagnosis research // Sci. Data. 2017. Vol. 4. P. 170177. doi: 10.1038/sdata.2017.177
  11. Moreira IC, Amaral I, Domingues I, et al. INbreast: toward a full-field digital mammographic database // Acad. Radiol. 2012. Vol. 19, N 2. P. 236–248. doi: 10.1016/j.acra.2011.09.014
  12. Cui C., Li L., Cai H., et al. The Chinese mammography database (CMMD): An online mammography database with biopsy confirmed types for machine diagnosis of breast // Data Cancer Imaging Arch. 2021. doi: 10.7937/tcia.eqde-4b16
  13. Alsolami AS, Shalash W, Alsaggaf W, et al. King abdulaziz university breast cancer mammogram dataset (KAU-BCMD) // Data Basel. 2021. Vol. 6, N 11. P. 111. doi: 10.3390/data6110111
  14. Nguyen HT, Nguyen HQ, Pham HH, et al. VinDr-Mammo: A large-scale benchmark dataset for computer-aided diagnosis in full-field digital mammography // Sci. Data. 2023. Vol. 10, N 1. P. 277. doi: 10.1038/s41597-023-02100-7

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Эко-вектор, 2024

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».