Кодирование с помощью сокращенного аминокислотного алфавита и его влияние на моделирование антигенной эволюции гриппа

Обложка

Цитировать

Полный текст

Аннотация

В настоящее время, вакцинация является одним из наиболее эффективных способов контроля и профилактики гриппозной инфекции. Производство вакцин в основном зависит от результатов лабораторных анализов, включая анализ реакции торможения гемагглютинации и микронейтрализации, которые требуют много времени и труда. Вирусы могут избегать иммунного ответа, что приводит к необходимости пересмотра и обновления вакцин два раза в год. Анализ реакции торможения гемагглютинации позволяет измерить, насколько эффективно антитела против эталонного штамма связывают и блокируют антиген испытуемого штамма. Для оптимизации выбора вакцинного штамма-кандидата были разработаны различные компьютерные модели. Одной из общих проблем в моделировании антигенной эволюции является представление генетических последовательностей для ввода в исследовательскую модель. Наша мотивация связана с хорошо известной проблемой кодирования генетической информации для моделирования антигенной эволюции. В данной работе представлен двухэтапный подход к кодированию, основанный на сокращенных аминокислотных алфавитах и базах данных аминокислотных индексов под названием AAindex. Мы предлагаем использовать упрощенные аминокислотные алфавиты для моделирования антигенной эволюции. Упрощенный алфавит, также называемый субалфавитом или сокращенным аминокислотным алфавитом, это алфавит, в котором 20 аминокислот разделены на группы. Предложенное кодирование позволяет переопределить мутации в терминах групп аминокислот, расположенных в сокращенном алфавите. Мы исследовали 40 сокращенных алфавитов и их эффективность при моделировании антигенной эволюции. Результаты экспериментов показывают, что предложенные сокращенные аминокислотные алфавиты могут достичь показателей стандартного алфавита по точности. Более того, эти алфавиты позволяют лучше понять взаимосвязь между мутациями и антигенными изменениями с различных точек зрения. Проверив полученные высокоэффективные сайты в исследовательской базе данных гриппа (Influenza Research Database), мы обнаружили, что не только антигенные сайты оказывают значительное влияние на антигенность, но и их соседние аминокислоты. Результаты показывают, что все выбранные неантигенные участки связаны с иммунным ответом. Согласно исследовательской базе данных гриппа, экспериментально установлено, что это эпитопы Т-клеток, эпитопы В-клеток и MHC-связывающие эпитопы различных классов. Это подчеркивает значимость того, что: при моделировании антигенной эволюции модель должна учитывать не только генетическую информацию антигенных участков, но и генетическую информацию соседних позиций, поскольку они могут косвенно влиять на антигенность. Кроме того, наши результаты показывают, что, в соответствии с предыдущими исследованиями, структурные и зарядовые характеристики аминокислот являются наиболее значимыми при моделировании антигенной эволюции.

Об авторах

М. Форгани

ФГБУН Институт математики и механики им. Н.Н. Красовского Уральского отделения Российской академии наук

Автор, ответственный за переписку.
Email: majid.forqani@gmail.com

к.ф.-м.наук, научный сотрудник

Россия, Екатеринбург

А. Л. Фирстков

ФГБУН Институт математики и механики им. Н.Н. Красовского Уральского отделения Российской академии наук

Email: firstk121@gmail.com

математик первой категории

Россия, Екатеринбург

М. M. Аляннеджади

Университет науки и технологии Мазандарана

Email: alyan.nezhadip@mazust.ac.ir

к.комп.н. (специальность: искусственный интеллект), доцент, научный сотрудник и преподаватель

Иран, Бехшехр

Д. М. Даниленко

ФГБУ НИИ гриппа имени А.А. Смородинцева Минздрава России

Email: daria.baibus@gmail.com

к.б.н., зам. директора по научной работе, руководитель отдела этиологии и эпидемиологии

Россия, Санкт-Петербург

А. Б. Комиссаров

ФГБУ НИИ гриппа имени А.А. Смородинцева Минздрава России

Email: a.b.komissarov@gmail.com

зав. лабораторией молекулярной вирусологии

Россия, Санкт-Петербург

Список литературы

  1. Andersen C.A., Brunak S. Representation of protein-sequence information by amino acid subalphabets. AI Magazine, 2004, vol. 25, no. 1, pp. 97–101. doi: 10.1609/aimag.v25i1.1750
  2. Arinaminpathy N., Grenfell B. Dynamics of glycoprotein charge in the evolutionary history of human influenza. PLoS One, 2010, vol. 5, no. 12: e15674. doi: 10.1371/journal.pone.0015674
  3. Berman H.M., Westbrook J., Feng Z., Gilliland G., Bhat T.N., Weissig H., Shindyalov I.N., Bourne P.E. The protein data bank. Nucleic Acids Res., 2000, vol. 28, no. 1, pp. 235–242. doi: 10.1093/nar/28.1.235
  4. Burns A., Van der Mensbrugghe D., Timmer H. Evaluating the economic consequences of avian influenza. World Bank Washington, DC, 2006. 6 p.
  5. Cannata N., Toppo S., Romualdi C., Valle G. Simplifying amino acid alphabets by means of a branch and bound algorithm and substitution matrices. Bioinformatics, 2002, vol. 18, no. 8, pp. 1102–1108. doi: 10.1093/bioinformatics/18.8.1102
  6. Cui H., Wei X., Huang Y., Hu B., Fang Y., Wang J. Using multiple linear regression and physicochemical changes of amino acid mutations to predict antigenic variants of influenza A/H3N2 viruses. Biomed Mater. Eng., 2014, vol. 24, no. 6, pp. 3729–3735. doi: 10.3233/BME-141201
  7. De Brevern A.G. New assessment of a structural alphabet. In Silico Biol., 2005, vol. 5, no. 3, pp. 283–289.
  8. Edgar R.C. Local homology recognition and distance measures in linear time using compressed amino acid alphabets. Nucleic Acids Res., 2004, vol. 32, no. 1, pp. 380–385. doi: 10.1093/nar/gkh180
  9. Etchebest C., Benros C., Bornot A., Camproux A.C., De Brevern A.G. A reduced amino acid alphabet for understanding and designing protein adaptation to mutation. Eur. Biophys. J., 2007, vol. 36, no. 8, pp. 1059–1069. doi: 10.1007/s00249-007-0188-5
  10. Forghani M., Khachay M. Convolutional neural network based approach to in silico non-anticipating prediction of antigenic distance for influenza virus. Viruses, 2020, vol. 12, no. 9: 1019. doi: 10.3390/v12091019
  11. Forghani M., Khachay M., AlyanNezhadi M.M. The impact of amino acid encoding on the prediction of antigenic variants. In: 2020 6th Iranian Conference on Signal Processing and Intelligent Systems (ICSPIS), pp. 1–5, 2020. doi: 10.1109/ICSPIS51611.2020.9349560
  12. Gamblin S.J., Haire L.F., Russell R.J., Stevens D.J., Xiao B., Ha Y., Vasisht N., Steinhauer D.A., Daniels R.S., Elliot A., Wiley D.C., Skehel J.J. The structure and receptor binding properties of the 1918 influenza hemagglutinin. Science, 2004, vol. 303, no. 5665, pp. 1838–1842. doi: 10.1126/science.1093155
  13. Gregory V., Harvey W., Daniels R.S., Reeve R., Whittaker L., Halai C., Douglas A., Gonsalves R., Skehel J.J., Hay A.J., McCauley J.W., Haydon D. Human former seasonal Influenza A (H1N1) haemagglutination inhibition data 1977–2009 from the WHO Collaborating Centre for Reference and Research on Influenza, London, UK. University of Glasgow, 2016. doi: 10.5525/gla.researchdata.289
  14. Huang Z.Z., Yu L., Huang P., Liang L.J., Guo Q. Charged amino acid variability related to N-glyco-sylation and epitopes in A/H3N2 influenza: hem-agglutinin and neuraminidase. PLoS One, 2017, vol. 12, no. 7: e0178231. doi: 10.1371/journal.pone.0178231
  15. Kawashima S., Pokarowski P., Pokarowska M., Kolinski A., Katayama T., Kanehisa M. AAindex: amino acid index database, progress report 2008. Nucleic Acids Res., 2007, vol. 36, suppl. 1, pp. D202–D205. doi: 10.1093/nar/gkm998
  16. Klingen T.R., Reimering S., Guzmán C.A., McHardy A.C. In silico vaccine strain prediction for human influenza viruses. Trends Microbiol., 2018, vol. 26, no. 2, pp. 119–131. doi: 10.1016/j.tim.2017.09.001
  17. Kobayashi Y., Suzuki Y. Compensatory evolution of net-charge in influenza A virus hemagglutinin. PLoS One, 2012, vol. 7, no. 7: E40422. doi: 10.1371/journal.pone.0040422
  18. Lee M.S., Chen J.S.E. Predicting antigenic variants of influenza A/H3N2 viruses. Emerg. Infect. Dis., 2004, vol. 10, no. 8, pp. 1385–1390. doi: 10.3201/eid1008.040107
  19. Lenckowski J., Walczak K. Simplifying amino acid alphabets using a genetic algorithm and sequence alignment. In: European Conference on Evolutionary Computation, Machine Learning and Data Mining in Bioinformatics, 2007, pp. 122–131. doi: 10.1007/978-3-540-71783-6_12
  20. Li T., Fan K., Wang J., Wang W. Reduction of protein sequence complexity by residue grouping. Protein Eng., 2003, vol. 16, no. 5, pp. 323–330. doi: 10.1093/protein/gzg044
  21. Nanni L., Lumini A. A genetic approach for building different alphabets for peptide and protein classification. BMC Bioinformatics, 2008, vol. 9, no. 1, pp. 1–10. doi: 10.1186/1471-2105-9-45
  22. Pedregosa F., Varoquaux G., Gramfort A., Michel V., Thirion B., Grisel O., Blondel M., Prettenhofer P., Weiss R., Dubourg V., Vanderplas J., Passos A., Cournapeau D., Brucher M., Perrot M., Duchesnay É. Scikit-learn: machine learning in Python. J. Mach. Learn Res., 2011, vol. 12, pp. 2825–2830.
  23. Prlić A., Domingues F.S., Sippl M.J. Structure-derived substitution matrices for alignment of distantly related sequences. Protein Eng., 2000, vol. 13, no. 8, pp. 545–550. doi: 10.1093/protein/13.8.545
  24. Qiu J., Qiu T., Yang Y., Wu D., Cao Z. Incorporating structure context of HA protein to improve antigenicity calculation for influenza virus A/H3N2. Sci. Rep., 2016, vol. 6, no. 1, pp. 1–9. doi: 10.1038/srep31156
  25. Risler J.L., Delorme M.O., Delacroix H., Henaut A. Amino acid substitutions in structurally related proteins a pattern recognition approach: determination of a new and efficient scoring matrix. J. Mol. Biol., 1988, vol. 204, no. 4, pp. 1019–1029. doi: 10.1016/0022-2836(88)90058-7
  26. Schrödinger L.L.C. The PyMOL molecular graphics system, version 1.8, 2015.
  27. Smith D.J., Forrest S., Ackley D.H., Perelson A.S. Variable efficacy of repeated annual influenza vaccination. Proc. Natl. Acad. Sci. USA, 1999, vol. 96, no. 24, pp. 14001–14006. doi: 10.1073/pnas.96.24.14001
  28. Smith D.J., Lapedes A.S., De Jong J.C., Bestebroer T.M., Rimmelzwaan G.F., Osterhaus A.D., Fouchier R.A. apping the antigenic and genetic evolution of influenza virus. Science, 2004, vol. 305, no. 5682, pp. 371–376. doi: 10.1126/science.1097211
  29. Stephenson J.D., Freeland S.J. Unearthing the root of amino acid similarity. J. Mol. Evol., 2013, vol. 77, no. 4, pp. 159–169. doi: 10.1007/s00239-013-9565-0
  30. Su S., Fu X., Li G., Kerlin F., Veit M. Novel influenza D virus: epidemiology, pathology, evolution and biological characteristics. Virulence, 2017, vol. 8, no. 8, pp. 1580–1591. doi: 10.1080/21505594.2017.1365216
  31. Sylte M.J., Suarez D.L. Influenza neuraminidase as a vaccine antigen. In: Vaccines for Pandemic Influenza. Current Topics in Microbiology and Immunology. Eds.: R. Compans, W. Orenstein. Vol. 333. Berlin, Heidelberg: Springer, 2009, pp. 227–241. doi: 10.1007/978-3-540-92165-3_12
  32. Tomii K., Kanehisa M. Analysis of amino acid indices and mutation matrices for sequence comparison and structure prediction of proteins. Protein Eng., 1996, vol. 9, no. 1, pp. 27–36. doi: 10.1093/protein/9.1.27
  33. Tzarum N., de Vries R.P., Peng W., Thompson A.J., Bouwman K.M., McBride R., Yu W., Zhu X., Verheije M.H., Paulson J.C., Wilson I.A. The 150-loop restricts the host specificity of human H10N8 influenza virus. Cell Rep., 2017, vol. 19, no. 2, pp. 235–245. doi: 10.1016/j.celrep.2017.03.054
  34. Wang P., Zhu W., Liao B., Cai L., Peng L., Yang J. Predicting influenza antigenicity by matrix completion with antigen and antiserum similarity. Front. Microbiol., 2018, vol. 9: 2500. doi: 10.3389/fmicb.2018.02500
  35. Wikramaratna P.S., Sandeman M., Recker M., Gupta S. The antigenic evolution of influenza: drift or thrift? Philos Trans. R. Soc. Lond. B Biol. Sci., 2013, vol. 368, no. 1614: 20120200. doi: 10.1098/rstb.2012.0200
  36. World Health Organization. Influenza fact sheet: Overview = Aide-mémoire sur la grippe: Généralités. Weekly Epidemiological Record = Relevé épidémiologique hebdomadaire, 2003, vol. 78, no. 11, pp. 77–80.
  37. Yang H., Carney P.J., Chang J.C., Guo Z., Villanueva J.M., Stevens J. Structure and receptor binding preferences of recombinant human A (H3N2) virus hemagglutinins. Virology, 2015, vol. 477, pp. 18–31. doi: 10.1016/j.virol.2014.12.024
  38. Yang X.Y., Shi X.H., Meng X., Li X.L., Lin K., Qian Z.L., Feng K.Y., Kong X.Y., Cai Y.D. Classification of transcription factors using protein primary structure. Protein Pept. Lett., 2010, vol. 17, no. 7, pp. 899–908. doi: 10.2174/092986610791306670
  39. Yao Y., Li X., Liao B., Huang L., He P., Wang F., Yang J., Sun H., Zhao Y., Yang J. Predicting influenza antigenicity from Hemagglutintin sequence data based on a joint random forest method. Sci. Rep., 2017, vol. 7, no. 1, pp. 1–10. doi: 10.1038/s41598-017-01699-z
  40. Zhang Y., Aevermann B.D., Anderson T.K., Burke D.F., Dauphin G., Gu Z., He S., Kumar S., Larsen C.N., Lee A.J., Li X., Macken C., Mahaffey C., Pickett B.E., Reardon B., Smith T., Stewart L., Suloway C., Sun G., Tong L., Vincent A.L., Walters B., Zaremba S., Zhao H., Zhou L., Zmasek C., Klem E.B., Scheuermann R.H. Influenza Research Database: an integrated bioinformatics resource for influenza virus research. Nucleic Acids Res., 2017, vol. 45, no. D1, pp. D466–D474. doi: 10.1093/nar/gkw857
  41. Zhang Z.H., Wang Z.H., Zhang Z.R., Wang Y.X. A novel method for apoptosis protein subcellular localization prediction combining encoding based on grouped weight and support vector machine. FEBS Lett., 2006, vol. 580, no. 26, pp. 6169–6174. doi: 10.1016/j.febslet.2006.10.017
  42. Zuo Y.C., Li Q.Z. Using reduced amino acid composition to predict defensin family and subfamily: integrating similarity measure and structural alphabet. Peptides, 2009, vol. 30, no. 10, pp. 1788–1793. doi: 10.1016/j.peptides.2009.06.032

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Общая схема вычислительного конвейера

Скачать (178KB)
3. Рисунок 2. Генерация базы данных псевдо-AAindex1 из индекса гидрофобности.

Скачать (94KB)
4. Рисунок 5. Объяснение коэффициентов дисперсии для компонентов анализа PCA

Скачать (37KB)
5. Рис. 3. Визуализация объектов с высоким уровнем воздействия на поверхность белка гемагглютинина методом PyMOL [26]

Скачать (266KB)
6. Рисунок 4. Корреляционная матрица 11 уникальных AAindex1 записи из таблицы 5

Скачать (115KB)

© Форгани М., Фирстков А.Л., Аляннеджади М.M., Даниленко Д.М., Комиссаров А.Б., 2022

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».