🔧На сайте запланированы технические работы
25.12.2025 в промежутке с 18:00 до 21:00 по Московскому времени (GMT+3) на сайте будут проводиться плановые технические работы. Возможны перебои с доступом к сайту. Приносим извинения за временные неудобства. Благодарим за понимание!
🔧Site maintenance is scheduled.
Scheduled maintenance will be performed on the site from 6:00 PM to 9:00 PM Moscow time (GMT+3) on December 25, 2025. Site access may be interrupted. We apologize for the inconvenience. Thank you for your understanding!

 

Rna-seq contamination as a metatranscriptomic data for screening of plant pests and symbionts

Cover Page

Cite item

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription Access

Abstract

Background: Transcriptome sequencing data can contain up to 30 % contaminating reads. These may originate from laboratory contamination or biologically relevant sources, amenable to metatranscriptomics analysis.

Aim: To evaluate the utility of contaminating reads for large-scale screening of plant pests and symbionts.

Methods: We analyzed the data of RNA-seq experiments of rye (Secale cereale L.) including five in-house accessions and 50 public datasets from NCBI SRA archive. Reads with good mapping to the rye genome were filtered out, retaining putative contaminats for downstream analysis.

Results: After removing laboratory contaminants, we compared aphids, symbiotic fungi, bacteria and viruses across accessions. Symbiome-derived reads were reproducible in biological replicates and varied by location, condition, and plant species, enabling post-hoc metatranscriptomic analysis.

Conclusions: Contaminating reads correlated with field-observed species or expected symbionts. Distribution patterns across accessions support repurposing existing and future sequencing data to screen for plant pests, monitor symbiotic organisms, and plan eradication strategies amid global climate change.

About the authors

Pavel A. Zykin

Saint Petersburg State University

Email: pavel.zykin@spbu.ru
ORCID iD: 0000-0003-1624-6163
SPIN-code: 2730-5890

Cand. Sci. (Biology)

Russian Federation, 7–9 Universitetskaya emb., Saint Petersburg, 199034

Elena A. Andreeva

Saint Petersburg State University; Institute of General Genetics

Email: e.a.andreeva@spbu.ru
ORCID iD: 0000-0002-9326-3170
SPIN-code: 7269-8240

Cand. Sci. (Biology)

Russian Federation, 7–9 Universitetskaya emb., Saint Petersburg, 199034; 3 Gubkina st, Moscow, 117971

Natalia V. Tsvetkova

Saint Petersburg State University

Email: n.tswetkowa@spbu.ru
ORCID iD: 0000-0002-7353-1107
SPIN-code: 1687-5757

Cand. Sci. (Biology)

Russian Federation, 7–9 Universitetskaya emb., Saint Petersburg, 199034

Andrey N. Bulanov

Institute of General Genetics

Email: an.bulanov20002014@gmail.com
ORCID iD: 0009-0003-8092-9978
SPIN-code: 3791-9700
Russian Federation, 3 Gubkina st, Moscow, 117971

Anatoly V. Voylokov

Institute of General Genetics

Author for correspondence.
Email: av_voylokov@mail.ru
ORCID iD: 0000-0003-3423-8511

Dr. Sci. (Biology)

Russian Federation, 3 Gubkina st, Moscow, 117971

References

  1. Sangiovanni M, Granata I, Thind AS, Guarracino MR. From trash to treasure: detecting unexpected contamination in unmapped NGS data. BMC Bioinformatics. 2019;20:168. doi: 10.1186/s12859-019-2684-x
  2. Simion P, Belkhir K, François C, et al. A software tool ‘CroCo’ detects pervasive cross-species contamination in next generation sequencing data. BMC Biology. 2018;16:28. doi: 10.1186/s12915-018-0486-7
  3. Chen S, Zhou Y, Chen Y, Gu J. fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 2018;34(17):i884–i890. doi: 10.1093/bioinformatics/bty560
  4. Rabanus-Wallace MT, Hackauf B, Mascher M, et al. Chromosome-scale genome assembly provides insights into rye biology, evolution and agronomic potential. Nat Genet. 2021;53:564–573. doi: 10.1038/s41588-021-00807-0
  5. Bushnell B. BBMap: A fast, accurate, splice-aware aligner. USA: Department of Energy. Office of Science; 2014.
  6. Bushmanova E, Antipov D, Lapidus A, Prjibelski A.D. rnaSPAdes: a de novo transcriptome assembler and its application to RNA-Seq data. Gigascience. 2019;8(9):giz100. doi: 10.1093/gigascience/giz100
  7. NCBI Resource Coordinators. Database resources of the National Center for Biotechnology Information. Nucleic Acids Res. 2018;46(D1):D8–D13. doi: 10.1093/nar/gkx1095
  8. Wingett SW, Andrews S. FastQ Screen: A tool for multi-genome mapping and quality control. F1000Res. 2018;7:1338. doi: 10.12688/f1000research.15931.2
  9. Lafond-Lapalme J, Duceppe M-O, Wang S, et al. A new method for decontamination of de novo transcriptomes using a hierarchical clustering algorithm. Bioinformatics. 2017;33(9):1293–1300. doi: 10.1093/bioinformatics/btw793
  10. Chen Y, Singh A, Kaithakottil GG, et al. An aphid RNA transcript migrates systemically within plants and is a virulence factor. PNAS. 2020;117(23):12763–12771. doi: 10.1073/pnas.1918410117
  11. Salter SJ, Cox MJ, Turek EM, et al. Reagent and laboratory contamination can critically impact sequence-based microbiome analyses. BMC Biol. 2014;12:87. doi: 10.1186/s12915-014-0087
  12. Berim MN. The most harmful species of aphids in the north-west of Russia. Plant protection and quarantine. 2014;(9):29–30. EDN: SJYWIX
  13. van Kleeff PJM, Galland M, Schuurink RC, Bleeker PM. Small RNAs from Bemisia tabaci are transferred to Solanum lycopersicum phloem during feeding. Front Plant Sci. 2016;7:1759. doi: 10.3389/fpls.2016.01759
  14. Su Y-L, Li J-M, Li M, et al. Transcriptomic analysis of the salivary glands of an invasive whitefly. PLoS One. 2012;7(6):e39303. doi: 10.1371/journal.pone.0039303
  15. Ban L, Didon A, Jonsson LMV, et al. An improved detection method for the Rhopalosiphum padi virus (RhPV) allows monitoring of its presence in aphids and movement within plants. J Virol Methods. 2003;142(1–2): 136–142. doi: 10.1016/j.jviromet.2007.01.014
  16. Zhao S, Ye Z, Stanton R. Misuse of RPKM or TPM normalization when comparing across samples and sequencing protocols. RNA. 2020;26(8): 903–909. doi: 10.1261/rna.074922.120
  17. Zhao Y, Li M–C, Konaté MM, et al. TPM, FPKM, or normalized counts? A comparative study of quantification measures for the analysis of RNA-seq data from the NCI patient-derived models repository. J Transl Med. 2021;19:296. doi: 10.1186/s12967-021-02936-w
  18. Mukherjee A, Reddy MS. Metatranscriptomics: an approach for retrieving novel eukaryotic genes from polluted and related environments. 3 Biotech. 2020;10:71. doi: 10.1007/s13205-020-2057-1
  19. Shakya M, Lo C–C, Chain PSG. Advances and challenges in metatranscriptomic analysis. Front Genet. 2019;10:904. doi: 10.3389/fgene.2019.00904
  20. Barton HA, Taylor NM, Lubbers BR, Pemberton AC. DNA extraction from low-biomass carbonate rock: An improved method with reduced contamination and the low-biomass contaminant database. J Microbiol Methods. 2006;66(1):21–31. doi: 10.1016/j.mimet.2005.10.005
  21. Wally N, Schneider M, Thannesberger J, et al. Plasmid DNA contaminant in molecular reagents. Sci Rep. 2019;9:1652. doi: 10.1038/s41598-019-38733-1
  22. Weyrich LS, Farrer AG, Eisenhofer R, et al. Laboratory contamination over time during low-biomass sample analysis. Mol Ecol Resour. 2019;19(4):982–996. doi: 10.1111/1755-0998.13011
  23. Christensen GJM, Brüggemann H. Bacterial skin commensals and their role as host guardians. Benef Microbes. 2014;5(2):201–215. doi: 10.3920/BM2012.0062

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Supplement 1
Download (822KB)
3. Supplement 2
Download (1MB)
4. Supplement 3
Download (1MB)
5. Supplement 4
Download (1MB)
6. Supplement 5
Download (1MB)
7. Supplement 6
Download (874KB)

Copyright (c) 2025 Eco-Vector

License URL: https://eco-vector.com/for_authors.php#07
 


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».