Participation of chicken GGAAA repeat in sex differentiation
- Authors: Saifitdinova A.F.1,2, Zhukova A.A.1,3
-
Affiliations:
- Herzen State Pedagogical University of Russia
- St. Petersburg University
- Russian Federal Research Institute of Fisheries and oceanography
- Issue: Vol 55, No 2 (2024)
- Pages: 47-52
- Section: Original study articles
- URL: https://journal-vniispk.ru/0475-1450/article/view/280945
- DOI: https://doi.org/10.31857/S0475145024020015
- EDN: https://elibrary.ru/MDPCTC
- ID: 280945
Cite item
Full Text
Abstract
Tandem repeating elements that form extended polypurine/polypyrimidine tract sequences have been found in the genomes of various species. Their structural properties bend the DNA helix and cause a transition to non-canonical DNA secondary structures. The modern scientific literature describes many examples of the involvement of such elements in the regulation of gene expression and the formation of alternative transcripts in cells of different types of differentiation (Matos-Rodrigues et al., 2023). Previously, we described the (GGAAA)n repeating element of chicken (Gallus gallus domesticus), which is predominantly localized on the sex chromosome W and makes up about 1% of the female genome (Komissarov et al., 2018). Here we describe the localization peculiarities of this tandem repeat in the chicken genome within autosomes and the sex chromosome Z. The study identified a number of genes carrying tandemly repeated (GGAAA)n elements within non-coding transcribed regulatory regions that can influence expression intensity and the formation of alternative transcripts. Functional characterization of genes carrying stacks of (GGAAA)n allowed us to suggest the involvement of these tandem repeats in regulating the differential activity of genes important for the development of sexual dimorphism traits in chicken.
Full Text
ВВЕДЕНИЕ
Для птиц характерно наличие генетического механизма определения пола с системой половых хромосом ZW, при которой самки гетерогаметны, а самцы гомогаметны. В ходе эволюции нерекомбинирующие участки W-хромосомы птиц подверглись значительной деградации и накоплению повторяющихся элементов (Komissarov et al., 2018), однако, в отличие от млекопитающих, гетероморфная половая хромосома у птиц сохранила небольшое число генов, причем все они имеют биаллельную экспрессию в широком спектре взрослых и эмбриональных тканей и чувствительны к сокращению дозы гена (Bellott et al., 2017). Пол у всех изученных видов птиц определяется генетически, но в составе половых хромосом не найдено конкретных генов — инвариантных переключателей типа половой дифференцировки, подобно SRY у млекопитающих (Bellott et al., 2017).
Ранее нами описан повторяющийся элемент (GGAAA)n, который у курицы локализуется преимущественно в виде двух протяженных блоков на обоих плечах половой хромосомы W и составляет около 1% генома (Komissarov et al., 2018). В эукариотических геномах гомопуриновые последовательности составляют значительную часть простых повторяющихся последовательностей ДНК, они часто встречаются в регуляторных областях генов. Помимо этого, протяженные полипуриновые/полипиримидиновые непрерывные последовательности обнаружены в местах рекомбинации, в точках начала репликации и внутри различных типов мобильных элементов, включая временно встраивающихся в геном последовательности вирусов (Matos-Rodrigues et al., 2023). Особенность организации таких элементов способствует увеличению их копийности в составе нерекомбинирующей половой хромосомы. Транскрипция повторяющихся элементов, в состав которых входят комплементарные регуляторным районам последовательности, создает предпосылки для вовлечения их в регуляцию экспрессии генов. Механизм регуляции может быть основан как на связывании белков с неканоническими структурами ДНК и РНК, так и быть опосредован некодирующими РНК, оказывающими влияние на конформационные изменения нуклеиновых кислот (Matos-Rodrigues et al., 2023).
Получены свидетельства того, что локализованный на половой хромосоме W повтор (GGAAA)n транскрибируется в соматических клетках, однако значение этой транскрипции пока не установлено (Komissarov et al., 2018). Ранее повторяющийся элемент (GGAAA)n был описан в регулируемом промоторе гена овотрансферрина у фазана (Maroteaux et al. 1983). У курицы наличие тандемного повтора (GGAAA)n было описано в промоторе гена промежуточных нейрофиламентов, транскрипция которого может изменяться под влиянием стимуляции, причем было показано, что изменение числа повторов в составе промотора влияет на его активацию (Zopf et al., 1990). Мы выдвинули предположение, что повторы (GGAAA)n, транскрибирующиеся с протяженных блоков на хромосоме W, могут участвовать в половой дифференцировке у курицы посредством взаимодействия с комплементарными короткими блоками тандемных повторов в составе регуляторных областей генов. Мы выявили последовательности тандемных повторов (GGAAA)n в актуальной версии сборки генома курицы и проанализировали их потенциальное влияние на дифференцировку признаков, специфичных для представителей разного пола.
МАТЕРИАЛЫ И МЕТОДЫ
Для проведения исследования были использованы данные сборки генома курицы (Gallus gallus, Linnaeus, 1758) GRCg6a (GenBank accession: GCF_000002315.6). Эта сборка содержит информацию о последовательностях половых хромосом Z и W, а также 33 аутосом из 38 имеющихся в геноме курицы. Для определения локализации повторов на хромосомах мы использовали программное обеспечение Unipro UGENE (Version 35, Unipro, Новосибирск, Россия). Для функциональной характеристики генов использовали данные из базы данных GeneCards (Version 5.22.0, Weizmann Institute of Science, Реховот, Израиль), дополнительно информация об их белковых продуктах была проанализирована с помощью аннотированной базы данных белков UNIPROT (The UniProt Consortium: EMBL-EBI, SIB, PIR). Для поиска молекулярного взаимодействия и биологических путей использовали плагин StringApp (Version 1.6.0) для платформы Cytoscape (Version: 3.8.1, Cytoscape Consortium).
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
В геноме курицы (сборка GRCg6a (GCF_000002315.6)) тандемные блоки (GGAAA)n в количестве 7 и более копий были найдены в составе транскрибируемых некодирующих последовательностей 67 генов (Табл. 1). Из них 55 генов входят в состав аутосом (1, 2, 3, 4, 5, 6, 9, 15, 20, 22, 27, 28, 31) и 12 — в состав половой хромосомы Z. Среди них гены Robo2, Sh3gl2, Slit2, Zmiz1, экспрессия которых чувствительна к уровню половых гормонов. Активность генов Lrrc4c и Nrxn1 критична для роста фолликулов в яичниках, а продукты генов Csmd3, Csmd1 и Rorb участвуют в формировании яйца. Продукт гена Grik1 регулирует на уровне центральной нервной системы откладку яиц. Подавляющее большинство интерстициальных коротких блоков повтора (GGAAA)n были выявлены в составе первых интронов генов, кодирующих трансмембранные белки, которые участвуют в синаптической передаче и вовлечены в процессы обучения, пения и реализации агрессивного поведения. Присутствие протяженных участков полипуриновых/полипиримидиновых непрерывных последовательностей, состоящих из тандемно повторенного мономера (GGAAA)n, может модулировать активность промотров или переключать транскрипцию на альтернативные промоторы, приводя к образованию белков разной длины, что особенно важно для регуляции активности трансмембранных рецепторов.
Таблица 1. Локализация тандемного повтора (GGAAA)n в геноме курицы GRCg6a
Хромосома | Ген | Район | Число копий | Характеристика белка |
1 | Aff3 | 3 интрон | 27 | транскрипционный фактор |
1 | Atp7b | 1 интрон | 36 | медь-транспортирующая АТФаза |
1 | Bmx | 8 интрон | 26, 21, 18, 16 | тирозиновая протеинкиназа |
1 | Cd101 | 10 интрон | 11 | сигнальный белок мембраны |
1 | Clybl | 7 интрон | 44 | цитрамалил-КоА-лиаза |
1 | Dram1 | 3’ область | 14 | модулятор аутофагии |
1 | Gja8 | 2 интрон | 40 | коннексин |
1 | Gpc5 | 6 интрон | 34, 15, 14, 13 | сигнальный белок мембраны |
1 | Grik1 | 1 интрон | 30 | глутаматергический белок |
1 | Grm5 | 2 интрон | 31 | глутаматергический белок |
1 | Immp2l | 5 интрон | 46 | пептидаза внутренней мембраны митохондрий |
1 | Magi2 | 16 интрон | 34, 31, 17 | мембранная гуанилат-киназа |
1 | Mpzl1 | 4 интрон | 11 | миелиновый мембранный белок |
1 | Nbea | 30 интрон | 51 | интегральный белок везикул |
1 | Pcdh9 | 2 интрон | 38 | кадгерин |
1 | Robo2 | 1 интрон | 26 | сигнальный белок мембраны |
1 | Tmprss15 | 16 интрон | 70 | мембранная сериновая протеаза |
1 | Vwf | 21 интрон | 22 | гликопротеин |
1 | Zpld1 | 1 интрон | 41 | гликопротеин |
2 | Adarb2 | 1 интрон | 40 | аденозиновая деаминаза |
2 | Amph | 16 интрон | 34, 30, 21 | белок везикулярных мембран |
2 | Cdh19 | 2 интрон | 29 | кадгерин |
2 | Cntnap2 | 1 интрон | 33 | нейрексин |
2 | Cubn | 37 интрон | 21 | сигнальный белок мембраны |
2 | Dip2c | 4 интрон | 31 | регуляторный белок |
2 | Dlgap1 | 2 интрон | 15 | компонент глутаматергического синапса |
2 | Frk | 1 интрон | 21 | тирозиновая киназа |
2 | Npsr1 | 1 интрон | 21 | трансмембранный рецептор |
2 | Nrn1 | 2 интрон | 45 | сигнальный белок мембраны |
2 | Ppp1r9a | 6 интрон | 25 | мембранная фосфатаза |
2 | Tsnare1 | 10 интрон | 32 | интегральный белок везикул |
2 | Wisp1 | 1 интрон | 32 | сигнальный белок |
3 | Bmp5 | 7 интрон | 13 | сигнальный белок |
3 | Csmd1 | 3 интрон | 20 | сигнальный белок |
3 | Csmd3 | 1 интрон 35 интрон | 40 9 | сигнальный белок |
Хромосома | Ген | Район | Число копий | Характеристика белка |
3 | Grik2 | 11 интро | 35 | глутаматергический белок |
3 | Msra | 6 интрон | 25 | метионинсульфоксидредуктаза |
3 | Nrxn1 | 1 интрон | 20 | глутаматергический белок |
3 | Ralyl | 1 интрон | 39 | РНК-связывающий белок |
3 | Sntg2 | 10 интрон | 26 | интегральный белок |
4 | Fhl1 | 2 интрон | 28 | интегральный белок |
4 | Gria3 | 3’ область | 33 | глутаматергический белок |
4 | Ppp2r2c | 6 интрон | 42 | мембранная протеаза |
4 | Sorcs2 | 3 интрон | 13 | сигнальный белок |
5 | Lrrc4c | 6 интрон | 42 | сигнальный белок |
6 | Gdf10 | 2 интрон | 22, 16 | сигнальный белок |
6 | Zmiz1 | 2 интрон | 8 | транскрипционный регулятор |
9 | Mecom | 1 интрон | 7 | транскрипционный регулятор |
15 | Tbx1 | 3 интрон | 19 | транскрипционный фактор |
20 | Asip | 1 интрон | 30, 16 | сигнальный белок |
22 | Nefm | промотор | 31 | белок цитоскелета нейронов |
27 | Asic2 | 2 интрон | 19 | ионный канал |
28 | Onecut3 | 1 интрон | 40 | транскрипционный фактор |
31 | Chir-B2 | 1 интрон | 14 | сигнальный белок мембраны |
31 | Chir-B4 | 1 интрон 2 интрон | 15 26 | сигнальный белок мембраны |
Z | Aldh1a1 | 1 интрон | 19 | альдегидная дегидрогенеаза |
Z | Dnai1 | 8 интрон | 9 | компонент моторного белка |
Z | Fbxl17 | 7 интрон | 10 | регулятор катаболизма |
Z | Ptprd | 2 интрон 23 интрон | 19 20 | мембранная тирозиновая фосфотаза |
Z | Rab3c | 2 интрон | 23 | малая мембранная ГТФаза |
Z | Rasef | 1 интрон | 21 | малая мембранная ГТФаза |
Z | Rit2 | 1 интрон | 27 | малая мембранная ГТФаза |
Z | Rnf165 | 1 интрон | 21 | убиквитиновая трансфераза |
Z | Rorb | 1 интрон 7 интрон | 51 30 | транскрипционный фактор |
Z | Setbp1 | 2 интрон 3 интрон | 27 26 | транскрипционный фактор |
Z | Sh3gl2 | 3 интрон | 27 | транскрипционный регулятор |
Z | Trpm3 | 1 интрон | 31 | трансмембранный катионный канал |
По данным базы данных UNIPROT, продукты более 40% выявленных генов оказались вовлечены во взаимные регуляторные и белок-белковые взаимодействия, а 13 из этих генов образуют общий функциональный кластер. Большая часть генов, содержащих полипуриновые/полипиримидиновые непрерывные последовательности (GGAAA)n, участвует в синаптической передаче сигнала. Среди таких генов оказались Grm5, Dlgap1, Grik1, Grik2, Gria3, продукты которых входят в состав глутаматергических синапсов и существенны для синаптической пластичности. Как было показано ранее, эти гены задействованы в обучении и развитии памяти, а для певчих птиц играют существенную роль в обучении пению (Wada et al., 2004). Экспрессия еще трех выявленных нами генов Lrrc4c, Robo2, Slit2 также упоминается в литературе в связи с пением и описана в голосовых ядрах мозга у самцов птиц (Lovell et al., 2018). Подавление активности этих генов у самок птиц может быть опосредовано участием транскриптов тандемных повторов (GGAAA)n, локализованных на половой хромосоме W.
Агрессивное половое поведение самцов G. gallus, петухов, непосредственно связано с борьбой за социальное доминирование и является одной из характеристик проявления полового диморфизма у этого вида. При сравнении полученного в ходе анализа списка генов из генома G. gallus, несущих в своем составе повторяющийся элемент (GGAAA)n, с гомологами человека, было выявлено 8 генов, дифференциальная экспрессия которых так или иначе связана с агрессивным поведением. Один из них, а именно Sorcs2, был ранее выявлен в ходе скрининга мутаций у пород бойцовых кур, характеризующихся повышенной агрессивностью в поведении петухов (Li et al., 2016). Интересно, что описанная у китайской желтой карликовой породы кур мутация, приводящая к увеличению вероятности реализации альтернативного сайта инициации транскрипции, была локализована в 3-м интроне. Именно в третьем интроне в этом гене в геномной сборке GRCg6a локализуется блок тандемных повторов (GGAAA), состоящий из 13 мономеров, который может регулировать реализацию альтернативной транскрипции и увеличивать вероятность продукции более длинного белка с дополнительным интегральным доменом.
ЗАКЛЮЧЕНИЕ
Функциональные особенности генов, несущих в составе некодирующих регуляторных последовательностей тандемный повтор (GGAAA)n и различия в их экспрессии у самцов и самок, свидетельствуют о том, что полипуриновые/полипиримидиновые непрерывные последовательности (GGAAA)n могут участвовать в регуляции активности генов, вовлеченных в дифференцировку пола, развитие признаков полового диморфизма и половое поведение у курицы.
БЛАГОДАРНОСТИ
Результаты настоящего исследования посвящаются 120-летию со дня рождения выдающегося российского ученого академика Бориса Львовича Астаурова, внесшего существенный вклад в исследование генетики пола. Авторы благодарят Р. В. Четверикову и Е. В. Большакову, выполнявших учебные проекты и внесших вклад в исследование.
ФИНАНСИРОВАНИЕ РАБОТЫ
Исследование не имеет финансовой поддержки.
СОБЛЮДЕНИЕ ЭТИЧЕСКИХ СТАНДАРТОВ
При выполнении данного исследования люди и животные не использовались в качестве объектов.
КОНФЛИКТ ИНТЕРЕСОВ
Авторы заявляют об отсутствии конфликта интересов.
ВКЛАД АВТОРОВ
Идея исследования принадлежит А. Ф. Сайфитдиновой. Оба автора участвовали в анализе данных, обсуждении результатов и подготовке рукописи.
About the authors
A. F. Saifitdinova
Herzen State Pedagogical University of Russia; St. Petersburg University
Author for correspondence.
Email: saifitdinova@mail.ru
Russian Federation, St. Petersburg, 191186; St. Petersburg, 199034
A. A. Zhukova
Herzen State Pedagogical University of Russia; Russian Federal Research Institute of Fisheries and oceanography
Email: saifitdinova@mail.ru
Saint Petersburg branch
Russian Federation, St. Petersburg, 191186; St. Petersburg, 199053References
- Bellott D.W., Skaletsky H., Cho T.-J. et al. Avian W and mammalian Y chromosomes convergently retained dosage-sensitive regulators // Nature Genetics. 2017. V. 49. № 387. P. 94.
- Komissarov A.S., Galkina S.A., Koshel E.I. et al. New high copy tandem repeat in the content of the chicken W chromosome // Chromosoma. 2018. V. 127. № 1. P. 73–83.
- Li Z., Zheng M., Abdalla B.A., Zhang Z. et al. Genome-wide association study of aggressive behaviour in chicken // Scientific reports. 2016. V. 6. № . 30981.
- Lovell P.V., Huizinga N.A., Friedrich S.R. The constitutive differential transcriptome of a brain circuit for vocal learning // BMC Genomics. 2018. V. 19. № 1.
- Matos-Rodrigues G., Hisey J.A., Nussenzweig A. et al. Detection of alternative DNA structures and its implications for human disease // Molecular Cell. 2023. V. 83. № 20. P. 3622–3641.
- Maroteaux L., Heilig R., Dupret D. et al. Repetitive satellite-like sequences are present within or upstream from 3 avian protein-coding genes // Nucleic Acids Research. 1983. V. 11. P. 1227–1243.
- Wada K., Sakaguchi H., Jarvis E. D. et al. Differential expression of glutamate receptors in avian neural pathways for learned vocalization // The Journal of Comparative Neurology. 2004. V. 476. P. 44–64.
- Zopf D., Dineva B., Betz H., Gundelfinger E.D. Isolation of the chicken middle-molecular weight neurofilament (NF-M) gene and characterization of its promoter // Nucleic Acids Research. 1990. V. 18. № 3. P. 521–529.
Supplementary files
