Fine-tuning neural networks for the features of a dataset in the speaker verification task using transfer learning
- Authors: Trofimova V.S.1, Karshieva P.K.1, Rakhmanenko I.A.1
-
Affiliations:
- Issue: No 3 (2024)
- Pages: 26-36
- Section: Articles
- URL: https://journal-vniispk.ru/2454-0714/article/view/359407
- DOI: https://doi.org/10.7256/2454-0714.2024.3.71630
- EDN: https://elibrary.ru/XHZCTS
- ID: 359407
Cite item
Full Text
Abstract
About the authors
Varvara Sergeevna Trofimova
Email: varvara.trofimova.01@mail.ru
ORCID iD: 0009-0008-5044-2321
Polina Konstantinovna Karshieva
Email: polinakarshieva1@gmail.com
ORCID iD: 0009-0004-8390-2348
Ivan Andreevich Rakhmanenko
Email: ria@fb.tusur.ru
ORCID iD: 0000-0002-8799-601X
References
Гассиев Д. О., Сахаров В. А., Ермолаева В. В. Голосовая аутентификация // Тенденции развития науки и образования. 2019. № 56(2). С. 22-24. ГОСТ Р 58668.11-2019 (ИСО/МЭК 19794-13:2018). Информационные технологии. Биометрия. Форматы обмена биометрическими данными. Часть 11. Данные голоса. Москва: Стандартинформ, 2019. 28 с. Девятков В.В. Системы искусственного интеллекта. Гл. ред. И.Б. Федоров. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. 352 с. Галушкин А.И. Нейронные сети. Основы теории. – М.: Горячая линия – Телеком, 2012. 496 с. Suzuki K. Artificial Neural Networks: Architectures and Applications. – Publisher: InTech, 2013. 256 p. Евсюков М.В., Путято М.М., Макарян А.С., Немчинова В.О. Методы зашиты в современных системах голосовой аутентификации // Прикаспийский журнал: управление и высокие технологии. 2020. № 3(59). С 84-92. Nagrani A., Chung J.S., Zisserman A. VoxCeleb: A large-scale speaker identification dataset // arXiv:1706.08612. 2018. URL: https://arxiv.org/pdf/1706.08612 (дата обращения: 15.07.2024). Hinton G. E., Srivastava X., Krizhevsky A., Sutskever I., Salakhutdinov R. R. Improving neural networks by preventing co-adaptation of feature detectors // arXiv:1207.0580. 2012. URL: https://arxiv.org/pdf/1207.0580 (дата обращения: 22.07.2024). Конев А.А. Модель и алгоритмы анализа и сегментации речевого сигнала: автореф. дис. на соиск. ученой степ. канд. техн. наук. Томск, 2007. 150 с. Qin X., Bu H., Li M. HI-MIA: A Far-field Text-Dependent Speaker Verification Database and the Baselines // IEEE International Conference on Acoustics, Speech, and Signal Processing, 2020. Pp. 7609-7613. Рахманенко И.А., Шелупанов А.А., Костюченко Е.Ю. Автоматическая верификация диктора по произвольной фразе с применением свёрточных глубоких сетей доверия // Компьютерная оптика. 2020. № 44(4). С. 596-605.
Supplementary files

