Нейросетевая модель для обработки запросов пользователей на этапе эксплуатации и сопровождения программного продукта
- Авторы: Грибков Е.И.1,2, Ехлаков Ю.П.2
-
Учреждения:
- ООО «ТомскСофт»
- Томский государственный университет систем управления и радиоэлектроники
- Выпуск: Том 14, № 1 (2020)
- Страницы: 7-18
- Раздел: Анализ данных и интеллектуальные системы
- URL: https://journal-vniispk.ru/1998-0663/article/view/351567
- DOI: https://doi.org/10.17323/2587-814X.2020.1.7.18
- ID: 351567
Цитировать
Аннотация
В статье предлагается оригинальная нейросетевая модель на основе системы переходов для извлечения информативных высказываний из текстов обращений пользователей. Описаны конфигурация и система переходов, определяющие процесс извлечения составных объектов как исполнение последовательности переходов. Предсказание последовательности переходов осуществляется при помощи нейронной сети, признаки которой формируются на основе конфигурации. Для обучения и оценки качества работы модели создан размеченный набор текстов отзывов о приложениях из магазина приложений Google Play для операционной системы Android. Описана процедура обучения модели для извлечения информативных фраз на наборе отзывов, предложены конкретные значения гиперпараметров модели. Проведено экспериментальное сравнение предложенной модели с гибридной моделью на основе сверточной и рекуррентной нейронных сетей. Для сравнения моделей использовался критерий F1, характеризующий соотношение полноты и точности извлечения информативных фраз. Результаты экспериментального исследования предложенной модели показывают, что она дает более высокие по сравнению с аналогом результаты: F1 для извлечения фрагментов объектов выше на 2,9%, для извлечения связей между фрагментами – на 36,2%. Качественный анализ полученных результатов говорит о возможности практического применения предложенной модели для обработки запросов пользователей при эксплуатации и сопровождении программных продуктов.
Об авторах
Егор И. Грибков
ООО «ТомскСофт»; Томский государственный университет систем управления и радиоэлектроники
Автор, ответственный за переписку.
Email: drnemor@gmail.com
634034, г. Томск, ул. Нахимова, д. 8; 634050, г. Томск, пр. Ленина, д. 40
Юрий П. Ехлаков
Томский государственный университет систем управления и радиоэлектроники
Email: upe@tusur.ru
ORCID iD: 0000-0003-1662-4005
634050, г. Томск, пр. Ленина, д. 40
Список литературы
- ГОСТ Р ИСО/МЭК 12207-2010. Информационная технология. Системная и программная инженерия. Процессы жизненного цикла программных средств. М.: Стандартинформ, 2011.
- Schach S.R. Object-oriented and classical software engineering. N.Y.: McGraw-Hill Education, 2011.
- Is it a bug or an enhancement? A text-based approach to classify change requests / G. Antoniol [et al.] // Proceedings of the 2008 Conference of the Center for Advanced Studies on Collaborative Research: Meeting of Minds. Ontario, Canada, 27–30 October 2008. P. 304–318. doi: 10.1145/1463788.1463819.
- Pagano D., Maalej W. User feedback in the appstore: An empirical study // Proceedings of the 21st IEEE International Requirements Engineering Conference. Rio de Janeiro, Brasil, 15–19 July 2013. P. 125–134. doi: 10.1109/RE.2013.6636712.
- Iacob C., Harrison R. Retrieving and analyzing mobile apps feature requests from online reviews // Proceedings of the 10th Working Conference on Mining Software Repositories (MSR 2013). San Francisco, USA, 18–19 May 2013. P. 41–44. doi: 10.1109/MSR.2013.6624001.
- SCARE – The sentiment corpus of app reviews with fine-grained annotations in German / M. Sänger [et al.] // Proceedings of the 10th International Conference on Language Resources and Evaluation. Portorož, Slovenia, 23–28 May 2016. P. 1114–1121.
- Ехлаков Ю.П., Грибков Е.И. Модель извлечения пользовательских мнений о потребительских свойствах товара на основе рекуррентной нейронной сети // Бизнес-информатика. 2018. № 4 (46). С. 7–16. doi: 10.17323/1998-0663.2018.4.7.16.
- Перегудов Ф.И., Тарасенко Ф.П. Основы системного анализа. Томск: НТЛ, 1997.
- Dyer C., Kuncoro A., Ballesteros M., Smith N.A. Recurrent neural network grammars // Proceedings of the 15th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. San Diego, USA, 12–17 June 2016. P. 199–209. doi: 10.18653/v1/N16-1024.
- Kiperwasser E., Goldberg Y. Simple and accurate dependency parsing using bidirectional LSTM feature representations // Transactions of the Association for Computational Linguistics. 2016. Vol. 4. P. 313–327. doi: 10.1162/tacl_a_00101.
- Neural architectures for named entity recognition / G. Lample [et al.] // Proceedings of the 15th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. San Diego, USA, 12–17 June 2016. P. 260–270. doi: 10.18653/v1/N16-1030.
- Kim Y. Convolutional neural networks for sentence classification // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). Doha, Qatar, 25–29 October 2014. P. 1746–1751. doi: 10.3115/v1/D14-1181.
- Convolutional sequence to sequence learning / J. Gehring [et al.] // Proceedings of the 34th International Conference on Machine Learning (ICML). Sydney, Australia, 6–11 August 2017. Vol. 70. P. 1243–1252.
- Kalchbrenner N., Grefenstette E., Blunsom P. A convolutional neural network for modelling sentences // Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics. Baltimore, USA, 22–27 June 2014. P. 655–665. doi: 10.3115/v1/P14-1062.
- Huang Z., Xu W., Yu K. Bidirectional LSTM-CRF models for sequence tagging // arXiv.org. [Электронный ресурс]: https://arxiv.org/abs/1508.01991 (дата обращения 20.01.2020).
- Irsoy O., Cardie C. Opinion mining with deep recurrent neural networks // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). Doha, Qatar, 25–29 October 2014. P. 720–728. doi: 10.3115/v1/D14-1080.
- Wang W., Jialin Pan S., Dahlmeier D., Xiao X. Recursive neural conditional random fields for aspect-based sentiment analysis // Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing (EMNLP). Austin, USA, 1–5 November 2016. P. 616–626. doi: 10.18653/v1/D16-1059.
- Maxout networks / I. Goodfellow [et al.] // Proceedings of the 30th International Conference on Machine Learning. Atlanta, USA, 16–21 June 2013. P. 1319–1327.
- He K., Zhang X., Ren S., Sun J. Deep residual learning for image recognition // Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las-Vegas, USA, 26 June – 1 July 2016. P. 770–778. doi: 10.1109/CVPR.2016.90.
- Graves A., Jaitly N., Mohamed A. Hybrid speech recognition with deep bidirectional LSTM // Proceedings of the 2013 IEEE Workshop on Automatic Speech Recognition and Understanding. Olomouc, Czech Republic, 8–12 December 2013. P. 273–278. doi: 10.1109/ASRU.2013.6707742.
- Hochreiter S., Schmidhuber J. Long short-term memory // Neural Computation. 1997. Vol. 9. No 8. P. 1735–1780. doi: 10.1162/neco.1997.9.8.1735.
- Chiu J.P.C., Nichols E. Named entity recognition with bidirectional LSTM-CNNs // Transactions of the Association for Computational Linguistics. 2016. No 4. P. 357–370. doi: 10.1162/tacl_a_00104.
- Ma X., Hovy E. End-to-end sequence labeling via bi-directional LSTM-CNNs-CRF // Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. Berlin, Germany, 7–12 August 2016. Vol. 1. P. 1064–1074. doi: 10.18653/v1/P16-1101.
- Wang Y., Huang M., Zhu X., Zhao L. Attention-based LSTM for aspect-level sentiment classification // Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing (EMNLP). Austin, USA, 1–5 November 2016. P. 606–615. doi: 10.18653/v1/D16-1058.
- Caruana R. Multitask learning: A knowledge-based source of inductive bias // Proceedings of the Tenth International Conference on Machine Learning. Amherst, USA, 27–29 June 1993. P. 41–48. doi: 10.1016/b978-1-55860-307-3.50012-5.
- Hashimoto K., Xiong C., Tsuruoka Y., Socher R. A joint many-task model: Growing a neural network for multiple NLP tasks // Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing (EMNLP). Copenhagen, Denmark, 7–11 September 2017. P. 1923–1933. doi: 10.18653/v1/D17-1206.
- Learning word vectors for 157 languages / E. Grave [et al.] // Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan, 7–12 May 2018. P. 3483–3487.
- Jebbara S., Cimiano P. Aspect-based relational sentiment analysis using a stacked neural network architecture // Proceedings of the 22nd European Conference on Artificial Intelligence. The Hague, The Netherlands, 29 August – 2 September 2016. P. 1123–1131. doi: 10.3233/978-1-61499-672-9-1123.
Дополнительные файлы
