Some Features of Literary Texts when Comparing them to Determine their Authorship

Cover Page

Cite item

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription Access

Abstract

A method for analyzing literary author's texts based on selecting the most frequent auxiliary parts of speech characteristic of a particular author's style and calculating their weighting coefficients has been developed. This linguistic analysis of natural language text (NLP) is based on the calculation of the most frequently used prepositions, conjunctions and particles in literary works. The process of calculating weight coefficients, determined by the ratio of the values of auxiliary parts of speech in the text to its total volume, has been analyzed in detail. Experimental results on establishing the authorship of literary texts for two authors are presented. The results were obtained by comparing the numerical values of the same type of weighting coefficients, expressed as percentages. The theoretical and practical results obtained can be used to analyze, identify linguistic features, and differences not only in literary texts, but, in the future, in texts of any genre and style.

About the authors

Gurami N. Akhobadze

V. A. Trapeznikov Institute of Control Sciences of Russian Academy of Sciences

Author for correspondence.
Email: ahogur@ipu.ru

Professor, Doctor of technical sciences

Russian Federation, Moscow

Elena Ya. Rusyaeva

V. A. Trapeznikov Institute of Control Sciences of Russian Academy of Sciences

Email: rusyaeva@ipu.ru

PhD

Russian Federation, Moscow

References

  1. Mikheev M.Yu., Erlikh L.I. Idiostyle profile and determination of the authorship of the text by the frequencies of function words // Scientific and technical information. Series 2: Information processes and systems. No. 2, 2018.– p. 25-34
  2. Mikheev M.Yu., Erlikh L.I. Text staples and their frequencies as a distinctive feature of the author's idiostyles Electronic resource. Access date 03/15/2024. https://ruslang.ru/sites/default/files/doc/grigoriev2022/Mish.pdf
  3. Orlova, M.V. Mikheev M.Yu., Erlikh L.I. On the differences between Russian scientific idiostyle and artistic style in terms of the frequency of use of text staples / Questions of literature. No. 1 2022, pp. 118-140.
  4. Kukushkina O.V., Polikarpov A.A. Frequency and distribution characteristics of Russian prepositions and syntaxes associated with them (according to the “Nuclear Computer Corpus of Texts of Russian Newspapers of the End of the 20th Century”) // Language, consciousness, communication. Issue 47. M.: MAKS Press, volume 47, 2013. .341-362
  5. Vsevolodova M.V., Kukushkina O.V., Polikarpov A.A. Russian prepositions and prepositional devices. Materials for a functional-grammatical description of real use. Book 1. Introduction to objective grammar and lexicography of Russian prepositional units. Place of publication URSS, 2013. 304p.
  6. Bolshakova E.I., Vorontsov K.V., Efremova N.E., Klyshinsky E.S., Lukashevich N.V., Sapin A.S. Automatic pro- cessing of texts in natural language and data analysis - M.: National Research University Higher School of Economics, 2017. - 269 p.
  7. Smirnov I.V., Shelmanov A.O. Semantic-syntactic analysis of natural languages // Artificial intelligence and decision making. - 2013. No. 1. - P. 41-54.
  8. Morozov N.A. Linguistic spectra: A means for distinguish- ing plagiarism from the true works of one or another famous author: Stylemetric study // News of the Department of Russian Language and Literature of the Imperial Academy of Sciences. - 1915. - T. 20, book. 4. - pp. 93-127.
  9. Markov A.A. On one application of the statistical method//Izv.Imp.academy.nauk, Ser. 6. 1916. N4, pp. 239-242.
  10. Text attribution: theory and practice (festivalnauki.ru). Electronic resource. Access date 02/12/2024.
  11. Smith Peter, Aldrigde W. (2011): Improving Authorship Attribution: Optimizing Burrows’s Delta Method // Journal of Quantitative Linguistics 18, 63–88.
  12. Ryzhkovich A.Ch. On the question of the treminological status of the preposition // Universum: Philology and art history: electronic scientific journal. 2018. No. 9(55). URL: http://7universum.com/ru/philology/archive/item/6385
  13. Shalymov D, Granichin O, Klebanov L, Volkovich Z. Literary writing style recognition via a minimal spanning tree- based approach // Expert Systems with Applications 61, 145-153, 2016 doi: 10.1016/j.eswa.2016.05.032
  14. Suetin V. Yu., Application of frequency characteristics to determine the authorship of literary texts, Vestnik TvGU. Series: Applied Mathematics, 2022, issue 2, 84–89 doi: 10.26456/vtpmk637
  15. Voronina, M. Yu. Orlov Yu. N. Determining the author of a text using the segmentation method. Federal Research Center "Institute of Applied Mathematics named after. M.
  16. V. Keldysh Russian Academy of Sciences", 2022. DOI: https://doi.org/10.20537/2076-7633-2022-14-5-1199-1210
  17. Kislitsyn A.A., Kislitsyna M.Yu. Recognition of sample distributions among a system of standards: the nearest neighbor method // Preprints of IPM im. M.V.Keldysh. 2023. No. 29. – 21 p. https://doi.org/10.20948/prepr-2023-29 https://library.keldysh.ru/preprint.asp?id=2023-2
  18. Gorozhanov A. I. Creation of a linguistic corpus based on natural language processing tools: planning software solu- tions. / Philological sciences. Questions of theory and practice., 2023. Volume 16. Issue 5. P. 1616-1620.
  19. Gasparov M.L. Linguistics of verse // News of PAH. Ser. lit. and language. – M., 1994. – T. 53. No. 6. – p. 28-35.
  20. Fedyanin D. N., Rusyaeva E. Yu., Akhobadze G. N. Lin- guistic text analyzer: Certificate of state registration of a computer program No. 2023668307 RF; Registered 08/25/2023.
  21. Litres. Electronic resource: https://www.li- tres.ru/book/maks-alekseevich-glebov/chernyy-staratel-67077536/ Date of access 01/10/2024

Supplementary files

Supplementary Files
Action
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».