Digital Toolkit for Natural Language Processing in the Linux Free Operating System Family

封面

如何引用文章

全文:

详细

The aim of the present study is to determine the compatibility status of the contemporary digital toolkit for natural language processing in the Linux kernel-based operating system environment. The research is based on the material of catalogs and registries of general purpose and linguistic software developed by international and Russian programmer teams. The analysis, conducted by means of the descriptive and experimental methods, describes the functionality of specialized linguistic software within the framework of their use in the Linux operating system environment. A model of improving the efficiency of the Linux-centric linguistics digital workflow is proposed, built around the use of Russian operating systems based on the Linux kernel.

作者简介

Mikhail Kamensky

North-Caucasus Federal University

编辑信件的主要联系方式.
Email: stavdev@mail.ru

Doctor of Philology (Dr. habil.), Associate Professor, Professor at the Department of Linguistics
Faculty of International Relationships

俄罗斯联邦

参考

  1. Antopolsky, A. B. (2021). Digital linguistic information resources. The definition of the object and cataloging. Automatic documentation and mathematical linguistics, 3, 27−36. (In Russ.)
  2. Kamensky, M. V. (2021). Information technologies in optimizing scientific research in the sphere of theoretical and applied linguistics in the digital age. Humanities and law research, 4, 208−218. (In Russ.)
  3. Gorozhanov, A. I. (2024). Architecture of a balanced linguistic corpus built automatically (experience of Moscow State Linguistic University). Vestnik of Moscow State Linguistic University. Humanities, 11(892), 24−30. (In Russ.)
  4. Gurtueva, I. A. (2024). Corpus study of Russian accent speech. Human – language – computer. Issledovateli budushchego (pp. 56−62): Materialy Nauchno-prakticheskoj (zaochnoj) konferencii s mezhdunarodnym uchastiem. Moscow, 2023, December 25. Moscow: Moscow State Linguistic University. (In Russ.)
  5. Gorozhanov, A. I., Guseynova, I. A. (2020). Korpusanalyse der Konstituenten Grammatischer Kategorien im Literarischen Text mit Berücksichtigung der Linguoregionalen Komponente. Journal of Siberian Federal University. Humanities & Social Sciences, 13(12), 2035–2048. doi: 10.17516/1997-1370-0702.
  6. Avetisyan, A. I. (2024). Artificial intelligence in the humanitarian field. Threats and opportunities. Herald of the Russian Academy of Sciences, 94(7), 623–628. (In Russ.)
  7. Avramenko, A. P. (2023). Bol’shie yazykovye modeli v lingvistike i lingvodidaktike = Large Language Models in Linguistics and Linguodidactics. Moscow: KDU, Dobrosvet. (In Russ.)
  8. Polikarpov, A. M. (2019). Filologicheskoe znanie v tsifrovoi tsivilizatsii = Philological knowledge in digital civilization. In. Gromskij, A. A. (Ed.), Sbornik tezisov po itogam Professorskogo foruma 2019 «Nauka. Obrazovanie. RegionY» (vol. 1, pp. 182–184): collection of papers. Moscow: Obshcherossijskaya obshchestvennaya organizaciya “Rossijskoe professorskoe sobranie.” (In Russ.)
  9. Sheiko, A. M. (2023). Digital humanities and digital philology: origins and future. Teoriya yazyka i mezhkul’turnaya kommunikatsiya, 3(50), 259−273. (In Russ.)
  10. Gimaletdinova, G. K., Dovtaeva, E. Kh. (2021). Sentiment analysis of reader comments: automated vs manual text processing. Uchenye zapiski kazanskogo universiteta. Seriya: gumanitarnye nauki, 163(1), 65−80. (In Russ.)
  11. Maksimenko, O. I. (2019). Automatic Distributive-Statistic Analysis As System Text Processing. RUDN journal of language studies, semiotics and semantics, 10(1), 92−100. (In Russ.)
  12. Boichuk, E. I. (2021). Automated analysis of the rhythm of advertising text. Verhnevolzhski philological bulletin, 1(24), 137−144. (In Russ.)
  13. Fatkulin, B. G. (2015). Applied linguistics at the service of the Russian sinology: automate content downloading from the Chinese encyclopedia BAIDU BAIKE using the OS LINUX opportunities. Rossiya i Kitai: istoriya i perspektivy sotrudnichestva (vol. 5, pp. 374 −378): Proceedings of the 5th International Scientific and practical conference, 2015, May 18–23. Blagoveshchensk – Kheikhe – Kharbin. (In Russ.)

补充文件

附件文件
动作
1. JATS XML


Creative Commons License
此作品已接受知识共享署名 4.0国际许可协议的许可

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».