Identification of Means of the Category of Negation in a Balanced Linguistic Corpus

Мұқаба

Дәйексөз келтіру

Толық мәтін

Аннотация

The aim of the research is to develop a basic technology for identifying means of the category of negation within the framework of the software package “Balanced linguistic corpus generator and corpus manager”. The methods of analysis, testing, modeling, professionally oriented programming and experiment are applied. The language material is the corpus of recent CNN news texts with a volume of 1,024,583 tokens. As a result, the capabilities of the current version of the software package were clarified, and an extension was written that allows one to find lexical units that are directly subordinate to a given lemma.

Авторлар туралы

Alexey Gorozhanov

Moscow State Linguistic University

Хат алмасуға жауапты Автор.
Email: a.gorozhanov@linguanet.ru
ORCID iD: 0000-0003-2280-1282
SPIN-код: 1753-4920
Scopus Author ID: 57221193252
ResearcherId: U-2569-2018

Doctor of Philology, Associate Professor, Professor at the Department of German Language Grammar and History

Ресей

Әдебиет тізімі

  1. Grashchenkov, P. V., Studenikina, K. A., Pasko, L. I. (2024). Coordinate structure constraint in the linguistic competence of large language models. Vestnik of Saint Petersburg University. Language and Literature, 21(3), 668–688. doi: 10.21638/spbu09.2024.309. (In Russ.)
  2. Lagutina, K. V., Boychuk, E. I., Lagutina, N. S. (2023). Automatic classification of Russian-language Internet texts by genre. Artificial Intelligence and Decision Making, 4, 103–114. doi: 10.14357/20718594230410. (In Russ.)
  3. Solnyshkina, M. I., McNamara, D. S., Zamaletdinov, R. R. (2022). Natural language processing and discourse complexity studies. Russian Journal of Linguistics, 26(2), 317–341. doi: 10.22363/2687-0088-30171. (In Russ.)
  4. Gagarin, S. N. (2024). Getting a handle on a Hansard with Python and NLTK, or how to tame the linguistic picture of British politics with NLP. Linguistics & Polyglot Studies, 10(2), 125–140. doi: 10.24833/2410-2423-2024-2-39-125-140. (In Russ.)
  5. Safina, Z. M. (2024). Translation analysis of a literary text in Python. Global scientific potential, 1-11(164), 177–180. (In Russ.)
  6. Krasikova, E. A. (2024). The role of the corpus manager in analyzing the use of proper names in electronic media texts (on the material of the English-speaking CNN corpus). Philological sciences in the 21st century: relevance, multipolarity, development prospects (pp. 45–49): conference proceedings. Krasnodar. (In Russ.)
  7. Stepanova, D. V. (2024). Presentation of the semantic row “traditional energy carriers” in modern media in Germany (based on the texts of “Frankfurter Allgemeine Zeitung”). Philological sciences in the 21st century: relevance, multipolarity, development prospects (pp. 136–140): conference proceedings. Krasnodar. (In Russ.)
  8. Gorozhanov, A. I. (2024а). Architecture of a balanced linguistic corpus built automatically (experience of Moscow State Linguistic University). Vestnik of Moscow State Linguistic University. Humanities, 11(892), 24–30. (In Russ.)
  9. Glushak, V. M. (2023). Negation of German polar words and expressions in automated analysis of text tonality. Philology. Theory & Practice, 16(10), 3287–3292. 10.30853/phil20230510. (In Russ.)
  10. Gorozhanov, A. I. (2024б). Programming analysis of the lexical unit context. Current issues in philology and pedagogical linguistics, 3, 178–190. 10.29025/2079-6021-2024-3-178-190. (In Russ.)
  11. Gorozhanov, A. I. (2023). Extension of a standard balanced linguistic corpus built according to spacy rules by connotative characteristics. Philology. Theory & Practice, 16(11), 3888–3893. 10.30853/phil20230594. (In Russ.)
  12. Sytko, A. V. (2023). Negative deontic statements: semantics and pragmatics (on the material of the German and Russian languages). Minsk State Linguistic University Bulletin. Series 1. Philology, 2(123), 40–49. (In Russ.)

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML


Creative Commons License
Бұл мақала лицензия бойынша қолжетімді Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».