Structural Models of English Terms of Automated Processing of Scientific and Technical Texts Corpora

Capa

Citar

Texto integral

Resumo

The article is devoted to the structural models of English multi-component terms from the subject area “Welding types” as a basis for marking the corpora of scientific and technical texts. The place of corpora of scientific and technical texts in corpus linguistics and prospects of further scientific research based on them are marked. Relevance of the research is conditioned by the necessity to create the corpus of scientific and technical texts, in general, and means of automatic marking of terms, in particular. It has been substantiated that the main problem in creating the corpus of scientific and technical texts is automatic marking of terminological word combinations. The analysis of the current state of the terminology system of the subject area “Welding types” has been carried out. The formal structure of elements of the “Welding types” terminology system is considered. The results of the analysis of two, three, four-component English terminological word combinations of the “Welding types” subject area and their structural models are presented. All structural models of English terminology combinations are illustrated with examples. The most productive models of English terms word combinations are highlighted. It is shown that the most productive model - the combination of a nucleus element with a noun or an adjective in the function of the prepositional definition - can be traced in two-component word combinations, but the analysis of more complex formations shows that the model of “left definition attached to the term kernel” is also present in them, demonstrating generic features. The necessity of enumerating all possible structural models of terminological combinations in the subject area “Welding types” has been substantiated. The novelty of the study is seen in the formation of a database of structural models of terminological combinations as the basis of a superstructure database on the structure of terms to improve the quality of automatic marking of the bodies of scientific and technical texts and processing of terms-candidates in the conduct of body studies.

Sobre autores

Iuliia Butenko

Peoples’ Friendship University of Russia (RUDN University)

Autor responsável pela correspondência
Email: iubutenko@bmstu.ru
PhD, Candidate of Technology, Assoсiate Professor of Roman-Germanic Languages Department, Bauman Moscow State Technical University; assistant professor of Foriegn Languages Department, Peoples’ Friendship University of Russia (RUDN University) 6, Mikluho-Maklaya str., Moscow, Russian Federation, 117198

Natalia Nikolaeva

Bauman Moscow State Technical University

Email: natalynic@yandex.ru
PhD, Candidate of Philology, Assoсiate Professor of English for Mechanical Engineering Department 5/1, 2-nd Baymanskaya str., Moscow, Russian Federation, 105005

Elena Kartseva

Peoples’ Friendship University of Russia (RUDN University)

Email: kartseva_eyu@rudn.ru
PhD, Candidate of History, Associate Professor of Foriegn Languages Department 6, Mikluho-Maklaya str., Moscow, Russian Federation, 117198

Bibliografia

  1. Nagel’, O.V. (2008). Corpus linguistics and its use in computer-based language teaching. Language and culture, 4, 53—59. (In Russ.).
  2. Zakharov, V.P. (2015). Corpora of the Russian Language. Proceedings of the V.V. Vinogradov Russian Language Institute, 6, 20—65. (In Russ.).
  3. Kruzhkov, M.G. (2015). Information resources for contrastive studies: electronic text corpora. Systems and means of informatics, 25(2), 140—159. (In Russ.).
  4. Lesnikov, S.V. (2019). The types of marking of text corpora of the Russian language. Scientific and Technical Information. Series 2. Information Processes and Systems, 9, 27—30. (In Russ.).
  5. Zakharov, V.P. & Khokhlova, M.V. (2014). Automatic extracting of terminological phrases. Structural and Applied Linguistics, 10, 182—200. (In Russ.).
  6. Zakharov, V.P. & Khokhlova, M.V. (2012). Automatic term extraction and statistical analysis in a special text corpus as a tool for thesaurus construction. Structural and Applied Linguistics, 9, 222—233. (In Russ.).
  7. Loukachevitch, N. & Dobrov, B. (2018). Ontological Resources for Representing Security Domain in Information-Analytical System. Open Semantic Technology for Intelligent Systems, 8, 185—191.
  8. Morev, N.A. (2012). To the problem of linguistic analysis of terminology in the field of nanotechnology (on the need to develop a research corpus of terminological units). Vestnik of Moscow State Linguistic University. Humanities, 13(646), 115—124. (In Russ.).
  9. Sidnyaev, N.I., Butenko, I.I. & Bolotova, E.E. (2020). Formal Grammar Theory in Recognition Methods of Unknown Objects. Automatic Documentation and Mathematical Linguistics, 54(4), 215—225.
  10. Nikolaeva, N.S. (2011). Peculiarities of origin of the basic terms of the “Welding” system (on the material of English and Russian terminology). Bulletin of the Moscow Region State University. Series: Linguistics, 1, 132—138. (In Russ.).
  11. Lejchik, V.M. (1986). About the language substrate of the term. Topics in the study of language, 5, 87—97. (In Russ.).
  12. Lejchik, V.M. (1994). Original concepts, basic provisions, definitions of modern terminology and terminology. Bulletin of Kharkiv Polytechnic Institute, 1, 147—180. (In Russ.).
  13. Lotte, D.S. (1961). Basics of building scientific and technical terminology. Moscow: Izdatel’stvo AN SSSR. (In Russ.).
  14. Tsitkina, F.A. (1988). Terminology and translation. L’vov: Vysshaya shkola. (In Russ).
  15. Nikolaeva, N.S. (2013). Peculiarities of the initial stage in the formation of the terminology (the prescientific and protoscientific periods). Humanities Bulletin of BMSTU. URL: http://hmbul.bmstu.ru/catalog/pedagog/engped/87.html. (accessed: 25.10.2020). (In Russ.).
  16. Lejchik, V.M. (1981). Optimal length and structure of the term Voprosy Jazykoznanija (Topics in the study of language), 2, 63—73. (In Russ.).
  17. Grinev-Grinevich, S.V. (2020). On terminology aspects of scientific and technical translation. Bulletin of the Moscow Region State University. Series: Linguistics, 6(2), 74—78. (In Russ.).
  18. Zolotykh, V.T. (1967). English-Russian dictionary of welding production, A.A. Erokhin (ed.). Moscow: Sovetskaya Encyclopedia. (In Russ.).
  19. Nikolaeva, N.S. (2015). Teaching reading literature in English in the specialty “Welding”: a lexical guide. Moscow: MSTU named after N.E. Bauman publ. (In Russ.).
  20. Cordovi, Marcel A. (1944). Glossary of Foreign Welding Terms, M.A. Cordovi (comp.). New York: American Welding Society.
  21. Extensive Experience with Both Consumable Guide and High Speed ​​Conventional Electroslag Welding [Electronic resource]. URL: http://www.netwelding.com/serv04.htm#Background Details (accessed: 06.17.2020).
  22. Friction Stir Welding. In: Wikipedia: the free encyclopedia [Electronic resource]. URL: http://en.wikipedia.org/wiki/Friction_stir_welding (accessed: 05.11.2020).
  23. Fusion Splicing. In: Wikipedia: the free encyclopedia [Electronic resource]. URL: http://en.wikipedia.org/wiki/Fusion_splicing (accessed: 05.11.2020).
  24. History of MIG (GMAW) Welding [Electronic resource]. URL: http://www.netwelding.com/History_MIG%201.htm#Atomic Hydrogen (accessed: 05.14.2020).
  25. History of Welding — in the Beginning [Electronic resource]. URL: http://www.netwelding.com/History%20of%20Welding.htm (accessed: 05.11.2020).
  26. Laser-Hybrid Welding. In: Wikipedia: the free encyclopedia. [Electronic resource]. URL: http://en.wikipedia.org/wiki/Laser-hybrid_welding (accessed: 05.12.2020).
  27. Mackenzie, L.B. (1951). The Welding Encyclopedia, T.B. Jefferson (ed.). New York: McGray-Hill.
  28. Terms and Definitions (1969). AWS A 3.0-69, prep. By AWS Com. On definitions and symbols. Under the dir. of AWS Technical activities com. New York: American Welding Society.
  29. Welding handbook (1976). In: Fundamentals of welding. Vol. 1. Miami: American Welding Society.

Arquivos suplementares

Arquivos suplementares
Ação
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».