Formulaicity of German Controlled Language as a Translation Challenge for Neural Machine Translation

Capa

Citar

Texto integral

Resumo

This paper examines the formulaicity of the German, considering both its perceived and actual challenges for neural machine translation (NMT) into Russian. The study aims to conceptualize German as a controlled language for formulaic structures within the DeepL neural translator, investigating its criteria, restrictions, and output evaluation. The analysis is based on a corpus of 120 examples of German formulaic constructions, comprising two categories: verb-nominal phrases and binomial expressions. The data were sourced from the Digital Dictionary of the German Language (DWDS). We present a novel two-stage experimental design for analyzing translation choices applied to a random sample of these formulas. The methodological approach involves observing lexical-level rules for German as a controlled language. The analysis of lexical restrictions in German controlled natural language for formulaic constructions is combined with a contextual method for translation quality assessment. Our findings reveal a distinct strategy employed by the state-of-the-art DeepL translator for rendering stable formulaic expressions of varying structures. It is established that the neural approach to machine translation aims to replicate cognitive models of human thinking; however, the utilization of established translation solutions is identified here as an asset. The author emphasizes that this study does not seek to evaluate the commercial product DeepL itself, as it is a proprietary tool developed by a German corporation and tailored for texts with a specific stylistic profile.

Sobre autores

K. Manerova

St. Petersburg State University

Email: k.manerova@spbu.ru
ORCID ID: 0000-0002-4979-8573

Bibliografia

  1. Бабич М. Ю. Искусственный интеллект и создание сложных организационнотехнических систем / М. Ю. Бабич // Известия высших учебных заведений. Поволжский регион. Технические науки. — 2021. — № 4 (60). — С. 34—42. — doi: 10.21685/20723059-2021-4-3.
  2. Манёрова К. В. Вариантность произносительной нормы и значения в свете семантико-когнитивного анализа : немецкий фразеологизм das A und O / К. В. Манёрова // Научный диалог. — 2022. — Т. 11. — № 7. — С. 74—98. — doi: 10.24224/2227-12952022-11-7-74-98.
  3. Образцова В. М. Использование контролируемого языка для повышения качества машинного перевода / В. М. Образцова // Проблемы языка и перевода в трудах молодых ученых. — 2022. — № 21. — С. 140—146.
  4. Пиотровский Д. Д. Формульная техника фарерских баллад / Д. Д. Пиотровский // Вестник Санкт-Петербургского университета. Язык и литература. — 2020. — Т. 17 (2). — С. 271—289. — DOI: org/10.21638/spbu09.2020.207.
  5. Тузовский А. Ф. Системы управления знаниями (методы и технологии) / А. Ф. Тузовский, С. В. Чириков, В. З. Ямпольский ; под общ. ред. В. З. Ямпольского. — Томск : Изд-во НТЛ, 2005. — 258 с. — ISBN 5-89503-241-9.
  6. Хабаров В. И. Контролируемый естественный язык для работы с онтологиями / В. И. Хабаров, И. С. Степанов, А. А. Серенко // Научный вестник Новосибирского государственного технического университета. — 2019. — № 4 (77). — С. 99—120. — doi: 10.17212/1814-1196-2019-4-99-120.
  7. Ширяева А. А. Перспективы использования машинного перевода на основе нейросетей при переводе текстов официально-делового стиля / А. А. Ширяева, Д. Ю. Леонова // Философия и наука в культурах Запада и Востока. Сборник статей по материалам VII Всероссийской научной конференции с международным участием. — Томск :, 2024. — С. 146—150.
  8. Burger H. Handbuch der Phraseologie / H. Burger. — Berlin, New York : de Gruyter, 1982. — Pp. 20—56.
  9. Drewer P. Technische Dokumentation : Übersetzungsgerechte Texterstellung und Content-Management / P. Drewer, W. Ziegler. — Würzburg : Vogel, 2014. — 527 S.
  10. Dobrovol’skij D. Figurative Language. Cross-Cultural and Cross-Linguistic Perspectives / D. Dobrovol’skij, E. Piirainen // 2nd edition, revised and updated. — Berlin, Boston : Walter de Gruyter GmbH, 2022. — 504 р.
  11. Göpferich S. Standardisierung von Kommunikation / S. Göpferich. — Tübingen ; Basel : A. Francke Verlag, 2007. — S. 479—502.
  12. Göpferich S. Textproduktion im Zeitalter der Globalisierung : Entwicklung einer Didaktik des Wissenstransfers. 3. Aufl / S. Göpferich // Studien zur Translation. — Tübingen : Stauffenburg Verlag, 2008. — Bd. 15. — XII + 499 S.
  13. Häusermann J. Phraseologie. Hauptprobleme der deutschen Phraseologie auf der Basis sowjetischer Forschungsergebnisse / J. Häusermann // 1. Aufl. Max Niemeyer Verlag. — Tübingen : Phraseologie, 1977. — 130 p.
  14. Heine A. Zwischen Grammatik und Lexikon: Ein forschungsgeschichtlicher Blick auf Funktionsverbgefüge / A. Heine // In International Conference : Light Verb Constructions in Germanic Languages. — Brussels : Université Saint-Louis, 2017. — 452 p.
  15. Huijsen W.-O. Controlled language : An introduction / W.-O. Huijsen // Proceedings of the second international workshop on controlled language application (CLAW 98). — Pittsburg, PA : Language Technologies Institute, Carnegie Mellon University, 1998. — Pp. 1—15.
  16. Kamprath K. Controlled Language for Multilingual Document Production : Experience with Caterpillar Technical English / K. Kamprath, E. Adolphson, T. Mitamura, E. Nyberg // Carnegie Mellon University. — 1998. — P. 12.
  17. Kuhn T. A Survey and Classification of Controlled Natural Languages / T. Kuhn // Computational Linguistics. — 2014. — Vol. 40 (1). — Pp. 121—170.
  18. Lehrndorfer A. Kontrolliertes Deutsch : Linguistische und sprachpsychologische Leitlinien für eine (maschinell) kontrollierte Sprache in der Technischen Dokumentation / A. Lehrndorfer. — Tübingen : Gunter Narr, 1996. — 246 S.
  19. Lehrndorfer A. Controlled Siemens documentary German and TopTrans / A. Lehrndorfer, S. Schachtl // Technical Communicators, TC-Forum (3). — 1998. — Pp. 8—10.
  20. Lehrndorfer A. Kontrollierte Sprache: standardisierte Sprache? / A. Lehrndorfer, U. Reuther. — Lübeck : Schmidt-Römhild (tekom Hochschulschriften), 2008. — Bd. 16. — S. 9—121.
  21. Marzouk Sh. Sprachkontrolle im Spiegel der Maschinellen Übersetzung : Untersuchung zur Wechselwirkung ausgewählter Regeln der Kontrollierten Sprache mit verschiedenen Ansätzen der Maschinellen Übersetzung (Translation and Multilingual Natural Language Processing 20) / Sh. Marzouk. — Berlin : Language Science Press, 2022. — 698 S.
  22. Matusov E. The challenges of using neural machine translation for literature / E. Matusov // Proceedings of the qualities of literary machine translation. — Dublin : European Association for Machine Translation, 2019. — Pp. 10—19.
  23. Stein St. Neuere Literatur zur Phraseologie und zu ritualisierter Sprache / St. Stein // Deutsche Sprache 22. — 1994. — Pp. 152—180.
  24. Stein St. Formelhafte Sprache. Untersuchungen zu ihren pragmatischen und kognitiven Funktionen im gegenwärtigen Deutsch (Sprache in der Gesellschaft, 22) / St. Stein. — Frankfurt am Main : Peter Lang Verlag, 1995. — 375 p.
  25. Stein St. Formelhaftigkeit und Routinen in mündlicher Kommunikation/ St. Stein. — 2004. — Access mode : https://www.degruyterbrill.com/document/doi/10.1515/9783110622768-013/html?srsltid=AfmBOooG1KBpaDDILshoX-8rGiY4078JdjFTb-U9Nequ0gAkIMI0kpI5 doi.org/10.1515/9783110622768-013 (accessed 20.03.2025).
  26. Stumpf S. Formelhafte (Ir-)Regularitäten. Korpuslinguistische Befunde und sprachtheoretische Überlegungen / S. Stumpf // Reihe : Sprache — System und Tätigkeit. — Frankfurt am Main : Peter Lang Verlag, 2016. — Bd. 67. — 543 S.

Arquivos suplementares

Arquivos suplementares
Ação
1. JATS XML

Declaração de direitos autorais © Manerova K.V., 2025

Creative Commons License
Este artigo é disponível sob a Licença Creative Commons Atribuição 4.0 Internacional.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».