TYPOLOGY OF TRANSFORMATIONS IN MACHINE TRANSLATION POST-EDITING: LEXICAL, SYNTACTIC, AND DISCOURSE LEVELS
Abstract
This article analyses the transformations that arise during the post-editing of neural machine translation output. The study aims to develop a systematic typology of changes introduced by human translators when editing machinegenerated texts. The proposed framework distinguishes three interconnected levels of textual organization: lexical, syntactic, and discourse. The theoretical background of the research draws on contemporary studies of neural machine translation, post-editing practices, and functional approaches to translation transformations. The empirical material consists of a parallel micro-corpus compiled from the educational and legal textbook The Reckoning Project @ WCEE. The dataset includes three aligned versions of the text: the English source text, a Ukrainian machine translation generated with DeepL, and a final human-post-edited version. The corpus exceeds 150,000 word forms across the three versions. The analysis is based on systematic comparison between MT and PE segments, with the minimal functionally relevant difference taken as the unit of analysis. The findings reveal that most post-editing operations occur at the lexical level and involve semantic specification, removal of calques, register adjustment, and terminological normalization. Discourse-level interventions focus on restoring cohesion, aligning thematic progression, and standardizing the genre structure of the document. Syntactic transformations appear less frequently and mainly include sentence segmentation, restructuring of clause relations, and reduction of information density to improve readability. The results demonstrate that post-editing should not be viewed as only error correction. Instead, it functions as a process of secondary textual organization in which the human translator integrates machine-generated output into the linguistic, professional, and institutional norms of the target environment
References
2. Бабич Н. Практична стилістика і культура української мови : навч. посіб. для філол. спец. вищ. навч. закл. Львів : Світ, 2003. 432 с.
3. Баняс В., Баняс Н., Лізак К. Роль машинного перекладу в сучасній практиці перекладача. Наука і техніка сьогодні. 2025. С. 491-501. № 8(49). URL: https://doi.org/10.52058/2786-6025-2025-8(49)-491-501 (дата звернення: 07.03.2026).
4. Бацевич Ф. Нариси з теорії тексту: монографія. Львів : ЛНУ ім. І. Франка, 2019. 280 с.
5. Бондаренко К., Бондаренко О. Видобування термінології з корпусів фахових текстів та постредагування машинного перекладу в командно-орієнтованому навчанні перекладачів та локалізаторів відповідно до компетентнісної рамки EMT. Проблеми гуманітарних наук. Серія: Філологія. 2025. № 62. С. 24–32.
URL: https://doi.org/10.24919/2522-4565.2025. 62.3 (дата звернення: 02.03.2026).
6. Вихованець І. Р. Граматика української мови. Синтаксис: підручник. Київ : Либідь, 1993.368 с.
7. Вінтонів М. О. Керування як різновид прислівного синтаксичного зв’язку. Українська мова і література в школах України. 2017. № 2. С. 3–7.
8. Вінтонів М. О. Актуальне членування речення і тексту: формальні та функційні вияви. Донецьк : ДонНУ, 2013. 328 с.
9. Вінтонів М. О., Вінтонів Т. М., Бойко М. І. Синтаксис сучасної української мови: навчальний посібник. Київ : Київський столичний університет імені Бориса Грінченка, 2023. 177 с.
10. Головаш І., Щербина Т. Машинний переклад та його постредагування як засоби формування основ перекладацької компетенції. Науковий вісник Ужгородського університету. Серія:Філологія. 2025. Т. 1, № 53. С. 78–83. URL: https://doi.org/10.24144/2663-6840.2025.1.(53).78-83 (дата звернення: 07.03.2026).
11. Головащенко Ю. Структура лексико-семантичного поля у межах художнього тексту. Науковий вісник Чернівецького національного університету імені Юрія Федьковича. Серія: Германська філологія. 835–836.С. 24–35. URL: https://doi.org/10.31861/ gph2022.835-836.24-32.
12. Городенська К. Г. Керовані другорядні члени речення і валентність предиката. Матеріали V конгресу Міжнародної асоціації україністів. Мовознавство : зб. наук. статей. Чернівці :Рута, 2003. С. 260–263.
13. Гуйванюк Н. В. Формально-семантичні співвідношення в системі синтаксичних одиниць. Чернівці : Рута, 1999. 336 с.
14. Дашкова К. В. Поняття «лексико-семантичне поле» і його структура. Наукові записки Міжнародного гуманітарного університету. 2020.
Вип. 33. С. 56–60.
15. Єрмоленко С. Я. Сучасна лінгвостилістика в інтегративній науковій парадигмі. Науковий часопис НПУ імені М. П. Драгоманова. 2014. Вип. 5. С. 3–8.
16. Загнітко А. Теоретична граматика сучасної української мови. Морфологія. Синтаксис. Донецьк : ТОВ «ВКФ «БАО», 2011. 992 с.
17. Загнітко А. Лінгвістика тексту: теорія і практикум : науково-навчальний посібник. 3-тє вид. Вінниця : ТОВ «ТВОРИ», 2023. 277 с. 18. Загнітко А. П. Теорія граматики і тексту : монографія. Донецьк : ДонНУ, 2014. 480 с.
19. Загнітко А. П. Текст як лінгвістична категорія. Синтаксис української мови : хрестоматія : у 2 ч. Київ : ВПЦ «Київський університет», 2019. Ч. 2.
С. 112–143.
20. Книшенко Н. П. Поняття «лексико-семантичне поле» й «термінологічне поле» в сучасному мовознавстві. Лінгвістичні дослідження. 2020. Вип. 52. С. 3–9. URL: https://doi.org/10.34142/23127546.2020.52.01.
21. Кочерган М. П. Теорія функціонально-семантичного поля і її застосування в зіставному мовознавстві. Мовознавство. 2007. № 4–5.С. 13–19.
22. Кухаренко В. А. Інтерпретація тексту : навчальний посібник. Вінниця : Нова книга, 2004. 272 с.
23. Липка С. І. Лексико-семантичне поле як фрагмент мовної картини світу. Наукові записки Національного університету «Острозька ака-
демія». 2015. Вип. 51. С. 255–257.
24. Масенко Л. Т. Суржик: між мовою і язиком. Київ : Кліо, 2020. 202 с.
25. Мацько Л. І. Стилістика української мови. Київ : Вища школа, 2003. 462 с.
26. Островська Л. Теоретичні проблеми синтаксису сучасної української мови : навчальний посібник. Миколаїв : Вид-во ЧНУ ім. Петра Могили, 2022. 240 с.
27. Плющ М. Я. Словоформа у семантично елементарному та ускладненому реченні : вибрані праці. Київ : Вид-во НПУ ім. М. П. Драгоманова, 2011. 362 с.
28. Плющ М. Я. Відмінок у семантико-синтаксичній структурі речення. Київ : Вид-во НПУ ім. М. П. Драгоманова, 2022. 233 с.
29. Пономарів О. Д. Культура слова. Київ : Либідь, 2011. 240 с.
30. Святобаченко І. Актуальне членування безсполучникових складних речень із рівноцінними частинами. Лінгвістичні студії. 2012. Вип. 25. С. 60–63.
31. Селіванова О. О. Сучасна лінгвістика: напрями та проблеми. Полтава : Довкілля-К, 2017. 712 с.
32. Скрильник С. В. Ступені інтерферентності у художньому та нехудожньому перекладі : автореф. дис. … канд. філол. наук. Київ, 2013.
18 с.
33. Ткаченко О. Постредактор машинного перекладу – нова професія перекладача. Стиль і переклад. 2022. Т. 1, вип. 8. С. 118-128. 34. Чередниченко О. Мова та ідентичність у глобальному світі. Вища школа. 2009. № 9. С. 67–72.
35. Bahdanau D., Cho K., Bengio Y. Neural machine translation by jointly learning to align and translate // Proceedings of the International
Conference on Learning Representations (ICLR). 2015. DOI: https://doi.org/10.48550/arXiv.1409.0473
36. L. Bentivogli та ін. Neural versus phrase-based machine translation quality: a case study /Proceedings of the 2016 conference on empirical methods in natural language processing, м. Austin, Texas. Stroudsburg, PA, USA, 2016. 257-267 с. URL: https://doi.org/10.18653/v1/d16-1025 (дата звернення: 01.02.2026)
37. Biber D., Gray B., Poonpon K. Register, genre, and style. Cambridge : Cambridge University Press, 2021. 344 с.
38. Cabré M. T., Sager J. C., DeCesaris J. A. Terminology: Theory, Methods, and Applications. Benjamins Publishing Company, John, 1999. 249 с.
39. Castilho S., Moorkens J., Gaspari F., Sennrich R., Sosoni V., Georgakopoulou P., Lohar P., Way A., Miceli-Barone A. V., Gialama M. A comparative
quality evaluation of PBSMT and NMT using professional translators // Proceedings of the URL: https://aclanthology.org/2017.mtsummitpapers.10/
40. Castilho S., та ін Is neural machine translation the new state of the art? / The prague bulletin of mathematical linguistics. 2017. Т. 108, № 1.
С. 109–120. URL: https://doi.org/10.1515/pralin-2017-0013 (дата звернення: 01.03.2026).
41. Cruse D. A. Lexical semantics. International encyclopedia of the social & behavioral sciences. 2001. С. 8758–8764. URL: https://doi.org/10.1016/b0-08-043076-7/02990-9
42. Daems J., Vandepitte S., Hartsuiker R., Macken L. Identifying the machine translation error types with the greatest impact on post-editing effort.
Frontiers in Psychology. 2017. Vol. 8. DOI:https://doi.org/10.3389/fpsyg.2017.01282
43. Sánchez-Gijón P., Moorkens J., Way A. Post-editing neural machine translation versus translation memory segments. Machine Translation. 2019.Т. 33, № 1-2. С. 31–59. URL: https://doi.org/10.1007/s10590-019-09232-x
44. Fantinuoli C., Prandi B. Towards the evaluation of automatic simultaneous speech translation from a communicative perspective. Proceedingsof the 18th international conference onspoken language translation (IWSLT 2021), м. Bangkok, Thailand (online). Stroudsburg, PA,USA, 2021. 245–254 с. URL: https://doi.org/
10.18653/v1/2021.iwslt-1.29 (дата звернення: 13.01.2026).
45. Futrell R., Mahowald K., Gibson E. Large-scaleevidence of dependency length minimization in 37 languages. PNAS. 2015. Vol. 112(33).P. 10336–10341. DOI: https://doi.org/10.1073/pnas.1502134112
46. Halliday M. A. K., Matthiessen C. Halliday’s introduction to functional grammar. 4th ed. London : Routledge, 2014. DOI: https://doi.
org/10.4324/9780203783771
47. House J. Translation competence. Translation: the basics. 2-ге вид. London, 2023. С. 16–22.URL: https://doi.org/10.4324/9781003355823-3
(дата звернення: 01.02.2026).
48. ISO 18587:2017. Translation services – Post-editing of machine translation output – Requirements. Geneva : International Organization for Standardization, 2017
49. Guerberof A., Moorkens J. Machine translation and post-editing training as part of a master's programme. The journal of specialised translation.
2019. № 31. С. 217–238. URL: https://doi.org/10.26034/cm.jostrans.2019.184
50. Jia Y., Zheng B. The interaction effect between source text complexity and machine translation quality on the task difficulty of НМП postediting from English to Chinese: a multi-method study. Across languages and cultures. 2022.Т. 23, № 1. С. 36–55. URL: https://doi.org/10.1556/084.2022.00120
51. Krings H. P. Repairing texts: empirical investigations of machine translation post-editing processes. Kent (Ohio) : Kent State UniversityPress, 2001. URL: http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=018587984&sequence=000002&line_number=0001&func_
code=DB_RECORDS&service_type=MEDIA
52. Moorkens J. Chapter 4. Eye tracking as a measure of cognitive effort for post-editing of machine translation. Eye tracking and multidisciplinary studies on translation. Amsterdam, 2018. С. 55–70. URL: https://doi.org/10.1075/btl.143.04moo (дата звернення: 12.01.2026)
53. Läubli S., Sennrich R., Volk M. Has machine translation achieved human parity? A case for document-level evaluation. Proceedings of the
2018 conference on empirical methods in natural language processing, м. Brussels, Belgium. Stroudsburg, PA, USA, 2018. 4791–4796 с.
URL: https://doi.org/10.18653/v1/d18-1512
54. Mac Ruairc G. Stephen O’Brien (2016) Inside Education: Exploring the Art of Good Learning // Irish Journal of Sociology. 2017.Vol. 26, No. 1. P. 130–131. DOI: https://doi.org/10.1177/0791603517731006
55. Pym A. Exploring translation theories. 3rd ed. London ; New York : Routledge, 2023. 256 с. DOI: https://doi.org/10.4324/9781003383130
56. Temmerman, R. Towards new ways of terminology description. Amsterdam: John Benjamins, 2000.276 с. DOI: https://doi.org/10.1075/tlrp.3
57. Toral A., Sánchez-Cartagena V. M. A multifaceted evaluation of neural versus phrase-based machine translation for 9 language directions. Proceedings
of the 15th conference of the european chapter of the association for computational linguistics: volume 1, long papers, м. Valencia, Spain. Stroudsburg, PA, USA, 2017. 1063–1073 с.URL: https://doi.org/10.18653/v1/e17-1100
58. Torrejón E., Rico C. Skills and profile of the new role of the translator as MT posteditor. Tradumàtica: tecnologies de la traducció. 2013. № 10. С. 166. URL: https://
doi.org/10.5565/rev/tradumatica.18 (дата звернення: 02.03.2026).
59. Skrylnyk S. V. Linguistic-cognitive economy index in simultaneous interpreting. Тrаnscarpathian philological studies. 2025. Т. 2, № 44.
С.145–152. URL: https://doi.org/10.32782/tps2663-4880/2025.44.2.25 (дата звернення:09.03.2026).
60. Skrylnyk S. Token-Level Post-Editing Dataset (EN–MT–Human): English-Ukrainian Translation Edit Log (Education-Legal). Version 1.2 [Dataset]. Zenodo. CERN European Organization for Nuclear Research, 2026. DOI:https://doi.org/10.5281/zenodo.18742235
61. Vaswani, A., et al. Attention is all you need. Advances in Neural Information ProcessingSystems, 2017. 5998-6008 с. DOI: https://doi.
org/10.48550/arXiv.1706.03762
62. Vieira L. N. Indices of cognitive effort in machine translation post-editing. Machine translation. 2014. Т. 28, № 3-4. С. 187–216. URL: https://doi.org/10.1007/s10590-014-9156-x
63. Vardaro J., Schaeffer M., Hansen-Schirra S. Translation quality and error recognition in professional neural machine translation post-editing. Informatics. 2019. Т. 6, № 3. С. 41. URL: https://doi.org/10.3390/informatics6030041 (дата звернення: 01.03.2026).
64. Yamada M. Impact of google neural machine translation on post-editing by student translators. The journal of specialised translation. 2019. № 31. С. 87–106. URL: https://doi.org/10.26034/cm.jostrans.2019.178

This work is licensed under a Creative Commons Attribution 4.0 International License.
ISSN 
.png)



