THE USAGE OF LEXICAL AND SEMANTIC ANALYSIS IN MACHINE TRANSLATION AND CREATION OF ELECTRONIC SEARCH ENGINES

  • G. O. KHATSER
Keywords: lexical and semantic analysis, machine translation, transformation and semantic model of the translation, semantic connections, the algorithm of machine translation, text analysis, the role structure of the sentence

Abstract

The article is dedicated to the issue of lexical and semantic analysis usage in automatic translation systems, electronic search engines and text analysis software. Lexical and semantic analysis consists of four stages described in this paper, namely a split of the text / sentence into structural elements; semantic interpretation building of certain words and constructions; extraction of the main and meaningful parts of the text; and identifying “meaningful” semantic relations between elements. To conduct semantic analysis and to identify its peculiarities during the machine translation and search of the relevant information, the semantic analysis program “ParSem” is introduced. It is built on the basis of the world resource WordNet, a large lexical database of English which is regarded as one of the most useful tools in the natural language processing. The model of the sentence role structure (the identification of agents, patiens, benefacts, experiencers, addressees, etc.) helps to determine specific roles of the particular predicative words, groups or frames consisted both of predicates and other parts of the sentence. The search of semantic relations is conducted within a triangle “actants – action – circonstants.” Moreover, the inherent cases play a significant role in the analysis. In general, semantic structures are built with their help. The article describes eight verbal groups and eleven semantic structures implemented within the program. Besides, in the paper principles of transformation and semantic model of the translation are also given as the algorithm of machine translation. They are regarded as the significant constituent part for the machine translation and information search conducted by a computer or other electronic devices.

References

1. Апресян Ю. Д. Исследования по семантике и лексикографии / Ю. Д. Апресян. – М.: Языки славянских культур, 2009. – 568с.
2. Большакова Е. И., Клышинский Э. С., Ландэ Д. В. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие / Е. И. Большакова, Э. С. Клышинский, Д. В. Ландэ. – М. : МИЭМ, 2011. – 272 с.
3. Комиссаров В. Н. Теория перевода (лингвистические аспекты) / В. Н. Комиссаров. – М: Высшая школа, 2002, 253 с.
4. Митина О. В., Евдокименко А. С. Методы анализа текста : методологические основания и программная реализация / О. В. Митина, А. С. Евдокименко // Вестник Южно-Уральского государственного университета, 2010. – № 40 (216). – С. 29-38.
5. Мочалова А. В. Алгоритм семантического анализа текста, основанный на базовых семантических шаблонах с удалением / А. В. Мочалова // Научно-технический вестник информационных технологий, механики и оптики // Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2014. – № 5 (93). – С. 126-132.
6. Рейтинг Top Ten Reviews. – 2016. – [Електронний ресурс]. – Режим доступу : http://www.toptenreviews.com/business/software/best-translation-software/
7. Селіванова О. О. Світ свідомості в мові. Монографічне видання / О. О. Селіванова. – Черкаси : Ю. Чабаненко, 2012. – 488 с.
8. Сокирко А. В. Семантические словари в автоматической обработке текста : По материалам системы ДИАЛИНГ: диссертация ... кандидата технических наук: 05.13.17 / А. В. Сокирко. – Москва, 2001. – 120 с.
9. Стадульская Н. А. Компонентный анализ значения слова как способ выявления содержания концепта / Н. А. Стадульская // Вестник Челябинского государственного университета. – 2012. – № 32 (286). Филология. Искусствоведение. Вып. 71. – С. 112–117.
10. Чапайкина Н. Е. Семантический анализ текстов. Основные положення / Н. Е. Чапайкина // Молодой ученый. – 2012. – № 5. – С. 112-115.
11. Что такое семантика и зачем нужен семантический анализ текста? – [Електронний ресурс]. – Режим доступу : http://mastersloga.ru/chto-takoe-semantika/
12. Шелманов А. О. Исследование методов автоматического анализа текстов и разработка интегрированной системы семантико-синтаксического анализа. Дисс. кан.н. / А. О. Шелманов. – М., 2015. – 210 с.
13. Bilotti M. W., Ogilvie P., Callan J., Nyberg, E. Structured retrieval forquestion answering. In Proceedings of SIGIR / M. W. Bilotti, P. Ogilvie, J. Callan, E Nyberg. – NY, 2007. – 131 p.
14. Dipanjan Das. Semi-supervised and latent-variable models of natural language semantics : PhD thesis. – CarnegieMellon University, Pittsburgh, Pennsylvania, USA, 2012. – [Електронний ресурс]. – Режим доступу : http: //www.dipanjandas.com/files/thesis.pdf
15. Foltz P. W. Latent Semantic Analysis for Text-Based Research. Behavior Research Methods, Instruments and Computers / Foltz P. – 28 (2), 2014. – Р. 197-202.
16. Harry D. Moving Past the Keyword : Understanding Semantic Analysis. Electronic Resource / D. Harry. – September 15, 2015. – Режим доступу до ресурсу: http://seocopywriting.com/beyond-keywords-understanding-semantic-analysis/?hvid=4JhfkN
17. Schneider N. Lexical Semantic Analysis in Natural Language Text. Language Technologies Institute / N. Schneider. School of Computer Science. – CarnegieMellon University, 2012. – 78 р.
18. Weston J., Ratle F., and Collobert R. Deep learning via semi-supervised embedding.In Proceedings of ICML / J. Weston, F. Ratle, R. Collobert. – CarnegieMellon University, 2008. – Р. 22.
19. Wu D. and Fung P. Semantic roles for SMT : a hybrid two-pass model. In Proceedings of NAACL / D. Wu, P. Fung. – University of Pennsylvania, 2009. – 185 р.
Published
2017-02-28
How to Cite
KHATSER, G. O. (2017). THE USAGE OF LEXICAL AND SEMANTIC ANALYSIS IN MACHINE TRANSLATION AND CREATION OF ELECTRONIC SEARCH ENGINES. New Philology, (69), 202-207. Retrieved from http://www.novafilolohiia.zp.ua/index.php/new-philology/article/view/325
Section
Articles