Avaliação humana da tradução automática de combinações lexicais especializadas: o caso do Google Translate e do DeepL

Autores

DOI:

https://doi.org/10.26512/belasinfieis.v9.n4.2020.26755

Palavras-chave:

Tradução automática. Textos jurídicos. Combinações lexicais especializadas. Avaliação da tradução.

Resumo

Este trabalho se propõe a avaliar a tradução automática feita pelos sistemas Google Translate e DeepL especificamente em relação a combinações lexicais especializadas (L’HOMME; BERTRAND, 2000) compostas por verbo+substantivo extraídas de textos jurídicos chamados “cláusulas arbitrais”. Nós apresentamos uma metodologia para selecionar as combinações lexicais especializadas e avaliar a adequação e a fluência das traduções produzidas pelos sistemas em questão. Os resultados obtidos estão alinhados com recentes pesquisas na área de tradução automática baseada em redes neurais (NMT) que indicam que esse tipo de tecnologia tem um desempenho melhor no parâmetro “fluência” do que no parâmetro “adequação” (KOEHN; KNOWLES, 2017). Em relação à precisão terminológica, houve ocorrências de tradução de termos diferentes na língua-fonte para o mesmo termo na língua-alvo em uma mesma frase, o que muitas vezes pode ser inadequado em textos técnicos e contraria a percepção bastante comum de que a tradução automática produz resultados consistentes, sendo mais adequada à tradução especializada. Ainda assim, e apesar das limitações apontadas neste estudo, as avaliações das traduções das combinações lexicais foram bastante satisfatórias.

Downloads

Não há dados estatísticos.

Biografia do Autor

Thais Miranda e Borges, Pesquisadora autônoma

Especialista em Técnicas, Práticas e Estudos da Tradução Inglês-Português (2019) e Bacharel em Direto (2013) pela Pontifícia Universidade Católica do Rio de Janeiro. Pesquisadora autônoma. Rio de Janeiro, Rio de Janeiro, Brasil.

Janine Maria Mendonça Pimentel, Universidade Federal do Rio de Janeiro

Professora adjunta I na Universidade Federal do Rio de Janeiro. Doutora em Estudos de Tradução (2012) pela Université de Montréal, Canada. Mestre em Lexicologia, Lexicografia e Terminologia (2007) e graduada em Estudos Ingleses e Alemães (2003) pela Universidade Nova de Lisboa, Portugal. Realizou estágio pós-doutoral (2013-2014) na Pontifícia Universidade Católica do Rio de Janeiro. Universidade Federal do Rio de Janeiro, Faculdade de Letras, Departamento de Anglo-Germânicas, Programa Interdisciplinar de Pós-Graduação em Linguística Aplicada. Rio de Janeiro, Rio de Janeiro, Brasil.

Referências

ARNOLD, Doug. Why translation is difficult for computers. In: SOMERS, Harold (Ed.). Computers and translation: a translator’s guide. Amsterdam: John Benjamins, 2003. p. 119-142. doi: https://doi.org/10.1075/btl.35.11arn

CASTILHO, Sheila; O’BRIEN, Sharon. Acceptability of machine-translated content: A multi-language evaluation by translators and end-users. Linguistica Antverpiensia ”“ New Series: Themes in Translation Studies, v. 16, p. 120-136, 2017. Disponível em: https://lans-tts.uantwerpen.be/index.php/LANS-TTS/article/view/430. Acesso em: 26 dez. 2019.

CASTILHO, Sheila; DOHERTY, Stephen; GASPARI, Federico; MOORKENS, Joss. Approaches to Human and Machine Translation Quality Assessment. In: MOORKENS, Joss; CASTILHO, Sheila; GASPARI, Federico; DOHERTY, Stephen (Ed.). Translation quality assessment: From principles to practice. Cham: Springer, 2018. p. 9-38. doi: https://doi.org/10.1007/978-3-319-91241-7_2

CASTRO, Marcílio M. Dicionário de Direito, Economia e Contabilidade ”“ Português-Inglês/Inglês-Português. Rio de Janeiro: Forense, 2013.

CONSTANT, Mathieu et al. Multiword expression processing: A survey. Computational Linguistics, v. 43, n. 4, p. 1-92, 2017. Disponível em: https://www.mitpressjournals.org/doi/full/10.1162/COLI_a_00302. Acesso em: 29 dez. 2019. doi: https://doi.org/10.1162/COLI_a_00302

CRYSTAL, David. The language revolution. Cambridge/Malden: Polity Press, 2004.

PÉREZ-HERNÁNDEZ, Chantal; ORTIZ, Antonio Moreno; FABER, Pamela. Lexicografia Computacional y Lexicografia de Corpus. Revista Española de Lingüística Aplicada: Panorama de la investigación em lingúistica informática, v. 1, p. 175-214, 1999. Disponível em: https://www.researchgate.net/publication/28106208_Lexicografia_computacional_y_lexicografia_de_corpus. Acesso em: 26 dez. 2019.

FIEDERER, Rebecca; O’BRIEN, Sharon. Quality and machine translation: A realistic objective? The Journal of Specialized Translation, v. 11, p. 52-74, 2009. Disponível em: https://www.jostrans.org/issue11/art_fiederer_obrien.pdf. Acesso em: 26 dez 2019.

FROTA, Maria Paula. Erros e lapsos de tradução: um tema para o ensino. Cadernos de Tradução, Florianópolis, v. 1, n. 17, p. 141-156, 2006. Disponível em: https://periodicos.ufsc.br/index.php/traducao/article/view/6859. Acesso em: 26 dez 2019.

HASSAN, Hany et al. Achieving human parity on automatic Chinese to English news translation. Relatório da Microsoft. 2018. Disponível em: https://www.microsoft.com/en-us/research/publication/achieving-human-parity-on-automatic-chinese-to-english-news-translation. Acesso em: 10 dez 2019.

HEID, Ulrich. On the way words work together ”“ Topics in lexical combinatorics. In: MARTIN, Willy et al. (Org.). Proceedings of the Euralex ‘94. Amsterdam: EURALEX, 2014. p. 226-257.

KOEHN, Philipp; KNOWLES, Rebecca. Six challenges for neural machine translation. In: Proceedings of the First Workshop on Neural Machine Translation. Vancouver (Canadá), 2017. p. 28-39. doi: https://doi.org/10.18653/v1/W17-3204

L’HOMME, Marie-Claude; BERTRAND, Claudine. Specialized lexical combinations: Should they be described as collocations or in terms of selectional restrictions. In: EVERT, Stefan et al. Proceedings of the Ninth Euralex International Congress. Stuttgart: EURALEX, 2000. p. 497-506.

MARTÃN, Beatriz. Translations quality assessment of google translate and microsoft bing translation. 2016. 45f. TCC (Graduação em Estudos Ingleses) ”“ Faculdade de Filosofia e Letras, Departamento de Filologia Inglesa, Universidad de Valladolid, Valladolid, 2017. Disponível em: https://uvadoc.uva.es/bitstream/handle/10324/22596/TFG_F_2017_7.pdf;jsessionid=153C84743864859CEF93398BDB9D818A?sequence=1. Acesso em: 26 dez 2019.

MUNDAY, Jeremy. Introducing translation studies: Theories and applications. 3. ed. Londres: Routledge. 2012. doi: https://doi.org/10.4324/9780203121252

MUZII, Luigi. Quality assessment and economic sustainability of translation. Rivista internazionale di técnica della traduzione, v. 9, p. 15-38, 2006. Disponível em: https://www.openstarts.units.it/bitstream/10077/2891/1/ritt9_05muzii.pdf. Acesso em: 27 dez. 2019.

ORENHA, Adriane. Unidades fraseológicas especializadas: colocações e colocações estendidas em contratos sociais e estatutos sociais traduzidos no modo juramentado e não-juramentado. 2009. 290f. Tese (Doutorado em Estudos Linguísticos) ”“ Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2009. Disponível em: https://repositorio.unesp.br/bitstream/handle/11449/103524/orenha_a_dr_sjrp.pdf?sequence=1&isAllowed=y. Acesso em: 27 dez. 2019.

PIMENTEL, Janine. Specialized verbs and specialized uses of verbs in a comparable corpus of judgments produced in Canada, Portugal and Brazil. In: DROUIN, Patrick et al. (Org.). Multiple perspectives on terminological variation. Amsterdam/Filadélfia: John Benjamins, 2017. p. 109-130. doi: https://doi.org/10.1075/tlrp.18.05pim

RAMISCH, Carlos. Multi-word terminology extraction for domain-specific documents. Advisor: Christian Boitet. 2009. 77f. Mémoire (Master de Recherche en Infromatique ”“ Option Intelligence Artificielle et Web) ”“ Institut National Polytechnique de Grenoble, Grenoble, 2009. Disponível em: https://pdfs.semanticscholar.org/79b6/a43105df36fe6e507adc8fa67dfa4d9f9d19.pdf?_ga=2.54638955.1171411335.1577447828-749771379.1577447828. Acesso em: 27 dez. 2019.

SAG, Ivan A.; BALDWIN, Timothy; BOND, Francis; COPESTAKE, Ann; FLICKINGER, Dan. Multiword expressions: A pain in the neck for NLP. In: INTERNATIONAL CONFERENCE ON INTELLIGENT TEXT PROCESSING AND COMPUTATIONAL LINGUISTICS, 3., 2002, Cidade do México. Proceedings… Cidade do México: [s.e.], 2002. p. 1-15. doi: https://doi.org/10.1007/3-540-45715-1_1

SYCZ-OPOŃ, Joanna. Machine translation ”“ Can it assist in professional translation of contracts?, International Journal of Legal Discourse, v. 20, p. 81-200, 2014. Disponível em: https://pressto.amu.edu.pl/index.php/cl/article/view/6524. Acesso em: 27 dez. 2019.

TAGNIN, Stella. Os corpora: Instrumentos de auto-ajuda para o tradutor. Cadernos de Tradução, Florianópolis, v.9, n. 9, p. 191-213, 2002. Disponível em: https://periodicos.ufsc.br/index.php/traducao/article/view/5986/5690. Acesso em: 27 dez. 2019.

TEIXEIRA, Michel. O jogo da avaliação: um estudo prático sobre tradução automática. 2018. 134f. Dissertação (Mestrado em Estudos da Linguagem) ”“ Programa de Pós-Graduação em Estudos da Linguagem, Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2018. Disponível em: https://www.maxwell.vrac.puc-rio.br/41711/41711.PDF. Acesso em: 27 dez. 2019.

VILLAVICENCIO, Aline; RAMISCH, Carlos. Chutando o balde ou batendo as botas? Processamento de linguagem natural e expressões multipalavra na linguagem cotidiana e científica. In: PERNA, Cristina; DELGADO, Heloisa; FINATTO, Maria José (Org.) Linguagens especializadas em corpora modos de dizer e interfaces de pesquisa. Porto Alegre: EDIPUCRS, 2010. p. 29-49.

WAQUIL, Marina. Tradução de textos especializados: unidades fraseológicas especializadas e técnicas tradutórias. 2013. 206f. Dissertação (Mestrado em Letras) ”“ Programa de Pós-Graduação em Letras, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2013. Disponível em: https://www.lume.ufrgs.br/bitstream/handle/10183/72737/000883531.pdf?sequence=1&isAllowed=y. Acesso em: 27 dez. 2019.

WU, Yonghui et al. Google’s neural machine translation system: Bridging the gap between human and machine translation. ArXiv, p. 1-23, 2016. Disponível em: https://arxiv.org/pdf/1609.08144.pdf. Acesso em: 10 dez. 2019.

Downloads

Publicado

29-07-2020

Como Citar

BORGES, Thais Miranda e; PIMENTEL, Janine Maria Mendonça. Avaliação humana da tradução automática de combinações lexicais especializadas: o caso do Google Translate e do DeepL. Belas Infiéis, Brasília, Brasil, v. 9, n. 4, p. 21–43, 2020. DOI: 10.26512/belasinfieis.v9.n4.2020.26755. Disponível em: https://periodicos.unb.br/index.php/belasinfieis/article/view/26755. Acesso em: 21 nov. 2024.