Avaliação humana da tradução automática de combinações lexicais especializadas: o caso do Google Translate e do DeepL
DOI :
https://doi.org/10.26512/belasinfieis.v9.n4.2020.26755Mots-clés :
Tradução automática. Textos jurídicos. Combinações lexicais especializadas. Avaliação da tradução.Résumé
Este trabalho se propõe a avaliar a tradução automática feita pelos sistemas Google Translate e DeepL especificamente em relação a combinações lexicais especializadas (L’HOMME; BERTRAND, 2000) compostas por verbo+substantivo extraídas de textos jurídicos chamados “cláusulas arbitrais”. Nós apresentamos uma metodologia para selecionar as combinações lexicais especializadas e avaliar a adequação e a fluência das traduções produzidas pelos sistemas em questão. Os resultados obtidos estão alinhados com recentes pesquisas na área de tradução automática baseada em redes neurais (NMT) que indicam que esse tipo de tecnologia tem um desempenho melhor no parâmetro “fluência” do que no parâmetro “adequação” (KOEHN; KNOWLES, 2017). Em relação à precisão terminológica, houve ocorrências de tradução de termos diferentes na língua-fonte para o mesmo termo na língua-alvo em uma mesma frase, o que muitas vezes pode ser inadequado em textos técnicos e contraria a percepção bastante comum de que a tradução automática produz resultados consistentes, sendo mais adequada à tradução especializada. Ainda assim, e apesar das limitações apontadas neste estudo, as avaliações das traduções das combinações lexicais foram bastante satisfatórias.
Téléchargements
Références
ARNOLD, Doug. Why translation is difficult for computers. In: SOMERS, Harold (Ed.). Computers and translation: a translator’s guide. Amsterdam: John Benjamins, 2003. p. 119-142. doi: https://doi.org/10.1075/btl.35.11arn
CASTILHO, Sheila; O’BRIEN, Sharon. Acceptability of machine-translated content: A multi-language evaluation by translators and end-users. Linguistica Antverpiensia ”“ New Series: Themes in Translation Studies, v. 16, p. 120-136, 2017. Disponível em: https://lans-tts.uantwerpen.be/index.php/LANS-TTS/article/view/430. Acesso em: 26 dez. 2019.
CASTILHO, Sheila; DOHERTY, Stephen; GASPARI, Federico; MOORKENS, Joss. Approaches to Human and Machine Translation Quality Assessment. In: MOORKENS, Joss; CASTILHO, Sheila; GASPARI, Federico; DOHERTY, Stephen (Ed.). Translation quality assessment: From principles to practice. Cham: Springer, 2018. p. 9-38. doi: https://doi.org/10.1007/978-3-319-91241-7_2
CASTRO, Marcílio M. Dicionário de Direito, Economia e Contabilidade ”“ Português-Inglês/Inglês-Português. Rio de Janeiro: Forense, 2013.
CONSTANT, Mathieu et al. Multiword expression processing: A survey. Computational Linguistics, v. 43, n. 4, p. 1-92, 2017. Disponível em: https://www.mitpressjournals.org/doi/full/10.1162/COLI_a_00302. Acesso em: 29 dez. 2019. doi: https://doi.org/10.1162/COLI_a_00302
CRYSTAL, David. The language revolution. Cambridge/Malden: Polity Press, 2004.
PÉREZ-HERNÁNDEZ, Chantal; ORTIZ, Antonio Moreno; FABER, Pamela. Lexicografia Computacional y Lexicografia de Corpus. Revista Española de Lingüística Aplicada: Panorama de la investigación em lingúistica informática, v. 1, p. 175-214, 1999. Disponível em: https://www.researchgate.net/publication/28106208_Lexicografia_computacional_y_lexicografia_de_corpus. Acesso em: 26 dez. 2019.
FIEDERER, Rebecca; O’BRIEN, Sharon. Quality and machine translation: A realistic objective? The Journal of Specialized Translation, v. 11, p. 52-74, 2009. Disponível em: https://www.jostrans.org/issue11/art_fiederer_obrien.pdf. Acesso em: 26 dez 2019.
FROTA, Maria Paula. Erros e lapsos de tradução: um tema para o ensino. Cadernos de Tradução, Florianópolis, v. 1, n. 17, p. 141-156, 2006. Disponível em: https://periodicos.ufsc.br/index.php/traducao/article/view/6859. Acesso em: 26 dez 2019.
HASSAN, Hany et al. Achieving human parity on automatic Chinese to English news translation. Relatório da Microsoft. 2018. Disponível em: https://www.microsoft.com/en-us/research/publication/achieving-human-parity-on-automatic-chinese-to-english-news-translation. Acesso em: 10 dez 2019.
HEID, Ulrich. On the way words work together ”“ Topics in lexical combinatorics. In: MARTIN, Willy et al. (Org.). Proceedings of the Euralex ‘94. Amsterdam: EURALEX, 2014. p. 226-257.
KOEHN, Philipp; KNOWLES, Rebecca. Six challenges for neural machine translation. In: Proceedings of the First Workshop on Neural Machine Translation. Vancouver (Canadá), 2017. p. 28-39. doi: https://doi.org/10.18653/v1/W17-3204
L’HOMME, Marie-Claude; BERTRAND, Claudine. Specialized lexical combinations: Should they be described as collocations or in terms of selectional restrictions. In: EVERT, Stefan et al. Proceedings of the Ninth Euralex International Congress. Stuttgart: EURALEX, 2000. p. 497-506.
MARTÃN, Beatriz. Translations quality assessment of google translate and microsoft bing translation. 2016. 45f. TCC (Graduação em Estudos Ingleses) ”“ Faculdade de Filosofia e Letras, Departamento de Filologia Inglesa, Universidad de Valladolid, Valladolid, 2017. Disponível em: https://uvadoc.uva.es/bitstream/handle/10324/22596/TFG_F_2017_7.pdf;jsessionid=153C84743864859CEF93398BDB9D818A?sequence=1. Acesso em: 26 dez 2019.
MUNDAY, Jeremy. Introducing translation studies: Theories and applications. 3. ed. Londres: Routledge. 2012. doi: https://doi.org/10.4324/9780203121252
MUZII, Luigi. Quality assessment and economic sustainability of translation. Rivista internazionale di técnica della traduzione, v. 9, p. 15-38, 2006. Disponível em: https://www.openstarts.units.it/bitstream/10077/2891/1/ritt9_05muzii.pdf. Acesso em: 27 dez. 2019.
ORENHA, Adriane. Unidades fraseológicas especializadas: colocações e colocações estendidas em contratos sociais e estatutos sociais traduzidos no modo juramentado e não-juramentado. 2009. 290f. Tese (Doutorado em Estudos Linguísticos) ”“ Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2009. Disponível em: https://repositorio.unesp.br/bitstream/handle/11449/103524/orenha_a_dr_sjrp.pdf?sequence=1&isAllowed=y. Acesso em: 27 dez. 2019.
PIMENTEL, Janine. Specialized verbs and specialized uses of verbs in a comparable corpus of judgments produced in Canada, Portugal and Brazil. In: DROUIN, Patrick et al. (Org.). Multiple perspectives on terminological variation. Amsterdam/Filadélfia: John Benjamins, 2017. p. 109-130. doi: https://doi.org/10.1075/tlrp.18.05pim
RAMISCH, Carlos. Multi-word terminology extraction for domain-specific documents. Advisor: Christian Boitet. 2009. 77f. Mémoire (Master de Recherche en Infromatique ”“ Option Intelligence Artificielle et Web) ”“ Institut National Polytechnique de Grenoble, Grenoble, 2009. Disponível em: https://pdfs.semanticscholar.org/79b6/a43105df36fe6e507adc8fa67dfa4d9f9d19.pdf?_ga=2.54638955.1171411335.1577447828-749771379.1577447828. Acesso em: 27 dez. 2019.
SAG, Ivan A.; BALDWIN, Timothy; BOND, Francis; COPESTAKE, Ann; FLICKINGER, Dan. Multiword expressions: A pain in the neck for NLP. In: INTERNATIONAL CONFERENCE ON INTELLIGENT TEXT PROCESSING AND COMPUTATIONAL LINGUISTICS, 3., 2002, Cidade do México. Proceedings… Cidade do México: [s.e.], 2002. p. 1-15. doi: https://doi.org/10.1007/3-540-45715-1_1
SYCZ-OPOŃ, Joanna. Machine translation ”“ Can it assist in professional translation of contracts?, International Journal of Legal Discourse, v. 20, p. 81-200, 2014. Disponível em: https://pressto.amu.edu.pl/index.php/cl/article/view/6524. Acesso em: 27 dez. 2019.
TAGNIN, Stella. Os corpora: Instrumentos de auto-ajuda para o tradutor. Cadernos de Tradução, Florianópolis, v.9, n. 9, p. 191-213, 2002. Disponível em: https://periodicos.ufsc.br/index.php/traducao/article/view/5986/5690. Acesso em: 27 dez. 2019.
TEIXEIRA, Michel. O jogo da avaliação: um estudo prático sobre tradução automática. 2018. 134f. Dissertação (Mestrado em Estudos da Linguagem) ”“ Programa de Pós-Graduação em Estudos da Linguagem, Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2018. Disponível em: https://www.maxwell.vrac.puc-rio.br/41711/41711.PDF. Acesso em: 27 dez. 2019.
VILLAVICENCIO, Aline; RAMISCH, Carlos. Chutando o balde ou batendo as botas? Processamento de linguagem natural e expressões multipalavra na linguagem cotidiana e científica. In: PERNA, Cristina; DELGADO, Heloisa; FINATTO, Maria José (Org.) Linguagens especializadas em corpora modos de dizer e interfaces de pesquisa. Porto Alegre: EDIPUCRS, 2010. p. 29-49.
WAQUIL, Marina. Tradução de textos especializados: unidades fraseológicas especializadas e técnicas tradutórias. 2013. 206f. Dissertação (Mestrado em Letras) ”“ Programa de Pós-Graduação em Letras, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2013. Disponível em: https://www.lume.ufrgs.br/bitstream/handle/10183/72737/000883531.pdf?sequence=1&isAllowed=y. Acesso em: 27 dez. 2019.
WU, Yonghui et al. Google’s neural machine translation system: Bridging the gap between human and machine translation. ArXiv, p. 1-23, 2016. Disponível em: https://arxiv.org/pdf/1609.08144.pdf. Acesso em: 10 dez. 2019.
Téléchargements
Publié-e
Comment citer
Numéro
Rubrique
Licence
(c) Tous droits réservés CC BY 2020
Cette œuvre est sous licence Creative Commons Attribution 4.0 International.
Copyright Statement
Given the public access to this journal, the texts are free to use but requires the recognition of the original authorship and initial publication in this journal to be properly stated.
The journal allows the use of works published for non-commercial purposes, including the right to submit the work to publicly accessible databases. Published contributions are the sole and exclusive responsibility of the author(s).
- When submitting papers to be evaluated by the Belas Infiéis journal, the author(s):
- Declare that the contents of the contributions are original and of their original creation, being entirely responsible for their content if there is an objection by third parties.
- Claim to be aware that they should not commit academic plagiarism.
- Declare that the manuscript has not been published, completely or partially, in Portuguese or another language. If it is a translation it should be submitted to the Translated Articles section.
- Declare that the manuscript is not being evaluated by other journals.
- Declare that the manuscript was not submitted to another journal simultaneously.
- Commit(s) to inform the journal of any kind of error or inaccuracy in their contribution (published, in evaluation or in editing) and to collaborate with the editors to make due corrections of the article (when in evaluation or editing) or erratum/retraction (after publication).
- Declare that there is no conflict of interest regarding the published work.
- Authorize its release if it is accepted for publication without any kind of monetary compensation.
- Agree to assign non-exclusive rights to publication to the magazine, remaining free to make their contribution available in other media as long as the publication of the first version in Belas Infiéis magazine is mentioned. They also authorize Belas Infiéis to assign their texts for reproduction in content indexers, virtual libraries and similar platforms.
- Maintain copyright and grant the journal the right of first publication, the work being licensed under theCreative Commons Attribution License.
- Is/Are allowed and encouraged to publish and distribute their work online after the editorial process, which may increase the impact and citation of the published work.
- Authorize the editorial team to make textual adjustments and to adapt the article to the publication rules, when necessary.