当前位置:论文网 > 论文宝库 > 外语文学类 > 外语翻译论文 > 正文

言外语境在中德机械翻译中的应用

来源:UC论文网2020-10-31 09:39

摘要:

  摘要:翻译是一个极其复杂的过程,从源语言的输入到目的语的输出是各种主客体因素综合作用下的结果。现有的机器翻译系统进行翻译的依据基本都是我们所输入的源语言的句子,这也是现有机械翻译不够“智能”、太过死板的根本原因。本文从语言外语境的角度入手,研究如何在现有机械翻译的基础上加上语言外语境的约束,使机械翻译输出的目的语更准确、更切合目的语的文化背景和社会背景。  关键词:机械翻译语用学言外语境  自...

  摘要:翻译是一个极其复杂的过程,从源语言的输入到目的语的输出是各种主客体因素综合作用下的结果。现有的机器翻译系统进行翻译的依据基本都是我们所输入的源语言的句子,这也是现有机械翻译不够“智能”、太过死板的根本原因。本文从语言外语境的角度入手,研究如何在现有机械翻译的基础上加上语言外语境的约束,使机械翻译输出的目的语更准确、更切合目的语的文化背景和社会背景。


  关键词:机械翻译语用学言外语境


  自从人工智能翻译飞速发展并在翻译界占据半壁江山之后,其与人工翻译之间的矛盾便一直存在。那么机械翻译能否取代人工翻译呢,在第十七届全国翻译研讨会上讯飞北京研究院院长、讯飞AI研究院副院长王士进在说,人工智能在全球范围内掀起发展高潮,不仅是作为各个国家和地区的战略发展重点,更体现在传统工业上改变了人们的生产和生活模式。但王士进院长强调我们应该理性地看待机器翻译,机器翻译虽然在不断地进步,但就目前来看并不能完全满足翻译的需求。普通机器翻译的优势是高速低成本,但是在涉及多重语境或者复杂的背景知识下的翻译时,机器的弊病也显露无遗。


  一、机械翻译现状


  2018年3月15日,微软亚洲研究院与雷德蒙研究院的研究人员组成的团队所研发出的机械翻译系统在通用新闻报道领域的中译英测试方面达到了人类专业译者的水平,这是在机械翻译发展史上具有里程碑意义的重大事件,也是第一个在新闻报道的翻译质量和准确率等方面媲美人类专业译者的翻译系统。尽管如此,机械翻译的弊端并没有从根本上被解决。一方面,达到人类专业译者水准的翻译系统只局限在新闻报道的翻译这一个情景中,并不适用与其他情景;另一方面,开发此系统所消耗的大量人力物力也决定了这种系统不可能短时间内进行大范围普及。


  当前市面上流行的翻译软件主要可以划分为基于规则(Rule-Based)和基于语料库(Corpus-Based)两大类。基于规则的翻译软件是比较传统的机械翻译,它由词典和规则库构成知识源,运用语法和语义理论生成目的语。基于语料库的翻译软件是比较现代的机械翻译,它的知识源是语料库,经过语料库的筛选和模仿实现目的语的输出。然而两者都存在明显的缺陷,基于规则依靠词典和规则库构成知识源过于死板,输出目的语的效率和质量都不高,实用性低;基于语料库虽然摆脱了复杂的词典和死板的语法规则,但是其统计规律并不稳定,其原因在于:基于统计的方法需要大规模双语语料,翻译模型、语言模型参数的准确性直接依赖于语料的多少,而翻译质量的高低主要取决于概率模型的好坏和语料库的覆盖能力。


  二、语用学及语境


  语用学是在相应的情境下对话语进行研究,目的是让人们能够懂得在各种交际环境当中正确地理解语言和准确地应用语言。语言学中的语用学指出词的词义都是潜在的、游离不定的,它会随着语用环境而发生变化,因此是不可靠的。只有在实际的语言环境中才能确定某个词或某句话,乃至某篇文章的真正语义。如果我们要准确地完成从源语言到目的语的翻译,就必须考虑语境这种语言外因素。语言交流并不是语言内部的事,他还与时间、地点、场合、语言使用者、交际目的等诸多语言外的因素有密切的关系。这些就是我们进行言语交际时所依赖的语境。


  语境可以从广义上分为语言内语境及语言外语境,语言内语境指的就是词、短语、句子及语言的上下文;语言外语境指的是语言产生的环境,它包括个人的认知、社会文化背景、语言产生的时间地点等因素。当前主流翻译软件进行翻译的依据主要是语言中的词、短语、句子;刘海军提出的机械翻译系统可以以人工智能机械翻译系统为基础,分析出句子的主谓宾等成分,构成篇章环境的局部信息,从局部信息中精炼出篇章的全局信息,从而构造了一个句子翻译时的环境。把语言的上下文环境纳入机械翻译的范围,但是关于语言外因素在机械翻译中的应用的研究并不多,由于个人认知等主观因素无法把握,本文研究的语言外因素主要是社会文化背景及言语交际发生的时间、地点、场合等客观因素。


  三、语境在机械翻译上的应用


  作为外语专业的学生基本都经历过情景模拟的学习方法,即假设一个情景并以該情景为背景进行对话的练习和学习以提高语言的学习效率。有过翻译经验的人也都知道,情景和相对应的背景知识在翻译实践中是至关重要的,有经验的口译员为了特定的目标翻译任务需要数周乃至一个月的时间进行准备。如果可以在计算机翻译程序中加入与外语学习时相类似的情景模拟程序再加上相对应的筛选系统,一定可以大大提高机器翻译的准确度,使之在高速低成本的基础上再增加相对高效的优势。而机器没有人的思维,如何在进行机械翻译的同时考虑到言外语境的因素呢,我们可以在输入源语言的同时运用语用学理论进行模拟情境的生成,从而在计算机进行人工智能翻译的过程中进行关联检索,使之输出的目的语因为语言外语境因素中的部分因素被确定而更加准确。模拟情景构建的过程发生在机器翻译软件进行人工智能翻译之前,模拟情景的方法既可以是限定关键词,也可以是指定特定的场景。


  (一)时间地点形式限定


  限定关键词主要是对源语言的时间地点等因素进行限定,以德语为例,言语交际发生的时间、地点不同,其中所蕴含的社会文化背景就有差异,言语所表达的意思也就会不同。德国是世界上最大的德语国家,但同时德语也有很多变体和方言,大约有800万的德语母语者居住在奥地利,在瑞士也有很多人讲德语,这也是瑞士的官方语言之一。尽管德语使用者在奥地利和瑞士这两个国家都不会有理解上的问题,因为他们都会适度使用一些标准德语,但还是要考虑到奥地利和瑞士的德语在很多方面都有所区分。例如,土豆在德国德语中的表达是Kartoffel,而在奥地利德语中的表达是Erdapfel。除此之外,德国的州与州之间,南北部之间德语的用法也存在差异。我们如果能够在输入源语言的同时进行关键词的限制,计算机就可以在检索语料库的同时根据关键词的限定匹配到更合适的目的语。


  例如,在中德翻译中的称呼问题上,中国的贬自尊人的传统理念形成了以职业、职务、职称、学位、取代名字和就高不就低的称呼原则,但是这些在中国社会必须遵守的交际原则在德国却不适用,在那里职业通常不与称呼挂钩,没有人称呼LehrerMeier,DirektorMeier的,而是一律用Herr/Frau+Name来称呼对方,这些文化差异给德译中时的机器翻译造成了很大的障碍。如果在输入源语言的同时进行情景模拟构建的话就可以解决这种问题,人工智能翻译系统会在进行机器翻译的同时按照设定好的情景或者关键词把HerrLi翻译为李老师、李医生或者李经理。如果根据指示牌上的德语:IHK-Stock6,Zimmer608.来进行翻译:德国工商会办公室位于6层608房间,刚到德国的中国客人肯定找不到他们要去的地方,因为德国的层数不算底层,而是从二层算起。如果事先把语境的地点设定为德国在进行翻译,就会得到准确的答案:德国工商会办公室在7层608房间。


  除了时间、地点因素外,具有浓厚社会文化背景的俗语、成语包括中文的古文都是翻译中的重点和难点,也是口译和笔译工作者需要格外重视的地方。在3月12日举行的外交部例行记者会上,外交部发言人耿爽在回答路透社记者提问的问题时,引用了一句中国的古语“行有不得,反求诸己”并向提问的路透社记者问道:“知道什么意思吗”。显然这句古语让外国的翻译工作者们束手无策,对于我们国内的翻译工作者们来说也是一个不小的挑战。从机械翻译的角度来说,我们把这句古语用谷歌翻译的中翻德模式翻译成德语输出的目的语是“Tuwasdukannst”,这显然是不对的。那么运用情景模拟的方法,在输入这句古语的同时选择一个中文古语翻译的关键词,使计算机在一个中间平台先把中文的古语转化为白话文:“遇到什么困难挫折,不要去责怪抱怨别人,一定要多从自己身上找问题。”再把它翻译成德语:“WennSieaufSchwierigkeitenoderFrustrationenstoen,beschuldigenSiesichnichtundbeschwerenSiesichüberandere.StellenSiesicher,dassSiemehrProblemevonsichselbstfinden.”就可以知道大概的意思了。


  (二)場合限定


  指定特定的场景即在输入源语言的同时为使用者提供几种情景的选择,比如严肃的商务会谈会用到更多的和贸易、金融有关的单词和句子,轻松的八卦闲聊会涉及更多跟新闻、年轻人使用的网络用语等,专业的不同领域学术探讨会出现很多专业领域的专有名词。这些特定的情景中会包含与之相关的语义场,这样在计算机进行人工智能翻译的过程中就可以通过语义场来进行快速准确地检索,从而提高生成目的语的准确度,这种通过语义场检索的方式和普通的人工智能翻译软件不同,除了要进行翻译的目标语的语义场还有场景关键词的语义场。


  例如,我们把德语例句“BittebesttigenSiediesenZuschlag”输入到谷歌翻译的中翻德模式中,得到的目的语就是“请确认此附加费”。“Zuschlag”在德语中的意思一般指附加费、追加费和拍卖成交时的拍板等,但是它还有其他几个不同的意思,如在经济领域“Zuschlag”指的是订货的意思,在工业领域还有助溶剂、添加剂的意思,那么我们就不能确定源语言的译文是“请确认此附加费”、“请确认订货”还是“请确认添加剂”。如果进行翻译的是人工翻译,那么译者可以根据不同的情景来确定单词的具体含义,但是当前市面上流行的机器翻译并不具备这种功能。按照本研究的理论在输入源语言的同时确定源语言产生的情景——选择经济领域或者工业领域,就能使计算机在进行翻译的同时利用情景的语义场进行偏重性的检索匹配,从而准确地输出目的语。


  在实际的翻译实践中,语义的决定因素远远不限于两种语言的文化背景,从翻译学的角度来讲,我们要确定语义的内容,在一定程度上必须借语境这一重要手段,因为在语言使用中,词、词义和语境处于相互联系、相互制约之中。而模拟情景构建简单地讲就是在计算机进行人工智能翻译之前,就“告诉”计算机要翻译的源语言发生的语境,使机器翻译也能做到类似人工翻译的情景识别的过程,这样翻译的效率自然会提高。


  四、结语


  近年来,神经网络机械翻译的研究成为热门的前沿发展方向,然而机械翻译的发展距离完全取代人工翻译仍有一定距离。本研究并不打算与机器翻译向神经翻译过度的主流趋势对抗,而是计划在这个过渡的过程中开辟出一条支路,通过在中德机械翻译中添加关键词限定检索和情景限定检索两种方式,完善机械翻译在情景不明确的情况下的翻译机制和解决具有浓重社会文化背景的古文、成语、谚语等源语言的翻译困难的问题,使机械翻译更好地满足人类社会发展的需要并在现有的基础上得到更广泛地应用。但是本研究仍然未能突破机械翻译的根本弊端,经过完善的统计匹配翻译机制生成的目的语只是比原有的机械翻译系统在一些特定的场景下更加准确,涉及更复杂、更灵活的翻译场景并不能取代人工翻译。这也反映了人工翻译在当前时代背景下的重要性和不可替代性。

核心期刊推荐