CN103885942A - 一种快速翻译装置及方法 - Google Patents

一种快速翻译装置及方法 Download PDF

Info

Publication number
CN103885942A
CN103885942A CN201410100000.9A CN201410100000A CN103885942A CN 103885942 A CN103885942 A CN 103885942A CN 201410100000 A CN201410100000 A CN 201410100000A CN 103885942 A CN103885942 A CN 103885942A
Authority
CN
China
Prior art keywords
translated
module
simple sentence
file
storehouse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410100000.9A
Other languages
English (en)
Other versions
CN103885942B (zh
Inventor
张马成
王兴强
杨明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU URELITE INFORMATION TECHNOLOGY Co Ltd
Original Assignee
CHENGDU URELITE INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU URELITE INFORMATION TECHNOLOGY Co Ltd filed Critical CHENGDU URELITE INFORMATION TECHNOLOGY Co Ltd
Priority to CN201410100000.9A priority Critical patent/CN103885942B/zh
Publication of CN103885942A publication Critical patent/CN103885942A/zh
Application granted granted Critical
Publication of CN103885942B publication Critical patent/CN103885942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

一种快速翻译方法,包括预先将待翻译文件分配为待翻译单句的步骤,还包括将待翻译单句与历史记忆库中的单句比较的步骤;首次筛选步骤:判断该待翻译单句是否在待翻译文件中首次出现;恢复步骤,在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。一种快速翻译装置,包括历史记忆库、输入分配模块、首次判断模块、对比模块、首次筛选库、标识模块、恢复模块和显示装置,所述对比模块与历史记忆库连接,比对库中单句与输入分配模块分配得到的每一待翻译单句;所述首次判断模块判断输入分配模块分配得到的每一待翻译单句。本发明所述快速翻译装置及方法,减少了翻译文字数量并保证了译文翻译质量。

Description

一种快速翻译装置及方法
技术领域
本发明属于软件领域,涉及一种语言翻译软件,特别是一种快速翻译装置及方法。
背景技术
从上世纪80年代中期开始,基于语料和多引擎机译方法的广泛运用,翻译软件的性能和效率有了明显提高,各式各样的翻译软件如雨后春笋般问世。采用预先编写的软件程序翻译,极大提高了文本翻译的速度。
由于语言表达的特殊性,翻译软件的翻译质量一直屡遭诟病, 翻译软件的原理是将两种语言的语义一一对应的存储,翻译时机械调用替换,由于语言表达的多样性,每个字或单词往往对应不止一个意思,完全使用软件翻译所得到的译文通常不能正确表达原文含义,因此人工翻译仍然是获得高翻译质量的保证。
人工翻译的固有缺点仍然是翻译速度过慢,译员翻译时首先需要将词翻译,再组合形成符合目标语言表达习惯的句式,时间较长且不能由翻译软件替代。
发明内容
为克服翻译软件翻译质量差,人工翻译翻译速度慢的缺陷,本发明公开了一种快速翻译装置及方法。
本发明所述一种快速翻译装置,包括历史记忆库、输入分配模块、首次判断模块、对比模块、首次筛选库、标识模块、恢复模块和显示装置;
待翻译文件输入所述输入分配模块,并以整句为单位分配;
所述首次判断模块判断输入分配模块分配得到的每一待翻译单句,判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;
所述对比模块与历史记忆库连接,比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;
显示装置显示做出全部不翻译标识的待翻译文件;
所述恢复模块用于在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。
优选的,所述输入分配模块还将待翻译文件中的字母缩写识别为单句。
具体的,所述标识模块做出的不翻译标识为色彩显示异于正常显示,且为不可编辑状态。
本发明还公开了一种快速翻译方法,包括预先将待翻译文件分配为待翻译单句的步骤,还包括:
I1将待翻译单句与历史记忆库中的单句比较的步骤:比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;做出不翻译标识的单句不再进入I2步骤;
I2首次筛选步骤:判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;
I3恢复步骤:在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。
优选的,设置一匹配数组D,对每一单句,若D中没有存储与之相同的单句,则将该单句存储在D中,否则将该单句作出不翻译标识。
具体的,所述预先将待翻译文件分配为待翻译单句的步骤包括待翻译文件中的字母缩写识别为单句。
采用本发明所述的快速翻译装置及方法,对待翻译文件利用历史文件库进行预先筛选,结合自身对比进行重复过滤,减少了翻译文字数量,以句为单位对比保证译文的翻译质量,经过实际测试,本发明可以减少翻译工作量30%以上。
附图说明
图1为本发明所述快速翻译装置的一种具体实施方式结构示意图;
图2为本发明所述快速翻译方法的一种具体实施方式结构示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步的详细说明。
本发明所述快速翻译装置,包括历史记忆库、输入分配模块、首次判断模块、对比模块、首次筛选库、标识模块、恢复模块和显示装置;
待翻译文件输入所述输入分配模块,并以整句为单位分配;
所述首次判断模块判断输入分配模块分配得到的每一待翻译单句,判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;
所述对比模块与历史记忆库连接,比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;
显示装置显示做出全部不翻译标识的待翻译文件;
所述恢复模块用于在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。
应用本发明时,首先将待翻译文件输入至输入分配模块,输入分配模块按照一定规则将待翻译文件分为单句,通常的处理方式为以标点符号,例如句号、问号、省略号等作为单句分割标识符划分出单句。
历史记忆库将待翻译文件划分出的单句与历史记忆库中预先存储的单句进行比对,比对原则是完全一致,即单句中每一单词及全部单词的前后排列顺序完全一致,符合完全一致的单句做出不翻译标识。
在识别单句的过程中,本发明优选的将拥有公知含义的字母缩写作为单句单独划分出来,而不考虑该字母缩写是否被标点符号分隔,例如WTO(世界贸易组织),USA(***合众国)等,通常字母缩写位于一个句子内,则首先对比缩写,再对比该缩写所在的句子。
以最常见的英译汉为例,历史记忆库是根据以往积累或公开英汉对照文献所积累的单句或能表达完整意思的短语为单位存储的数据文件库,包括一一对应的英语原文和汉语译文,众所周知,在英语中每一单词可能存在多个意思表示,但在每一特定的句子中,该单词的意思通常固定不变,单句和约定俗成的短语的意思即使在不同的上下文语境中,意思表述也基本一致。
使用对比模块对比历史记忆库中单句文件与待翻译文件中被分割的单句单位,按照完全相同的比对原则进行筛选,筛选出的完全相同的单句在待译文件中做出不翻译标识。做出不翻译标识的单句不再进行后续的首次出现判断。
历史记忆库对比完成后,继续对剩余单句进行首次出现判断,即该单句是否在该待翻译文件中首次出现,首次判断模块利用待翻译文件自身进行筛选,将重复出现的句式过滤,同一篇文章之中,由于是同一作者撰写的同一主题的描述,有相当多单句或短语可能多次出现,首次判断模块依次判断每一单句在待翻译文件中是否首次出现,只要不是首次出现,则做出不翻译标识,是首次出现则存储在首次筛选库中。
历史记忆库对比应该早于首次判断对比,可以减少判断计算量,例如某句话在文中第一次出现,如果该句话还出现在历史记忆库中,则只需要进行历史记忆对比即可做出不翻译标识。如果首先进行首次判断对比,则还需要进行历史记忆判断才可得到结果,对于一篇文章来说,一般情况下,重复出现的单句数量总是少于只出现一次的单句数量,并且由于历史记忆库的单句积累量巨大,出现在历史记忆库中的单句往往数量上大于重复出现的单句,因此应该将首次判断置后。
在***内部被作出不翻译标识的单句,在显示模块的显示状态应该异于其他单句,例如色彩显示异于正常显示,为防止翻译人员自行翻译或误动作,将不翻译的单句可以设定为不可编辑状态。翻译人员只需要操作和翻译显示模块显示出的待翻译文件中需要翻译的单句,以及首次判断模块中存储的在待翻译文件中多次出现的单句。 
翻译完成后,得到的是包含若干空缺的译文,空缺处是作出不翻译标识的单句对应位置,***根据历史记忆库中存储的译文和首次判断模块中的单句译文,按照对应关系将这些作出不翻译标识的单句的译文回填到译文的空缺处,得到完整译文。
如图2给出采用循环嵌套算法批量实时处理待翻译文件的一种具体实施方式,
***一次读入N篇待翻译文件,对每一篇待翻译文件采取本发明所述的翻译方法,即首先将全文断句,得到C个单句,对每一单句,依次进行判断识别,判断识别采用循环累加方式,即对第J句,首先判断是否出现在历史记忆库中,若是,则做出不翻译标识后,继续进行第J+1句的判断,若不是,则继续判断是否首次出现。
首次判断步骤在本实施例中的具体实施方式为:设立一个自定义的匹配数组D,初始时该数组为空,对每一单句,若第一次出现,则存储在匹配数组D中,随后进行第J+1句判断,当该单句第二次出现时,则对该单句做出不翻译标识,随后进行第J+1句判断,由此匹配数组D最终存储了待翻译文件中不重复的全部单句,翻译人员实际翻译完该匹配数组D中的全部单句,结合历史记忆库中存储的历史译文,即完成了待翻译文件的全部翻译工作。采用设置匹配数组的方式,数据处理逻辑简单,程序运行消耗资源少。
本发明中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。 

Claims (6)

1.一种快速翻译装置,其特征在于,包括历史记忆库、输入分配模块、首次判断模块、对比模块、首次筛选库、标识模块、恢复模块和显示装置;
待翻译文件输入所述输入分配模块,并以整句为单位分配;
所述首次判断模块判断输入分配模块分配得到的每一待翻译单句,判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;
所述对比模块与历史记忆库连接,比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;
显示装置显示做出全部不翻译标识的待翻译文件;
所述恢复模块用于在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。
2.如权利要求1所述的一种快速翻译装置,其特征在于,所述输入分配模块还将待翻译文件中的字母缩写识别为单句。
3.如权利要求1所述的一种快速翻译装置,其特征在于,所述标识模块做出的不翻译标识为色彩显示异于正常显示,且为不可编辑状态。
4.一种快速翻译方法,包括预先将待翻译文件分配为待翻译单句的步骤,其特征在于,还包括:
I1将待翻译单句与历史记忆库中的单句比较的步骤:比对库中单句与输入分配模块分配得到的每一待翻译单句,如完全相同,则指示标识模块将该待翻译单句做出表示不翻译的标识;做出不翻译标识的单句不再进入I2步骤;
I2首次筛选步骤:判断该待翻译单句是否在待翻译文件中首次出现,是则存入首次筛选库,否则指示标识模块将该句做出表示不翻译的标识;
I3恢复步骤:在翻译完成后,将历史记忆库和首次筛选库中的全部单句的译文按照对应关系恢复到待翻译文件的对应位置。
5.如权利要求4所述的一种快速翻译方法,其特征在于,所述首次筛选步骤为:设置一匹配数组D,对每一单句,若D中没有存储与之相同的单句,则将该单句存储在D中,否则将该单句作出不翻译标识。
6.如权利要求4所述的一种快速翻译方法,其特征在于,所述预先将待翻译文件分配为待翻译单句的步骤包括待翻译文件中的字母缩写识别为单句。
CN201410100000.9A 2014-03-18 2014-03-18 一种快速翻译装置及方法 Active CN103885942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410100000.9A CN103885942B (zh) 2014-03-18 2014-03-18 一种快速翻译装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410100000.9A CN103885942B (zh) 2014-03-18 2014-03-18 一种快速翻译装置及方法

Publications (2)

Publication Number Publication Date
CN103885942A true CN103885942A (zh) 2014-06-25
CN103885942B CN103885942B (zh) 2017-09-05

Family

ID=50954837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410100000.9A Active CN103885942B (zh) 2014-03-18 2014-03-18 一种快速翻译装置及方法

Country Status (1)

Country Link
CN (1) CN103885942B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699669A (zh) * 2015-03-31 2015-06-10 中译语通科技(北京)有限公司 一种文本字数统计的方法及装置
CN105183723A (zh) * 2015-09-17 2015-12-23 成都优译信息技术有限公司 一种翻译软件与语料搜索的关联方法
CN107451127A (zh) * 2017-07-04 2017-12-08 广东小天才科技有限公司 一种基于图像的单词翻译方法及***、移动设备
CN107918904A (zh) * 2017-11-15 2018-04-17 郑州中业科技股份有限公司 一种众包翻译方法及平台
CN109992753A (zh) * 2019-03-22 2019-07-09 维沃移动通信有限公司 一种翻译处理方法及终端设备
CN111563389A (zh) * 2020-04-20 2020-08-21 富途网络科技(深圳)有限公司 一种用户原创内容的翻译方法和装置
CN112784613A (zh) * 2021-01-29 2021-05-11 语联网(武汉)信息技术有限公司 文档批量翻译方法、装置、电子设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60124782A (ja) * 1983-12-09 1985-07-03 Fujitsu Ltd 機械翻訳装置
JPH09305610A (ja) * 1996-05-20 1997-11-28 Matsushita Electric Ind Co Ltd 機械翻訳装置
CN1606030A (zh) * 2004-11-12 2005-04-13 无敌科技(西安)有限公司 一种电子摄相翻译释义方法及其装置
CN1661593A (zh) * 2004-02-24 2005-08-31 北京中专翻译有限公司 一种计算机语言翻译方法及其翻译***
CN1952930A (zh) * 2005-10-20 2007-04-25 英业达股份有限公司 词汇查询***以及方法
CN101221576A (zh) * 2008-01-23 2008-07-16 腾讯科技(深圳)有限公司 一种能够实现自动翻译的输入方法及装置
CN102662933A (zh) * 2012-03-28 2012-09-12 成都优译信息技术有限公司 分布式智能翻译方法
CN102708097A (zh) * 2012-04-27 2012-10-03 曾立人 一种计算机在线翻译方法及其翻译***
CN102902667A (zh) * 2012-10-12 2013-01-30 曾立人 一种翻译记忆匹配结果显示方法
CN103020044A (zh) * 2012-12-03 2013-04-03 江苏乐买到网络科技有限公司 一种机器辅助网页翻译方法及其***
CN103235775A (zh) * 2013-04-25 2013-08-07 中国科学院自动化研究所 一种融合翻译记忆和短语翻译模型的统计机器翻译方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60124782A (ja) * 1983-12-09 1985-07-03 Fujitsu Ltd 機械翻訳装置
JPH09305610A (ja) * 1996-05-20 1997-11-28 Matsushita Electric Ind Co Ltd 機械翻訳装置
CN1661593A (zh) * 2004-02-24 2005-08-31 北京中专翻译有限公司 一种计算机语言翻译方法及其翻译***
CN1606030A (zh) * 2004-11-12 2005-04-13 无敌科技(西安)有限公司 一种电子摄相翻译释义方法及其装置
CN1952930A (zh) * 2005-10-20 2007-04-25 英业达股份有限公司 词汇查询***以及方法
CN101221576A (zh) * 2008-01-23 2008-07-16 腾讯科技(深圳)有限公司 一种能够实现自动翻译的输入方法及装置
CN102662933A (zh) * 2012-03-28 2012-09-12 成都优译信息技术有限公司 分布式智能翻译方法
CN102708097A (zh) * 2012-04-27 2012-10-03 曾立人 一种计算机在线翻译方法及其翻译***
CN102902667A (zh) * 2012-10-12 2013-01-30 曾立人 一种翻译记忆匹配结果显示方法
CN103020044A (zh) * 2012-12-03 2013-04-03 江苏乐买到网络科技有限公司 一种机器辅助网页翻译方法及其***
CN103235775A (zh) * 2013-04-25 2013-08-07 中国科学院自动化研究所 一种融合翻译记忆和短语翻译模型的统计机器翻译方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
梁三云: "机器翻译与计算机辅助翻译比较分析", 《外语电化教学》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699669A (zh) * 2015-03-31 2015-06-10 中译语通科技(北京)有限公司 一种文本字数统计的方法及装置
CN104699669B (zh) * 2015-03-31 2018-08-03 中译语通科技股份有限公司 一种文本字数统计的方法及装置
CN105183723A (zh) * 2015-09-17 2015-12-23 成都优译信息技术有限公司 一种翻译软件与语料搜索的关联方法
CN107451127A (zh) * 2017-07-04 2017-12-08 广东小天才科技有限公司 一种基于图像的单词翻译方法及***、移动设备
CN107451127B (zh) * 2017-07-04 2020-11-06 广东小天才科技有限公司 一种基于图像的单词翻译方法及***、移动设备
CN107918904A (zh) * 2017-11-15 2018-04-17 郑州中业科技股份有限公司 一种众包翻译方法及平台
CN109992753A (zh) * 2019-03-22 2019-07-09 维沃移动通信有限公司 一种翻译处理方法及终端设备
CN109992753B (zh) * 2019-03-22 2023-09-08 维沃移动通信有限公司 一种翻译处理方法及终端设备
CN111563389A (zh) * 2020-04-20 2020-08-21 富途网络科技(深圳)有限公司 一种用户原创内容的翻译方法和装置
CN111563389B (zh) * 2020-04-20 2023-11-03 富途网络科技(深圳)有限公司 一种用户原创内容的翻译方法和装置
CN112784613A (zh) * 2021-01-29 2021-05-11 语联网(武汉)信息技术有限公司 文档批量翻译方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN103885942B (zh) 2017-09-05

Similar Documents

Publication Publication Date Title
CN103885942A (zh) 一种快速翻译装置及方法
Steinhauser et al. Simulations of ram-pressure stripping in galaxy-cluster interactions
US8959431B2 (en) Low resolution placeholder content for document navigation
CN106852185B (zh) 基于字典的并行压缩编码器
US20170193292A1 (en) Identifying the lines of a table
CN106610931B (zh) 话题名称的提取方法及装置
WO2012037721A1 (en) Handwritten character font library
US20180260376A1 (en) System and method to create searchable electronic documents
CN105701215B (zh) 基于Hadoop MapReduce的数据连接方法及装置
EP3353676A2 (en) Method and system of performing a translation
CN109597983A (zh) 一种拼写纠错方法及装置
CN105183642A (zh) 基于插桩的程序行为获取及结构分析方法
CN103955354B (zh) 重定位方法和装置
JP6845911B1 (ja) 文字処理システム及びプログラム
CN109753976B (zh) 语料标注装置和方法
US10224958B2 (en) Computer-readable recording medium, encoding apparatus, and encoding method
CN107203763A (zh) 文字识别方法和装置
CN106873971B (zh) 一种flash应用的多语言展示方法和***
CN104933030A (zh) 一种维吾尔语拼写检查方法及装置
US9008428B2 (en) Efficient verification or disambiguation of character recognition results
CN106293862B (zh) 一种可扩展标记语言xml数据的解析方法和装置
WO2015199734A1 (en) Buffer-based update of state data
US9613019B2 (en) Techniques for automatically generating test data
CN103440231A (zh) 用于比较文本的设备和方法
CN116433474A (zh) 模型训练方法、字体迁移方法、装置及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 610000 B, building 4, building 200, Tianfu five street, Chengdu hi tech Zone, Sichuan,

Applicant after: CHENGDU UE INFORMATION TECHNOLOGY CO.,LTD.

Address before: 610000, No. 1, building 107, 1 West Bauhinia Road, Chengdu hi tech Zone, Sichuan, 6

Applicant before: CHENGDU UE INFORMATION TECHNOLOGY CO.,LTD.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Fast Translation Device and Method

Effective date of registration: 20230526

Granted publication date: 20170905

Pledgee: Industrial Bank Limited by Share Ltd. Chengdu branch

Pledgor: CHENGDU UE INFORMATION TECHNOLOGY CO.,LTD.

Registration number: Y2023980041884

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20170905

Pledgee: Industrial Bank Limited by Share Ltd. Chengdu branch

Pledgor: CHENGDU UE INFORMATION TECHNOLOGY CO.,LTD.

Registration number: Y2023980041884