CN102708097A - 一种计算机在线翻译方法及其翻译*** - Google Patents

一种计算机在线翻译方法及其翻译*** Download PDF

Info

Publication number
CN102708097A
CN102708097A CN2012101285061A CN201210128506A CN102708097A CN 102708097 A CN102708097 A CN 102708097A CN 2012101285061 A CN2012101285061 A CN 2012101285061A CN 201210128506 A CN201210128506 A CN 201210128506A CN 102708097 A CN102708097 A CN 102708097A
Authority
CN
China
Prior art keywords
translation
sentence
translator
text
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101285061A
Other languages
English (en)
Inventor
曾立人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2012101285061A priority Critical patent/CN102708097A/zh
Publication of CN102708097A publication Critical patent/CN102708097A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明属于计算机辅助人工翻译领域类,具体是一种计算机在线翻译方法及其翻译***,其特征在于:需要翻译的源文文本在上传后被分割成句子单元,根据其在文章中的顺序这些句子单元被打上身份和顺序标签,译者选择适当的句子单元翻译后,该句子单元被打上译者身份标签,然后按照源语文本中的位置重新组合成完整的译文;同时将翻译好的句子单元放入在线翻译记忆库里供自动匹配器搜索,被匹配的句子单元记录在译者著作权统计信息里,以此支付每次被使用的稿酬。本发明能使资源利用最大化、省时省力、翻译效率高、成本低的计算机在线翻译方法及其翻译***。

Description

一种计算机在线翻译方法及其翻译***
技术领域
本发明属于计算机辅助人工翻译领域。
背景技术
目前的计算机辅助翻译工具都是基于“翻译记忆”的工作原理,即将翻译好的文章以双语对应的平行语料库的形式存储起来,下次翻译同类文章时,计算机先将原文与平行语料库里的原文进行对比,若有完全相同或部分相同的句子,计算机就将这个句子和译文一起显示给译员,译员可以直接拷贝或修改使用,以达到省时省力的效果,降低翻译成本。
但是因为现有的计算机辅助翻译工具不提供翻译记忆库,而译者或翻译公司自行建库速度慢、难度大,加上大家都不想无偿贡献自己的劳动,所以一般翻译记忆都是译员自己使用或公司内部分享,不但浪费了很好的语言资产,也使得实现计算机辅助翻译工具的省时省力功能变得很困难。
发明内容
本发明的目的是针对现有技术的不足,提供一种将源语文章分割为句子或更小单位,通过网络发布到译者群,并通过对句子在文章中的顺序及译者著作权标记,根据译者工作量或翻译记忆被引用的数量给译者支付报酬,从而能使资源利用最大化、省时省力、翻译效率高、成本低的计算机在线翻译方法及其翻译***。
本发明采用如下技术方案:
一种计算机在线翻译方法,其特征在于:需要翻译的源文文本在上传后被分割成句子单元;根据其在文章中的顺序这些句子单元被打上身份和顺序标签;译者选择适当的句子单元翻译后,该句子单元被打上译者身份标签;然后按照源语文本中的位置重新组合成完整的译文;同时将翻译好的句子单元放入在线翻译记忆库里供自动匹配器搜索,被匹配的句子单元记录在译者著作权统计信息里,以此支付每次被使用的稿酬。
本发明可以根据标点符号判断等预定规则将源文分割成为句子单元,句子单元可以包括自然句子、词组、单词等。
根据上述方法,本发明提供了计算机在线翻译***,其特征在于:包括文本上传器、文本切割器、句子身份和顺序标记器、在线翻译记忆库、译文输入编辑器、翻译记忆匹配器、译文重组器,同时还带有报酬结算器、译文下载器,其中文本上传器用于上传需要翻译的文本;文本切割器根据预定的规则按标点符号等判断将源文分割成为句子单元;句子身份和顺序标记器将每个句子标记上它在文章中的顺序标签;在线翻译记忆库记录了所有译员在本***里翻译过或另外提交的翻译记忆;译文输入编辑器供译员输入与源语对应的译文;翻译记忆匹配器,它将译员输入的译文与在线翻译记忆库里存储的句子或词组进行匹配对应,有完全匹配或部分匹配的,显示给译员进行选用;译文重组器重新将译文根据源语文本的顺序组合成完整的译文;译员选用了他人的翻译记忆,由译者著作权统计器统计,报酬结算器里向翻译记忆著作权所有人支付报酬;译文下载器供下载完成的目标语译文。
本***还可带有句子发布器和翻译记忆质量评价装置,句子发布器根据句子的复杂程度和难度将其分类,供不同的译员选择;翻译记忆质量评价装置反馈每个句子或译者的翻译质量,为以后译者引用翻译记忆作参考。
本发明由于译者不但得到第一次翻译该句子的稿酬,还能得到后续一次或多次翻译记忆使用的稿酬。这种激励机制会促使译员或翻译公司将其翻译记忆放到在线翻译记忆库里与他人分享,使计算机辅助翻译工具的效率大大提高;本***通过以句子为单位登记译者著作权,使译员或翻译公司将翻译记忆拿出来有偿分享,不但能从翻译新句子时拿到稿酬,还可以从后续的翻译记忆出售拿到多次稿酬,同时因为一篇文章可以拆散向整个译者群发布,可以让众多译员同时翻译一篇文章,大大缩短交稿时间,等***积累到大量的翻译记忆后有望实现所有文章的自动翻译,到那时,本***即同时可以有机器翻译的速度以及人工翻译的质量,达到计算机辅助翻译***效率最大化。
附图说明
图1为本发明在线翻译***示意图。
具体实施方式
一种计算机在线翻译方法,包括如下步骤:
A、输入要翻译的源文;
B、根据标点符号判断将源文分割成为自然句子;
C、将每个句子标记上其在源文中的顺序发布给不同的译者;
D、译者将句子翻译成目标语后,句子被标记上译者身份信息;
E、按照源语文本中句子的顺序将目标语组成完整译文;
F、将翻译好的句子单元放入在线翻译记忆库里供自动匹配器搜索,被匹配的句子单元记录在译者著作权统计信息里,以此支付每次被使用的稿酬。
本发明译者可以查看句子的上下文,以更好地翻译句子。
如图1所示,本发明提供了计算机在线翻译***,翻译客户登录客户端后通过源语文本上传器1上传需要翻译的文章,该文章由文本切割器2将文章根据标点符号判断等预定规则将源文分割成为自然句子或词组,句子身份和顺序标记器3给每个句子标记上它在文章中的顺序编号。编号后的句子通过句子发布器4向译者用户群发布。译者用户可以根据自己的翻译水平和速度选择适合自己翻译的句子,在译文输入编辑器5输入与源语句子对应的译文。译文输入编辑器5里可以显示句子所在的整片文章,供译者更好地了解整篇文章的文体、风格和上下文结构。输入的译文通过翻译记忆匹配器7在在线翻译记忆库6里寻找匹配,在线翻译记忆库6里存储了其他译者和译者本人以前的翻译记忆。找到和源语匹配的句子后在译文输入编辑器5里显示其对应的目标语译文翻译记忆,供译者选用。通过译者著作权标记器8,译者自己翻译的句子被打上译者著作权标签,引用他人在在线翻译记忆库6里的句子则继承原译者的著作权标签。各个译者提交的译文句子在译文重组器9里根据源语的句子顺序编号进行排列,获得顺序正确的完整译文。译者新翻译的、在线翻译记忆库6里没有的句子被当作翻译记忆存储到在线翻译记忆库里,为以后匹配的翻译记忆源。译者的工作量通过译者著作权标记器8记录,综合计算新翻译句子的字数和被引用的翻译记忆的字数得出,通过报酬结算器10付费。付费后,客户可以通过译文下载器11下载完成的译文。客户和引用翻译记忆的译者可以通过翻译记忆质量评价装置12反馈每个句子或译者的翻译质量,为以后译者引用翻译记忆作参考。评价高的句子和译者会被更多引用,达到激励提高翻译质量的目的。

Claims (6)

1.一种计算机在线翻译方法,其特征在于:需要翻译的源文文本在上传后被分割成句子单元;根据其在文章中的顺序这些句子单元被打上顺序标签;译者选择适当的句子单元翻译后,该句子单元被打上译者身份标签;然后按照源语文本中的位置重新组合成完整的译文;同时将翻译好的句子单元放入在线翻译记忆库里供自动匹配器搜索,被匹配的句子单元记录在译者著作权统计信息里,以此支付每次被使用的稿酬。
2.根据权利要求1所述的计算机在线翻译方法,其特征在于:源文文本在上传后根据标点符号判断将源文分割成为句子单元。
3.根据权利要求1或2所述的计算机在线翻译方法,其特征在于:句子单元包括自然句子、词组、单词。
4.一种计算机在线翻译***,其特征在于:包括文本上传器、文本切割器、一句子身份和顺序标记器、一句子发布器、在线翻译记忆库、译文输入编辑器、翻译记忆匹配器、译文重组器,其中文本上传器用于上传需要翻译的文本;文本切割器根据预定的规则按标点符号等判断将源文分割成为句子单元;句子身份和顺序标记器将每个句子标记上它在文章中的顺序标签;在线翻译记忆库库记录了所有译员在本***里翻译过或另外提交的翻译记忆;译文输入编辑器供译员输入与源语对应的译文;一翻译记忆匹配器,它将译员输入的译文与在线翻译记忆库里存储的句子或词组进行匹配对应,有完全匹配或部分匹配的,显示给译员进行选用;译文重组器重新将译文根据源语文本的顺序组合成完整的译文;译员选用了他人的翻译记忆,由译者著作权统计器统计,在报酬结算器里向翻译记忆著作权所有人支付报酬;译文下载器供下载完成的目标语译文。
5.根据权利要求4所述的计算机在线翻译***,其特征在于:该***带有句子发布器,根据句子的复杂程度和难度将其分类,供不同的译员选择。
6.根据权利要求4或5所述的计算机在线翻译***,其特征在于:该***带有一翻译记忆质量评价装置。
CN2012101285061A 2012-04-27 2012-04-27 一种计算机在线翻译方法及其翻译*** Pending CN102708097A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101285061A CN102708097A (zh) 2012-04-27 2012-04-27 一种计算机在线翻译方法及其翻译***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101285061A CN102708097A (zh) 2012-04-27 2012-04-27 一种计算机在线翻译方法及其翻译***

Publications (1)

Publication Number Publication Date
CN102708097A true CN102708097A (zh) 2012-10-03

Family

ID=46900892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101285061A Pending CN102708097A (zh) 2012-04-27 2012-04-27 一种计算机在线翻译方法及其翻译***

Country Status (1)

Country Link
CN (1) CN102708097A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218354A (zh) * 2013-03-28 2013-07-24 曾立人 一种在线翻译记忆交换方法和***
CN103823796A (zh) * 2014-02-25 2014-05-28 武汉传神信息技术有限公司 一种翻译***及翻译方法
CN103838716A (zh) * 2012-11-27 2014-06-04 英业达科技有限公司 将目标资料拆分至服务器与客户端翻译的***及其方法
CN103885942A (zh) * 2014-03-18 2014-06-25 成都优译信息技术有限公司 一种快速翻译装置及方法
CN104462073A (zh) * 2014-12-26 2015-03-25 武汉传神信息技术有限公司 文档协同翻译的处理方法和***
CN104503960A (zh) * 2015-01-07 2015-04-08 渤海大学 一种用于英语翻译的文本数据处理方法
CN104699669A (zh) * 2015-03-31 2015-06-10 中译语通科技(北京)有限公司 一种文本字数统计的方法及装置
WO2016206582A1 (zh) * 2015-06-22 2016-12-29 张云鹏 计算机辅助翻译方法及程序
CN106537373A (zh) * 2014-07-16 2017-03-22 美国联合包裹服务公司 语言内容翻译
CN107016116A (zh) * 2017-04-18 2017-08-04 赖灿 一种通过引用特定知识进行商品生产的方法
CN107066249A (zh) * 2016-12-31 2017-08-18 余天译 一种众包式维语学习***
CN108763228A (zh) * 2018-05-21 2018-11-06 王伟宙 一种自然语言辅助处理***
US10719871B2 (en) 2012-12-07 2020-07-21 United Parcel Service Of America, Inc. Systems and methods of website integration

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101090461A (zh) * 2006-06-13 2007-12-19 中国科学院计算技术研究所 一种数字视频字幕自动翻译方法
JP2008052677A (ja) * 2006-08-28 2008-03-06 Nec Corp 翻訳装置、翻訳システム及び翻訳方法
CN101414294A (zh) * 2007-10-18 2009-04-22 英业达股份有限公司 使用远端翻译记忆库的翻译***及其方法
CN102075509A (zh) * 2009-11-24 2011-05-25 英特尔公司 用于使用社交网络进行实时语言翻译的方法和***
CN102368236A (zh) * 2011-09-22 2012-03-07 北京智明星通科技有限公司 一种翻译***及翻译方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101090461A (zh) * 2006-06-13 2007-12-19 中国科学院计算技术研究所 一种数字视频字幕自动翻译方法
JP2008052677A (ja) * 2006-08-28 2008-03-06 Nec Corp 翻訳装置、翻訳システム及び翻訳方法
CN101414294A (zh) * 2007-10-18 2009-04-22 英业达股份有限公司 使用远端翻译记忆库的翻译***及其方法
CN102075509A (zh) * 2009-11-24 2011-05-25 英特尔公司 用于使用社交网络进行实时语言翻译的方法和***
CN102368236A (zh) * 2011-09-22 2012-03-07 北京智明星通科技有限公司 一种翻译***及翻译方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103838716A (zh) * 2012-11-27 2014-06-04 英业达科技有限公司 将目标资料拆分至服务器与客户端翻译的***及其方法
US11593867B2 (en) 2012-12-07 2023-02-28 United Parcel Service Of America, Inc. Systems and methods of website integration
US11367131B2 (en) 2012-12-07 2022-06-21 United Parcel Service Of America, Inc. Systems and methods of website integration
US10719871B2 (en) 2012-12-07 2020-07-21 United Parcel Service Of America, Inc. Systems and methods of website integration
CN103218354A (zh) * 2013-03-28 2013-07-24 曾立人 一种在线翻译记忆交换方法和***
CN103823796A (zh) * 2014-02-25 2014-05-28 武汉传神信息技术有限公司 一种翻译***及翻译方法
CN103885942B (zh) * 2014-03-18 2017-09-05 成都优译信息技术股份有限公司 一种快速翻译装置及方法
CN103885942A (zh) * 2014-03-18 2014-06-25 成都优译信息技术有限公司 一种快速翻译装置及方法
CN106537373A (zh) * 2014-07-16 2017-03-22 美国联合包裹服务公司 语言内容翻译
CN106537373B (zh) * 2014-07-16 2019-10-15 美国联合包裹服务公司 语言内容翻译
CN104462073A (zh) * 2014-12-26 2015-03-25 武汉传神信息技术有限公司 文档协同翻译的处理方法和***
CN104503960A (zh) * 2015-01-07 2015-04-08 渤海大学 一种用于英语翻译的文本数据处理方法
CN104699669A (zh) * 2015-03-31 2015-06-10 中译语通科技(北京)有限公司 一种文本字数统计的方法及装置
WO2016206582A1 (zh) * 2015-06-22 2016-12-29 张云鹏 计算机辅助翻译方法及程序
CN107066249A (zh) * 2016-12-31 2017-08-18 余天译 一种众包式维语学习***
WO2018192366A1 (zh) * 2017-04-18 2018-10-25 赖灿 一种通过引用特定知识进行商品生产的方法和***
CN107016116A (zh) * 2017-04-18 2017-08-04 赖灿 一种通过引用特定知识进行商品生产的方法
CN108763228A (zh) * 2018-05-21 2018-11-06 王伟宙 一种自然语言辅助处理***

Similar Documents

Publication Publication Date Title
CN102708097A (zh) 一种计算机在线翻译方法及其翻译***
Yin et al. Ranking relevance in yahoo search
CN104424279B (zh) 一种文本的相关性计算方法和装置
US20180143975A1 (en) Collection strategies that facilitate arranging portions of documents into content collections
CN105765573B (zh) 网站通信量优化方面的改进
Pääkkönen et al. Exporting Finnish digitized historical newspaper contents for offline use
US20110258054A1 (en) Automatic Generation of Bid Phrases for Online Advertising
CN104050532A (zh) 简历生成方法及简历生成***
CN105205104A (zh) 一种云平台数据获取方法
CN106202061A (zh) 面向跨境电子商务平台的汉英蒙藏维多语机器翻译***及方法
US20200357063A1 (en) Systems and computer-implemented processes for model-based underwriting
CN104111966A (zh) 用于动态地同步技术环境中的元素的方法和***
CN109918375B (zh) 一种基于区块链和分布式存储的大文本存储、索引及检索方法
CN104750771A (zh) 利用域信息进行上下文数据分析的方法和***
Tötösy de Zepetnek et al. Electronic journals, prestige, and the economics of academic journal publishing
CN103198087A (zh) 用于分析建议请求的关联存储器技术
Jiang et al. Improving pointer-generator network with keywords information for chinese abstractive summarization
Imanbayev et al. Analysis and mathematical modeling of big data processing
CN115309885A (zh) 一种用于科技服务的知识图谱构建、检索和可视化方法及***
CN103218354A (zh) 一种在线翻译记忆交换方法和***
CN107748748A (zh) 水利水电技术标准全文检索***
Bulut et al. Generating campaign ads & keywords for programmatic advertising
Clever et al. Towards auto-suggested process modeling–prototypical development of an auto-suggest component for process modeling tools
Cornford et al. Introduction to information systems
Steele Phoenix rising: new models for the research monograph?

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121003