CN106021239B - 一种翻译质量实时评价方法 - Google Patents

一种翻译质量实时评价方法 Download PDF

Info

Publication number
CN106021239B
CN106021239B CN201610272936.9A CN201610272936A CN106021239B CN 106021239 B CN106021239 B CN 106021239B CN 201610272936 A CN201610272936 A CN 201610272936A CN 106021239 B CN106021239 B CN 106021239B
Authority
CN
China
Prior art keywords
translation
user
sentence
engine
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610272936.9A
Other languages
English (en)
Other versions
CN106021239A (zh
Inventor
韩鑫
张矗
陈罡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Chuangxin Journey Network Technology Co Ltd
Original Assignee
Beijing Chuangxin Journey Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Chuangxin Journey Network Technology Co Ltd filed Critical Beijing Chuangxin Journey Network Technology Co Ltd
Priority to CN201610272936.9A priority Critical patent/CN106021239B/zh
Publication of CN106021239A publication Critical patent/CN106021239A/zh
Application granted granted Critical
Publication of CN106021239B publication Critical patent/CN106021239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种翻译质量实时评价方法,包括以下步骤:根据用户的翻译请求,接收用户所发起的语句;多个翻译引擎均接收到所述用户发起的语句,根据统计不同引擎的各自的总翻译次数及用户所收藏该语句、播放该语句的频次,计算翻译引擎的翻译结果的加权使用频次和计算人均使用频次作为质量分,并以质量分占所有引擎的质量分加和的比例为概率,概率最高的翻译引擎则作为本次语句请求的最优翻译引擎;将上述的得到的最优翻译引擎作为请求此语句的优先使用引擎,调度该翻译引擎来翻译用户所请求的语句,得到翻译结果。通过本发明,对多个引擎的翻译质量,进行自动化的实时的质量评估,对于不同的翻译语句,给出最优的翻译引擎结果。

Description

一种翻译质量实时评价方法
技术领域
本发明涉及翻译质量评价领域,具体地说是一种翻译质量实时评价方法。
背景技术
人们在使用翻译工具时,通常是通过一种翻译引擎实现,并人工识别这个翻译结果的准确度,若觉得翻译结果不够理想,则会尝试换一种翻译引擎再进行尝试,直到无法得到更优结果为止。这种人工切换翻译引擎的方式,获得最优翻译结果的效率低,耗时长,尤其无法满足实时翻译的需求。
那么,集成多个翻译引擎,为用户提供覆盖度更高的翻译结果,能够部分解决上述技术问题,尤其适用于出境游用户。为了给出境游用户提供高品质的翻译结果,提升翻译覆盖度,会集成多个翻译引擎,确保翻译的覆盖度,但同一个待翻译语句,对于有限的常用语句的使用,可以请专家进行评审,来选择和确定最优翻译结果,而这种方式显然无法应对复杂的翻译需求。现有的专家评审的方式,最大的缺点是无法做到快速的实时响应,对于海量翻译语句,人力评审成本高,无法做到自动化和量化的程度,也无法持续改进评价方式。另一种方式是对每个翻译引擎进行抽样质量评估,评价某个引擎的综合翻译质量。但无法做到精确到不同语句的翻译质量。
更难处理的是,针对实时的在线翻译,如何量化评估多个引擎的翻译结果,是获得最优翻译结果所必须要解决的技术问题,这就成了一个很迫切的技术问题。现有技术往往通过分析语言结构来解决这一技术问题,例如国家知识产权局公开的专利申请号为201410461334.9的发明专利申请机器翻译方法及***,但这同样无法适应不同的语境、场合以及用户的语言习惯等,因此无法解决上述技术问题。
发明内容
有鉴于此,本发明针对上述现有技术存在的无法高效地获得最优翻译结果的技术问题,提供了一种集成多个翻译引擎并实时在线评估的翻译质量实时评价方法,以获得最优翻译结果。
本发明的技术解决方案是,提供一种以下步骤的翻译质量实时评价方法,包括以下步骤:
步骤1:根据用户的翻译请求,接收用户所发起的语句;
步骤2:集成的多个翻译引擎均接收到所述用户发起的语句,根据统计不同引擎的各自的总翻译次数及用户所收藏该语句、播放该语句的频次,计算相应翻译引擎的翻译结果的加权使用频次和计算人均使用频次作为质量分,并以质量分占所有引擎的质量分加和的比例为概率,概率最高的翻译引擎则作为本次语句请求的最优翻译引擎;
步骤3:将上述的得到的最优翻译引擎作为请求此语句的优先使用引擎,调度该翻译引擎来翻译用户所请求的语句,得到翻译结果,返回给用户。
采用以上步骤,本发明与现有技术相比,具有以下优点:采用本发明,针对用户发起的特定语句,每个翻译引擎不尽相同,通过计算相应翻译引擎的翻译结果的加权使用频次和计算人均使用频次作为质量分,作为对不同翻译引擎针对该语句之翻译结果的评价,以评价较高者作为优先使用的翻译引擎,完成对该语句最优翻译引擎的选择,从而得到最优翻译结果,返回给用户。本发明引入了频次作为评价依据,无需分析语句的语言结构,能够快速有效地得到最优翻译结果,通过这种***性的方法,对多个引擎的翻译质量,进行自动化的实时的质量评估,对于不同的翻译语句,给出最优的翻译引擎结果。
作为优选,在完成步骤3后,更新所述最优翻译引擎下对用户所发起的该语句的翻译频次,提起该语句翻译请求的用户在使用翻译结果的后续行为,作为日志发送给质量评估数据库,用于后续的评价和对选择最优翻译引擎的动态修正。
作为优选,质量评估数据库根据上报的日志信息,并采集用户的位置信息来判断用户所在地及是否在国外,结合用户地理位置情况作为衡量翻译质量的辅助因素,便可设定区域范围,得到该区域范围的最优翻译引擎。叠加了位置信息后,更能精确反映翻译引擎的翻译质量,因为翻译的质量往往跟语句的使用场景有关。
作为优选,针对不同用户的相同翻译请求,不同用户使用不同引擎获得翻译结果,并通过分析处理后续用户对翻译结果在不同时间、不同地域的使用方式与频次,量化评估不同翻译引擎对此语句的翻译质量,从而为其他用户提供此语句的最好的翻译结果。通过这种综合分析和评估的方式,能够获得更优的翻译结果。
附图说明
图1为翻译质量实时评价方法的步骤示意图;
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,但本发明并不仅仅限于这些实施例。
本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。
如图1所示,本发明的一种翻译质量实时评价方法,包括以下步骤:
步骤1:根据用户的翻译请求,接收用户所发起的语句;
步骤2:集成的多个翻译引擎均接收到所述用户发起的语句,根据统计不同引擎的各自的总翻译次数及用户所收藏该语句、播放该语句的频次,计算相应翻译引擎的翻译结果的加权使用频次和计算人均使用频次作为质量分,并以质量分占所有引擎的质量分加和的比例为概率,概率最高的翻译引擎则作为本次语句请求的最优翻译引擎;
步骤2中,可以设定数据量、质量的阈值,达到后,不再根据概率返回最优翻译引擎,因为已经得到可靠的结果,则不需要每次重复,提高响应速度。
步骤3:将上述的得到的最优翻译引擎作为请求此语句的优先使用引擎,调度该翻译引擎来翻译用户所请求的语句,得到翻译结果,返回给用户。
在完成步骤3后,更新所述最优翻译引擎下对用户所发起的该语句的翻译频次,提起该语句翻译请求的用户在使用翻译结果的后续行为,作为日志发送给质量评估数据库,用于后续的评价和对选择最优翻译引擎的动态修正。
质量评估数据库根据上报的日志信息,并采集用户的位置信息来判断用户所在地及是否在国外,结合用户地理位置情况作为衡量翻译质量的辅助因素,便可设定区域范围,得到该区域范围的最优翻译引擎。叠加了位置信息后,更能精确反映翻译引擎的翻译质量,因为翻译的质量往往跟语句的使用场景有关,使用场景和地理位置往往决定了使用习惯,也就存在不同的表达习惯。
针对不同用户的相同翻译请求,不同用户使用不同引擎获得翻译结果,并通过分析处理后续用户对翻译结果在不同时间、不同地域的使用方式与频次,量化评估不同翻译引擎对此语句的翻译质量,从而为其他用户提供此语句的最好的翻译结果。通过这种综合分析和评估的方式,能够获得更优的翻译结果。
需要注意的是,以上所提及的质量评估数据库均指的是图1中的质量评估库。
本发明的具体原理步骤如下:尤其是针对身处国外旅行的人,向客户端发起语句翻译的请求,获取其地理位置信息,根据在该地区的使用习惯,并结合对相应请求语句的翻译频次以及用户的后续行为,为用户提供最优的翻译引擎,获得最优的翻译结果,并在多因素的综合下,可对翻译引擎的选择进行动态修正。
本发明的更具体的应用场景如下(通过移动终端APP实现):
步骤1:客户端发起语句的翻译请求。
步骤2:翻译引擎调度请求此语句的优先使用引擎。
步骤3:质量评估库根据统计不同引擎的各自的总翻译次数及后续用户国外进行的收藏语句、播放语句的频次,计算此翻译结果的加权使用频次计算人均使用频次作为质量分,并以质量分占所有引擎的质量分加和的比例为概率,返回给翻译引擎调度分者对应的引擎,并更新下此引擎对此语句的翻译频次。
步骤4:根据返回引擎,请求对应引擎的翻译结果。
步骤5:对应引擎返回翻译结果给翻译引擎调度。
步骤6:翻译引擎调度将翻译结果返回给客户端。
步骤7:用户在客户端使用翻译结果的后续行为,作为日志发送给质量评估引擎。
步骤8:质量评估引擎根据客户端上报的日志信息,计算用户所在地及是否在国外,并添加此日志到质量评估库,并计算用户使用频次数据
以上仅就本发明较佳的实施例作了说明,但不能理解为是对权利要求的限制。本发明不仅局限于以上实施例,其具体结构允许有变化。总之,凡在本发明独立权利要求的保护范围内所作的各种变化均在本发明的保护范围内。

Claims (3)

1.一种翻译质量实时评价方法,包括以下步骤:
步骤1:根据用户的翻译请求,接收用户所发起的语句;
步骤2:集成的多个翻译引擎均接收到所述用户发起的语句,根据统计不同引擎的各自的总翻译次数及用户所收藏该语句、播放该语句的频次,计算相应翻译引擎的翻译结果的加权使用频次和计算人均使用频次作为质量分,并以质量分占所有引擎的质量分加和的比例为概率,概率最高的翻译引擎则作为本次语句请求的最优翻译引擎;
步骤3:将所述最优翻译引擎作为请求此语句的优先使用引擎,调度该翻译引擎来翻译用户所请求的语句,得到翻译结果,返回给用户;
在完成步骤3后,更新所述最优翻译引擎下对用户所发起的该语句的翻译频次,提起该语句翻译请求的用户在使用翻译结果的后续行为,作为日志发送给质量评估数据库,用于后续的评价和对选择最优翻译引擎的动态修正。
2.根据权利要求1所述的一种翻译质量实时评价方法,其特征在于:质量评估数据库根据上报的日志信息,并采集用户的位置信息来判断用户所在地及是否在国外,结合用户地理位置情况作为衡量翻译质量的辅助因素,便可设定区域范围,得到该区域范围的最优翻译引擎。
3.根据权利要求1所述的一种翻译质量实时评价方法,其特征在于:针对不同用户的相同翻译请求,不同用户使用不同引擎获得翻译结果,并通过分析处理后续用户对翻译结果在不同时间、不同地域的使用方式与频次,量化评估不同翻译引擎对此语句的翻译质量,从而为其他用户提供此语句的最好的翻译结果;通过这种综合分析和评估的方式,能够获得更优的翻译结果。
CN201610272936.9A 2016-04-29 2016-04-29 一种翻译质量实时评价方法 Active CN106021239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610272936.9A CN106021239B (zh) 2016-04-29 2016-04-29 一种翻译质量实时评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610272936.9A CN106021239B (zh) 2016-04-29 2016-04-29 一种翻译质量实时评价方法

Publications (2)

Publication Number Publication Date
CN106021239A CN106021239A (zh) 2016-10-12
CN106021239B true CN106021239B (zh) 2018-10-26

Family

ID=57081012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610272936.9A Active CN106021239B (zh) 2016-04-29 2016-04-29 一种翻译质量实时评价方法

Country Status (1)

Country Link
CN (1) CN106021239B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107894983A (zh) * 2017-11-08 2018-04-10 深圳市沃特沃德股份有限公司 引擎的切换方法与装置
CN107979856B (zh) * 2017-11-22 2020-10-27 深圳市沃特沃德股份有限公司 连接引擎的方法与装置
CN108319591A (zh) * 2018-02-05 2018-07-24 深圳市沃特沃德股份有限公司 实现语音翻译的方法、装置和语音翻译设备
CN109118109B (zh) * 2018-08-31 2021-06-01 传神语联网网络科技股份有限公司 基于etm的质量评估
CN109214011A (zh) * 2018-09-19 2019-01-15 深圳市合言信息科技有限公司 一种通过用户反馈来自我完善的认知引擎选择策略
CN109299737B (zh) * 2018-09-19 2021-10-26 语联网(武汉)信息技术有限公司 译员基因的选取方法、装置与电子设备
US11074420B2 (en) 2019-06-25 2021-07-27 International Business Machines Corporation Self-learning input-driven brokering of language-translation engines
CN110532574A (zh) * 2019-08-20 2019-12-03 语联网(武汉)信息技术有限公司 机器翻译引擎选择方法及装置
CN110502762B (zh) * 2019-08-27 2023-07-28 北京金山数字娱乐科技有限公司 一种翻译平台及其管理方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1465018A (zh) * 2000-05-11 2003-12-31 南加利福尼亚大学 机器翻译技术
CN1530861A (zh) * 2003-02-24 2004-09-22 语言翻译方法及其***
WO2010052696A1 (en) * 2008-11-05 2010-05-14 Ubstream Ltd. Session initiation protocol in multi-cast/unicast system for connection between users behind nat and connection between server and users behind nat
CN102253930A (zh) * 2010-05-18 2011-11-23 腾讯科技(深圳)有限公司 一种文本翻译的方法及装置
CN102446169A (zh) * 2010-10-13 2012-05-09 张龙哺 利用在线翻译服务的翻译***
CN103914446A (zh) * 2013-01-08 2014-07-09 崴强科技股份有限公司 翻译方法及翻译***
CN104011712A (zh) * 2011-06-24 2014-08-27 谷歌公司 对跨语言查询建议的查询翻译进行评价
CN104090870A (zh) * 2014-06-26 2014-10-08 武汉传神信息技术有限公司 一种在线翻译引擎的推送方法
CN105051728A (zh) * 2013-01-03 2015-11-11 时新公司 数据库查询翻译***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1465018A (zh) * 2000-05-11 2003-12-31 南加利福尼亚大学 机器翻译技术
CN1530861A (zh) * 2003-02-24 2004-09-22 语言翻译方法及其***
WO2010052696A1 (en) * 2008-11-05 2010-05-14 Ubstream Ltd. Session initiation protocol in multi-cast/unicast system for connection between users behind nat and connection between server and users behind nat
CN102253930A (zh) * 2010-05-18 2011-11-23 腾讯科技(深圳)有限公司 一种文本翻译的方法及装置
CN102446169A (zh) * 2010-10-13 2012-05-09 张龙哺 利用在线翻译服务的翻译***
CN104011712A (zh) * 2011-06-24 2014-08-27 谷歌公司 对跨语言查询建议的查询翻译进行评价
CN105051728A (zh) * 2013-01-03 2015-11-11 时新公司 数据库查询翻译***
CN103914446A (zh) * 2013-01-08 2014-07-09 崴强科技股份有限公司 翻译方法及翻译***
CN104090870A (zh) * 2014-06-26 2014-10-08 武汉传神信息技术有限公司 一种在线翻译引擎的推送方法

Also Published As

Publication number Publication date
CN106021239A (zh) 2016-10-12

Similar Documents

Publication Publication Date Title
CN106021239B (zh) 一种翻译质量实时评价方法
KR101982159B1 (ko) 카테고리별로 구분된 유동인구 정보를 이용한 유동인구 측정 방법
Beige et al. Interdependencies between turning points in life and long-term mobility decisions
CN104980950B (zh) 一种网络优化服务器、实现网络优化的移动设备和***
JP2012198870A (ja) ユーザ行動認識装置および方法
CN109816226B (zh) 一种公园绿地防灾避险能力的评价方法及***
CN107026750B (zh) 一种用户上网QoE评价方法及装置
CN106528147A (zh) 桌面图标显示方法、桌面图标显示装置及终端
CN109548036A (zh) 一种移动网络潜在投诉用户预测方法和装置
CN106021240A (zh) 一种旅行中常用外语语句及对应场景的自动识别方法
CN103377403B (zh) 企业业务组件建模方法和***
CN111866776A (zh) 一种基于手机信令数据的人口测算方法及装置
CN110727752B (zh) 位置指纹库处理方法、设备及计算机可读存储介质
CN109995549B (zh) 一种评估流量价值的方法及装置
CN108319591A (zh) 实现语音翻译的方法、装置和语音翻译设备
CN106604297A (zh) 一种优化基站扇区中心经纬度数据的方法和设备
CN110335626A (zh) 基于音频的年龄识别方法及装置、存储介质
Macdonald et al. Experimental estimates of cannabis consumption in Canada, 1960 to 2015
Chung et al. Identification of a city‟ s soundscape using soundwalks
JP2011154484A (ja) 行動状況を判定するための方法、装置及びプログラム
CN101620597A (zh) 移动通信业数据业务的产品关联分析方法
CN103188629B (zh) 一种不同制式网络间的流量引导方法和装置
CN110875834A (zh) 一种风控模型的创建方法、风控评估方法及相关装置
CN112965795B (zh) 集群调度方法、电子设备及存储介质
CN110400160B (zh) 识别竞品用户的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Han Xin

Inventor after: Zhang Chu

Inventor after: Chen Gang

Inventor before: Chen Gang

GR01 Patent grant
GR01 Patent grant