CN107391500A - 文本翻译方法、装置及设备 - Google Patents

文本翻译方法、装置及设备 Download PDF

Info

Publication number
CN107391500A
CN107391500A CN201710718020.6A CN201710718020A CN107391500A CN 107391500 A CN107391500 A CN 107391500A CN 201710718020 A CN201710718020 A CN 201710718020A CN 107391500 A CN107391500 A CN 107391500A
Authority
CN
China
Prior art keywords
text
sentence pattern
target
pattern template
language text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710718020.6A
Other languages
English (en)
Inventor
姚陶钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710718020.6A priority Critical patent/CN107391500A/zh
Publication of CN107391500A publication Critical patent/CN107391500A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本说明书实施例提供一种文本翻译方法、装置及设备,本实施例中不仅提供不同语言类型的翻译字典,还针对同一语言类型的不同业务场景配置有不同场景字典,由于场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,因此,在获得待翻译的源语言文本,以及确定目标语言类型以及源语言文本所属的业务场景类型后,可以确定与目标语言类型和业务场景类型对应的目标场景字典,并利用目标场景字典将所述源语言文本翻译为目标语言文本。

Description

文本翻译方法、装置及设备
技术领域
本说明书涉及数据处理领域,尤其涉及文本翻译方法、装置及设备。
背景技术
随着互联网的快速发展,各种形式的业务不断涌现,如在线支付、在线购物等基于互联网的服务业务。用户已经接受并越来越习惯在网上进行各种商务活动。随着不同用户对语言要求不同,提供服务的服务端需要有不同国家语言文本以满足不同国家的用户需求。例如,在页面信息进行更新或进行信息推送时,根据用户对语言的要求,需要将源语言文本转换为目标语言文本。
鉴于此,提供一种可靠的文本翻译方案显得尤为重要。
发明内容
为克服相关技术中存在的问题,本说明书提供了文本翻译方法、装置及设备。
一种文本翻译方法,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述方法包括:
获得待翻译的源语言文本;
确定目标语言类型以及所述源语言文本所属的业务场景类型;
确定与所述目标语言类型和业务场景类型对应的目标场景字典;
利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
可选的,所述目标场景字典包括句式模板集和固定词句集,所述句式模板集中每个句式模板包括固定部分和变量部分,所述利用所述目标场景字典将所述源语言文本翻译为目标语言文本,包括:
若所述源语言文本属于固定词句,则利用所述目标场景字典中的固定词句集将所述源语言文本翻译为目标语言文本;
若所述源语言文本不属于固定词句,则利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本。
可选的,每个句式模板对应有翻译为目标语言的翻译文本,所述利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本,包括:
从所述目标场景字典中的句式模板集中,查找与所述源语言文本匹配的句式模板;
将所述源语言文本中与匹配的句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
可选的,每个句式模板对应有翻译为目标语言的翻译文本,所述利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本,包括:
从所述目标场景字典中的句式模板集中,查找固定部分与所述源语言文本匹配的句式模板;
若查找到的句式模板的数量为1,将所述源语言文本中与查找到的句式模板的变量部分相对应的动态信息,与所述查找到的句式模板对应的翻译文本结合,获得目标语言文本;
若查找到的句式模板的数量大于1,从查找到的句式模板中获得与所述源语言文本匹配的目标句式模板,将所述源语言文本中与目标句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
可选的,所述场景字典在预设的多语言管理平台进行存储和更新,所述方法还包括:
定时从所述多语言管理平台获取场景字典的版本标识;
将所获取的版本标识与本地存储的场景字典的版本标识进行比较;
若版本标识不一致,则从所述多语言管理平台获取不同版本的场景字典间的差异数据;
利用所述差异数据更新本地存储的场景字典,并将该场景字典的版本标识更新为与所获取的版本标识一致。
一种文本翻译装置,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述装置包括:
文本获得模块,用于获得待翻译的源语言文本;
类型确定模块,用于确定目标语言类型以及所述源语言文本所属的业务场景类型;
字典确定模块,用于确定与所述目标语言类型和业务场景类型对应的目标场景字典;
文本翻译模块,用于利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
可选的,所述目标场景字典包括句式模板集和固定词句集,所述句式模板集中每个句式模板包括固定部分和变量部分,所述文本翻译模块包括:
静态翻译模块,用于若所述源语言文本属于固定词句,则利用所述目标场景字典中的固定词句集将所述源语言文本翻译为目标语言文本;
动态翻译模块,用于若所述源语言文本不属于固定词句,则利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本。
可选的,每个句式模板对应有翻译为目标语言的翻译文本,所述动态翻译模块,具体用于:
从所述目标场景字典中的句式模板集中,查找与所述源语言文本匹配的句式模板;
将所述源语言文本中与匹配的句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
可选的,每个句式模板对应有翻译为目标语言的翻译文本,所述动态翻译模块,具体用于:
从所述目标场景字典中的句式模板集中,查找固定部分与所述源语言文本匹配的句式模板;
若查找到的句式模板的数量为1,将所述源语言文本中与查找到的句式模板的变量部分相对应的动态信息,与所述查找到的句式模板对应的翻译文本结合,获得目标语言文本;
若查找到的句式模板的数量大于1,从查找到的句式模板中获得与所述源语言文本匹配的目标句式模板,将所述源语言文本中与目标句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
可选的,所述场景字典在预设的多语言管理平台进行存储和更新,所述装置还包括字典更新模块,用于:
定时从所述多语言管理平台获取场景字典的版本标识;
将所获取的版本标识与本地存储的场景字典的版本标识进行比较;
若版本标识不一致,则从所述多语言管理平台获取不同版本的场景字典间的差异数据;
利用所述差异数据更新本地存储的场景字典,并将该场景字典的版本标识更新为与所获取的版本标识一致。
一种计算机设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述处理器被配置为:
获得待翻译的源语言文本;
确定目标语言类型以及所述源语言文本所属的业务场景类型;
确定与所述目标语言类型和业务场景类型对应的目标场景字典;
利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
本说明书的实施例提供的技术方案可以包括以下有益效果:
本说明书实施例中,不仅提供不同语言类型的翻译字典,还针对同一语言类型的不同业务场景配置有不同场景字典,由于场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,因此,在获得待翻译的源语言文本,以及确定目标语言类型以及源语言文本所属的业务场景类型后,可以根据目标语言类型和业务场景类型确定目标场景字典,并利用目标场景字典对源语言文本进行翻译时,可以获得符合该业务场景下的翻译结果,提高翻译的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
图1A是本说明书根据一示例性实施例示出的一种文本翻译方法的应用场景图;
图1B是本说明书根据一示例性实施例示出的另一种文本翻译方法的应用场景图;
图2是本说明书根据一示例性实施例示出的一种文本翻译方法的流程图;
图3是本说明书根据一示例性实施例示出的另一种文本翻译方法的流程图;
图4是本说明书文本翻译装置所在计算机设备的一种硬件结构图;
图5是本说明书根据一示例性实施例示出的一种文本翻译装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
随着互联网的快速发展,各种形式的业务不断涌现,如在线支付、在线购物等基于互联网的服务业务。随着不同用户对语言要求不同,提供服务的服务端需要有不同国家语言文本以满足不同国家的用户需求。鉴于此,提供一种可靠的文本翻译方案显得尤为重要。
文本翻译可以应用在不同的应用场景中。例如,基于用户指令生成的翻译请求,将用户输入的信息翻译为相应的用户期望语言类型的信息。又如,在即时通讯过程中,将需要发送的信息或接收的信息翻译为相应的用户期望语言类型的信息。又如,将服务端提供的页面内容翻译为用户期望语言类型的信息。又如,将服务端推送的信息翻译为用户期望语言类型的信息等。本说明书主要以将服务端提供的信息翻译为用户期望语言类型(目标语言类型)的信息为例进行示例说明。
如图1A所示,是本说明书根据一示例性实施例示出的一种文本翻译方法的应用场景图。在该应用场景中,服务端可以根据客户端的请求向客户端返回相应的信息,例如,请求进入下一个页面等。客户端也可以在页面信息进行更新时向客户端发送更新信息等。在服务端向客户端发送信息的过程中,根据用户对语言类型的需求,可以在客户端将接收的信息翻译为目标语言类型的信息,也可以在服务端将待发送的信息翻译为目标语言类型的信息。例如,当前页面的源语言类型为中文,用户期望展示的目标语言类型为英文,用户可以触发将语言类型切换为英文的按钮,则客户端或服务端执行文本翻译操作。
由于展示页面信息的应用程序可以提供多种服务业务,不同服务业务可能由分布式***中的不同服务端提供,每个服务端可以具有多语言文案翻译能力。为了实现统一管理,本说明书实施例还提供一种多语言管理平台,在多语言管理平台存储和更新翻译时所需的字典。多语言管理平台提供***粒度下的多语言文案管理,例如字典中信息的增加、删除、修改等。如图1B所示,是本说明书根据一示例性实施例示出的另一种文本翻译方法的应用场景图。客户端通过网络与分布式***连接,分布式***中每个服务端分别与多语言管理平台连接,以实现从多语言管理平台中获取最新字典。字典中信息可以基于用户的操作指令进行更新,也可以通过大数据统计进行更新等。服务端***中的服务端可以将源语言文本翻译为目标语言文本,并将目标语言文本发送至客户端。
为了提供一种可靠的文本翻译方案,本说明书实施例不仅提供不同语言类型的翻译字典,还针对同一语言类型的不同业务场景配置有不同场景字典,由于场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,因此,在获取到待翻译的源语言文本,以及确定目标语言类型以及源语言文本所属的业务场景类型后,可以根据目标语言类型和业务场景类型确定目标场景字典,并利用目标场景字典对源语言文本进行翻译时,可以获得符合该业务场景下的翻译结果,提高翻译的准确性。
如图2所示,是本说明书根据一示例性实施例示出的一种文本翻译方法的流程图,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述方法包括:
在步骤201中,获得待翻译的源语言文本。
在步骤202中,确定目标语言类型以及所述源语言文本所属的业务场景类型。
在步骤203中,确定与所述目标语言类型和业务场景类型对应的目标场景字典。
在步骤204中,利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
其中,文本可以以不同语言类型进行展示。语言类型可以是各种语种对应的文字类型,例如中文、英文、法文、西班牙文、俄文、***文、意大利文、德文等。源语言文本可以是语言类型为源语言类型的文本,目标语言文本可以是语言类型为目标语言类型的文本,目标语言类型是用户期望翻译获得的翻译文本的语言类型。源语言类型和目标语言类型是为了区分文本当前语言类型以及期望转换的语言类型,而进行不同的命名。源语言类型与目标语言类型不同。例如,源语言文本可以是中文文本,目标语言文本可以是英文文本。
针对不同的语言类型可以配置有不同的字典,字典用于辅助翻译。字典中可以包括源语言信息、将源语言信息翻译为目标语言的翻译结果,还可以包括字典可实现的语言转换类型。例如,字典可以是将中文转换为英文的字典,也可以是将中文转换为日文的字典等。
然而,由于同一个词汇往往有多个翻译结果,鉴于此,本说明书实施例针对同一种语言类型的不同业务场景配置有不同场景字典。业务场景可以是按业务类型进行划分的场景。例如,业务场景类型可以是转账场景类型、***还款场景类型、理财场景类型、共享单车场景类型等。同一个词汇在不同业务场景下翻译的结果可能不同,例如,在某些业务场景中China翻译为中国,在某些业务场景中china翻译为瓷器。因此,可以按业务场景配置场景字典,在场景字典中基于业务场景限制词汇的翻译结果,从而避免同一词汇有多种翻译结果导致翻译不准确的情况。
其中,场景字典中至少包括该业务场景下将源语言信息翻译为目标语言的翻译结果,还可以包括源语言信息、该场景字典所对应的业务场景类型、以及场景字典可实现的语言转换类型等。例如,将中文翻译为英文的字典细分为:转账场景字典、***还款场景字典、共享单车场景字典等。在不同的场景字典中,源语言信息对应有适应于该业务场景下的翻译结果。例如,在转账场景字典中,配置有将中文词汇翻译为适合转账场景的英文词汇。在共享单车场景字典中,配置有将中文词汇翻译为适合共享单车场景的英文词汇。
在将待翻译的源语言文本翻译为目标语言文本过程中,可以获得待翻译的源语言文本。关于源语言文本,可以是需要翻译为目标语言的文本。将源语言文本翻译为目标语言文本的时机,可以是根据翻译请求进行翻译,也可以是预先翻译后进行备份,以便在需要切换语言类型时直接获取。
在一个例子中,如果源语言文本经常变动,则可以根据翻译请求进行翻译。例如,在接收到将源语言类型切换为目标语言类型的指令时,可以将当前页面信息作为源语言文本;又如,在接收到将源语言类型切换为目标语言类型的指令后,如果当前页面需要进行信息更新、且更新信息的默认语言类型不是目标语言类型,则将更新信息作为待翻译的源语言文本。又如,在接收到将源语言类型切换为目标语言类型的指令后,如果需要进行信息推送、且推送的信息默认语言类型不是目标语言类型,则将待推送的信息作为待翻译的源语言文本等等。
由于针对目标语言的不同业务场景配置有不同场景字典,因此,在将待翻译的源语言文本翻译为目标语言文本过程中,可以确定目标语言类型以及源语言文本所属的业务场景类型。在一个例子中,目标语言类型可以基于用户指令生成的翻译请求获得。翻译请求中至少携带有期望翻译获得的翻译结果的语言类型。例如,用户期望将当前页面切换为英文模式,则目标语言类型可以是英文。
关于业务场景类型,可以基于源语言文本所属的业务确定,也可以基于用户设置指令确定等。如果源语言文本是服务端提供的信息,例如,页面信息、更新信息、推送信息等,则可以根据源语言文本归属的业务确定源语言文本所属的业务场景类型。例如,源语言信息属于共享单车场景业务中的信息,则源语言信息所属的业务场景类型为共享单车场景类型。如果源语言文本不是服务端提供的信息,则业务场景类型可以基于用户设置指令获得。例如,源语言文本是用户输入的需要翻译的文本,在用户触发翻译按钮时,设置该源语言文本所属的业务场景,从而获得源语言文本所属的业务场景类型。
由于不同语言类型以及业务场景类型对应的场景字典不同,因此在确定目标语言类型以及源语言文本所属的业务场景类型后,可以确定与目标语言类型和业务场景类型对应的目标场景字典,从而获得用于将源语言文本翻译为适合该业务场景的目标语言文本的目标场景字典。鉴于此,利用所述目标场景字典将源语言文本翻译为目标语言文本,在目标场景字典中基于业务场景限制词汇的翻译结果,从而避免同一词汇有多种翻译结果导致翻译不准确的情况,提高翻译准确性。
为了实现将源语言文本翻译为目标语言文本,可以在目标场景字典中配置有源语言信息、以及源语言信息对应的翻译结果等。通过将源语言文本与源语言信息进行匹配,并将与源语言文本匹配的源语言信息对应的翻译结果作为目标语言文本。
某些情况下,待翻译的源语言文本内容相对固定。特别是在对服务端提供的信息进行翻译的场景中,例如,在某些服务端提供的页面信息中,基于业务类型,页面信息中的词句往往是固定的,因此可以将内容独立且固定的词句称为固定词句或静态文案。针对这类信息,可以在固定词句集中查找到与源语言文本完全匹配的信息。
鉴于此,可以在目标场景字典中配置有该业务场景下所需的固定词句集。固定词句集包括语言类型为源语言类型的固定词汇或句子,该类固定词汇或句子可以基于该业务所需信息而定。可以理解的是,目标场景字典中还包括该业务场景下将固定词句集中固定词句翻译为目标语言的翻译结果。例如,源语言类型为中文,目标语言类型为英文,业务场景类型为账单类型,则固定词汇“今天”对应有翻译结果“Today”,固定句子“我的账单”对应有翻译结果“My bill”等。在一个可选的实现方式中,可以利用目标场景字典中固定词句集将源语言文本翻译为目标语言文本。例如,由于源语言文本的语言类型为源语言类型,固定词句集中语言类型为源语言类型,因此可以将源语言文本与固定词句集中的固定词句进行哈希映射,获得与源语言文本匹配的固定词句,从而基于固定词句对应的翻译结果获得目标语言文本。在该例子中,匹配规则可以是完全匹配。
可见,该实施例中利用目标场景字典中的固定词句集将源语言文本翻译为目标语言文本,实现对固定句式进行翻译。
在某些服务业务中,往往有许多词句虽然具有相似性,但词句中部分信息存在差异,将这类词句可以称为非固定词句(不属于固定词句)或动态文案。为了能提高这类信息翻译的准确性,可以在目标场景字典中配置有词句对应的翻译文本;同时为了节约词句占用的资源,可以将相似词句中不同部分抽象为一个变量,并基于相同部分获得满足规则的句式模板。
鉴于此,本说明书其中一个实施例在目标场景字典中设置有句式模板集,句式模板集中每个句式模板包括固定部分和变量部分,固定部分可以是相似词句中相同的部分,变量部分可以是相似词句中不同的部分,因此,可以对固定部分进行翻译,翻译获得适合该业务场景的目标语言类型的翻译信息,并基于变量部分在句式模板中的位置,在翻译结果中设置变量标识符,从而获得句式模板对应的翻译文本。可见,句式模板是语言类型为源语言类型的模板,每个句式模板对应有翻译为目标语言的翻译文本。以句式模板的语言类型为中文为例,句式模板可以是“我的账户余额为(d+)元”。以目标语言类型为英文为例,句式模板对应的翻译文本可以是“My account balance is{0}yuan”。在该实施例中,可以利用目标场景字典中的句式模板集将源语言文本翻译为目标语言文本,实现提高信息翻译准确性的同时,节约目标场景字典中大量词句占用的存储资源。
针对如何利用目标场景字典中的句式模板集将源语言文本翻译为目标语言文本,在一个例子中,可以从所述目标场景字典中的句式模板集中,查找与所述源语言文本匹配的句式模板;将所述源语言文本中与匹配的句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
其中,本实施例可以从目标场景字典中的句式模板集中,查找与源语言文本匹配的句式模板。作为其中一种实现方式,句式模板可以用正则表达式表达。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。例如,可以遍历句式模板集中的句式模板,通过正则表达式匹配源语言文本是否和句式模板匹配,获得匹配的句式模板。句式模板与源语言文本的匹配规则可以是:句式模板中的固定部分与源语言文本中相应位置的信息完全匹配,或者匹配度大于预设阈值等。可见,通过正则表达式表达句式模板,可以查找到与源语言文本匹配的句式模板。
由于每个句式模板对应有翻译为目标语言的翻译文本,因此可以利用匹配的句式模板以及该句式模板对应的翻译文本获得目标语言文本。例如,将源语言文本中的动态信息与匹配的句式模板对应的翻译文本结合,获得目标语言文本。其中,动态信息是源语言文本中与匹配的句式模板的变量部分相对应的信息。以源语言文本包括“我的账户余额为11元”为例,匹配的句式模板为“我的账户余额为(d+)元”,变量部分(d+)对应的动态信息为“11”。作为其中一种组合,将动态信息直接添加到匹配的句式模板对应的翻译文本中,例如,目标语言文本为“My account balance is 11yuan”,作为另一种组合,可以将动态信息翻译为目标语言类型的译文,并将译文添加到匹配的句式模板对应的翻译文本中,例如,目标语言文本为“My account balance is eleven yuan”。这类句式模板的变量部分设置有特殊需求,以实现将变量部分对应的动态信息翻译为目标语言类型的译文。进一步的,针对不同的句式模板,可以预先设置句式模板的标识信息,该标识信息用于标识是否将句式模板的变量部分对应的动态信息进行翻译。在进行组合时,可以根据标识信息决定是将动态信息翻译为目标语言类型的译文,并将译文添加到匹配的句式模板对应的翻译文本中,还是直接将动态信息直接添加到匹配的句式模板对应的翻译文本中。例如,针对变量部分对应的动态信息为昵称时,可以直接将动态信息直接添加到匹配的句式模板对应的翻译文本中,针对变量部分对应的动态信息为数字或指定类型信息时,可以将动态信息翻译为目标语言类型的译文,并将译文添加到匹配的句式模板对应的翻译文本中。可以理解的是,还可以是其他组合方式,在此不再一一列举。
然而,将源语言文本直接与句式模板进行匹配,需要将源语言文本中的所有信息与句式模板中的所有信息进行匹配,会影响性能,为了降低对性能的影响,本说明书实施例可以利用源语言文本与句式模板中的固定部分是否匹配从而对句式模板进行过滤,将过滤获得的句式模板与源语言文本进行匹配,减少直接将源语言文本与句式模板进行匹配的数量,进而降低匹配消耗的性能,特别是正则匹配造成的性能消耗。具体的,可以从所述目标场景字典中的句式模板集中,查找固定部分与所述源语言文本匹配的句式模板。其中,查找固定部分与所述源语言文本匹配的句式模板,可以是查找固定部分存在于源语言文本中的句式模板。在将句式模板中的固定部分与源语言文本进行匹配时,可以是查找源语言文本中是否存在全部固定部分,或是否存在部分固定部分,从而确定是否过滤该句式模板。
例如,基于变量部分与固定部分的位置关系,如果变量部分在固定部分的中间,可以将固定部分中变量部分的上文部分称为前缀部分,将固定部分中变量部分的下文部分称为后缀部分,在将句式模板中的固定部分与源语言文本进行匹配时,还可以仅判断前缀部分或后缀部分是否存在于源语言文本中,从而实现对句式模板的过滤。仅利用固定部分中的部分信息对句式模板进行过滤,可以提高过滤效率。
在查找到句式模板后,如果查找到的句式模板的数量为1,则认为查找到的句式模板是与源语言文本匹配的模板,可以将源语言文本中与查找到的句式模板的变量部分相对应的动态信息,与所述查找到的句式模板对应的翻译文本结合,获得目标语言文本。其中,动态信息可以是源语言文本中与查找到的句式模板的变量部分相对应的信息,将动态信息与查找到的句式模板对应的翻译文本结合获得目标语言文本。例如,可以将动态信息直接添加到查找到的句式模板对应的翻译文本中。又如,可以将动态信息翻译为目标语言类型的译文,并将译文添加到匹配的句式模板对应的翻译文本中。
如果查找到的句式模板的数量为1,可以从查找到的句式模板中获得与所述源语言文本匹配的目标句式模板,将所述源语言文本中与目标句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。可以理解的是,如果查找到的句式模板的数量为1,也可以判断查找到的句式模板是否与源语言文本匹配,实现对句式模板的进一步判断,以便根据判断结果确定是否需要将动态信息与翻译文本进行结合,进而提高翻译的准确性。
如果查找到的句式模板的数量大于1,表示有多个候选的句式模板,则可以将源语言文本与查找到的句式模板进行匹配,获得与源语言文本匹配的目标句式模板,从而利用目标句式模板以及目标句式模板对应的翻译文本将源语言文本翻译为目标语言文本。
由上述实施例可见,利用句式模板中的固定部分是否与源语言文本匹配,从而对句式模板进行过滤,将过滤获得的句式模板与源语言文本进行匹配,减少直接将源语言文本与句式模板进行匹配的数量,降低匹配消耗的时间,同时减少性能消耗。
实际应用中,待翻译的信息中,某些信息属于固定词句,有些信息不属于固定词句,鉴于此,本说明书实施例可以将属于固定词句的源语言文本利用固定词句集进行翻译,将不属于固定词句的源语言文本利用句式模板集进行翻译。在该实施例中,目标场景字典包括句式模板集和固定词句集,所述句式模板集中每个句式模板包括固定部分和变量部分,所述利用所述目标场景字典将所述源语言文本翻译为目标语言文本,包括:
若所述源语言文本属于固定词句,则利用所述目标场景字典中的固定词句集将所述源语言文本翻译为目标语言文本;
若所述源语言文本不属于固定词句,则利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本。
在该实施例中,可以先确定源语言文本是否属于固定词句。在一个例子中,可以通过用户设置指令确定源语言文本是否属于固定词句。在另一个例子中,页面布局一般是预先设置的,页面中不同位置所布局的信息的动静状态相对固定,其中,动静状态是用于描述源语言文本是否属于固定词句的状态,因此,可以基于源语言文本在页面中的位置确定源语言文本是否属于固定词句。可以理解的是,还可以通过其他方式确定源语言文本是否属于固定词句,在此不一一列举。
可见,在源语言文本属于固定词句时,利用目标场景字典中的固定词句集将源语言文本翻译为目标语言文本,可以提高翻译效率,在源语言文本属于非固定词句时,利用目标场景字典中的句式模板集将源语言文本翻译为目标语言文本,可以提高翻译准确率,实现既支持静态文案翻译,又支持动态文案翻译。
进一步的,可以将句式模板集单独划分为动态字典,将固定词句集单独划分为静态字典,即目标场景字典可以包括动态字典和静态字典,通过不同字典管理不同集合,实现分别管理,便于分别进行更新。
本地存储的场景字典还可以进行更新。在一个可选的实现方式中,所述场景字典在预设的多语言管理平台进行存储和更新,所述方法还包括:
定时从所述多语言管理平台获取场景字典的版本标识;
将所获取的版本标识与本地存储的场景字典的版本标识进行比较;
若版本标识不一致,则从所述多语言管理平台获取不同版本的场景字典间的差异数据;
利用所述差异数据更新本地存储的场景字典,并将该场景字典的版本标识更新为与所获取的版本标识一致。
其中,多语言管理平台可以管理分布式***中各服务端的场景字典,实现字典的存储和更新。例如,更新可以包括句式模板以及其翻译文本的删除、添加、修改等。为了避免服务端从多语言管理平台获取本端不需要的字典信息,多语言管理平台可以分别管理各个服务端的场景字典。每次更新字典时,标识该场景字典的版本标识进行变动,例如版本标识可以是版本号,每次更新字典时,将该字典的版本号进行增加,并记录变更信息(差异数据)。
在一个例子中,可以通过设置间隔时间实现定时,例如每间隔5分钟拉取一次数据。
在本执行端中,定时从多语言管理平台获取场景字典的版本标识,并将所获取的版本标识与本地存储的场景字典的版本标识进行比较,若版本标识不一致,表示本地存储的场景字典与多语言管理平台存储的场景字典不一致,则从多语言管理平台获取不同版本的场景字典间的差异数据;并利用差异数据更新本地存储的场景字典,同时并将该场景字典的版本标识更新为与所获取的版本标识一致,以便下一次进行版本标识比较。
可见,本实施例通过版本标识的方式判断场景字典是否进行了更新,如果场景字典进行了更新,则主动从多语言管理平台中拉取差异数据,利用差异数据更新本地存储的场景字典,实现场景字典及时更新。
此外,可以在多语言管理平台更新场景字典时,主动将差异数据(更新信息)推送至服务端,服务端利用接收的差异数据更新本地存储的场景字典,在此不做限制。
以上实施方式中的各种技术特征可以任意进行组合,只要特征之间的组合不存在冲突或矛盾,但是限于篇幅,未进行一一描述,因此上述实施方式中的各种技术特征的任意进行组合也属于本说明书公开的范围。
以下以其中一种组合方式进行示例说明。
如图3所示,图3是本说明书根据一示例性实施例示出的另一种文本翻译方法的流程图,在该实施例中,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述方法包括:
在步骤301中,获得待翻译的源语言文本。
在步骤302中,确定目标语言类型、所述源语言文本所属的业务场景类型、以及所述源语言文本的动静状态。
其中,动静状态是用于描述源语言文本是否属于固定词句的状态,可以将属于固定词句的源语言文本判定为处于静态,将属于非固定词句的源语言文本判定为处于动态。
在步骤303中,确定与所述目标语言类型和业务场景类型对应的目标场景字典。
其中,所述目标场景字典包括含有句式模板的动态字典和含有固定词句的静态字典,所述动态字典中每个句式模板包括固定部分和变量部分。
在步骤304中,若所述源语言文本属于固定词句,则利用所述目标场景字典中的静态字典将所述源语言文本翻译为目标语言文本。
在步骤305中,若所述源语言文本不属于固定词句,则利用所述目标场景字典中的动态字典将所述源语言文本翻译为目标语言文本。
进一步的,还可以通过多语言管理平台对字典进行统一管理,并在本执行端对场景字典进行更新,字典更新过程可以包括:
在步骤306中,定时从所述多语言管理平台获取场景字典的版本标识。
在步骤307中,将所获取的版本标识与本地存储的场景字典的版本标识进行比较。
在步骤308中,若版本标识不一致,则从所述多语言管理平台获取不同版本的场景字典间的差异数据。
在步骤309中,利用所述差异数据更新本地存储的场景字典,并将该场景字典的版本标识更新为与所获取的版本标识一致。
步骤301至309与前述实施例中相关技术相同,在此不再一一赘述。
由上述实施例可见,该实施例针对同一语言类型的不同业务场景配置有不同场景字典,由于场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,因此,利用目标场景字典对源语言文本进行翻译时,可以获得符合该业务场景下的翻译结果,提高翻译的准确性;同时,通过动态字典和静态字典实现多语言的静态文案翻译、动态文案翻译,另外,还可以通过版本标识的方式判断场景字典是否进行了更新,如果场景字典进行了更新,则主动从多语言管理平台中拉取差异数据,利用差异数据更新本地存储的场景字典,实现场景字典及时更新。
与前述文本翻译方法的实施例相对应,本说明书还提供了文本翻译装置及其所应用的电子设备的实施例。
本说明书文本翻译装置的实施例可以应用在计算机设备。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在计算机设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图4所示,为本说明书文本翻译装置所在计算机设备的一种硬件结构图,除了图4所示的处理器410、内存430、网络接口420、以及非易失性存储器440之外,实施例中装置431所在的计算机设备通常根据该设备的实际功能,还可以包括其他硬件,对此不再赘述。
如图5所示,是本说明书根据一示例性实施例示出的一种文本翻译装置的框图,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述装置包括:
文本获得模块52,用于获得待翻译的源语言文本;
类型确定模块54,用于确定目标语言类型以及所述源语言文本所属的业务场景类型;
字典确定模块56,用于确定与所述目标语言类型和业务场景类型对应的目标场景字典;
文本翻译模块58,用于利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
可选的,所述目标场景字典包括句式模板集和固定词句集,所述句式模板集中每个句式模板包括固定部分和变量部分,所述文本翻译模块包括:
静态翻译模块,用于若所述源语言文本属于固定词句,则利用所述目标场景字典中的固定词句集将所述源语言文本翻译为目标语言文本;
动态翻译模块,用于若所述源语言文本不属于固定词句,则利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本。
可选的,每个句式模板对应有翻译为目标语言的翻译文本,所述动态翻译模块,具体用于:
从所述目标场景字典中的句式模板集中,查找与所述源语言文本匹配的句式模板;
将所述源语言文本中与匹配的句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
可选的,每个句式模板对应有翻译为目标语言的翻译文本,所述动态翻译模块,具体用于:
从所述目标场景字典中的句式模板集中,查找固定部分与所述源语言文本匹配的句式模板;
若查找到的句式模板的数量为1,将所述源语言文本中与查找到的句式模板的变量部分相对应的动态信息,与所述查找到的句式模板对应的翻译文本结合,获得目标语言文本;
若查找到的句式模板的数量大于1,从查找到的句式模板中获得与所述源语言文本匹配的目标句式模板,将所述源语言文本中与目标句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
可选的,所述场景字典在预设的多语言管理平台进行存储和更新,所述装置还包括字典更新模块,用于:
定时从所述多语言管理平台获取场景字典的版本标识;
将所获取的版本标识与本地存储的场景字典的版本标识进行比较;
若版本标识不一致,则从所述多语言管理平台获取不同版本的场景字典间的差异数据;
利用所述差异数据更新本地存储的场景字典,并将该场景字典的版本标识更新为与所获取的版本标识一致。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
一种计算机设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述处理器被配置为:
获得待翻译的源语言文本;
确定目标语言类型以及所述源语言文本所属的业务场景类型;
确定与所述目标语言类型和业务场景类型对应的目标场景字典;
利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
一种计算机存储介质,所述存储介质中存储有程序指令,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述程序指令包括:
获得待翻译的源语言文本;
确定目标语言类型以及所述源语言文本所属的业务场景类型;
确定与所述目标语言类型和业务场景类型对应的目标场景字典;
利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
本说明书实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本说明书的其它实施方案。本说明书旨在涵盖本说明书的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书的一般性原理并包括本说明书未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书的真正范围和精神由下面的权利要求指出。
应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书的范围仅由所附的权利要求来限制。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

Claims (11)

1.一种文本翻译方法,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述方法包括:
获得待翻译的源语言文本;
确定目标语言类型以及所述源语言文本所属的业务场景类型;
确定与所述目标语言类型和业务场景类型对应的目标场景字典;
利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
2.根据权利要求1所述的方法,所述目标场景字典包括句式模板集和固定词句集,所述句式模板集中每个句式模板包括固定部分和变量部分,所述利用所述目标场景字典将所述源语言文本翻译为目标语言文本,包括:
若所述源语言文本属于固定词句,则利用所述目标场景字典中的固定词句集将所述源语言文本翻译为目标语言文本;
若所述源语言文本不属于固定词句,则利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本。
3.根据权利要求2所述的方法,每个句式模板对应有翻译为目标语言的翻译文本,所述利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本,包括:
从所述目标场景字典中的句式模板集中,查找与所述源语言文本匹配的句式模板;
将所述源语言文本中与匹配的句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
4.根据权利要求2所述的方法,每个句式模板对应有翻译为目标语言的翻译文本,所述利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本,包括:
从所述目标场景字典中的句式模板集中,查找固定部分与所述源语言文本匹配的句式模板;
若查找到的句式模板的数量为1,将所述源语言文本中与查找到的句式模板的变量部分相对应的动态信息,与所述查找到的句式模板对应的翻译文本结合,获得目标语言文本;
若查找到的句式模板的数量大于1,从查找到的句式模板中获得与所述源语言文本匹配的目标句式模板,将所述源语言文本中与目标句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
5.根据权利要求1至4任一项所述的方法,所述场景字典在预设的多语言管理平台进行存储和更新,所述方法还包括:
定时从所述多语言管理平台获取场景字典的版本标识;
将所获取的版本标识与本地存储的场景字典的版本标识进行比较;
若版本标识不一致,则从所述多语言管理平台获取不同版本的场景字典间的差异数据;
利用所述差异数据更新本地存储的场景字典,并将该场景字典的版本标识更新为与所获取的版本标识一致。
6.一种文本翻译装置,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述装置包括:
文本获得模块,用于获得待翻译的源语言文本;
类型确定模块,用于确定目标语言类型以及所述源语言文本所属的业务场景类型;
字典确定模块,用于确定与所述目标语言类型和业务场景类型对应的目标场景字典;
文本翻译模块,用于利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
7.根据权利要求6所述的装置,所述目标场景字典包括句式模板集和固定词句集,所述句式模板集中每个句式模板包括固定部分和变量部分,所述文本翻译模块包括:
静态翻译模块,用于若所述源语言文本属于固定词句,则利用所述目标场景字典中的固定词句集将所述源语言文本翻译为目标语言文本;
动态翻译模块,用于若所述源语言文本不属于固定词句,则利用所述目标场景字典中的句式模板集将所述源语言文本翻译为目标语言文本。
8.根据权利要求7所述的装置,每个句式模板对应有翻译为目标语言的翻译文本,所述动态翻译模块,具体用于:
从所述目标场景字典中的句式模板集中,查找与所述源语言文本匹配的句式模板;
将所述源语言文本中与匹配的句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
9.根据权利要求7所述的装置,每个句式模板对应有翻译为目标语言的翻译文本,所述动态翻译模块,具体用于:
从所述目标场景字典中的句式模板集中,查找固定部分与所述源语言文本匹配的句式模板;
若查找到的句式模板的数量为1,将所述源语言文本中与查找到的句式模板的变量部分相对应的动态信息,与所述查找到的句式模板对应的翻译文本结合,获得目标语言文本;
若查找到的句式模板的数量大于1,从查找到的句式模板中获得与所述源语言文本匹配的目标句式模板,将所述源语言文本中与目标句式模板的变量部分相对应的动态信息,与所述匹配的句式模板对应的翻译文本结合,获得目标语言文本。
10.根据权利要求6至9任一项所述的装置,所述场景字典在预设的多语言管理平台进行存储和更新,所述装置还包括字典更新模块,用于:
定时从所述多语言管理平台获取场景字典的版本标识;
将所获取的版本标识与本地存储的场景字典的版本标识进行比较;
若版本标识不一致,则从所述多语言管理平台获取不同版本的场景字典间的差异数据;
利用所述差异数据更新本地存储的场景字典,并将该场景字典的版本标识更新为与所获取的版本标识一致。
11.一种计算机设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,针对目标语言的不同业务场景配置有不同场景字典,场景字典中包括该业务场景下将源语言信息翻译为目标语言的翻译结果,所述处理器被配置为:
获得待翻译的源语言文本;
确定目标语言类型以及所述源语言文本所属的业务场景类型;
确定与所述目标语言类型和业务场景类型对应的目标场景字典;
利用所述目标场景字典将所述源语言文本翻译为目标语言文本。
CN201710718020.6A 2017-08-21 2017-08-21 文本翻译方法、装置及设备 Pending CN107391500A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710718020.6A CN107391500A (zh) 2017-08-21 2017-08-21 文本翻译方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710718020.6A CN107391500A (zh) 2017-08-21 2017-08-21 文本翻译方法、装置及设备

Publications (1)

Publication Number Publication Date
CN107391500A true CN107391500A (zh) 2017-11-24

Family

ID=60353903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710718020.6A Pending CN107391500A (zh) 2017-08-21 2017-08-21 文本翻译方法、装置及设备

Country Status (1)

Country Link
CN (1) CN107391500A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153541A (zh) * 2017-04-20 2017-09-12 北京小米移动软件有限公司 浏览交互处理方法及装置
CN108415905A (zh) * 2018-03-06 2018-08-17 喻海联 实时翻译方法、智能眼镜及计算机可读存储介质
CN108763228A (zh) * 2018-05-21 2018-11-06 王伟宙 一种自然语言辅助处理***
CN108959274A (zh) * 2018-06-27 2018-12-07 维沃移动通信有限公司 一种应用程序的翻译方法及服务器
CN109861904A (zh) * 2019-02-19 2019-06-07 天津字节跳动科技有限公司 姓名标签显示方法和装置
CN110008468A (zh) * 2019-03-04 2019-07-12 广州虎牙信息科技有限公司 语言***管理方法、信息转换方法、服务器以及存储介质
CN111008524A (zh) * 2019-12-05 2020-04-14 网易(杭州)网络有限公司 语言翻译的处理方法和装置
CN111177318A (zh) * 2019-12-23 2020-05-19 杭州安恒信息技术股份有限公司 一种执行国际化业务的方法、装置和计算机可读存储介质
CN111369973A (zh) * 2020-02-28 2020-07-03 广州三星通信技术研究有限公司 用于在电子终端中选择翻译工具的方法和设备
CN111368560A (zh) * 2020-02-28 2020-07-03 北京字节跳动网络技术有限公司 文本翻译方法、装置、电子设备及存储介质
CN112037074A (zh) * 2020-09-11 2020-12-04 中国银行股份有限公司 基于可视化的数据文件解析方法及装置
CN112069439A (zh) * 2020-09-15 2020-12-11 成都知道创宇信息技术有限公司 文案请求处理方法和装置、文案提供服务器及存储介质
CN112100987A (zh) * 2020-09-27 2020-12-18 中国建设银行股份有限公司 一种多源数据字典的转码方法及装置
CN112347794A (zh) * 2020-10-27 2021-02-09 深圳前海微众银行股份有限公司 数据翻译方法、装置、设备及计算机存储介质
CN112699692A (zh) * 2021-01-04 2021-04-23 安徽希施玛数据科技有限公司 文本的翻译控制方法、装置、电子设备及存储介质
CN112817655A (zh) * 2021-01-29 2021-05-18 北京达佳互联信息技术有限公司 文案信息处理方法、装置、存储介质及电子设备
CN112988290A (zh) * 2019-12-12 2021-06-18 腾讯科技(深圳)有限公司 多语言配置文件的生成方法、页面显示方法、装置及终端
CN113539271A (zh) * 2021-07-23 2021-10-22 北京梧桐车联科技有限责任公司 语音识别方法、装置、设备及计算机可读存储介质
CN115797815A (zh) * 2021-09-08 2023-03-14 荣耀终端有限公司 Ar翻译的处理方法及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1308748A (zh) * 1998-05-04 2001-08-15 特雷道斯股份有限公司 机器辅助翻译工具
CN101206643A (zh) * 2006-12-21 2008-06-25 中国科学院计算技术研究所 一种融合了句型模板和统计机器翻译技术的翻译方法
CN101571854A (zh) * 2009-06-11 2009-11-04 四川国腾通讯股份有限公司 多国语言间交流和沟通***及方法
CN102084417A (zh) * 2008-04-15 2011-06-01 移动技术有限责任公司 现场维护语音到语音翻译的***和方法
CN104025079A (zh) * 2011-09-09 2014-09-03 谷歌公司 用于翻译网页的用户接口
US20150088484A1 (en) * 2013-09-26 2015-03-26 International Business Machines Corporation Domain specific salient point translation
CN106649282A (zh) * 2015-10-30 2017-05-10 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备
CN106959943A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 语种识别更新方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1308748A (zh) * 1998-05-04 2001-08-15 特雷道斯股份有限公司 机器辅助翻译工具
CN101206643A (zh) * 2006-12-21 2008-06-25 中国科学院计算技术研究所 一种融合了句型模板和统计机器翻译技术的翻译方法
CN102084417A (zh) * 2008-04-15 2011-06-01 移动技术有限责任公司 现场维护语音到语音翻译的***和方法
CN101571854A (zh) * 2009-06-11 2009-11-04 四川国腾通讯股份有限公司 多国语言间交流和沟通***及方法
CN104025079A (zh) * 2011-09-09 2014-09-03 谷歌公司 用于翻译网页的用户接口
US20150088484A1 (en) * 2013-09-26 2015-03-26 International Business Machines Corporation Domain specific salient point translation
CN106649282A (zh) * 2015-10-30 2017-05-10 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备
CN106959943A (zh) * 2016-01-11 2017-07-18 阿里巴巴集团控股有限公司 语种识别更新方法及装置

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153541A (zh) * 2017-04-20 2017-09-12 北京小米移动软件有限公司 浏览交互处理方法及装置
CN108415905A (zh) * 2018-03-06 2018-08-17 喻海联 实时翻译方法、智能眼镜及计算机可读存储介质
CN108763228A (zh) * 2018-05-21 2018-11-06 王伟宙 一种自然语言辅助处理***
CN108959274A (zh) * 2018-06-27 2018-12-07 维沃移动通信有限公司 一种应用程序的翻译方法及服务器
CN108959274B (zh) * 2018-06-27 2022-09-02 维沃移动通信有限公司 一种应用程序的翻译方法及服务器
US11283740B2 (en) 2019-02-19 2022-03-22 Tianjin Bytedance Technology Co., Ltd. Name label display method and apparatus
CN109861904A (zh) * 2019-02-19 2019-06-07 天津字节跳动科技有限公司 姓名标签显示方法和装置
CN110008468A (zh) * 2019-03-04 2019-07-12 广州虎牙信息科技有限公司 语言***管理方法、信息转换方法、服务器以及存储介质
CN111008524A (zh) * 2019-12-05 2020-04-14 网易(杭州)网络有限公司 语言翻译的处理方法和装置
CN112988290B (zh) * 2019-12-12 2024-01-26 腾讯科技(深圳)有限公司 多语言配置文件的生成方法、页面显示方法、装置及终端
CN112988290A (zh) * 2019-12-12 2021-06-18 腾讯科技(深圳)有限公司 多语言配置文件的生成方法、页面显示方法、装置及终端
CN111177318A (zh) * 2019-12-23 2020-05-19 杭州安恒信息技术股份有限公司 一种执行国际化业务的方法、装置和计算机可读存储介质
CN111368560A (zh) * 2020-02-28 2020-07-03 北京字节跳动网络技术有限公司 文本翻译方法、装置、电子设备及存储介质
CN111369973A (zh) * 2020-02-28 2020-07-03 广州三星通信技术研究有限公司 用于在电子终端中选择翻译工具的方法和设备
CN112037074A (zh) * 2020-09-11 2020-12-04 中国银行股份有限公司 基于可视化的数据文件解析方法及装置
CN112037074B (zh) * 2020-09-11 2024-04-19 中国银行股份有限公司 基于可视化的数据文件解析方法及装置
CN112069439A (zh) * 2020-09-15 2020-12-11 成都知道创宇信息技术有限公司 文案请求处理方法和装置、文案提供服务器及存储介质
CN112069439B (zh) * 2020-09-15 2023-10-13 成都知道创宇信息技术有限公司 文案请求处理方法和装置、文案提供服务器及存储介质
CN112100987A (zh) * 2020-09-27 2020-12-18 中国建设银行股份有限公司 一种多源数据字典的转码方法及装置
CN112347794A (zh) * 2020-10-27 2021-02-09 深圳前海微众银行股份有限公司 数据翻译方法、装置、设备及计算机存储介质
CN112699692A (zh) * 2021-01-04 2021-04-23 安徽希施玛数据科技有限公司 文本的翻译控制方法、装置、电子设备及存储介质
CN112817655A (zh) * 2021-01-29 2021-05-18 北京达佳互联信息技术有限公司 文案信息处理方法、装置、存储介质及电子设备
CN112817655B (zh) * 2021-01-29 2024-05-14 北京达佳互联信息技术有限公司 文案信息处理方法、装置、存储介质及电子设备
CN113539271A (zh) * 2021-07-23 2021-10-22 北京梧桐车联科技有限责任公司 语音识别方法、装置、设备及计算机可读存储介质
CN115797815A (zh) * 2021-09-08 2023-03-14 荣耀终端有限公司 Ar翻译的处理方法及电子设备
CN115797815B (zh) * 2021-09-08 2023-12-15 荣耀终端有限公司 Ar翻译的处理方法及电子设备

Similar Documents

Publication Publication Date Title
CN107391500A (zh) 文本翻译方法、装置及设备
Maekawa et al. Balanced corpus of contemporary written Japanese
CN107256269B (zh) 方法、计算机可读非临时性存储介质和***
EP2570974B1 (en) Automatic crowd sourcing for machine learning in information extraction
US9224103B1 (en) Automatic annotation for training and evaluation of semantic analysis engines
CN110413738A (zh) 一种信息处理方法、装置、服务器及存储介质
CN105045852A (zh) 一种教学资源的全文搜索引擎***
MXPA04001729A (es) Metodos y sistemas para traduccion de idiomas.
KR20100038378A (ko) 지능적인 텍스트 주석을 위한 방법, 시스템 및 컴퓨터 프로그램
JP6663826B2 (ja) 計算機及び応答の生成方法
CN102314440B (zh) 利用网络维护语言模型库的方法和***
JP2017220204A (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
CN109191158A (zh) 用户画像标签数据的处理方法及处理设备
Dong et al. Multichannel LSTM-CRF for named entity recognition in Chinese social media
CN110489032B (zh) 用于电子书的词典查询方法及电子设备
CN110134970B (zh) 标题纠错方法和装置
Kuć et al. Mastering elasticsearch
US20080040352A1 (en) Method for creating a disambiguation database
Kuć et al. Elasticsearch Server
CN110209780A (zh) 一种问题模板生成方法、装置、服务器及存储介质
JPWO2009048149A1 (ja) 電子文書の同等判定システムおよび同等判定方法
US20090182759A1 (en) Extracting entities from a web page
CN109902309B (zh) 翻译方法、装置、设备和存储介质
März et al. Data centric domain adaptation for historical text with OCR errors
JP5739352B2 (ja) 辞書生成装置、文書ラベル判定システム及びコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171124