CN108351871A

CN108351871A - 通用翻译

Info

Publication number: CN108351871A
Application number: CN201580084729.4A
Authority: CN
Inventors: 黄飞
Original assignee: Facebook Inc
Current assignee: Meta Platforms Inc
Priority date: 2015-09-22
Filing date: 2015-09-23
Publication date: 2018-07-31
Anticipated expiration: 2035-09-23
Also published as: US10346537B2; CA2999244A1; JP6754426B2; JP2018533786A; US9734142B2; WO2017052538A1; US20170083504A1; CN108351871B; KR102364163B1; IL257988A; US20180113851A1; AU2015409645A1; KR20180056677A; MX2018003490A

Abstract

能够通过基于诸如媒体项中的词汇和由媒体项作者获知的语言等固有或外在的因素尝试对媒体项进行初始语言识别而识别媒体项的可能源语言。该初始识别能够利用对应的可能性因素生成最可能源语言的列表。然后，能够执行假定最可能源语言中的每种的翻译。能够对多种输出语言执行翻译。产生的每个译本均能够接收基于多种因素的对应分数。能够对具有共同源语言的分数进行组合。这些组合的分数能够用于对媒体项的源语言的之前识别的可能性因素进行加权。

Description

通用翻译

相关申请的交叉引用

本申请要求于2015年9月22日提交的美国专利申请号14/861/747的权益，通过引用将其全部内容结合在此。

背景技术

互联网使得人们可以以之前不曾想到的方式全球性地连接并且共享信息。例如，社交媒体平台使位于地球的相对侧的人们能够沟通理念、讨论当前事件、或共享他们的午餐。在过去，这种惊人的资源在某种程度上被限制于具有共同自然语言(“语言”)的用户之间的通信。此外，用户仅能够消费他们的语言之中的内容，或内容供应商能够基于***设置或网络位置(例如，互联网协议(“IP”)地址或语言标识符)对其确定适当的译本的内容。

尽管世界各地使用的许多不同语言之间的通信具有特殊的挑战性，机器翻译服务已经尝试去解决此问题。这些服务提供了用户使用网络形式提供文本、选择一种或多种语言、并且以已选择的语言接收文本的译本的机制。尽管这些服务已经明显提高人们跨越语言障碍进行通信的能力，但其可以要求用户打开单独的网站、指出其想要的翻译语言、并且识别源文件的语言。然后，在该单独的网站中示出生成的译本，从由最初来源提供的上下文中移除该内容。在某些情况下，翻译器服务不能够锁定源页面的各部分以进行翻译或由于翻译产生的格式变化而提供源网站的不可读版本。在许多情况下，用户发现这个过程过于不便并且可能丧失耐性并导航至不同的网站或可能直接跳过其不理解的文本，从而错失接收内容的机会。

附图说明

图1是示出本公开技术的一些实现方式能够操作的设备的概况的框图。

图2是示出本公开技术的一些实现方式能够在其中操作的环境的概况的框图。

图3是示出采用本公开技术的一些实现方式的***中能够使用的部件的框图。

图4是示出用于计算片段源语言的置信分数的一些实现方式中使用的过程的流程图。

图5A是示出用于生成片段的被评分的译本的一些实现方式中使用的一个过程的流程图。

图5B是示出用于生成片段的被评分的译本的一些额外实现方式中使用的过程的流程图。

图6是示出计算片段源语言的置信分数的实施例。

通过结合所附附图参考下列细节描述可以更好地理解此处引入的技术，其中，类似参考标号指示相同或功能相似的元件。

具体实施方式

本公开的各种实施方式可以包括用于识别片段的最可能源语言的方法、计算机可读存储介质、以及***。可以接收片段的指示。可以确定片段的两种以上可能源语言。可以生成片段的两个以上译本，每个均具有指定的译本源语言。可以生成片段的两个以上译本中的至少一个，将片段的两种以上可能源语言中的第一种设置为指定的译本源语言，并且可以生成片段的两个以上译本中的至少另一个，将片段的两种以上可能源语言中的除片段的两种以上可能源语言中的第一种之外的第二种设置为指定的译本源语言。可以计算片段的已生成的两个以上译本中的至少两个的准确度分数。可以产生片段的至少两种已选择的可能源语言中的每种的置信因数，其中，可以基于具有与已选择的可能源语言对应的源语言的经过计算的准确度分数中的一个或多个产生每种已选择的可能源语言的置信因数。可以选择与最高置信因数相关联的片段的可能源语言作为最可能源语言。

在实施方式中，一个或多个计算机可读非易失性存储介质涵盖软件，当被运行时可操作以执行根据本发明或其任意实施方式的方法的软件。

在实施方式中，***包括一个或多个处理器以及耦合至处理器并且包括通过处理器可运行的指令的至少一个存储器，处理器在运行指令时可操作为执行根据本发明或其任意实施方式的方法。

在实施方式中，一种计算机程序产品，优选包括计算机可读非易失性存储介质，当在数据处理***上运行时可操作以执行根据本发明或其任意实施方式的方法。

在面向方法、存储介质、***、以及计算机程序产品的所附权利要求中具体公开了根据本发明的实施方式，其中，在一个权利要求范畴(例如，方法)中提及的任何特征也能够在另一个权利要求范畴(例如，***)中要求保护。仅出于形式原因选定所附权利要求的从属性或逆向引用。然而，也能够要求保护对任意在先权利要求的有意引用(具体地，多重从属性)而产生的任何主题，因此，公开了权利要求及其特征的任何组合并且能够要求保护，而与所附权利要求中选定的从属性无关。能够要求保护的主题不仅包括所附权利要求中阐述的特征的组合，而且还包括权利要求中的特征的任何其他组合，其中，权利要求中提及的每个特征均能够与权利要求中的任何其他特征或其他特征的组合进行组合。进一步地，在单独权利要求和/或在与此处描述或记述的任意实施方式或特征，或者与所附权利要求的任意特征的任意组合中能够要求保护此处描述或记述的任意实施方式或特征。

公开了基于多个语言译本的打分的源语言识别。当对媒体项执行语言处理时，诸如应用机器翻译引擎、执行拼写校正或语法校正等，能够提供媒体项的源语言作为处理引擎的参数。对媒体项的源语言的识别可以是困难的，特别是在媒体项的语言学内容较短、使用未附有具体语言的俚语或其他词汇，具有未识别的部分或包含错误时。

通过基于诸如其内容和上下文等因素执行媒体项的初始分析能够实现媒体项的源语言识别。该初始分析能够识别一种或多种可能源语言及对应的置信分数。然后，能够对于每种得分最高的源语言使用机器翻译引擎执行媒体项的多种翻译，以将媒体项转换成多种输出语言。能够计算指示该译本的质量的每个译本的分数。能够将与每种源语言对应的分数集合进行组合，以形成与该源语言对应的加权因数。然后，能够使用这些加权因数调整与每种源语言对应的置信分数。能够选择具有最高调整分数的源语言作为最可能源语言。

此处使用的“源语言”指编写媒体项或当前存在的自然语言。此处使用的“媒体项”可以是利用语言的任何内容，包括文本、音频、视频等。此处使用的“语言”是自然语言，即人类编写语言、口说语言、或手语，例如英语、法语、中文、或美国手语。语言不需要是国家语言，例如英语，但是能够是具体自然语言的方言或变异，或者能够是语言的单独表示法，例如拼音。

作为实施例，关于圣地亚哥教士(San Diego Padres)的社交媒体帖子的媒体项可以包含片段：“Mi Padres r playing on television”。使用仅将词汇匹配至对应语言的算法的该片段的初始分析可以用.87的分数指示英语并且用.91的分数指示西班牙语作为两个最高打分的源语言，因为在西班牙语中“mi”指“my”，但在英语中“mi”可能是“my”的打字错误；在西班牙语中“Padres”指“fathers”，但在英语中通常在指Padres体育队时使用，特别是当在句子中大写时；由于用“r”取代“are；”是常见俚语，“r”可能不被映射至任何语言或可能被较弱地指示为英语“on”可以指英语；并且“television”可能模糊地处在英语与西班牙语之间，因为在没有口音时其拼写在两种语言中是相同的。

继续该实施例，然后使用机器翻译引擎能够执行片段的多种翻译。能够执行将片段转换成多种输出语言，将源语言设置为英语的翻译的第一集合。能够执行将片段转换成多种输出语言、将源语言设置成西班牙语的翻译的第二集合。能够对第一集合中的产生的每种译本评分，并且能够将这些分数组合成英语加权因数，在该实施例中为1.12。还能够对第二集合中的产生的每种译本评分，并且能够将这些分数组合成西班牙语加权因数，在该实施例中为.80。通过将英语置信分数和英语加权因数相乘能够对英语置信分数应用英语加权因数，以接收更新的英语置信因数.97。通过将西班牙语置信因数和西班牙语加权因数相乘能够对西班牙语置信因数应用西班牙语加权因数，以接收更新的西班牙语置信因数.73。基于已更新的置信因数，能够确定英语是最可能源语言。

下面参考附图对所描述的技术的若干实现方式进行更为详细地讨论。关于附图，图1是示出本公开技术的一些实现方式可以在其上操作的设备100的概况的框图。设备能够包括能够基于多个译本识别媒体项源语言的设备100的硬件部件。设备100能够包括对CPU(处理器)110提供输入，通知其动作的一个或多个输入设备120。通常通过解释从输入设备接收的信号并且使用通信协议将信息通信至CPU 110的硬件控制器传达动作。例如，输入设备120包括鼠标、键盘、触摸屏、红外传感器、触摸板、可佩戴的输入设备、基于摄像头或图像的输入设备、麦克风、或其他用户输入设备。

CPU 110可以是设备中的或跨多个设备分布的单个处理单元或多个处理单元。例如，CPU 110能够通过使用例如PCI总线或SCSI总线的总线耦合至其他硬件设备。CPU 110能够与诸如用于显示器130等的用于设备的硬件控制器通信。显示器130能够用于显示文本和图形。在一些实施例中，显示器130向用户提供图形和文本视觉反馈。在一些实现方式中，诸如，当输入设备是触摸屏或配备有眼睛方向监测***时，显示器130包括作为显示器的一部分的输入设备。在一些实现方式中，显示器与输入设备分离。显示设备的实施例是：LCD显示屏、LED显示屏、投影显示器(诸如，平视设备或头戴式设备)等。其他I/O设备140还能够耦合至处理器，诸如，网卡、视频卡、音频卡、USB、火线或其他外部设备、摄像头、打印机、扬声器、CD-ROM驱动器、DVD驱动器、磁盘驱动器、或蓝光设备。

在一些实现方式中，设备100还包括能够与网络节点无线地或基于有线地通信的通信设备。通信设备能够使用例如TCP/IP协议通过网络与另一设备或服务器通信。设备100能够利用通信设备跨多个网络设备分配操作。

CPU 110能够访问存储器150。存储器包括用于易失性和非易失性存储器的各种硬件设备中的一个或多个并且能够包括只读和可写存储器。例如，存储器能够包括随机访问存储器(RAM)、CPU寄存器、只读存储器(ROM)、以及可写非易失性存储器，诸如闪存存储器、硬盘驱动器、软盘、CD、DVD、磁性存储设备、磁带驱动器、设备缓冲器等。存储器不是与下层硬件脱离的传播信号；由此，存储器是非易失性的。存储器150能够包括存储程序和软件(诸如操作***162、语言分类符164、以及任何其他的应用程序166)的程序存储器160。存储器150还能够包括数据存储器170，数据存储器170能包括媒体项；媒体项译本和翻译引擎；译本分数；组合的译本分数；以及打分模型；媒体项到源语言的映射或置信分数；配置数据；设置；以及能够提供给程序存储器160或设备100的任何元件的用户选项或喜好。

利用多个其他通用或专用的计算***环境或配置操作本公开的技术。熟知的计算***、环境、和/或配置的示例可以适合于结合下列技术使用，包括但不限于个人计算机、服务器计算机、手持或膝上型设备、蜂窝电话、可佩戴式电子设备、平板设备、多处理器***、基于微处理器的***、机顶盒、可编程消费电子设备、网络PC、迷你计算机、大型计算机、包括任意上述***或设备等的分布式计算环境。

图2是示出本公开的技术的一些实现方式可以在其中操作的环境200的概况的框图。环境200能够包括一个或多个客户端计算设备205A-D，其实施例包可以包括设备100。客户端计算设备205能够通过到诸如服务器计算设备等一个或多个远程计算机的网络230在使用逻辑连接210的网络环境中进行操作。

在一些实现方式中，服务器210可以是通过诸如服务器220A-C等其他服务器接收客户端请求并且协调这些请求的执行的边缘服务器。服务器计算设备210和220能够包括诸如设备100等计算***。虽然每个服务器计算设备210和220被逻辑地显示为单个服务器，服务器计算设备也各自可以是涵盖位于相同或地理上背离的物理位置的多个计算设备的分布式计算环境。在一些实现方式中，每个服务器220均与一组服务器对应。

客户端计算设备205及服务器计算设备210和220各自能够用作其他服务器/客户端设备的服务器或客户端。服务器210能够连接至数据库215。服务器220A-C各自能够连接至对应的数据库225A-C。如上所述，每个服务器220均可以与一组服务器对应，并且这些服务器中的每个均能够共享数据库或能够具有其自身的数据库。数据库215和225能够贮藏(例如，存储)诸如媒体项；媒体项译本和翻译引擎；译本分数、组合译本分数、以及打分模型；或媒体项至源语言映射或置信分数等信息。虽然数据库215和225被逻辑地显示为单个单元，数据库215和225各自能够是涵盖多个计算设备的分布式计算环境，能够定位于其对应的服务器内，或能够定位在相同或地理上背离的物理位置。

网络230可以是局域网(LAN)或广域网(WAN)，但是，也能够是其他有线或无线网络。网络230可以是互联网或某一其他公共或私有网络。客户端计算设备205能够通过诸如有线或无线通信等网络接口能够连接至网络230。尽管服务器210与服务器220之间的连接被示出为独立的连接，然而，这些连接能够是任意形式的局域、广域、有线、或无线网络，包括网络230或独立的公共或私有网络。

此处使用的“语言片段”或“片段”是一个或多个词汇或字符组的数字表示。片段能够是媒体项或媒体项的语言的表示。尽管下列描述当对媒体项执行源语言分类时涉及了片段，然而，可以使用诸如音频或视频语言表示等其他语言格式。

图3是示出一些实现方式中实现本公开技术的***中所使用的部件300的框图。部件300包括硬件302、通用软件320、以及专用部件340。如上所述，实现本公开技术的***能够使用包括中央处理单元304、工作存储器306、储存存储器308、以及输入和输出设备310的多种硬件。在诸如客户端计算设备205等客户端计算设备或诸如服务器计算设备210或220等服务器计算设备上能够实现部件300。

通用软件320能够包括含操作***322、本地程序324、以及BIOS 326的各种应用。专用部件340能够是诸如本地程序324等通用软件应用320的子部件。专用部件340能够包括预翻译语言识别器344、翻译器346、译本打分模型348、置信分数生成器350、以及可以用于控制和接收来自诸如界面342等专用部件的数据的部件。在一些实现方式中，部件300能够在跨多个计算设备分布的计算***中，或能够包括到基于服务器的应用的接口。

预翻译语言识别器344能够被配置为执行片段的初始源语言分类，诸如，通过界面342接收的片段。该初始源语言分类能够利用对应的置信值识别片段的一种或多种语言。基于其置信值能够对被识别的语言进行分类并且能够选择具有位于阈值水平以上的置信值的语言用于进一步的分析。例如，阈值水平可以是1、3、5、或10种潜在的源语言；最高1、3、5、10、25、或50％的潜在源语言；具有50％、60％、75％、80％、或90％以上的置信值的所有潜在源语言；或能够选择所有的潜在源语言用于进一步的分析。初始源语言分类能够基于片段的内容的分析，诸如，使用的词汇、片段的结构和语法、使用的俚语词汇、标点符号等。初始源语言分类还能够基于片段的上下文的分析，诸如，作者是谁和关于他们了解什么以及其朋友是谁、片段在何时创建、张贴片段的位置、以及关于该位置的其他项的可获得的其他信息内容等。在美国专利申请号14/302，032中按照这种方式进一步详细地讨论了对媒体项进行分类的实施例，通过引用结合在此。

翻译器346能够是一个或多个机器翻译引擎。机器翻译生成引擎能够是将片段作为输入并且生成另一种语言或方言的片段的版本的程序。在一些实现方式中，能够将翻译器346中的一个设置成对具体的源语言、输出语言、或两者执行翻译。在一些实现方式中，能够将翻译器346设置成执行从多种源语言或至由提供给翻译器的参数限定的多种输出语言的翻译。翻译器346能够使用各种语言模型、规则集合、或其他算法以执行片段的从源语言到输出语言的转换。基于具有高于阈值的置信值的语言，能够通过预翻译语言识别器344选择用于各种源/输出语言或源/输出语言参数的翻译器用于进一步的分析。

译本打分模型348能够从翻译器346接收译本并且能够被配置为提供译本质量的评估。在一些实现方式中，译本打分模型348能够是诸如神经网络等能够提供译本分数的一个或多个已训练模型。在一些实现方式中，能够将译本打分模型348中的一个设置为对具体的源语言、输出语言、或两者执行译本的分析。在一些实现方式中，能够将译本打分模型348中的一个设置为执行多种源语言或至多种输出语言的分析。译本打分模型348能够提供每个译本的分数。在一些实现方式中，翻译器346能够被选择或配置为创建应用相同源语言和多种不同的输出语言的片段的多个译本。在这些情况下，诸如，能够通过将共享源语言的译本的各个分数平均化来创建源语言的组合分数。分数能够被配置成由预翻译语言识别器344生成的置信分数的加权因数。例如，分数1是中性分数，分数.9将置信值降低10％，并且分数1.1将置信值增加10％。

置信分数生成器350能够从译本打分模型348接收加权因数并且从预翻译语言识别器344接收被识别的可能源语言的置信值。然后，置信分数生成器350能够使用加权因数对被识别的可能源语言的置信值进行更新。能够选择产生的具有最高更新的置信值的识别的可能源语言作为片段的最可能源语言。通过界面342能够返回该识别。

本领域技术人员应认识到，可以各种方式更换上述图1至图3中以及在下面讨论的各个流程图中示出的部件。例如，可以重新布置逻辑顺序，可以并行执行子步骤，可以省去示出的逻辑，可以包括其他逻辑等。

图4是示出用于计算片段源语言的置信分数的一些实现方式中使用的过程400的流程图。过程400从框图402开始并且继续至框图404。在框图404，过程400能够接收将要确定其源语言的片段。在各种实现方式中，对于过程400，能够基于对具有低置信值、或片段较重要的指示、或具有众多读者的指示的片段的识别的源语言来选择片段，诸如，作者是名人或创建通常由许多人看到/分享的片段的人、片段的话题是关于吸引许多人注意力的流行话题、或片段在其创建之后的短时间内已经拥有众多预约等。

在框406，过程400能够对在框404接收的片段执行初始源语言识别。执行片段的初始源语言识别能够包括分析片段的内容和/或上下文。分析片段的内容能够包括确定片段中的哪些词汇与哪种语言匹配；片段中的语法是否指示具体的语言；片段中的语言的结构是否指示具体的语言；是否使用了诸如重音标记等标点符号；使用的字符的类型等。分析片段的上下文能够包括：确定创建片段的时间是否指示具体的语言或区域；确定是否将片段张贴到虚拟位置、或该位置处的其他媒体项是否指示具体的语言；或关于片段的作者的可用的信息是否指示具体的语言。例如，可能以其作者或作者的朋友已知的语言编写片段。在美国专利申请号14/302，032中能够找出关于执行初始源语言识别的额外细节。在一些实现方式中，初始源语言的识别能够包括置信值。置信值能够基于来自产生源语言识别的内容或上下文分析、或者一个或多个因数指示一种具体语言的强烈程度的因数的类型。

在框408，能够识别一种或多种最高可能源语言。其可以例如，通过选择具有高于阈值的置信值的潜在源语言来实现。在一些实现方式中，选择最高可能源语言能够包括选择所有潜在的源语言。

在框410，过程400能够生成在框408确定的最高可能源语言的打分译本。生成打分译本能够包括：对片段应用被配置为用于不同的源语言或输出语言的翻译器；对产生的译本应用打分模型；并且如果针对相同的源语言创建多个译本，则将译本分数与相同的源语言进行组合。下面就特征5A和5B讨论关于生成打分译本的额外细节。在一些实现方式中，能够跳过框406和408或能够仅执行简化的最可能语言分析。如果跳过框406和408，则能够针对所有可能源语言或指定的共同源语言的集合执行框410。

在框412，过程400能够调整在框406识别的一种或多种可能源语言的置信因数。在一些实现方式中，来自框410的分数能够是加权因数。在一些实现方式中，调整置信值能够包括将来自框410的加权因数与在框406确定的置信值相乘。在一些实现方式中，能够使用与具体源语言对应的在框410确定的分数作为通过替换在框406确定的值而更新的置信值。能够选择具有最高调整的置信值的潜在源语言作为接收的片段的最可能源语言。能够返回该最可能源语言或者与该最可能源语言对应的一个或多个译本的识别。过程400继续至框414，在框414，过程400结束。

图5A是示出用于生成片段的打分译本的一些实现方式中使用的过程500的流程图。如下面讨论的，在一些实现方式中，对于多种潜在源语言中的每种，过程500能够创建具有不同的输出语言的译本。这可能是计算密集的过程，因此可以“离线”执行(诸如在创建社交媒体网站的帖子之时、在选择待显示的帖子之前等)。过程500在框502开始并且继续至框504。在框504，过程500能够接收片段。在一些实现方式中，该片段可以是通过过程400在框404接收的片段的一个。

在框506，过程500能够获得一个或多个翻译器。在一些实现方式中，获得的翻译器能够是一个或多个机器翻译引擎。尽管下面讨论了被个别配置用于具体的源语言或输出语言的翻译器，然而，在一些实现方式中，能够通过设置将对其应用源语言或输出语言的参数来对于多种源语言或输出语言使用相同的翻译器。在各种实现方式中，翻译器能够被配置为用于具体的输出语言或可被配置为用于多种输出语言。在一些实现方式中，获得的翻译器能够与被确定(诸如通过在框406的过程确定)为接收的片段的可能源语言的源语言对应。

在框508，将首先获得的翻译器设置为已选择的翻译器。在框510，能够对接收的片段应用已选择的翻译器，从而创建片段的译本，该已选择的翻译器假定具体的源语言生成具体的输出语言。在框512，过程510能够计算在框510创建的译本的分数。在一些实现方式中，模型能够计算给定的源语言和输出语言的译本的置信分数。在一些实现方式中，打分模型能够是诸如神经网络等已训练的构造，或能够使用诸如语法分析和决策树等其他分析技术。

在框514，过程500能够确定在框506获得的任何译本是否尚未应用于接收的片段。如果是，过程500则继续至框516。如果否，过程500则继续至框518。在框516，过程500将来自在框506接收的翻译器中的下一未使用的翻译器设置为已选择的翻译器。框510至框516之间的循环将继续，直至获得与在框506滞留的每个翻译器对应的打分译本。

在框518，如果存在具有相同的源语言但不同的输出语言的多个译本，能够将具有相同源语言的译本分数诸如通过对其平均化而进行组合。在框520，能够返回在框518计算的组合分数或在框512计算的分数。在一些实现方式中，还能够返回对应的译本。然后，过程500继续至框522，在框522，过程500结束。

图5B是示出用于生成片段的打分译本的一些额外实现方式中使用的过程550的流程图。相比于过程500，过程550在计算上更为低廉。因此，当及时性必不可少时，诸如在发出片段的请求之后等，能够使用过程558。过程550从框552开始并且继续至框554。在框554，过程550能够接收片段。在一些实现方式中，该接收的片段能够是在框404接收的片段的一个。

在框556，能够接收其请求内容包含片段的用户的识别。在框558，能够识别与用户被识别的框556相关联的语言。识别与用户相关联的语言能够基于诸如用户的指定设置(例如，浏览器设置或配置文件设置)；与用户创建的内容项相关联的语言历史；用户倾向于与其进行交互的内容项；与用户的朋友相关联的语言等因素。在美国专利申请号14/302，032中能够找出关于识别与用户相关联的语言的额外细节。

在框560，过程550能够获得翻译器，例如，将各种源语言的译本生成为与在框558识别的语言对应的输出语言的机器翻译引擎。在一些实现方式中，能够将获得的翻译器局限于指定与在框408识别的最高可能源语言中的一种对应的源语言的翻译器。

在框562，能够对在框552接收的片段应用在框560获得的翻译器，以获得接收片段的一个或多个译本。每个被应用的翻译器均能够假定具体的源语言并且能够生成在框558识别的语言的译本。在框564，过程550能够对在框562创建的译本进行打分。如上面关于框512讨论的，对译本结果打分能够包括应用打分模型。打分模型能够输入译本和源片段并且基于诸如指定的源语言或输出语言等参数计算译本的质量分数。

在框566，过程550能够返回译本分数。在一些实现方式中，过程550还能够返回对应的译本。然后，过程550继续至框568，在框568，过程550结束。

图6是示出计算片段的可能源语言的置信分数的实施例600。实施例600包括片段602、语言标识符604、初始源语言分数606、翻译器608、译本打分模型610、译本分数612、分数更新器614、以及更新的源语言分数616。片段602能够与上面关于框404讨论的片段对应。语言标识符604能够与上面关于框344讨论的预翻译语言识别器对应。翻译器608能够与上面关于框346讨论的翻译器对应。译本打分模型610能够与上面关于框348讨论的译本打分模型对应。分数更新器614能够与上面关于框350讨论的置信分数生成器对应。

在实施例600中，在步骤650将片段提供至语言标识符604。在该实施例中，片段包括“Check it:sto imparando un nouveau langua！”该片段具有若干语言的特征：“Checkit”(英语)；sto imparando(意大利语)；un(法语、意大利语、或西班牙语错误拼写)；nouveau(法语)；langua(在法语、意大利语、或西班牙语等任一种中，接近错误拼写)。此外，该片段是对于一篇文章张贴在社交媒体网站上的评论部分的，该文章是通过已知一般讲西班牙语、但具有许多讲法语的朋友的用户以法语编写的，并且被从与具有多数讲英语的人的美国位置相关联的IP地址张贴。在实施例600的步骤652，语言标识符604能够识别初始源语言分数606。在步骤652识别初始源语言分数606能够对应于框406。在实施例600中，基于上述因素，法语是打分最高的最可能源语言，西班牙语是相近的第二位，并且意大利语也具有75％以上的可能性。

在实施例600中，因为打分最高的可能源语言的接近性并且因为作者是有已由许多其他用户观看她在社交媒体网站上发布的帖子的历史的名人，所以选择该片段进行进一步的分析。因此，在步骤654a至654e，将片段提供至翻译器608，以执行片段的多种翻译，每种均使用源语言与输出语言的不同组合。在实施例600中，将阈值初始置信因数设置为50％，所以对下列潜在的源语言执行翻译：法语、西班牙语、意大利语、英语、以及德语，因为在具有50％以上的初始置信分数的实施例600中，这些是可能源语言。在步骤654a，例如，假定法语作为源语言并且创建包括西班牙语、中文、日语、以及其他语言的输出语言的译本而对片段进行翻译。使用翻译器生成不同源语言和输出语言的译本能够对应于框508-510。

在步骤656，能够将产生的译本提供至译本打分模型610。在步骤658，译本打分模型610能够对各个译本进行打分并且确定具有共同源语言的译本的组合分数。在实施例600中，具有意大利源语言的译本接收输出语言的下列分数：西班牙语1.12、中文1.32、日语.87、英语.99、法语1.21、以及其他分数。例如，意大利源语言的这些分数的组合为1.09。确定源语言的分数和组合分数能够对应于框512和518。

在步骤660和662，将初始源语言分数606和组合的译本分数612提供至分数更新器614。在步骤664，分数更新器614通过使用组合的译本分数612作为打分最高的初始源语言分数606的加权因数而能够提供更新的源语言分数616。例如，基于将其组合译本分数1.09与其初始源语言分数.78相乘的乘法确定意大利语作为最可能源语言。更新初始源语言分数以确定更新的源语言置信分数能够对应于框412。在实施例600中，现在选择意大利语作为片段602的最可能源语言，因为它具有最高更新的源语言置信分数。

上面参考附图描述了公开技术的若干实现方式。可以在其上实现所描述的技术的计算设备可以包括一个或多个中央处理单元、存储器、输入设备(例如，键盘和定点设备)、输出设备(例如，显示设备)、存储设备(例如，磁盘驱动)、以及网络设备(例如，网络接口)。存储器和存储设备是能够存储至少实现所描述的技术的部分的指令的计算机可读存储介质。此外，经由数据传输介质能够存储或传输数据结构和消息结构，诸如通信链路上的信号等。可以使用诸如互联网、局域网、广域网、或点到点拨号连接等各种通信链路。因此，计算机可读介质能够包括计算机可读存储介质(例如，“非易失性”介质)和计算机可读传输介质。

如此处使用的，高于阈值指进行比较的项的值高于指定的其他值，该进行比较的项在具有最大值的特定指定数目的项之中，或该进行比较的项具有在指定的最高百分比值之内的值。如本文使用的，低于阈值指进行比较的项的值位于指定的其他值以下，进行比较的项在具有最小值的特定指定的数目的项之中，或进行比较的项具有在指定的最低百分比值内的值。如此处使用的，在阈值内指进行比较的项的值介于两个指定的其他值之间，进行比较的项在指定的中间数目的项之中，或进行比较的项具有在指定的中间百分比范围内的值。

如此处使用的，词汇“或”指项的集合的任何可能置换。例如，短语“A、B、或C”指A、B、C、或其任何组合中的至少一个，诸如下列中的任一个：A；B；C；A和B；A和C；B和C；A、B、以及C；或诸如A和A；B、B、以及C；A、A、B、C、以及C等多个任意项。

尽管以结构特征和/或方法行为指定的语言对主题进行了描述，然而，应当理解的是，所附权利要求中限定的主题并不一定必须局限于上述所述指定的特征或行为。此处，出于示出之目的，对指定的实施方式和实现方式进行了描述，但是，在不背离实施方式和实现方式的范围的情况下，能够做出各种改变。作为实现后续权利要求的示例性形式公开了上述所述指定的特征和行为。相应地，除非由所附权利要求限制，实施方式和实现方式并不受限制。

通过引用将上述所述任何专利、专利应用、以及其他参考结合在此。如果需要，能够采用上述所述各种参考的***、功能、以及构思对各方面进行改造，以提供又一些进一步的实现方式。如果通过引用而整合的文献中的主题的陈述与本申请的主题的陈述相冲突，则本申请优先。

Claims

1.一种用于识别片段的最可能源语言的方法，包括：

接收所述片段的指示；

确定所述片段的两种以上可能源语言；

生成所述片段的两个以上译本，每个译本均具有指定的译本源语言，

其中，生成所述片段的所述两个以上译本中的至少一个，将所述片段的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言，并且

其中，生成所述片段的所述两个以上译本中的至少另一个，将所述片段的所述两种以上可能源语言中的除所述片段的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言；

计算所述片段的已生成的所述两个以上译本中的至少两个的准确度分数；

生成所述片段的至少两种已选择的可能源语言中的每种的置信因数，其中，基于具有与已选择的所述可能源语言对应的源语言的经过计算的所述准确度分数中的一个或多个，生成每种已选择的可能源语言的所述置信因数；并且

选择与最高置信因数相关联的所述片段的所述可能源语言作为所述最可能源语言。

2.根据权利要求1所述的方法，

其中，所述片段的所述两个以上译本中的至少一个包括多个译本，每个译本具有共同的指定的译本源语言；

其中，计算准确度分数包括计算所述多个译本的组合准确度分数，每个译本具有共同的指定的译本源语言，其中，通过将与具有共同的指定的译本源语言的所述多个译本中的每个对应的单独准确度分数进行组合而计算每个组合准确度分数；并且

其中，基于各自具有共同的指定的译本源语言的所述多个译本的所述组合准确度分数产生所述共同的指定的译本源语言的所述置信因数。

3.根据权利要求2所述的方法，进一步包括：

执行所述片段的初始源语言识别；

其中，所述片段的所述初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种；

其中，对于对应的可能源语言，每个初始置信值均指示所述对应的可能源语言是所述片段的语言的置信度；并且

其中，产生所述可能源语言中的已选择的至少一种的所述置信因数包括使用与所述可能源语言中的已选择的一种对应的所述组合准确度分数，对所述可能源语言中的已选择的一种的所述初始置信值进行更新。

4.根据权利要求2所述的方法，

其中，所述共同的指定的译本源语言的所述置信因数是所述组合准确度分数。

5.根据权利要求1所述的方法，进一步包括：

执行所述片段的初始源语言识别；

其中，所述片段的所述初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种；并且

其中，对于对应的可能源语言，每个初始置信值均指示所述对应的可能源语言是所述片段的语言的置信度。

6.根据权利要求5所述的方法，

其中，基于所述两种以上可能源语言中的第一种的所述对应的初始置信值高于阈值，选择所述两种以上可能源语言中的第一种。

7.根据权利要求5所述的方法，

其中，执行所述片段的所述初始源语言识别包括对所述片段的上下文的分析。

8.根据权利要求7所述的方法，其中，所述片段的上下文的分析使用下列一种或多种：

已知所述片段的作者易做到的语言；

与被识别为所述片段的作者的朋友的用户相关联的语言；

创建所述片段的时间；

关于张贴所述片段的虚拟位置的信息；或

上述项的任何组合。

9.根据权利要求1所述的方法，进一步包括：

从所述片段的已生成的所述两个以上译本中选择所述指定的译本源语言是被选为所述片段的最可能源语言的语言的译本作为所述片段的译本。

10.根据权利要求1所述的方法，进一步包括：

接收所述片段的观看用户的指示；并且

确定与所述片段的观看用户相关联的输出语言；

其中，所述片段的已生成的所述两个以上译本各自为与和所述片段的观看用户相关联的输出语言相匹配的输出语言。

11.根据权利要求1所述的方法，

其中，通过译本打分模型执行对所述准确度分数的计算，所述译本打分模型被训练成利用包括各自包含输入片段、输出片段、以及分数的数据点的训练数据以生成译本分数。

12.根据权利要求1所述的方法，

其中，响应于要求所述片段的译本的请求而执行所述方法。

13.根据权利要求1所述的方法，

其中，响应于所述片段的创建或所述片段到社交媒体网站的张贴而执行所述方法。

14.一种计算机可读存储介质，存储指令，当由计算***运行所述指令时，使所述计算***执行用于识别片段源语言的置信因数的操作，所述操作包括：

接收片段的指示；

接收所述片段的观看者的指示；

确定与所述片段的观看者相关联的输出语言；

生成两个以上译本的所述片段的所述两个以上译本，所述两个以上译本各自具有指定的译本源语言，并且所述两个以上译本中的每个为与和所述片段的观看者相关联的输出语言相匹配的输出语言；

其中，生成所述片段的所述两个以上译本中的至少一个，将所述片段的两种以上可能源语言中的第一种设置为所述指定的译本源语言，并且

计算所述片段的已生成的所述两个以上译本中的至少两个的准确度分数；并且

产生所述片段的至少两种已选择的可能源语言中的每种的置信因数，其中，基于具有与所述已选择的可能源语言对应的源语言的经过计算的所述准确度分数中的一个或多个，产生每种已选择的可能源语言的所述置信因数。

15.根据权利要求14所述的计算机可读存储介质，其中，所述操作进一步包括：

执行所述片段的初始源语言识别；

其中，所述片段的所述初始源语言识别识别各自具有对应初始置信值的所述可能源语言中的一种或多种；并且

16.根据权利要求15所述的计算机可读存储介质，

其中，基于所述两种以上可能源语言中的第一种的所述对应初始置信值高于阈值，选择所述两种以上可能源语言中的第一种。

17.根据权利要求14所述的计算机可读存储介质，其中，所述操作进一步包括：

从所述片段的已生成的所述两个以上译本中选择所述指定的译本源语言是具有最高置信因数的语言的译本作为所述片段的译本。

18.根据权利要求14所述的计算机可读存储介质，

其中，通过译本打分模型执行对所述准确度分数的计算，所述译本打分模型被训练成利用包括各自包含输入片段、输出片段、以及分数的数据点的训练数据生成译本分数。

19.一种用于生成片段的译本的***，包括：

存储器；

一个或多个处理器；

界面，被配置为接收所述片段的指示；

预翻译语言识别器，被配置为确定所述片段的两种以上可能源语言；

翻译器，被配置为生成所述片段的两个以上译本，所述片段的所述两个以上译本中的每个均具有指定的译本源语言，

译本打分模型，被配置为计算所述片段的已生成的所述两个以上译本中的至少两个的准确度分数；以及

置信分数生成器，被配置为产生所述片段的至少两种已选择的可能源语言中的每种的置信因数，其中，基于具有与所述已选择的可能源语言对应的源语言的经过计算的所述准确度分数中的一个或多个，产生每种已选择的可能源语言的所述置信因数；

其中，所述界面被进一步配置为从所述片段的已生成的所述两个以上译本中提供所述指定的译本源语言是具有最高置信因数的所述可能源语言的译本作为所述片段的译本。

20.根据权利要求19所述的***，其中，所述预翻译语言识别器被配置为通过下列项确定所述片段的所述两种以上可能源语言：

执行所述片段的初始源语言识别；

其中，对于对应的可能源语言，每个初始置信值指示对应的可能源语言是所述片段的语言的置信度；并且

其中，基于所述两种以上可能源语言中的第一种的对应的初始置信值高于阈值，选择所述两种以上可能源语言中的第一种。

21.一种用于识别片段(602)的最可能源语言的计算机实现方法，包括：

接收所述片段(602)的指示；

确定所述片段(602)的两种以上可能源语言；

使用机器翻译引擎生成所述片段(602)的两个以上译本，每个均具有指定的译本源语言，

其中，生成所述片段(602)的所述两个以上译本中的至少一个，将所述片段(602)的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言，并且

其中，生成所述片段(602)的所述两个以上译本中的至少另一个，将所述片段(602)的所述两种以上可能源语言中的除所述片段(602)的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言；

计算所述片段(602)的已生成的所述两个以上译本中的至少两个的准确度分数(612)；

产生所述片段(602)的至少两种已选择的可能源语言中的每种的置信因数(616)，其中，基于具有与所述已选择的可能源语言对应的源语言的经过计算的所述准确度分数(612)中的一个或多个，产生每种已选择的可能源语言的所述置信因数(616)；并且

选择与最高置信因数(616)相关联的所述片段(602)的所述可能源语言作为所述最可能源语言。

22.根据权利要求21所述的方法，

其中，所述片段(602)的所述两个以上译本中的至少一个包括多个译本，每个译本均具有共同的指定的译本源语言；

其中，计算准确度分数(612)包括计算所述多个译本的组合准确度分数(612)，每个译本均具有共同的指定的译本源语言，其中，通过将与具有共同的指定的译本源语言的所述多个译本中的每个对应的单独准确度分数(612)组合，执行对各个组合准确度分数(612)的计算；并且

其中，基于各自具有所述共同的指定的译本源语言的所述多个译本的所述组合准确度分数(612)产生所述共同的指定的译本源语言的所述置信因数(616)。

23.根据权利要求22所述的方法，进一步包括：

对所述片段(602)执行初始源语言识别；

其中，对所述片段(602)的所述初始源语言识别识别各自具有对应的初始置信值(606)的所述可能源语言中的一种或多种；

其中，对于对应的可能源语言，每个初始置信值(606)指示所述对应的可能源语言是所述片段(602)的语言的置信度；并且

其中，产生所述可能源语言中的已选择的至少一种的所述置信因数(616)包括使用与所述可能源语言中的已选择的一种对应的所述组合准确度分数(612)，对所述可能源语言中的已选择的一种的所述初始置信值(606)进行更新。

24.根据权利要求22或23所述的方法，

其中，所述共同的指定的译本源语言的所述置信因数是所述组合准确度分数(612)。

25.根据权利要求21或24中任一种所述的方法，进一步包括：

执行所述片段(602)的初始源语言识别；

其中，所述片段(602)的初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种；并且

其中，对于对应的可能源语言，每个初始置信值指示所述对应的可能源语言是所述片段(602)的语言的置信度；

可选地，其中，基于所述两种以上可能源语言中的第一种的所述对应的初始置信值(606)高于阈值，选择所述两种以上可能源语言中的第一种。

26.根据权利要求25所述的方法，

其中，对所述片段(602)执行所述初始源语言识别包括对所述片段(602)的上下文的分析；

可选地，其中，所述片段(602)的上下文的分析使用下列中的一种或多种：

已知所述片段(602)的作者易做到的语言；

与被识别为所述片段(602)的所述作者的朋友的用户相关联的语言；

创建所述片段(602)的时间；

关于张贴所述片段(602)的虚拟位置的信息；或

上述项的任何组合。

27.根据权利要求21或26中任一项所述的方法，进一步包括：

从所述片段(602)的已生成的所述两个以上译本中选择所述指定的译本源语言是被选为所述片段(602)的所述最可能源语言的所述语言的译本作为所述片段(602)的译本。

28.根据权利要求21或27中任一项所述的方法，进一步包括：

接收所述片段(602)的观看用户的指示；并且

确定与所述片段(602)的观看用户相关联的输出语言；

其中，所述片段(602)的已生成的所述两个以上译本各自是与和所述片段(602)的观看用户相关联的输出语言相匹配的输出语言。

29.根据权利要求21或28中任一项所述的方法，

其中，通过译本打分模型(348；610)执行对所述准确度分数(612)的计算，所述译本打分模型(348；610)被训练成利用包括各自包含输入片段(602)、输出片段(602)、以及分数的数据点的训练数据以生成译本分数(612)。

30.根据权利要求21或29中任一项所述的方法，

其中，响应于要求所述片段(602)的译本的请求而执行所述方法，或

其中，响应于所述片段(602)的创建或所述片段(602)到社交媒体网站的张贴而执行所述方法。

31.根据权利要求21或30中任一项所述的方法，

其中，提供所述最可能源语言作为用于下列至少一项的处理引擎的参数：

应用机器翻译引擎；

执行拼写校正；以及

执行语法校正。

32.一种计算机可读存储介质，存储指令，当由计算***(100；200；300)运行所述指令时，使所述计算***(100；200；300)执行用于识别片段源语言的置信因数的操作，所述操作包括：

接收片段(602)的指示；

接收所述片段(602)的观看者的指示；

确定与所述片段(602)的所述观看者相关联的输出语言；

生成两个以上译本的所述片段(602)的所述两个以上译本，所述两个以上译本各自具有指定的译本源语言，并且所述两个以上译本中的每个为与和所述片段(602)的观看者相关联的输出语言相匹配的输出语言，

其中，生成所述片段(602)的所述两个以上译本中的至少一个，将所述片段(602)的两种以上可能源语言中的第一种设置为所述指定的译本源语言，并且

计算所述片段(602)的已生成的所述两个以上译本中的至少两个的准确度分数(612)；并且

产生所述片段(602)的至少两种已选择的可能源语言中的每种的置信因数(616)，其中，基于具有与所述选择的可能源语言对应的源语言的经过计算的所述准确度分数(612)中的一个或多个，产生每种已选择的可能源语言的所述置信因数(616)。

33.根据权利要求32所述的计算机可读存储介质，其中，所述操作进一步包括：

从所述片段(602)的已生成的所述两个以上译本中选择所述指定的译本源语言是具有最高置信因数(616)的语言的译本作为所述片段(602)的译本。

34.根据权利要求32或33所述的计算机可读存储介质，

其中，当由所述计算***(100；200；300)运行所述指令时，使所述计算***(100；200；300)执行根据权利要求21 31中任一项所述的方法。

35.一种用于生成片段(602)的译本的***，例如，被布置成执行根据权利要求21 31中任一项所述的方法，包括：

存储器(150；306，308)；

一个或多个处理器(110；304)；

界面(342)，被配置为接收所述片段(602)的指示；

预翻译语言识别器(344)，被配置为确定所述片段(602)的两种以上可能源语言；

翻译器(346；608)，被配置为生成所述片段(602)的两个以上译本，所述片段(602)的所述两个以上译本中的每个均具有指定的译本源语言，

其中，生成所述片段(602)的所述两个以上译本中的至少另一个，所述片段(602)的所述两种以上可能源语言中的除所述片段(602)的所述两种以上可能源语言中的第一种之外的第二种作为所述指定的译本源语言；

翻译打分模型(348；610)，被配置为计算所述片段(602)的已生成的所述两个以上译本中的至少两个的准确度分数(612)；以及

置信分数生成器(350)，被配置为产生所述片段(602)的至少两种已选择的可能源语言中的每种的置信因数(616)，其中，基于具有与已选择的所述可能源语言对应的源语言的经过计算的所述准确度分数(612)中的一个或多个，产生每种已选择的可能源语言的所述置信因数(616)；

其中，所述界面(342)被进一步配置为从所述片段(602)的已生成的所述两个以上译本中提供所述指定的译本源语言是具有最高置信因数(616)的所述可能源语言的译本作为所述片段(602)的译本。