CN108351871A - 通用翻译 - Google Patents

通用翻译 Download PDF

Info

Publication number
CN108351871A
CN108351871A CN201580084729.4A CN201580084729A CN108351871A CN 108351871 A CN108351871 A CN 108351871A CN 201580084729 A CN201580084729 A CN 201580084729A CN 108351871 A CN108351871 A CN 108351871A
Authority
CN
China
Prior art keywords
segment
original language
language
translation
translations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580084729.4A
Other languages
English (en)
Other versions
CN108351871B (zh
Inventor
黄飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meta Platforms Inc
Original Assignee
Facebook Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Facebook Inc filed Critical Facebook Inc
Publication of CN108351871A publication Critical patent/CN108351871A/zh
Application granted granted Critical
Publication of CN108351871B publication Critical patent/CN108351871B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

能够通过基于诸如媒体项中的词汇和由媒体项作者获知的语言等固有或外在的因素尝试对媒体项进行初始语言识别而识别媒体项的可能源语言。该初始识别能够利用对应的可能性因素生成最可能源语言的列表。然后,能够执行假定最可能源语言中的每种的翻译。能够对多种输出语言执行翻译。产生的每个译本均能够接收基于多种因素的对应分数。能够对具有共同源语言的分数进行组合。这些组合的分数能够用于对媒体项的源语言的之前识别的可能性因素进行加权。

Description

通用翻译
相关申请的交叉引用
本申请要求于2015年9月22日提交的美国专利申请号14/861/747的权益,通过引用将其全部内容结合在此。
背景技术
互联网使得人们可以以之前不曾想到的方式全球性地连接并且共享信息。例如,社交媒体平台使位于地球的相对侧的人们能够沟通理念、讨论当前事件、或共享他们的午餐。在过去,这种惊人的资源在某种程度上被限制于具有共同自然语言(“语言”)的用户之间的通信。此外,用户仅能够消费他们的语言之中的内容,或内容供应商能够基于***设置或网络位置(例如,互联网协议(“IP”)地址或语言标识符)对其确定适当的译本的内容。
尽管世界各地使用的许多不同语言之间的通信具有特殊的挑战性,机器翻译服务已经尝试去解决此问题。这些服务提供了用户使用网络形式提供文本、选择一种或多种语言、并且以已选择的语言接收文本的译本的机制。尽管这些服务已经明显提高人们跨越语言障碍进行通信的能力,但其可以要求用户打开单独的网站、指出其想要的翻译语言、并且识别源文件的语言。然后,在该单独的网站中示出生成的译本,从由最初来源提供的上下文中移除该内容。在某些情况下,翻译器服务不能够锁定源页面的各部分以进行翻译或由于翻译产生的格式变化而提供源网站的不可读版本。在许多情况下,用户发现这个过程过于不便并且可能丧失耐性并导航至不同的网站或可能直接跳过其不理解的文本,从而错失接收内容的机会。
附图说明
图1是示出本公开技术的一些实现方式能够操作的设备的概况的框图。
图2是示出本公开技术的一些实现方式能够在其中操作的环境的概况的框图。
图3是示出采用本公开技术的一些实现方式的***中能够使用的部件的框图。
图4是示出用于计算片段源语言的置信分数的一些实现方式中使用的过程的流程图。
图5A是示出用于生成片段的被评分的译本的一些实现方式中使用的一个过程的流程图。
图5B是示出用于生成片段的被评分的译本的一些额外实现方式中使用的过程的流程图。
图6是示出计算片段源语言的置信分数的实施例。
通过结合所附附图参考下列细节描述可以更好地理解此处引入的技术,其中,类似参考标号指示相同或功能相似的元件。
具体实施方式
本公开的各种实施方式可以包括用于识别片段的最可能源语言的方法、计算机可读存储介质、以及***。可以接收片段的指示。可以确定片段的两种以上可能源语言。可以生成片段的两个以上译本,每个均具有指定的译本源语言。可以生成片段的两个以上译本中的至少一个,将片段的两种以上可能源语言中的第一种设置为指定的译本源语言,并且可以生成片段的两个以上译本中的至少另一个,将片段的两种以上可能源语言中的除片段的两种以上可能源语言中的第一种之外的第二种设置为指定的译本源语言。可以计算片段的已生成的两个以上译本中的至少两个的准确度分数。可以产生片段的至少两种已选择的可能源语言中的每种的置信因数,其中,可以基于具有与已选择的可能源语言对应的源语言的经过计算的准确度分数中的一个或多个产生每种已选择的可能源语言的置信因数。可以选择与最高置信因数相关联的片段的可能源语言作为最可能源语言。
在实施方式中,一个或多个计算机可读非易失性存储介质涵盖软件,当被运行时可操作以执行根据本发明或其任意实施方式的方法的软件。
在实施方式中,***包括一个或多个处理器以及耦合至处理器并且包括通过处理器可运行的指令的至少一个存储器,处理器在运行指令时可操作为执行根据本发明或其任意实施方式的方法。
在实施方式中,一种计算机程序产品,优选包括计算机可读非易失性存储介质,当在数据处理***上运行时可操作以执行根据本发明或其任意实施方式的方法。
在面向方法、存储介质、***、以及计算机程序产品的所附权利要求中具体公开了根据本发明的实施方式,其中,在一个权利要求范畴(例如,方法)中提及的任何特征也能够在另一个权利要求范畴(例如,***)中要求保护。仅出于形式原因选定所附权利要求的从属性或逆向引用。然而,也能够要求保护对任意在先权利要求的有意引用(具体地,多重从属性)而产生的任何主题,因此,公开了权利要求及其特征的任何组合并且能够要求保护,而与所附权利要求中选定的从属性无关。能够要求保护的主题不仅包括所附权利要求中阐述的特征的组合,而且还包括权利要求中的特征的任何其他组合,其中,权利要求中提及的每个特征均能够与权利要求中的任何其他特征或其他特征的组合进行组合。进一步地,在单独权利要求和/或在与此处描述或记述的任意实施方式或特征,或者与所附权利要求的任意特征的任意组合中能够要求保护此处描述或记述的任意实施方式或特征。
公开了基于多个语言译本的打分的源语言识别。当对媒体项执行语言处理时,诸如应用机器翻译引擎、执行拼写校正或语法校正等,能够提供媒体项的源语言作为处理引擎的参数。对媒体项的源语言的识别可以是困难的,特别是在媒体项的语言学内容较短、使用未附有具体语言的俚语或其他词汇,具有未识别的部分或包含错误时。
通过基于诸如其内容和上下文等因素执行媒体项的初始分析能够实现媒体项的源语言识别。该初始分析能够识别一种或多种可能源语言及对应的置信分数。然后,能够对于每种得分最高的源语言使用机器翻译引擎执行媒体项的多种翻译,以将媒体项转换成多种输出语言。能够计算指示该译本的质量的每个译本的分数。能够将与每种源语言对应的分数集合进行组合,以形成与该源语言对应的加权因数。然后,能够使用这些加权因数调整与每种源语言对应的置信分数。能够选择具有最高调整分数的源语言作为最可能源语言。
此处使用的“源语言”指编写媒体项或当前存在的自然语言。此处使用的“媒体项”可以是利用语言的任何内容,包括文本、音频、视频等。此处使用的“语言”是自然语言,即人类编写语言、口说语言、或手语,例如英语、法语、中文、或美国手语。语言不需要是国家语言,例如英语,但是能够是具体自然语言的方言或变异,或者能够是语言的单独表示法,例如拼音。
作为实施例,关于圣地亚哥教士(San Diego Padres)的社交媒体帖子的媒体项可以包含片段:“Mi Padres r playing on television”。使用仅将词汇匹配至对应语言的算法的该片段的初始分析可以用.87的分数指示英语并且用.91的分数指示西班牙语作为两个最高打分的源语言,因为在西班牙语中“mi”指“my”,但在英语中“mi”可能是“my”的打字错误;在西班牙语中“Padres”指“fathers”,但在英语中通常在指Padres体育队时使用,特别是当在句子中大写时;由于用“r”取代“are;”是常见俚语,“r”可能不被映射至任何语言或可能被较弱地指示为英语“on”可以指英语;并且“television”可能模糊地处在英语与西班牙语之间,因为在没有口音时其拼写在两种语言中是相同的。
继续该实施例,然后使用机器翻译引擎能够执行片段的多种翻译。能够执行将片段转换成多种输出语言,将源语言设置为英语的翻译的第一集合。能够执行将片段转换成多种输出语言、将源语言设置成西班牙语的翻译的第二集合。能够对第一集合中的产生的每种译本评分,并且能够将这些分数组合成英语加权因数,在该实施例中为1.12。还能够对第二集合中的产生的每种译本评分,并且能够将这些分数组合成西班牙语加权因数,在该实施例中为.80。通过将英语置信分数和英语加权因数相乘能够对英语置信分数应用英语加权因数,以接收更新的英语置信因数.97。通过将西班牙语置信因数和西班牙语加权因数相乘能够对西班牙语置信因数应用西班牙语加权因数,以接收更新的西班牙语置信因数.73。基于已更新的置信因数,能够确定英语是最可能源语言。
下面参考附图对所描述的技术的若干实现方式进行更为详细地讨论。关于附图,图1是示出本公开技术的一些实现方式可以在其上操作的设备100的概况的框图。设备能够包括能够基于多个译本识别媒体项源语言的设备100的硬件部件。设备100能够包括对CPU(处理器)110提供输入,通知其动作的一个或多个输入设备120。通常通过解释从输入设备接收的信号并且使用通信协议将信息通信至CPU 110的硬件控制器传达动作。例如,输入设备120包括鼠标、键盘、触摸屏、红外传感器、触摸板、可佩戴的输入设备、基于摄像头或图像的输入设备、麦克风、或其他用户输入设备。
CPU 110可以是设备中的或跨多个设备分布的单个处理单元或多个处理单元。例如,CPU 110能够通过使用例如PCI总线或SCSI总线的总线耦合至其他硬件设备。CPU 110能够与诸如用于显示器130等的用于设备的硬件控制器通信。显示器130能够用于显示文本和图形。在一些实施例中,显示器130向用户提供图形和文本视觉反馈。在一些实现方式中,诸如,当输入设备是触摸屏或配备有眼睛方向监测***时,显示器130包括作为显示器的一部分的输入设备。在一些实现方式中,显示器与输入设备分离。显示设备的实施例是:LCD显示屏、LED显示屏、投影显示器(诸如,平视设备或头戴式设备)等。其他I/O设备140还能够耦合至处理器,诸如,网卡、视频卡、音频卡、USB、火线或其他外部设备、摄像头、打印机、扬声器、CD-ROM驱动器、DVD驱动器、磁盘驱动器、或蓝光设备。
在一些实现方式中,设备100还包括能够与网络节点无线地或基于有线地通信的通信设备。通信设备能够使用例如TCP/IP协议通过网络与另一设备或服务器通信。设备100能够利用通信设备跨多个网络设备分配操作。
CPU 110能够访问存储器150。存储器包括用于易失性和非易失性存储器的各种硬件设备中的一个或多个并且能够包括只读和可写存储器。例如,存储器能够包括随机访问存储器(RAM)、CPU寄存器、只读存储器(ROM)、以及可写非易失性存储器,诸如闪存存储器、硬盘驱动器、软盘、CD、DVD、磁性存储设备、磁带驱动器、设备缓冲器等。存储器不是与下层硬件脱离的传播信号;由此,存储器是非易失性的。存储器150能够包括存储程序和软件(诸如操作***162、语言分类符164、以及任何其他的应用程序166)的程序存储器160。存储器150还能够包括数据存储器170,数据存储器170能包括媒体项;媒体项译本和翻译引擎;译本分数;组合的译本分数;以及打分模型;媒体项到源语言的映射或置信分数;配置数据;设置;以及能够提供给程序存储器160或设备100的任何元件的用户选项或喜好。
利用多个其他通用或专用的计算***环境或配置操作本公开的技术。熟知的计算***、环境、和/或配置的示例可以适合于结合下列技术使用,包括但不限于个人计算机、服务器计算机、手持或膝上型设备、蜂窝电话、可佩戴式电子设备、平板设备、多处理器***、基于微处理器的***、机顶盒、可编程消费电子设备、网络PC、迷你计算机、大型计算机、包括任意上述***或设备等的分布式计算环境。
图2是示出本公开的技术的一些实现方式可以在其中操作的环境200的概况的框图。环境200能够包括一个或多个客户端计算设备205A-D,其实施例包可以包括设备100。客户端计算设备205能够通过到诸如服务器计算设备等一个或多个远程计算机的网络230在使用逻辑连接210的网络环境中进行操作。
在一些实现方式中,服务器210可以是通过诸如服务器220A-C等其他服务器接收客户端请求并且协调这些请求的执行的边缘服务器。服务器计算设备210和220能够包括诸如设备100等计算***。虽然每个服务器计算设备210和220被逻辑地显示为单个服务器,服务器计算设备也各自可以是涵盖位于相同或地理上背离的物理位置的多个计算设备的分布式计算环境。在一些实现方式中,每个服务器220均与一组服务器对应。
客户端计算设备205及服务器计算设备210和220各自能够用作其他服务器/客户端设备的服务器或客户端。服务器210能够连接至数据库215。服务器220A-C各自能够连接至对应的数据库225A-C。如上所述,每个服务器220均可以与一组服务器对应,并且这些服务器中的每个均能够共享数据库或能够具有其自身的数据库。数据库215和225能够贮藏(例如,存储)诸如媒体项;媒体项译本和翻译引擎;译本分数、组合译本分数、以及打分模型;或媒体项至源语言映射或置信分数等信息。虽然数据库215和225被逻辑地显示为单个单元,数据库215和225各自能够是涵盖多个计算设备的分布式计算环境,能够定位于其对应的服务器内,或能够定位在相同或地理上背离的物理位置。
网络230可以是局域网(LAN)或广域网(WAN),但是,也能够是其他有线或无线网络。网络230可以是互联网或某一其他公共或私有网络。客户端计算设备205能够通过诸如有线或无线通信等网络接口能够连接至网络230。尽管服务器210与服务器220之间的连接被示出为独立的连接,然而,这些连接能够是任意形式的局域、广域、有线、或无线网络,包括网络230或独立的公共或私有网络。
此处使用的“语言片段”或“片段”是一个或多个词汇或字符组的数字表示。片段能够是媒体项或媒体项的语言的表示。尽管下列描述当对媒体项执行源语言分类时涉及了片段,然而,可以使用诸如音频或视频语言表示等其他语言格式。
图3是示出一些实现方式中实现本公开技术的***中所使用的部件300的框图。部件300包括硬件302、通用软件320、以及专用部件340。如上所述,实现本公开技术的***能够使用包括中央处理单元304、工作存储器306、储存存储器308、以及输入和输出设备310的多种硬件。在诸如客户端计算设备205等客户端计算设备或诸如服务器计算设备210或220等服务器计算设备上能够实现部件300。
通用软件320能够包括含操作***322、本地程序324、以及BIOS 326的各种应用。专用部件340能够是诸如本地程序324等通用软件应用320的子部件。专用部件340能够包括预翻译语言识别器344、翻译器346、译本打分模型348、置信分数生成器350、以及可以用于控制和接收来自诸如界面342等专用部件的数据的部件。在一些实现方式中,部件300能够在跨多个计算设备分布的计算***中,或能够包括到基于服务器的应用的接口。
预翻译语言识别器344能够被配置为执行片段的初始源语言分类,诸如,通过界面342接收的片段。该初始源语言分类能够利用对应的置信值识别片段的一种或多种语言。基于其置信值能够对被识别的语言进行分类并且能够选择具有位于阈值水平以上的置信值的语言用于进一步的分析。例如,阈值水平可以是1、3、5、或10种潜在的源语言;最高1、3、5、10、25、或50%的潜在源语言;具有50%、60%、75%、80%、或90%以上的置信值的所有潜在源语言;或能够选择所有的潜在源语言用于进一步的分析。初始源语言分类能够基于片段的内容的分析,诸如,使用的词汇、片段的结构和语法、使用的俚语词汇、标点符号等。初始源语言分类还能够基于片段的上下文的分析,诸如,作者是谁和关于他们了解什么以及其朋友是谁、片段在何时创建、张贴片段的位置、以及关于该位置的其他项的可获得的其他信息内容等。在美国专利申请号14/302,032中按照这种方式进一步详细地讨论了对媒体项进行分类的实施例,通过引用结合在此。
翻译器346能够是一个或多个机器翻译引擎。机器翻译生成引擎能够是将片段作为输入并且生成另一种语言或方言的片段的版本的程序。在一些实现方式中,能够将翻译器346中的一个设置成对具体的源语言、输出语言、或两者执行翻译。在一些实现方式中,能够将翻译器346设置成执行从多种源语言或至由提供给翻译器的参数限定的多种输出语言的翻译。翻译器346能够使用各种语言模型、规则集合、或其他算法以执行片段的从源语言到输出语言的转换。基于具有高于阈值的置信值的语言,能够通过预翻译语言识别器344选择用于各种源/输出语言或源/输出语言参数的翻译器用于进一步的分析。
译本打分模型348能够从翻译器346接收译本并且能够被配置为提供译本质量的评估。在一些实现方式中,译本打分模型348能够是诸如神经网络等能够提供译本分数的一个或多个已训练模型。在一些实现方式中,能够将译本打分模型348中的一个设置为对具体的源语言、输出语言、或两者执行译本的分析。在一些实现方式中,能够将译本打分模型348中的一个设置为执行多种源语言或至多种输出语言的分析。译本打分模型348能够提供每个译本的分数。在一些实现方式中,翻译器346能够被选择或配置为创建应用相同源语言和多种不同的输出语言的片段的多个译本。在这些情况下,诸如,能够通过将共享源语言的译本的各个分数平均化来创建源语言的组合分数。分数能够被配置成由预翻译语言识别器344生成的置信分数的加权因数。例如,分数1是中性分数,分数.9将置信值降低10%,并且分数1.1将置信值增加10%。
置信分数生成器350能够从译本打分模型348接收加权因数并且从预翻译语言识别器344接收被识别的可能源语言的置信值。然后,置信分数生成器350能够使用加权因数对被识别的可能源语言的置信值进行更新。能够选择产生的具有最高更新的置信值的识别的可能源语言作为片段的最可能源语言。通过界面342能够返回该识别。
本领域技术人员应认识到,可以各种方式更换上述图1至图3中以及在下面讨论的各个流程图中示出的部件。例如,可以重新布置逻辑顺序,可以并行执行子步骤,可以省去示出的逻辑,可以包括其他逻辑等。
图4是示出用于计算片段源语言的置信分数的一些实现方式中使用的过程400的流程图。过程400从框图402开始并且继续至框图404。在框图404,过程400能够接收将要确定其源语言的片段。在各种实现方式中,对于过程400,能够基于对具有低置信值、或片段较重要的指示、或具有众多读者的指示的片段的识别的源语言来选择片段,诸如,作者是名人或创建通常由许多人看到/分享的片段的人、片段的话题是关于吸引许多人注意力的流行话题、或片段在其创建之后的短时间内已经拥有众多预约等。
在框406,过程400能够对在框404接收的片段执行初始源语言识别。执行片段的初始源语言识别能够包括分析片段的内容和/或上下文。分析片段的内容能够包括确定片段中的哪些词汇与哪种语言匹配;片段中的语法是否指示具体的语言;片段中的语言的结构是否指示具体的语言;是否使用了诸如重音标记等标点符号;使用的字符的类型等。分析片段的上下文能够包括:确定创建片段的时间是否指示具体的语言或区域;确定是否将片段张贴到虚拟位置、或该位置处的其他媒体项是否指示具体的语言;或关于片段的作者的可用的信息是否指示具体的语言。例如,可能以其作者或作者的朋友已知的语言编写片段。在美国专利申请号14/302,032中能够找出关于执行初始源语言识别的额外细节。在一些实现方式中,初始源语言的识别能够包括置信值。置信值能够基于来自产生源语言识别的内容或上下文分析、或者一个或多个因数指示一种具体语言的强烈程度的因数的类型。
在框408,能够识别一种或多种最高可能源语言。其可以例如,通过选择具有高于阈值的置信值的潜在源语言来实现。在一些实现方式中,选择最高可能源语言能够包括选择所有潜在的源语言。
在框410,过程400能够生成在框408确定的最高可能源语言的打分译本。生成打分译本能够包括:对片段应用被配置为用于不同的源语言或输出语言的翻译器;对产生的译本应用打分模型;并且如果针对相同的源语言创建多个译本,则将译本分数与相同的源语言进行组合。下面就特征5A和5B讨论关于生成打分译本的额外细节。在一些实现方式中,能够跳过框406和408或能够仅执行简化的最可能语言分析。如果跳过框406和408,则能够针对所有可能源语言或指定的共同源语言的集合执行框410。
在框412,过程400能够调整在框406识别的一种或多种可能源语言的置信因数。在一些实现方式中,来自框410的分数能够是加权因数。在一些实现方式中,调整置信值能够包括将来自框410的加权因数与在框406确定的置信值相乘。在一些实现方式中,能够使用与具体源语言对应的在框410确定的分数作为通过替换在框406确定的值而更新的置信值。能够选择具有最高调整的置信值的潜在源语言作为接收的片段的最可能源语言。能够返回该最可能源语言或者与该最可能源语言对应的一个或多个译本的识别。过程400继续至框414,在框414,过程400结束。
图5A是示出用于生成片段的打分译本的一些实现方式中使用的过程500的流程图。如下面讨论的,在一些实现方式中,对于多种潜在源语言中的每种,过程500能够创建具有不同的输出语言的译本。这可能是计算密集的过程,因此可以“离线”执行(诸如在创建社交媒体网站的帖子之时、在选择待显示的帖子之前等)。过程500在框502开始并且继续至框504。在框504,过程500能够接收片段。在一些实现方式中,该片段可以是通过过程400在框404接收的片段的一个。
在框506,过程500能够获得一个或多个翻译器。在一些实现方式中,获得的翻译器能够是一个或多个机器翻译引擎。尽管下面讨论了被个别配置用于具体的源语言或输出语言的翻译器,然而,在一些实现方式中,能够通过设置将对其应用源语言或输出语言的参数来对于多种源语言或输出语言使用相同的翻译器。在各种实现方式中,翻译器能够被配置为用于具体的输出语言或可被配置为用于多种输出语言。在一些实现方式中,获得的翻译器能够与被确定(诸如通过在框406的过程确定)为接收的片段的可能源语言的源语言对应。
在框508,将首先获得的翻译器设置为已选择的翻译器。在框510,能够对接收的片段应用已选择的翻译器,从而创建片段的译本,该已选择的翻译器假定具体的源语言生成具体的输出语言。在框512,过程510能够计算在框510创建的译本的分数。在一些实现方式中,模型能够计算给定的源语言和输出语言的译本的置信分数。在一些实现方式中,打分模型能够是诸如神经网络等已训练的构造,或能够使用诸如语法分析和决策树等其他分析技术。
在框514,过程500能够确定在框506获得的任何译本是否尚未应用于接收的片段。如果是,过程500则继续至框516。如果否,过程500则继续至框518。在框516,过程500将来自在框506接收的翻译器中的下一未使用的翻译器设置为已选择的翻译器。框510至框516之间的循环将继续,直至获得与在框506滞留的每个翻译器对应的打分译本。
在框518,如果存在具有相同的源语言但不同的输出语言的多个译本,能够将具有相同源语言的译本分数诸如通过对其平均化而进行组合。在框520,能够返回在框518计算的组合分数或在框512计算的分数。在一些实现方式中,还能够返回对应的译本。然后,过程500继续至框522,在框522,过程500结束。
图5B是示出用于生成片段的打分译本的一些额外实现方式中使用的过程550的流程图。相比于过程500,过程550在计算上更为低廉。因此,当及时性必不可少时,诸如在发出片段的请求之后等,能够使用过程558。过程550从框552开始并且继续至框554。在框554,过程550能够接收片段。在一些实现方式中,该接收的片段能够是在框404接收的片段的一个。
在框556,能够接收其请求内容包含片段的用户的识别。在框558,能够识别与用户被识别的框556相关联的语言。识别与用户相关联的语言能够基于诸如用户的指定设置(例如,浏览器设置或配置文件设置);与用户创建的内容项相关联的语言历史;用户倾向于与其进行交互的内容项;与用户的朋友相关联的语言等因素。在美国专利申请号14/302,032中能够找出关于识别与用户相关联的语言的额外细节。
在框560,过程550能够获得翻译器,例如,将各种源语言的译本生成为与在框558识别的语言对应的输出语言的机器翻译引擎。在一些实现方式中,能够将获得的翻译器局限于指定与在框408识别的最高可能源语言中的一种对应的源语言的翻译器。
在框562,能够对在框552接收的片段应用在框560获得的翻译器,以获得接收片段的一个或多个译本。每个被应用的翻译器均能够假定具体的源语言并且能够生成在框558识别的语言的译本。在框564,过程550能够对在框562创建的译本进行打分。如上面关于框512讨论的,对译本结果打分能够包括应用打分模型。打分模型能够输入译本和源片段并且基于诸如指定的源语言或输出语言等参数计算译本的质量分数。
在框566,过程550能够返回译本分数。在一些实现方式中,过程550还能够返回对应的译本。然后,过程550继续至框568,在框568,过程550结束。
图6是示出计算片段的可能源语言的置信分数的实施例600。实施例600包括片段602、语言标识符604、初始源语言分数606、翻译器608、译本打分模型610、译本分数612、分数更新器614、以及更新的源语言分数616。片段602能够与上面关于框404讨论的片段对应。语言标识符604能够与上面关于框344讨论的预翻译语言识别器对应。翻译器608能够与上面关于框346讨论的翻译器对应。译本打分模型610能够与上面关于框348讨论的译本打分模型对应。分数更新器614能够与上面关于框350讨论的置信分数生成器对应。
在实施例600中,在步骤650将片段提供至语言标识符604。在该实施例中,片段包括“Check it:sto imparando un nouveau langua!”该片段具有若干语言的特征:“Checkit”(英语);sto imparando(意大利语);un(法语、意大利语、或西班牙语错误拼写);nouveau(法语);langua(在法语、意大利语、或西班牙语等任一种中,接近错误拼写)。此外,该片段是对于一篇文章张贴在社交媒体网站上的评论部分的,该文章是通过已知一般讲西班牙语、但具有许多讲法语的朋友的用户以法语编写的,并且被从与具有多数讲英语的人的美国位置相关联的IP地址张贴。在实施例600的步骤652,语言标识符604能够识别初始源语言分数606。在步骤652识别初始源语言分数606能够对应于框406。在实施例600中,基于上述因素,法语是打分最高的最可能源语言,西班牙语是相近的第二位,并且意大利语也具有75%以上的可能性。
在实施例600中,因为打分最高的可能源语言的接近性并且因为作者是有已由许多其他用户观看她在社交媒体网站上发布的帖子的历史的名人,所以选择该片段进行进一步的分析。因此,在步骤654a至654e,将片段提供至翻译器608,以执行片段的多种翻译,每种均使用源语言与输出语言的不同组合。在实施例600中,将阈值初始置信因数设置为50%,所以对下列潜在的源语言执行翻译:法语、西班牙语、意大利语、英语、以及德语,因为在具有50%以上的初始置信分数的实施例600中,这些是可能源语言。在步骤654a,例如,假定法语作为源语言并且创建包括西班牙语、中文、日语、以及其他语言的输出语言的译本而对片段进行翻译。使用翻译器生成不同源语言和输出语言的译本能够对应于框508-510。
在步骤656,能够将产生的译本提供至译本打分模型610。在步骤658,译本打分模型610能够对各个译本进行打分并且确定具有共同源语言的译本的组合分数。在实施例600中,具有意大利源语言的译本接收输出语言的下列分数:西班牙语1.12、中文1.32、日语.87、英语.99、法语1.21、以及其他分数。例如,意大利源语言的这些分数的组合为1.09。确定源语言的分数和组合分数能够对应于框512和518。
在步骤660和662,将初始源语言分数606和组合的译本分数612提供至分数更新器614。在步骤664,分数更新器614通过使用组合的译本分数612作为打分最高的初始源语言分数606的加权因数而能够提供更新的源语言分数616。例如,基于将其组合译本分数1.09与其初始源语言分数.78相乘的乘法确定意大利语作为最可能源语言。更新初始源语言分数以确定更新的源语言置信分数能够对应于框412。在实施例600中,现在选择意大利语作为片段602的最可能源语言,因为它具有最高更新的源语言置信分数。
上面参考附图描述了公开技术的若干实现方式。可以在其上实现所描述的技术的计算设备可以包括一个或多个中央处理单元、存储器、输入设备(例如,键盘和定点设备)、输出设备(例如,显示设备)、存储设备(例如,磁盘驱动)、以及网络设备(例如,网络接口)。存储器和存储设备是能够存储至少实现所描述的技术的部分的指令的计算机可读存储介质。此外,经由数据传输介质能够存储或传输数据结构和消息结构,诸如通信链路上的信号等。可以使用诸如互联网、局域网、广域网、或点到点拨号连接等各种通信链路。因此,计算机可读介质能够包括计算机可读存储介质(例如,“非易失性”介质)和计算机可读传输介质。
如此处使用的,高于阈值指进行比较的项的值高于指定的其他值,该进行比较的项在具有最大值的特定指定数目的项之中,或该进行比较的项具有在指定的最高百分比值之内的值。如本文使用的,低于阈值指进行比较的项的值位于指定的其他值以下,进行比较的项在具有最小值的特定指定的数目的项之中,或进行比较的项具有在指定的最低百分比值内的值。如此处使用的,在阈值内指进行比较的项的值介于两个指定的其他值之间,进行比较的项在指定的中间数目的项之中,或进行比较的项具有在指定的中间百分比范围内的值。
如此处使用的,词汇“或”指项的集合的任何可能置换。例如,短语“A、B、或C”指A、B、C、或其任何组合中的至少一个,诸如下列中的任一个:A;B;C;A和B;A和C;B和C;A、B、以及C;或诸如A和A;B、B、以及C;A、A、B、C、以及C等多个任意项。
尽管以结构特征和/或方法行为指定的语言对主题进行了描述,然而,应当理解的是,所附权利要求中限定的主题并不一定必须局限于上述所述指定的特征或行为。此处,出于示出之目的,对指定的实施方式和实现方式进行了描述,但是,在不背离实施方式和实现方式的范围的情况下,能够做出各种改变。作为实现后续权利要求的示例性形式公开了上述所述指定的特征和行为。相应地,除非由所附权利要求限制,实施方式和实现方式并不受限制。
通过引用将上述所述任何专利、专利应用、以及其他参考结合在此。如果需要,能够采用上述所述各种参考的***、功能、以及构思对各方面进行改造,以提供又一些进一步的实现方式。如果通过引用而整合的文献中的主题的陈述与本申请的主题的陈述相冲突,则本申请优先。

Claims (35)

1.一种用于识别片段的最可能源语言的方法,包括:
接收所述片段的指示;
确定所述片段的两种以上可能源语言;
生成所述片段的两个以上译本,每个译本均具有指定的译本源语言,
其中,生成所述片段的所述两个以上译本中的至少一个,将所述片段的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段的所述两个以上译本中的至少另一个,将所述片段的所述两种以上可能源语言中的除所述片段的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
计算所述片段的已生成的所述两个以上译本中的至少两个的准确度分数;
生成所述片段的至少两种已选择的可能源语言中的每种的置信因数,其中,基于具有与已选择的所述可能源语言对应的源语言的经过计算的所述准确度分数中的一个或多个,生成每种已选择的可能源语言的所述置信因数;并且
选择与最高置信因数相关联的所述片段的所述可能源语言作为所述最可能源语言。
2.根据权利要求1所述的方法,
其中,所述片段的所述两个以上译本中的至少一个包括多个译本,每个译本具有共同的指定的译本源语言;
其中,计算准确度分数包括计算所述多个译本的组合准确度分数,每个译本具有共同的指定的译本源语言,其中,通过将与具有共同的指定的译本源语言的所述多个译本中的每个对应的单独准确度分数进行组合而计算每个组合准确度分数;并且
其中,基于各自具有共同的指定的译本源语言的所述多个译本的所述组合准确度分数产生所述共同的指定的译本源语言的所述置信因数。
3.根据权利要求2所述的方法,进一步包括:
执行所述片段的初始源语言识别;
其中,所述片段的所述初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种;
其中,对于对应的可能源语言,每个初始置信值均指示所述对应的可能源语言是所述片段的语言的置信度;并且
其中,产生所述可能源语言中的已选择的至少一种的所述置信因数包括使用与所述可能源语言中的已选择的一种对应的所述组合准确度分数,对所述可能源语言中的已选择的一种的所述初始置信值进行更新。
4.根据权利要求2所述的方法,
其中,所述共同的指定的译本源语言的所述置信因数是所述组合准确度分数。
5.根据权利要求1所述的方法,进一步包括:
执行所述片段的初始源语言识别;
其中,所述片段的所述初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种;并且
其中,对于对应的可能源语言,每个初始置信值均指示所述对应的可能源语言是所述片段的语言的置信度。
6.根据权利要求5所述的方法,
其中,基于所述两种以上可能源语言中的第一种的所述对应的初始置信值高于阈值,选择所述两种以上可能源语言中的第一种。
7.根据权利要求5所述的方法,
其中,执行所述片段的所述初始源语言识别包括对所述片段的上下文的分析。
8.根据权利要求7所述的方法,其中,所述片段的上下文的分析使用下列一种或多种:
已知所述片段的作者易做到的语言;
与被识别为所述片段的作者的朋友的用户相关联的语言;
创建所述片段的时间;
关于张贴所述片段的虚拟位置的信息;或
上述项的任何组合。
9.根据权利要求1所述的方法,进一步包括:
从所述片段的已生成的所述两个以上译本中选择所述指定的译本源语言是被选为所述片段的最可能源语言的语言的译本作为所述片段的译本。
10.根据权利要求1所述的方法,进一步包括:
接收所述片段的观看用户的指示;并且
确定与所述片段的观看用户相关联的输出语言;
其中,所述片段的已生成的所述两个以上译本各自为与和所述片段的观看用户相关联的输出语言相匹配的输出语言。
11.根据权利要求1所述的方法,
其中,通过译本打分模型执行对所述准确度分数的计算,所述译本打分模型被训练成利用包括各自包含输入片段、输出片段、以及分数的数据点的训练数据以生成译本分数。
12.根据权利要求1所述的方法,
其中,响应于要求所述片段的译本的请求而执行所述方法。
13.根据权利要求1所述的方法,
其中,响应于所述片段的创建或所述片段到社交媒体网站的张贴而执行所述方法。
14.一种计算机可读存储介质,存储指令,当由计算***运行所述指令时,使所述计算***执行用于识别片段源语言的置信因数的操作,所述操作包括:
接收片段的指示;
接收所述片段的观看者的指示;
确定与所述片段的观看者相关联的输出语言;
生成两个以上译本的所述片段的所述两个以上译本,所述两个以上译本各自具有指定的译本源语言,并且所述两个以上译本中的每个为与和所述片段的观看者相关联的输出语言相匹配的输出语言;
其中,生成所述片段的所述两个以上译本中的至少一个,将所述片段的两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段的所述两个以上译本中的至少另一个,将所述片段的所述两种以上可能源语言中的除所述片段的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
计算所述片段的已生成的所述两个以上译本中的至少两个的准确度分数;并且
产生所述片段的至少两种已选择的可能源语言中的每种的置信因数,其中,基于具有与所述已选择的可能源语言对应的源语言的经过计算的所述准确度分数中的一个或多个,产生每种已选择的可能源语言的所述置信因数。
15.根据权利要求14所述的计算机可读存储介质,其中,所述操作进一步包括:
执行所述片段的初始源语言识别;
其中,所述片段的所述初始源语言识别识别各自具有对应初始置信值的所述可能源语言中的一种或多种;并且
其中,对于对应的可能源语言,每个初始置信值均指示所述对应的可能源语言是所述片段的语言的置信度。
16.根据权利要求15所述的计算机可读存储介质,
其中,基于所述两种以上可能源语言中的第一种的所述对应初始置信值高于阈值,选择所述两种以上可能源语言中的第一种。
17.根据权利要求14所述的计算机可读存储介质,其中,所述操作进一步包括:
从所述片段的已生成的所述两个以上译本中选择所述指定的译本源语言是具有最高置信因数的语言的译本作为所述片段的译本。
18.根据权利要求14所述的计算机可读存储介质,
其中,通过译本打分模型执行对所述准确度分数的计算,所述译本打分模型被训练成利用包括各自包含输入片段、输出片段、以及分数的数据点的训练数据生成译本分数。
19.一种用于生成片段的译本的***,包括:
存储器;
一个或多个处理器;
界面,被配置为接收所述片段的指示;
预翻译语言识别器,被配置为确定所述片段的两种以上可能源语言;
翻译器,被配置为生成所述片段的两个以上译本,所述片段的所述两个以上译本中的每个均具有指定的译本源语言,
其中,生成所述片段的所述两个以上译本中的至少一个,将所述片段的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段的所述两个以上译本中的至少另一个,将所述片段的所述两种以上可能源语言中的除所述片段的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
译本打分模型,被配置为计算所述片段的已生成的所述两个以上译本中的至少两个的准确度分数;以及
置信分数生成器,被配置为产生所述片段的至少两种已选择的可能源语言中的每种的置信因数,其中,基于具有与所述已选择的可能源语言对应的源语言的经过计算的所述准确度分数中的一个或多个,产生每种已选择的可能源语言的所述置信因数;
其中,所述界面被进一步配置为从所述片段的已生成的所述两个以上译本中提供所述指定的译本源语言是具有最高置信因数的所述可能源语言的译本作为所述片段的译本。
20.根据权利要求19所述的***,其中,所述预翻译语言识别器被配置为通过下列项确定所述片段的所述两种以上可能源语言:
执行所述片段的初始源语言识别;
其中,所述片段的所述初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种;
其中,对于对应的可能源语言,每个初始置信值指示对应的可能源语言是所述片段的语言的置信度;并且
其中,基于所述两种以上可能源语言中的第一种的对应的初始置信值高于阈值,选择所述两种以上可能源语言中的第一种。
21.一种用于识别片段(602)的最可能源语言的计算机实现方法,包括:
接收所述片段(602)的指示;
确定所述片段(602)的两种以上可能源语言;
使用机器翻译引擎生成所述片段(602)的两个以上译本,每个均具有指定的译本源语言,
其中,生成所述片段(602)的所述两个以上译本中的至少一个,将所述片段(602)的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段(602)的所述两个以上译本中的至少另一个,将所述片段(602)的所述两种以上可能源语言中的除所述片段(602)的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
计算所述片段(602)的已生成的所述两个以上译本中的至少两个的准确度分数(612);
产生所述片段(602)的至少两种已选择的可能源语言中的每种的置信因数(616),其中,基于具有与所述已选择的可能源语言对应的源语言的经过计算的所述准确度分数(612)中的一个或多个,产生每种已选择的可能源语言的所述置信因数(616);并且
选择与最高置信因数(616)相关联的所述片段(602)的所述可能源语言作为所述最可能源语言。
22.根据权利要求21所述的方法,
其中,所述片段(602)的所述两个以上译本中的至少一个包括多个译本,每个译本均具有共同的指定的译本源语言;
其中,计算准确度分数(612)包括计算所述多个译本的组合准确度分数(612),每个译本均具有共同的指定的译本源语言,其中,通过将与具有共同的指定的译本源语言的所述多个译本中的每个对应的单独准确度分数(612)组合,执行对各个组合准确度分数(612)的计算;并且
其中,基于各自具有所述共同的指定的译本源语言的所述多个译本的所述组合准确度分数(612)产生所述共同的指定的译本源语言的所述置信因数(616)。
23.根据权利要求22所述的方法,进一步包括:
对所述片段(602)执行初始源语言识别;
其中,对所述片段(602)的所述初始源语言识别识别各自具有对应的初始置信值(606)的所述可能源语言中的一种或多种;
其中,对于对应的可能源语言,每个初始置信值(606)指示所述对应的可能源语言是所述片段(602)的语言的置信度;并且
其中,产生所述可能源语言中的已选择的至少一种的所述置信因数(616)包括使用与所述可能源语言中的已选择的一种对应的所述组合准确度分数(612),对所述可能源语言中的已选择的一种的所述初始置信值(606)进行更新。
24.根据权利要求22或23所述的方法,
其中,所述共同的指定的译本源语言的所述置信因数是所述组合准确度分数(612)。
25.根据权利要求21或24中任一种所述的方法,进一步包括:
执行所述片段(602)的初始源语言识别;
其中,所述片段(602)的初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种;并且
其中,对于对应的可能源语言,每个初始置信值指示所述对应的可能源语言是所述片段(602)的语言的置信度;
可选地,其中,基于所述两种以上可能源语言中的第一种的所述对应的初始置信值(606)高于阈值,选择所述两种以上可能源语言中的第一种。
26.根据权利要求25所述的方法,
其中,对所述片段(602)执行所述初始源语言识别包括对所述片段(602)的上下文的分析;
可选地,其中,所述片段(602)的上下文的分析使用下列中的一种或多种:
已知所述片段(602)的作者易做到的语言;
与被识别为所述片段(602)的所述作者的朋友的用户相关联的语言;
创建所述片段(602)的时间;
关于张贴所述片段(602)的虚拟位置的信息;或
上述项的任何组合。
27.根据权利要求21或26中任一项所述的方法,进一步包括:
从所述片段(602)的已生成的所述两个以上译本中选择所述指定的译本源语言是被选为所述片段(602)的所述最可能源语言的所述语言的译本作为所述片段(602)的译本。
28.根据权利要求21或27中任一项所述的方法,进一步包括:
接收所述片段(602)的观看用户的指示;并且
确定与所述片段(602)的观看用户相关联的输出语言;
其中,所述片段(602)的已生成的所述两个以上译本各自是与和所述片段(602)的观看用户相关联的输出语言相匹配的输出语言。
29.根据权利要求21或28中任一项所述的方法,
其中,通过译本打分模型(348;610)执行对所述准确度分数(612)的计算,所述译本打分模型(348;610)被训练成利用包括各自包含输入片段(602)、输出片段(602)、以及分数的数据点的训练数据以生成译本分数(612)。
30.根据权利要求21或29中任一项所述的方法,
其中,响应于要求所述片段(602)的译本的请求而执行所述方法,或
其中,响应于所述片段(602)的创建或所述片段(602)到社交媒体网站的张贴而执行所述方法。
31.根据权利要求21或30中任一项所述的方法,
其中,提供所述最可能源语言作为用于下列至少一项的处理引擎的参数:
应用机器翻译引擎;
执行拼写校正;以及
执行语法校正。
32.一种计算机可读存储介质,存储指令,当由计算***(100;200;300)运行所述指令时,使所述计算***(100;200;300)执行用于识别片段源语言的置信因数的操作,所述操作包括:
接收片段(602)的指示;
接收所述片段(602)的观看者的指示;
确定与所述片段(602)的所述观看者相关联的输出语言;
生成两个以上译本的所述片段(602)的所述两个以上译本,所述两个以上译本各自具有指定的译本源语言,并且所述两个以上译本中的每个为与和所述片段(602)的观看者相关联的输出语言相匹配的输出语言,
其中,生成所述片段(602)的所述两个以上译本中的至少一个,将所述片段(602)的两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段(602)的所述两个以上译本中的至少另一个,将所述片段(602)的所述两种以上可能源语言中的除所述片段(602)的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
计算所述片段(602)的已生成的所述两个以上译本中的至少两个的准确度分数(612);并且
产生所述片段(602)的至少两种已选择的可能源语言中的每种的置信因数(616),其中,基于具有与所述选择的可能源语言对应的源语言的经过计算的所述准确度分数(612)中的一个或多个,产生每种已选择的可能源语言的所述置信因数(616)。
33.根据权利要求32所述的计算机可读存储介质,其中,所述操作进一步包括:
从所述片段(602)的已生成的所述两个以上译本中选择所述指定的译本源语言是具有最高置信因数(616)的语言的译本作为所述片段(602)的译本。
34.根据权利要求32或33所述的计算机可读存储介质,
其中,当由所述计算***(100;200;300)运行所述指令时,使所述计算***(100;200;300)执行根据权利要求21 31中任一项所述的方法。
35.一种用于生成片段(602)的译本的***,例如,被布置成执行根据权利要求21 31中任一项所述的方法,包括:
存储器(150;306,308);
一个或多个处理器(110;304);
界面(342),被配置为接收所述片段(602)的指示;
预翻译语言识别器(344),被配置为确定所述片段(602)的两种以上可能源语言;
翻译器(346;608),被配置为生成所述片段(602)的两个以上译本,所述片段(602)的所述两个以上译本中的每个均具有指定的译本源语言,
其中,生成所述片段(602)的所述两个以上译本中的至少一个,将所述片段(602)的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段(602)的所述两个以上译本中的至少另一个,所述片段(602)的所述两种以上可能源语言中的除所述片段(602)的所述两种以上可能源语言中的第一种之外的第二种作为所述指定的译本源语言;
翻译打分模型(348;610),被配置为计算所述片段(602)的已生成的所述两个以上译本中的至少两个的准确度分数(612);以及
置信分数生成器(350),被配置为产生所述片段(602)的至少两种已选择的可能源语言中的每种的置信因数(616),其中,基于具有与已选择的所述可能源语言对应的源语言的经过计算的所述准确度分数(612)中的一个或多个,产生每种已选择的可能源语言的所述置信因数(616);
其中,所述界面(342)被进一步配置为从所述片段(602)的已生成的所述两个以上译本中提供所述指定的译本源语言是具有最高置信因数(616)的所述可能源语言的译本作为所述片段(602)的译本。
CN201580084729.4A 2015-09-22 2015-09-23 通用翻译 Active CN108351871B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/861,747 2015-09-22
US14/861,747 US9734142B2 (en) 2015-09-22 2015-09-22 Universal translation
PCT/US2015/051737 WO2017052538A1 (en) 2015-09-22 2015-09-23 Universal translation

Publications (2)

Publication Number Publication Date
CN108351871A true CN108351871A (zh) 2018-07-31
CN108351871B CN108351871B (zh) 2019-09-27

Family

ID=58282418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580084729.4A Active CN108351871B (zh) 2015-09-22 2015-09-23 通用翻译

Country Status (9)

Country Link
US (2) US9734142B2 (zh)
JP (1) JP6754426B2 (zh)
KR (1) KR102364163B1 (zh)
CN (1) CN108351871B (zh)
AU (1) AU2015409645A1 (zh)
CA (1) CA2999244A1 (zh)
IL (1) IL257988A (zh)
MX (1) MX2018003490A (zh)
WO (1) WO2017052538A1 (zh)

Families Citing this family (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
EP4138075A1 (en) 2013-02-07 2023-02-22 Apple Inc. Voice trigger for a digital assistant
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9740687B2 (en) 2014-06-11 2017-08-22 Facebook, Inc. Classifying languages for objects and entities
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9864744B2 (en) 2014-12-03 2018-01-09 Facebook, Inc. Mining multi-lingual data
US9830404B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Analyzing language dependency structures
US9830386B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Determining trending topics in social media
US10067936B2 (en) 2014-12-30 2018-09-04 Facebook, Inc. Machine translation output reranking
US9477652B2 (en) 2015-02-13 2016-10-25 Facebook, Inc. Machine learning dialect identification
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US9734142B2 (en) 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10133738B2 (en) 2015-12-14 2018-11-20 Facebook, Inc. Translation confidence scores
US9734143B2 (en) 2015-12-17 2017-08-15 Facebook, Inc. Multi-media context language processing
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US9805029B2 (en) 2015-12-28 2017-10-31 Facebook, Inc. Predicting future translations
US10002125B2 (en) 2015-12-28 2018-06-19 Facebook, Inc. Language model personalization
US9747283B2 (en) 2015-12-28 2017-08-29 Facebook, Inc. Predicting future translations
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10902221B1 (en) 2016-06-30 2021-01-26 Facebook, Inc. Social hash for language models
US10902215B1 (en) 2016-06-30 2021-01-26 Facebook, Inc. Social hash for language models
DE102016114265A1 (de) * 2016-08-02 2018-02-08 Claas Selbstfahrende Erntemaschinen Gmbh Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache
US10474753B2 (en) * 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10180935B2 (en) 2016-12-30 2019-01-15 Facebook, Inc. Identifying multiple languages in a content item
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
KR102056329B1 (ko) * 2017-09-12 2019-12-16 (주)한컴인터프리 통역방법
KR102056330B1 (ko) * 2017-09-12 2019-12-16 (주)한컴인터프리 통역장치 및 그 방법
US10380249B2 (en) 2017-10-02 2019-08-13 Facebook, Inc. Predicting future trending topics
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11120224B2 (en) * 2018-09-14 2021-09-14 International Business Machines Corporation Efficient translating of social media posts
US11087098B2 (en) * 2018-09-18 2021-08-10 Sap Se Computer systems for classifying multilingual text
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11093720B2 (en) * 2019-03-28 2021-08-17 Lenovo (Singapore) Pte. Ltd. Apparatus, method, and program product for converting multiple language variations
CN111031232B (zh) * 2019-04-24 2022-01-28 广东小天才科技有限公司 一种听写实时检测的方法及电子设备
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
JP6856277B1 (ja) * 2019-11-28 2021-04-07 ゆり 柴田 音声入力で翻訳言語を設定する自動音声翻訳システム、自動音声翻訳方法及びそのプログラム
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
JP7502761B2 (ja) * 2021-06-10 2024-06-19 Scalably株式会社 情報処理装置及び情報処理プログラム
US11908446B1 (en) * 2023-10-05 2024-02-20 Eunice Jia Min Yong Wearable audiovisual translation system

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271451A (zh) * 2007-03-20 2008-09-24 株式会社东芝 计算机辅助翻译的方法和装置
CN101714136A (zh) * 2008-10-06 2010-05-26 株式会社东芝 将基于语料库的机器翻译***适应到新领域的方法和装置
US20110137636A1 (en) * 2009-12-02 2011-06-09 Janya, Inc. Context aware back-transliteration and translation of names and common phrases using web resources
CN102388383A (zh) * 2006-12-08 2012-03-21 帕特里克·J·霍尔 在线计算机辅助翻译
CN102650987A (zh) * 2011-02-25 2012-08-29 北京百度网讯科技有限公司 一种基于源语言复述资源的机器翻译方法及装置
US20140172413A1 (en) * 2012-12-18 2014-06-19 International Business Machines Corporation Short phrase language identification
US20140207439A1 (en) * 2013-01-21 2014-07-24 Xerox Corporation Machine translation-driven authoring system and method
US20140335483A1 (en) * 2013-05-13 2014-11-13 Google Inc. Language proficiency detection in social applications
US20140350916A1 (en) * 2011-07-26 2014-11-27 Google Inc. Techniques for performing language detection and translation for multi-language content feeds
CN104899193A (zh) * 2015-06-15 2015-09-09 南京大学 一种计算机中限定翻译片段的交互式翻译方法

Family Cites Families (185)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
US5293584A (en) * 1992-05-21 1994-03-08 International Business Machines Corporation Speech recognition system for natural language translation
US5293581A (en) 1993-04-16 1994-03-08 Alcoa Fujikura Ltd. Flexible connector assembly for fiber optics
US6304841B1 (en) * 1993-10-28 2001-10-16 International Business Machines Corporation Automatic construction of conditional exponential models from elementary features
US5510981A (en) * 1993-10-28 1996-04-23 International Business Machines Corporation Language translation apparatus and method using context-based translation models
US5799193A (en) 1996-04-29 1998-08-25 Siemens Corporate Research, Inc. Scenario based iterative method for development of an object oriented system model
US6002998A (en) * 1996-09-30 1999-12-14 International Business Machines Corporation Fast, efficient hardware mechanism for natural language determination
GB9625284D0 (en) 1996-12-04 1997-01-22 Canon Kk A data processing method and apparatus for identifying a classification to which data belongs
US5991710A (en) * 1997-05-20 1999-11-23 International Business Machines Corporation Statistical translation system with features based on phrases or groups of words
US6629095B1 (en) 1997-10-14 2003-09-30 International Business Machines Corporation System and method for integrating data mining into a relational database management system
US6161082A (en) 1997-11-18 2000-12-12 At&T Corp Network based language translation system
US6157905A (en) * 1997-12-11 2000-12-05 Microsoft Corporation Identifying language and character set of data representing text
US7912696B1 (en) * 1998-08-31 2011-03-22 Sony Corporation Natural language processing apparatus and natural language processing method
US6223150B1 (en) * 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6266642B1 (en) * 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US7110938B1 (en) 1999-09-17 2006-09-19 Trados, Inc. E-services translation portal system
US6393389B1 (en) * 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US6377925B1 (en) 1999-12-16 2002-04-23 Interactive Solutions, Inc. Electronic translator for assisting communications
GB0004095D0 (en) 2000-02-22 2000-04-12 Domain Dynamics Ltd Waveform shape descriptors for statistical modelling
US7289911B1 (en) 2000-08-23 2007-10-30 David Roth Rigney System, methods, and computer program product for analyzing microarray data
IT1315160B1 (it) * 2000-12-28 2003-02-03 Agostini Organizzazione Srl D Sistema e metodo di traduzione automatica o semiautomatica conposteditazione per la correzione degli errori.
US6996518B2 (en) * 2001-01-03 2006-02-07 International Business Machines Corporation Method and apparatus for automated measurement of quality for machine translation
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US7035804B2 (en) 2001-04-26 2006-04-25 Stenograph, L.L.C. Systems and methods for automated audio transcription, translation, and transfer
US20020169592A1 (en) * 2001-05-11 2002-11-14 Aityan Sergey Khachatur Open environment for real-time multilingual communication
US7359861B2 (en) 2002-04-24 2008-04-15 Polyglot Systems, Inc. Inter-language translation device
US7054804B2 (en) 2002-05-20 2006-05-30 International Buisness Machines Corporation Method and apparatus for performing real-time subtitles translation
US7353165B2 (en) * 2002-06-28 2008-04-01 Microsoft Corporation Example based machine translation system
US20040049374A1 (en) 2002-09-05 2004-03-11 International Business Machines Corporation Translation aid for multilingual Web sites
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
JP3920812B2 (ja) * 2003-05-27 2007-05-30 株式会社東芝 コミュニケーション支援装置、支援方法、及び支援プログラム
US8127405B2 (en) 2003-06-18 2012-03-06 Suburban Machine Co., Inc. Reusable hose bundling sleeve
US7346487B2 (en) * 2003-07-23 2008-03-18 Microsoft Corporation Method and apparatus for identifying translations
US20050055630A1 (en) * 2003-09-04 2005-03-10 Philip Scanlan Seamless translation system
US7533019B1 (en) 2003-12-23 2009-05-12 At&T Intellectual Property Ii, L.P. System and method for unsupervised and active learning for automatic speech recognition
US7593843B2 (en) * 2004-03-30 2009-09-22 Microsoft Corporation Statistical language model for logical form using transfer mappings
US7996208B2 (en) 2004-09-30 2011-08-09 Google Inc. Methods and systems for selecting a language for text segmentation
US7698124B2 (en) * 2004-11-04 2010-04-13 Microsoft Corporaiton Machine translation system incorporating syntactic dependency treelets into a statistical framework
US7827026B2 (en) * 2004-12-21 2010-11-02 Xerox Corporation Bilingual authoring assistant for the “tip of the tongue” problem
US8219907B2 (en) * 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
US8249854B2 (en) * 2005-05-26 2012-08-21 Microsoft Corporation Integrated native language translation
WO2006133571A1 (en) * 2005-06-17 2006-12-21 National Research Council Of Canada Means and method for adapted language translation
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8200687B2 (en) 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US7664629B2 (en) 2005-07-19 2010-02-16 Xerox Corporation Second language writing advisor
US7813918B2 (en) 2005-08-03 2010-10-12 Language Weaver, Inc. Identifying documents which form translated pairs, within a document collection
US7672865B2 (en) 2005-10-21 2010-03-02 Fair Isaac Corporation Method and apparatus for retail data mining using pair-wise co-occurrence consistency
US7822596B2 (en) * 2005-12-05 2010-10-26 Microsoft Corporation Flexible display translation
US20070136222A1 (en) 2005-12-09 2007-06-14 Microsoft Corporation Question and answer architecture for reasoning and clarifying intentions, goals, and needs from contextual clues and content
US8275602B2 (en) 2006-04-21 2012-09-25 Scomm, Inc. Interactive conversational speech communicator method and system
US20080046231A1 (en) 2006-05-26 2008-02-21 Srk Ventures, Llc System and Method of Language Translation
EP1870804A1 (en) * 2006-06-22 2007-12-26 Microsoft Corporation Dynamic software localization
US8886514B2 (en) * 2006-08-18 2014-11-11 National Research Council Of Canada Means and a method for training a statistical machine translation system utilizing a posterior probability in an N-best translation list
US20080077384A1 (en) * 2006-09-22 2008-03-27 International Business Machines Corporation Dynamically translating a software application to a user selected target language that is not natively provided by the software application
US8145473B2 (en) * 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US8073850B1 (en) 2007-01-19 2011-12-06 Wordnetworks, Inc. Selecting key phrases for serving contextually relevant content
US7895030B2 (en) 2007-03-16 2011-02-22 International Business Machines Corporation Visualization method for machine translation
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US7877251B2 (en) * 2007-05-07 2011-01-25 Microsoft Corporation Document translation system
US8897423B2 (en) 2007-06-01 2014-11-25 Cisco Technology, Inc. Calling party's language selection based on called party's phone number
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US7983903B2 (en) 2007-09-07 2011-07-19 Microsoft Corporation Mining bilingual dictionaries from monolingual web pages
US8209164B2 (en) * 2007-11-21 2012-06-26 University Of Washington Use of lexical translations for facilitating searches
JP5374515B2 (ja) * 2007-12-05 2013-12-25 フェイスブック,インク. ソーシャルネットワークにおけるコミュニティー翻訳
US20090182547A1 (en) * 2008-01-16 2009-07-16 Microsoft Corporation Adaptive Web Mining of Bilingual Lexicon for Query Translation
US8473276B2 (en) * 2008-02-19 2013-06-25 Google Inc. Universal language input
WO2009129315A1 (en) * 2008-04-15 2009-10-22 Mobile Technologies, Llc System and methods for maintaining speech-to-speech translation in the field
US20100042928A1 (en) 2008-08-12 2010-02-18 Peter Rinearson Systems and methods for calculating and presenting a user-contributor rating index
WO2010046782A2 (en) 2008-10-24 2010-04-29 App Tek Hybrid machine translation
US8330864B2 (en) 2008-11-02 2012-12-11 Xorbit, Inc. Multi-lingual transmission and delay of closed caption content through a delivery system
US8145484B2 (en) 2008-11-11 2012-03-27 Microsoft Corporation Speech processing with predictive language modeling
US8543580B2 (en) 2008-12-23 2013-09-24 Microsoft Corporation Mining translations of web queries from web click-through data
US9195739B2 (en) 2009-02-20 2015-11-24 Microsoft Technology Licensing, Llc Identifying a discussion topic based on user interest information
US8843359B2 (en) * 2009-02-27 2014-09-23 Andrew Nelthropp Lauder Language translation employing a combination of machine and human translations
US9262403B2 (en) * 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8275604B2 (en) 2009-03-18 2012-09-25 Microsoft Corporation Adaptive pattern learning for bilingual data mining
GB0905457D0 (en) 2009-03-30 2009-05-13 Touchtype Ltd System and method for inputting text into electronic devices
JP5413622B2 (ja) 2009-04-30 2014-02-12 日本電気株式会社 言語モデル作成装置、言語モデル作成方法、およびプログラム
US20100283829A1 (en) 2009-05-11 2010-11-11 Cisco Technology, Inc. System and method for translating communications between participants in a conferencing environment
US20100299132A1 (en) 2009-05-22 2010-11-25 Microsoft Corporation Mining phrase pairs from an unstructured resource
EP2441010A4 (en) 2009-06-09 2016-12-28 Ebh Entpr Inc METHODS, APPARATUS AND SOFTWARE FOR ANALYZING THE CONTENT OF MICROBLOGUE MESSAGES
US9189254B2 (en) 2009-10-02 2015-11-17 Massachusetts Institute Of Technology Translating text to, merging, and optimizing graphical user interface tasks
US8554537B2 (en) * 2009-10-23 2013-10-08 Samsung Electronics Co., Ltd Method and device for transliteration
US11122009B2 (en) 2009-12-01 2021-09-14 Apple Inc. Systems and methods for identifying geographic locations of social media content collected over social networks
JP2011128260A (ja) * 2009-12-16 2011-06-30 Nec Corp 外国語会話支援装置、方法、プログラム、および電話端末装置
US8606792B1 (en) 2010-02-08 2013-12-10 Google Inc. Scoring authors of posts
US8825759B1 (en) 2010-02-08 2014-09-02 Google Inc. Recommending posts to non-subscribing users
US20110246172A1 (en) 2010-03-30 2011-10-06 Polycom, Inc. Method and System for Adding Translation in a Videoconference
US8666979B2 (en) 2010-04-09 2014-03-04 Palo Alto Research Center Incorporated Recommending interesting content using messages containing URLs
US8265923B2 (en) 2010-05-11 2012-09-11 Xerox Corporation Statistical machine translation employing efficient parameter training
US8768686B2 (en) 2010-05-13 2014-07-01 International Business Machines Corporation Machine translation with side information
US9710555B2 (en) 2010-05-28 2017-07-18 Adobe Systems Incorporated User profile stitching
US8386235B2 (en) 2010-05-20 2013-02-26 Acosys Limited Collaborative translation system and method
US20120330643A1 (en) * 2010-06-04 2012-12-27 John Frei System and method for translation
US9177346B2 (en) 2010-07-01 2015-11-03 Facebook, Inc. Facilitating interaction among users of a social network
US8775156B2 (en) 2010-08-05 2014-07-08 Google Inc. Translating languages in response to device motion
US20120047172A1 (en) * 2010-08-23 2012-02-23 Google Inc. Parallel document mining
US8880403B2 (en) 2010-09-03 2014-11-04 Canyon Ip Holdings Llc Methods and systems for obtaining language models for transcribing communications
US8756050B1 (en) * 2010-09-14 2014-06-17 Amazon Technologies, Inc. Techniques for translating content
US8775155B2 (en) 2010-10-25 2014-07-08 Xerox Corporation Machine translation using overlapping biphrase alignments and sampling
US20120109649A1 (en) 2010-11-01 2012-05-03 General Motors Llc Speech dialect classification for automatic speech recognition
US8635059B2 (en) * 2010-11-15 2014-01-21 Google Inc. Providing alternative translations
WO2012068557A1 (en) 2010-11-18 2012-05-24 Wal-Mart Stores, Inc. Real-time analytics of streaming data
US8645289B2 (en) 2010-12-16 2014-02-04 Microsoft Corporation Structured cross-lingual relevance feedback for enhancing search results
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
US9098488B2 (en) * 2011-04-03 2015-08-04 Microsoft Technology Licensing, Llc Translation of multilingual embedded phrases
US20130246063A1 (en) 2011-04-07 2013-09-19 Google Inc. System and Methods for Providing Animated Video Content with a Spoken Language Segment
US9015030B2 (en) * 2011-04-15 2015-04-21 International Business Machines Corporation Translating prompt and user input
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US9104661B1 (en) * 2011-06-29 2015-08-11 Amazon Technologies, Inc. Translation of applications
US8928591B2 (en) 2011-06-30 2015-01-06 Google Inc. Techniques for providing a user interface having bi-directional writing tools
US20150161114A1 (en) 2011-06-30 2015-06-11 Google Inc. Rules-based language detection
US9104744B2 (en) 2011-06-30 2015-08-11 Google Inc. Cluster-based language detection
US9298698B2 (en) 2011-06-30 2016-03-29 Google Inc. Language detection based upon a social graph
US20130018650A1 (en) * 2011-07-11 2013-01-17 Microsoft Corporation Selection of Language Model Training Data
US8175244B1 (en) 2011-07-22 2012-05-08 Frankel David P Method and system for tele-conferencing with simultaneous interpretation and automatic floor control
US8838434B1 (en) * 2011-07-29 2014-09-16 Nuance Communications, Inc. Bootstrap call router to other languages using selected N-best translations
US8332206B1 (en) * 2011-08-31 2012-12-11 Google Inc. Dictionary and translation lookup
US20130060769A1 (en) 2011-09-01 2013-03-07 Oren Pereg System and method for identifying social media interactions
US20130084976A1 (en) * 2011-10-01 2013-04-04 Microsoft Corporation Game paradigm for language learning and linguistic data generation
US20130144619A1 (en) 2011-12-01 2013-06-06 Richard T. Lord Enhanced voice conferencing
US9245254B2 (en) 2011-12-01 2016-01-26 Elwha Llc Enhanced voice conferencing with history, language translation and identification
US9053096B2 (en) 2011-12-01 2015-06-09 Elwha Llc Language translation based on speaker-related information
US9009025B1 (en) 2011-12-27 2015-04-14 Amazon Technologies, Inc. Context-based utterance recognition
US9613026B2 (en) * 2011-12-28 2017-04-04 Bloomberg Finance L.P. System and method for interactive automatic translation
US9116885B2 (en) 2012-01-16 2015-08-25 Google Inc. Techniques for a gender weighted pinyin input method editor
US8942973B2 (en) * 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
AU2013245215A1 (en) 2012-04-02 2014-11-20 Dixilang Ltd. A client-server architecture for automatic speech recognition applications
US20150161112A1 (en) 2012-04-13 2015-06-11 Google Inc. One click localization techniques
US8874429B1 (en) 2012-05-18 2014-10-28 Amazon Technologies, Inc. Delay in video for language translation
US20130317808A1 (en) 2012-05-24 2013-11-28 About, Inc. System for and method of analyzing and responding to user generated content
US20140195884A1 (en) * 2012-06-11 2014-07-10 International Business Machines Corporation System and method for automatically detecting and interactively displaying information about entities, activities, and events from multiple-modality natural language sources
US9779080B2 (en) 2012-07-09 2017-10-03 International Business Machines Corporation Text auto-correction via N-grams
US20140025734A1 (en) 2012-07-18 2014-01-23 Cisco Technology, Inc. Dynamic Community Generation Based Upon Determined Trends Within a Social Software Environment
US9519641B2 (en) * 2012-09-18 2016-12-13 Abbyy Development Llc Photography recognition translation
US10275521B2 (en) 2012-10-13 2019-04-30 John Angwin System and method for displaying changes in trending topics to a user
US9190057B2 (en) 2012-12-12 2015-11-17 Amazon Technologies, Inc. Speech model retrieval in distributed speech recognition systems
US8996355B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for reviewing histories of text messages from multi-user multi-lingual communications
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US8990068B2 (en) * 2013-02-08 2015-03-24 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9231898B2 (en) * 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996353B2 (en) * 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9544381B2 (en) 2013-03-13 2017-01-10 Arizona Board Of Regents On Behalf Of Arizona State University User identification across social media
US20140280295A1 (en) 2013-03-14 2014-09-18 Microsoft Corporation Multi-language information retrieval and advertising
US9424354B2 (en) 2013-03-15 2016-08-23 Microsoft Technology Licensing, Llc Providing crowdsourced answers to information needs presented by search engine and social networking application users
US9183198B2 (en) 2013-03-19 2015-11-10 International Business Machines Corporation Customizable and low-latency interactive computer-aided translation
US8949865B1 (en) 2013-03-29 2015-02-03 Intuit Inc. Unified usage tracking mechanism for application
US9430465B2 (en) 2013-05-13 2016-08-30 Facebook, Inc. Hybrid, offline/online speech translation system
US20140358519A1 (en) * 2013-06-03 2014-12-04 Xerox Corporation Confidence-driven rewriting of source texts for improved translation
US20140365200A1 (en) * 2013-06-05 2014-12-11 Lexifone Communication Systems (2010) Ltd. System and method for automatic speech translation
US9684723B2 (en) 2013-06-10 2017-06-20 Microsoft Technology Licensing, Llc Adaptable real-time feed for site population
US10599765B2 (en) 2013-06-27 2020-03-24 Avaya Inc. Semantic translation model training
US20150006148A1 (en) 2013-06-27 2015-01-01 Microsoft Corporation Automatically Creating Training Data For Language Identifiers
US9864974B2 (en) 2013-06-28 2018-01-09 Microsoft Technology Licensing, Llc Serendipitous issue reminder system
US9411790B2 (en) * 2013-07-26 2016-08-09 Metrodigi, Inc. Systems, methods, and media for generating structured documents
US9922351B2 (en) 2013-08-29 2018-03-20 Intuit Inc. Location-based adaptation of financial management system
US9600474B2 (en) * 2013-11-08 2017-03-21 Google Inc. User interface for realtime language translation
GB201319856D0 (en) 2013-11-11 2013-12-25 Univ Manchester Transforming natural language specifications of software requirements into analysis models
US10162813B2 (en) * 2013-11-21 2018-12-25 Microsoft Technology Licensing, Llc Dialogue evaluation via multiple hypothesis ranking
JP2017504876A (ja) * 2013-12-09 2017-02-09 グーグル インコーポレイテッド テキストのコンテキストベースの定義および翻訳を提供するためのシステムおよび方法
US9842592B2 (en) 2014-02-12 2017-12-12 Google Inc. Language models using non-linguistic context
US9740687B2 (en) 2014-06-11 2017-08-22 Facebook, Inc. Classifying languages for objects and entities
US20160041986A1 (en) 2014-08-08 2016-02-11 Cuong Duc Nguyen Smart Search Engine
US9524293B2 (en) * 2014-08-15 2016-12-20 Google Inc. Techniques for automatically swapping languages and/or content for machine translation
US10031939B2 (en) 2014-09-30 2018-07-24 Microsoft Technology Licensing, Llc Automated supplementation of data model
US9569430B2 (en) * 2014-10-24 2017-02-14 International Business Machines Corporation Language translation and work assignment optimization in a customer support environment
US10248653B2 (en) 2014-11-25 2019-04-02 Lionbridge Technologies, Inc. Information technology platform for language translation and task management
US9864744B2 (en) * 2014-12-03 2018-01-09 Facebook, Inc. Mining multi-lingual data
US20160162473A1 (en) * 2014-12-08 2016-06-09 Microsoft Technology Licensing, Llc Localization complexity of arbitrary language assets and resources
US10452786B2 (en) 2014-12-29 2019-10-22 Paypal, Inc. Use of statistical flow data for machine translations between different languages
US9830386B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Determining trending topics in social media
US10067936B2 (en) 2014-12-30 2018-09-04 Facebook, Inc. Machine translation output reranking
US9830404B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Analyzing language dependency structures
US9767091B2 (en) 2015-01-23 2017-09-19 Microsoft Technology Licensing, Llc Methods for understanding incomplete natural language query
US9477652B2 (en) 2015-02-13 2016-10-25 Facebook, Inc. Machine learning dialect identification
US9934203B2 (en) 2015-03-10 2018-04-03 International Business Machines Corporation Performance detection and enhancement of machine translation
US20160357519A1 (en) * 2015-06-05 2016-12-08 Microsoft Technology Licensing, Llc Natural Language Engine for Coding and Debugging
US9734142B2 (en) 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
US10133738B2 (en) 2015-12-14 2018-11-20 Facebook, Inc. Translation confidence scores
US9734143B2 (en) 2015-12-17 2017-08-15 Facebook, Inc. Multi-media context language processing
US10002125B2 (en) 2015-12-28 2018-06-19 Facebook, Inc. Language model personalization
US9805029B2 (en) 2015-12-28 2017-10-31 Facebook, Inc. Predicting future translations
US9747283B2 (en) 2015-12-28 2017-08-29 Facebook, Inc. Predicting future translations

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102388383A (zh) * 2006-12-08 2012-03-21 帕特里克·J·霍尔 在线计算机辅助翻译
CN101271451A (zh) * 2007-03-20 2008-09-24 株式会社东芝 计算机辅助翻译的方法和装置
CN101714136A (zh) * 2008-10-06 2010-05-26 株式会社东芝 将基于语料库的机器翻译***适应到新领域的方法和装置
US20110137636A1 (en) * 2009-12-02 2011-06-09 Janya, Inc. Context aware back-transliteration and translation of names and common phrases using web resources
CN102650987A (zh) * 2011-02-25 2012-08-29 北京百度网讯科技有限公司 一种基于源语言复述资源的机器翻译方法及装置
US20140350916A1 (en) * 2011-07-26 2014-11-27 Google Inc. Techniques for performing language detection and translation for multi-language content feeds
US20140172413A1 (en) * 2012-12-18 2014-06-19 International Business Machines Corporation Short phrase language identification
US20140207439A1 (en) * 2013-01-21 2014-07-24 Xerox Corporation Machine translation-driven authoring system and method
US20140335483A1 (en) * 2013-05-13 2014-11-13 Google Inc. Language proficiency detection in social applications
CN104899193A (zh) * 2015-06-15 2015-09-09 南京大学 一种计算机中限定翻译片段的交互式翻译方法

Also Published As

Publication number Publication date
US10346537B2 (en) 2019-07-09
CA2999244A1 (en) 2017-03-30
JP6754426B2 (ja) 2020-09-09
JP2018533786A (ja) 2018-11-15
US9734142B2 (en) 2017-08-15
WO2017052538A1 (en) 2017-03-30
US20170083504A1 (en) 2017-03-23
CN108351871B (zh) 2019-09-27
KR102364163B1 (ko) 2022-02-18
IL257988A (en) 2018-05-31
US20180113851A1 (en) 2018-04-26
AU2015409645A1 (en) 2018-04-12
KR20180056677A (ko) 2018-05-29
MX2018003490A (es) 2018-06-06

Similar Documents

Publication Publication Date Title
CN108351871B (zh) 通用翻译
US10089299B2 (en) Multi-media context language processing
US10002125B2 (en) Language model personalization
JP6596511B2 (ja) デジタルグラフィックノベルの自動翻訳
Osborn et al. African languages in a digital age: Challenges and opportunities for indigenous language computing
US11126794B2 (en) Targeted rewrites
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
US11709893B2 (en) Search method, electronic device and storage medium
NL2024377B1 (en) Method and System for Intelligently Detecting and Modifying Unoriginal Content
WO2019224891A1 (ja) 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム
KR102304608B1 (ko) 동작인식장치와 아바타를 이용한 수어 통역/번역 서비스 시스템
JP6457058B1 (ja) 知的財産システム、知的財産支援方法および知的財産支援プログラム
JPWO2018198807A1 (ja) 翻訳装置
Joy et al. A prototype Malayalam to sign language automatic translator
James Introduction to Google Translate
Di Paola et al. Foundation models in augmentative and alternative communication: Opportunities and challenges
US20240106776A1 (en) Sign Language Translation Method And System Thereof
EP3147796B1 (en) Language identification
EP4379598A1 (en) A sign language translation method and system thereof
CN117313754B (zh) 智能翻译方法、装置以及翻译机
EP4336379A1 (en) Tracking concepts within content in content management systems and adaptive learning systems
Balan Introduction to Natural Language Processing
Falletto et al. An avatar-based Italian Sign Language visualization system
ZainEldin et al. Silent no more: a comprehensive review of artificial intelligence, deep learning, and machine learning in facilitating deaf and mute communication
JP2022537879A (ja) 名づけを支援する電子装置、方法、およびコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: California, USA

Patentee after: Yuan platform Co.

Address before: California, USA

Patentee before: Facebook, Inc.

CP01 Change in the name or title of a patent holder