JP6754426B2 - 世界共通翻訳 - Google Patents

世界共通翻訳 Download PDF

Info

Publication number
JP6754426B2
JP6754426B2 JP2018514832A JP2018514832A JP6754426B2 JP 6754426 B2 JP6754426 B2 JP 6754426B2 JP 2018514832 A JP2018514832 A JP 2018514832A JP 2018514832 A JP2018514832 A JP 2018514832A JP 6754426 B2 JP6754426 B2 JP 6754426B2
Authority
JP
Japan
Prior art keywords
fragment
source language
language
translation
translations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018514832A
Other languages
English (en)
Other versions
JP2018533786A (ja
Inventor
ファン、フェイ
Original Assignee
フェイスブック,インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フェイスブック,インク. filed Critical フェイスブック,インク.
Publication of JP2018533786A publication Critical patent/JP2018533786A/ja
Application granted granted Critical
Publication of JP6754426B2 publication Critical patent/JP6754426B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

インターネットは、人々が以前には想像もされなかった方法で世界的に接続しかつ情報を共有することを可能にしている。例えば、ソーシャルメディアプラットフォームは、地球の反対側の人々がアイデアに協力し、現在行われているイベントについて議論し、または昼食に食べたものを共有することを可能にしている。これまで、この目覚ましい資源は、共通の自然言語(「言語」)を有するユーザ間の通信に幾分限定されていた。加えて、ユーザは、その言語で表されたコンテンツまたはシステム設定もしくはネットワーク場所(例えば、インターネットプロトコル(「IP」:Internet Protocol)アドレスまたは言語識別子)に基づき、コンテンツプロバイダが適切な翻訳を決定できるコンテンツを消費することのみができた。
世界中で使用される多くの異なる言語にわたる通信は、依然として特定の課題であるが、機械翻訳サービスは、この懸念への対処を試みている。これらのサービスは、ユーザがウェブ形式を使用してテキストを提供し、1つまたは複数の言語を選択し、選択した言語でテキストの翻訳を受信するためのメカニズムを提供する。これらのサービスは、言語の障壁を越えて通信するための人々の能力をかなり増大させたが、それらのサービスは、ユーザが別個のウェブサイトを開き、翻訳を望む言語を示し、ソースドキュメントの言語を識別する必要があり得る。次いで、結果として得られた翻訳がその別個のウェブサイトに示され、オリジナルのソースによって提供された文脈からコンテンツが取り除かれる。いくつかの事例では、翻訳機サービスは、翻訳するソースページの一部分を位置付けられないことがあり得、または翻訳によるフォーマットの変化が原因でソースウェブサイトの判読できないバージョンを提供し得る。多くの事例では、ユーザは、このプロセスを非常に扱いにくいものと感じ、我慢できなくなって異なるウェブサイトにナビゲートするか、または単に理解できないテキストを読み飛ばし、コンテンツを受信する機会を逃す恐れがある。
開示される技術のいくつかの実施形態が動作し得るデバイスの概要を示すブロック図である。 開示される技術のいくつかの実施形態が動作し得る環境の概要を示すブロック図である。 いくつかの実施形態において開示される技術を採用するシステムで使用することができるコンポーネントを示すブロック図である。 いくつかの実施形態において使用される、断片のソース言語に対する信頼度スコアを算出するためのプロセスを示すフロー図である。 いくつかの実施形態において使用される、断片のスコア付き翻訳を生成するためのプロセスを示すフロー図である。 いくつかの追加の実施形態において使用される、断片のスコア付き翻訳を生成するためのプロセスを示すフロー図である。 断片のソース言語に対する信頼度スコアの算出を示す例である。
本明細書で紹介される技法は、添付の図面と併せて、以下の詳細な説明を参照することにより、より良く理解することができ、添付の図面では、同様の参照番号は、同一のまたは機能的に同様の要素を示す。
本開示の様々な実施形態は、断片の最も可能性が高いソース言語を識別するための方法、コンピュータ可読記憶媒体およびシステムを含み得る。断片の表示が受信され得る。断片の2つ以上の可能性のあるソース言語が決定され得る。それぞれ指定された翻訳ソース言語を有する、断片の2つ以上の翻訳が生成され得る。指定された翻訳ソース言語として設定された断片の2つ以上の可能性のあるソース言語の第1のソース言語を有する断片の2つ以上の翻訳の少なくとも1つが生成され得、かつ指定された翻訳ソース言語として設定された断片の2つ以上の可能性のあるソース言語の第1のソース言語以外の断片の2つ以上の可能性のあるソース言語の第2のソース言語を有する断片の2つ以上の翻訳の少なくとも別の翻訳が生成され得る。断片の生成された2つ以上の翻訳の少なくとも2つに対する正確度スコアが算出され得る。断片の少なくとも2つの選択された可能性のあるソース言語の各々に対する信頼度係数が生成され得、それぞれの選択された可能性のあるソース言語に対する信頼度係数は、選択された可能性のあるソース言語に対応するソース言語を有する算出された正確度スコアの1つまたは複数に基づいて生成され得る。最も高い信頼度係数と関連付けられた断片の可能性のあるソース言語は、最も可能性が高いソース言語として選択され得る。
実施形態では、1つまたは複数の非一時的なコンピュータ可読記憶媒体は、実行されると、本発明またはその実施形態のいずれかによる方法を実行するように動作可能なソフトウェアを具体化する。
実施形態では、システムは、1つまたは複数のプロセッサと、プロセッサに結合され、かつプロセッサによって実行可能な命令を含む少なくとも1つのメモリとを含み、プロセッサは、命令を実行する際、本発明またはその実施形態のいずれかによる方法を実行するように動作可能である。
実施形態では、好ましくは非一時的なコンピュータ可読記憶媒体を含むコンピュータプログラム製品は、データ処理システム上で実行されると、本発明またはその実施形態のいずれかによる方法を実行するように動作可能である。
本発明による実施形態は、特に、方法、記憶媒体、システムおよびコンピュータプログラム製品を対象とする添付の請求項で開示される。1つの請求項カテゴリ(例えば、方法)で言及されるいかなる特徴も、別の請求項カテゴリ(例えば、システム)で特許請求され得る。添付の請求項への従属性または参照は、形式的な理由でのみ選択される。しかし、任意の以前の請求項の故意の参照(特に複数の従属性)から得られたいかなる主題も特許請求され得、その結果、請求項およびその特徴のいかなる組合せも開示され、添付の請求項において選択される従属性にかかわらず特許請求され得る。特許請求され得る主題は、添付の請求項に記載される特徴の組合せのみならず、請求項の特徴の他の任意の組合せも含み、請求項で言及される各特徴は、請求項の他の任意の特徴または他の特徴の組合せと組み合わせられ得る。その上、本明細書で説明または描写される実施形態および特徴のいずれも、別個の請求項および/もしくは本明細書で説明もしくは描写される任意の実施形態もしくは特徴の任意の組合せにおいて、または添付の請求項の特徴のいずれかを用いて特許請求され得る。
複数の言語翻訳にスコアを付けることに基づくソース言語識別が開示される。メディアアイテム上で言語処理を実行する(機械翻訳エンジンを適用する、スペル訂正または文法訂正を実行するなど)際、メディアアイテムのソース言語は、処理エンジンのパラメータとして提供することができる。メディアアイテムのソース言語の識別は、メディアアイテムの言語コンテンツが短かったり、スラングまたは特定の言語との関連性がない他の単語を使用したり、正体不明の部分があったり、エラーを含んでいたりする場合に特に困難であり得る。
メディアアイテムのソース言語識別は、そのコンテンツおよび文脈などの因子に基づいてメディアアイテムの初期分析を実行することによって遂行することができる。この初期分析は、1つまたは複数の可能性のあるソース言語および対応する信頼度スコアを識別することができる。次いで、トップスコアを有する各ソース言語について、メディアアイテムを複数の出力言語に変換するために、機械翻訳エンジンを使用してメディアアイテムの複数の翻訳を実行することができる。スコアは、各翻訳について算出され、その翻訳の質を示すことができる。各ソース言語に対応する一連のスコアは、そのソース言語に対応する重み付け係数を形成するために組み合わせることができる。次いで、これらの重み付け係数を使用して、各ソース言語に対応する信頼度スコアを調整することができる。最も高い調整済みのスコアを有するソース言語は、最も可能性が高いソース言語として選択することができる。
「ソース言語」は、本明細書で使用される場合、メディアアイテムが記述された自然言語または現存する自然言語を指す。「メディアアイテム」は、本明細書で使用される場合、テキスト、音声、映像などを含む、言語を利用するいかなるコンテンツでもあり得る。「言語」は、本明細書で使用される場合、人間が記述するか、話すかまたは手話する自然言語(例えば、英語、フランス語、中国語または米国手話)である。言語は、公用語(例えば、英語)でなくともよく、特定の自然言語の方言または変形語でも、言語の別個の表現(例えば、ピンイン(pinyin))でもよい。
例として、サンディエゴパドレス(San Diego Padres)について投稿するソーシャルメディアであるメディアアイテムは、「Mi Padres r playing on television」という断片を含み得る。単語を対応する言語と整合させるのみのアルゴリズムを使用したこの断片の初期分析は、2つのトップスコアを有するソース言語として、0.87のスコアで英語を、および0.91のスコアでスペイン語を示す可能性があり、その理由は、「mi」は、スペイン語で「私の」を意味するが、英語の「my」のタイプミスである可能性があり、「Padres」は、スペイン語で「神父」を意味するが、英語では、特に文章の途中で大文字記載されている場合、スポーツチームのパドレスを指す際に一般的に使用され、「r」は、いかなる言語にもマッピングできない場合でも「are」の代わりに「r」を使用するという一般的なスラングであるため、英語を弱く示す場合もあり得、「on」は、英語を示し得、「television」は、両方の言語においてスペルが同じであるため、アクセントなしでは、英語とスペイン語との間の曖昧な表現であり得る、からである。
この例を続けると、機械翻訳エンジンを使用して断片の複数の翻訳が実行され得る。翻訳の第1のセットは、ソース言語を英語と設定し、断片を複数の出力言語に変換して実行することができる。翻訳の第2のセットは、ソース言語をスペイン語と設定し、断片を複数の出力言語に変換して実行することができる。第1のセットの結果として得られた翻訳の各々にスコアを付けることができ、これらのスコアを組み合わせて、英語重み付け係数(この例では、1.12である)とすることができる。また、第2のセットの結果として得られた翻訳の各々にもスコアを付けることができ、これらのスコアを組み合わせて、スペイン語重み付け係数(この例では、0.80である)とすることができる。英語重み付け係数と英語信頼度スコアとを乗じることにより、英語重み付け係数は英語信頼度スコアに適用され得、0.97の更新された英語信頼度係数を受信することができる。スペイン語重み付け係数とスペイン語信頼度スコアとを乗じることにより、スペイン語重み付け係数はスペイン語信頼度スコアに適用され得、0.73の更新されたスペイン語信頼度係数を受信することができる。更新された信頼度係数に基づいて、英語は、最も可能性が高いソース言語であると決定され得る。
説明される技術のいくつかの実施形態は、図を参照して以下でより詳細に説明される。ここで、図に移ると、図1は、開示される技術のいくつかの実施形態が動作し得るデバイス100の概要を示すブロック図である。デバイスは、複数の翻訳に基づいてメディアアイテムソース言語を識別することができるデバイス100のハードウェアコンポーネントを含み得る。デバイス100は、1つまたは複数の入力デバイス120を含み得、1つまたは複数の入力デバイス120は、CPU(プロセッサ)110への入力を提供し、その動作についてCPU(プロセッサ)110に通知する。動作は、典型的には、ハードウェアコントローラによって仲介され、ハードウェアコントローラは、入力デバイスから受信した信号を解釈し、通信プロトコルを使用してCPU110に情報を伝達する。入力デバイス120は、例えば、マウス、キーボード、タッチスクリーン、赤外線センサ、タッチパッド、着用可能な入力デバイス、カメラもしくは画像ベースの入力デバイス、マイクロフォン、または他のユーザ入力デバイスを含む。
CPU110は、単一の処理ユニットでも、1つのデバイスにおける複数の処理ユニットでも、複数のデバイスにわたって分散したものでもよい。CPU110は、例えば、PCIバスまたはSCSIバスなどのバスを使用して、他のハードウェアデバイスに結合することができる。CPU110は、ディスプレイ130など、デバイス用のハードウェアコントローラと通信することができる。ディスプレイ130は、テキストおよびグラフィックスを表示するために使用することができる。いくつかの例では、ディスプレイ130は、グラフィックスおよびテキストの視覚フィードバックをユーザに提供する。いくつかの実施形態では、ディスプレイ130は、入力デバイスがタッチスクリーンであるかまたは視線方向モニタリングシステムが装備されている場合など、ディスプレイの一部として入力デバイスを含む。いくつかの実施形態では、ディスプレイは、入力デバイスとは別個のものである。表示デバイスの例は、LCD表示画面、LED表示画面、投影ディスプレイ(ヘッドアップ表示デバイスまたは頭部装着型デバイスなど)などである。また、ネットワークカード、ビデオカード、オーディオカード、USB、ファイアワイヤ(FireWire)、他の外部のデバイス、カメラ、プリンタ、スピーカ、CD−ROMドライブ、DVDドライブ、ディスクドライブまたはブルーレイ(Blu−Ray)デバイスなどの他のI/Oデバイス140もプロセッサに結合することができる。
また、いくつかの実施形態では、デバイス100は、ネットワークノードと無線でまたはワイヤベースで通信することができる通信デバイスも含む。通信デバイスは、例えば、TCP/IPプロトコルを使用してネットワークを通じて別のデバイスまたはサーバと通信することができる。デバイス100は、複数のネットワークデバイスにわたって動作を分散させるために、通信デバイスを利用することができる。
CPU110は、メモリ150へのアクセスを有する。メモリは、揮発性または不揮発性記憶装置用の様々なハードウェアデバイスの1つまたは複数を含み、読み取り専用メモリと書き込み可能メモリの両方を含み得る。例えば、メモリは、ランダムアクセスメモリ(RAM:random access memory)、CPUレジスタ、読み取り専用メモリ(ROM:read−only memory)および書き込み可能不揮発性メモリ(フラッシュメモリ、ハードドライブ、フロッピーディスク(登録商標)、CD、DVD、磁気記憶装置、テープドライブ、デバイスバッファなど)などを含み得る。メモリは、根本的なハードウェアから切り離された伝播信号ではない。従って、メモリは、非一時的なものである。メモリ150は、プログラムメモリ160を含み得、プログラムメモリ160は、オペレーティングシステム162、言語分類器164および他の任意のアプリケーションプログラム166などのプログラムおよびソフトウェアを格納する。また、メモリ150は、データメモリ170も含み得、データメモリ170は、メディアアイテム、メディアアイテム翻訳および翻訳エンジン、翻訳スコア、組み合わされた翻訳スコアおよびスコア付けモデル、メディアアイテムからソース言語へのマッピングまたは信頼度スコア、構成データ、設定、ならびにプログラムメモリ160またはデバイス100の任意の要素に提供することができるユーザオプションまたは好みを含み得る。
開示される技術は、他の多くの汎用または専用コンピューティングシステム環境または構成で動作可能である。技術での使用に適し得る周知のコンピューティングシステム、環境および/または構成の例は、これらに限定されないが、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップデバイス、携帯電話、着用可能な電子機器、タブレットデバイス、マルチプロセッサシステム、マイクロプロセッサベースシステム、セットトップボックス、プログラマブル家庭用電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたはデバイスのいずれかを含む分散型コンピューティング環境および同様のものを含む。
図2は、開示される技術のいくつかの実施形態が動作し得る環境200の概要を示すブロック図である。環境200は、1つまたは複数のクライアントコンピューティングデバイス205A〜205Dを含み得、その例は、デバイス100を含み得る。クライアントコンピューティングデバイス205は、ネットワーク230を介した1つまたは複数のリモートコンピュータ(サーバコンピューティングデバイスなど)への論理接続210を使用して、ネットワーク接続環境で動作することができる。
いくつかの実施形態では、サーバ210は、クライアント要求を受信し、サーバ220A〜Cなどの他のサーバを通じてそれらの要求の遂行を調整するエッジサーバであり得る。サーバコンピューティングデバイス210、220は、デバイス100などのコンピューティングシステムを含み得る。各サーバコンピューティングデバイス210、220は単一のサーバとして論理的に示されているが、サーバコンピューティングデバイスの各々は、同じまたは地理的に異なる物理的な場所に位置する複数のコンピューティングデバイスを含む分散型コンピューティング環境であり得る。いくつかの実施形態では、各サーバ220は、サーバ群に対応する。
クライアントコンピューティングデバイス205およびサーバコンピューティングデバイス210、220の各々は、他のサーバ/クライアントデバイスに対するサーバまたはクライアントとして動作し得る。サーバ210は、データベース215に接続することができる。サーバ220A〜Cの各々は、対応するデータベース225A〜Cに接続することができる。上記で説明されたように、各サーバ220は、サーバ群に対応し得、これらのサーバの各々は、データベースを共有することも、サーバ自体のデータベースを有することもできる。データベース215、225は、メディアアイテム、メディアアイテム翻訳および翻訳エンジン、翻訳スコア、組み合わされた翻訳スコアおよびスコア付けモデル、ならびにメディアアイテムからソース言語へのマッピングまたは信頼度スコアなどの情報をウェアハウスに入れる(例えば、格納する)ことができる。データベース215、225は単一のユニットとして論理的に示されているが、データベース215、225の各々は、複数のコンピューティングデバイスを含む分散型コンピューティング環境であっても、それらの対応するサーバ内に位置しても、同じまたは地理的に異なる物理的な場所に位置してもよい。
ネットワーク230は、ローカルエリアネットワーク(LAN:local area network)または広域ネットワーク(WAN:wide area network)であり得るが、他の有線または無線ネットワークでもあり得る。ネットワーク230は、インターネットまたは他の何らかのパブリックもしくはプライベートネットワークであり得る。クライアントコンピューティングデバイス205は、有線または無線通信などによってネットワークインタフェースを通じてネットワーク230に接続することができる。サーバ210とサーバ220との間の接続は別個の接続として示されているが、これらの接続は、ネットワーク230を含むいかなる種類のローカルエリア、広域、有線または無線ネットワークでも、別個のパブリックまたはプライベートネットワークでもあり得る。
「言語断片(language snippet)」または「断片(snippet)」は、本明細書で使用される場合、1つまたは複数の単語または文字群のデジタル表現である。断片は、メディアアイテムまたはメディアアイテムからの言語の表現であり得る。以下の説明は、メディアアイテムのソース言語分類を実行する際には断片を指すが、音声または映像言語表現などの他の言語フォーマットを使用することができる。
図3は、いくつかの実施形態において開示される技術を具体化するシステムで使用することができるコンポーネント300を示すブロック図である。コンポーネント300は、ハードウェア302、汎用ソフトウェア320および専用コンポーネント340を含む。上記で説明されたように、開示される技術を具体化するシステムは、中央処理装置304、動作メモリ306、記憶メモリ308、ならびに入力および出力デバイス310を含む様々なハードウェアを使用することができる。コンポーネント300は、クライアントコンピューティングデバイス205などのクライアントコンピューティングデバイスにおいてまたはサーバコンピューティングデバイス210、220などのサーバコンピューティングデバイス上で具体化することができる。
汎用ソフトウェア320は、オペレーティングシステム322、ローカルプログラム324およびBIOS326を含む様々なアプリケーションを含み得る。専用コンポーネント340は、ローカルプログラム324などの汎用ソフトウェアアプリケーション320のサブコンポーネントであり得る。専用コンポーネント340は、翻訳前言語識別子344、翻訳機346、翻訳スコア付けモデル348、信頼度スコア生成器350、および専用コンポーネントからのデータの制御および受信のために使用することができるコンポーネント(インタフェース342など)を含み得る。いくつかの実施形態では、コンポーネント300は、複数のコンピューティングデバイスにわたって分散されたコンピューティングシステムにあることも、サーバベースアプリケーションとのインタフェースを含むこともあり得る。
翻訳前言語識別子344は、インタフェース342を通じて受信された断片などの断片の初期のソース言語分類を実行するように構成することができる。この初期のソース言語分類は、対応する信頼度値を用いて、断片の1つまたは複数の言語を識別することができる。識別された言語は、それらの信頼度値に基づいてソートすることができ、さらなる分析のために、閾値レベルを上回る信頼度値を有する言語を選択することができる。例えば、閾値レベルは、1つ、3つ、5つまたは10の潜在的なソース言語でも、潜在的なソース言語の上位1、3、5、10、25または50%でも、50%、60%、75%、80%または90%を上回る信頼度値を有するすべての潜在的なソース言語でもよく、さらなる分析のためにすべての潜在的なソース言語を選択してもよい。初期のソース言語分類は、いずれの単語が使用されたか、断片の構造および文法、使用されたスラング用語、句読点など、断片のコンテンツの分析に基づき得る。また、初期のソース言語分類は、作者は誰であるか、作者について知られていること、作者の友人は誰であるか、断片が作成されたのはいつであるか、どこに断片が投稿されたか、その場所において他のアイテムに関する他のいずれの情報が利用可能であるかなど、断片の文脈の分析にも基づき得る。この様式でメディアアイテムを分類する例は、参照により本明細書に組み込まれる米国特許出願第14/302,032号明細書においてさらに詳細に説明されている。
翻訳機346は、1つまたは複数の機械翻訳エンジンであり得る。機械翻訳生成エンジンは、入力として断片を取り入れ、断片の別の言語または方言のバージョンを生成するプログラムであり得る。いくつかの実施形態では、翻訳機346の1つは、特定のソース言語、出力言語またはその両方に対する翻訳を実行するようにセットアップすることができる。いくつかの実施形態では、翻訳機346は、翻訳機に提供されるパラメータによって定義されるように、複数のソース言語からまたは複数の出力言語に翻訳を実行するようにセットアップすることができる。翻訳機346は、様々な言語モデル、規則のセットまたは他のアルゴリズムを使用して、ソース言語から出力言語への断片の変換を実行することができる。様々なソース/出力言語またはソース/出力言語パラメータのための翻訳機は、閾値レベルを上回る信頼度値を有する言語に基づく翻訳前言語識別子344によるさらなる分析のために選択することができる。
翻訳スコア付けモデル348は、翻訳機346から翻訳を受信することができ、翻訳の質の推定を提供するように構成することができる。いくつかの実施形態では、翻訳スコア付けモデル348は、翻訳に対するスコアを提供することができる、ニューラルネットワークなどの1つまたは複数の訓練されたモデルであり得る。いくつかの実施形態では、翻訳スコア付けモデル348の1つは、特定のソース言語、出力言語またはその両方に対する翻訳の分析を実行するようにセットアップすることができる。いくつかの実施形態では、翻訳スコア付けモデル348の1つは、複数のソース言語または複数の出力言語の分析を実行するようにセットアップすることができる。翻訳スコア付けモデル348は、各翻訳に対するスコアを提供することができる。いくつかの実施形態では、翻訳機346は、同じソース言語および複数の異なる出力言語を適用して断片の複数の翻訳を作成するように選択または構成することができる。これらの事例では、ソース言語に対する組み合わされたスコアは、ソース言語を共有する翻訳に対する様々なスコアを平均することなどによって作成することができる。スコアは、翻訳前言語識別子344によって生成された信頼度スコアに対する重み付け係数となるように構成することができる。例えば、スコア1はニュートラルスコアであり、スコア0.9は信頼度値を10%減少したものであり、スコア1.1は信頼度値を10%増加したものである。
信頼度スコア生成器350は、翻訳スコア付けモデル348から重み付け係数を受信し、翻訳前言語識別子344から識別された可能性のあるソース言語に対する信頼度値を受信することができる。次いで、信頼度スコア生成器350は、重み付け係数を使用して、識別された可能性のあるソース言語の信頼度値を更新することができる。最も高い更新された信頼度値を有する結果として得られた識別された可能性のあるソース言語は、断片に対する最も可能性が高いソース言語として選択することができる。この識別は、インタフェース342を通じて返送することができる。
当業者であれば、上記で説明される図1〜3および以下で説明されるフロー図の各々に示されるコンポーネントを各種の方法で変更できることが理解するであろう。例えば、論理の順番を再構成することも、サブステップを並列に実行することも、示される論理を省略することも、他の論理を含めることもできる。
図4は、いくつかの実施形態において使用される、断片のソース言語に対する信頼度スコアを算出するためのプロセス400を示すフロー図である。プロセス400は、ブロック402から始まり、ブロック404へと続く。ブロック404では、プロセス400は、ソース言語を決定すべき断片を受信することができる。様々な実施形態では、断片は、プロセス400について、低い信頼度値を有するか、または断片が重要であるかもしくは読者が多いという表示(作者が有名人であるか、もしくは多くの人々によって通常閲覧/共有される断片を作成した人物である場合、断片のトピックが、多くの人々が注目する人気のある問題に関するものである場合、または断片についてその作成後の短時間の間に多くのつながりがある場合など)を有する断片に対する識別されたソース言語に基づいて選択することができる。
ブロック406では、プロセス400は、ブロック404で受信された断片において初期のソース言語識別を実行することができる。断片の初期のソース言語識別を実行することは、断片のコンテンツおよび/または文脈を分析することを含み得る。断片のコンテンツを分析することは、断片のいずれの単語がいずれの言語と整合するか、断片の文法が特定の言語を示しているかどうか、断片の言語の構造が特定の言語を示しているかどうか、アクセントマークなどの句読点が使用されているかどうか、いずれの文字タイプが使用されているかなどを判断することを含み得る。断片の文脈を分析することは、断片が作成された時間が特定の言語または領域を示しているかどうか、断片が投稿された仮想場所またはその場所における他のメディアアイテムが特定の言語を示しているかどうか、または断片の作者について利用可能な情報が特定の言語を示しているかどうかを判断することを含み得る。例えば、断片は、その作者または作者の友人が知っている言語で記述されている可能性がある。初期のソース言語識別を実行することについての追加の詳細は、米国特許出願第14/302,032号明細書に見出すことができる。いくつかの実施形態では、初期のソース言語の識別は、信頼度値を含み得る。信頼度値は、ソース言語識別をもたらしたコンテンツまたは文脈分析からのタイプもしくは因子、または多くの因子の1つがどの程度強く特定の言語を示しているかに基づき得る。
ブロック408では、1つまたは複数の最上位の最も可能性が高いソース言語を識別することができる。これは、例えば、閾値を上回る信頼度値を有する潜在的なソース言語を選択することによって遂行することができる。いくつかの実施形態では、最上位の最も可能性が高いソース言語を識別することは、すべての潜在的なソース言語を選択することを含み得る。
ブロック410では、プロセス400は、ブロック408で決定された最上位の最も可能性が高いソース言語に対するスコア付き翻訳を生成することができる。スコア付き翻訳を生成することは、異なるソースまたは出力言語について構成された翻訳機を断片に適用すること、結果として得られた翻訳にスコア付けモデルを適用すること、および同じソース言語について複数の翻訳が作成された場合、同じソース言語を有する翻訳に対するスコアを組み合わせることを含み得る。スコア付き翻訳を生成することに関する追加の詳細は、図5Aおよび5Bに関連して以下で説明する。いくつかの実施形態では、ブロック406および408を省略することも、簡略化された最も可能性が高い言語分析のみを実行することもできる。ブロック406および408を省略する場合、ブロック410は、すべての可能性のあるソース言語についてまたは共通のソース言語の指定されたセットについて実行することができる。
ブロック412では、プロセス400は、ブロック406で識別された可能性のあるソース言語の1つまたは複数に対する信頼度係数を調整することができる。いくつかの実施形態では、ブロック410からのスコアは、重み付け係数であり得る。いくつかの実施形態では、信頼度値を調整することは、ブロック406で決定された信頼度値をブロック410からの重み付け係数に乗じることを含み得る。いくつかの実施形態では、特定のソース言語に対応するブロック410で決定されたスコアは、ブロック406で決定された値を置き換えることにより、更新された信頼度値として使用することができる。最も高い調整済みの信頼度値を有する潜在的なソース言語は、受信された断片に対する最も可能性が高いソース言語として選択することができる。この最も可能性が高いソース言語またはこの最も可能性が高いソース言語に対応する翻訳の1つまたは複数の識別が返送され得る。プロセス400は、ブロック414へと続き、そこで終了する。
図5Aは、いくつかの実施形態において使用される、断片のスコア付き翻訳を生成するためのプロセス500を示すフロー図である。以下で説明されるように、いくつかの実施形態では、プロセス500は、複数の潜在的なソース言語の各々について異なる出力言語を有する翻訳を作成することができる。これは、演算集約的な手順であり得、従って、ソーシャルメディアサイトへの投稿の作成時、投稿が表示のために選択される前など、「オフライン」で実行することができる。プロセス500は、ブロック502から始まり、ブロック504へと続く。ブロック504では、プロセス500は、断片を受信することができる。いくつかの実施形態では、断片は、ブロック404でプロセス400によって受信されたものであり得る。
ブロック506では、プロセス500は、1つまたは複数の翻訳機を得ることができる。いくつかの実施形態では、得られた翻訳機は、1つまたは複数の機械翻訳エンジンであり得る。翻訳機は、以下では特定のソースまたは出力言語について個別に構成されるものとして説明されているが、いくつかの実施形態では、ソースまたは出力言語が適用されるパラメータを設定することにより、同じ翻訳機を複数のソースまたは出力言語について使用することができる。様々な実施形態では、翻訳機は、特定の出力言語について構成することも、複数の出力言語について構成することもできる。いくつかの実施形態では、得られた翻訳機は、ブロック406においてプロセスによって決定することができるものなど、受信された断片に対する可能性のあるソース言語であると決定されたソース言語に対応し得る。
ブロック508では、第1の得られた翻訳機は、選択された翻訳機として設定される。ブロック510では、特定のソース言語を推測し、特定の出力言語を生成する選択された翻訳機を受信された断片に適用し、断片の翻訳を作成することができる。ブロック512では、プロセス510は、ブロック510で作成された翻訳に対するスコアを算出することができる。いくつかの実施形態では、モデルは、ソースおよび出力言語が与えられた翻訳の信頼度スコアを算出することができる。いくつかの実施形態では、スコア付けモデルは、ニューラルネットワークなどの訓練された構造物でも、文法分析および決定木などの他の分析技法を使用してもよい。
ブロック514では、プロセス500は、ブロック506で得られた翻訳機のいずれも、受信された断片に適用されなかったかどうかを判断することができる。適用されなかった場合、プロセス500は、ブロック516へと続く。そうでない場合、プロセス500は、ブロック518へと続く。ブロック516では、プロセス500は、選択された翻訳機として、ブロック506で受信された翻訳機から次の未使用の翻訳機を設定する。ブロック510〜516のループは、ブロック506で拘束された翻訳機の各々に対応するスコア付き翻訳が得られるまで続く。
ブロック518では、同じソース言語を有するが、異なる出力言語を有する複数の翻訳がある場合、同じソース言語を有する翻訳に対するスコアは、それらを平均することなどによって組み合わせることができる。ブロック520では、ブロック518で算出された組み合わされたスコアまたはブロック512で算出されたスコアが返送され得る。また、いくつかの実施形態では、対応する翻訳も返送され得る。次いで、プロセス500は、ブロック522へと続き、そこで終了する。
図5Bは、いくつかの追加の実施形態において使用される、断片のスコア付き翻訳を生成するためのプロセス550を示すフロー図である。プロセス550は、プロセス500ほど演算コストが高くない。従って、プロセス558は、断片に対する要求が行われた後など、適時性が必須の場合に使用することができる。プロセス550は、ブロック552から始まり、ブロック554へと続く。ブロック554では、プロセス550は、断片を受信することができる。いくつかの実施形態では、断片は、ブロック404で受信されたものであり得る。
ブロック556では、断片を含むコンテンツを要求したユーザの識別を受信することができる。ブロック558では、ブロック556で識別されたユーザと関連付けられた言語を識別することができる。ユーザと関連付けられた言語を識別することは、ユーザについて指定された設定(例えば、ブラウザ設定またはプロファイル設定)、ユーザによって作成されたコンテンツアイテムと関連付けられた言語の履歴、ユーザが対話する傾向にあるコンテンツアイテム、ユーザの友人と関連付けられた言語などの因子に基づき得る。ユーザと関連付けられた言語を識別することについての追加の詳細は、米国特許出願第14/302,032号明細書に見出すことができる。
ブロック560では、プロセス550は、様々なソース言語からブロック558で識別された言語に対応する出力言語への翻訳を生成する翻訳機(例えば、機械翻訳エンジン)を得ることができる。いくつかの実施形態では、得られた翻訳機は、ブロック408で識別された最上位の最も可能性が高いソース言語の1つに対応するソース言語を指定するものに限定され得る。
ブロック562では、ブロック560で得られた翻訳機は、受信された断片の1つまたは複数の翻訳を得るために、ブロック552で受信された断片に適用することができる。適用された各翻訳機は、特定のソース言語を推測し、ブロック558で識別された言語で翻訳を生成することができる。ブロック564では、プロセス550は、ブロック562で作成された翻訳にスコアを付けることができる。ブロック512に関連して上記で説明されるように、スコア付け翻訳結果は、スコア付けモデルを適用することを含み得る。スコア付けモデルは、翻訳およびソース断片を取り入れ、翻訳に対する質スコアを算出することができ、翻訳に対する質スコアは、指定されたソースまたは出力言語などのパラメータに基づき得る。
ブロック566では、プロセス550は、翻訳スコアを返送することができる。また、いくつかの実施形態では、プロセス550は、対応する翻訳も返送することができる。次いで、プロセス550は、ブロック568へと続き、そこで終了する。
図6は、断片の可能性のあるソース言語に対する信頼度スコアの算出を示す例600である。例600は、断片602、言語識別子604、初期のソース言語スコア606、翻訳機608、翻訳スコア付けモデル610、翻訳スコア612、スコアアップデータ614および更新されたソース言語スコア616を含む。断片602は、ブロック404に関連して上記で説明される断片に対応し得る。言語識別子604は、ブロック344に関連して上記で説明される翻訳前言語識別子に対応し得る。翻訳機608は、ブロック346に関連して上記で説明される翻訳機に対応し得る。翻訳スコア付けモデル610は、ブロック348に関連して上記で説明される翻訳スコア付けモデルに対応し得る。スコアアップデータ614は、ブロック350に関連して上記で説明される信頼度スコア生成器に対応し得る。
例600では、ステップ650において、断片が言語識別子604に提供される。この例では、断片は、「Check it:sto imparando un nouveau langua!」を含む。この断片は、いくつかの言語の特徴:「Check it」(英語);sto imparando(イタリア語);un(フランス語、イタリア語またはスペイン語のスペルミス);nouveau(フランス語);langua(フランス語、イタリア語またはスペイン語のいずれかの正解に近いスペルミス)を有する。また、この断片は、一般的にスペイン語を話すが、フランス語を話す多くの友人がいることで知られているユーザにより、フランス語で記述された記事に対するソーシャルメディアウェブサイトのコメントセクションに投稿され、ほとんどが英語を話す米国の場所と関連付けられたIPアドレスから投稿されたものである。例600のステップ652では、言語識別子604は、初期のソース言語スコア606を識別することができる。ステップ652で初期のソース言語スコア606を識別することは、ブロック406に対応し得る。例600では、上記の因子に基づいて、フランス語がトップスコアを有する最も可能性が高いソース言語であり、スペイン語がその次に近い言語であり、また、イタリア語も75%を上回る可能性を有する。
例600では、トップスコアを有する可能性のあるソース言語に近いという理由、および作者がソーシャルメディアサイトへのその投稿が他の多くのユーザによって閲覧されているという歴史を有する有名人であるという理由により、この断片は、さらなる分析のために選択される。従って、ステップ654a〜654eにおいて、断片は翻訳機608に提供され、それぞれソース言語および出力言語の異なる組合せを使用して断片の複数の翻訳が実行される。例600では、初期の信頼度係数の閾値は50%に設定され、従って、翻訳は、フランス語、スペイン語、イタリア語、英語およびドイツ語などの潜在的なソース言語について実行される(例600では、これらのソース言語が、50%を上回る初期の信頼度スコアを有する可能性のあるソース言語であるため)。ステップ654aでは、例えば、フランス語をソース言語と想定し、スペイン語、中国語、日本語および他の言語を含む出力言語で翻訳を作成して、断片が翻訳される。異なるソースおよび出力言語に対する翻訳を生成するために翻訳機を使用することは、ブロック508〜510に対応し得る。
ステップ656では、結果として得られた翻訳は、翻訳スコアモデル610に提供することができる。ステップ658では、翻訳スコアモデル610は、翻訳の各々にスコアを付け、共通のソース言語を有する翻訳に対する組み合わされたスコアを決定することができる。例600では、イタリア語のソース言語を有する翻訳は、出力言語について、次のスコア:スペイン語1.12、中国語1.32、日本語0.87、英語0.99、フランス語1.21および他のスコアを受信した。イタリア語のソース言語に対するこれらのスコアの組合せは、例えば、1.09である。ソース言語に対するスコアおよびスコアの組合せを決定することは、ブロック512および518に対応し得る。
ステップ660および662では、初期のソース言語スコア606および組み合わされた翻訳スコア612は、スコアアップデータ614に提供される。ステップ664では、スコアアップデータ614は、組み合わされた翻訳スコア612をトップスコアを有する初期のソース言語スコア606に対する重み付け係数として使用することにより、更新されたソース言語スコア616を提供することができる。例えば、その組み合わされた翻訳スコア1.09をその初期のソース言語スコア0.78に乗じた乗算に基づいて、イタリア語が最も可能性が高いソース言語であると決定される。更新されたソース言語信頼度スコアを決定するために初期のソース言語スコアを更新することは、ブロック412に対応し得る。例600では、イタリア語が最も高い更新されたソース言語信頼度スコアを有するため、断片602に対する最も可能性が高いソース言語としてイタリア語を選択することができる。
開示される技術のいくつかの実施形態は、図を参照して上記で説明される。説明される技術を具体化することができるコンピューティングデバイスは、1つまたは複数の中央処理装置、メモリ、入力デバイス(例えば、キーボードおよびポインティングデバイス)、出力デバイス(例えば、表示デバイス)、記憶装置(例えば、ディスクドライブ)およびネットワークデバイス(例えば、ネットワークインタフェース)を含み得る。メモリおよび記憶装置は、説明される技術の少なくとも一部分を実施する命令を格納することができるコンピュータ可読記憶媒体である。加えて、データ構造およびメッセージ構造は、格納することも、通信リンク上の信号などのデータ伝送媒体を介して送信することもできる。インターネット、ローカルエリアネットワーク、広域ネットワークまたはポイントツーポイントダイアルアップ接続などの様々な通信リンクを使用することができる。従って、コンピュータ可読媒体は、コンピュータ可読記憶媒体(例えば、「非一時的な」媒体)およびコンピュータ可読伝送媒体を含み得る。
本明細書で使用される場合、閾値を上回ることは、比較中のアイテムに対する値が他の指定値を上回ること、比較中のアイテムが特定の指定された数のアイテムの中で最も大きい値を有すること、または比較中のアイテムが指定された最高のパーセンテージ値内の値を有することを意味する。本明細書で使用される場合、閾値を下回ることは、比較中のアイテムに対する値が他の指定値を下回ること、比較中のアイテムが特定の指定された数のアイテムの中で最も小さい値を有すること、または比較中のアイテムが指定された最低のパーセンテージ値内の値を有することを意味する。本明細書で使用される場合、閾値内であることは、比較中のアイテムに対する値が2つの他の指定値間にあること、比較中のアイテムが指定された数のアイテムの中間にあること、または比較中のアイテムが中間の指定されたパーセンテージ範囲内の値を有することを意味する。
本明細書で使用される場合、「または」という用語は、一連のアイテムの可能な任意の置換を指す。例えば、「A、BまたはC」という記載は、「A」、「B」、「C」、「AおよびB」、「AおよびC」、「BおよびC」、「A、BおよびC」、または「AおよびA」、「B、BおよびC」、「A、A、B、CおよびC」などの複数のアイテムなど、A、B、Cの少なくとも1つまたはそれらの任意の組合せを指す。
構造上の特徴および/または方法処理に特有の用語で主題について説明してきたが、添付の請求項で定義される主題は必ずしも上記で説明される具体的な特徴または動作に限定されないことを理解されたい。本明細書では、具体的な実施形態および実施形態が例示を目的として説明されてきたが、実施形態および実施形態の範囲から逸脱することなく、様々な変更形態がなされ得る。上記で説明される具体的な特徴および処理は、以下に続く請求項を具体化する実施例の形態として開示される。それに従って、実施形態および実施形態は、添付の請求項によって限定される場合を除いて限定されない。
上記で述べられる特許、特許出願および他の参考文献は、参照により本明細書に組み込まれる。必要に応じて、上記で説明される様々な参考文献のシステム、機能および概念を採用してさらなる実施形態を提供するために態様が変更され得る。参照により組み込まれる文献の記述または主題が本出願の記述または主題と矛盾する場合、本出願が優先されるものとする。

Claims (15)

  1. 断片(602)の最も可能性が高いソース言語を識別するためのコンピュータが実行する方法であって、
    単語または文字群のデジタル表現である前記断片(602)を示す情報を受信するステップと、
    前記断片(602)に対する2つ以上の可能性のあるソース言語を決定するステップと、
    機械翻訳エンジンを使用して、それぞれ指定された翻訳ソース言語を有する前記断片(602)の2つ以上の翻訳を生成するステップであって、
    生成される前記2つ以上の翻訳のうち少なくとも1つは、前記断片(602)の前記2つ以上の可能性のあるソース言語のうち、前記指定された翻訳ソース言語として設定された第1のソース言語を有し、
    生成される前記2つ以上の翻訳のうち少なくとも1つの別の翻訳は、前記断片(602)の前記2つ以上の可能性のあるソース言語のうち、前記指定された翻訳ソース言語として設定された、前記第1のソース言語以外の第2のソース言語を有する、前記2つ以上の翻訳を生成するステップと、
    前記断片(602)の生成された2つ以上の翻訳の少なくとも2つに対する正確度スコア(612)を算出するステップと、
    前記断片(602)の少なくとも2つの選択された可能性のあるソース言語の各々に対する信頼度係数(616)を生成するステップであって、各選択された可能性のあるソース言語に対する前記信頼度係数(616)が、当該選択された可能性のあるソース言語に対応するソース言語を有する算出された正確度スコア(612)の1つまたは複数に基づいて生成される、前記信頼度係数を生成するステップと、
    最も高い信頼度係数(616)と関連付けられる前記断片(602)の前記可能性のあるソース言語を、最も可能性が高いソース言語として選択するステップとを含む、コンピュータが実行する方法。
  2. 前記断片(602)の前記2つ以上の翻訳の前記少なくとも1つが、それぞれ共通の指定された翻訳ソース言語を有する複数の翻訳を含み、
    正確度スコア(612)を算出するステップが、それぞれ共通の指定された翻訳ソース言語を有する前記複数の翻訳に対する組み合わされた正確度スコア(612)を算出することを含み、各組み合わされた正確度スコア(612)を算出することが、共通の指定された翻訳ソース言語を有する前記複数の翻訳の各々に対応する個々の正確度スコア(612)を組み合わせることによって実行され、
    前記共通の指定された翻訳ソース言語に対する前記信頼度係数(616)を生成するステップが、それぞれ前記共通の指定された翻訳ソース言語を有する前記複数の翻訳に対する前記組み合わされた正確度スコア(612)に基づく、請求項1に記載の方法。
  3. 前記2つ以上の可能性のあるソース言語を決定するステップは、前記断片(602)の初期のソース言語識別を実行することを含み、
    前記断片(602)の前記初期のソース言語識別が、それぞれ対応する初期の信頼度値(606)を有する前記可能性のあるソース言語の1つまたは複数を識別し、
    各初期の信頼度値(606)が、対応する可能性のあるソース言語について、前記対応する可能性のあるソース言語が前記断片(602)の言語である信頼度を示し、
    前記可能性のあるソース言語の少なくとも選択された1つに対する前記信頼度係数(616)を生成するステップが、前記可能性のあるソース言語の前記選択された1つに対応する前記組み合わされた正確度スコア(612)を使用して、前記可能性のあるソース言語の前記選択された1つに対する前記初期の信頼度値(606)を更新することを含む、請求項2に記載の方法。
  4. 前記2つ以上の可能性のあるソース言語のうちの前記第1のソース言語は、当該第1のソース言語に対応する前記初期の信頼度値(606)が閾値を上回っていることに基づいて選択される、請求項3に記載の方法。
  5. 前記共通の指定された翻訳ソース言語に対する前記信頼度係数が、前記組み合わされた正確度スコア(612)である、請求項2乃至4のいずれか一項に記載の方法。
  6. 前記断片(602)の前記初期のソース言語識別を実行することが、前記断片(602)の文脈の分析を含み、
    任意選択により、前記断片(602)の前記文脈の前記分析が、
    前記断片(602)の作者が堪能であることが知られている言語、
    前記断片(602)の前記作者の友人として識別されたユーザと関連付けられた言語、
    前記断片(602)が作成されたとき、
    前記断片(602)が投稿された仮想場所に関する情報、または
    それらの任意の組合せ
    のうち1つまたは複数を使用する、請求項3または4に記載の方法。
  7. 前記指定された翻訳ソース言語が、前記断片(602)の前記最も可能性が高いソース言語として選択された言語である翻訳を、前記断片(602)の翻訳として、前記断片(602)の前記生成された2つ以上の翻訳から選択するステップをさらに含む、請求項1乃至6のいずれか1項に記載の方法。
  8. 前記断片(602)の閲覧ユーザを示す情報を受信するステップと、
    前記断片(602)の前記閲覧ユーザと関連付けられた出力言語を決定するステップとをさらに含み、
    前記断片(602)の前記生成された2つ以上の翻訳が、それぞれ前記断片(602)の前記閲覧ユーザと関連付けられた前記出力言語と整合する出力言語におけるものである、請求項1乃至7のいずれか1項に記載の方法。
  9. 前記正確度スコア(612)を算出するステップが、それぞれ入力断片(602)、出力断片(602)およびスコアを含むデータポイントを含む訓練データを用いて翻訳スコア(612)を生成するように訓練される翻訳スコア付けモデル(348;610)によって実行される、請求項1乃至8のいずれか1項に記載の方法。
  10. 前記断片(602)の翻訳を求める要求に応答して実行されるか、または
    前記断片(602)の作成またはソーシャルメディアウェブサイトへの前記断片(602)の投稿に応答して実行される、請求項1乃至9のいずれか1項に記載の方法。
  11. 機械翻訳エンジンを適用すること、
    スペル訂正を実行すること、および
    文法訂正を実行すること
    の少なくとも1つのために前記最も可能性が高いソース言語が、パラメータとして処理エンジンに提供される、請求項1乃至10のいずれか1項に記載の方法。
  12. 命令を格納するコンピュータ可読記憶媒体であって、前記命令が、コンピューティングシステム(100;200;300)によって実行されると、断片のソース言語に対する信頼度係数を識別するための処理を前記コンピューティングシステム(100;200;300)に実行させ、前記処理が、
    単語または文字群のデジタル表現である断片(602)を示す情報を受信するステップと、
    前記断片(602)の閲覧者を示す情報を受信するステップと、
    前記断片(602)の前記閲覧者と関連付けられた出力言語を決定するステップと、
    各々が指定された翻訳ソース言語を有する前記断片(602)の2つ以上の翻訳を生成するステップであって、前記2つ以上の翻訳の各々が、前記断片(602)の前記閲覧者と関連付けられた前記出力言語と整合する出力言語のものであり、
    生成される前記2つ以上の翻訳のうち少なくとも1つは、前記断片(602)の前記2つ以上の可能性のあるソース言語のうち、前記指定された翻訳ソース言語として設定された第1のソース言語を有し、
    生成される前記2つ以上の翻訳のうち少なくとも1つの別の翻訳は、前記断片(602)の前記2つ以上の可能性のあるソース言語のうち、前記指定された翻訳ソース言語として設定された、前記第1のソース言語以外の第2のソース言語を有する、前記翻訳を生成するステップと、
    前記断片(602)の生成された2つ以上の翻訳の少なくとも2つに対する正確度スコア(612)を算出するステップと、
    前記断片(602)の少なくとも2つの選択された可能性のあるソース言語の各々に対する信頼度係数(616)を生成するステップであって、各選択された可能性のあるソース言語に対する前記信頼度係数(616)が、当該選択された可能性のあるソース言語に対応するソース言語を有する算出された正確度スコア(612)の1つまたは複数に基づいて生成される、前記信頼度係数を生成するステップとを含む、コンピュータ可読記憶媒体。
  13. 前記処理が、前記断片(602)の前記生成された2つ以上の翻訳から、前記断片(602)の翻訳として、前記指定された翻訳ソース言語が最も高い信頼度係数(616)を有する言語である翻訳を選択するステップをさらに含む、請求項12に記載のコンピュータ可読記憶媒体。
  14. 前記命令が、前記コンピューティングシステム(100;200;300)によって実行されると、請求項1乃至11のいずれか一項に記載の方法を前記コンピューティングシステム(100;200;300)に実行させる、請求項12または13に記載のコンピュータ可読記憶媒体。
  15. 請求項1乃至11のいずれか一項に記載の方法を実行するように構成されている、断片(602)の翻訳を生成するためのシステムであって、
    メモリ(150;306;308)と、
    1つまたは複数のプロセッサ(110;304)と、
    単語または文字群のデジタル表現である前記断片(602)を示す情報を受信するように構成されたインタフェース(342)と、
    前記断片(602)に対する2つ以上の可能性のあるソース言語を決定するように構成された翻訳前言語識別子(344)と、
    前記断片(602)の2つ以上の翻訳を生成するように構成された翻訳機(346;608)であって、前記断片(602)の前記2つ以上の翻訳の各々が、指定された翻訳ソース言語を有し、
    生成される前記2つ以上の翻訳のうち少なくとも1つは、前記断片(602)の前記2つ以上の可能性のあるソース言語のうち、前記指定された翻訳ソース言語として設定された第1のソース言語を有し、
    生成される前記2つ以上の翻訳のうち少なくとも1つの別の翻訳は、前記断片(602)の前記2つ以上の可能性のあるソース言語のうち、前記指定された翻訳ソース言語として設定された、前記第1のソース言語以外の第2のソース言語を有する、前記翻訳機(346;608)と、
    前記断片(602)の生成された2つ以上の翻訳の少なくとも2つに対する正確度スコア(612)を算出するように構成された翻訳スコア付けモデル(348;610)と、
    前記断片(602)の少なくとも2つの選択された可能性のあるソース言語の各々に対する信頼度係数(616)を生成するように構成された信頼度スコア生成器(350)であって、各選択された可能性のあるソース言語に対する前記信頼度係数(616)が、当該選択された可能性のあるソース言語に対応するソース言語を有する算出された正確度スコア(612)の1つまたは複数に基づいて生成される、前記信頼度スコア生成器(350)とを含み、
    前記インタフェース(342)が、前記断片(602)の生成された2つ以上の翻訳から、前記断片(602)の翻訳として、前記指定された翻訳ソース言語が最も高い信頼度係数(616)を有する可能性のあるソース言語である翻訳を提供するようにさらに構成される、システム。
JP2018514832A 2015-09-22 2015-09-23 世界共通翻訳 Active JP6754426B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/861,747 2015-09-22
US14/861,747 US9734142B2 (en) 2015-09-22 2015-09-22 Universal translation
PCT/US2015/051737 WO2017052538A1 (en) 2015-09-22 2015-09-23 Universal translation

Publications (2)

Publication Number Publication Date
JP2018533786A JP2018533786A (ja) 2018-11-15
JP6754426B2 true JP6754426B2 (ja) 2020-09-09

Family

ID=58282418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018514832A Active JP6754426B2 (ja) 2015-09-22 2015-09-23 世界共通翻訳

Country Status (9)

Country Link
US (2) US9734142B2 (ja)
JP (1) JP6754426B2 (ja)
KR (1) KR102364163B1 (ja)
CN (1) CN108351871B (ja)
AU (1) AU2015409645A1 (ja)
CA (1) CA2999244A1 (ja)
IL (1) IL257988A (ja)
MX (1) MX2018003490A (ja)
WO (1) WO2017052538A1 (ja)

Families Citing this family (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
CN113744733B (zh) 2013-02-07 2022-10-25 苹果公司 数字助理的语音触发器
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9740687B2 (en) 2014-06-11 2017-08-22 Facebook, Inc. Classifying languages for objects and entities
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9864744B2 (en) 2014-12-03 2018-01-09 Facebook, Inc. Mining multi-lingual data
US9830404B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Analyzing language dependency structures
US10067936B2 (en) 2014-12-30 2018-09-04 Facebook, Inc. Machine translation output reranking
US9830386B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Determining trending topics in social media
US9477652B2 (en) 2015-02-13 2016-10-25 Facebook, Inc. Machine learning dialect identification
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9734142B2 (en) 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10133738B2 (en) 2015-12-14 2018-11-20 Facebook, Inc. Translation confidence scores
US9734143B2 (en) 2015-12-17 2017-08-15 Facebook, Inc. Multi-media context language processing
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10002125B2 (en) 2015-12-28 2018-06-19 Facebook, Inc. Language model personalization
US9747283B2 (en) 2015-12-28 2017-08-29 Facebook, Inc. Predicting future translations
US9805029B2 (en) 2015-12-28 2017-10-31 Facebook, Inc. Predicting future translations
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10902221B1 (en) 2016-06-30 2021-01-26 Facebook, Inc. Social hash for language models
US10902215B1 (en) 2016-06-30 2021-01-26 Facebook, Inc. Social hash for language models
DE102016114265A1 (de) * 2016-08-02 2018-02-08 Claas Selbstfahrende Erntemaschinen Gmbh Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache
US10474753B2 (en) * 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10180935B2 (en) 2016-12-30 2019-01-15 Facebook, Inc. Identifying multiple languages in a content item
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
KR102056329B1 (ko) * 2017-09-12 2019-12-16 (주)한컴인터프리 통역방법
KR102056330B1 (ko) * 2017-09-12 2019-12-16 (주)한컴인터프리 통역장치 및 그 방법
US10380249B2 (en) 2017-10-02 2019-08-13 Facebook, Inc. Predicting future trending topics
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11120224B2 (en) * 2018-09-14 2021-09-14 International Business Machines Corporation Efficient translating of social media posts
US11087098B2 (en) * 2018-09-18 2021-08-10 Sap Se Computer systems for classifying multilingual text
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11093720B2 (en) * 2019-03-28 2021-08-17 Lenovo (Singapore) Pte. Ltd. Apparatus, method, and program product for converting multiple language variations
CN111031232B (zh) * 2019-04-24 2022-01-28 广东小天才科技有限公司 一种听写实时检测的方法及电子设备
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
JP6856277B1 (ja) * 2019-11-28 2021-04-07 ゆり 柴田 音声入力で翻訳言語を設定する自動音声翻訳システム、自動音声翻訳方法及びそのプログラム
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
JP7502761B2 (ja) * 2021-06-10 2024-06-19 Scalably株式会社 情報処理装置及び情報処理プログラム
US20230351123A1 (en) * 2022-04-29 2023-11-02 Zoom Video Communications, Inc. Providing multistream machine translation during virtual conferences
US11908446B1 (en) * 2023-10-05 2024-02-20 Eunice Jia Min Yong Wearable audiovisual translation system

Family Cites Families (195)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
US5293584A (en) * 1992-05-21 1994-03-08 International Business Machines Corporation Speech recognition system for natural language translation
US5293581A (en) 1993-04-16 1994-03-08 Alcoa Fujikura Ltd. Flexible connector assembly for fiber optics
US6304841B1 (en) * 1993-10-28 2001-10-16 International Business Machines Corporation Automatic construction of conditional exponential models from elementary features
US5510981A (en) * 1993-10-28 1996-04-23 International Business Machines Corporation Language translation apparatus and method using context-based translation models
US5799193A (en) 1996-04-29 1998-08-25 Siemens Corporate Research, Inc. Scenario based iterative method for development of an object oriented system model
US6002998A (en) * 1996-09-30 1999-12-14 International Business Machines Corporation Fast, efficient hardware mechanism for natural language determination
GB9625284D0 (en) 1996-12-04 1997-01-22 Canon Kk A data processing method and apparatus for identifying a classification to which data belongs
US5991710A (en) * 1997-05-20 1999-11-23 International Business Machines Corporation Statistical translation system with features based on phrases or groups of words
US6629095B1 (en) 1997-10-14 2003-09-30 International Business Machines Corporation System and method for integrating data mining into a relational database management system
US6161082A (en) 1997-11-18 2000-12-12 At&T Corp Network based language translation system
US6157905A (en) * 1997-12-11 2000-12-05 Microsoft Corporation Identifying language and character set of data representing text
CN1119760C (zh) * 1998-08-31 2003-08-27 索尼株式会社 自然语言处理装置及方法
US6266642B1 (en) * 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US6223150B1 (en) * 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US7110938B1 (en) 1999-09-17 2006-09-19 Trados, Inc. E-services translation portal system
US6393389B1 (en) * 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US6377925B1 (en) 1999-12-16 2002-04-23 Interactive Solutions, Inc. Electronic translator for assisting communications
GB0004095D0 (en) 2000-02-22 2000-04-12 Domain Dynamics Ltd Waveform shape descriptors for statistical modelling
US7289911B1 (en) 2000-08-23 2007-10-30 David Roth Rigney System, methods, and computer program product for analyzing microarray data
IT1315160B1 (it) * 2000-12-28 2003-02-03 Agostini Organizzazione Srl D Sistema e metodo di traduzione automatica o semiautomatica conposteditazione per la correzione degli errori.
US6996518B2 (en) * 2001-01-03 2006-02-07 International Business Machines Corporation Method and apparatus for automated measurement of quality for machine translation
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US7035804B2 (en) 2001-04-26 2006-04-25 Stenograph, L.L.C. Systems and methods for automated audio transcription, translation, and transfer
US20020169592A1 (en) * 2001-05-11 2002-11-14 Aityan Sergey Khachatur Open environment for real-time multilingual communication
US7359861B2 (en) 2002-04-24 2008-04-15 Polyglot Systems, Inc. Inter-language translation device
US7054804B2 (en) 2002-05-20 2006-05-30 International Buisness Machines Corporation Method and apparatus for performing real-time subtitles translation
US7353165B2 (en) * 2002-06-28 2008-04-01 Microsoft Corporation Example based machine translation system
US20040049374A1 (en) 2002-09-05 2004-03-11 International Business Machines Corporation Translation aid for multilingual Web sites
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
JP3920812B2 (ja) * 2003-05-27 2007-05-30 株式会社東芝 コミュニケーション支援装置、支援方法、及び支援プログラム
US8127405B2 (en) 2003-06-18 2012-03-06 Suburban Machine Co., Inc. Reusable hose bundling sleeve
US7346487B2 (en) * 2003-07-23 2008-03-18 Microsoft Corporation Method and apparatus for identifying translations
US20050055630A1 (en) * 2003-09-04 2005-03-10 Philip Scanlan Seamless translation system
US7533019B1 (en) 2003-12-23 2009-05-12 At&T Intellectual Property Ii, L.P. System and method for unsupervised and active learning for automatic speech recognition
US7593843B2 (en) * 2004-03-30 2009-09-22 Microsoft Corporation Statistical language model for logical form using transfer mappings
US7996208B2 (en) 2004-09-30 2011-08-09 Google Inc. Methods and systems for selecting a language for text segmentation
US7698124B2 (en) * 2004-11-04 2010-04-13 Microsoft Corporaiton Machine translation system incorporating syntactic dependency treelets into a statistical framework
US7827026B2 (en) * 2004-12-21 2010-11-02 Xerox Corporation Bilingual authoring assistant for the “tip of the tongue” problem
US8219907B2 (en) * 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
US8249854B2 (en) * 2005-05-26 2012-08-21 Microsoft Corporation Integrated native language translation
WO2006133571A1 (en) * 2005-06-17 2006-12-21 National Research Council Of Canada Means and method for adapted language translation
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8200687B2 (en) 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US7664629B2 (en) 2005-07-19 2010-02-16 Xerox Corporation Second language writing advisor
US7813918B2 (en) 2005-08-03 2010-10-12 Language Weaver, Inc. Identifying documents which form translated pairs, within a document collection
US7672865B2 (en) 2005-10-21 2010-03-02 Fair Isaac Corporation Method and apparatus for retail data mining using pair-wise co-occurrence consistency
US7822596B2 (en) * 2005-12-05 2010-10-26 Microsoft Corporation Flexible display translation
US20070136222A1 (en) 2005-12-09 2007-06-14 Microsoft Corporation Question and answer architecture for reasoning and clarifying intentions, goals, and needs from contextual clues and content
WO2007124109A2 (en) 2006-04-21 2007-11-01 Scomm, Inc. Interactive conversational speech communicator method and system
US20080046231A1 (en) 2006-05-26 2008-02-21 Srk Ventures, Llc System and Method of Language Translation
EP1870804A1 (en) * 2006-06-22 2007-12-26 Microsoft Corporation Dynamic software localization
CA2661535A1 (en) * 2006-08-18 2008-02-21 National Research Council Of Canada Means and method for training a statistical machine translation system
US20080077384A1 (en) * 2006-09-22 2008-03-27 International Business Machines Corporation Dynamically translating a software application to a user selected target language that is not natively provided by the software application
US8145473B2 (en) * 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
WO2008070877A2 (en) * 2006-12-08 2008-06-12 Hall Patrick J Online computer-aided translation
US8073850B1 (en) 2007-01-19 2011-12-06 Wordnetworks, Inc. Selecting key phrases for serving contextually relevant content
US7895030B2 (en) 2007-03-16 2011-02-22 International Business Machines Corporation Visualization method for machine translation
CN101271451A (zh) * 2007-03-20 2008-09-24 株式会社东芝 计算机辅助翻译的方法和装置
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US7877251B2 (en) * 2007-05-07 2011-01-25 Microsoft Corporation Document translation system
US8897423B2 (en) 2007-06-01 2014-11-25 Cisco Technology, Inc. Calling party's language selection based on called party's phone number
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US7983903B2 (en) 2007-09-07 2011-07-19 Microsoft Corporation Mining bilingual dictionaries from monolingual web pages
US8209164B2 (en) * 2007-11-21 2012-06-26 University Of Washington Use of lexical translations for facilitating searches
JP5374515B2 (ja) * 2007-12-05 2013-12-25 フェイスブック,インク. ソーシャルネットワークにおけるコミュニティー翻訳
US20090182547A1 (en) * 2008-01-16 2009-07-16 Microsoft Corporation Adaptive Web Mining of Bilingual Lexicon for Query Translation
US8473276B2 (en) * 2008-02-19 2013-06-25 Google Inc. Universal language input
WO2009129315A1 (en) * 2008-04-15 2009-10-22 Mobile Technologies, Llc System and methods for maintaining speech-to-speech translation in the field
US20100042928A1 (en) 2008-08-12 2010-02-18 Peter Rinearson Systems and methods for calculating and presenting a user-contributor rating index
CN101714136B (zh) * 2008-10-06 2012-04-11 株式会社东芝 将基于语料库的机器翻译***适应到新领域的方法和装置
US9798720B2 (en) 2008-10-24 2017-10-24 Ebay Inc. Hybrid machine translation
US8330864B2 (en) 2008-11-02 2012-12-11 Xorbit, Inc. Multi-lingual transmission and delay of closed caption content through a delivery system
US8145484B2 (en) 2008-11-11 2012-03-27 Microsoft Corporation Speech processing with predictive language modeling
US8543580B2 (en) 2008-12-23 2013-09-24 Microsoft Corporation Mining translations of web queries from web click-through data
US9195739B2 (en) 2009-02-20 2015-11-24 Microsoft Technology Licensing, Llc Identifying a discussion topic based on user interest information
US8843359B2 (en) * 2009-02-27 2014-09-23 Andrew Nelthropp Lauder Language translation employing a combination of machine and human translations
US9262403B2 (en) * 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8275604B2 (en) 2009-03-18 2012-09-25 Microsoft Corporation Adaptive pattern learning for bilingual data mining
GB0905457D0 (en) 2009-03-30 2009-05-13 Touchtype Ltd System and method for inputting text into electronic devices
WO2010125736A1 (ja) 2009-04-30 2010-11-04 日本電気株式会社 言語モデル作成装置、言語モデル作成方法、およびコンピュータ読み取り可能な記録媒体
US20100283829A1 (en) 2009-05-11 2010-11-11 Cisco Technology, Inc. System and method for translating communications between participants in a conferencing environment
US20100299132A1 (en) 2009-05-22 2010-11-25 Microsoft Corporation Mining phrase pairs from an unstructured resource
WO2010144618A1 (en) 2009-06-09 2010-12-16 Ebh Enterprises Inc. Methods, apparatus and software for analyzing the content of micro-blog messages
US9189254B2 (en) 2009-10-02 2015-11-17 Massachusetts Institute Of Technology Translating text to, merging, and optimizing graphical user interface tasks
US8554537B2 (en) * 2009-10-23 2013-10-08 Samsung Electronics Co., Ltd Method and device for transliteration
US11122009B2 (en) 2009-12-01 2021-09-14 Apple Inc. Systems and methods for identifying geographic locations of social media content collected over social networks
US8731901B2 (en) 2009-12-02 2014-05-20 Content Savvy, Inc. Context aware back-transliteration and translation of names and common phrases using web resources
JP2011128260A (ja) * 2009-12-16 2011-06-30 Nec Corp 外国語会話支援装置、方法、プログラム、および電話端末装置
US8825759B1 (en) 2010-02-08 2014-09-02 Google Inc. Recommending posts to non-subscribing users
US8606792B1 (en) 2010-02-08 2013-12-10 Google Inc. Scoring authors of posts
US20110246172A1 (en) 2010-03-30 2011-10-06 Polycom, Inc. Method and System for Adding Translation in a Videoconference
US8666979B2 (en) 2010-04-09 2014-03-04 Palo Alto Research Center Incorporated Recommending interesting content using messages containing URLs
US8265923B2 (en) 2010-05-11 2012-09-11 Xerox Corporation Statistical machine translation employing efficient parameter training
US8768686B2 (en) 2010-05-13 2014-07-01 International Business Machines Corporation Machine translation with side information
US9183270B2 (en) 2010-05-17 2015-11-10 Wal-Mart Stores, Inc. Social genome
US9710555B2 (en) 2010-05-28 2017-07-18 Adobe Systems Incorporated User profile stitching
US8386235B2 (en) 2010-05-20 2013-02-26 Acosys Limited Collaborative translation system and method
US20120330643A1 (en) * 2010-06-04 2012-12-27 John Frei System and method for translation
US9177346B2 (en) 2010-07-01 2015-11-03 Facebook, Inc. Facilitating interaction among users of a social network
US8775156B2 (en) 2010-08-05 2014-07-08 Google Inc. Translating languages in response to device motion
WO2012027262A1 (en) * 2010-08-23 2012-03-01 Google Inc. Parallel document mining
US8880403B2 (en) 2010-09-03 2014-11-04 Canyon Ip Holdings Llc Methods and systems for obtaining language models for transcribing communications
US8756050B1 (en) * 2010-09-14 2014-06-17 Amazon Technologies, Inc. Techniques for translating content
US8775155B2 (en) 2010-10-25 2014-07-08 Xerox Corporation Machine translation using overlapping biphrase alignments and sampling
US20120109649A1 (en) 2010-11-01 2012-05-03 General Motors Llc Speech dialect classification for automatic speech recognition
US8635059B2 (en) * 2010-11-15 2014-01-21 Google Inc. Providing alternative translations
US8645289B2 (en) 2010-12-16 2014-02-04 Microsoft Corporation Structured cross-lingual relevance feedback for enhancing search results
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
CN102650987A (zh) * 2011-02-25 2012-08-29 北京百度网讯科技有限公司 一种基于源语言复述资源的机器翻译方法及装置
US9098488B2 (en) * 2011-04-03 2015-08-04 Microsoft Technology Licensing, Llc Translation of multilingual embedded phrases
US20130246063A1 (en) 2011-04-07 2013-09-19 Google Inc. System and Methods for Providing Animated Video Content with a Spoken Language Segment
US9015030B2 (en) * 2011-04-15 2015-04-21 International Business Machines Corporation Translating prompt and user input
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US9104661B1 (en) * 2011-06-29 2015-08-11 Amazon Technologies, Inc. Translation of applications
US8928591B2 (en) 2011-06-30 2015-01-06 Google Inc. Techniques for providing a user interface having bi-directional writing tools
US9104744B2 (en) 2011-06-30 2015-08-11 Google Inc. Cluster-based language detection
US9298698B2 (en) 2011-06-30 2016-03-29 Google Inc. Language detection based upon a social graph
US20150161114A1 (en) 2011-06-30 2015-06-11 Google Inc. Rules-based language detection
US20130018650A1 (en) * 2011-07-11 2013-01-17 Microsoft Corporation Selection of Language Model Training Data
US8175244B1 (en) 2011-07-22 2012-05-08 Frankel David P Method and system for tele-conferencing with simultaneous interpretation and automatic floor control
US8812295B1 (en) * 2011-07-26 2014-08-19 Google Inc. Techniques for performing language detection and translation for multi-language content feeds
US8838434B1 (en) * 2011-07-29 2014-09-16 Nuance Communications, Inc. Bootstrap call router to other languages using selected N-best translations
US8332206B1 (en) * 2011-08-31 2012-12-11 Google Inc. Dictionary and translation lookup
US20130060769A1 (en) 2011-09-01 2013-03-07 Oren Pereg System and method for identifying social media interactions
US20130084976A1 (en) * 2011-10-01 2013-04-04 Microsoft Corporation Game paradigm for language learning and linguistic data generation
US9053096B2 (en) 2011-12-01 2015-06-09 Elwha Llc Language translation based on speaker-related information
US20130144619A1 (en) 2011-12-01 2013-06-06 Richard T. Lord Enhanced voice conferencing
US9245254B2 (en) 2011-12-01 2016-01-26 Elwha Llc Enhanced voice conferencing with history, language translation and identification
US9009025B1 (en) 2011-12-27 2015-04-14 Amazon Technologies, Inc. Context-based utterance recognition
US9613026B2 (en) * 2011-12-28 2017-04-04 Bloomberg Finance L.P. System and method for interactive automatic translation
US9116885B2 (en) 2012-01-16 2015-08-25 Google Inc. Techniques for a gender weighted pinyin input method editor
US8942973B2 (en) * 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
AU2013245215A1 (en) 2012-04-02 2014-11-20 Dixilang Ltd. A client-server architecture for automatic speech recognition applications
US20150161112A1 (en) 2012-04-13 2015-06-11 Google Inc. One click localization techniques
US8874429B1 (en) 2012-05-18 2014-10-28 Amazon Technologies, Inc. Delay in video for language translation
US20130317808A1 (en) 2012-05-24 2013-11-28 About, Inc. System for and method of analyzing and responding to user generated content
US20140195884A1 (en) * 2012-06-11 2014-07-10 International Business Machines Corporation System and method for automatically detecting and interactively displaying information about entities, activities, and events from multiple-modality natural language sources
US9779080B2 (en) 2012-07-09 2017-10-03 International Business Machines Corporation Text auto-correction via N-grams
US20140025734A1 (en) 2012-07-18 2014-01-23 Cisco Technology, Inc. Dynamic Community Generation Based Upon Determined Trends Within a Social Software Environment
US9519641B2 (en) * 2012-09-18 2016-12-13 Abbyy Development Llc Photography recognition translation
US10275521B2 (en) 2012-10-13 2019-04-30 John Angwin System and method for displaying changes in trending topics to a user
US9190057B2 (en) 2012-12-12 2015-11-17 Amazon Technologies, Inc. Speech model retrieval in distributed speech recognition systems
US9195644B2 (en) * 2012-12-18 2015-11-24 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Short phrase language identification
US9047274B2 (en) * 2013-01-21 2015-06-02 Xerox Corporation Machine translation-driven authoring system and method
US9231898B2 (en) 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996355B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for reviewing histories of text messages from multi-user multi-lingual communications
US8996353B2 (en) * 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8990068B2 (en) * 2013-02-08 2015-03-24 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US9544381B2 (en) 2013-03-13 2017-01-10 Arizona Board Of Regents On Behalf Of Arizona State University User identification across social media
US20140280295A1 (en) 2013-03-14 2014-09-18 Microsoft Corporation Multi-language information retrieval and advertising
US9424354B2 (en) 2013-03-15 2016-08-23 Microsoft Technology Licensing, Llc Providing crowdsourced answers to information needs presented by search engine and social networking application users
US9183198B2 (en) 2013-03-19 2015-11-10 International Business Machines Corporation Customizable and low-latency interactive computer-aided translation
US8949865B1 (en) 2013-03-29 2015-02-03 Intuit Inc. Unified usage tracking mechanism for application
US20140335483A1 (en) 2013-05-13 2014-11-13 Google Inc. Language proficiency detection in social applications
US9430465B2 (en) 2013-05-13 2016-08-30 Facebook, Inc. Hybrid, offline/online speech translation system
US20140358519A1 (en) * 2013-06-03 2014-12-04 Xerox Corporation Confidence-driven rewriting of source texts for improved translation
US20140365200A1 (en) * 2013-06-05 2014-12-11 Lexifone Communication Systems (2010) Ltd. System and method for automatic speech translation
US9684723B2 (en) 2013-06-10 2017-06-20 Microsoft Technology Licensing, Llc Adaptable real-time feed for site population
US20150006148A1 (en) 2013-06-27 2015-01-01 Microsoft Corporation Automatically Creating Training Data For Language Identifiers
US10599765B2 (en) 2013-06-27 2020-03-24 Avaya Inc. Semantic translation model training
US9864974B2 (en) 2013-06-28 2018-01-09 Microsoft Technology Licensing, Llc Serendipitous issue reminder system
US9411790B2 (en) * 2013-07-26 2016-08-09 Metrodigi, Inc. Systems, methods, and media for generating structured documents
US9922351B2 (en) 2013-08-29 2018-03-20 Intuit Inc. Location-based adaptation of financial management system
US9600474B2 (en) * 2013-11-08 2017-03-21 Google Inc. User interface for realtime language translation
GB201319856D0 (en) 2013-11-11 2013-12-25 Univ Manchester Transforming natural language specifications of software requirements into analysis models
US10162813B2 (en) * 2013-11-21 2018-12-25 Microsoft Technology Licensing, Llc Dialogue evaluation via multiple hypothesis ranking
JP2017504876A (ja) * 2013-12-09 2017-02-09 グーグル インコーポレイテッド テキストのコンテキストベースの定義および翻訳を提供するためのシステムおよび方法
US9842592B2 (en) 2014-02-12 2017-12-12 Google Inc. Language models using non-linguistic context
US9740687B2 (en) 2014-06-11 2017-08-22 Facebook, Inc. Classifying languages for objects and entities
US20160041986A1 (en) 2014-08-08 2016-02-11 Cuong Duc Nguyen Smart Search Engine
US9524293B2 (en) * 2014-08-15 2016-12-20 Google Inc. Techniques for automatically swapping languages and/or content for machine translation
US10031939B2 (en) 2014-09-30 2018-07-24 Microsoft Technology Licensing, Llc Automated supplementation of data model
US9569430B2 (en) * 2014-10-24 2017-02-14 International Business Machines Corporation Language translation and work assignment optimization in a customer support environment
US10248653B2 (en) 2014-11-25 2019-04-02 Lionbridge Technologies, Inc. Information technology platform for language translation and task management
US9864744B2 (en) * 2014-12-03 2018-01-09 Facebook, Inc. Mining multi-lingual data
US20160162473A1 (en) * 2014-12-08 2016-06-09 Microsoft Technology Licensing, Llc Localization complexity of arbitrary language assets and resources
US10452786B2 (en) 2014-12-29 2019-10-22 Paypal, Inc. Use of statistical flow data for machine translations between different languages
US10067936B2 (en) 2014-12-30 2018-09-04 Facebook, Inc. Machine translation output reranking
US9830404B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Analyzing language dependency structures
US9830386B2 (en) 2014-12-30 2017-11-28 Facebook, Inc. Determining trending topics in social media
US9767091B2 (en) 2015-01-23 2017-09-19 Microsoft Technology Licensing, Llc Methods for understanding incomplete natural language query
US9477652B2 (en) 2015-02-13 2016-10-25 Facebook, Inc. Machine learning dialect identification
US9934203B2 (en) 2015-03-10 2018-04-03 International Business Machines Corporation Performance detection and enhancement of machine translation
US20160357519A1 (en) * 2015-06-05 2016-12-08 Microsoft Technology Licensing, Llc Natural Language Engine for Coding and Debugging
CN104899193B (zh) * 2015-06-15 2017-10-17 南京大学 一种计算机中限定翻译片段的交互式翻译方法
US9734142B2 (en) 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
US10133738B2 (en) 2015-12-14 2018-11-20 Facebook, Inc. Translation confidence scores
US9734143B2 (en) 2015-12-17 2017-08-15 Facebook, Inc. Multi-media context language processing
US9747283B2 (en) 2015-12-28 2017-08-29 Facebook, Inc. Predicting future translations
US9805029B2 (en) 2015-12-28 2017-10-31 Facebook, Inc. Predicting future translations
US10002125B2 (en) 2015-12-28 2018-06-19 Facebook, Inc. Language model personalization

Also Published As

Publication number Publication date
KR20180056677A (ko) 2018-05-29
MX2018003490A (es) 2018-06-06
US10346537B2 (en) 2019-07-09
US20170083504A1 (en) 2017-03-23
US20180113851A1 (en) 2018-04-26
AU2015409645A1 (en) 2018-04-12
KR102364163B1 (ko) 2022-02-18
US9734142B2 (en) 2017-08-15
IL257988A (en) 2018-05-31
CA2999244A1 (en) 2017-03-30
WO2017052538A1 (en) 2017-03-30
JP2018533786A (ja) 2018-11-15
CN108351871A (zh) 2018-07-31
CN108351871B (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
JP6754426B2 (ja) 世界共通翻訳
US10133738B2 (en) Translation confidence scores
US10089299B2 (en) Multi-media context language processing
US10002125B2 (en) Language model personalization
US10013417B2 (en) Classifying languages for objects and entities
US9864744B2 (en) Mining multi-lingual data
US9916306B2 (en) Statistical linguistic analysis of source content
US8886517B2 (en) Trust scoring for language translation systems
US9916304B2 (en) Method of creating translation corpus
US20170004120A1 (en) Corrections for natural language processing
US9916299B2 (en) Data sorting for language processing such as POS tagging
US10496751B2 (en) Avoiding sentiment model overfitting in a machine language model
US10318640B2 (en) Identifying risky translations
US20190012315A1 (en) User feedback for low-confidence translations
US20150324073A1 (en) Displaying aligned ebook text in different languages
EP3147796B1 (en) Language identification

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180704

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180704

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191023

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200710

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20200720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200811

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200821

R150 Certificate of patent or registration of utility model

Ref document number: 6754426

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250