JP6297144B2 - 対話マネージャー - Google Patents

対話マネージャー Download PDF

Info

Publication number
JP6297144B2
JP6297144B2 JP2016523334A JP2016523334A JP6297144B2 JP 6297144 B2 JP6297144 B2 JP 6297144B2 JP 2016523334 A JP2016523334 A JP 2016523334A JP 2016523334 A JP2016523334 A JP 2016523334A JP 6297144 B2 JP6297144 B2 JP 6297144B2
Authority
JP
Japan
Prior art keywords
previous
dialog manager
variable
user
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016523334A
Other languages
English (en)
Other versions
JP2016535297A (ja
Inventor
渡部 晋治
晋治 渡部
タング、ハオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2016535297A publication Critical patent/JP2016535297A/ja
Application granted granted Critical
Publication of JP6297144B2 publication Critical patent/JP6297144B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Description

本発明は、包括的には、テキスト処理および音声処理に関し、より詳細には、対話マネージャーに関する。
対話マネージャーは、音声対話またはテキスト対話のいずれかを用いて特定のタスクを達成するシステムである。対話は、ユーザーの番とシステムの番とを交互に繰り返す。対話は、ユーザー動作およびシステム動作のシーケンスを含むことができる。ユーザー動作は、システムから隠蔽される。システムは、観測結果からユーザー動作を求める。ユーザーは、同様にシステムから隠蔽される変化する状態を有する。システムは、ユーザーの音声またはテキストに基づいて以前のシステム動作および観測結果を所与として、プランニングを用いて、次のシステム動作を決定する。プランニングについては、以下で説明する。
対話マネージャーは、ルールベースとすることもできるし、統計的枠組み、例えば、部分観測可能マルコフ決定過程(POMDP)を用いることもできる。POMDP対話システムでは、対話は、確率変数の集合によって表される。各順番において、対話は、ユーザーが言ったことを表す観測変数と、これまでの対話の進行を表す隠れ状態変数と、選択されたシステム動作とを含む。POMDPモデルは、以前の状態およびシステム動作を所与とする現在の状態の条件付き確率と、現在の状態および以前のシステム動作を所与とする観測結果の条件付き確率との2つの確率的依存関係を定義する。
報酬関数は、順番ごとに、その順番の状態および選択された動作の関数としての適合度基準を指定する。報酬関数が与えられると、現在の時刻における状態分布について知られるものを所与として、最適なシステム動作を提供する方策を求めることが可能である。この方策は、その後、対話の最中にシステム動作を生成するのに用いることができる。報酬を最大にするようにシステム動作を選択することは、プランニングと呼ばれる。
動作するシステムを得るには、POMDPにおいて確率を定義するモデルパラメーターを推定する必要がある。この推定は、学習と呼ばれる。パラメーターは、通常、報酬関数を用いるのではなく、最尤(ML)基準を用いて推定される。例えば、最尤動的ベイジアンネットワーク(DBN)を用いることができる。それらの手法に関する主な問題は、プランニングおよび学習が、異なる基準を用いて別々に独立して最適化されるということである。加えて、プランニングおよび学習は、難しい最適化問題であることで有名である。なぜならば、推論が、実際の問題を扱うのに十分大きな変数空間では処理しにくいからである。
本発明の実施の形態は、統計的な対話の枠組みに基づくテキストおよび音声の対話システムを提供する。従来の手法において用いられる生成モデルとは対照的に、本発明は、識別モデルを用いて、対数線形モデルの枠組みに基づくシステム動作、観測結果、および他の情報の間の関係を表す。その後、対話マネージャーは、確率伝搬(BP)手順を用いて期待報酬を直接最適化することによって、以前の観測結果およびシステム動作のシーケンスを所与とする適切なシステム動作を出力する。
本発明は、対数線形モデルを用いるので、対話中に取得される様々な特徴量をモデルに組み込むことができる。確率伝搬手順に基づいて、対話データを用いることによって対数線形モデル内のパラメーターを統計的にトレーニングし、精緻化されたシステム動作を用いて性能を改善することができる。
実施の形態は、一貫した最適化基準の利点を有すると同時に、最適化するのに、より効率的なコヒーレントなシステムを提供する。対話システムは、対数線形確率分布を用いてモデル化される。このため、本発明は、対数線形対話マネージャーを提供する。
対数線形分布は、条件付き確率場(CRF)の導入以後、シーケンスをモデル化するのに用いられてきた。一般の対数線形モデルは、全ての分布族を表すことができるとは限らないが、特徴関数のそれらの柔軟な使用によって、モデルは、幅広い確率モデル族を表すことが可能になる。モデルは、マルコフ連鎖であるので、効率的な手順を最適化に利用することができる。特に、実施の形態は、時間軸に沿った報酬の合計を最適化する。
可能な状態、ユーザー動作、およびシステム動作の空間を表すために、文脈自由文法(CFG)が用いられる。これらのそれぞれは、対話システムの領域に関係したセマンティック表現のグラフに基づいている。
確率変数は、単純な多項式ではなく、CFGによって生成されたパース木の空間内の値を取る。これによって、幅広い範囲の特徴量の抽出を可能にするリッチな構造が提供される。対数線形モデルに本来的な特徴量の柔軟な使用によって、これらの特徴量は、特殊な場合として従来のルールベースの対話システムのように正確に対話システムを挙動させるように設計することができる。これは、対話システムのルールを指示関数特徴量として実施するとともに、対数線形確率分布がこれらのルールに対応するように、パラメーターを初期化することによって行われる。
本発明の実施の形態による対話マネージャーのプランニング部分のフロー図である。 本発明の実施の形態による対話マネージャーの学習部分のフロー図である。 本発明の実施の形態による一例示のパース木を示す図である。 本発明の実施の形態による一例示の状態のパース木を示す図である。 図4のパース木の例示のプロダクションルールのブロック図である。
プランニング
図1および図2に示すように、本発明の実施の形態は、対数線形対話マネージャーを提供する。このシステムは、プランニング部分100および学習部分200を備える。これらの2つの部分の方法は、当該技術分野において知られているように、バスによってメモリおよび入力/出力インターフェースに接続されたプロセッサ150および250において実行することができる。プロセッサ150および250は、組み合わせることができる。
システムモデル
本発明者らの確率モデルは、各時間ステップtにおいて4つの変数を有する。2つは、システム動作a102および観測結果o101の観測可能変数である。他の2つは、ユーザー動作u201および状態sの推論される潜在変数である。
対話の各ステップは、次のように進む。時刻t−1までの以前のシステム動作および以前の観測結果の全てに基づいて、システムは、クエリat−1を用いてユーザーに入力を促す。ユーザーによる応答は、oによって表される。1つの実施の形態では、oは、ユーザーによって発話された単語のシーケンスである。ただし、応答は、タイプ入力されたテキストとすることもできるし、応答は、他の手段によってシステムに入力することもできることが理解される。
応答の意味は、観測結果から推論することができるユーザー動作uによって表される。新たな状態sは、システム動作at−1およびユーザー動作u、ならびに以前の状態st−1に基づいて推論することができる。本発明者らのシステムでは、状態sは、ユーザーの意図を表すが、一般に、状態は、追加の状況情報も含むことができる。
添え字のコロンを用いてシーケンス、例えば、
Figure 0006297144
を表すと、持続時間Tの対話セッションは、以下の4つの変数シーケンスによって表される。
Figure 0006297144
図3は、ファクターグラフによって表される対話セッションのモデルを示している。このファクターグラフは、本発明者らの対数線形モデルの場合、変数にわたる以下の結合確率分布に対応する。
Figure 0006297144
ここで、Zθは、正規化定数であり、φおよびφは、特徴関数のベクトルであり、θおよびθは、それぞれ対応するモデルパラメーターのベクトルである。
時刻t=Tにおいて、st+1およびut+1は、ファクターグラフのファクターfに示すように未定義である。時刻t=Tにおいて、φを、その最初の2つの入力のみの関数として定義する。表記を簡単にするために、以下のベクトルも定義する。
Figure 0006297144
これによって、式(1)を、以下のようにより簡潔に書き換えることが可能になる。
Figure 0006297144
ここで、
Figure 0006297144
は、p(s0:T,a0:T,u1:T,o1:T)の分配関数である。
変数空間
S、U、A、およびOを、変数空間、すなわち、それぞれ変数s、u、a、およびoの全ての可能な値の集合を表すものとする。各観測結果o∈Oは、波形、音響特徴量、認識されたテキスト、および/または言語的特徴量とすることができる。o∈Oを用いて入力シーケンスを表し、変数空間Oを、語彙集合V内の単語の全てのシーケンスの集合として定義することにする。
変数空間S、U、およびAのそれぞれを、プロダクションルールの集合を含む文脈自由文法(CFG)を用いて定義することにする。各変数空間は、そのCFGによって生成することができる全ての可能なパース木の集合として定義される。
図5は、変数空間Sを定義するCFGにおけるプロダクションルールのうちのいくつかを示している。Sにおける各パース木は、状態sの可能な値である。図5は、図4に太字体で示されたプロダクションルールを用いて生成されたS内の1つのパース木である状態sの1つの可能な値を示している。図4において、終端は、引用符で囲まれる一方、非終端は、引用符で囲まれない。変数$ADDRESS$は、他のプロダクションルールを用いてさらに拡張することもできるし、自由変数として存続することもできる。
特徴量
図3のファクターグラフおよび式(1)に見て取ることができるように、本発明者らのモデルには2つのタイプのファクターが存在する。第1のものは、fで示され、以前の状態および現在の状態、システム動作、ならびにユーザー動作の間の統計的依存関係をモデル化するものである。第2のものは、gで示され、観測された単語のシーケンスとそれらのセマンティック解釈との間の依存関係をモデル化するものである。空間がCFGを用いて定義される変数の場合、各変数値(各パース木)は、アクティブなプロダクションルールの集合として扱われる。例えば、図5のパース木において、アクティブなプロダクションルールは、図4のプロダクションルールでは太字体で示されている。
、G、およびGは、それぞれS(状態)、U(ユーザー動作)、およびA(システム動作)の変数空間を定義するCFGによるプロダクションルールの集合であると仮定する。ファクターgについて、ユーザー動作における各プロダクションルールは、関連付けられた単語のシーケンスの言語モデルと関連付けられる。具体的には、ユーザー動作uおよび観測結果oが与えられると、
Figure 0006297144
の形態の特徴量が得られる。この特徴量は、特定のプロダクションルールk∈Gがユーザー動作uのパース木においてアクティブであり、かつ、特定のバイグラムwi−1が観測結果oの単語シーケンスに存在する場合に限り1に等しい指示関数を示す。
木のルートの近くに現われるプロダクションルールの言語モデルは、発話の一般的クラスをモデル化するのに対して、木のリーフの近くに現われるプロダクションルールは、より特殊化されている。ファクターfについて、同時に生起するプロダクションルールを考えることができる。例えば、2つの特定のプロダクションルールk,k’∈Gに関係する特徴量
Figure 0006297144
は、kが状態st−1においてアクティブであり、かつ、k’が状態sにおいてアクティブである場合に限り、1に等しい。対話システムに通常見られる別のタイプの特徴タイプは、
Figure 0006297144
であり、これは、プロダクションルールj∈Gがシステム動作at−1においてアクティブであることも必要とする。この特徴量は、特定のシステム動作が特定の状態遷移を誘発する傾向があることを示す。
プランニングおよび学習
対話マネージャーが解決する必要がある2つの基本問題は、プランニング100および学習200である。本発明者らのモデルを評価する報酬関数r:S×A→Rが存在するものと仮定する。次に、この報酬関数の観点からプランニングおよび学習を説明することにする。
プランニング
時刻τにおけるプランニングは、全ての以前のシステム動作a0:τ−1および観測結果o1:τを所与として最適なシステム動作aτを求めるという問題である。対話は、持続時間Tを有するものと仮定する。期待報酬Eを最大にするaτを求めるプランニング問題を、以下のような目的関数として定義することにする。
Figure 0006297144
この期待値は、所与としない全ての変数、すなわち、全ての状態、全てのユーザー動作、ならびに全ての今後のシステム動作および観測結果にわたって得られる。
目的関数は、各動作aτを仮定し、その動作を所与として積和手順を用いて期待報酬を求め、そして、期待報酬を最大にした動作を選択することによって、正確に最適化することができる。
しかしながら、実施を容易にするとともに高速にするために、上記の代わりに、イェンセン(Jensen)の不等式から得られる以下の目的関数の変分下限が最適化される。
Figure 0006297144
ここで、γは、Σγ=1となるような変分パラメーターである。γは、期待値最大化(EM)手順を用いて最適化することができるが、計算をさらに簡単にするために、γ=1/(T+1)とすることにする。
この積形式は、報酬を時間と因数分解することができるという優れた特性を有する。換言すれば、式(6)は、以下の式に拡張することができる。
Figure 0006297144
ここで、Z’は、a0:τ−1,o1:τを所与とするpの分配関数である。この時、最適なaτは、報酬用の追加の項を有するグラフモデル上で従来の積和手順によって求めることができる。
先ず、グラフモデルの双方の端部から時刻τまでの信念(belief)が収集され、式(6)を最大にするaτが求められる。確率伝搬(belief propagation:信念伝搬)を明示的に詳しく記載するならば、確率伝搬は、前方後方手順となる。例えば、ファクターノードfから変数ノードst+1への前方メッセージ
Figure 0006297144
は、時刻tからt+1までの(正規化されていない)確率分布
Figure 0006297144
を用いた、メッセージ
Figure 0006297144
と、
Figure 0006297144
と、
Figure 0006297144
にわたる以下の総和によって求められる。
Figure 0006297144
ここで、
Figure 0006297144
は、変数ノードaからファクターノードfへのメッセージである。aのいずれの事前分布も仮定しない場合には、一様分布を含む任意の分布を用いることができる。
Figure 0006297144
は、変数ノードsからファクターノードfへのメッセージである。
Figure 0006297144
は、以前のステップから再帰的に求められる。
変数ノードut+1からファクターノードfへのメッセージは、
Figure 0006297144
である。このメッセージは、以下の式のように分布から求められる。
Figure 0006297144
このため、メッセージ
Figure 0006297144
を求めるのに、シーケンス
Figure 0006297144
の全てにわたる総和を行うことが回避される。他のメッセージも、確率伝搬方法に基づいてシーケンスにわたる総和を計算することなく、効率的に求めることができる。
積和手順を用いた今後の動作にわたる平均化は、従来のPOMDP最適化と異なることに留意されたい。従来のPOMDP最適化は、今後のシステム動作にわたる報酬を最大にしようとするものである。aに対しては最大積手順を用いる一方、他の変数には積和を用いて、今後のシステム動作にわたる最大化を達成することも可能である。しかしながら、このモデル自体、今後の動作にわたる予測分布を提供する確率的方策を含む。
学習
学習部分200は、最適な動作を求める代わりに最適なモデルパラメーターを求めることを対象としていることを除いて、プランニングと同様である。換言すれば、本発明者らは、期待報酬
Figure 0006297144
が、全てのシステム動作a0:Tおよび全ての観測結果o1:Tを所与して最大にされるようなθ103を見つけたい。この場合も、期待値は、所与としない全ての変数、すなわち、全ての状態および全てのユーザー動作にわたって得られる。プランニング部分と同様に、ここでも、式(8)の変分下限を用いることができる。
勾配降下を用いて、学習目的が最適化される。一般に、任意の効用関数v(x)および対数線形モデルに基づく形態の確率分布
Figure 0006297144
について、期待効用の導関数は、以下の式となる。
Figure 0006297144
θにおける各パラメーターθについて、この導関数は、対応する特徴量φと効用との間の共分散であることに留意されたい。このため、効用と正に相関する特徴量に対応するパラメーターは増加する一方、その対応する特徴量が効用と負に相関するパラメーターは減少する。
これを本発明者らのモデルに適用すると、以下の式が得られる。
Figure 0006297144
ここで、期待値は、p(s0:T,u1:T|a0:T,o1:T)を用いて求められる。一般的な場合、これらの量を求めることは困難な場合がある。本発明者らは、粒子確率伝搬を用いる。
粒子確率伝搬
変数空間は、無視するには大きすぎるので、粒子確率伝搬を用いて、上記問題を解くことにする。
ファクターノードfから変数ノードst+1に渡るメッセージ
Figure 0006297144
を、s、a、およびut+1を過小評価する下式によって検討することにする。
Figure 0006297144
重点サンプリングを用いて上記和を書き直すと、期待値が求められる、あるサンプリング分布π(a)、π(u)、π(s)について、以下の式が得られる。
Figure 0006297144
次に、サンプル
Figure 0006297144
にわたり、和を用いて上記期待値を近似することができる。
Figure 0006297144

Claims (13)

  1. 以前のシステム動作ならびに以前の観測結果および現在の観測結果を受信するステップと、
    以前の観測結果および現在の観測結果から現在のユーザー動作を推論し、以前のシステム動作、現在のユーザー動作、ならびに以前のユーザー状態に基づいて現在のユーザー状態を推論するステップと、
    前記ユーザー状態、前記システム動作、前記ユーザー動作、および前記観測結果に基づいて特徴を抽出するステップと、
    前記特徴量を組み込んだ対数線形モデルを評価するための報酬関数を用いて規定された期待報酬を目的関数として、全ての以前のシステム動作および全ての観測結果に基づいて前記期待報酬を最大にするシステム動作を求めるステップと
    を含み、それぞれのステップは、プロセッサにおいて実行される、対話マネージャー。
  2. 確率モデルが、各時間ステップtにおいて、2つの観測可能変数である前記システム動作aおよび前記観測結果oと、2つの潜在変数である前記ユーザー動作uおよび前記ユーザー状態sとを含む4つの変数を有する、
    請求項1に記載の対話マネージャー。
  3. 添え字のコロンを用いてシーケンスを例えば下式
    Figure 0006297144
    で表すと、持続時間Tの対話セッションが、4つの変数シーケンス
    Figure 0006297144
    によって表される
    請求項2に記載の対話マネージャー。
  4. 前記対話セッションは、以下の結合確率分布に対応するファクターグラフによって表され、
    Figure 0006297144
    ここで、Zθは、正規化定数であり、φおよびφは、前記特徴であり、θおよびθは、それぞれ対応するモデルパラメーターのベクトルである
    請求項3に記載の対話マネージャー。
  5. 前記観測結果は、発話された単語またはテキストである
    請求項1に記載の対話マネージャー。
  6. S、U、A、およびOは、それぞれ前記変数s、u、a、およびoの全ての可能な値の集合である変数空間を表す
    請求項3に記載の対話マネージャー。
  7. プロダクションルールの集合を含む文脈自由文法(CFG)を用いて、前記変数空間S、U、およびAを定義するステップ
    をさらに含む、請求項6に記載の対話マネージャー。
  8. 各変数空間は、前記CFGによって生成することができる全ての可能なパース木の集合として定義される、請求項7に記載の対話マネージャー。
  9. 前記対話マネージャーのプランニング部分は、全ての以前のシステム動作a0:τ−1および以前の観測結果o1:τを所与として最適なシステム動作aτを求める
    請求項3に記載の対話マネージャー。
  10. 報酬関数r(s、a)を用いて、目的関数
    Figure 0006297144
    を最大にして、前記期待報酬を求めるステップ
    をさらに含む、請求項3に記載の対話マネージャー。
  11. 前記目的関数に関する変分下限を最適化するステップ
    をさらに含む、請求項10に記載の対話マネージャー。
  12. 前記目的関数は、勾配降下を用いて最適化される
    請求項10に記載の対話マネージャー。
  13. 前記目的関数は、粒子確率確率伝搬を用いて最適化される
    請求項10に記載の対話マネージャー。
JP2016523334A 2013-12-16 2014-11-21 対話マネージャー Active JP6297144B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/106,968 2013-12-16
US14/106,968 US9311430B2 (en) 2013-12-16 2013-12-16 Log-linear dialog manager that determines expected rewards and uses hidden states and actions
PCT/JP2014/081666 WO2015093263A1 (en) 2013-12-16 2014-11-21 Dialog manager

Publications (2)

Publication Number Publication Date
JP2016535297A JP2016535297A (ja) 2016-11-10
JP6297144B2 true JP6297144B2 (ja) 2018-03-20

Family

ID=52023593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016523334A Active JP6297144B2 (ja) 2013-12-16 2014-11-21 対話マネージャー

Country Status (5)

Country Link
US (1) US9311430B2 (ja)
JP (1) JP6297144B2 (ja)
CN (1) CN105830058B (ja)
DE (1) DE112014005715T5 (ja)
WO (1) WO2015093263A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7005016B2 (ja) 2018-11-15 2022-01-21 株式会社スノウチ エンドタブ

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10831802B2 (en) * 2016-04-11 2020-11-10 Facebook, Inc. Techniques to respond to user requests using natural-language machine learning based on example conversations
GB2559408B (en) * 2017-02-06 2020-07-08 Toshiba Kk A spoken dialogue system, a spoken dialogue method and a method of adapting a spoken dialogue system
GB2559618B (en) * 2017-02-13 2020-07-08 Toshiba Kk A dialogue system, a dialogue method and a method of adapting a dialogue system
US10424302B2 (en) * 2017-10-12 2019-09-24 Google Llc Turn-based reinforcement learning for dialog management
CN108182942B (zh) * 2017-12-28 2021-11-26 瑞芯微电子股份有限公司 一种支持不同虚拟角色交互的方法和装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5617509A (en) * 1995-03-29 1997-04-01 Motorola, Inc. Method, apparatus, and radio optimizing Hidden Markov Model speech recognition
JP2004139446A (ja) * 2002-10-18 2004-05-13 Inst Of Physical & Chemical Res 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法
JP4843987B2 (ja) * 2005-04-05 2011-12-21 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
CN101398914A (zh) * 2008-11-10 2009-04-01 南京大学 基于点的部分可观察马尔可夫决策过程的预处理方法
US8793119B2 (en) 2009-07-13 2014-07-29 At&T Intellectual Property I, L.P. System and method for generating manually designed and automatically optimized spoken dialog systems
US8433578B2 (en) 2009-11-30 2013-04-30 At&T Intellectual Property I, L.P. System and method for automatically generating a dialog manager
US8457968B2 (en) 2009-12-08 2013-06-04 At&T Intellectual Property I, L.P. System and method for efficient tracking of multiple dialog states with incremental recombination
US8484077B2 (en) * 2010-07-21 2013-07-09 Yahoo! Inc. Using linear and log-linear model combinations for estimating probabilities of events
WO2012030838A1 (en) 2010-08-30 2012-03-08 Honda Motor Co., Ltd. Belief tracking and action selection in spoken dialog systems
US9582592B2 (en) * 2011-12-20 2017-02-28 Bitly, Inc. Systems and methods for generating a recommended list of URLs by aggregating a plurality of enumerated lists of URLs, the recommended list of URLs identifying URLs accessed by users that also accessed a submitted URL
GB2501067B (en) * 2012-03-30 2014-12-03 Toshiba Kk A text to speech system
US20130325483A1 (en) * 2012-05-29 2013-12-05 GM Global Technology Operations LLC Dialogue models for vehicle occupants
US20150025931A1 (en) * 2013-07-18 2015-01-22 International Business Machines Corporation Business opportunity forecasting

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7005016B2 (ja) 2018-11-15 2022-01-21 株式会社スノウチ エンドタブ

Also Published As

Publication number Publication date
CN105830058B (zh) 2019-11-22
US20150169553A1 (en) 2015-06-18
DE112014005715T5 (de) 2016-09-22
US9311430B2 (en) 2016-04-12
CN105830058A (zh) 2016-08-03
WO2015093263A1 (en) 2015-06-25
JP2016535297A (ja) 2016-11-10

Similar Documents

Publication Publication Date Title
JP6297144B2 (ja) 対話マネージャー
JP6671020B2 (ja) 対話行為推定方法、対話行為推定装置及びプログラム
Su et al. Sample-efficient actor-critic reinforcement learning with supervised data for dialogue management
Serban et al. A hierarchical latent variable encoder-decoder model for generating dialogues
Miao et al. Discovering discrete latent topics with neural variational inference
CN110444214B (zh) 语音信号处理模型训练方法、装置、电子设备及存储介质
JP6164639B2 (ja) ディープ・ニューラルネットワークの学習方法、及びコンピュータプログラム
JP2018513405A (ja) 音声言語理解システム
JP2019086679A (ja) 対話システム、対話方法および対話プログラム
JP6884946B2 (ja) 音響モデルの学習装置及びそのためのコンピュータプログラム
JP6823809B2 (ja) 対話行為推定方法、対話行為推定装置およびプログラム
CN109726819B (zh) 一种实现事件推理的方法及装置
ElSalamouny et al. An analysis of the exponential decay principle in probabilistic trust models
Paek et al. Evaluating the Markov assumption in Markov Decision Processes for spoken dialogue management
US20060100874A1 (en) Method for inducing a Hidden Markov Model with a similarity metric
Svensson et al. Utilizing reinforcement learning for de novo drug design
JP6910002B2 (ja) 対話行為推定方法、対話行為推定装置及びプログラム
Simmons-Edler et al. Program synthesis through reinforcement learning guided tree search
Kaplan et al. Efficient subjective Bayesian network belief propagation for trees
Chinaei et al. An inverse reinforcement learning algorithm for partially observable domains with application on healthcare dialogue management
CN111400479A (zh) 针对多轮对话的问题识别方法和装置
Fink et al. Hidden markov models
Mozes et al. Speeding up HMM decoding and training by exploiting sequence repetitions
Sato et al. Improved sampling using loopy belief propagation for probabilistic model building genetic programming
Tang et al. Log-linear dialog manager

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180220

R150 Certificate of patent or registration of utility model

Ref document number: 6297144

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250