CN105830058B - 对话管理器 - Google Patents

对话管理器 Download PDF

Info

Publication number
CN105830058B
CN105830058B CN201480068215.5A CN201480068215A CN105830058B CN 105830058 B CN105830058 B CN 105830058B CN 201480068215 A CN201480068215 A CN 201480068215A CN 105830058 B CN105830058 B CN 105830058B
Authority
CN
China
Prior art keywords
dialog manager
previous
user
dialog
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480068215.5A
Other languages
English (en)
Other versions
CN105830058A (zh
Inventor
渡部晋治
H·唐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Corp
Original Assignee
Mitsubishi Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Corp filed Critical Mitsubishi Corp
Publication of CN105830058A publication Critical patent/CN105830058A/zh
Application granted granted Critical
Publication of CN105830058B publication Critical patent/CN105830058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

一种对话管理器,该对话管理器接收先前的用户动作以及先前的观察和当前的观察。假设先前的用户状态和当前的用户状态、先前的用户动作、当前的用户动作、未来***动作和未来观察。隐藏用户状态、用户动作和用户观察。基于用户状态、***动作、用户动作和观察来提取特征矢量。使用所述特征矢量,基于对数线性模型来确定每个当前的动作的期望报酬。然后,输出具有最佳期望报酬的当前动作。

Description

对话管理器
技术领域
本发明总体上涉及文本和语音处理,并且更具体地涉及对话管理器。
背景技术
对话管理器是利用口头的或者文本的对话来完成某些任务的***。对话在用户和***之间轮流交替。对话可以包括用户动作和***动作的序列。用户动作对***隐藏。***根据观察来确定用户动作。用户具有同样对***隐藏的变化状态。***基于用户语音或文本鉴于先前的***动作和观察使用规划来确定下一个***动作。下面描述所述规划。
对话管理器可以是基于规则的,或使用统计框架(例如,部分可观察马尔可夫决策过程(POMDP))。在POMDP对话***中,由一组随机变量表示对话。在每轮,对话包括表示用户说了什么的观察变量、表示到目前为止对话的进程的隐藏状态变量以及所选择的***动作。POMDP模型定义了两个概率相关性:考虑到先前状态和***动作的当前状态的条件概率;以及考虑到当前状态和先前***动作的观察的条件概率。
报酬函数针对每轮指定适合性标准(fitness criterion)作为该轮的状态和所选择的动作的函数。给定回报函数,能够确定提供考虑到在当前时刻对状态分布的了解的最佳***动作的策略。然后,该策略可以被用于在对话过程中生成***动作。选择***动作以便使报酬变得最大被称为规划。
为了拥有工作***(working system),需要估计定义POMDP中的概率的模型参数。该估计被称为学习。通常使用最大似然(ML)准则而不是使用报酬函数来估计这些参数。例如,可以使用最大似然动态贝叶斯网络(DBN)。这些方法的主要问题在于使用不同的准则分别且单独地对规划和学习进行优化。另外,规划和学习是众所周知困难的优化问题,因为推理在大到足以处理实际问题的变量空间中变得棘手。
发明内容
本发明的实施方式提供基于统计对话框架的文本和口头对话***。与传统方法中使用的生成式模型相比,本发明基于对数线性模型框架使用判别式模型来表示***动作、观察以及其它信息之间的关系。然后,考虑到先前的观察和***动作,对话管理器通过使用置信传播(BP)过程直接优化期望报酬来输出适当的***动作。
由于本发明使用对数线性模型,在对话期间获得的各种特征可以被并入该模型中。可以通过使用基于置信传播过程的对话数据来统计训练对数线性模型中的参数以使用精确的***动作来提高性能。
实施方式提供一种具有一致的优化准则的优点并且同时对于优化更有效的相干***。使用对数线性概率分布来建模对话***。因此,本发明提供一种对数线性对话管理器。
由于条件随机字段(CRF)的引入,对数线性分布已经被用于对序列建模。虽然对数线性模型通常无法表示所有的分布族(distribution families),但是它们对特征函数的灵活使用使得模型能够表示概率模型的广泛的族。由于模型是马尔可夫链,因此针对优化可以利用有效的过程。尤其是,实施方式优化沿时间轴的报酬的总和。
为了表示可能状态、用户动作和***动作的空间,使用上下文无关文法(CFG),可能状态、用户动作和***动作中的每一个都是基于与对话***的域相关的语义表征的曲线图。
代替成为简单的多项式,随机变量在由CFG生成的分析树的空间中取值。这提供了能够进行大范围的特征的提取的丰富的结构。由于对数线性模型中固有的对特征的灵活使用,作为特殊情况,这些特征可以被设计成使得对话***表现得与基于传统规则的对话***完全一样。这是通过将对话***的规则实现为指示函数特征并初始化参数以使得对数线性概率分布对应于这些规则来完成的。
附图说明
[图1]
图1是根据本发明的实施方式的对话管理器的规划部分的流程图。
[图2]
图2是根据本发明的实施方式的对话管理器的学习部分的流程图。
[图3]
图3是根据本发明的实施方式的示例性分析树。
[图4]
图4是根据本发明的实施方式的示例性状态的分析树。
[图5]
图5是用于图4的分析树的示例性产生式规则的框图。
具体实施方式
规划
如图1和图2所示,我们的发明的实施方式提供一种对数线性对话管理器。该***包括规划部分100和学习部分200。如现有技术已知的,可以在通过总线连接至存储器和输入/输出接口的处理器150和250中执行用于这两个部分的方法。可以将处理器150和250组合。
***模型
我们的概率模型在每个时间步长t具有四个变量。两个变量是可观察变量:***动作at 102和观察ot 101。另外两个变量是被推导出的两个潜变量:用户动作ut 201和状态st
对话的每个步骤如下进行。基于直到时刻t-1的所有先前的***动作和先前的观察,***利用询问at-1提示用户。由ot表示用户的响应。在一个实施方式中,ot是由用户说出的词的序列。然而,应当理解,响应可以是键入的文本,或者响应可以通过其它手段进入***。
响应的含义由用户动作ut来表示,用户动作可以根据观察来推断。可以基于***动作at-1和用户动作ut以及先前状态st-1来推断新的状态st。在我们的***中,状态st表示用户的意图,虽然通常其也可以包括附加的上下文信息。
使用下标冒号来表示序列,例如,s0:T≡{s0,s1,…,sT},由四个变量序列s0:T、a0:T、o1:T、u1:T表示持续时间T的对话会话。
图3示出了如由因子图表示的用于对话会话的模型,针对我们的对数线性模型,该因子图与所述变量的以下联合概率分布相对应。
其中,Zθ是归一化常数,是特征函数的矢量,并且θf和θg分别是相应模型参数的矢量。
在时刻t=T,st+1和ut+1是未定义的,所以如因子图的因子fT中所示。在时刻t=T,我们将定义为仅其前两个输入的函数。为了简化符号,我们也定义了下面的矢量:
其使我们能够将等式(1)更简洁地重写为
其中,
是p(s0:T,a0:T,u1:T,o1:T)的配分函数。
变量空间
我们让S、U、A和O分别表示变量空间(即,针对变量st、ut、at和ot的所有可能的值的集合)。每个观察o∈O可以是波形、声学特征、所识别的文本、和/或语言特征。我们使用o∈O来表示输入序列,并且我们将变量空间O定义为词汇组V中的词的所有序列的集合。
我们使用包括一组产生式规则的上下文无关文法(CFG)来定义变量空间S、U、和A中的每一个变量空间。每个变量空间都被定义为可以由其CFG生成的所有可能的分析树的集合。
图5示出了定义变量空间S的CFG中的产生式规则中的一些。S中的每个分析树都是状态st的可能值。图5示出了针对状态st的一个可能值,该值是使用图4中的黑体字所示的产生式规则生成的S中的一个分析树。在图4中,在引号中括起了末端(terminal),而非末端(non-terminal)没有用引号括起。变量$ADDRESS$可以利用其它产生式规则进一步扩展或者作为自由变量保留。
特征值
如在图3中的因子图以及等式(1)中可见,在我们的模型中存在两种类型的因子。表示为f的第一类型因子对先前和当前状态、***动作和用户动作之间的统计依赖关系进行建模。表示为g的第二类型因子对观察到的词序列与它们的语义解释之间的依赖关系进行建模。对于使用CFG定义其空间的变量,我们将每个变量值(每个分析树)看作一组活跃的产生式规则。例如,图5的分析树中活跃的产生式规则在图4的产生式规则中以黑体字示出。
假设GS、GU和GA分别是为S(状态)、U(用户动作)和A(***动作)定义变量空间的CFG中的产生式规则的集合。对于因子g,我们将用户动作中的每个产生式规则与用于相关联的词序列的语言模型相关联。具体地,考虑到用户动作ut和观察ot,我们拥有形式的特征值,其表示指示函数,当且仅当特定产生式规则k∈GU在用户动作ut的分析树中是活跃的并且特定的双字母组wi-1wi存在于观察ot的词序列中时,该指示函数等于1。
靠近树的根出现的用于产生式规则的语言模型对一般类型的话语进行建模,而靠近树的叶出现的产生式规则更加专门化。对于因子f,我们可以考虑协同出现的产生式规则。例如,涉及两种特定的产生式规则k,k′∈GS的特征当且仅当k在状态st-1中是活跃的并且k′在状态st中是活跃的时等于1。通常在对话***中可见的特征类型的另一种类型是其也需要产生式规则j∈GA在***动作at-1中是活跃的。该特征表示特定的***动作趋向于引起特定的状态转换。
规划和学习
对话管理器需要解决的两个基本问题是规划100和学习200。我们假设存在评估我们的模型的报酬函数r:S×A→R+。我们现在就报酬函数来描述规划和学习。
规划
在时刻τ的规划是考虑到所有先前的***动作a0:τ-1和观察o1:τ来确定最佳***动作aτ的问题。假设对话具有持续时间T。我们将规划问题定义为确定aτ以最大化期望报酬E作为目标函数
期望值是在未给出所有变量(即,所有状态、所有用户动作以及所有未来***动作和观察)的情况下获取的。
可以通过假设每个动作aτ、鉴于使用和-积过程的动作确定期望的报酬、以及选择最大化的期望报酬的动作来精确地优化目标函数。
然而,为了便于实现与迅速起见,我们取而代之地优化从詹森(Jensen)的不等式获得的目标函数的变分下界(objective’s variational lower bound)
其中,γt是变分参数,使得∑tγt=1。虽然可以使用期望最大化(EM)过程优化γt,但是我们采用γt=1/(T+1)来进一步简化计算。
该乘积形式具有所述报酬随时间因式分解的优良的性能。换言之,等式(6)可以被扩展为
其中,Z′是具有给定的a0:τ-1、o1:τ的p的配分函数。现在,可以通过具有用于报酬的附加项的图解模型上的传统的和-积过程来确定最佳的aτ
首先,我们采集从图解模型的两端到时间τ的信度(belief),并且确定使等式(6)最大化的aτ。如果我们明确地写出置信传播,则其将变成向前-向后过程。例如,从因子节点ft到变量节点st+1的向前消息通过以下使用时间t到t+1的(非归一化)概率分布对消息的求和来确定:
这里,是从变量节点at到因子节点ft的消息。我们可以使用任何分布,包括其中我们不假设at的任何先验分布的均匀分布。是从变量节点st到因子节点ft的消息。从先前的步骤递归地来确定。
从变量节点ut+1到因子节点ft的消息为该消息从如下分布被确定为
因此,我们避免对序列求和来确定消息也可以有效地确定其它消息而无需基于置信传播方法计算序列的总和。
注意,使用和-积过程对特征动作进行平均化不同于寻求最大化未来***动作的报酬的传统的POMDP优化。在对其它变量使用和-积的同时,也可以对at使用最大积过程,以实现对未来***动作的最大化。然而,模型本身包含提供对未来动作的预测分布的随机策略。
学习
学习部分200类似于规划,区别在于不确定最佳动作,我们对确定最佳模型参数更感兴趣。换言之,我们期望找到θ103使得看到所有的***动作a0:T和所有的观察o1:T而使期望报酬最大化
此外,对未给定的所有变量(即,所有状态和所有用户动作)取期望值。类似于规划部分,这里我们也可以使用等式(8)的变分下界。
我们使用梯度下降来优化学习目标。通常,对于任何效用函数v(x)和基于对数线性模型的形式的概率分布
期望效用的导数为:
注意,对于θ中的每个参数θi,该导数是相应特征φi与效用之间的协方差。因此,当与效用负相关的这些相应特征减少时,对应于与效用明确相关的特征的参数增加。
将该规律应用于我们的模型给出:
其中,使用p(s0:T,u1:T|a0:T,o1:T)确定期望值。在一般情况下,可能难以确定这些量。我们使用粒子置信传播。
粒子置信传播
由于变量空间太大而被边缘化(marginalize),所以我们使用粒子置信传播来解决该问题。
通过边缘化st、at和ut+1,考虑从因子节点ft传递到变量节点st+1的消息
如果我们利用重要性采样重写总和,则针对通过其确定期望值的一些采样分布πt(a)、πt(u)、πt(s),我们获得
然后,我们可以利用对样本求和
来近似期望值。

Claims (13)

1.一种对话管理器,所述对话管理器具有执行以下步骤的处理器:
接收先前的***动作以及先前的观察结果和当前的观察结果;
根据先前的观察结果和当前的观察结果,推测当前的用户动作,根据先前的***动作、当前的用户动作以及先前的用户状态,推测当前的用户状态;
基于所述先前的用户状态和所述当前的用户状态、所述先前的***动作、先前的用户动作和所述当前的用户动作、以及所述先前的观察结果和所述当前的观察结果来提取特征量;
将使用报酬函数而规定的期望报酬作为目标函数,其中所述报酬函数用于评估并入了所述特征量的对数线性模型;根据所有先前的***动作以及所有观察结果求出将所述期望报酬最大化的***动作。
2.根据权利要求1所述的对话管理器,其中,表示所述对数线性模型的概率的概率模型在每个时间步长t具有四个变量,所述四个变量包括两个可观察变量和两个潜变量,所述两个可观察变量包括***动作at和观察结果Ot,并且所述两个潜变量包括用户动作ut和用户状态St
3.根据权利要求2所述的对话管理器,其中,由四个变量序列s0:T、a0:T、o1:T、u1:T表示持续时间T的对话会话,使用下标冒号表示序列,
S0:T≡{S0,S1,…,ST}
a0:T≡{a0,a1,…,aT}
O1:T≡{o1,O2,…,OT}
u1:T≡{u1,u2,…,uT};
其中,S0,S1,...,ST表示从0到所述持续时间T的多个用户状态;a0,...,aT表示从0到所述持续时间T的多个***动作;O1,...,OT表示从1到所述持续时间T的多个观察结果;u1,...,uT表示从1到所述持续时间T的多个用户动作。
4.根据权利要求3所述的对话管理器,其中,所述对话会话由因子图表示,所述因子图与联合概率分布
相对应,其中,Zθ是归一化常数,是所述特征量,并且θf和θg分别是相应模型参数的矢量。
5.根据权利要求1所述的对话管理器,其中,所述先前的观察结果和所述当前的观察结果是口述词语或文本。
6.根据权利要求3所述的对话管理器,其中,S、U、A和O分别表示变量空间,所述变量空间是针对所述变量st、ut、at和ot的所有可能的值的集合。
7.根据权利要求6所述的对话管理器,所述对话管理器还通过所述处理器执行以下步骤:
使用包括一组产生式规则的上下文无关文法来定义所述变量空间S、U和A。
8.根据权利要求7所述的对话管理器,其中,每个变量空间都被定义为能够由所述上下文无关文法生成的所有可能的分析树的集合。
9.根据权利要求3所述的对话管理器,其中,所述对话管理器的规划部分根据所有先前的***动作a0:τ-1和先前的观察结果o1:τ,确定最佳***动作aτ
10.根据权利要求3所述的对话管理器,所述对话管理器还通过所述处理器执行以下步骤:
使目标函数
最大化以使用报酬函数r(st,at)确定所述期望报酬。
11.根据权利要求10所述的对话管理器,所述对话管理器还通过所述处理器执行以下步骤:
优化所述目标函数上的变分下界。
12.根据权利要求10所述的对话管理器,其中,使用梯度下降来优化所述目标函数。
13.根据权利要求10所述的对话管理器,其中,使用粒子置信传播来优化所述目标函数。
CN201480068215.5A 2013-12-16 2014-11-21 对话管理器 Active CN105830058B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/106,968 2013-12-16
US14/106,968 US9311430B2 (en) 2013-12-16 2013-12-16 Log-linear dialog manager that determines expected rewards and uses hidden states and actions
PCT/JP2014/081666 WO2015093263A1 (en) 2013-12-16 2014-11-21 Dialog manager

Publications (2)

Publication Number Publication Date
CN105830058A CN105830058A (zh) 2016-08-03
CN105830058B true CN105830058B (zh) 2019-11-22

Family

ID=52023593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480068215.5A Active CN105830058B (zh) 2013-12-16 2014-11-21 对话管理器

Country Status (5)

Country Link
US (1) US9311430B2 (zh)
JP (1) JP6297144B2 (zh)
CN (1) CN105830058B (zh)
DE (1) DE112014005715T5 (zh)
WO (1) WO2015093263A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10831802B2 (en) * 2016-04-11 2020-11-10 Facebook, Inc. Techniques to respond to user requests using natural-language machine learning based on example conversations
GB2559408B (en) * 2017-02-06 2020-07-08 Toshiba Kk A spoken dialogue system, a spoken dialogue method and a method of adapting a spoken dialogue system
GB2559618B (en) * 2017-02-13 2020-07-08 Toshiba Kk A dialogue system, a dialogue method and a method of adapting a dialogue system
US10424302B2 (en) * 2017-10-12 2019-09-24 Google Llc Turn-based reinforcement learning for dialog management
CN108182942B (zh) * 2017-12-28 2021-11-26 瑞芯微电子股份有限公司 一种支持不同虚拟角色交互的方法和装置
JP7005016B2 (ja) 2018-11-15 2022-01-21 株式会社スノウチ エンドタブ

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1150490A (zh) * 1995-03-29 1997-05-21 摩托罗拉公司 优化隐藏的马尔科夫模型语音识别的方法、装置和无线电设备
CN1855224A (zh) * 2005-04-05 2006-11-01 索尼株式会社 信息处理装置、信息处理方法及程序
CN101398914A (zh) * 2008-11-10 2009-04-01 南京大学 基于点的部分可观察马尔可夫决策过程的预处理方法
CN103366733A (zh) * 2012-03-30 2013-10-23 株式会社东芝 文本到语音的***

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139446A (ja) * 2002-10-18 2004-05-13 Inst Of Physical & Chemical Res 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法
US8793119B2 (en) 2009-07-13 2014-07-29 At&T Intellectual Property I, L.P. System and method for generating manually designed and automatically optimized spoken dialog systems
US8433578B2 (en) 2009-11-30 2013-04-30 At&T Intellectual Property I, L.P. System and method for automatically generating a dialog manager
US8457968B2 (en) 2009-12-08 2013-06-04 At&T Intellectual Property I, L.P. System and method for efficient tracking of multiple dialog states with incremental recombination
US8484077B2 (en) * 2010-07-21 2013-07-09 Yahoo! Inc. Using linear and log-linear model combinations for estimating probabilities of events
WO2012030838A1 (en) 2010-08-30 2012-03-08 Honda Motor Co., Ltd. Belief tracking and action selection in spoken dialog systems
US9582592B2 (en) * 2011-12-20 2017-02-28 Bitly, Inc. Systems and methods for generating a recommended list of URLs by aggregating a plurality of enumerated lists of URLs, the recommended list of URLs identifying URLs accessed by users that also accessed a submitted URL
US20130325483A1 (en) * 2012-05-29 2013-12-05 GM Global Technology Operations LLC Dialogue models for vehicle occupants
US20150025931A1 (en) * 2013-07-18 2015-01-22 International Business Machines Corporation Business opportunity forecasting

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1150490A (zh) * 1995-03-29 1997-05-21 摩托罗拉公司 优化隐藏的马尔科夫模型语音识别的方法、装置和无线电设备
CN1855224A (zh) * 2005-04-05 2006-11-01 索尼株式会社 信息处理装置、信息处理方法及程序
CN101398914A (zh) * 2008-11-10 2009-04-01 南京大学 基于点的部分可观察马尔可夫决策过程的预处理方法
CN103366733A (zh) * 2012-03-30 2013-10-23 株式会社东芝 文本到语音的***

Also Published As

Publication number Publication date
US20150169553A1 (en) 2015-06-18
JP6297144B2 (ja) 2018-03-20
DE112014005715T5 (de) 2016-09-22
US9311430B2 (en) 2016-04-12
CN105830058A (zh) 2016-08-03
WO2015093263A1 (en) 2015-06-25
JP2016535297A (ja) 2016-11-10

Similar Documents

Publication Publication Date Title
CN105830058B (zh) 对话管理器
Serban et al. A hierarchical latent variable encoder-decoder model for generating dialogues
JP6444530B2 (ja) 音声言語理解システム
JP6228260B2 (ja) 音声対話システムのためのデバイスおよび方法
Thomson et al. Bayesian update of dialogue state: A POMDP framework for spoken dialogue systems
Williams et al. Scaling up POMDPs for Dialog Management: The``Summary POMDP''Method
JP2017228160A (ja) 対話行為推定方法、対話行為推定装置及びプログラム
Kouemou et al. History and theoretical basics of hidden Markov models
JP6884946B2 (ja) 音響モデルの学習装置及びそのためのコンピュータプログラム
JP6823809B2 (ja) 対話行為推定方法、対話行為推定装置およびプログラム
Lee et al. POMDP-based Let's Go system for spoken dialog challenge
CN116306686A (zh) 一种多情绪指导的共情对话生成方法
Kadlec et al. Knowledge-based dialog state tracking
US6173076B1 (en) Speech recognition pattern adaptation system using tree scheme
US8700400B2 (en) Subspace speech adaptation
US20060100874A1 (en) Method for inducing a Hidden Markov Model with a similarity metric
JP6910002B2 (ja) 対話行為推定方法、対話行為推定装置及びプログラム
Rosti Linear Gaussian models for speech recognition
Chinaei et al. An inverse reinforcement learning algorithm for partially observable domains with application on healthcare dialogue management
JP4950600B2 (ja) 音響モデル作成装置、その装置を用いた音声認識装置、これらの方法、これらのプログラム、およびこれらの記録媒体
JP2004117503A (ja) 音声認識用音響モデル作成方法、その装置、そのプログラムおよびその記録媒体、上記音響モデルを用いる音声認識装置
Fink et al. Hidden markov models
Kohlschein An introduction to hidden Markov models
Yin et al. Context-uncertainty-aware chatbot action selection via parameterized auxiliary reinforcement learning
Tang et al. Log-linear dialog manager

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant