CN110609618A - 一种人机对话方法、装置、计算机设备及存储介质 - Google Patents

一种人机对话方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110609618A
CN110609618A CN201910792348.1A CN201910792348A CN110609618A CN 110609618 A CN110609618 A CN 110609618A CN 201910792348 A CN201910792348 A CN 201910792348A CN 110609618 A CN110609618 A CN 110609618A
Authority
CN
China
Prior art keywords
information
dialogue
natural language
intention
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910792348.1A
Other languages
English (en)
Other versions
CN110609618B (zh
Inventor
徐金梦
操玉琴
金建良
吴林强
许琮浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Zhongyun Data Technology Co Ltd
Huzhou Big Data Operation Co Ltd
Hangzhou City Big Data Operation Co Ltd
Original Assignee
Hangzhou Zhongyun Data Technology Co Ltd
Huzhou Big Data Operation Co Ltd
Hangzhou City Big Data Operation Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Zhongyun Data Technology Co Ltd, Huzhou Big Data Operation Co Ltd, Hangzhou City Big Data Operation Co Ltd filed Critical Hangzhou Zhongyun Data Technology Co Ltd
Priority to CN201910792348.1A priority Critical patent/CN110609618B/zh
Publication of CN110609618A publication Critical patent/CN110609618A/zh
Application granted granted Critical
Publication of CN110609618B publication Critical patent/CN110609618B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明适用于计算机技术领域,提供了一种人机对话方法、装置、计算机设备及存储介质,所述人机对话方法包括:获取对话信息;对所述对话信息分别进行专业领域识别处理以及意图识别处理;分别对不同意图类型的对话信息采用不同的模型进行处理,获取更新后的对话状态;根据更新后的对话状态生成对应的对话动作;根据所述对话动作生成自然语言并输出。本发明提供的人机对话方法能够先对对话信息进行专业领域识别处理,提高了对话信息意图的识别准确率,同时采用预先基于强化学习训练生成的对话动作生成模型,有效地提高了***的鲁棒性。

Description

一种人机对话方法、装置、计算机设备及存储介质
专业领域
本发明属于计算机技术领域,尤其涉及一种人机对话方法、装置、计算机设备及存储介质。
背景技术
近些年来,随着人工智能技术的迅猛发展,人机交互领域有了巨大的进步。而人机对话***是人机交互中十分重要的一个子领域,在虚拟个人助手应用中扮演着非常重要的角色。其主要的功能是通过对用户自然语言的理解,帮助用户完成某项特定的任务,比如预定电影票等。
现有的人机交互对话***一般包含较为复杂的模块化流程,包含如领域识别、意图识别、槽填充、对话状态追踪模块、策略学习在内等诸多的子模块。虽然每种子模块都有着不俗的表现,但是各个模块之间存在着极强的耦合性,互相依赖,互相影响,导致把各个子模块组合到一起时,整个人机交互对话***会出现鲁棒性差的问题。
可见,现有的人机交互对话***还存在着各模块互相依赖、互相影响而导致鲁棒性差的问题。
发明内容
本发明实施例的目的在于提供一种人机对话方法,旨在解决现有的人机交互对话***还存在的因各模块互相依赖、互相影响而导致鲁棒性差的技术问题。
本发明实施例是这样实现的,一种人机对话方法,所述人机对话方法包括:
获取用户输入的对话信息;
对所述对话信息进行专业领域识别处理,获取所述对话信息的专业领域;
根据所述对话信息的专业领域采用预设的与所述专业领域对应的意图识别模型对所述对话信息进行意图识别处理,获取所述对话信息的意图类型;
对意图类型为询问的对话信息采用预设的询问模型进行处理,获取更新后的对话状态;
对意图类型为通知的对话信息识别所述对话信息中的槽信息,并获取更新后的对话状态;
根据所述更新后的对话状态,采用预先基于强化学习训练生成的对话动作生成模型,生成与所述更新后的对话状态所对应的对话动作;
根据所述对话动作生成自然语言并输出。
本发明实施例的另一目的在于提供一种人机对话装置,所述人机对话装置包括:
对话信息获取单元,用于获取用户输入的对话信息;
专业领域识别单元,用于对所述对话信息进行专业领域识别处理,获取所述对话信息的专业领域;
意图类型识别单元,用于根据所述对话信息的专业领域采用预设的与所述专业领域对应的意图识别模型对所述对话信息进行意图识别处理,获取所述对话信息的意图类型;
询问意图处理单元,用于对意图类型为询问的对话信息采用预设的询问模型进行处理,获取更新后的对话状态;
通知意图处理单元,用于对意图类型为通知的对话信息识别所述对话信息中的槽信息,并获取更新后的对话状态;
对话动作生成单元,用于根据所述更新后的对话状态,采用预先基于强化学习训练生成的对话动作生成模型,生成与所述更新后的对话状态所对应的对话动作;
自然语言生成单元,用于根据所述对话动作生成自然语言并输出。
本发明实施例的另一目的在于提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述所述人机对话方法的步骤。
本发明实施例的另一目的在于提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述所述人机对话方法的步骤。
本发明实施例提供的一种人机对话方法,在获取用户输入的对话信息后,分别对所述对话信息进行专业领域识别处理和意图类型识别处理,能够将对话信息定位到具体的专业领域中,并获知对话信息的意图类型,针对于不同的意图类型不同的模型进行处理,获取到更新后的对话状态后,根据对话状态生成相应的对话动作,并转化为自然语言进行输出。本发明实施例提供的一种人机对话方法,能够先对对话信息进行专业领域识别处理,对不同的专业领域的对话信息分别采用对应的专业领域的模型进行识别,提高了对话信息意图的识别准确率,另一方面,进一步采用预先基于强化学习训练生成的对话动作生成模型,通过强化学习,有效地提高了***的鲁棒性。
附图说明
图1为本发明实施例提供的人机对话方法的步骤流程图;
图2为本发明实施例提供的一种对意图类型为询问的对话信息进行处理的步骤流程图;
图3为本发明实施例提供的一种生成自然语言的方法的步骤流程图;
图4为本发明实施例提供的一种人机对话装置的结构示意图;
图5为本发明实施例提供的一种对话信息获取单元的结构示意图;
图6为本发明实施例提供的一种询问意图处理单元的结构示意图;
图7为本发明实施例提供的一种自然语言生成单元的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
图1为本发明实施例提供的人机对话方法的步骤流程图,具体包括以下步骤:
步骤S102,获取用户输入的对话信息。
在本发明实施例中,所述获取的用户输入的对话信息可以是用户直接输入的文本格式的对话信息,也可以是利用语音识别模型识别用户输入的语音格式的对话信息,并处理为文本格式的对话信息。相比于现有的人机对话方法,可以直接使用文本格式的对话信息对***模型进行端到端的训练。
步骤S104,对所述对话信息进行专业领域识别处理,获取所述对话信息的专业领域。
步骤S106,根据所述对话信息的专业领域采用预设的与所述专业领域对应的意图识别模型对所述对话信息进行意图识别处理,获取所述对话信息的意图类型。
在本发明实施例中,通过先对对话信息进行专业领域识别处理,在获取到所述对话信息的专业领域后,能够将对话信息定位到相应的与所述所述专业领域对应的意图识别模型中进行处理,有效地提高了对对话信息意图识别的准确率。
在本发明实施例中,所述意图类型主要包括询问以及通知。
步骤S108,对意图类型为询问的对话信息采用预设的询问模型进行处理,获取更新后的对话状态。
在本发明实施例中,所述对意图类型为询问的对话信息采用预设的询问模型进行处理的步骤具体请参阅图2及其解释说明部分。
步骤S110,对意图类型为通知的对话信息识别所述对话信息中的槽信息,并获取更新后的对话状态。
在本发明实施例中,所述槽信息是指机器在理解并执行用户的要求时,所必需的信息,以用户想要打车为例,则出发地、目的地以及准备出发的时间就属于机器在执行叫车服务的槽信息。
在本发明实施例中,当意图类型为通知时,识别所述对话信息中的槽信息后并进行填充,然后基于填充之后的槽信息更新对话状态。例如,当机器在执行叫车服务时,当前的对话状态为缺失目的地以及准备出发的时间两个槽信息,在获取到用户新输入的对话信息为下午三点时,识别出下午三点为准备出发的时间,并将对话状态更新为缺失目的地槽信息。
步骤S112,根据所述更新后的对话状态,采用预先基于强化学习训练生成的对话动作生成模型,生成与所述更新后的对话状态所对应的对话动作。
在本发明实施例中,根据当前的对话状态,就能够预先基于强化学习训练生成的对话动作生成模型生成与所述更新后的对话状态所对应的对话动作。例如,当当前对话状态为缺失目的地槽信息,生成的对话动作即为获取所述目的地槽信息。
步骤S114,根据所述对话动作生成自然语言并输出。
本发明实施例提供的一种人机对话方法,在获取用户输入的对话信息后,分别对所述对话信息进行专业领域识别处理和意图类型识别处理,能够将对话信息定位到具体的专业领域中,并获知对话信息的意图类型,针对于不同的意图类型不同的模型进行处理,获取到更新后的对话状态后,根据对话状态生成相应的对话动作,并转化为自然语言进行输出。本发明实施例提供的一种人机对话方法,能够先对对话信息进行专业领域识别处理,对不同的专业领域的对话信息分别采用对应的专业领域的模型进行识别,提高了对话信息意图的识别准确率,另一方面,进一步采用预先基于强化学习训练生成的对话动作生成模型,通过强化学习,有效地提高了***的鲁棒性。
图2为本发明实施例提供的一种对意图类型为询问的对话信息进行处理的步骤流程图,具体包括以下步骤:
步骤S202,判断所述对话信息中是否含有槽信息。当判断所述对话信息中含有槽信息时,执行步骤S204;当判断所述对话信息中不含有槽信息时,执行步骤S206。
步骤S204,获取与所述槽信息相关的信息,并根据所述与所述槽信息相关的信息更新对话状态。
步骤S206,更新对话状态。
图3为本发明实施例提供的一种生成自然语言的方法的步骤流程图,具体包括以下步骤:
步骤S302,基于预先按照指定规则所设定好的第一自然语言生成模型生成自然语言并输出。
步骤S304,当基于预先按照指定规则所设定好的第一自然语言生成模型无法生成自然语言时,基于预先按照神经网络算法训练生成的第二自然语言生成模型生成自然语言并输出。
在本发明实施例中,基于预先按照指定规则所设定好的第一自然语言生成模型能够较快的生成自然语言,但是适用范围较小,而基于预先按照神经网络算法训练生成的第二自然语言生成模型适用范围较广,但是生成自然语言的效率低。当基于预先按照指定规则所设定好的第一自然语言生成模型无法生成自然语言时,基于预先按照神经网络算法训练生成的第二自然语言生成模型生成自然语言,可以在保证高效率生成自然语言的同时,也能提高***的鲁棒性。
图4为本发明实施例提供的一种人机对话装置的结构示意图,详述如下。
在本发明实施例中,所述人机对话装置具体包括:
对话信息获取单元410,用于获取用户输入的对话信息。
在本发明实施例中,所述获取的用户输入的对话信息可以是用户直接输入的文本格式的对话信息,也可以是利用语音识别模型识别用户输入的语音格式的对话信息,并处理为文本格式的对话信息。相比于现有的人机对话方法,可以直接使用文本格式的对话信息对***模型进行端到端的训练。
在本发明实施例中,所述对话信息获取单元的结构示意图具体请参阅图5及其解释说明。
专业领域识别单元420,用于对所述对话信息进行专业领域识别处理,获取所述对话信息的专业领域。
意图类型识别单元430,用于根据所述对话信息的专业领域采用预设的与所述专业领域对应的意图识别模型对所述对话信息进行意图识别处理,获取所述对话信息的意图类型。
在本发明实施例中,通过先对对话信息进行专业领域识别处理,在获取到所述对话信息的专业领域后,能够将对话信息定位到相应的与所述所述专业领域对应的意图识别模型中进行处理,有效地提高了对对话信息意图识别的准确率。
询问意图处理单元440,用于对意图类型为询问的对话信息采用预设的询问模型进行处理,获取更新后的对话状态。
在本发明实施例中,所述询问意图处理单元的结构示意图请参阅图6及其解释说明。
通知意图处理单元450,用于对意图类型为通知的对话信息识别所述对话信息中的槽信息,并获取更新后的对话状态。
在本发明实施例中,所述槽信息是指机器在理解并执行用户的要求时,所必需的信息,以用户想要打车为例,则出发地、目的地以及准备出发的时间就属于机器在执行叫车服务的槽信息。
在本发明实施例中,当意图类型为通知时,识别所述对话信息中的槽信息后并进行填充,然后基于填充之后的槽信息更新对话状态。例如,当机器在执行叫车服务时,当前的对话状态为缺失目的地以及准备出发的时间两个槽信息,在获取到用户新输入的对话信息为下午三点时,识别出下午三点为准备出发的时间,并将对话状态更新为缺失目的地槽信息。
对话动作生成单元460,用于根据所述更新后的对话状态,采用预先基于强化学习训练生成的对话动作生成模型,生成与所述更新后的对话状态所对应的对话动作。
在本发明实施例中,根据当前的对话状态,就能够预先基于强化学习训练生成的对话动作生成模型生成与所述更新后的对话状态所对应的对话动作。例如,当当前对话状态为缺失目的地槽信息,生成的对话动作即为获取所述目的地槽信息。
自然语言生成单元470,用于根据所述对话动作生成自然语言并输出。
本发明实施例提供的一种人机对话装置,在获取用户输入的对话信息后,分别对所述对话信息进行专业领域识别处理和意图类型识别处理,能够将对话信息定位到具体的专业领域中,并获知对话信息的意图类型,针对于不同的意图类型不同的模型进行处理,获取到更新后的对话状态后,根据对话状态生成相应的对话动作,并转化为自然语言进行输出。本发明实施例提供的一种人机对话装置,能够先对对话信息进行专业领域识别处理,对不同的专业领域的对话信息分别采用对应的专业领域的模型进行识别,提高了对话信息意图的识别准确率,另一方面,进一步采用预先基于强化学习训练生成的对话动作生成模型,通过强化学习,有效地提高了***的鲁棒性。
图5为本发明实施例提供的一种对话信息获取单元的结构示意图,详述如下。
在本发明实施例中,所述对话信息获取单元具体包括:
文本格式对话信息获取模块510,用于获取用户输入的文本格式的对话信息。
语音格式对话信息处理模块520,用于利用语音识别模型识别用户输入的语音格式的对话信息并处理为文本格式的对话信息。
在本发明实施例中,相比于现有的人机对话方法,可以直接使用文本格式的对话信息对***模型进行端到端的训练。
图6为本发明实施例提供的一种询问意图处理单元的结构示意图,详述如下。
在本发明实施例中,所述询问意图处理单元具体包括:
槽信息判断模块610,用于判断所述对话信息中是否含有槽信息。
槽信息处理模块620,用于当判断所述对话信息中含有槽信息时,获取与所述槽信息相关的信息,并根据所述与所述槽信息相关的信息更新对话状态。
非槽信息处理模块630,用于当判断所述对话信息中不含有槽信息时,更新对话状态。
图7为本发明实施例提供的一种自然语言生成单元的结构示意图,详述如下。
在本发明实施例中,所述自然语言生成单元具体包括:
指定规则自然语言生成模块710,用于基于预先按照指定规则所设定好的第一自然语言生成模型生成自然语言并输出。
神经网络自然语言生成模块720,用于当基于预先按照指定规则所设定好的第一自然语言生成模型无法生成自然语言时,基于预先按照神经网络算法训练生成的第二自然语言生成模型生成自然语言并输出。
在本发明实施例中,基于预先按照指定规则所设定好的第一自然语言生成模型能够较快的生成自然语言,但是适用范围较小,而基于预先按照神经网络算法训练生成的第二自然语言生成模型适用范围较广,但是生成自然语言的效率低。当基于预先按照指定规则所设定好的第一自然语言生成模型无法生成自然语言时,基于预先按照神经网络算法训练生成的第二自然语言生成模型生成自然语言,可以在保证高效率生成自然语言的同时,也能提高***的鲁棒性。
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取用户输入的对话信息;
对所述对话信息进行专业领域识别处理,获取所述对话信息的专业领域;
根据所述对话信息的专业领域采用预设的与所述专业领域对应的意图识别模型对所述对话信息进行意图识别处理,获取所述对话信息的意图类型;
对意图类型为询问的对话信息采用预设的询问模型进行处理,获取更新后的对话状态;
对意图类型为通知的对话信息识别所述对话信息中的槽信息,并获取更新后的对话状态;
根据所述更新后的对话状态,采用预先基于强化学习训练生成的对话动作生成模型,生成与所述更新后的对话状态所对应的对话动作;
根据所述对话动作生成自然语言并输出。
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取用户输入的对话信息;
对所述对话信息进行专业领域识别处理,获取所述对话信息的专业领域;
根据所述对话信息的专业领域采用预设的与所述专业领域对应的意图识别模型对所述对话信息进行意图识别处理,获取所述对话信息的意图类型;
对意图类型为询问的对话信息采用预设的询问模型进行处理,获取更新后的对话状态;
对意图类型为通知的对话信息识别所述对话信息中的槽信息,并获取更新后的对话状态;
根据所述更新后的对话状态,采用预先基于强化学习训练生成的对话动作生成模型,生成与所述更新后的对话状态所对应的对话动作;
根据所述对话动作生成自然语言并输出。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种人机对话方法,其特征在于,所述人机对话方法包括:
获取用户输入的对话信息;
对所述对话信息进行专业领域识别处理,获取所述对话信息的专业领域;
根据所述对话信息的专业领域采用预设的与所述专业领域对应的意图识别模型对所述对话信息进行意图识别处理,获取所述对话信息的意图类型;
对意图类型为询问的对话信息采用预设的询问模型进行处理,获取更新后的对话状态;
对意图类型为通知的对话信息识别所述对话信息中的槽信息,并获取更新后的对话状态;
根据所述更新后的对话状态,采用预先基于强化学习训练生成的对话动作生成模型,生成与所述更新后的对话状态所对应的对话动作;
根据所述对话动作生成自然语言并输出。
2.根据权利要求1所述的人机对话方法,其特征在于,所述获取用户输入的对话信息的步骤具体为:
获取用户输入的文本格式的对话信息;或
利用语音识别模型识别用户输入的语音格式的对话信息,并处理为文本格式的对话信息。
3.根据权利要求1所述的人机对话方法,其特征在于,所述对意图类型为询问的对话信息采用预设的询问模型进行处理,获取更新后的对话状态的步骤具体包括:
判断所述对话信息中是否含有槽信息;
当判断所述对话信息中含有槽信息时,获取与所述槽信息相关的信息,并根据所述与所述槽信息相关的信息更新对话状态;
当判断所述对话信息中不含有槽信息时,更新对话状态。
4.根据权利要求1所述的人机对话方法,其特征在于,所述根据所述对话动作生成自然语言并输出的步骤具体包括:
基于预先按照指定规则所设定好的第一自然语言生成模型生成自然语言并输出;
当基于预先按照指定规则所设定好的第一自然语言生成模型无法生成自然语言时,基于预先按照神经网络算法训练生成的第二自然语言生成模型生成自然语言并输出。
5.一种人机对话装置,其特征在于,所述人机对话装置包括:
对话信息获取单元,用于获取用户输入的对话信息;
专业领域识别单元,用于对所述对话信息进行专业领域识别处理,获取所述对话信息的专业领域;
意图类型识别单元,用于根据所述对话信息的专业领域采用预设的与所述专业领域对应的意图识别模型对所述对话信息进行意图识别处理,获取所述对话信息的意图类型;
询问意图处理单元,用于对意图类型为询问的对话信息采用预设的询问模型进行处理,获取更新后的对话状态;
通知意图处理单元,用于对意图类型为通知的对话信息识别所述对话信息中的槽信息,并获取更新后的对话状态;
对话动作生成单元,用于根据所述更新后的对话状态,采用预先基于强化学习训练生成的对话动作生成模型,生成与所述更新后的对话状态所对应的对话动作;
自然语言生成单元,用于根据所述对话动作生成自然语言并输出。
6.根据权利要求5所述的人机对话装置,其特征在于,所述对话信息获取单元具体包括:
文本格式对话信息获取模块,用于获取用户输入的文本格式的对话信息;
语音格式对话信息处理模块,用于利用语音识别模型识别用户输入的语音格式的对话信息并处理为文本格式的对话信息。
7.根据权利要求5所述的人机对话装置,其特征在于,所述询问意图处理单元具体包括:
槽信息判断模块,用于判断所述对话信息中是否含有槽信息;
槽信息处理模块,用于当判断所述对话信息中含有槽信息时,获取与所述槽信息相关的信息,并根据所述与所述槽信息相关的信息更新对话状态;
非槽信息处理模块,用于当判断所述对话信息中不含有槽信息时,更新对话状态。
8.根据权利要求5所述的人机对话装置,其特征在于,所述自然语言生成单元包括:
指定规则自然语言生成模块,用于基于预先按照指定规则所设定好的第一自然语言生成模型生成自然语言并输出;
神经网络自然语言生成模块,用于当基于预先按照指定规则所设定好的第一自然语言生成模型无法生成自然语言时,基于预先按照神经网络算法训练生成的第二自然语言生成模型生成自然语言并输出。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至4中任一项权利要求所述人机对话方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至4中任一项权利要求所述人机对话方法的步骤。
CN201910792348.1A 2019-08-26 2019-08-26 一种人机对话方法、装置、计算机设备及存储介质 Active CN110609618B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910792348.1A CN110609618B (zh) 2019-08-26 2019-08-26 一种人机对话方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910792348.1A CN110609618B (zh) 2019-08-26 2019-08-26 一种人机对话方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110609618A true CN110609618A (zh) 2019-12-24
CN110609618B CN110609618B (zh) 2023-06-20

Family

ID=68890562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910792348.1A Active CN110609618B (zh) 2019-08-26 2019-08-26 一种人机对话方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110609618B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114490968A (zh) * 2021-12-29 2022-05-13 北京百度网讯科技有限公司 对话状态跟踪方法、模型训练方法、装置以及电子设备
JP2022071170A (ja) * 2021-06-30 2022-05-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 対話状態の生成方法、装置、電子機器及び記憶媒体
CN115129878A (zh) * 2022-08-31 2022-09-30 支付宝(杭州)信息技术有限公司 一种对话业务执行方法、装置、存储介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150179170A1 (en) * 2013-12-20 2015-06-25 Microsoft Corporation Discriminative Policy Training for Dialog Systems
CN106407333A (zh) * 2016-09-05 2017-02-15 北京百度网讯科技有限公司 基于人工智能的口语查询识别方法及装置
CN109739965A (zh) * 2018-12-29 2019-05-10 深圳前海微众银行股份有限公司 跨领域对话策略的迁移方法及装置、设备、可读存储介质
CN109815326A (zh) * 2019-01-24 2019-05-28 网易(杭州)网络有限公司 对话控制方法及装置
CN109829044A (zh) * 2018-12-28 2019-05-31 北京百度网讯科技有限公司 对话方法、装置及设备
CN110008325A (zh) * 2019-03-29 2019-07-12 海南中智信信息技术有限公司 一种基于商用对话***的口语语言理解及改写方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150179170A1 (en) * 2013-12-20 2015-06-25 Microsoft Corporation Discriminative Policy Training for Dialog Systems
CN106407333A (zh) * 2016-09-05 2017-02-15 北京百度网讯科技有限公司 基于人工智能的口语查询识别方法及装置
CN109829044A (zh) * 2018-12-28 2019-05-31 北京百度网讯科技有限公司 对话方法、装置及设备
CN109739965A (zh) * 2018-12-29 2019-05-10 深圳前海微众银行股份有限公司 跨领域对话策略的迁移方法及装置、设备、可读存储介质
CN109815326A (zh) * 2019-01-24 2019-05-28 网易(杭州)网络有限公司 对话控制方法及装置
CN110008325A (zh) * 2019-03-29 2019-07-12 海南中智信信息技术有限公司 一种基于商用对话***的口语语言理解及改写方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022071170A (ja) * 2021-06-30 2022-05-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 対話状態の生成方法、装置、電子機器及び記憶媒体
CN114490968A (zh) * 2021-12-29 2022-05-13 北京百度网讯科技有限公司 对话状态跟踪方法、模型训练方法、装置以及电子设备
CN115129878A (zh) * 2022-08-31 2022-09-30 支付宝(杭州)信息技术有限公司 一种对话业务执行方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN110609618B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
CN109766534B (zh) 报表生成方法、装置、计算机设备及可读存储介质
US9953639B2 (en) Voice recognition system and construction method thereof
CN110609618A (zh) 一种人机对话方法、装置、计算机设备及存储介质
CN108038544B (zh) 基于大数据和深度学习的神经网络深度学习方法和***
CN110750267A (zh) 业务信息更新方法、装置、计算机设备和存储介质
CN109308305B (zh) 监测数据的查询方法、装置和计算机设备
CN110347810B (zh) 对话式检索回答方法、装置、计算机设备及存储介质
CN110689881A (zh) 语音识别方法、装置、计算机设备和存储介质
CN111191032A (zh) 语料扩充方法、装置、计算机设备和存储介质
CN113961768B (zh) 敏感词检测方法、装置、计算机设备和存储介质
CN113506575B (zh) 流式语音识别的处理方法、装置和计算机设备
CN111597818A (zh) 呼叫质检方法、装置、计算机设备和计算机可读存储介质
CN111124898B (zh) 问答***测试方法、装置、计算机设备和存储介质
CN111831920A (zh) 用户需求分析方法、装置、计算机设备及存储介质
CN111400340A (zh) 一种自然语言处理方法、装置、计算机设备和存储介质
CN115098062A (zh) 一种代码生成方法及装置
CN112507010B (zh) 业务数据处理方法、装置、计算机设备和存储介质
CN109344385B (zh) 自然语言处理方法、装置、计算机设备和存储介质
CN111353027A (zh) 聊天机器人中的答案反馈方法、装置、计算机设备和介质
CN112016297B (zh) 意图识别模型测试方法、装置、计算机设备和存储介质
CN109410069A (zh) 结算数据处理方法、装置、计算机设备和存储介质
CN114238715A (zh) 基于社会救助的问答***、构建方法、计算机设备及介质
CN112435657B (zh) 语音识别方法、装置、计算机设备及存储介质
CN113220859A (zh) 基于图像的问答方法、装置、计算机设备及存储介质
CN111552785A (zh) 人机交互***数据库更新方法、装置、计算机设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant