CN110795548A - 智能问答方法、装置及计算机可读存储介质 - Google Patents
智能问答方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110795548A CN110795548A CN201911029339.3A CN201911029339A CN110795548A CN 110795548 A CN110795548 A CN 110795548A CN 201911029339 A CN201911029339 A CN 201911029339A CN 110795548 A CN110795548 A CN 110795548A
- Authority
- CN
- China
- Prior art keywords
- question
- target
- user
- answer
- answering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Artificial Intelligence (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明揭露了一种智能问答方法,包括:获取用户的目标问题,从问答库中进行问题匹配;匹配成功时输出对应答案给用户;匹配不成功时对目标问题进行相似问题检索得到相似问题集;将目标问题与相似问题集进行语义相似度匹配,选取相似度最高的相似问题作为目标问题的标准问题;当目标问题不进入多轮问答模式时,输出标准问题的文本答案给用户;当目标问题进入多轮问答模式时,根据预设方式输出目标问题的文本答案。本发明还提供一种装置以及计算机可读存储介质。利用本发明,无需通过大量语料训练即可实现提升问答过程中答***度。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的智能问答方法、装置及计算机可读存储介质。
背景技术
现有的智能问答***通常通过如下两种方法实现智能问答:1、匹配用户问题的关键字词进行问题答案的搜索;2、对用户问题和标准问题实现语义相似度计算,返回相似度最高的标准问题所对应的答案。
其中,所述关键字词匹配的方法往往只能挖掘问题的字面意思,适用于输入的问题比较精准的情形。通常,用户的问题复杂多样,质量相对较差,利用关键字词匹配的方法难以匹配到正确的标准问题和答案。所述语义相似度计算要求利用大量问答语料训练Bi-LSTM等深度神经网络模型,该模型构建较为复杂且需要大量的问答语料数量,训练数据不多的时候容易导致模型得不到有效的训练,最终的相似性度量结果准确性会比较低。
发明内容
本发明提供一种智能问答方法、装置及计算机可读存储介质,其主要目的在于提供一种智能化的智能问答的技术方案,其不需要通过大量语料训练模型就可以实现对用户输入的问题进行分析,得到标准问题,从而根据所述标准问题得到用户想要的答案。
为实现上述目的,本发明提供的一种智能问答方法,包括:
获取用户的目标问题,根据所述目标问题到预先构建的问答库中进行问题匹配操作;
当所述匹配成功时,从所述问答库中选择跟所述目标问题匹配的问题对应的答案输出给所述用户;
当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集;
将所述目标问题与所述相似问题集进行语义相似度匹配,选取语义相似度最高的相似问题作为所述目标问题的标准问题;
获取所述目标问题的类型,并根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式;
当所述目标问题不进入多轮问答模式时,从所述问答库中获取所述标准问题的文本答案作为所述目标问题的文本答案返回给所述用户;
当所述目标问题进入多轮问答模式时,根据预设的多轮问答方式输出所述目标问题的文本答案,从而完成所述目标问题的问答操作。
可选地,在所述获取用户的目标问题之前,该方法还包括:
接收用户输入的原始问题,采用预设的联想规则,对所述原始问题进行拓展操作,生成预设数量的联想问题,得到联想问题集;
将所述联想问题集输出给所述用户,并将所述用户从所述联想问题集中选择的联想问题作为所述目标问题;或
当采用所述预设的联想规则不能生成联想问题,或用户没有在预设时间内从所述联想问题集中选择其中一个联想问题时,将所述用户输入的原始问题作为所述目标问题。
可选地,所述预设的联想规则包括:前缀匹配法规则、中间匹配法规则、顺序匹配法规则以及乱序匹配法规则。
可选地,所述目标问题与所述相似问题集的语义相似度匹配是通过预先训练完成的深度学习模型执行的;
其中,所述深度学习模型具体训练实施步骤包括:
利用爬虫技术搜索得到保险的相关问题集,将用户的提问问题集和所述保险的相关问题集作为训练集;
将与用户的提问问题相似度高的保险的相关问题设置标签为1,将与用户的提问问题相似度低的保险的相关问题设置标签为0,得到标签集;
通过所述训练集和标签集对所述深度学习模型进行不断的更新,直至所述深度学习模型趋于收敛时完成训练,从而得到所述训练完成的深度学习模型。
可选地,所述预设的多轮问答模式包括:
将所述用户的目标问题拆分成多个子问题,根据用户的需求选取所述多个子问题中的一个子问题作为目标子问题,从所述问答库中获取所述目标子问题的文本答案;
若所述文本答案满足用户的需求,直接输出所述文本答案;
若所述目标子问题的文本答案无法满足所述用户的需求,对所述目标子问题进行重新拆分,直至从所述问答库获取的文本答案满足用户的需求。
此外,为实现上述目的,本发明还提供一种智能问答装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的智能问答程序,所述智能问答程序被所述处理器执行时实现如下步骤:
获取用户的目标问题,根据所述目标问题到预先构建的问答库中进行问题匹配操作;
当所述匹配成功时,从所述问答库中选择跟所述目标问题匹配的问题对应的答案输出给所述用户;
当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集;
将所述目标问题与所述相似问题集进行语义相似度匹配,选取语义相似度最高的相似问题作为所述目标问题的标准问题;
获取所述目标问题的类型,并根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式;
当所述目标问题不进入多轮问答模式时,从所述问答库中获取所述标准问题的文本答案作为所述目标问题的文本答案返回给所述用户;
当所述目标问题进入多轮问答模式时,根据预设的多轮问答方式输出所述目标问题的文本答案,从而完成所述目标问题的问答操作。
可选地,在所述获取用户的目标问题之前,该方法还包括:
接收用户输入的原始问题,采用预设的联想规则,对所述原始问题进行拓展操作,生成预设数量的联想问题,得到联想问题集;
将所述联想问题集输出给所述用户,并将所述用户从所述联想问题集中选择的联想问题作为所述目标问题;或
当采用所述预设的联想规则不能生成联想问题,或用户没有在预设时间内从所述联想问题集中选择其中一个联想问题时,将所述用户输入的原始问题作为所述目标问题。
可选地,所述预设的联想规则包括:前缀匹配法规则、中间匹配法规则、顺序匹配法规则以及乱序匹配法规则。
可选地,所述预设的多轮问答模式包括:
将所述用户的目标问题拆分成多个子问题,根据用户的需求选取所述多个子问题中的一个子问题作为目标子问题,从所述问答库中获取所述目标子问题的文本答案;
若所述文本答案满足用户的需求,直接输出所述文本答案;
若所述目标子问题的文本答案无法满足所述用户的需求,对所述目标子问题进行重新拆分,直至从所述问答库获取的文本答案满足用户的需求。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有智能问答程序,所述智能问答程序可被一个或者多个处理器执行,以实现如上所述的智能问答方法的步骤。
本发明提出的智能问答方法、装置及计算机可读存储介质,在用户在进行智能问答时,获取用户的目标问题,将所述目标问题与预先构建的问答库进行精确匹配,当匹配成功时,输出对应的匹配问题的答案给所述用户,当匹配不成功时,对所述目标问题进行模糊匹配,执行相似问题检索,得到相似问题集,选取所述相似问题集中与所述目标问题相似度最高的相似问题作为标准问题,从而根据所述标准问题得到所述用户想要的答案,进一步地,本发明还可以通过多轮问答模式输出用户所需要的答案。
附图说明
图1为本发明一实施例提供的智能问答方法的流程示意图;
图2为本发明一实施例提供的智能问答装置的内部结构示意图;
图3为本发明一实施例提供的智能问答装置中智能问答程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种智能问答方法。参照图1所示,为本发明一实施例提供的智能问答方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,智能问答方法包括:
S1、获取用户的目标问题,根据所述目标问题到预先构建的问答库中进行问题匹配操作,当所述匹配成功时,从所述问答库中选择跟所述目标问题匹配的问题对应的答案输出给所述用户,当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集。
优先地,在获取所述用户的目标问题之前,本发明较佳实施例还包括:接收用户输入的原始问题,采用预设的联想规则,对所述原始问题进行拓展操作,生成预设数量的联想问题,得到联想问题集;将所述联想问题集输出给所述用户,并将所述用户从所述联想问题集中选择的联想问题作为所述目标问题;或当采用所述预设的联想规则不能生成联想问题,及用户没有在预设时间内从所述联想问题集中选择其中一个联想问题时,将所述用户输入的原始问题作为所述目标问题。
进一步地,本发明所述预设的联想规则包括:前缀匹配法规则、中间匹配法规则、顺序匹配法规则以及乱序匹配法规则。例如,当用户输入的原始问题为“如何购买”时,所述前缀匹配法是将所述“如何购买”作为前缀进行拓展操作,得到的拓展问题可以为“如何购买保险”;所述中间匹配法是将所述“如何购买”作为中间值进行拓展操作,得到的拓展问题可以为“我该如何购买保险”;所述顺序匹配法首先基于分词和去停用词对用户输入的原始问题“如何购买”进行处理,得到分词“如何”、“购买”后,按照顺序对所述得到的分词进行拓展操作,得到的拓展问题可以为“我如何才能购买保险”;所述乱序匹配法首先基于分词和去停用词对用户输入的原始问题“如何购买”进行处理,得到分词“如何”、“购买”后,对所述得到的分词打乱顺序进行拓展操作,得到的拓展问题可以为“我想购买保险,如何买”。
根据所述预设的联想规则,可以生成预设数量的联想问题,得到联想问题集,本发明实施例将所述用户从所述联想问题集中选择的联想问题作为所述目标问题;当采用所述预设的联想规则不能生成联想问题,或者用户没有在预设时间内从所述联想问题集中选择其中一个联想问题时,本发明实施例将所述用户输入的原始问题作为所述目标问题。
进一步地,本发明根据所述用户的目标问题到预先构建的问答库中进行问题匹配操作;当所述匹配成功时,从所述问答库中选择匹配的问题对应的答案输出给所述用户;当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集。
例如,所述目标问题可以为有关保险的相关问题,其包括:保险该如何购买、保险的分类以及保险购买的流程等,此时,所述预先构建的问答库为保险数据库。较佳地,本发明较佳实施例利用全字符匹配算法对所述目标问题与所述保险数据库中已经存在的问题进行进行匹配操作。
进一步地,当所述匹配不成功时,本发明利用同义词检索方法对所述目标问题进行相似问题检索,得到相似问题集。其中,本发明较佳实施例通过预设的搜索引擎对所述目标问题进行同义词检索。较佳地,本发明所述预设的搜索引擎为ElasticSearch(ES),所述ES提供了一个分布式多用户能力的全文搜索引擎。详细地,本发明从哈工大词典以及Hownet词典中筛选目标同义词语集,将所述目标同义词语集加载至所述目标问题后向所述ES进行检索,得到所述相似问题集。本发明所述目标同义词语集可以为保险相关的词语集,例如保险名词、疾病名词、常见的职业名词等。例如,对所述目标问题为“小儿可以买保险吗”进行同义词检索时,加入所述同义词语集,返回结果包括“小孩儿可以买保险吗”“小孩儿能够买保险吗”等。
S2、将所述目标问题与所述相似问题集进行语义相似度匹配,选取语义相似度最高的相似问题作为所述目标问题的标准问题。
本发明较佳实施例中通过预先训练好的深度学习模型对所述目标问题与所述相似问题集进行语义相似度匹配,并选取语义相似度最高的相似问题作为所述目标问题的标准问题。其中,所述深度学习模型具体训练实施步骤包括:利用爬虫技术搜索得到保险的相关问题集,将用户的提问问题集和所述保险的相关问题集作为训练集;将与用户的提问问题相似度高的保险的相关问题设置标签为1,将与用户的提问问题相似度低的保险的相关问题设置标签为0,得到标签集;通过所述训练集和标签集对所述深度学习模型进行不断的更新,直至所述深度学习模型趋于收敛时完成训练,从而得到所述训练完成的深度学习模型。
较佳地,本发明通过爬虫技术获取约46万条的通用保险数据,不断进行训练6万个步骤。
进一步地,本发明中根据上述训练好的深度学习模型获取得到所述目标问题对应的相似问题集的候选集列表,例如候选集列表的问题数为5个,分别计算所述目标问题与候选集列表中每个问题的相似度得分,选取相似度得分最高的相似问题作为所述目标问题的标准问题,于是,所述标准问题的文本答案即为所述目标问题的文本答案。
S3、获取所述目标问题的类型,并根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式。
由于保险问答等***涉及到多种多样的业务场景,存在一些目标问题的意图较难通过单轮问答表述清楚,因此,需要执行多轮问答。本发明根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式。
本发明较佳实施例中,所述预先构建的问答库中的所有问题都标记有类型信息,且每种类型信息都映射到一个问答模式,即单轮问答模式或者多轮问答模式,其中,所述多轮问答模式用于对单轮问答较难表述清楚的所述目标问题进行多轮问答后输出对应的文本答案,提高了用户的使用体验。
S4、当所述目标问题不进入所述多轮问答模式时,从所述问答库中获取所述标准问题的文本答案作为所述目标问题的文本答案返回给所述用户。
S5、当所述目标问题进入所述多轮问答模式时,根据预设的多轮问答方式输出所述目标问题的文本答案,从而完成所述原始问题文本的问答操作。
较佳地,本发明中所述预设的多轮问答方式包括:对所述用户的目标问题进行拆分多个子问题,根据用户的需求选取所述多个子问题中的一个子问题作为目标子问题,从所述问答库中获取所述目标子问题的文本答案,若所述文本答案满足用户的需求,直接输出所述文本答案,若所述目标子问题的文本答案无法满足所述用户的需求,对所述目标子问题进行重新拆分,直至从所述问答库获取的文本答案满足用户的需求。
例如,所述目标问题为:"怎么退保",根据该目标问题的类型,识别出进入多轮问答模式。在多轮问答模式中,本发明将所述目标问题拆分成多个子问题,如将所述目标问题“怎么退保”拆分为:问题1“占用太多预算,无力承担保费”;问题2“保险购买错误,想换成其他类型保险”;问题3“当前保险保额较低,想换成高额保险”;问题4“当前购买的保险已经过时,想更换为其他保险”;问题5“以上问题都不是”。本发明根据用户的需求选取所述多个子问题中的一个子问题作为目标子问题,从所述问答库中获取所述目标子问题的文本答案。
本发明还提供一种智能问答装置。参照图2所示,为本发明一实施例提供的智能问答装置的内部结构示意图。
在本实施例中,所述智能问答装置1可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。该智能问答装置1至少包括存储器11、处理器12,通信总线13,以及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是智能问答装置1的内部存储单元,例如该智能问答装置1的硬盘。存储器11在另一些实施例中也可以是智能问答装置1的外部存储设备,例如智能问答装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括智能问答装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于智能问答装置1的应用软件及各类数据,例如智能问答程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行智能问答程序01等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置1与其他电子设备之间建立通信连接。
可选地,该装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在智能问答装置1中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-14以及智能问答程序01的智能问答装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对智能问答装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的装置1实施例中,存储器11中存储有智能问答程序01;处理器12执行存储器11中存储的智能问答程序01时实现如下步骤:
步骤一、获取用户的目标问题,根据所述目标问题到预先构建的问答库中进行问题匹配操作,当所述匹配成功时,从所述问答库中选择跟所述目标问题匹配的问题对应的答案输出给所述用户,当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集。
优先地,在获取所述用户的目标问题之前,本发明较佳实施例还包括:接收用户输入的原始问题,采用预设的联想规则,对所述原始问题进行拓展操作,生成预设数量的联想问题,得到联想问题集;将所述联想问题集输出给所述用户,并将所述用户从所述联想问题集中选择的联想问题作为所述目标问题;或当采用所述预设的联想规则不能生成联想问题,及用户没有在预设时间内从所述联想问题集中选择其中一个联想问题时,将所述用户输入的原始问题作为所述目标问题。
进一步地,本发明中所述预设的联想规则包括:前缀匹配法规则、中间匹配法规则、顺序匹配法规则以及乱序匹配法规则。例如,当用户输入的原始问题为“如何购买”时,所述前缀匹配法是将所述“如何购买”作为前缀进行拓展操作,得到的拓展问题可以为“如何购买保险”;所述中间匹配法是将所述“如何购买”作为中间值进行拓展操作,得到的拓展问题可以为“我该如何购买保险”;所述顺序匹配法首先基于分词和去停用词对用户输入的原始问题“如何购买”进行处理,得到分词“如何”、“购买”后,按照顺序对所述得到的分词进行拓展操作,得到的拓展问题可以为“我如何才能购买保险”;所述乱序匹配法首先基于分词和去停用词对用户输入的原始问题“如何购买”进行处理,得到分词“如何”、“购买”后,对所述得到的分词打乱顺序进行拓展操作,得到的拓展问题可以为“我想购买保险,如何买”。
根据所述预设的联想规则,可以生成预设数量的联想问题,得到联想问题集,本发明实施例将所述用户从所述联想问题集中选择的联想问题作为所述目标问题;当采用所述预设的联想规则不能生成联想问题,或者用户没有在预设时间内从所述联想问题集中选择其中一个联想问题时,本发明实施例将所述用户输入的原始问题作为所述目标问题。
进一步地,本发明根据所述用户的目标问题到预先构建的问答库中进行问题匹配操作;当所述匹配成功时,从所述问答库中选择匹配的问题对应的答案输出给所述用户;当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集。
例如,所述目标问题可以为有关保险的相关问题,其包括:保险该如何购买、保险的分类以及保险购买的流程等,此时,所述预先构建的问答库为保险数据库。较佳地,本发明较佳实施例利用全字符匹配算法对所述目标问题与所述保险数据库中已经存在的问题进行进行匹配操作。
进一步地,当所述匹配不成功时,本发明利用同义词检索方法对所述目标问题进行相似问题检索,得到相似问题集。其中,本发明较佳实施例通过预设的搜索引擎对所述目标问题进行同义词检索。较佳地,本发明所述预设的搜索引擎为ElasticSearch(ES),所述ES提供了一个分布式多用户能力的全文搜索引擎。详细地,本发明从哈工大词典以及Hownet词典中筛选目标同义词语集,将所述目标同义词语集加载至所述目标问题后向所述ES进行检索,得到所述相似问题集。本发明所述目标同义词语集可以为保险相关的词语集,例如保险名词、疾病名词、常见的职业名词等。例如,对所述目标问题为“小儿可以买保险吗”进行同义词检索时,加入所述同义词语集,返回结果包括“小孩儿可以买保险吗”“小孩儿能够买保险吗”等。
步骤二、将所述目标问题与所述相似问题集进行语义相似度匹配,选取语义相似度最高的相似问题作为所述目标问题的标准问题。
本发明较佳实施例中通过预先训练好的深度学习模型对所述目标问题与所述相似问题集进行语义相似度匹配,并选取语义相似度最高的相似问题作为所述目标问题的标准问题。其中,所述深度学习模型具体训练实施步骤包括:
利用爬虫技术搜索得到保险的相关问题集,将用户的提问问题集和所述保险的相关问题集作为训练集;将与用户的提问问题相似度高的保险的相关问题设置标签为1,将与用户的提问问题相似度低的保险的相关问题设置标签为0,得到标签集;通过所述训练集和标签集对所述深度学习模型进行不断的更新,直至所述深度学习模型趋于收敛时完成训练,从而得到所述训练完成的深度学习模型。
较佳地,本发明通过爬虫技术获取约46万条的通用保险数据,不断进行训练6万个步骤。
进一步地,本发明中根据上述训练好的深度学习模型获取得到所述目标问题对应的相似问题集的候选集列表,例如候选集列表的问题数为5个,分别计算所述目标问题与候选集列表中每个问题的相似度得分,选取相似度得分最高的相似问题作为所述目标问题的标准问题,于是,所述标准问题的文本答案即为所述目标问题的文本答案。
步骤三、获取所述目标问题的类型,并根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式。
由于保险问答等***涉及到多种多样的业务场景,存在一些目标问题的意图较难通过单轮问答表述清楚,因此,需要执行多轮问答。本发明根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式。
本发明较佳实施例中,所述预先构建的问答库中的所有问题都标记有类型信息,且每种类型信息都映射到一个问答模式,即单轮问答模式或者多轮问答模式,其中,所述多轮问答模式用于对单轮问答较难表述清楚的所述目标问题进行多轮问答后输出对应的文本答案,提高了用户的使用体验。
步骤四、当所述目标问题不进入所述多轮问答模式时,从所述问答库中获取所述标准问题的文本答案作为所述目标问题的文本答案返回给所述用户。
步骤五、当所述目标问题进入所述多轮问答模式时,根据预设的多轮问答方式输出所述目标问题的文本答案,从而完成所述原始问题文本的问答操作。
较佳地,本发明中所述预设的多轮问答方式包括:对所述用户的目标问题进行拆分多个子问题,根据用户的需求选取所述多个子问题中的一个子问题作为目标子问题,从所述问答库中获取所述目标子问题的文本答案,若所述文本答案满足用户的需求,直接输出所述文本答案,若所述目标子问题的文本答案无法满足所述用户的需求,对所述目标子问题进行重新拆分,直至从所述问答库获取的文本答案满足用户的需求。
例如,所述目标问题为:"怎么退保?"根据该目标问题的类型,识别出进入多轮问答模式。在多轮问答模式中,本发明将所述目标问题拆分成多个子问题,如将所述目标问题“怎么退保”拆分为:问题1“占用太多预算,无力承担保费”;问题2“保险购买错误,想换成其他类型保险”;问题3“当前保险保额较低,想换成高额保险”;问题4“当前购买的保险已经过时,想更换为其他保险”;问题5“以上问题都不是”。本发明根据用户的需求选取所述多个子问题中的一个子问题作为目标子问题,从所述问答库中获取所述目标子问题的文本答案。
可选地,在其他实施例中,智能问答程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述智能问答程序在智能问答装置中的执行过程。
例如,参照图3所示,为本发明智能问答装置一实施例中的智能问答程序的程序模块示意图,该实施例中,所述智能问答程序可以被分割为匹配模块10、相似度匹配模块20、识别模块30以及输出模块40示例性地:
所述匹配模块10用于:获取用户的目标问题,根据所述目标问题到预先构建的问答库中进行问题匹配操作,当所述匹配成功时,从所述问答库中选择匹配的问题对应的答案输出给所述用户。
所述相似度匹配模块20用于:当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集,将所述目标问题与所述相似问题集进行语义相似度匹配,选取语义相似度最高的相似问题作为所述目标问题的标准问题。
所述识别模块30用于:获取所述目标问题的类型,并根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式模式。
所述输出模块40用于:当所述目标问题不进入多轮问答模式时,从所述问答库中获取所述标准问题的文本答案作为所述目标问题的文本答案返回给所述用户;当所述目标问题进入多轮问答模式时,根据预设的多轮问答方式输出所述目标问题的文本答案,从而完成所述目标问题的问答操作。
上述匹配模块10、相似度匹配模块20、识别模块30以及输出模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有智能问答程序,所述智能问答程序可被一个或多个处理器执行,以实现如下操作:
获取用户的目标问题,根据所述目标问题到预先构建的问答库中进行问题匹配操作;
当所述匹配成功时,从所述问答库中选择跟所述目标问题匹配的问题对应的答案输出给所述用户;
当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集;
将所述目标问题与所述相似问题集进行语义相似度匹配,选取语义相似度最高的相似问题作为所述目标问题的标准问题;
获取所述目标问题的类型,并根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式模式;
当所述目标问题不进入多轮问答模式时,从所述问答库中获取所述标准问题的文本答案作为所述目标问题的文本答案返回给所述用户;
当所述目标问题进入多轮问答模式时,根据预设的多轮问答方式输出所述目标问题的文本答案,从而完成所述目标问题的问答操作。
本发明计算机可读存储介质具体实施方式与上述智能问答装置和方法各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种智能问答方法,其特征在于,所述方法包括:
获取用户的目标问题,根据所述目标问题到预先构建的问答库中进行问题匹配操作;
当所述匹配成功时,从所述问答库中选择跟所述目标问题匹配的问题对应的答案输出给所述用户;
当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集;
将所述目标问题与所述相似问题集进行语义相似度匹配,选取语义相似度最高的相似问题作为所述目标问题的标准问题;
获取所述目标问题的类型,并根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式模式;
当所述目标问题不进入多轮问答模式时,从所述问答库中获取所述标准问题的文本答案作为所述目标问题的文本答案返回给所述用户;
当所述目标问题进入多轮问答模式时,根据预设的多轮问答方式输出所述目标问题的文本答案,从而完成所述目标问题的问答操作。
2.如权利要求1所述的智能问答方法,其特征在于,在所述获取用户的目标问题之前,该方法还包括:
接收用户输入的原始问题,采用预设的联想规则,对所述原始问题进行拓展操作,生成预设数量的联想问题,得到联想问题集;
将所述联想问题集输出给所述用户,并将所述用户从所述联想问题集中选择的联想问题作为所述目标问题;或
当采用所述预设的联想规则不能生成联想问题,或用户没有在预设时间内从所述联想问题集中选择其中一个联想问题时,将所述用户输入的原始问题作为所述目标问题。
3.如权利要求2所述的智能问答方法,其特征在于,所述预设的联想规则包括:前缀匹配法规则、中间匹配法规则、顺序匹配法规则以及乱序匹配法规则。
4.如权利要求1所述的智能问答方法,其特征在于,所述目标问题与所述相似问题集的语义相似度匹配是通过预先训练完成的深度学习模型执行的;
其中,所述深度学习模型具体训练实施步骤包括:
利用爬虫技术搜索得到保险的相关问题集,将用户的提问问题集和所述保险的相关问题集作为训练集;
将与用户的提问问题相似度高的保险的相关问题设置标签为1,将与用户的提问问题相似度低的保险的相关问题设置标签为0,得到标签集;
通过所述训练集和标签集对所述深度学习模型进行不断的更新,直至所述深度学习模型趋于收敛时完成训练,从而得到所述训练完成的深度学习模型。
5.如权利要求1至4中任意一项所述的智能问答方法,其特征在于,所述预设的多轮问答模式包括:
将所述用户的目标问题拆分成多个子问题,根据用户的需求选取所述多个子问题中的一个子问题作为目标子问题,从所述问答库中获取所述目标子问题的文本答案;
若所述文本答案满足用户的需求,直接输出所述文本答案;
若所述目标子问题的文本答案无法满足所述用户的需求,对所述目标子问题进行重新拆分,直至从所述问答库获取的文本答案满足用户的需求。
6.一种智能问答装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的智能问答程序,所述智能问答程序被所述处理器执行时实现如下步骤:
获取用户的目标问题,根据所述目标问题到预先构建的问答库中进行问题匹配操作;
当所述匹配成功时,从所述问答库中选择跟所述目标问题匹配的问题对应的答案输出给所述用户;
当所述匹配不成功时,在所述问答库中对所述目标问题进行相似问题检索,得到相似问题集;
将所述目标问题与所述相似问题集进行语义相似度匹配,选取语义相似度最高的相似问题作为所述目标问题的标准问题;
获取所述目标问题的类型,并根据所述目标问题的类型,识别出所述目标问题是否进入预设的多轮问答模式;
当所述目标问题不进入多轮问答模式时,从所述问答库中获取所述标准问题的文本答案作为所述目标问题的文本答案返回给所述用户;
当所述目标问题进入多轮问答模式时,根据预设的多轮问答方式输出所述目标问题的文本答案,从而完成所述目标问题的问答操作。
7.如权利要求6所述的智能问答装置,其特征在于,在所述获取用户的目标问题之前,该方法还包括:
接收用户输入的原始问题,采用预设的联想规则,对所述原始问题进行拓展操作,生成预设数量的联想问题,得到联想问题集;
将所述联想问题集输出给所述用户,并将所述用户从所述联想问题集中选择的联想问题作为所述目标问题;或
当采用所述预设的联想规则不能生成联想问题,或用户没有在预设时间内从所述联想问题集中选择其中一个联想问题时,将所述用户输入的原始问题作为所述目标问题。
8.如权利要求7所述的智能问答装置,其特征在于,所述预设的联想规则包括:前缀匹配法规则、中间匹配法规则、顺序匹配法规则以及乱序匹配法规则。
9.如权利要求6至8中任意一项所述的智能问答装置,其特征在于,所述预设的多轮问答模式包括:
将所述用户的目标问题拆分成多个子问题,根据用户的需求选取所述多个子问题中的一个子问题作为目标子问题,从所述问答库中获取所述目标子问题的文本答案;
若所述文本答案满足用户的需求,直接输出所述文本答案;
若所述目标子问题的文本答案无法满足所述用户的需求,对所述目标子问题进行重新拆分,直至从所述问答库获取的文本答案满足用户的需求。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有智能问答程序,所述智能问答程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的智能问答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911029339.3A CN110795548A (zh) | 2019-10-25 | 2019-10-25 | 智能问答方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911029339.3A CN110795548A (zh) | 2019-10-25 | 2019-10-25 | 智能问答方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110795548A true CN110795548A (zh) | 2020-02-14 |
Family
ID=69441492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911029339.3A Pending CN110795548A (zh) | 2019-10-25 | 2019-10-25 | 智能问答方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110795548A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460816A (zh) * | 2020-03-30 | 2020-07-28 | 招商局金融科技有限公司 | 基于语义特征的数据检索方法、电子装置及存储介质 |
CN111708870A (zh) * | 2020-05-27 | 2020-09-25 | 盛视科技股份有限公司 | 基于深度神经网络的问答方法、装置及存储介质 |
CN111767382A (zh) * | 2020-06-30 | 2020-10-13 | 平安国际智慧城市科技股份有限公司 | 生成反馈信息的方法、装置及终端设备 |
CN112328753A (zh) * | 2020-08-13 | 2021-02-05 | 北京沃东天骏信息技术有限公司 | 问答的处理方法、装置、计算设备及介质 |
CN112732942A (zh) * | 2021-01-16 | 2021-04-30 | 江苏网进科技股份有限公司 | 一种面向用户的多轮问答法律文书实体关系抽取方法 |
CN113159187A (zh) * | 2021-04-23 | 2021-07-23 | 北京金山数字娱乐科技有限公司 | 分类模型训练方法及装置、目标文本确定方法及装置 |
CN113792129A (zh) * | 2021-09-16 | 2021-12-14 | 平安普惠企业管理有限公司 | 一种智能会话方法、装置、计算机设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104991965A (zh) * | 2015-07-23 | 2015-10-21 | 上海智臻网络科技有限公司 | 用于基于标准问创建扩展问的方法和装置 |
CN105677783A (zh) * | 2015-12-31 | 2016-06-15 | 上海智臻智能网络科技股份有限公司 | 智能问答***的信息处理方法及装置 |
CN107256224A (zh) * | 2017-04-28 | 2017-10-17 | 北京神州泰岳软件股份有限公司 | 一种要素知识结构的生成方法,搜索方法,装置及*** |
CN107885844A (zh) * | 2017-11-10 | 2018-04-06 | 南京大学 | 基于分类检索的自动问答方法及*** |
CN108491394A (zh) * | 2018-06-27 | 2018-09-04 | 杭州贝店科技有限公司 | 一种语义分析方法、装置、计算机设备及存储介质 |
CN110019716A (zh) * | 2017-12-15 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 多轮问答方法、终端设备以及存储介质 |
CN110321416A (zh) * | 2019-05-23 | 2019-10-11 | 深圳壹账通智能科技有限公司 | 基于aiml的智能问答方法、装置、计算机设备及存储介质 |
-
2019
- 2019-10-25 CN CN201911029339.3A patent/CN110795548A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104991965A (zh) * | 2015-07-23 | 2015-10-21 | 上海智臻网络科技有限公司 | 用于基于标准问创建扩展问的方法和装置 |
CN105677783A (zh) * | 2015-12-31 | 2016-06-15 | 上海智臻智能网络科技股份有限公司 | 智能问答***的信息处理方法及装置 |
CN107256224A (zh) * | 2017-04-28 | 2017-10-17 | 北京神州泰岳软件股份有限公司 | 一种要素知识结构的生成方法,搜索方法,装置及*** |
CN107885844A (zh) * | 2017-11-10 | 2018-04-06 | 南京大学 | 基于分类检索的自动问答方法及*** |
CN110019716A (zh) * | 2017-12-15 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 多轮问答方法、终端设备以及存储介质 |
CN108491394A (zh) * | 2018-06-27 | 2018-09-04 | 杭州贝店科技有限公司 | 一种语义分析方法、装置、计算机设备及存储介质 |
CN110321416A (zh) * | 2019-05-23 | 2019-10-11 | 深圳壹账通智能科技有限公司 | 基于aiml的智能问答方法、装置、计算机设备及存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460816A (zh) * | 2020-03-30 | 2020-07-28 | 招商局金融科技有限公司 | 基于语义特征的数据检索方法、电子装置及存储介质 |
CN111460816B (zh) * | 2020-03-30 | 2023-03-31 | 招商局金融科技有限公司 | 基于语义特征的数据检索方法、电子装置及存储介质 |
CN111708870A (zh) * | 2020-05-27 | 2020-09-25 | 盛视科技股份有限公司 | 基于深度神经网络的问答方法、装置及存储介质 |
CN111767382A (zh) * | 2020-06-30 | 2020-10-13 | 平安国际智慧城市科技股份有限公司 | 生成反馈信息的方法、装置及终端设备 |
CN112328753A (zh) * | 2020-08-13 | 2021-02-05 | 北京沃东天骏信息技术有限公司 | 问答的处理方法、装置、计算设备及介质 |
CN112732942A (zh) * | 2021-01-16 | 2021-04-30 | 江苏网进科技股份有限公司 | 一种面向用户的多轮问答法律文书实体关系抽取方法 |
CN113159187A (zh) * | 2021-04-23 | 2021-07-23 | 北京金山数字娱乐科技有限公司 | 分类模型训练方法及装置、目标文本确定方法及装置 |
CN113792129A (zh) * | 2021-09-16 | 2021-12-14 | 平安普惠企业管理有限公司 | 一种智能会话方法、装置、计算机设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110795548A (zh) | 智能问答方法、装置及计算机可读存储介质 | |
CN112632385B (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN110502608B (zh) | 基于知识图谱的人机对话方法及人机对话装置 | |
CN110334272B (zh) | 基于知识图谱的智能问答方法、装置及计算机存储介质 | |
CN110442841B (zh) | 识别简历的方法及装置、计算机设备、存储介质 | |
CN110427480B (zh) | 个性化文本智能推荐方法、装置及计算机可读存储介质 | |
US9898464B2 (en) | Information extraction supporting apparatus and method | |
CN113707300B (zh) | 基于人工智能的搜索意图识别方法、装置、设备及介质 | |
CN110866098B (zh) | 基于transformer和lstm的机器阅读方法、装置及可读存储介质 | |
CN112287069B (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
CN110909549A (zh) | 对古汉语进行断句的方法、装置以及存储介质 | |
CN111651570A (zh) | 文本语句处理方法、装置、电子设备以及存储介质 | |
CN113821622B (zh) | 基于人工智能的答案检索方法、装置、电子设备及介质 | |
CN114281957A (zh) | 自然语言数据查询方法、装置、电子设备及存储介质 | |
CN115062134B (zh) | 知识问答模型训练及知识问答方法、装置和计算机设备 | |
CN112182178A (zh) | 智能问答方法、装置、设备及可读存储介质 | |
CN112131881A (zh) | 信息抽取方法及装置、电子设备、存储介质 | |
CN110866042A (zh) | 表格智能查询方法、装置及计算机可读存储介质 | |
CN114492669B (zh) | 关键词推荐模型训练方法、推荐方法和装置、设备、介质 | |
CN110717333B (zh) | 文章摘要自动生成方法、装置及计算机可读存储介质 | |
CN116821373A (zh) | 基于图谱的prompt推荐方法、装置、设备及介质 | |
CN110222144B (zh) | 文本内容提取方法、装置、电子设备及存储介质 | |
CN110765765A (zh) | 基于人工智能的合同关键条款提取方法、装置及存储介质 | |
CN117932022A (zh) | 一种智能问答方法、装置、电子设备及存储介质 | |
US20210056149A1 (en) | Search system, search method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200214 |