CN111708870A - 基于深度神经网络的问答方法、装置及存储介质 - Google Patents

基于深度神经网络的问答方法、装置及存储介质 Download PDF

Info

Publication number
CN111708870A
CN111708870A CN202010460124.3A CN202010460124A CN111708870A CN 111708870 A CN111708870 A CN 111708870A CN 202010460124 A CN202010460124 A CN 202010460124A CN 111708870 A CN111708870 A CN 111708870A
Authority
CN
China
Prior art keywords
preset
question
information
sentences
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010460124.3A
Other languages
English (en)
Inventor
童昌东
苗应亮
张浒
许金金
熊大华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maxvision Technology Corp
Original Assignee
Maxvision Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maxvision Technology Corp filed Critical Maxvision Technology Corp
Priority to CN202010460124.3A priority Critical patent/CN111708870A/zh
Publication of CN111708870A publication Critical patent/CN111708870A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度神经网络的问答方法、装置及存储介质,应用于智能问答设备,所述方法包括:对输入问题进行文本纠错处理得到信息语句;将所述信息语句输入到预设算法库中,输出答复语句,所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法,所述任务型对话算法用于识别所述信息语句中预设类型的任务意图,所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。本发明可解决目前回答准确率低、响应时间长和不能综合处理任务和垂直领域问答的问题。

Description

基于深度神经网络的问答方法、装置及存储介质
技术领域
本发明涉及人工智能,尤其涉及一种基于深度神经网络的问答方法、装置及存储介质。
背景技术
智能问答***为将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型;这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低网站运行成本。基于对网站多年积累的关于政府和企业的基本情况常见问题及其解答,整理为规范的问答库形式,以支撑各种形式问题的智能问答。
然而在当前智能问答***中,普遍存在回答准确率低、响应时间较长等问题。
发明内容
本发明针对现有的回答准确率低、响应时间较长的问题,提供了一种基于深度神经网络的问答方法、装置及存储介质。
本发明就上述技术问题而提出的技术方案如下:
第一方面,本发明提供了一种基于深度神经网络的问答方法,所述方法包括:
对输入问题进行文本纠错处理得到信息语句;
将所述信息语句输入到预设算法库中,输出答复语句,所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法,所述任务型对话算法用于识别所述信息语句中预设类型的任务意图,所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。
根据上述的基于深度神经网络的问答方法,所述方法包括:
所述将所述信息语句输入到预设算法库中,输出答复语句,包括:
利用所述任务型对话算法对所述信息语句进行识别;
若识别出所述信息语句中不包含预设类型的任务意图,则利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别;
若识别出所述信息语句与预设问题库中的语句相似度达预设相似度以上,则输出与相似度达预设相似度以上的语句对应的答复语句。
根据上述的基于深度神经网络的问答方法,所述将所述信息语句输入到预设算法库中,输出答复语句,还包括:
利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别;
若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上,则利用所述任务型对话算法对所述信息语句进行识别;
若识别出所述信息语句包含预设类型的任务意图,则输出与所述预设类型的任务意图匹配的答复语句。
根据上述的基于深度神经网络的问答方法,所述对输入问题进行文本纠错处理得到信息语句包括:
基于预设规则和语言模型对输入问题进行语句预处理以得到符合预设规则的文本字符串;
利用混淆词典库对所述文本字符串进行混淆度计算以确定所述文本字符串中的错误字词;
获取所述错误字词、所述错误字词的位置及错误类型;获取替换所述错误字词的候选词列表;
对利用所述候选词列表中的候选词替换所述错误字词后的语句进行混淆度计算;
输出混淆度最低的语句。
根据上述的基于深度神经网络的问答方法,所述利用所述任务型对话算法对所述信息语句进行识别包括:
利用双向长短时记忆模型和条件随机场模型对所述信息语句进行BIEO编码模式以得到槽位标记列表;
根据所述槽位标记列表确定所述信息语句是否包含预设类型的任务意图,所述预设类型的任务意图至少包括地点查询任务和/或组合任务意图。
根据上述的基于深度神经网络的问答方法,所述利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别包括:
对所述信息语句进行切词处理及去停用词处理得到语料结果;
从预设问题库中召回按相似度高低顺序排列的预设个数的高顺位相似语句,所述预设个数的高顺位相似语句与所述语料结果均具有相似度;
利用预设深度模型获取所述预设个数的高顺位相似语句的深度语义相似度;
根据深度语义相似度和字面相似度对所述预设个数的高顺位相似语句进行重新排列得到按综合相似度高低顺序排列的相似语句;
获取语句相似度达到预设相似度以上的按综合相似度高低顺序排列的相似语句。
根据上述的基于深度神经网络的问答方法,获取最高顺位的按综合相似度高低顺序排列的相似语句。
根据上述的基于深度神经网络的问答方法,所述方法包括:
若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上,则对所述信息语句进行敏感词检测;
若检测出所述信息语句中包含敏感词,则随机输出预设问答结果库中的答复语句。
第二方面,本发明还提供一种基于深度神经网络的问答装置,应用于智能问答设备,所述装置包括:
预处理模块,用于对输入问题进行文本纠错处理得到信息语句;
预处理模块,用于对输入问题进行文本纠错处理得到信息语句;
处理模块,用于将所述信息语句输入到预设算法库中,输出答复语句,所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法,所述任务型对话算法用于识别所述信息语句中预设类型的任务意图,所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。
第三方面,本发明还提供一种基于深度神经网络的问答存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于深度神经网络的问答方法的步骤。
本发明实施例提供的技术方案带来的有益效果是:
本发明提供的基于深度神经网络的问答方法先利用文本纠错算法对用户输入的问题进行处理以得到符合规范的信息语句,其后再利用任务型对话算法和基于深度神经网络的检索型问答算法分别对所述信息语句进行识别,在识别后返回相应的问答结果,以解决目前回答准确率低、响应时间长和不能综合处理任务和垂直领域问答的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于深度神经网络的问答方法在第一实施方式下的流程图;
图2为本发明提供的基于深度神经网络的问答***的纠正流程示意图;
图3为本发明提供的基于深度神经网络的问答***的FAQBot模块流程示意图;
图4为本发明提供的基于深度神经网络的问答方法在第二实施方式下的流程图;
图5为本发明提供的基于深度神经网络的问答方法在第三实施方式下的流程图;
图6为本发明提供的基于深度神经网络的问答***整体模块结构示意图;
图7为本发明提供的基于深度神经网络的问答装置的模块结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
参见图1,为本发明提供的基于深度神经网络的问答方法在第一实施方式下的流程图。本发明提供的基于深度神经网络的问答方法,主要应用于智能问答设备,通过与用户进行问答交互,为用户提供更佳的信息服务,提升用户的问答体验。
步骤S101:对输入问题进行文本纠错处理得到信息语句。
本步骤中,所述输入问题可以为用户输入的文本形式的问题,也可为对用户输入的语音进行转化得到的问题。
结合图2,图2为本发明提供的基于深度神经网络的问答***的纠正流程示意图。在进行文本纠错前,可先对文本进行初步处理以得到规范语句,所述初步处理可以为大小写转换,如可将用户输入的涉及英文字母的问题“IPAD售价是多少”转化为“ipad售价是多少”。此处,所述规范语句为利于进行语句识别的符合自定义规则的语句。
其后,对可能出现的错误进行拼写纠错,所述拼写纠错可基于预设规则和语言模型进行相应处理,具体可包括语句预测处理、错误检测召回处理及纠正排序处理,其中所述语句预测处理可采用正则表达式格式化字符串以得到相应格式的文本,如全角转半角、大写转小写等操作以将语句转换为小写半角文本字符串。所述错误检测召回处理可通过混淆度计算检测语句中疑似错误的字词,获取疑似错误字词及其的位置、错误类型,此外,还获取可替换所述疑似错误字词的候选词列表。所述纠正排序处理为:对候选词列表中的候选词替换相应的疑似错误字词得到的语句,然后对该语句进行排序计算以得到混淆度得分列表,最后返回混淆度最低的语句由此得到纠错文本,也即所述信息语句。
在一具体应用例中,比如输入错误语句“笔记本守家是多少”经过检错会发现在垂直领域汇中“守家”一词在此处可能是错误词,根据混淆词典获得候选词列表['守家','售价','收假','收集'],将候选词依次替换错误词“守家”计算混淆度得分,取让语句混淆度得分最小的候选词“售价”,并替换错词“守家”,便得到最后纠错后的文本:“笔记本售价是多少”。
可以理解的是,还可对输入的问题采用训练正负例方法后再进行数据增强的方式得到相应要求的信息语句。
步骤S102:将所述信息语句输入到预设算法库中,输出答复语句,所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法,所述任务型对话算法用于识别所述信息语句中预设类型的任务意图,所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。
本步骤中,所述预设类型的任务意图至少包括地点查询任务和/或组合任务意图。
利用任务型对话算法对所述信息语句进行识别也即利用任务型对话***(TaskBot***)进行识别。所述任务型对话***的任务模块具体可采用双向长短时记忆模型(Bi-directional Long Short-Term Memory,BiLSTM)和条件随机场模型(ConditionalRandom Fields,CRF)对所述信息语句进行标记并处理,具体地,所述采用所述双向长短是记忆模型和条件随机场模型识别语句中的时间、地点、任务及其命令词,包括对语句进行BIEO编码模式标记处理得到槽位标记列表,其中标签B(begin)表示段的开始,标签I(Intermediate)表示段的中间,标签E(end)表示段的结尾,标签O(other)表示与标记无关的元素。根据所述槽位标记列表可以确定为地点查询任务或组合任务,返回槽位信息和意图。此外,还可分析槽位标记列表并修改其中的错误标记以得到更准确的槽位标记列表。
在一个示例中,如所述信息语句为“三小时后去客厅充电”,则经过模型处理得到槽位标记列表有['B-TIM','I-TIM','E-TIM','O','O','B-LOC','E-LOC','B-ACT','E-ACT']和意图信息为“intentc”组合任务,根据槽位标记列表可以得到时间词为“三小时”、地点词为“客厅”、任务词为“充电”,分析槽位标记列表并修改其中错误标记返回时间词、地点词和任务槽位词,再根据返回的字词获得最终结果:“组合任务|三小时;客厅;充电”,直接返回执行命令并等待下一次文本语句的输入。此处,所述返回执行命令可为预先与相应任务意图建立匹配关系的答复语句。
可以理解的是,若输入的语句为非任务语句,也即输入的语句不能体现用户的任务意图,则经过分析后返回意图槽位为“其他”。如在一个示例中输入的语句为“早上吃什么”,则在识别出意图为“其他”时,也即非预设类型的任务意图时,则将其输出以作为信息语句。
本步骤中,利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别以及利用检索型问答***(FQBot***)进行识别,可具体包括:
1)、对所述信息语句进行切词处理及去停用词处理得到语料结果;
2)、从预设问题库中召回按相似度高低顺序排列的预设个数的高顺位相似语句,所述预设个数的高顺位相似语句与所述语料结果均具有相似度;
3)、利用预设深度模型获取所述预设个数的高顺位相似语句的深度语义相似度;
4)、根据深度语义相似度和字面相似度对所述预设个数的高顺位相似语句进行重新排列得到按综合相似度高低顺序排列的相似语句;
5)、获取语句相似度达到预设相似度以上的按综合相似度高低顺序排列的相似语句。
图3为本发明提供的基于深度神经网络的问答***的FAQBot模块流程示意图。具体可为:
首先,对所述信息语句进行切词并去停用词处理得到语料结果,如输入的语句为“电脑售价是多少”时,经过切词并去停用词处理可得到语料结果为['电脑','售价']。
其次,通过luence从预设问题库中召回出按相似度高低顺序排列的预设个数的高顺位相似语句,如可取排名靠前的K条相似语句(也即与“电脑售价是多少”相类似的问题),此处,召回出排名靠前的K条相似语句的目的包括在提高召回率的基础上获得较高的问答准确率。
再者,对召回的语句进行编码并利用预设深度模型进行重新排序得到深度语义相似度,此处,所述预设深度模型为SimNet模型。之后,再根据深度语义相似度和jcard字面相似度对语句进行重新排列得到所述K条相似语句的按综合相似度高低顺序排列的相似语句,取最高顺位的按综合相似度高低顺序排列的相似语句,则输出该相似语句所对应的问答结果,作为输入的问题的答复。此处,按综合相似度高低顺序排列可通过对相似语句进行计分实现。
在一示例中,如信息语句为“电脑售价是多少”时,经切词和去停用词之后得到列表(也即语料结果):['电脑','售价'],然后进入luence召回得到前K个最相似问题列表:['笔记本电脑的售价是多少','邮寄笔记本的售价是多少','请问笔记本要钱吗','笔记本也要交钱吗','笔记本要卖多少钱','笔记本需要多少钱','笔记本可以免费拿吗','笔记本要不要交钱','这个笔记本要卖多少钱','笔记本邮寄要多少钱'],再根据计算的深度语义相似度和jcard语义相似度得分取得最高相似度得分的句子“笔记本电脑的售价是多少”和最终相似度得分“0.9636”,经比较该得分在预设相似度得分之上,则返回“笔记本电脑的售价是多少”的问答结果作为输入句子“电脑售价是多少”的正确问答结果。
此外,若该语句相似度未达到预设相似度以上的按综合相似度高低顺序排列的相似语句,则进入后续处理。
可以理解的上,所述预设深度模型可在采用LSTM、ABCNN等深度算法对相似语句进行匹配。
本发明提供的基于深度神经网络的问答方法先利用文本纠错算法对用户输入的问题进行处理以得到符合规范的信息语句,其后再利用任务型对话算法和基于深度神经网络的检索型问答算法分别对所述信息语句进行识别,在识别后返回相应的问答结果,以解决目前回答准确率低、响应时间长和不能综合处理任务和垂直领域问答的问题。
参见图4,为本发明提供的基于深度神经网络的问答方法在第二实施方式下的流程图。本实施方式与第一实施方式的区别主要在于,先利用任务型对话算法对信息语句进行识别,其后在利用基于深度神经网络的检索型问答算法对信息语句进行识别。本实施方式具体包括如下步骤:
步骤S201:对输入问题进行文本纠错处理得到信息语句。
步骤S202:利用任务型对话算法对所述信息语句进行识别,若识别出所述信息语句包含预设类型的任务意图,则输出与所述预设类型的任务意图匹配的答复语句。
步骤S203:若识别出所述信息语句中不包含预设类型的任务意图,则利用基于深度神经网络的检索型问答算法对所述信息语句进行识别。
步骤S204:若识别出所述信息语句与预设问题库中的语句相似度达预设相似度以上,则输出与相似度达预设相似度以上的语句对应的答复语句。
可以理解的是,作为本实施方式的一种变体,所述步骤S202和步骤S203能够相互调换顺序,以在所述信息语句不满足一步骤中的识别要求后,由另一步骤中进行识别,提升对信息语句的有效答复能力。具体可为,所述方法包括步骤:
对输入问题进行文本纠错处理得到信息语句;
利用基于深度神经网络的检索型问答算法对所述信息语句进行识别,若识别出所述信息语句与预设问题库中的语句相似度达预设相似度以上,则输出与相似度达预设相似度以上的语句对应的答复语句;
若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上,则利用任务型对话算法对所述信息语句进行识别;
若识别出所述信息语句包含预设类型的任务意图,则输出与所述预设类型的任务意图匹配的答复语句。
本实施方式可为第一实施方式的更具体化的应用例,提升回答准确率,缩短响应时长,并实现综合处理任务和垂直领域问答。
参见图5和图6,其中,图5为本发明提供的基于深度神经网络的问答方法在另一实施方式下的流程图,图6为本发明提供的基于深度神经网络的问答***整体模块结构示意图。相较前述实施方式而言,本实施方式不同之处在于,还包括敏感词检查步骤。如图5和图6所示,本实施方式提供的基于深度神经网络的问答方法包括如下步骤:
步骤S301:对输入问题进行文本纠错处理得到信息语句。
步骤S302:利用任务型对话算法对所述信息语句进行识别,若识别出所述信息语句包含预设类型的任务意图,则输出与所述预设类型的任务意图匹配的答复语句。
步骤S303:若识别出所述信息语句中不包含预设类型的任务意图,则利用基于深度神经网络的检索型问答算法对所述信息语句进行识别。
步骤S304:若识别出所述信息语句中不包含预设类型的任务意图,则利用基于深度神经网络的检索型问答算法对所述信息语句进行识别。
步骤S305:若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上,则对所述信息语句进行敏感词检测;
步骤S306:若检测出所述信息语句中包含敏感词,则随机输出预设问答结果库中的答复语句。
在步骤S305和步骤S306中,经过敏感词检测步骤,判断用户问答是否存在不友好内容。具体应用时,检测输入的文本是否存在敏感词,如果检测到敏感词则将文本的敏感词替换为“XX”进行表示,且从特定预设问答结果库中随机选择问答结果输出。例如输入句子“她好***啊”,经过前面TaskBot模块和FAQBot模块时均无输出,在敏感词检测步骤中首先判断出输入句子中存在敏感词“***”,然后就将“***”用“XX”替代得到“她好XX啊”,并从特定预设问答结果库随机选择一条问答结果“你要是聊这个,我可走了”进行返回输出。
可以理解的是,在进行敏感词检测时,可采用DFA算法或切词-检测算法。
此外,若未检测出所述信息语句中包含敏感词,则输出闲聊问答库中的闲聊答复语句,以实现与用户的闲聊对话。所述闲聊问答库为可为通过收集、整理日常闲聊时的问答语料所建立问答库。
本实施方式可在前实施方式的基础上,进一步解决目前回答准确率低、响应时间长和不能综合处理任务和垂直领域问答的问题,同时还有利于实现对用户的话题引导及趣味互动。
参见图7,为本发明提供的基于深度神经网络的问答装置的模块结构示意图。本发明还提供一种基于深度神经网络的问答装置,应用于智能问答设备,所述问答装置10包括:
预处理模块11,用于对输入问题进行文本纠错处理得到信息语句;
第一处理模块12,用于利用任务型对话算法对所述信息语句进行识别,若识别出所述信息语句包含预设类型的任务意图,则输出与所述预设类型的任务意图匹配的答复语句;
第二处理模块13,用于在识别出所述信息语句中不包含预设类型的任务意图时,利用基于深度神经网络的检索型问答算法对所述信息语句进行识别;
输出模块14,用于在识别出所述信息语句与预设问题库中的语句相似度达预设相似度以上时,输出与相似度达预设相似度以上的语句对应的答复语句。
可以理解的是,在具体产品中,所述第一处理模块12和第二处理模块13及输出模块14可作为一个处理模块进行相应处理,以用于将所述信息语句输入到预设算法库中,输出答复语句,所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法,所述任务型对话算法用于识别所述信息语句中预设类型的任务意图,所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。
通过各个模块实现对信息语句的相应功能处理,从而解决目前回答准确率低、响应时间长和不能综合处理任务和垂直领域问答的问题。
此外,本发明还提供一种基于深度神经网络的问答存储介质,其上存储有实现上述问答方法的计算机程序。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于深度神经网络的问答方法,其特征在于,所述方法包括:
对输入问题进行文本纠错处理得到信息语句;
将所述信息语句输入到预设算法库中,输出答复语句,所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法,所述任务型对话算法用于识别所述信息语句中预设类型的任务意图,所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。
2.根据权利要求1所述基于深度神经网络的问答方法,其特征在于,所述将所述信息语句输入到预设算法库中,输出答复语句,包括:
利用所述任务型对话算法对所述信息语句进行识别;
若识别出所述信息语句中不包含预设类型的任务意图,则利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别;
若识别出所述信息语句与预设问题库中的语句相似度达预设相似度以上,则输出与相似度达预设相似度以上的语句对应的答复语句。
3.根据权利要求1所述基于深度神经网络的问答方法,其特征在于,所述将所述信息语句输入到预设算法库中,输出答复语句,还包括:
利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别;
若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上,则利用所述任务型对话算法对所述信息语句进行识别;
若识别出所述信息语句包含预设类型的任务意图,则输出与所述预设类型的任务意图匹配的答复语句。
4.根据权利要求1至3任一项所述基于深度神经网络的问答方法,其特征在于,所述对输入问题进行文本纠错处理得到信息语句包括:
基于预设规则和语言模型对输入问题进行语句预处理以得到符合预设规则的文本字符串;
利用混淆词典库对所述文本字符串进行混淆度计算以确定所述文本字符串中的错误字词;
获取所述错误字词、所述错误字词的位置及错误类型;获取替换所述错误字词的候选词列表;
对利用所述候选词列表中的候选词替换所述错误字词后的语句进行混淆度计算;
输出混淆度最低的语句。
5.根据权利要求2至3任一项所述基于深度神经网络的问答方法,其特征在于,所述利用所述任务型对话算法对所述信息语句进行识别包括:
利用双向长短时记忆模型和条件随机场模型对所述信息语句进行BIEO编码模式以得到槽位标记列表;
根据所述槽位标记列表确定所述信息语句是否包含预设类型的任务意图,所述预设类型的任务意图至少包括地点查询任务和/或组合任务意图。
6.根据权利要求2至3所述基于深度神经网络的问答方法,其特征在于,所述利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别包括:
对所述信息语句进行切词处理及去停用词处理得到语料结果;
从预设问题库中召回按相似度高低顺序排列的预设个数的高顺位相似语句,所述预设个数的高顺位相似语句与所述语料结果均具有相似度;
利用预设深度模型获取所述预设个数的高顺位相似语句的深度语义相似度;
根据深度语义相似度和字面相似度对所述预设个数的高顺位相似语句进行重新排列得到按综合相似度高低顺序排列的相似语句;
获取语句相似度达到预设相似度以上的按综合相似度高低顺序排列的相似语句。
7.根据权利要求6所述基于深度神经网络的问答方法,其特征在于,获取最高顺位的按综合相似度高低顺序排列的相似语句。
8.根据权利要求1所述基于深度神经网络的问答方法,其特征在于,所述方法包括:
若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上,则对所述信息语句进行敏感词检测;
若检测出所述信息语句中包含敏感词,则随机输出预设问答结果库中的答复语句。
9.一种基于深度神经网络的问答装置,其特征在于,所述装置包括:
预处理模块,用于对输入问题进行文本纠错处理得到信息语句;
处理模块,用于将所述信息语句输入到预设算法库中,输出答复语句,所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法,所述任务型对话算法用于识别所述信息语句中预设类型的任务意图,所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。
10.一种基于深度神经网络的问答存储介质,其特征在于,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述基于深度神经网络的问答方法的步骤。
CN202010460124.3A 2020-05-27 2020-05-27 基于深度神经网络的问答方法、装置及存储介质 Pending CN111708870A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010460124.3A CN111708870A (zh) 2020-05-27 2020-05-27 基于深度神经网络的问答方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010460124.3A CN111708870A (zh) 2020-05-27 2020-05-27 基于深度神经网络的问答方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN111708870A true CN111708870A (zh) 2020-09-25

Family

ID=72538033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010460124.3A Pending CN111708870A (zh) 2020-05-27 2020-05-27 基于深度神经网络的问答方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111708870A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364128A (zh) * 2020-11-06 2021-02-12 北京乐学帮网络技术有限公司 一种信息处理的方法、装置、计算机设备和存储介质
CN117034957A (zh) * 2023-06-30 2023-11-10 海信集团控股股份有限公司 一种语义理解方法及设备
CN117609462A (zh) * 2023-11-29 2024-02-27 广州方舟信息科技有限公司 药品问答方法、药品问答机器人、电子设备和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468468A (zh) * 2015-12-02 2016-04-06 北京光年无限科技有限公司 面向问答***的数据纠错方法及装置
WO2016112679A1 (zh) * 2015-01-14 2016-07-21 百度在线网络技术(北京)有限公司 实现智能问答的方法、***和存储介质
CN107291828A (zh) * 2017-05-27 2017-10-24 北京百度网讯科技有限公司 基于人工智能的口语查询解析方法、装置及存储介质
CN109410948A (zh) * 2018-09-07 2019-03-01 北京三快在线科技有限公司 通信方法、装置、***、计算机设备以及可读存储介质
CN109727041A (zh) * 2018-07-03 2019-05-07 平安科技(深圳)有限公司 智能客服多轮问答方法、设备、存储介质及装置
CN109829044A (zh) * 2018-12-28 2019-05-31 北京百度网讯科技有限公司 对话方法、装置及设备
CN109858007A (zh) * 2017-11-30 2019-06-07 上海智臻智能网络科技股份有限公司 语义分析问答方法和装置、计算机设备和存储介质
CN109977208A (zh) * 2019-03-22 2019-07-05 北京中科汇联科技股份有限公司 一种融合faq和任务及主动引导的对话***
CN110765244A (zh) * 2019-09-18 2020-02-07 平安科技(深圳)有限公司 获取应答话术的方法、装置、计算机设备及存储介质
CN110795548A (zh) * 2019-10-25 2020-02-14 招商局金融科技有限公司 智能问答方法、装置及计算机可读存储介质
CN110929016A (zh) * 2019-12-10 2020-03-27 北京爱医生智慧医疗科技有限公司 一种基于知识图谱的智能问答方法及装置
CN111078986A (zh) * 2019-12-13 2020-04-28 腾讯科技(深圳)有限公司 数据检索方法、装置及计算机可读存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016112679A1 (zh) * 2015-01-14 2016-07-21 百度在线网络技术(北京)有限公司 实现智能问答的方法、***和存储介质
CN105468468A (zh) * 2015-12-02 2016-04-06 北京光年无限科技有限公司 面向问答***的数据纠错方法及装置
CN107291828A (zh) * 2017-05-27 2017-10-24 北京百度网讯科技有限公司 基于人工智能的口语查询解析方法、装置及存储介质
CN109858007A (zh) * 2017-11-30 2019-06-07 上海智臻智能网络科技股份有限公司 语义分析问答方法和装置、计算机设备和存储介质
CN109727041A (zh) * 2018-07-03 2019-05-07 平安科技(深圳)有限公司 智能客服多轮问答方法、设备、存储介质及装置
CN109410948A (zh) * 2018-09-07 2019-03-01 北京三快在线科技有限公司 通信方法、装置、***、计算机设备以及可读存储介质
CN109829044A (zh) * 2018-12-28 2019-05-31 北京百度网讯科技有限公司 对话方法、装置及设备
CN109977208A (zh) * 2019-03-22 2019-07-05 北京中科汇联科技股份有限公司 一种融合faq和任务及主动引导的对话***
CN110765244A (zh) * 2019-09-18 2020-02-07 平安科技(深圳)有限公司 获取应答话术的方法、装置、计算机设备及存储介质
CN110795548A (zh) * 2019-10-25 2020-02-14 招商局金融科技有限公司 智能问答方法、装置及计算机可读存储介质
CN110929016A (zh) * 2019-12-10 2020-03-27 北京爱医生智慧医疗科技有限公司 一种基于知识图谱的智能问答方法及装置
CN111078986A (zh) * 2019-12-13 2020-04-28 腾讯科技(深圳)有限公司 数据检索方法、装置及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周鸣争 等: "中国科协新一代信息技术系列丛书 人工智能导论", pages: 165 - 168 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364128A (zh) * 2020-11-06 2021-02-12 北京乐学帮网络技术有限公司 一种信息处理的方法、装置、计算机设备和存储介质
CN112364128B (zh) * 2020-11-06 2024-05-24 北京乐学帮网络技术有限公司 一种信息处理的方法、装置、计算机设备和存储介质
CN117034957A (zh) * 2023-06-30 2023-11-10 海信集团控股股份有限公司 一种语义理解方法及设备
CN117034957B (zh) * 2023-06-30 2024-05-31 海信集团控股股份有限公司 一种融合大模型的语义理解方法及设备
CN117609462A (zh) * 2023-11-29 2024-02-27 广州方舟信息科技有限公司 药品问答方法、药品问答机器人、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN110795543B (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
US11693894B2 (en) Conversation oriented machine-user interaction
CN110727779A (zh) 基于多模型融合的问答方法及***
CN110276023B (zh) Poi变迁事件发现方法、装置、计算设备和介质
CN110909122B (zh) 一种信息处理方法及相关设备
CN112084381A (zh) 一种事件抽取方法、***、存储介质以及设备
CN113495900A (zh) 基于自然语言的结构化查询语言语句获取方法及装置
CN104471568A (zh) 对自然语言问题的基于学习的处理
CN110096572B (zh) 一种样本生成方法、装置及计算机可读介质
CN114298035A (zh) 一种文本识别脱敏方法及其***
CN111782793A (zh) 智能客服处理方法和***及设备
CN113590778A (zh) 智能客服意图理解方法、装置、设备及存储介质
CN111708870A (zh) 基于深度神经网络的问答方法、装置及存储介质
CN117668180A (zh) 文档问答方法、文档问答设备以及可读存储介质
CN113505786A (zh) 试题拍照评判方法、装置及电子设备
CN112559711A (zh) 一种同义文本提示方法、装置及电子设备
CN110941713B (zh) 基于主题模型的自优化金融资讯版块分类方法
US20120197894A1 (en) Apparatus and method for processing documents to extract expressions and descriptions
Karpagam et al. Deep learning approaches for answer selection in question answering system for conversation agents
CN112528003B (zh) 一种基于语义排序和知识修正的多项选择问答方法
CN114154503A (zh) 一种敏感数据类型识别方法
CN113688633A (zh) 一种提纲确定方法及装置
KR101126186B1 (ko) 형태적 중의성 동사 분석 장치, 방법 및 그 기록 매체
CN116992874B (zh) 一种文本引用审核溯源方法、***、装置和存储介质
CN116340481B (zh) 自动回复提问的方法及装置、计算机可读存储介质、终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination