CN107545003B - 自动问答方法及*** - Google Patents

自动问答方法及*** Download PDF

Info

Publication number
CN107545003B
CN107545003B CN201610490478.6A CN201610490478A CN107545003B CN 107545003 B CN107545003 B CN 107545003B CN 201610490478 A CN201610490478 A CN 201610490478A CN 107545003 B CN107545003 B CN 107545003B
Authority
CN
China
Prior art keywords
user
question
answer
path
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610490478.6A
Other languages
English (en)
Other versions
CN107545003A (zh
Inventor
曲文武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610490478.6A priority Critical patent/CN107545003B/zh
Priority to PCT/CN2017/089581 priority patent/WO2018001169A1/zh
Publication of CN107545003A publication Critical patent/CN107545003A/zh
Application granted granted Critical
Publication of CN107545003B publication Critical patent/CN107545003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例提供一种自动问答方法及***,从产品与服务数据中为用户问题生成答案数据,针对每一产品与服务数据集合对应一个路径,针对每一路径设置一个权值向量得到路径和权值对应关系表;当收到用户下发的用户问题后,则将该用户问题编码成特征向量,然后将特征向量与路径和权值对应关系表中的各权值向量进行匹配,在特征向量与其中一个权值向量匹配成功时,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。基于涵盖所有服务数据以及所有用户服务数据的产品与服务数据进行路径和权值向量设置,而不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。

Description

自动问答方法及***
技术领域
本发明涉及人工智能领域,尤其涉及一种自动问答方法及***。
背景技术
目前自动问答***根据其知识的来源分为开放域和封闭域。前者的知识来源比较广泛,包括互联网、领域知识文档等等,典型的***如IBM的Watson。后者的知识来源仅包括某个特殊的领域,例如电信领域的客服机器人,它仅仅回答与公司或者行业产品相关的知识。
目前在封闭域的自动问答***中,传统的自动问答***实现方法是基于标准问题的,它通过人工的方法对用户可能提出的问题进行提炼生成一个标准问题库StdQ={Qesi,Ansi},其中Qesi表示一个标准问题,Ansi表示标准问题Qesi 所对应标准答案。当用户提问问题时,将用户问题与每一个标准问题进行匹配,若匹配到合适的问题,则将该问题所对应的答案返回给用户。但这种方法存在一些弊端,例如生成的标准问题无法覆盖用户的查询问题,一方面,由于产品以及服务的更新会导致用户查询内容的变化,另一方面,用户是使用自然语言进行查询的,而每个人的语言习惯是不完全相同的,以至于一些用户问题难以匹配到标准问题。
发明内容
本发明实施例提供的自动问答方法及***,主要解决的技术问题是:解决现有自动问答***中采用标准问题库导致不能很好的覆盖用户问题,进而容易导致对用户问题解答识别,降低用户体验满意度的问题。
为解决上述技术问题,本发明实施例提供一种自动问答方法,包括:
获取用户下发的用户问题;
将所述用户问题编码成特征向量;
在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
本发明实施例还提供一种自动问答***,问题交互模块,问题解析模块、答案处理模块;
所述问题交互模块用于获取用户下发的用户问题;
所述问题解析模块用于将所述用户问题编码成特征向量;
所述答案处理模块用于在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行前述的自动问答方法。
本发明的有益效果是:
根据本发明实施例提供的自动问答方法、***以及计算机存储介质,由于产品与服务数据是存储在数据库中的,本发明实施例从产品与服务数据中按问题分类出对应的数据作为各类问题的答案数据,针对每一答案数据集合对应一个路径,针对每一路径设置一个权值向量得到路径和权值对应关系表;当收到用户下发的用户问题后,则将该用户问题编码成特征向量,然后将特征向量与路径和权值对应关系表中的各权值向量进行匹配,在特征向量与其中一个权值向量匹配成功时,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。本发明实施例实现自动问答是基于数据库中的产品与服务数据(涵盖运营商提供的所有服务数据以及所有用户服务数据)进行路径和权值向量设置,并不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。且本发明实施例中当出现新的服务内容或用户数据内容时,则需要对应增加新的路径和权值向量即可,并不需要对整个模型进行更新,更新更为灵活使用,适应性更好。
附图说明
图1为本发明实施例一中的自动问答流程示意图;
图2为本发明实施例一中的循环神经网络算法示意图;
图3为本发明实施例二中的自动问答***结构示意图;
图4为本发明实施例二中的自动问答***分布式设置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明中一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
各运营商的产品与服务数据是存储在数据库中的。例如,对于用户的话费余额、话费详单、流量余额、流量详单、剩余分钟数等产品数据都是针对每个用户分别存储在数据库中的。又例如对于电信火车、电信积木、电信飞机、电信旅游等服务的套餐内容、办理流程等数据也都存储在数据中。因此用户查询时本质是使用自然语言来搜索数据库中对应那部分的数据内容。以电信领域为例,用户查询的问题一般分为两类:一类是与用户自身相关的产品与服务数据,例如“我的流量还剩多少”、“我的话费还剩多少”、“我的通话分钟数还剩多少”、“我这月的话费怎么使用的”;另一类则是针对电信运营商所能提供的服务进行查询,例如“电信电视业务怎么开通”、“我的手机还可以参与哪些优惠活动”等。
因此,本实施例产品与服务数据使用路径进行标记,针对每一路径生成一个权值向量得到路径和权值对应关系表。例如:产品与服务数据库中包含了各用户(不同用户可以用不同号码表示)的话费余额、话费详单、流量余额、流量详单,还包括了各种套餐业务(例如电信飞机)怎么开通、套餐业务内容等数据。对于用户的查询权限只限于他自己的数据,则使用路径表示一类数据,例如“用户.话费详单”、“用户.流量余额”、“用户.流量详单”;而对于不限权限的数据,则使用路径表示每一条数据,例如“电信飞机.套餐内容”、“电信飞机. 办理流程”。经过上述过程对于每类问题从数据库中划分出对应的数据并设置好唯一路径之后,再为每个路径设置权值向量生成路径和权值对应关系表。通过历史的问答记录数据,生成一个问题到路径的样本集合。基于该样本集合,使用机器学习(包括神经网络)的方法来训练得到各路径的权值向量。
本实施例汇总机器学习方法其过程可以参考正样例调整权值的过程。基于足够大数据量的历史问答记录而生成的向量可以很好的表述用户的意图特征,提升问题回答的准确率。
基于上述设置,本实施例中当收到用户下发的用户问题后,实现自动问答的流程参见图1所示,包括:
S101:获取用户下发的用户问题;
S102:将用户问题编码成特征向量;
S103:在特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。
本实施例中,由于用户用的都是自然语言,每个用户所用的语言习惯不同会导致:用户问题中可能存在冗余字段、指代消解、缺失主语等问题,用户输入可能会出现错别字。因此,本实施例中,在收到用户问题之后,将用户问题编码成特征向量之前,还包括对所述用户问题进行以下至少一种初始化处理:
对用户问题中的冗余字段进行过滤,例如,“你好”等;
对用户问题中的错别字进行校正,例如将用户输入的“点心积木套餐”纠正为“电信积木套餐”;
对用户问题中的名称内容进行标准化处理,例如将“积木套餐”标准化为“电信积木套餐”;
对用户问题中上下文的指代进行消解处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“这个套餐怎么办理?”。那么后文问题将会被预处理为“电信积木套餐怎么办理?”;
对用户问题上下文的省略进行恢复处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“怎么办理?”。那么后文问题将会被预处理为“电信积木套餐怎么办理?”。
上述S102中,将用户问题编码成特征向量,该特征向量与权值向量的纬度相同。
本实施例中,具体可以使用神经网络算法将用户问题编码成一个特征向量。且本实施例中的神经网络算法包括但不限于循环神经网络算法、卷积神经网络算法等等。图2所示为一种循环神经网络的网络结构示意图。其中X1到Xn表示用户问题的自然语言输入,H1到Hn表示循环神经网络的隐藏层,Xi与Hi 之间通过相应的加权值进行换算,i大于等于1,小于等于n,O表示输出。
本实施例中,将特征向量与路径和权值对应关系表中的各权值向量进行匹配包括:分别计算特征向量与各权值向量的相似度值,并获取得到的多个相似度值中的最大相似度值。
本实施例中计算特征向量与权值向量的相似度可以采用各种相似度计算方法,例如可以采用以下余弦相似度算法:
Figure BDA0001033289250000051
上式中x和y分别用来表示特征向量与权值向量。
判断特征向量是否与其中一个权值向量匹配成功包括:判断最大相似度值是否大于预设相似度阈值,如是,判定与最大相似度值对应的权值向量匹配成功,从该权值向量对应路径的答案数据中提取用户问题的答案反馈给用户。本实施例中,从某一权值向量对应路径的答案数据中提取用户问题的答案反馈给用户时,具体根据该用户的权限,从答案数据中提取与该用户对应的数据作为答案进行封装后反馈给用户。例如,当用户提的问题是“我的话费余额”时,匹配到的路径是“用户.话费余额”,则从数据库中所有用户的话费余额中提取该用户问题的用户的话费余额,对于其他用户的数据该用户无权查看。
本实施例中存在以下两种情况:
上述相似度计算得到的最大相似度值小于等于预设相似度阈值,此时匹配失败,也就不能自动生成答案,此时可以切换至人工服务,通过人工服务为用户解答该用户问题,并可将人工服务提供的用户问题-答案(含路径)作为一个正例样本对相应路径的权值向量进行更新。例如,将正例样本的正例相似度标准值设置为1,然后从人工服务提供的用户问题-答案的答案中提取待校正路径,并提取待校正路径当前的相似度值,根据所述正例相似度标准值与待校正路径当前的相似度值之差,反向对待校正路径对应的权值向量进行校正更新。其中正例相似度标准值的取值可以根据实际应用场景灵活设定。
另外一种情况是,匹配到的答案并反馈给用户了,但该答案并不能解决用户的问题,此时用户可以主动转入人工服务。因此本实施例在将答案反馈给所述用户后,检测到启用人工服务为用户解答所述用户问题时,就表明出现了上述情况。此时将自动生成的问题-答案(含路径)作为一个反例样本,人工服务生成的问题-答案作为一个正例样本进行对相应路径的权值向量进行更新。例如,可以根据上述计算得到的最大相似度值与反例相似度标准值对该最大相似度值对应的权值向量进行更新。具体反例相似度标准值可以取0,根据上述计算得到的最大相似度值与反例相似度标准值之差,反向对上述最大相似度值路径对应的权值向量进行校正更新。其中反例相似度标准值的取值也可以根据实际应用场景灵活设定。
当然根据实际应用场景也可以灵活设定。
本实施例中,当在数据库中新增了产品及其服务数据时,可以按照上述划分方式对应为其设置路径,并基于神经网络算法为其分配一个初始的权值向量。当数据库中删除某一产品及其服务数据时,对应的删除相应路径及其权值向量。也即本实施例中当有新增数据以及删除数据时,可以对路径和权值对应关系表进行对应的局部更新即可,并不需要对整个模型重新进行更新。可以提升资源利用率以及更新效率。
本实施例实现自动问答是基于数据库中的产品与服务数据进行路径和权值向量设置,并不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。且本中当出现新的服务内容或用户数据内容时,则需要对应增加新的路径和权值向量即可,并不需要对整个模型进行更新,更新更为灵活使用,适应性更好。
实施例二:
本实施例提供了一种自动问答***,请参见图3所示,包括问题交互模块 31,问题解析模块32、答案处理模块33;
问题交互模块31用于获取用户下发的用户问题;
问题解析模块32用于将用户问题编码成特征向量;
答案处理模块33用于在特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
具体的,答案处理模块33包括答案映射子模块331和答案处理子模块332;答案映射子模块331用于分别计算所述特征向量与所述各权值向量的相似度值,并从得到的多个相似度值中选择出最大相似度值,判断所述最大相似度值是否大于预设相似度阈值,如是,判定与所述最大相似度值对应的权值向量匹配成功。答案处理子模块332用于在匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户。
本实施例中的上述问题交互模块31,问题解析模块32、答案处理模块33 的各功能可以通过网元节点实现,且一个模块可以通过一个网元节点实现,也可以一个网元节点实现上述功能模块中的至少两个。本实施例中,为了实现集群规模的扩展来增加***性能,将问题交互模块31,问题解析模块32以及答案处理模块33中至少两个模块设置在分布式通信***的不同通信节点上。例如,参见图4所示,问题交互模块31和问题解析模块32被置于一个节点上,它们是基于用户问题实现并行的,将多个用户问题分发给不同的节点进行并行处理,每个节点独立的处理其中一部分问题。答案映射子模块331是根据路径实现分布式并行的,每个节点只负责处理一部分路径。答案处理子模块332的工作负载比较小,一般可放在一个节点上完成,如果发生负载高的情况,它也可以基于用户问题分布式的实施到多个节点上。
本实施例中,由于用户用的都是自然语言,每个用户所用的语言习惯不同会导致:用户问题中可能存在冗余字段、前后指代不同、缺失主语等问题,用户自带的口音也可能会导致识别到错别字。因此,本实施例中,问题交互模块 31在收到用户问题之后,发给问题解析模块32之前,还包括对用户问题进行以下至少一种初始化处理:
对用户问题中的冗余字段进行过滤,例如,“你好”等;
对用户问题中的错别字进行校正,例如将用户输入的“点心积木套餐”纠正为“电信积木套餐”;
对用户问题中的名称内容进行标准化处理,例如将“积木套餐”标准化为“电信积木套餐”;
对用户问题中上下文的指代进行消解处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“这个套餐怎么办理?”。那么后文问题将会被预处理为“电信积木套餐怎么办理?”;
对用户问题上下文的省略进行恢复处理,例如,上文问题是“电信积木套餐是什么?”,后文问题是“怎么办理?”。那么后文问题将会被预处理为“电信积木套餐怎么办理?”。
问题解析模块32将用户问题编码成的特征向量与权值向量的纬度相同。本实施例中,问题解析模块32具体可以使用神经网络算法将用户问题编码成一个特征向量。且本实施例中的神经网络算法包括但不限于循环神经网络算法、卷积神经网络算法等等。
本实施例中,从某一权值向量对应路径的答案数据中提取用户问题的答案反馈给用户时,具体根据该用户的权限,从答案数据中提取与该用户对应的数据作为答案进行封装后反馈给用户。
本实施例中,答案处理模块33还用于在最大相似度值小于等于预设相似度阈值时,切换至人工服务,并从人工服务对所述用户问题解答的答案中提取路径,根据正例标准值对提取的路径的权值向量进行更新。例如,将正例样本的正例相似度标准值设置为1,然后从人工服务提供的用户问题-答案的答案中提取待校正路径,并提取待校正路径当前的相似度值,根据所述正例相似度标准值与待校正路径当前的相似度值之差,反向对待校正路径对应的权值向量进行校正更新。其中正例相似度标准值的取值可以根据实际应用场景灵活设定。
答案处理模块33还用于在将答案反馈给用户后,检测到启用人工服务为用户解答用户问题时,根据最大相似度值与反例相似度标准值对该最大相似度值对应的权值向量进行更新。
本实施例中,当在数据库中新增了产品及其服务数据时,答案处理模块33 可以按照上述划分方式对应为其设置路径,并基于神经网络算法为其分配一个初始的权值向量。当数据库中删除某一产品及其服务数据时,答案处理模块33 对应的删除相应路径及其权值向量。也即本实施例中当有新增数据以及删除数据时,可以对路径和权值对应关系表进行对应的局部更新即可,并不需要对整个模型重新进行更新。可以提升资源利用率以及更新效率。
为了更好的理解本发明,下面结合两种具体的情况对本发明做进一步示例说明。
假设电信运营商存储的用户表和产品与服务表分别见表1和表2:
表1
名字 手机号 话费余额 话费详单 流量余额 流量详单
张三 13012345001 128.60 …… 685M ……
李四 13012345002 86.30 …… 18M ……
王五 13012345003 18.00 …… 248M ……
表2
名字 标志 套餐内容 办理流程
电信积木 000101 …… ……
电信火车 000102 …… ……
答案映射模块33中的路径与权值对应关系表见表3:
表3
Figure BDA0001033289250000091
Figure BDA0001033289250000101
示例1,自动问答过程:
输入:来自于李四(13012345002)的问题:“查一下话费。”
步骤1,问题交互模块对问题初始化,处理结果为:“查一下话费。”
步骤2:问题解析模块的处理结果是:问题的特征向量为<0.9,0.2>。
步骤3:答案映射模块使用问题的特征向量为<0.9,0.2>与每一个路径向量计算余弦相似度,预设相似度阈值为0.95,各路径的计算结果如下:
用户.话费余额:<0.8,0.2>:
Figure BDA0001033289250000102
用户.话费详单:<0.7,0.3>:
Figure BDA0001033289250000103
用户.流量余额<0.6,0.8>:
Figure BDA0001033289250000104
用户.流量详单<0.6,0.9>:
Figure BDA0001033289250000111
电信积木.标志<0.3,0.4>:
Figure BDA0001033289250000112
电信积木.套餐内容<0.2,0.4>:
Figure BDA0001033289250000113
电信积木.办理流程<0.3,0.3>:
Figure BDA0001033289250000114
电信火车.标志<0.5,0.4>:
Figure BDA0001033289250000115
电信火车.套餐内容<0.6,0.4>:
Figure BDA0001033289250000116
电信火车.办理流程<0.5,0.5>:
Figure BDA0001033289250000117
Figure BDA0001033289250000121
从这10个结果中选取最大值0.999及其所对应的路径“用户.话费余额”发送给答案处理模块。
步骤4:由于0.999超过相似度阈值0.95,答案处理模块根据用户的手机号码(13012345002)到用户表中查询对应的余额,返回结果为86.30元,然后将该结果封装为“您的余额是86.30元”并返回给用户。
示例2,增量更新过程:
假设产品与服务表(套餐)发生了变化(更新),变化后的表见表4所示:
表4
名字 标志 套餐内容 办理流程
电信积木 000101 …… ……
电信火车 000102 …… ……
电信飞机 000103 …… ……
答案映射模块中的路径与权值对应表也会发生更新,将表5所示:
表5
Figure BDA0001033289250000122
Figure BDA0001033289250000131
输入:来自于用户张三(13012345001)的问题:“问一下,肥鸡套餐怎么办理?”
步骤1,问题交互模块对问题初始化,处理结果为:“问一下,电信飞机套餐怎么办理?”。
步骤2:问题解析模块的处理结果是:问题的特征向量为<0.1,0.9>。
步骤3:答案映射模块使用问题的特征向量为<0.1,0.9>与每一个路径向量计算余弦相似度,给定阈值为0.95,各路径的计算结果如下:
用户.话费余额:<0.8,0.2>:
Figure BDA0001033289250000132
用户.话费详单:<0.7,0.3>:
Figure BDA0001033289250000133
用户.流量余额<0.6,0.8>:
Figure BDA0001033289250000134
Figure BDA0001033289250000141
用户.流量详单<0.6,0.9>:
Figure BDA0001033289250000142
电信积木.标志<0.3,0.4>:
Figure BDA0001033289250000143
电信积木.套餐内容<0.2,0.4>:
Figure BDA0001033289250000144
电信积木.办理流程<0.3,0.3>:
Figure BDA0001033289250000145
电信火车.标志<0.5,0.4>:
Figure BDA0001033289250000146
电信火车.套餐内容<0.6,0.4>:
Figure BDA0001033289250000147
电信火车.办理流程<0.5,0.5>:
Figure BDA0001033289250000151
电信飞机.标志<0.4,0.7>:
Figure BDA0001033289250000152
电信飞机.套餐内容<0.8,0.5>:
Figure BDA0001033289250000153
电信飞机.办理流程<0.6,0.9>:
Figure BDA0001033289250000154
从这10个结果中选取最大值0.938及其所对应的路径“电信积木.套餐内容”发送给答案处理装模块。
步骤4:由于0.938没有超过阈值0.95,答案处理模块将问题转交给人工服务,通过人工的方式来生成答案并返回给用户,形如:“电信飞机的办理流程如下:......”。这是一个从问题到路径“电信飞机.办理流程”的正例样本,它被用来更新答案映射模块中路径“电信飞机.办理流程”的权值,更新结果例如<0.4, 0.9>。
答案映射模块中的路径及其权值表发生更新的表6所示:
表6
路径 权值
用户.话费余额 <0.8,0.2>
用户.话费详单 <0.7,0.3>
用户.流量余额 <0.6,0.8>
用户.流量详单 <0.6,0.9>
电信积木.标志 <0.3,0.4>
电信积木.套餐内容 <0.2,0.4>
电信积木.办理流程 <0.3,0.3>
电信火车.标志 <0.5,0.4>
电信火车.套餐内容 <0.6,0.4>
电信火车.办理流程 <0.5,0.5>
电信飞机.标志 <0.4,0.7>
电信飞机.套餐内容 <0.8,0.5>
电信飞机.办理流程 <0.4,0.9>
本发明实施例实现自动问答是基于数据库中的产品与服务数据(涵盖运营商提供的所有服务数据以及所有用户服务数据)进行路径和权值向量设置,并不是基于标准问题库,因此能更好的覆盖用户问题,为用户更全面的提供自动解答,提升用户体验满意度。且本发明实施例中当出现新的服务内容或用户数据内容时,则需要对应增加新的路径和权值向量即可,并不需要对整个模型进行更新,更新更为灵活使用,适应性更好。另外本发明中的各模块可以方便的部署于不同的节点上,从而可以通过集群规模的扩展来增加***性能。
以上内容是结合具体的实施方式对本发明实施例所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (11)

1.一种自动问答方法,包括:
获取用户下发的用户问题;
将所述用户问题编码成特征向量;
在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
2.如权利要求1所述的自动问答方法,其特征在于,将所述特征向量与路径和权值对应关系表中的各权值向量进行匹配包括:分别计算所述特征向量与所述各权值向量的相似度值,并获取得到的多个相似度值中的最大相似度值;
判断所述特征向量是否与其中一个权值向量匹配成功包括:判断所述最大相似度值是否大于预设相似度阈值,如是,判定与所述最大相似度值对应的权值向量匹配成功。
3.如权利要求2所述的自动问答方法,其特征在于,所述最大相似度值小于等于所述预设相似度阈值时,切换至人工服务,并从人工服务对所述用户问题解答的答案中提取路径,根据正例相似度标准值对提取的路径的权值向量进行更新。
4.如权利要求2所述的自动问答方法,其特征在于,将所述答案反馈给所述用户后,检测到启用人工服务为所述用户解答所述用户问题时,根据所述最大相似度值与反例相似度标准值对该最大相似度值对应的权值向量进行更新。
5.如权利要求1-4任一项所述的自动问答方法,其特征在于,将所述用户问题编码成特征向量之前,还包括对所述用户问题进行以下至少一种初始化处理:
对所述用户问题中的冗余字段进行过滤;
对所述用户问题中的错别字进行校正;
对所述用户问题中的名称内容进行标准化处理;
对所述用户问题中上下文的指代进行消解处理;
对所述用户问题上下文的省略进行恢复处理。
6.如权利要求1-4任一项所述的自动问答方法,其特征在于,从所述权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户包括:
根据所述用户的权限,从所述答案数据中提取与该用户对应的数据作为答案进行封装后反馈给用户。
7.一种自动问答***,包括问题交互模块,问题解析模块、答案处理模块;
所述问题交互模块用于获取用户下发的用户问题;
所述问题解析模块用于将所述用户问题编码成特征向量;
所述答案处理模块用于在所述特征向量与路径和权值对应关系表中的各权值向量中的一个匹配成功时,从该权值向量对应路径的答案数据中提取所述用户问题的答案反馈给所述用户;一个权值向量对应一个路径,一个路径对应一类答案数据;所述答案数据为从产品与服务数据中提取的数据。
8.如权利要求7所述的自动问答***,其特征在于,所述答案处理模块包括答案映射子模块,用于分别计算所述特征向量与所述各权值向量的相似度值,并从得到的多个相似度值中选择出最大相似度值,判断所述最大相似度值是否大于预设相似度阈值,如是,判定与所述最大相似度值对应的权值向量匹配成功。
9.如权利要求8所述的自动问答***,其特征在于,所述答案处理模块还用于在所述最大相似度值小于等于所述预设相似度阈值时,切换至人工服务,并从人工服务对所述用户问题解答的答案中提取路径,根据正例相似度标准值对提取的路径的权值向量进行更新。
10.如权利要求8所述的自动问答***,其特征在于,所述答案处理模块还用于在将所述答案反馈给所述用户后,检测到启用人工服务为所述用户解答所述用户问题时,根据所述最大相似度值与反例相似度标准值对该最大相似度值对应的权值向量进行更新。
11.如权利要求7-10任一项所述的自动问答***,其特征在于,问题交互模块,问题解析模块、答案映射模块以及答案处理模块中至少两个模块设置在分布式通信***的不同通信节点上。
CN201610490478.6A 2016-06-28 2016-06-28 自动问答方法及*** Active CN107545003B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610490478.6A CN107545003B (zh) 2016-06-28 2016-06-28 自动问答方法及***
PCT/CN2017/089581 WO2018001169A1 (zh) 2016-06-28 2017-06-22 自动问答方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610490478.6A CN107545003B (zh) 2016-06-28 2016-06-28 自动问答方法及***

Publications (2)

Publication Number Publication Date
CN107545003A CN107545003A (zh) 2018-01-05
CN107545003B true CN107545003B (zh) 2022-03-04

Family

ID=60786559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610490478.6A Active CN107545003B (zh) 2016-06-28 2016-06-28 自动问答方法及***

Country Status (2)

Country Link
CN (1) CN107545003B (zh)
WO (1) WO2018001169A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110597966A (zh) * 2018-05-23 2019-12-20 北京国双科技有限公司 自动问答方法及装置
CN108920543B (zh) * 2018-06-13 2020-07-10 珠海格力电器股份有限公司 查询和交互的方法及装置、计算机装置、存储介质
CN109033221A (zh) * 2018-06-29 2018-12-18 上海银赛计算机科技有限公司 答案生成方法、装置及服务器
CN109033342B (zh) * 2018-07-24 2023-01-31 北京京东尚科信息技术有限公司 应用于服务***的服务提供方法、装置和服务模型
CN111177328B (zh) * 2018-11-12 2023-04-28 阿里巴巴集团控股有限公司 问答匹配***和方法及问答处理设备和介质
CN110413730B (zh) * 2019-06-27 2024-06-07 平安科技(深圳)有限公司 文本信息匹配度检测方法、装置、计算机设备和存储介质
CN110674276A (zh) * 2019-09-23 2020-01-10 深圳前海微众银行股份有限公司 机器人自学习方法、机器人终端、装置及可读存储介质
CN111930905B (zh) * 2020-07-13 2024-06-07 上海明略人工智能(集团)有限公司 用于问答训练的方法、装置、***和计算机可读存储介质
CN113887246A (zh) * 2021-10-19 2022-01-04 京东科技信息技术有限公司 客服领域人机方案一致性检测的方法、装置及存储介质
CN115424622A (zh) * 2022-11-04 2022-12-02 之江实验室 一种人机语音智能交互方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850539A (zh) * 2015-05-28 2015-08-19 宁波薄言信息技术有限公司 一种自然语言理解方法及基于该方法的旅游问答***
CN105512349A (zh) * 2016-02-23 2016-04-20 首都师范大学 一种用于学习者自适应学习的问答方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070083589A1 (en) * 2005-09-26 2007-04-12 Olsen Luke M Method and apparatus for multi-user generation of domain specific knowledge and adjunct interface
CN101251862B (zh) * 2008-03-25 2010-06-09 北京百问百答网络技术有限公司 一种基于内容的问题自动分类方法及其***
CN104050256B (zh) * 2014-06-13 2017-05-24 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850539A (zh) * 2015-05-28 2015-08-19 宁波薄言信息技术有限公司 一种自然语言理解方法及基于该方法的旅游问答***
CN105512349A (zh) * 2016-02-23 2016-04-20 首都师范大学 一种用于学习者自适应学习的问答方法及装置

Also Published As

Publication number Publication date
WO2018001169A1 (zh) 2018-01-04
CN107545003A (zh) 2018-01-05

Similar Documents

Publication Publication Date Title
CN107545003B (zh) 自动问答方法及***
CN109145290B (zh) 基于字向量与自注意力机制的语义相似度计算方法
CN106372107B (zh) 自然语言文句库的生成方法及装置
CN109325132A (zh) 专家知识推荐方法、装置、计算机设备及存储介质
CN107886949A (zh) 一种内容推荐方法及装置
CN111680147A (zh) 一种数据处理方法、装置、设备以及可读存储介质
CN109063935A (zh) 一种预测任务处理时间的方法、装置及存储介质
Pustova Investigation of call centers as retrial queuing systems
CN108509493A (zh) 一种ar视觉搜索推荐服务方法
CN107247753B (zh) 一种相似用户选取方法及装置
JP2007241331A (ja) スキル値算出プログラムおよびスキル値算出装置
CN110225210A (zh) 基于通话摘要自动填写工单方法及***
CN110427604A (zh) 表格整合方法和装置
CN115456043A (zh) 分类模型处理、意图识别方法、装置和计算机设备
CN111581486B (zh) 一种信息分配方法及装置
CN108230121B (zh) 一种基于循环神经网络的产品设计方法
CN114281984A (zh) 一种风险检测方法、装置、设备及计算机可读存储介质
CN114462582A (zh) 基于卷积神经网络模型的数据处理方法及装置、设备
CN108415971B (zh) 采用知识图谱推荐供求信息的方法和装置
CN110572524A (zh) 一种用户呼叫处理方法、装置、存储介质和服务器
CN109558882A (zh) 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置
CN107590279A (zh) 一种智慧旅游推荐***
CN111353001B (zh) 对用户进行分类的方法和装置
CN109657950B (zh) 层次分析方法、装置、设备及计算机可读存储介质
CN114896294A (zh) 产品测试数据表生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant