CN107436916A - 智能提示答案的方法及装置 - Google Patents
智能提示答案的方法及装置 Download PDFInfo
- Publication number
- CN107436916A CN107436916A CN201710452312.XA CN201710452312A CN107436916A CN 107436916 A CN107436916 A CN 107436916A CN 201710452312 A CN201710452312 A CN 201710452312A CN 107436916 A CN107436916 A CN 107436916A
- Authority
- CN
- China
- Prior art keywords
- msub
- mrow
- answer
- semantic
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
- G06Q30/016—After-sales
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Computer Interaction (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种智能提示答案的方法及装置,该方法包括:分析并提取问题Q的信息特征,信息特征包括词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q);计算问题Q和问题库中问题Qi之间的每一类信息特征的相似度,获得问题Q和问题库中问题Qi的相似度Sim(Q,Qi),其中问题库中包含问题Qi以及对应的答案;以及根据相似度Sim(Q,Qi)对问题库问题Qi进行排序,将排序结果最靠前的若干问题库问题Qi的***给用户。根据本申请实施例的技术方案,能够实现对问题智能准确地分析,并有助于快速筛选得到问题对应的答案,从而大大提高了问题答复的响应速度及准确性。
Description
技术领域
本公开一般涉及计算机技术领域,具体涉及一种智能提示答案的方法及装置。
背景技术
随着电子商务平台的兴起,越来越多的行业开始与电子商务相结合。相比传统销售渠道的面对面直接沟通,如何同客户高效专业地进行线上沟通,对于提升公司的线上销售额具有十分重要的作用。
客服***中,客户与公司客服通过网页、通讯软件、电话等方式沟通交流。例如:客户对公司产品或业务提出问题,客服针对客户问题给出答案。但由于客服人员对公司业务知识的局限性和差异性,难以保证所给答***性和一致性。为弥补客服人员在业务知识上的不足,公司需要经常对其进行业务培训,成本较高。
已知一些***针对上述问题增加了快捷回复功能。利用该功能,客服可以预先在***里设置常用回答,当客户提出相同问题时,可以选择预先设置好的答案。该方法的缺陷在于,需要客服判断客户问题是和哪个答案匹配,当预设置的答案数量较少时难以满足需求,当预设置的答案数量较多时客服难以快速找到匹配的答案,无法快速响应。因此,现有***和方法只能辅助处理少量、简单的问题。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种高效灵活且智能的提示答案的方法。
第一方面,本申请实施例提供了一种智能提示答案的方法,包括:
分析并提取问题Q的信息特征,该信息特征包括词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q);
计算该问题Q和问题库中问题Qi之间的每一类信息特征的相似度,获得该问题Q和问题库中问题Qi的相似度Sim(Q,Qi),其中该问题库中包含问题Qi以及对应的答案;以及
根据该相似度Sim(Q,Qi)对问题库问题Qi进行排序,将排序结果最靠前的若干问题库问题Qi的***给用户。
在一些实施例中,该智能提示答案的方法包括:问题库包括公共问题库和私有问题库;按照问题和问题库中问题的相似度Sim(Q,Qi)高优先和私有问题优先的排序原则进行排序;响应于用户基于所提供的答案确定的最终答案;将该问题Q和最终答案组合,添加至私有问题库。
第二方面,本申请实施例还提供了一种智能提示答案的装置,包括:
特征提取单元,配置用于分析并提取问题Q的信息特征,该信息特征包括词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q);
相似度计算单元,配置用于计算该问题Q和问题库中问题Qi之间的每一类信息特征的相似度,获得该问题Q和问题库中问题Qi的相似度Sim(Q,Qi),其中该问题库中包含问题Qi以及对应的答案;以及
答案筛选单元,配置用于根据该相似度Sim(Q,Qi)对问题库问题Qi进行排序,将排序结果最靠前的若干问题库问题Qi的***给用户。
第三方面,本申请实施例还提供了一种设备,包括:
一个或多个处理器和存储器;
其中,存储器包含可由该一个或多个处理器执行的指令以使得该一个或多个处理器执行根据本申请各实施例提供的智能提示答案的方法。
第四方面,本申请实施例还提供了一种存储有计算机程序的计算机可读存储介质,该计算机程序使计算机执行根据本申请各实施例提供的智能提示答案的方法。
本申请实施例提供的智能提示答案的方法,通过计算问题和问题库问题之间每一类信息特征的相似度,得到问题和问题库问题的相似度,能够实现对问题智能准确地分析;根据相似度排序,有助于快速筛选得到问题对应的答案,从而辅助客服能够快速准确地答复客户问题,大大提高了客服的响应速度及答复的准确性;
本申请一些实施例提供的智能提示答案的方法进一步通过配置公共问题库和私有问题,既保证了答***性和一致性,又满足了回答的灵活性和个性化,有效提高了客服的服务质量。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了根据本申请实施例的智能提示答案的方法的示例性流程图;
图2示出了本申请一实施例提供的智能提示答案的装置的结构示意图;以及
图3示出了适于用来实现本申请实施例的设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了根据本申请实施例的智能提示答案的方法的示例性流程图。
如图1所示,该智能提示答案的方法包括:
步骤S10:分析并提取问题Q的信息特征,该信息特征包括词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q)。
具体地,在本实施例中,步骤S10可以但不限于按照如下方式实现:
对问题Q进行分词,获得分词序列S1(Q);
对分词序列S1(Q)进行词性标注,获得词法特征S2(Q);
根据语义词典对词法特征S2(Q)进行语义标注,获得语义词法特征S3(Q);
对词法特征S2(Q)进行相邻组合,获得句法特征S4(Q);以及
对语义词法特征S3(Q)进行相邻组合,获得语义句法特征S5(Q)。
优选地,对分词序列S1(Q)进行词性标注,获得词法特征S2(Q)可以按照如下方式得到:
对分词序列S1(Q)进行词性标注,并保留其中的名词、动词、形容词和疑问词,得到词性标注序列;
词法特征S2(Q)为该词性标注序列。
优选地,根据语义词典对词法特征S2(Q)进行语义标注,获得语义词法特征S3(Q)可以按照如下方式得到:
查找语义词典,将词法特征S2(Q)中登录在语义词典中的词语转换为对应的义原,并将未登录在语义词典中的词语作为义原保留,从而将词法特征S2(Q)转换为义原序列;
语义词法特征S3(Q)为该义原序列。
例如,对问题Q“怎么提高我的关键词排行”,分析提取过程如下:
1.问句分词,得到对应的分词序列S1(Q):怎么/提高/我/的/关键词/排行;
2.词性标注,并保留名词、动词、形容词和疑问词,得到词法特征S2(Q),也就是词性标注序列:怎么(疑问词)/提高(动词)/关键词(名词)/排行(动词);
3.查找语义词典,将词法特征S2(Q)中登录在语义词典中的词语转换为对应的义原,并将未登录在语义词典中的词语作为义原保留,从而将词法特征S2(Q)转换为义原序列,也就是语义词法特征S3(Q):Ka35B0(怎么)/Ie12A0(提高)/关键词(关键词)/Dd07A0(排行),其中“关键词”未登录在语义词典中,则作为义原保留;
4.对词法特征S2(Q)进行相邻组合,得到句法特征S4(Q):<怎么,提高>/<提高,关键词>/<关键词,排行>;
5.对语义词法特征S3(Q)进行相邻组合,得到语义句法特征S5(Q):<Ka35B0,Ie12A0>/<Ie12A0,关键词>/<关键词,Dd07A0>。
上述分析并提取问题信息特征的方法,将问题语句的词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q)四个层面的信息进行分析并提取,为后续相似度计算的准确性奠定了基础。
在更多实施例中,还可以根据实际需求采用不同的方法分析并提取问题Q的词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q),可实现相同的技术效果。
步骤S20:计算问题Q和问题库中问题Qi之间的每一类信息特征的相似度,获得问题Q和问题库中问题Qi的相似度Sim(Q,Qi),其中问题库中包含问题Qi以及对应的答案。
具体地,在本实施例中,问题Q和问题库中问题Qi之间每一类信息特征的相似度Sim(Sj(Q),Sj(Qi))的计算方式可以为:
基于上述每一类信息特征的相似度,问题Q和问题库中问题Qi的相似度Sim(Q,Qi)的计算方式继而可以为:
其中,Com(Sj(Q),Sj(Qi))为Sj(Q)和Sj(Qi)的公共元素数量,Num(Sj(Q),Sj(Qi))为Sj(Q)和Sj(Qi)中的最大元素数量,σ为平滑参数,元素为词语、词语组合、义原或义原组合,j=2、3、4或5。
平滑参数σ根据经验配置,可以在后续根据智能答案提示效果的反馈进行调整。设置平滑参数σ,可以避免Com(Sj(Q),Sj(Qi))和Num(Sj(Q),Sj(Qi))相差不大而导致的相似度Sim(Sj(Q),Sj(Qi))计算不准确,有效提高两者的区分度从而提高计算的准确性。
本实施例中,通过上述公式(1)计算问题Q和问题库中问题Qi之间每一类信息特征的相似度Sim(Sj(Q),Sj(Qi)),并将词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q)四个层面的信息融合起来,通过上述公式(2)计算得到问题和问题库中问题Qi的相似度Sim(Q,Qi),从而大大提高了问题Q和问题库Qi相似度计算的准确性和可靠性。
在一些实施例中,可以针对问题库中的所有问题Qi,计算问题Q与问题Qi的相似度,再进行后续操作。这种实施例可以遍历问题库中的所有问题Qi,以免漏掉合适的答案。在另一些实施例中,可以只针对问题库中的部分问题,计算问题Q与该部分问题的相似度,以供后续处理。在这种实施例中,当问题库较大时,可以先通过初步的筛选(例如,关键词匹配等)来选择候选问题,从而降低计算量,进一步提高响应速度。
在更多实施例中,本申请提供的方法不局限于上述公式(1)、(2)的计算方法,可配置更多的不同的计算方式分别计算问题Q和问题库中问题Qi之间的每一类信息特征的相似度Sim(Sj(Q),Sj(Qi))、问题和问题库中问题的相似度Sim(Q,Qi),只要通过每一类信息特征的相似度Sim(Sj(Q),Sj(Qi))得到问题和问题库中问题的相似度Sim(Q,Qi),即可实现同样的技术效果。
步骤S30:根据相似度Sim(Q,Qi)对问题库问题Qi进行排序,将排序结果最靠前的若干问题库问题Qi的***给用户。
具体地,在本实施例中,根据相似度Sim(Q,Qi)对问题库中问题Qi进行排序,排序结果最靠前的问题库问题Qi,也就是与问题Q最相近的问题,因而其对应的答案作为最相近的***给用户以作参考。
本实施例中,基于相似度Sim(Q,Qi)进行排序筛选,减少了获取提示答案的时间,大大提高了答复的响应速度。
优选地,问题库包括公共问题库和私有问题库,其中,公共问题库为收集公司业务范围内问题和标准答案构成,私有问题库为每个用户根据自身需求自定义形成。
进一步优选地,按照相似度高优先和私有问题优先的排序原则对对问题库问题Qi进行排序,并将排序结果最靠前的若干(例如,3个,5个,或10个)问题库问题Qi的***给用户。
进一步优选地,基于排序结果最靠前的若干问题库问题Qi的答案,用户确定最终答案作为问题Q的答复;将问题Q和该最终答案组合,添加至私有问题库。
上述实施例中,通过合理的排序和筛选规则,进一步有助于快速准确地得到最优提示答案,从而进一步提高了问题答复的速度和准确性。用户(例如,客服)可以从提供的提示答案中,挑选合适的答案直接回答给客户,也可以在提示答案的基础上进行修改后间接回答给客户。进一步通过配置公共问题库和私有问题库,既保证了答复的准确性和一致性,又实现了答复的灵活性和个性化。私有问题库可以仅限用户自己使用,或者仅限有权限的用户群组使用。
图2示出了本申请一实施例提供的智能提示答案的装置的结构示意图。图2所示的智能提示答案的装置可对应执行前文结合图1描述的任一方法。
如图2所示,在本实施例中,本申请提供一种智能提示答案的装置,包括:
特征提取单元10,配置用于分析并提取问题Q的信息特征,该信息特征包括词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q);
相似度计算单元20,配置用于计算问题Q和问题库中问题Qi之间的每一类信息特征的相似度,获得问题Q和问题库中问题Qi的相似度Sim(Q,Qi),其中问题库中包含问题Qi以及对应的答案;以及
答案筛选单元30,配置用于根据相似度对问题库问题Qi进行排序,将排序结果最靠前的若干问题库问题Qi的***给用户。
具体地,在本实施例中,特征提取单元10可以配置用于按如下分析并提取问题Q的信息特征:
对问题Q进行分词,获得分词序列S1(Q);
对分词序列S1(Q)进行词性标注,获得词法特征S2(Q);
根据语义词典对词法特征S2(Q)进行语义标注,获得语义词法特征S3(Q);
对词法特征S2(Q)进行相邻组合,获得句法特征S4(Q);以及
对语义词法特征S3(Q)进行相邻组合,获得语义句法特征S5(Q)。
优选地,对分词序列S1(Q)进行词性标注,获得词法特征S2(Q)可以按照如下方式得到:
对分词序列S1(Q)进行词性标注,并保留其中的名词、动词、形容词和疑问词,得到词性标注序列;
词法特征S2(Q)为该词性标注序列。
优选地,根据语义词典对词法特征S2(Q)进行语义标注,获得语义词法特征S3(Q)可以按照如下方式得到:
查找语义词典,将词法特征S2(Q)中登录在语义词典中的词语转换为对应的义原,并将未登录在语义词典中的词语作为义原保留,从而将词法特征S2(Q)转换为义原序列;
语义词法特征S3(Q)为该义原序列。
例如,特征提取单元10对问题Q“怎么提高我的关键词排行”,分析提取过程如下:
1.问句分词,得到对应的分词序列S1(Q):怎么/提高/我/的/关键词/排行;
2.词性标注,并保留名词、动词、形容词和疑问词,得到词法特征S2(Q),也就是词性标注序列:怎么(疑问词)/提高(动词)/关键词(名词)/排行(动词);
3.查找语义词典,将词法特征S2(Q)中登录在语义词典中的词语转换为对应的义原,并将未登录在语义词典中的词语作为义原保留,从而将词法特征S2(Q)转换为义原序列,也就是语义词法特征S3(Q):Ka35B0(怎么)/Ie12A0(提高)/关键词(关键词)/Dd07A0(排行),其中“关键词”未登录在语义词典中,则作为义原保留;
4.对词法特征S2(Q)进行相邻组合,得到句法特征S4(Q):<怎么,提高>/<提高,关键词>/<关键词,排行>;
5.对语义词法特征S3(Q)进行相邻组合,得到语义句法特征S5(Q):<Ka35B0,Ie12A0>/<Ie12A0,关键词>/<关键词,Dd07A0>。
上述分析并提取问题信息特征的方法,将问题语句的词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q)四个层面的信息进行分析并提取,为后续相似度计算的准确性奠定了基础。
在更多实施例中,特征提取单元10还可以根据实际需求采用不同的方法分析并提取问题Q的词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q),可实现相同的技术效果。
具体地,在本实施例中,相似度计算单元20可以用于按照下式(1)计算每一类信息特征的相似度Sim(Sj(Q),Sj(Qi))
基于上述每一类信息特征的相似度,继而可以按照下式(2)计算问题和问题库中问题Qi的相似度Sim(Q,Qi):
其中,Com(Sj(Q),Sj(Qi))为Sj(Q)和Sj(Qi)的公共元素数量,Num(Sj(Q),Sj(Qi))为Sj(Q)和Sj(Qi)中的最大元素数量,σ为平滑参数,元素为词语、词语组合、义原或义原组合,j=2、3、4或5。
平滑参数σ根据经验配置,可以在后续根据智能答案提示效果的反馈进行调整。设置平滑参数σ,可以避免Com(Sj(Q),Sj(Qi))和Num(Sj(Q),Sj(Qi))相差不大而导致的相似度Sim(Sj(Q),Sj(Qi))计算不准确,有效提高两者的区分度从而提高计算的准确性。
本实施例中,相似度计算单元20用于通过上述公式(1)计算问题Q和问题库中问题Qi之间每一类信息特征的相似度Sim(Sj(Q),Sj(Qi)),并将词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q)四个层面的信息融合起来,通过上述公式(2)计算得到问题和问题库中问题Qi的相似度Sim(Q,Qi),从而大大提高了问题Q和问题库Qi相似度计算的准确性和可靠性。
在一些实施例中,相似度计算单元20可以用于针对问题库中的所有问题Qi,计算问题Q与问题Qi的相似度,再进行后续操作。这种实施例可以遍历问题库中的所有问题Qi,以免漏掉合适的答案。在另一些实施例中,相似度计算单元20可以用于只针对问题库中的部分问题,计算问题Q与该部分问题的相似度,以供后续处理。在这种实施例中,当问题库较大时,可以先通过初步的筛选(例如,关键词匹配等)来选择候选问题,从而降低计算量,进一步提高响应速度。
在更多实施例中,本申请提供的相似度计算单元20不局限于通过上述公式(1)、(2)的计算方法,可配置更多的不同的计算方式分别计算问题Q和问题库中问题Qi之间的每一类信息特征的相似度Sim(Sj(Q),Sj(Qi))、问题和问题库中问题的相似度Sim(Q,Qi),只要通过每一类信息特征的相似度Sim(Sj(Q),Sj(Qi))得到问题和问题库中问题的相似度Sim(Q,Qi),即可实现同样的技术效果。
具体地,在本实施例中,答案筛选单元30,用于根据相似度Sim(Q,Qi)对问题库中问题Qi进行排序,排序结果最靠前的问题库问题Qi,也就是与问题Q最相近的问题,因而其对应的答案作为最相近的***给用户以作参考。
本实施例中,答案筛选单元30基于相似度Sim(Q,Qi)进行排序筛选,减少了获取提示答案的时间,大大提高了答复的响应速度。
优选地,智能提示答案的装置还包括:
问题库维护单元40,配置用于将问题库分类为公共问题库和私有问题库,以及响应于用户基于所提供的答案确定的最终答案,将问题Q和所述最终答案组合,添加至私有问题库。其中,公共问题库为收集公司业务范围内问题和标准答案构成,私有问题库为每个用户根据自身需求自定义形成。
进一步优选地,该答案筛选单元30,配置用于按照相似度高优先和私有问题优先的排序原则对对问题库问题Qi进行排序,并将排序结果最靠前的若干(例如,3个,5个,或10个)问题库问题Qi的***给用户。
上述实施例中,答案筛选单元30通过合理的排序和筛选规则,进一步有助于快速准确地得到最优提示答案,从而进一步提高了问题答复的速度和准确性。用户(例如,客服)可以从提供的提示答案中,挑选合适的答案直接回答给客户,也可以在提示答案的基础上进行修改后间接回答给客户。进一步通过问题库维护单元40,配置公共问题库和私有问题库,既保证了答复的准确性和一致性,又实现了答复的灵活性和个性化。私有问题库可以仅限用户自己使用,或者仅限有权限的用户群组使用。
图3示出了适于用来实现本申请实施例的设备的结构示意图。
如图3所示,设备300包括中央处理单元(CPU)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储部分308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有设备300操作所需的各种程序和数据。CPU301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
以下部件连接至I/O接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至I/O接口305。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。
特别地,根据本公开的实施例,上文参考图1描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,该计算机程序包含用于执行图1的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分309从网络上被下载和安装,和/或从可拆卸介质311被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (17)
1.一种智能提示答案的方法,其特征在于,所述方法包括:
分析并提取问题Q的信息特征,所述信息特征包括词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q);
计算所述问题Q和问题库中问题Qi之间的每一类信息特征的相似度,获得所述问题Q和问题库中问题Qi的相似度Sim(Q,Qi),其中所述问题库中包含问题Qi以及对应的答案;以及
根据所述相似度Sim(Q,Qi)对问题库问题Qi进行排序,将排序结果最靠前的若干问题库问题Qi的***给用户。
2.根据权利要求1所述的智能提示答案的方法,其特征在于,所述分析并提取问题Q的信息特征,包括:
对所述问题Q进行分词,获得分词序列S1(Q);
对所述分词序列S1(Q)进行词性标注,获得词法特征S2(Q);
根据语义词典对所述词法特征S2(Q)进行语义标注,获得语义词法特征S3(Q);
对所述词法特征S2(Q)进行相邻组合,获得句法特征S4(Q);以及
对所述语义词法特征S3(Q)进行相邻组合,获得语义句法特征S5(Q)。
3.根据权利要求2所述的智能提示答案的方法,其特征在于,所述对分词序列S1(Q)进行词性标注,获得词法特征S2(Q),包括:
对所述分词序列S1(Q)进行词性标注,并保留其中的名词、动词、形容词和疑问词,得到词性标注序列;
所述词法特征S2(Q)为所述词性标注序列。
4.根据权利要求2所述的智能提示答案的方法,其特征在于,所述根据语义词典对所述词法特征S2(Q)进行语义标注,获得语义词法特征S3(Q),包括:
查找语义词典,将所述词法特征S2(Q)中登录在所述语义词典中的词语转换为对应的义原,并将未登录在所述语义词典中的词语作为义原保留,从而将所述词法特征S2(Q)转换为义原序列;
所述语义词法特征S3(Q)为所述义原序列。
5.根据权利要求1-4任一项所述的智能提示答案的方法,其特征在于,按照下式计算所述每一类信息特征的相似度Sim(Sj(Q),Sj(Qi)):
<mrow>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mi>Q</mi>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>)</mo>
<mo>=</mo>
<mfrac>
<mrow>
<mi>C</mi>
<mi>o</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mi>Q</mi>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>N</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mi>Q</mi>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>&sigma;</mi>
</mrow>
</mfrac>
<mo>;</mo>
</mrow>
其中,Com(Sj(Q),Sj(Qi))为Sj(Q)和Sj(Qi)的公共元素数量,Num(Sj(Q),Sj(Qi))为Sj(Q)和Sj(Qi)中的最大元素数量,σ为平滑参数,元素为词语、词语组合、义原或义原组合,j=2、3、4或5。
6.根据权利要求5所述的智能提示答案的方法,其特征在于,按照下式计算所述问题和问题库中问题Qi的相似度Sim(Q,Qi):
<mrow>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>Q</mi>
<mo>,</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>2</mn>
</mrow>
<mn>5</mn>
</munderover>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mi>Q</mi>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
<mn>4</mn>
</mfrac>
<mo>;</mo>
</mrow>
其中,Sim(Sj(Q),Sj(Qi))为每一类信息特征的相似度,j=2、3、4或5。
7.根据权利要求1-6任一项所述的智能提示答案的方法,其特征在于,所述问题库包括公共问题库和私有问题库。
8.根据权利要求7所述的智能提示答案的方法,其特征在于,所述根据所述相似度对问题库问题Qi进行排序,将排序结果最靠前的若干问题库问题Qi的***给用户,包括:
按照相似度高优先和私有问题优先的排序原则进行排序。
9.根据权利要求8所述的智能提示答案的方法,其特征在于,所述方法还包括:
响应于用户基于所提供的答案确定的最终答案;
将所述问题Q和所述最终答案组合,添加至所述私有问题库。
10.一种智能提示答案的装置,其特征在于,所述装置包括:
特征提取单元,配置用于分析并提取问题Q的信息特征,所述信息特征包括词法特征S2(Q)、句法特征S4(Q)、语义词法特征S3(Q)和语义句法特征S5(Q);
相似度计算单元,配置用于计算所述问题Q和问题库中问题Qi之间的每一类信息特征的相似度,获得所述问题Q和问题库中问题Qi的相似度Sim(Q,Qi),其中所述问题库中包含问题Qi以及对应的答案;以及
答案筛选单元,配置用于根据所述相似度Sim(Q,Qi)对问题库问题Qi进行排序,将排序结果最靠前的若干问题库问题Qi的***给用户。
11.根据权利要求10所述的智能提示答案的装置,其特征在于,所述特征提取单元配置用于按如下分析并提取问题Q的信息特征:
对所述问题Q进行分词,获得分词序列S1(Q);
对所述分词序列S1(Q)进行词性标注,获得词法特征S2(Q);
根据语义词典对所述词法特征S2(Q)进行语义标注,获得语义词法特征S3(Q);
对所述词法特征S2(Q)进行相邻组合,获得句法特征S4(Q);以及
对所述语义词法特征S3(Q)进行相邻组合,获得语义句法特征S5(Q)。
12.根据权利要求10-11任一项所述的智能提示答案的装置,其特征在于,所述相似度计算单元配置用于按照下式计算所述每一类信息特征的相似度Sim(Sj(Q),Sj(Qi)):
<mrow>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mi>Q</mi>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<mi>C</mi>
<mi>o</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mi>Q</mi>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>N</mi>
<mi>u</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mi>Q</mi>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>&sigma;</mi>
</mrow>
</mfrac>
<mo>;</mo>
</mrow>
其中,Com(Sj(Q),Sj(Qi))为Sj(Q)和Sj(Qi)的公共元素数量,Num(Sj(Q),Sj(Qi))为Sj(Q)和Sj(Qi)中的最大元素数量,σ为平滑参数,元素为词语、词语组合、义原或义原组合,j=2、3、4或5。
13.根据权利要求12所述的智能提示答案的装置,其特征在于,所述相似度计算单元配置用于按照下式计算所述问题和问题库中问题Qi的相似度Sim(Q,Qi):
<mrow>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>Q</mi>
<mo>,</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>2</mn>
</mrow>
<mn>5</mn>
</munderover>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mi>Q</mi>
<mo>)</mo>
<mo>,</mo>
<msub>
<mi>S</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<msub>
<mi>Q</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
<mn>4</mn>
</mfrac>
<mo>;</mo>
</mrow>
其中,Sim(Sj(Q),Sj(Qi))为每一类信息特征的相似度,j=2、3、4或5。
14.根据权利要求10-13任一项所述的智能提示答案的装置,其特征在于,所述装置还包括:
问题库维护单元,配置用于将所述问题库分类为公共问题库和私有问题库,以及响应于用户基于所提供的答案确定的最终答案,将所述问题Q和所述最终答案组合,添加至所述私有问题库。
15.根据权利要求14所述的智能提示答案的装置,其特征在于,所述答案筛选单元配置用于按照相似度高优先和私有问题优先的排序原则进行排序。
16.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710452312.XA CN107436916B (zh) | 2017-06-15 | 2017-06-15 | 智能提示答案的方法及装置 |
PCT/CN2017/118746 WO2018227930A1 (zh) | 2017-06-15 | 2017-12-26 | 智能提示答案的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710452312.XA CN107436916B (zh) | 2017-06-15 | 2017-06-15 | 智能提示答案的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107436916A true CN107436916A (zh) | 2017-12-05 |
CN107436916B CN107436916B (zh) | 2021-04-27 |
Family
ID=60458402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710452312.XA Active CN107436916B (zh) | 2017-06-15 | 2017-06-15 | 智能提示答案的方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107436916B (zh) |
WO (1) | WO2018227930A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033265A (zh) * | 2018-07-09 | 2018-12-18 | 苏州浪潮智能软件有限公司 | 一种人机交互方法及装置 |
WO2018227930A1 (zh) * | 2017-06-15 | 2018-12-20 | 百度在线网络技术(北京)有限公司 | 智能提示答案的方法及装置 |
CN110209768A (zh) * | 2019-05-31 | 2019-09-06 | 中国联合网络通信集团有限公司 | 自动问答的问题处理方法和装置 |
CN111931498A (zh) * | 2020-08-14 | 2020-11-13 | 工银科技有限公司 | 基于复杂度分析的用户在线提问处理方法及*** |
WO2021017721A1 (zh) * | 2019-08-01 | 2021-02-04 | 平安科技(深圳)有限公司 | 智能问答方法、装置、介质及电子设备 |
CN112581954A (zh) * | 2020-12-01 | 2021-03-30 | 杭州九阳小家电有限公司 | 一种高匹配性语音交互方法和智能设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101286161A (zh) * | 2008-05-28 | 2008-10-15 | 华中科技大学 | 一种基于概念的智能中文问答*** |
CN101373532A (zh) * | 2008-07-10 | 2009-02-25 | 昆明理工大学 | 旅游领域faq中文问答***实现方法 |
CN102456060A (zh) * | 2010-10-28 | 2012-05-16 | 株式会社日立制作所 | 信息处理装置及信息处理方法 |
CN103577556A (zh) * | 2013-10-21 | 2014-02-12 | 北京奇虎科技有限公司 | 一种获取问答对的相关联程度的装置和方法 |
CN103810218A (zh) * | 2012-11-14 | 2014-05-21 | 北京百度网讯科技有限公司 | 一种基于问题簇的自动问答方法和装置 |
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答*** |
CN103970729A (zh) * | 2014-04-29 | 2014-08-06 | 河海大学 | 一种基于语义类的多主题提取方法 |
US20140342320A1 (en) * | 2013-02-15 | 2014-11-20 | Voxy, Inc. | Language learning systems and methods |
CN104573028A (zh) * | 2015-01-14 | 2015-04-29 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和*** |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598445B (zh) * | 2013-11-01 | 2019-05-10 | 腾讯科技(深圳)有限公司 | 自动问答***和方法 |
CN104503998B (zh) * | 2014-12-05 | 2018-11-20 | 百度在线网络技术(北京)有限公司 | 针对用户查询句的类型识别方法及装置 |
CN104850539B (zh) * | 2015-05-28 | 2017-08-25 | 宁波薄言信息技术有限公司 | 一种自然语言理解方法及基于该方法的旅游问答*** |
CN107436916B (zh) * | 2017-06-15 | 2021-04-27 | 百度在线网络技术(北京)有限公司 | 智能提示答案的方法及装置 |
-
2017
- 2017-06-15 CN CN201710452312.XA patent/CN107436916B/zh active Active
- 2017-12-26 WO PCT/CN2017/118746 patent/WO2018227930A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101286161A (zh) * | 2008-05-28 | 2008-10-15 | 华中科技大学 | 一种基于概念的智能中文问答*** |
CN101373532A (zh) * | 2008-07-10 | 2009-02-25 | 昆明理工大学 | 旅游领域faq中文问答***实现方法 |
CN102456060A (zh) * | 2010-10-28 | 2012-05-16 | 株式会社日立制作所 | 信息处理装置及信息处理方法 |
CN103810218A (zh) * | 2012-11-14 | 2014-05-21 | 北京百度网讯科技有限公司 | 一种基于问题簇的自动问答方法和装置 |
US20140342320A1 (en) * | 2013-02-15 | 2014-11-20 | Voxy, Inc. | Language learning systems and methods |
CN103577556A (zh) * | 2013-10-21 | 2014-02-12 | 北京奇虎科技有限公司 | 一种获取问答对的相关联程度的装置和方法 |
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答*** |
CN103970729A (zh) * | 2014-04-29 | 2014-08-06 | 河海大学 | 一种基于语义类的多主题提取方法 |
CN104573028A (zh) * | 2015-01-14 | 2015-04-29 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和*** |
Non-Patent Citations (1)
Title |
---|
徐启菊: "基于T-CRFs模型语义标注在智能问答***中的应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018227930A1 (zh) * | 2017-06-15 | 2018-12-20 | 百度在线网络技术(北京)有限公司 | 智能提示答案的方法及装置 |
CN109033265A (zh) * | 2018-07-09 | 2018-12-18 | 苏州浪潮智能软件有限公司 | 一种人机交互方法及装置 |
CN109033265B (zh) * | 2018-07-09 | 2020-10-16 | 苏州浪潮智能软件有限公司 | 一种人机交互方法及装置 |
CN110209768A (zh) * | 2019-05-31 | 2019-09-06 | 中国联合网络通信集团有限公司 | 自动问答的问题处理方法和装置 |
CN110209768B (zh) * | 2019-05-31 | 2021-08-10 | 中国联合网络通信集团有限公司 | 自动问答的问题处理方法和装置 |
WO2021017721A1 (zh) * | 2019-08-01 | 2021-02-04 | 平安科技(深圳)有限公司 | 智能问答方法、装置、介质及电子设备 |
CN111931498A (zh) * | 2020-08-14 | 2020-11-13 | 工银科技有限公司 | 基于复杂度分析的用户在线提问处理方法及*** |
CN111931498B (zh) * | 2020-08-14 | 2024-03-01 | 中国工商银行股份有限公司 | 基于复杂度分析的用户在线提问处理方法及*** |
CN112581954A (zh) * | 2020-12-01 | 2021-03-30 | 杭州九阳小家电有限公司 | 一种高匹配性语音交互方法和智能设备 |
CN112581954B (zh) * | 2020-12-01 | 2023-08-04 | 杭州九阳小家电有限公司 | 一种高匹配性语音交互方法和智能设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107436916B (zh) | 2021-04-27 |
WO2018227930A1 (zh) | 2018-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107436916A (zh) | 智能提示答案的方法及装置 | |
CN110175325B (zh) | 基于词向量和句法特征的评论分析方法及可视化交互界面 | |
Gupta et al. | Amazonqa: A review-based question answering task | |
CN101681251B (zh) | 从文档到排名短语的语义分析 | |
CN105630768B (zh) | 一种基于层叠条件随机场的产品名识别方法及装置 | |
CN104239331B (zh) | 一种用于实现评论搜索引擎排序的方法和装置 | |
CN105069143B (zh) | 提取文档中关键词的方法及装置 | |
CN105117398B (zh) | 一种基于众包的软件开发问题自动应答方法 | |
CN107305578A (zh) | 人机智能问答方法和装置 | |
CN107730346A (zh) | 物品聚类的方法和装置 | |
CN109299865A (zh) | 基于语义分析的心理测评***及方法、信息数据处理终端 | |
WO2020237872A1 (zh) | 语义分析模型准确度的校验方法、装置、存储介质及设备 | |
CN108573041A (zh) | 基于加权信任关系的概率矩阵分解推荐方法 | |
CN107102993A (zh) | 一种用户诉求分析方法和装置 | |
CN107291775A (zh) | 错误样本的修复语料生成方法和装置 | |
CN107798622A (zh) | 一种识别用户意图的方法和装置 | |
CN110348919A (zh) | 物品推荐方法、装置和计算机可读存储介质 | |
Khanna et al. | Sentiment analysis: An approach to opinion mining from twitter data using R | |
CN107368489A (zh) | 一种资讯数据处理方法及装置 | |
CN108804541A (zh) | 电商标题优化***及优化方法 | |
CN107346344A (zh) | 文本匹配的方法和装置 | |
CN113627797A (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN110309513B (zh) | 一种文本依存分析的方法和装置 | |
CN105931055A (zh) | 一种面向众包平台的服务商特征建模方法 | |
Kitanaka et al. | Introducing a new, machine learning process, and online tools for conducting sales literature reviews: An application to the forty years of JPSSM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |