CN105653619B - 智能问答***中正确日志库的更新方法和装置 - Google Patents

智能问答***中正确日志库的更新方法和装置 Download PDF

Info

Publication number
CN105653619B
CN105653619B CN201510993059.XA CN201510993059A CN105653619B CN 105653619 B CN105653619 B CN 105653619B CN 201510993059 A CN201510993059 A CN 201510993059A CN 105653619 B CN105653619 B CN 105653619B
Authority
CN
China
Prior art keywords
abstract semantics
semantic
customer problem
expression formula
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510993059.XA
Other languages
English (en)
Other versions
CN105653619A (zh
Inventor
曾永梅
朱频频
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Original Assignee
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhizhen Intelligent Network Technology Co Ltd filed Critical Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority to CN201510993059.XA priority Critical patent/CN105653619B/zh
Publication of CN105653619A publication Critical patent/CN105653619A/zh
Application granted granted Critical
Publication of CN105653619B publication Critical patent/CN105653619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种智能问答***中正确日志库的更新方法和装置。所述智能问答***包括抽象语义数据库,该抽象语义数据库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,该正确日志库包括用户问题和答案,所述更新方法包括:对该用户问题进行抽象语义推荐处理,并获取推荐到的抽象语义表达式对应的类别;提取所获取类别的抽象语义集合,以用所提取的抽象语义集合对该用户问题进行扩充处理,获得一个或多个具体语义表达式;将该具体语义表达式添加至该正确日志库中。本发明可以大大的增加正确日志库的量,能减少第二次迭代时需要人工审核的日志总数,即正确日志库对用户日志的覆盖率增加。

Description

智能问答***中正确日志库的更新方法和装置
技术领域
本发明涉及人机交互技术领域,尤其涉及智能问答***中正确日志库的更新方法和装置。
背景技术
人机交互是研究***与用户之间的交互关系的科学。***可以是各种各样的机器,也可以是计算机化的***和软件。例如,通过人机交互可以实现各种人工智能***,例如,智能客服***、语音控制***等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。
智能问答***是人机交互的一种典型应用,其中当用户提出问题后,智能问答***给出该问题的答案。为此,智能问答***中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答***首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。
智能问答***的维护更新是一项重要挑战。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
根据本发明的一方面,提供了一种智能问答***中正确日志库的更新方法,该智能问答***包括抽象语义数据库,该抽象语义数据库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,该正确日志库包括用户问题和答案,该更新方法包括:
对该用户问题进行抽象语义推荐处理,并获取推荐到的抽象语义表达式对应的类别;
提取所获取类别的抽象语义集合,以用所提取的抽象语义集合对该用户问题进行扩充处理,获得一个或多个具体语义表达式;
将该具体语义表达式添加至该正确日志库中。
在一实例中,该抽象语义表达式包括缺失语义成分;该扩充处理包括:
从该用户问题中提取与所提取的抽象语义集合的每一抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充至每一抽象语义表达式对应的缺失语义成分中以得到与该用户问题对应的具体语义表达式。
在一实例中,该抽象语义推荐处理包括:
对该用户问题进行分词处理,得到若干单词,该单词为语义规则词或非语义规则词;
分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;
分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;
根据该词性信息和词类信息对抽象语义数据库进行搜索处理,得到与该用户问题匹配的抽象语义表达式。
在一实例中,该抽象语义表达式还包括语义规则词,与该用户匹配的抽象语义表达式满足以下条件:
抽象语义表达式的缺失语义成分对应的词性包括用户问题对应的填充内容的词性;
抽象语义表达式和用户问题中对应的语义规则词相同或属于同一词类;
抽象语义表达式的顺序与用户问题的表达顺序相同。
在一实例中,该方法还包括:
接收人工维护知识点的数据信息,并根据该数据信息对正确日志库进行更新处理。
根据本发明的另一方面,提供了一种智能问答***的日志分析方法,包括:
获取用户日志数据;
至少从该用户日志数据中滤除与正确日志库中内容相匹配的日志,该正确日志库是通过前述方法更新的正确日志库。
根据本发明的另一方面,提供了一种智能问答***中正确日志库的更新装置,该智能问答***包括抽象语义数据库,该抽象语义数据库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,该正确日志库包括用户问题和答案,该更新装置包括:
抽象语义推荐模块,用于对该用户问题进行抽象语义推荐处理,并获取推荐到的抽象语义表达式对应的类别;
扩充模块,用于提取所获取类别的抽象语义集合,以用所提取的抽象语义集合对该用户问题进行扩充处理,获得一个或多个具体语义表达式;以及
添加模块,用于将该具体语义表达式添加至该正确日志库中。
在一实例中,该抽象语义表达式包括缺失语义成分;该扩充模块包括:
提取模块,用于从该用户问题中提取与所提取的抽象语义集合的每一抽象语义表达式的缺失语义成分对应的内容;以及
填充模块,用于将提取的内容填充至每一抽象语义表达式对应的缺失语义成分中以得到与该用户问题对应的具体语义表达式。
在一实例中,该抽象语义推荐模块包括:
分词模块,用于对该用户问题进行分词处理,得到若干单词,该单词为语义规则词或非语义规则词;
词性标注模块,用于分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;
词类判断模块,用于分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;
搜索模块,用于根据该词性信息和词类信息对抽象语义数据库进行搜索处理,得到与该用户问题匹配的抽象语义表达式。
在一实例中,该抽象语义表达式还包括语义规则词,与该用户匹配的抽象语义表达式满足以下条件:
抽象语义表达式的缺失语义成分对应的词性包括用户问题对应的填充内容的词性;
抽象语义表达式和用户问题中对应的语义规则词相同或属于同一词类;
抽象语义表达式的顺序与用户问题的表达顺序相同。
在一实例中,该装置还包括:
维护模块,用于接收人工维护知识点的数据信息,并根据该数据信息对正确日志库进行更新处理。
根据本发明的另一方面,提供了一种智能问答***的日志分析装置,包括:
获取模块,用于获取用户日志数据;以及
过滤模块,用于至少从该日志数据中滤除与正确日志库中内容相匹配的日志,该正确日志库是通过前述装置更新的正确日志库。
与现有技术相比,本发明的有益效果包括:
本发明可以自动对智能问答***中正确日志库进行更新,从而大大的增加正确日志库的量,减少第二次迭代时需要人工审核的日志总数,即正确日志库对用户日志的覆盖率增加。
附图说明
在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
图1是示出了根据本发明的一方面的智能问答***中正确日志库的更新方法的流程图;以及
图2是示出了根据本发明的一方面的智能问答***中正确日志库的更新装置的框图。
具体实施方式
以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。
知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。在本发明中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制***的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。
用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别***马上能够理解用户的意思。然而,用户往往并非使用的是标准问,而是标准问的一些变形的形式。例如,若对于收音机的电台切换的标准问形式是“换一个电台”,那么用户可能使用的命令是“切换一个电台”,机器也需要能够识别用户表达的是同一个意思。
因此,对于智能语义识别而言,知识库里需要有标准问的扩展问,该扩展问与标准问表达形式有略微差异,但是表达相同的含义。
进一步,为了更准确、高效地识别用户问题,智能问答***还发展出了抽象语义的概念。抽象语义是对本体类属性的进一步抽象。一个类别的抽象语义通过一组抽象语义表达式的集合来描述一类抽象语义的不同表达,为表达更为抽象的语义,这些抽象语义表达式在组成元素上进行了扩充。当这些扩充的元素一旦被赋予了相应的值就可以表达各种各样的具体语义。
每一个抽象语义表达式主要可包括缺失语义成分和语义规则词。缺失语义成分由语义成分符表示,当这些缺失的语义成分被填充了相应的值(即内容)后可以表达各式各样的具体语义。
抽象语义的语义成分符可包括:
[concept]:表示主体或客体成份的词或短语。
比如:“彩铃如何开通”中的“彩铃”
[action]:表示动作成分的词或短语。
比如:“***如何办理”中的“办理”
[attribute]:表示属性成份的词或短语。
比如:“iphone有哪些颜色”中的“颜色”
[adjective]:表示修饰成分的词或短语。
比如:“冰箱哪个品牌便宜”中的“便宜”
一些主要的抽象语义类别示例有:
概念说明 [concept]是什么
属性构成 [concept]有哪些[attribute]
行为方式 [concept]如何[action]
行为地点 [concept]在什么地方[action]
行为原因 [concept]为什么会[action]
行为预测 [concept]会不会[action]
行为判断 [concept]有没有[attribute]
属性状况 [concept]的[attribute]是不是[adjective]
属性判断 [concept]是不是有[attribute]
属性原因 [concept]的[attribute]为什么这么[adjective]
概念比较 [concept1]和[concept2]的区别在哪里
属性比较 [concept1]和[concept2]的[attribute]有什么不同之处
问句在抽象语义层面的成份判断可以通过词性标注来做一般的评判,concept对应的词性为名词,action对应的词性为动词、attribute对应的词性为名词、adjective对应的是形容词。
以类别为“行为方式”的抽象语义[concept]如何[action]为例,该类别的抽象语义集合下可包括多条抽象语义表达式:
抽象语义类别:行为方式
抽象语义表达式:
a.[concept][需要|应该?][如何]<才[可以]?><进行?>[action]
b.{[concept]~[action]}
c.[concept]<的?>[action]<方法|方式|步骤?>
d.<有哪些|有什么|有没有><通过|用|在>[concept][action]<的?>[方法]
e.[如何][action]~[concept]
上述a、b、c、d四个抽象语义表达式都是用来描述“行为方式”这一抽象语义类别的。符号“|”表示“或”关系,符号“?”表示该成分可有可无。以上述抽象语义表达式c为例,可展开为以下的抽象语义表达:
c1.[concept]<的>[action]<方法>
c2.[concept]<的>[action]<方式>
c3.[concept]<的>[action]<步骤>
c4.[concept]<的>[action]
c5.[concept][action]<方法>
c6.[concept][action]<方式>
c7.[concept][action]<步骤>
c8.[concept][action]
在上述抽象语义表达式中,除了作为缺失语义成分的抽象的语义成分符之外,其他出现的具体的词如“如何”、“应该”、“方法”等等,这些词需要在抽象语义规则中被使用,所以可统称为语义规则词。
以上介绍了智能问答***中的一些基本概念。
智能问答***在使用中会产生大量的用户日志,每一条日志包括用户给出的用户问题以及针对该用户问题由智能问答***给出的答案。人工需要对智能问答***产生的海量的用户日志进行分析确认,以查看***给出的答案正确与否,以用于对智能问答***的优化和维护。
正确日志库是智能问答***中用于存储正确日志的数据库。在对产生的海量用户日志进行分析时,如果一条日志的内容与正确日志库中的一条日志相匹配,即该条日志的问题与正确日志库中该条日志的问题相同,则默认智能问答***的提供的答案必然是正确的,因此,无需再人工分析。
所以正确日志库可用于在人工分析所智能问答***所产生的海量用户日志之前,先对这些海量日志进行过滤,与正确日志库中的正确日志匹配的那些用户日志可以直接认为正确,无需再分析确认,而仅对其他的用户日志进行人工分析确认,这极大地降低了人工工作量。
可见,正确日志库所涵盖的正确日志的量越大越好,初始的正确日志库仅包括一些问题,如何扩充正确日志库以使其包括覆盖更多的内容至关重要。
在本发明中,发明人认识到如果正确日志库中的一个知识点引用的是抽象语义的话,那么所有抽象语义规则扩展出来的问题都将是正确的,可以进入正确日志库,这个量非常的大,而且扩展出来的问题都是通顺的,有意义的。这将大大的增加正确日志库的量,能减少第二次迭代时需要人工审核的日志总数,即正确日志库对用户日志的覆盖率增加。
图1示出了根据本发明的一方面的智能问答***中正确日志库的更新方法100的流程图。
该智能问答***包括抽象语义数据库,所述抽象语义数据库包括多个类别的抽象语义集合,如上述的“概念说明”、“属性构成”、“行为方式”等等。每个类别的抽象语义集合包括多个抽象语义表达式。仍以上述“行为方式”这一类别的抽象语义集合为例,包括抽象语义表达式a、b、c、d、e。
正确日志库中包括用户问题和答案。对于特定的一个用户问题,可利用抽象语义数据库中的抽象语义对该用户问题进行扩展,然后将扩展得到的问题再添加至正确日志库以扩充正确日志库的量。
在步骤102,可对该用户问题进行抽象语义推荐处理,并获取推荐到的抽象语义表达式对应的类别。
例如,正确日志库中的一个用户问题为:“怎么查违章”。
在此步骤中,需要找到抽象语义数据库中与该用户问题相对应的抽象语义类别。对于“怎么查违章”这一用户问题而言,对应的类别为“行为方式”的抽象语义集合。
在一实例中,该抽象语义推荐首先对该用户问题进行分词处理,得到若干单词,该单词为语义规则词或非语义规则词。
例如,“怎么查违章”可分为单词“怎么”、“查”、“违章”。这些单词中,“怎么”为语义规则词,“查”和“违章”是非语义规则词。
然后,分别对每个非语义规则词进行词性标注处理,例如“查”被标注为动词,“违章”被标注为名词。
之后,对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息。词类简单的理解即为一组有共性的词,这些词在语义上可以相似也可以不相似。
最后,根据这些词性信息和词类信息对抽象语义数据库进行搜索处理,得到与用户问题“怎么查违章”匹配的抽象语义表达式。
实践中,与用户匹配的抽象语义表达式满足以下条件:
1)抽象语义表达式的缺失语义成分对应的词性包括用户问题对应的填充内容的词性;
2)抽象语义表达式和用户问题中对应的语义规则词相同或属于同一词类;
3)抽象语义表达式的顺序与用户问题的表达顺序相同。
在上述抽象语义类别“行为方式”中,抽象语义表达式e的缺失语义成分action的词性为动词,用户问题“怎么查违章”对应的填充内容“查”也为动词,缺失语义成分concept的词性为名词,用户问题“怎么查违章”对应的填充内容“违章”也为名词,因此符合上述条件1)。
其次,抽象语义表达式e中的语义规则词“如何”与用户问题“怎么查违章”中对应的语义规则词“怎么”属于同一词类,因此符合上述条件2)。
最后,抽象语义表达式e的顺序也与用户问题的表达顺序相同,符合上述条件3)。
因此,在抽象语义数据库中,找到与用户问题“怎么查违章”匹配的抽象语义表达式e,即[如何][action]~[concept]。由于该抽象语义表达式属于“行为方式”类别,因此为其推荐“行为方式”这一类别的抽象语义集合。
需要注意的是,并不是一定能够找到匹配的抽象语义表达式,所以有些问题找不到推荐的抽象语义,此时,该用户问题无法采用本发明的方法扩展。
在步骤104,提取所获取类别的抽象语义集合,以用所提取的抽象语义集合对所述用户问题进行扩充处理,获得一个或多个具体语义表达式。
以上述用户问题“怎么查违章”为例,提取所获取的“行为方式”这一类别的抽象语义集合,获得抽象语义表达式:
a.[concept][需要|应该?][如何]<才[可以]?><进行?>[action]
b.{[concept]~[action]}
c.[concept]<的?>[action]<方法|方式|步骤?>
d.<有哪些|有什么|有没有><通过|用|在>[concept][action]<的?>[方法]
用上述抽象语义表达式对用户问题“怎么查违章”进行扩充处理。
在一实例中,从用户问题中提取与所提取的抽象语义集合的每一抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充至每一抽象语义表达式对应的缺失语义成分中以得到与该用户问题对应的具体语义表达式。
以抽象语义表达式a:[concept][需要|应该?][如何]<才[可以]?><进行?>[action]为例,从“怎么”、“查”、“违章”中提取与该表达式的缺失语义成分对应的内容:
concept对应的内容:“违章”
action对应的内容:“查”
因此,将“查”和“违章”违章填充至对应的缺失语义成分得到一具体语义表达式:[违章][需要|应该?][如何]<才[可以]?><进行?>[查询]。
以抽象语义表达式b.{[concept]~[action]}为例,从“怎么”、“查”、“违章”中提取与该表达式的缺失语义成分对应的内容:
concept对应的内容:“违章”
action对应的内容:“查”
因此,将“查”和“违章”违章填充至对应的缺失语义成分得到一具体语义表达式:[违章][查询]。
以抽象语义表达式c.[concept]<的?>[action]<方法|方式|步骤?>为例,从“怎么”、“查”、“违章”中提取与该表达式的缺失语义成分对应的内容:
concept对应的内容:“违章”
action对应的内容:“查”
因此,将“查”和“违章”违章填充至对应的缺失语义成分得到一具体语义表达式:[违章]<的?>[查询]<方法|方式|步骤?>。
以抽象语义表达式d.<有哪些|有什么|有没有><通过|用|在>[concept][action]<的?>[方法]为例,从“怎么”、“查”、“违章”中提取与该表达式的缺失语义成分对应的内容:
concept对应的内容:“违章”
action对应的内容:“查”
因此,将“查”和“违章”违章填充至对应的缺失语义成分得到一具体语义表达式:<有哪些|有什么|有没有><通过|用|在>[违章][查询]<的?>[方法]。
在步骤106,将得到的这些具体语义表达式添加至正确日志库中。
这些具体语义表达式展开后的每句话都是通顺的,正确日志库中由此得到扩容。
通过对正确日志库中的所有用户问题进行类似过程,可以极大地扩大正确日志库的量。
此外,还可以接收人工维护知识点的数据信息,并根据这些数据信息对正确日志库进行更新处理。需要说明的是,此时的更新处理可以为增加、删除或替换。
图2示出了根据本发明的一方面的智能问答***中正确日志库的更新装置200的框图。
如图2所示,该更新装置200可包括抽象语义推荐模块210、扩充模块220以及添加模块230。
抽象语义推荐模块210可对正确日志库中的用户问题进行抽象语义推荐处理,并获取推荐到的抽象语义表达式对应的类别。
在一实例中,抽象语义推荐模块210可包括分词模块211,以用于对该用户问题进行分词处理,得到若干单词,所述单词为语义规则词或非语义规则词。抽象语义推荐模块210还可包括词性标注模块212,以用于分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息,以及词类判断模块213,用于分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息。最后,抽象语义推荐模块210还可以包括搜索模块,以用于根据这些词性信息和词类信息对抽象语义数据库进行搜索处理,得到与该用户问题匹配的抽象语义表达式。
实践中,与用户匹配的抽象语义表达式满足以下条件:
抽象语义表达式的缺失语义成分对应的词性包括用户问题对应的填充内容的词性;
抽象语义表达式和用户问题中对应的语义规则词相同或属于同一词类;
抽象语义表达式的顺序与用户问题的表达顺序相同。
扩充模块220可用于提取所获取类别的抽象语义集合,以用所提取的抽象语义集合对该用户问题进行扩充处理,获得一个或多个具体语义表达式。
在一实例中,扩充模块220可包括提取模块221以用于从用户问题中提取与所提取的抽象语义集合的每一抽象语义表达式的缺失语义成分对应的内容。扩充模块220还可包括填充模块以用于将提取的内容填充至每一抽象语义表达式对应的缺失语义成分中以得到与用户问题对应的具体语义表达式。
添加模块230负责将将得到的具体语义表达式添加至正确日志库中。
在一些实例中,更新装置200还可包括维护模块以用于接收人工维护知识点的数据信息,并根据这些数据信息对正确日志库进行更新处理。需要说明的是,此时的更新处理可以为增加、删除或替换。
根据本发明的另一方面,还提供了用于智能问答***的日志分析方法和装置。
该日志分析方法和装置皆利用了上述更新后的正确日志库。例如,日志分析方法可在获取用户日志数据之后,至少从用户日志数据中滤除与正确日志库中内容相匹配的日志,该正确日志库是通过上述方法更新的正确日志库。
由于在人工分析所智能问答***所产生的海量用户日志之前,先对这些海量日志进行过滤,与正确日志库中的正确日志匹配的那些用户日志可以直接认为正确,无需再分析确认,而仅对其他的用户日志进行人工分析确认,这极大地降低了人工工作量。
相应地,日志分析装置可包括过滤模块,以在获取模块获取用户日志数据之后,至少从用户日志数据中滤除与正确日志库中内容相匹配的日志,该正确日志库是通过上述方法更新的正确日志库。
尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体***的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
软件应当被宽泛地解释成意味着指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行件、执行的线程、规程、函数等,无论其是用软件、固件、中间件、微代码、硬件描述语言、还是其它术语来述及皆是如此。
结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。
提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

Claims (10)

1.一种智能问答***中正确日志库的更新方法,其特征在于,所述智能问答***包括抽象语义数据库,所述抽象语义数据库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,所述正确日志库包括用户问题和答案,所述更新方法包括:
对所述用户问题进行抽象语义推荐处理,并获取推荐到的抽象语义表达式对应的类别;
提取所获取类别的抽象语义集合,以用所提取的抽象语义集合对所述用户问题进行扩充处理,获得一个或多个具体语义表达式;
将所述具体语义表达式添加至所述正确日志库中;所述抽象语义表达式包括缺失语义成分;所述扩充处理包括:
从所述用户问题中提取与所提取的抽象语义集合的每一抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充至每一抽象语义表达式对应的缺失语义成分中以得到与所述用户问题对应的具体语义表达式。
2.如权利要求1所述的更新方法,其特征在于,所述抽象语义推荐处理包括:
对所述用户问题进行分词处理,得到若干单词,所述单词为语义规则词或非语义规则词;
分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;
分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;
根据所述词性信息和词类信息对抽象语义数据库进行搜索处理,得到与所述用户问题匹配的抽象语义表达式。
3.如权利要求2所述的更新方法,其特征在于,所述抽象语义表达式还包括语义规则词,与所述用户匹配的抽象语义表达式满足以下条件:
抽象语义表达式的缺失语义成分对应的词性包括用户问题对应的填充内容的词性;
抽象语义表达式和用户问题中对应的语义规则词相同或属于同一词类;
抽象语义表达式的顺序与用户问题的表达顺序相同。
4.如权利要求1所述的更新方法,其特征在于,还包括:
接收人工维护知识点的数据信息,并根据所述数据信息对正确日志库进行更新处理。
5.一种智能问答***的日志分析方法,其特征在于,包括:
获取用户日志数据;
至少从所述用户日志数据中滤除与正确日志库中内容相匹配的日志,所述正确日志库是通过如权利要求1至4中任一项所述的方法更新的正确日志库。
6.一种智能问答***中正确日志库的更新装置,其特征在于,所述智能问答***包括抽象语义数据库,所述抽象语义数据库包括多个类别的抽象语义集合,每个类别的抽象语义集合包括多个抽象语义表达式,所述正确日志库包括用户问题和答案,所述更新装置包括:
抽象语义推荐模块,用于对所述用户问题进行抽象语义推荐处理,并获取推荐到的抽象语义表达式对应的类别;
扩充模块,用于提取所获取类别的抽象语义集合,以用所提取的抽象语义集合对所述用户问题进行扩充处理,获得一个或多个具体语义表达式;以及
添加模块,用于将所述具体语义表达式添加至所述正确日志库中;所述抽象语义表达式包括缺失语义成分;所述扩充模块包括:
提取模块,用于从所述用户问题中提取与所提取的抽象语义集合的每一抽象语义表达式的缺失语义成分对应的内容;以及
填充模块,用于将提取的内容填充至每一抽象语义表达式对应的缺失语义成分中以得到与所述用户问题对应的具体语义表达式。
7.如权利要求6所述的更新装置,其特征在于,所述抽象语义推荐模块包括:
分词模块,用于对所述用户问题进行分词处理,得到若干单词,所述单词为语义规则词或非语义规则词;
词性标注模块,用于分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;
词类判断模块,用于分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;
搜索模块,用于根据所述词性信息和词类信息对抽象语义数据库进行搜索处理,得到与所述用户问题匹配的抽象语义表达式。
8.如权利要求7所述的更新装置,其特征在于,所述抽象语义表达式还包括语义规则词,与所述用户匹配的抽象语义表达式满足以下条件:
抽象语义表达式的缺失语义成分对应的词性包括用户问题对应的填充内容的词性;
抽象语义表达式和用户问题中对应的语义规则词相同或属于同一词类;
抽象语义表达式的顺序与用户问题的表达顺序相同。
9.如权利要求6所述的更新装置,其特征在于,还包括:
维护模块,用于接收人工维护知识点的数据信息,并根据所述数据信息对正确日志库进行更新处理。
10.一种智能问答***的日志分析装置,包括:
获取模块,用于获取用户日志数据;以及
过滤模块,用于至少从所述日志数据中滤除与正确日志库中内容相匹配的日志,所述正确日志库是通过如权利要求6至9中任一项所述的装置更新的正确日志库。
CN201510993059.XA 2015-12-25 2015-12-25 智能问答***中正确日志库的更新方法和装置 Active CN105653619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510993059.XA CN105653619B (zh) 2015-12-25 2015-12-25 智能问答***中正确日志库的更新方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510993059.XA CN105653619B (zh) 2015-12-25 2015-12-25 智能问答***中正确日志库的更新方法和装置

Publications (2)

Publication Number Publication Date
CN105653619A CN105653619A (zh) 2016-06-08
CN105653619B true CN105653619B (zh) 2019-01-25

Family

ID=56476784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510993059.XA Active CN105653619B (zh) 2015-12-25 2015-12-25 智能问答***中正确日志库的更新方法和装置

Country Status (1)

Country Link
CN (1) CN105653619B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326452A (zh) * 2016-08-26 2017-01-11 宁波薄言信息技术有限公司 一种基于上下文的人机对话方法
CN106485328B (zh) * 2016-10-31 2020-06-19 上海智臻智能网络科技股份有限公司 信息处理***及方法
CN111382240B (zh) * 2018-12-27 2024-03-12 上海智臻智能网络科技股份有限公司 一种语义推理方法及其装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119697A (ja) * 2004-10-19 2006-05-11 Fuji Xerox Co Ltd 質問応答システム、質疑応答方法および質疑応答プログラム
CN102880645A (zh) * 2012-08-24 2013-01-16 上海云叟网络科技有限公司 语义化的智能搜索方法
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答***
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答***
CN104657346A (zh) * 2015-01-15 2015-05-27 深圳市前海安测信息技术有限公司 智能交互***中的问题匹配方法和***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119697A (ja) * 2004-10-19 2006-05-11 Fuji Xerox Co Ltd 質問応答システム、質疑応答方法および質疑応答プログラム
CN102880645A (zh) * 2012-08-24 2013-01-16 上海云叟网络科技有限公司 语义化的智能搜索方法
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答***
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答***
CN104657346A (zh) * 2015-01-15 2015-05-27 深圳市前海安测信息技术有限公司 智能交互***中的问题匹配方法和***

Also Published As

Publication number Publication date
CN105653619A (zh) 2016-06-08

Similar Documents

Publication Publication Date Title
US20190005029A1 (en) Systems and methods for natural language processing of structured documents
EP2664997A2 (en) System and method for resolving named entity coreference
Màrquez et al. Part-of-speech tagging using decision trees
KR20190133931A (ko) 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
CN106601237A (zh) 交互式语音应答***及其语音识别方法
CN109635288A (zh) 一种基于深度神经网络的简历抽取方法
KR20080092337A (ko) 자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서
WO2021100902A1 (ko) 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
Kausar et al. ProSOUL: a framework to identify propaganda from online Urdu content
CN108875059A (zh) 用于生成文档标签的方法、装置、电子设备和存储介质
CN104503998A (zh) 针对用户查询句的类型识别方法及装置
MXPA04011788A (es) Aprendizaje y uso de patrones de cadena generalizados para extraccion de informacion.
CN110096599B (zh) 知识图谱的生成方法及装置
KR20200105057A (ko) 질의 문장 분석을 위한 질의 자질 추출 장치 및 방법
CN112380848B (zh) 文本生成方法、装置、设备及存储介质
CN105653619B (zh) 智能问答***中正确日志库的更新方法和装置
CN105550360B (zh) 优化抽象语义库的方法及装置
CN105677637A (zh) 智能问答***中抽象语义库的更新方法及更新装置
CN109992651B (zh) 一种问题目标特征自动识别和抽取方法
CN112487154B (zh) 一种基于自然语言的智能搜索方法
CN109800430B (zh) 一种语义理解方法及***
CN116702736A (zh) 保险话术生成方法、装置、电子设备及存储介质
CN110162615A (zh) 一种智能问答方法、装置、电子设备和存储介质
CN111625623B (zh) 文本主题提取方法、装置、计算机设备、介质和程序产品
CN114298048A (zh) 命名实体识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Updating method and device of correct log base in Intelligent Question Answering System

Effective date of registration: 20220211

Granted publication date: 20190125

Pledgee: Bank of Shanghai Limited by Share Ltd. Pudong branch

Pledgor: SHANGHAI XIAOI ROBOT TECHNOLOGY Co.,Ltd.

Registration number: Y2022310000021