CN103902652A - 自动问答*** - Google Patents

自动问答*** Download PDF

Info

Publication number
CN103902652A
CN103902652A CN201410068844.XA CN201410068844A CN103902652A CN 103902652 A CN103902652 A CN 103902652A CN 201410068844 A CN201410068844 A CN 201410068844A CN 103902652 A CN103902652 A CN 103902652A
Authority
CN
China
Prior art keywords
answer
question
keyword
answering system
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410068844.XA
Other languages
English (en)
Inventor
郑海涛
古宁
江勇
夏树涛
赵从志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN GIISO INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN GIISO INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN GIISO INFORMATION TECHNOLOGY Co Ltd filed Critical SHENZHEN GIISO INFORMATION TECHNOLOGY Co Ltd
Priority to CN201410068844.XA priority Critical patent/CN103902652A/zh
Publication of CN103902652A publication Critical patent/CN103902652A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开的自动问答***中,用户交互单元接收用户输入的问题,问题分析单元对用户输入的问题进行抽取关键词并对关键词进行扩展,然后由信息检索单元根据扩展后的关键词在常问问题库中搜索问题答案,并返回相关的文档,最后由答案抽取单元根据与所述问题类型对应的答案抽取规则从所述信息检索单元返回的相关文档中抽取符合所述规则的答案,将抽取的答案发送至所述用户交互单元向用户反馈。与现有技术中的自动问答***相比,本发明实施例提供的自动问答***可以自动对关键词进行扩展以及对输入问题进行类型划分,不同类型的问题对应不同的类型,进而在该类型中搜索答案,提高了答***率和多样性。

Description

自动问答***
技术领域
本发明涉及计算机软件技术领域,特别涉及一种自动问答***。
背景技术
20世纪90年代以来,Internet在世界范围内得到了迅猛的发展,互联网上信息越来越多,为人们提供了丰富的信息资源。另一方面,网上的信息越来越多,极大地推动了自然语言处理技术的发展,同时也对自然语言处理技术提出了更高的要求:人们希望在杂乱无章的网络世界中快速、准确地获得自己想要的信息。虽然现在互联网上有很多搜索引擎可以帮助人们搜索自己想要的信息,但是目前的搜索引擎还有很多缺点,并不能满足人们方便、快速、准确地获取信息的需要。表现在以下三个方面:一是相关性信息太多。传统的搜索引擎返回的相关网页太多,用户很难快速准确地定位到所需的信息。例如,用户在Google上输入几个关键字,它有可能返回成千上万个网页,用户将浪费很多时间在这些网页中查找自己所需要的信息。二是以关键词的逻辑组合来表达检索需求,因为人们的检索需求往往是非常复杂而特殊的,是无法以几个关键词的简单组合来表达的,这样用户都没有将自己的检索意图表达清楚,搜索引擎自然也就没有办法找出令用户满意的答案了。三是以关键词为基础的索引、匹配算法,尽管该算法简单易行,毕竟停留在语言的表层,而没有触及语义,因此检索效果很难进一步提高。
自动问答(QA,Automatic Question Answering)技术正是为了满足人们的这种愿望伴随着自然语言的语义处理技术而发展起来的。人们可以用普通的问句对自动问答***提问,自动问答***将从知识库或者互联网中搜索相应的答案,然后把答案以简洁的形式直接返回给用户,而不是像搜索引擎那样返回给用户的是一堆相关的网页。这样用户就可以通过自动问答***方便地获得自己想要的信息。自动问答技术综合运用了知识表示、信息检索、自然语言处理等技术。自动问答***能够使用户以自然语言输入问题,而不是关键词的组合。而返回给用户的是简洁、准确的答案,而不是一些相关的网页。所以,问答***能更好的满足用户的检索需求,能更快地找出用户所需的答案。可以说,问答***就是新一代的搜索引擎。对于问答***,用户不需要把自己的问题分解成关键字,用户可以把整个问题直接交给问答***。问答***结合自然语言处理技术,通过对问题理解,能够直接提交给用户想要的答案。问答***就像一个知识渊博的专家,可以快速准确地回答任何问题。比如,用户提交一个问题“上海的简称是什么?”问答***将会直接给出答案“上海的简称是沪”。可以看出,问答***要比传统的搜索引擎方便、快捷、高效。
目前国内尚未比较成熟的自动问答***。现有技术提出的“一种基于问答库的中文自然语言问答方法”,通过互联网专业网站建立FAQ库,然后对用户查询分词分析得到相近的查询问句,即以问句检索问句,匹配答案的方式,主要包含问答库的建立和问句相似度计算两方面。腾讯科技(深圳)有限公司提出的“一种自动问答***及方法”在问答***中提供了对关键词的归一化处理单元,使用户输入语句中关键词通过归一化处理能够转化为推理知识库中通用的关键词,从而减少搭建推理知识库的工作量。华中科技大学提出的“一种基于概念的智能中文问答***”能对用户输入的问句处理后关键词串进行同义扩展,更好的理解问句,进行检索,提高了问答***的查全率,从词形,词序,词长三方面给出了一种基于概念的中文句子相似度计算方法,提高了查准率。昆明理工大学提出的“旅游领域FAQ中文问答***实现方法”提供了一种旅游领域FAQ中文问答***的实现方法,包括FAQ收集和组织,旅游领域知识库构建,用户查询,答案提取等步骤。该实现借助了本体论的思想,构建了旅游领域知识库-领域知网,利用KDML语言定义和描述了旅游领域术语与关系,并提出了一种旅游问句相似度计算方法。北京大学深圳研究生院提出的“一种自动问答方法及***”对问句进行分析,采用问点/条件点识别模型对分词后的词语进行标示,利用识别出的问句的问点、条件点查询SQL结构的信息资源库得到结果。百度在线网络技术(北京)有限公司提出的“一种形成提问的方法、装置和知识问答***的服务器端”提出了利用提问模板获取用户输入关键信息并提问的方式。华为技术有限公司提出的“一种多媒体问答***及方法”根据用户对用户输入问题进行解析,获取特征信息和语义类别,在预设多媒体数据库中查找该类别下相似度最高的问题对应的答案。
上述的技术中存在以下问题:
第一、基于常用问题库(FAQ)的问答***,问题库的规模和范围影响着答案的正确率,所以构建出一个比较全面的常用问题库是该类问题***需要解决的首要问题,而且基于问题库的问答***通常用于某个专业领域之内,其扩展性是比较差的。此外,用户输入问句与问题库用句之间的相似度计算是***的核心所在,其计算方法的精确性和高效性关系到整个***的精确性和效率。
第二、基于Internet的自动问答***,检索到的信息冗余过大,可能隶属多个主题信息,答案的抽取过程会比较复杂而且答***率得不到保证。
第三、检索中关键词匹配和语义扩展问题,但是由于汉语中表达方式灵活,具有相同语义句子其关键词的出现的位置也不定,关键词按序匹配往往不能满足检索要求,汉语中存在着大量的同义词,在问题和答案中完全不同的关键词可能含有相同的语义,如果不进行语义扩展也会造成检索失败,但是语义扩展提高了检索的召回率却可能降低检索的准确率,如果能智能的划分出所问问题的类型,则可以提高确准率。
第四、上述方法大多是以输入问题检索FAQ库中的问题,返回FAQ库中的最相似的问题的答案,对于一些开放问题,其答案往往是受限于某个领域之内,虽然能得到一个或者多个共性的答案,往往无法提供给用户多样性的答案进行参考。
发明内容
鉴于现有技术的不足,本发明目的在于提供一种自动对输入问题进行类型划分,在该类型中搜索答案的自动问答***。
本发明的技术方案如下:
一种自动问答***,包括:
用户交互单元,用于接收用户输入的问题以及将问题答案反馈给所述用户;
问题分析单元,用于抽取用户输入的问题的关键词,并对所述关键词进行扩展,以及根据预先设置的问题分类标准对问题进行类型划分得到所述问题的类型;
常问问题库,用于存储用户常问的问题和答案;
信息检索单元,用于根据所述问题分析单元扩展后的关键词在所述常问问题库中搜索问题答案,并返回相关的文档或答案;
答案抽取单元,用于根据与所述问题的类型对应的答案抽取规则从所述信息检索单元返回的相关文档中抽取符合所述规则的答案,将抽取的答案发送至所述用户交互单元。
有益效果:
本发明实施例公开的自动问答***中,用户交互单元接收用户输入的问题,问题分析单元对用户输入的问题进行抽取关键词并对关键词进行扩展,然后由信息检索单元根据扩展后的关键词在常问问题库中搜索问题答案,找到则直接答案发送至所述用户交互单元向用户反馈,否则返回相关的文档,最后由答案抽取单元根据与所述问题类型对应的答案抽取规则从所述信息检索单元返回的相关文档中抽取符合所述规则的答案,将抽取的答案发送至所述用户交互单元向用户反馈。与现有技术中的自动问答***相比,本发明实施例提供的自动问答***可以自动对关键词进行扩展以及对输入问题进行类型划分,不同类型的问题对应不同的类型,进而在该类型中搜索答案,提高了答***率和多样性。输入问题进行问题领域和类型划分,通过领域划分,在该领域范围下搜索,缩小了搜索范围,通过类型划分提供了答案抽取的匹配规则,根据规则返回该类型对应的答案,提高了答***率和多样性。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明实施例提供的自动问答***的结构示意图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参阅图1,其为本发明实施例提供的自动问答***的结构示意图。如图1所示,所述自动问答***包括:
用户交互单元10,用于接收用户输入的问题以及将问题答案反馈给所述用户;
问题分析单元20,用于抽取用户输入的问题的关键词,并对所述关键词进行扩展,以及根据预先设置的问题分类标准对问题进行类型划分得到所述问题的类型;
常问问题库30,用于存储用户常问的问题和答案;
信息检索单元40,用于根据所述问题分析单元20扩展后的关键词在所述常问问题库中搜索问题答案,并返回相关的文档或答案;
答案抽取单元50,用于根据与所述问题的类型对应的答案抽取规则从所述信息检索单元40返回的相关文档中抽取符合所述规则的答案,将抽取的答案发送至所述用户交互单元10。
本发明实施例公开的自动问答***中,用户交互单元10接收用户输入的问题,问题分析单元20对用户输入的问题进行抽取关键词并对关键词进行扩展,然后由信息检索单元40根据扩展后的关键词在常问问题库30中搜索问题答案,并返回相关的文档,最后由答案抽取单元50根据与所述问题类型对应的答案抽取规则从所述信息检索单元40返回的相关文档中抽取符合所述规则的答案,将抽取的答案发送至所述用户交互单元10向用户反馈。与现有技术中的自动问答***相比,本发明实施例提供的自动问答***可以自动对关键词进行扩展以及对输入问题进行类型划分,不同类型的问题对应不同的类型,进而在该类型中搜索答案,提高了答***率和多样性。
为更详细的理解在本发明实施例提供的自动问答***中,下面针对自动问答***中的各功能模块进一步介绍。
在本发明实施例中,用户交互单元10为用户输入查询问题和浏览问题答案的模块,通常使用浏览器,如常用的Internet Explorer,Firefox,Chrome浏览器等,将接收到的用户查询问题送到问题分析单元处理,或者从常用问题库得到的问题答案反馈给用户。
本发明实施例提供的自动问答***还包括本体知识库60,所述本体知识库为所述问题分析单元20提供共享词表。本发明实施例将本体引入自动问答***使***能够对用户查询词进行语义分析,更能充分理解用户的查询意图,从而有效的改善查准率和查全率。本体描述了领域的概念以及他们之间的语义关系,可以帮助机器对领域知识有深刻理解的基础上做技术操作。具体的,本体知识库是指一种形式化的,对于共享概念体系的明确而又详细的说明。本体知识库提供的是一种共享词表,也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系;本体知识库是一种特殊类型的术语集,具有结构化的特点,且更加适合于在计算机***之中使用;本体知识库实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达(formal representation)。
进一步的,本发明实施例提供的***利用了语义化的本体作为知识库,本体描述了领域的概念以及他们之间的语义关系,可以帮助机器对领域知识有深刻理解的基础上做技术操作。
本***采用一种全自动的本体构造方法。该方法不需要人工干预,一般而言只需要对每个概念定义少量的关键词即可。随后可以自动运行,从网络上抓取信息,对本体进行构造。此方法对每个本体概念的训练过程可以分成4步:
步骤(1)用搜索引擎查询相关文档;
步骤(2)根据步骤(1)中的文档,用LDA模型生成候选词;
步骤(3)对候选词进行用语义距离公式进行打分,如NGD,WebJaccard等;
步骤(4)将打分后的词加入到本体概念的实例当中;
构造算法的第一步是为本体中的每个概念查找相关的文档。例如,我们可以从百度新闻中查询最近的热门新闻作为相关文档。
构造算法的第二步是从第一步得出的文档中选取候选词。这些候选词应该是在这个文档集中比较重要的词。这里我们用LDA(Latent DirichletAllocation)模型进行关键词提取。LDA是一种文档集的概率生成模型。他的基本思想是:每个文档都是由一系列遵循一定分布的隐含主题构成的,而每个主题中的可能出现的词也有其特定的分布。在所有词的权重都计算出来之后,我们对这些词进行排序,并选择前n(n=400)个词作为对应概念的候选词。
为了对选取的候选词进行更精确的评分,我们用基于搜索引擎查询返回数目的公式进行打分,最常用的公式为:Normalized GoogleDistance(NGD)。NGD是一个用Google搜索结果对两个词之间的关系紧密度进行评价的公式。在我们的模型中,给定一个词w和一个概念c,要计算他们之间的NGD值就必须选取一个词代表该概念。因此我们在本体中增加一个属性tag,代表每个概念的定义词。
最后选取重新打分之后得分最高的前n个候选词加入到本体概念的实例当中,通过上述过程,得到了概念及其实例,但是概念和概念之间以及概念和属性之间的关系尚未添加,这可以借助HowNet来实现。HowNet是一个以双语为代表的常识知识库,其基本组织单位是概念。概念使用义原定义。概念与概念的关系、概念与义原的关系以及义原与义原的关系构成了HowNet的网状知识体系。HowNet定义了上下位关系、同义关系、反义关系、对义关系、属性-宿主关系、部件-整体关系、材料-成品关系、事件-角色关系8种关系,从而完成本体的自动构造过程。
问题理解是问答***进行检索前所必需的分析工作,这个过程分析的效果对后面的处理过程有着重要的影响。问题理解部分需要完成以下几部分工作:提取出问题的关键词、依据问题的类型等因素对关键词进行适当的扩展,确定问题所属的类别,按预先定义的问题模式对问题进行模式抽取得到问题类型。如果是汉语的问答***,首先要对问题进行分词以及词性标注等。
词语是信息表达的最小单位,而汉语不同于西方语言,其句子的词语间没有分隔符(空格),因此需要进行词语进行切分。本发明实施例提供的问题分析单元20包括:中文词语处理模块21,用于对用户输入的中文问题进行词语切分和词性标注。
汉语词语切分中存在切分歧异,如句子“使用户满意”可切分为“使/用户/满意”,也可能被错误地切分为“使用/户/满意”,因而需要利用各种上下文知识解决词语切分歧异。在切分的基础上,利用基于规则和统计(马尔科夫链)的方法进行词性标注。基于马尔科夫链随机过程的n元语法统计分析方法,被证明在词性标注中能达到较高的精度。这里本发明实施例使用的分词程序是哈尔滨工业大学计算机学院机器翻译研究室所做的分词***,它能够将输入的汉语文本中的各个词断开,并在每个词后面用一个符号标明这个词的词性。例如:/ng表示一般名词,/nx表示中文姓氏,/vg表示一般动词等等。下面是一个经过分词和词性标注的例句:
哈尔滨/nd在/p什么/r地方/ng?/wj
进一步的,本发明实施例提供的问题分析单元20包括关键词/概念抽取模块22,用于根据切分后的词语的词性抽取出关键词。
本发明实施例需要在用户提问的问题中,由关键词抽取模块22提取出对后面检索***有用的关键字。并不是在问题中的每个词都可以提取出来作为检索***的关键词。比如,疑问词和一些常用的“吧、了、的”等词就应该被过滤掉,为此,需要一个停用词表来过滤这些词。
关键词主要由名词、动词、形容词、限定性副词等组成。关键词可以分为两种:一般性关键词、“必须含有”的关键词。所谓“必须含有”的关键词指的是这些关键词必须在答案句子中含有,而一般性关键词可以不被答案句子包含。关键词被赋予不同的权重,在检索句子时这些权重用来计算句子的权重。通常名词、具有限定性作用的副词会有比较高的权重。“必须含有”的关键词由专有名词、限定性副词(如:最大、最高、最快等)、时间(如:1997年)组成。之所以要制定“必须含有”的关键词原则是因为他们对问题有极强的限定性作用,如果不含有它们的句子是几乎不可能是正确的答案。例如:问题是“世界上最高的山峰是哪座山?”而检索的结果却出现“乔戈里山是世界第二高峰”,这显然不是用户想得到的结果,之所以出现这种情况的原因就在于非常重要的关键词“最高”没有被答案句子所含有。如果加上“必须含有”的关键词这个限制,那么这个答案就不会被检索出来,因此通过这些关键词的作用可以极大地提高检索的准确性。
本发明实施例提供的中文问答***还包括关键词拓展的过程,在答案句子中,某些词常常不是原来问题的关键词,而是这些词的同义扩展。例如:问题是“法国大革命哪一年发生?”,答案的句子是“18世纪末,法国爆发的资产阶级大革命。”在问题中使用的是“发生”,而答案中却用了“爆发”这个词。这就造成了关键词查询失败,因此本发明实施例需要对关键词进行适当的扩展。本发明实施例提供的自动问答***中的问题分析单元20还包括关键词扩展模块23,用于对抽取出的关键词进行同义扩展。
关键词扩展虽然提高了***的召回率,但如果扩展不适当会极大地降低检索的准确率,因此一般的问答***对关键词的扩展都是很谨慎的。在这里,本发明实施例从两个方面进行关键词扩展。首先,将所有词的同义词作为扩展的关键词;其次,对于某些类型的问题,所对应的答案中经常会出现某种共同特征的词。例如,对于询问地点的问题,答案中经常会出现“在”“位于”“地处”等关键词。本发明实施例把这些词也作为关键词进行扩展。
对于词义的拓展,在英语中常用的是WordNet。WordNet提供了词与近义词集合以及近义词集合之间关系网络。通过WordNet中词的hypernym指针,就可以找出词与词之间的远近程度。例如,“ex-husband”和“ex-wife”的hypernym指针都指向“ex-spouse”,于是这两个词在语义上可以通过“ex-spouse”联系在一起。WordNet***是用于英文的,对于中文,可以用知网(HowNet)作为***的语义知识资源。知网是一个以汉语和英语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。它是一个网状的有机的知识***。
本发明实施例提供的中文问答***还包括问题类型划分的过程,在本发明实施例中,每一个问题往往都由特定的类型(即领域),例如“中华人民共和国是什么时候成立的?”属于历史领域(历史类型),“姚明身高多少?”属于体育领域(体育类型);“长江有多长?”属于地理领域。预先对FAQ库中的常问问题进行按领域的分类,再对输入问题进行分类,然后在该类下进行检索,能够有效的提高检索的准确率和速度。目前大部分的自动问答***都是按照事先规定好的类别进行分类,但是这种分类还是存在很多不足的地方,太多人为的因素,而且分类太粗,并不能完全符合实际的要求,针对这一问题,本发明实施例***中将使用基于语义的自动分类方法。因此,本发明实施例提供的自动问答***中的问题分析单元20还包括问题类型划分模块24,用于根据预先设置的问题分类标准和所述扩展后的关键词划分所述问题的类型,或者用于根据所述扩展后的关键词的语义进行自动划分所述问题的类型。
本发明实施例提供的中文问答***还包括问题模式抽取的过程,这里本发明实施例以中文问答***为例。一般的问答***都按照疑问短语来对问题的进行模式抽取。下表列出了常见的问题类型:
表1常见问题类型
Figure BDA0000470464990000111
Figure BDA0000470464990000121
针对于不同类型的问题制定相应的答案抽取规则,以便在答案抽取阶段应用这些规则来抽取问题的答案。比如对于询问地点的问题,本发明实施例就可以规定,答案中必须含有位置信息。在***中将使用基于语义的自动模式抽取方法,首先收集大量的问题作为训练语料,然后通过程序统计出经常出现的疑问短语。比如通过统计,“什么颜色”这几个词经常出现在问题中,那本发明实施例就可以把“什么颜色”当作一个疑问短语。然后凡是含有“什么颜色”这个短语的问题都当作一类问题。
常用问题库(FAQ)20指的是常问问题库(Frequently-AskedQuestion)。常问问题库的作用是把用户经常问的问题和答案保存起来。这样,对于用户输入的问题,可以首先在FAQ库中搜索,看看有没有相同的问题。如果有,就可以直接把FAQ库中这个问题对应的答案返回给用户。这样,对于用户经常问的问题,问答***就可以很快地给出答案,而不需要经过后面复杂的处理过程,这样就大大提高了***的效率。
在本发明实施例中,自动问答***包括FAQ库30与FAQ库更新单元构成,常问问题库更新单元,用于在所述信息检索单元未在所述常问问题库中搜索到问题答案时从互联网搜索所述问题的答案,并将搜索到的答案加入所述常问问题库。
初始FAQ库的建立依托互联网上的相关资源,即使用网络爬虫对网页上的FAQ以及问答社区中的问答信息进行爬取,并在结构化数据处理后进行保存。含有FAQ的网页可以通过Google、百度等搜索引擎查找,方法为在这些搜索引擎中以“inurl:faq”为查询条件,搜索引擎返回的即是含有FAQ的网页。现有的互联网问答社区包括百度知道、新浪爱问等,这些开放社区允许普通用户浏览他们的问题和对应的解答,问题与答案在页面上的组织方式固定,并且对正确答案有明确标记,易于抽取。FAQ的更新单元是指对于FAQ库中没有用户所问的问题,那么本发明实施例会通过***的信息检索和答案抽取从Internet上找到匹配的答案,获取答案之后就可以将用户所问的这个问题和对应的答案加入FAQ库。
在本发明实施例中,信息检索单元40的任务就是用前面提取出来的关键字到文档库中查找相关的文档或答案。信息检索单元40返回的是一些最相关的文档。在问答***中的信息检索单元40也可以直接调用已有检索***,比如Smart***,或者也可调用Internet上的搜索引擎比如Google。信息检索单元40的输入一般都是关键字的组合,如果是英文的问答***,还需要对关键字进行词根操作(Stemming)。
要建立一个信息检索单元40,需要对文档库建立索引。这样才能快速地找到包含特定关键词的文档。在建立索引之前,有必要对语料进行预处理,比如去除重复的文档,如果是英文的语料需要进行词根操作(Stemming),如果是汉语语料则需要分词。
信息检索单元40中的关键是对文档权重的确定和对文档进行排序。文档的权重常用的是TF-IDF算法,公式如下:
WD = Σ i = 1 n ( KW i × TF i × IDF i ) + D
其中:KWi是该文档包含的第i个关键词在问题分析阶段的权重,TFi是该关键词在这篇文档中出现的频率,IDFi是该关键词在文档中出现的反频率,D是指关键字在文档中的分布密度。关键词在该文档中出现的频率越高则它的TF就越大,关键词在越多的文档中出现则它的IDF就越小,反之越大,关键词在这篇文档中分布的越集中,则D值越大。TF*IDF值从一个方面反映了该关键词的重要程度,通常在一个文档中经常出现(TF大)的词,而很少现在其他文档中的词(IDF大),该词所含有的信息量就越多,这个词也就越重要。另外如果关键词在文档中的分布越密集,则这篇文档包含相关答案的可能性越大,这篇文档的权重就越大。对文档计算完权重后,就可以按照权重对文档进行排序,把权重最大的那些文档返回给答案抽取单元50。
一般搜索引擎返回的是一堆文档(网页),而问答***需要返回的是简短的答案。所以本发明实施例自动问答***中的答案抽取单元50包括:
相关性排序模块,用于对信息检索单元40返回的相关文档进行相关性排序,获得相关性高的文档;文档抽取模块52,用于根据与所述问题类型对应的答案抽取规则从所述相关性高的文档中抽取符合所述规则的一个或多个答案;以及答案整理模块53,用于对所述答案抽取单元50抽取的多个答案进行聚类,将聚类后的答案发送至所述用户交互单元。其中,本发明实施例中对答案进行聚类的目的是为了让***能够尽可能的返回多样化的答案,从而最大限度的满足用户的提问要求。
相关性排序模块先要对返回的文档(例如网页)根据其相关性排序,取出其中相关性比较高的文档,交给答案抽取单元50中的文档抽取模块52来提炼一个或多个答案。答案的形式可以是词语、句子、段落或者文摘。如果答案的形式是词语、句子或者段落,处理起来还比较简单,如果答案的形式是文摘,那么就需要用到多文档自动文摘技术。抽取到了多个候选答案之后,本发明实施例中的答案整理模块53可以使用聚类的方法,对答案进行整理,根据答案的相关性和多样性的权衡反馈给用户交互单元10。
不同的问题往往有不同的答案形式以及不同的答案抽取方法。因此需要对每类问题制定一个答案抽取规则。根据问题的类型,答案的形式可以是词语、句子、段落或者文摘。另外,对于某些问题类型,答案必须满足特定的条件。表2是和表1对应的抽取答案规则。
表2答案抽取规则
Figure BDA0000470464990000151
如果以句子作为答案,处理起来相对简单一些,上述文档抽取模块52将相关性高的文档分为句子,根据TF-IDF算法计算每个句子的权重并根据权重排序得到候选答案,根据所述问题类型对所述候选答案进行排序获得所述问题的答案。但是,对于那些问时间地点的问题,其答案就比较简短,而用不着一句话。比如,对于问题:“中华人民共和国是什么时候成立的?”本发明实施例期待的答案是一个短语,即“1949年10月1日”。但是本发明实施例可能检索出这样的一句话:“自从1949年10月1日中华人民共和国成立以来至1994年底止,我国已经同世界上的约160个国家建立了外交关系,而且还同更多的国家和地区发展了经济贸易关系和文化往来。”从这个例子可以看出,本发明实施例所要的答案只是这句话中的一小部分,如果本发明实施例能把这整句话作为答案都提交给用户的话,显然冗余信息太多,所以需要将短语答案抽取出来。
为了处理的方便,很多的问答***返回的是句子作为答案。在这种***中,答案的抽取的详细步骤如下:
(1)把检索出来的文档分成句子
(2)按照一定的算法,计算每个句子的权重
(3)对句子按照权重进行排序
(4)根据问题的类型对候选答案重新排序
在步骤(2)中计算句子的权重还是采用上述的TF-IDF的算法,根据权重进行排序后,还需要对依据问题的类型对候选答案进行重新排序。每类问题对答案都有特殊的要求,所以每类问题都有自己特定的答案抽取规则。步骤(4)中的重新排序就是根据这些规则进行的。对于时间相关的问题,答案中就必须含有时间信息。对于数量相关的问题答案中必须含有数字信息,否则就不可能是正确答案。
此外,对于那些问时间地点的问题,可以用很短的语句来回答,而对于有些问题,简短的一个短语或者一句话很难说清楚,比如对于像“9.11事件是怎么回事?”这种问题,在互联网上有许多相关的报道,这些报道可能是从不同的方面描述这个事件。如果把这些相关报道都交给用户的话,那么用户将要花很多时间来阅读。如果能把这些相关报道做成一个简短的文摘,让用户只要看文摘就能知道整个事件的前因后果,那么将会为用户带来很大的方便。这就需要用到多文档自动文摘技术,本发明实施例中的文档抽取模块52提取各相关性高的文档中共同关注的内容作为所述问题的答案。多文档自动文摘模块能把信息检索单元40检索出来的相关文档做成文摘返回给用户。
多文档自动文摘的基本思想就是提取各文档中共同关注的主要内容,消除各文档之间相同的冗余信息,然后通过一定的算法生成文摘。多文档自动文摘可以通过句子的聚类来找出共同关注的主题,聚在一起的句子往往描述的是相同的问题,可以说一个类代表的是一个主题。聚在一起的句子数量越多,说明这个主体的重要性越大,然后再比较重要的主题中选出最具代表性的句子来组成文摘。
为更详细的理解在本发明实施例提供的自动问答***中,下面举例对对自动问答***中的各功能模块进一步介绍。
用户通过用户交互单元10输入查询问句,如“哈尔滨在什么地方?”;
问题分析单元20接收到该问题以后,由于词语是信息表达的最小单位,而汉语不同于西方语言,其句子的词语间没有分隔符(空格),因此需要进行词语进行切分。
首先对该问句进行分词和语义标注,使用的分词程序是哈尔滨工业大学计算机学院机器翻译研究室所做的分词***,它能够将输入的汉语文本中的各个词断开,并在每个词后面用一个符号标明这个词的词性。例如:/ng表示一般名词,/nx表示中文姓氏,/vg表示一般动词等等。下面是一个经过分词和词性标注的例句:
哈尔滨/nd在/p什么/r地方/ng?/wj
问题分析单元20中的关键词抽取模块22根据词性标注抽取出关键词,关键词主要由名词、动词、形容词、限定性副词等组成。关键词可以分为两种:一般性关键词、“必须含有”的关键词。所谓“必须含有”的关键词指的是这些关键词必须在答案句子中含有,而一般性关键词可以不被答案句子包含。关键词被赋予不同的权重,在检索句子时这些权重用来计算句子的权重。通常名词、具有限定性作用的副词会有比较高的权重。“必须含有”的关键词由专有名词、限定性副词(如:最大、最高、最快等)、时间(如:1997年)组成。之所以要制定“必须含有”的关键词原则是因为他们对问题有极强的限定性作用,如果不含有它们的句子是几乎不可能是正确的答案。上述问句中的“哈尔滨”、“在”、“地方”。
问题分析单元20中的关键词扩展模块23对关键词进行同义扩展,找到某些关键词的同义词。对于中文,可以用知网(HowNet)作为***的语义知识资源。知网是一个以汉语和英语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。它是一个网状的有机的知识***。上述的关键词中“在”和“位于”属于同义词,可以做同义词扩展,而且“位于”较“在”在书面用语中出现得更多,表意更清晰。
问题分析单元20中的问题类型划分模块24,则根据抽取出的关键词找出用户提问所在的知识领域,在本例中根据“哈尔滨”、“在”/“位于”,可以将其划分到地理知识领域,通过这样的划分可以缩小本发明实施例在FAQ库中检索问题的范围。
问题模式抽取则根据制定好的抽取规则,如表1所示,问题中的“什么地方”可以将问题类型定位为询问地点,以便根据此类型最后完成得到答案的抽取规则如表2,根据规则,得到抽取的答案中必须包含地点信息。
在问题分析单元20完成对问题的处理之后,将问题提交到常问问题库(FAQ库)30,FAQ库30可以通过倒排索引的方式进行检索,也可以通过结构化数据,即SQL数据库方式检索。本发明实施例中的信息检索单元40使用倒排序索引或SQL数据库检索FAQ库30,定义的问题表格如下例:
Figure BDA0000470464990000181
这样对上述问题,通过原问题匹配或者关键词匹配能找到对应的问题,则可以根据问题,得到问题的答案返回给用户。
假如原问题匹配或者关键词匹配都无法找到对应的Question ID,即该问题不在常问问题库中,则需要通过搜索引擎去互联网上检索该问题,得到对应的文档,而本发明实施例所需的答案就在候选的文档中。
答案提取单元50对上述的文档进行问题答案提取的操作。
首先由答案提取单元50中的相关度排序单元对得到的文档进行相关度排序,然后取其中相关性排名靠前的文档中的一部分,作为提出候选答案的文档集。
答案提取单元50根据之前问题模式抽取单元对问题类型的分类,得到对应的抽取规则,如表2所示,例如对“中华人民共和国是什么时候成立的”这一问题,根据表2,答案必须要含有时间信息的短语如“1949年10月1日”或者句子如“中华人民共和国成立于1949年10月1日”,根据这一规则,对文档中满足上述条件的短语或者句子进行提取,得到候选答案集。
再比如对于问题“9.11事件是怎么回事?”对于这种问题,在互联网上有许多相关的报道,这些报道可能是从不同的方面描述这个事件。如果把这些相关报道都交给用户的话,那么用户将要花很多时间来阅读。如果能把这些相关报道做成一个简短的文摘,让用户只要看文摘就能知道整个事件的前因后果,那么将会为用户带来很大的方便。这就需要用到多文档自动文摘技术。多文档自动文摘技术能把信息检索模块检索出来的相关文档做成文摘作为候选答案。
上述的候选答案集中,可能包含多个可能的答案,通过聚类可以得到答案的类型划分,对于答案唯一的问题,通过聚类,一般会聚出一个类,然后可以返回用户答案。对于某些问题例如“苹果是哪年成立的?”答案是不唯一的,因为“苹果”可以是IT行业的“苹果公司(Apple Inc.)”,也可以是服饰行业的“苹果集团公司”,还可以是音乐行业的“苹果唱片公司(Apple Record)”,对于这样的候选答案会聚出至少3个类,而且每一个答案都可能是用户期待的,所以不能只返回其中的一个,可以考虑反馈给用户多样性的答案。
在本发明实施例提供的自动问答***.根据本体对问题进行了分类,不单单只是领域层次的,而且是概念层次的,例如篮球/NBA/NBA明星/湖人队球星。
此外,本发明实施例中的***对问题中包含的关键概念进行了提取,针对关键概念我们也可以在本体的帮助下做同义词归一化的处理。
本发明实施例提供的自动问答***在提出问题抽取的模式和对应的答案的规则时,根据该模式和规则学习并在下一步抽取答案,提高答案抽取的准确率;例如,为了提高匹配的准确率,我们可以抽取问题中的问点和条件点,然后做成问题查询的模式,根据该模式来抽取答案。
本发明实施例自动问答***获取的问答答案是文档,但本发明实施例可以做进一步处理,抽取后可以是词/短语,句子,甚至可以根据多个文档中抽取出来的文摘,提出采用多文档自动摘要的方法,主要是为了节省用户阅读答案的时间。
现有技术中的自动问答***基本上都没有明确提出问题答案的多样化考虑,而本发明实施例中的自动问答***可以在对匹配的答案根据相关性和多样性的来重新计算权重,从而达到更加理想的排序,满足多样性和相关性的需求,反馈给用户答案。这里多样化指的是计算答案的排序的时候就考虑的了,而不是对答案进行聚类这部分。
与现有技术相比,本发明实施例通过对输入问题和FAQ库中的问题进行类型划分处理和模式抽取,得到的用户答案内容范围广泛,形式上能包括短语、句子,还能通过多文档摘要算法来得出摘要,通过聚类等方法对候选答案处理,提高了答***率和多样性。此外,本发明实施例通过将本体引入自动问答***可以使***能够对用户查询词进行语义分析,更能充分理解用户的查询意图,从而有效的改善查准率和查全率。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种自动问答***,其特征在于,包括:用户交互单元、问题分析单元、常问问题库、信息检索单元以及答案抽取单元,
其中,用户交互单元,用于接收用户输入的问题以及将问题答案反馈给所述用户;
问题分析单元,用于抽取用户输入的问题的关键词,并对所述关键词进行扩展,以及根据预先设置的问题分类标准对问题进行类型划分得到所述问题的类型;
常问问题库,用于存储用户常问的问题和答案;
信息检索单元,用于根据所述问题分析单元扩展后的关键词在所述常问问题库中搜索问题答案,并返回相关的文档或答案;
答案抽取单元,用于根据与所述问题的类型对应的答案抽取规则从所述信息检索单元返回的相关文档中抽取符合所述规则的答案,将抽取的答案发送至所述用户交互单元。
2.根据权利要求1所述的自动问答***,其特征在于,所述问题分析单元包括:
中文词语处理模块,用于对用户输入的中文问题进行词语切分和词性标注;
关键词抽取模块,用于根据切分后的词语的词性抽取出关键词;
关键词扩展模块,用于对抽取出的关键词进行同义扩展;
问题类型划分模块,用于根据预先设置的问题分类标准和所述扩展后的关键词划分所述问题的类型,或者用于根据所述扩展后的关键词的语义进行自动划分所述问题的类型。
3.根据权利要求2所述的自动问答***,其特征在于,所述答案抽取单元包括:
相关性排序模块,用于对信息检索单元返回的相关文档进行相关性排序,获得相关性高的文档;
文档抽取模块,用于根据与所述问题类型对应的答案抽取规则从所述相关性高的文档中抽取符合所述规则的一个或多个答案;
答案整理模块,用于对所述答案抽取单元抽取的多个答案进行聚类,将聚类后的答案发送至所述用户交互单元。
4.根据权利要求3所述的自动问答***,其特征在于,若所述问题类型对应的答案抽取规则为句子或段落,
则所述文档抽取模块将相关性高的文档分为句子,根据TF-IDF算法计算每个句子的权重并根据权重排序得到候选答案,根据所述问题类型对所述候选答案进行排序获得所述问题的答案。
5.根据权利要求3所述的自动问答***,其特征在于,若所述问题类型对应的答案抽取规则为文摘,
则所述文档抽取模块提取各相关性高的文档中共同关注的内容作为所述问题的答案。
6.根据权利要求2所述的自动问答***,其特征在于,所述信息检索单元通过倒排序索引或结构化数据的方式在所述常问问题库中搜索问题答案。
7.根据权利要求1-6任一项所述的自动问答***,其特征在于,所述***还包括:
常问问题库更新单元,用于在所述信息检索单元未在所述常问问题库中搜索到问题答案时从互联网搜索所述问题的答案,并将搜索到的答案加入所述常问问题库。
8.根据权利要求1-6任一项所述的自动问答***,其特征在于,所述用户交互单元为浏览器。
9.根据权利要求1-6任一项所述的自动问答***,其特征在于,所述问题分析单元抽取的关键词包括名词、动词、形容词或副词。
10.根据权利要求1-6任一项所述的自动问答***,其特征在于,所述***还包括本体知识库,所述本体知识库为所述问题分析单元提供共享词表。
CN201410068844.XA 2014-02-27 2014-02-27 自动问答*** Pending CN103902652A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410068844.XA CN103902652A (zh) 2014-02-27 2014-02-27 自动问答***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410068844.XA CN103902652A (zh) 2014-02-27 2014-02-27 自动问答***

Publications (1)

Publication Number Publication Date
CN103902652A true CN103902652A (zh) 2014-07-02

Family

ID=50993975

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410068844.XA Pending CN103902652A (zh) 2014-02-27 2014-02-27 自动问答***

Country Status (1)

Country Link
CN (1) CN103902652A (zh)

Cited By (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102721A (zh) * 2014-07-18 2014-10-15 百度在线网络技术(北京)有限公司 信息推荐方法和装置
CN104461525A (zh) * 2014-11-27 2015-03-25 韩慧健 一种可自定义的智能咨询平台生成***
CN104536991A (zh) * 2014-12-10 2015-04-22 乐娟 答案抽取方法及装置
CN104679815A (zh) * 2014-12-08 2015-06-03 北京云知声信息技术有限公司 一种筛选问答对并实时更新问答库的方法及***
CN104778257A (zh) * 2015-04-20 2015-07-15 百度在线网络技术(北京)有限公司 应用题搜索方法和装置
CN104820694A (zh) * 2015-04-28 2015-08-05 中国科学院自动化研究所 基于多知识库和整数线性规划ilp的自动问答方法和***
CN104951433A (zh) * 2015-06-24 2015-09-30 北京京东尚科信息技术有限公司 基于上下文进行意图识别的方法和***
CN105095195A (zh) * 2015-07-03 2015-11-25 北京京东尚科信息技术有限公司 基于知识图谱的人机问答方法和***
CN105117387A (zh) * 2015-09-21 2015-12-02 上海智臻智能网络科技股份有限公司 一种智能机器人交互***
CN105117388A (zh) * 2015-09-21 2015-12-02 上海智臻智能网络科技股份有限公司 一种智能机器人交互***
CN105279274A (zh) * 2015-10-30 2016-01-27 北京京东尚科信息技术有限公司 基于自然语义问答***的答案合成与匹配的方法和***
CN105335400A (zh) * 2014-07-22 2016-02-17 阿里巴巴集团控股有限公司 针对用户的提问意图获取答案信息的方法及装置
CN105354180A (zh) * 2015-08-26 2016-02-24 欧阳江 一种实现开放式语义交互服务的方法及***
CN105512349A (zh) * 2016-02-23 2016-04-20 首都师范大学 一种用于学习者自适应学习的问答方法及装置
CN105574133A (zh) * 2015-12-15 2016-05-11 苏州贝多环保技术有限公司 一种多模态的智能问答***及方法
CN105630938A (zh) * 2015-12-23 2016-06-01 深圳市智客网络科技有限公司 一种智能问答***
CN105630887A (zh) * 2015-12-18 2016-06-01 北京中科汇联科技股份有限公司 中文问答***知识标记语言的表示方法及中文问答***
CN105630917A (zh) * 2015-12-22 2016-06-01 成都小多科技有限公司 智能应答方法及装置
CN105653619A (zh) * 2015-12-25 2016-06-08 上海智臻智能网络科技股份有限公司 智能问答***中正确日志库的更新方法和装置
CN105740310A (zh) * 2015-12-21 2016-07-06 哈尔滨工业大学 一种用于问答***中的自动答案摘要方法及***
CN105824933A (zh) * 2016-03-18 2016-08-03 苏州大学 基于主述位的自动问答***及其实现方法
CN105893552A (zh) * 2016-03-31 2016-08-24 成都小多科技有限公司 数据处理方法及装置
CN105893465A (zh) * 2016-03-28 2016-08-24 北京京东尚科信息技术有限公司 自动问答方法和装置
CN105912527A (zh) * 2016-04-19 2016-08-31 北京高地信息技术有限公司 根据自然语言输出答案的方法、装置及***
CN105912697A (zh) * 2016-04-25 2016-08-31 北京光年无限科技有限公司 一种对话***知识库的优化方法及装置
CN105955976A (zh) * 2016-04-15 2016-09-21 中国工商银行股份有限公司 一种自动应答***及方法
CN106095965A (zh) * 2016-06-17 2016-11-09 上海智臻智能网络科技股份有限公司 一种数据处理方法和装置
CN106202288A (zh) * 2016-06-30 2016-12-07 北京智能管家科技有限公司 一种人机交互***知识库的优化方法及***
CN106547785A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 知识库中信息获取方法和***
CN106599297A (zh) * 2016-12-28 2017-04-26 北京百度网讯科技有限公司 基于深度问答的提问型搜索词搜索方法及装置
CN106649394A (zh) * 2015-11-03 2017-05-10 中兴通讯股份有限公司 融合知识库处理方法和装置,以及知识库管理***
CN106878819A (zh) * 2017-01-20 2017-06-20 合网络技术(北京)有限公司 一种网络直播中信息交互的方法、***及装置
CN106934012A (zh) * 2017-03-10 2017-07-07 上海数眼科技发展有限公司 一种基于知识图谱的自然语言问答实现方法和***
CN106951470A (zh) * 2017-03-03 2017-07-14 中兴耀维科技江苏有限公司 一种基于业务知识图检索的智能问答***
CN106980624A (zh) * 2016-01-18 2017-07-25 阿里巴巴集团控股有限公司 一种文本数据的处理方法和装置
CN106991161A (zh) * 2017-03-31 2017-07-28 北京字节跳动科技有限公司 一种自动生成开放式问题答案的方法
CN107133210A (zh) * 2017-04-20 2017-09-05 中国科学院上海高等研究院 方案文本生成方法及***
CN107145510A (zh) * 2017-03-31 2017-09-08 西安科技大学 一种数学公式搜索方法及装置
CN107168599A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 一种即时通信方法和装置
CN107180037A (zh) * 2016-03-09 2017-09-19 北京京东尚科信息技术有限公司 人机交互方法和装置
CN107229675A (zh) * 2017-04-28 2017-10-03 北京神州泰岳软件股份有限公司 列表型知识的问答库构建方法、作答方法、装置及***
CN107301213A (zh) * 2017-06-09 2017-10-27 腾讯科技(深圳)有限公司 智能问答方法及装置
CN107330040A (zh) * 2017-06-27 2017-11-07 李博 一种学习题目搜索方法及其***
CN107341157A (zh) * 2016-04-29 2017-11-10 阿里巴巴集团控股有限公司 一种客服对话聚类方法和装置
CN107408110A (zh) * 2015-03-06 2017-11-28 国立研究开发法人情报通信研究机构 含意配对扩展装置、用于其的计算机程序以及提问应答***
CN107436916A (zh) * 2017-06-15 2017-12-05 百度在线网络技术(北京)有限公司 智能提示答案的方法及装置
CN107453980A (zh) * 2017-07-26 2017-12-08 北京小米移动软件有限公司 即时通信中问题响应方法及装置
CN107528761A (zh) * 2016-06-21 2017-12-29 天脉聚源(北京)科技有限公司 一种微信公众号自动回复信息的方法和***
CN107729549A (zh) * 2017-10-31 2018-02-23 深圳追科技有限公司 一种包含要素提取的机器人客服方法及***
CN108073664A (zh) * 2016-11-11 2018-05-25 北京搜狗科技发展有限公司 一种信息处理方法、装置、设备及客户端设备
CN108170679A (zh) * 2017-12-28 2018-06-15 中国联合网络通信集团有限公司 基于计算机可识别自然语言描述的语义匹配方法及***
CN108170780A (zh) * 2017-12-26 2018-06-15 北京邦邦共赢网络科技有限公司 一种自助问答的问题匹配方法及装置
WO2018121759A1 (zh) * 2016-12-31 2018-07-05 深圳市优必选科技有限公司 智能问答方法及***
CN108416033A (zh) * 2018-03-12 2018-08-17 北京汽车研究总院有限公司 一种用于汽车研发的数据分析方法、装置及终端
WO2018157805A1 (zh) * 2017-03-03 2018-09-07 腾讯科技(深圳)有限公司 一种自动问答处理方法及自动问答***
CN108595494A (zh) * 2018-03-15 2018-09-28 腾讯科技(深圳)有限公司 答复信息的获取方法及装置
CN108595696A (zh) * 2018-05-09 2018-09-28 长沙学院 一种基于云平台的人机交互智能问答方法和***
CN108763529A (zh) * 2018-05-31 2018-11-06 苏州大学 一种智能检索方法、装置和计算机可读存储介质
CN108804627A (zh) * 2018-05-31 2018-11-13 科大讯飞股份有限公司 信息获取方法及装置
CN108804529A (zh) * 2018-05-02 2018-11-13 深圳智能思创科技有限公司 一种基于Web的问答***实现方法
CN108921743A (zh) * 2018-06-20 2018-11-30 大国创新智能科技(东莞)有限公司 基于大数据与人工智能的解惑方法和解惑教育机器人***
CN108986910A (zh) * 2018-07-04 2018-12-11 平安科技(深圳)有限公司 线上问答方法、装置、计算机设备和存储介质
CN109002434A (zh) * 2018-05-31 2018-12-14 青岛理工大学 客服问答匹配方法、服务器及存储介质
CN109241266A (zh) * 2015-07-23 2019-01-18 上海智臻智能网络科技股份有限公司 人机交互中基于标准问创建扩展问的方法和装置
CN109241258A (zh) * 2018-08-23 2019-01-18 江苏索迩软件技术有限公司 一种应用税务领域的深度学习智能问答***
CN109308320A (zh) * 2018-07-20 2019-02-05 北京智能点科技有限公司 一种机器人多轮对话流程化配置方法
WO2019062012A1 (zh) * 2017-09-30 2019-04-04 平安科技(深圳)有限公司 问题联想推送方法、电子装置及计算机可读存储介质
CN109583401A (zh) * 2018-12-05 2019-04-05 广东小天才科技有限公司 一种自动生成答案的搜题方法及用户设备
CN109582798A (zh) * 2017-09-29 2019-04-05 阿里巴巴集团控股有限公司 自动问答方法、***及设备
CN109657033A (zh) * 2018-12-13 2019-04-19 泰康保险集团股份有限公司 用户问题处理的方法、装置、存储介质及电子设备
CN109785698A (zh) * 2017-11-13 2019-05-21 上海流利说信息技术有限公司 用于口语水平评测的方法、装置、电子设备以及介质
CN109800286A (zh) * 2018-12-17 2019-05-24 北京百度网讯科技有限公司 对话生成方法和装置
CN109829052A (zh) * 2019-02-19 2019-05-31 田中瑶 一种基于人机交互的开放式对话方法和***
CN109840277A (zh) * 2019-02-20 2019-06-04 西南科技大学 一种政务服务智能问答方法及***
CN109885672A (zh) * 2019-03-04 2019-06-14 中国科学院软件研究所 一种面向在线教育的问答式智能检索***及方法
CN109918560A (zh) * 2019-01-09 2019-06-21 平安科技(深圳)有限公司 一种基于搜索引擎的问答方法和装置
CN109977214A (zh) * 2019-03-29 2019-07-05 沈阳师范大学 一种中小学教育的在线疑难问题解答推荐互动方法及***
CN109992665A (zh) * 2019-03-14 2019-07-09 广州智语信息科技有限公司 一种基于问题目标特征扩展的分类方法
CN110019706A (zh) * 2017-11-08 2019-07-16 北京搜狗科技发展有限公司 一种问题生成方法和装置
CN110020009A (zh) * 2017-09-29 2019-07-16 阿里巴巴集团控股有限公司 在线问答方法、装置及***
CN110110133A (zh) * 2019-04-18 2019-08-09 贝壳技术有限公司 一种智能语音数据生成方法及装置
EP3531301A1 (de) * 2018-02-27 2019-08-28 DTMS GmbH Computerimplementiertes verfahren zum abfragen von daten
CN110196901A (zh) * 2019-06-28 2019-09-03 北京百度网讯科技有限公司 对话***的构建方法、装置、计算机设备和存储介质
CN110263051A (zh) * 2019-06-11 2019-09-20 出门问问信息科技有限公司 用于问答***的问答对更新方法、装置、设备及存储介质
CN110263137A (zh) * 2019-05-31 2019-09-20 阿里巴巴集团控股有限公司 主题关键词的提取方法和装置、电子设备
CN110334272A (zh) * 2019-05-29 2019-10-15 平安科技(深圳)有限公司 基于知识图谱的智能问答方法、装置及计算机存储介质
CN110347833A (zh) * 2019-07-09 2019-10-18 浙江工业大学 一种多轮对话的分类方法
CN110472034A (zh) * 2019-08-21 2019-11-19 北京百度网讯科技有限公司 问答***的检测方法、装置、设备及计算机可读存储介质
CN110516057A (zh) * 2019-08-23 2019-11-29 深圳前海微众银行股份有限公司 一种信访问题答复方法及装置
CN110516157A (zh) * 2019-08-30 2019-11-29 盈盛智创科技(广州)有限公司 一种文献检索方法、设备和存储介质
CN110659091A (zh) * 2018-06-29 2020-01-07 国际商业机器公司 会话代理对话流用户界面
CN110955761A (zh) * 2019-10-12 2020-04-03 深圳壹账通智能科技有限公司 文书中问答数据获取方法、装置、计算机设备和存储介质
CN111046155A (zh) * 2019-11-27 2020-04-21 中博信息技术研究院有限公司 一种基于fsm多轮问答的语义相似度计算方法
CN111198940A (zh) * 2019-12-27 2020-05-26 北京百度网讯科技有限公司 Faq方法、问答检索***、电子设备和存储介质
CN111428037A (zh) * 2020-03-24 2020-07-17 合肥科捷通科技信息服务有限公司 一种分析行为政策匹配性的方法
CN111460095A (zh) * 2020-03-17 2020-07-28 北京百度网讯科技有限公司 问答处理方法、装置、电子设备及存储介质
CN111581329A (zh) * 2020-04-23 2020-08-25 上海兑观信息科技技术有限公司 基于倒排索引的短文本匹配方法及装置
CN111813889A (zh) * 2020-06-24 2020-10-23 北京安博盛赢教育科技有限责任公司 一种提问信息的排序方法、装置、介质和电子设备
CN111930920A (zh) * 2020-09-30 2020-11-13 恒生电子股份有限公司 基于知识增强处理的faq相似度计算方法、装置及电子设备
CN112307291A (zh) * 2020-10-28 2021-02-02 福建菩泰网络科技有限公司 一种网上商城在线咨询管理方法及管理***
CN112307171A (zh) * 2020-10-30 2021-02-02 中国电力科学研究院有限公司 一种基于电力知识库的制度标准检索方法及***和可读存储介质
CN112541109A (zh) * 2020-12-22 2021-03-23 北京百度网讯科技有限公司 答案摘要抽取方法及装置、电子设备、可读介质、产品
CN112749265A (zh) * 2021-01-08 2021-05-04 哈尔滨工业大学 一种基于多信息源的智能问答***
CN112925890A (zh) * 2021-03-05 2021-06-08 湖南神通智能股份有限公司 一种智能问答***
CN112948557A (zh) * 2021-03-09 2021-06-11 哈尔滨工业大学 一种以说明文档为辅助的可迭代的基于常用问题集的智能客服***
CN113836296A (zh) * 2021-09-28 2021-12-24 平安科技(深圳)有限公司 一种佛学问答摘要的生成方法、装置、设备及存储介质
CN114491051A (zh) * 2022-04-02 2022-05-13 四川省大数据中心 一种建筑用地项目审批***
CN116186232A (zh) * 2023-04-26 2023-05-30 中国电子技术标准化研究院 一种标准知识智能问答实现方法、装置、设备和介质
US11775839B2 (en) 2020-06-10 2023-10-03 International Business Machines Corporation Frequently asked questions and document retrieval using bidirectional encoder representations from transformers (BERT) model trained on generated paraphrases
CN116881426A (zh) * 2023-08-30 2023-10-13 环球数科集团有限公司 一种基于aigc的自解释问答***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1928864A (zh) * 2006-09-22 2007-03-14 浙江大学 一种基于问答库的中文自然语言问答方法
CN101097573A (zh) * 2006-06-28 2008-01-02 腾讯科技(深圳)有限公司 一种自动问答***及方法
CN101286161A (zh) * 2008-05-28 2008-10-15 华中科技大学 一种基于概念的智能中文问答***
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答***实现方法
CN101377777A (zh) * 2007-09-03 2009-03-04 北京百问百答网络技术有限公司 一种自动问答方法和***
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答***及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101097573A (zh) * 2006-06-28 2008-01-02 腾讯科技(深圳)有限公司 一种自动问答***及方法
CN1928864A (zh) * 2006-09-22 2007-03-14 浙江大学 一种基于问答库的中文自然语言问答方法
CN101377777A (zh) * 2007-09-03 2009-03-04 北京百问百答网络技术有限公司 一种自动问答方法和***
CN101286161A (zh) * 2008-05-28 2008-10-15 华中科技大学 一种基于概念的智能中文问答***
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答***实现方法
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答***及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YONG JIANG ET AL.: ""Affiliation Disambiguation for Constructing Semantic Digital Libraries"", 《JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY》 *
刘里等: ""自动问答***研究综述"", 《山东科技大学学报(自然科学版)》 *
郑实福等: ""自动问答综述"", 《中文信息学报》 *

Cited By (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102721A (zh) * 2014-07-18 2014-10-15 百度在线网络技术(北京)有限公司 信息推荐方法和装置
CN105335400A (zh) * 2014-07-22 2016-02-17 阿里巴巴集团控股有限公司 针对用户的提问意图获取答案信息的方法及装置
CN105335400B (zh) * 2014-07-22 2018-11-23 阿里巴巴集团控股有限公司 针对用户的提问意图获取答案信息的方法及装置
CN104461525A (zh) * 2014-11-27 2015-03-25 韩慧健 一种可自定义的智能咨询平台生成***
CN104461525B (zh) * 2014-11-27 2018-01-23 韩慧健 一种可自定义的智能咨询平台生成***
CN104679815A (zh) * 2014-12-08 2015-06-03 北京云知声信息技术有限公司 一种筛选问答对并实时更新问答库的方法及***
CN104679815B (zh) * 2014-12-08 2018-02-23 北京云知声信息技术有限公司 一种筛选问答对并实时更新问答库的方法及***
CN104536991A (zh) * 2014-12-10 2015-04-22 乐娟 答案抽取方法及装置
CN104536991B (zh) * 2014-12-10 2017-12-08 乐娟 答案抽取方法及装置
CN107408110B (zh) * 2015-03-06 2020-12-15 国立研究开发法人情报通信研究机构 含意配对扩展装置、记录介质以及提问应答***
CN107408110A (zh) * 2015-03-06 2017-11-28 国立研究开发法人情报通信研究机构 含意配对扩展装置、用于其的计算机程序以及提问应答***
CN104778257A (zh) * 2015-04-20 2015-07-15 百度在线网络技术(北京)有限公司 应用题搜索方法和装置
CN104778257B (zh) * 2015-04-20 2018-09-07 百度在线网络技术(北京)有限公司 应用题搜索方法和装置
CN104820694B (zh) * 2015-04-28 2019-03-15 中国科学院自动化研究所 基于多知识库和整数线性规划ilp的自动问答方法和***
CN104820694A (zh) * 2015-04-28 2015-08-05 中国科学院自动化研究所 基于多知识库和整数线性规划ilp的自动问答方法和***
CN104951433A (zh) * 2015-06-24 2015-09-30 北京京东尚科信息技术有限公司 基于上下文进行意图识别的方法和***
CN104951433B (zh) * 2015-06-24 2018-01-23 北京京东尚科信息技术有限公司 基于上下文进行意图识别的方法和***
CN105095195B (zh) * 2015-07-03 2018-09-18 北京京东尚科信息技术有限公司 基于知识图谱的人机问答方法和***
CN105095195A (zh) * 2015-07-03 2015-11-25 北京京东尚科信息技术有限公司 基于知识图谱的人机问答方法和***
CN109241266A (zh) * 2015-07-23 2019-01-18 上海智臻智能网络科技股份有限公司 人机交互中基于标准问创建扩展问的方法和装置
CN105354180A (zh) * 2015-08-26 2016-02-24 欧阳江 一种实现开放式语义交互服务的方法及***
CN105117388A (zh) * 2015-09-21 2015-12-02 上海智臻智能网络科技股份有限公司 一种智能机器人交互***
CN105117387A (zh) * 2015-09-21 2015-12-02 上海智臻智能网络科技股份有限公司 一种智能机器人交互***
CN106547785B (zh) * 2015-09-22 2020-08-04 阿里巴巴集团控股有限公司 知识库中信息获取方法和***
CN106547785A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 知识库中信息获取方法和***
CN105279274A (zh) * 2015-10-30 2016-01-27 北京京东尚科信息技术有限公司 基于自然语义问答***的答案合成与匹配的方法和***
CN105279274B (zh) * 2015-10-30 2018-11-02 北京京东尚科信息技术有限公司 基于自然语义问答***的答案合成与匹配的方法和***
CN106649394A (zh) * 2015-11-03 2017-05-10 中兴通讯股份有限公司 融合知识库处理方法和装置,以及知识库管理***
WO2017076263A1 (zh) * 2015-11-03 2017-05-11 中兴通讯股份有限公司 融合知识库处理方法和装置及知识库管理***、存储介质
CN105574133A (zh) * 2015-12-15 2016-05-11 苏州贝多环保技术有限公司 一种多模态的智能问答***及方法
CN105630887A (zh) * 2015-12-18 2016-06-01 北京中科汇联科技股份有限公司 中文问答***知识标记语言的表示方法及中文问答***
CN105740310B (zh) * 2015-12-21 2019-08-02 哈尔滨工业大学 一种用于问答***中的自动答案摘要方法及***
CN105740310A (zh) * 2015-12-21 2016-07-06 哈尔滨工业大学 一种用于问答***中的自动答案摘要方法及***
CN105630917A (zh) * 2015-12-22 2016-06-01 成都小多科技有限公司 智能应答方法及装置
CN105630938A (zh) * 2015-12-23 2016-06-01 深圳市智客网络科技有限公司 一种智能问答***
CN105653619A (zh) * 2015-12-25 2016-06-08 上海智臻智能网络科技股份有限公司 智能问答***中正确日志库的更新方法和装置
CN105653619B (zh) * 2015-12-25 2019-01-25 上海智臻智能网络科技股份有限公司 智能问答***中正确日志库的更新方法和装置
CN106980624A (zh) * 2016-01-18 2017-07-25 阿里巴巴集团控股有限公司 一种文本数据的处理方法和装置
CN105512349B (zh) * 2016-02-23 2019-03-26 首都师范大学 一种用于学习者自适应学习的问答方法及装置
CN105512349A (zh) * 2016-02-23 2016-04-20 首都师范大学 一种用于学习者自适应学习的问答方法及装置
CN107168599B (zh) * 2016-03-07 2020-05-29 阿里巴巴集团控股有限公司 一种即时通信方法和装置
CN107168599A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 一种即时通信方法和装置
CN107180037A (zh) * 2016-03-09 2017-09-19 北京京东尚科信息技术有限公司 人机交互方法和装置
CN105824933B (zh) * 2016-03-18 2019-02-26 苏州大学 基于主述位的自动问答***及其实现方法
CN105824933A (zh) * 2016-03-18 2016-08-03 苏州大学 基于主述位的自动问答***及其实现方法
CN105893465A (zh) * 2016-03-28 2016-08-24 北京京东尚科信息技术有限公司 自动问答方法和装置
CN105893552A (zh) * 2016-03-31 2016-08-24 成都小多科技有限公司 数据处理方法及装置
CN105955976A (zh) * 2016-04-15 2016-09-21 中国工商银行股份有限公司 一种自动应答***及方法
CN105955976B (zh) * 2016-04-15 2019-05-14 中国工商银行股份有限公司 一种自动应答***及方法
CN105912527A (zh) * 2016-04-19 2016-08-31 北京高地信息技术有限公司 根据自然语言输出答案的方法、装置及***
CN105912697B (zh) * 2016-04-25 2019-08-27 北京光年无限科技有限公司 一种对话***知识库的优化方法及装置
CN105912697A (zh) * 2016-04-25 2016-08-31 北京光年无限科技有限公司 一种对话***知识库的优化方法及装置
CN107341157A (zh) * 2016-04-29 2017-11-10 阿里巴巴集团控股有限公司 一种客服对话聚类方法和装置
CN107341157B (zh) * 2016-04-29 2021-01-22 阿里巴巴集团控股有限公司 一种客服对话聚类方法和装置
CN106095965A (zh) * 2016-06-17 2016-11-09 上海智臻智能网络科技股份有限公司 一种数据处理方法和装置
CN107528761A (zh) * 2016-06-21 2017-12-29 天脉聚源(北京)科技有限公司 一种微信公众号自动回复信息的方法和***
CN106202288A (zh) * 2016-06-30 2016-12-07 北京智能管家科技有限公司 一种人机交互***知识库的优化方法及***
CN106202288B (zh) * 2016-06-30 2019-10-11 北京智能管家科技有限公司 一种人机交互***知识库的优化方法及***
CN108073664B (zh) * 2016-11-11 2021-08-31 北京搜狗科技发展有限公司 一种信息处理方法、装置、设备及客户端设备
CN108073664A (zh) * 2016-11-11 2018-05-25 北京搜狗科技发展有限公司 一种信息处理方法、装置、设备及客户端设备
CN106599297A (zh) * 2016-12-28 2017-04-26 北京百度网讯科技有限公司 基于深度问答的提问型搜索词搜索方法及装置
WO2018121759A1 (zh) * 2016-12-31 2018-07-05 深圳市优必选科技有限公司 智能问答方法及***
CN106878819A (zh) * 2017-01-20 2017-06-20 合网络技术(北京)有限公司 一种网络直播中信息交互的方法、***及装置
WO2018133518A1 (zh) * 2017-01-20 2018-07-26 优酷网络技术(北京)有限公司 一种网络直播中信息交互的方法、***及装置
US11086912B2 (en) 2017-03-03 2021-08-10 Tencent Technology (Shenzhen) Company Limited Automatic questioning and answering processing method and automatic questioning and answering system
CN106951470A (zh) * 2017-03-03 2017-07-14 中兴耀维科技江苏有限公司 一种基于业务知识图检索的智能问答***
WO2018157805A1 (zh) * 2017-03-03 2018-09-07 腾讯科技(深圳)有限公司 一种自动问答处理方法及自动问答***
CN106934012B (zh) * 2017-03-10 2020-05-08 上海数眼科技发展有限公司 一种基于知识图谱的自然语言问答实现方法和***
CN106934012A (zh) * 2017-03-10 2017-07-07 上海数眼科技发展有限公司 一种基于知识图谱的自然语言问答实现方法和***
CN106991161A (zh) * 2017-03-31 2017-07-28 北京字节跳动科技有限公司 一种自动生成开放式问题答案的方法
CN107145510A (zh) * 2017-03-31 2017-09-08 西安科技大学 一种数学公式搜索方法及装置
CN106991161B (zh) * 2017-03-31 2019-02-19 北京字节跳动科技有限公司 一种自动生成开放式问题答案的方法
CN107133210A (zh) * 2017-04-20 2017-09-05 中国科学院上海高等研究院 方案文本生成方法及***
CN107229675A (zh) * 2017-04-28 2017-10-03 北京神州泰岳软件股份有限公司 列表型知识的问答库构建方法、作答方法、装置及***
CN107301213A (zh) * 2017-06-09 2017-10-27 腾讯科技(深圳)有限公司 智能问答方法及装置
CN107436916A (zh) * 2017-06-15 2017-12-05 百度在线网络技术(北京)有限公司 智能提示答案的方法及装置
CN107436916B (zh) * 2017-06-15 2021-04-27 百度在线网络技术(北京)有限公司 智能提示答案的方法及装置
CN107330040A (zh) * 2017-06-27 2017-11-07 李博 一种学习题目搜索方法及其***
CN107453980A (zh) * 2017-07-26 2017-12-08 北京小米移动软件有限公司 即时通信中问题响应方法及装置
CN110020009B (zh) * 2017-09-29 2023-03-21 阿里巴巴集团控股有限公司 在线问答方法、装置及***
CN110020009A (zh) * 2017-09-29 2019-07-16 阿里巴巴集团控股有限公司 在线问答方法、装置及***
CN109582798A (zh) * 2017-09-29 2019-04-05 阿里巴巴集团控股有限公司 自动问答方法、***及设备
WO2019062012A1 (zh) * 2017-09-30 2019-04-04 平安科技(深圳)有限公司 问题联想推送方法、电子装置及计算机可读存储介质
CN107729549A (zh) * 2017-10-31 2018-02-23 深圳追科技有限公司 一种包含要素提取的机器人客服方法及***
CN110019706B (zh) * 2017-11-08 2021-11-19 北京搜狗科技发展有限公司 一种问题生成方法和装置
CN110019706A (zh) * 2017-11-08 2019-07-16 北京搜狗科技发展有限公司 一种问题生成方法和装置
CN109785698B (zh) * 2017-11-13 2021-11-23 上海流利说信息技术有限公司 用于口语水平评测的方法、装置、电子设备以及介质
CN109785698A (zh) * 2017-11-13 2019-05-21 上海流利说信息技术有限公司 用于口语水平评测的方法、装置、电子设备以及介质
CN108170780A (zh) * 2017-12-26 2018-06-15 北京邦邦共赢网络科技有限公司 一种自助问答的问题匹配方法及装置
CN108170679A (zh) * 2017-12-28 2018-06-15 中国联合网络通信集团有限公司 基于计算机可识别自然语言描述的语义匹配方法及***
CN108170679B (zh) * 2017-12-28 2021-09-03 中国联合网络通信集团有限公司 基于计算机可识别自然语言描述的语义匹配方法及***
EP3531301A1 (de) * 2018-02-27 2019-08-28 DTMS GmbH Computerimplementiertes verfahren zum abfragen von daten
CN108416033A (zh) * 2018-03-12 2018-08-17 北京汽车研究总院有限公司 一种用于汽车研发的数据分析方法、装置及终端
CN108595494A (zh) * 2018-03-15 2018-09-28 腾讯科技(深圳)有限公司 答复信息的获取方法及装置
CN108595494B (zh) * 2018-03-15 2022-05-20 腾讯科技(深圳)有限公司 答复信息的获取方法及装置
CN108804529A (zh) * 2018-05-02 2018-11-13 深圳智能思创科技有限公司 一种基于Web的问答***实现方法
CN108595696A (zh) * 2018-05-09 2018-09-28 长沙学院 一种基于云平台的人机交互智能问答方法和***
CN108763529A (zh) * 2018-05-31 2018-11-06 苏州大学 一种智能检索方法、装置和计算机可读存储介质
CN108804627A (zh) * 2018-05-31 2018-11-13 科大讯飞股份有限公司 信息获取方法及装置
CN109002434A (zh) * 2018-05-31 2018-12-14 青岛理工大学 客服问答匹配方法、服务器及存储介质
CN108804627B (zh) * 2018-05-31 2021-04-06 科大讯飞股份有限公司 信息获取方法及装置
CN108921743B (zh) * 2018-06-20 2020-12-22 大国创新智能科技(东莞)有限公司 基于大数据与人工智能的解惑方法和解惑教育机器人***
CN108921743A (zh) * 2018-06-20 2018-11-30 大国创新智能科技(东莞)有限公司 基于大数据与人工智能的解惑方法和解惑教育机器人***
CN110659091A (zh) * 2018-06-29 2020-01-07 国际商业机器公司 会话代理对话流用户界面
CN108986910A (zh) * 2018-07-04 2018-12-11 平安科技(深圳)有限公司 线上问答方法、装置、计算机设备和存储介质
CN108986910B (zh) * 2018-07-04 2023-09-05 平安科技(深圳)有限公司 线上问答方法、装置、计算机设备和存储介质
CN109308320A (zh) * 2018-07-20 2019-02-05 北京智能点科技有限公司 一种机器人多轮对话流程化配置方法
CN109241258B (zh) * 2018-08-23 2022-09-06 江苏索迩软件技术有限公司 一种应用税务领域的深度学习智能问答***
CN109241258A (zh) * 2018-08-23 2019-01-18 江苏索迩软件技术有限公司 一种应用税务领域的深度学习智能问答***
CN109583401A (zh) * 2018-12-05 2019-04-05 广东小天才科技有限公司 一种自动生成答案的搜题方法及用户设备
CN109657033A (zh) * 2018-12-13 2019-04-19 泰康保险集团股份有限公司 用户问题处理的方法、装置、存储介质及电子设备
CN109800286A (zh) * 2018-12-17 2019-05-24 北京百度网讯科技有限公司 对话生成方法和装置
CN109918560A (zh) * 2019-01-09 2019-06-21 平安科技(深圳)有限公司 一种基于搜索引擎的问答方法和装置
CN109918560B (zh) * 2019-01-09 2024-03-12 平安科技(深圳)有限公司 一种基于搜索引擎的问答方法和装置
CN109829052A (zh) * 2019-02-19 2019-05-31 田中瑶 一种基于人机交互的开放式对话方法和***
CN109840277A (zh) * 2019-02-20 2019-06-04 西南科技大学 一种政务服务智能问答方法及***
CN109885672B (zh) * 2019-03-04 2020-10-30 中国科学院软件研究所 一种面向在线教育的问答式智能检索***及方法
CN109885672A (zh) * 2019-03-04 2019-06-14 中国科学院软件研究所 一种面向在线教育的问答式智能检索***及方法
CN109992665A (zh) * 2019-03-14 2019-07-09 广州智语信息科技有限公司 一种基于问题目标特征扩展的分类方法
CN109977214A (zh) * 2019-03-29 2019-07-05 沈阳师范大学 一种中小学教育的在线疑难问题解答推荐互动方法及***
CN110110133A (zh) * 2019-04-18 2019-08-09 贝壳技术有限公司 一种智能语音数据生成方法及装置
CN110334272A (zh) * 2019-05-29 2019-10-15 平安科技(深圳)有限公司 基于知识图谱的智能问答方法、装置及计算机存储介质
CN110334272B (zh) * 2019-05-29 2022-04-12 平安科技(深圳)有限公司 基于知识图谱的智能问答方法、装置及计算机存储介质
CN110263137A (zh) * 2019-05-31 2019-09-20 阿里巴巴集团控股有限公司 主题关键词的提取方法和装置、电子设备
CN110263137B (zh) * 2019-05-31 2023-06-06 创新先进技术有限公司 主题关键词的提取方法和装置、电子设备
CN110263051A (zh) * 2019-06-11 2019-09-20 出门问问信息科技有限公司 用于问答***的问答对更新方法、装置、设备及存储介质
CN110196901A (zh) * 2019-06-28 2019-09-03 北京百度网讯科技有限公司 对话***的构建方法、装置、计算机设备和存储介质
CN110347833A (zh) * 2019-07-09 2019-10-18 浙江工业大学 一种多轮对话的分类方法
CN110472034B (zh) * 2019-08-21 2022-11-15 北京百度网讯科技有限公司 问答***的检测方法、装置、设备及计算机可读存储介质
CN110472034A (zh) * 2019-08-21 2019-11-19 北京百度网讯科技有限公司 问答***的检测方法、装置、设备及计算机可读存储介质
CN110516057A (zh) * 2019-08-23 2019-11-29 深圳前海微众银行股份有限公司 一种信访问题答复方法及装置
CN110516057B (zh) * 2019-08-23 2022-10-28 深圳前海微众银行股份有限公司 一种信访问题答复方法及装置
CN110516157A (zh) * 2019-08-30 2019-11-29 盈盛智创科技(广州)有限公司 一种文献检索方法、设备和存储介质
WO2021068615A1 (zh) * 2019-10-12 2021-04-15 深圳壹账通智能科技有限公司 文书中问答数据获取方法、装置、计算机设备和存储介质
CN110955761A (zh) * 2019-10-12 2020-04-03 深圳壹账通智能科技有限公司 文书中问答数据获取方法、装置、计算机设备和存储介质
CN111046155A (zh) * 2019-11-27 2020-04-21 中博信息技术研究院有限公司 一种基于fsm多轮问答的语义相似度计算方法
CN111198940A (zh) * 2019-12-27 2020-05-26 北京百度网讯科技有限公司 Faq方法、问答检索***、电子设备和存储介质
CN111198940B (zh) * 2019-12-27 2023-01-31 北京百度网讯科技有限公司 Faq方法、问答检索***、电子设备和存储介质
CN111460095A (zh) * 2020-03-17 2020-07-28 北京百度网讯科技有限公司 问答处理方法、装置、电子设备及存储介质
CN111428037A (zh) * 2020-03-24 2020-07-17 合肥科捷通科技信息服务有限公司 一种分析行为政策匹配性的方法
CN111428037B (zh) * 2020-03-24 2022-09-20 合肥科捷通科技信息服务有限公司 一种分析行为政策匹配性的方法
CN111581329A (zh) * 2020-04-23 2020-08-25 上海兑观信息科技技术有限公司 基于倒排索引的短文本匹配方法及装置
US11775839B2 (en) 2020-06-10 2023-10-03 International Business Machines Corporation Frequently asked questions and document retrieval using bidirectional encoder representations from transformers (BERT) model trained on generated paraphrases
CN111813889A (zh) * 2020-06-24 2020-10-23 北京安博盛赢教育科技有限责任公司 一种提问信息的排序方法、装置、介质和电子设备
CN111930920A (zh) * 2020-09-30 2020-11-13 恒生电子股份有限公司 基于知识增强处理的faq相似度计算方法、装置及电子设备
CN112307291A (zh) * 2020-10-28 2021-02-02 福建菩泰网络科技有限公司 一种网上商城在线咨询管理方法及管理***
CN112307171B (zh) * 2020-10-30 2022-02-11 中国电力科学研究院有限公司 一种基于电力知识库的制度标准检索方法及***和可读存储介质
CN112307171A (zh) * 2020-10-30 2021-02-02 中国电力科学研究院有限公司 一种基于电力知识库的制度标准检索方法及***和可读存储介质
CN112541109A (zh) * 2020-12-22 2021-03-23 北京百度网讯科技有限公司 答案摘要抽取方法及装置、电子设备、可读介质、产品
CN112541109B (zh) * 2020-12-22 2023-10-24 北京百度网讯科技有限公司 答案摘要抽取方法及装置、电子设备、可读介质、产品
CN112749265A (zh) * 2021-01-08 2021-05-04 哈尔滨工业大学 一种基于多信息源的智能问答***
CN112925890A (zh) * 2021-03-05 2021-06-08 湖南神通智能股份有限公司 一种智能问答***
CN112948557A (zh) * 2021-03-09 2021-06-11 哈尔滨工业大学 一种以说明文档为辅助的可迭代的基于常用问题集的智能客服***
CN113836296A (zh) * 2021-09-28 2021-12-24 平安科技(深圳)有限公司 一种佛学问答摘要的生成方法、装置、设备及存储介质
CN114491051B (zh) * 2022-04-02 2022-07-29 四川省大数据中心 一种建筑用地项目审批***
CN114491051A (zh) * 2022-04-02 2022-05-13 四川省大数据中心 一种建筑用地项目审批***
CN116186232A (zh) * 2023-04-26 2023-05-30 中国电子技术标准化研究院 一种标准知识智能问答实现方法、装置、设备和介质
CN116881426A (zh) * 2023-08-30 2023-10-13 环球数科集团有限公司 一种基于aigc的自解释问答***
CN116881426B (zh) * 2023-08-30 2023-11-10 环球数科集团有限公司 一种基于aigc的自解释问答***

Similar Documents

Publication Publication Date Title
CN103902652A (zh) 自动问答***
Mihalcea et al. Wikify! Linking documents to encyclopedic knowledge
Cafarella et al. Webtables: exploring the power of tables on the web
CN102087669B (zh) 基于语义关联的智能搜索引擎***
US9715493B2 (en) Method and system for monitoring social media and analyzing text to automate classification of user posts using a facet based relevance assessment model
Cafarella et al. Web-scale extraction of structured data
Lin et al. An integrated approach to extracting ontological structures from folksonomies
Lytvyn et al. Identifying textual content based on thematic analysis of similar texts in big data
CN110888991A (zh) 一种弱标注环境下的分段式语义标注方法
CN104765779A (zh) 一种基于YAGO2s的专利文档查询扩展方法
Cafarella et al. Relational web search
Subhashini et al. Shallow NLP techniques for noun phrase extraction
Kim et al. Ontology construction using online ontologies based on selection, mapping and merging
Park et al. Extracting search intentions from web search logs
Nabil et al. AlQuAnS-An Arabic Language Question Answering System.
Annadurai et al. Architecture of personalized web search engine using suffix tree clustering
Gupta et al. Document summarisation based on sentence ranking using vector space model
Wroblewski A hierarchical www pages clustering algorithm based on the vector space model
Sahu et al. Analytical study on intelligent information retrieval system using semantic network
Takhirov et al. An evidence-based verification approach to extract entities and relations for knowledge base population
Gardarin et al. SEWISE: An ontology-based web information search engine
Sharma et al. Improved stemming approach used for text processing in information retrieval system
Ibekwe‐SanJuan Information Science in the web era: A term‐based approach to domain mapping
TWI423053B (zh) Domain Interpretation Data Retrieval Method and Its System
Kanavos et al. Extracting knowledge from web search engine using wikipedia

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140702

RJ01 Rejection of invention patent application after publication