CN106528764B - 基于人工智能的提问型检索词的检索方法及装置 - Google Patents

基于人工智能的提问型检索词的检索方法及装置 Download PDF

Info

Publication number
CN106528764B
CN106528764B CN201610973469.2A CN201610973469A CN106528764B CN 106528764 B CN106528764 B CN 106528764B CN 201610973469 A CN201610973469 A CN 201610973469A CN 106528764 B CN106528764 B CN 106528764B
Authority
CN
China
Prior art keywords
answer
term
list
webpage
artificial intelligence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610973469.2A
Other languages
English (en)
Other versions
CN106528764A (zh
Inventor
刘雄
何伯磊
马艳军
费晓旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610973469.2A priority Critical patent/CN106528764B/zh
Publication of CN106528764A publication Critical patent/CN106528764A/zh
Application granted granted Critical
Publication of CN106528764B publication Critical patent/CN106528764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于人工智能的提问型检索词的检索方法和装置,其中,方法包括:通过根据提问型检索词进行检索,确定与该检索词相关的网页之后,根据预设的列表模板,从网页的正文内容中,提取出列表形式的答案,从而在检索词的检索结果页面上,对列表形式的答案进行呈现。由于采用了在检索结果页面上对该列表形式的答案直接进行呈现的方式,替代了现有技术中呈现的一段文本,无需用户执行点击相关链接、查看网页中的具体内容以及自行总结归纳出问题的答案的步骤,解决了现有技术中问题的答案呈现不够直观,导致检索效率较差的技术问题。

Description

基于人工智能的提问型检索词的检索方法及装置
技术领域
本发明涉及信息检索技术领域,尤其涉及一种基于人工智能的提问型检索词的检索方法及装置。
背景技术
人工智能(Artificial Intelligence,简称AI)。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家***等。
随着互联网的普及,互联网上的信息也越来越丰富,现在人们通过搜索引擎可以便捷的获取自己想要的信息。用户可以自行设置检索词,从而搜索引擎根据检索词进行检索,将检索结果返回给用户。
在搜索引擎运行的过程中,发明人发现:用户在一些情况下会提出一个问题作为检索词,也就是说检索词为提问型检索词,在这种情况下,如果采用现有技术中的信息检索和文档摘要技术,搜索引擎将用户所提出的问题作为检索词,从检索到的与用户提出的问题相关的网页中,摘取一段连续的文本,呈现给用户。
但往往所摘取的文本与问题的答案相关性不高,用户在获取问题的答案时,还需要首先通过在检索结果中点击相关链接,以查看网页中的具体内容,进而用户还需要自行总结归纳出问题的答案,因此,现有技术中,针对提问型检索词进行检索时,存在问题的答案呈现不够直观,导致检索效率较差。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于人工智能的提问型检索词的检索方法,以实现从页面中提取出列表形式的答案,从而在检索结果页面上对该列表形式的答案直接进行呈现,通过用列表形式的答案替代现有技术中呈现的一段文本,来解决现有技术中呈现不够直观,导致检索效率较差的技术问题。
本发明的第二个目的在于提出一种基于人工智能的提问型检索词的检索装置。
本发明的第三个目的在于提出另一种基于人工智能的提问型检索词的检索装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种基于人工智能的提问型检索词的检索方法,包括:根据所述提问型检索词进行检索,以确定与所述检索词相关的网页;根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现。
本发明实施例的基于人工智能的提问型检索词的检索方法,通过根据提问型检索词进行检索,确定与该检索词相关的网页之后,根据预设的列表模板,从网页的正文内容中,提取出列表形式的答案,从而在检索词的检索结果页面上,对列表形式的答案进行呈现。由于采用了在检索结果页面上对该列表形式的答案直接进行呈现的方式,替代了现有技术中呈现的一段文本,无需用户执行点击相关链接、查看网页中的具体内容以及自行总结归纳出问题的答案的步骤,解决了现有技术中问题的答案呈现不够直观,导致检索效率较差的技术问题。
为达上述目的,本发明第二方面实施例提出了一种基于人工智能的提问型检索词的检索装置,包括:检索模块,用于根据所述提问型检索词进行检索,以确定与所述检索词相关的网页;提取模块,用于根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;呈现模块,用于在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现。
本发明实施例的基于人工智能的提问型检索词的检索装置,通过检索模块根据提问型检索词进行检索,确定与该检索词相关的网页之后,根据预设的列表模板,提取模块从网页的正文内容中,提取出列表形式的答案,从而在检索词的检索结果页面上,呈现模块对列表形式的答案进行呈现。由于采用了在检索结果页面上对该列表形式的答案直接进行呈现的方式,替代了现有技术中呈现的一段文本,无需用户执行点击相关链接、查看网页中的具体内容以及自行总结归纳出问题的答案的步骤,解决了现有技术中问题的答案呈现不够直观,导致检索效率较差的技术问题。
为达上述目的,本发明第三方面实施例提出了另一种基于人工智能的提问型检索词的检索装置,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:根据所述提问型检索词进行检索,以确定与所述检索词相关的网页;根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器被执行时,使得移动终端能够执行一种基于人工智能的提问型检索词的检索方法,所述方法包括:根据所述提问型检索词进行检索,以确定与所述检索词相关的网页;根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的提问型检索词的检索方法,所述方法包括:根据所述提问型检索词进行检索,以确定与所述检索词相关的网页;根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种基于人工智能的提问型检索词的检索方法的流程示意图;
图2为本发明实施例所提供的另一种基于人工智能的提问型检索词的检索方法的流程示意图;
图3为提取列表形式的答案的流程图;
图4为置信度计算的流程图;
图5为在电脑端的呈现界面的示意图;
图6为在移动端的呈现界面的示意图之一;
图7为在移动端的呈现界面的示意图之二;
图8为本发明实施例提供的一种基于人工智能的提问型检索词的检索装置的结构示意图之一;以及
图9为本发明实施例提供的一种基于人工智能的提问型检索词的检索装置的结构示意图之二。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的提问型检索词的检索方法和装置。
图1为本发明实施例所提供的一种基于人工智能的提问型检索词的检索方法的流程示意图。
如图1所示,该提问型检索词的检索方法包括:
步骤101,根据提问型检索词进行检索,以确定与检索词相关的网页。
其中,提问型检索词是指用于提出问题以检索到该问题的答案的检索词。
具体地,本发明实施例提供的检索方法可以应用于具有检索功能的搜索引擎上。在根据提问型检索词进行检索之后,会获得多个与检索词相关的网页,检索结果的排序往往是与检索词的相关性有关的,排序越靠前,则相关性越大。一般来说,能够回答问题页面中不仅包含答案,而且有问题本身,因此,这里可以优选检索结果排序靠前的若干个网页。
步骤102,根据预设的列表模板,从网页的正文内容中,提取出列表形式的答案。
其中,列表模板中记录有各种句式。
具体地,可以首先从网页中提取出网页的正文内容。在进行正文内容提取时,有两种可能的实现方式:其中一种可能的实现方式为从普通页面中直接进行提取,其中另一种可能的实现方式为从结构化网页中进行提取,这里的结构化网页是预先对正常的页面由爬虫进行爬取到的。
进而,针对网页的正文内容中的每一个句子,判断该句子是否为与列表模板中的列表句式匹配的目标句子,针对目标句子,识别目标句子所采用的列表句式和列表序号,依据列表序号,将采用同一列表句式的目标句子组织为列表形式的答案。
之所以采用列表形式的答案是由于,在进行网络检索时,往往会有一部分检索是基于提问型检索词,这类检索是无法采用简短的文字与用户的检索需求匹配的,比如对于问题“苹果手机如何截图”、“黑木耳的功效与作用”、“关于爱情的句子”等等,用户会采用如上这些提问型检索词直接进行检索。在这种情况下,检索获得的一段与检索词字面匹配的文字显然不能回答用户提出的问题,往往只能是重复检索问题本身。如果能够提供列表类型的答案,则能够较好的匹配用户的检索需求,还是以前面所提供的三个问题为例,针对第一个问题,列表型的答案可以给用户展示截图方法的一个个步骤,而针对第二个问题,列表型的答案可以给用户展示每一个功效的主要内容,针对第三个问题,列表型的答案可以将具体的句子示例一一列举出来。因此,在针对提问型检索词进行检索时,列表型答案则可以更好地满足用户的检索需求,让他们快速地找到问题的答案。
进一步,如果在步骤101中选取了至少两个网页,则在本步骤中可能会获得不止一个列表形式的答案。但由于呈现空间有限,一般只选择一个置信度最高的列表形式的答案进行呈现,其中,这里的置信度用于指示答案与检索词所提问题之间的相关性,也就是选择最能够回答检索词所提问题的列表形式的答案。
步骤103,在检索词的检索结果页面上,对列表形式的答案进行呈现。
具体地,在检索结果页面上,包含至少两部分内容,一个部分为页面的链接,另一个部分为列表形式的答案。作为一种可能的实现方式,列表形式的答案可以设置于链接下方。相较于在链接下方显示匹配文本的方式,改善了答案呈现效果,答案的呈现更直观,使答案更有组织,方便用户阅读和选择。同时,以列表的形式呈现用户所需的答案内容,实现了搜索引擎自动地为用户总结归纳了网页中针对用户问题最合适的列表内容,而且从网页中抽取列表形式的答案,有效圈定了候选答案的范围,提高了答案与问题之间的相关性。
本实施例中,通过根据提问型检索词进行检索,确定与该检索词相关的网页之后,根据预设的列表模板,从网页的正文内容中,提取出列表形式的答案,从而在检索词的检索结果页面上,对列表形式的答案进行呈现。由于采用了在检索结果页面上对该列表形式的答案直接进行呈现的方式,替代了现有技术中呈现的一段文本,无需用户执行点击相关链接、查看网页中的具体内容以及自行总结归纳出问题的答案的步骤,解决了现有技术中问题的答案呈现不够直观,导致检索效率较差的技术问题。
为了清楚说明上一实施例,本实施例提供了另一种基于人工智能的提问型检索词的检索方法,图2为本发明实施例所提供的另一种基于人工智能的提问型检索词的检索方法的流程示意图。
如图2所示,该提问型检索词的检索方法可以包括以下步骤:
步骤201,利用提问型检索词检索与该检索词相关的各网页。
步骤202,提取各网页的正文。
作为一种可能的实现方式,可以从普通页面中直接进行提取。
作为另一种可能的实现方式,可以从结构化网页中进行提取,这里的结构化网页是预先对正常的页面由爬虫进行爬取到的。
步骤203,根据预设的列表模板,对各网页的正文内容进行提取,以得到列表形式的答案作为列表候选。
具体地,针对网页的正文内容中的每一个句子,判断句子是否为与列表模板中的列表句式匹配的目标句子,针对目标句子,识别目标句子所采用的列表句式和列表序号。进而判断采用同一列表句式的目标句子的列表序号是否连续,若连续,则根据列表序号,确定采用同一列表句式的目标句子之间的父子关系。基于栈的结构,对这些采用同一列表句式的目标句子,依据父子关系进行组织,以生成具体采用列表树形式的答案。
为了清楚说明本步骤,图3为提取列表形式的答案的流程图,如图3所示,在分别执行获取网页的正文内容,以及对正文内容进行句子切分,获得每一个句子之后,首先执行基于列表模块的句子识别,具体地,识别正文内容中的每个句子是否为与列表模板中的列表句式匹配的目标句子,只有与列表模板中的列表句式匹配的目标句子才能够构成列表形式的答案的内容。若判断结果为是,则会进一步识别句子的列表句式和列表序号。
例如:对于句子“方法一:使用浏览器打开……”,会识别其匹配的列表句式为“方法”+“中文数字”+“中文冒号”,列表的序号为“1”。
进而,根据列表序号,确定采用同一列表句式的目标句子之间的父子关系。基于栈的结构,对这些采用同一列表句式的目标句子,依据父子关系进行组织,以生成具体采用列表树形式的答案。
最后,为了方便用户阅读,还可以对识别出的序号进行改写,例如,统一为“1.”“2.”“3.”的形式,则对于目标句子“方法一:使用浏览器打开……”,将其改写为“1.使用浏览器打开……”。另外,还可以对列表的长度进行改写,具体来说,针对每一个句子截取若干字节用于进行呈现。
步骤204,判断是否提取出列表候选,若是则将所提取到的列表形式的答案作为列表候选,执行步骤205,否则结束流程。
具体地,若未提取出列表候选,则不再继续执行本流程,转而执行现有技术中的检索结果呈现,也就是显示网页链接以及网页中的一段文本。
步骤205,对各列表候选进行置信度计算,以根据该置信度确定各列表候选与检索词所提问题之间的相关性。
具体地,置信度用于指示答案与检索词所提问题之间的相关性,这里的置信度包含两个参数,一个参数为引导句与检索词之间的相关性,另一个参数为答案的文本与检索词之间的相关性。
为了清楚说明本步骤,图4为置信度计算的流程图,如图4所示,置信度由引导句与检索词之间的相关性,以及答案的文本与检索词之间的相关性两部分拟合而成。
其中,针对引导句与检索词之间的相关性来说,在网页中的目标句子之前通常会有一个句子提示接下来的内容会是列表型的内容,如“步骤如下:”,我们将这样的句子称为引导句。引导句的类型主要有两种:一种是与检索词无关的,对于各种检索词均适用的引导句,例如“具体如下:”、“列举如下:”等等;另一种,是与检索词相关的引导句,例如:提问型检索词“开衫毛衣怎么搭配”,引导句为“下面就一起来看看怎么搭配吧”。显然,后一种情况下引导句与检索词之间的相关性较高,在后一种引导句下也更容易出现问题的答案。
针对答案的文本与检索词之间的相关性来说,首先需要判断检索词的类型,这里所说的类型可以包括:如何、何时、为什么、什么功效等提问类型,以及判断检索词对应答案的类型(Lexical Answer Type,LAT)。进而,根据检索词所提问题的类型,和/或检索词对应答案的类型,在相关性词典中查询对应的特征词。这里所说的相关性词典中记载有各问题的类型和/或答案的类型对应的特征词。
例如:如何类型的提问,对应的答案中常有“动词+名词”的组合,因而如何类型的提问对应的特征词为“动词+名词”。
又例如:功效类型的提问,对应的答案中常有“含有”、“丰富”、“可以”等,因而功效类型的提问对应的特征词为“含有”、“丰富”、“可以”。
最后,将答案的文本与特征词之间计算相似度。
从而对引导句与检索词之间的相关性,以及答案的文本与检索词之间的相关性两部分进行计算,例如:加权求和等,获得最终的置信度。
步骤206,判断置信度最高的列表候选的置信度是否大于预设阈值,若是,则执行步骤207,否则结束流程。
具体地,若在全部列表候选中,置信度最高的列表候选的置信度比较低,则说明全部列表候选中不存在问题答案的可能性较大,从而不再执行本流程,而是执行现有技术中的检索结果呈现,也就是显示网页链接以及网页中的一段文本。
步骤207、将信度最高的列表候选作为列表形式的答案进行后处理,并在检索结果页面上进行呈现。
具体地,后处理的目的在于呈现的美观性和可读性,具体来说,可以包括序号改写、长度截断等。为了说明呈现效果本实施例提供了图5-图7的呈现界面的示意,其中,图5为在电脑端的呈现界面的示意图,图6和图7为在移动端的呈现界面的示意图。
可见,通过根据提问型检索词进行检索,确定与该检索词相关的网页之后,根据预设的列表模板,从网页的正文内容中,提取出列表形式的答案,从而在检索词的检索结果页面上,对列表形式的答案进行呈现。由于采用了在检索结果页面上对该列表形式的答案直接进行呈现的方式,替代了现有技术中呈现的一段文本,无需用户执行点击相关链接、查看网页中的具体内容以及自行总结归纳出问题的答案的步骤,解决了现有技术中问题的答案呈现不够直观,导致检索效率较差的技术问题。
为了实现上述实施例,本发明还提出一种基于人工智能的提问型检索词的检索装置。
图8为本发明实施例提供的一种基于人工智能的提问型检索词的检索装置的结构示意图之一。
如图8所示,该装置包括:检索模块81、提取模块82和呈现模块83。
检索模块81,用于根据提问型检索词进行检索,以确定与所述检索词相关的网页。
提取模块82,用于根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案。
呈现模块83,用于在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现。
需要说明的是,前述对提问型检索词的检索方法实施例的解释说明也适用于该实施例的提问型检索词的检索装置,此处不再赘述。
本发明实施例中,通过检索模块根据提问型检索词进行检索,确定与该检索词相关的网页之后,根据预设的列表模板,提取模块从网页的正文内容中,提取出列表形式的答案,从而在检索词的检索结果页面上,呈现模块对列表形式的答案进行呈现。由于采用了在检索结果页面上对该列表形式的答案直接进行呈现的方式,替代了现有技术中呈现的一段文本,无需用户执行点击相关链接、查看网页中的具体内容以及自行总结归纳出问题的答案的步骤,解决了现有技术中问题的答案呈现不够直观,导致检索效率较差的技术问题。
基于上述实施例,本发明实施例还提供了一种基于人工智能的提问型检索词的检索装置的可能的实现方式,图9为本发明实施例提供的一种基于人工智能的提问型检索词的检索装置的结构示意图之二,如图9所示,在上一实施例的基础上,提取模块82包括:判断单元821、识别单元822和组织单元823。
判断单元821,用于针对所述网页的正文内容中的每一个句子,判断所述句子是否为与所述列表模板中的列表句式匹配的目标句子。
识别单元822,用于针对所述目标句子,识别所述目标句子所采用的列表句式和列表序号。
组织单元823,用于依据所述列表序号,将采用同一列表句式的目标句子组织为列表形式的答案。
进一步地,在本发明实施例的一种可能的实现方式中,组织单元823,具体用于根据所述列表序号,确定所述采用同一列表句式的目标句子之间的父子关系;基于栈的结构,对所述采用同一列表句式的目标句子,依据所述父子关系进行组织,以生成具体采用列表树形式的答案。
进一步地,在本发明实施例的一种可能的实现方式中,提取模块82,还包括:序号处理单元824。
序号处理单元824,用于判断所述采用同一列表句式的目标句子的列表序号是否连续;若连续,则指示组织单元依据所述列表序号,将采用同一列表句式的目标句子组织为列表形式的答案。
进一步地,在本发明实施例的一种可能的实现方式中,提问型检索词的检索装置,还包括:改写模块84。
改写模块84,用于对所述列表形式的答案中的列表序号,按照预设格式进行改写。
进一步地,在本发明实施例的一种可能的实现方式中,检索模块81所检索到的网页为多个,则装置,还包括:计算模块85和筛选模块86。
计算模块85,用于对多个所述网页所对应的答案,进行置信度计算;其中,所述置信度用于指示答案与检索词所提问题之间的相关性。
筛选模块86,用于根据所述置信度,对多个所述网页所对应的答案进行筛选,保留置信度最高且置信度大于预设阈值的答案。
其中,计算模块85,包括:提取单元851、第一计算单元852和第二计算单元853。
提取单元851,用于提取所述网页中用于引出所述目标句子的引导句。
第一计算单元852,用于根据所述引导句与所述检索词之间的相关性,计算所述置信度。
第二计算单元853,用于根据所述答案的文本与所述检索词之间的相关性,计算所述置信度。
具体地,第二计算单元853,具体用于确定所述检索词所提问题的类型,和/或所述检索词对应答案的类型;查询所述检索词所提问题的类型,和/或所述检索词对应答案的类型对应的特征词;根据所述答案的文本与所述特征词之间的相关性,计算所述置信度。
本发明实施例中,通过检索模块根据提问型检索词进行检索,确定与该检索词相关的网页之后,根据预设的列表模板,提取模块从网页的正文内容中,提取出列表形式的答案,从而在检索词的检索结果页面上,呈现模块对列表形式的答案进行呈现。由于采用了在检索结果页面上对该列表形式的答案直接进行呈现的方式,替代了现有技术中呈现的一段文本,无需用户执行点击相关链接、查看网页中的具体内容以及自行总结归纳出问题的答案的步骤,解决了现有技术中问题的答案呈现不够直观,导致检索效率较差的技术问题。
为了实现上述实施例,本发明还提出另一种基于人工智能的提问型检索词的检索装置,包括:处理器,以及用于存储所述处理器可执行指令的存储器。
其中,处理器被配置为:根据所述提问型检索词进行检索,以确定与所述检索词相关的网页;根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器被执行时,使得移动终端能够执行一种基于人工智能的提问型检索词的检索方法,所述方法包括:根据所述提问型检索词进行检索,以确定与所述检索词相关的网页;根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的提问型检索词的检索方法,所述方法包括:根据所述提问型检索词进行检索,以确定与所述检索词相关的网页;根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (16)

1.一种基于人工智能的提问型检索词的检索方法,其特征在于,包括以下步骤:
根据提问型检索词进行检索,以确定与所述检索词相关的网页;
根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;
在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现;
其中,所述根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的***括:
针对所述网页的正文内容中的每一个句子,判断所述句子是否为与所述列表模板中的列表句式匹配的目标句子;
针对所述目标句子,识别所述目标句子所采用的列表句式和列表序号;
依据所述列表序号,将采用同一列表句式的目标句子组织为列表形式的答案。
2.根据权利要求1所述的基于人工智能的提问型检索词的检索方法,其特征在于,所述依据所述列表序号,将采用同一列表句式的目标句子组织为列表形式的***括:
根据所述列表序号,确定所述采用同一列表句式的目标句子之间的父子关系;
基于栈的结构,对所述采用同一列表句式的目标句子,依据所述父子关系进行组织,以生成具体采用列表树形式的答案。
3.根据权利要求1所述的基于人工智能的提问型检索词的检索方法,其特征在于,所述依据所述列表序号,将采用同一列表句式的目标句子组织为列表形式的答案之前,还包括:
判断所述采用同一列表句式的目标句子的列表序号是否连续;
若连续,依据所述列表序号,将采用同一列表句式的目标句子组织为列表形式的答案。
4.根据权利要求1所述的基于人工智能的提问型检索词的检索方法,其特征在于,所述依据所述列表序号,将采用同一列表句式的目标句子组织为列表形式的答案之后,还包括:
对所述列表形式的答案中的列表序号,按照预设格式进行改写。
5.根据权利要求1-4任一项所述的基于人工智能的提问型检索词的检索方法,其特征在于,所述网页为多个,所述根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案之后,还包括:
对多个所述网页所对应的答案,进行置信度计算;其中,所述置信度用于指示答案与检索词所提问题之间的相关性;
根据所述置信度,对多个所述网页所对应的答案进行筛选,保留置信度最高且置信度大于预设阈值的答案。
6.根据权利要求5所述的基于人工智能的提问型检索词的检索方法,其特征在于,所述进行置信度计算包括:
提取所述网页中用于引出目标句子的引导句;
根据所述引导句与所述检索词之间的相关性,计算所述置信度。
7.根据权利要求5所述的基于人工智能的提问型检索词的检索方法,其特征在于,所述进行置信度计算包括:
根据所述答案的文本与所述检索词之间的相关性,计算所述置信度。
8.根据权利要求7所述的基于人工智能的提问型检索词的检索方法,其特征在于,所述根据所述答案的文本与所述检索词之间的相关性,计算所述置信度包括:
确定所述检索词所提问题的类型,和/或所述检索词对应答案的类型;
查询所述检索词所提问题的类型,和/或所述检索词对应答案的类型对应的特征词;
根据所述答案的文本与所述特征词之间的相关性,计算所述置信度。
9.一种基于人工智能的提问型检索词的检索装置,其特征在于,包括:
检索模块,用于根据提问型检索词进行检索,以确定与所述检索词相关的网页;
提取模块,用于根据预设的列表模板,从所述网页的正文内容中,提取出列表形式的答案;
呈现模块,用于在所述检索词的检索结果页面上,对所述列表形式的答案进行呈现;
其中,所述提取模块包括:
判断单元,用于针对所述网页的正文内容中的每一个句子,判断所述句子是否为与所述列表模板中的列表句式匹配的目标句子;
识别单元,用于针对所述目标句子,识别所述目标句子所采用的列表句式和列表序号;
组织单元,用于依据所述列表序号,将采用同一列表句式的目标句子组织为列表形式的答案。
10.根据权利要求9所述的基于人工智能的提问型检索词的检索装置,其特征在于,
所述组织单元,具体用于根据所述列表序号,确定所述采用同一列表句式的目标句子之间的父子关系;基于栈的结构,对所述采用同一列表句式的目标句子,依据所述父子关系进行组织,以生成具体采用列表树形式的答案。
11.根据权利要求9所述的基于人工智能的提问型检索词的检索装置,其特征在于,所述提取模块,还包括:
序号处理单元,用于判断所述采用同一列表句式的目标句子的列表序号是否连续;若连续,则指示组织单元依据所述列表序号,将采用同一列表句式的目标句子组织为列表形式的答案。
12.根据权利要求9所述的基于人工智能的提问型检索词的检索装置,其特征在于,所述装置,还包括:
改写模块,用于对所述列表形式的答案中的列表序号,按照预设格式进行改写。
13.根据权利要求9-12任一项所述的基于人工智能的提问型检索词的检索装置,其特征在于,所述网页为多个,所述装置,还包括:
计算模块,用于对多个所述网页所对应的答案,进行置信度计算;其中,所述置信度用于指示答案与检索词所提问题之间的相关性;
筛选模块,用于根据所述置信度,对多个所述网页所对应的答案进行筛选,保留置信度最高且置信度大于预设阈值的答案。
14.根据权利要求13所述的基于人工智能的提问型检索词的检索装置,其特征在于,所述计算模块,包括:
提取单元,用于提取所述网页中用于引出目标句子的引导句;
第一计算单元,用于根据所述引导句与所述检索词之间的相关性,计算所述置信度。
15.根据权利要求13所述的提问型检索词的检索装置,其特征在于,所述计算模块,包括:
第二计算单元,用于根据所述答案的文本与所述检索词之间的相关性,计算所述置信度。
16.根据权利要求15所述的基于人工智能的提问型检索词的检索装置,其特征在于,
所述第二计算单元,具体用于确定所述检索词所提问题的类型,和/或所述检索词对应答案的类型;查询所述检索词所提问题的类型,和/或所述检索词对应答案的类型对应的特征词;根据所述答案的文本与所述特征词之间的相关性,计算所述置信度。
CN201610973469.2A 2016-10-28 2016-10-28 基于人工智能的提问型检索词的检索方法及装置 Active CN106528764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610973469.2A CN106528764B (zh) 2016-10-28 2016-10-28 基于人工智能的提问型检索词的检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610973469.2A CN106528764B (zh) 2016-10-28 2016-10-28 基于人工智能的提问型检索词的检索方法及装置

Publications (2)

Publication Number Publication Date
CN106528764A CN106528764A (zh) 2017-03-22
CN106528764B true CN106528764B (zh) 2019-11-08

Family

ID=58349880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610973469.2A Active CN106528764B (zh) 2016-10-28 2016-10-28 基于人工智能的提问型检索词的检索方法及装置

Country Status (1)

Country Link
CN (1) CN106528764B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108632322B (zh) * 2017-03-24 2021-07-30 北京京东尚科信息技术有限公司 应答接口开放的方法、装置、设备及存储介质
CN109635094B (zh) * 2018-12-17 2023-04-18 北京百度网讯科技有限公司 用于生成答案的方法和装置
CN111611484B (zh) * 2020-05-13 2023-08-11 湖南微步信息科技有限责任公司 一种基于物品属性识别的股票推荐方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101174259A (zh) * 2007-09-17 2008-05-07 张琰亮 一种智能互动式问答***
CN101256586A (zh) * 2007-03-02 2008-09-03 索尼株式会社 信息处理装置、信息处理方法和程序
CN102169501A (zh) * 2011-04-26 2011-08-31 北京百度网讯科技有限公司 基于搜索结果对应文档的类型信息生成摘要的方法与设备
CN102637192A (zh) * 2012-02-17 2012-08-15 清华大学 一种自然语言问答的方法
CN102789496A (zh) * 2012-07-13 2012-11-21 携程计算机技术(上海)有限公司 智能应答的实现方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256586A (zh) * 2007-03-02 2008-09-03 索尼株式会社 信息处理装置、信息处理方法和程序
CN101174259A (zh) * 2007-09-17 2008-05-07 张琰亮 一种智能互动式问答***
CN102169501A (zh) * 2011-04-26 2011-08-31 北京百度网讯科技有限公司 基于搜索结果对应文档的类型信息生成摘要的方法与设备
CN102637192A (zh) * 2012-02-17 2012-08-15 清华大学 一种自然语言问答的方法
CN102789496A (zh) * 2012-07-13 2012-11-21 携程计算机技术(上海)有限公司 智能应答的实现方法及***

Also Published As

Publication number Publication date
CN106528764A (zh) 2017-03-22

Similar Documents

Publication Publication Date Title
CN106528845B (zh) 基于人工智能的检索纠错方法及装置
CN107220094B (zh) 页面加载方法、装置和电子设备
Kao et al. Towards text-based emotion detection a survey and possible improvements
US10073836B2 (en) Detecting literary elements in literature and their importance through semantic analysis and literary correlation
Bauer et al. Quantitive evaluation of Web site content and structure
CN100595762C (zh) 文本集合可视化***
CN108170859A (zh) 语音查询的方法、装置、存储介质及终端设备
CN106294635B (zh) 应用程序搜索方法、深度神经网络模型的训练方法及装置
CN110188350A (zh) 文本一致性计算方法及装置
Baur et al. eXplainable cooperative machine learning with NOVA
CN106528764B (zh) 基于人工智能的提问型检索词的检索方法及装置
CN110222654A (zh) 文本分割方法、装置、设备及存储介质
CN112631436B (zh) 输入法敏感词的过滤方法及装置
CN110083829A (zh) 情感极性分析方法及相关装置
Sardinha An assessment of metaphor retrieval methods
KR101007284B1 (ko) 인터넷을 이용한 의견 검색 시스템 및 그 방법
CN109284389A (zh) 一种文本数据的信息处理方法、装置
KR20230052609A (ko) 기계독해를 이용한 리뷰 분석 시스템 및 방법
Mousavi Nejad et al. Knight: Mapping privacy policies to gdpr
CN106599297A (zh) 基于深度问答的提问型搜索词搜索方法及装置
CN112711666B (zh) 期货标签抽取方法及装置
KR102094201B1 (ko) 자연어처리 기반의 낚시성 뉴스 기사 판별 시스템 및 방법
Wanner et al. Are my children old enough to read these books? Age suitability analysis
Vivoli et al. Multimodal transformer for comics text-cloze
Kumar et al. Natural language processing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant