CN106570116B - 基于人工智能的搜索结果的聚合方法及装置 - Google Patents

基于人工智能的搜索结果的聚合方法及装置 Download PDF

Info

Publication number
CN106570116B
CN106570116B CN201610943347.9A CN201610943347A CN106570116B CN 106570116 B CN106570116 B CN 106570116B CN 201610943347 A CN201610943347 A CN 201610943347A CN 106570116 B CN106570116 B CN 106570116B
Authority
CN
China
Prior art keywords
page
demand
pages
matched
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610943347.9A
Other languages
English (en)
Other versions
CN106570116A (zh
Inventor
刘家辰
何伯磊
费晓旭
马艳军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610943347.9A priority Critical patent/CN106570116B/zh
Publication of CN106570116A publication Critical patent/CN106570116A/zh
Application granted granted Critical
Publication of CN106570116B publication Critical patent/CN106570116B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于人工智能的搜索结果的聚合方法及装置,其中,方法包括:根据用户提供的泛需求检索词,进行搜索得到各页面之后,对搜索得到的各页面进行需求分析,以得到该页面所匹配需求的信息,从而根据页面所匹配需求的信息,从搜索得到的各页面中选择出目标页面,并采用在搜索结果中优先显示目标页面的方式,进行搜索结果的聚合。由于目标页面是根据页面所匹配需求的信息所选择出的,因此,目标页面能够较好的与需求相匹配,解决了现有技术中针对泛需求检索词进行检索时,存在搜索结果与用户需求的匹配性较差,导致检索效率不高的技术问题。

Description

基于人工智能的搜索结果的聚合方法及装置
技术领域
本发明涉及信息检索技术领域,尤其涉及一种基于人工智能的搜索结果的聚合方法及装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家***等。其中,人工智能最重要的方面就是自然语言处理、自然语言理解等相关技术。
互联网的普及,互联网上的信息也越来越丰富,现在人们通过搜索引擎可以便捷的获取自己想要的信息。用户可以自行设置检索词,从而搜索引擎根据检索词进行检索,将检索结果返回给用户。
在搜索引擎运行的过程中,发明人发现:用户在一些情况下所采用的检索词能够较为明确地体现用户的需求,例如:“北京一日游行程”,能明确指出用户的需求为北京一日游行程的内容,而在另一些情况下用户所采用的检索词所体现的用户需求则较为模糊,例如:“北京旅游”,有可能该用户的需求为北京旅游的行程内容,也有可能为北京旅游的旅游产品介绍,还有可能是北京旅游的景点介绍等等,仅根据这种检索词并不能够确定用户需求,因此,我们称这一类检索词为泛需求检索词。
在现有技术中对这一类检索词进行搜索时,由于检索词所体现的用户需求不明确,搜索结果中排序靠前的页面与用户需求的匹配性也较差。在这种情况下,用户需要自行在搜索结果中进行手动查询。可见在现有技术中,针对泛需求检索词进行检索时,存在搜索结果与用户需求的匹配性较差,导致检索效率不高的技术问题。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于人工智能的搜索结果的聚合方法,以实现在搜索结果中提高排序靠前的页面与用户需求的匹配程度,解决现有技术中针对泛需求检索词进行检索时,存在搜索结果与用户需求的匹配性较差,导致检索效率不高的技术问题。
本发明的第二个目的在于提出一种基于人工智能的搜索结果的聚合装置。
本发明的第三个目的在于提出另一种基于人工智能的搜索结果的聚合装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种基于人工智能的搜索结果的聚合方法,包括:
根据用户提供的泛需求检索词,进行搜索得到各页面;
对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;
根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;
采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
本发明实施例的基于人工智能的搜索结果的聚合方法,通过根据用户提供的泛需求检索词,进行搜索得到各页面之后,对搜索得到的各页面进行需求分析,以得到该页面所匹配需求的信息,从而根据页面所匹配需求的信息,从搜索得到的各页面中选择出目标页面,并采用在搜索结果中优先显示目标页面的方式,进行搜索结果的聚合。由于目标页面是根据页面所匹配需求的信息所选择出的,因此,目标页面能够较好的与需求相匹配,解决了现有技术中针对泛需求检索词进行检索时,存在搜索结果与用户需求的匹配性较差,导致检索效率不高的技术问题。
为达上述目的,本发明第二方面实施例提出了一种基于人工智能的搜索结果的聚合装置,包括:
搜索模块,用于根据用户提供的泛需求检索词,进行搜索得到各页面;
需求分析模块,用于对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;
选择模块,用于根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;
聚合模块,用于采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
本发明实施例的基于人工智能的搜索结果的聚合装置,通过搜索模块根据用户提供的泛需求检索词进行搜索得到各页面之后,需求分析模块对搜索得到的各页面进行需求分析,以得到页面所匹配需求的信息,进而根据页面所匹配需求的信息,选择模块从搜索得到的各页面中选择出目标页面,并由聚合模块采用在搜索结果中优先显示目标页面的方式,进行搜索结果的聚合。由于目标页面是根据页面所匹配需求的信息所选择出的,因此,目标页面能够较好的与需求相匹配,解决了现有技术中针对泛需求检索词进行检索时,存在搜索结果与用户需求的匹配性较差,导致检索效率不高的技术问题。
为达上述目的,本发明第三方面实施例提出了另一种基于人工智能的搜索结果的聚合装置,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:根据用户提供的泛需求检索词,进行搜索得到各页面;对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器端的处理器被执行时,使得服务器端能够执行一种基于人工智能的搜索结果的聚合方法,所述方法包括:根据用户提供的泛需求检索词,进行搜索得到各页面;对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的搜索结果的聚合方法,所述方法包括:根据用户提供的泛需求检索词,进行搜索得到各页面;对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种基于人工智能的搜索结果的聚合方法的流程示意图;
图2为本发明实施例所提供的另一种基于人工智能的搜索结果的聚合方法的流程示意图;
图3提供了一种可能的挖掘流程图;
图4为本发明实施例提供的一种基于人工智能的搜索结果的聚合装置的结构示意图之一;
图5为需求分析模块42的结构示意图;以及
图6为本发明实施例提供的一种基于人工智能的搜索结果的聚合装置的结构示意图之二。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于人工智能的搜索结果的聚合方法和装置。
图1为本发明实施例所提供的一种基于人工智能的搜索结果的聚合方法的流程示意图。
如图1所示,该基于人工智能的搜索结果的聚合方法包括以下步骤:
步骤101,根据用户提供的泛需求检索词,进行搜索得到各页面。
具体地,对于用户采用的泛需求检索词,其可能包含的多个具体需求,为了最大可能匹配中用户的需求,本发明实施例采用了对匹配各种需求的页面进行聚合的方式,从而给出聚合的搜索结果。但在对匹配各种需求的页面进行聚合之前,首先需要确定页面的选择范围进而从中选择出这些页面。本步骤通过采用泛需求检索词进行检索的方式,得到字面匹配的各页面作为选择范围。
步骤102,对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息。
其中,需求的信息包括:需求的标签,和/或页面与所确定出的需求标签的匹配程度。
具体地,在上一步骤所确定的选择范围内,针对每一个页面进行需求分析,具体来说,从页面的元素信息中,提取出分类特征,这里所说的元素信息包括题目、摘要、页面正文内容和/或网络地址;进而根据分类特征,在页面所属领域下,进行需求分类,以在该领域所对应的需求标签中,确定页面所匹配的需求标签,并计算页面与所确定出的需求标签的匹配程度。
一般来说,用户在每一个领域下,均有一些惯用的需求,从而使得每一领域均对应了多个常用的需求标签。在页面对应的领域下,从这些需求标签中确定匹配的需求标签,能够使得需求标签在较大程度上与页面匹配,也就是说,需求标签能够较为准确地指示页面所能满足的用户需求。
步骤103,根据页面所匹配需求的信息,从搜索得到的各页面中选择目标页面。
具体地,以预设指标为依据,根据页面所匹配需求的标签,以及页面与需求匹配的程度,从搜索得到的各页面中选择目标页面,所选择出来的目标页面所匹配的需求应当尽量多元化,从而能够最大程度涵盖用户的需求,提高与用户需求的匹配程度。
如何能够使得目标页面所匹配的需求应当尽量多元化,本步骤中具体可以通过指标的设置来进行保证。作为一种可能的实现方式,预设指标包括:具有同一标签的目标页面数量高于第一阈值;和/或,所选择出的目标页面所匹配需求的标签数量高于第二阈值;和/或所选择出的目标页面与所述需求匹配的程度高于第三阈值。
这三项指标分别对应了三个方面的限制条件,第一方面为满足每一方面需求的目标页面数量应尽量较多,第二方面为每一目标页面所能满足的需求应尽量较多,第三方面为目标页面应尽可能契合与其所能满足的需求。通过这三个方面的限制,能够选择出最大程度涵盖用户的需求的目标页面。
步骤104,采用在搜索结果中优先显示目标页面的方式,进行搜索结果的聚合。
具体地,在进行搜索结果的聚合时,将所述目标页面设置于所述搜索结果的首页进行显示。由于大多数用户习惯于从第一页开始寻找所需的页面,同时页面排序越靠后被用户点击的概率越低,因此,优先将目标页面设置于搜索结果的首页进行显示。
本实施例中,通过根据用户提供的泛需求检索词,进行搜索得到各页面之后,对搜索得到的各页面进行需求分析,以得到该页面所匹配需求的信息,从而根据页面所匹配需求的信息,从搜索得到的各页面中选择出目标页面,并采用在搜索结果中优先显示目标页面的方式,进行搜索结果的聚合。由于目标页面是根据页面所匹配需求的信息所选择出的,因此,目标页面能够较好的与需求相匹配,解决了现有技术中针对泛需求检索词进行检索时,存在搜索结果与用户需求的匹配性较差,导致检索效率不高的技术问题。
为了清楚说明上一实施例,本实施例提供了另一种基于人工智能的搜索结果的聚合方法,图2为本发明实施例所提供的另一种基于人工智能的搜索结果的聚合方法的流程示意图。
如图2所示,该基于人工智能的搜索结果的聚合方法可以包括以下步骤:
步骤201,采用离线***进行离线的数据挖掘,以对历史搜索所采用的检索词按照领域进行分析,得到各个领域对应的需求标签,生成用于记录各个领域对应的需求标签的标签词典。
具体地,用户的检索词尽管为泛需求检索词,但这里的所说的“泛需求”只是说需求不明确,较为模糊,因此,通常会并不是完全的“泛”,而是确定了某一个特定领域,但具体需求不确定的“泛”。可见,针对泛需求检索词,脱离开领域,直接从所有可能的需求词中推测用户需求,是不能够有效匹配用户需求的。应当预先对特定的领域分别分析用户的需求分布特点,以便在用户采用泛需求检索词进行搜索时,能够提高匹配中用户需求的概率。
在具体操作上,图3提供了一种可能的挖掘流程图,如图3所示,可以预先从展现日志和点击日志中获取历史搜索所采用的检索词,构成检索词集合,进而按照领域,对检索词集合中的检索词进行分类,得到各领域中常用的检索词。在这些领域内,对这些常用的检索词进行语法分析和词汇答案类型分析(Lexical Answer Type,LAT)提取出检索词中所隐含的需求词。通过对这些需求词进行统计分析,当然为了进一步提高准确度还可以进行人工校对,以便生成各个领域对应的需求标签。将各个领域对应的需求标签记录到标签词典中。
步骤202,在页面所属领域内,对页面进行需求分析,以从标签词典中所记录的该领域对应的需求标签中,确定该页面所匹配中的需求标签。
具体地,在确定页面所属领域之后,可以在前述标签词典所记录的该领域对应的需求标签基础上,参考人工智能中的多分类问题的解决方法,从页面的题目、摘要、网络地址等各种元信息中提取出分类特征,输入分类模型,在该领域对应的需求标签中确定匹配的需求标签。
步骤203,计算页面与所确定出的需求标签的匹配程度。
具体地,在确定出页面的需求标签之后,还需要对该页面满足该标签所指示需求的能力进行评估,将评估结果作为页面与所确定出的需求标签的匹配程度。作为一种可能的实现方式,在对该页面满足该标签所指示需求的能力进行评估时,可以依据以下三点:首先,为页面的题目、摘要和页面内容的一致性;其次,为页面的题目和摘要的文字质量;最后,为搜索引擎的点击日志中,该页面在历史搜索中被点击的情况。
步骤204,生成记录各页面所匹配需求的标签,以及页面与标签所指示需求的匹配程度的索引库。
步骤205,在线***获取用户的检索词,根据检索词进行搜索。
具体地,在用户需要进行检索时,在在线***输入检索词进行搜索。
步骤206,通过需求词典进行需求分析,以判断检索词是否为泛需求检索词,若为泛需求检索词,则利用索引库确定搜索到的页面所匹配需求的标签,以及所述页面与所述需求匹配的程度。
其中,需求词典用于记录各检索词对应的需求,若根据检索词在需求词典中没有匹配到对应的需求,则确定该检索词为泛需求检索词,
具体地,针对检索词首先需要判断该检索词是否为泛需求,如果需求是明确的,或者检索词无法作为泛需求检索词进行分析,则不再执行本流程;但若该检索词为泛需求检索词,则从索引库中获取离线***已经计算得到的页面所匹配需求的标签,以及所述页面与所述需求匹配的程度。
例如:针对在线***输入检索词进行搜索所得到的前100个页面,确定所匹配需求的标签以及该页面与需求匹配的程度。
步骤207,根据页面所匹配需求的信息,从搜索得到的各页面中选择目标页面,采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
其中,目标页面中的标题、摘要和页面内容所匹配的需求一致。
本步骤决定了最终给用户展现的内容,需要将已经获取了需求标签的页面,利用离线***计算得到的匹配程度进行聚合。在聚合的过程中需要注意以下三个要求:首先,所展现的需求标签,应当包含足够多的页面;其次,每个需求标签下的页面需要具有足够的内容多样性;最后,聚合后所展示的页面,其标题、摘要和页面内容对应的需求应当一致。具体地,为了满足以上三个要求,可以以预设指标为依据,根据页面所匹配需求的标签,以及页面与所述需求匹配的程度,从搜索得到的各页面中选择目标页面;其中,预设指标包括:具有同一标签的目标页面数量高于第一阈值;和/或,所选择出的目标页面所匹配需求的标签数量高于第二阈值;和/或所选择出的目标页面与所述需求匹配的程度高于第三阈值。
步骤208,将目标页面设置于搜索结果的首页进行显示。
本实施例中,通过根据用户提供的泛需求检索词,进行搜索得到各页面之后,对搜索得到的各页面进行需求分析,以得到该页面所匹配需求的信息,从而根据页面所匹配需求的信息,从搜索得到的各页面中选择出目标页面,并采用在搜索结果中优先显示目标页面的方式,进行搜索结果的聚合。由于目标页面是根据页面所匹配需求的信息所选择出的,因此,目标页面能够较好的与需求相匹配,解决了现有技术中针对泛需求检索词进行检索时,存在搜索结果与用户需求的匹配性较差,导致检索效率不高的技术问题。
为了实现上述实施例,本发明还提出一种基于人工智能的搜索结果的聚合装置。
图4为本发明实施例提供的一种基于人工智能的搜索结果的聚合装置的结构示意图之一。
如图4所示,该基于人工智能的搜索结果的聚合装置包括:搜索模块41、需求分析模块42、选择模块43和聚合模块44。
搜索模块41,用于根据用户提供的泛需求检索词,进行搜索得到各页面。
需求分析模块42,用于对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息。
作为一种可能的实现方式,需求分析模块42,具体用于在由离线运算所获得的索引库中,查询所述页面所匹配需求的标签,以及所述页面与所述需求匹配的程度。
作为另一种可能的实现方式,图5为需求分析模块42的结构示意图,如图5所示,需求分析模块42包括:提取单元421、分类单元422和计算单元423。
提取单元421,用于从所述页面的元素信息中,提取出分类特征。
其中,所述元素信息包括题目、摘要、页面正文内容和/或网络地址。
分类单元422,用于根据所述分类特征,在所述页面所属领域下,进行需求分类,以在所述领域所对应的需求标签中,确定所述页面所匹配的需求标签。
计算单元423,用于计算所述页面与所确定出的需求标签的匹配程度。
选择模块43,用于根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面。
其中,目标页面中的标题、摘要和页面内容所匹配的需求一致。
聚合模块44,用于采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
具体地,聚合模块44,具体用于在进行搜索结果的聚合时,将所述目标页面设置于所述搜索结果的首页进行显示。
需要说明的是,前述对基于人工智能的搜索结果的聚合方法实施例的解释说明也适用于该实施例的基于人工智能的搜索结果的聚合装置,此处不再赘述。
本发明实施例中,通过搜索模块根据用户提供的泛需求检索词进行搜索得到各页面之后,需求分析模块对搜索得到的各页面进行需求分析,以得到页面所匹配需求的信息,进而根据页面所匹配需求的信息,选择模块从搜索得到的各页面中选择出目标页面,并由聚合模块采用在搜索结果中优先显示目标页面的方式,进行搜索结果的聚合。由于目标页面是根据页面所匹配需求的信息所选择出的,因此,目标页面能够较好的与需求相匹配,解决了现有技术中针对泛需求检索词进行检索时,存在搜索结果与用户需求的匹配性较差,导致检索效率不高的技术问题。
基于上述实施例,本发明实施例还提供了一种基于人工智能的搜索结果的聚合装置的可能的实现方式,图6为本发明实施例提供的一种基于人工智能的搜索结果的聚合装置的结构示意图之二,如图6所示,在上一实施例的基础上,基于人工智能的搜索结果的聚合装置还包括:
领域分类模块61,用于对历史搜索所采用的检索词,按照领域进行分类,以得到各领域对应的检索词。
标签确定模块62,用于针对每一领域,对所述领域所对应的检索词进行分析,得到所述领域对应的需求标签。
具体地,标签确定模块62具体用于对所述领域所对应的检索词进行语法分析和/或LAT分析,得到需求词;对所述需求词进行统计分析,得到所述领域对应的需求标签。
进一步地,在本发明实施例的一种可能的实现方式中,选择模块43,具体用于以预设指标为依据,根据所述页面所匹配需求的标签,以及所述页面与所述需求匹配的程度,从搜索得到的各页面中选择目标页面;其中,所述预设指标包括:具有同一标签的目标页面数量高于第一阈值;和/或,所选择出的目标页面所匹配需求的标签数量高于第二阈值;和/或所选择出的目标页面与所述需求匹配的程度高于第三阈值。
本发明实施例中,通过搜索模块根据用户提供的泛需求检索词进行搜索得到各页面之后,需求分析模块对搜索得到的各页面进行需求分析,以得到页面所匹配需求的信息,进而根据页面所匹配需求的信息,选择模块从搜索得到的各页面中选择出目标页面,并由聚合模块采用在搜索结果中优先显示目标页面的方式,进行搜索结果的聚合。由于目标页面是根据页面所匹配需求的信息所选择出的,因此,目标页面能够较好的与需求相匹配,解决了现有技术中针对泛需求检索词进行检索时,存在搜索结果与用户需求的匹配性较差,导致检索效率不高的技术问题。
为了实现上述实施例,本发明还提出另一种基于人工智能的搜索结果的聚合装置,包括:处理器,以及用于存储所述处理器可执行指令的存储器。
其中,处理器被配置为:根据用户提供的泛需求检索词,进行搜索得到各页面;对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器端的处理器被执行时,使得服务器端能够执行一种基于人工智能的搜索结果的聚合方法,所述方法包括:根据用户提供的泛需求检索词,进行搜索得到各页面;对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的搜索结果的聚合方法,所述方法包括:根据用户提供的泛需求检索词,进行搜索得到各页面;对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (20)

1.一种基于人工智能的搜索结果的聚合方法,其特征在于,包括以下步骤:
根据用户提供的泛需求检索词,进行搜索得到各页面;
对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;
根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;
采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合;
所述需求信息包括需求标签和/或匹配程度,所述对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息,包括:
从所述页面的元素信息中,提取出分类特征;其中,所述元素信息包括题目、摘要和/或网络地址;
根据所述分类特征,在所述页面所属领域下,进行需求分类,以在所述领域所对应的需求标签中,确定所述页面所匹配的需求标签;
计算所述页面与所确定出的需求标签的匹配程度。
2.根据权利要求根据权利要求1所述的基于人工智能的搜索结果的聚合方法,其特征在于,所述根据所述分类特征,在所述页面所属领域下,进行需求分类之前,还包括:
对历史搜索所采用的检索词,按照领域进行分类,以得到各领域对应的检索词;
针对每一领域,对所述领域所对应的检索词进行分析,得到所述领域对应的需求标签。
3.根据权利要求根据权利要求2所述的基于人工智能的搜索结果的聚合方法,其特征在于,所述针对每一领域,对所述领域所对应的检索词进行分析,得到所述领域对应的需求标签,包括:
对所述领域所对应的检索词进行语法分析和/或LAT分析,得到需求词;
对所述需求词进行统计分析,得到所述领域对应的需求标签。
4.根据权利要求1所述的基于人工智能的搜索结果的聚合方法,其特征在于,所述根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面,包括:
以预设指标为依据,根据所述页面所匹配需求的标签,以及所述页面与所述需求匹配的程度,从搜索得到的各页面中选择目标页面;其中,所述预设指标包括:具有同一标签的目标页面数量高于第一阈值;和/或,所选择出的目标页面所匹配需求的标签数量高于第二阈值;和/或所选择出的目标页面与所述需求匹配的程度高于第三阈值。
5.根据权利要求4所述的基于人工智能的搜索结果的聚合方法,其特征在于,所述目标页面中的标题、摘要和页面内容所匹配的需求一致。
6.根据权利要求根据权利要求1-5任一项所述的基于人工智能的搜索结果的聚合方法,其特征在于,所述采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合,包括:
在进行搜索结果的聚合时,将所述目标页面设置于所述搜索结果的首页进行显示。
7.一种基于人工智能的搜索结果的聚合方法,其特征在于,包括以下步骤:
根据用户提供的泛需求检索词,进行搜索得到各页面;
在由离线运算所获得的索引库中,查询所述页面所匹配需求的标签,以及所述页面与所述需求匹配的程度;
根据所述页面所匹配需求的的标签,以及所述页面与所述需求匹配的程度,从搜索得到的各页面中选择目标页面;
采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
8.根据权利要求7所述的基于人工智能的搜索结果的聚合方法,其特征在于,所述根据所述页面所匹配需求的的标签,以及所述页面与所述需求匹配的程度,从搜索得到的各页面中选择目标页面,包括:
以预设指标为依据,根据所述页面所匹配需求的标签,以及所述页面与所述需求匹配的程度,从搜索得到的各页面中选择目标页面;其中,所述预设指标包括:具有同一标签的目标页面数量高于第一阈值;和/或,所选择出的目标页面所匹配需求的标签数量高于第二阈值;和/或所选择出的目标页面与所述需求匹配的程度高于第三阈值。
9.根据权利要求8所述的基于人工智能的搜索结果的聚合方法,其特征在于,所述目标页面中的标题、摘要和页面内容所匹配的需求一致。
10.根据权利要求根据权利要求7-9任一项所述的基于人工智能的搜索结果的聚合方法,其特征在于,所述采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合,包括:
在进行搜索结果的聚合时,将所述目标页面设置于所述搜索结果的首页进行显示。
11.一种基于人工智能的搜索结果的聚合装置,其特征在于,包括:
搜索模块,用于根据用户提供的泛需求检索词,进行搜索得到各页面;
需求分析模块,用于对搜索得到的各页面进行需求分析,以得到所述页面所匹配需求的信息;
选择模块,用于根据所述页面所匹配需求的信息,从搜索得到的各页面中选择目标页面;
聚合模块,用于采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合;
所述需求信息包括需求标签和/或匹配程度,所述需求分析模块,包括:
提取单元,用于从所述页面的元素信息中,提取出分类特征;其中,所述元素信息包括题目、摘要和/或网络地址;
分类单元,用于根据所述分类特征,在所述页面所属领域下,进行需求分类,以在所述领域所对应的需求标签中,确定所述页面所匹配的需求标签;
计算单元,用于计算所述页面与所确定出的需求标签的匹配程度。
12.根据权利要求根据权利要求11所述的基于人工智能的搜索结果的聚合装置,其特征在于,所述装置,还包括:
领域分类模块,用于对历史搜索所采用的检索词,按照领域进行分类,以得到各领域对应的检索词;
标签确定模块,用于针对每一领域,对所述领域所对应的检索词进行分析,得到所述领域对应的需求标签。
13.根据权利要求根据权利要求12所述的基于人工智能的搜索结果的聚合装置,其特征在于,
所述标签确定模块具体用于对所述领域所对应的检索词进行语法分析和/或LAT分析,得到需求词;对所述需求词进行统计分析,得到所述领域对应的需求标签。
14.根据权利要求11所述的基于人工智能的搜索结果的聚合装置,其特征在于,
所述选择模块,具体用于以预设指标为依据,根据所述页面所匹配需求的标签,以及所述页面与所述需求匹配的程度,从搜索得到的各页面中选择目标页面;其中,所述预设指标包括:具有同一标签的目标页面数量高于第一阈值;和/或,所选择出的目标页面所匹配需求的标签数量高于第二阈值;和/或所选择出的目标页面与所述需求匹配的程度高于第三阈值。
15.根据权利要求14所述的基于人工智能的搜索结果的聚合装置,其特征在于,所述目标页面中的标题、摘要和页面内容所匹配的需求一致。
16.根据权利要求根据权利要求11-15任一项所述的基于人工智能的搜索结果的聚合装置,其特征在于,
所述聚合模块,具体用于在进行搜索结果的聚合时,将所述目标页面设置于所述搜索结果的首页进行显示。
17.一种基于人工智能的搜索结果的聚合装置,其特征在于,
搜索模块,用于根据用户提供的泛需求检索词,进行搜索得到各页面;
需求分析模块,用于在由离线运算所获得的索引库中,查询所述页面所匹配需求的标签,以及所述页面与所述需求匹配的程度;
选择模块,用于根据所述页面所匹配需求的的标签,以及所述页面与所述需求匹配的程度,从搜索得到的各页面中选择目标页面;
聚合模块,用于采用在搜索结果中优先显示所述目标页面的方式,进行搜索结果的聚合。
18.根据权利要求17所述的基于人工智能的搜索结果的聚合装置,其特征在于,
所述选择模块,具体用于以预设指标为依据,根据所述页面所匹配需求的标签,以及所述页面与所述需求匹配的程度,从搜索得到的各页面中选择目标页面;其中,所述预设指标包括:具有同一标签的目标页面数量高于第一阈值;和/或,所选择出的目标页面所匹配需求的标签数量高于第二阈值;和/或所选择出的目标页面与所述需求匹配的程度高于第三阈值。
19.根据权利要求18所述的基于人工智能的搜索结果的聚合装置,其特征在于,所述目标页面中的标题、摘要和页面内容所匹配的需求一致。
20.根据权利要求17-19任一项所述的基于人工智能的搜索结果的聚合装置,其特征在于,
所述聚合模块,具体用于在进行搜索结果的聚合时,将所述目标页面设置于所述搜索结果的首页进行显示。
CN201610943347.9A 2016-11-01 2016-11-01 基于人工智能的搜索结果的聚合方法及装置 Active CN106570116B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610943347.9A CN106570116B (zh) 2016-11-01 2016-11-01 基于人工智能的搜索结果的聚合方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610943347.9A CN106570116B (zh) 2016-11-01 2016-11-01 基于人工智能的搜索结果的聚合方法及装置

Publications (2)

Publication Number Publication Date
CN106570116A CN106570116A (zh) 2017-04-19
CN106570116B true CN106570116B (zh) 2020-05-22

Family

ID=58534793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610943347.9A Active CN106570116B (zh) 2016-11-01 2016-11-01 基于人工智能的搜索结果的聚合方法及装置

Country Status (1)

Country Link
CN (1) CN106570116B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200159860A1 (en) * 2018-11-15 2020-05-21 Microsoft Technology Licensing, Llc Search engine user interface ai skinning
CN111859091B (zh) * 2020-07-21 2021-06-04 山东省科院易达科技咨询有限公司 一种基于人工智能的搜索结果的聚合方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246502A (zh) * 2008-03-27 2008-08-20 腾讯科技(深圳)有限公司 一种在网络上搜索图片的方法及***
CN102567409A (zh) * 2010-12-31 2012-07-11 珠海博睿科技有限公司 一种提供检索关联词的方法及装置
CN102968413A (zh) * 2011-08-31 2013-03-13 北京百度网讯科技有限公司 一种用于提供搜索结果的方法与设备
CN103164449A (zh) * 2011-12-15 2013-06-19 腾讯科技(深圳)有限公司 一种搜索结果的展现方法与装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013078640A1 (en) * 2011-11-30 2013-06-06 Google Inc. Estimating user demographics

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246502A (zh) * 2008-03-27 2008-08-20 腾讯科技(深圳)有限公司 一种在网络上搜索图片的方法及***
CN102567409A (zh) * 2010-12-31 2012-07-11 珠海博睿科技有限公司 一种提供检索关联词的方法及装置
CN102968413A (zh) * 2011-08-31 2013-03-13 北京百度网讯科技有限公司 一种用于提供搜索结果的方法与设备
CN103164449A (zh) * 2011-12-15 2013-06-19 腾讯科技(深圳)有限公司 一种搜索结果的展现方法与装置

Also Published As

Publication number Publication date
CN106570116A (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
CN108052659B (zh) 基于人工智能的搜索方法、装置和电子设备
CN108280155B (zh) 基于短视频的问题检索反馈方法、装置及其设备
CN110543592B (zh) 信息搜索方法、装置以及计算机设备
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
US20090319449A1 (en) Providing context for web articles
CN109492081B (zh) 文本信息搜索和信息交互方法、装置、设备及存储介质
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN105279227B (zh) 同音词的语音搜索处理方法及装置
CN109145110B (zh) 标签查询方法和装置
WO2012061275A1 (en) Multi-modal approach to search query input
US20100191758A1 (en) System and method for improved search relevance using proximity boosting
CN111475603A (zh) 企业标识识别方法、装置、计算机设备及存储介质
CN109508391B (zh) 基于知识图谱的输入预测方法、装置和电子设备
CN109635157A (zh) 模型生成方法、视频搜索方法、装置、终端及存储介质
CN112685642A (zh) 一种标签推荐方法、装置、电子设备及存储介质
CN112256845A (zh) 意图识别方法、装置、电子设备和计算机可读存储介质
CN111260428A (zh) 一种商品推荐方法和装置
CN106570116B (zh) 基于人工智能的搜索结果的聚合方法及装置
CN111859091B (zh) 一种基于人工智能的搜索结果的聚合方法及装置
CN117437422A (zh) 一种医学影像识别方法和装置
Tsai et al. User intent prediction search engine system based on query analysis and image recognition technologies
CN107609094B (zh) 数据消歧方法、装置及计算机设备
CN113869043A (zh) 内容标注方法、装置、设备及存储介质
CN113449094A (zh) 语料获取方法、装置、电子设备及存储介质
CN113704422A (zh) 一种文本推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant