CN102096717A - 搜索方法及搜索引擎 - Google Patents
搜索方法及搜索引擎 Download PDFInfo
- Publication number
- CN102096717A CN102096717A CN 201110038433 CN201110038433A CN102096717A CN 102096717 A CN102096717 A CN 102096717A CN 201110038433 CN201110038433 CN 201110038433 CN 201110038433 A CN201110038433 A CN 201110038433A CN 102096717 A CN102096717 A CN 102096717A
- Authority
- CN
- China
- Prior art keywords
- query statement
- demand
- knowledge
- knowledge base
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种搜索方法,包括以下步骤:S1、接收查询指令;S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;S3、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;S4、输出所述搜索结果。与现有技术相比,本发明的有益效果是:在知识库的基础上,更好的理解用户输入的查询指令,分析查询指令的以图,解析查询指令的结构,对查询指令进行语义内容扩充,从而更好的指导搜索引擎选择优质的资源满足用户的搜索需求,使得用户搜索效率提高,节约网络流量。
Description
技术领域
本发明涉及搜索引擎技术,尤其涉及一种基于知识库对查询指令进行需求分析与解析的搜索方法及搜索引擎。
背景技术
随着互联网上信息的飞速增长,网络上充斥了越来越多的冗余信息,而对于在网络上搜寻自己所需要信息的互联网用户而言,面对这些漫无边际的信息无疑像大海捞针。搜索引擎的出现无疑在一定程度上为用户的搜索需求带来了很大便利。搜索引擎是一种在网络上应用的软件***,其以一定的策略在网络上搜集和发现信息,并在对信息进行处理和组织后,为用户提供互联网上的信息搜索服务。通常,这种软件***提供一个网页界面,让用户在客户端通过浏览器软件提交搜索词,然后很快返回一个可能和用户输入的搜索内容相关的信息列表。这个列表通常会包括上万个条目,每个条目代表一篇搜索到的相关网页。
过去十几年以来,相应地,众多的互联网搜索引擎及对应的网站应运而生,这中间的佼佼者包括百度公司的百度搜索(www.***.com)和谷歌公司的谷歌搜索(www.***.cn)。
现有的搜索引擎对用户输入的查询指令大多是基于查询指令字符理解的,例如,用户输入查询指令为“Nokia手机”,基于现有的搜索引擎只能将该查询指令分词为“Nokia”和“手机”,且通过该分词结果在网页数据库索引中进行检索,将文本包括“Nokia”和“手机”的网页Url输入,形成搜索结果,然而这种搜索引擎并不能对用户的查询指令进行内容与语义层次上的理解,例如,用户输入查询指令为“Nokia手机”,其并不能将这个查询指令理解为“Nokia”为“手机”中的一种品牌;当然,更不能理解查询指令的需求意图,以及查询指令的结构,不能对查询指令进行语义内容扩充等。对于用户输入的表达形式多样化、需求意图多样化的查询指令,现有的基于字符的搜索引擎已经不能更好的满足用户的需求,造成用于查找不全,需要多次输入不同的查询指令才可能找到需要的搜索结果,搜索效率较低,浪费网络资源的问题。
发明内容
本发明的目的在于提供一种改进的搜索方法,其可在知识库的基础上,更好的理解用户输入的查询指令,分析查询指令的以图,解析查询指令的结构,对查询指令进行语义内容扩充。
本发明的目的还在于提供一种实现上述搜索方法的改进的搜索引擎。
为实现上述发明目的之一,本发明第一实施方式提供一种搜索方法,包括以下步骤:
S1、接收查询指令;
S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;
S3、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;
S4、输出所述搜索结果。
作为本发明的进一步改进,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
作为本发明的进一步改进,在所述S2步骤和S3步骤间,还包括语义扩充步骤:
基于所述知识库对所述查询指令进行语义扩充。
作为本发明的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个知识片段;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、判断所述知识库整体需求得分是否大于一设定阈值;
S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为所述查询指令的需求意图;
S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
作为本发明的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配的至少一个知识片段和一表达模板;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;
S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度得分;
S206、判断所述查询指令需求强度得分是否大于一设定阈值;
S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所述查询指令的需求意图;
S208、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
为实现上述发明目的之一,本发明第二实施方式提供一种搜索方法,包括以下步骤:
S1、接收查询指令;
S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图,同时,基于所述知识库对所述查询指令进行语义扩充;
S3、将带有需求意图并扩充语义的查询指令在数据库中搜索,得到搜索结果;
S4、输出所述搜索结果。
作为本发明的进一步改进,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
作为本发明的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个知识片段;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、判断所述知识库整体需求得分是否大于一设定阈值;
S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为所述查询指令的需求意图;
S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
作为本发明的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配的至少一个知识片段和一表达模板;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;
S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度得分;
S206、判断所述查询指令需求强度得分是否大于一设定阈值;
S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所述查询指令的需求意图;
S208、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
为实现上述发明目的之一,本发明第三实施方式提供一种搜索方法,包括以下步骤:
S1、接收查询指令;
S2、基于知识库和表达模板库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;
S3、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;
S4、输出所述搜索结果。
作为本发明的进一步改进,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
作为本发明的进一步改进,在所述S2步骤和S3步骤间,还包括语义扩充步骤:
基于所述知识库对所述查询指令进行语义扩充。
作为本发明的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个知识片段;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、判断所述知识库整体需求得分是否大于一设定阈值;
S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为所述查询指令的需求意图;
S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
作为本发明的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配的至少一个知识片段和一表达模板;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;
S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度得分;
S206、判断所述查询指令需求强度得分是否大于一设定阈值;
S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所述查询指令的需求意图;
S208、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
作为本发明的进一步改进,所述表达模板库的构建方法,包括以下流程:
S300、抽取在用户历史行为库中包含知识片段的查询指令;
S301、将所述知识库片段替换成通用符号,生成候选表达模板;
S302、统计生成的所述候选表达模板符合的知识库片段的数量;
S303、判断所述数量是否大于设定阈值;
S304、若大于设定阈值,则将所述候选表达模板作为表达模板,并存于数据库中,生成表达模板库;
S305、若小于设定阈值,则舍弃所述候选表达模板。
为实现上述发明目的之一,本发明第四实施方式提供一种搜索方法,包括以下步骤:
S1、接收查询指令;
S2、基于知识库和表达模板库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图,同时,基于所述知识库对接收到的查询指令进行语义扩充;
S3、将带有需求意图并扩充语义的查询指令在数据库中搜索,得到搜索结果;
S4、输出所述搜索结果。
作为本发明的进一步改进,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
作为本发明的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个知识片段;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、判断所述知识库整体需求得分是否大于一设定阈值;
S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为所述查询指令的需求意图;
S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
作为本发明的进一步改进,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配的至少一个知识片段和一表达模板;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;
S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度得分;
S206、判断所述查询指令需求强度得分是否大于一设定阈值;
S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所述查询指令的需求意图;
S208、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
作为本发明的进一步改进,所述表达模板库的构建方法,包括以下流程:
S300、抽取在用户历史行为库中包含知识片段的查询指令;
S301、将所述知识库片段替换成通用符号,生成候选表达模板;
S302、统计生成的所述候选表达模板符合的知识库片段的数量;
S303、判断所述数量是否大于设定阈值;
S304、若大于设定阈值,则将所述候选表达模板作为表达模板,并存于数据库中,生成表达模板库;
S305、若小于设定阈值,则舍弃所述候选表达模板。
相应地,作为实现上述发明另一目的,本发明一实施方式提供一种搜索引擎,包括:
UI模块,用于接收查询指令,且所述UI模块还用于接收搜索模块返回的搜索结果,并将所述搜索结果拼装为结果页面后输出;
需求意图分析模块,用于基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;
搜索模块,用于将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;
知识库,用于存储先验知识。
作为本发明的进一步改进,所述搜索引擎还包括:
web服务模块,用于通过网络协议接收客户端发出的查询指令,并将所述查询指令转到所述UI模块,且所述web服务模块还用于接收所述UI模块返回的结果页面,并将所述结果页面返回至所述客户端。
作为本发明的进一步改进,所述搜索引擎还包括:
用户历史行为库,用于存储用户历史搜索记录。
作为本发明的进一步改进,所述用户历史搜索记录包括:查询指令、查询次数,以及加权点击数。
作为本发明的进一步改进,所述搜索引擎还包括:
表达模板挖掘模块,用于根据所述知识库中的知识片段和所述用户历史行为库中的用户历史查询指令,挖掘表达模板,并将所述表达模板存储于表达模板库;
表达模板库,用于存储由所述表达模板挖掘模块挖掘出的表达模板。
作为本发明的进一步改进,所述搜索引擎还包括:
结构分类模块,用于基于所述知识库对所述查询指令进行语义扩充。
作为本发明的进一步改进,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
作为本发明的进一步改进,所述网页存储库用于存储网页数据和该网页数据的索引信息;
所述垂直搜索数据库用于存储特定类别数据和该特定类别数据的索引信息。
与现有技术相比,本发明的有益效果是:在知识库的基础上,更好的理解用户输入的查询指令,分析查询指令的以图,解析查询指令的结构,对查询指令进行语义内容扩充,从而更好的指导搜索引擎选择优质的资源满足用户的搜索需求,使得用户搜索效率提高,节约网络流量。
附图说明
图1是本发明搜索引擎与客户端实现互动的工作原理图;
图2是本发明搜索引擎第一实施方式的模块图;
图3是本发明搜索引擎第二实施方式的模块图;
图4是本发明搜索引擎第三实施方式的模块图;
图5是本发明搜索引擎第四实施方式的模块图;
图6是本发明知识库架构的示意图;
图7是本发明搜索方法第一实施方式的流程图;
图8是本发明搜索方法第二实施方式的流程图;
图9是本发明搜索方法第三实施方式的流程图;
图10是本发明搜索方法第四实施方式的流程图;
图11是本发明“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”步骤一实施方式的流程图;
图12是本发明“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”步骤另一实施方式的流程图;
图13是本发明表达模板库的构建方法的流程图;
图14是本发明在线界面一实施方式的示意图;
图15是“当用户点击垂直搜索结果跳转至新页面”中的新页面示意图。
具体实施方式
以下将结合附图所示的各实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所轻易做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
图1所示的本发明的搜索引擎10与客户端20实现互动的工作原理图。本实施方式中,该客户端20包括一浏览器201,客户可通过该浏览器201打开搜索引擎在线展示的网页,并在网页中的对话框内输入查询指令,一般的,该输入的查询指令为文本信息,当然,该查询指令还可以为图片信息、视频信息等等。所述搜索引擎10通过网络接收客户输入至所述浏览器中的查询指令,并对该查询指令进行搜索后,将搜索结果通过搜索引擎在线展示网页返回至该浏览器201。其中,该搜索引擎10可以包括一台或多台服务器,该客户端20可以包括一个或多个用户终端设备,如个人计算机、笔记本电脑、无线电话、个人数字处理(PDA)、或其它计算机***和通信***。
这些服务器和终端设备在架构上都包含一些基本组件,如总线、处理***、存储***、一个或多个输入/输出***、和通信接口等。总线可以包括一个或多个导线,用来实现服务器或终端设备各组件之间的通信。处理***包括各类型的用来执行指令、处理进程或线程的处理器或微处理器。存储***可以包括存储动态信息的随机访问存储器(RAM)等动态存储器,和存储静态信息的只读存储器(ROM)等静态存储器,以及包括磁或光学记录介质与相应驱动的大容量存储器。输入***供用户输入信息到服务器或终端设备,如键盘、鼠标、手写笔、声音识别***、或生物测定***等。输出***包括用来输出信息的显示器、打印机、扬声器等。通信接口用来使服务器或终端设备与其它***或***进行通信。通信接口之间可通过有线连接、无线连接、或光连接连接到网络中,使搜索引擎10、客户端20间能够通过网络实现相互间的通信。网络可以包括局域网(LAN)、广域网(WAN)、电话网络如公共交换电话网(PSTN)、企业内部的互联网、因特网、或上述这些网络的结合等。
服务器和终端设备上均包含有用来管理***资源、控制其它程序运行的操作***软件,以及用来实现特定功能模块的应用软件。如图2所示,在本发明第一实施方式中,所述搜索引擎包括了web服务模块101、与web服务模块101交互通信的UI模块102、与所述UI模块102通信的需求意图分析模块103、与所述需求意图分析模块103通信的结构分析模块104、与所述结构分析模块104通信的搜索模块105,以及与所述需求意图分析模块103、所述结构分析模块104交互通信的知识库106、与所述知识库106通信的用户历史行为库107、与所述知识库106、用户历史行为库107通信的表达模板挖掘模块108、与所述表达模板挖掘模块108和所述需求意图分析模块103通信的表达模板库109,以及与所述搜索模块105通信的网页存储库110。值得一提的是,这些模块即可存储并运行于同一服务器中,也可存储并运行在多台服务器中。
所述web服务模块101用于通过网络协议接收从客户端20传来的查询指令,并将该查询指令转到UI模块102,另外,该web服务模块101还用于接收所述UI模块102返回的结果页面,并将所述结果页面返回至客户端20。
所述UI模块102用于接收所述web服务模块101传送的查询指令,并将该查询指令发送至所述查询指令分析模块103;另外,所述UI模块102还用于接收所述搜索模块104返回的搜索结果,并将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101。
所述需求意图分析模块103用于调用所述知识库106、用户历史行为库107,以及所述表达模板库108,以对接收到的查询指令进行需求意图分析,明确所述查询指令的需求意图。在本发明中,所述意图分析模块103首先通过所述用户历史行为库107给所述知识库106中的各个知识片段的各个需求意图打分,具体的:用户在查询某类需求时,会点击相应的满足他需求的结果,如用户想获得汽车报价相关的信息,在搜索引擎输入查询指令“朗逸”后,会点击搜索引擎返回的汽车网站的Url,如“网易车库”,此时用户输入的查询指令“朗逸”片段以及用户点击的Url“网易车库”都隐含反映用户有找车相关信息的需求,基于这一点,本发明在计算各个知识片段的需求意图时,根据某个知识片段点击某类Url的数目/某个知识片段点击的总Url,来确定此知识片段需求意图的得分,如在所述用户历史行为库107中得知,查询指令为“朗逸”,其点击的总Url数为10个,其中,商品类Url为5个,新闻类Url为3个,图片类Url为2个,则可计算出该查询指令的商品类的需求意图为0.5,新闻类的需求意图为0.3,图片类的需求意图为0.2;其次,在接收到用户输入的一个查询指令后,需要经过知识库106的知识匹配,得到所述查询指令中存在于所述知识库106中的知识片段,并综合计算所述查询指令的知识库整体需求强度。例如用户输入“上海大众朗逸报价”,则通过知识库可获得“上海大众”“朗逸”的知识片段。获得初步信息后,首先将知识片段“上海大众”和“朗逸”各自的需求意图得分加总,得到第一分数,其次,再通过知识片段“上海大众”与“朗逸”的关系,加减所述第一分数,得到知识库整体需求得分,在本发明最佳实施方式中,若知识片段的关系为同属关系,则加分;若知识片段为非同属关系,则减分;若该知识库整体需求得分大于设定的阈值,则以知识库整体需求得分最高的需求类型作为查询指令的需求意图,并根据所述需求意图在所述查询指令中加入相应的tag信息,例如“商品”、“新闻”、“图片”等。值得一提的是:在本发明的最佳实施方式中,除了计算知识库整体需求得分外,在分析需求意图时,还会考虑表达模板层面上的打分:在接收到用户输入的一个查询指令后,需要经过表达模板库108的表达模板匹配,得到所述查询指令中存在于所述表达模板库108中的表达模板片段,例如用户输入“上海大众朗逸报价”,则通过用户模板识别出查询指令中存在的“XX报价”模板。在根据上述方法获得知识库整体需求得分的同时,查询指令又符合用户需求模板,表达模板库108也对所述查询指令在表达模板层面上进行打分,得到表达模板得分,则整体查询指令的需求强度得分为知识库整体需求得分与表达模板得分的加权之和,若该加权之和大于设定的阈值,则已加权之和最大的需求类型作为查询指令的需求意图,并根据所述需求意图在所述查询指令中加入相应的tag信息,例如“商品”、“新闻”、“图片”等。
所述结构分类模块104用于结合所述知识库106,对经过所述需求意图分析模块103后的查询指令进行智能化变换后发送至所述搜索模块105,其中,所述智能化变换即是语义内容扩充,所述的语义内容扩充包括了语义内容的归一化,以及语义类别的扩展。具体的,在所述查询指令有同属关系(上位属性的知识片段+下位属性的知识片段)时,例如,所述查询指令为“手机诺基亚”,此时,所述结构分类模块104在发送给所述搜索模块105时,即会在“手机”这个上位属性的知识片段上加入“可以丢弃”的tag,这样,在搜索模块105对所述查询指令进行搜索时,即可通过“手机诺基亚”进行搜索,也可通过“诺基亚”进行搜索,且还可认为带有“手机诺基亚”文本信息的网页和只带有“诺基亚”文本信息的网页权值一样;另外,例如:若所述查询指令为“诺基亚”,则所述结构分类模块104在发送给所述搜索模块105时,还可根据“诺基亚”对应其上位属性进行扩展,如扩展为“手机”,这样,在搜索模块105对“诺基亚”进行搜索时,可根据结果的数量判断是否需要扩展到“手机”进行搜索,如通过“诺基亚”搜索到的结果数量较小时,即可扩展到“手机”;又如:若所述查询指令为“手机”,则所述结构分类模块104可将“手机”对应其同位属性进行扩展,如扩展为“电脑”,这样的扩展可用于广告的推广,如在搜索页面的右侧即可根据“手机”这个查询指令进行广告推广,又可根据“电脑”这个查询指令进行广告推广;再如,若所述查询指令为“诺基亚”,则所述结构分类模块104在发送给所述搜索模块105时,还可根据“诺基亚”对应其下位属性进行扩展,如扩展为“N71”、“N72”等,这样,在搜索模块105在搜索到带有“N71”、“N72”等文本信息网页时,也可根据这些网页的权值,判断是否作为搜索结果输出。这种权值判断可参现有搜索引擎中的权值判断,在此不再赘述。总而言之,对所述查询指令进行扩展时,可根据搜索的策略,即可扩展其上位属性的知识片段,也可扩展其同位属性的知识片段,也可扩展其下位属性的知识片段。
所述搜索模块105用于接收经过所述需求意图分析模块103或所述结构分类模块104的智能化变换后的查询指令,并将该查询指令在网页存储库110中搜索,以得到搜索结果,同时,所述搜索模块105还用于将所述搜索结果返回至所述UI模块102。
所述知识库106用于存储先验知识。在本发明最佳实施方式中,所述知识库主要存储为树形结构,对每一类知识库构建一棵知识库树,通过该知识库树的父亲节点标识其上位属性,右兄弟节点表示其同位属性,左兄弟节点表示其下位属性,如此迭代,直至叶子节点。如图6所示,“大众”为其最上位属性;其下位属性为“上海大众”;与所述“上海大众”同位的有“一汽大众”;在所述“上海大众”下位的有“朗逸”,与所述“朗逸”同位的有“途观”......这种知识库的构建方法,本领域的普通技术人员可参现有技术完成,在此不再赘述。
用户历史行为库107用于存储用户历史搜索记录。优选地,其可包括查询指令、查询次数,以及加权点击数等信息。
表达模板挖掘模块108用于根据所述知识库106中的知识片段和所述用户历史行为库107中的用户历史查询指令,挖掘出表达模板,并将所述表达模板存储于所述表达模板库109中。相同需求的用户,在表达方式上会出现相似性,所述表达模板是指,一般用户在有一定查询需求时,其输入的查询指令为何,例如,当用户在查询汽车相关信息时,表达方式会有:“速腾怎么样”、“马六动力如何”等,其中即可抽取出“【汽车品牌/型号】怎么样”、“【汽车品牌/型号】动力如何”等表达汽车需求时常用的表达模板。在本发明的一实施方式中,具体为:首先在所述用户历史行为库107中包含知识库106知识片段的查询指令抽取出来,如在“马六如何”、“斯柯达如何”、“速腾如何”的查询指令中,抽取出知识片段:“马六”、“斯柯达”、“速腾”,其次将知识库片段替换成“【汽车品牌/型号】”符号,即生成“【汽车品牌/型号】如何”的候选表达模板;再次,统计生成的候选表达模板符合的知识库片段的数量,若该数量大于设定的阈值,则将所述候选表达模板作为表达模板,存于所述表达模板库109中;若该数量小于设定的阈值,则舍弃所述候选表达模板。
所述表达模板库109用于存储由所述表达模板挖掘模块108挖掘出的表达模板。
所述网页存储库110用于存储网页数据和该网页数据的索引信息。该数据库即是普通搜索引擎常用的数据库,在此不再赘述。
如图3所示,在本发明第二实施方式中,所述搜索引擎包括了web服务模块101、与web服务模块101交互通信的UI模块102、与所述UI模块102通信的需求意图分析模块103、与所述需求意图分析模块103通信的结构分析模块104、与所述结构分析模块104通信的搜索模块105,以及与所述需求意图分析模块103、所述结构分析模块104交互通信的知识库106、与所述知识库106通信的用户历史行为库107、与所述知识库106、用户历史行为库107通信的表达模板挖掘模块108、与所述表达模板挖掘模块108和所述需求意图分析模块103通信的表达模板库109,以及与所述搜索模块105通信的网页存储库110、第一垂直搜索数据111a、第二垂直搜索数据库111b、......、第N垂直搜索数据库111n。值得一提的是,这些模块即可存储并运行于同一服务器中,也可存储并运行在多台服务器中。
所述web服务模块101用于通过网络协议接收从客户端20传来的查询指令,并将该查询指令转到UI模块102,另外,该web服务模块101还用于接收所述UI模块102返回的结果页面,并将所述结果页面返回至客户端20。
所述UI模块102用于接收所述web服务模块101传送的查询指令,并将该查询指令发送至所述查询指令分析模块103;另外,所述UI模块102还用于接收所述搜索模块104返回的搜索结果,并将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101。
所述需求意图分析模块103用于调用所述知识库106、用户历史行为库107,以及所述表达模板库108,以对接收到的查询指令进行需求意图分析,明确所述查询指令的需求意图。在本发明中,所述意图分析模块103首先通过所述用户历史行为库107给所述知识库106中的各个知识片段的各个需求意图打分,具体的:用户在查询某类需求时,会点击相应的满足他需求的结果,如用户想获得汽车报价相关的信息,在搜索引擎输入查询指令“朗逸”后,会点击搜索引擎返回的汽车网站的Url,如“网易车库”,此时用户输入的查询指令“朗逸”片段以及用户点击的Url“网易车库”都隐含反映用户有找车相关信息的需求,基于这一点,本发明在计算各个知识片段的需求意图时,根据某个知识片段点击某类Url的数目/某个知识片段点击的总Url,来确定此知识片段需求意图的得分,如在所述用户历史行为库107中得知,查询指令为“朗逸”,其点击的总Url数为10个,其中,商品类Url为5个,新闻类Url为3个,图片类Url为2个,则可计算出该查询指令的商品类的需求意图为0.5,新闻类的需求意图为0.3,图片类的需求意图为0.2;其次,在接收到用户输入的一个查询指令后,需要经过知识库106的知识匹配,得到所述查询指令中存在于所述知识库106中的知识片段,并综合计算所述查询指令的知识库整体需求强度。例如用户输入“上海大众朗逸报价”,则通过知识库可获得“上海大众”“朗逸”的知识片段。获得初步信息后,首先将知识片段“上海大众”和“朗逸”各自的需求意图得分加总,得到第一分数,其次,再通过知识片段“上海大众”与“朗逸”的关系,加减所述第一分数,得到知识库整体需求得分,在本发明最佳实施方式中,若知识片段的关系为同属关系,则加分;若知识片段为非同属关系,则减分;若该知识库整体需求得分大于设定的阈值,则以知识库整体需求得分最高的需求类型作为查询指令的需求意图,并根据所述需求意图在所述查询指令中加入相应的tag信息,例如“商品”、“新闻”、“图片”等。值得一提的是:在本发明的最佳实施方式中,除了计算知识库整体需求得分外,在分析需求意图时,还会考虑表达模板层面上的打分:在接收到用户输入的一个查询指令后,需要经过表达模板库108的表达模板匹配,得到所述查询指令中存在于所述表达模板库108中的表达模板片段,例如用户输入“上海大众朗逸报价”,则通过用户模板识别出查询指令中存在的“XX报价”模板。在根据上述方法获得知识库整体需求得分的同时,查询指令又符合用户需求模板,表达模板库108也对所述查询指令在表达模板层面上进行打分,得到表达模板得分,则整体查询指令的需求强度得分为知识库整体需求得分与表达模板得分的加权之和,若该加权之和大于设定的阈值,则已加权之和最大的需求类型作为查询指令的需求意图。
所述结构分类模块104用于结合所述知识库106,对经过所述需求意图分析模块103后的查询指令进行智能化变换后发送至所述搜索模块105,其中,所述智能化变换即是语义内容扩充,所述的语义内容扩充包括了语义内容的归一化,以及语义类别的扩展。具体的,在所述查询指令有同属关系(上位属性的知识片段+下位属性的知识片段)时,例如,所述查询指令为“手机诺基亚”,此时,所述结构分类模块104在发送给所述搜索模块105时,即会在“手机”这个上位属性的知识片段上加入“可以丢弃”的tag,这样,在搜索模块105对所述查询指令进行搜索时,即可通过“手机诺基亚”进行搜索,也可通过“诺基亚”进行搜索,且还可认为带有“手机诺基亚”文本信息的网页和只带有“诺基亚”文本信息的网页权值一样;另外,例如:若所述查询指令为“诺基亚”,则所述结构分类模块104在发送给所述搜索模块105时,还可根据“诺基亚”对应其上位属性进行扩展,如扩展为“手机”,这样,在搜索模块105对“诺基亚”进行搜索时,可根据结果的数量判断是否需要扩展到“手机”进行搜索,如通过“诺基亚”搜索到的结果数量较小时,即可扩展到“手机”;又如:若所述查询指令为“手机”,则所述结构分类模块104可将“手机”对应其同位属性进行扩展,如扩展为“电脑”,这样的扩展可用于广告的推广,如在搜索页面的右侧即可根据“手机”这个查询指令进行广告推广,又可根据“电脑”这个查询指令进行广告推广;再如,若所述查询指令为“诺基亚”,则所述结构分类模块104在发送给所述搜索模块105时,还可根据“诺基亚”对应其下位属性进行扩展,如扩展为“N71”、“N72”等,这样,在搜索模块105在搜索到带有“N71”、“N72”等文本信息网页时,也可根据这些网页的权值,判断是否作为搜索结果输出。这种权值判断可参现有搜索引擎中的权值判断,在此不再赘述。总而言之,对所述查询指令进行扩展时,可根据搜索的策略,即可扩展其上位属性的知识片段,也可扩展其同位属性的知识片段,也可扩展其下位属性的知识片段。
所述搜索模块105用于接收经过所述需求意图分析模块103或所述结构分类模块104的智能化变换后的查询指令,并将该查询指令在多个垂直搜索数据库(第一垂直搜索数据库111a、第二垂直搜索数据库111b、......、第N垂直数据库111n)的其中之一,以及所述网页存储库1110中搜索,以得到搜索结果,同时,所述搜索模块105还用于将所述搜索结果返回至所述UI模块102。值得一提的是:选择某个垂直搜索数据库进行垂直搜索是通过查询指令的需求意图确定的,例如:若查询指令的需求意图为“商品”,则在商品垂直搜索数据库中进行搜索;所查询指令的需求意图为“图片”,则在图片垂直搜索数据库中进行搜索,其中,在垂直搜索数据库中搜索到的一条或多条结果,会***至在网页存储库中搜索到的结果中,形成整体搜索结果。所述垂直搜索,即是在某个特定的类别下进行搜索,其具体的搜索方法和***在本领域中已多有现有技术揭示,在此不再赘述。
所述知识库106用于存储先验知识。在本发明最佳实施方式中,所述知识库主要存储为树形结构,对每一类知识库构建一棵知识库树,通过该知识库树的父亲节点标识其上位属性,右兄弟节点表示其同位属性,左兄弟节点表示其下位属性,如此迭代,直至叶子节点。如图6所示,“大众”为其最上位属性;其下位属性为“上海大众”;与所述“上海大众”同位的有“一汽大众”;在所述“上海大众”下位的有“朗逸”,与所述“朗逸”同位的有“途观”......这种知识库的构建方法,本领域的普通技术人员可参现有技术完成,在此不再赘述。
用户历史行为库107用于存储用户历史搜索记录。优选地,其可包括查询指令、查询次数,以及加权点击数等信息。
表达模板挖掘模块108用于根据所述知识库106中的知识片段和所述用户历史行为库107中的用户历史查询指令,挖掘出表达模板,并将所述表达模板存储于所述表达模板库109中。相同需求的用户,在表达方式上会出现相似性,所述表达模板是指,一般用户在有一定查询需求时,其输入的查询指令为何,例如,当用户在查询汽车相关信息时,表达方式会有:“速腾怎么样”、“马六动力如何”等,其中即可抽取出“【汽车品牌/型号】怎么样”、“【汽车品牌/型号】动力如何”等表达汽车需求时常用的表达模板。在本发明的一实施方式中,具体为:首先在所述用户历史行为库107中包含知识库106知识片段的查询指令抽取出来,如在“马六如何”、“斯柯达如何”、“速腾如何”的查询指令中,抽取出知识片段:“马六”、“斯柯达”、“速腾”,其次将知识库片段替换成“【汽车品牌/型号】”符号,即生成“【汽车品牌/型号】如何”的候选表达模板;再次,统计生成的候选表达模板符合的知识库片段的数量,若该数量大于设定的阈值,则将所述候选表达模板作为表达模板,存于所述表达模板库109中;若该数量小于设定的阈值,则舍弃所述候选表达模板。
所述表达模板库109用于存储由所述表达模板挖掘模块108挖掘出的表达模板。
所述网页存储库110用于存储网页数据和该网页数据的索引信息。该数据库即是普通搜索引擎常用的数据库,在此不再赘述。
所述第一垂直搜索数据库111a、第二垂直搜索数据库111b、......、第N垂直搜索数据库111n用于存储特定类别数据和该特定类别数据的索引信息,例如商品数据、商品索引;新闻数据、新闻索引;图片数据、图片索引等。
如图4所示,在本发明第三实施方式中,所述搜索引擎包括了web服务模块101、与web服务模块101交互通信的UI模块102、与所述UI模块102通信的需求意图分析模块103、与所述UI模块102通信的结构分析模块104、与所述结构分析模块104通信的搜索模块105,以及与所述需求意图分析模块103、所述结构分析模块104交互通信的知识库106、与所述知识库106通信的用户历史行为库107、与所述知识库106、用户历史行为库107通信的表达模板挖掘模块108、与所述表达模板挖掘模块108和所述需求意图分析模块103通信的表达模板库109,以及与所述搜索模块105通信的网页存储库110。值得一提的是,这些模块即可存储并运行于同一服务器中,也可存储并运行在多台服务器中。
所述web服务模块101用于通过网络协议接收从客户端20传来的查询指令,并将该查询指令转到UI模块102,另外,该web服务模块101还用于接收所述UI模块102返回的结果页面,并将所述结果页面返回至客户端20。
所述UI模块102用于接收所述web服务模块101传送的查询指令,并将该查询指令发送至所述查询指令分析模块103;另外,所述UI模块102还用于接收所述搜索模块104返回的搜索结果,并将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101。
所述需求意图分析模块103用于调用所述知识库106、用户历史行为库107,以及所述表达模板库108,以对接收到的查询指令进行需求意图分析,明确所述查询指令的需求意图。在本发明中,所述意图分析模块103首先通过所述用户历史行为库107给所述知识库106中的各个知识片段的各个需求意图打分,具体的:用户在查询某类需求时,会点击相应的满足他需求的结果,如用户想获得汽车报价相关的信息,在搜索引擎输入查询指令“朗逸”后,会点击搜索引擎返回的汽车网站的Url,如“网易车库”,此时用户输入的查询指令“朗逸”片段以及用户点击的Url“网易车库”都隐含反映用户有找车相关信息的需求,基于这一点,本发明在计算各个知识片段的需求意图时,根据某个知识片段点击某类Url的数目/某个知识片段点击的总Url,来确定此知识片段需求意图的得分,如在所述用户历史行为库107中得知,查询指令为“朗逸”,其点击的总Url数为10个,其中,商品类Url为5个,新闻类Url为3个,图片类Url为2个,则可计算出该查询指令的商品类的需求意图为0.5,新闻类的需求意图为0.3,图片类的需求意图为0.2;其次,在接收到用户输入的一个查询指令后,需要经过知识库106的知识匹配,得到所述查询指令中存在于所述知识库106中的知识片段,并综合计算所述查询指令的知识库整体需求强度。例如用户输入“上海大众朗逸报价”,则通过知识库可获得“上海大众”“朗逸”的知识片段。获得初步信息后,首先将知识片段“上海大众”和“朗逸”各自的需求意图得分加总,得到第一分数,其次,再通过知识片段“上海大众”与“朗逸”的关系,加减所述第一分数,得到知识库整体需求得分,在本发明最佳实施方式中,若知识片段的关系为同属关系,则加分;若知识片段为非同属关系,则减分;若该知识库整体需求得分大于设定的阈值,则以知识库整体需求得分最高的需求类型作为查询指令的需求意图,并根据所述需求意图在所述查询指令中加入相应的tag信息,例如“商品”、“新闻”、“图片”等。值得一提的是:在本发明的最佳实施方式中,除了计算知识库整体需求得分外,在分析需求意图时,还会考虑表达模板层面上的打分:在接收到用户输入的一个查询指令后,需要经过表达模板库108的表达模板匹配,得到所述查询指令中存在于所述表达模板库108中的表达模板片段,例如用户输入“上海大众朗逸报价”,则通过用户模板识别出查询指令中存在的“XX报价”模板。在根据上述方法获得知识库整体需求得分的同时,查询指令又符合用户需求模板,表达模板库108也对所述查询指令在表达模板层面上进行打分,得到表达模板得分,则整体查询指令的需求强度得分为知识库整体需求得分与表达模板得分的加权之和,若该加权之和大于设定的阈值,则已加权之和最大的需求类型作为查询指令的需求意图,并根据所述需求意图在所述查询指令中加入相应的tag信息,例如“商品”、“新闻”、“图片”等。
所述结构分类模块104用于结合所述知识库106,对UI模块102输入的查询指令进行智能化变换后发送至所述搜索模块105,其中,所述智能化变换即是语义内容扩充,所述的语义内容扩充包括了语义内容的归一化,以及语义类别的扩展。具体的,在所述查询指令有同属关系(上位属性的知识片段+下位属性的知识片段)时,例如,所述查询指令为“手机诺基亚”,此时,所述结构分类模块104在发送给所述搜索模块105时,即会在“手机”这个上位属性的知识片段上加入“可以丢弃”的tag,这样,在搜索模块105对所述查询指令进行搜索时,即可通过“手机诺基亚”进行搜索,也可通过“诺基亚”进行搜索,且还可认为带有“手机诺基亚”文本信息的网页和只带有“诺基亚”文本信息的网页权值一样;另外,例如:若所述查询指令为“诺基亚”,则所述结构分类模块104在发送给所述搜索模块105时,还可根据“诺基亚”对应其上位属性进行扩展,如扩展为“手机”,这样,在搜索模块105对“诺基亚”进行搜索时,可根据结果的数量判断是否需要扩展到“手机”进行搜索,如通过“诺基亚”搜索到的结果数量较小时,即可扩展到“手机”;又如:若所述查询指令为“手机”,则所述结构分类模块104可将“手机”对应其同位属性进行扩展,如扩展为“电脑”,这样的扩展可用于广告的推广,如在搜索页面的右侧即可根据“手机”这个查询指令进行广告推广,又可根据“电脑”这个查询指令进行广告推广;再如,若所述查询指令为“诺基亚”,则所述结构分类模块104在发送给所述搜索模块105时,还可根据“诺基亚”对应其下位属性进行扩展,如扩展为“N71”、“N72”等,这样,在搜索模块105在搜索到带有“N71”、“N72”等文本信息网页时,也可根据这些网页的权值,判断是否作为搜索结果输出。这种权值判断可参现有搜索引擎中的权值判断,在此不再赘述。总而言之,对所述查询指令进行扩展时,可根据搜索的策略,即可扩展其上位属性的知识片段,也可扩展其同位属性的知识片段,也可扩展其下位属性的知识片段。
所述搜索模块105用于接收经过所述需求意图分析模块103或所述结构分类模块104的智能化变换后的查询指令,并将该查询指令在网页存储库110中搜索,以得到搜索结果,同时,所述搜索模块105还用于将所述搜索结果返回至所述UI模块102。
所述知识库106用于存储先验知识。在本发明最佳实施方式中,所述知识库主要存储为树形结构,对每一类知识库构建一棵知识库树,通过该知识库树的父亲节点标识其上位属性,右兄弟节点表示其同位属性,左兄弟节点表示其下位属性,如此迭代,直至叶子节点。如图6所示,“大众”为其最上位属性;其下位属性为“上海大众”;与所述“上海大众”同位的有“一汽大众”;在所述“上海大众”下位的有“朗逸”,与所述“朗逸”同位的有“途观”......这种知识库的构建方法,本领域的普通技术人员可参现有技术完成,在此不再赘述。
用户历史行为库107用于存储用户历史搜索记录。优选地,其可包括查询指令、查询次数,以及加权点击数等信息。
表达模板挖掘模块108用于根据所述知识库106中的知识片段和所述用户历史行为库107中的用户历史查询指令,挖掘出表达模板,并将所述表达模板存储于所述表达模板库109中。相同需求的用户,在表达方式上会出现相似性,所述表达模板是指,一般用户在有一定查询需求时,其输入的查询指令为何,例如,当用户在查询汽车相关信息时,表达方式会有:“速腾怎么样”、“马六动力如何”等,其中即可抽取出“【汽车品牌/型号】怎么样”、“【汽车品牌/型号】动力如何”等表达汽车需求时常用的表达模板。在本发明的一实施方式中,具体为:首先在所述用户历史行为库107中包含知识库106知识片段的查询指令抽取出来,如在“马六如何”、“斯柯达如何”、“速腾如何”的查询指令中,抽取出知识片段:“马六”、“斯柯达”、“速腾”,其次将知识库片段替换成“【汽车品牌/型号】”符号,即生成“【汽车品牌/型号】如何”的候选表达模板;再次,统计生成的候选表达模板符合的知识库片段的数量,若该数量大于设定的阈值,则将所述候选表达模板作为表达模板,存于所述表达模板库109中;若该数量小于设定的阈值,则舍弃所述候选表达模板。
所述表达模板库109用于存储由所述表达模板挖掘模块108挖掘出的表达模板。
所述网页存储库110用于存储网页数据和该网页数据的索引信息。该数据库即是普通搜索引擎常用的数据库,在此不再赘述。
如图5所示,在本发明第四实施方式中,所述搜索引擎包括了web服务模块101、与web服务模块101交互通信的UI模块102、与所述UI模块102通信的需求意图分析模块103、与所述UI模块102通信的结构分析模块104、与所述结构分析模块104通信的搜索模块105,以及与所述需求意图分析模块103、所述结构分析模块104交互通信的知识库106、与所述知识库106通信的用户历史行为库107、与所述知识库106、用户历史行为库107通信的表达模板挖掘模块108、与所述表达模板挖掘模块108和所述需求意图分析模块103通信的表达模板库109,以及与所述搜索模块105通信的网页存储库110、第一垂直搜索数据111a、第二垂直搜索数据库111b、......、第N垂直搜索数据库111n。值得一提的是,这些模块即可存储并运行于同一服务器中,也可存储并运行在多台服务器中。
所述web服务模块101用于通过网络协议接收从客户端20传来的查询指令,并将该查询指令转到UI模块102,另外,该web服务模块101还用于接收所述UI模块102返回的结果页面,并将所述结果页面返回至客户端20。
所述UI模块102用于接收所述web服务模块101传送的查询指令,并将该查询指令发送至所述查询指令分析模块103;另外,所述UI模块102还用于接收所述搜索模块104返回的搜索结果,并将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101。
所述需求意图分析模块103用于调用所述知识库106、用户历史行为库107,以及所述表达模板库108,以对接收到的查询指令进行需求意图分析,明确所述查询指令的需求意图。在本发明中,所述意图分析模块103首先通过所述用户历史行为库107给所述知识库106中的各个知识片段的各个需求意图打分,具体的:用户在查询某类需求时,会点击相应的满足他需求的结果,如用户想获得汽车报价相关的信息,在搜索引擎输入查询指令“朗逸”后,会点击搜索引擎返回的汽车网站的Url,如“网易车库”,此时用户输入的查询指令“朗逸”片段以及用户点击的Url“网易车库”都隐含反映用户有找车相关信息的需求,基于这一点,本发明在计算各个知识片段的需求意图时,根据某个知识片段点击某类Url的数目/某个知识片段点击的总Url,来确定此知识片段需求意图的得分,如在所述用户历史行为库107中得知,查询指令为“朗逸”,其点击的总Url数为10个,其中,商品类Url为5个,新闻类Url为3个,图片类Url为2个,则可计算出该查询指令的商品类的需求意图为0.5,新闻类的需求意图为0.3,图片类的需求意图为0.2;其次,在接收到用户输入的一个查询指令后,需要经过知识库106的知识匹配,得到所述查询指令中存在于所述知识库106中的知识片段,并综合计算所述查询指令的知识库整体需求强度。例如用户输入“上海大众朗逸报价”,则通过知识库可获得“上海大众”“朗逸”的知识片段。获得初步信息后,首先将知识片段“上海大众”和“朗逸”各自的需求意图得分加总,得到第一分数,其次,再通过知识片段“上海大众”与“朗逸”的关系,加减所述第一分数,得到知识库整体需求得分,在本发明最佳实施方式中,若知识片段的关系为同属关系,则加分;若知识片段为非同属关系,则减分;若该知识库整体需求得分大于设定的阈值,则以知识库整体需求得分最高的需求类型作为查询指令的需求意图,并根据所述需求意图在所述查询指令中加入相应的tag信息,例如“商品”、“新闻”、“图片”等。值得一提的是:在本发明的最佳实施方式中,除了计算知识库整体需求得分外,在分析需求意图时,还会考虑表达模板层面上的打分:在接收到用户输入的一个查询指令后,需要经过表达模板库108的表达模板匹配,得到所述查询指令中存在于所述表达模板库108中的表达模板片段,例如用户输入“上海大众朗逸报价”,则通过用户模板识别出查询指令中存在的“XX报价”模板。在根据上述方法获得知识库整体需求得分的同时,查询指令又符合用户需求模板,表达模板库108也对所述查询指令在表达模板层面上进行打分,得到表达模板得分,则整体查询指令的需求强度得分为知识库整体需求得分与表达模板得分的加权之和,若该加权之和大于设定的阈值,则已加权之和最大的需求类型作为查询指令的需求意图。
所述结构分类模块104用于结合所述知识库106,对UI模块102输入查询指令进行智能化变换后发送至所述搜索模块105,其中,所述智能化变换即是语义内容扩充,所述的语义内容扩充包括了语义内容的归一化,以及语义类别的扩展。具体的,在所述查询指令有同属关系(上位属性的知识片段+下位属性的知识片段)时,例如,所述查询指令为“手机诺基亚”,此时,所述结构分类模块104在发送给所述搜索模块105时,即会在“手机”这个上位属性的知识片段上加入“可以丢弃”的tag,这样,在搜索模块105对所述查询指令进行搜索时,即可通过“手机诺基亚”进行搜索,也可通过“诺基亚”进行搜索,且还可认为带有“手机诺基亚”文本信息的网页和只带有“诺基亚”文本信息的网页权值一样;另外,例如:若所述查询指令为“诺基亚”,则所述结构分类模块104在发送给所述搜索模块105时,还可根据“诺基亚”对应其上位属性进行扩展,如扩展为“手机”,这样,在搜索模块105对“诺基亚”进行搜索时,可根据结果的数量判断是否需要扩展到“手机”进行搜索,如通过“诺基亚”搜索到的结果数量较小时,即可扩展到“手机”;又如:若所述查询指令为“手机”,则所述结构分类模块104可将“手机”对应其同位属性进行扩展,如扩展为“电脑”,这样的扩展可用于广告的推广,如在搜索页面的右侧即可根据“手机”这个查询指令进行广告推广,又可根据“电脑”这个查询指令进行广告推广;再如,若所述查询指令为“诺基亚”,则所述结构分类模块104在发送给所述搜索模块105时,还可根据“诺基亚”对应其下位属性进行扩展,如扩展为“N71”、“N72”等,这样,在搜索模块105在搜索到带有“N71”、“N72”等文本信息网页时,也可根据这些网页的权值,判断是否作为搜索结果输出。这种权值判断可参现有搜索引擎中的权值判断,在此不再赘述。总而言之,对所述查询指令进行扩展时,可根据搜索的策略,即可扩展其上位属性的知识片段,也可扩展其同位属性的知识片段,也可扩展其下位属性的知识片段。
所述搜索模块105用于接收经过所述需求意图分析模块103或所述结构分类模块104的智能化变换后的查询指令,并将该查询指令在多个垂直搜索数据库(第一垂直搜索数据库111a、第二垂直搜索数据库111b、......、第N垂直数据库111n)的其中之一,以及所述网页存储库1110中搜索,以得到搜索结果,同时,所述搜索模块105还用于将所述搜索结果返回至所述UI模块102。值得一提的是:选择某个垂直搜索数据库进行垂直搜索是通过查询指令的需求意图确定的,例如:若查询指令的需求意图为“商品”,则在商品垂直搜索数据库中进行搜索;所查询指令的需求意图为“图片”,则在图片垂直搜索数据库中进行搜索,其中,在垂直搜索数据库中搜索到的一条或多条结果,会***至在网页存储库中搜索到的结果中,形成整体搜索结果。所述垂直搜索,即是在某个特定的类别下进行搜索,其具体的搜索方法和***在本领域中已多有现有技术揭示,在此不再赘述。
所述知识库106用于存储先验知识。在本发明最佳实施方式中,所述知识库主要存储为树形结构,对每一类知识库构建一棵知识库树,通过该知识库树的父亲节点标识其上位属性,右兄弟节点表示其同位属性,左兄弟节点表示其下位属性,如此迭代,直至叶子节点。如图6所示,“大众”为其最上位属性;其下位属性为“上海大众”;与所述“上海大众”同位的有“一汽大众”;在所述“上海大众”下位的有“朗逸”,与所述“朗逸”同位的有“途观”......这种知识库的构建方法,本领域的普通技术人员可参现有技术完成,在此不再赘述。
用户历史行为库107用于存储用户历史搜索记录。优选地,其可包括查询指令、查询次数,以及加权点击数等信息。
表达模板挖掘模块108用于根据所述知识库106中的知识片段和所述用户历史行为库107中的用户历史查询指令,挖掘出表达模板,并将所述表达模板存储于所述表达模板库109中。相同需求的用户,在表达方式上会出现相似性,所述表达模板是指,一般用户在有一定查询需求时,其输入的查询指令为何,例如,当用户在查询汽车相关信息时,表达方式会有:“速腾怎么样”、“马六动力如何”等,其中即可抽取出“【汽车品牌/型号】怎么样”、“【汽车品牌/型号】动力如何”等表达汽车需求时常用的表达模板。在本发明的一实施方式中,具体为:首先在所述用户历史行为库107中包含知识库106知识片段的查询指令抽取出来,如在“马六如何”、“斯柯达如何”、“速腾如何”的查询指令中,抽取出知识片段:“马六”、“斯柯达”、“速腾”,其次将知识库片段替换成“【汽车品牌/型号】”符号,即生成“【汽车品牌/型号】如何”的候选表达模板;再次,统计生成的候选表达模板符合的知识库片段的数量,若该数量大于设定的阈值,则将所述候选表达模板作为表达模板,存于所述表达模板库109中;若该数量小于设定的阈值,则舍弃所述候选表达模板。
所述表达模板库109用于存储由所述表达模板挖掘模块108挖掘出的表达模板。
所述网页存储库110用于存储网页数据和该网页数据的索引信息。该数据库即是普通搜索引擎常用的数据库,在此不再赘述。
所述第一垂直搜索数据库111a、第二垂直搜索数据库111b、......、第N垂直搜索数据库111n用于存储特定类别数据和该特定类别数据的索引信息,例如商品数据、商品索引;新闻数据、新闻索引;图片数据、图片索引等。
如图7所示,本发明第一实施方式的搜索方法包括以下步骤:
S1、接收查询指令;优选地,该查询指令是用户通过客户端上的浏览器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块102;
S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;优选地,该步骤是通过所述需求意图分析模块103完成的;
S3、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;优选地,该步骤是通过所述搜索模块105完成的;
S4、输出所述搜索结果。优选地,该步骤是在所述UI模块102和所述web服务模块101中完成的,搜索结果从所述搜索模块104返回至所述UI模块102,并通过所述UI模块102将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。
其中,在所述S3步骤中的数据库即可为网页存储库110,或与需求意图相对应的垂直搜索数据库;当然,也可包括网页存储库110和与所述需求意图相对应的垂直搜索数据库。
在所述S2步骤和S3步骤之间,还包括语义扩充步骤:
基于所述知识库对接收到的查询指令进行语义扩充;优选地,该步骤是通过结构分析模块104完成的。
如图8所示,本发明第二实施方式的搜索方法包括以下步骤:
S1’、接收查询指令;优选地,该查询指令是用户通过客户端上的浏览器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块102;
S2’、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图,同时,基于所述知识库对接收到的查询指令进行语义扩充;优选地,该步骤是通过所述需求意图分析模块103和所述结构分析模块104完成的;
S3’、将带有需求意图并扩充语义的查询指令在数据库中搜索,得到搜索结果;优选地,该步骤是通过所述搜索模块105完成的;
S4’、输出所述搜索结果。优选地,该步骤是在所述UI模块102和所述web服务模块101中完成的,搜索结果从所述搜索模块104返回至所述UI模块102,并通过所述UI模块102将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。
其中,在所述S3’步骤中的数据库即可为网页存储库110,或与需求意图相对应的垂直搜索数据库;当然,也可包括网页存储库110和与所述需求意图相对应的垂直搜索数据库。
如图9所示,本发明第三实施方式的搜索方法包括以下步骤:
S10、接收查询指令;优选地,该查询指令是用户通过客户端上的浏览器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块102;
S20、基于知识库和表达模板库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;优选地,该步骤是通过所述需求意图分析模块103完成的;
S30、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;优选地,该步骤是通过所述搜索模块105完成的;
S40、输出所述搜索结果。优选地,该步骤是在所述UI模块102和所述web服务模块101中完成的,搜索结果从所述搜索模块104返回至所述UI模块102,并通过所述UI模块102将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。
其中,在所述S30步骤中的数据库即可为网页存储库110,或与需求意图相对应的垂直搜索数据库;当然,也可包括网页存储库110和与所述需求意图相对应的垂直搜索数据库。
在所述S20步骤和S30步骤之间,还包括语义扩充步骤:
基于所述知识库对接收到的查询指令进行语义扩充;优选地,该步骤是通过结构分析模块104完成的。
如图8所示,本发明第四实施方式的搜索方法包括以下步骤:
S10’、接收查询指令;优选地,该查询指令是用户通过客户端上的浏览器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块102;
S20’、基于知识库和表达模板库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图,同时,基于所述知识库对接收到的查询指令进行语义扩充;优选地,该步骤是通过所述需求意图分析模块103和所述结构分析模块104完成的;
S30’、将带有需求意图并扩充语义的查询指令在数据库中搜索,得到搜索结果;优选地,该步骤是通过所述搜索模块105完成的;
S40’、输出所述搜索结果。优选地,该步骤是在所述UI模块102和所述web服务模块101中完成的,搜索结果从所述搜索模块104返回至所述UI模块102,并通过所述UI模块102将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。
其中,在所述S30’步骤中的数据库即可为网页存储库110,或与需求意图相对应的垂直搜索数据库;当然,也可包括网页存储库110和与所述需求意图相对应的垂直搜索数据库。
如图11所示,在本发明第一实施方式、第二实施方式、第三实施方式、第四实施方式的搜索方法中,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”步骤的一实施方式,包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;具体的:用户在查询某类需求时,会点击相应的满足他需求的结果,如用户想获得汽车报价相关的信息,在搜索引擎输入查询指令“朗逸”后,会点击搜索引擎返回的汽车网站的Url,如“网易车库”,此时用户输入的查询指令“朗逸”片段以及用户点击的Url“网易车库”都隐含反映用户有找车相关信息的需求,基于这一点,本发明在计算各个知识片段的需求意图时,根据某个知识片段点击某类Url的数目/某个知识片段点击的总Url,来确定此知识片段需求意图的得分,如在所述用户历史行为库107中得知,查询指令为“朗逸”,其点击的总Url数为10个,其中,商品类Url为5个,新闻类Url为3个,图片类Url为2个,则可计算出该查询指令的商品类的需求意图为0.5,新闻类的需求意图为0.3,图片类的需求意图为0.2;
S201、在接收到用户输入的一个查询指令后,将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个知识片段;例如用户输入“上海大众朗逸报价”,则通过知识库可获得“上海大众”“朗逸”的知识片段;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;例如:知识片段“上海大众”和“朗逸”各自的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;在本发明最佳实施方式中,若知识片段的关系为同属关系,则加分;若知识片段为非同属关系,则减分;
S204、判断所述知识库整体需求得分是否大于一设定阈值;
S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为所述查询指令的需求意图;
S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图,按照普通搜索引擎搜索方式进行搜索,在此不再赘述。
如图12所示,在本发明第一实施方式、第二实施方式、第三实施方式、第四实施方式的搜索方法中,所述“基于知识库和表达模板库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”步骤的另一实施方式,包括以下流程:
S200’、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;具体的:用户在查询某类需求时,会点击相应的满足他需求的结果,如用户想获得汽车报价相关的信息,在搜索引擎输入查询指令“朗逸”后,会点击搜索引擎返回的汽车网站的Url,如“网易车库”,此时用户输入的查询指令“朗逸”片段以及用户点击的Url“网易车库”都隐含反映用户有找车相关信息的需求,基于这一点,本发明在计算各个知识片段的需求意图时,根据某个知识片段点击某类Url的数目/某个知识片段点击的总Url,来确定此知识片段需求意图的得分,如在所述用户历史行为库107中得知,查询指令为“朗逸”,其点击的总Url数为10个,其中,商品类Url为5个,新闻类Url为3个,图片类Url为2个,则可计算出该查询指令的商品类的需求意图为0.5,新闻类的需求意图为0.3,图片类的需求意图为0.2;
S201’、在接收到用户输入的一个查询指令后,将所述查询指令与知识片段和存储于表达模板库中的表达模板匹配,得到与所述查询指令相匹配的至少一个知识片段和一个表达模板;例如用户输入“上海大众朗逸报价”,则通过知识库可获得“上海大众”“朗逸”的知识片段;通过表达模板库克获得查询指令中存在的“XX报价”的表达模板;
S202’、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;例如:知识片段“上海大众”和“朗逸”各自的需求意图得分加总,得到第一分数;
S203’、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;在本发明最佳实施方式中,若知识片段的关系为同属关系,则加分;若知识片段为非同属关系,则减分;
S204’、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;
S205’、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度得分;
S206’、判断所述查询指令需求强度得分是否大于一设定阈值;
S207’、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所述查询指令的需求意图;
S208’、若小于所述设定阈值,则判断所述查询指令无明显的需求意图。
如图13所示,在本发明第三实施方式、第四实施方式的搜索方法中,所述表达模板库的构建方法,包括以下流程:
S300、抽取在用户历史行为库中包含知识片段的查询指令;如在“马六如何”、“斯柯达如何”、“速腾如何”的查询指令中,抽取出知识片段:“马六”、“斯柯达”、“速腾”;
S301、将所述知识库片段替换成通用符号,生成候选表达模板;例如:“【汽车品牌/型号】”符号,即生成“【汽车品牌/型号】如何”的候选表达模板;
S302、统计生成的候选表达模板符合的知识库片段的数量;
S303、判断所述数量是否大于设定的阈值;
S304、若大于设定的阈值,则将所述候选表达模板作为表达模板,并存于数据库中,生成表达模板库;
S305、若小于设定阈值,则舍弃所述候选表达模板。
通过上述的搜索方法及搜索引擎,本发明一种实施方式的在线界面如图14所示,用于在浏览器中打开本发明搜索引擎的在线界面,并在对话框中输入查询指令“手机诺基亚”,通过上述的搜索方法及搜索***,可判断出该查询指令包括了商品类的需求意图,故在本发明的搜索方法及搜索***中,可将“手机诺基亚”这个查询指令在商品垂直搜索数据库中进行搜索,同时,***该垂直搜索结果至网页存储库中搜索的结果中,如图的A部分,当用户点击所述垂直搜索结果时,即可跳转至新页面中,如图15所示,该新页面中包含了具有商品类需求意图的检索结果,从图中B部分可看出,这条检索结果中并未包括“手机”这个文本信息,即是通过本发明的语义扩展得到的搜索结果。
综上所述可知,本发明在知识库的基础上,更好的理解用户输入的查询指令,分析查询指令的以图,解析查询指令的结构,对查询指令进行语义内容扩充,从而更好的指导搜索引擎选择优质的资源满足用户的搜索需求,使得用户搜索效率提高,节约网络流量。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
Claims (28)
1.一种搜索方法,其特征在于,所述搜索方法包括以下步骤:
S1、接收查询指令;
S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;
S3、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;
S4、输出所述搜索结果。
2.根据权利要求1所述的搜索方法,其特征在于,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
3.根据权利要求1所述的搜索方法,其特征在于,在所述S2步骤和S3步骤间,还包括语义扩充步骤:
基于所述知识库对所述查询指令进行语义扩充。
4.根据权利要求1所述的搜索方法,其特征在于,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个知识片段;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、判断所述知识库整体需求得分是否大于一设定阈值;
S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为所述查询指令的需求意图;
S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
5.根据权利要求1所述的搜索方法,其特征在于,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配的至少一个知识片段和一表达模板;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;
S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度得分;
S206、判断所述查询指令需求强度得分是否大于一设定阈值;
S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所述查询指令的需求意图;
S208、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
6.一种搜索方法,其特征在于,所述搜索方法包括以下步骤:
S1、接收查询指令;
S2、基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图,同时,基于所述知识库对所述查询指令进行语义扩充;
S3、将带有需求意图并扩充语义的查询指令在数据库中搜索,得到搜索结果;
S4、输出所述搜索结果。
7.根据权利要求6所述的搜索方法,其特征在于,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
8.根据权利要求6所述的搜索方法,其特征在于,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个知识片段;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、判断所述知识库整体需求得分是否大于一设定阈值;
S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为所述查询指令的需求意图;
S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
9.根据权利要求6所述的搜索方法,其特征在于,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配的至少一个知识片段和一表达模板;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;
S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度得分;
S206、判断所述查询指令需求强度得分是否大于一设定阈值;
S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所述查询指令的需求意图;
S208、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
10.一种搜索方法,其特征在于,所述搜索方法包括以下步骤:
S1、接收查询指令;
S2、基于知识库和表达模板库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;
S3、将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;
S4、输出所述搜索结果。
11.根据权利要求10所述的搜索方法,其特征在于,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
12.根据权利要求10所述的搜索方法,其特征在于,在所述S2步骤和S3步骤间,还包括语义扩充步骤:
基于所述知识库对所述查询指令进行语义扩充。
13.根据权利要求10所述的搜索方法,其特征在于,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个知识片段;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、判断所述知识库整体需求得分是否大于一设定阈值;
S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为所述查询指令的需求意图;
S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
14.根据权利要求10所述的搜索方法,其特征在于,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配的至少一个知识片段和一表达模板;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;
S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度得分;
S206、判断所述查询指令需求强度得分是否大于一设定阈值;
S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所述查询指令的需求意图;
S208、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
15.根据权利要求10所述的搜索方法,其特征在于,所述表达模板库的构建方法,包括以下流程:
S300、抽取在用户历史行为库中包含知识片段的查询指令;
S301、将所述知识库片段替换成通用符号,生成候选表达模板;
S302、统计生成的所述候选表达模板符合的知识库片段的数量;
S303、判断所述数量是否大于设定阈值;
S304、若大于设定阈值,则将所述候选表达模板作为表达模板,并存于数据库中,生成表达模板库;
S305、若小于设定阈值,则舍弃所述候选表达模板。
16.一种搜索方法,其特征在于,所述搜索方法包括以下步骤:
S1、接收查询指令;
S2、基于知识库和表达模板库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图,同时,基于所述知识库对接收到的查询指令进行语义扩充;
S3、将带有需求意图并扩充语义的查询指令在数据库中搜索,得到搜索结果;
S4、输出所述搜索结果。
17.根据权利要求16所述的搜索方法,其特征在于,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
18.根据权利要求16所述的搜索方法,其特征在于,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段匹配,得到与所述查询指令相匹配的至少一个知识片段;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、判断所述知识库整体需求得分是否大于一设定阈值;
S205、若大于所述设定阈值,则以所述知识库整体需求得分最高的需求类型作为所述查询指令的需求意图;
S206、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
19.根据权利要求16所述的搜索方法,其特征在于,所述“基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图”具体包括以下流程:
S200、通过用户历史行为库给知识库中的各个知识片段的各个需求意图打分,使各个知识片段都具有相应的需求意图得分;
S201、将所述查询指令与知识片段和表达模板匹配,得到与所述查询指令相匹配的至少一个知识片段和一表达模板;
S202、将与所述查询指令相匹配的知识片段的需求意图得分加总,得到第一分数;
S203、通过与所述查询指令相匹配的知识片段在所述知识库中的从属关系,加减所述第一分数,得到知识库整体需求得分;
S204、对所述查询指令在表达模板层面上进行打分,得到表达模板得分;
S205、将知识库整体需求得分与表达模板得分的加权之和作为查询指令需求强度得分;
S206、判断所述查询指令需求强度得分是否大于一设定阈值;
S207、若大于所述设定阈值,则以查询指令需求强度得分最高的需求类型作为所述查询指令的需求意图;
S208、若小于所述设定阈值,则判断所述查询指令无明显需求意图。
20.根据权利要求16所述的搜索方法,其特征在于,所述表达模板库的构建方法,包括以下流程:
S300、抽取在用户历史行为库中包含知识片段的查询指令;
S301、将所述知识库片段替换成通用符号,生成候选表达模板;
S302、统计生成的所述候选表达模板符合的知识库片段的数量;
S303、判断所述数量是否大于设定阈值;
S304、若大于设定阈值,则将所述候选表达模板作为表达模板,并存于数据库中,生成表达模板库;
S305、若小于设定阈值,则舍弃所述候选表达模板。
21.一种搜索引擎,其特征在于,所述搜索引擎包括:
UI模块,用于接收查询指令,且所述UI模块还用于接收搜索模块返回的搜索结果,并将所述搜索结果拼装为结果页面后输出;
需求意图分析模块,用于基于知识库对所述查询指令进行需求意图分析,明确所述查询指令的需求意图;
搜索模块,用于将带有需求意图的所述查询指令在数据库中搜索,得到搜索结果;
知识库,用于存储先验知识。
22.根据权利要求21所述的搜索引擎,其特征在于,所述搜索引擎还包括:
web服务模块,用于通过网络协议接收客户端发出的查询指令,并将所述查询指令转到所述UI模块,且所述web服务模块还用于接收所述UI模块返回的结果页面,并将所述结果页面返回至所述客户端。
23.根据权利要求21所述的搜索引擎,其特征在于,所述搜索引擎还包括:
用户历史行为库,用于存储用户历史搜索记录。
24.根据权利要求23所述的搜索引擎,其特征在于,所述用户历史搜索记录包括:查询指令、查询次数,以及加权点击数。
25.根据权利要求23或24所述的搜索引擎,其特征在于,所述搜索引擎还包括:
表达模板挖掘模块,用于根据所述知识库中的知识片段和所述用户历史行为库中的用户历史查询指令,挖掘表达模板,并将所述表达模板存储于表达模板库;
表达模板库,用于存储由所述表达模板挖掘模块挖掘出的表达模板。
26.根据权利要求21所述的搜索引擎,其特征在于,所述搜索引擎还包括:
结构分类模块,用于基于所述知识库对所述查询指令进行语义扩充。
27.根据权利要求21所述的搜索引擎,其特征在于,所述数据库为网页存储库或与所述需求意图相对应的垂直搜索数据库。
28.根据权利要求27所述的搜索引擎,其特征在于,
所述网页存储库用于存储网页数据和该网页数据的索引信息;
所述垂直搜索数据库用于存储特定类别数据和该特定类别数据的索引信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110038433 CN102096717B (zh) | 2011-02-15 | 2011-02-15 | 搜索方法及搜索引擎 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110038433 CN102096717B (zh) | 2011-02-15 | 2011-02-15 | 搜索方法及搜索引擎 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102096717A true CN102096717A (zh) | 2011-06-15 |
CN102096717B CN102096717B (zh) | 2013-01-16 |
Family
ID=44129812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110038433 Active CN102096717B (zh) | 2011-02-15 | 2011-02-15 | 搜索方法及搜索引擎 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102096717B (zh) |
Cited By (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402619A (zh) * | 2011-12-23 | 2012-04-04 | 广东威创视讯科技股份有限公司 | 一种搜索方法和装置 |
CN102591932A (zh) * | 2011-12-23 | 2012-07-18 | 优视科技有限公司 | 语音搜索方法及***、移动终端、中转服务器 |
CN102982025A (zh) * | 2011-09-02 | 2013-03-20 | 北京百度网讯科技有限公司 | 一种搜索需求识别方法及装置 |
CN102999520A (zh) * | 2011-09-15 | 2013-03-27 | 北京百度网讯科技有限公司 | 一种搜索需求识别的方法和装置 |
CN103136221A (zh) * | 2011-11-24 | 2013-06-05 | 北京百度网讯科技有限公司 | 一种生成需求模板的方法、需求识别的方法及其装置 |
CN103186573A (zh) * | 2011-12-29 | 2013-07-03 | 北京百度网讯科技有限公司 | 一种确定搜索需求强度的方法、需求识别的方法及其装置 |
CN103389988A (zh) * | 2012-05-10 | 2013-11-13 | 腾讯科技(深圳)有限公司 | 一种引导用户进行信息搜索的方法及装置 |
CN103530385A (zh) * | 2013-10-18 | 2014-01-22 | 北京奇虎科技有限公司 | 基于垂直搜索频道的信息搜索方法及装置 |
CN103559253A (zh) * | 2013-10-31 | 2014-02-05 | 北京奇虎科技有限公司 | 相关垂直资源搜索方法及设备 |
CN103577560A (zh) * | 2013-10-24 | 2014-02-12 | 华为技术有限公司 | 一种输入数据库操作指令的方法和装置 |
CN103761326A (zh) * | 2014-01-29 | 2014-04-30 | 百度在线网络技术(北京)有限公司 | 图片搜索方法以及搜索引擎 |
CN104252298A (zh) * | 2013-06-25 | 2014-12-31 | 刘建 | 基于电子装置外部设备的信息管理*** |
CN104298658A (zh) * | 2014-10-29 | 2015-01-21 | 百度在线网络技术(北京)有限公司 | 获取搜索结果的方法和装置 |
CN104408639A (zh) * | 2014-10-22 | 2015-03-11 | 百度在线网络技术(北京)有限公司 | 多轮会话交互方法和*** |
CN104424216A (zh) * | 2013-08-23 | 2015-03-18 | 佳能株式会社 | 用于意图挖掘的方法和设备 |
CN104598617A (zh) * | 2015-01-30 | 2015-05-06 | 百度在线网络技术(北京)有限公司 | 一种搜索结果展示方法及装置 |
CN104657397A (zh) * | 2013-11-25 | 2015-05-27 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及终端 |
CN105159977A (zh) * | 2015-08-27 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 信息交互处理方法及装置 |
CN105320674A (zh) * | 2014-07-03 | 2016-02-10 | 腾讯科技(深圳)有限公司 | 一种领域本体库的建立方法、装置及服务器 |
CN106503189A (zh) * | 2016-10-31 | 2017-03-15 | 北京百度网讯科技有限公司 | 基于人工智能的搜索***优化方法和装置 |
CN106776852A (zh) * | 2016-11-28 | 2017-05-31 | 百度(中国)有限公司 | 资源处理方法及装置 |
CN106774969A (zh) * | 2015-11-20 | 2017-05-31 | 北京搜狗科技发展有限公司 | 一种输入方法和装置 |
CN106874467A (zh) * | 2017-02-15 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 用于提供搜索结果的方法和装置 |
CN106960248A (zh) * | 2016-01-08 | 2017-07-18 | 阿里巴巴集团控股有限公司 | 一种基于数据驱动预测用户问题的方法及装置 |
CN107256267A (zh) * | 2017-06-19 | 2017-10-17 | 北京百度网讯科技有限公司 | 查询方法和装置 |
CN107480162A (zh) * | 2017-06-15 | 2017-12-15 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法、装置、设备及计算机可读存储介质 |
CN108268505A (zh) * | 2016-12-30 | 2018-07-10 | 西门子公司 | 基于语义知识的建模方法和装置 |
CN109284405A (zh) * | 2018-08-31 | 2019-01-29 | 北京优酷科技有限公司 | 信息应答方法及装置 |
CN109920429A (zh) * | 2017-12-13 | 2019-06-21 | 上海擎感智能科技有限公司 | 一种用于车载的语音识别数据处理方法及*** |
CN110019725A (zh) * | 2017-12-22 | 2019-07-16 | 科沃斯商用机器人有限公司 | 人机交互方法、***及其电子设备 |
CN110019771A (zh) * | 2017-07-28 | 2019-07-16 | 北京国双科技有限公司 | 文本处理的方法及装置 |
CN111339239A (zh) * | 2019-06-13 | 2020-06-26 | 海通证券股份有限公司 | 知识检索方法及装置、存储介质、服务器 |
CN111382256A (zh) * | 2020-03-20 | 2020-07-07 | 北京百度网讯科技有限公司 | 信息推荐方法及装置 |
CN111552768A (zh) * | 2020-03-26 | 2020-08-18 | 平安医疗健康管理股份有限公司 | 基于自然语言理解的信息搜索方法、装置、设备及可读存储介质 |
CN111787007A (zh) * | 2020-06-30 | 2020-10-16 | 北京天融信网络安全技术有限公司 | 信息处理方法、装置、电子设备及存储介质 |
CN112015531A (zh) * | 2012-05-15 | 2020-12-01 | 苹果公司 | 用于将第三方服务与数字助理相结合的***和方法 |
CN112181524A (zh) * | 2020-09-29 | 2021-01-05 | 北京有竹居网络技术有限公司 | 组件控制方法及装置、电子设备和计算机可读存储介质 |
CN113343071A (zh) * | 2021-06-30 | 2021-09-03 | 北京搜狗科技发展有限公司 | 一种检索方法、装置和电子设备 |
CN114417179A (zh) * | 2021-12-29 | 2022-04-29 | 航天科工网络信息发展有限公司 | 一种面向大规模知识库群的元搜索引擎处理方法和装置 |
US11360577B2 (en) | 2018-06-01 | 2022-06-14 | Apple Inc. | Attention aware virtual assistant dismissal |
US11487364B2 (en) | 2018-05-07 | 2022-11-01 | Apple Inc. | Raise to speak |
US11550542B2 (en) | 2015-09-08 | 2023-01-10 | Apple Inc. | Zero latency digital assistant |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
US11657820B2 (en) | 2016-06-10 | 2023-05-23 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11699448B2 (en) | 2014-05-30 | 2023-07-11 | Apple Inc. | Intelligent assistant for home automation |
US11705130B2 (en) | 2019-05-06 | 2023-07-18 | Apple Inc. | Spoken notifications |
US11749275B2 (en) | 2016-06-11 | 2023-09-05 | Apple Inc. | Application integration with a digital assistant |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11842734B2 (en) | 2015-03-08 | 2023-12-12 | Apple Inc. | Virtual assistant activation |
US11888791B2 (en) | 2019-05-21 | 2024-01-30 | Apple Inc. | Providing message response suggestions |
US11900923B2 (en) | 2018-05-07 | 2024-02-13 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11947873B2 (en) | 2015-06-29 | 2024-04-02 | Apple Inc. | Virtual assistant for media playback |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080104061A1 (en) * | 2006-10-27 | 2008-05-01 | Netseer, Inc. | Methods and apparatus for matching relevant content to user intention |
CN101398810A (zh) * | 2007-09-30 | 2009-04-01 | 日电(中国)有限公司 | 自适应服务选择设备及其方法,查询***及其方法 |
CN101751422A (zh) * | 2008-12-08 | 2010-06-23 | 北京摩软科技有限公司 | 一种移动终端智能搜索的方法、移动终端和服务器 |
-
2011
- 2011-02-15 CN CN 201110038433 patent/CN102096717B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080104061A1 (en) * | 2006-10-27 | 2008-05-01 | Netseer, Inc. | Methods and apparatus for matching relevant content to user intention |
CN101398810A (zh) * | 2007-09-30 | 2009-04-01 | 日电(中国)有限公司 | 自适应服务选择设备及其方法,查询***及其方法 |
CN101751422A (zh) * | 2008-12-08 | 2010-06-23 | 北京摩软科技有限公司 | 一种移动终端智能搜索的方法、移动终端和服务器 |
Cited By (78)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
CN102982025B (zh) * | 2011-09-02 | 2016-05-11 | 北京百度网讯科技有限公司 | 一种搜索需求识别方法及装置 |
CN102982025A (zh) * | 2011-09-02 | 2013-03-20 | 北京百度网讯科技有限公司 | 一种搜索需求识别方法及装置 |
CN102999520B (zh) * | 2011-09-15 | 2016-04-27 | 北京百度网讯科技有限公司 | 一种搜索需求识别的方法和装置 |
CN102999520A (zh) * | 2011-09-15 | 2013-03-27 | 北京百度网讯科技有限公司 | 一种搜索需求识别的方法和装置 |
CN103136221A (zh) * | 2011-11-24 | 2013-06-05 | 北京百度网讯科技有限公司 | 一种生成需求模板的方法、需求识别的方法及其装置 |
CN102402619B (zh) * | 2011-12-23 | 2013-10-30 | 广东威创视讯科技股份有限公司 | 一种搜索方法和装置 |
CN102402619A (zh) * | 2011-12-23 | 2012-04-04 | 广东威创视讯科技股份有限公司 | 一种搜索方法和装置 |
CN102591932A (zh) * | 2011-12-23 | 2012-07-18 | 优视科技有限公司 | 语音搜索方法及***、移动终端、中转服务器 |
CN103186573A (zh) * | 2011-12-29 | 2013-07-03 | 北京百度网讯科技有限公司 | 一种确定搜索需求强度的方法、需求识别的方法及其装置 |
CN103186573B (zh) * | 2011-12-29 | 2016-05-18 | 北京百度网讯科技有限公司 | 一种确定搜索需求强度的方法、需求识别的方法及其装置 |
CN103389988A (zh) * | 2012-05-10 | 2013-11-13 | 腾讯科技(深圳)有限公司 | 一种引导用户进行信息搜索的方法及装置 |
CN112015531A (zh) * | 2012-05-15 | 2020-12-01 | 苹果公司 | 用于将第三方服务与数字助理相结合的***和方法 |
US11321116B2 (en) | 2012-05-15 | 2022-05-03 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
CN112015531B (zh) * | 2012-05-15 | 2022-06-10 | 苹果公司 | 用于将第三方服务与数字助理相结合的***和方法 |
CN104252298A (zh) * | 2013-06-25 | 2014-12-31 | 刘建 | 基于电子装置外部设备的信息管理*** |
CN104424216A (zh) * | 2013-08-23 | 2015-03-18 | 佳能株式会社 | 用于意图挖掘的方法和设备 |
CN104424216B (zh) * | 2013-08-23 | 2018-01-23 | 佳能株式会社 | 用于意图挖掘的方法和设备 |
CN103530385A (zh) * | 2013-10-18 | 2014-01-22 | 北京奇虎科技有限公司 | 基于垂直搜索频道的信息搜索方法及装置 |
CN103577560A (zh) * | 2013-10-24 | 2014-02-12 | 华为技术有限公司 | 一种输入数据库操作指令的方法和装置 |
CN103559253A (zh) * | 2013-10-31 | 2014-02-05 | 北京奇虎科技有限公司 | 相关垂直资源搜索方法及设备 |
CN104657397A (zh) * | 2013-11-25 | 2015-05-27 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及终端 |
CN104657397B (zh) * | 2013-11-25 | 2020-03-03 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及终端 |
CN103761326A (zh) * | 2014-01-29 | 2014-04-30 | 百度在线网络技术(北京)有限公司 | 图片搜索方法以及搜索引擎 |
US11699448B2 (en) | 2014-05-30 | 2023-07-11 | Apple Inc. | Intelligent assistant for home automation |
US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
CN105320674B (zh) * | 2014-07-03 | 2020-05-12 | 腾讯科技(深圳)有限公司 | 一种领域本体库的建立方法、装置及服务器 |
CN105320674A (zh) * | 2014-07-03 | 2016-02-10 | 腾讯科技(深圳)有限公司 | 一种领域本体库的建立方法、装置及服务器 |
CN104408639A (zh) * | 2014-10-22 | 2015-03-11 | 百度在线网络技术(北京)有限公司 | 多轮会话交互方法和*** |
CN104298658A (zh) * | 2014-10-29 | 2015-01-21 | 百度在线网络技术(北京)有限公司 | 获取搜索结果的方法和装置 |
CN104598617A (zh) * | 2015-01-30 | 2015-05-06 | 百度在线网络技术(北京)有限公司 | 一种搜索结果展示方法及装置 |
US11842734B2 (en) | 2015-03-08 | 2023-12-12 | Apple Inc. | Virtual assistant activation |
US11947873B2 (en) | 2015-06-29 | 2024-04-02 | Apple Inc. | Virtual assistant for media playback |
CN105159977A (zh) * | 2015-08-27 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 信息交互处理方法及装置 |
CN105159977B (zh) * | 2015-08-27 | 2019-01-25 | 百度在线网络技术(北京)有限公司 | 信息交互处理方法及装置 |
US11550542B2 (en) | 2015-09-08 | 2023-01-10 | Apple Inc. | Zero latency digital assistant |
CN106774969A (zh) * | 2015-11-20 | 2017-05-31 | 北京搜狗科技发展有限公司 | 一种输入方法和装置 |
CN106774969B (zh) * | 2015-11-20 | 2021-12-14 | 北京搜狗科技发展有限公司 | 一种输入方法和装置 |
CN106960248B (zh) * | 2016-01-08 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 一种基于数据驱动预测用户问题的方法及装置 |
US11481698B2 (en) | 2016-01-08 | 2022-10-25 | Alibaba Group Holding Limited | Data-driven method and apparatus for handling user inquiries using collected data |
US11928617B2 (en) | 2016-01-08 | 2024-03-12 | Alibaba Group Holding Limited | Data-driven method and apparatus for handling user inquiries using collected data |
CN106960248A (zh) * | 2016-01-08 | 2017-07-18 | 阿里巴巴集团控股有限公司 | 一种基于数据驱动预测用户问题的方法及装置 |
US11657820B2 (en) | 2016-06-10 | 2023-05-23 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11749275B2 (en) | 2016-06-11 | 2023-09-05 | Apple Inc. | Application integration with a digital assistant |
CN106503189B (zh) * | 2016-10-31 | 2020-03-03 | 北京百度网讯科技有限公司 | 基于人工智能的搜索***优化方法和装置 |
CN106503189A (zh) * | 2016-10-31 | 2017-03-15 | 北京百度网讯科技有限公司 | 基于人工智能的搜索***优化方法和装置 |
CN106776852A (zh) * | 2016-11-28 | 2017-05-31 | 百度(中国)有限公司 | 资源处理方法及装置 |
CN108268505A (zh) * | 2016-12-30 | 2018-07-10 | 西门子公司 | 基于语义知识的建模方法和装置 |
CN106874467B (zh) * | 2017-02-15 | 2019-12-06 | 百度在线网络技术(北京)有限公司 | 用于提供搜索结果的方法和装置 |
CN106874467A (zh) * | 2017-02-15 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 用于提供搜索结果的方法和装置 |
WO2018149115A1 (zh) * | 2017-02-15 | 2018-08-23 | 百度在线网络技术(北京)有限公司 | 用于提供搜索结果的方法和装置 |
US11669579B2 (en) | 2017-02-15 | 2023-06-06 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for providing search results |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
CN107480162A (zh) * | 2017-06-15 | 2017-12-15 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法、装置、设备及计算机可读存储介质 |
CN107256267A (zh) * | 2017-06-19 | 2017-10-17 | 北京百度网讯科技有限公司 | 查询方法和装置 |
CN107256267B (zh) * | 2017-06-19 | 2020-07-24 | 北京百度网讯科技有限公司 | 查询方法和装置 |
CN110019771A (zh) * | 2017-07-28 | 2019-07-16 | 北京国双科技有限公司 | 文本处理的方法及装置 |
CN110019771B (zh) * | 2017-07-28 | 2021-08-13 | 北京国双科技有限公司 | 文本处理的方法及装置 |
CN109920429A (zh) * | 2017-12-13 | 2019-06-21 | 上海擎感智能科技有限公司 | 一种用于车载的语音识别数据处理方法及*** |
CN110019725A (zh) * | 2017-12-22 | 2019-07-16 | 科沃斯商用机器人有限公司 | 人机交互方法、***及其电子设备 |
US11900923B2 (en) | 2018-05-07 | 2024-02-13 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11487364B2 (en) | 2018-05-07 | 2022-11-01 | Apple Inc. | Raise to speak |
US11360577B2 (en) | 2018-06-01 | 2022-06-14 | Apple Inc. | Attention aware virtual assistant dismissal |
CN109284405A (zh) * | 2018-08-31 | 2019-01-29 | 北京优酷科技有限公司 | 信息应答方法及装置 |
US11705130B2 (en) | 2019-05-06 | 2023-07-18 | Apple Inc. | Spoken notifications |
US11888791B2 (en) | 2019-05-21 | 2024-01-30 | Apple Inc. | Providing message response suggestions |
CN111339239A (zh) * | 2019-06-13 | 2020-06-26 | 海通证券股份有限公司 | 知识检索方法及装置、存储介质、服务器 |
CN111382256B (zh) * | 2020-03-20 | 2024-04-09 | 北京百度网讯科技有限公司 | 信息推荐方法及装置 |
CN111382256A (zh) * | 2020-03-20 | 2020-07-07 | 北京百度网讯科技有限公司 | 信息推荐方法及装置 |
CN111552768B (zh) * | 2020-03-26 | 2022-07-19 | 深圳平安医疗健康科技服务有限公司 | 基于自然语言理解的信息搜索方法、装置、设备及可读存储介质 |
CN111552768A (zh) * | 2020-03-26 | 2020-08-18 | 平安医疗健康管理股份有限公司 | 基于自然语言理解的信息搜索方法、装置、设备及可读存储介质 |
US11924254B2 (en) | 2020-05-11 | 2024-03-05 | Apple Inc. | Digital assistant hardware abstraction |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
CN111787007A (zh) * | 2020-06-30 | 2020-10-16 | 北京天融信网络安全技术有限公司 | 信息处理方法、装置、电子设备及存储介质 |
CN111787007B (zh) * | 2020-06-30 | 2022-09-16 | 北京天融信网络安全技术有限公司 | 信息处理方法、装置、电子设备及存储介质 |
CN112181524A (zh) * | 2020-09-29 | 2021-01-05 | 北京有竹居网络技术有限公司 | 组件控制方法及装置、电子设备和计算机可读存储介质 |
CN113343071A (zh) * | 2021-06-30 | 2021-09-03 | 北京搜狗科技发展有限公司 | 一种检索方法、装置和电子设备 |
CN114417179A (zh) * | 2021-12-29 | 2022-04-29 | 航天科工网络信息发展有限公司 | 一种面向大规模知识库群的元搜索引擎处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN102096717B (zh) | 2013-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102096717B (zh) | 搜索方法及搜索引擎 | |
CN102163198B (zh) | 提供新词或热词的方法及*** | |
CN102110170B (zh) | 一种具有信息发布和搜索功能的***及信息发布方法 | |
CN102073725B (zh) | 结构化数据的搜索方法和实现该搜索方法的搜索引擎*** | |
CN101420313B (zh) | 一种针对客户端用户群进行聚类的方法和*** | |
CN102279894B (zh) | 基于语义的查找、集成和提供评论信息的方法及搜索*** | |
CN102053983B (zh) | 一种垂直搜索的查询方法、***和装置 | |
CN101408894B (zh) | 使用语义关键词改进搜索相关性 | |
CN102253936B (zh) | 记录用户访问商品信息的方法及搜索方法和服务器 | |
CN103365833B (zh) | 一种基于上下文场景的输入候选词提示方法及*** | |
CN111708740A (zh) | 基于云平台的海量搜索查询日志计算分析*** | |
CN113822067A (zh) | 关键信息提取方法、装置、计算机设备及存储介质 | |
CN103294815A (zh) | 基于关键字分类并有多种呈现方式的搜索引擎装置与方法 | |
CN102930054A (zh) | 数据搜索方法及*** | |
CN102915380A (zh) | 用于对数据进行搜索的方法和*** | |
CN101593200A (zh) | 基于关键词频度分析的中文网页分类方法 | |
CN110888990A (zh) | 文本推荐方法、装置、设备及介质 | |
CN102737022B (zh) | 获取和搜索相关知识信息的方法及装置 | |
CN102722499B (zh) | 搜索引擎及其实现方法 | |
CN102456054B (zh) | 一种搜索方法及*** | |
CN101996195A (zh) | 音频文件中语音信息的搜索方法、装置及设备 | |
CN103226393A (zh) | 一种输入方法和设备 | |
CN102722498A (zh) | 搜索引擎及其实现方法 | |
CN102737021B (zh) | 搜索引擎及其实现方法 | |
CN102073735A (zh) | 搜索方法及搜索*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |