CN101986293A - 用于在搜索界面中呈现搜索答案信息的方法及设备 - Google Patents

用于在搜索界面中呈现搜索答案信息的方法及设备 Download PDF

Info

Publication number
CN101986293A
CN101986293A CN 201010271796 CN201010271796A CN101986293A CN 101986293 A CN101986293 A CN 101986293A CN 201010271796 CN201010271796 CN 201010271796 CN 201010271796 A CN201010271796 A CN 201010271796A CN 101986293 A CN101986293 A CN 101986293A
Authority
CN
China
Prior art keywords
answer
question
information
search information
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010271796
Other languages
English (en)
Other versions
CN101986293B (zh
Inventor
戴帅湘
徐犇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201010271796.6A priority Critical patent/CN101986293B/zh
Publication of CN101986293A publication Critical patent/CN101986293A/zh
Application granted granted Critical
Publication of CN101986293B publication Critical patent/CN101986293B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用于在搜索界面中呈现搜索答案信息的方法及设备,本发明通过获取来自用户的搜索信息,来将所述搜索信息与预存的各个问答对进行匹配,获得与所述搜索信息的全部或部分内容相匹配的一个或多个问答对,并根据所述一个或多个问答对,向用户提供与该搜索信息对应的答案信息。本发明具有以下优点:1)能够根据用户输入的搜索信息,直接在搜索界面中向用户提供基于该搜索信息的确定性答案,并能够同时向用户提供基于该搜索信息的搜索结果;2)通过对网页内容及百科知识的分析,生成问答对库,来向用户提供全面的、实时的答案;3)通过用户的相关信息及/或与用户的进一步交互,提高答案准确性,给予用户更好的个性化体验。

Description

用于在搜索界面中呈现搜索答案信息的方法及设备
技术领域
本发明涉及计算机领域,尤其涉及用于在搜索界面中呈现搜索答案信息的方法、设备和***。
背景技术
现有技术中,若用户希望得到某些信息,往往会在搜索引擎或专门的信息库中进行搜索。其中,对于某些可能得到确定性答案的信息,搜索引擎仅根据用户的搜索信息向用户提供链接,用户还需要从链接中选择并查找答案;而专门的信息库多为某个方面的专门库,难以向用户提供全面的信息,且在向用户提供答案信息的同时,无法向用户提供其他的搜索内容。
因此,如何能够同时向用户全面地提供确定性问题的答案,又能根据用户的搜索信息提供搜索结果,已成为本领域技术人员需要解决的问题。
发明内容
本发明的目的是提供一种用于在搜索界面中呈现搜索答案信息的方法、设备和***。
根据本发明的一个方面,提供一种用于在搜索界面中呈现搜索答案信息的方法,该方法包括以下步骤:
a获取来自用户的搜索信息;
b将所述搜索信息与预存的各个问答对进行匹配,获得与所述搜索信息的全部或部分内容相匹配的一个或多个问答对;
c根据所述一个或多个问答对,向用户提供与该搜索信息对应的答案信息。
根据本发明的另一方面,还提供了一种用于在搜索界面中呈现搜索答案信息的设备,其中,该设备包括:
第一获取装置、用于获取来自用户的搜索信息;
匹配装置、用于将所述搜索信息与预存的各个问答对进行匹配,获得与所述搜索信息的全部或部分内容相匹配的一个或多个问答对;
提供装置、用于根据所述一个或多个问答对,向用户提供与该搜索信息对应的答案信息。
与现有技术相比,本发明具有以下优点:1)能够根据用户输入的搜索信息,直接在搜索界面中向用户提供基于该搜索信息的确定性答案,并且,还能够同时向用户提供基于该搜索信息的搜索结果;2)通过对网页内容及百科知识的分析,生成问答对库,来向用户提供全面的、实时的答案;3)通过用户的相关信息及/或与用户的进一步交互,提高了答***性,给予用户更好的个性化体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一个方面的用于在搜索界面中呈现搜索答案信息的方法流程图;
图2为本发明一个优选实施例的用于在搜索界面中呈现搜索答案信息的方法流程图;
图3为本发明另一优选实施例的用于在搜索界面中呈现搜索答案信息的方法流程图;
图4为网络设备根据来自网页的问答内容生成问答对的方法流程图;
图5为网络设备根据来自百科网页的数据生成问答对的方法流程图。
图6为本发明一个方面的在搜索界面中呈现搜索答案信息的***结构示意图;
图7为本发明一个优选实施例的匹配装置的结构示意图;
图8为本发明的另一个优选实施例的匹配装置的结构示意图;
图9为网络设备根据来自网页的问答内容和百科网页的数据生成问答对的装置结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面在搜索界面中呈现搜索答案信息的方法流程图。其示出网络设备2经由网络获取来自用户通过用户设备1输入的搜索信息,将搜索信息与问答对匹配,获取答案信息并在搜索界面中呈现给用户的过程。
其中,网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。用户设备1包括但不限于任何一种与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。网络设备2包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,网络设备2保存有问答对库和词汇类型库。问答对中包含问题及该问题相应的答案,而问答对库为包含大量问答对的集合。词汇类型库中记录了词汇或词汇的组合与该词汇或词汇的组合可能描述的类型的对应关系。
当用户希望进行搜索时,通过用户设备提供的输入方式输入搜索信息。其中,该输入方式包括但不限于:1)文字输入;2)语音输入;3)手写输入。其中,在上述方式中输入搜索信息的位置包括但不限于:1)搜索引擎提供的页面的搜索栏;2)客户端提供的搜索页面;3)嵌入网页或客户端中的搜索栏等。
具体地,在步骤s101中,用户设备1通过任何一种与用户进行人机交互的交互设备来获取用户输入的搜索信息。该交互设备可以是键盘、遥控器、触摸板或声控设备等。接着,在步骤s102中,用户设备1将所述用户输入的搜索信息发送至网络设备2。在步骤s103中,网络设备2获取上述搜索信息。
接着,在步骤s104中,网络设备2将接收到的搜索信息与本地问答对库中预存的各个问答对进行匹配,即在各个问答对中查找与搜索信息中相同或相似的词汇信息,以获得与所述搜索信息的全部或部分内容相匹配的一个或多个问答对。
具体地,网络设备2将搜索信息与问答对中的问题进行匹配,根据搜索信息,可出现一个或多个问答对的问题与该搜索信息匹配的情况。
当搜索信息仅隐含单个问题时,网络设备2可以得到该搜索信息中的全部内容可与一个或多个问答对中的问题相匹配的结果。
例如,当搜索信息为“***的出生地在哪”,上述搜索信息隐含单个问题。网络设备2将该搜索信息在问答对库中进行匹配,得到一个问答对的问题为“***出生地”,该问答对的问题与搜索信息的全部内容相匹配,则网络设备2获得了问答对“***出生地,湖南韶山”。
当搜索信息隐含多个问题时,网络设备2可匹配得到多个问答对,每个问答对的问题与该搜索信息中的部分内容相匹配。
例如,当搜索信息为“***的出生年月和地点”,上述搜索信息隐含两个问题。网络设备2将该搜索信息在问答对库中进行匹配,得到问答对“***出生地,湖南韶山”及问答对“***出生日期,1893年12月26日”。其中,前一个问答对的问题为“***出生地”,该问题与搜索信息中“***出生地点”相匹配,后一个问答对的问题为“***出生日期”,该问题与搜索信息中“***出生年月”相匹配。
当问答对库中存在相对搜索信息更为细化的问答对时,网络设备2可匹配到多个问答对。
例如,当搜索信息为“地铁二号线末班车时刻”,由于各个城市地铁二号线末班车时间不同,问答对库中往往会存有各个不同城市的地铁二号线末班车的问答对。网络设备2将上述搜索信息与各个问答对进行匹配后,获得多个问答对:“上海地铁二号线末班车时刻,23:00”、“北京地铁二号线末班车时刻,23:15”、“广州地铁二号线末班车时刻,23:30”等,上述问答对的问题均能与搜索信息的全部内容匹配。需要说明的是,上述例子仅为更好地说明本发明的方案,但本发明并不以此为限,本领域技术人员应该理解,任何根据搜索信息,获得一个或多个问答对的方案,均应包含在本发明的范围中。
在步骤s105中,网络设备2根据步骤s104中得到的问答对生成答案信息。
当与搜索信息匹配的问答对仅有一个时,网络设备2获取上述问答对中的答案,结合该问答对的问题作为答案信息。
当与搜索信息匹配的问答对有多个时,判断是否可以将各个问答对的答案进行整合。如果上述各个问答对在语义上相关联,可以整合,网络设备2将上述各个问答对用符合自然语言习惯的方式整合,并生成答案信息。例如,对于与搜索信息“***的出生年月和地点”相匹配的问答对“***出生年月,1893年12月26日”和“***出生地,湖南韶山”,其问题的主体相同,网络设备2可将其整合生成一条语义上连贯的答案信息“***出生于1893年12月26日,湖南韶山”;若各个问答对无法整合,网络设备2则分别根据问答对的答案及该问答对的问题,生成多个答案单元作为答案信息,例如,将搜索信息“地铁二号线末班车时刻”相匹配的问答对“上海地铁二号线末班车时刻,23:00”、“北京地铁二号线末班车时刻,23:15”、“广州地铁二号线末班车时刻,23:30”生成诸如“上海地铁二号线末班车时刻为23:00;北京地铁二号线末班车时刻为23:15;广州地铁二号线末班车时刻为23:30”的答案信息。
需要进一步说明的是,网络设备2可在生成答案信息的过程中包含复合问答对的生成,即网络设备2可将根据搜索信息得到的多个问答对合并以生成新的复合问答对,例如,可根据获得的问答对“***出生地,湖南韶山”及问答对“***出生日期,1893年12月26日”生成问答对“***的出生日期和地点,1893年12月26日湖南韶山”。
随后,在步骤s107中,网络设备2将所述答案信息发送给用户设备1。最后,在步骤s108中,用户设备1根据所述接收到的答案信息,更新页面,以将所述答案信息融入更新后的页面呈现给用户。
优选地,在步骤s105及步骤s107之间,还包括步骤s106(图未示)。在步骤s106中,网络设备2更新搜索页面,将步骤s105中生成的答案信息融入到更新的搜索页面中。
其中,答案信息在页面中呈现的位置包括但不限于以下至少一项:
-搜索结果第一条,例如将结果呈现在根据搜索信息获得的链接中的第一条;
-搜索建议,例如将结果呈现在向用户提供建议的搜索关键字的位置中;
-输入法候选栏,例如,将结果呈现在用户输入法的选项中;
-搜索栏候选项栏,例如,将结果呈现在搜索栏列出的提供搜索候选项的下拉栏中;
-WEB输入栏下的候选项栏,例如,将结果呈现在WEB输入栏中用于列出候选项的下拉栏中。
需要说明的是,上述例子仅为更好地说明本发明的方案,但本发明并不以此为限,本领域技术人员应该理解,任何对搜索页面进行处理,以将答案信息包含在搜索页面中的方案,均应包含在本发明的范围中。
相应的,在步骤s107中,网络设备2将所述包含了答案信息的更新后的页面发送给用户设备1。在步骤s108中,用户设备1接收到所述更新后的包含答案信息的页面后,呈现给用户。
优选的,在步骤s104中,每个问答对在网络设备2中是以一个四元组的结构方式存储的。一个问答对表示为包含问答类别、实体、实体特征描述、答案四部分的四元组。
在此,“问答类别”表示该问答对中所含问题的类别,包括但不限于:时间,地点,产品特性等;“实体”表示问答对中被提问的对象,包括但不限于:人名、地名、产品、事件、专有名词等;“实体特征描述”表示希望了解的所述对象的内容;“答案”即为该问答对的答案。例如,问答对“地点·***·出生地·湖南韶山”,其中“地点”为该问答对的问答类别,“***”为该问答对的实体,“出生地”为该问答对的实体特征描述,“湖南韶山”为该问答对的答案。以四元组存储问答对可将问答对数据结构化,便于用关系数据库等进行存储。因此,网络设备2将搜索信息与问答对匹配可进一步具化为将搜索信息与所述预存的各个问答对所包含的实体及实体特征描述进行匹配,来获得所述实体及所述实体特征描述均能够与所述搜索信息全部或部分内容匹配的一个或多个问答对。
例如,当搜索信息为“***的出生地在哪”,网络设备2将上述搜索信息与所述预存的各个问答对所包含的实体及实体特征描述匹配,得到问答对“地点·***·出生地·湖南韶山”,其实体“***”、特征描述“出生地”与所述搜索信息的全部内容匹配。这样就获得了与搜索信息全部内容相匹配的一个问答对。
又如,当搜索信息为“***的出生年月和地点”,上述搜索信息隐含两个问题,网络设备2将上述搜索信息在问答对库中与问答对的实体及实体特征描述进行匹配,得到问答对“时间·***·出生日期·1893年12月26日”和问答对“地点·***·出生地·湖南韶山”,其中,上述两个问答对实体“***”、特征描述“出生日期”及“出生地”分别与所述搜索信息的部分内容“***的出生年月”和***的出生地”相匹配。
优选的,在步骤s104中,网络设备2将搜索信息与各个问答对进行匹配前,还将判断所述搜索信息包含的问答类别。问答类别即为上述四元组中的第一项,问答类别表示问答对中问题的类别。例如“时间·***·出生日期·1893年12月26日”属于时间性质的问答类别;“地点·***·出生地·湖南韶山”属于地点性质的问答类别。例如,当搜索信息为“***的出生年月和地点”,网络设备2将上述搜索信息在词汇类型库中匹配,获得搜索信息部分内容“出生日”这一词汇组合描述的类型—“时间”和搜索信息部分内容“出生地”这一词汇组合描述的类型—“地点”。接着判断上述两种类型分别对应时间性质的问答类别和地点性质的问答类别,然后网络设备2将所述搜索信息分别在其包含的上述时间性质的问答类别和地点性质问答类别的两个问答类别所包含的问答对中进行匹配,得到地点性质问答类别中的问答对“地点·***·出生地·湖南韶山”和时间性质问答类别中的问答对“时间·***·出生日期·1893年12月26日”。其中,前一个问答对的问题为“***出生地”,该问题与搜索信息中“***出生地点”相匹配,后一个问答对的问题为“***出生日期”,该问题与搜索信息中“***的出生年月”相匹配。
优选的,在步骤s104中,网络设备2先判断是否能够从所述搜索信息中提取出所包含问题的实体及实体特征描述,若能够从所述搜索信息中提取出实体及实体特征描述,将所述能够提取出的实体及实体特征描述与所述各个问答对所包含的实体及实体特征描述进行匹配查询。例如,当搜索信息为“***的出生地在哪”,网络设备2根据实体识别技术及专有名词识别技术判断能够从所述搜索信息中提取出所包含问题的实体及实体特征描述并识别所述搜索信息中问题的实体为“***”、判断该实体的实体特征描述为“出生地”。其中,实体识别技术是一种识别文本内容所描述对象或主题,并优选的,对所述描述对象或主题加以归类的技术;专有名词识别技术是一种识别文本中出现的专有名称和有意义的数量短语,并优选的,对所述专有名称和有意义的数量短语加以归类的技术。接着网络设备2将提取出的实体“***”及实体特征描述“出生地”与各个问答对所包含的实体及实体特征描述进行匹配,获得相匹配的问答对“地点·***·出生地·湖南韶山”。
优选的,在步骤s104中,网络设备2先判断是否能够从所述搜索信息中提取出所包含问题的实体及实体特征描述,并是否能够判断出该搜索信息所包含问题的类别。若能够从所述搜索信息中提取出实体及实体特征描述,并能够判断出该搜索信息所包含问题的类别,网络设备2将该搜索信息所包含问题的类别、实体及实体特征描述与各个问答对中的类别、实体及实体特征描述分别匹配。例如,当搜索信息为“***的出生年月”,网络设备2根据实体识别技术及专有名词识别技术判断能够从所述搜索信息中提取出所包含问题的类别、实体及实体特征描述并识别所述搜索信息中问题的类别为“时间”,实体为“***”,并判断该实体的实体特征描述为“出生日期”。接着网络设备2将提取出的问题类别“时间”、实体“***”及实体特征描述“出生日期”与各个问答对所包含的问题类别、实体及实体特征描述进行匹配,获得相匹配的问答对“时间·***·出生日期·湖南韶山”。
图2为根据本发明一优选实施例的用于在搜索界面中呈现搜索答案信息的方法流程图。
网络设备2首先获取来自用户通过用户设备1输入的搜索信息,当问答对库中存在相对搜索信息更为细化的问答对时,可匹配到多个问答对,作为问答对候选项。于是网络设备2将根据用户相关信息在上述多个问答对候选项中进一步选取一个或多个问答对,然后进一步获取答案信息并在搜索界面中呈现给用户。其中用户相关信息包括但不限于:1)用户个人属性(包括但不限于:用户IP地址、用户设备类别、用户性别年龄等);2)用户偏好设置;3)用户搜索历史记录等。
具体地,步骤s201至s204与前面参照图1所描述的步骤s101至s104相同或相似,在此以引用的方式包含,不再赘述。
在步骤s205中,网络设备2获取来自用户设备1的用户相关信息。其中,所述相关信息的获取包括但不限于以下方式:
1)直接获取用户设备1发送的用户相关信息;
2)获取用户设备1发送的用户的身份或识别信息,网络设备2根据该身份或识别信息获取记录在网络设备2中的该用户的相关信息;
3)网络设备2根据与所述用户设备1建立通信时获取的用户设备1的标识信息,诸如获得的用户设备的手机号或硬件序列号等,来判断用户的身份,并根据该身份获取该用户的相关信息。
在步骤s206中,网络设备2根据步骤s205中获得的用户相关信息在步骤204中所获多个问答对候选项中进一步选取一个或多个问答对。其中,所述选取一个或多个问答对的方法包括以下至少一种:
1)具体地,网络设备2将获得的问答对候选项的各个问题进行比对,提取不相关的词汇,并将所述不相关的词汇在所述词汇类型库中查找,获得所述不相关词汇的类型,并根据该类型提取或获取相应的用户相关信息,在对问答候选项中进行选取。
例如,若搜索信息为“地铁二号线末班车时刻”,获得的问答对为“上海地铁二号线末班车时刻,23:00”、“北京地铁二号线末班车时刻,23:00”、“广州地铁二号线末班车时刻,23:00”等,将上述问答对候选项的问题进行比对,提取不相关的词汇为“上海”、“北京”、“广州”等,在词汇类型库中查找得到上述不相关词汇类型均为“地点”,而“地点”所对应的用户相关信息为用户IP地址,网络设备2根据用户IP地址,判断用户所在地为上海,进而选择问答对“上海地铁二号线末班车时刻,23:00”。
其中,若问答对是以四元组的方式存储的,则所述比对可进一步限定在对实体及实体特征描述的比对。
例如,搜索信息为“地铁二号线末班车时刻”,网络设备2将此搜索信息与各个问答对所包含的实体及实体特征描述进行匹配,得到“时间·上海地铁二号线·末班车时刻·23:00”、“时间·北京地铁二号线·末班车时刻·23:15”、“时间·广州地铁二号线·末班车时刻·23:30”等多个问答对,接着网络设备2分析这些问答对,提取这些问答对“实体”项的不同之处“上海”、“北京”、“广州”等、在词汇类型库中匹配得到其类型为“地点”,“地点”所对应的用户相关信息为用户IP地址,然后根据用户设备IP位置,网络设备2在上述问答对中进一步选取问答对“时间·上海地铁二号线·末班车时刻·23:00”。
2)根据获得的用户偏好设置,判断如何选取问答对候选项。
例如,当用户偏好设置中设定在搜索界面仅呈现一定数量的答案信息时,若网络设备2在将搜索信息与各个问答对所包含的实体及实体特征描述进行匹配得到的匹配问答对的个数超过此设定数量,则网络设备2删去多余的问答对,而只保留用户偏好设置中设定数量的问答对。
又如,用户偏好设置中可设定当获得多个问答对候选项时,选取答案最多的问答对。
再如,若问答对以四元组形式存储,用户偏好中还可设置各个问答类别的优先级,如优先选取哪些类别的问答对候选项等。
3)根据获得的用户搜索历史记录,判断如何选取问答对候选项。
具体地,网络设备2将获得的问答对的各个问题进行比对,提取不相关的词汇,并将所述不相关的词汇与用户的搜索信息进行匹配,选择用户搜索信息中匹配度最高的词汇所在的问答对候选项。其中,所述匹配度的判断因素包括但不限于:相匹配的词汇的数量、相匹配的词汇的搜索时间、相匹配的频率等。
例如,若用户的搜索信息为“最好吃川系”,匹配得到的问答对为“最好吃川系菜,XXX”及“最好吃川系餐馆,YYY”等,网络设备2提取不相关的词汇“菜”、“餐馆”等。接着网络设备2分析用户的搜索历史记录,得到“餐厅”、“菜馆”、“酒店”等与“餐馆”较为匹配的在数量上较多的词汇,接着网络设备2选择包含“餐馆”的问答对“最好吃川系餐馆,YYY”。
步骤s207至s210与如图1所描述的步骤s105至s108相同或相似,在此以引用的方式包含,不再赘述。
图3为根据本发明另一优选实施例的用于在搜索界面中呈现搜索答案信息的方法流程图。其示出网络设备2首先获取来自用户通过用户设备1输入的搜索信息,当问答对库中存在相对搜索信息更为细化的问答对时,即可匹配到多个问答对作为问答对候选项。于是网络设备2将根据与用户的进一步交互在上述多个问答对中进一步选取一个或多个问答对,最后获取答案信息并在搜索界面中呈现给用户。
步骤s301至s304与如图1所描述的步骤s101至s104相同或相似,在此以引用的方式包含,不再赘述。
在步骤s305中,网络设备2根据获得的问答对候选项,获取相应的选择项。
具体地,所述选择项可根据各个问答对候选项的问题或用于描述问题的实体及实体特征描述生成,或直接将各个问答对候选项的问题作为对应的选择项。
例如,当输入搜索信息为“***出生”,网络设备2将所述搜索信息与各个问答对所包含的实体及实体特征描述进行匹配后将得到问答对候选项“时间·***·出生日期·1893年12月26日”、“地点·***·出生地·湖南韶山”,网络设备2分别提取上述问答对候选项的实体及实体特征描述组合成选择项“***的出生日期”、“***的出生地点”。
在步骤s306中,网络设备2将上述两个选择项发送给用户设备1。接着,在步骤s307中,用户设备1将上述选择项呈现给用户。在步骤s308中,用户设备1获取用户所选的选择项。随后,在步骤s309中,用户设备1将用户所选择的选择项发送给网络设备2。最后,在步骤s310中,网络设备2根据该选择项选择其相应的问答对。
步骤s311至s314与图1所描述的步骤s207至s210相同或相似,在此以引用的方式包含,不再赘述。
优选的,在步骤s304中,网络设备2先判断是否能够从所述搜索信息中提取出所包含问题的实体及实体特征描述,若能够从所述搜索信息中提取出实体及实体特征描述,将所述能够提取出的实体及实体特征描述与所述各个问答对所包含的实体及实体特征描述进行匹配;若网络设备2不能提取包含问题的实体及实体特征描述这两项,而只能提取上述两项之一,网络设备2将先在实体或实体特征描述两项中其中一项确定的问答对中匹配,得到多个匹配问答对作为问答对候选项。
例如,当搜索信息为“***的出生”,网络设备2根据实体识别技术及专有名词识别技术只能从所述搜索信息中提取出所包含问题的实体为“***”,而不能提取其实体特征描述。网络设备2将“出生”与实体为“***”的问答对中的实体特征描述匹配,得到实体特征描述包含“出生”的两个匹配问答对“时间·***·出生日期·1893年12月26日”和“地点·***·出生地·湖南韶山”。
图4示出上述网络设备2根据来自网页的问答内容生成问答对的方法流程图。
具体地,在步骤s401中,网络设备2从预设的网站库中获取可能含有问答内容信息的网站,如百度知道、搜搜问问等。接着,在步骤s402中,网络设备2可采用网络蜘蛛、网络爬虫等方式,抓取该网站中的可能含有问答内容信息的网页内容,并对上述可能含有问答内容信息的网页内容进行分析,根据网页代码判断问题的位置,并提取出问题。例如网页的html格式源代码,在其问题文本一栏会出现诸如代码“title”的标记,网络设备2获取上述相应位置上的问题文本信息,即获得了该网页的问答内容的问题。
接着,网络设备2获取该问答内容的答案。获取答案的方法包括但不限于以下至少一项:
1)该问答内容中是否有被确认的最佳答案,有则以此最佳答案作为该问答内容的答案;
例如,分析网页,判断获取到的百度知道中的问答内容中是否有“最佳答案”这一栏。“最佳答案”代表了该问题所对应的答案。
2)以该问答内容的所有答案中点击率或好评率最高的答案作为该问答内容的答案。
例如,分析得到某个答案受到网友“顶”和“好评”最多,则判断此答案为该问题的答案。
随后,在步骤s403中,网络设备2判断步骤s402中获取的问答内容是否为确定性问答内容,“是”则进行步骤s405;“否”进行步骤s404,即舍弃该问答内容。
判断问答内容是否为确定性问答内容的方法包括但不限于:
1)首先通过在词汇类型库中查找匹配判断该问答内容的类别,当在词汇类型库中有预存类别能与其匹配时,再根据实体识别技术及专有名词识别技术识别所述问答内容中问题的实体、判断该实体的实体特征描述。当所述问答内容的类别、实体及实体特征描述以及答案由上述步骤确定后,即表明所述问答内容为确定性问答内容;
2)通过专有名词识别技术及实体识别技术,判断是否能够识别出实体及该实体的实体特征描述,若能够,则判断该问答内容为确定性问答内容,并进一步判断该问答内容的类别。
需要说明的是,本领域技术人员应该理解,判断是否为确定性问答的方法并不以上述举例为限,事实上,任何根据是否能够提取实体及实体特征描述,或是否能够提取实体及实体特征描述并判断问答类别,来判断问答内容是否为确定性问答内容的方法,均应包含在本发明的范围内。
需要进一步说明的是,本领域技术人员应该理解,判断问答内容是否为确定性问答内容时,可仅通过问答内容中的问题进行判断,因此,步骤s403的顺序可在步骤s402之前,相应的,在步骤s402中,仅在判断该问答内容为确定性问答内容的情况下,才提取答案。
最后,在步骤s405中,网络设备2根据上述步骤中得到的上述问题的类别、实体及实体特征描述,结合上述问答内容信息中的答案信息,生成四元组结构(“类别·实体·实体特征描述·答案”)的问答对。
图5示出上述网络设备2根据来自百科网页的数据生成问答对的方法流程图。
在步骤s501中,网络设备2可通过互联网获取网络百科性质的网页地址,如百度百科、***等,从而获取该类网站中的百科数据。网络设备2还可通过本地上传或网络的方式获取百科数据。
接着,在步骤s502中,网络设备2可通过对步骤s501中得到的网络百科网页进行分析,通过网页代码判断百科数据的词条及词条解释。例如在网页html源代码的相应位置中获取该百科数据的主题词条及所述词条的词条解释等;还可通过对上传的百科数据的解析(模板解析判断等)来获取百科数据的主题词条及所述词条的词条解释等。
接着,在步骤s504中,网络设备2将词条作为实体,并根据词条及词条解释生成实体特征描述。然后根据所述实体及实体特征描述生成问题。例如对于“***”这一词条,网络设备2将生成其对应的实体特征描述为“生平”,并生成问题“***的生平”;对于“贸易顺差”这一词条,网络设备2将生成实体特征描述为“含义”等,生成问题“贸易顺差的含义是什么”等。
最后,在步骤s505中,网络设备2根据步骤s503及s504所得到问题,并以步骤s502中所获得的词条解释为答案,生成该百科数据对应的问答对。
优选地,所述步骤s502及步骤s504之间,还包括步骤s503(图未示)。在步骤s503中,网络设备2根据上述词条及所述词条的词条解释在词汇类型库中查找匹配,以确定上述词条及所述词条的词条解释其对应的类别。例如对于“***”这一百科数据,网络设备2将“***”该词条在词汇类型库中查找,并判断该词条及词条解释对应的类别应为“人物”。相应的,在步骤s504中,网络设备2将词条作为实体,并根据词条及词条解释对应的类别生成实体特征描述。例如对于“***”这一词条,网络设备2将生成其对应的实体特征描述为“生平”;对于“贸易顺差”这一词条,网络设备2将生成实体特征描述为“含义”等。在步骤s505中,网络设备2根据步骤s503及s504所得到的词条类别、实体及实体特征描述,结合步骤s502中所获得的词条解释为答案,生成该百科数据对应的问答对。
需要说明的是,作为本发明的优选方案之一,在问答对生成或匹配的过程中,可对实体及实体特征描述进行归一化处理。
其中,所述归一化处理包括但不限于:
1)将属于同一个同义词组中的多个实体或实体特征描述用其中一个实体或实体特征描述来表述,其中,所述同义词组存储在同义词库中;
例如,在问答对生成的过程中,得到该问答对的实体为“毛***”,实体特征为“出生日期”,且在问答对生成的过程中或该过程之后,网络设备2在同义词库中查找得到“毛***”包含在一个同义词组中,该同义词组均以“***”作为统一的描述,则在问答对的生成过程中,将实体“毛***”归一化为实体“***”;在匹配过程中或者匹配后,网络设备2在同义词库中查找得到“出生日期”包含在一个同义词组中,且该同义词组均以“生日”作为统一的描述,则在问答对的生成过程中,将实体特征描述“出生日期”归一化为实体特征描述“生日”。
又例如,在对搜索信息进行匹配的过程中,得到该搜索信息的实体为“毛***”,实体特征为“出生日期”,且在匹配的过程中或该过程之后,网络设备2在同义词库中查找得到“毛***”包含在一个同义词组中,该同义词组均以“***”作为统一的描述,则在将搜索信息与问答对进行匹配的过程中,将实体“毛***”归一化为实体“***”来进行匹配;在匹配过程中或者匹配后,网络设备2在同义词库中查找得到“出生日期”包含在一个同义词组中,且该同义词组均以“生日”作为统一的描述,则在将搜索信息与问答对进行匹配的过程中,将实体特征描述“出生日期”归一化为实体特征描述“生日”来进行匹配。
2)将相似度超过预定阈值的实体统一为相同的实体,将相似度超过预定阈值的实体特征描述统一为相同的实体特征描述。
本领域技术人员应理解,实体或实体特征描述的相似度可通过多种方式来计算,例如,通过相似部分所占比例,或预设的与前述相似部分所占比例的不同范围所对应的数值来确定。另外,本领域技术人员应可根据经验或实际需求来确定前述预定阈值,在此不做赘述。
需要说明的是,作为本发明的优选方案之一,还包括网络设备2对匹配得到的问答对所包含的答案信息进行分析,判断所述答案信息是否包含答案获取信息,若所述答案信息包含答案获取信息,网络设备2根据该答案获取信息,通过API接口调用得到相应的答案的步骤。其中,上述答案获取信息包括但不限于1)网页url链接及答案在该网页中的具***置;2)从特定接口获得的特定信息。上述答案获取信息可由人工预设。
例如,某用户于2010年8月31日输入搜索信息“上海天气情况”,网络设备2根据所述搜索信息匹配得到相应的问答对,该问答对的答案信息中包含某个网页的网址及希望获取的内容在该网页中的位置信息,该位置信息包括但不限于所述内容在该网页中的位置范围或所处模块,则网络设备2判断该问答对所包含的答案信息包含答案获取信息,接着,网络设备2通过API接口调用相应的网页,并在该网页上根据所述位置信息,抓取希望获取的内容为“上海,2010年8月31日,25~29℃,小雨转中雨,东南风4-5级”,并将其作为答案呈现给用户,该答案的呈现形式包括但不限于包含上述答案的文本形式或图片形式。
根据本发明的另一方面,若用户设备1将网络设备2根据图4及图5所示实施例生成的问答对库及预设的词汇类型库下载至本地,用户设备1可独立完成如图1、图2及图3所示的实施例的功能。
具体地,与图1所示的实施例的不同之处在于,本实施例中,用户设备1获取用户输入的搜索信息后,无需发送给网络设备2,而是直接执行与所述步骤s104、所述步骤s105及所述步骤s106中网络设备2所执行的相同或相似的步骤,获得包含了答案信息的搜索页面后,直接呈现给用户。其中,图1中所述步骤s104、所述步骤s105及所述步骤s106中网络设备2所执行的所有操作均可同样的由用户设备完成,在此以用的方式包含,不再赘述。
与图2所示的实施例的不同之处在于,本实施例中,用户设备1获取用户输入的搜索信息后,无需发送给网络设备2,而是直接执行与所述步骤s204中网络设备2所执行的相同或相似的步骤,来获得问答对候选项,随后,用户设备1直接从本地获取用户相关信息,再执行与所述步骤s206、所述步骤s207及所述步骤s208中网络设备2所做的相同或相似的步骤,获得包含了答案信息的搜索页面后,直接呈现给用户。其中,图2中所述步骤s204、所述步骤s206、所述步骤s207及所述步骤s208中网络设备2所执行的所有操作均可同样的由用户设备1完成,在此以用的方式包含,不再赘述。
与图3所示的实施例的不同之处在于,本实施例中,用户设备1获取用户输入的搜索信息后,无需发送给网络设备2,而是直接执行与所述步骤s304及所述步骤s305中网络设备2所执行的相同或相似的步骤,来获得选择项,随后,用户设备1将所述选择项直接呈现给用户,并获取用户的选择后,直接执行与所述步骤s310、所述步骤s311及所述步骤s312中网络设备2所做的相同或相似的步骤,来获得包含了答案信息的搜索页面后,直接呈现给用户。其中,图3中所述步骤s304、所述步骤s305、所述步骤s310、所述步骤311及所述步骤s312中网络设备2所执行的所有操作均可同样的由用户设备完成,在此以用的方式包含,不再赘述。
图6示出根据本发明一个方面的在搜索界面中呈现搜索答案信息的***结构图。
其中,用户设备1经由网络与网络设备2连接,所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。
用户设备1包括但不限于任何一种与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。用户设备1包括第一发送装置11、第一接收装置12和第四获取装置13。
网络设备2包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云。其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,网络设备2包括第一获取装置21、匹配装置22、提供装置23。所述问答对库26和词汇类型库25可包含在网络设备2中,也可与网络设备2物理分离但通信连接。其中,问答对中包含问题及该问题相应的答案,而问答对库26为包含大量问答对的集合。词汇类型库25中记录了词汇或词汇的组合与该词汇或词汇的组合可能描述的类型的对应关系。
当用户希望进行搜索时,通过用户设备提供的输入方式输入搜索信息。其中,该输入方式包括但不限于:1)文字输入;2)语音输入;3)手写输入。其中,在上述方式中输入搜索信息的位置包括但不限于:1)搜索引擎提供的页面的搜索栏;2)客户端提供的搜索页面;3)嵌入网页或客户端中的搜索栏等。
具体地,用户设备1中的第四获取装置13通过任何一种与用户进行人机交互的交互设备来获取用户输入的搜索信息。该交互设备可以是键盘、遥控器、触摸板或声控设备等。接着,第一发送装置11将所述用户输入的搜索信息通过互联网发送至网络设备2。
接着,网络设备2中的第一获取装置21获取上述用户搜索信息,匹配装置22将获取到的搜索信息与问答对库26中预存的各个问答对进行匹配,即在各个问答对中查找与搜索信息中相同或相似的词汇信息,以获得与所述搜索信息的全部或部分内容相匹配的一个或多个问答对。
具体地,匹配装置22将搜索信息与问答对中的问题进行匹配。根据搜索信息,可出现一个或多个问答对的问题与该搜索信息匹配的情况。
当搜索信息仅隐含单个问题时,匹配装置22可以得到该搜索信息中的全部内容可与一个或多个问答对中的问题相匹配的结果。
例如,当搜索信息为“***的出生地在哪”,上述搜索信息隐含单个问题。匹配装置22将该搜索信息在问答对库26中进行匹配,得到一个问答对“***出生地,湖南韶山”的问题为“***出生地”,该问答对的问题与搜索信息的全部内容相匹配。
当搜索信息隐含多个问题时,匹配装置22可匹配得到多个问答对,每个问答对的问题与该搜索信息中的部分内容相匹配。
例如,当搜索信息为“***的出生年月和地点”,上述搜索信息隐含两个问题。匹配装置22将该搜索信息在问答对库26中进行匹配,得到问答对“***出生地,湖南韶山”和“***出生日期,1893年12月26日”。其中,前一个问答对的问题为“***出生地”,该问题与搜索信息中“***出生地点”相匹配,后一个问答对的问题为“***出生日期”,该问题与搜索信息中“***出生年月”相匹配。
当问答对库26中存在相对搜索信息更为细化的问答对时,匹配装置22可匹配到多个问答对。
例如,当搜索信息为“地铁二号线末班车时刻”,由于各个城市地铁二号线末班车时间不同,问答对库26中往往会存有各个不同城市的地铁二号线末班车的问答对。具体地,匹配装置22将上述搜索信息与各个问答对进行匹配后,获得多个问答对:“上海地铁二号线末班车时刻,23:00”、“北京地铁二号线末班车时刻,23:15”、“广州地铁二号线末班车时刻,23:30”等,上述问答对的问题均能与搜索信息的全部内容匹配。
需要说明的是,上述例子仅为更好地说明本发明的方案,但本发明并不以此为限,本领域技术人员应该理解,任何根据搜索信息,获得一个或多个问答对的方案,均应包含在本发明的范围中。
接着,提供装置23根据上述一个或多个匹配问答对提取答案信息。
当与搜索信息匹配的问答对仅有一个时,提供装置23获取上述问答对中的答案,结合该问答对的问题作为答案信息。
当与搜索信息匹配的问答对有多个时,判断是否可以将各个问答对的答案进行整合。提供装置23还包括整合装置(图未示),若上述各个问答对在语义上相关联而可以整合,所述整合装置将上述各个问答对用符合自然语言习惯的方式整合,并生成答案信息。例如,对于与搜索信息“***的出生年月和地点”相匹配的问答对“***出生年月,1893年12月26日”和“***出生地,湖南韶山”,其问题的主体相同,整合装置可将其整合生成一条语义上连贯的答案信息“***出生于1893年12月26日,湖南韶山”;若各个问答对无法整合,整合装置则分别根据问答对的答案及该问答对的问题,生成多个答案单元作为答案信息,例如,将搜索信息“地铁二号线末班车时刻”相匹配的问答对“上海地铁二号线末班车时刻,23:00”、“北京地铁二号线末班车时刻,23:15”、“广州地铁二号线末班车时刻,23:30”生成诸如“上海地铁二号线末班车时刻为23:00;北京地铁二号线末班车时刻为23:15;广州地铁二号线末班车时刻为23:30”的答案信息。
需要进一步说明的是,网络设备2可在生成答案信息的过程中包含复合问答对的生成,即提供装置23中还包含整合装置(图未示),所述整合装置可将根据搜索信息得到的多个问答对合并以生成新的复合问答对,例如,可根据获得的问答对“***出生地,湖南韶山”及问答对“***出生日期,1893年12月26日”生成问答对“***的出生日期和地点,1893年12月26日湖南韶山”。
接着,提供装置23将所述答案信息发送给用户设备1。第一接收装置12根据接收到的所述答案信息,更新页面,以将所述答案信息融入更新后的页面呈现给用户。
优选的,网络设备2还包括网页更新装置(图未示),所述网页更新装置根据所述提供装置23提供的答案信息,更新搜索页面,以将答案信息融入到更新的搜索页面中。
其中答案信息在页面中呈现的位置包括但不限于以下至少一项:
-搜索结果第一条,例如将结果呈现在根据搜索信息获得的链接中的第一条;
-搜索建议,例如将结果呈现在向用户提供建议的搜索关键字的位置中;
-输入法候选栏,例如,将结果呈现在用户输入法的选项中;
-搜索栏候选项栏,例如,将结果呈现在搜索栏列出的提供搜索候选项的下拉栏中;
-WEB输入栏下的候选项栏,例如,将结果呈现在WEB输入栏中用于列出候选项的下拉栏中。
需要说明的是,上述例子仅为更好地说明本发明的方案,但本发明并不以此为限,本领域技术人员应该理解,任何对搜索页面进行处理,以将答案信息包含在搜索页面中的方案,均应包含在本发明的范围中。
相应的,网页更新装置将所述包含了答案信息的更新后的页面发送给用户设备1。第一接收装置12接收到所述更新后的包含答案信息的页面后,呈现给用户。
优选的,每个问答对在问答对库26中是以一个四元组的结构方式存储的。一个问答对表示为包含问答类别、实体、实体特征描述、答案四部分的四元组。其中,问答类别表示该问答对中问题的类别(包括但不限于:时间,地点,产品特性等)实体表示问答对中被提问的对象(包括但不限于:人名、地名、产品、事件、专有名词等);实体特征描述表示希望了解的所述对象的内容;答案即为该问答对的答案。例如问答对“地点·***·出生地·湖南韶山”,其中“地点”为该问答对的问答类别,“***”为该问答对的实体,“出生地”为该问答对的实体特征描述,“湖南韶山”为该问答对的答案。以四元组存储问答对可将问答对数据结构化,便于用关系数据库等进行存储。因此,匹配装置22将搜索信息与预存的各个问答对匹配可进一步具化为将搜索信息与所述预存的各个问答对所包含的实体及实体特征描述进行匹配,来获得所述实体及所述实体特征描述均能够与所述搜索信息全部或部分内容匹配的一个或多个问答对。
例如,当搜索信息为“***的出生地在哪”,匹配装置22将上述搜索信息与所述预存的各个问答对所包含的实体及实体特征描述匹配,得到问答对“地点·***·出生地·湖南韶山”,其实体“***”、特征描述“出生地”与所述搜索信息的全部内容匹配。这样就获得了与搜索信息全部内容相匹配的一个问答对。
又如,当搜索信息为“***的出生年月和地点”,上述搜索信息隐含两个问题,匹配装置22将上述搜索信息在问答对库26中与问答对的实体及实体特征描述进行匹配,得到问答对“时间·***·出生日期·1893年12月26日”和问答对“地点·***·出生地·湖南韶山”,其中,上述两个问答对实体“***”、特征描述“出生日期”及“出生地”分别与所述搜索信息的部分内容“***的出生年月”和***的出生地”相匹配。
图7示出根据本发明的网络设备2的一个优选实施例的匹配装置22的示意图。其中匹配装置22还包括第一判断装置221、第一子匹配装置222、第二判断装置227、第二子匹配装置223、第三判断装置228、第三子匹配装置225。其中第一判断装置221与第一子匹配装置222、第二判断装置227与第二子匹配装置223、第三判断装置228与第三子匹配装置225分别组合为三套装置。
优选的,将搜索信息与各个问答对进行匹配前,匹配装置22中第一判断装置221还将判断所述搜索信息包含的问答类别。问答类别即为上述四元组中的第一项,问答类别表示问答对中问题的类别。例如“时间·***·出生日期·1893年12月26日”属于时间性质的问答类别;“地点·***·出生地·湖南韶山”属于地点性质的问答类别。具体地,当搜索信息为“***的出生年月和地点”,第一判断装置221将上述搜索信息在词汇类型库25中匹配,获得搜索信息部分内容“出生日”这一词汇组合描述的类型—“时间”和搜索信息部分内容“出生地”这一词汇组合描述的类型—“地点”。接着第一判断装置221判断上述两种类型分别对应时间性质的问答类别和地点性质的问答类别。然后第一子匹配装置222利用问答对库26,将所述搜索信息分别在其包含的上述时间性质的问答类别和地点性质问答类别的两个问答类别所包含的问答对中进行匹配,得到地点性质问答类别中的问答对“地点·***·出生地·湖南韶山”和时间性质问答类别中的问答对“时间·***·出生日期·1893年12月26日”。其中,前一个问答对的问题为“***出生地”,该问题与搜索信息中“***出生地点”相匹配,后一个问答对的问题为“***出生日期”,该问题与搜索信息中“***的出生年月”相匹配。
优选的,将搜索信息与各个问答对进行匹配前,第二判断装置227先判断是否能够从所述搜索信息中提取出所包含问题的实体及实体特征描述,若能够从所述搜索信息中提取出实体及实体特征描述,第二判断装置227将所述能够提取出的实体及实体特征描述与所述各个问答对所包含的实体及实体特征描述进行匹配。例如,当搜索信息为“***的出生地在哪”,第二判断装置227根据实体识别技术及专有名词识别技术判断能够从所述搜索信息中提取出所包含问题的实体及实体特征描述,并识别所述搜索信息中问题的实体为“***”、实体特征描述为“出生地”。接着,第二子匹配装置223将提取出的实体“***”及实体特征描述“出生地”与各个问答对所包含的实体及实体特征描述进行匹配,获得相匹配的问答对“地点·***·出生地·湖南韶山”。
优选的,将搜索信息与各个问答对进行匹配前,匹配装置22中第三判断装置228先判断是否能够从所述搜索信息中提取出所包含问题的实体及实体特征描述,并是否能够判断出该搜索信息所包含问题的类别。若能够从所述搜索信息中提取出实体及实体特征描述,并能够判断出该搜索信息所包含问题的类别,第三子匹配装置225将该搜索信息所包含问题的类别、实体及实体特征描述与各个问答对中的类别、实体及实体特征描述分别匹配。例如,当搜索信息为“***的出生年月”,第三判断装置228根据实体识别技术及专有名词识别技术判断能够从所述搜索信息中提取出所包含问题的类别、实体及实体特征描述并识别所述搜索信息中问题的类别为“时间”,实体为“***”,并判断该实体的实体特征描述为“出生日期”。接着,第三子匹配装置225将提取出的问题类别“时间”、实体“***”及实体特征描述“出生日期”与各个问答对所包含的问题类别、实体及实体特征描述进行匹配,获得相匹配的问答对“时间·***·出生日期·湖南韶山”。
图8示出根据本发明的网络设备2的另一个优选实施例的匹配装置22的示意图。其中匹配装置22还包括第四子匹配装置223、选择装置224、第五子匹配装置225和交互装置226。
优选的,匹配装置22中第四子匹配装置229将所述搜索信息与预存的各个问答对进行匹配,当问答对库26中存在相对搜索信息更为细化的问答对时,可匹配到多个问答对作为问答对候选项。接着选择装置224根据获取到的用户相关信息在上述多个问答对候选项中进一步选取一个或多个问答对。其中用户相关信息包括但不限于:1)用户个人属性(包括但不限于:用户IP地址、用户设备类别、用户性别年龄等);2)用户偏好设置;3)用户搜索历史记录等。
其中,所述相关信息的获取包括但不限于以下方式:
1)网络设备2直接获取用户设备1发送的用户相关信息并提供给选择装置224;
2)网络设备2获取用户设备1发送的用户的身份或识别信息并提供给选择装置224,选择装置224根据该身份或识别信息获取记录在网络设备2中的该用户的相关信息;
3)选择装置224根据网络设备2与所述用户设备1建立通信时获取的用户设备1的信息(如获得的用户设备的手机号或硬件序列号等),判断用户的身份,并根据该身份获取该用户的相关信息。
接着,选择装置224根据获得的用户相关信息在第四子匹配装置229中获得的多个问答对候选项中进一步选取一个或多个问答对。其中,所述选取一个或多个问答对的方法包括以下至少一种:
1)具体地,选择装置224将获得的问答对候选项的各个问题进行比对,提取不相关的词汇,并将所述不相关的词汇在所述词汇类型库中查找,获得所述不相关词汇的类型,并根据该类型提取或获取相应的用户相关信息,在对问答候选项中进行选取。
例如,若搜索信息为“地铁二号线末班车时刻”,获得的问答对候选项为“上海地铁二号线末班车时刻,23:00”、“北京地铁二号线末班车时刻,23:00”、“广州地铁二号线末班车时刻,23:00”等,选择装置224将上述问答对候选项的问题进行比对,提取不相关的词汇为“上海”、“北京”、“广州”等,然后在词汇类型库25中查找得到上述不相关词汇类型均为“地点”,而“地点”所对应的用户相关信息为用户IP地址,选择装置224根据用户IP地址,判断用户所在地为上海,进而选择问答对“上海地铁二号线末班车时刻,23:00”。
其中,若问答对是以四元组的方式存储的,则所述比对可进一步限定在对实体及实体特征描述的比对。
例如,搜索信息为“地铁二号线末班车时刻”,第四子匹配装置229将此搜索信息与各个问答对所包含的实体及实体特征描述进行匹配,得到“时间·上海地铁二号线·末班车时刻·23:00”、“时间·北京地铁二号线·末班车时刻·23:15”、“时间·广州地铁二号线·末班车时刻·23:30”等多个问答对,接着选择装置224分析这些问答对,提取这些问答对“实体”项的不同之处“上海”、“北京”、“广州”等,并在词汇类型库25中匹配得到其类型为“地点”,“地点”所对应的用户相关信息为用户IP地址,然后根据用户设备IP位置,选择装置224在上述问答对中进一步选取问答对“时间·上海地铁二号线·末班车时刻·23:00”。
2)根据获得的用户偏好设置,判断如何选取问答对候选项。
例如,当用户偏好设置中设定在搜索界面仅呈现一定数量的答案信息时,若第四子匹配装置229在将搜索信息与各个问答对所包含的实体及实体特征描述进行匹配得到的匹配问答对的个数超过此设定数量,则选择装置224删去多余的问答对,而只保留用户偏好设置中设定数量的问答对。
又如,用户偏好设置中可设定当获得多个问答对候选项时,选取答案最多的问答对。
再如,若问答对以四元组形式存储,用户偏好中还可设置各个问答类别的优先级,如优先选取哪些类别的问答对候选项等。
3)根据获得的用户搜索历史记录,判断如何选取问答对候选项。
具体地,选择装置224将获得的问答对的各个问题进行比对,提取不相关的词汇,并将所述不相关的词汇与用户的搜索信息进行匹配,选择用户搜索信息中匹配度最高的词汇所在的问答对候选项。其中,所述匹配度的判断因素包括但不限于:相匹配的词汇的数量、相匹配的词汇的搜索时间、相匹配的频率等。
例如,若用户的搜索信息为“最好吃川系”,匹配得到的问答对为“最好吃川系菜,XXX”及“最好吃川系餐馆,YYY”等,选择装置224提取不相关的词汇“菜”、“餐馆”等。接着选择装置224根据用户的搜索历史记录得到“餐厅”、“菜馆”、“酒店”等与“餐馆”较为匹配的在数量上较多的词汇,因此选择装置224选择包含词汇“餐馆”的问答对“最好吃川系餐馆,YYY”。
优选的,匹配装置22中第五子匹配装置230将所述搜索信息与预存的各个问答对进行匹配,当问答对库26中存在相对搜索信息更为细化的问答对时,即可匹配到多个问答对作为问答对候选项。于是交互装置226将与用户进一步并根据用户的反馈信息在上述多个问答对中进一步选取一个或多个问答对。
具体地,交互装置226先根据在第五子匹配装置230中获得的问答对候选项,获取相应的选择项。其中,所述选择项可根据各个问答对候选项的问题或用于描述问题的实体及实体特征描述生成,或直接将各个问答对候选项的问题作为对应的选择项。
例如,当输入搜索信息为“***出生”,第五子匹配装置230将所述搜索信息在问答对库26中与各个问答对所包含的实体及实体特征描述进行匹配后将得到问答对候选项“时间·***·出生日期·1893年12月26日”、“地点·***·出生地·湖南韶山”,交互装置226分别提取上述问答对候选项的实体及实体特征描述组合成选择项“***的出生日期”、“***的出生地点”。
接着,交互装置226将上述两个选择项发送给用户设备1,用户设备1将选择项呈现给用户供其选择,在用户选择了其中一个选择项后,用户设备1通过互联网将此选择项发送给交互装置226,接着,交互装置226获取上述用户所选的选择项,并根据该选择项选择其相应的问答对。
应注意的是,匹配装置22可由图7中所示的三套装置中至少一套装置与图8中选择装置224、交互装置226两者中至少一者进行任意组合,以实现进一步的功能。例如,匹配装置22由第二判断装置227及第二子匹配装置223与交互装置226组合构成;当由第二判断装置227判断出实体及实体特征描述,并由第二子匹配装置223匹配得到相应的多个问答对时,交互装置226获取与该多个问答对相应的选择项提供给用户,并获取与用户选择的选择项相对应的问答对。本领域技术人员应当理解,本发明并不以上述举例为限,事实上,任何将所述三套装置中的至少一套与选择装置224及交互装置226中至少一套组合以选择最优的问答对的方案,均包含在本发明的范围内。
图9示出网络设备2根据来自网页的问答内容和百科网页的数据生成问答对的装置结构示意图。其中,第二获取装置27还包括第四判断装置(图未示),第一生成装置28还包括第一子生成装置(图未示)。
具体地,网络设备2可根据来自网页的内容生成问答对,该生成问答对的过程涉及第二获取装置27及第一生成装置28。第二获取装置27从预设的网站库中获取可能含有问答内容信息的网站,如百度知道、搜搜问问等。接着,第二获取装置27可采用网络蜘蛛、网络爬虫等方式,抓取该网站中的可能含有问答内容信息的网页内容,并对上述可能含有问答内容信息的网页内容进行分析,根据网页代码判断问题的位置,并提取出问题。例如网页的html格式源代码,在其问题文本一栏会出现诸如代码“title”的标记,第二获取装置27获取上述相应位置上的问题文本信息,即获得了该网页的问答内容的问题。
接着第二获取装置27从所述问答内容中获取答案。获取答案的方法包括但不限于以下至少一项:
1)该问答内容中是否有被确认的最佳答案,有则以此最佳答案作为该问答内容的答案;
例如,分析网页,判断获取到的百度知道中的问答内容中是否有“最佳答案”这一栏。“最佳答案”代表了该问题所对应的答案。
2)该问答内容的所有答案中,点击率或好评率最高的答案。
例如,分析得到某个答案受到网友“顶”和“好评”最多,则判断此答案为该问题的答案。
随后,第四判断装置判断获取的问答内容是否为确定性问答内容,“是”则将该问答内容提供给第一生成装置28中的第一子生成装置以生成问答对;“否”则舍弃该问答内容。
第四判断装置判断问答内容是否为确定性问答内容的方法包括但不限于:
1)首先通过在词汇类型库中查找匹配判断该问答内容的类别,当在词汇类型库中有预存类别能与其匹配时,再根据实体识别技术及专有名词识别技术识别所述问答内容中问题的实体、判断该实体的实体特征描述。当所述问答内容的类别、实体及实体特征描述以及答案由上述步骤确定后,即表明所述问答内容为确定性问答内容;
2)通过专有名词识别技术及实体识别技术,判断是否能够识别出实体及该实体的实体特征描述,若能够,则判断该问答内容为确定性问答内容,并进一步判断该问答内容的类别。
需要说明的是,本领域技术人员应该理解,判断是否为确定性问答的方法并不以上述举例为限,事实上,任何根据是否能够提取实体及实体特征描述,或是否能够提取实体及实体特征描述并判断问答类别,来判断问答内容是否为确定性问答内容的方法,均应包含在本发明的范围内。
需要进一步说明的是,本领域技术人员应该理解,判断问答内容是否为确定性问答内容时,可仅通过问答内容中的问题进行判断,因此,第四判断装置可在第二获取装置27获取答案之前即判断问答是否为确定性问答,相应的,第二获取装置27仅在第四判断装置判断该问答内容为确定性问答内容的情况下,才提取答案。
最后,第一生成装置28根据上述步骤中得到的上述问题的类别、实体及实体特征描述,结合上述问答内容信息中的答案信息,生成四元组结构(“类别·实体·实体特征描述·答案”)的问答对。
具体地,网络设备2可根据来自百科网页的数据生成问答对,该生成问答对的过程涉及第三获取装置29及第二生成装置30。第三获取装置29可通过互联网获取网络百科性质的网页地址,如百度百科、***等,从而获取该类网站中的百科数据。第三获取装置29还可通过本地上传或网络的方式获取百科数据。
第二生成装置30可通过对上述得到的网络百科网页进行分析,通过网页代码判断百科数据的词条及词条解释。例如在网页html源代码的相应位置中获取该百科数据的主题词条及所述词条的词条解释等;还可通过对上传的百科数据的解析(模板解析判断等)来获取百科数据的主题词条及所述词条的词条解释等。
第二生成装置30还包括第二判断装置(图未示)、第三子生成装置(图未示)及第四子生成装置(图未示)。第三子生成装置将词条作为实体,并根据词条及词条解释生成实体特征描述。然后根据所述实体及实体特征描述生成问题。例如对于“***”这一词条,第三子生成装置将生成其对应的实体特征描述为“生平”,并生成问题“***的生平”;对于“贸易顺差”这一词条,第三子生成装置将生成实体特征描述为“含义”等,并生成问题“贸易顺差的含义是什么”等。
最后,第四子生成装置根据上述所得到的问题,并以在第三获取装置29中得到的词条解释为答案,生成该百科数据对应的问答对。
优选地,在第三子生成装置生成问题之前,第二判断装置可根据在第三获取装置29中得到的词条及所述词条的词条解释在词汇类型库25中查找匹配,以确定上述词条及所述词条的词条解释其对应的类别。例如对于“***”这一百科数据,第二判断装置将“***”该词条在词汇类型库中查找,并判断该词条及词条解释对应的类别应为“人物”。相应的,第三子生成装置将词条作为实体,并根据词条及词条解释对应的类别生成实体特征描述。例如对于“***”这一词条,第三子生成装置将生成其对应的实体特征描述为“生平”;对于“贸易顺差”这一词条,第三子生成装置将生成实体特征描述为“含义”等。最后,第四子生成装置根据步骤上述得到的词条类别、实体及实体特征描述,结合在第三获取装置29中所获得的词条解释为答案,生成该百科数据对应的问答对。
为简洁起见,图6至图9中省略了与该图所示的实施例无关的装置,本领域技术人员应该理解,网络设备2可包含图6至图9中所述的所有装置或所有装置的任意组合。
需要说明的是,作为本发明的优选方案之一,在问答对生成的过程中,可对实体及实体特征描述进行归一化处理,再结合相应问答内容中的问题类别和答案生成相应的问答对。
其中,所述归一化处理包括但不限于:
1)将属于同一个同义词组中的多个实体或实体特征描述用其中一个实体或实体特征描述来表述,其中,所述同义词组存储在同义词库中;
例如,在问答对生成的过程中,得到该问答对的实体为“毛***”,实体特征为“出生日期”,且在问答对生成的过程中或该过程之后,网络设备2在同义词库中查找得到“毛***”包含在一个同义词组中,该同义词组均以“***”作为统一的描述,则在问答对的生成过程中,将实体“毛***”归一化为实体“***”;在匹配过程中或者匹配后,网络设备2在同义词库中查找得到“出生日期”包含在一个同义词组中,且该同义词组均以“生日”作为统一的描述,则在问答对的生成过程中,将实体特征描述“出生日期”归一化为实体特征描述“生日”。
又例如,在对搜索信息进行匹配的过程中,得到该搜索信息的实体为“毛***”,实体特征为“出生日期”,且在匹配的过程中或该过程之后,网络设备2在同义词库中查找得到“毛***”包含在一个同义词组中,该同义词组均以“***”作为统一的描述,则在将搜索信息与问答对进行匹配的过程中,将实体“毛***”归一化为实体“***”来进行匹配;在匹配过程中或者匹配后,网络设备2在同义词库中查找得到“出生日期”包含在一个同义词组中,且该同义词组均以“生日”作为统一的描述,则在将搜索信息与问答对进行匹配的过程中,将实体特征描述“出生日期”归一化为实体特征描述“生日”来进行匹配。
2)将相似度超过预定阈值的实体统一为相同的实体,将相似度超过预定阈值的实体特征描述统一为相同的实体特征描述。
本领域技术人员应理解,实体或实体特征描述的相似度可通过多种方式来计算,例如,通过相似部分所占比例,或预设的与前述相似部分所占比例的不同范围所对应的数值来确定。另外,本领域技术人员应可根据经验或实际需求来确定前述对应预定阈值,在此不做赘述。
需要说明的是,作为本发明的优选方案之一,网络设备2还包括第六判断装置(图未示)和调用装置(图未示)。第六判断装置对根据匹配问答对获取的答案信息进行分析,判断所述答案信息是否包含答案获取信息,若所述答案信息包含答案获取信息,调用装置根据该答案获取信息,通过API接口调用得到相应的答案。其中,上述答案获取信息包括但不限于:1)网页url链接及答案在该网页中的具***置;2)从特定接口获得的特定信息。上述答案获取信息可由人工进行预设。
例如,某用户于2010年8月31日输入搜索信息“上海天气情况”,网络设备2根据所述搜索信息匹配得到相应的问答对,该问答对的答案信息中包含某个网页的网址及希望获取的内容在该网页中的位置信息,该位置信息包括但不限于所述内容在该网页中的位置范围或所处模块,则第六判断装置判断该问答对所包含的答案信息包含答案获取信息,接着,调用装置通过API接口调用相应的网页,并在该网页上根据所述位置信息,抓取希望获取的内容为“上海,2010年8月31日,25~29℃,小雨转中雨,东南风4-5级”,并将其作为答案呈现给用户,该答案的呈现形式包括但不限于包含上述答案的文本形式或图片形式。
根据本发明的另一方面,若用户设备1将网络设备2根据图9所示实施例生成的问答对库26及预设的词汇类型库25下载至本地,用户设备1可独立完成如图6、图7及图8所示的实施例的功能。
具体地,与图6所示的实施例不同之处在于,本实施例中,用户设备1中包含第四获取装置13,并进一步包含与如图1所示的实施例中网络设备2所包含的第一获取装置21、匹配装置22、提供装置23功能相同或相似的装置,但不包含第一发送装置11及第一接收装置12。用户设备1通过第四获取装置13获取用户输入的搜索信息后,无需发送给网络设备2,而是直接通过所述与第一获取装置21、匹配装置22、提供装置23功能相同或相似的装置,获得包含了答案信息的搜索页面后,直接呈现给用户。
本实施例中,用户设备1可包含匹配装置22中所包含的各个装置,然与图8所示的实施例不同之处在于,由于选择装置224及交互装置226设置于用户设备1中,因此选择装置224直接从用户设备1中获取用户相关信息,且交互装置226直接通过用户设备1所具备的交互设备(如:显示器、触摸屏、鼠标、键盘、触摸笔等)与用户进行交互,但选择装置224如何根据用户相关信息选择一个或对个问答对及交互装置226如何根据用户的选择来获取问答对,与图8中所示的实施例相同或相似,在此以引用的方式包含,不再赘述;第一判断装置221、第一子匹配装置222、第二判断装置227、第二子匹配装置223、第三判断装置228及第三子匹配装置225在用户设备1中所实现的功能及实现功能的方式与图7所示的实施例相同或相似,在此以引用的方式包含,不再赘述。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (36)

1.一种用于在搜索界面中呈现搜索答案信息的方法,该方法包括以下步骤:
a获取来自用户的搜索信息;
b将所述搜索信息与预存的各个问答对进行匹配,获得与所述搜索信息的全部或部分内容相匹配的一个或多个问答对;
c根据所述一个或多个问答对,向用户提供与该搜索信息对应的答案信息。
2.根据权利要求1所述的方法,其中,还包括:
-对用户输入所述搜索信息的页面进行更新处理,以将其更新为包含所述答案信息的更新页面。
3.根据权利要求1或2所述的方法,其中,所述步骤b还包括以下步骤:
-将所述搜索信息与所述预存的各个问答对所包含的实体及实体特征描述进行匹配,获得所述实体及所述实体特征描述均能够与所述搜索信息的全部或部分内容匹配的一个或多个问答对。
4.根据权利要求1至3中任一项所述的方法,其中,所述步骤b还包括以下步骤:
-判断所述搜索信息包含的问答类别;
-将所述搜索信息在其包含的问答类别所包含的问答信息中进行匹配,获得与所述搜索信息的全部或部分内容相匹配的一个或多个问答对。
5.根据权利要求3或4所述的方法,其中,所述步骤b还包括以下步骤:
-判断是否能够从所述搜索信息中提取出实体及实体特征描述;
-若能够从所述搜索信息中提取出实体及实体特征描述,将所述能够提取出的实体及实体特征描述与所述各个问答对所包含的实体及实体特征描述进行匹配,获得相匹配的一个或多个问答对。
6.根据权利要求5所述的方法,其中,所述步骤b还包括以下步骤:
-判断是否能够从所述搜索信息中提取出实体及实体特征描述,并是否能够判断出该搜索信息包含的类别;
-若能够从所述搜索信息中提取出实体及实体特征描述,并能够判断出该搜索信息包含的类别,将所述能够提取出的实体、实体特征描述及所述判断出的类别与所述各个问答对所包含的问答类别、实体及实体特征描述进行匹配,获得相匹配的一个或多个问答对。
7.根据权利要求1至4中任一项所述的方法,其中,所述步骤c还包括以下步骤:
-若需要呈现的问答对为多个,则整合该多个问答对以生成答案信息。
8.根据权利要求1至7中任一项所述的方法,其中,所述答案信息能够呈现在以下至少一个位置中:
-搜索结果第一条;
-搜索建议;
-输入法候选栏;
-搜索栏候选项栏;
-WEB输入栏下的候选项栏。
9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括以下步骤:
e获取来自网页的问答内容,判断所述问答内容是否为确定性问答内容;
f根据判断为确定性问答的内容生成问答对。
10.根据权利要求9所述的方法,其中,所述步骤e还包括以下步骤:
-通过判断所述问答内容的问题能否提取出实体及实体特征描述,来判断所述问答内容是否为确定性问答内容;
所述步骤f还包括以下步骤:
-根据所述实体及实体特征描述,结合所述问答内容的答案,生成问答对。
11.根据权利要求1至8中任一项所述的方法,其中,该方法还包括以下步骤:
g获取百科数据;
h根据所述百科数据中对应的词条及词条解释生成问答对。
12.根据权利要求11所述的方法,其中,所述步骤h还包括以下步骤:
-根据所述词条及词条解释判断待生成的问答对的类别;
-将所述词条作为实体,并根据所述词条解释生成实体特征描述;
-结合所述问答对的类别、所述实体、所述实体特征描述及所述词条解释,生成问答对。
13.根据权利要求1至12中任一项所述的方法,其中,所述步骤b还包括以下步骤:
-将所述搜索信息与预存的各个问答对进行匹配,获得多个问答对候选项;
-根据用户相关信息,从所述多个问答对候选项中选取一个或多个问答对。
14.根据权利要求13所述的方法,其中,所述用户相关信息包括以下至少一项:
-用户个人属性;
-用户偏好设置;
-用户搜索历史记录。
15.根据权利要求1至14中任一项所述的方法,其中,所述步骤b还包括以下步骤:
-将所述搜索信息与预存的各个问答对进行匹配,获得多个问答对候选项;
-根据与用户的进一步交互,从所述多个问答对候选项中获取一个或多个问答对。
16.根据权利要求1至15中任一项所述的方法,其中,该方法还包括以下步骤:
-判断获得的问答对的答案信息是否包含答案获取信息;
-当获得的问答对的答案信息包含答案获取信息,则根据该答案获取信息,通过API调用相应的答案。
17.根据权利要求1至16中任一项所述的方法,其中,该方法由网络设备完成。
18.根据权利要求1至8及权利要求13至15中任一项所述的方法,其中,该方法由用户设备完成。
19.一种用于在搜索界面中呈现搜索答案信息的设备,其中,该设备包括:
第一获取装置、用于获取来自用户的搜索信息;
匹配装置、用于将所述搜索信息与预存的各个问答对进行匹配,获得与所述搜索信息的全部或部分内容相匹配的一个或多个问答对;
提供装置、用于根据所述一个或多个问答对,向用户提供与该搜索信息对应的答案信息。
20.根据权利要求19所述的设备,其中,该设备还包括:
网页更新装置、用于对用户输入所述搜索信息的页面进行更新处理,以将其更新为包含所述答案信息的更新页面。
21.根据权利要求19或20所述的设备,其中,所述匹配装置还用于:
将所述搜索信息与所述预存的各个问答对所包含的实体及实体特征描述进行匹配,获得所述实体及所述实体特征描述均能够与所述搜索信息的全部或部分内容匹配的一个或多个问答对。
22.根据权利要求19至21中任一项所述的设备,其中,所述匹配装置还包括:
第一判断装置、用于判断所述搜索信息包含的问答类别;
第一子匹配装置、用于将所述搜索信息在其包含的问答类别所包含的问答信息中进行匹配,获得与所述搜索信息的全部或部分内容相匹配的一个或多个问答对。
23.根据权利要求19至21中任一项所述的设备,其中,所述匹配装置还包括:
第二判断装置、用于判断是否能够从所述搜索信息中提取出实体及实体特征描述;
第二子匹配装置、用于若能够从所述搜索信息中提取出实体及实体特征描述,将所述能够提取出的实体及实体特征描述与所述各个问答对所包含的实体及实体特征描述进行匹配,获得相匹配的一个或多个问答对。
24.根据权利要求19至21中任一项所述的设备,其中,所述匹配装置还包括:
第三判断装置、用于判断是否能够从所述搜索信息中提取出实体及实体特征描述,并是否能够判断出该搜索信息包含的类别;
第三子匹配装置、用于若能够从所述搜索信息中提取出实体及实体特征描述,并能够判断出该搜索信息包含的类别,将所述能够提取出的实体、实体特征描述及所述判断出的类别与所述各个问答对所包含的问答类别、实体及实体特征描述进行匹配,获得相匹配的一个或多个问答对。
25.根据权利要求19至24中任一项所述的设备,其中,所述提供装置还包括:
整合装置、用于若需要呈现的问答对为多个,则整合该多个问答对以生成答案信息。
26.根据权利要求19至25中任一项所述的设备,其中,所述答案信息能够呈现在以下至少一个位置中:
-搜索结果第一条;
-搜索建议;
-输入法候选栏;
-搜索栏候选项栏;
-WEB输入栏下的候选项栏。
27.根据权利要求19至26中任一项所述的设备,其中,该设备还包括:
第二获取装置、用于获取来自网页的问答内容,判断所述问答内容是否为确定性问答内容;
第一生成装置、用于根据判断为确定性问答的内容生成问答对。
28.根据权利要求27所述的设备,其中,所述第二获取装置还包括:
第四判断装置、用于通过判断所述问答内容的问题能否提取出实体及实体特征描述,来判断所述问答内容是否为确定性问答内容;
所述第一生成装置还包括:
第一子生成装置、用于根据所述实体及实体特征描述,结合所述问答内容的答案,生成问答对。
29.根据权利要求19至26中任一项所述的设备,其中,该设备还包括:
第三获取装置、用于获取百科数据;
第二生成装置、用于根据所述百科数据中对应的词条及词条解释生成问答对。
30.根据权利要求29所述的设备,其中,所述第二生成装置包括:
第五判断装置、用于根据所述词条及词条解释判断待生成的问答对的类别;
第三子生成装置、用于将所述词条作为实体,并根据所述词条解释生成实体特征描述;
第四子生成装置、用于结合所述问答对的类别、所述实体、所述实体特征描述及所述词条解释,生成问答对。
31.根据权利要求19至30中任一项所述的设备,其中,所述匹配装置还包括:
第四子匹配装置、用于将所述搜索信息与预存的各个问答对进行匹配,获得多个问答对候选项;
选择装置、用于根据用户相关信息,从所述多个问答对候选项中选取一个或多个问答对。
32.根据权利要求31所述的设备,其中,所述用户相关信息包括以下至少一项:
-用户个人属性;
-用户偏好设置;
-用户搜索历史记录。
33.根据权利要求19至32中任一项所述的设备,其中,所述匹配装置还包括:
第五子匹配装置、用于将所述搜索信息与预存的各个问答对进行匹配,获得多个问答对候选项;
交互装置、用于根据与用户的进一步交互,从所述多个问答对候选项中获取一个或多个问答对。
34.根据权利要求19至33中任一项所述的方法,其中,该设备还包括:
-第六判断装置、用于判断获得的问答对的答案信息是否包含答案获取信息;
-调用装置、当获得的问答对的答案信息包含答案获取信息,则根据该答案获取信息,通过API调用相应的答案。
35.根据权利要求19至34中任一项所述的设备,其中,该设备为网络设备。
36.根据权利要求19至24及权利要求31至34中任一项所述的设备,其中,该设备为用户设备。
CN201010271796.6A 2010-09-03 2010-09-03 用于在搜索界面中呈现搜索答案信息的方法及设备 Active CN101986293B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010271796.6A CN101986293B (zh) 2010-09-03 2010-09-03 用于在搜索界面中呈现搜索答案信息的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010271796.6A CN101986293B (zh) 2010-09-03 2010-09-03 用于在搜索界面中呈现搜索答案信息的方法及设备

Publications (2)

Publication Number Publication Date
CN101986293A true CN101986293A (zh) 2011-03-16
CN101986293B CN101986293B (zh) 2016-08-24

Family

ID=43710640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010271796.6A Active CN101986293B (zh) 2010-09-03 2010-09-03 用于在搜索界面中呈现搜索答案信息的方法及设备

Country Status (1)

Country Link
CN (1) CN101986293B (zh)

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214209A (zh) * 2011-04-27 2011-10-12 百度在线网络技术(北京)有限公司 一种用于识别同名信息实体的方法与设备
CN103186643A (zh) * 2011-12-30 2013-07-03 安凯(广州)微电子技术有限公司 一种实现教学内容关联的自主学习方法、终端及***
CN103699590A (zh) * 2013-12-09 2014-04-02 北京奇虎科技有限公司 提供图文教程类问题解决方案的方法和服务器
CN103760991A (zh) * 2014-01-13 2014-04-30 北京搜狗科技发展有限公司 一种实体输入方法和装置
CN103838554A (zh) * 2012-11-21 2014-06-04 腾讯科技(北京)有限公司 一种互动活动的生成方法和装置
WO2014161292A1 (zh) * 2013-08-14 2014-10-09 中兴通讯股份有限公司 一种启动应用程序的方法、装置及终端
CN104331440A (zh) * 2014-10-24 2015-02-04 北京奇虎科技有限公司 基于搜索引擎提供查询结果的即时通讯方法和客户端
CN104331441A (zh) * 2014-10-24 2015-02-04 北京奇虎科技有限公司 基于搜索引擎提供问题答案的方法和装置
CN104376046A (zh) * 2014-10-24 2015-02-25 北京奇虎科技有限公司 基于搜索引擎提供查询结果的浏览方法和浏览器客户端
WO2015058604A1 (zh) * 2013-10-21 2015-04-30 北京奇虎科技有限公司 获取问答对相关联程度、优化搜索排名的装置和方法
CN105117398A (zh) * 2015-06-25 2015-12-02 扬州大学 一种基于众包的软件开发问题自动应答方法
CN105740362A (zh) * 2016-01-26 2016-07-06 百度在线网络技术(北京)有限公司 信息显示方法及显示装置
CN105786869A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于搜索获取问答专题数据的方法和装置
CN105786851A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 问答知识库的构建方法、提供搜索的方法及装置
CN105786874A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于百科词条构建问答知识库数据项的方法和装置
CN105786872A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于用户搜索提供问答onebox的方法和装置
CN105786871A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于搜索词的问答类搜索结果呈现方法和装置
CN106168962A (zh) * 2016-06-30 2016-11-30 北京奇虎科技有限公司 基于自然搜索结果提供精确观点的搜索方法及装置
WO2017016104A1 (zh) * 2015-07-28 2017-02-02 百度在线网络技术(北京)有限公司 问答信息的处理方法、装置、存储介质及设备
CN106776797A (zh) * 2016-11-22 2017-05-31 中国人名解放军理工大学 一种基于本体推理的知识问答***及其工作方法
CN106919589A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 用户问题分析方法和装置
CN103853842B (zh) * 2014-03-20 2017-07-18 百度在线网络技术(北京)有限公司 一种自动问答方法和***
CN107590252A (zh) * 2017-09-19 2018-01-16 百度在线网络技术(北京)有限公司 用于信息交互的方法及装置
CN108959559A (zh) * 2018-06-29 2018-12-07 北京百度网讯科技有限公司 问答对生成方法和装置
CN109191940A (zh) * 2018-08-31 2019-01-11 广东小天才科技有限公司 一种基于智能设备的交互方法及智能设备
CN109308357A (zh) * 2015-05-04 2019-02-05 上海智臻智能网络科技股份有限公司 一种用于获得答案信息的方法、装置和设备
CN109635214A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种学习资源的推送方法及电子设备
CN109710747A (zh) * 2019-01-16 2019-05-03 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN109800286A (zh) * 2018-12-17 2019-05-24 北京百度网讯科技有限公司 对话生成方法和装置
CN110246493A (zh) * 2019-05-06 2019-09-17 百度在线网络技术(北京)有限公司 通讯录联系人查找方法、装置及存储介质
CN110502689A (zh) * 2019-08-28 2019-11-26 上海智臻智能网络科技股份有限公司 知识点的爬取方法及装置、存储介质、终端
CN112214692A (zh) * 2019-07-11 2021-01-12 北京搜狗科技发展有限公司 基于输入法的数据处理方法、装置和机器可读介质
CN112579642A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 数据处理方法、装置、存储介质及电子设备
CN113377934A (zh) * 2021-05-21 2021-09-10 海南师范大学 一种实现智能客服的***及方法
CN107798126B (zh) * 2017-11-13 2021-11-02 北京邮电大学 基于知识库的问答处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1821991A (zh) * 2005-02-18 2006-08-23 上海赢思软件技术有限公司 一种基于人工智能的知识问答快速处理***
CN1928864A (zh) * 2006-09-22 2007-03-14 浙江大学 一种基于问答库的中文自然语言问答方法
CN101118554A (zh) * 2007-09-14 2008-02-06 中兴通讯股份有限公司 智能交互式问答***及其处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1821991A (zh) * 2005-02-18 2006-08-23 上海赢思软件技术有限公司 一种基于人工智能的知识问答快速处理***
CN1928864A (zh) * 2006-09-22 2007-03-14 浙江大学 一种基于问答库的中文自然语言问答方法
CN101118554A (zh) * 2007-09-14 2008-02-06 中兴通讯股份有限公司 智能交互式问答***及其处理方法

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214209A (zh) * 2011-04-27 2011-10-12 百度在线网络技术(北京)有限公司 一种用于识别同名信息实体的方法与设备
CN103186643A (zh) * 2011-12-30 2013-07-03 安凯(广州)微电子技术有限公司 一种实现教学内容关联的自主学习方法、终端及***
US10120546B2 (en) 2012-11-21 2018-11-06 Tencent Technology (Shenzhen) Company Limited Interactive activity generating method and apparatus and computer storage medium
CN103838554A (zh) * 2012-11-21 2014-06-04 腾讯科技(北京)有限公司 一种互动活动的生成方法和装置
CN103838554B (zh) * 2012-11-21 2017-12-12 腾讯科技(北京)有限公司 一种互动活动的生成方法和装置
WO2014161292A1 (zh) * 2013-08-14 2014-10-09 中兴通讯股份有限公司 一种启动应用程序的方法、装置及终端
WO2015058604A1 (zh) * 2013-10-21 2015-04-30 北京奇虎科技有限公司 获取问答对相关联程度、优化搜索排名的装置和方法
CN103699590A (zh) * 2013-12-09 2014-04-02 北京奇虎科技有限公司 提供图文教程类问题解决方案的方法和服务器
CN103760991A (zh) * 2014-01-13 2014-04-30 北京搜狗科技发展有限公司 一种实体输入方法和装置
CN103760991B (zh) * 2014-01-13 2017-02-15 北京搜狗科技发展有限公司 一种实体输入方法和装置
CN103853842B (zh) * 2014-03-20 2017-07-18 百度在线网络技术(北京)有限公司 一种自动问答方法和***
CN104376046A (zh) * 2014-10-24 2015-02-25 北京奇虎科技有限公司 基于搜索引擎提供查询结果的浏览方法和浏览器客户端
CN104331441A (zh) * 2014-10-24 2015-02-04 北京奇虎科技有限公司 基于搜索引擎提供问题答案的方法和装置
CN104331440A (zh) * 2014-10-24 2015-02-04 北京奇虎科技有限公司 基于搜索引擎提供查询结果的即时通讯方法和客户端
CN105786869A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于搜索获取问答专题数据的方法和装置
CN105786872A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于用户搜索提供问答onebox的方法和装置
CN105786871A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于搜索词的问答类搜索结果呈现方法和装置
CN105786874A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于百科词条构建问答知识库数据项的方法和装置
CN105786871B (zh) * 2014-12-23 2019-03-19 北京奇虎科技有限公司 基于搜索词的问答类搜索结果呈现方法和装置
CN105786851A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 问答知识库的构建方法、提供搜索的方法及装置
CN109308357B (zh) * 2015-05-04 2023-07-18 上海智臻智能网络科技股份有限公司 一种用于获得答案信息的方法、装置和设备
CN109308357A (zh) * 2015-05-04 2019-02-05 上海智臻智能网络科技股份有限公司 一种用于获得答案信息的方法、装置和设备
CN105117398A (zh) * 2015-06-25 2015-12-02 扬州大学 一种基于众包的软件开发问题自动应答方法
CN105117398B (zh) * 2015-06-25 2018-10-26 扬州大学 一种基于众包的软件开发问题自动应答方法
WO2017016104A1 (zh) * 2015-07-28 2017-02-02 百度在线网络技术(北京)有限公司 问答信息的处理方法、装置、存储介质及设备
CN106919589A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 用户问题分析方法和装置
CN105740362A (zh) * 2016-01-26 2016-07-06 百度在线网络技术(北京)有限公司 信息显示方法及显示装置
CN106168962B (zh) * 2016-06-30 2020-02-21 北京奇虎科技有限公司 基于自然搜索结果提供精确观点的搜索方法及装置
CN106168962A (zh) * 2016-06-30 2016-11-30 北京奇虎科技有限公司 基于自然搜索结果提供精确观点的搜索方法及装置
CN106776797A (zh) * 2016-11-22 2017-05-31 中国人名解放军理工大学 一种基于本体推理的知识问答***及其工作方法
CN107590252A (zh) * 2017-09-19 2018-01-16 百度在线网络技术(北京)有限公司 用于信息交互的方法及装置
CN107798126B (zh) * 2017-11-13 2021-11-02 北京邮电大学 基于知识库的问答处理方法
CN108959559A (zh) * 2018-06-29 2018-12-07 北京百度网讯科技有限公司 问答对生成方法和装置
CN108959559B (zh) * 2018-06-29 2021-02-26 北京百度网讯科技有限公司 问答对生成方法和装置
CN109191940A (zh) * 2018-08-31 2019-01-11 广东小天才科技有限公司 一种基于智能设备的交互方法及智能设备
CN109800286A (zh) * 2018-12-17 2019-05-24 北京百度网讯科技有限公司 对话生成方法和装置
CN109635214A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种学习资源的推送方法及电子设备
CN109710747A (zh) * 2019-01-16 2019-05-03 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN109710747B (zh) * 2019-01-16 2021-04-06 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN110246493A (zh) * 2019-05-06 2019-09-17 百度在线网络技术(北京)有限公司 通讯录联系人查找方法、装置及存储介质
CN112214692A (zh) * 2019-07-11 2021-01-12 北京搜狗科技发展有限公司 基于输入法的数据处理方法、装置和机器可读介质
CN110502689A (zh) * 2019-08-28 2019-11-26 上海智臻智能网络科技股份有限公司 知识点的爬取方法及装置、存储介质、终端
WO2021063087A1 (zh) * 2019-09-30 2021-04-08 北京国双科技有限公司 数据处理方法、装置、存储介质及电子设备
CN112579642A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 数据处理方法、装置、存储介质及电子设备
CN113377934A (zh) * 2021-05-21 2021-09-10 海南师范大学 一种实现智能客服的***及方法
CN113377934B (zh) * 2021-05-21 2022-07-05 海南师范大学 一种实现智能客服的***及方法

Also Published As

Publication number Publication date
CN101986293B (zh) 2016-08-24

Similar Documents

Publication Publication Date Title
CN101986293A (zh) 用于在搜索界面中呈现搜索答案信息的方法及设备
CN109783651B (zh) 提取实体相关信息的方法、装置、电子设备和存储介质
CN106227815B (zh) 一种多模态线索的个性化应用程序功能推荐方法及其***
CN101647020B (zh) 搜索结构化地理数据
JP6105094B2 (ja) アプリケーションへの状態リンクを含む検索結果の生成
CN102110170B (zh) 一种具有信息发布和搜索功能的***及信息发布方法
CN102054024B (zh) 信息处理设备、信息提取方法、程序和信息处理***
CN105701254A (zh) 一种信息处理方法和装置、一种用于信息处理的装置
CN107861753B (zh) App生成索引、检索方法和***及可读存储介质
CN102880649A (zh) 一种个性化信息处理方法和***
CN106708929B (zh) 视频节目的搜索方法和装置
CN102141868B (zh) 快捷操作信息交互页面的方法、输入法***和浏览器插件
CN102782677B (zh) 使用语义密钥的改良搜索
CN101404035A (zh) 一种基于文本或语音的信息搜索方法
CN107092639A (zh) 一种搜索引擎***
CN106371624A (zh) 一种用于提供输入候选项的方法与装置
JP2022073981A (ja) ソースコード取得
CN104808806A (zh) 根据不确定性信息实现汉字输入的方法和装置
CN105518661A (zh) 经由挖掘的超链接文本的片段来浏览图像
JP2011018178A (ja) 情報処理装置、情報処理方法およびプログラム
CN102446191A (zh) 一种用于生成网页内容摘要的方法、设备及***
US8209346B2 (en) Named entity database or mining rule database update apparatus and method using named entity database and mining rule merged ontology schema
CN103744887A (zh) 一种用于人物搜索的方法、装置和计算机设备
CN107656997A (zh) 自然语言处理方法、装置、存储介质及终端设备
KR101391107B1 (ko) 검색 대상의 타입을 인터렉티브하게 표시하는 검색 서비스 제공 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant