CN102999576A - 用于确定目标页面所对应的页面描述信息的方法和设备 - Google Patents
用于确定目标页面所对应的页面描述信息的方法和设备 Download PDFInfo
- Publication number
- CN102999576A CN102999576A CN2012104528436A CN201210452843A CN102999576A CN 102999576 A CN102999576 A CN 102999576A CN 2012104528436 A CN2012104528436 A CN 2012104528436A CN 201210452843 A CN201210452843 A CN 201210452843A CN 102999576 A CN102999576 A CN 102999576A
- Authority
- CN
- China
- Prior art keywords
- information
- page
- target pages
- equipment
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明的目的是提供一种用于确定目标页面所对应的页面描述信息的方法和设备。具体地,确定待处理的目标页面所对应的分类相关信息;根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。与现有技术相比,本发明通过根据确定的目标页面的分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息,从而使目标页面的页面描述信息更加准确,不仅提高了用户获取信息效率,还提升了用户的浏览阅读体验及用户设备的资源节约。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于确定目标页面所对应的页面描述信息的技术。
背景技术
当前,随着互联网技术的发展及互联网应用对用户学习、工作与生活的渗透,人们越来越多地通过网络获取信息,例如浏览页面或者搜索关于特定主题的页面结果。相应地,若能精确地确定目标页面的页面描述信息,将能够大幅提高用户获取信息的效率,例如为搜索用户提供更合适的页面结果,或者为页面浏览用户推供更为相关的其他信息。然而,现有技术中往往仅通过先对页面分词再统计词频来确定该页面的描述信息,这样获得的页面描述信息往往存在较大误差,例如关注“作文”的用户在浏览作文写作页面,若该页面包括一篇关于“粽子”的范文,现有技术则会得到“粽子”为该页面的描述信息,而不是“作文”。特别地,随着目前搜索引擎优化或网站优化技术的泛滥,利用该现有技术获得的页面描述信息越来越不可靠,严重影响了人们获取信息的效率和使用体验。
发明内容
本发明的目的是提供一种用于确定目标页面所对应的页面描述信息的方法与设备。
根据本发明的一个方面,提供了一种用于确定目标页面所对应的页面描述信息的方法,其中,该方法包括以下步骤:
a确定待处理的目标页面所对应的分类相关信息;
b根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。
根据本发明的另一个方面,还提供了一种用于确定目标页面所对应的页面描述信息的信息确定设备,其中,该信息确定设备包括:
分类装置,用于确定待处理的目标页面所对应的分类相关信息;
确定装置,用于根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。
根据本发明的又一个方面,还提供了一种计算机设备,该计算机设备包括如前述根据本发明另一个方面的用于确定目标页面所对应的页面描述信息的信息确定设备。
与现有技术相比,本发明通过根据确定的目标页面的分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息,从而使目标页面的页面描述信息更加准确,不仅提高了用户获取信息效率,还提升了用户的浏览阅读体验及用户设备的资源节约。而且,本发明还可根据所述页面描述信息,确定与所述目标页面相对应的呈现信息,从而进一步地提高了信息提供效率及用户获取信息效率。进一步地,本发明还可确定所述目标页面的内容敏感度信息,根据所述页面描述信息,并结合所述内容敏感度信息,确定与所述目标页面相对应的呈现信息,从而进一步地提高了信息提供效率及用户获取信息效率,进而也相应地提升了用户的浏览阅读体验。此外,本发明还可根据搜索结果所对应页面的页面描述信息与查询序列的匹配度信息,对搜索结果进行后续处理,更进一步地缩短了用户网页搜索的时间,减少了用户访问流量,提高了用户获取信息的效率,并提升了用户的搜索浏览体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于确定目标页面所对应的页面描述信息的设备示意图;
图2示出根据本发明一个优选实施例的用于确定目标页面所对应的页面描述信息的设备示意图;
图3示出根据本发明另一个方面的用于确定目标页面所对应的页面描述信息的方法流程图;
图4示出根据本发明一个优选实施例的用于确定目标页面所对应的页面描述信息的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于确定目标页面所对应的页面描述信息的信息确定设备1,其中,信息确定设备1包括分类装置11和确定装置12。具体地,分类装置11确定待处理的目标页面所对应的分类相关信息;确定装置12根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。在此,信息确定设备1包括但不限于网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述信息确定设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,分类装置11首先通过诸如浏览器、搜索引擎等第三方设备提供的应用程序接口(API),获取待处理的目标页面;或者,通过ASP、JSP等动态网页技术,获取用户通过用户设备输入的查询序列,再将该查询序列提交给搜索引擎,并接收搜索引擎所反馈的与该查询序列相对应的搜索结果,以作为待处理的目标页面;或者,通过http、htths等约定通信方式,获取待处理的目标页面;然后,分类装置11确定所述目标页面所对应的分类相关信息。在此,所述分类相关信息包括但不限于以下至少任一项:1)虚拟主题,在此,所述虚拟主题意旨所述目标页面的页面主体内容可反映的访问该目标页面的用户的访问意旨,例如,假设目标页面如“划船比赛作文范文”(http://www.qc99.com/xiaoxue/sinj/101176.Html)的主体内容为一篇划船比赛作文范文,而浏览该页面的用户希望学习作文写作方面的信息,则该目标页面所对应的分类相关信息为虚拟主题如作文;再如,假设目标页面如“鲜花素材下载”(http://sucai.redocn.com/category/260/)的主体内容为鲜花的图片,而浏览该页面的用户希望获取有关鲜花的素材以用于艺术类创作,则该目标页面所对应的分类相关信息为虚拟主题如艺术类素材;2)精确匹配对象,在此,所述精确匹配对象意旨所述目标页面包含了与用户需求完全一致的内容信息,且所述用户需求具有不可替代性,例如,假设目标页面如“北京口腔专家-好大夫在线”(http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?province=beijing)包含了关于疾病“口腔溃疡”的医院及主治医师等相关信息,而浏览该页面的用户希望查询得到关于治疗疾病如“口腔溃疡”并不是其他疾病如“鼻炎”的相关信息的页面,则该目标页面所对应的分类相关信息为精确匹配对象;再如,假设目标页面如“IBM小型机IBMPOWER720”(http://www.xinhuigroup.com/Product/10026/11479.html)包含了关于IBM小型机IBM POWER720的产品简介、规格参数等信息,而浏览该页面的用户希望查询得到关于IBM小型机IBMPOWER720而不是其他型号产品如“IBM POWER 550”相关信息的页面,则该目标页面所对应的分类相关信息为精确匹配对象;3)广义匹配对象,在此,所述广义匹配对象意旨所述目标页面的内容信息与用户需求具有相关性,例如,假设目标页面如“iphone5粉色且背面具有心形图案的外壳保护套”(http://www.vipshop.com/show-0-48369-0.html?),而浏览该页面的用户还可能对iphone5设备的其他配件如“苹果数据线”及与“iohone5”属于同类产品如智能机的其他品牌如“nokia”智能机等感兴趣,则该目标页面所对应的分类相关信息为广义匹配对象;4)失配对象,在此,所述失配对象意旨所述目标页面的内容信息不适宜包含供用户获取处该目标页面的内容信息之外的呈现信息,例如,用户浏览新闻报导如“专家称奥巴马对华亦敌亦友将深化重返亚太战略”(http://news.sina.com.cn/w/sd/2012-11-08/021925532469.shtml)时,除关注该新闻的内容报导之外,不会再关注该页面中的其他内容信息,则该页面所对应的分类相关信息为失配对象如新闻报导。本领域技术人员应能理解上述分类相关信息仅为举例,其他现有的或今后可能出现的分类相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,用户在浏览器地址栏中输入网址http://news.sina.com.cn/,按Enter键,分类装置11通过诸如新闻网站等第三方设备提供的应用程序接口(API)获取到与该网址http://news.sina.com.cn/相对应的网页。再如,用户通过其用户设备如PC机在搜索栏中输入关键词“iphone配件”,点击搜索按钮,则分类装置11通过JSP或ASP等动态网页技术,从该用户设备获取到该用户输入的查询序列,并基于该查询序列向搜索引擎提交搜索请求,通过搜索引擎提供的应用程序接口(API)获取搜索引擎根据关键词“iphone配件”匹配查询得到的与关键词“iphone配件”相匹配的一个或多个搜索结果,如“iphone配件【行情价格评价正品行货】”、“iphone配件Apple Store(中国)”等,作为待处理的目标页面。
本领域技术人员应能理解上述获取待处理的目标页面的方式仅为举例,其他现有的或今后可能出现的获取待处理的目标页面的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,分类装置11确定待处理的目标页面所对应的分类相关信息,在此,分类装置11确定所述目标页面所对应的分类相关信息的方式包括但不限于以下至少任一项:
1)根据所述目标页面的页面主题内容,确定所述目标页面所对应的分类相关信息。具体地,分类装置11首先通过诸如页面HTML标签分析方法,提取所述目标页面的页面主体内容,或者,根据VIPS(Vision-based Page Segmentation,基于视觉的页面分段)算法,利用网页前景颜色、背景颜色、字体颜色和大小、边框、逻辑块和逻辑块之间的间距、元素位置等视觉特征,对所述目标页面进行分块处理,以获得所述目标页面的主体内容分块;然后,分类装置11根据所述目标页面的页面主体内容,确定所述目标页面所对应的分类相关信息。例如,假设分类装置11首先获取到的所述目标页面为新闻报导如“专家称奥巴马对华亦敌亦友将深化重返亚太战略”(http://news.sina.com.cn/w/sd/2012-11-08/021925532469.shtml),则分类装置11通过诸如页面HTML标签分析方法,提取到该目标页面的页面主体内容为“奥巴马对华亦敌亦友将深化重返亚太战略”的新闻报导,则分类装置11确定该目标页面所对应的分类相关信息为失配对象。再如,假设分类装置11首先获取到的所述目标页面为关于治疗疾病如“口腔溃疡”相关信息的页面“北京口腔专家-好大夫在线”(http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?province=beijing),该目标页面包含了与用户需求完全一致的内容信息,则分类装置11确定该目标页面所对应的分类相关信息为精确匹配对象。
2)根据访问所述目标页面的用户的页面访问记录信息,确定所述目标页面所对应的分类相关信息。例如,用户user正在浏览页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?),而该用户user还对iphone5设备的其他配件如“苹果数据线”及与“iohone5”属于同类产品如智能机的其他品牌如“nokia”智能机等感兴趣,则分类装置11确定该目标页面所对应的分类相关信息为广义匹配对象。
本领域技术人员应能理解上述确定所述分类相关信息的方式仅为举例,其他现有的或今后可能出现的确定所述分类相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
确定装置12根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。在此,所述候选描述信息包括但不限于如所述目标页面主体内容信息的描述、所述目标页面所对应的所述分类相关信息的描述。具体地,确定装置12首先通过诸如对所述目标页面的页面内容进行词频统计,或者,调用所述目标页面所属的第三方网站所提供的页面候选描述信息应用程序接口(API),获得所述目标页面所对应的候选描述信息;然后,确定装置12根据分类装置确定的所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。本领域技术人员应能理解上述候选描述信息仅为举例,其他现有的或今后可能出现的候选描述信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,所述相应调整处理操作包括以下至少任一项:
-当所述分类相关信息包括所述虚拟主题,根据所述候选描述信息在虚拟主题数据库中进行匹配查询,以将对应的匹配查询结果作为所述页面描述信息;
-当所述分类相关信息包括所述精确匹配对象,将所述候选描述信息作为所述页面描述信息;
-当所述分类相关信息包括所述广义匹配对象,根据所述候选描述信息在广义对象数据库中进行匹配查询,以将所述候选描述信息及其对应的匹配查询结果作为所述页面描述信息;
-当所述分类相关信息包括所述失配对象,将所述候选描述信息清空,以作为所述页面描述信息。
例如,假设分类装置11确定待处理的目标页面如“划船比赛作文范文”(http://www.qc99.com/xiaoxue/sinj/101176.Html)所对应的所述分类相关信息为所述虚拟主题,而确定装置12首先调用该目标页面http://www.qc99.com/xiaoxue/sinj/101176.Html所属的第三方网站qc99所提供的页面候选描述信息应用程序接口(API),获得该目标页面http://www.qc99.com/xiaoxue/sinj/101176.Html的所述候选描述信息包括“划船比赛作文范文”内容等,则确定装置12根据该候选描述信息在虚拟主题数据库中进行匹配查询,得到匹配查询结果如“页面主体内容:划船比赛作文范文-对应分类相关信息:虚拟主题(作文)”,然后该匹配查询结果作为所述页面描述信息,在此,所述虚拟主题数据库存储有多个虚拟主题,其可位于信息确定设备1中,还可位于与信息确定设备1通过网络相连的服务器中;再如,假设分类装置11确定待处理的目标页面如关于治疗疾病如“口腔溃疡”相关信息的页面“北京口腔专家-好大夫在线”(http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?province=beijing)的所述分类相关信息为精确匹配对象,而确定装置12首先对该目标页面的页面内容进行词频统计,获得该目标页面http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?province=beijing的所述候选描述信息包括“疾病“口腔溃疡”治疗-对应分类相关信息:精确匹配对象”等,则确定装置12将该候选描述信息作为所述页面描述信息;又如,假设分类装置11确定待处理的目标页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)的所述分类相关信息为广义匹配对象,而确定装置12首先对该目标页面http://www.vipshop.com/show-0-48369-0.html?的页面内容进行词频统计,获得该目标页面http://www.vipshop.com/show-0-48369-0.html?的所述候选描述信息包括“数码配件专场”等,则确定装置12根据该候选描述信息在广义对象数据库中进行匹配查询,获得匹配查询结果如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”等,将该候选描述信息及其对应的匹配查询结果作为所述页面描述信息,在此,所述广义对象数据库包括广义对象的分类集合,每一广义对象可再次细化分类,其可位于信息确定设备1中,还可位于与信息确定设备1通过网络相连的服务器中;还如,假设分类装置11确定待处理的目标页面为新闻报导如“专家称奥巴马对华亦敌亦友将深化重返亚太战略”(http://news.sina.com.cn/w/sd/2012-11-08/021925532469.shtml)的所述分类相关信息为失配对象,而确定装置12首先首先调用该目标页面所属的第三方网站sina所提供的页面候选描述信息应用程序接口(API),获得该目标页面的所述候选描述信息包括“新闻报道-对应分类相关信息:失配对象”,则确定装置12将该候选描述信息清空,以作为所述页面描述信息,即该目标页面所对应的页面描述信息为空缺。
本领域技术人员应能理解上述对所述目标页面所对应的候选描述信息进行相应调整处理的方式仅为举例,其他现有的或今后可能出现的对所述目标页面所对应的候选描述信息进行相应调整处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述获得所述目标页面所对应的页面描述信息的方式仅为举例,其他现有的或今后可能出现的获得所述目标页面所对应的页面描述信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
信息确定设备1的各个装置之间是持续不断工作的。具体地,分类装置11持续确定待处理的目标页面所对应的分类相关信息;确定装置12持续根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。在此,本领域技术人员应当理解“持续”是指信息确定设备1的各装置分别不断地进行分类相关信息的确定及页面描述信息的获取,直至信息确定设备1在较长时间内停止分类相关信息的确定。
优选地,信息确定设备1还包括模型建立装置(未示出),具体地,模型建立装置根据经标注分类信息的多个训练页面,进行机器学习处理,以获得用于页面分类的页面分类模型;其中,分类装置11根据所述页面分类模型,基于所述目标页面的页面相关信息,确定所述分类相关信息。
具体地,模型建立装置根据经标注分类信息的多个训练页面,进行机器学习处理,以获得用于页面分类的页面分类模型。例如,假设经标注分类信息的多个训练页面如下:
I:划船比赛作文范文
http://www.qc99.com/xiaoxue/sinj/101176.Html,虚拟主题
II:sina/读书/小说馆/世界名著/《基督山伯爵》
http://vip.book.sina.com.cn/book/index_81300.html,虚拟主题
III:北京口腔专家-好大夫在线
http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?
province=beijing,精确匹配对象
IV:sina体育新闻http://sports.sina.com.cn/,失配对象
V:sina财经新闻http://finance.sina.com.cn/,失配对象
VI:唯品网数码配件
http://www.vipshop.com/show-0-48369-0.html?,广义匹配对象
VII:当当网个护产品http://cosmetic.dangdang.com/,广义匹配对象则模型建立装置根据该经标注分类信息的多个训练页面,进行机器学习处理,如对所述训练集进行线性回归分析、或者对所述训练集进行非线性回归分析等方式,获得用于页面分类的页面分类模型如决策树,该决策树的每一节点对应于每一页面分类,其中,所述页面分类包括多个所述训练页面,如页面分类如虚拟主题分类包括页面I与II、精确匹配对象分类包括页面III、失配对象分类包括页面IV与V、广义匹配对象分类包括页面VI和VII。
接着,分类装置11根据所述页面分类模型,基于所述目标页面的页面相关信息,确定所述分类相关信息。在此,所述页面相关信息包括但不限于如页面主体内容类别、页面结构特征等。例如,假设分类装置11首先获取的待处理的目标页面为“划船比赛作文范文”http://www.qc99.com/xiaoxue/sinj/101176.Html,则分类装置11可根据模型建立装置获得的所述页面分类模型,基于该目标页面的页面相关信息如页面主体内容信息,将该目标页面的页面主体内容类别与所述页面分类模型中每一页面分类所包括的训练页面的页面主体内容类别相比较,如假设确定该目标页面的页面主体内容类别为作文类型,与虚拟主题的页面分类所包括的训练页面的页面内容类别相一致,则分类装置11确定该目标页面的所述分类相关信息为虚拟主题。
优选地,信息确定设备1还包括搜索处理装置(未示出),具体地,搜索处理装置首先获取与查询序列相对应的一个或多个搜索结果;然后,根据所述搜索结果所对应页面的页面描述信息与所述查询序列的匹配度信息,对所述一个或多个搜索结果进行后续处理;接着,将经后续处理的所述一个或多个搜索结果中至少一个提供给所述查询序列所对应的应用。
具体地,搜索处理装置首先通过ASP、JSP等动态页面技术,获取用户通过用户设备在搜索引擎搜索栏中输入查询序列的移动查询请求,然后再将该查询序列提及至搜索引擎,并接收搜索引擎所反馈的与该查询序列相对应的一个或多个搜索结果,以获取与查询序列相对应的一个或多个搜索结果,例如,假设用户user运用其PC机在搜索引擎搜索栏中输入关键词“iphone保护外壳配件”,然后点击搜索按钮,则搜索处理装置通过ASP、JSP等动态页面技术,便可获取到用户user输入的查询序列,然后基于该查询序列向搜索引擎提交页面搜索请求,并接收搜索引擎所反馈的与该查询序列“iphone保护外壳配件”相对应的一个或多个搜索结果如搜索结果A“首页-米多多苹果数码配件正品折扣店”、搜索结果B“...3C苹果配件iphone外壳手机套批发零售保护壳”、搜索结果C“独一无二的保护壳iphone4s配件推荐手机科技时代新浪网”等。
本领域技术人员应能理解上述获取与查询序列相对应的一个或多个搜索结果的方式仅为举例,其他现有的或今后可能出现的获取与查询序列相对应的一个或多个搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后,搜索处理装置根据所述搜索结果所对应页面的页面描述信息与所述查询序列的匹配度信息,对所述一个或多个搜索结果进行后续处理。具体地,搜索处理装置首先对所述搜索结果所对应的页面描述信息进行语义分析,根据所述查询序列所对应的词语在所述搜索结果所对应的页面描述信息所包括的总词语中所占的比例,确定所述搜索结果所对应的页面描述信息与所述查询序列的匹配度信息,如当比例大于0.95时,确定所述匹配度信息为高度匹配,若比例介于0.95与0.7之间时,确定所述匹配度信息为中度匹配,若比例小于0.7时,确定所述匹配度信息为低度匹配;然后,搜索处理装置再根据该匹配度信息,对所述一个或多个搜索结果进行后续处理,如对所述一个或多个搜索结果之间的顺序进行调整、对所述一个或多个搜索结果进行筛选。例如,接上例,假设搜索结果A所对应页面的页面描述信息与查询序列“iphone保护外壳配件”的匹配度高于搜索结果B所对应页面的页面描述信息与该查询序列“iphone保护外壳配件”的匹配度,搜索结果B所对应页面的页面描述信息与查询序列“iphone保护外壳配件”的匹配度高于搜索结果C所对应页面的页面描述信息与该查询序列“iphone保护外壳配件”的匹配度,则搜索处理装置根据所述匹配度信息,确定搜索结果A、搜索结果B及搜索结果C的排列顺序为A、B、C,即用户user得到与查询序列“iphone保护外壳配件”相对应的搜索结果时,搜索结果A位于搜索结果B之前,搜索结果B位于搜索结果C之前;再如,搜索处理装置还可根据所述匹配度信息,对搜索结果A、B、C进行筛选,如过滤搜索结果,将匹配度低的搜索结果C不提供给用户。
本领域技术人员应能理解上述对所述一个或多个搜索结果进行后续处理的方式仅为举例,其他现有的或今后可能出现的对所述一个或多个搜索结果进行后续处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,搜索处理装置通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将经后续处理的所述一个或多个搜索结果中至少一个提供给所述查询序列所对应的应用,以供应用将处理后的所述搜索结果提供给所述查询序列所对应的用户。在此,所述应用包括但不限于如搜索引擎、浏览器等。例如,接上例,搜索处理装置将后其进行后续处理后的搜索结果A、B和C按照匹配度信息顺序A、B、C提供给用户user,供用户浏览,或者,将页面搜索结果A、B和C中页面匹配度信息小于预定阈值的页面搜索结果不提供给用户user。
图2示出根据本发明一个优选实施例的用于确定目标页面所对应的页面描述信息的设备示意图,信息确定装置1包括分类装置11’、确定装置12’和匹配装置13’。具体地,分类装置11’确定待处理的目标页面所对应的分类相关信息;确定装置12’根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息;匹配装置13’根据所述页面描述信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配。在此,分类装置11’和确定装置12’分别与图1所示对应装置相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,匹配装置13’根据所述页面描述信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配。在此,所述呈现信息包括但不限于如待显示于页面中以一定载体如链接、文本、图片、视频、动画等,用于向用户传递信息的内容,其包括但不限于如与所述页面描述信息页面描述信息的内容信息、与所述页面描述信息相对应的页面样式信息等。具体地,匹配装置13’根据所述页面描述信息,通过在呈现信息数据库中查询所述描述信息所对应的呈现信息,来确定与所述页面描述信息相对应的呈现信息;或者,通过在呈现信息数据库中查询所述页面描述信息所对应的目标页面的呈现用户或该呈现用户的相关用户的资源配置内容信息,来确定与所述页面描述信息相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配。在此,所述呈现信息数据库可位于信息确定设备1中,也可位于与信息确定设备1通过网络相连的数据库中。
例如,假设分类装置11’确定待处理的目标页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)的所述分类相关信息为广义匹配对象,而确定装置12’确定的该目标页面http://www.vipshop.com/show-0-48369-0.html?的所述页面描述信息包括“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”等,则匹配装置13’可将该页面描述信息,作为与该目标页面http://www.vipshop.com/show-0-48369-0.html?相对应的呈现信息;再如,接上例,匹配装置13’可将所述页面描述信息“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”的内容信息,及该页面描述信息对应的呈现用户的其他资源配置内容信息如“iphone售货信息”等内容作为所述呈现信息。
本领域技术人员应能理解上述确定与所述目标页面相对应的呈现信息的方式仅为举例,其他现有的或今后可能出现的确定与所述目标页面相对应的呈现信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,信息确定设备1还包括敏感度装置(未示出),具体地,敏感度装置确定所述目标页面的内容敏感度信息;其中,匹配装置13’根据所述页面描述信息,并结合所述内容敏感度信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。
具体地,敏感度装置通过诸如解析所述目标页面的HTML源码,得到所述目标页面的页面内容信息,在该页面内容信息中通过查询预定内容敏感度信息,以确定所述目标页面的内容敏感度信息。在此,所述内容敏感信息包括但不限于如只适合某特定群体浏览的内容如成人信息等、如关于造成死亡、疾病、伤害、损坏或者其他损失等意外情况的相关内容信息等。例如,假设分类装置11’获取的待处理的所述目标页面为“香奈儿5号面临被欧盟禁售”(http://news.163.com/12/1109/05/8FRIGU8300014AED.html)的新闻报导,则敏感度装置通过解析该页面的HTML源码,发现该页面的页面内容信息中包括词语如“禁售”、“过敏”等,即确定该目标页面的内容敏感度信息为“禁售”、“过敏”。
本领域技术人员应能理解上述内容敏感度信息仅为举例,其他现有的或今后可能出现的内容敏感度信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述确定所述敏感度信息的方式仅为举例,其他现有的或今后可能出现的确定所述敏感度信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,匹配装置13’根据所述页面描述信息,并结合所述内容敏感度信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。例如,接上例,假设确定装置12’确定目标页面“香奈儿5号面临被欧盟禁售”(http://news.163.com/12/1109/05/8FRIGU8300014AED.html)的所述页面描述信息为空缺,即该目标页面的所述分类相关信息为失配对象,则匹配装置13’根据该页面描述信息,并结合内容敏感度信息“禁售”、“过敏”,确定的与该目标页面相对应的呈现信息为不适合在该页面提供呈现信息,或者,所述呈现信息为其它品牌香水,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。再如,假设确定装置12’确定目标页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)的所述页面描述信息为“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,而敏感度确定装置确定该目标页面的所述内容敏感度信息为包括只适合某特定群体浏览的内容如成人信息,则匹配装置13’根据该页面描述信息,并结合所述内容敏感度信息,确定与该目标页面相对应的呈现信息包括该页面描述信息但声明禁止儿童浏览该页面的信息,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。
本领域技术人员应能理解上述结合内容敏感度信息确定所述呈现信息的方式仅为举例,其他现有的或今后可能出现的确结合内容敏感度信息确定所述呈现信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一个优选实施例中(参考图2),信息确定设备1包括分类装置11’、确定装置12’、匹配装置13’、生成装置(未示出)和提供装置(未示出),其中,分类装置11’包括获取单元111’(未示出)和分类单元112’(未示出)。以下参考图2对该优选实施例进行描述:具体地,获取单元111’获取用户所访问的访问页面,以作为所述目标页面;分类单元112’确定所述目标页面所对应的分类相关信息;确定装置12’根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息;匹配装置13’根据所述页面描述信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配;生成装置根据所述呈现信息,对所述目标页面进行更新处理,以生成对应的结果页面,其中,所述结果页面包括所述呈现信息;提供装置将所述结果页面提供给所述用户。在此,确定装置12’与图1所示对应装置相同或相似,匹配装置13’与图2所示对应装置相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,获取单元111’首先获取用户的页面访问请求,将页面访问请求所对应的页面作为所述目标页面;或者,通过诸如浏览器、搜索引擎等第三方设备提供的应用程序接口(API),获取用户所访问的访问页面,以作为所述目标页面。例如,用户user在浏览器地址栏中输入http://news.sina.com.cn/,按enter键,则获取单元111’通过浏览器提供的应用程序接口(API),便获取到用户user的页面访问请求;然后,获取单元111’根据该页面URL,向页面服务器发送相应页面访问请求,通过页面服务器返回的相应HTML响应,获取与该页面访问请求相对应的页面http://news.sina.com.cn/,将页面http://news.sina.com.cn/作为所述目标页面。再如,假设用户user在搜索引擎搜索栏中输入关键词“iphone保护外壳配件”,然后点击搜索按钮,则获取单元111’通过搜索引擎提供的应用程序接口(API),便获取到用户user的页面访问请求,然后获取单元111’基于该查询序列向搜索引擎提交页面搜索请求,并接收搜索引擎所反馈的与该查询序列“iphone保护外壳配件”相对应的一个或多个搜索结果如搜索结果A“首页-米多多苹果数码配件正品折扣店”、搜索结果B“...3C苹果配件iphone外壳手机套批发零售保护壳”、搜索结果C“独一无二的保护壳iphone4s配件推荐手机科技时代新浪网”等,则获取单元111’将包括该等搜索结果的搜索结果页作为所述目标页面。
分类单元112’确定所述目标页面所对应的分类相关信息。在此,分类单元112’确定所述目标页面所对应的分类相关信息的方式与图1中分类装置11确定所述目标页面所对应的分类相关信息的方式相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
优选地,分类单元112’还可结合所述用户的用户操作信息,确定所述目标页面所对应的分类相关信息;
其中,所述用户操作信息包括以下至少任一项:
-所述用户关于所述访问页面的页面访问会话信息;
-所述用户的页面访问记录信息;
-所述访问页面所对应的页面搜索记录。
例如,当所述用户操作信息包括所述用户关于所述访问页面的页面访问会话信息时,在此,所述页面访问会话信息包括但不限于如同一个用户对访问页面的连续访问操作。假设用户user在搜索结果如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)所对应的页面的浏览过程中,还查询得到其需求的其他信息如配件“苹果数据线白色”,则分类单元112’确定该目标页面所对应的分类相关信息为广义匹配对象;再如,当所述用户操作信息包括所述用户的页面访问记录信息时,假设获取单元111’获取到用户user提交的访问页面如“划船比赛作文范文”(http://www.qc99.com/xiaoxue/sinj/101176.Html)的页面访问请求,而用户user经常访问如关于如何写作的页面,则分类单元112’确定访问页面如(“划船比赛作文范文”http://www.qc99.com/xiaoxue/sinj/101176.Html)所对应的分类相关信息为虚拟主题如写作。
本领域技术人员能理解上述结合用户的用户操作信息确定所述分类相关信息的方式仅为举例,其他现有的或今后可能出现的结合用户的用户操作信息确定所述分类相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
生成装置根据所述呈现信息,对所述目标页面进行更新处理,如将与所述呈现信息嵌入于所述目标页面中,以生成对应的结果页面,其中,所述结果页面包括所述呈现信息。例如,假设匹配装置13’确定的与目标页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)相对应的呈现信息包括该页面描述信息如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,则生成装置可根据该呈现信息,对该目标页面进行更新处理,如将与所述呈现信息嵌入于该目标页面中,如嵌入于该目标页面的导航分块区域处,其中,所述呈现信息与所述页面描述信息相匹配。
提供装置通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将所述结果页面提供给所述用户。
优选地,信息确定设备1还包括位置确定装置(未示出),具体地,位置确定装置确定所述呈现信息在所述目标页面中所对应的目标位置信息;其中,生成装置根据所述呈现信息,并结合所述目标位置信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面在所述目标位置信息对应处包括所述呈现信息。
具体地,位置确定装置确定所述呈现信息在所述目标页面中所对应的目标位置信息。在此,所述目标位置信息包括将所述呈现信息嵌入于所述目标页面中的哪些位置,如将所述呈现信息嵌入于所述目标页面中用户优选浏览的位置处,或者,将所述待呈现信息嵌入于所述目标页面中的导航分块区域等。在此,位置确定装置确定所述目标位置信息的方式包括但不限于以下至少任一项:
1)根据所述目标页面的页面布局信息,确定目标位置信息,如将目标页面中的空白区域如页面右侧分栏作为所述目标位置信息,将目标页面中容易引起用户注意的区域如搜索页中搜索栏的周围等作为所述目标位置信息。例如,假设获取单元111’获取的待处理的所述目标页面为“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?),而位置确定装置通过诸如HTML标签解析方法、或者根据VIPS(Vision-based PageSegmentation,基于视觉的页面分段)算法,对该目标页面进行解析,得到该目标页面的页面样式信息,如页面布局信息,其中,该目标页面的页面右侧分栏为空白区域,则位置确定装置可将该目标页面中的页面右侧分栏区域作为所述目标位置信息。
2)根据所述目标页面的页面内容信息,将所述目标页面中与所述呈现信息的内容相匹配的内容位置区域作为所述目标位置信息。例如,假设获取单元111’获取的所述目标页面为页面http://www.vipshop.com/show-0-48369-0.html?,匹配装置13’确定的所述呈现信息包括内容如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,位置确定装置通过解析该目标页面,该目标页面中包含多个频道内容如“奢饰品”、“唯品团”、“唯品尚”等,则位置确定装置将该目标页面中与该呈现信息的内容相匹配的内容位置区域作为所述目标位置信息,即将该目标页面中“唯品尚”频道位置区域作为所述待呈现信息的所述目标位置信息。
3)根据所述目标页面的页面相关信息,并结合所述用户的页面访问记录信息,确定所述呈现信息在所述目标页面中所对应的目标位置信息。例如,假设获取单元111’获取的待处理的所述目标页面为页面http://www.vipshop.com/show-0-48369-0.html?,匹配装置13’确定的所述呈现信息包括内容如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,假设用户user经常点击该目标页面http://www.vipshop.com/show-0-48369-0.html?中的页面顶部区域内容链接,则位置确定装置结合用户user的页面访问记录信息,将用户user经常访问该目标页面http://www.vipshop.com/show-0-48369-0.html?中的内容在该目标页面中的位置信息如页面顶部区域作为所述呈现信息在该目标页面中所对应的目标位置信息。
本领域技术人员能理解上述确定所述目标位置信息的方式仅为举例,其他现有的或今后可能出现的确定所述目标位置信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
接着,生成装置根据所述呈现信息,并结合所述目标位置信息,对所述目标页面进行更新处理,如将与所述呈现信息嵌入于所述目标页面的所述目标位置信息处,以生成对应的所述结果页面,其中,所述结果页面在所述目标位置信息对应处包括所述呈现信息。例如,接上例,假设位置确定装置确定的呈现信息“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”在目标页面http://www.vipshop.com/show-0-48369-0.html?中的目标位置信息为页面右侧右上区域,则生成装置将其确定的与该呈现信息嵌入于该目标页面的所述目标位置信息处,以生成对应的所述结果页面。
优选地,信息确定设备1还包括样式确定装置(未示出),具体地,样式确定装置确定所述呈现信息在所述目标页面中所对应的目标样式信息;其中,生成装置根据所述呈现信息,并结合所述目标样式信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面包括与所述目标样式信息相对应的所述呈现信息。
具体地,样式确定装置确定所述呈现信息在所述目标页面中所对应的目标样式信息,在此,样式确定装置确定所述呈现信息在所述目标页面中所对应的目标样式信息的方式包括但不限于以下至少任一项:
1)根据所述目标页面的样式相关信息,确定所述呈现信息在所述目标页面中所对应的目标样式信息。具体地,样式确定装置首先确定所述目标页面的样式相关信息;然后,再根据所述目标页面的样式相关信息,从该样式相关信息中抽取出一条或多条样式设置信息来作为所述呈现信息的目标样式信息,或者,直接将所述目标页面的样式相关信息作为所述呈现信息的目标样式信息。例如,假设获取单元111’获取到的所述目标页面“唯品会品牌时尚折扣店”http://www.vipshop.com/show-0-48369-0.html?,而匹配装置13’确定的所述呈现信息包括内容如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,则样式确定装置首先可通过诸如基于HTML标签分析方法、或者根据VIPS(Vision-based Page Segmentation,基于视觉的页面分段)算法等,对所述目标页面进行解析,得到所述目标页面的样式相关信息包括页面顶部导航块、面包屑导航、正文区域块、页面左边栏内容块、页面右边栏提供信息链接块及页面底部内容块等页面分块特征,页面中的字体颜色为灰色、页面色调为粉色等页面样式设置等;然后,样式确定装置可根据所述目标页面的样式相关信息,来确定所述呈现信息的目标样式信息,如将所述呈现信息的页面色调、字体颜色等设置为与该初始搜索结果页面的页面色调、字体颜色等一致,即页面色调设置为粉色、字体颜色设置为灰色。
2)根据所述呈现信息的应用分类信息,在页面样式数据库中进行匹配查询,以获得与所述应用分类信息相对应的页面样式信息,以作为所述目标样式信息,其中,所述页面样式数据库包括应用分类与页面样式的映射关系。在此,所述应用分类信息包括但不限于所述第一页面访问请求所对应页面的行业分类,如食品、环保、新闻、化妆品、鲜花、汽车、小说等。例如,例如,假设所述呈现信息的应用分类信息的应用分类信息属于食品行业,则样式确定装置在访问页面样式数据库中进行匹配查询,获得与所述应用分类信息相对应的页面样式信息包括面包屑导航、正文摘要区域块、页面背景为绿色、页面字体颜色为黑色等;再如,假设所述呈现信息的应用分类信息的应用分类信息属于化妆品行业,则样式确定装置在访问页面样式数据库中进行匹配查询,获得与所述应用分类信息相对应的页面样式信息包括面包屑导航、正文摘要区域块、页面背景为暖色调如粉色等、页面字体颜色为白色等。在此,所述页面样式数据库既可位于信息确定设备1中,还可位于与信息确定设备1通过网络相连的服务器中。
本领域技术人员能理解上述确定所述呈现信息在所述目标页面中所对应的目标样式信息的方式仅为举例,其他现有的或今后可能出现的确定所述呈现信息在所述目标页面中所对应的目标样式信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
接着,生成装置根据所述呈现信息,并结合所述目标样式信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面包括与所述目标样式信息相对应的所述呈现信息。例如,接上例,假设样式确定装置确定的呈现信息“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”在目标页面http://www.vipshop.com/show-0-48369-0.html?中所对应的目标样式信息包括面包屑导航、正文摘要区域块、页面背景为暖色调如粉色等、页面字体颜色为白色等,则生成装置将该呈现信息以该目标样式信息的显示形式嵌入于该目标页面中,以生成对应的所述结果页面,其中,所述结果页面包括与所述目标样式信息相对应的所述呈现信息。
本领域技术人员能理解上述结合目标样式信息生成结果页面的方式仅为举例,其他现有的或今后可能出现的结合目标样式信息生成结果页面的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
图3示出根据本发明另一个方面的用于确定目标页面所对应的页面描述信息的方法流程图。
具体地,在步骤S1中,信息确定设备1确定待处理的目标页面所对应的分类相关信息;在步骤S2中,信息确定设备1根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。在此,信息确定设备1包括但不限于网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述信息确定设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,在步骤S1中,信息确定设备1首先通过诸如浏览器、搜索引擎等第三方设备提供的应用程序接口(API),获取待处理的目标页面;或者,通过ASP、JSP等动态网页技术,获取用户通过用户设备输入的查询序列,再将该查询序列提交给搜索引擎,并接收搜索引擎所反馈的与该查询序列相对应的搜索结果,以作为待处理的目标页面;或者,通过http、https等约定通信方式,获取待处理的目标页面;然后,在步骤S1中,信息确定设备1确定所述目标页面所对应的分类相关信息。在此,所述分类相关信息包括但不限于以下至少任一项:1)虚拟主题,在此,所述虚拟主题意旨所述目标页面的页面主体内容可反映的访问该目标页面的用户的访问意旨,例如,假设目标页面如“划船比赛作文范文”(http://www.qc99.com/xiaoxue/sinj/101176.Html)的主体内容为一篇划船比赛作文范文,而浏览该页面的用户希望学习作文写作方面的信息,则该目标页面所对应的分类相关信息为虚拟主题如作文;再如,假设目标页面如“鲜花素材下载”(http://sucai.redocn.com/category/260/)的主体内容为鲜花的图片,而浏览该页面的用户希望获取有关鲜花的素材以用于艺术类创作,则该目标页面所对应的分类相关信息为虚拟主题如艺术类素材;2)精确匹配对象,在此,所述精确匹配对象意旨所述目标页面包含了与用户需求完全一致的内容信息,且所述用户需求具有不可替代性,例如,假设目标页面如“北京口腔专家-好大夫在线”(http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?province=beijing)包含了关于疾病“口腔溃疡”的医院及主治医师等相关信息,而浏览该页面的用户希望查询得到关于治疗疾病如“口腔溃疡”并不是其他疾病如“鼻炎”的相关信息的页面,则该目标页面所对应的分类相关信息为精确匹配对象;再如,假设目标页面如“IBM小型机IBMPOWER720”(http://www.xinhuigroup.com/Product/10026/11479.html)包含了关于IBM小型机IBM POWER720的产品简介、规格参数等信息,而浏览该页面的用户希望查询得到关于IBM小型机IBMPOWER720而不是其他型号产品如“IBM POWER 550”相关信息的页面,则该目标页面所对应的分类相关信息为精确匹配对象;3)广义匹配对象,在此,所述广义匹配对象意旨所述目标页面的内容信息与用户需求具有相关性,例如,假设目标页面如“iphone5粉色且背面具有心形图案的外壳保护套”(http://www.vipshop.com/show-0-48369-0.html?),而浏览该页面的用户还可能对iphone5设备的其他配件如“苹果数据线”及与“iohone5”属于同类产品如智能机的其他品牌如“nokia”智能机等感兴趣,则该目标页面所对应的分类相关信息为广义匹配对象;4)失配对象,在此,所述失配对象意旨所述目标页面的内容信息不适宜包含供用户获取处该目标页面的内容信息之外的呈现信息,例如,用户浏览新闻报导如“专家称奥巴马对华亦敌亦友将深化重返亚太战略”(http://news.sina.com.cn/w/sd/2012-11-08/021925532469.shtml)时,除关注该新闻的内容报导之外,不会再关注该页面中的其他内容信息,则该页面所对应的分类相关信息为失配对象如新闻报导。本领域技术人员应能理解上述分类相关信息仅为举例,其他现有的或今后可能出现的分类相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,用户在浏览器地址栏中输入网址http://news.sina.com.cn/,按Enter键,在步骤S1中,信息确定设备1通过诸如新闻网站等第三方设备提供的应用程序接口(API)获取到与该网址http://news.sina.com.cn/相对应的网页。再如,用户通过其用户设备如PC机在搜索栏中输入关键词“iphone配件”,点击搜索按钮,则分类装置11通过JSP或ASP等动态网页技术,从该用户设备获取到该用户输入的查询序列,并基于该查询序列向搜索引擎提交搜索请求,通过搜索引擎提供的应用程序接口(API)获取搜索引擎根据关键词“iphone配件”匹配查询得到的与关键词“iphone配件”相匹配的一个或多个搜索结果,如“iphone配件【行情价格评价正品行货】”、“iphone配件Apple Store(中国)”等,作为待处理的目标页面。
本领域技术人员应能理解上述获取待处理的目标页面的方式仅为举例,其他现有的或今后可能出现的获取待处理的目标页面的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S1中,信息确定设备1确定待处理的目标页面所对应的分类相关信息,在此,在步骤S1中,信息确定设备1确定所述目标页面所对应的分类相关信息的方式包括但不限于以下至少任一项:
1)根据所述目标页面的页面主题内容,确定所述目标页面所对应的分类相关信息。具体地,在步骤S1中,信息确定设备1首先通过诸如页面HTML标签分析方法,提取所述目标页面的页面主体内容,或者,根据VIPS(Vision-based Page Segmentation,基于视觉的页面分段)算法,利用网页前景颜色、背景颜色、字体颜色和大小、边框、逻辑块和逻辑块之间的间距、元素位置等视觉特征,对所述目标页面进行分块处理,以获得所述目标页面的主体内容分块;然后,在步骤S 1中,信息确定设备1根据所述目标页面的页面主体内容,确定所述目标页面所对应的分类相关信息。例如,假设在步骤S1中,信息确定设备1首先获取到的所述目标页面为新闻报导如“专家称奥巴马对华亦敌亦友将深化重返亚太战略”(http://news.sina.com.cn/w/sd/2012-11-08/021925532469.shtml),则在步骤S1中,信息确定设备1通过诸如页面HTML标签分析方法,提取到该目标页面的页面主体内容为“奥巴马对华亦敌亦友将深化重返亚太战略”的新闻报导,则在步骤S1中,信息确定设备1确定该目标页面所对应的分类相关信息为失配对象。再如,假设在步骤S1中,信息确定设备1首先获取到的所述目标页面关于治疗疾病如“口腔溃疡”相关信息的页面“北京口腔专家-好大夫在线”(http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?province=beijing),该目标页面包含了与用户需求完全一致的内容信息,则在步骤S1中,信息确定设备1确定该目标页面所对应的分类相关信息为精确匹配对象。
2)根据访问所述目标页面的用户的页面访问记录信息,确定所述目标页面所对应的分类相关信息。例如,用户user正在浏览页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?),而该用户user还对iphone5设备的其他配件如“苹果数据线”及与“iohone5”属于同类产品如智能机的其他品牌如“nokia”智能机等感兴趣,则在步骤S1中,信息确定设备1确定该目标页面所对应的分类相关信息为广义匹配对象。
本领域技术人员应能理解上述确定所述分类相关信息的方式仅为举例,其他现有的或今后可能出现的确定所述分类相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S2中,信息确定设备1根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。在此,所述候选描述信息包括但不限于如所述目标页面主体内容信息的描述、所述目标页面所对应的所述分类相关信息的描述。具体地,在步骤S2中,信息确定设备1首先通过诸如对所述目标页面的页面内容进行词频统计,或者,调用所述目标页面所属的第三方网站所提供的页面候选描述信息应用程序接口(API),获得所述目标页面所对应的候选描述信息;然后,在步骤S2中,信息确定设备1根据分类装置确定的所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。本领域技术人员应能理解上述候选描述信息仅为举例,其他现有的或今后可能出现的候选描述信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,所述相应调整处理操作包括以下至少任一项:
-当所述分类相关信息包括所述虚拟主题,根据所述候选描述信息在虚拟主题数据库中进行匹配查询,以将对应的匹配查询结果作为所述页面描述信息;
-当所述分类相关信息包括所述精确匹配对象,将所述候选描述信息作为所述页面描述信息;
-当所述分类相关信息包括所述广义匹配对象,根据所述候选描述信息在广义对象数据库中进行匹配查询,以将所述候选描述信息及其对应的匹配查询结果作为所述页面描述信息;
-当所述分类相关信息包括所述失配对象,将所述候选描述信息清空,以作为所述页面描述信息。
例如,假设在步骤S1中,信息确定设备1确定待处理的目标页面如“划船比赛作文范文”(http://www.qc99.com/xiaoxue/sinj/101176.Html)所对应的所述分类相关信息为所述虚拟主题,而在步骤S2中,信息确定设备1首先调用该目标页面http://www.qc99.com/xiaoxue/sinj/101176.Html所属的第三方网站qc99所提供的页面候选描述信息应用程序接口(API),获得该目标页面http://www.qc99.com/xiaoxue/sinj/101176.Html的所述候选描述信息包括“划船比赛作文范文”内容等,则在步骤S2中,信息确定设备1根据该候选描述信息在虚拟主题数据库中进行匹配查询,得到匹配查询结果如“页面主体内容:划船比赛作文范文-对应分类相关信息:虚拟主题(作文)”,然后该匹配查询结果作为所述页面描述信息,在此,所述虚拟主题数据库存储有多个虚拟主题,其可位于信息确定设备1中,还可位于与信息确定设备1通过网络相连的服务器中;再如,假设在步骤S 1中,信息确定设备1确定待处理的目标页面如关于治疗疾病如“口腔溃疡”相关信息的页面“北京口腔专家-好大夫在线”(http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?province=beijing)的所述分类相关信息为精确匹配对象,而在步骤S2中,信息确定设备1首先对该目标页面的页面内容进行词频统计,获得该目标页面http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?province=beijing的所述候选描述信息包括“疾病“口腔溃疡”治疗-对应分类相关信息:精确匹配对象”等,则在步骤S2中,信息确定设备1将该候选描述信息作为所述页面描述信息;又如,假设在步骤S 1中,信息确定设备1确定待处理的目标页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)的所述分类相关信息为广义匹配对象,而在步骤S2中,信息确定设备1首先对该目标页面http://www.vipshop.com/show-0-48369-0.html?的页面内容进行词频统计,获得该目标页面http://www.vipshop.com/show-0-48369-0.html?的所述候选描述信息包括“数码配件专场”等,则在步骤S2中,信息确定设备1根据该候选描述信息在广义对象数据库中进行匹配查询,获得匹配查询结果如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”等,将该候选描述信息及其对应的匹配查询结果作为所述页面描述信息,在此,所述广义对象数据库包括广义对象的分类集合,每一广义对象可再次细化分类,其可位于信息确定设备1中,还可位于与信息确定设备1通过网络相连的服务器中;还如,假设在步骤S 1中,信息确定设备1确定待处理的目标页面为新闻报导如“专家称奥巴马对华亦敌亦友将深化重返亚太战略”(http://news.sina.com.cn/w/sd/2012-11-08/021925532469.shtml)的所述分类相关信息为失配对象,而在步骤S2中,信息确定设备1首先首先调用该目标页面所属的第三方网站sina所提供的页面候选描述信息应用程序接口(API),获得该目标页面的所述候选描述信息包括“新闻报道-对应分类相关信息:失配对象”,则在步骤S2中,信息确定设备1将该候选描述信息清空,以作为所述页面描述信息,即该目标页面所对应的页面描述信息为空缺。
本领域技术人员应能理解上述对所述目标页面所对应的候选描述信息进行相应调整处理的方式仅为举例,其他现有的或今后可能出现的对所述目标页面所对应的候选描述信息进行相应调整处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述获得所述目标页面所对应的页面描述信息的方式仅为举例,其他现有的或今后可能出现的获得所述目标页面所对应的页面描述信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
信息确定设备1的各个步骤之间是持续不断工作的。具体地,在步骤S1中,信息确定设备1持续确定待处理的目标页面所对应的分类相关信息;在步骤S2中,信息确定设备1持续根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。在此,本领域技术人员应当理解“持续”是指信息确定设备1的各步骤分别不断地进行分类相关信息的确定及页面描述信息的获取,直至信息确定设备1在较长时间内停止分类相关信息的确定。
优选地,信息确定设备1还包括步骤S4(未示出),具体地,在步骤S4中,信息确定设备1根据经标注分类信息的多个训练页面,进行机器学习处理,以获得用于页面分类的页面分类模型;其中,在步骤S1中,信息确定设备1根据所述页面分类模型,基于所述目标页面的页面相关信息,确定所述分类相关信息。
具体地,在步骤S4中,信息确定设备1根据经标注分类信息的多个训练页面,进行机器学习处理,以获得用于页面分类的页面分类模型。例如,假设经标注分类信息的多个训练页面如下:
I:划船比赛作文范文
http://www.qc99.com/xiaoxue/sinj/101176.Html,虚拟主题
II:sina/读书/小说馆/世界名著/《基督山伯爵》
http://vip.book.sina.com.cn/book/index_81300.html,虚拟主题
III:北京口腔专家-好大夫在线
http://www.haodf.com/jibing/kouqiangkuiyang/daifu.htm?
province=beijing,精确匹配对象
IV:sina体育新闻http://sports.sina.com.cn/,失配对象
V:sina财经新闻http://finance.sina.com.cn/,失配对象
VI:唯品网数码配件
http://www.vipshop.com/show-0-48369-0.html?,广义匹配对象
VII:当当网个护产品http://cosmetic.dangdang.com/,广义匹配对象则在步骤S4中,信息确定设备1根据该经标注分类信息的多个训练页面,进行机器学习处理,如对所述训练集进行线性回归分析、或者对所述训练集进行非线性回归分析等方式,获得用于页面分类的页面分类模型如决策树,该决策树的每一节点对应于每一页面分类,其中,所述页面分类包括多个所述训练页面,如页面分类如虚拟主题分类包括页面I与II、精确匹配对象分类包括页面III、失配对象分类包括页面IV与V、广义匹配对象分类包括页面VI和VII。
接着,在步骤S1中,信息确定设备1根据所述页面分类模型,基于所述目标页面的页面相关信息,确定所述分类相关信息。在此,所述页面相关信息包括但不限于如页面主体内容类别、页面结构特征等。例如,假设在步骤S1中,信息确定设备1首先获取的待处理的目标页面为“划船比赛作文范文”http://www.qc99.com/xiaoxue/sinj/101176.Html,则在步骤S1中,信息确定设备1可根据模型建立装置获得的所述页面分类模型,基于该目标页面的页面相关信息如页面主体内容信息,将该目标页面的页面主体内容类别与所述页面分类模型中每一页面分类所包括的训练页面的页面主体内容类别相比较,如假设确定该目标页面的页面主体内容类别为作文类型,与虚拟主题的页面分类所包括的训练页面的页面内容类别相一致,则在步骤S1中,信息确定设备1确定该目标页面的所述分类相关信息为虚拟主题。
优选地,信息确定设备1还包括步骤S5(未示出),具体地,在步骤S5中,信息确定设备1首先获取与查询序列相对应的一个或多个搜索结果;然后,根据所述搜索结果所对应页面的页面描述信息与所述查询序列的匹配度信息,对所述一个或多个搜索结果进行后续处理;接着,将经后续处理的所述一个或多个搜索结果中至少一个提供给所述查询序列所对应的应用。
具体地,在步骤S5中,信息确定设备1首先通过ASP、JSP等动态页面技术,获取用户通过用户设备在搜索引擎搜索栏中输入查询序列的移动查询请求,然后再将该查询序列提及至搜索引擎,并接收搜索引擎所反馈的与该查询序列相对应的一个或多个搜索结果,以获取与查询序列相对应的一个或多个搜索结果,例如,假设用户user运用其PC机在搜索引擎搜索栏中输入关键词“iphone保护外壳配件”,然后点击搜索按钮,则在步骤S5中,信息确定设备1通过ASP、JSP等动态页面技术,便可获取到用户user输入的查询序列,然后基于该查询序列向搜索引擎提交页面搜索请求,并接收搜索引擎所反馈的与该查询序列“iphone保护外壳配件”相对应的一个或多个搜索结果如搜索结果A“首页-米多多苹果数码配件正品折扣店”、搜索结果B“...3C苹果配件iphone外壳手机套批发零售保护壳”、搜索结果C“独一无二的保护壳iphone4s配件推荐手机科技时代新浪网”等。
本领域技术人员应能理解上述获取与查询序列相对应的一个或多个搜索结果的方式仅为举例,其他现有的或今后可能出现的获取与查询序列相对应的一个或多个搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后,在步骤S5中,信息确定设备1根据所述搜索结果所对应页面的页面描述信息与所述查询序列的匹配度信息,对所述一个或多个搜索结果进行后续处理。具体地,在步骤S5中,信息确定设备1首先对所述搜索结果所对应的页面描述信息进行语义分析,根据所述查询序列所对应的词语在所述搜索结果所对应的页面描述信息所包括的总词语中所占的比例,确定所述搜索结果所对应的页面描述信息与所述查询序列的匹配度信息,如当比例大于0.95时,确定所述匹配度信息为高度匹配,若比例介于0.95与0.7之间时,确定所述匹配度信息为中度匹配,若比例小于0.7时,确定所述匹配度信息为低度匹配;然后,搜索处理装置再根据该匹配度信息,对所述一个或多个搜索结果进行后续处理,如对所述一个或多个搜索结果之间的顺序进行调整、对所述一个或多个搜索结果进行筛选。例如,接上例,假设搜索结果A所对应页面的页面描述信息与查询序列“iphone保护外壳配件”的匹配度高于搜索结果B所对应页面的页面描述信息与该查询序列“iphone保护外壳配件”的匹配度,搜索结果B所对应页面的页面描述信息与查询序列“iphone保护外壳配件”的匹配度高于搜索结果C所对应页面的页面描述信息与该查询序列“iphone保护外壳配件”的匹配度,则在步骤S5中,信息确定设备1根据所述匹配度信息,确定搜索结果A、搜索结果B及搜索结果C的排列顺序为A、B、C,即用户user得到与查询序列“iphone保护外壳配件”相对应的搜索结果时,搜索结果A位于搜索结果B之前,搜索结果B位于搜索结果C之前;再如,在步骤S5中,信息确定设备1还可根据所述匹配度信息,对搜索结果A、B、C进行筛选,如过滤搜索结果,将匹配度低的搜索结果C不提供给用户。
本领域技术人员应能理解上述对所述一个或多个搜索结果进行后续处理的方式仅为举例,其他现有的或今后可能出现的对所述一个或多个搜索结果进行后续处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S5中,信息确定设备1通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将经后续处理的所述一个或多个搜索结果中至少一个提供给所述查询序列所对应的应用,以供应用将处理后的所述搜索结果提供给所述查询序列所对应的用户。在此,所述应用包括但不限于如搜索引擎、浏览器等。例如,接上例,在步骤S5中,信息确定设备1将后其进行后续处理后的搜索结果A、B和C按照匹配度信息顺序A、B、C提供给用户user,供用户浏览,或者,将页面搜索结果A、B和C中页面匹配度信息小于预定阈值的页面搜索结果不提供给用户user。
图4示出根据本发明一个优选实施例的用于确定目标页面所对应的页面描述信息的方法流程图。
具体地,在步骤S1’中,信息确定设备1确定待处理的目标页面所对应的分类相关信息;在步骤S2’中,信息确定设备1根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息;在步骤S3’中,信息确定设备1根据所述页面描述信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配。在此,步骤S1’和步骤S2’分别与图3所示对应步骤相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,在步骤S3’中,信息确定设备1根据所述页面描述信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配。在此,所述呈现信息包括但不限于如待显示于页面中以一定载体如链接、文本、图片、视频、动画等,用于向用户传递信息的内容,其包括但不限于如与所述页面描述信息页面描述信息的内容信息、与所述页面描述信息相对应的页面样式信息等。具体地,在步骤S3’中,信息确定设备1根据所述页面描述信息,通过在呈现信息数据库中查询所述描述信息所对应的呈现信息,来确定与所述页面描述信息相对应的呈现信息;或者,通过在呈现信息数据库中查询所述页面描述信息所对应的目标页面的呈现用户或该呈现用户的相关用户的资源配置内容信息,来确定与所述页面描述信息相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配。在此,所述呈现信息数据库可位于信息确定设备1中,也可位于与信息确定设备1通过网络相连的数据库中。
例如,假设在步骤S1’中,信息确定设备1确定待处理的目标页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)的所述分类相关信息为广义匹配对象,而在步骤S2’中,信息确定设备1确定的该目标页面http://www.vipshop.com/show-0-48369-0.html?的所述页面描述信息包括“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”等,则在步骤S3’中,信息确定设备1可将该页面描述信息,作为与该目标页面http://www.vipshop.com/show-0-48369-0.html?相对应的呈现信息;再如,接上例,在步骤S3’中,信息确定设备1可将所述页面描述信息“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”的内容信息,及该页面描述信息对应的呈现用户的其他资源配置内容信息如“iphone售货信息”等内容作为所述呈现信息。
本领域技术人员应能理解上述确定与所述目标页面相对应的呈现信息的方式仅为举例,其他现有的或今后可能出现的确定与所述目标页面相对应的呈现信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,信息确定设备1还包括步骤S6’(未示出),具体地,敏在步骤S6’中,信息确定设备1确定所述目标页面的内容敏感度信息;其中,在步骤S3’中,信息确定设备1根据所述页面描述信息,并结合所述内容敏感度信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。
具体地,在步骤S6’中,信息确定设备1通过诸如解析所述目标页面的HTML源码,得到所述目标页面的页面内容信息,在该页面内容信息中通过查询预定内容敏感度信息,以确定所述目标页面的内容敏感度信息。在此,所述内容敏感信息包括但不限于如只适合某特定群体浏览的内容如成人信息等、如关于造成死亡、疾病、伤害、损坏或者其他损失等意外情况的相关内容信息等。例如,假设在步骤S1’中,信息确定设备1获取的待处理的所述目标页面为“香奈儿5号面临被欧盟禁售”(http://news.163.com/12/1109/05/8FRIGU8300014AED.html)的新闻报导,则在步骤S6’中,信息确定设备1通过解析该页面的HTML源码,发现该页面的页面内容信息中包括词语如“禁售”、“过敏”等,即确定该目标页面的内容敏感度信息为“禁售”、“过敏”。
本领域技术人员应能理解上述内容敏感度信息仅为举例,其他现有的或今后可能出现的内容敏感度信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述确定所述敏感度信息的方式仅为举例,其他现有的或今后可能出现的确定所述敏感度信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S3’中,信息确定设备1根据所述页面描述信息,并结合所述内容敏感度信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。例如,接上例,假设在步骤S2’中,信息确定设备1确定目标页面“香奈儿5号面临被欧盟禁售”(http://news.163.com/12/1109/05/8FRIGU8300014AED.html)的所述页面描述信息为空缺,即该目标页面的所述分类相关信息为失配对象,则在步骤S3’中,信息确定设备1根据该页面描述信息,并结合内容敏感度信息“禁售”、“过敏”,确定的与该目标页面相对应的呈现信息为不适合在该页面提供呈现信息,或者,所述呈现信息为其它品牌香水,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。再如,假设在步骤S2’中,信息确定设备1确定目标页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)的所述页面描述信息为“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,而在步骤S6’中,信息确定设备1确定该目标页面的所述内容敏感度信息为包括只适合某特定群体浏览的内容如成人信息,则在步骤S3’中,信息确定设备1根据该页面描述信息,并结合所述内容敏感度信息,确定与该目标页面相对应的呈现信息包括该页面描述信息但声明禁止儿童浏览该页面的信息,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。
本领域技术人员应能理解上述结合内容敏感度信息确定所述呈现信息的方式仅为举例,其他现有的或今后可能出现的确结合内容敏感度信息确定所述呈现信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一个优选实施例中(参考图4),信息确定设备1包括步骤S1’、步骤S2’、步骤S3’、步骤S7’(未示出)和步骤S8’(未示出),其中,步骤S1’包括步骤S11’(未示出)和步骤S12’(未示出)。以下参考图4对该优选实施例进行描述:具体地,在步骤S11’中,信息确定设备1获取用户所访问的访问页面,以作为所述目标页面;在步骤S12’中,信息确定设备1确定所述目标页面所对应的分类相关信息;在步骤S2’中,信息确定设备1根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息;在步骤S3’中,信息确定设备1根据所述页面描述信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配;在步骤S7’中,信息确定设备1生成装置根据所述呈现信息,对所述目标页面进行更新处理,以生成对应的结果页面,其中,所述结果页面包括所述呈现信息;在步骤S8’中,信息确定设备1提供装置将所述结果页面提供给所述用户。在此,步骤S2’与图3所示对应装置步骤相同或相似,步骤S3’与图4所示对应步骤相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,在步骤S11’中,信息确定设备1首先获取用户的页面访问请求,将页面访问请求所对应的页面作为所述目标页面;或者,通过诸如浏览器、搜索引擎等第三方设备提供的应用程序接口(API),获取用户所访问的访问页面,以作为所述目标页面。例如,用户user在浏览器地址栏中输入http://news.sina.com.cn/,按enter键,则在步骤S11’中,信息确定设备1通过浏览器提供的应用程序接口(API),便获取到用户user的页面访问请求;然后,在步骤S11’中,信息确定设备1根据该页面URL,向页面服务器发送相应页面访问请求,通过页面服务器返回的相应HTML响应,获取与该页面访问请求相对应的页面http://news.sina.com.cn/,将页面http://news.sina.com.cn/作为所述目标页面。再如,假设用户user在搜索引擎搜索栏中输入关键词“iphone保护外壳配件”,然后点击搜索按钮,则在步骤S11’中,信息确定设备1通过搜索引擎提供的应用程序接口(API),便获取到用户user的页面访问请求,然后在步骤S11’中,信息确定设备1基于该查询序列向搜索引擎提交页面搜索请求,并接收搜索引擎所反馈的与该查询序列“iphone保护外壳配件”相对应的一个或多个搜索结果如搜索结果A“首页-米多多苹果数码配件正品折扣店”、搜索结果B“...3C苹果配件iphone外壳手机套批发零售保护壳”、搜索结果C“独一无二的保护壳iphone4s配件推荐手机科技时代新浪网”等,则在步骤S11’中,信息确定设备1将包括该等搜索结果的搜索结果页作为所述目标页面。
在步骤S12’中,信息确定设备1确定所述目标页面所对应的分类相关信息。在此,在步骤S12’中,信息确定设备1确定所述目标页面所对应的分类相关信息的方式与图3中在步骤S1中,信息确定设备1确定所述目标页面所对应的分类相关信息的方式相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
优选地,在步骤S12’中,信息确定设备1还可结合所述用户的用户操作信息,确定所述目标页面所对应的分类相关信息;
其中,所述用户操作信息包括以下至少任一项:
-所述用户关于所述访问页面的页面访问会话信息;
-所述用户的页面访问记录信息;
-所述访问页面所对应的页面搜索记录。
例如,当所述用户操作信息包括所述用户关于所述访问页面的页面访问会话信息时,在此,所述页面访问会话信息包括但不限于如同一个用户对访问页面的连续访问操作。假设用户user在搜索结果如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)所对应的页面的浏览过程中,还查询得到其需求的其他信息如配件“苹果数据线白色”,则在步骤S12’中,信息确定设备1确定该目标页面所对应的分类相关信息为广义匹配对象;再如,当所述用户操作信息包括所述用户的页面访问记录信息时,假设在步骤S11’中,信息确定设备1获取到用户user提交的访问页面如“划船比赛作文范文”(http://www.qc99.com/xiaoxue/sinj/101176.Html)的页面访问请求,而用户user经常访问如关于如何阐述实时政治试题的页面,则在步骤S12’中,信息确定设备1确定访问页面如“划船比赛作文范文”(http://www.qc99.com/xiaoxue/sinj/101176.Html)所对应的分类相关信息为虚拟主题如写作。
本领域技术人员能理解上述结合用户的用户操作信息确定所述分类相关信息的方式仅为举例,其他现有的或今后可能出现的结合用户的用户操作信息确定所述分类相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S7’中,信息确定设备1根据所述呈现信息,对所述目标页面进行更新处理,如将与所述呈现信息嵌入于所述目标页面中,以生成对应的结果页面,其中,所述结果页面包括所述呈现信息。例如,假设在步骤S3’中,信息确定设备1确定的与目标页面如“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?)相对应的呈现信息包括该页面描述信息如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,则在步骤S7’中,信息确定设备1可根据该呈现信息,对该目标页面进行更新处理,如将与所述呈现信息嵌入于该目标页面中,如嵌入于该目标页面的导航分块区域处,其中,所述呈现信息与所述页面描述信息相匹配。
在步骤S8’中,信息确定设备1通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将所述结果页面提供给所述用户。
优选地,信息确定设备1还包括位步骤S9’(未示出),具体地,在步骤S9’中,信息确定设备1确定所述呈现信息在所述目标页面中所对应的目标位置信息;其中,在步骤S7’中,信息确定设备1根据所述呈现信息,并结合所述目标位置信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面在所述目标位置信息对应处包括所述呈现信息。
具体地,在步骤S9’中,信息确定设备1确定所述呈现信息在所述目标页面中所对应的目标位置信息。在此,所述目标位置信息包括将所述呈现信息嵌入于所述目标页面中的哪些位置,如将所述呈现信息嵌入于所述目标页面中用户优选浏览的位置处,或者,将所述待呈现信息嵌入于所述目标页面中的导航分块区域等。在此,在步骤S9’中,信息确定设备1确定所述目标位置信息的方式包括但不限于以下至少任一项:
1)根据所述目标页面的页面布局信息,确定目标位置信息,如将目标页面中的空白区域如页面右侧分栏作为所述目标位置信息,将目标页面中容易引起用户注意的区域如搜索页中搜索栏的周围等作为所述目标位置信息。例如,假设在步骤S11’中,信息确定设备1获取的待处理的所述目标页面为“iphone配件唯品会抄底低价!数码配件专场限时特惠”(http://www.vipshop.com/show-0-48369-0.html?),而在步骤S9’中,信息确定设备1通过诸如HTML标签解析方法、或者根据VIPS(Vision-based Page Segmentation,基于视觉的页面分段)算法,对该目标页面进行解析,得到该目标页面的页面样式信息,如页面布局信息,其中,该目标页面的页面右侧分栏为空白区域,则在步骤S9’中,信息确定设备1可将该目标页面中的页面右侧分栏区域作为所述目标位置信息。
2)根据所述目标页面的页面内容信息,将所述目标页面中与所述呈现信息的内容相匹配的内容位置区域作为所述目标位置信息。例如,假设在步骤S11’中,信息确定设备1获取的所述目标页面为页面http://www.vipshop.com/show-0-48369-0.html?,在步骤S3’中,信息确定设备1确定的所述呈现信息包括内容如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,在步骤S9’中,信息确定设备1通过解析该目标页面,该目标页面中包含多个频道内容如“奢饰品”、“唯品团”、“唯品尚”等,则在步骤S9’中,信息确定设备1将该目标页面中与该呈现信息的内容相匹配的内容位置区域作为所述目标位置信息,即将该目标页面中“唯品尚”频道位置区域作为所述待呈现信息的所述目标位置信息。
3)根据所述目标页面的页面相关信息,并结合所述用户的页面访问记录信息,确定所述呈现信息在所述目标页面中所对应的目标位置信息。例如,假设在步骤S11’中,信息确定设备1获取的待处理的所述目标页面为页面http://www.vipshop.com/show-0-48369-0.html?,在步骤S3’中,信息确定设备1确定的所述呈现信息包括内容如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,假设用户user经常点击该目标页面http://www.vipshop.com/show-0-48369-0.html?中的页面顶部区域内容链接,则在步骤S9’中,信息确定设备1结合用户user的页面访问记录信息,将用户user经常访问该目标页面http://www.vipshop.com/show-0-48369-0.html?中的内容在该目标页面中的位置信息如页面顶部区域作为所述呈现信息在该目标页面中所对应的目标位置信息。
本领域技术人员能理解上述确定所述目标位置信息的方式仅为举例,其他现有的或今后可能出现的确定所述目标位置信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
接着,在步骤S7’中,信息确定设备1根据所述呈现信息,并结合所述目标位置信息,对所述目标页面进行更新处理,如将与所述呈现信息嵌入于所述目标页面的所述目标位置信息处,以生成对应的所述结果页面,其中,所述结果页面在所述目标位置信息对应处包括所述呈现信息。例如,接上例,假设在步骤S9’中,信息确定设备1确定的呈现信息“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”在目标页面http://www.vipshop.com/show-0-48369-0.html?中的目标位置信息为页面右侧右上区域,则在步骤S7’中,信息确定设备1将其确定的与该呈现信息嵌入于该目标页面的所述目标位置信息处,以生成对应的所述结果页面。
优选地,信息确定设备1还包括步骤S10’(未示出),具体地,在步骤S10’中,信息确定设备1确定所述呈现信息在所述目标页面中所对应的目标样式信息;其中,在步骤S7’中,信息确定设备1根据所述呈现信息,并结合所述目标样式信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面包括与所述目标样式信息相对应的所述呈现信息。
具体地,在步骤S10’中,信息确定设备1确定所述呈现信息在所述目标页面中所对应的目标样式信息,在此,在步骤S10’中,信息确定设备1确定所述呈现信息在所述目标页面中所对应的目标样式信息的方式包括但不限于以下至少任一项:
1)根据所述目标页面的样式相关信息,确定所述呈现信息在所述目标页面中所对应的目标样式信息。具体地,在步骤S10’中,信息确定设备1首先确定所述目标页面的样式相关信息;然后,再根据所述目标页面的样式相关信息,从该样式相关信息中抽取出一条或多条样式设置信息来作为所述呈现信息的目标样式信息,或者,直接将所述目标页面的样式相关信息作为所述呈现信息的目标样式信息。例如,假设在步骤S11’中,信息确定设备1获取到的所述目标页面“唯品会品牌时尚折扣店”http://www.vipshop.com/show-0-48369-0.html?,而在步骤S3’中,信息确定设备1确定的所述呈现信息包括内容如“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”,则样式确定装置首先可通过诸如基于HTML标签分析方法、或者根据VIPS(Vision-based Page Segmentation,基于视觉的页面分段)算法等,对所述目标页面进行解析,得到所述目标页面的样式相关信息包括页面顶部导航块、面包屑导航、正文区域块、页面左边栏内容块、页面右边栏提供信息链接块及页面底部内容块等页面分块特征,页面中的字体颜色为灰色、页面色调为粉色等页面样式设置等;然后,在步骤S10’中,信息确定设备1可根据所述目标页面的样式相关信息,来确定所述呈现信息的目标样式信息,如将所述呈现信息的页面色调、字体颜色等设置为与该初始搜索结果页面的页面色调、字体颜色等一致,即页面色调设置为粉色、字体颜色设置为灰色。
2)根据所述呈现信息的应用分类信息,在页面样式数据库中进行匹配查询,以获得与所述应用分类信息相对应的页面样式信息,以作为所述目标样式信息,其中,所述页面样式数据库包括应用分类与页面样式的映射关系。在此,所述应用分类信息包括但不限于所述第一页面访问请求所对应页面的行业分类,如食品、环保、新闻、化妆品、鲜花、汽车、小说等。例如,例如,假设所述呈现信息的应用分类信息的应用分类信息属于食品行业,则在步骤S10’中,信息确定设备1在访问页面样式数据库中进行匹配查询,获得与所述应用分类信息相对应的页面样式信息包括面包屑导航、正文摘要区域块、页面背景为绿色、页面字体颜色为黑色等;再如,假设所述呈现信息的应用分类信息的应用分类信息属于化妆品行业,则在步骤S10’中,信息确定设备1在访问页面样式数据库中进行匹配查询,获得与所述应用分类信息相对应的页面样式信息包括面包屑导航、正文摘要区域块、页面背景为暖色调如粉色等、页面字体颜色为白色等。在此,所述页面样式数据库既可位于信息确定设备1中,还可位于与信息确定设备1通过网络相连的服务器中。
本领域技术人员能理解上述确定所述呈现信息在所述目标页面中所对应的目标样式信息的方式仅为举例,其他现有的或今后可能出现的确定所述呈现信息在所述目标页面中所对应的目标样式信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
接着,在步骤S7’中,信息确定设备1根据所述呈现信息,并结合所述目标样式信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面包括与所述目标样式信息相对应的所述呈现信息。例如,接上例,假设在步骤S10’中,信息确定设备1确定的呈现信息“iphone数码配件(保护外壳配件、充电器等)-nokia数码配件-...”在目标页面http://www.vipshop.com/show-0-48369-0.html?中所对应的目标样式信息包括面包屑导航、正文摘要区域块、页面背景为暖色调如粉色等、页面字体颜色为白色等,则在步骤S7’中,信息确定设备1将该呈现信息以该目标样式信息的显示形式嵌入于该目标页面中,以生成对应的所述结果页面,其中,所述结果页面包括与所述目标样式信息相对应的所述呈现信息。
本领域技术人员能理解上述结合目标样式信息生成结果页面的方式仅为举例,其他现有的或今后可能出现的结合目标样式信息生成结果页面的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (21)
1.一种用于确定目标页面所对应的页面描述信息的方法,其中,该方法包括以下步骤:
a确定待处理的目标页面所对应的分类相关信息;
b根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。
2.根据权利要求1所述的方法,其中,该方法还包括:
-根据经标注分类信息的多个训练页面,进行机器学习处理,以获得用于页面分类的页面分类模型;
其中,所述步骤a包括:
-根据所述页面分类模型,基于所述目标页面的页面相关信息,确定所述分类相关信息。
3.根据权利要求1所述的方法,其中,该方法还包括:
c根据所述页面描述信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配。
4.根据权利要求3所述的方法,其中,所述步骤a包括:
-获取用户所访问的访问页面,以作为所述目标页面;
a1确定所述目标页面所对应的分类相关信息;
其中,该方法还包括:
d根据所述呈现信息,对所述目标页面进行更新处理,以生成对应的结果页面,其中,所述结果页面包括所述呈现信息;
-将所述结果页面提供给所述用户。
5.根据权利要求4所述的方法,其中,所述步骤a1包括:
-结合所述用户的用户操作信息,确定所述目标页面所对应的分类相关信息;
其中,所述用户操作信息包括以下至少任一项:
-所述用户关于所述访问页面的页面访问会话信息;
-所述用户的页面访问记录信息;
-所述访问页面所对应的页面搜索记录。
6.根据权利要求4或5所述的方法,其中,该方法还包括:
-确定所述呈现信息在所述目标页面中所对应的目标位置信息;
其中,所述步骤d包括:
-根据所述呈现信息,并结合所述目标位置信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面在所述目标位置信息对应处包括所述呈现信息。
7.根据权利要求4或5所述的方法,其中,该方法还包括:
-确定所述呈现信息在所述目标页面中所对应的目标样式信息;
其中,所述步骤d包括:
-根据所述呈现信息,并结合所述目标样式信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面包括与所述目标样式信息相对应的所述呈现信息。
8.根据权利要求3所述的方法,其中,该方法还包括:
-确定所述目标页面的内容敏感度信息;
其中,所述步骤c包括:
-根据所述页面描述信息,并结合所述内容敏感度信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。
9.根据权利要求1所述的方法,其中,所述分类相关信息包括以下至少任一项:
-虚拟主题;
-精确匹配对象;
-广义匹配对象;
-失配对象;
其中,所述相应调整处理操作包括以下至少任一项:
-当所述分类相关信息包括所述虚拟主题,根据所述候选描述信息在虚拟主题数据库中进行匹配查询,以将对应的匹配查询结果作为所述页面描述信息;
-当所述分类相关信息包括所述精确匹配对象,将所述候选描述信息作为所述页面描述信息;
-当所述分类相关信息包括所述广义匹配对象,根据所述候选描述信息在广义对象数据库中进行匹配查询,以将所述候选描述信息及其对应的匹配查询结果作为所述页面描述信息;
-当所述分类相关信息包括所述失配对象,将所述候选描述信息清空,以作为所述页面描述信息。
10.根据权利要求1所述的方法,其中,该方法还包括:
-获取与查询序列相对应的一个或多个搜索结果;
-根据所述搜索结果所对应页面的页面描述信息与所述查询序列的匹配度信息,对所述一个或多个搜索结果进行后续处理;
-将经后续处理的所述一个或多个搜索结果中至少一个提供给所述查询序列所对应的应用。
11.一种用于确定目标页面所对应的页面描述信息的信息确定设备,其中,该信息确定设备包括:
分类装置,用于确定待处理的目标页面所对应的分类相关信息;
确定装置,用于根据所述分类相关信息,对所述目标页面所对应的候选描述信息进行相应调整处理,以获得所述目标页面所对应的页面描述信息。
12.根据权利要求11所述的信息确定设备,其中,该信息确定设备还包括:
模型建立装置,用于根据经标注分类信息的多个训练页面,进行机器学习处理,以获得用于页面分类的页面分类模型;
其中,所述分类装置用于:
-根据所述页面分类模型,基于所述目标页面的页面相关信息,确定所述分类相关信息。
13.根据权利要求11所述的信息确定设备,其中,该信息确定设备还包括:
匹配装置,用于根据所述页面描述信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息相匹配。
14.根据权利要求13所述的信息确定设备,其中,所述分类装置包括:
获取单元,用于获取用户所访问的访问页面,以作为所述目标页面;
分类单元,用于确定所述目标页面所对应的分类相关信息;
其中,该信息确定设备还包括:
生成装置,用于根据所述呈现信息,对所述目标页面进行更新处理,以生成对应的结果页面,其中,所述结果页面包括所述呈现信息;
提供装置,用于将所述结果页面提供给所述用户。
15.根据权利要求14所述的信息确定设备,其中,所述分类单元用于:
-结合所述用户的用户相关信息,确定所述目标页面所对应的分类相关信息;
其中,所述用户相关信息包括以下至少任一项:
-所述用户关于所述访问页面的页面访问会话信息;
-所述用户的页面访问记录信息;
-所述访问页面所对应的页面搜索记录。
16.根据权利要求14或15所述的信息确定设备,其中,该信息确定设备还包括:
位置确定装置,用于确定所述呈现信息在所述目标页面中所对应的目标位置信息;
其中,所述生成装置用于:
-根据所述呈现信息,并结合所述目标位置信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面在所述目标位置信息对应处包括所述呈现信息。
17.根据权利要求14或15所述的信息确定设备,其中,该信息确定设备还包括:
样式确定装置,用于确定所述呈现信息在所述目标页面中所对应的目标样式信息;
其中,所述生成装置用于:
-根据所述呈现信息,并结合所述目标样式信息,对所述目标页面进行更新处理,以生成对应的所述结果页面,其中,所述结果页面包括与所述目标样式信息相对应的所述呈现信息。
18.根据权利要求13所述的信息确定设备,其中,该信息确定设备还包括:
敏感度装置,用于确定所述目标页面的内容敏感度信息;
其中,所述匹配装置用于:
-根据所述页面描述信息,并结合所述内容敏感度信息,确定与所述目标页面相对应的呈现信息,其中,所述呈现信息与所述页面描述信息及所述内容敏感度信息相匹配。
19.根据权利要求11所述的信息确定设备,其中,所述分类相关信息包括以下至少任一项:
-虚拟主题;
-精确匹配对象;
-广义匹配对象;
-失配对象;
其中,所述相应调整处理操作包括以下至少任一项:
-当所述分类相关信息包括所述虚拟主题,根据所述候选描述信息在虚拟主题数据库中进行匹配查询,以将对应的匹配查询结果作为所述页面描述信息;
-当所述分类相关信息包括所述精确匹配对象,将所述候选描述信息作为所述页面描述信息;
-当所述分类相关信息包括所述广义匹配对象,根据所述候选描述信息在广义对象数据库中进行匹配查询,以将所述候选描述信息及其对应的匹配查询结果作为所述页面描述信息;
-当所述分类相关信息包括所述失配对象,将所述候选描述信息清空,以作为所述页面描述信息。
20.根据权利要求11所述的信息确定设备,其中,该信息确定设备还包括搜索处理装置,用于:
-获取与查询序列相对应的一个或多个搜索结果;
-根据所述搜索结果所对应页面的页面描述信息与所述查询序列的匹配度信息,对所述一个或多个搜索结果进行后续处理;
-将经后续处理的所述一个或多个搜索结果中至少一个提供给所述查询序列所对应的应用。
21.一种计算机设备,包括如权利要求11至20中任一项所述的信息确定设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210452843.6A CN102999576B (zh) | 2012-11-13 | 2012-11-13 | 用于确定目标页面所对应的页面描述信息的方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210452843.6A CN102999576B (zh) | 2012-11-13 | 2012-11-13 | 用于确定目标页面所对应的页面描述信息的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102999576A true CN102999576A (zh) | 2013-03-27 |
CN102999576B CN102999576B (zh) | 2016-08-17 |
Family
ID=47928144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210452843.6A Active CN102999576B (zh) | 2012-11-13 | 2012-11-13 | 用于确定目标页面所对应的页面描述信息的方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102999576B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103345476A (zh) * | 2013-06-09 | 2013-10-09 | 北京百度网讯科技有限公司 | 用于确定与目标页面相对应的呈现信息的方法与设备 |
CN103399764A (zh) * | 2013-07-24 | 2013-11-20 | 北京小米科技有限责任公司 | 界面色彩设置方法、装置和终端 |
CN103440326A (zh) * | 2013-09-02 | 2013-12-11 | 百度在线网络技术(北京)有限公司 | 提供呈现信息的方法和装置 |
CN106709073A (zh) * | 2013-12-30 | 2017-05-24 | 北京奇虎科技有限公司 | 一种浏览器中进行消息推送的方法和一种浏览器终端 |
CN109492216A (zh) * | 2018-09-19 | 2019-03-19 | 平安科技(深圳)有限公司 | 水帖自动鉴别及审批方法、装置及计算机可读存储介质 |
CN110489187A (zh) * | 2018-05-15 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 页面刷新方法、装置、存储介质和计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251855A (zh) * | 2008-03-27 | 2008-08-27 | 腾讯科技(深圳)有限公司 | 一种互联网网页清洗方法、***及设备 |
CN101404031A (zh) * | 2008-11-12 | 2009-04-08 | 北京搜狗科技发展有限公司 | 识别概念型网页的方法与*** |
US20110196737A1 (en) * | 2010-02-05 | 2011-08-11 | Microsoft Corporation | Semantic advertising selection from lateral concepts and topics |
CN102609407A (zh) * | 2012-02-16 | 2012-07-25 | 复旦大学 | 一种网络不良文本内容的细粒度语义检测方法 |
CN102750334A (zh) * | 2012-06-01 | 2012-10-24 | 北京市农林科学院农业科技信息研究所 | 一种基于dm的农业信息精准推送的方法 |
-
2012
- 2012-11-13 CN CN201210452843.6A patent/CN102999576B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251855A (zh) * | 2008-03-27 | 2008-08-27 | 腾讯科技(深圳)有限公司 | 一种互联网网页清洗方法、***及设备 |
CN101404031A (zh) * | 2008-11-12 | 2009-04-08 | 北京搜狗科技发展有限公司 | 识别概念型网页的方法与*** |
US20110196737A1 (en) * | 2010-02-05 | 2011-08-11 | Microsoft Corporation | Semantic advertising selection from lateral concepts and topics |
CN102609407A (zh) * | 2012-02-16 | 2012-07-25 | 复旦大学 | 一种网络不良文本内容的细粒度语义检测方法 |
CN102750334A (zh) * | 2012-06-01 | 2012-10-24 | 北京市农林科学院农业科技信息研究所 | 一种基于dm的农业信息精准推送的方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103345476A (zh) * | 2013-06-09 | 2013-10-09 | 北京百度网讯科技有限公司 | 用于确定与目标页面相对应的呈现信息的方法与设备 |
CN103345476B (zh) * | 2013-06-09 | 2017-03-01 | 北京百度网讯科技有限公司 | 用于确定与目标页面相对应的呈现信息的方法与设备 |
CN103399764A (zh) * | 2013-07-24 | 2013-11-20 | 北京小米科技有限责任公司 | 界面色彩设置方法、装置和终端 |
CN103440326A (zh) * | 2013-09-02 | 2013-12-11 | 百度在线网络技术(北京)有限公司 | 提供呈现信息的方法和装置 |
CN106709073A (zh) * | 2013-12-30 | 2017-05-24 | 北京奇虎科技有限公司 | 一种浏览器中进行消息推送的方法和一种浏览器终端 |
CN110489187A (zh) * | 2018-05-15 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 页面刷新方法、装置、存储介质和计算机设备 |
CN110489187B (zh) * | 2018-05-15 | 2021-09-24 | 腾讯科技(深圳)有限公司 | 页面刷新方法、装置、存储介质和计算机设备 |
CN109492216A (zh) * | 2018-09-19 | 2019-03-19 | 平安科技(深圳)有限公司 | 水帖自动鉴别及审批方法、装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102999576B (zh) | 2016-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105808685B (zh) | 推广信息的推送方法及装置 | |
CN103544178B (zh) | 一种用于提供与目标页面相对应的重构页面的方法和设备 | |
CN103295145B (zh) | 一种基于用户消费特征向量的手机广告投放方法 | |
US10031954B2 (en) | Method and system for presenting a search result in a search result card | |
US11416565B2 (en) | Techniques to leverage machine learning for search engine optimization | |
CN105808764A (zh) | 推荐内容的展示方法和装置 | |
CN102999595B (zh) | 一种用于提供与页面信息相对应的访问页面的方法和设备 | |
CN102999576A (zh) | 用于确定目标页面所对应的页面描述信息的方法和设备 | |
WO2014107682A1 (en) | Method and apparatus for generating webpage content | |
CN109325179A (zh) | 一种内容推广的方法及装置 | |
CN107918622A (zh) | 内容推荐、展示方法、客户端、服务器和*** | |
CN103699619A (zh) | 一种用于提供搜索结果的方法及装置 | |
CN106445971A (zh) | 一种应用推荐方法和*** | |
CN107491465A (zh) | 用于搜索内容的方法和装置以及数据处理*** | |
CN106951495A (zh) | 用于呈现信息的方法和装置 | |
CN103703483A (zh) | 信息提供装置、信息提供方法、信息提供程序、信息显示程序以及存储信息提供程序的计算机可读取的记录介质 | |
CN106371706A (zh) | 应用快捷方式位置选择的方法及装置 | |
CN102982135A (zh) | 一种用于提供呈现信息的方法和设备 | |
Van Looy | Search engine optimization | |
CN105138702B (zh) | 一种基于搜索引擎的网络搜索方法及电子设备 | |
CN107153697A (zh) | 一种商品交易网站中的商品搜索方法和装置 | |
JP6295577B2 (ja) | サーバ装置、プログラム、及び、情報提供方法 | |
CN104765747A (zh) | 网页处理方法及装置 | |
CN106776634A (zh) | 一种用于网络访问的方法、装置及终端设备 | |
CN104484415A (zh) | 提供电子书的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |