CN107341162B - 网页处理方法和装置、用于网页处理的装置 - Google Patents

网页处理方法和装置、用于网页处理的装置 Download PDF

Info

Publication number
CN107341162B
CN107341162B CN201610286906.3A CN201610286906A CN107341162B CN 107341162 B CN107341162 B CN 107341162B CN 201610286906 A CN201610286906 A CN 201610286906A CN 107341162 B CN107341162 B CN 107341162B
Authority
CN
China
Prior art keywords
target
webpage
historical
current user
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610286906.3A
Other languages
English (en)
Other versions
CN107341162A (zh
Inventor
姚波怀
张扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201610286906.3A priority Critical patent/CN107341162B/zh
Publication of CN107341162A publication Critical patent/CN107341162A/zh
Application granted granted Critical
Publication of CN107341162B publication Critical patent/CN107341162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供了一种网页处理方法和装置、用于网页处理的装置,其中的网页处理方法具体包括:确定当前用户所属的目标用户群组;依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;向当前用户推荐所述目标网页。本发明实施例能够契合当前用户的访问需求以及提高网页推荐的准确率。

Description

网页处理方法和装置、用于网页处理的装置
技术领域
本发明涉及通信技术领域,特别是涉及一种网页处理方法、一种网页处理装置、及一种用于网页处理的装置。
背景技术
随着互联网技术的发展,各式各样的网站也如雨后春笋般涌现,为了方便用户在众多网址中能够快速获取到所需的网址,现有的浏览器一般都会提供收藏夹功能。收藏夹是浏览器提供的网址收藏功能。用户在通过浏览器进行网页浏览时,可以将常用的、喜欢的或者需要标记的网站或网页放入浏览器的收藏夹中,以便后续查找、访问。
目前,收藏夹内容的获取方式主要有两种。第一种获取方式为人工获取,具体地,用户可以根据自身的长期浏览经验、或者根据朋友的推荐等方式才能获取到契合访问需求的网站;上述第一种获取方式不智能且获取效率低。
第二种为推荐方式,现有的推荐方式依据访问频率越高则访问需求越大的原理进行收藏夹内容的推荐。具体地,可以依据用户对于网页的访问频率,从用户浏览过的历史网页中选择访问频率较高的网页以用于推荐。然而,在实际应用中,难免存在一些访问频率低、但用户仍存在访问需求的网页,因此,现有的推荐方式无法实现网页的准确推荐。例如,学校的成绩查询网站的访问频率较低,但用户对该类网站仍然存在访问需求,如学生在期末考试结束后需要访问该类网站以进行期末成绩的查询。
另外,在用户初次安装浏览器时,浏览器中并不存在历史网页
Figure GDA0003902925300000011
并且,在用户具有新访问需求时,历史网页与该新访问需求不相关,因此,现有的推荐方式无法实现收藏夹内容的准确推荐。
发明内容
鉴于上述问题,本发明实施例提出了一种克服上述问题或者至少部分地解决上述问题的网页处理方法、网页处理装置及用于网页处理的装置,本发明实施例能够契合当前用户的访问需求以及提高网页推荐的准确率。
为了解决上述问题,本发明公开了一种网页处理方法,包括:
确定当前用户所属的目标用户群组;
依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;
向当前用户推荐所述目标网页。
另一方面,本发明公开了一种网页处理装置,包括:
群组确定模块,用于确定当前用户所属的目标用户群组;
网页获取模块,用于依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;以及
网页推荐模块,用于向当前用户推荐所述目标网页。
再一方面,本发明公开了一种用于网页处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定当前用户所属的目标用户群组;
依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;
向当前用户推荐所述目标网页。
本发明实施例包括以下优点:
本发明实施例依据当前用户所属目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,进而向当前用户推荐所述目标网页。由于本发明实施例向当前用户推荐所述目标网页为依据当前用户所属目标用户群组的历史关注行为所对应的历史网页确定的网页,而用户群组内不同群用户的访问需求往往具有相同之处,故所述目标网页可以在不受网页访问频率的限制,且能够契合当前用户的访问需求以及提高网页推荐的准确率。
例如,本发明实施例可以挖掘出一些访问频率较低(一年只用一次)或者用户不知道的有价值网站(如学校的成绩查询网站),推荐给用户,供其浏览收藏;用户在以后的浏览器使用中可以很方便的访问一些网站,并且用户根据***推荐发现了很多有价值网站,提升了用户的使用体验。
其次,在用户初次安装浏览器时,由于浏览器中并不存在历史网页,因此,现有的推荐方式无法实现收藏夹内容的准确推荐;或者,在用户具有新访问需求时,历史网页与该新访问需求不相关,因此,现有的推荐方式无法实现收藏夹内容的准确推荐。而本发明实施例可以利用地理位置等信息进行网页推荐的冷启动,即使用户没有浏览信息或者浏览信息与现在新的浏览目的不匹配时也可以确定当前用户所属的目标区域群组,进而可以依据所述目标区域群组群组的历史关注行为所对应的历史网页获取向当前用户推荐的目标网页。
附图说明
图1是本发明的一种网页处理方法的应用环境的结构示意图;
图2是本发明的一种网页处理方法实施例一的步骤流程图;
图3是本发明的一种网页处理方法实施例二的步骤流程图;
图4是本发明的一种网页处理方法实施例三的步骤流程图;
图5是本发明的一种网页处理方法实施例四的步骤流程图;
图6是本发明的一种网页处理方法实施例五的步骤流程图;
图7是本发明的一种网页处理方法装置实施例的结构框图;
图8是本发明的一种用于网页处理的装置900的框图;及
图9是本发明的一种服务器的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
现有的推荐方式依据用户对于网页的访问频率,从用户浏览过的历史网页中选择访问频率较高的网页以用于推荐;这样,将无法满足低访问频率的网页的访问需求。例如,学校的成绩查询网站的访问频率较低,但学生在期末考试结束后需要访问该类网站以进行期末成绩的查询。
经分析发现,在用户使用浏览器的过程中,具有相同群组特征的用户群组内不同群用户的访问需求往往具有相同之处。在实际应用中,上述群组特征具体可以包括:位置特征、偏好特征和属性特征等。
其中,上述位置特征可以与预置区域群组相应,可用于表示用户所属的区域。例如,预置区域群组“清华大学”的学生需要浏览清华大学学校教务处以获取对应的教务信息,清华大学的学生还有可能浏览水木清华BBS(电子布告栏,Bulletin Board System)、水木社区BBS等网站以获取对应的生活信息或娱乐信息。又如,预置区域群组“XX小区”需要关注周边的便民信息和教育信息(如幼儿园、小学等)、小区的物业信息等。
上述属性特征可以与预置属性群组相应,可用于表示用户相对稳定的静态属性特征,如用户的年龄、性别、地域、学历、商圈、职业、婚姻、消费等级等。例如,预置属性群组“妈妈群组”共同关注的是母婴网站、育儿网站,又如,预置属性群组“狮子座群组”共同关注的是星座网站,再如,预置属性群组“北京人群组”共同关注的是北京电视台、北京国安官网、北京金隅官网等网站。
上述偏好特征可以与预置偏好群组相应,可用于表示随着不断变化的用户行为而变化的内容或兴趣偏好。例如,“篮球迷群组”不仅存在新浪NBA(美国国家篮球协会,National Basketball Association)、腾讯NBA等网页的访问需求,而且也存在NBA官方网站甚至CBA(中国篮球协会,Chinese Basketball Association)的网站的访问需求。
本发明实施例的核心构思之一在于,依据当前用户所属目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,进而向当前用户推荐所述目标网页。由于本发明实施例向当前用户推荐所述目标网页为依据当前用户所属目标用户群组的历史关注行为所对应的历史网页确定的网页,而用户群组内不同群用户的访问需求往往具有相同之处,故所述目标网页可以在不受网页访问频率的限制,且能够契合当前用户的访问需求以及提高网页推荐的准确率。
在本发明的一种应用示例1中,用户A为清华大学的新生,在用户A将自己的计算机连接到清华网络之后,本发明实施例可以确定用户A所属的目标用户群组为“清华大学”,并且,还可以向用户A推荐访问频率较低、但被“清华大学”中大多数群用户收藏的网页,如清华教务处、清华BBS、清华成绩查询等,以供用户A收藏或浏览。
进一步,本发明实施例还可以根据用户A之前的浏览记录和收藏夹内容等信息,确定A是一个篮球爱好者,故可以向用户A推荐范围频率较低、但被目标群组“清华大学篮球”中大多数群用户收藏的网页,如清华大学CUBA官网、清华大学篮球俱乐部等,以供用户A收藏或浏览。
本发明实施例提供的网页处理方法可以应用于浏览器、即时通讯程序、输入法程序等应用程序中,且本发明实施例提供的网页处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务器200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务器200进行数据交互。
具体地,客户端100可以运行在智能终端上,上述智能终端具体可以包括但不限:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,MovingPicture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
客户端100可以采集当前用户的当前位置特征,或者,可以获取当前用户的历史关注行为所对应的历史网页(以下简称第一历史网页)。
在本发明的一种可选实施例中,客户端100可以通过与服务器200之间的数据交互,获取待推荐的目标网页。具体地,客户端100可以向服务器200发送获取请求,其中,该获取请求中可以包括:上述第一历史网页和/或当前位置特征,以使服务器200依据上述第一历史网页和/或当前位置特征,确定当前用户所属的目标用户群组;进而,服务器200还可以依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,并向客户端100发送上述目标网页。
当然,上述客户端100通过与服务器200之间的数据交互,获取上述待推荐的目标网页的过程只是作为可选实施例,实际上,客户端100可以自行获取待推荐的目标网页,或者,客户端100可以自行确定当前用户所属的目标用户群组,并向服务器200发送上述目标用户群组,以使服务器200依据上述目标用户群组获取待推荐的目标网页,可以理解,本发明实施例上述待推荐的目标网页的获取过程所对应的执行主体不加以限制。
可以理解,上述图1所示应用环境只是作为应用示例,本发明实施例中网页处理流程的目的之一在于,依据当前用户所属目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,进而向当前用户推荐所述目标网页,从而能够提高网页推荐的准确率,而对网页处理流程的具体执行主体和具体应用环境不加以限制。
方法实施例一
参照图2,示出了本发明的一种网页处理方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤201、确定当前用户所属的目标用户群组;
本发明实施例中,用户群组可用于表示有相同群组特征的某一类用户的组合。在实际应用中,上述用户群组具体可以包括:位置特征对应的区域群组、偏好特征对应的偏好群组、属性特征对应的区域群组等。可以理解,本领域技术人员可以根据实际应用需求,采用任意的用户群组,本发明实施例对于具体的用户群组不加以限制。
本发明实施例可以提供确定当前用户所属的目标用户群组的如下技术方案:
技术方案1
技术方案1可用于确定当前用户所属的目标区域群组,所述确定当前用户所属的目标用户群组的步骤201,具体可以包括:
步骤A1、采集当前用户的当前位置特征;
步骤A2、将当前位置特征与预置区域群组所对应的预置位置特征进行匹配,以得到所述当前位置特征对应的目标区域群组。
在本发明的一种可选实施例中,可以针对国家、省、市、城区等单位进行区域划分,以得到对应的预置区域群组;相应的划分方式具体可以包括如下方式中的至少一种:
方式1:依据经纬度信息进行区域划分;其中,每个预置区域群组可以具有对应的经纬度范围;
方式2:依据电子地图信息,获取每个大厦的位置特征的范围;其中,一个或多个大厦可以对应一个预置区域群组;
方式3:通过客户端采集多个用户的位置特征,并通过聚类算法得到对应的预置区域群组,其中,可以将多用户聚集的位置范围划分为一个预置区域,而区域边界可以为用户密度锐减的位置。
本发明实施例中,位置特征可用于表征地理位置,在实际应用中,上述位置特征具体可以包括:经纬度信息、IP(网络之间互连的协议,Internet Protocol)信息等。其中,可以通过智能终端的GPS(全球定位***,Global Positioning System)功能采集上述经纬度信息,可以通过智能终端的网络连接装置或者对应的预置查询接口获取上述IP信息,可以理解,本发明实施例对于具体的位置特征及其采集方式不加以限制。
在此提供一种IP信息的聚类过程示例。假设IP信息为A.B.C.D,则当两个IP信息的A、B和C相同时,则可以将该两个IP信息聚类至同一预置区域群组。在本发明的一种可选实施例中,还可以依据用户的IP信息和用户的关注行为所对应的网页共同应用于上述聚类过程,通过聚类算法,可以将关注行为所对应的网页相似且IP相近的用户划分为同一预置区域群组。进一步,还可以将该预置区域群组内用户所属的IP网段即作为对应的IP网段,并将属于该IP网段的用户聚类至该预置区域群组。
可以理解,上述通过划分得到预置区域群组的过程只是作为示例,本发明实施例对于预置区域群组的具体获取方式不加以限制。
在实际应用中,上述步骤A2可以通过智能终端的GPS功能采集当前用户的当前经纬度信息,并将该当前经纬度信息与预置区域群组的经纬度范围进行匹配,以得到所述当前经纬度信息对应的目标区域群组。或者,上述步骤A2还可以通过预置查询接口查询智能终端的当前IP信息,并将该当前IP信息与预置区域群组的IP信息范围(如IP网段)进行匹配,以得到所述当前IP信息对应的目标区域群组。可以理解,本发明实施例对于上述步骤A2的具体实现过程不加以限制。
综上,技术方案1依据当前用户的当前经纬度信息、当前IP信息等当前位置特征,确定当前用户所属的目标区域群组;由于上述技术方案1可以不使用当前用户的历史关注行为所对应的历史网页,这样,在当前用户的浏览器中并不存在历史网页的情况下,上述技术方案1仍然能够确定当前用户所属的目标区域群组,进而可以依据所述目标区域群组群组的历史关注行为所对应的历史网页获取向当前用户推荐的目标网页,也即,即使不存在当前用户的历史网页的情况下,上述技术方案1仍然能够向用户提供准确的、有价值的目标网页,因此能够提高网页推荐的准确度。
在上述应用示例1中,用户A为清华大学的新生,假设用户A的计算机为新买的计算机,故其浏览器中并不存在相应的历史网页;在上述情况下,本发明实施例仍然可以通过上述技术方案1可以确定用户A所属的目标用户群组为“清华大学”,进而可以向用户A推荐访问频率较低、但被“清华大学”中大多数群用户收藏的网页,如清华教务处、清华BBS、清华成绩查询等,以供用户A收藏或浏览。
并且,在当前用户的历史网页不契合后续的访问需求时,本发明实施例仍然可以通过上述技术方案1可以确定当前用户所属的目标区域群组。在本发明的一种应用示例2中,用户B刚刚加入X公司,以后需要访问X公司的相关网页,但用户B之前访问过的历史网页与该X公司对应的相关网页并不存在联系,故通过用户B之前访问过的历史网页无法获得相应X公司的相关网页;而本发明实施例仍然可以通过上述技术方案1可以确定当前用户B所属的目标区域群组“X公司”,进而可以向用户B推荐访问频率低、但被“X公司”中大多数群用户收藏的网页,如“X公司主页”、“X公司邮箱页”、“X公司办公页”等,以供用户B收藏或浏览。
技术方案2
技术方案2可用于确定当前用户所属的目标偏好群组,所述确定当前用户所属的目标用户群组的步骤201,具体可以包括:
步骤B1、依据当前用户的历史关注行为所对应的历史网页,获取当前用户的偏好特征;
步骤B2、将当前用户的偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的偏好特征对应的目标偏好群组。
在本发明的一种可选实施例中,上述依据当前用户的历史关注行为所对应的历史网页,获取当前用户的偏好特征的步骤B1,具体可以包括:
步骤B11、针对现有的网站和/或网页生成对应的类别标签;其中,可以采用人工标记方式,也可以采用自动标记方式,例如,可以抓取网站内容,并依据上述网站内容利用机器学习方法获得对应网站的类别标签。例如,上述类别标签可以包括:体育、娱乐、C语言、JAVA语言,其中,体育对应的类别标签可以进一步包括:篮球、足球、羽毛球、武术、游泳等,娱乐对应的类别标签可以进一步包括:明星、电影、电视等。可以理解,本发明实施例对于网站的类别标签及其生成过程不加以限制。
步骤B12、将当前用户的历史关注行为所对应的历史网页与带有类别标签的网页进行匹配,以得到上述历史网页对应的目标类别标签,进而依据上述目标类别标签得到当前用户的偏好特征;其中,可以将上述目标类别标签作为当前用户的偏好特征,也可以对上述目标类别标签进行处理后得到当前用户的偏好特征。例如,可以将出现频率符合预置条件的上述目标类别标签作为当前用户的偏好特征。其中,上述预置条件可以与关注时间相关,也可以与关注频率相关;例如,用户C的收藏夹内容中M个网页的类别标签为“母婴”,N个网页的类别标签为“星座”,虽然M小于N,但由于N个网页的关注行为发生在3年前,而M个网页的关注行为发生在最近1年内,则可以认为用户C的偏好特征包含“母婴”,而可以舍弃“星座”标签。可以理解,本发明实施例对于依据上述目标类别标签得到当前用户的偏好特征的具体过程不加以限制。
在本发明的另一种可选实施例中,获取预置偏好群组的过程具体可以包括:通过客户端采集多个用户的历史网页,并通过聚类算法对上述历史网页进行聚类,以得到对应的预置偏好群组及预置偏好特征。其中,可以将具有相似偏好特征的不同用户聚类至相同的预置偏好群组。需要说明的是,一个偏好特征可以对应一个或多个预置偏好群组,例如,“篮球”可以对应多个预置偏好群组。另外,由于一个用户可以具有多个偏好特征,故用户可以属于多个预置偏好群组。
在本发明的再一种可选实施例中,获取预置偏好群组的过程具体可以包括:从即时通讯程序、社交网站、BBS网站中的已有群组中获取群组及对应的预置偏好特征。以腾讯、微信等即时通讯程序为例,可以依据其群组的群名称、群简介、聊天记录等获取对应的偏好特征,或者,还可以采集其群组的群用户的历史网页,对所有群用户的历史网页进行分析,以得到共现的偏好特征等。同理,可以对微博、豆瓣等社交网站进行分析,以得到其群组的偏好特征,可以理解,本发明实施例对于预置偏好群组及其偏好特征的具体获取过程不加以限制。
在本发明的一种应用示例3中,假设用户C的偏好特征包含“中关村”、“母婴”和“幼儿园”等,则可以确定其所属的目标偏好群组为“中关村幼儿园”、“中科院幼儿园”、“中关村小学”等,从而可以向用户C推荐“中关村幼儿园”、“中科院幼儿园”中其他群用户收藏或浏览过的网页,如“中国科学院幼儿园中关村实验园”、“明天第四幼儿园”等,以满足用户C对于中关村附近幼儿园信息的访问需求。进一步,还可以向用户C推荐“中关村小学”中其他群用户收藏或浏览过的网页,如“家长帮”等,以满足用户C对于中关村附近小学信息的访问需求。
在本发明的又一种可选实施例中,上述关注行为具体可以包括如下行为中的至少一种:浏览行为、收藏行为、评论行为、点赞行为、转发行为、关注行为、复制行为、标记行为和保存行为。例如,用户D在浏览到网页1时,觉得该网页1暂时不被用到、将来可能被用到,因此可以针对网页1产生标记行为或收藏行为。又如,用户E在浏览到网页2时,对该网页2的内容比较感兴趣,因此通过评论区域提交了相应的评论内容,则可以认为用户B针对网页2产生了评论行为。再如,用户F在朋友圈中看到一条微博内容1的摘要,觉得不错,故针对该条微博内容1发出了点赞行为,则可以认为用户F针对该条微博内容1对应网页3产生了点赞行为。
综上,上述技术方案2将当前用户的偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的偏好特征对应的目标偏好群组,能够得到契合当前用户的偏好特征的目标偏好群组,进而可以得到契合当前用户的偏好需求的目标网页。
以上通过技术方案1和技术方案2对确定当前用户所属的目标区域特征和目标偏好群组的过程进行了详细介绍,可以理解,本领域技术人员可以根据实际应用需求,采用上述技术方案1和技术方案2中的任一或者组合,或者,还可以采用确定当前用户所属的目标用户群组的其他技术方案,例如,还可以依据当前用户的属性特征获取对应的目标属性群组等。例如,用户G的年龄为30岁,则可以确定其对应的目标属性群组为“三十而立”,又如,用户H的职业为JAVA程序员,则可以确定其对应的目标属性群组为“JAVA兴趣小组”,再如,用户I为住在玉渊潭附近的老人,则可以确定其对应的目标属性群组为“玉渊潭晨练俱乐部”、或者“玉渊潭老年俱乐部”等,可以理解,本发明实施例对于确定当前用户所属的目标用户群组的具体技术方案不加以限制。
步骤202、依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;
在本发明的一种可选实施例中,步骤202可以将所述目标用户群组中一些群用户关注过的网页,作为作为推荐给当前用户的目标网页。以上述应用示例1为例,假设预置区域群组“清华大学”中一些群用户收藏了清华大学学校教务处、水木清华BBS、水木社区BBS等网站的主页,则可以将上述主页作为推荐给当前用户A的目标网页。
在本发明的另一种可选实施例中,步骤202还可以将所述目标用户群组中一些群用户使用较为频繁的网页,也即符合预置频繁条件的网页,作为推荐给当前用户的目标网页。例如,清华同学自主开发的网站Z可以用于查询空闲自习室等信息,在预置区域群组“清华大学”中部分群用户的使用较为频繁,故也可以向用户A推荐该网站Z的主页以供收藏。其中,可以依据网页在预定时间段内的使用频率来确定符合预置频繁条件的网页,例如,网页在预定时间段内的使用频率大于频率阈值等。其中,上述预定时间段可以为最近的时间段,且其长度可以根据实际应用需求确定,可以理解,本发明实施例对于具体的预定时间段及其长度不加以限制。
在本发明的再一种可选实施例中,所述依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页的步骤,包括:依据所述目标用户群组的历史关注行为,获取相应的关注特征,并从所述关注特征所对应的网页中选择待推荐的目标网页。其中,上述关注特征可用于标识目标用户群组在预定时间段内的兴趣标签,故从所述关注特征所对应的网页中选择待推荐的目标网页,能够契合整个目标用户群组的兴趣偏好。
在本发明的又一种可选实施例中,上述关注特征具体可以包括:关注行为种类、关注行为数量、关注人数、最近关注时间、关注行为的持续时长等;其中,最近关注时间距离当前越近,则对应的权重越高;以浏览行为为例,其持续时长(停留时间)越长则表示用户对其关注度越高,反之,若其持续时长小于时间阈值(5s),则表示用户对其不感兴趣,因此,可以将其滤除。可以理解,本发明实施例对于具体的关注特征不加以限制。
在本发明的一种可选实施例中,可以对所述关注行为所对应的网页进行排序,并依据排序结果,从所述关注行为所对应的网页中选择待推荐的目标网页。其中,上述排序所采用的排序特征具体可以包括:使用频率、关注特征与当前用户的偏好特征的匹配度等,可以理解,本发明实施例对于具体的排序特征不加以限制。
以上对步骤202获取待推荐的目标网页的过程进行了详细介绍,可以理解,本领域技术人员可以根据实际应用需求依据所述目标用户群组的历史关注行为所对应的历史网页,采用获取待推荐的目标网页的任意过程,本发明实施例对于步骤202获取待推荐的目标网页的具体过程不加以限制。
步骤203、向当前用户推荐所述目标网页。
在实际应用中,步骤203可以通过预置展示方式,向当前用户推荐所述目标网页。例如,可以弹出不同于当前网页的显示窗口,并通过该显示窗口展示上述目标网页;或者,在当前网页上加载一个类似于透明蒙版的层,在此层上显示对所述目标网页等。其中,可以显示上述目标网页的URL(统一资源定位符,Uniform Resoure Locator)、超链接等信息,可以理解,本发明实施例对于向当前用户推荐所述目标网页的具体过程不加以限制。
在本发明的一种可选实施例中,在所述向当前用户推荐所述目标网页的步骤203之前,所述方法还可以包括:对所述目标网页与当前用户的收藏夹内容进行比较,以得到对应的比较结果;
则所述向当前用户推荐所述目标网页的步骤203,具体可以包括:依据所述比较结果,向当前用户推荐与所述收藏夹内容不同的目标网页。
本可选实施例可用于收藏夹内容的推荐,具体地,可以基于目标网页与收藏夹内容的比较结果,向当前用户推荐与所述收藏夹内容不同的目标网页,从而可以避免网页的重复推荐。
在本发明的另一种可选实施例中,还可以在离线获取目标网页的过程中进行收藏夹内容的比较,由此可以实现待推荐的网页的不重复和不间断更新。相应地,所述依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页的步骤202,具体可以包括:
按照预设周期遍历所述目标用户群组的历史关注行为所对应的历史网页,以得到更新的目标历史网页;其中,该预设周期可用于表示目标历史网页的更新周期,其可以为24小时、12小时、48小时等预置长度的周期。目标用户群组的历史关注行为可以是目标用户群组内所有用户在该预设周期内的历史关注行为。
对所述目标历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
则所述向当前用户推荐所述目标网页的步骤203,具体可以包括:向当前用户推荐与所述收藏夹内容不同的目标历史网页。
在本发明的另一种可选实施例中,还可以监测目标用户群组内用户的历史关注行为及其所对应的历史网页,由此可以实现待推荐的网页的及时更新。相应地,所述依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页的步骤202,具体可以包括:
监测所述目标用户群组内用户的历史关注行为及其所对应的历史网页;
在监测到所述历史网页后,对所述历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
则所述向当前用户推荐所述目标网页的步骤203,具体可以包括:
向当前用户推荐与所述收藏夹内容不同的目标历史网页。
例如,目标用户群组内用户均为某明星的粉丝,则在该目标用户群组内一个用户观看并收藏了该明星的最新新闻网页后,本发明实施例可以及时监测到该最新新闻网页,并将该最新新闻网页推荐给该目标用户群组内的其他用户。
进一步,可以依据当前用户对于与所述收藏夹内容不同的目标网页的触发操作,执行相应的网页收藏操作,也即,可以将上述触发操作对应的目标网页添加至收藏夹。
综上,本发明实施例具有如下优点:
首先,由于本发明实施例向当前用户推荐所述目标网页为依据当前用户所属目标用户群组的历史关注行为所对应的历史网页确定的网页,而用户群组内不同群用户的访问需求往往具有相同之处,故所述目标网页可以在不受网页访问频率的限制,且能够契合当前用户的访问需求以及提高网页推荐的准确率。
例如,本发明实施例可以挖掘出一些访问频率较低(一年只用一次)或者用户不知道的有价值网站(如学校的成绩查询网站),推荐给用户,供其浏览收藏;用户在以后的浏览器使用中可以很方便的访问一些网站,并且用户根据***推荐发现了很多有价值网站,提升了用户的使用体验。
其次,在用户初次安装浏览器时,由于浏览器中并不存在历史网页,因此,现有的推荐方式无法实现收藏夹内容的准确推荐;或者,在用户具有新访问需求时,历史网页与该新访问需求不相关,因此,现有的推荐方式无法实现收藏夹内容的准确推荐。而本发明实施例可以利用地理位置等信息进行网页推荐的冷启动,即使用户没有浏览信息或者浏览信息与现在新的浏览目的不匹配时也可以确定当前用户所属的目标区域群组,进而可以依据所述目标区域群组群组的历史关注行为所对应的历史网页获取向当前用户推荐的目标网页。
方法实施例二
参照图3,示出了本发明的一种网页处理方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤301、确定当前用户所属的目标用户群组;
步骤302、依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;
步骤303、采集当前用户的当前环境信息;
步骤304、在所述当前环境信息符合预置的新访问需求条件时,向当前用户推荐所述目标网页。
为了避免推荐的网页对于用户的打扰,本发明实施例中预置的新访问需求条件可用于表示用户存在新的访问需求,也即本发明实施例可以在用户存在新的访问需求时向当前用户推荐所述目标网页,从而提高网页推荐的智能性和及时性。
本发明实施例中,所述当前环境信息符合预置的新访问需求条件,具体可以包括如下条件中的至少一种:
条件1、当前位置特征相对于历史位置特征的变化符合预置的区域变化条件。
例如,用户J为清华大学的教职工,其之前使用自己的笔记本在家上网,现在使用同一个笔记本在清华大学上网,可以认为该笔记本的位置特征发生了变化、而存在新位置对应的访问需求,因此,可以认为用户存在新的访问需求。其中,对于同一智能终端而言,在其首次到达某个位置时,可以认为当前位置特征相对于历史位置特征的变化符合预置的区域变化条件;可选地,上述当前位置特征相对于历史位置特征的变化的持续时间可以大于时间阈值,在实际应用中,可以设定该时间阈值,这样当位置特征变化的持续时间大于该时间阈值,可以认为符合预置的区域变化条件;当然,本发明实施例对于具体的预置的区域变化条件不加以限制。
条件2、当前浏览器的使用信息和/或安装信息符合预置的使用条件。
上述浏览器可用于表示计算机中浏览器、智能手机或平板电脑中嵌入式APP等具有网页显示功能的装置,其使用信息具体可以包括:使用次数、最近使用时间等,上述安装信息具体可以包括:安装时间等。可选地,上述预置的使用条件可以表示用户初次安装浏览器、以至于浏览器中不存在任何历史网页,所以此种情况下存在新的访问需求。或者,上述预置的使用条件可以表示用户对于浏览器的使用次数小于阈值、以至于浏览器中存在有限的历史网页,所以此种情况下存在新的访问需求。或者,上述预置的使用条件可以表示最近使用时间表明用户较长时间未使用过浏览器、以至于访问需求发生了变化。可以理解,本领域技术人员可以根据实际应用需求,采用所需的预置的使用条件,本发明实施例对于具体的预置的使用条件不加以限制。
方法实施例三
参照图4,示出了本发明的一种网页处理方法实施例三的步骤流程图,具体可以包括如下步骤:
步骤401、确定当前用户所属的目标用户群组;
步骤402、依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;
步骤403、向当前用户推荐所述目标网页。
相对于图2所示方法实施例一或者图3所示方法实施例二,本实施例的方法还可以包括:
步骤404、获取与所述目标用户群组相匹配、且在预定时间段内新增的新增网页;
步骤405、向当前用户推荐所述新增网页。
在实际应用中,目标用户群组所关注的网页可能会随着时间的推移而发生变化,例如,在最近一个时间段内发生热门事件时,而该热门事件刚好与所述目标用户群组相匹配,则目标用户群组也会关注热门事件对应的网页。因此,本发明实施例可以将新增网页及时推荐给当前用户,以提高网页推荐的智能性。
在实际应用中,可以首先获取在预定时间段内新增的新增网页,然后将该新增网页与目标用户群组的预置偏好特征进行匹配,并将匹配度大于匹配度阈值的新增网页推荐给用户。其中,在将该新增网页与目标用户群组的预置偏好特征进行匹配之前,可以确定新增网页的热度,然后依据该热度过滤掉热度小于热度阈值的新增网页,并针对热度超过热度阈值的新增网页进行匹配。其中,可以依据新增网页的关注行为确定其热度,本发明实施例对于热度的具体确定过程不加以限制。
方法实施例四
参照图5,示出了本发明的一种网页处理方法实施例四的步骤流程图,具体可以包括如下步骤:
步骤501、确定当前用户所属的目标用户群组;
步骤502、依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;
步骤503、向当前用户推荐所述目标网页。
相对于图2所示方法实施例一或者图3所示方法实施例二,本实施例的所述确定当前用户所属的目标用户群组的步骤502,具体可以包括:
步骤521、监测当前用户在最近一个时间段内主动收藏的符合预置新增条件的第一网页;
步骤522、依据所述第一网页,获取当前用户的新增偏好特征;
步骤523、将当前用户的新增偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的新增偏好特征对应的目标偏好群组。
本实施例中,最近一个时间段可用于终止时间为当前时间的一个时间区间,其长度可由本领域技术人员确定,例如,该长度可以为24小时、48小时、一周等。该符合预置新增条件的第一网页可用于表示当前用户在之前未关注、但在最近一个时间段内开始关注的网页,也即,该第一网页对于当前用户而言为反映其新增偏好的网页。在实际应用中,可以将最近一个时间段内主动收藏的网页与最近一个时间段之前的历史网页进行比对分析,若最近一个时间段内存在与历史网页实质不同的网页,则可以将该网页作为符合预置新增条件的第一网页。
在本发明的一种应用示例4中,假设用户K以前从来没有关注过“手工制作”,因此,也不会收藏关于有关“手工制作”的网站,故其历史网页中不会包含此类网站,但是在最近一个时间段(例如一周内)用户K对“手工制作”感兴趣,收藏了好几个关于“手工制作”的第一网页,此种情况下,可以依据所述第一网页,获取当前用户的新增偏好特征“手工制作”,并得到对应的目标偏好群组(如“手工制作爱好者小组”、“手工制作交流小组”等),由此可以步骤503可以将这些目标偏好群组中其他用户的收藏夹中与“手工制作”相关的、但是用户K没有收藏的推荐给用户K。由此,可以向用户K提供契合其新增偏好的网页。
在本发明的一种可选实施例中,所述确定当前用户所属的目标用户群组的步骤502,还可以包括:
采集当前用户的常用位置特征;
依据所述常用位置特征,对所述当前用户的新增偏好特征对应的目标偏好群组进行筛选,以得到最终的目标用户群组。
上述常用位置特征可用于当前用户的位置特征中频繁出现的位置特征,如家庭和公司对应的位置特征等。本可选实施例可以在步骤523得到的目标用户群组的数量较多时,利用常用位置特征对其进行筛选,以得到更符合常用位置特征的、更符合实际的目标用户群组。例如,用户K为清华大学的学生,同时家住xx小区,则最终的目标用户群组可以包括:清华大学和xx小区中有关“手工制作”的目标用户群组,由此可以实现网页的精确推荐。
方法实施例五
参照图6,示出了本发明的一种网页处理方法实施例五的步骤流程图,具体可以包括如下步骤:
步骤601、根据当前用户的设置信息,判断是否进行网页推荐,若是,则执行步骤602和步骤604,否则结束流程;
其中,可以提供设置接口,以使用户通过该设置接口设置是否使用网页推荐功能,也即,上述设置信息具体可以包括:是或否等,可以理解,本发明实施例对于是否使用网页推荐功能的具体设置方式不加以限制。
步骤602、确定当前用户所属的目标用户群组;
步骤603、依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;
步骤604、获取当前用户的收藏夹内容;
步骤605、对所述目标网页与所述收藏夹内容进行比较,以得到对应的比较结果;
步骤606、依据比较结果,判断所述收藏夹内容是否需要更新,若是,则执行步骤607,否则结束流程;
步骤607、向当前用户推荐与所述收藏夹内容不同的目标网页;
步骤608、依据当前用户对于与所述收藏夹内容不同的目标网页的触发操作,执行相应的网页收藏操作。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的运动动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图7,示出了本发明的一种网页处理装置实施例的结构框图,具体可以包括:群组确定模块701、网页获取模块702和网页推荐模块703。
其中,群组确定模块701,用于确定当前用户所属的目标用户群组;
网页获取模块702,用于依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;以及
网页推荐模块703,用于向当前用户推荐所述目标网页。
在本发明的一种可选实施例中,所述群组确定模块701,具体可以包括:
第一采集子模块,用于采集当前用户的当前位置特征;以及
第一匹配子模块,用于将当前位置特征与预置区域群组所对应的预置位置特征进行匹配,以得到所述当前位置特征对应的目标区域群组。
在本发明的另一种可选实施例中,所述群组确定模块701,具体可以包括:
第一特征获取子模块,用于依据当前用户的历史关注行为所对应的历史网页,获取当前用户的偏好特征;以及
第二匹配子模块,用于将当前用户的偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的偏好特征对应的目标偏好群组。
在本发明的再一种可选实施例中,所述网页获取模块702,具体可以包括:
选择子模块,用于依据所述目标用户群组的历史关注行为,获取相应的关注特征,并从所述关注特征所对应的网页中选择待推荐的目标网页。
在本发明的又一种可选实施例中,所述装置还可以包括:
信息采集模块,用于在所述网页推荐模块向当前用户推荐所述目标网页之前,采集当前用户的当前环境信息;
则所述网页推荐模块703,具体可以包括:
第一推荐子模块,用于在所述当前环境信息符合预置的新访问需求条件时,向当前用户推荐所述目标网页。
在本发明的一种可选实施例中,所述当前环境信息符合预置的新访问需求条件,具体可以包括:
当前位置特征相对于历史位置特征的变化符合预置的区域变化条件;和/或
当前浏览器的使用信息和/或安装信息符合预置的使用条件。
在本发明的另一种可选实施例中,所述装置还可以包括:
比较模块,用于对所述目标网页与当前用户的收藏夹内容进行比较,以得到对应的比较结果;
则所述网页推荐模块703,具体可以包括:
第二推荐子模块,用于依据所述比较结果,向当前用户推荐与所述收藏夹内容不同的目标网页。
在本发明的再一种可选实施例中,所述装置还可以包括:
新增获取模块,用于获取与所述目标用户群组相匹配、且在预定时间段内新增的新增网页;
新增推荐模块,用于向当前用户推荐所述新增网页。
在本发明的一种可选实施例中,所述网页获取模块702,具体可以包括:
遍历子模块,用于按照预设周期遍历所述目标用户群组的历史关注行为所对应的历史网页,以得到更新的目标历史网页;以及
第一比较子模块,用于对所述目标历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
则所述网页推荐模块703,具体可以包括:
第三推荐子模块,用于向当前用户推荐与所述收藏夹内容不同的目标历史网页。
在本发明的一种可选实施例中,所述网页获取模块702,具体可以包括:
第一监测子模块,用于监测所述目标用户群组内用户的历史关注行为及其所对应的历史网页;以及
第二比较子模块,用于在监测到所述历史网页后,对所述历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
则所述网页推荐模块703,具体可以包括:
第四推荐子模块,用于向当前用户推荐与所述收藏夹内容不同的目标历史网页。
在本发明的又一种可选实施例中,所述群组确定模块701,具体可以包括:
第二监测子模块,用于监测当前用户在最近一个时间段内主动收藏的符合预置新增条件的第一网页;
第二特征获取子模块,用于依据所述第一网页,获取当前用户的新增偏好特征;
群组获取子模块,用于将当前用户的新增偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的新增偏好特征对应的目标偏好群组。
在本发明的一种可选实施例中,所述群组确定模块701,还可以包括:
采集子模块,用于采集当前用户的常用位置特征;
筛选子模块,用于依据所述常用位置特征,对所述当前用户的新增偏好特征对应的目标偏好群组进行筛选,以得到最终的目标用户群组。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种用于网页处理的装置900的框图。例如,装置900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图8,装置900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制装置900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为装置900的各种组件提供电力。电源组件906可以包括电源管理***,一个或多个电源,及其他与为装置900生成、管理和分配电力相关联的组件。
多媒体组件908包括在所述装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动运动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当装置900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/O接口912为处理组件902和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为装置900提供各个方面的状态评估。例如,传感器组件914可以检测到设备900的打开/关闭状态,组件的相对定位,例如所述组件为装置900的显示器和小键盘,传感器组件914还可以检测装置900或装置900一个组件的位置改变,用户与装置900接触的存在或不存在,装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件916经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由装置600的处理器620执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由智能终端的处理器执行时,使得智能终端能够执行一种网页处理方法,所述方法包括:确定当前用户所属的目标用户群组;依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页;向当前用户推荐所述目标网页。
图9是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作***1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种网页处理方法、一种网页处理装置和一种用于网页处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (25)

1.一种网页处理方法,其特征在于,包括:
通过预置查询接口查询当前用户终端的网络之间互连的协议IP信息,将当前IP信息与预置区域群组的IP信息范围进行匹配,得到所述当前IP信息对应的目标区域群组,其中,同一个所述预置区域群组内的IP信息的前预设数量位相同;
确定当前用户所属的目标用户群组,所述目标用户群组包括所述目标区域群组,所述目标用户群组与学校或公司相应;
依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,所述历史关注行为包括:历史收藏行为和历史访问行为,所述目标网页包括:访问频率符合预设低频率条件、且在所述目标用户群组中的收藏比例符合预设高比例条件的网页;
其中,在所述目标用户群组与所述学校相应的情况下,所述目标网页包括所述学校的官方网页和/或所述学校内部组织的官方网页,所述官方网页用于为所述目标用户群组内的用户提供学业信息查询和/或布告通知;在所述目标用户群组与所述公司相应的情况下,所述目标网页包括所述公司的相关网页,所述相关网页包括公司简介页、公司邮箱页和/或公司办公页;
向当前用户推荐所述目标网页;
所述依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,包括:
按照预设周期遍历所述目标用户群组的历史关注行为所对应的历史网页,以得到更新的目标历史网页;
对所述目标历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
所述向当前用户推荐所述目标网页,包括:
向当前用户推荐所述与所述收藏夹内容不同的目标历史网页;或者,
在当前环境信息符合预置的新访问需求条件的情况下,向当前用户推荐所述目标网页;
其中,所述当前环境信息符合预置的新访问需求条件包括以下至少一项:所述用户终端首次到达一个位置的持续时间大于时间阈值、初次安装应用、所述应用的使用次数小于次数阈值或者所述应用的最近使用时间距离当前时间大于使用时间阈值,所述使用时间阈值用于指示使得用户的访问需求发生改变的最近使用时间。
2.根据权利要求1所述的方法,其特征在于,所述确定当前用户所属的目标用户群组的步骤,包括:
依据当前用户的历史关注行为所对应的历史网页,获取当前用户的偏好特征;
将当前用户的偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的偏好特征对应的目标偏好群组。
3.根据权利要求1所述的方法,其特征在于,所述依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页的步骤,包括:
依据所述目标用户群组的历史关注行为,获取相应的关注特征,并从所述关注特征所对应的网页中选择待推荐的目标网页。
4.根据权利要求1所述的方法,其特征在于,在所述向当前用户推荐所述目标网页的步骤之前,所述方法还包括:
对所述目标网页与当前用户的收藏夹内容进行比较,以得到对应的比较结果;
则所述向当前用户推荐所述目标网页的步骤,包括:
依据所述比较结果,向当前用户推荐与所述收藏夹内容不同的所述目标网页。
5.根据权利要求1所述的方法,其特征在于,所述依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页的步骤,包括:
监测所述目标用户群组内用户的历史关注行为及其所对应的历史网页;
在监测到所述历史网页后,对所述历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
则所述向当前用户推荐所述目标网页的步骤,包括:
向当前用户推荐所述与所述收藏夹内容不同的目标历史网页。
6.根据权利要求1所述的方法,其特征在于,所述确定当前用户所属的目标用户群组的步骤,包括:
监测当前用户在最近一个时间段内主动收藏的符合预置新增条件的第一网页;
依据所述第一网页,获取当前用户的新增偏好特征;
将当前用户的新增偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的新增偏好特征对应的目标偏好群组。
7.根据权利要求6所述的方法,其特征在于,所述确定当前用户所属的目标用户群组的步骤,还包括:
采集当前用户的常用位置特征;
依据所述常用位置特征,对所述当前用户的新增偏好特征对应的目标偏好群组进行筛选,以得到最终的目标用户群组。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取与所述目标用户群组相匹配、且在预定时间段内新增的新增网页;
向当前用户推荐所述新增网页。
9.一种网页处理装置,其特征在于,包括:
群组确定模块,包括第一采集子模块和第一匹配子模块;所述第一采集子模块,用于通过预置查询接口查询当前用户终端的网络之间互连的协议IP信息;
所述第一匹配子模块,用于将当前IP信息与预置区域群组的IP信息范围进行匹配,得到所述当前IP信息对应的目标区域群组,其中,同一个所述预置区域群组内的IP信息的前预设数量位相同;
所述群组确定模块,还用于确定当前用户所属的目标用户群组,所述目标用户群组包括所述目标区域群组,所述目标用户群组与学校或公司相应;
网页获取模块,用于依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,所述历史关注行为包括:历史收藏行为和历史访问行为,所述目标网页包括:访问频率符合预设低频率条件、且在所述目标用户群组中的收藏比例符合预设高比例条件的网页;
其中,在所述目标用户群组与所述学校相应的情况下,所述目标网页包括所述学校的官方网页和/或所述学校内部组织的官方网页,所述官方网页用于为所述目标用户群组内的用户提供学业信息查询和/或布告通知;在所述目标用户群组与所述公司相应的情况下,所述目标网页包括所述公司的相关网页,所述相关网页包括公司简介页、公司邮箱页和/或公司办公页;
网页推荐模块,用于向当前用户推荐所述目标网页;
遍历子模块,用于按照预设周期遍历所述目标用户群组的历史关注行为所对应的历史网页,以得到更新的目标历史网页;
第一比较子模块,用于对所述目标历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
所述网页推荐模块包括第一推荐子模块和第三推荐子模块;所述第三推荐子模块,用于向当前用户推荐所述与所述收藏夹内容不同的目标历史网页;
所述第一推荐子模块,用于在当前环境信息符合预置的新访问需求条件的情况下,向当前用户推荐所述目标网页;
其中,所述当前环境信息符合预置的新访问需求条件包括以下至少一项:所述用户终端首次到达一个位置的持续时间大于时间阈值、初次安装应用、所述应用的使用次数小于次数阈值或者所述应用的最近使用时间距离当前时间大于使用时间阈值,所述使用时间阈值用于指示使得用户的访问需求发生改变的最近使用时间。
10.根据权利要求9所述的装置,其特征在于,所述群组确定模块包括:
第一特征获取子模块,用于依据当前用户的历史关注行为所对应的历史网页,获取当前用户的偏好特征;以及
第二匹配子模块,用于将当前用户的偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的偏好特征对应的目标偏好群组。
11.根据权利要求9所述的装置,其特征在于,所述网页获取模块,包括:
选择子模块,用于依据所述目标用户群组的历史关注行为,获取相应的关注特征,并从所述关注特征所对应的网页中选择待推荐的目标网页。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括:
比较模块,用于对所述目标网页与当前用户的收藏夹内容进行比较,以得到对应的比较结果;
则所述网页推荐模块包括:
第二推荐子模块,用于依据所述比较结果,向当前用户推荐与所述收藏夹内容不同的所述目标网页。
13.根据权利要求9所述的装置,其特征在于,所述装置还包括:
新增获取模块,用于获取与所述目标用户群组相匹配、且在预定时间段内新增的新增网页;
新增推荐模块,用于向当前用户推荐所述新增网页。
14.根据权利要求9所述的装置,其特征在于,所述网页获取模块包括:
第一监测子模块,用于监测所述目标用户群组内用户的历史关注行为及其所对应的历史网页;以及
第二比较子模块,用于在监测到所述历史网页后,对所述历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
则所述网页推荐模块包括:
第四推荐子模块,用于向当前用户推荐所述与所述收藏夹内容不同的目标历史网页。
15.根据权利要求9所述的装置,其特征在于,所述群组确定模块包括:
第二监测子模块,用于监测当前用户在最近一个时间段内主动收藏的符合预置新增条件的第一网页;
第二特征获取子模块,用于依据所述第一网页,获取当前用户的新增偏好特征;
群组获取子模块,用于将当前用户的新增偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的新增偏好特征对应的目标偏好群组。
16.根据权利要求15所述的装置,其特征在于,所述群组确定模块还包括:
采集子模块,用于采集当前用户的常用位置特征;
筛选子模块,用于依据所述常用位置特征,对所述当前用户的新增偏好特征对应的目标偏好群组进行筛选,以得到最终的目标用户群组。
17.一种用于网页处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于所述存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
通过预置查询接口查询当前用户终端的网络之间互连的协议IP信息,将当前IP信息与预置区域群组的IP信息范围进行匹配,得到所述当前IP信息对应的目标区域群组,其中,同一个所述预置区域群组内的IP信息的前预设数量位相同;
确定当前用户所属的目标用户群组,所述目标用户群组包括所述目标区域群组,所述目标用户群组与学校或公司相应;
依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,所述历史关注行为包括:历史收藏行为和历史访问行为,所述目标网页包括:访问频率符合预设低频率条件、且在所述目标用户群组中的收藏比例符合预设高比例条件的网页;
其中,在所述目标用户群组与所述学校相应的情况下,所述目标网页包括所述学校的官方网页和/或所述学校内部组织的官方网页,所述官方网页用于为所述目标用户群组内的用户提供学业信息查询和/或布告通知;在所述目标用户群组与所述公司相应的情况下,所述目标网页包括所述公司的相关网页,所述相关网页包括公司简介页、公司邮箱页和/或公司办公页;
向当前用户推荐所述目标网页;
所述依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,包括:
按照预设周期遍历所述目标用户群组的历史关注行为所对应的历史网页,以得到更新的目标历史网页;
对所述目标历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
所述向当前用户推荐所述目标网页,包括:
向当前用户推荐所述与所述收藏夹内容不同的目标历史网页;或者,
在当前环境信息符合预置的新访问需求条件时,向当前用户推荐所述目标网页;
其中,所述当前环境信息符合预置的新访问需求条件包括以下至少一项:所述用户终端首次到达一个位置的持续时间大于时间阈值、初次安装应用、所述应用的使用次数小于次数阈值或者所述应用的最近使用时间距离当前时间大于使用时间阈值,所述使用时间阈值用于指示使得用户的访问需求发生改变的最近使用时间。
18.根据权利要求17所述的装置,其特征在于,所述确定当前用户所属的目标用户群组,包括:
依据当前用户的历史关注行为所对应的历史网页,获取当前用户的偏好特征;
将当前用户的偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的偏好特征对应的目标偏好群组。
19.根据权利要求17所述的装置,其特征在于,所述依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,包括:
依据所述目标用户群组的历史关注行为,获取相应的关注特征,并从所述关注特征所对应的网页中选择待推荐的目标网页。
20.根据权利要求17所述的装置,其特征在于,在所述向当前用户推荐所述目标网页之前,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对所述目标网页与当前用户的收藏夹内容进行比较,以得到对应的比较结果;
则所述向当前用户推荐所述目标网页,包括:
依据所述比较结果,向当前用户推荐与所述收藏夹内容不同的所述目标网页。
21.根据权利要求17所述的装置,其特征在于,所述依据所述目标用户群组的历史关注行为所对应的历史网页,获取待推荐的目标网页,包括:
监测所述目标用户群组内用户的历史关注行为及其所对应的历史网页;
在监测到所述历史网页后,对所述历史网页与当前用户的收藏夹内容进行比较,以得到与所述收藏夹内容不同的目标历史网页;
则所述向当前用户推荐所述目标网页,包括:
向当前用户推荐所述与所述收藏夹内容不同的目标历史网页。
22.根据权利要求17所述的装置,其特征在于,所述确定当前用户所属的目标用户群组,包括:
监测当前用户在最近一个时间段内主动收藏的符合预置新增条件的第一网页;
依据所述第一网页,获取当前用户的新增偏好特征;
将当前用户的新增偏好特征与预置偏好群组所对应的预置偏好特征进行匹配,以得到当前用户的新增偏好特征对应的目标偏好群组。
23.根据权利要求22所述的装置,其特征在于,所述确定当前用户所属的目标用户群组,还包括:
采集当前用户的常用位置特征;
依据所述常用位置特征,对所述当前用户的新增偏好特征对应的目标偏好群组进行筛选,以得到最终的目标用户群组。
24.根据权利要求17所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取与所述目标用户群组相匹配、且在预定时间段内新增的新增网页;
向当前用户推荐所述新增网页。
25.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至8中一个或多个所述的方法。
CN201610286906.3A 2016-05-03 2016-05-03 网页处理方法和装置、用于网页处理的装置 Active CN107341162B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610286906.3A CN107341162B (zh) 2016-05-03 2016-05-03 网页处理方法和装置、用于网页处理的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610286906.3A CN107341162B (zh) 2016-05-03 2016-05-03 网页处理方法和装置、用于网页处理的装置

Publications (2)

Publication Number Publication Date
CN107341162A CN107341162A (zh) 2017-11-10
CN107341162B true CN107341162B (zh) 2022-11-25

Family

ID=60222089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610286906.3A Active CN107341162B (zh) 2016-05-03 2016-05-03 网页处理方法和装置、用于网页处理的装置

Country Status (1)

Country Link
CN (1) CN107341162B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108230042B (zh) * 2018-01-24 2021-01-01 北京墨丘科技有限公司 需求识别方法、装置、电子设备及计算机可读存储介质
CN110633399A (zh) * 2018-06-01 2019-12-31 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
CN110955821B (zh) * 2018-09-25 2024-05-17 北京搜狗科技发展有限公司 一种推荐方法、装置及可读介质
CN111274492A (zh) * 2020-01-15 2020-06-12 腾讯科技(深圳)有限公司 信息推荐方法、信息推荐装置及计算机可读存储介质
CN112632445A (zh) * 2020-12-30 2021-04-09 广州酷狗计算机科技有限公司 网页播放方法、装置、设备及存储介质
CN112632359B (zh) * 2020-12-30 2023-11-07 北京锐安科技有限公司 信息推荐方法、装置、电子设备和存储介质
CN112507241A (zh) * 2020-12-31 2021-03-16 北京精准沟通传媒科技股份有限公司 车型推荐方法、获取车型推荐列表的方法、***、介质及电子设备
CN113407040A (zh) * 2021-05-13 2021-09-17 北京搜狗科技发展有限公司 一种信息处理方法、装置和介质
CN114492370B (zh) * 2022-01-29 2023-09-01 北京百度网讯科技有限公司 网页识别方法、装置、电子设备和介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102044009A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 群组推荐方法和***
CN102937975A (zh) * 2012-10-17 2013-02-20 北京奇虎科技有限公司 一种网页搜索设备和方法
CN103116614A (zh) * 2013-01-25 2013-05-22 北京奇艺世纪科技有限公司 一种基于用户轨迹的协同过滤推荐方法、装置及***
CN103544623A (zh) * 2013-11-06 2014-01-29 武汉大学 一种基于用户偏好特征建模的Web 服务推荐方法
CN104135693A (zh) * 2014-07-22 2014-11-05 乐视网信息技术(北京)股份有限公司 一种视频播放方法、智能电视及服务器
CN104239450A (zh) * 2014-09-01 2014-12-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2438602A (en) * 2000-10-18 2002-04-29 Johnson & Johnson Consumer Intelligent performance-based product recommendation system
US20070005419A1 (en) * 2005-06-30 2007-01-04 Microsoft Corporation Recommending location and services via geospatial collaborative filtering
US8023963B2 (en) * 2008-01-17 2011-09-20 Garmin Switzerland Gmbh Mobile communication device and method for linking communications with location data
US20100325553A1 (en) * 2009-06-23 2010-12-23 Eyal Levy Network of user-aware multiple-protocol internet browsers
CN104182428A (zh) * 2013-05-28 2014-12-03 腾讯科技(深圳)有限公司 浏览器起始页的生成方法及生成装置
US9420442B2 (en) * 2014-10-06 2016-08-16 Facebook, Inc. Ping compensation factor for location updates

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102044009A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 群组推荐方法和***
CN102937975A (zh) * 2012-10-17 2013-02-20 北京奇虎科技有限公司 一种网页搜索设备和方法
CN103116614A (zh) * 2013-01-25 2013-05-22 北京奇艺世纪科技有限公司 一种基于用户轨迹的协同过滤推荐方法、装置及***
CN103544623A (zh) * 2013-11-06 2014-01-29 武汉大学 一种基于用户偏好特征建模的Web 服务推荐方法
CN104135693A (zh) * 2014-07-22 2014-11-05 乐视网信息技术(北京)股份有限公司 一种视频播放方法、智能电视及服务器
CN104239450A (zh) * 2014-09-01 2014-12-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置

Also Published As

Publication number Publication date
CN107341162A (zh) 2017-11-10

Similar Documents

Publication Publication Date Title
CN107341162B (zh) 网页处理方法和装置、用于网页处理的装置
CN107656938B (zh) 一种推荐方法和装置、一种用于推荐的装置
US20190026285A1 (en) Generating Cards in Response to User Actions on Online Social Networks
CN106605418B (zh) 使用基于位置的服务的移动客户端的电力管理
US10311478B2 (en) Recommending content based on user profiles clustered by subscription data
KR102067278B1 (ko) 친구 추천 방법 및 이를 위한 서버 및 단말
US10244042B2 (en) Pushing suggested search queries to mobile devices
US11106709B2 (en) Recommendation method and device, a device for formulating recommendations
CN107103019B (zh) 促进社交网络用户之间的交互
US10282483B2 (en) Client-side caching of search keywords for online social networks
CN110710190B (zh) 一种生成用户画像的方法、终端、电子设备以及计算机可读存储介质
CN107315487B (zh) 一种输入处理方法、装置及电子设备
US10242114B2 (en) Point of interest tagging from social feeds
WO2017019468A1 (en) Virtual tiles for service content recommendation
CN112445970B (zh) 一种信息推荐方法、装置、电子设备及存储介质
JP2010009315A (ja) 推薦店舗提示システム
CN110020106B (zh) 一种推荐方法、推荐装置和用于推荐的装置
KR20140027011A (ko) 친구 추천 방법 및 이를 위한 서버 및 단말
CN107515869B (zh) 一种搜索方法和装置、一种用于搜索的装置
CN112784142A (zh) 一种信息推荐方法及装置
JP5891909B2 (ja) サーバ装置、プログラム及び通信システム
CN110147426B (zh) 一种查询文本的分类标签确定方法及相关装置
CN113420209A (zh) 基于天气搜索的推荐方法、装置、设备及存储介质
CN110020206B (zh) 一种搜索结果排序方法及装置
CN114218930A (zh) 一种标题生成方法、装置和用于标题生成的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant