CN108268519A - 一种推荐网络对象的方法和装置 - Google Patents

一种推荐网络对象的方法和装置 Download PDF

Info

Publication number
CN108268519A
CN108268519A CN201611263884.5A CN201611263884A CN108268519A CN 108268519 A CN108268519 A CN 108268519A CN 201611263884 A CN201611263884 A CN 201611263884A CN 108268519 A CN108268519 A CN 108268519A
Authority
CN
China
Prior art keywords
network object
access data
data acquisition
acquisition system
geographic area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611263884.5A
Other languages
English (en)
Other versions
CN108268519B (zh
Inventor
靳玉康
马艳玲
许涵斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201611263884.5A priority Critical patent/CN108268519B/zh
Publication of CN108268519A publication Critical patent/CN108268519A/zh
Application granted granted Critical
Publication of CN108268519B publication Critical patent/CN108268519B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种推荐网络对象的方法和装置,其中,所述方法包括:获取各地理区域对各网络对象的访问数据,基于地理区域,对访问数据进行分类,得到各地理区域分别对应的初始访问数据集合,计算各个初始访问数据集合之间的相似度,合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合,基于目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象,使得在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的相应数据的影响,还受到和计算设备所在地理区域相似的其他地理区域的访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。

Description

一种推荐网络对象的方法和装置
技术领域
本申请涉及信息推荐技术领域,具体涉及一种推荐网络对象的方法、一种推荐网络对象的装置。
背景技术
随着信息技术发展,根据用户行为的历史记录为用户提供信息推荐的技术也在不断发展,例如根据用户的购物记录、浏览记录等信息,为用户推荐相似种类的其他商品。
一般来说,基于排行、评分或者用户的其他行为数据都可以进行推荐。现有技术中,通过分析用户所在区域的数据来进行推荐是较为常见的一种方式,但在推荐时无法将其他区域对用户所在区域的影响考虑在内。现有技术仅仅基于本区域的历史数据进行推荐,无法对多个区域的数据进行关联分析,无法实现对数据的充分挖掘和利用。
发明内容
鉴于上述问题,提出了本申请以便提供克服上述问题或者至少部分地解决上述问题的推荐网络对象的方法以及装置。
依据本申请的一个方面,提供了一种推荐网络对象的方法,包括:
获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
计算各个初始访问数据集合之间的相似度;
合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合;
基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。
可选地,所述获取各地理区域对各网络对象的访问数据包括:
获取各计算设备对各网络对象的访问记录;
根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数。
可选地,所述位置信息为访问网络对象时计算设备所处经纬度信息,所述根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数包括:
查找各访问记录的经纬度信息所属的地理区域,所述地理区域采用经纬度范围进行标识;
统计经纬度信息归属于同一地理区域的访问记录的总数。
可选地,所述位置信息为访问网络对象时关联添加的区域地址,所述根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数包括:
根据各访问记录的区域地址中提取的区域信息;
统计区域地址归属于同一地理区域的访问记录的总数。
可选地,在计算各个初始访问数据集合之间的相似度之前,所述方法还包括:
将所述初始访问数据集合的访问数据按照对应网络对象的对象类型进行分类;
对每个分类下的访问数据进行归一化处理。
可选地,在所述基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合之后,所述方法还包括:
在同一初始访问数据集合内,对满足相似条件的多个网络对象的访问数据进行合并。
可选地,所述计算各个初始访问数据集合之间的相似度包括:
计算每两个初始访问数据集合对应的数据矩阵的协方差矩阵;
分别定义每个初始访问数据集合对应的数据矩阵的特征向量,其中特征向量由使所述数据矩阵两两之间具有最大关联的权重确定;
计算每两个所述数据矩阵对应的特征向量的方差和协方差;
推导出每两个初始访问数据集合的典型相关性系数。
可选地,所述计算各个初始访问数据集合之间的相似度包括:
将各初始访问数据集合的访问数据按照网络对象和/或网络对象的对象类型进行排序;
计算任意两个排序后的初始访问数据集合的相似度。
可选地,在所述合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合之后,所述方法还包括:
对一次合并后的多个访问数据集合进行二次合并;
多次执行合并步骤,直至无可合并的访问数据集合。
可选地,所述基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象包括:
获取所述计算设备访问的第一网络对象;
根据所述目标访问数据集合的访问数据,查找与所述第一网络对象的第一对象类型关联的至少一个第二对象类型;
从第二对象类型对应的访问数据中选取至少一个第二网络对象,将所述第二网络对象推送至所述计算设备。
可选地,所述根据所述目标访问数据集合的访问数据,查找与所述第一网络对象的第一对象类型关联的至少一个第二对象类型包括:
计算各对象类型对应的访问数据的综合值;
查找与所述第一对象类型对应的综合值相近的至少一个第二对象类型。
可选地,所述从第二对象类型对应的访问数据中选取至少一个第二网络对象,将所述第二网络对象推送至所述计算设备包括:
选取各第二对象类型中访问数据符合设定要求的至少一个第二网络对象;
将选取的至少一个第二网络对象推送至所述计算设备。
可选地,所述将所述第二网络对象推送至所述计算设备包括:
根据选取的至少一个第二网络对象对应的访问数据,对至少一个第二网络对象进行排序;
按照顺序将所述第二网络对象推送至所述计算设备。
可选地,所述将所述第二网络对象推送至所述计算设备包括:
将所述第二网络对象推送至计算设备,所述第二网络对象携带所属供应方的计算设备标识,以供所述计算设备根据所述供应方的计算设备标识开启与供应方的对话框。
可选地,在所述基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象之前,所述方法还包括:
建立目标访问数据集合与对应的初始访问数据集合对应的地理区域的关联关系。
根据本申请的另一方面,提供了一种推荐网络对象的方法,包括:
接收计算设备当前访问的第一网络对象;
基于具有相似访问行为的多个地理区域对应的历史访问数据推荐第二网络对象;
反馈所述第二网络对象至所述计算设备,以供所述计算设备生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
根据本申请的另一方面,提供了一种推荐网络对象的方法,包括:
获取当前访问的第一网络对象,并上传到服务端;
接收服务端基于具有相似访问行为的多个地理区域对应的历史访问数据推荐的第二网络对象;
生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
根据本申请的另一方面,提供了一种推荐网络对象的方法,包括:
获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
计算各个初始访问数据集合之间的相似度;
将相似度超过预设阈值的初始访问数据集合对应的地理区域进行关联;
对各个地理区域的计算设备推荐其关联地理区域的网络对象。
根据本申请的另一方面,提供了一种推荐网络对象的装置,包括:
访问数据获取模块,用于获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
数据分类模块,用于基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
相似度计算模块,用于计算各个初始访问数据集合之间的相似度;
集合合并模块,用于合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合;
网络对象推荐模块,用于基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。
可选地,所述访问数据获取模块包括:
访问记录获取子模块,用于获取各计算设备对各网络对象的访问记录;
总数统计子模块,用于根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数。
可选地,所述位置信息为访问网络对象时计算设备所处经纬度信息,所述总数统计子模块包括:
地理区域查找子单元,用于查找各访问记录的经纬度信息所属的地理区域,所述地理区域采用经纬度范围进行标识;
第一总数统计子单元,用于统计经纬度信息归属于同一地理区域的访问记录的总数。
可选地,所述位置信息为访问网络对象时关联添加的区域地址,所述总数统计子模块包括:
区域信息提取子单元,用于根据各访问记录的区域地址中提取的区域信息;
第二总数统计子单元,用于统计区域地址归属于同一地理区域的访问记录的总数。
可选地,所述装置还包括:
对象分类模块,用于在计算各个初始访问数据集合之间的相似度之前,将所述初始访问数据集合的访问数据按照对应网络对象的对象类型进行分类;
归一化模块,用于对每个分类下的访问数据进行归一化处理。
可选地,所述装置还包括:
数据合并模块,用于在所述基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合之后,在同一初始访问数据集合内,对满足相似条件的多个网络对象的访问数据进行合并。
可选地,所述相似度计算模块包括:
协方差计算子模块,用于计算每两个初始访问数据集合对应的数据矩阵的协方差矩阵;
特征向量定义子模块,用于分别定义每个初始访问数据集合对应的数据矩阵的特征向量,其中特征向量由使所述数据矩阵两两之间具有最大关联的权重确定;
方差协方差计算子模块,用于计算每两个所述数据矩阵对应的特征向量的方差和协方差;
相关性系数推导子模块,用于推导出每两个初始访问数据集合的典型相关性系数。
可选地,所述相似度计算模块包括:
对象排序子模块,用于将各初始访问数据集合的访问数据按照网络对象和/或网络对象的对象类型进行排序;
相似度计算子模块,用于计算任意两个排序后的初始访问数据集合的相似度。
可选地,所述装置还包括:
二次合并模块,用于在所述合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合之后,对一次合并后的多个访问数据集合进行二次合并;
多次合并模块,用于多次执行合并步骤,直至无可合并的访问数据集合。
可选地,所述网络对象推荐模块包括:
网络对象获取子模块,用于获取所述计算设备访问的第一网络对象;
对象类型查找子模块,用于根据所述目标访问数据集合的访问数据,查找与所述第一网络对象的第一对象类型关联的至少一个第二对象类型;
网络对象推送子模块,用于从第二对象类型对应的访问数据中选取至少一个第二网络对象,将所述第二网络对象推送至所述计算设备。
可选地,所述对象类型查找子模块包括:
综合值计算子单元,用于计算各对象类型对应的访问数据的综合值;
对象类型查找子单元,用于查找与所述第一对象类型对应的综合值相近的至少一个第二对象类型。
可选地,所述网络对象推送子模块包括:
对象选取子单元,用于选取各第二对象类型中访问数据符合设定要求的至少一个第二网络对象;
对象推送子单元,用于将选取的至少一个第二网络对象推送至所述计算设备。
可选地,所述网络对象推送子模块包括:
网络对象排序子单元,用于根据选取的至少一个第二网络对象对应的访问数据,对至少一个第二网络对象进行排序;
对象顺序推送自单元,用于按照顺序将所述第二网络对象推送至所述计算设备。
可选地,所述网络对象推送子模块包括:
标识推送子单元,用于将所述第二网络对象推送至计算设备,所述第二网络对象携带所属供应方的计算设备标识,以供所述计算设备根据所述供应方的计算设备标识开启与供应方的对话框。
可选地,所述装置还包括:
关联关系建立模块,用于在所述基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象之前,建立目标访问数据集合与对应的初始访问数据集合对应的地理区域的关联关系。
根据本申请的另一方面,提供了一种推荐网络对象的装置,包括:
第一对象接收模块,用于接收计算设备当前访问的第一网络对象;
第二对象推荐模块,用于基于具有相似访问行为的多个地理区域对应的历史访问数据推荐第二网络对象;
第二对象反馈模块,用于反馈所述第二网络对象至所述计算设备,以供所述计算设备生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
根据本申请的另一方面,提供了一种计算设备,包括:
网络对象获取模块,用于获取当前访问的第一网络对象,并上传到服务端;
网络对象接收模块,用于接收服务端基于具有相似访问行为的多个地理区域对应的历史访问数据推荐的第二网络对象;
会话框生成模块,用于生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
根据本申请的另一方面,提供了一种推荐网络对象的装置,包括:
访问数据获取模块,用于获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
数据分类模块,用于基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
相似度计算模块,用于计算各个初始访问数据集合之间的相似度;
地理区域关联模块,用于将相似度超过预设阈值的初始访问数据集合对应的地理区域进行关联;
网络对象推荐模块,用于对各个地理区域的计算设备推荐其关联地理区域的网络对象。
依据本申请实施例,通过获取各地理区域对各网络对象的访问数据,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合,计算各个初始访问数据集合之间的相似度,合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合,基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。由此各地理区域的相似度达到设定的访问数据集合进行合并,就会在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的相应数据的影响,还受到和计算设备所在地理区域相似的其他地理区域的访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本申请的一种推荐网络对象的方法的示意图;
图2示出了根据本申请实施例一的一种推荐网络对象的方法实施例的流程图;
图3示出了根据本申请实施例二的一种推荐网络对象的方法实施例的流程图;
图4示出了根据本申请实施例三的一种推荐网络对象的方法实施例的流程图;
图5示出了根据本申请实施例四的一种推荐网络对象的方法实施例的流程图;
图6示出了根据本申请实施例五的一种推荐网络对象的方法实施例的流程图;
图7示出了根据本申请实施例六的一种推荐网络对象的方法实施例的流程图;
图8示出了本申请的一个示例中商品推荐的示意图;
图9示出了本申请的一个示例中商品推荐的过程示意图;
图10示出了本申请的另一个示例中商品推荐的过程示意图;
图11示出了购物数据矩阵的示意图;
图12示出了一种分布式存储***的示意图;
图13示出了根据本申请实施例七的一种推荐网络对象的装置的结构框图;
图14示出了根据本申请实施例八的一种推荐网络对象的装置的结构框图;
图15示出了根据本申请实施例九的一种计算设备的结构框图;
图16示出了根据本申请实施例十的一种推荐网络对象的装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请可以应用在推荐服务中,在很多应用中都需要提供主动或被动的推荐服务。例如用户在电商平台上购买了一件商品后,为了给用户推荐其他商品,需要根据用户的购买行为,基于对其他购买行为的大数据分析结果,为用户推荐与用户的购买行为或个人信息相关的商品。
本申请中,网络对象为可以通过网络访问的任意的对象,对象可以是商品,图片,视频,音乐,小说等中至少一种。对网络对象的访问包括对网络对象进行的购买、加入购物车、收藏、浏览、播放、下载等操作中的任意一种或多种操作。用户基于计算设备对网络对象进行访问产生访问行为,对应于网络对象的种类,计算设备可以对应为购物应用、音乐应用、视频应用、阅读应用、社交应用等。用户通过计算设备在对网络对象进行访问时,计算设备可以记录网络对象的名称、网络对象的种类、访问时的位置信息、用户的标识等。
访问数据为对应表征对网络对象的访问行为的数据,例如可以是对商品的购买量、对商品的订单量、对商品的收藏量、对页面的浏览量、对视频的播放量、对小说的下载量等。多个网络对象的访问数据集合为对多个网络对象的访问数据组成的集合,例如多个商品各自的购买量组成的集合、多个商品各自的订单量组成的集合、多个商品各自的收藏量组成的集合、多个视频各自的播放量组成的集合、多个小说各自的下载量组成的集合等。访问数据集合可以包括初始访问数据集合和目标访问数据集合。初始访问数据集合为单个地理区域对多个网络对象的访问数据组成的集合,其中,地理区域是指针对与访问相关的位置划定地理上的区域,例如购买商品时对计算设备进行定位得到的位置所属的地理区域、购买商品时填写的收货地址所属的地理区域等。目标访问数据集合为至少两个初始访问数据集合进行合并后组成的访问数据集合。如无其他说明,下面以商品为例描述各个实施例。
参照图1,示出了根据本申请的一种推荐网络对象的方法的示意图。
根据各地理区域中各计算设备对各网络对象的访问行为数据,按照计算设备所属的地理区域,分地理区域对各网络对象的访问行为数据进行统计,得到地理区域A的初始访问数据集合1、地理区域B的初始访问数据集合2、地理区域C的初始访问数据集合3,地理区域A的初始访问数据集合1和地理区域B的初始访问数据集合2在整体上具有较强的相似性,也就是地理区域A的计算设备和地理区域B的计算设备的访问行为具有相似性,将地理区域A的初始访问数据集合1和地理区域B的初始访问数据集合2进行合并得到目标访问数据集合1,并且目标访问数据集合1的对应地理区域为地理区域A和B。在进行网络对象推荐时,计算设备M所属地理区域为地理区域A或B,则根据目标访问数据集合1对计算设备推荐网络对象,当然如果计算设备所属的地理区域为地理区域C,则根据初始访问数据集合3对计算设备推荐网络对象。
参照图2,示出了根据本申请实施例一的一种推荐网络对象的方法实施例的流程图,该方法具体可以包括以下步骤:
步骤101,获取各地理区域对各网络对象的访问数据。
访问数据表征对网络对象的访问行为,例如,对商品的购买量、对商品的订单量等。访问数据可以根据用户对网络对象访问时的位置信息,将位置信息指向同一地理区域的表征访问行为的数据统计到一起来产生。例如,将购买一件商品时定位位置属于划定区域的购物数据统计到一起,组成的访问数据为该商品在划定区域的订单量或购买量。
具体而言,一种访问数据的统计方式为直接筛选出单个地理区域对应的访问行为的数据进行加和,一种访问数据的统计方式为是先确定地理区域对应的执行访问行为的各计算设备,然后对各计算设备对应的访问行为的数据进行汇总。
访问数据可以是预先统计,或是获取其他相关***统计的数据。具体的统计方式可以是,由服务器在检测到一次访问行为时,累加得到,或收集一段时间内的访问记录进行统计,访问记录是单个计算设备对单个访问对象的一次访问行为的记录,可以是计算设备也可以是服务器在检测到用户的一次访问行为时生成,通过汇总得到访问数据。计算设备对网络对象进行访问时,访问记录会包括有对应的位置信息,例如购买商品时计算设备的定位位置所属的地理区域。
步骤102,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合。
初始访问数据集合中的各访问数据为单个地理区域对单个网络对象的访问数据。在本申请中,初始访问数据集合是指没有进行过合并的访问数据集合。不同地理区域的初始访问数据集合都是针对相同的多个网络对象。
针对划分的多个地理区域以及预先获取的各地理区域对各网络对象的访问数据,根据地理区域进行分类,将属于同一地理区域的所有的访问数据分为一类,得到初始访问数据集合,具体可以分别收集单个地理区域对所有网络对象的初始访问数据集合,最后得到各个地理区域分别对应的初始访问数据集合。初始访问数据集合可以采用向量、矩阵或是任意适用的方式表示,当采用矩阵的方式表示时,若某个地理区域对某个网络对象并未产生访问数据,则可以以设定字符或是0表示。
例如,获得的原始数据为商品销售情况的数据,其中包括购物时的位置信息、购买商品的名称、购买商品的数量以及购买商品的种类。根据这些数据通过以上方法就可以得到各地理区域的各购买人对所有商品的销量组成的集合。
步骤103,计算各个初始访问数据集合之间的相似度。
访问数据集合之间的相似度是指各地理区域对于网络对象的访问在整体上的相似度,或者说各地理区域对于网络对象的访问产生的数据集合的有代表性的综合指标之间的相似度。其中综合指标是指反应数据集合内部各数据间的关系的指标。访问数据集合之间的相似度可以表征各地理区域对用网络对象的访问行为的相似度。
例如:可以对两个初始访问数据集合进行典型相关分析。典型相关分析(canonical correlation analysis)是利用综合变量对之间的相关关系来反映两组指标之间的整体相似度的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相似度。
考虑两组变量的线性组合,并研究它们之间的相关系数p(u,v)。在所有的线性组合中,找一对相关系数最大的线性组合,用这个组合的单相关系数来表示两组变量的相似度,叫做两组变量的典型相关系数,而这两个线性组合叫做一对典型变量。在两组多变量的情形下,需要用若干对典型变量才能完全反映出它们之间的相似度。下一步,再在两组变量的与u1,v1不相关的线性组合中,找一对相关系数最大的线性组合,它就是第二对典型变量,而且p(u2,v2)就是第二个典型相关系数。这样下去,可以得到若干对典型变量,从而提取出两组变量间的全部信息。
典型相关分析的实质就是在两组随机变量中选取若干个有代表性的综合指标(变量的线性组合),用这些指标的相关关系来表示原来的两组变量的相似度。这在两组变量的相关性分析中,可以起到合理的简化变量的作用。
例如:初始访问数据集合中包括各种苹果的销量数据和各种水果刀的销量数据。针对两个地理区域的初始访问数据集合,给定两组由访问数据组成的向量x1和x2,其中x1中各数值代表一个地理区域的各种苹果的销量数据和各种水果刀的销量数据,x2中各数值代表另一个地理区域的各种苹果的销量数据和各种水果刀的销量数据。x1维度为p1,x2维度为p2,默认p1≤p2。形式化表示如下:
∑是x的协方差矩阵;左上角是x1自己的协方差矩阵;右上角是Cov(x1,x2);左下角是Cov(x2,x1),也是∑12的转置;右下角是x2的协方差矩阵。
从x1和x2的整体入手,定义两个综合变量u和v:
u=aTx1,v=bTx2
其中,a、b为假设的使得u和v具有最大关联的权重。
计算出u和v的方差和协方差:
Var(u)=aT11a,Var(v)=bT22b,Cov(u,v)=aT12b
例如:其中一个u的方差的推导过程如下:
最后,计算得到两个地理区域的初始访问数据集合的典型相关系数Corr(u,v):
在本实施例中,用典型相关系数表示两个初始访问数据集合之间的相似度。具体可以选择任意适用的计算相似度的方式,本实施例对此不做限制。
步骤104,合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合。
初始访问数据集合之间的相似度大于设定阈值,也就是两个地理区域对所有网络对象的访问行为在整体上具有相似性,其中设定阈值可以是任意适用的值,本实施例对此不作限定。
在本实施例中,相似度用两个初始访问数据集合的典型相关系数来表示时,当典型相关系数大于设定阈值时,就可以像线性回归分析一样,认为两个地理区域的初始访问数据集合相似性达到设定要求。
对相似度大于设定阈值的初始访问数据集合进行合并,是指将对相同网络对象访问的访问数据对应的进行合并,可以采用任意适用的合并方式,本实施例对此不作限制。例如,可以将不同初始访问数据集合中每个网络对象对应的访问数据进行加和得到的总值,或者对于每个网络对象对应的访问数据,根据各个地理区域预先设定的系数,将访问数据乘以本地理区域的系数后再分别取总值。将得到的访问数据的总值作为目标访问数据集合中对应网络对象的访问数据。
在本实施例中,各地理区域的初始访问数据集合中可能有些集合可以合并在一起,有些集合可能不与其他集合有相关性,则不与其他集合合并。通过合并相似度大于设定阈值的初始访问数据集合,可能得到一个目标访问数据集合,也可能得到多个目标访问数据集合。
例如,两个地理区域的初始访问数据集合中苹果的种类数相同,水果刀的种类数也相同。将各种苹果和各种水果刀对应的销量数据分别对应地相加,相加后的数据就组成了目标访问数据集合。
在本实施例中,目标访问数据集合对应的地理区域为合并至该目标访问数据集合的初始访问数据集合对应的各个地理区域。
在本实施例中,根据各计算设备对多个网络对象的访问数据,对各地理区域的初始访问数据集合进行大数据分析,分析出初始访问数据集合相近似的地理区域,并将具有相近似特点的地理区域的数据进行合并,将合并的数据作为合并的地理区域的访问数据集合,以作为推荐的依据。
步骤105,基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。
在本申请中,对计算设备进行网络对象的推荐时,计算设备所处的地理区域对应的初始访问数据集合已经合并至目标访问数据集合,对计算设备进行网络对象的推荐可以基于目标访问数据集合进行。
地理区域是指针对与访问相关的位置划定地理上的区域,例如购买商品时对计算设备进行定位得到的位置所属的地理区域、购买商品时填写的收货地址所属的地理区域等。
计算设备所属地理区域是指计算设备访问网络对象时的位置信息所属的地理区域,例如,购买商品时对计算设备进行定位得到的位置所属的地理区域、购买商品时填写的收货地址所属的地理区域等。
地理区域对应的目标访问数据集合为地理区域对应的初始访问数据集合合并至的目标访问数据集合,具体可以通过建立目标访问数据集合与对应的初始访问数据集合对应的地理区域的关联关系,根据计算设备所属地理区域查找都对应的目标访问数据集合。
进行网络对象推荐时可以根据用户通过计算设备对网络对象的访问行为主动进行网络对象的推荐,也可以主动的向计算设备进行网络对象的推荐。例如,计算设备可以是聊天应用,可以根据用户的购物行为,将推荐的商品推送到聊天应用。
基于目标访问数据集合进行网络对象的推荐,可以采用任意适用的推荐方法,本实施例对此不作限制。例如,根据计算设备上一次访问的网络对象,选取相同种类的对应访问数据满足设定条件的其他网络对象,或者选取与该网络对象对应的访问数据相同的其他网络对象,并将选取的网络对象推荐给计算设备。
在本实施例中,基于目标访问数据集合可以给计算设备推荐一个或多个网络对象,具体可以将网络对象按照一定顺序逐次推送到计算设备,或者将多个网络对象以列表形式一次性推送到计算设备。
依据本申请实施例,通过获取各地理区域对各网络对象的访问数据,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合,计算各个初始访问数据集合之间的相似度,合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合,基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象,使得各地理区域的相似度达到设定的访问数据集合进行合并,就会在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的相应数据的影响,还受到和计算设备所在地理区域相似的其他地理区域的访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
本申请的一种优选实施例中,所述步骤103中所述计算各个初始访问数据集合之间的相似度可以包括:
子步骤S1,计算每两个初始访问数据集合对应的数据矩阵的协方差矩阵。
子步骤S2,分别定义每个初始访问数据集合对应的数据矩阵的特征向量,其中特征向量由使所述数据矩阵两两之间具有最大关联的权重确定。
子步骤S3,计算每两个所述数据矩阵对应的特征向量的方差和协方差。
子步骤S4,推导出每两个初始访问数据集合的典型相关性系数。
每个初始访问数据集合可以对应一个由访问数据组成的数据矩阵。针对两个地理区域的初始访问数据集合,给定两组由访问数据组成的向量x1和x2,其中x1中各数值代表一个地理区域的各网络对象的访问数据,x2中各数值代表另一个地理区域的各网络对象的访问数据。x1维度为p1,x2维度为p2,默认p1≤p2。形式化表示如下:
∑是x的协方差矩阵;左上角是x1自己的协方差矩阵;右上角是Cov(x1,x2);左下角是Cov(x2,x1),也是∑12的转置;右下角是x2的协方差矩阵。
从x1和x2的整体入手,定义两个特征向量u和v:
u=aTx1,v=bTx2
其中,a、b为假设的使得u和v具有最大关联的权重。
计算出u和v的方差和协方差:
Var(u)=aT11a,Var(v)=bT22b,Cov(u,v)=aT12b
例如:其中一个u的方差的推导过程如下:
最后,计算得到两个地理区域的初始访问数据集合的典型相关系数Corr(u,v):
本申请的一种优选实施例中,在所述步骤105之前,可以包括:步骤106,建立目标访问数据集合与对应的初始访问数据集合对应的地理区域的关联关系。
目标访问数据集合对应的地理区域为合并至该目标访问数据集合的初始访问数据集合对应的各个地理区域,在得到目标访问数据集合后,可以将对应的各地理区域与目标访问数据集合的关联关系进行记录,以供根据该关联关系,在给计算设备进行推荐时,查找与计算设备对应的目标访问数据集合。
参照图3,示出了根据本申请实施例二的一种推荐网络对象的方法实施例的流程图,该方法具体可以包括以下步骤:
步骤201,获取各计算设备对各网络对象的访问记录。
访问记录是指计算设备对网络对象进行访问时产生的记录信息,具体包括计算设备的用户信息、网络对象的名称、网络对象的类型、与网络对象访问相关的位置信息等记录信息中至少一种。具体可以根据实际需要获取所需的访问记录,本实施例对此不作限制。实际应用中,访问记录具体包括购物记录、浏览记录、收藏记录、搜索记录等记录中至少一种。
在本实施例中,在统计各地理区域对多个网络对象的初始访问数据集合时,针对各地理区域,获取其中各计算设备对网络对象的访问记录。
步骤202,根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数。
访问记录中的位置信息是指计算设备对网络对象访问相关的位置信息,例如计算设备访问网络对象时进行定位得到的位置信息,或者计算设备访问网络对象时填写的位置信息。具体可以是任意适用的位置信息,本实施例对此不作限制。
根据位置信息,查找属于同一地理区域的所有计算设备对各网络对象的访问记录,分别统计各网络对象的访问记录总数,对于商品的购买记录,统计同一地理区域内的购买记录的总数。
本申请的一种优选实施例中,所述步骤202中所述位置信息为访问网络对象时计算设备所处经纬度信息,所述根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数可以包括:
子步骤S5,查找各访问记录的经纬度信息所属的地理区域,所述地理区域采用经纬度范围进行标识。
子步骤S6,统计经纬度信息归属于同一地理区域的访问记录的总数。
位置信息是计算设备访问网络对象时所处经纬度信息,具体可以通过在计算设备访问网络对象时调用定位服务获取经纬度信息。
在本实施例中,地理区域可以根据经纬度进行划分并标识,例如取经度间隔为a和纬度间隔为b,将地球划分为若干个a乘以b大小的区域,并用经纬度范围对划分的地理区域进行标识。具体可以用任意适用的划分方式,本实施例对此不作限制。
根据各访问记录中的经纬度信息,查找对应所属的地理区域,对经纬度信息归属于同一地理区域的访问记录的总数进行统计。
本申请的一种优选实施例中,所述步骤202中所述位置信息为访问网络对象时关联添加的区域地址,所述根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数可以包括:
子步骤S7,根据各访问记录的区域地址中提取的区域信息。
子步骤S8,统计区域地址归属于同一地理区域的访问记录的总数。
在本实施例中,位置信息为访问网络对象时关联添加的区域地址,例如,购买商品时的寄送地理,账单地址等。根据各访问记录中的区域地址,可以提取出区域信息,以此来对区域地址归属于同一地理区域的访问记录的总数进行统计。
步骤203,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合。
步骤204,将所述初始访问数据集合的访问数据按照对应网络对象的对象类型进行分类。
对象类型是指对可以网络对象进行分类的类型,例如商品所属的种类、视频的内容题材等。
在本实施例中,对于同一网络对象,初始访问数据集合的访问数据可以根据该网络对象对应的对象类型进行分类,例如,可以将每个网络对象在初始访问数据集合中的访问数据分对象类型标记,每一项访问数据为网络对象在对应的对象类型下的访问数据。实际应用中,可以将所有网络对象对应每一对象类型的访问数据都记录下来。
步骤205,对每个分类下的访问数据进行归一化处理。
在本实施例中,将访问数据进行分类后,对于每个分类下的访问数据进行归一化处理,具体可以找到每个分类中访问数据的最大值,然后将每个分类中所有访问数据都分别除以该分类中访问数据的最大值,用得到的商更新初始访问数据集合。具体可以用任意适用的归一化处理方式,本实施例对此不作限制。
由于不同地理区域之间访问网络对象的数据规模各不相同,以及不同对象类型下各访问数据的数量级也各不相同,归一化处理后,得到的所有访问数据都在0到1之间,对于之后对初始访问数据集合进行相关分析和进行推荐时,可以忽略数据规模各不相同和不同对象类型下各访问数据的数量级也各不相同造成的差异,着重体现访问数据之间的关系。
步骤206,在同一初始访问数据集合内,对满足相似条件的多个网络对象的访问数据进行合并。
多个网络对象满足相似条件是指网络对象之间在部分属性上具有相似性,由于实际标识网络对象时使用了不同的名称,但网络对象本质上是相同的,可以分析网络对象是否满足相似条件来判断网络对象是否相同。例如,电商平台中商品取名方法很近似,可以通过计算名称之间的相似度,得到名称相似度大于设定阈值的多个商品。
对于每一个初始访问数据集合,在集合内对满足相似条件的多个网络对象的访问数据进行合并,具体可以将多个网络对象合并为一个,相应的访问数据进行相加。
由于网络对象的数量极其多,导致访问数据集合数据量过大,进行合并后,减少了数据量,减少了后续操作的计算量。
步骤207,计算各个初始访问数据集合之间的相似度。
本申请的一种优选实施例中,所述步骤207中所述计算各个初始访问数据集合之间的相似度可以包括:
子步骤S9,将各初始访问数据集合的访问数据按照网络对象和/或网络对象的对象类型进行排序。
子步骤S10,计算任意两个排序后的初始访问数据集合的相似度。
对于各初始访问数据集合,按照网络对象对访问数据进行排序,或者按照网络对象的对象类型进行排序,或者按照网络对象和网络对象的对象类型进行排序,使得各个初始访问数据集合中,访问数据都有相同的排序。然后计算排序后的两个初始访问数据集合的相似度。
例如,访问数据集合进行排序后得到一个数据矩阵,其中按照网络对象的对象类型排列矩阵中的各行数据,按照网络对象排列矩阵中各列数据,如果商品水晶苹果属于的对象类型为苹果,而对象类型苹果对应矩阵中第2行,商品水晶苹果对应矩阵中第4列,水晶苹果对应苹果类型销量为1000,则矩阵中第2行第4列的数据为水晶苹果对应苹果类型的销量,具体数值为1000。
步骤208,合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合。
步骤209,对一次合并后的多个访问数据集合进行二次合并。
访问数据集合可以包括初始访问数据集合和经过合并得到的目标访问数据集合。在本实施例中,对于合并后得到的访问数据集合,以及没有合并的初始访问数据集合,按照步骤208中的方式,任意选取两个访问数据集合,计算两个访问数据集合的相似度,如果两个访问数据集合的相似度大于设定阈值,则将两个访问数据集合进行合并。
步骤210,多次执行合并步骤,直至无可合并的访问数据集合。
在本实施例中,多次执行步骤209中的合并步骤,直到任意两个访问数据集合的相似度都不会大于设定阈值。具体可以将所有访问数据集合两两之间的相似度都计算出来,如果访问数据集合无可合并,则结束合并步骤。
最后得到多个目标访问数据集合,将多个目标访问数据集合存储在服务器或服务器集群中,以供对计算设备进行推荐时获取目标访问数据集合。
步骤211,基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。
依据本申请实施例,通过获取各地理区域对各网络对象的访问数据,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合,计算各个初始访问数据集合之间的相似度,合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合,多次执行合并步骤,直至无可合并的访问数据集合,基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。由此各地理区域的相似度达到设定的访问数据集合进行合并,就会在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的相应数据的影响,还受到和计算设备所在地理区域相似的其他地理区域的访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
进一步在进行合并之前,对网络对象的每个分类下的访问数据进行归一化处理,使得可以忽略数据规模各不相同和不同对象类型下各访问数据的数量级也各不相同造成的差异,着重体现访问数据之间的关系。
进一步在进行合并之前,对满足相似条件的多个网络对象的访问数据进行合并,由于网络对象的数量极其多,导致访问数据集合数据量过大,进行合并后,减少了数据量,减少了后续操作的计算量。
参照图4,示出了根据本申请实施例三的一种推荐网络对象的方法实施例的流程图,该方法具体可以包括以下步骤:
步骤301,获取各地理区域对各网络对象的访问数据。
步骤302,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合。
步骤303,计算各个初始访问数据集合之间的相似度。
步骤304,合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合。
步骤305,获取计算设备访问网络对象时的所属地理区域。
在本实施例中,根据计算设备访问网络对象的历史记录或实时获取的计算设备访问网络对象的记录,获取计算设备访问网络对象时的所属地理区域,具体可以在计算设备访问网络对象时调用定位程序得到位置信息查找计算设备所属的地理区域,或者可以根据计算设备访问网络对象时添加的区域地址查找计算设备所属的地理区域。
步骤306,查找所述计算设备所属地理区域对应的目标访问数据集合。
目标访问数据集合对应的地理区域为合并至该目标访问数据集合的初始访问数据集合对应的各个地理区域。在本实施例中,根据计算设备所属地理区域,查找对应的目标访问数据集合。
步骤307,获取所述计算设备访问的第一网络对象。
第一网络对象为计算设备访问的第一网络对象,具体可以从对网络对象访问的历史记录或者实时的计算设备访问时上报的信息,获取计算设备访问的第一网络对象。
步骤308,根据所述目标访问数据集合的访问数据,查找与所述第一网络对象的第一对象类型关联的至少一个第二对象类型。
对象类型之间的关联可以包括根据访问数据分析出的对象类型之间的关联,例如,对象类型之间所有网络对象的访问数据是相近的,则两个对象类型之间有关联。
在本实施例中,根据第一网络对象,确定第一网络对象的第一对象类型,从目标访问数据集合中的得到归属于第一对象类型的所有网络对象的访问数据,以及其他各对象类型的所有网络对象的访问数据,根据访问数据,查找与第一对象类型关联的至少一个第二对象类型。
本申请的一种优选实施例中,所述步骤308中所述根据所述目标访问数据集合的访问数据,查找与所述第一网络对象的第一对象类型关联的至少一个第二对象类型可以包括:
子步骤S11,计算各对象类型对应的访问数据的综合值。
子步骤S12,查找与所述第一对象类型对应的综合值相近的至少一个第二对象类型。
对象类型对应的访问数据的综合值是指由归属于同一对象类型的网络对象的访问数据根据设定的计算方式得到的综合数据。例如,可以将同一对象类型对应的访问数据进行相加,将得到的总值作为综合值。
在本实施例中,分别计算各对象类型对应的访问数据的综合值。根据计算的结果,查找与第一对象类型对应的综合值相近的至少一个第二对象类型。具体可以设定一个范围,如果第一对象类型对应的访问数据的综合值和第二对象类型对应的访问数据的综合值的差值没有超过设定的发范围,则第一对象类型对应的综合值和第二对象类型对应的综合值相近。
步骤309,从第二对象类型对应的访问数据中选取至少一个第二网络对象,将所述第二网络对象推送至所述计算设备。
从第二对象类型对应的访问数据中选取至少一个第二网络对象,具体可以从至少一个第二对象类型中选取若干个对象类型,再从中选取至少一个第二网络对象,或者可以从每个第二对象类型中,分别选取出至少一个第二网络对象。具体选取的个数本实施例对此不做限制。
将选取的第二网络对象推送至计算设备,具体的推送方式本实施例对此不作限制。例如,可以将第二网络对象的标识,提供者信息,相关介绍,对应的链接等信息中的一种或几种发送至计算设备。
本申请的一种优选实施例中,所述步骤309中所述从第二对象类型对应的访问数据中选取至少一个第二网络对象,将所述第二网络对象推送至所述计算设备可以包括:
子步骤S13,选取各第二对象类型中访问数据符合设定要求的至少一个第二网络对象。
子步骤S14,将选取的至少一个第二网络对象推送至所述计算设备。
选取各第二对象类型中访问数据符合设定要求的至少一个第二网络对象,可以是任意适用的设定要求,本实施例对此不做限制。例如可以设定要求是第二对象类型中访问数据的数值超过设定阈值,或者访问数据的数值在对象类型中是最大值。选取至少一个符合设定要求的访问数据对应的第二网络对象,然后推送至计算设备。
进一步,所述步骤309中所述将所述第二网络对象推送至所述计算设备可以包括:
子步骤S15,根据选取的至少一个第二网络对象对应的访问数据,对至少一个第二网络对象进行排序。
子步骤S16,按照顺序将所述第二网络对象推送至所述计算设备。
根据选取的至少一个第二网络对象对应的访问数据,对至少一个第二网络对象进行排序,具体排序的方式本实施例不作限制,例如可以根据访问数据的大小,依照从大到小的顺序,对第二网络对象进行排序。
按照排序的结果将第二网络对象推送至计算设备,具体可以将排序的结果以列表形式一起推送到计算设备,或者可以依照排序逐次将第二网络对象推送至计算设备。
本申请的一种优选实施例中,所述步骤309中所述将所述第二网络对象推送至所述计算设备可以包括:
子步骤S12,将所述第二网络对象推送至计算设备,所述第二网络对象携带所属供应方的计算设备标识,以供所述计算设备根据所述供应方的计算设备标识开启与供应方的对话框。
将第二网络对象推送至计算设备时,第二网络对象可以携带所属供应方的计算设备标识,以供计算设备根据该标识开启与供应方的对话框。例如,在聊天应用中,根据商品对应的商家的计算设备标识,开启用户与商家的聊天对话框。
依据本申请实施例,通过获取各地理区域对各网络对象的访问数据,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合,计算各个初始访问数据集合之间的相似度,合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合,基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。由此各地理区域的相似度达到设定的访问数据集合进行合并,就会在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的相应数据的影响,还受到和计算设备所在地理区域相似的其他地理区域的访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
进一步,根据网络对象的对象类型之间的关联关系,进行推荐,使得可以推荐与计算设备访问的网络对象属于不同类型的其他网络对象,避免了重复推荐同一种类型的问题。
进一步,直接建立与网络对象供应方的对话框,提高了推荐的效率和便捷度。
参照图5,示出了根据本申请实施例四的一种推荐网络对象的方法实施例的流程图,该方法具体可以包括以下步骤:
步骤401,接收计算设备当前访问的第一网络对象。
在本实施例中,第一网络对象为计算设备当前访问的网络对象,计算设备在访问第一网络对象时上报第一网络对象相关信息。例如,用户通过购物计算设备购买商品时,将订单信息上传至服务器,服务器接收订单信息,得到计算设备当前访问的商品。
步骤402,基于具有相似访问行为的多个地理区域对应的历史访问数据推荐第二网络对象。
历史访问数据为各计算设备对网络对象进行访问时上报给用于推荐网络对象的服务器的访问记录形成的历史访问数据,其中访问记录是指计算设备对网络对象进行访问时产生的记录信息,具体包括计算设备的用户信息、网络对象的名称、网络对象的类型、与网络对象访问相关的位置信息等记录信息中至少一种。具体可以根据实际需要获取所需的访问记录,本实施例对此不作限制。实际应用中,访问记录具体包括购物记录、浏览记录、收藏记录、搜索记录等记录中至少一种。
在本实施例中,各计算设备上报的访问记录分地理区域形成的历史访问数据,具体可以根据访问记录中的位置信息找到对应的地理区域,得到多个地理区域对应的历史访问数据。根据历史访问数据分析各地理区域的访问行为,如果从历史访问数据中分析出至少两个地理区域的历史访问数据在整体上具有数字上的相似性,则至少两个地理区域具有相似访问行为。
例如,可以根据计算各地理区域的历史访问数据之间的相似度,如果相似度大于设定阈值则地理区域之间具有相似访问行为,具体方式与其他实施例描述一致,不做赘述。
在为计算设备推荐网络对象时,根据计算设备所在的地理区域以及具有相似访问行为的地理区域的历史访问数据为计算设备推荐网络对象,推荐的网络对象为第二网络对象。例如,可以将具有相似访问行为的多个地理区域对应的历史访问数据合并,基于合并后的数据推荐网络对象,具体方式与其他实施例描述一致,不作赘述。
步骤403,反馈所述第二网络对象至所述计算设备,以供所述计算设备生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
在本实施例中,用于推荐网络对象的服务器根据具有相似访问行为的多个地理区域对应的历史访问数据为计算设备推荐第二网络对象,将第二网络对象反馈至计算设备。
将第二网络对象推送至计算设备时,第二网络对象可以携带所属供应方的计算设备标识,以供计算设备根据该标识开启与供应方的对话框,并且在会话框中展示第二网络对象。例如,在聊天应用中,根据商品对应的商家的计算设备标识,开启用户与商家的聊天对话框。
依据本申请实施例,通过接收计算设备当前访问的第一网络对象,基于具有相似访问行为的多个地理区域对应的历史访问数据推荐第二网络对象,反馈所述第二网络对象至所述计算设备,以供所述计算设备生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象,使得在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的历史访问数据的影响,还受到和计算设备所在地理区域具有相似访问行为的其他地理区域的历史访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
进一步,直接建立与网络对象供应方的对话框,提高了推荐的效率和便捷度。
参照图6,示出了根据本申请实施例五的一种推荐网络对象的方法实施例的流程图,该方法具体可以包括以下步骤:
步骤501,获取当前访问的第一网络对象,并上传到服务端。
在本实施例中,计算设备获取当前访问的第一网络对象,并且将第一网络对象上传到服务端,具体上传的信息可以包括用户购物的地址、商品种类、用户名、计算设备标识等
步骤502,接收服务端基于具有相似访问行为的多个地理区域对应的历史访问数据推荐的第二网络对象。
在本实施例中,服务端推荐第二网络对象的具体方式与其他实施例描述一致,不做赘述。服务端将第二网络对象发送给计算设备,计算设备接收第二网络对象。
步骤503,生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
在本实施例中,第二网络对象可以携带所属供应方的计算设备标识,计算设备根据该标识开启与供应方的对话框,并且在会话框中展示第二网络对象。例如,在聊天应用中,根据商品对应的商家的计算设备标识,开启用户与商家的聊天对话框。
依据本申请实施例,通过获取当前访问的第一网络对象,并上传到服务端,用于接收服务端基于具有相似访问行为的多个地理区域对应的历史访问数据推荐的第二网络对象,用于生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象,使得在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的历史访问数据的影响,还受到和计算设备所在地理区域具有相似访问行为的其他地理区域的历史访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
进一步,直接建立与网络对象供应方的对话框,提高了推荐的效率和便捷度。
参照图7,示出了根据本申请实施例六的一种推荐网络对象的方法实施例的流程图,该方法具体可以包括以下步骤:
步骤601,获取各地理区域对各网络对象的访问数据。
在本实施例中,具体方式与其他实施例描述一致,不做赘述。
步骤602,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合。
在本实施例中,具体方式与其他实施例描述一致,不做赘述。
步骤603,计算各个初始访问数据集合之间的相似度。
在本实施例中,具体方式与其他实施例描述一致,不做赘述。
步骤604,将相似度超过预设阈值的初始访问数据集合对应的地理区域进行关联。
初始访问数据集合之间的相似度大于预设阈值,也就是多个地理区域对所有网络对象的访问行为在整体上具有相似性,其中预设阈值可以是任意适用的值,本实施例对此不作限定。
在本实施例中,将相似度超过预设阈值的初始访问数据集合对应的各地理区域的关联关系进行记录,以供根据该关联关系,在给计算设备进行推荐时,查找与计算设备对应的地理区域以及相似度超过预设阈值的初始访问数据集合对应的地理区域。
步骤605,对各个地理区域的计算设备推荐其关联地理区域的网络对象。
针对各个地理区域的计算设备,根据计算设备所处位置信息查找到所属的地理区域以及相似度超过预设阈值的初始访问数据集合对应的地理区域,继而根据相似度超过预设阈值的其他地理区域的初始访问数据集合进行网络对象推荐、或者根据计算设备所在地理区域和相似度超过预设阈值的其他地理区域的初始访问数据集合进行网络对象推荐。
在本实施例中,对各个地理区域的计算设备推荐网络推荐,并且将关联地理区域的网络对象推荐给计算设备。例如,商品一在计算设备所属区域销量最大,商品二在计算设备所属区域的关联区域销量最大,由于两个地理区域相互关联,为计算设备推荐商品二,也就是为计算设备推荐关联地理区域的网络对象。
依据本申请实施例,通过获取各地理区域对各网络对象的访问数据,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合,计算各个初始访问数据集合之间的相似度,将相似度超过预设阈值的初始访问数据集合对应的地理区域进行关联,对各个地理区域的计算设备推荐其关联地理区域的网络对象,使得在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的相应数据的影响,还受到和计算设备所在地理区域关联的其他地理区域的访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
为使本领域技术人员更好地理解本申请,以下通过具体的示例对本申请的一种网络对象的推荐方法进行说明。
参见图8,示出了本申请的一个示例中商品推荐的示意图。通过离线模块将相近的不同地区的购物数据进行合并,得到合并后地区的购物数据;再通过实时模块根据用户购物行为的对应地区,查找到相应的合并后的购物数据,基于合并后的购物数据推荐商品给用户,然后用户与推荐的商品的商家建立回话。
参见图9,示出了本申请的一个示例中商品推荐的过程示意图。
步骤1,获得购物数据库。
步骤2,订阅购物事件。
步骤3,获取购物单地址、产品种类、名称、价格等。
步骤4,根据购物地址从服务器获取相应的购物数据矩阵。
步骤5,计算推荐物品评分,并进行推荐。
步骤6,商家和用户直接建立会话,弹出聊天窗口。
参见图10,示出了本申请的另一个示例中商品推荐的过程示意图。
步骤1,分地区获得购物数据矩阵。如图11所示的购物数据矩阵,其中,矩阵的行代表商品名称,矩阵的列代表商品的种类,矩阵中每一项数据代表该商品种类对应的商品的购买数量。
步骤2,对购物数据矩阵的每一行进行归一化处理。具体包括每一项数据除以该行中的最大值。
步骤3,将商品名称相似的商品对应的矩阵中的列进行合并。
步骤4,任意选择两个地区的购物数据矩阵进行典型相关分析计算,当相关性系数大于设定值时,将两个矩阵进行合并,将对应数据项相加。
步骤5,重复两两矩阵的合并过程直到没有矩阵可以合并。
步骤6,订阅用户的购物事件。具体包括获取用户购物的地址、商品种类、用户名、计算设备标识等。
步骤7,根据购物地址从服务器获取相应的购物数据矩阵。具体包括:将用户购物的地址转化为经纬度,查找对应的地区,根据所属的地区确定购物数据矩阵存储的服务器,并从服务器获取相应的数据。如图12所示的分布式存储***,在存储特征服务器上,统一由存储服务接入层对外提供服务,每个FeatureInfo(特征信息)块分别存储于不同的服务器上,所有的数据都集中存储于分布式存储***中。当请求FeatureInfo id(特征信息标识)时,返回相应的FeatureInfo。分布式存储***中数据是以FeatureInfo id为主键,FeatureInfo为键值的存储key/value结构。
步骤8,根据购物数据矩阵,计算每一行数据的总值。
步骤9,查找与用户购物的商品种类对应行的数据的总值,相近似的若干个其他的行的总值。
步骤10,在查找的其他行对应的商品种类中选取数据的数值最大的商品,将每行选取的各个最大购买量的商品由大到小进行排序。
步骤11,将排序后的商品序列发送到用户计算设备上,并计算设备打开与推荐商品卖家的对话框。
本申请的另一个示例中,商品推荐的服务器端的工作过程如下所述:
步骤1,获得购物数据。
步骤2,分地理区域对购物数据进行统计,得到各个地理区域对应的初始访问数据集合。
步骤3,在商品推荐的服务器端显示各个地理区域的围栏,并在围栏中显示对应的初始访问数据集合。
步骤4,计算各初始访问数据集合之间的集合相似度的值,并显示在各地理区域的围栏之间,例如地理区域A和地理区域B的初始访问数据集合之间的相似度的值为0.8。
步骤5,对相似度大于设定阈值的初始访问数据集合进行合并,得到目标访问数据集合,并将对应的地理区域的围栏进行合并,并在合并后的围栏中显示对应的目标访问数据集合。
步骤6,根据计算设备所属的地理区域,查找到对应的目标访问数据集合。
步骤7,基于目标访问数据集合为计算设备推荐商品。
参考图13,其示出了根据本申请实施例七的一种推荐网络对象的装置的结构框图,具体可以包括:
访问数据获取模块701,用于获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
数据分类模块702,用于基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
相似度计算模块703,用于计算各个初始访问数据集合之间的相似度;
集合合并模块704,用于合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合;
网络对象推荐模块705,用于基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。
在本实施例中,优选地,所述访问数据获取模块包括:
访问记录获取子模块,用于获取各计算设备对各网络对象的访问记录;
总数统计子模块,用于根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数。
在本实施例中,优选地,所述位置信息为访问网络对象时计算设备所处经纬度信息,所述总数统计子模块包括:
地理区域查找子单元,用于查找各访问记录的经纬度信息所属的地理区域,所述地理区域采用经纬度范围进行标识;
第一总数统计子单元,用于统计经纬度信息归属于同一地理区域的访问记录的总数。
在本实施例中,优选地,所述位置信息为访问网络对象时关联添加的区域地址,所述总数统计子模块包括:
区域信息提取子单元,用于根据各访问记录的区域地址中提取的区域信息;
第二总数统计子单元,用于统计区域地址归属于同一地理区域的访问记录的总数。
在本实施例中,优选地,所述装置还包括:
对象分类模块,用于在计算各个初始访问数据集合之间的相似度之前,将所述初始访问数据集合的访问数据按照对应网络对象的对象类型进行分类;
归一化模块,用于对每个分类下的访问数据进行归一化处理。
在本实施例中,优选地,所述装置还包括:
数据合并模块,用于在所述基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合之后,在同一初始访问数据集合内,对满足相似条件的多个网络对象的访问数据进行合并。
在本实施例中,优选地,所述相似度计算模块包括:
协方差计算子模块,用于计算每两个初始访问数据集合对应的数据矩阵的协方差矩阵;
特征向量定义子模块,用于分别定义每个初始访问数据集合对应的数据矩阵的特征向量,其中特征向量由使所述数据矩阵两两之间具有最大关联的权重确定;
方差协方差计算子模块,用于计算每两个所述数据矩阵对应的特征向量的方差和协方差;
相关性系数推导子模块,用于推导出每两个初始访问数据集合的典型相关性系数。
在本实施例中,优选地,所述相似度计算模块包括:
对象排序子模块,用于将各初始访问数据集合的访问数据按照网络对象和/或网络对象的对象类型进行排序;
相似度计算子模块,用于计算任意两个排序后的初始访问数据集合的相似度。
在本实施例中,优选地,所述装置还包括:
二次合并模块,用于在所述合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合之后,对一次合并后的多个访问数据集合进行二次合并;
多次合并模块,用于多次执行合并步骤,直至无可合并的访问数据集合。
在本实施例中,优选地,所述网络对象推荐模块包括:
网络对象获取子模块,用于获取所述计算设备访问的第一网络对象;
对象类型查找子模块,用于根据所述目标访问数据集合的访问数据,查找与所述第一网络对象的第一对象类型关联的至少一个第二对象类型;
网络对象推送子模块,用于从第二对象类型对应的访问数据中选取至少一个第二网络对象,将所述第二网络对象推送至所述计算设备。
在本实施例中优选地,所述对象类型查找子模块包括:
综合值计算子单元,用于计算各对象类型对应的访问数据的综合值;
对象类型查找子单元,用于查找与所述第一对象类型对应的综合值相近的至少一个第二对象类型。
在本实施例中,优选地,所述网络对象推送子模块包括:
对象选取子单元,用于选取各第二对象类型中访问数据符合设定要求的至少一个第二网络对象;
对象推送子单元,用于将选取的至少一个第二网络对象推送至所述计算设备。
在本实施例中,优选地,所述网络对象推送子模块包括:
网络对象排序子单元,用于根据选取的至少一个第二网络对象对应的访问数据,对至少一个第二网络对象进行排序;
对象顺序推送自单元,用于按照顺序将所述第二网络对象推送至所述计算设备。
在本实施例中,优选地,所述网络对象推送子模块包括:
标识推送子单元,用于将所述第二网络对象推送至计算设备,所述第二网络对象携带所属供应方的计算设备标识,以供所述计算设备根据所述供应方的计算设备标识开启与供应方的对话框。
在本实施例中,优选地,所述装置还包括:
关联关系建立模块,用于在所述基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象之前,建立目标访问数据集合与对应的初始访问数据集合对应的地理区域的关联关系。
依据本申请实施例,通过获取各地理区域对各网络对象的访问数据,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合,计算各个初始访问数据集合之间的相似度,合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合,基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。由此各地理区域的相似度达到设定的访问数据集合进行合并,就会在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的相应数据的影响,还受到和计算设备所在地理区域相似的其他地理区域的访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
参考图14,其示出了根据本申请实施例八的一种推荐网络对象的装置的结构框图,具体可以包括:
第一对象接收模块801,用于接收计算设备当前访问的第一网络对象;
第二对象推荐模块802,用于基于具有相似访问行为的多个地理区域对应的历史访问数据推荐第二网络对象;
第二对象反馈模块803,用于反馈所述第二网络对象至所述计算设备,以供所述计算设备生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
依据本申请实施例,通过接收计算设备当前访问的第一网络对象,基于具有相似访问行为的多个地理区域对应的历史访问数据推荐第二网络对象,反馈所述第二网络对象至所述计算设备,以供所述计算设备生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象,使得在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的历史访问数据的影响,还受到和计算设备所在地理区域具有相似访问行为的其他地理区域的历史访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
进一步,直接建立与网络对象供应方的对话框,提高了推荐的效率和便捷度。
参考图15,其示出了根据本申请实施例九的一种计算设备的结构框图,具体可以包括:
网络对象获取模块901,用于获取当前访问的第一网络对象,并上传到服务端;
网络对象接收模块902,用于接收服务端基于具有相似访问行为的多个地理区域对应的历史访问数据推荐的第二网络对象;
会话框生成模块903,用于生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
依据本申请实施例,通过获取当前访问的第一网络对象,并上传到服务端,用于接收服务端基于具有相似访问行为的多个地理区域对应的历史访问数据推荐的第二网络对象,用于生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象,使得在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的历史访问数据的影响,还受到和计算设备所在地理区域具有相似访问行为的其他地理区域的历史访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
进一步,直接建立与网络对象供应方的对话框,提高了推荐的效率和便捷度。
参考图16,其示出了根据本申请实施例十的一种推荐网络对象的装置的结构框图,具体可以包括:
访问数据获取模块1001,用于获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
数据分类模块1002,用于基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
相似度计算模块1003,用于计算各个初始访问数据集合之间的相似度;
地理区域关联模块1004,用于将相似度超过预设阈值的初始访问数据集合对应的地理区域进行关联;
网络对象推荐模块1005,用于对各个地理区域的计算设备推荐其关联地理区域的网络对象。
依据本申请实施例,通过获取各地理区域对各网络对象的访问数据,基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合,计算各个初始访问数据集合之间的相似度,将相似度超过预设阈值的初始访问数据集合对应的地理区域进行关联,对各个地理区域的计算设备推荐其关联地理区域的网络对象,使得在对网络对象进行推荐时,推荐的网络对象不仅受到计算设备所在地理区域的相应数据的影响,还受到和计算设备所在地理区域关联的其他地理区域的访问数据的影响,实现了对多个区域的数据进行关联分析,提高了对数据的挖掘和利用效率。
由于所述装置实施例基本相应于前述图2、图3、图4、图5、图6和图7所示的方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此就不赘述了。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个申请方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,申请方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的基于数据分析的服务器入侵识别设备中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (22)

1.一种推荐网络对象的方法,其特征在于,包括:
获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
计算各个初始访问数据集合之间的相似度;
合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合;
基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。
2.如权利要求1所述的方法,其特征在于,所述获取各地理区域对各网络对象的访问数据包括:
获取各计算设备对各网络对象的访问记录;
根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数。
3.如权利要求2所述的方法,其特征在于,所述位置信息为访问网络对象时计算设备所处经纬度信息,所述根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数包括:
查找各访问记录的经纬度信息所属的地理区域,所述地理区域采用经纬度范围进行标识;
统计经纬度信息归属于同一地理区域的访问记录的总数。
4.如权利要求2所述的方法,其特征在于,所述位置信息为访问网络对象时关联添加的区域地址,所述根据访问记录中的位置信息,统计同一地理区域内所有计算设备分别对各网络对象的访问记录的总数包括:
根据各访问记录的区域地址中提取的区域信息;
统计区域地址归属于同一地理区域的访问记录的总数。
5.如权利要求1所述的方法,其特征在于,在计算各个初始访问数据集合之间的相似度之前,所述方法还包括:
将所述初始访问数据集合的访问数据按照对应网络对象的对象类型进行分类;
对每个分类下的访问数据进行归一化处理。
6.如权利要求1所述的方法,其特征在于,在所述基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合之后,所述方法还包括:
在同一初始访问数据集合内,对满足相似条件的多个网络对象的访问数据进行合并。
7.如权利要求1所述的方法,其特征在于,所述计算各个初始访问数据集合之间的相似度包括:
计算每两个初始访问数据集合对应的数据矩阵的协方差矩阵;
分别定义每个初始访问数据集合对应的数据矩阵的特征向量,其中特征向量由使所述数据矩阵两两之间具有最大关联的权重确定;
计算每两个所述数据矩阵对应的特征向量的方差和协方差;
推导出每两个初始访问数据集合的典型相关性系数。
8.如权利要求1所述的方法,其特征在于,所述计算各个初始访问数据集合之间的相似度包括:
将各初始访问数据集合的访问数据按照网络对象和/或网络对象的对象类型进行排序;
计算任意两个排序后的初始访问数据集合的相似度。
9.如权利要求1所述的方法,其特征在于,在所述合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合之后,所述方法还包括:
对一次合并后的多个访问数据集合进行二次合并;
多次执行合并步骤,直至无可合并的访问数据集合。
10.如权利要求1所述的方法,其特征在于,所述基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象包括:
获取所述计算设备访问的第一网络对象;
根据所述目标访问数据集合的访问数据,查找与所述第一网络对象的第一对象类型关联的至少一个第二对象类型;
从第二对象类型对应的访问数据中选取至少一个第二网络对象,将所述第二网络对象推送至所述计算设备。
11.如权利要求10所述的方法,其特征在于,所述根据所述目标访问数据集合的访问数据,查找与所述第一网络对象的第一对象类型关联的至少一个第二对象类型包括:
计算各对象类型对应的访问数据的综合值;
查找与所述第一对象类型对应的综合值相近的至少一个第二对象类型。
12.如权利要求10所述的方法,其特征在于,所述从第二对象类型对应的访问数据中选取至少一个第二网络对象,将所述第二网络对象推送至所述计算设备包括:
选取各第二对象类型中访问数据符合设定要求的至少一个第二网络对象;
将选取的至少一个第二网络对象推送至所述计算设备。
13.如权利要求10所述的方法,其特征在于,所述将所述第二网络对象推送至所述计算设备包括:
根据选取的至少一个第二网络对象对应的访问数据,对至少一个第二网络对象进行排序;
按照顺序将所述第二网络对象推送至所述计算设备。
14.如权利要求10所述的方法,其特征在于,所述将所述第二网络对象推送至所述计算设备包括:
将所述第二网络对象推送至计算设备,所述第二网络对象携带所属供应方的计算设备标识,以供所述计算设备根据所述供应方的计算设备标识开启与供应方的对话框。
15.如权利要求1所述的方法,其特征在于,在所述基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象之前,所述方法还包括:
建立目标访问数据集合与对应的初始访问数据集合对应的地理区域的关联关系。
16.一种推荐网络对象的方法,其特征在于,包括:
接收计算设备当前访问的第一网络对象;
基于具有相似访问行为的多个地理区域对应的历史访问数据推荐第二网络对象;
反馈所述第二网络对象至所述计算设备,以供所述计算设备生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
17.一种推荐网络对象的方法,其特征在于,包括:
获取当前访问的第一网络对象,并上传到服务端;
接收服务端基于具有相似访问行为的多个地理区域对应的历史访问数据推荐的第二网络对象;
生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
18.一种推荐网络对象的方法,其特征在于,包括:
获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
计算各个初始访问数据集合之间的相似度;
将相似度超过预设阈值的初始访问数据集合对应的地理区域进行关联;
对各个地理区域的计算设备推荐其关联地理区域的网络对象。
19.一种推荐网络对象装置,其特征在于,包括:
访问数据获取模块,用于获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
数据分类模块,用于基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
相似度计算模块,用于计算各个初始访问数据集合之间的相似度;
集合合并模块,用于合并相似度大于设定阈值的初始访问数据集合,获得一个或多个目标访问数据集合;
网络对象推荐模块,用于基于所述目标访问数据集合对目标访问数据集合对应的一个或多个地理区域中的计算设备推荐网络对象。
20.一种推荐网络对象的装置,其特征在于,包括:
第一对象接收模块,用于接收计算设备当前访问的第一网络对象;
第二对象推荐模块,用于基于具有相似访问行为的多个地理区域对应的历史访问数据推荐第二网络对象;
第二对象反馈模块,用于反馈所述第二网络对象至所述计算设备,以供所述计算设备生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
21.一种计算设备,其特征在于,包括:
网络对象获取模块,用于获取当前访问的第一网络对象,并上传到服务端;
网络对象接收模块,用于接收服务端基于具有相似访问行为的多个地理区域对应的历史访问数据推荐的第二网络对象;
会话框生成模块,用于生成与所述第二网络对象的供应方的会话框,并在会话框中展示所述第二网络对象。
22.一种推荐网络对象的装置,其特征在于,包括:
访问数据获取模块,用于获取各地理区域对各网络对象的访问数据,所述访问数据表征对网络对象的访问行为;
数据分类模块,用于基于所述地理区域,对所述访问数据进行分类,得到各地理区域分别对应的初始访问数据集合;
相似度计算模块,用于计算各个初始访问数据集合之间的相似度;
地理区域关联模块,用于将相似度超过预设阈值的初始访问数据集合对应的地理区域进行关联;
网络对象推荐模块,用于对各个地理区域的计算设备推荐其关联地理区域的网络对象。
CN201611263884.5A 2016-12-30 2016-12-30 一种推荐网络对象的方法和装置 Active CN108268519B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611263884.5A CN108268519B (zh) 2016-12-30 2016-12-30 一种推荐网络对象的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611263884.5A CN108268519B (zh) 2016-12-30 2016-12-30 一种推荐网络对象的方法和装置

Publications (2)

Publication Number Publication Date
CN108268519A true CN108268519A (zh) 2018-07-10
CN108268519B CN108268519B (zh) 2022-05-24

Family

ID=62755238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611263884.5A Active CN108268519B (zh) 2016-12-30 2016-12-30 一种推荐网络对象的方法和装置

Country Status (1)

Country Link
CN (1) CN108268519B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109660999A (zh) * 2018-12-05 2019-04-19 广州数锐智能科技有限公司 一种基于cca模型的网络性能优化方法、装置及存储介质
CN110533454A (zh) * 2019-07-24 2019-12-03 阿里巴巴集团控股有限公司 一种识别业务对象群体的方法及***
CN111079577A (zh) * 2019-12-02 2020-04-28 重庆紫光华山智安科技有限公司 一种动态区域聚集预警实时推荐的计算方法及***
CN111400513A (zh) * 2020-03-11 2020-07-10 北京字节跳动网络技术有限公司 数据处理方法、装置、计算机设备和存储介质

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198882A1 (en) * 2001-03-29 2002-12-26 Linden Gregory D. Content personalization based on actions performed during a current browsing session
CN1661604A (zh) * 2004-02-25 2005-08-31 松下电器产业株式会社 移动终端的活动记录分析和自动信息推荐***及方法
CN102609523A (zh) * 2012-02-10 2012-07-25 上海视畅信息科技有限公司 基于物品分类和用户分类的协同过滤推荐算法
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和***
CN103763361A (zh) * 2014-01-13 2014-04-30 北京奇虎科技有限公司 一种基于用户行为推荐应用的方法、***及推荐服务器
CN103810030A (zh) * 2014-02-20 2014-05-21 北京奇虎科技有限公司 一种基于移动终端应用市场的应用推荐方法、装置及***
US20140244762A1 (en) * 2013-02-26 2014-08-28 Facebook, Inc. Application distribution platform for rating and recommending applications
CN104272756A (zh) * 2012-01-04 2015-01-07 汤姆逊许可公司 用于提供媒体推荐的方法和***
CN104750856A (zh) * 2015-04-16 2015-07-01 天天艾米(北京)网络科技有限公司 一种多维协同推荐的***与方法
CN104821963A (zh) * 2015-04-30 2015-08-05 华为技术有限公司 推荐信息展示方法及装置
CN105069003A (zh) * 2015-06-15 2015-11-18 北京工业大学 一种基于转发链相似度的用户关注对象推荐计算方法
CN105095242A (zh) * 2014-04-30 2015-11-25 国际商业机器公司 一种标记地理区域的方法和装置
CN105227396A (zh) * 2015-09-01 2016-01-06 厦门大学 一种面向移动通信网络的次等内容推荐分发***及其方法
CN105224545A (zh) * 2014-06-03 2016-01-06 华为技术有限公司 一种位置推荐方法及装置
US20160086212A1 (en) * 2014-09-18 2016-03-24 Edatanetworks Inc. Systems and methods for loyalty programs
US20160092768A1 (en) * 2014-09-26 2016-03-31 Quixey, Inc. Providing application recommendations
CN105554704A (zh) * 2015-12-21 2016-05-04 西安电子科技大学 推荐***中基于假轨迹的位置隐私保护方法
CN105718576A (zh) * 2016-01-22 2016-06-29 西安电子科技大学 与地理特征相关的个性化位置推荐***
CN105868237A (zh) * 2015-12-09 2016-08-17 乐视网信息技术(北京)股份有限公司 媒体数据推荐方法及服务器
CN106021290A (zh) * 2016-04-29 2016-10-12 中国科学院信息工程研究所 一种基于多尺度地理信息的社交网络关联挖掘方法

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198882A1 (en) * 2001-03-29 2002-12-26 Linden Gregory D. Content personalization based on actions performed during a current browsing session
CN1661604A (zh) * 2004-02-25 2005-08-31 松下电器产业株式会社 移动终端的活动记录分析和自动信息推荐***及方法
CN104272756A (zh) * 2012-01-04 2015-01-07 汤姆逊许可公司 用于提供媒体推荐的方法和***
CN102609523A (zh) * 2012-02-10 2012-07-25 上海视畅信息科技有限公司 基于物品分类和用户分类的协同过滤推荐算法
US20140244762A1 (en) * 2013-02-26 2014-08-28 Facebook, Inc. Application distribution platform for rating and recommending applications
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和***
CN103763361A (zh) * 2014-01-13 2014-04-30 北京奇虎科技有限公司 一种基于用户行为推荐应用的方法、***及推荐服务器
CN103810030A (zh) * 2014-02-20 2014-05-21 北京奇虎科技有限公司 一种基于移动终端应用市场的应用推荐方法、装置及***
CN105095242A (zh) * 2014-04-30 2015-11-25 国际商业机器公司 一种标记地理区域的方法和装置
CN105224545A (zh) * 2014-06-03 2016-01-06 华为技术有限公司 一种位置推荐方法及装置
US20160086212A1 (en) * 2014-09-18 2016-03-24 Edatanetworks Inc. Systems and methods for loyalty programs
US20160092768A1 (en) * 2014-09-26 2016-03-31 Quixey, Inc. Providing application recommendations
CN104750856A (zh) * 2015-04-16 2015-07-01 天天艾米(北京)网络科技有限公司 一种多维协同推荐的***与方法
CN104821963A (zh) * 2015-04-30 2015-08-05 华为技术有限公司 推荐信息展示方法及装置
CN105069003A (zh) * 2015-06-15 2015-11-18 北京工业大学 一种基于转发链相似度的用户关注对象推荐计算方法
CN105227396A (zh) * 2015-09-01 2016-01-06 厦门大学 一种面向移动通信网络的次等内容推荐分发***及其方法
CN105868237A (zh) * 2015-12-09 2016-08-17 乐视网信息技术(北京)股份有限公司 媒体数据推荐方法及服务器
CN105554704A (zh) * 2015-12-21 2016-05-04 西安电子科技大学 推荐***中基于假轨迹的位置隐私保护方法
CN105718576A (zh) * 2016-01-22 2016-06-29 西安电子科技大学 与地理特征相关的个性化位置推荐***
CN106021290A (zh) * 2016-04-29 2016-10-12 中国科学院信息工程研究所 一种基于多尺度地理信息的社交网络关联挖掘方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
EUNJEONG CHOI 等: ""ACAM: Personalized application managements based on application usage and location"", 《2013 INTERNATIONAL CONFERENCE ON ICT CONVERGENCE》 *
廖开际 等: ""基于位置信息的协同过滤推荐算法 "", 《***工程 》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109660999A (zh) * 2018-12-05 2019-04-19 广州数锐智能科技有限公司 一种基于cca模型的网络性能优化方法、装置及存储介质
CN110533454A (zh) * 2019-07-24 2019-12-03 阿里巴巴集团控股有限公司 一种识别业务对象群体的方法及***
CN111079577A (zh) * 2019-12-02 2020-04-28 重庆紫光华山智安科技有限公司 一种动态区域聚集预警实时推荐的计算方法及***
CN111400513A (zh) * 2020-03-11 2020-07-10 北京字节跳动网络技术有限公司 数据处理方法、装置、计算机设备和存储介质
CN111400513B (zh) * 2020-03-11 2023-04-25 北京字节跳动网络技术有限公司 数据处理方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN108268519B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN105989004B (zh) 一种信息投放的预处理方法和装置
KR101419504B1 (ko) 사용자 성향 분석을 통한 맞춤형 쇼핑 정보 제공 시스템 및 방법
CN105868847A (zh) 一种购物行为的预测方法及装置
CN110175895B (zh) 一种物品推荐方法及装置
CN108205766A (zh) 信息推送方法、装置及***
CN106991576A (zh) 一种地理区域的热力展现方法和装置
CN105469263A (zh) 一种商品推荐方法及装置
JP5859606B2 (ja) オンライン商取引プラットフォームにおける広告ソースおよびキーワードセットの適合
CN106327227A (zh) 一种信息推荐***及信息推荐方法
CN106503025A (zh) 一种应用推荐方法和***
CN107292648A (zh) 一种用户行为分析方法及装置
CN109582876A (zh) 旅游行业用户画像构造方法、装置和计算机设备
CN106557480A (zh) 查询改写的实现方法及装置
CN113191838B (zh) 一种基于异质图神经网络的购物推荐方法及***
CN108268519A (zh) 一种推荐网络对象的方法和装置
CN107644036A (zh) 一种数据对象推送的方法、装置及***
CN104239335B (zh) 特定用户信息获取方法及装置
CN110413888A (zh) 一种书籍推荐方法及装置
CN106570031A (zh) 一种业务对象的推荐方法和装置
CN109190027A (zh) 多源推荐方法、终端、服务器、计算机设备、可读介质
KR20220001617A (ko) 고객 빅데이터를 활용한 상품 추천 방법, 장치 및 시스템
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
Cao et al. Distributed design and implementation of SVD++ algorithm for e-commerce personalized recommender system
KR102538398B1 (ko) 빅데이터 기반의 그룹 단위의 상품 추천 방법, 장치 및 시스템
CN107679236A (zh) 一种热门内容池维护方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1257330

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant