CN107077475A - 根据产品/用户标签和共安装图推荐产品捆绑包的***和方法 - Google Patents

根据产品/用户标签和共安装图推荐产品捆绑包的***和方法 Download PDF

Info

Publication number
CN107077475A
CN107077475A CN201580034880.7A CN201580034880A CN107077475A CN 107077475 A CN107077475 A CN 107077475A CN 201580034880 A CN201580034880 A CN 201580034880A CN 107077475 A CN107077475 A CN 107077475A
Authority
CN
China
Prior art keywords
user
content product
data
subset
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580034880.7A
Other languages
English (en)
Inventor
宁华中
柴玮
赫里希凯什·阿拉德海耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN107077475A publication Critical patent/CN107077475A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种向用户推荐内容产品捆绑包的***和方法,包括:在计算机***中存储多个内容产品;对所述多个内容产品中的每个内容产品配对确定相应的共选得分,所述共选得分指出所述多个内容产品中给定的内容产品配对中两者都被所述计算机***的用户下载的概率;以及向第一用户输出包括所述多个内容产品的子集的多个内容产品。

Description

根据产品/用户标签和共安装图推荐产品捆绑包的***和 方法
背景技术
存在用于管理、出售和搜索数字媒体内容和/或应用的各种***。这些***通常包括用户账户功能和被设计成记录***的用户的下载决定的跟踪功能。基于用户过去的决定,这些***可以向用户推荐被认为用户将潜在地感兴趣的数字媒体内容和/或应用。
发明内容
根据公开主旨的实施例,可以采用一种基于计算机的处理器以执行被存储在存储器内的计算机可执行组件,从而执行:在计算机***中存储多个内容产品;确定多个内容产品中的每一内容产品配对的相应共选得分,共选得分指示多个内容产品中的给定的内容产品配对中两者都将被计算机***的用户下载的概率;以及向第一用户输出包括多个内容产品的子集的多个内容产品,该子集被选为对应于具有顶点的图,每个顶点都由唯一性边连接,其中每个顶点都对应于内容产品,并且每个唯一性边都对应于大于预定阈值的共选得分。
根据公开主旨的实施例,一种***可以包括存储装置、存储计算机可执行组件的存储器,以及执行被存储在存储器内的计算机可执行组件的处理器,包括在存储装置内存储多个内容产品的存储组件、确定所存储的多个内容产品中的每个内容产品配对的相应共选得分的计算组件,共选得分指示多个内容产品中的给定的内容产品配对中两者都将被***的用户下载的概率,向第一用户输出包括所存储的多个内容产品的子集的多个内容产品的输出组件,以及选择子集的处理组件,使得该子集对应于具有顶点的图,每个顶点都由唯一性边连接,其中每个顶点都对应于内容产品,并且每个唯一性边都对应于大于预定阈值的共选得分。
根据公开主旨的实施例,提供用于在计算***中存储多个内容产品的装置,用于确定多个内容产品中的每个内容产品配对的相应共选得分的装置,共选得分指示多个内容产品中的给定的内容产品配对中两者都将被***的用户下载的概率,以及用于向第一用户输出包括多个内容产品的子集的多个内容产品的装置,该子集被选为对应于具有顶点的图,每个顶点都由唯一性边连接,其中每个顶点都对应于内容产品,并且每个唯一性边都对应于大于预定阈值的共选得分。
可以提出或者从下文详细说明、附图和权利要求可明白所公开主题的另外特征、优点和实施例。此外,应理解,上述发明内容和下文详细说明两者是例示性的,并且有意提供进一步解释而不限制权利要求的范围。
附图说明
为了提供对所公开主题主旨的进一步理解而包括的附图被并入并且组成本说明书的一部分。附图也例示了所公开主旨的实施例,并且用于与详细说明一起解释所公开主题的实施例的原理。不尝试比对所公开主题基本理解以及可以实践所公开主题的各种方式所必要的更详细地示出结构性细节。其中
图1示出根据所公开主题的实施例的例证性***。
图2示出根据所公开主题的实施例的例证性存储器装置。
图3示出根据所公开主题的实施例的以捆绑包向用户提供应用推荐的流程图。
图4示出根据所公开主题的实施例的计算装置。
图5示出根据所公开主题的实施例的网络配置。
图6示出根据所公开主题的实施例的示例网络和***配置。
图7示出示例简单无向完全图。
具体实施方式
参考附图描述本公开的各个方面和特征,其中始终使用相同标识符参考相同元件。在本说明书中,提出各种细节以提供对本公开的完全理解。然而,应理解,可以不通过这些特定细节,或者通过其它方法、组件、材料等等实践本公开的特定方面。在其它情况下,以方框图形式示出众所周知的结构和装置,以促进对主题公开的描述。
在用于向多个用户推荐并且提供可下载内容产品的现有***中存在各种缺点。例如,在用于出售/分配可下载应用程序(下文为“应用”)的典型在线商店***中,用户可以从关于用户可能感兴趣的其它应用的***下载应用和接收推荐。然而,通常根据特定标准,例如由分类、由开发者等等将推荐分为多个聚簇(cluster)。类似地,提供媒体内容的在线***将基于标准聚簇,例如由相同类型或者由同一艺术家创作的推荐媒体内容等等向用户做出推荐。标准聚簇中的推荐应用不能产生作为完全解决方案一起工作的推荐,从而匹配用户的不同、变化和独特兴趣或者考虑用户的当前环境。
本文公开主题提供各种特征,包括跨类型边界一起工作从而应对用户的情况并且具有非常少的重复功能的内容产品的捆绑包(bundle)的推荐。本文公开的内容产品可以被基于数据标签和/或用于已经下载了应用配对(app pair)的概率推荐。以这种方式,用户可以获得许多益处。在一个示例中,通过存储涉及***用户的数据标签信息以及涉及内容产品的数据标签信息,可以基于用户数据标签指示的用户环境的改变做出推荐。
图1提供根据本公开的例证性实施例的可被用于推荐内容产品的***100的概念图示。***100包括服务器110,服务器110包括存储装置120、存储器130和处理器140。服务器110被连接至网络150,并且可由用户通过接口160访问。网络150可以是用于发送数据的任何适当的网络,例如局域网、广域网、因特网等等。
在本领域中易于理解,服务器110和接口160每个都可以由任何适当的计算装置和/或多个计算机装置实施。例如,在一个实施例中,可以使用移动计算装置实施接口160,诸如膝上型计算机、平板电脑、移动电话、智能电话、个人数字助理、便携式游戏***、数字媒体播放器等等,而服务器110可以被实施为一个或者更多起大容量存储单元作用的计算机。
关于服务器110,存储装置120可以被实施为例如一个或者更多硬件存储装置,诸如硬盘驱动器、闪存驱动器或者其它存储器存储电路。因而,***100可以在服务器110的存储装置120中存储多个内容产品170。内容产品170例如可以是数字媒体文件、可执行应用、程序等等。
***100的用户可以使用接口140通过网络150访问多个内容产品170。用户可以维护作为用户数据180存储在***100中的用户账户。用户数据180可以根据已确立的隐私权政策包括基本标识信息数据,包括姓名、电话号码、地址、电子邮件地址等等,以及历史信息数据,诸如已观看的产品170、已下载的产品170、已购买的产品170、呈现的广告、提供的推荐、转换率等等。
可以使用硬件、只读存储器(ROM)、随机存取存储器(RAM)、存储电路,诸如寄存器,和/或软件存储器结构或者其任何组合实施存储器130。存储器130可以存储用于操作***100的多个可执行组件。
图2示出包括存储组件210、计算组件220、输出组件230、处理组件240和标签组件250的存储器130的一个例证性实施例。本领域技术人员应明白,可以使用软件和/或能够包括适当功能的电路元件,以便实施本文所述的实施例的电子电路实施这些各种组件。此外,应明白,能够在一个或者更多集成电路(IC)芯片上实施许多各种组件。
存储组件210可以被配置成管理多个内容产品(应用)的存储,以及被存储在存储装置120内的用户数据的存储(图1)。
标签组件220可以被配置成“标签”内容产品170和用户账户。本文的标签涉及存储第一数据产品与第二数据产品的关联。例如,第一数据产品能够为描述性信息数据类型,例如语言、区域、位置、价格或者实体数据,并且第二数据产品能够为内容产品数据,例如音乐文件或者应用。下面,标签操作中的第一数据产品将被称为标签,并且第二数据产品将被称为主题。
考虑下文将描述的例证性实施例将更清楚地理解上述特征,其中***100被实施为在线应用商店。应理解,***100仅是为了例示而呈现的一个例证性实施例,并且***100可以被实施为任何多种其它方式,这些方式包括以给定***中向用户呈现个性化内容,例如作为网络音乐商店、在线新闻/商品/评论网站、产品取样网站、艺术商店等等。
在用作在线应用商店的例证性***100中,用户数据180包括用户(顾客)账户信息,和用户的相应历史应用观看/安装数据,并且内容产品170包括用户可通过商店获得的应用。关于数据的标签,用户账户和应用两者可以是由相同标签集合标记的主题。
对于应用A,计算组件220可以确定相应的应用质量得分SA。应用质量得分SA可以基于集体用户数据180,并且指示应用的整体质量。应用质量得分SA能够根据但是不限于根据下列关于应用的一个或者更多因素而定:应用的用户安装数量、卸载比例、评级数、评级平均值、开发者信用和/或新鲜性。例如,较高评级数或者较高平均数可以产生较高的应用质量得分SA
计算组件220还可以确定被存储在***100内的多个应用中的每个应用配对(A,B)的共安装得分S(A,B)。可以通过任何多种方式确定共安装得分S(A,B)。本质上,共安装得分S(A,B)应指示该给定的应用配对被相同用户安装的可能性。例如,可以基于互信息如下确定两个应用(A,B)之间的共安装得分S(A,B)
[公式1]S(A,B)=∑a∈{A,!A}b∈{B,!B}P(a,b)log(P(a,b)/(P(a)P(b))),
其中A是指第一应用已经被用户安装,!A是指第一应用还未被用户安装,B是指第二应用已经被用户安装,!B是指第二应用还未被用户安装,并且P(.)是基于用户安装数据估计的概率,其中可以通过对所有用户的安装和共安装计数估计该概率。
基于共安装得分,***100可以确定存储在***100中的多个应用之间的应用的图(集合)和子集。可以基于应用之间的基于共安装得分的关系确定或者定义这种图,即应用集合可以被定义成应用配对集,每个应用配对都具有至少最小值的共得分。这种集合可以被称为共安装图。例如,共安装图G={V,E}可以被定义为具有顶点集F和无向边集E的图,其中每个顶点v∈V都代表一个应用,并且与上述应用标签和质量得分Sv相关联。在该示例中,每个边e=(v1,v2)∈E都连接两个顶点(应用)v1和v2,并且与共安装得分Se相关联。
可以通过调节参数和/或设置阈值要求来控制上述共安装图的大小。例如,***100可以被配置成如果两个应用的共安装得分低于阈值,则不在两个应用之间添加边。
多个应用之间的完全图可以被定义为简单无向图,其中每对不同顶点都由唯一性边连接。图7示出多个顶点(应用)A-F之间的示例性简单无向图700。完全图700包括四个顶点(应用)A、B、C和D,每个顶点都由唯一性边连接。***100可以将共安装图的完全子图作为推荐应用的子集(捆绑包)提供给用户。给定数据标签的集合,标签集合子图可以被定义为共安装图的子图,使得子图中的每个应用都包含给定标签集合中的一个或者更多标签。
图质量得分Q(G)可以被定义为测量应用的完全图的质量。即,图质量得分Q(G)提供确定应用捆绑包的完全图推荐的整体质量。例如,高质量完全图可以包含平均高应用质量得分的顶点,以及平均高共安装得分的边。Q(G)的例证性定义为:
[公式2] Q(G={V,E})=∑v∈VSV/|V|+α∑e∈ESe/|E|+β|V|,
其中,α和β是可调参数,即大α向大边数赋予得分优先权,并且β向大图赋予优先权。
因而,可以使用各种算法以产生满足不同问题的完全子图。例如,最大N完全子图问题能够被定义成从多个应用的原始图寻找具有最多N个顶点(应用)的完全子图G的问题,使得子图G具有最大质量得分Q(G)。然而,该问题的完全最佳解决方案的求解和实施可能不可接受地昂贵。在这种情况下,可以使用次优解决方案,例如,处理组件240可以执行下列算法:
算法I.
1.令G={V,E}为原始图;
2.r=0;
3.k=0,Gk=φ;
4.令C(Gk)={v∈V/Gk|Gk+v为完全},并且C(φ)=V。如果C(Gk)=φ,则转至步骤10;
5.计算权重其中
Ev={e∈E|v是e的顶点};
6.使用w(v)作为权重通过权重取样从C(Gk)选择v;
7.Gk+1=Gk+v;
8.k←k+1;
9.转至步骤4直到k=N;
10.r←r+1;
11.令Gr=Gk
12.转至步骤3直到r=R;
13.返回具有最大Q(Gr)的Gr,r=1:R。
令Vf为G中顶点的固定集合。设G(Vf)为移除不属于Vf的所有顶点之后的G的子图。假设G(Vf)为完全子图。除了所找到的完全子图必须包含G(Vf)之外,都可以与上述最大N完全子图问题类似地定义最大N完全F子图。例如,算法I将具有下列对步骤3的一种变化:
3.k=0,Gk=G(Vf);
在这种情况下,如果G(Vf)不是完全子图,***100可以首先从G(Vf)找到最大N完全子图,并且然后应用最大N完全F子图算法。
由此,***100可以考虑不同因素,在任何多种场景下通过输出组件230向用户输出应用捆绑包。例如,应用和用户账户两者都可以具有相同集合的相应相关联数据标签。将涉及的例证性标签集合是“实体”数据标签。在本文中,实体(entity)是世界上存在的并且由唯一性ID表示的事物或者概念。实体ID可以独立于语言限制或者类属限制。例如,使用所建立的Freebase实体***,社交网络应用能够被标以“entity:/m/01w362”(社交网络)和/或“entity:/m/0fj7z”(即时通信)等等。
用户账户和所存储的应用两者可以被标以实体数据标签。另外,用户账户可以被标以适用于用户的长期数据,诸如人口统计学数据、性别数据、标识(姓名、电话号码、地址、电子邮件地址)等等。例如,可以从用户概况的设置接收长期用户数据。
基于实体数据标签,***100能够推荐应用捆绑包。例如,在一个例证性实施例中,如果用户经历了变化(例如,旅行到新位置、怀孕、寻找房屋,等等),则用户账户标签可以通过相应的实体数据更新,以反应这种变化。即,与长期用户数据相比,可以基于用户的近期动作产生短期用户数据标签。例如,如果用户最近提出了关于房屋的很多搜索请求,则用户可以被标以即时标签“entity:/m/0bp7qzc”(购买房屋)、“entity:/m/023907r”(不动产)等等。如果用户旅行至新位置——东京,则用户可以被标以即时标签“entity:/m/07dfk”(东京)。因而,如图3中的流程图所示,***100可以响应于变化推荐应用的捆绑包。
参考图1-3,标签组件250标记多个应用170和被存储在存储装置内的用户数据180。在操作S100,***100可以产生代表用户兴趣和推荐基础,例如用户的已改变状态的标签集合。在用户改变的情况下,可以基于用户数据180中的检测变化自动地,或者通过经接口160输入信息从而更新用户状态的用户手动地处理标签更新。
在操作S200,计算组件可以计算多个应用170的共安装得分,并且处理组件240可以基于共安装得分从多个应用170确定共安装图。处理组件可以基于在操作S100中产生的标签集合从共安装图确定标签集合子图。
在操作S300,处理组件可以例如使用算法I或者另一算法从标签集合子图确定最大N完全子图,其中N为应用数目。
在操作S400,输出组件将最大N完全子图中的推荐应用作为捆绑包推荐给用户。
在另一示例性实施例中,如果用户具有已有的应用集合,则***可以通过与图3中所示的过程类似的方式推荐补充现有应用集合的另外的应用集合,不同在于操作S300将包括从标签子图确定最大N完全F子图,并且因而操作S400包括将最大N完全F子图(在去除了已安装的应用后)中的应用作为捆绑包推荐给用户。
上述例证性实施例为了例示而将***100应用于应用商店,但是本领域技术人员能够易于将***100应用于其它类型的内容产品***,包括但是不限于音乐商店、商品/新闻网站、产品取样网站等等。例如,一般而言,如上所述,***100可以在计算机***中存储多个内容产品,确定多个内容产品中的每个内容产品配对的相应共选得分,共选得分指示多个内容产品中给定内容产品配对中两者都将被计算机***的用户下载的概率,并且向第一用户输出包括多个内容产品的子集的多个内容产品,子集被选为对应于具有顶点的图,每个顶点都被唯一性边连接。每个顶点可对应于内容产品,并且每个唯一性边都可对应于大于预定阈值的共选得分。
***100还可以确定多个内容产品中每个的相应质量得分,并且选择具有大于预定阈值的图质量得分的子集。图质量得分可以基于子集内容产品的平均质量得分,以及子集内容产品配对的平均共安装得分。
子集还可以被选为具有预定内容产品数的近似最大可能值的图质量得分。
***100还可以存储安装数据,该安装数据对应于由***100的多个用户实现的内容产品安装统计。还可以基于安装数据确定共安装得分。
***100可以将一个或者更多数据标签与多个内容产品中的每个相关联。所述子集还可以被选为每个子集内容产品都与一个或者更多数据标签的预定集合的一个或者更多数据标签相关联。
***100可以将一个或者更多数据标签与计算机***的多个用户中的每个用户的用户数据相关联。在这种情况下,一个或者更多数据标签的预定集合可以包括与给定用户相关联的一个或者更多数据标签。
***100可以在与给定用户的用户数据相关联的数据标签中存在改变时向用户输出推荐捆绑包。
在本文所述的***收集关于用户的个人信息或者可能使用个人信息的情况下,可对用户提供机会,使得控制程序或者部件是否收集用户信息(例如,关于用户的社交网络、社交活动或者行为、职业、用户偏好或者用户的当前位置的信息),或者控制是否和/或如何从可能与用户更相关的内容服务器接收内容。另外,在被存储或者使用之前,特定数据可以被以一种或者更多种方式处理,使得去除个人可标识信息。例如,用户的身份可以被处理,使得不能确定用户的任何可标识信息,或者其中获得位置信息(诸如城市、ZIP码或者州层级)的用户地理位置可以被泛化,使得不能确定用户的具***置。因而,用户可以控制如何收集关于用户的信息以及信息如何本文所述的***使用。
当前公开主题的实施例可以被以多种组件和网络架构实施并且与多种组件和网络架构一起使用。图4是适合实施当前公开主题的实施例中的接口160或者服务器110的示例计算装置20。例如,装置20可以是台式机或者膝上型计算机,或者移动计算装置,诸如智能电话、平板电脑等等。装置20可以包括将计算机20的主要组件互连的总线21,计算机装置20的主要组件诸如为中央处理器24、诸如随机存取存储器(RAM)、只读存储器(ROM)、闪存RAM等等的存储器27、诸如显示屏的用户显示器22、可以包括一个或者更多控制器以及相关联的用户输入装置诸如键盘、鼠标、触摸屏等等的用户输入界面26、诸如硬盘驱动器、闪存等等的固定存储器23、可操作地控制和接收光盘、闪存驱动器等等的可移除媒体组件25,以及可操作地通过适当的网络连接与一个或者更多远程装置通信的网络接口29。
总线21允许在中央处理器24和一个或者更多存储器组件之间数据通信,存储器可以包括RAM、ROM和上述其它存储器。通常,RAM是操作***和应用程序被加载到其中的主存储器。ROM或者闪存组件能够获得控制基础硬件操作,诸如与***组件的交流的基础输入输出***(BIOS)和其它代码。计算机20固有的应用程序通常被存储在计算机可读媒体上并且通过计算机可读媒体访问,诸如硬盘驱动器(例如,固定存储器23)、光盘驱动器、软盘或者其它存储媒体。
固定存储器23可以与计算机20集成,或者可以为单独的,比给可通过其它接口访问。网络接口29可以提供通过有线或者无线连接与远程服务器的直接连接。网络接口29可以使用本领域技术人员将易于理解的任何适当的技术和协议提供这种连接,包括数字蜂窝电话、WiFi、蓝牙(R)、近场通信等等。例如,如下文进一步详述的,网络接口29可以允许计算机通过局域网、广域网或者其它通信网络其中一个或者更多与其它计算机通信。
许多其它装置或者组件(未示出)都可以通过类似的方式连接(例如,文件扫描仪、数码相机等等)。相反,为了实践本公开,图4中所示的所有组件不需要都存在。组件能够通过与所示的不同的方式互连。诸如图4中所示的计算机的操作是本领域中易于了解的,并且在本申请中不详细地讨论。实施本公开的代码能够被存储在计算机可读存储媒体中,诸如存储器27、固定存储装置23、可移除媒体25其中之一或者更多,或者可以被存储在远程存储位置上。
图5示出根据所公开主题的实施例的示例网络布置。一个或者更多装置10、11,诸如本地计算机、智能电话、平板计算装置等等可以通过一个或者更多网络7连接至其它装置。每个装置都可以是上述计算装置。网络可以是局域网、广域网、因特网或者任何其它适当的通信网络或者多个网络,并且可以在包括有线和/或无线网络的任何适当的平台上实施。装置可以与一个或者更多远程装置,诸如服务器13和/或数据库15通信。远程装置可以被装置10、11直接访问,或者一个或者更多其它装置可以提供中间访问,诸如其中服务器13提供对存储在数据库15中的资源的访问。装置10、11也可以访问远程平台17或者远程平台17提供的服务,诸如云计算布置和服务。远程平台17可以包括一个或者更多服务器13和/或数据库15。
图6示出根据所公开主题的实施例的另一示例布置。一个或者更多装置或者***/用户装置10,诸如本地计算机、智能电话、平板计算装置、远程服务/服务供应商18等等可以通过一个或者更多网络7连接至其它装置。网络可以是局域网、广域网、互联网或者任何其它适当的通信网络或者多个网络,并且可以在包括有线和/或无线网络的任何适当的平台上实施。装置10、11可以与一个或者更多远程计算机***通信,诸如处理单元14、数据库15和用户接口***19。在一些情况下,装置10、11可以与可以提供对一个或者更多其它***,诸如数据库15、处理单元14等等的面向用户界面***19通信。例如,用户界面13可以是挺杆来自一个或者更多其它计算机***的数据的用户可访问网页。用户界面19可以向不同的客户提供不同的界面,诸如其中人类可读网页被提供给用户装置10上的网页浏览器客户,并且计算机可读API或者其它界面被提供给远程服务客户端11。
用户界面19、数据库15和/或处理单元14可以是集成***的一部分,或者可以包括通过私人网络、因特网或者任何其它适当的网络通信的多个计算机***。例如,一个或者更多处理单元14可以是分布式***的一部分,诸如也可以包括或者与数据库15和/或用户界面通信的基于云的计算***、搜索引擎、内容传输***等等。在一些布置中,分析***5可以提供后端处理,诸如其中所存储或者获取的数据在被传输至处理单元14、数据库15和/或用户界面19之前被分析***5提前预处理。例如,机器学习***5可以向一个或者更多其它***19、14、15提供各种预测模型、数据分析等等。
更通常地,当前公开主题的各个实施例可以包括或者被具体化为用于实践那些过程的计算机实施过程和设备的形式。实施例也可以被具体化为具有包含指令的计算机程序代码的,被具体化为非暂态和/或有形媒体的计算机程序产品的形式,包括软磁盘、CD-ROM、硬盘驱动器、USB(通用串行总线)驱动器或者任何其它机器可读存储媒体,使得当计算机程序代码被载入和由计算机执行时,计算机变为用于实践所公开主题的实施例的设备。实施例也可以被具体化为计算机程序代码的形式,例如,无论是否被存储在存储媒体中、被载入和/或由计算机执行,或者在一些传输媒体上传输,诸如在电配线或者电缆上传输,通过光纤、或者通过电磁辐射传输,使得当计算机程序代码被载入并且由计算机执行时,计算机变为用于实践所公开主题的实施例的设备。当在通用微处理器上实施时,计算机程序代码段配置微处理器以产生专用逻辑电路。
在一些配置中,被存储在计算机可读存储媒体上的计算机可读指令的集合可由通用处理器实施,这可以将通用处理器或者含通用处理器的装置变为被配置成实施或者执行指令的专用装置。实施例可以使用可以包括处理器,诸如将根据所公开主题的实施例的全部或者部分具体化为硬件和/或固件的通用处理器和/或应用程序专用集成电路(ASIC)的硬件实施。处理器可以被耦合至存储器,诸如RAM、ROM、闪存、硬盘或者能够存储电子信息的任何其它装置。存储器可以存储适合由处理器执行,从而执行根据所公开主题的实施例的技术的指令。
已经为了解释参考特定实施例描述了上述说明。然而,上述例示性讨论无意为详尽的或者将所公开主题的实施例限于所公开的精确形式。考虑到上述教导,可能存在许多变型和变体。选择和描述这些实施例是为了解释所公开主题和它们的实践应用的实施例的原理,由此使得本领域技术人员能够采用那些实施例,以及具有适合所预期的特殊用途的各种变型的各种实施例。

Claims (20)

1.一种计算机实现的方法,包括:
在计算机***中存储多个内容产品;
对所述多个内容产品中的每个内容产品配对确定相应的共选得分,所述共选得分指出所述多个内容产品中给定的内容产品配对中两者都被所述计算机***的用户下载的概率;以及
向第一用户输出包括所述多个内容产品的子集的多个内容产品,所述子集被选择以对应具有顶点的图,每个顶点用唯一性边连接,其中,每个顶点对应内容产品,并且每个唯一性边对应大于预定阈值的共选得分。
2.根据权利要求1所述的方法,还包括:
确定所述多个内容产品的每个内容产品的相应质量得分;和
选择所述子集使得具有大于预定阈值的图质量得分,所述图质量得分基于所述子集内容产品的平均质量得分和所述子集内容产品配对的平均共安装得分。
3.根据权利要求2所述的方法,其中所述子集还被选择成对预定数量的内容产品具有近似最大可能值的图质量得分。
4.根据权利要求2所述的方法,其中所述内容产品对应于可以被多个用户下载的可安装应用,并且其中根据下述至少之一确定所述质量得分:所述应用已经被多个用户安装的次数,所述应用已经被所述多个用户卸载的次数,所述应用的用户评级的平均值,已经对所述应用评级的用户数目,以及开发所述应用的开发者的评级。
5.根据权利要求1所述的方法,还包括:
存储安装数据,该安装数据对应于所述计算机***的多个用户做出的内容产品安装的统计,
其中所述共选得分的确定还基于所述安装数据。
6.根据权利要求5所述的方法,其中基于互信息如下确定每个内容产品配对(A,B)的共选得分S(A,B):
S(A,B)=∑a∈{A,!A}b∈{B,!B}P(a,b)log(P(a,b)/(P(a)P(b))),
其中A是指第一内容产品已经被用户安装,!A是第一内容产品还未被用户安装,B是指第二内容产品已经被用户安装,!B是指第二内容产品还未被用户安装,并且P(.)是基于所述安装数据近似的概率。
7.根据权利要求1所述的方法,还包括:
使一个或者更多数据标签与所述多个内容产品的每个相关联,
其中所述子集还被选择成使得所述子集内容产品的每个都与一个或者更多数据标签的预定集合的一个或者更多数据标签相关联。
8.根据权利要求7所述的方法,还包括:
使一个或者更多数据标签与所述计算机***的多个用户中的每个用户的用户数据相关联,
其中一个或者更多数据标签的所述预定集合包括与给定用户相关联的一个或者更多数据标签。
9.根据权利要求8所述的方法,其中当与所述给定用户的用户数据相关联的数据标签中存在变化时,所述输出被提供给所述用户。
10.根据权利要求1所述的方法,还包括:
存储与所述计算机***的多个用户中的每个用户的人口统计学用户数据相关联的第一数据标签,
其中所述子集还被选择成使得每个子集内容产品都与相同的第一数据标签相关联。
11.根据权利要求1所述的方法,其中当所述用户通过所述计算机***的界面选择所述内容产品之一时,所述输出被提供给所述用户。
12.一种***,包括:
存储装置;存储计算机可执行组件的存储器;以及
执行被存储在所述存储器内的计算机可执行组件的处理器;
在所述存储装置内存储多个内容产品的存储组件;
确定所存储的多个内容产品中的每个内容产品配对的相应共选得分的计算组件,所述共选得分指示所述多个内容产品中的给定的内容产品配对中的两者都被所述***的用户下载的概率;
向第一用户输出包括所存储的多个内容产品的子集的多个内容产品的输出组件;以及
选择所述子集的处理组件,使得所述子集对应具有顶点的图,每个顶点都由唯一性边连接,其中每个顶点对应内容产品,并且每个唯一性边对应大于预定阈值的共选得分。
13.根据权利要求12所述的***,其中所述计算组件还确定所述多个内容产品的每个内容产品的相应质量得分,并且
其中所述处理组件还选择所述子集使得具有大于预定阈值的图质量得分,所述图质量得分基于所述子集内容产品的平均质量得分和所述子集内容产品配对的平均共安装得分。
14.根据权利要求13所述的***,其中所述处理组件还把所述子集选择成对预定数量的内容产品具有近似最大可能值的图质量得分。
15.根据权利要求13所述的***,其中所述内容产品对应可以被多个用户下载的可安装应用,并且
所述计算装置基于下述至少之一确定所述质量得分:所述应用已经被所述用户安装的次数,所述应用已经被所述用户卸载的次数,所述应用的被所述用户评级的平均值,已经对所述应用评级的用户数目,以及开发所述应用的开发者的评级。
16.根据权利要求12所述的***,其中所述存储组件在所述存储装置中存储对应于多个用户下载的内容产品的统计的下载数据,
其中所述得分组件还基于所述下载数据确定所述共选得分。
17.根据权利要求12所述的***,还包括:
标签组件,把一个或者更多数据标签与所述多个内容产品的每个相关联,
其中所述处理组件还把所述子集选择成使得所述子集内容产品的每个都与一个或者更多数据标签的预定集合的一个或者更多数据标签相关联。
18.根据权利要求17所述的***,其中所述标签组件把一个或者更多数据标签与所述多个用户中的每个用户的用户数据相关联,并且
其中所述处理组件还选择所述子集,使得一个或者更多数据标签的所述预定集合包括与给定用户相关联的一个或者更多数据标签。
19.根据权利要求12所述的***,其中所述存储组件在存储装置中存储与所述多个用户中的每个用户的人口统计学用户数据相关联的第一数据标签,并且
其中所述处理组件还把所述子集选择成使得每个子集内容产品都与第一数据标签相关联。
20.根据权利要求12所述的***,其中当在短期用户数据中存在变化时,所述输出被提供给所述用户。
CN201580034880.7A 2014-10-31 2015-10-27 根据产品/用户标签和共安装图推荐产品捆绑包的***和方法 Pending CN107077475A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/529,580 US20160124959A1 (en) 2014-10-31 2014-10-31 System and method to recommend a bundle of items based on item/user tagging and co-install graph
US14/529,580 2014-10-31
PCT/US2015/057618 WO2016069621A1 (en) 2014-10-31 2015-10-27 System and method to recommend a bundle of items based on item/user tagging and co-install graph

Publications (1)

Publication Number Publication Date
CN107077475A true CN107077475A (zh) 2017-08-18

Family

ID=54541207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580034880.7A Pending CN107077475A (zh) 2014-10-31 2015-10-27 根据产品/用户标签和共安装图推荐产品捆绑包的***和方法

Country Status (4)

Country Link
US (2) US20160124959A1 (zh)
CN (1) CN107077475A (zh)
DE (1) DE112015004968T5 (zh)
WO (1) WO2016069621A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114329200A (zh) * 2021-12-27 2022-04-12 黑龙江大学 一种个性化自适应捆绑推荐模型及推荐方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10332184B2 (en) * 2014-12-15 2019-06-25 Samsung Electronics Co., Ltd. Personalized application recommendations
US11704371B1 (en) * 2022-02-07 2023-07-18 Microsoft Technology Licensing, Llc User centric topics for topic suggestions

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102789462A (zh) * 2011-05-18 2012-11-21 阿里巴巴集团控股有限公司 一种项目推荐方法及***
US20130151536A1 (en) * 2011-12-09 2013-06-13 International Business Machines Corporation Vertex-Proximity Query Processing
US20130185292A1 (en) * 2012-01-04 2013-07-18 Trustgo Mobile, Inc. Application recommendation system
CN103593393A (zh) * 2013-09-13 2014-02-19 微梦创科网络科技(中国)有限公司 基于微博互动关系挖掘社交圈的方法及装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8099407B2 (en) * 2004-03-31 2012-01-17 Google Inc. Methods and systems for processing media files
US7720720B1 (en) 2004-08-05 2010-05-18 Versata Development Group, Inc. System and method for generating effective recommendations
US7743059B2 (en) 2007-03-30 2010-06-22 Amazon Technologies, Inc. Cluster-based management of collections of items
US20080270398A1 (en) 2007-04-30 2008-10-30 Landau Matthew J Product affinity engine and method
US8090621B1 (en) 2007-06-27 2012-01-03 Amazon Technologies, Inc. Method and system for associating feedback with recommendation rules
US8396759B2 (en) 2010-06-18 2013-03-12 Google Inc. Context-influenced application recommendations
US8468164B1 (en) 2011-03-09 2013-06-18 Amazon Technologies, Inc. Personalized recommendations based on related users
US8452797B1 (en) 2011-03-09 2013-05-28 Amazon Technologies, Inc. Personalized recommendations based on item usage
EP2700025A4 (en) 2011-04-19 2014-10-22 Nokia Corp METHOD AND DEVICE FOR FLEXIBLE DIVERSIFICATION OF RECOMMENDATION RESULTS
US8620764B2 (en) 2011-05-09 2013-12-31 Telefonaktiebolaget L M Ericsson (Publ) Method for providing a recommendation such as a personalized recommendation, recommender system, and computer program product comprising a recommender computer program
EP2710487A4 (en) 2011-05-09 2015-06-17 Google Inc GENERATING APPLICATION RECOMMENDATIONS BASED ON USER INSTALLED APPLICATIONS
US20130024464A1 (en) 2011-07-20 2013-01-24 Ness Computing, Inc. Recommendation engine that processes data including user data to provide recommendations and explanations for the recommendations to a user
US20130085886A1 (en) 2011-09-29 2013-04-04 Symantec Corporation Method and system for automatic application recommendation
US9224105B2 (en) * 2012-10-21 2015-12-29 Concept.Io, Inc. Method and system of automatically downloading media content in a preferred network
US9274816B2 (en) * 2012-12-21 2016-03-01 Mcafee, Inc. User driven emulation of applications
US20140188866A1 (en) 2012-12-31 2014-07-03 Microsoft Corporation Recommendation engine based on conditioned profiles
US9330411B2 (en) * 2013-09-27 2016-05-03 Palo Alto Research Center Incorporated High-performance graph analytics engine making recommendations using a finite state machine/FSM, bitmasks, and graphs with edges representing purchases, and vertices representing customers and products
CN104516904B (zh) * 2013-09-29 2018-04-03 北大方正集团有限公司 一种关键知识点推荐方法及其***
US9326026B2 (en) * 2013-10-31 2016-04-26 At&T Intellectual Property I, Lp Method and apparatus for content distribution over a network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102789462A (zh) * 2011-05-18 2012-11-21 阿里巴巴集团控股有限公司 一种项目推荐方法及***
US20130151536A1 (en) * 2011-12-09 2013-06-13 International Business Machines Corporation Vertex-Proximity Query Processing
US20130185292A1 (en) * 2012-01-04 2013-07-18 Trustgo Mobile, Inc. Application recommendation system
CN103593393A (zh) * 2013-09-13 2014-02-19 微梦创科网络科技(中国)有限公司 基于微博互动关系挖掘社交圈的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114329200A (zh) * 2021-12-27 2022-04-12 黑龙江大学 一种个性化自适应捆绑推荐模型及推荐方法

Also Published As

Publication number Publication date
US20160124959A1 (en) 2016-05-05
DE112015004968T5 (de) 2017-07-20
US10474688B2 (en) 2019-11-12
US20180129664A1 (en) 2018-05-10
WO2016069621A1 (en) 2016-05-06

Similar Documents

Publication Publication Date Title
JP6744353B2 (ja) ディープラーニングを活用した個人化商品推薦
US9576248B2 (en) Record linkage sharing using labeled comparison vectors and a machine learning domain classification trainer
US20210174230A1 (en) Service recommendation method, apparatus, and device
CN105320766B (zh) 信息推送方法和装置
US11127066B2 (en) Multi-layer optimization for a multi-sided network service
CN105095470B (zh) 用于应用程序的数据推荐方法及装置
CN108287857B (zh) 表情图片推荐方法及装置
CN105721629B (zh) 用户标识匹配方法和装置
US10074097B2 (en) Classification engine for classifying businesses based on power consumption
CN107808314B (zh) 用户推荐方法及装置
CN105279672A (zh) 线索推荐
WO2020143849A2 (en) Method and system for optimizing user grouping for advertisement
CN114663198A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN111400613A (zh) 物品推荐方法、装置、介质及计算机设备
JP2020035068A (ja) 情報処理装置、情報処理方法および情報処理プログラム
CN115033801B (zh) 物品推荐方法、模型训练方法及电子设备
CN110414613B (zh) 区域聚类的方法、装置、设备和计算机可读存储介质
CN107077475A (zh) 根据产品/用户标签和共安装图推荐产品捆绑包的***和方法
US20210049665A1 (en) Deep cognitive constrained filtering for product recommendation
CN113034168A (zh) 内容项投放方法、装置、计算机设备及存储介质
CN112783468A (zh) 目标对象的排序方法和排序装置
CN113792952A (zh) 用于生成模型的方法和装置
CN113327132A (zh) 多媒体推荐方法、装置、设备及存储介质
WO2018024222A1 (zh) 应用推荐方法、装置及服务器
CN111177564A (zh) 一种产品推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20170818

RJ01 Rejection of invention patent application after publication