CN104809148A

CN104809148A - 一种用于确定标杆对象的方法和装置

Info

Publication number: CN104809148A
Application number: CN201510090131.8A
Authority: CN
Inventors: 周泽伟; 程涛远
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2015-02-27
Filing date: 2015-02-27
Publication date: 2015-07-29
Anticipated expiration: 2035-02-27
Also published as: CN104809148B; WO2016134599A1

Abstract

本发明设计用于在计算机设备中为对象确定标杆对象的方法，该方法包括：获取多个对象的转移情况信息；根据所述转移情况信息，为所述多个对象中的至少一个对象确定其标杆对象。本发明能够通过分析用户在多个对象中的转移情况，来确定标杆对象，因此，本发明的方案所确定的标杆对象更为客观、准确。

Description

一种用于确定标杆对象的方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种用于确定标杆对象的方法和装置。

背景技术

现有技术中，通常需要根据人工主观经验，来确定一个对象的标杆对象。在此过程中，计算机仅能通过整理从对象角度出发的数据，如该对象所属的行业和地域、对象的销售情况和市场需求等，来辅助人工判断对象的标杆对象。

发明内容

本发明的目的包括提供一种用于确定标杆对象的方法和装置。

根据本发明的一个方面，提供一种用于在计算机设备中为对象确定标杆对象的方法，其中，该方法包括：

获取多个对象的转移情况信息，所述转移情况信息用于指示基于对象信息获取行为的、用户在所述多个对象中的转移情况；

根据所述转移情况信息，为所述多个对象中的至少一个对象确定其标杆对象，其中，所述标杆对象属于所述多个对象。

根据本发明的另一个方面，还提供了一种用于在计算机设备中为对象确定标杆对象的装置，其中，该装置包括：

用于获取多个对象的转移情况信息的装置，所述转移情况信息用于指示基于对象信息获取行为的、用户在所述多个对象中的转移情况；

用于根据所述转移情况信息，为所述多个对象中的至少一个对象确定其标杆对象的装置，其中，所述标杆对象属于所述多个对象。

与现有技术相比，本发明具有以下优点：1)提供了计算机设备自动确定标杆对象的方案；2)打破了本领域技术人员的偏见，能够通过分析用户在多个对象中的转移情况，来确定标杆对象；3)相比从对象角度出发的数据，本发明中通过分析用户在多个对象中的转移情况来确定标杆对象的方案，更贴近用户角度，更能直观地反映用户对标杆对象的认识，因此，本发明的方案所确定的标杆对象更为客观、准确；4)即便在从用户角度出发的数据中，本发明的转移情况信息也并非常见数据，事实上，若明确提及从用户角度出发的数据，本领域技术人员更容易想到的是来自用户的直接评价(如打分、评论文字等)。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明一个优选实施例的用于确定标杆对象的方法流程示意图；

图2为本发明一个优选实施例的用于确定标杆对象的确定装置的结构示意图；

图3示出了一个优选实施例的用户在多个对象中的转移路径的示意图；

图4示出了一个优选实施例的用户在多个关键词中的转移路径的示意图；

图5示出了一个从关键词的网状结构的转移路径到对象的网状结构的转移路径的转换的具体实例；

图6示出了一个优选实施例的、从一个对象到多个对象的转移的示意图；

图7示出了图6的一个具体实例。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

图1为本发明一个优选实施例的确定标杆对象的方法流程示意图。其中，本实施例的方法主要通过计算机设备来实现；该计算机设备包括网络设备和用户设备。其中，所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量计算机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机；所述网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等。

需要说明的是，所述计算机设备和网络仅为举例，其他现有的或今后可能出现的计算设备或网络如可适用于本发明，也应包含在本发明保护范围以内，并以引用方式包含于此。

根据本实施例的方法包括步骤S1和步骤S2。

在步骤S1中，计算机设备获取多个对象的转移情况信息。

优选地，所述对象具有商业性质。更优选地，所述对象包括品牌。

其中，所述转移情况信息用于指示基于对象信息获取行为的、用户在所述多个对象中的转移情况。其中，所述对象信息获取行为包括任何能够用于获取对象的信息的行为；例如，所述对象信息获取行为包括通过搜索与对象有关的关键词来获取对象信息的行为；又例如，所述对象信息获取行为包括通过点击并浏览与对象有关的内容来获取对象信息的行为。其中，所述“基于对象信息获取行为”，表示所述转移情况反映了用户在对象信息获取行为中产生的转移情况，优选地，所述转移情况需要基于对象信息获取行为来被确定；例如，通过统计多个用户在搜索行为中变更的搜索对象，或通过统计多个用户在搜索行为中变更的与对象关联的搜索关键词，来确定用户在中对象中的转移情况信息等。

优选地，所述多个对象的转移情况信息包括但不限于以下至少一项：

1)用户在多个对象中的转移路径信息。

其中，所述转移路径信息指示了用户在多个对象中的转移路径。例如，存在三个对象Object1、Object2和Object3，转移路径信息指示多个用户在该三个对象中的转移路径包括：从Object1转移至Object2，以及，从Object1转移至Object3。

2)用户在各个对象之间的转移次数信息。

其中，所述转移次数信息指示了用户在各个对象之间的转移次数。例如，存在三个对象Object1、Object2和Object3，转移次数信息指示了多个用户在该三个对象之间的转移次数包括：从Object1转移至Object2五次，以及，从Object1转移至Object3八次。

3)用户在各个对象之间的转移概率信息。

其中，所述转移概率信息指示了用户在各个对象之间的转移概率。例如，存在三个对象Object1、Object2和Object3，转移概率信息指示了多个用户在该三个对象之间的转移概率包括：从Object1转移至Object2的概率为38.46％，以及，从Object1转移至Object3的概率为61.54％。

需要说明的是，多个对象中的部分对象之间可能不存在转移路径(即用户在对象信息获取行为中未在该等部分对象之间进行过转移)，则该等部分对象之间的转移次数和转移概率均为零。此外，可能存在从一个对象转移至该对象自身的情况；例如，用户在搜索行为中可能连续多次采用不同的搜索关键词搜索同一个对象的信息，从而产生从一个对象转移至该对象自身的情况。

优选地，该转移情况信息可采用多种存储方式。

例如，该转移情况信息存储为表格，且表格中记录了用户在多个对象中的转移路径以及用户在各个对象之间的转移次数和转移概率，如下表1所示。

转移路径	转移次数	转移概率
			Object1→Object2	5	38.46％
Object1→Object3	8	61.54％

表1

又例如，该转移情况信息包括：存储为网状结构的转移路径，以及，该网状结构中各个节点之间(即各个对象之间)的转移次数和/或转移概率。如对于9个对象Object1至Object9，该9个对象的转移情况信息包括如图3所示的转移路径，以及，图3中具有箭头连接的各个节点之间(如从Object1到Object2、从Object1到Object3、从Object1到Object4等等)的转移次数和/或转移概率。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何用于指示基于对象信息获取行为的、用户在所述多个对象中的转移情况的转移情况信息，均应包含在本发明的范围内。

具体地，计算机设备获取多个对象的转移情况信息的方式包括但不限于：

1)计算机设备直接获取已预确定的、该多个对象的转移情况信息。

例如，计算机设备从本地或其他设备处读取已预确定的、该多个对象的转移情况信息。

2)步骤S1进一步包括步骤S11和步骤S12。

在步骤S11中，计算机设备获取多个关键词的转移情况信息。

其中，所述多个关键词的转移情况信息用于指示基于对象信息获取行为的、用户在多个关键词中的转移情况。优选地，所述多个关键词与对象信息获取行为中的对象相关联；例如，若对象信息获取行为为对象搜索行为，则关键词可为该搜索行为中用户输入的或选择的搜索关键词等。

优选地，所述多个关键词的转移情况信息包括以下至少一项：

a)用户在所述多个关键词中的转移路径信息。

其中，用户在所述多个关键词中的转移路径信息指示了用户在多个关键词中的转移路径。例如，存在三个关键词Query1、Query2和Query3，转移路径信息指示多个用户在该三个关键词中的转移路径包括：从Query1转移至Query2，以及，从Query1转移至Query3。

b)用户在各个关键词之间的转移次数信息。

其中，用户在各个关键词之间的转移次数信息指示了用户在各个关键词之间的转移次数。例如，存在三个关键词Query1、Query2和Query3，转移次数信息指示多个用户在该三个关键词之间的转移次数包括：从Query1转移至Query2五次，以及，从Query1转移至Query3八次。

需要说明的是，多个关键词中的部分关键词之间可能不存在转移路径(即用户在对象信息获取行为中没有在该等部分关键词之间进行过转移)，则该等部分关键词之间的转移次数为零。

优选地，该多个关键词的转移情况信息可采用多种存储方式。

例如，该转移情况信息存储为表格，且表格中记录了用户在多个关键词中的转移路径以及用户在各个关键词之间的转移次数，如下表2所示。

转移路径	转移次数
		Query1→Query2	5
Query1→Query3	8

表2

又例如，该转移情况信息包括：存储为网状结构的转移路径，以及，该网状结构中各个节点之间(即各个关键词之间)的转移次数。如对于9个关键词Query1至Query9，该9个对象的转移情况信息包括如图4所示的转移路径，以及，图4中具有箭头连接的各个节点之间的转移次数。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何用于指示基于对象信息获取行为的、用户在多个关键词中的转移情况的转移情况信息，均应包含在本发明的范围内。

具体地，计算机设备获取多个关键词的转移情况信息的实现方式包括但不限于：

a)计算机设备直接获取已预确定的、该多个关键词的转移情况信息。

例如，计算机设备从本地或其他设备处读取已预确定的、该多个关键词的转移情况信息。

b)计算机设备获取至少一个用户的关键词关注记录，并根据所述关键词关注记录，确定所述多个关键词的转移情况信息。

其中，该关键词关注记录包括所述多个用户在对象信息获取行为中关注过的关键词以及所述关键词被关注的时间信息。优选地，对象信息获取行为包括搜索行为，所述关注过的关键词包括被搜索的关键词；优选地，对象信息获取行为包括浏览行为，所述关注过的关键词包括被点击来用以浏览对象内容的关键词。

优选地，对于每个用户的关键词关注记录，计算机设备根据该关键词关注记录中包含的关键词被关注的时间信息，确定该用户在关键词中的转移路径以及各个关键词之间的转移次数；并且，计算机设备通过合并各个用户在关键词中的转移路径以及各个关键词之间的转移次数，确定所述多个关键词的转移情况信息。

例如，计算机设备获取了用户A和用户B的关键词关注记录；其中，用户A和用户B的关键词关注记录分别如下表3和表4所示：

关注的关键词	关键词被关注的时间
		Query1	2014-12-13-10:40
Query3	2014-12-13-10:36

表3

关注的关键词	关键词被关注的时间
		Query1	2014-11-10-00:14
Query2	2014-11-10-00:23

表4

则对于用户A的关键词关注记录，计算机设备确定用户A在关键词中的转移路径包括“Query1→Query3”，且“Query1→Query3”的转移次数为1；类似地，计算机设备确定用户B在关键词中的转移路径包括“Query1→Query2”，且“Query1→Query2”的转移次数为1。接着，计算机设备合并用户A和B在关键词中的转移路径以及各个关键词之间的转移次数，确定所述多个关键词的转移情况信息如下表5所示。

转移路径	转移次数
		Query1→Query2	1
Query1→Query3	1

表5

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何获取多个关键词的转移情况信息的实现方式，均应包含在本发明的范围内。

在步骤S12中，计算机设备根据多个关键词分别关联至的对象以及所述多个关键词的转移情况信息，确定多个对象的转移情况信息。

具体地，计算机设备可根据用户在多个关键词中的转移路径信息以及多个关键词分别关联至的对象，确定用户在多个对象中的转移路径信息，并且，计算机设备根据用户在各个关键词之间的转移次数信息以及多个关键词分别关联至的对象，确定用户在各个对象之间的转移次数和/或转移概率信息。

例如，多个关键词的转移情况信息如前述表2所示，且Query1、Query2和Query3分别关联至Object1、Object2和Object3；计算机设备根据表2所示的关键词的转移情况信息以及前述关联关系，确定用户在对象Object1、Object2和Object3中的转移路径包括“Object1→Object2”和“Object1→Object3”，且该2个转移路径的转移次数分别为5和8；接着，计算机设备根据该2个转移路径的转移次数，计算“Object1→Object2”的转移概率＝5/(5+8)＝38.46％，“Object1→Object3”的转移概率＝8/(5+8)＝61.54％，也即，计算机设备获得如表1所示的转移情况信息。

需要说明的是，由于一个用户可能在连续多次对象信息获取行为中关注关联至同一个对象的不同关键词(如在多次搜索中采用对应同一个对象的不同搜素关键词)，因此，可能存在从一个对象转移至该对象自身的转移概率，如可存在图6中所示的p₀₀等。图6的一个具体实例可参见图7。如图7中所示，从“金宝贝”转移到“金宝贝”自身的概率可高达71.86％。

需要说明的是，优选地，计算机设备可基于以下公式来计算对象i到对象j的转移概率p_ij：

p_{ij} = \frac{a_{ij}}{\underset{j}{Σ} a_{ij}}

其中，a_ij表示对象i到对象j的转移次数，表示对象i到所有对象的转移次数。

例如，如图6所示，对象Object0可转移至其自身以及其他多个对象Object1至Object13；以从对象Object1转移到Object8为例，对象Objectp0到对象Object8的转移概率其中，表示从对象Object0到Object0自身以及对象Object1至Object13的所有转移次数。

需要说明的是，多个关键词分别关联至的对象可预先被确定，图5示出了从关键词的网状结构的转移路径到对象的网状结构的转移路径的转换实例。图5中，上方的网状结构中的各个节点为关键词，下方的网状结构中的各个节点为与上方的相应节点中的关键词对应的对象。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何获取多个对象的转移情况信息的实现方式，均应包含在本发明的范围内。

在步骤S2中，计算机设备根据在步骤S1中获得的多个对象的转移情况信息，为多个对象中的至少一个对象确定其标杆对象，其中，所述标杆对象属于所述多个对象。优选地，所述多个对象属于同一类别。

其中，一个对象的标杆(benchmark)对象，表示对该对象具有一定竞争力的对象，例如，在商业上与该对象产生较大竞争关系的对象等。

具体地，计算机设备根据多个对象的转移情况信息，为多个对象中的至少一个对象确定其标杆对象的实现方式包括但不限于：

1)计算机设备直接根据多个对象的转移情况信息，为多个对象中的至少一个对象确定其标杆对象。

例如，共存在三个对象Object1、Object2和Object3，转移情况信息如表1所示，则计算机设备根据从Object1到Object3的转移概率超过预定阈值60％，将Object3确定为Object1的标杆对象。

又例如，对于多个对象中的每个对象，计算机设备计算该多个对象中的其他对象到该对象的转移概率的平均值；接着，计算机设备选择平均值最高的一个对象，作为该多个对象中其他对象的共同的标杆对象。

需要说明的是，优选地，对于一个对象：从该对象转移到其他对象的转移次数或转移概率越高，则该其他对象被确定为该对象的标杆对象的可能性越高；从多个其他对象转移到该对象的次数总和、次数平均值、概率总和、和/或概率平均值越高，则该对象被确定为该多个其他对象的标杆对象的可能性越高。

2)步骤S2进一步包括步骤S21和步骤S22。

在步骤S21中，计算机设备根据多个对象的转移情况信息，确定该多个对象的排序。

其中，所述多个对象的排序可包括该多个对象中的每个对象在该多个对象中的排序位置，也可仅包括该多个对象中的部分对象中的每个的排序位置。

具体地，计算机设备根据多个对象的转移情况信息，确定该多个对象的排序的实现方式包括但不限于：

a)计算机设备直接根据多个对象的转移情况信息，确定该多个对象的排序。

例如，对于多个对象中的每个对象，计算机设备计算该多个对象中的其他对象到该对象的转移概率的平均值；接着，计算机设备根据每个对象的所述转移概率的平均值，对多个对象进行排序。

需要说明的是，优选地，对于一个对象：从该对象转移到其他对象的转移概率越高，则该对象的排序较低的可能性越高；从多个其他对象转移到该对象的次数总和、次数平均值、概率总和、和/或概率平均值越高，则该对象排序越高的可能性越高。

b)计算机设备根据多个对象的转移情况信息以及所述多个对象的初始排序，确定所述多个对象的排序。其中，所述初始排序可人工设定，或通过多个对象的转移情况信息来被预确定。

具体地，计算机设备可根据多个对象的转移情况信息，对所述多个对象的初始排序进行调整，获得所述多个对象的排序。该实现方式包括但不限于：

i)计算机设备直接根据多个对象的转移情况信息，对所述多个对象的初始排序进行一次性调整，获得所述多个对象的排序。

例如，计算机设备根据转移情况信息中包含的转移次数和/或转移概率，将转移到其他对象的概率较低，且其他对象转移到自身的概率较高的对象的排序上调等。

ii)计算机设备重复执行以下步骤，直至满足预定条件：计算机设备根据多个对象的转移情况信息以及上一次确定的所述多个对象的排序，确定所述多个对象的本次的排序；更优选地，计算机设备可根据对象的转移情况信息的矩阵与上一次确定的多个对象的排序的矩阵，如通过将该两个矩阵相乘，来确定多个对象的本次的排序。其中，最后一次被确定的排序为所述多个对象的排序；其中，当确定所述多个对象的本次的排序的步骤被首次执行时，所述上一次确定的所述多个对象的排序为所述初始排序。

其中，所述预定条件包括任何能够终止所述重复步骤的条件。优选地，所述预定条件包括但不限于以下至少一项：

-重复次数达到预定重复阈值；例如，预定重复阈值为50次，当计算机设备执行50次根据多个对象的转移情况信息以及上一次确定的所述多个对象的排序来确定所述多个对象的本次的排序的操作后，停止重复操作。

-在多次重复所述确定所述多个对象的本次的排序的步骤后，所述多个对象的排序没有发生变化；例如，当计算机设备重复执行5次根据多个对象的转移情况信息以及上一次确定的所述多个对象的排序来确定所述多个对象的本次的排序后，所获得的该多个对象的排序没有发生变化，则计算机设备停止重复操作。

优选地，在实现方式ii)中，计算机设备可根据以下公式来计算多个对象的本次的排序：

R^{t} = {[\begin{matrix} (1 - q) / N \\ (1 - q) / N \\ \cdot \\ \cdot \\ \cdot \\ (1 - q) / N \end{matrix}]}^{T} + q^{*} R^{t - 1} [\begin{matrix} l (p_{1}, p_{1}) & l (p_{1}, p_{2}) & \cdot \cdot \cdot & l (p_{1}, p_{N}) \\ l (p_{2}, p_{1}) & l (p_{2}, p_{2}) & \cdot \cdot \cdot & l (p_{2}, p_{N}) \\ \cdot & \cdot \\ \cdot & l (p_{i}, p_{j}) & \cdot \cdot \cdot & \cdot \\ \cdot & \cdot \\ l (p_{N}, p_{1}) & l (p_{N}, p_{2}) & \cdot \cdot \cdot & l (p_{N}, p_{N}) \end{matrix}]

其中，R^t为多个对象的本次的排序；R^t-1为上一次确定的多个对象的排序；

{[\begin{matrix} (1 - q) / N \\ (1 - q) / N \\ \cdot \\ \cdot \\ \cdot \\ (1 - q) / N \end{matrix}]}^{T}

为偏移量矩阵，其中，q为参数，且q可预先设定，N为多个对象的数量；l(p_i,p_j)为对象i到对象j的转移概率，其中，1≤i≤N，1≤j≤N，l(p_i,p_j)可根据转移情况信息计算，如可根据以下公式计算：

l (p_{i}, p_{j}) = \frac{b_{ij}}{\underset{j}{Σ} b_{ij}}

其中，b_ij表示从对象i到对象j的转移次数，表示从对象i到所述多个对象中的所有对象的转移次数。此外，从一个对象转移到所述多个对象中的所有对象的概率之和为1，也即，l(p_i,p_j)满足以下公式：

\frac{N}{\underset{j = 1}{Σ}} l (p_{i}, p_{j}) = 1

优选地，当t＝1时(即第一次执行确定多个对象的排序的步骤时)，多个对象的初始排序的状态矩阵R⁰如下所示：

R^{0} = {[\begin{matrix} PageRank {(p_{1})}^{0} \\ PageRank {(p_{2})}^{0} \\ \cdot \\ \cdot \\ \cdot \\ PageRank {(p_{N})}^{0} \end{matrix}]}^{T}

其中，PageRank(p_i)⁰表示对象i的初始排序值，该PageRank(p_i)⁰可人工设定，或可根据转移情况信息确定。例如，该PageRank(p_i)⁰可根据如下公式确定：

PageRank {(p_{i})}^{0} = \frac{a_{i}}{\underset{i}{Σ} a_{i}}

其中，a_i表示对象i在转移次数信息中出现的次数，例如，从对象i转移到其他所有对象的次数为301次，从其他所有对象转移到对象i的次数为298次，则对象i在转移次数信息中出现的次数＝301+298＝599次；表示所有品牌在转移次数信息中出现的次数总和。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何根据多个对象的转移情况信息以及上一次确定的所述多个对象的排序，确定所述多个对象的本次的排序的实现方式，均应包含在本发明的范围内；例如，上述用于计算R^t的公式中，偏移量矩阵可采用其他数值，如其他人工设定的值等；又例如，若所有l(p_i,p_j)均不为零，则上述用于计算R^t的公式可无需所述偏移量矩阵，即该公式可调整为：

R^{t} = q^{*} R^{t - 1} [\begin{matrix} l (p_{1}, p_{1}) & l (p_{1}, p_{2}) & \cdot \cdot \cdot & l (p_{1}, p_{N}) \\ l (p_{2}, p_{1}) & l (p_{2}, p_{2}) & \cdot \cdot \cdot & l (p_{2}, p_{N}) \\ \cdot & \cdot \\ \cdot & l (p_{i}, p_{j}) & \cdot \cdot \cdot & \cdot \\ \cdot & \cdot \\ l (p_{N}, p_{1}) & l (p_{N}, p_{2}) & \cdot \cdot \cdot & l (p_{N}, p_{N}) \end{matrix}]

或者，对于为零的l(p_i,p_j)，若计算机设备赋予其一个极小的非零值，则同样可采用上述调整后的公式。

在步骤S22中，计算机设备根据多个对象的排序，为所述多个对象中的至少一个对象确定其标杆对象。

例如，计算机设备将多个对象中排序最高的前Z个对象作为该多个对象排序在Z之后的对象的共同的标杆对象。其中，Z为预先设定的自然数，当Z为1时，计算机设备将排序最高的一个对象作为多个对象中其他所有对象的共同的标杆对象。

又例如，对于多个对象中的一个对象，计算机设备将排序位置与该对象的排序位置接近的对象，作为该对象的标杆对象等。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何根据多个对象的排序，为所述多个对象中的至少一个对象确定其标杆对象的实现方式，均应包含在本发明的范围内。

也即，现有技术中尚不存在可由计算机独立确定标杆对象的方案；此外，受到目前人工主观经验的影响，本领域技术人员存在这样的偏见：在考虑标杆对象的确定方案时，往往仅关注前述从对象角度出发的数据。

本发明提供了计算机设备自动确定标杆对象的方案；并且，本发明打破了本领域技术人员的偏见，能够通过分析用户在多个对象中的转移情况，来确定标杆对象。此外，相比前述从对象角度出发的数据，本发明中通过分析用户在多个对象中的转移情况来确定标杆对象的方案，更贴近用户角度，更能直观地反映用户对标杆对象的认识，因此，本发明的方案所确定的标杆对象更为客观、准确；此外，即便在从用户角度出发的数据中，本发明的转移情况信息也并非常见数据，事实上，若明确提及从用户角度出发的数据，本领域技术人员更容易想到的是来自用户的直接评价(如打分、评论文字等)。

图2为本发明一个优选实施例的用于确定标杆对象的确定装置的结构示意图。该确定装置可安装至计算机设备中，该确定装置包括用于获取多个对象的转移情况信息的装置(以下简称“获取装置1”)、用于根据所述转移情况信息，为所述多个对象中的至少一个对象确定其标杆对象的装置(以下简称“子确定装置2”)。

获取装置1获取多个对象的转移情况信息。

1)用户在多个对象中的转移路径信息。

2)用户在各个对象之间的转移次数信息。

3)用户在各个对象之间的转移概率信息。

优选地，该转移情况信息可采用多种存储方式。

例如，该转移情况信息存储为表格，且表格中记录了用户在多个对象中的转移路径以及用户在各个对象之间的转移次数和转移概率，如前述表1所示。

具体地，获取装置1获取多个对象的转移情况信息的方式包括但不限于：

1)获取装置1直接获取已预确定的、该多个对象的转移情况信息。

例如，获取装置1从本地或其他设备处读取已预确定的、该多个对象的转移情况信息。

2)获取装置1进一步包括用于获取多个关键词的转移情况信息的装置(以下简称“子获取装置”，图未示)和用于根据多个关键词分别关联至的对象以及所述多个关键词的转移情况信息，确定多个对象的转移情况信息的装置(以下简称“转移情况确定装置”，图未示)。

子获取装置获取多个关键词的转移情况信息。

a)用户在所述多个关键词中的转移路径信息。

b)用户在各个关键词之间的转移次数信息。

例如，该转移情况信息存储为表格，且表格中记录了用户在多个关键词中的转移路径以及用户在各个关键词之间的转移次数，如前述表2所示。

具体地，子获取装置获取多个关键词的转移情况信息的实现方式包括但不限于：

a)子获取装置直接获取已预确定的、该多个关键词的转移情况信息。

例如，子获取装置从本地或其他设备处读取已预确定的、该多个关键词的转移情况信息。

b)子获取装置获取至少一个用户的关键词关注记录，并根据所述关键词关注记录，确定所述多个关键词的转移情况信息。

优选地，对于每个用户的关键词关注记录，子获取装置根据该关键词关注记录中包含的关键词被关注的时间信息，确定该用户在关键词中的转移路径以及各个关键词之间的转移次数；并且，子获取装置通过合并各个用户在关键词中的转移路径以及各个关键词之间的转移次数，确定所述多个关键词的转移情况信息。

例如，子获取装置获取了用户A和用户B的关键词关注记录；其中，用户A和用户B的关键词关注记录分别如前述表3和表4所示。

则对于用户A的关键词关注记录，子获取装置确定用户A在关键词中的转移路径包括“Query1→Query3”，且“Query1→Query3”的转移次数为1；类似地，子获取装置确定用户B在关键词中的转移路径包括“Query1→Query2”，且“Query1→Query2”的转移次数为1。接着，子获取装置合并用户A和B在关键词中的转移路径以及各个关键词之间的转移次数，确定所述多个关键词的转移情况信息如前述表5所示。

转移情况确定装置根据多个关键词分别关联至的对象以及所述多个关键词的转移情况信息，确定多个对象的转移情况信息。

具体地，转移情况确定装置可根据用户在多个关键词中的转移路径信息以及多个关键词分别关联至的对象，确定用户在多个对象中的转移路径信息，并且，转移情况确定装置根据用户在各个关键词之间的转移次数信息以及多个关键词分别关联至的对象，确定用户在各个对象之间的转移次数和/或转移概率信息。

例如，多个关键词的转移情况信息如前述表2所示，且Query1、Query2和Query3分别关联至Object1、Object2和Object3；转移情况确定装置根据表2所示的关键词的转移情况信息以及前述关联关系，确定用户在对象Object1、Object2和Object3中的转移路径包括“Object1→Object2”和“Object1→Object3”，且该2个转移路径的转移次数分别为5和8；接着，转移情况确定装置根据该2个转移路径的转移次数，计算“Object1→Object2”的转移概率＝5/(5+8)＝38.46％，“Object1→Object3”的转移概率＝8/(5+8)＝61.54％，也即，转移情况确定装置获得如表1所示的转移情况信息。

需要说明的是，优选地，转移情况确定装置可基于以下公式来计算对象i到对象j的转移概率p_ij：

p_{ij} = \frac{a_{ij}}{\underset{j}{Σ} a_{ij}}

子确定装置2根据获取装置1获得的多个对象的转移情况信息，为多个对象中的至少一个对象确定其标杆对象，其中，所述标杆对象属于所述多个对象。优选地，所述多个对象属于同一类别。

具体地，子确定装置2根据多个对象的转移情况信息，为多个对象中的至少一个对象确定其标杆对象的实现方式包括但不限于：

1)子确定装置2直接根据多个对象的转移情况信息，为多个对象中的至少一个对象确定其标杆对象。

例如，共存在三个对象Object1、Object2和Object3，转移情况信息如表1所示，则子确定装置2根据从Object1到Object3的转移概率超过预定阈值60％，将Object3确定为Object1的标杆对象。

又例如，对于多个对象中的每个对象，子确定装置2计算该多个对象中的其他对象到该对象的转移概率的平均值；接着，子确定装置2选择平均值最高的一个对象，作为该多个对象中其他对象的共同的标杆对象。

2)子确定装置2进一步包括用于根据所述转移情况信息，确定所述多个对象的排序的装置(以下简称“排序确定装置”，图未示)、用于根据所述排序，为所述多个对象中的至少一个对象确定其标杆对象的装置(以下简称“标杆对象确定装置”，图未示)。

排序确定装置根据多个对象的转移情况信息，确定该多个对象的排序。

具体地，排序确定装置根据多个对象的转移情况信息，确定该多个对象的排序的实现方式包括但不限于：

a)排序确定装置直接根据多个对象的转移情况信息，确定该多个对象的排序。

例如，对于多个对象中的每个对象，排序确定装置计算该多个对象中的其他对象到该对象的转移概率的平均值；接着，排序确定装置根据每个对象的所述转移概率的平均值，对多个对象进行排序。

b)排序确定装置根据多个对象的转移情况信息以及所述多个对象的初始排序，确定所述多个对象的排序。其中，所述初始排序可人工设定，或通过多个对象的转移情况信息来被预确定。

具体地，排序确定装置可根据多个对象的转移情况信息，对所述多个对象的初始排序进行调整，获得所述多个对象的排序。该实现方式包括但不限于：

i)排序确定装置直接根据多个对象的转移情况信息，对所述多个对象的初始排序进行一次性调整，获得所述多个对象的排序。

例如，排序确定装置根据转移情况信息中包含的转移次数和/或转移概率，将转移到其他对象的概率较低，且其他对象转移到自身的概率较高的对象的排序上调等。

ii)排序确定装置重复执行以下操作，直至满足预定条件：排序确定装置根据多个对象的转移情况信息以及上一次确定的所述多个对象的排序，确定所述多个对象的本次的排序；更优选地，排序确定装置可根据对象的转移情况信息的矩阵与上一次确定的多个对象的排序的矩阵，如通过将该两个矩阵相乘，来确定多个对象的本次的排序。其中，最后一次被确定的排序为所述多个对象的排序；其中，当确定所述多个对象的本次的排序的操作被首次执行时，所述上一次确定的所述多个对象的排序为所述初始排序。

其中，所述预定条件包括任何能够终止所述重复操作的条件。优选地，所述预定条件包括但不限于以下至少一项：

-重复次数达到预定重复阈值；例如，预定重复阈值为50次，当排序确定装置执行50次根据多个对象的转移情况信息以及上一次确定的所述多个对象的排序来确定所述多个对象的本次的排序的操作后，停止重复操作。

-在多次重复所述确定所述多个对象的本次的排序的操作后，所述多个对象的排序没有发生变化；例如，当排序确定装置重复执行5次根据多个对象的转移情况信息以及上一次确定的所述多个对象的排序来确定所述多个对象的本次的排序后，所获得的该多个对象的排序没有发生变化，则排序确定装置停止重复操作。

优选地，在实现方式ii)中，排序确定装置可根据以下公式来计算多个对象的本次的排序：

R^{t} = {[\begin{matrix} (1 - q) / N \\ (1 - q) / N \\ \cdot \\ \cdot \\ \cdot \\ (1 - q) / N \end{matrix}]}^{T} + q^{*} R^{t - 1} [\begin{matrix} l (p_{1}, p_{1}) & l (p_{1}, p_{2}) & \cdot \cdot \cdot & l (p_{1}, p_{N}) \\ l (p_{2}, p_{1}) & l (p_{2}, p_{2}) & \cdot \cdot \cdot & l (p_{2}, p_{N}) \\ \cdot & \cdot \\ \cdot & l (p_{i}, p_{j}) & \cdot \cdot \cdot & \cdot \\ \cdot & \cdot \\ l (p_{N}, p_{1}) & l (p_{N}, p_{2}) & \cdot \cdot \cdot & l (p_{N}, p_{N}) \end{matrix}]

{[\begin{matrix} (1 - q) / N \\ (1 - q) / N \\ \cdot \\ \cdot \\ \cdot \\ (1 - q) / N \end{matrix}]}^{T}

l (p_{i}, p_{j}) = \frac{b_{ij}}{\underset{j}{Σ} b_{ij}}

\frac{N}{\underset{j = 1}{Σ}} l (p_{i}, p_{j}) = 1

优选地，当t＝1时(即第一次执行确定多个对象的排序的操作时)，多个对象的初始排序的状态矩阵R⁰如下所示：

R^{0} = {[\begin{matrix} PageRank {(p_{1})}^{0} \\ PageRank {(p_{2})}^{0} \\ \cdot \\ \cdot \\ \cdot \\ PageRank {(p_{N})}^{0} \end{matrix}]}^{T}

PageRank {(p_{i})}^{0} = \frac{a_{i}}{\underset{i}{Σ} a_{i}}

R^{t} = q^{*} R^{t - 1} [\begin{matrix} l (p_{1}, p_{1}) & l (p_{1}, p_{2}) & \cdot \cdot \cdot & l (p_{1}, p_{N}) \\ l (p_{2}, p_{1}) & l (p_{2}, p_{2}) & \cdot \cdot \cdot & l (p_{2}, p_{N}) \\ \cdot & \cdot \\ \cdot & l (p_{i}, p_{j}) & \cdot \cdot \cdot & \cdot \\ \cdot & \cdot \\ l (p_{N}, p_{1}) & l (p_{N}, p_{2}) & \cdot \cdot \cdot & l (p_{N}, p_{N}) \end{matrix}]

或者，对于为零的l(p_i,p_j)，若确定装置赋予其一个极小的非零值，则同样可采用上述调整后的公式。

标杆对象确定装置根据多个对象的排序，为所述多个对象中的至少一个对象确定其标杆对象。

例如，标杆对象确定装置将多个对象中排序最高的前Z个对象作为该多个对象排序在Z之后的对象的共同的标杆对象。其中，Z为预先设定的自然数，当Z为1时，标杆对象确定装置将排序最高的一个对象作为多个对象中其他所有对象的共同的标杆对象。

又例如，对于多个对象中的一个对象，标杆对象确定装置将排序位置与该对象的排序位置接近的对象，作为该对象的标杆对象等。

需要注意的是，本发明可在软件和/或软件与硬件的组合体中被实施，例如，本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中，本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本发明的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种用于在计算机设备中为对象确定标杆对象的方法，其中，该方法包括：

2.根据权利要求1所述的方法，其中，确定所述标杆对象的步骤包括：

根据所述转移情况信息，确定所述多个对象的排序；

根据所述排序，为所述多个对象中的至少一个对象确定其标杆对象。

3.根据权利要求1或2所述的方法，其中，确定所述多个对象的排序的步骤包括：

根据所述转移情况信息以及所述多个对象的初始排序，确定所述多个对象的排序。

4.根据权利要求3所述的方法，其中，确定所述多个对象的排序的步骤包括：

重复执行以下步骤，直至满足预定条件：

根据所述转移情况信息以及上一次确定的所述多个对象的排序，确定所述多个对象的本次的排序；

其中，最后一次被确定的排序为所述多个对象的排序；

其中，当确定所述多个对象的本次的排序的步骤被首次执行时，所述上一次确定的所述多个对象的排序为所述初始排序。

5.根据权利要求4所述的方法，其中，所述预定条件包括以下至少一项：

-重复次数达到预定重复阈值；

-在多次重复所述确定所述多个对象的本次的排序的步骤后，所述多个对象的排序没有发生变化。

6.根据权利要求1至5中任一项所述的方法，其中，所述多个对象属于同一类别。

7.根据权利要求1至6中任一项所述的方法，其中，获取所述转移情况信息的步骤包括：

获取多个关键词的转移情况信息，其中，所述多个关键词的转移情况信息用于指示基于对象信息获取行为的、用户在多个关键词中的转移情况；

根据所述多个关键词分别关联至的对象以及所述多个关键词的转移情况信息，确定所述多个对象的转移情况信息。

8.根据权利要求7所述的方法，其中，获取所述关键词之间的转移情况信息的步骤包括：

获取至少一个用户的关键词关注记录，该关键词关注记录包括所述多个用户在对象信息获取行为中关注过的关键词以及所述关键词被关注的时间信息；

根据所述关键词关注记录，确定所述多个关键词的转移情况信息。

9.根据权利要求7或8所述的方法，其中，所述多个关键词的转移情况信息包括以下至少一项：

-用户在所述多个关键词中的转移路径信息；

-用户在各个关键词之间的转移次数信息。

10.根据权利要求1至9中任一项所述的方法，其中，所述多个对象之间的转移情况信息包括以下至少一项：

-用户在所述多个对象中的转移路径信息；

-用户在各个对象之间的转移次数信息；

-用户在各个对象之间的转移概率信息。

11.一种用于在计算机设备中为对象确定标杆对象的装置，其中，该装置包括：

12.根据权利要求11所述的装置，其中，用于确定所述标杆对象的装置包括：

用于根据所述转移情况信息，确定所述多个对象的排序的装置；

用于根据所述排序，为所述多个对象中的至少一个对象确定其标杆对象的装置。

13.根据权利要求11或12所述的装置，其中，用于确定所述多个对象的排序的装置包括：

用于根据所述转移情况信息以及所述多个对象的初始排序，确定所述多个对象的排序的装置。

14.根据权利要求13所述的装置，其中，用于确定所述多个对象的排序的装置包括：

用于触发以下装置重复执行操作，直至满足预定条件的装置：

用于根据所述转移情况信息以及上一次确定的所述多个对象的排序，确定所述多个对象的本次的排序的装置；

其中，最后一次被确定的排序为所述多个对象的排序；

15.根据权利要求14所述的装置，其中，所述预定条件包括以下至少一项：

-重复次数达到预定重复阈值；

16.根据权利要求11至15中任一项所述的装置，其中，所述多个对象属于同一类别。

17.根据权利要求11至16中任一项所述的装置，其中，用于获取所述转移情况信息的装置包括：

用于获取多个关键词的转移情况信息的装置，其中，所述多个关键词的转移情况信息用于指示基于对象信息获取行为的、用户在多个关键词中的转移情况；

用于根据所述多个关键词分别关联至的对象以及所述多个关键词的转移情况信息，确定所述多个对象的转移情况信息的装置。

18.根据权利要求17所述的装置，其中，获取所述关键词之间的转移情况信息的装置包括：

用于获取至少一个用户的关键词关注记录的装置，该关键词关注记录包括所述多个用户在对象信息获取行为中关注过的关键词以及所述关键词被关注的时间信息；

用于根据所述关键词关注记录，确定所述多个关键词的转移情况信息的装置。

19.根据权利要求17或18所述的装置，其中，所述多个关键词的转移情况信息包括以下至少一项：

-用户在所述多个关键词中的转移路径信息；

-用户在各个关键词之间的转移次数信息。

20.根据权利要求11至19中任一项所述的装置，其中，所述多个对象之间的转移情况信息包括以下至少一项：

-用户在所述多个对象中的转移路径信息；

-用户在各个对象之间的转移次数信息；

-用户在各个对象之间的转移概率信息。