CN111368131B

CN111368131B - 用户关系识别方法、装置、电子设备及存储介质

Info

Publication number: CN111368131B
Application number: CN202010153074.4A
Authority: CN
Inventors: 李家杰
Original assignee: China Mobile Communications Group Co Ltd; MIGU Music Co Ltd; MIGU Culture Technology Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; MIGU Music Co Ltd; MIGU Culture Technology Co Ltd
Priority date: 2020-03-06
Filing date: 2020-03-06
Publication date: 2023-08-18
Anticipated expiration: 2040-03-06
Also published as: CN111368131A

Abstract

本发明实施例提供一种用户关系识别方法、装置、电子设备及存储介质，该方法包括：确定用于识别用户关系的设定识别模型；获取第一用户针对第二用户的用户行为数据；根据所述用户行为数据和所述设定识别模型，识别第一用户针对第二用户的用户关系。因此，本发明实施例实现了直接采用预先训练好的识别模型来识别不同用户之间的用户关系，提高了用户关系识别的效率，还提高了用户关系识别的准确性，尤其是在信息推荐时，可以根据识别出的用户关系进行准确推荐，从而达到更好的信息推荐结果。

Description

用户关系识别方法、装置、电子设备及存储介质

技术领域

本发明涉及通信技术领域，尤其涉及一种用户关系识别方法、装置、电子设备及存储介质。

背景技术

随着通信技术的飞速发展，移动终端的普及率越来越高，移动终端的应用领域也越来越广。现有移动终端上的音乐APP(应用程序，Application)已经代替了传统的音乐播放设备，成为人们日常听歌的主要工具，同时由于因为移动终端(手机)的普及以及其便于携带的特性，使得用户可以随时随地的利用手机上安装的音乐APP收听歌曲，这也就使得听歌成为人们日常休闲放松的主要活动。

目前，为了能给用户提供更满意且更符合用户需求的音乐内容，现有的音乐APP通常可以基于一些音乐推荐算法，计算出用户可能喜欢的音乐，并向用户推荐该些音乐。而其中协同过滤算法和标签相似性算法是目前最为常用的音乐推荐算法。

但是，基于用户的协同过滤算法、标签相似性算法受用户质量和内容标签质量影响较大。如果用户群样本中有很多异常用户，或者内容标签不够精准，将无法达到更好的信息推荐结果。

发明内容

针对现有技术存在的问题，本发明实施例提供一种用户关系识别方法、装置、电子设备及存储介质。

第一方面，本发明实施例提供一种用户关系识别方法，包括：

确定用于识别用户关系的设定识别模型；

获取第一用户针对第二用户的用户行为数据；

根据所述用户行为数据和所述设定识别模型，识别第一用户针对第二用户的用户关系。

可选地，所述确定用于识别用户关系的设定识别模型，包括：

根据预先设置的用于识别用户关系的关联标签，从数据库中选取训练样本用户；

对所述训练样本用户的行为数据进行证据权重WOE和信息价值IV计算，得到用户行为对应的IV值；

根据所述用户行为对应的IV值，在层次分析法AHP中构造判断矩阵，所述判断矩阵中每一行的各个得分项的得分值用于表征行标题表示的用户行为针对列标题表示的另一用户行为的重要程度；

调整所述判断矩阵中每一行的各个得分项的权重，并进行召回率计算，直到计算得到的召回率不继续变大时，结束权重调整为止；

输出最大召回率对应的用户行为权重值、以及用于识别用户关系的用户行为得分阈值。

可选地，所述关联标签包括多种用于识别用户关系的二分类标签；

所述训练样本用户包括正样本用户和负样本用户，所述正样本用户是具备至少一种二分类标签的用户，所述负样本用户是不具备任一二分类标签的用户。

可选地，所述对所述训练样本用户的行为数据进行证据权重WOE和信息价值IV计算，得到用户行为对应的IV值，包括：

针对任一用户行为，配置多个行为数据组；

将所述训练样本用户的行为数据划分至对应的行为数据组中；

利用第一公式计算各个行为数据组的WOE值；其中，第一公式包括：

WOE_i＝ln((y_i/y)/(n_i/n))

其中，i表示待计算WOE值的行为数据组的编号，y_i表示待计算WOE值的行为数据组中具备所述关联标签的用户数，y表示所有行为数据组中具备所述关联标签的用户数，n_i表示待计算WOE值的行为数据组中不具备所述关联标签的用户数，n表示所有行为数据组中不具备所述关联标签的用户数；

利用第二公式计算各个行为数据组的IV值；其中，第二公式包括：

IV_i＝WOE_i*((y_i/y)-(n_i/n))

其中，i表示待计算IV值的行为数据组的编号，WOE_i表示待计算IV值的行为数据组的WOE值，y_i表示待计算IV值的行为数据组中具备所述关联标签的用户数，y表示所有行为数据组中具备所述关联标签的用户数，n_i表示待计算IV值的行为数据组中不具备所述关联标签的用户数，n表示所有行为数据组中不具备所述关联标签的用户数；

对各个行为数据组的IV值求和，得到用户行为对应的IV值。

可选地，所述调整所述判断矩阵中每一行的各个得分项的权重，包括：

计算所述判断矩阵中每一列的和，并对每个得分项进行归一化处理；

计算归一化处理后的判断矩阵中每一行的和；

对每一行的和进行归一化处理，得到的归一化处理结果为行标题表示的用户行为对应的权重值；

对计算得到的权重值进行一致性验证，所述一致性验证是基于计算得到的权重值，确定不同用户行为中两两比较后的重要程度为逻辑一致。

可选地，所述根据所述用户行为数据和所述设定识别模型，识别第一用户针对第二用户的用户关系，包括：

根据所述设定识别模型输出的所述用户行为权重值，计算所述用户行为数据对应的用户行为得分；

根据计算得到的所述用户行为得分、以及所述设定识别模型输出的所述用户行为得分阈值，识别第一用户针对第二用户的用户关系。

可选地，所述根据计算得到的所述用户行为得分、以及所述设定识别模型输出的所述用户行为得分阈值，识别第一用户针对第二用户的用户关系，包括：

若所述用户行为得分为大于所述用户行为得分阈值，则确定所述用户关系为第一关系；

若所述用户行为得分为小于或等于所述用户行为得分阈值，则确定所述用户关系为第二关系。

第二方面，本发明实施例提供一种用户关系识别装置，包括：

模型确定模块，用于确定用于识别用户关系的设定识别模型；

数据获取模块，用于获取第一用户针对第二用户的用户行为数据；

关系识别模块，用于根据所述用户行为数据和所述设定识别模型，识别第一用户针对第二用户的用户关系。

第三方面，本发明实施例还提出一种电子设备，包括：

至少一个处理器；以及

与所述处理器通信连接的至少一个存储器，其中：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行上述方法。

第四方面，本发明实施例还提出一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机程序，所述计算机程序使所述计算机执行上述方法。

本发明实施例提供的用户关系识别方法、装置、电子设备及存储介质，通过确定用于识别用户关系的设定识别模型，获取第一用户针对第二用户的用户行为数据，根据用户行为数据和设定识别模型，识别第一用户针对第二用户的用户关系，从而实现了直接采用预先训练好的识别模型来识别不同用户之间的用户关系，提高了用户关系识别的效率，还提高了用户关系识别的准确性，尤其是在信息推荐时，可以根据识别出的用户关系进行准确推荐，能够达到更好的信息推荐结果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种用户关系识别方法的流程示意图；

图2为本发明实施例提供的参加过和未参加过线下活动的用户占比对比示意图；

图3为本发明实施例提供的一种用户关系识别装置的结构示意图；

图4为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的一种用户关系识别方法的流程示意图；该用户关系识别方法可以用于终端，比如：智能手机；如图1所示，该用户关系识别方法可以包括以下步骤：

S110、确定用于识别用户关系的设定识别模型。

具体地，用户关系可以指的是不同用户之间的某种特定的关系。设定识别模型可以指的是预先训练好的、且用于识别某种特定的关系的模型。

比如：一个用户是艺人，另一用户是该艺人的粉丝，用户关系可以指的是艺人和粉丝的关系；设定识别模型是用于识别艺人和粉丝的关系的模型。

又比如：一个用户是歌星，另一个用户是该歌星的歌迷，用户关系可以指的是歌星和歌迷的关系；设定识别模型是用于识别歌星和歌迷的关系的模型。

S120、获取第一用户针对第二用户的用户行为数据。

具体地，为了识别第一用户针对第二用户的用户关系，可以基于第一用户针对第二用户的用户行为数据来识别。

比如：第一用户针对第二用户的用户行为数据包括：第一用户听过第二用户的歌120次，参加第二用户演唱会3次，下载第二用户歌曲5首，这样在识别第一用户是否为第二用户的歌迷时，可以基于这些用户行为数据来识别。

S130、根据用户行为数据和设定识别模型，识别第一用户针对第二用户的用户关系。

具体地，为了提高识别的准确度，在识别用户关系时，可以基于用户行为数据之外，还需要利用预先训练好的识别模型，这样可以对用户关系进行准确的识别。在根据用户行为数据和设定识别模型识别第一用户针对第二用户的用户关系时，可以基于识别模型的输出，再结合用户行为数据，确定第一用户针对第二用户的用户关系。

比如：设定识别模型是用于识别歌星和歌迷的关系的模型，这样就可以利用该模型和第一用户针对第二用户的用户行为数据来识别第一用户是否为第二用户的歌迷，若是，则可以对第一用户推荐第二用户的歌曲，从而达到更好地歌曲推荐效果。另外，除了推荐歌曲之后，还可以将该识别结果应用于售票、活动推广、专辑销售等不同的应用场景中。

由上述实施例可见，通过确定用于识别用户关系的设定识别模型，获取第一用户针对第二用户的用户行为数据，根据用户行为数据和设定识别模型，识别第一用户针对第二用户的用户关系，从而实现了直接采用预先训练好的识别模型来识别不同用户之间的用户关系，提高了用户关系识别的效率，还提高了用户关系识别的准确性，尤其是在信息推荐时，可以根据识别出的用户关系进行准确推荐，能够达到更好的信息推荐结果。

进一步地，在上述方法实施例的基础上，在执行步骤110时，可以包括但不限于以下实现方式：

(1-1)根据预先设置的用于识别用户关系的关联标签，从数据库中选取训练样本用户。

具体地，预先设置的关联标签通常选取与识别用户关系关联性最强的指标。比如：识别用户是否为某一个艺人歌手的歌迷粉丝，其对应的关联标签可以包括：该用户参加过现场演唱会、购买过一定数量数字专辑、问卷调查结果等。

(1-2)对所述训练样本用户的行为数据进行证据权重WOE(Weight of Evidence，证据权重)和IV(Information Value，信息价值)计算，得到用户行为对应的IV值。

具体地，训练样本用户的行为数据可以包括一种或多种用户行为对应的数据。比如：针对音乐APP的歌曲操作数据，其中，歌曲操作数据又具体可以划分为：试听、下载、分享、收藏以及评论等数据。其中，试听、下载、分享、收藏以及评论均指的是不同的用户行为。

(1-3)根据所述用户行为对应的IV值，在AHP(Analytic Hierarchy Process，层次分析法)中构造判断矩阵，所述判断矩阵中每一行的各个得分项的得分值用于表征行标题表示的用户行为针对列标题表示的另一用户行为的重要程度。

(1-4)调整所述判断矩阵中每一行的各个得分项的权重，并进行召回率计算，直到计算得到的召回率不继续变大时，结束权重调整。

具体地，AHP的信息基础主要是对每一层次各因素的相对重要性给出的判断，这些判断用数值表示出来，写成矩阵形式就是判断矩阵。

比如：用户行为包括试听、下载、分享、收藏以及评论，构造的判断矩阵如表1所示。

表1所示

其中，每格填入的值代表横标题对于竖标题而言的重要程度，1表示同等重要，3表示稍微重要，5表示较为重要，7表示非常重要，9表示绝对重要，2，4，6，8表示重要性介于1，3，5，7，9之间。

在调整判断矩阵中每一行的各个得分项的权重时，就是每格填入的值。比如：试听与试听相交值为1即同等重要，下载与试听相交值为3表示下载稍微重要，收藏与试听相交值为8表示收藏相对试听而言在非常重要和绝对重要之间。其中，倒数如1/3表示两者关系正好相反。此举既保证了变量两两关系的评价具有客观性又结合了一定主观性。

(1-5)输出最大召回率对应的用户行为权重值、以及用于识别用户关系的用户行为得分阈值。

具体地，可以将最大召回率对应的用户行为权重值作为设定识别模型的权重，以及将设定识别模型输出的得分阈值作为识别用户关系的评价标准。

另外，由于设定识别模型会输出用于识别用户关系的用户行为权重值和用户行为得分阈值，这样在识别用户关系时，可以利用输出值进行识别。

由上述实施例可见，通过根据预先设置的用于识别用户关系的关联标签，从数据库中选取具备所述关联标签的训练样本用户，对所述训练样本用户的行为数据进行证据权重WOE和信息价值IV计算，得到用户行为对应的IV值；根据所述用户行为对应的IV值，在层次分析法AHP中构造判断矩阵，反复地调整所述判断矩阵中每一行的各个得分项的权重，并进行召回率计算，直到计算得到的召回率不继续变大时，结束权重调整；输出最大召回率对应的用户行为权重值、以及用于识别用户关系的用户行为得分阈值，从而实现了在训练识别模型中加入了关联标签、训练集、WOE、IV和召回率等因素，保证了训练得到的识别模型的客观性，以及具有较高的识别准确度。

进一步地，在上述方法实施例的基础上，上述(1-1)中的所述关联标签包括多种用于识别用户关系的二分类标签；

具体地，二分类：表示分类任务中有两个类别，即每个样本都被设置了一个且仅有一个标签0或者1。比如：参加现场演唱会，购买数字专辑，问卷调查结果等近似二分类的标签。

另外，在选取训练样本用户时，可以选取一些正样本用户和一些负样本用户。比如：当需要对识别某明星的粉丝时，音乐APP的后台服务器在数据库中选取具备以上任意二分类标签或某些二分类标签组合的用户作为该明星的粉丝用户，同时选取不具备上述任一二分类标签的用户作为该明星的非粉丝用户。根据粉丝用户构成后续训练使用的正样本数据集，根据非粉丝用户构成后续训练的负样本数据集。

后台服务器会按照一定比例从正负样本集中分别抽取一定数量的数据进行权重训练，以下示例中以是否参加过演唱会作为关联标签为例，按照1:4的比例抽取参加过演唱会的用户455人，未参加演唱会的用户1820人，总计2275人，作为训练样本。

由上述实施例可见，通过预先设置多种二分类标签，以及在选取训练样本用户时，可以选取一些正样本用户和一些负样本用户，从而丰富了训练样本用户的种类，满足了后续训练识别模型时对训练样本的需求。

进一步地，在上述方法实施例的基础上，在执行(1-2)时，可以包括但不限于以下实现方式：

(2-1)针对任一用户行为，配置多个行为数据组；

(2-2)将所述训练样本用户的行为数据划分至对应的行为数据组中；

(2-3)利用第一公式计算各个行为数据组的WOE值；其中，第一公式包括：

WOE_i＝ln((y_i/y)/(n_i/n))

(2-4)利用第二公式计算各个行为数据组的IV值；其中，第二公式包括：

IV_i＝WOE_i*((y_i/y)-(n_i/n))

(2-5)对各个行为数据组的IV值求和，得到用户行为对应的IV值。

具体地，训练样本数据为某明星的粉丝用户以及非粉丝用户，则训练样本的各项指标则为该用户的行为数据，比如针对音乐APP的歌曲操作数据，其中，歌曲操作数据又具体可以划分为：试听、下载、分享、收藏以及评论等数据。

以试听数据为例，来描述上述(2-1)至(2-5)的具体实现过程：

与(2-1)对应的，为试听次数配置多个组。比如：10个组，如表2中的(0.0)、(20.0)、(30.0)、(40.0)、(50.0)、(60.0)、(70.0)、(80.0)、(90.0)、(100.0)。

与(2-2)对应的，将训练样本用户(2275人)按试听次数划分到对应组中。比如：试听0次且参加过演唱会的用户数为379人，试听0次且未参加过演唱会的用户数为1169人；

与(2-3)对应的，按照第一公式计算各个组的WOE_i值。其中，第一公式包括：WOE_i＝ln((y_i/y)/(n_i/n))；

其中，i表示当前组编号，y_i为当前分组中参加过演唱会的人数，y为训练样本中的所有参加过演唱会的人数，n_i为当前组中未参加过演唱会的人数，n为训练样本中的所有未参加过演唱会的人数。

以下述表2中记录的第二组数据为例，则实际计算结果为：

WOE₂＝ln((5/455)/(59/1820))＝-1.081805

与(2-4)对应的，按照第二公式计算各个组的IV_i值。其中，第二公式包括：IVi＝WOEi×((yi/y)/(ni/n))；

仍以下述表2中记录的第二组数据为例，则实际计算结果为：

IV2＝-1.081805*((5/455)-(59/1820))＝0.023128

与(2-5)对应的，对所有组的IV值求和，计算试听行为对应的IV值。

IV＝0.049557+0.023182+…+0.026094+0.062548＝0.477012

表2

按照上述方法，依次计算试听、下载、分享、收藏以及评论等用户行为的IV值，得到如下表3的计算结果。

表3

用户行为	IV	重要性排序
			收藏	0.743611	1
评论	0.559043	2
			分享	0.512237	3
下载	0.500824	4
			试听	0.477012	5

在本发明实施例中，后台服务器计算出的IV值越大，则说明该用户行为对于预测是否为歌迷这一结果更为重要，进而后续在AHP等算法中结合业务经验构造判断矩阵得出最终的权重。

由上述实施例可见，针对任一用户行为，可以配置多个行为数据组，并将所述训练样本用户的行为数据划分至对应的行为数据组中，计算各个行为数据组的WOE值，根据所述WOE值，计算各个行为数据组的IV值，对各个行为数据组的IV值求和，得到用户行为对应的IV值，从而实现了通过IV值来表明该用户行为对预测用户关系的重要程度，尤其是IV值越大，重要程度越高，这样有利于后续在AHP中结合业务经验构造判断矩阵得出最终的权重。

进一步地，在上述方法实施例的基础上，如表1所示，所述判断矩阵中每一行的各个得分项的得分值用于表征一用户行为针对另一用户行为的重要程度；在执行(1-4)时，可以包括但不限于以下实现方式：

(3-1)计算所述判断矩阵中每一列的和，并对每个得分项进行归一化处理；

(3-2)计算归一化处理后的判断矩阵中每一行的和；

(3-3)对每一行的和进行归一化处理，得到的归一化处理结果为用户行为对应的权重值；

(3-4)对计算得到的权重值进行一致性验证，所述一致性验证是基于计算得到的权重值，确定不同用户行为中两两比较后的重要程度为逻辑一致。

具体地，一致性验证是确保两两比较后的重要性呈逻辑一致。举例说明，假设认为A比C重要得多，B比C重要一些，一致性验证即是用于确保A比B更重要得一种检验方法。

另外，通过一致性验证后的结果，即各权重值按照用户各行为次数或分箱后的打分计算出最终得分，可以将所有用户行为得分进行离散化，区分出有强相关行为的用户和无强相关行为的用户，反复地调整所述判断矩阵中每一行的各个得分项的权重，直到出现强相关行为的用户数大于无强相关行为的用户数的得分值，并以该得分值为基准计算召回率的最大值。

其中，针对用于识别用户关系的二分类标签，强相关行为的用户指的是具备该二分类标签的用户，无强相关行为的用户指的是不具备该二分类标签的用户。比如：二分类标签为是否参加过线下活动，强相关行为的用户指的是参加过线下活动的用户，无强相关行为的用户指的是未参加过线下活动。

所述召回率是该得分值以上的强相关行为用户数与所有的强相关行为用户数的比值；该得分值为用于识别用户关系的用户行为得分阈值。

以表1为例，来描述上述(3-1)至(3-4)的具体实现过程：

与(3-1)对应的，计算表1中每一列的和，并对每个得分项进行归一化处理。比如：试听归一化＝1/25＝0.04；计算结果如下表4所示。

表4

与(3-2)对应的，计算归一化处理后的判断矩阵中每一行的和；具体计算结果如下表5所示。

表5

与(3-3)对应的，对每一行的和进行归一化处理，得到的归一化处理结果为用户行为对应的权重值；比如：试听权重为0.18241/5＝0.036482，具体计算结果如下表6所示。

表6

与(3-4)对应的，对计算得到的权重值进行一致性验证，所述一致性验证是基于计算得到的权重值，确定不同用户行为中两两比较后的重要程度为逻辑一致。其中，调整权重设置以保证通过一致性验证；

具体地，通过一致性验证后的结果，即各权重值按照用户各行为次数或分箱后的打分计算出最终得分，然后可以将所有用户行为得分进行离散化，区分出有强相关行为的用户和无强相关行为的用户，如图2所示的参加过和未参加过线下活动的用户占比对比示意图，其中的黑色柱条代表参加过线下活动的用户分布即有强相关行为的用户分布，而灰色柱条代表未参加过线下活动的用户分布即无强相关行为的用户分布。在(0，15)区间，无强相关行为用户数总量均大于有强相关行为用户数。而从15分开始往后的所有区间中，有强相关行为用户数总量均大于无强相关行为用户数。即可以认为，得分15分以上的用户中，有更大的可能性会表现出典型地粉丝行为，进而认为是该艺人的粉丝。其中：

召回率＝所有15分以上的强相关行为用户数/所有的强相关行为用户数；

准确率＝所有15分以上的强相关行为用户数/所有15分以上的用户数。

通过不断调整前面的权重值，使得以出现强相关行为用户数大于无强相关行为用户数的得分值(例如该例子中的15分)为基准计算出的召回率和准确率取得最大值，并输出该得分值为评判一个用户是否为某个艺人的粉丝的标准。

由上述实施例可见，可以根据所述用户行为对应的IV值，在AHP中构造判断矩阵，计算所述判断矩阵中每一列的和，并对每个得分项进行归一化处理，计算归一化处理后的判断矩阵中每一行的和，对每一行的和进行归一化处理，得到的归一化处理结果为用户行为对应的权重值，对计算得到的权重值进行一致性验证，按照通过一致性验证的权重值计算所有训练样本用户的用户行为得分，将所有用户行为得分进行离散化，区分出有强相关行为的用户和无强相关行为的用户，反复地调整所述判断矩阵中每一行的各个得分项的权重，直到出现具备二分类标签的用户大于不具备二分类标签的用户的得分值，并以该得分值为基准计算召回率的最大值，从而实现了通过构造判断矩阵来确定最终权重，还保证了不同用户行为的重要程度评价具有客观性有结合了一定的主观性，并通过选定一批高关联性的指标作为分类标签，有目标有标准的进行权重优化，最终在多次迭代计算后达到收敛，从而保证训练得到的识别模型具有较高的识别准确度。

进一步地，在上述方法实施例的基础上，在执行步骤130时，可以包括但不限于以下实现方式：

(4-1)根据所述设定识别模型输出的所述用户行为权重值，计算所述用户行为数据对应的用户行为得分。

具体地，可以利用第三公式计算用户行为得分。其中，第三公式包括：

用户行为得分＝用户行为数据×用户行为权重值的权重值。

(4-2)根据计算得到的所述用户行为得分、以及所述设定识别模型输出的所述用户行为得分阈值，识别第一用户针对第二用户的用户关系。

具体地，可以比较用户行为得分和用户行为得分阈值的大小关系，并根据该大小关系来确定对应的用户关系。

由上述实施例可见，可以根据设定识别模型输出的所述用户行为权重值，计算所述用户行为数据对应的用户行为得分，根据计算得到的所述用户行为得分、以及所述设定识别模型输出的所述用户行为得分阈值，识别第一用户针对第二用户的用户关系，从而提高了用户关系识别的效率。

进一步地，在上述方法实施例的基础上，在执行步骤(4-2)根时，可以包括但不限于以下实现方式：

(5-1)若所述用户行为得分为大于所述用户行为得分阈值，则确定所述用户关系为第一关系；

(5-2)若所述用户行为得分为小于或等于所述用户行为得分阈值，则确定所述用户关系为第二关系。

具体地，若用户行为得分阈值为15分，若用户行为得分大于15分，则可以确定第一用户是第二用户的歌迷；若用户行为得分小于或等于15分，则可以确定第一用户不是第二用户的歌迷。

由上述实施例可见，若所述用户行为得分为大于所述用户行为得分阈值，则确定所述用户关系为第一关系，若所述用户行为得分为小于或等于所述用户行为得分阈值，则确定所述用户关系为第二关系，从而提高了用户关系识别的准确性。

图3为本发明实施例提供的一种用户关系识别装置的结构示意图；该装置可以用于终端，比如：智能手机；如图3所示，该用户关系识别装置可以包括：

模型确定模块31，用于确定用于识别用户关系的设定识别模型；

数据获取模块32，用于获取第一用户针对第二用户的用户行为数据；

关系识别模块33，用于根据所述用户行为数据和所述设定识别模型，识别第一用户针对第二用户的用户关系。

进一步地，在上述装置实施例的基础上，所述模型确定模块31可以包括：

选取子模块，用于根据预先设置的用于识别用户关系的关联标签，从数据库中选取训练样本用户；

第一计算子模块，用于对所述训练样本用户的行为数据进行证据权重WOE和信息价值IV计算，得到用户行为对应的IV值；

构造子模块，用于根据所述用户行为对应的IV值，在层次分析法AHP中构造判断矩阵，所述判断矩阵中每一行的各个得分项的得分值用于表征行标题表示的用户行为针对列标题表示的另一用户行为的重要程度；

调整子模块，用于调整所述判断矩阵中每一行的各个得分项的权重，并进行召回率计算，直到计算得到的召回率不继续变大时，结束权重调整为止；

输出子模块，用于输出最大召回率对应的用户行为权重值、以及用于识别用户关系的用户行为得分阈值。

进一步地，在上述装置实施例的基础上，所述关联标签包括多种用于识别用户关系的二分类标签；

进一步地，在上述装置实施例的基础上，所述第一计算子模块可以包括：

配置单元，用于针对任一用户行为，配置多个行为数据组；

划分单元，用于将所述训练样本用户的行为数据划分至对应的行为数据组中；

第一计算单元，用于利用第一公式计算各个行为数据组的WOE值；其中，第一公式包括：

WOE_i＝ln((y_i/y)/(n_i/n))

其中，i表示待计算WOE值的行为数据组的编号，y_i表示待计算WOE值的行为数据组中具备所述关联标签的用户数，y表示所有行为数据组中具备所述关联标签的用户数，n_i表示待计算WOE值的行为数据组中不具备所述关联标签的用户数，n表示所有行为数据组中不具备所述关联标签的用户数

第二计算单元，用于利用第二公式计算各个行为数据组的IV值；其中，第二公式包括：

IV_i＝WOE_i*((y_i/y)-(n_i/n))

第三计算单元，用于对各个行为数据组的IV值求和，得到用户行为对应的IV值。

进一步地，在上述装置实施例的基础上，所述调整子模块可以包括：

第四计算单元，用于计算所述判断矩阵中每一列的和，并对每个得分项进行归一化处理；

第五计算单元，用于计算归一化处理后的判断矩阵中每一行的和；

第六计算单元，用于对每一行的和进行归一化处理，得到的归一化处理结果为行标题表示的用户行为对应的权重值；

一致性验证单元，用于对计算得到的权重值进行一致性验证，所述一致性验证是基于计算得到的权重值，确定不同用户行为中两两比较后的重要程度为逻辑一致。

进一步地，在上述装置实施例的基础上，所述关系识别模块33可以包括：

第二计算子模块，用于根据所述设定识别模型输出的所述用户行为权重值，计算所述用户行为数据对应的用户行为得分；

识别子模块，用于根据计算得到的所述用户行为得分、以及所述设定识别模型输出的所述用户行为得分阈值，识别第一用户针对第二用户的用户关系。

进一步地，在上述装置实施例的基础上，所述识别子模块可以包括：

第一识别单元，用于若所述用户行为得分为大于所述用户行为得分阈值，则确定所述用户关系为第一关系；

第二识别单元，用于若所述用户行为得分为小于或等于所述用户行为得分阈值，则确定所述用户关系为第二关系。

本实施例所述的用户关系识别装置可以用于执行上述方法实施例，其原理和技术效果类似，此处不再赘述。

图4示出了一种电子设备的实体结构示意图，如图4所示，该电子设备可以包括：处理器(processor)401、通信接口(Communications Interface)402、存储器(memory)403和通信总线404，其中，处理器401，通信接口402，存储器403通过通信总线404完成相互间的通信。处理器401可以调用存储器403中的逻辑指令，以执行如下方法：

确定用于识别用户关系的设定识别模型；

获取第一用户针对第二用户的用户行为数据；

需要说明的是，本实施例中的电子设备在具体实现时可以为服务器，也可以为PC机，还可以为其他设备，只要其结构中包括如图4所示的处理器401、通信接口402、存储器403和通信总线404，其中处理器401，通信接口402，存储器403通过通信总线404完成相互间的通信，且处理器401可以调用存储器403中的逻辑指令以执行上述方法即可。本实施例不对电子设备的具体实现形式进行限定。

此外，上述的存储器403中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

进一步地，本发明实施例公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法，例如包括：

确定用于识别用户关系的设定识别模型；

获取第一用户针对第二用户的用户行为数据；

另一方面，本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法，例如包括：

确定用于识别用户关系的设定识别模型；

获取第一用户针对第二用户的用户行为数据；

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种用户关系识别方法，其特征在于，包括：

确定用于识别用户关系的设定识别模型；

获取第一用户针对第二用户的用户行为数据；

根据所述用户行为数据和所述设定识别模型，识别第一用户针对第二用户的用户关系；

所述确定用于识别用户关系的设定识别模型，包括：

调整所述判断矩阵中每一行的各个得分项的权重，并进行召回率计算，直到计算得到的召回率不继续变大时，结束权重调整；

输出最大召回率对应的用户行为权重值、以及用于识别用户关系的用户行为得分阈值；

所述对所述训练样本用户的行为数据进行证据权重WOE和信息价值IV计算，得到用户行为对应的IV值，包括：

针对任一用户行为，配置多个行为数据组；

WOE_i=ln（（y_i/y）/（n_i/n））；

IV_i= WOE_i*（（y_i/y）-（n_i/n））；

其中，i表示待计算IV值的行为数据组的编号，WOE_i 表示待计算IV值的行为数据组的WOE值，y_i表示待计算IV值的行为数据组中具备所述关联标签的用户数，y表示所有行为数据组中具备所述关联标签的用户数，n_i表示待计算IV值的行为数据组中不具备所述关联标签的用户数，n表示所有行为数据组中不具备所述关联标签的用户数；

对各个行为数据组的IV值求和，得到用户行为对应的IV值；

所述根据所述用户行为数据和所述设定识别模型，识别第一用户针对第二用户的用户关系，包括：

2.根据权利要求1所述的用户关系识别方法，其特征在于，所述关联标签包括多种用于识别用户关系的二分类标签；

3.根据权利要求1所述的用户关系识别方法，其特征在于，所述调整所述判断矩阵中每一行的各个得分项的权重，包括：

计算归一化处理后的判断矩阵中每一行的和；

4.根据权利要求1所述的用户关系识别方法，其特征在于，所述根据计算得到的所述用户行为得分、以及所述设定识别模型输出的所述用户行为得分阈值，识别第一用户针对第二用户的用户关系，包括：

5.一种用户关系识别装置，其特征在于，包括：

关系识别模块，用于根据所述用户行为数据和所述设定识别模型，识别第一用户针对第二用户的用户关系；

所述确定用于识别用户关系的设定识别模型，包括：

针对任一用户行为，配置多个行为数据组；

WOE_i=ln（（y_i/y）/（n_i/n））；

IV_i= WOE_i*（（y_i/y）-（n_i/n））；

对各个行为数据组的IV值求和，得到用户行为对应的IV值；

6.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-4任一项所述用户关系识别方法的步骤。

7.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1-4任一项所述用户关系识别方法的步骤。