CN110197375A - 一种相似用户识别方法、装置、相似用户识别设备和介质 - Google Patents

一种相似用户识别方法、装置、相似用户识别设备和介质 Download PDF

Info

Publication number
CN110197375A
CN110197375A CN201811434297.7A CN201811434297A CN110197375A CN 110197375 A CN110197375 A CN 110197375A CN 201811434297 A CN201811434297 A CN 201811434297A CN 110197375 A CN110197375 A CN 110197375A
Authority
CN
China
Prior art keywords
user
identified
attribute
various dimensions
similar users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811434297.7A
Other languages
English (en)
Inventor
杨洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201811434297.7A priority Critical patent/CN110197375A/zh
Publication of CN110197375A publication Critical patent/CN110197375A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/12Payment architectures specially adapted for electronic shopping systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请属于计算机技术领域,公开了一种相似用户识别方法、装置、相似用户识别设备和介质,本申请公开的相似用户识别方法包括,预先对指定类型的各用户进行特征分析,进而指定用于相似识别的多维度属性;根据各待识别用户的多维度属性中的各属性的特征参数值,确定待识别用户在多个维度上的多维度综合相关度;根据获取的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,并将对应的多维度综合相关度高于最优分隔阈值的各待识别用户,判定为相似用户。这样,通过各待识别用户在各个指定的维度上的相关度,可以识别出相似用户,提高了相似用户识别的效率和精确度。

Description

一种相似用户识别方法、装置、相似用户识别设备和介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种相似用户识别方法、装置、相似用户识别设备和介质。
背景技术
在商户运营中,通常需要对特定目标用户进行识别分析,这类特定目标用户可以是具有某些共性消费特征的,也可以是一些不良的用户,根据识别结果,可以制定相应的运营管理策略。
如,非法用户团伙通常为团伙行动,通过手机号以及邮箱等注册大量的虚假账号,并根据虚假账号进行不规范交易(如,洗钱),为净化运营环境,需要对非法用户团伙进行识别,进而对各非法用户进行屏蔽或惩治。
因此,如何高效且有效的识别特定目标用户成为一种需求。
发明内容
本申请实施例提供一种相似用户识别方法、装置、相似用户识别设备和介质,用以在用户识别时,根据各用户在多个指定维度上的相关度,识别出相似类型的用户,提高用户识别的效率和精确度。
一方面,提供一种相似用户识别方法,包括:
针对每个待识别用户,分别获取指定的多维度属性中每个属性的特征参数值;
针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,并分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待识别用户之间的多维度综合相关度;
根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,分隔阈值模型用于确定对各多维度综合相关度进行最优划分的分隔阈值;
将对应的多维度综合相关度高于最优分隔阈值的各待识别用户,判定为相似用户。
一方面,提供一种相似用户识别装置,包括:
获取单元,用于针对每个待识别用户,分别获取指定的多维度属性中每个属性的特征参数值;
确定单元,用于针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,并分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待识别用户之间的多维度综合相关度;
获得单元,用于根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,分隔阈值模型用于确定对各多维度综合相关度进行最优划分的分隔阈值;
判定单元,用于将对应的多维度综合相关度高于最优分隔阈值的各待识别用户,判定为相似用户。
一方面,提供一种相似用户识别设备,包括至少一个处理单元、以及至少一个存储单元,其中,存储单元存储有计算机程序,当程序被处理单元执行时,使得处理单元执行上述任意一种相似用户识别方法的步骤。
一方面,提供一种计算机可读介质,其存储有可由相似用户识别设备执行的计算机程序,当程序在相似用户识别设备上运行时,使得相似用户识别设备执行上述任意一种相似用户识别方法的步骤。
本申请实施例提供的一种相似用户识别方法、装置、相似用户识别设备和介质中,可以预先针对指定类型的各用户共有的各个属性,制定相应的多维度属性;根据各待识别用户的指定的多维度属性中的各属性的特征参数值,确定各个待识别用户在多个维度上的多维度综合相关度;进而根据确定出的各用户之间的多维度综合相关度,确定最优分隔阈值,并根据最优分隔阈值将各待识别用户进行划分,获得相关度较高的各相似用户,这样,通过各待识别用户在各个指定维度上的相关度,可以识别出相似用户,提高了用户识别的效率和精确度。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1a为本申请实施方式中一种相似用户识别的应用场景图;
图1b为本申请实施方式中一种应用登录界面示例图;
图2为本申请实施方式中一种相似用户识别方法的实施流程图;
图3为本申请实施方式中一种相似用户识别装置的结构示意图;
图4为本申请实施方式中一种相似用户识别设备结构示意图;
图5为本申请实施方式中一种相似用户识别设备结构示意图。
具体实施方式
为了在用户识别时,根据各用户在多个指定维度上的相关度,识别出相似类型的用户,提高用户识别的效率和精确度,本申请实施例提供了一种相似用户识别方法、装置、相似用户识别设备和介质。
首先,对本申请实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
1、多维度属性:是针对指定类型的各用户进行特征分析后,根据分析结果筛选出的指定类型的各用户在多个不同维度上分别具有的属性的集合。
2、单属性相关度:表示两个用户在同一属性对应的维度上的相关度,是通过同一属性对应的维度上的两个特征参数值的维度距离获得的,并与上述维度距离呈负相关。
3、多维度综合相关度:表示两个用户在多个维度上的综合的相关度。
在商户运营中,通常需要对特定目标用户进行识别分析,以进行不规范交易的非法用户为例,通常需要对非法用户进行分析识别,进而可以针对其做出必要的防范,来减少不规范交易。由于非法用户通常会在注册或登陆时,采用特定应用进行自动验证,因此,运营平台在对用户进行筛选或识别时,通常采用以下几种方式:
第一种方式为:设置应用程序无法识别的复杂验证码。
采用这种方式,可以减少非法用户通过特定应用的自动验证登录,但是,验证码过于复杂,会给用户的输入带来不便,这大大影响了用户体验。
第二种方式为:通过摄像装置对非法用户进行人脸识别。
但是,采用这种方式,人脸识别的成本较高,并且会侵害用户的隐私。
第三种方式为:通过设置黑名单方式(如,设备识别码),对非法用户进行筛选。
但是,采用这种方式,容易被非法用户通过刷机等方式破解。
由于非法用户通常会团体行动,并且通常会通过手机号码和邮箱等注册大量的虚假账号,以根据虚假账号进行不规范交易,因此,非法用户团伙通常具有很多共有的属性,如,地理位置较为接近,验证时间较短,用户名比较相似等。综上,本申请实施例中提供了一种相似用户识别的技术方案,该技术方案中,根据非法用户团伙中各非法用户通常具有共有的多个属性并且各非法用户在不同维度上的相关度都较高这一特点,对非法用户进行识别。例如,在空间维度上的相关度表现在地理位置较为接近,在时间维度上的相关度表现在验证时间均较短,在识别时综合考虑多个维度的属性相关度,可以很好的提高识别精度和效率,降低识别错误的概率。
具体的,预先对指定类型的各用户进行特征分析,然后,根据分析结果,制定相应的多维度属性;根据待识别用户的多维度属性中的各属性的特征参数值,确定各待识别用户分别在每一维度上的维度距离,并根据维度距离的倒数,放大各待识别用户分别在每一维度上的相关度,进而确定各待识别用户之间分别在各个维度上的相关度,进一步地,根据各待识别用户在各维度上的相关度,以及分隔阈值模型,确定最优分隔阈值,并将对应的多个维度上的相关度高于上述最优分隔阈值的各待识别用户,判定为相似用户。
本申请实施例中的相似用户识别方法可以应用于如图1a所示的应用场景。参阅图1a所示,为一种相似用户识别的应用场景图。在该应用场景中包括:相似用户识别设备101,各用户的用户终端102和管理终端103。
相似用户识别设备101是一台服务器或若干台服务器组成的服务器集群或云计算中心。用户终端102和管理终端103是具备网络通信能力的电子设备,该电子设备可以是智能手机、平板电脑或便携式个人计算机等等,通过有线或无线网络与相似用户识别设备101连接。
在识别相似用户时,各用户终端102先分别获取待识别用户在指定应用程序(如,购物应用)的操作信息,并将操作信息发送至相似用户识别设备101。
其中,操作信息中包括各属性的特征参数值,各属性可以为注册手机号,应用用户名,注册邮箱,邮箱用户名,登录时间,登录时间间隔,互联网协议(Internet Protocol,IP)地址,登录设备身份编码(Identity,ID),操作***(Operation System,OS)版本,浏览器以及短信或图片验证回传时间等。
具体参阅图1b所示,为一种应用登录界面示例图。用户通过用户终端登录应用程序后,该应用程序将用户登录的用户名(如,昵称,手机号,邮箱),短信验证码的验证回传时间,填写速度,登录时间,上次登录时间间隔,登录IP地址,登录设备ID,OS版本,***浏览器,用户主动填写的信息以及其它应用程序收集的信息发送至相似用户识别设备101。
然后由相似用户识别设备101依次执行以下步骤:接收各用户终端102发送的操作信息,并根据目标人群的特性,对操作信息中包含的各属性进行筛选,以及根据筛选后的属性的特征参数值,分别确定每两个待识别用户之间针对一个属性的维度距离;分别根据每两个待识别用户针对每一属性的维度距离;确定每两个待识别用户分别在每一属性上的单属性相关度;分别根据每两个待识别用户之间的各单属性相关度,确定每两个待识别用户的多维度综合相关度;根据各多维度综合相关度以及分隔阈值模型,确定最优分隔阈值,将多维度综合相关度高于上述最优分隔阈值的各待识别用户,判定为相似用户,并向运营者的管理终端103发出疑似存在目标用户群的通知信息。
最后,运营者通过管理终端103接收相似用户识别设备101发送的通知信息后,针对通知信息中包含的相似用户进行进一步详细分析,以及根据分析结果执行相应的运营管理策略。
参阅图2所示,为本申请提供的一种相似用户识别方法的实施流程图。基于图1a所示的应用场景图,该方法的具体实施流程如下:
步骤200:相似用户识别设备针对每一待识别用户,分别通过用户终端获取指定的多维度属性中每个属性的特征参数值。
具体的,相似用户识别设备根据指定类型的目标用户人群的特性,确定相应的多维度属性后,分别接收每一待识别用户的用户终端通过应用程序发送的用户的操作信息,并根据操作信息获取指定的多维度属性中每一属性的特征参数值。
其中,指定类型为目标用户的类型,如,非法团伙、非法教师,非法销售组织和非法留学生等。多维度属性是研究人员预先对多个目标用户进行分析,确定目标用户共有的多个维度上的属性的集合。
多维度属性是为识别指定类型的目标用户,而根据目标用户在可能的多个维度上具有的共同属性特征而设定的,例如可选的维度包括:地理区域,个人信息、注册信息以及时间信息等。属性例如可以为:地址,年龄,学历,手机号的注册地,邮箱的特征以及验证时间等。一个维度中可以包一个属性,也可以包含多个属性。如,维度为个人信息时,个人信息可以包含身高、体重、年龄以及性别等属性。一个属性可以有一个特征参数值,也可以由多个特征参数值表示。如,身高(属性)的特征参数值为身高值;又如,坐标(属性)由经度坐标和纬度坐标组合表示。
例如,非法交易用户团伙通常具有以下特点:各非法用户的地理区域维度上通常较为接近,可以利用地址属性进行判断;时间信息维度中的验证时间通常较短;个人信息维度中的用户名构成特征可能比较相似等等。则针对非法交易用户集合,制定相应的多维度属性包括的各个属性为:手机号码的申请地址、用户名的特征、邮箱的特征、邮箱的登录时间和登录时间间隔等、登录时的IP地址、设备标识信息、操作***版本、浏览器以及验证时间等。
又例如,目标用户为网络购物用户,通常具有以下特点:登录购物应用的频率较高,年龄通常在20-40岁之间,女性居多,购买的物品主要为化妆品和服饰。则针对网络购物用户制定的多维度属性包括的各个属性为:性别,年龄,登录购物应用的频率,购物种类。
又例如,目标用户为电话推销人员,通常具有以下特点:每天通话的联系人较多,通话时间较短,年龄在20-40之间,地理位置比较固定。则针对电话销售人员制定的多维度属性包括的各个属性为:通话次数,联系人数量,通话时间,年龄以及地理位置。
这样,就可以预先对目标用户的特征进行分析,进而针对目标用户共有的属性,设定用于判断各待识别用户之间的相关度的多维度属性。从而在后续的步骤中通过多维度属性的各属性的特征参数值识别相似用户。
步骤201:相似用户识别设备分别确定每两个待识别用户之间针对每一个属性的维度距离。
具体的,维度距离为两个用户在一个属性对应的维度上的相对距离,即维度距离为两个用户在一个维度上的差异度。
本申请实施例中,以确定任意两个待识别用户针对任意一个属性的维度距离为例进行说明。
相似用户识别设备确定两个待识别用户在一个属性对应的维度距离时,根据两个待识别用户在一个属性对应的特征参数值,以及预设的距离规则,获得维度距离。
其中,距离规则可以采用以下方式:
第一种方式为:若特征参数值为连续变量(如,长度,高度,时长以及速度等),则直接通过特征参数值之间的差值,确定维度距离。
例如,用户A的身高为160cm(厘米),用户B的身高为170cm,则相似用户识别设备确定用户A和用户B在身高(属性)对应的维度距离为10cm。
又例如,用户A登录购物应用的验证时间为2s(秒),用户B登录同一购物应用的验证时间为5s,则相似用户识别设备确定用户A和用户B在验证时间(属性)对应的维度距离为3s。
又例如,用户A登录学习网站的频率为每周3次,用户B登录学习网站的频率为每周1次,则用户A和用户B在登录学习网站的频率(属性)对应的维度距离为2次。
这样,直接根据不同用户针对同一属性的特征参数值的差值,就可以获得精确的维度距离。
第二种方式为:若特征参数值为非连续变量(如,手机号码,设备版本号,操作***以及浏览器等),则分别对每一非连续变量进行分类,若两个待识别用户的非连续变量所属类别相同,则确定两者的维度距离为0,否则,为1。
例如,假设待识别用户的一个属性为手机号码,则根据手机号码所属的运营商归属地将手机号码进行分类,若两个待识别用户的手机号码的运营商归属地相同,则确定两者的维度距离为0,否则为1。
又例如,假设待识别用户的一个属性为OS版本号,若两个待识别用户的OS版本号相同,则确定两者的维度距离为0,否则,为1。
又例如,假设用户A采用的终端设备为国产手机,用户B采用的终端设备为非国产手机,则判定用户A和用户B在终端设备产地对应的维度距离为1。
这样,针对数值类型为非连续变量,但是可以按照类别进行划分的特征参数值,就可以按照特征参数值的类别,确定相应的维度距离。但是,采用这种方式,无法准确的确定用户在属性上的差异性,获得的维度距离精度较低。
第三种方式为:若特征参数值为字符串变量(如,用户名和邮箱等),则根据字符串距离算法,确定两个待识别用户之间的维度距离。
其中,字符串距离算法可以为:编辑距离(Edit Distance)算法。
例如,用户A的用户名为天空之城,用户B的用户名为空中楼阁,则采用EditDistance算法,确定用户名“天空之城”和用户名“空中楼阁”之间的维度距离。
这样,就可以针对字符类型的特征参数值,确定相应的维度距离。
第四种方式为:若特征参数值为语句,则根据语句之间的相似度或释义,确定相应的维度距离。
例如,用户A输入的查询语句为“一本好书”,用户B输入的查询语句为“玄幻小说”,则分别对用户A和用户B的查询语句进行分词以及释义,确定“一本好书”为书籍的概率为0.6,大于预设概率0.5,“玄幻小说”为书籍的概率为0.8,大于预设概率0.5,则判定“一本好书”和“玄幻小说”均是指书籍,两者的维度距离为1。
第五种方式为:预先为每一特征参数值设置相应的等级,根据特征参数值对应的等级差值,判定相应维度距离。
例如,预先设置各学历对应的等级:小学的等级为1,中学的等级为2,高中的等级为3,大学的等级为4。假设用户A的学历为大学,用户B的学历为高中,则判定用户A和用户B之间在学历上的维度距离为1。
本申请实施例中仅以特征参数值为连续变量,非连续变量,字符串变量,以及语句等为例进行说明,实际应用中,维度距离可以根据不同的属性特点,制定相应的距离规则,在此不作限制。这样,就可以确定不同用户在一个维度上的距离。
本申请实施例中,仅以确定两个用户在一个属性对应的维度上的维度距离为例进行说明,基于相似原理,可以获得其他任意两个用户在任意一个属性的维度距离。
步骤202:相似用户识别设备分别针对每两个待识别用户的每一属性的维度距离,分别确定每一属性对应的单属性相关度。
具体的,相似用户识别设备分别将每一维度距离的倒数确定为单属性相关度,并对单属性相关度进行归一化,获得归一化后的单属性相关度。
可选的,确定归一化后的单属性相关度时,可以采用以下公式:
其中,i和j均为待识别用户的序号,Mij为待识别用户i和待识别用户j之间的单属性相关度,n为待识别用户的总数目,a为维度距离,Δ为参数。
为了避免aij为0时,无法计算aij的距离倒数的情况,若存在任意一个aij为0,则Δ不为0,若所有aij均不为0,则设置Δ=0。可选的,Δ可以设置为0.0001*Min aij
例如,用户A和用户B之间在身高对应的维度距离为10,用户B与用户C之间在身高对应的维度距离为5,用户A与用户C在身高对应的维度距离为5。则用户A与用户B之间的归一化后的单属性相关度=0.1/(0.1+0.2+0.2)=0.2。
可选的,执行步骤202时,也可以不对各距离倒数进行归一化。这样,可以减少计算的数据量,提高数据处理效率。
这样,就可以确定两个待识别用户分别在每一个维度上的相关度。显然,两个待识别用户之间的维度距离越小,说明两个待识别用户之间的差异就越小,则两个待识别用户之间的单属性相关度就越大,反之,单属性相关度越小。
例如,两个用户在验证时间上的维度距离为0.001,则确定两个用户之间的单属性相关度为1000。可见,两个用户在验证时间这一维度上的相关度较高,也就是说两个用户在进行验证时,采用几乎相同的时间进行了应用验证。
步骤203:相似用户识别设备分别根据每两个待识别用户之间的各单属性相关度,确定每两个待识别用户的多维度综合相关度。
具体的,相似用户识别设备分别确定每两个待识别用户之间的多维度综合相关度时,可以针对每两个待识别用户采用以下几种方式:
第一种方式为:将两个待识别用户之间的各单属性相关度的加和,确定为两个待识别用户之间的多维度综合相关度。
例如,用户A与用户B之间的各单属性相关度分别为:时间相关度为0.5,地理位置相关度为0.1,以及个人信息相关度为0.2,则相似用户识别设备确定用户A与用户B之间的多维度综合相关度为0.8。
这样,就可以直接将各单属性相关度进行线性相加,获得多维度综合相关度。
第二种方式为:将两个待识别用户之间的各单属性相关度进行加权求和,获得两个待识别用户之间的多维度综合相关度。
例如,用户A与用户B之间的各单属性相关度分别为:时间相关度为0.2,地理位置相关度为0.1,以及个人信息相关度为0.5,每一属性的权重值均为0.5,则相似用户识别设备确定用户A与用户B之间的多维度综合相关度为0.4。
这样,采用第二种方式,分别根据每一单属性相关度的重要程度,分别为每一单属性相关度设置相应的权重,并将各单属性相关度与相应的权重的乘积进行加和,进而将该加和确定为多维度综合相关度。
可选的,也可以采用加权平均法,获得多维度综合相关度。
例如,用户A与用户B之间的各单属性相关度分别为:年龄相关度为0.1,对应的权重值为0.5,学历相关度为0.5,对应的权重值为0.1,性别相关度为1,对应的权重值为0.1,归属地相关度为1,相应的权重值为0.3,则相似用户识别设备判定两者的多维度综合相关度为(0.1*0.5+0.1*0.5+0.1*1+1*0.3)/4=0.125。
这样,就可以确定待识别用户之间在各个维度上的综合的相关度。
步骤204:相似用户识别设备根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值。
本申请实施例中,假设各待识别用户分为两类,则通过两类间的差异方差确定一个最优分隔阈值,以对各待识别用户进行合理划分。
其中,确定最优分隔阈值时,可以采用以下步骤:
首先,相似用户识别设备根据各多维度综合相关度,生成相关度矩阵,并依次针对相关度矩阵的每一多维度综合相关度执行以下步骤:
S1、将该多维度综合相关度作为分隔阈值对各多维度综合相关度对应的待识别用户进行划分,获得指定类型集合和非指定类型集合。
也就是说,将各待识别用户以分割阈值为分界线进行分界,将对应的多维度综合相关度高于分隔阈值的各待识别用户划分到指定类型集合,将剩余的其他用户划分到非指定类型集合。
例如,假设分隔阈值为0.5,用户A和用户B之间的多维度综合相关度为0.8,用户A和用户C之间的多维度综合相关度为0.3,则将对应的多维度综合相关度0.8大于分隔阈值0.5的用户A和用户B划分到指定类型集合,并将剩余的用户C划分到非指定类型集合。
S2、确定指定类型集合包含的待识别用户的数量与所有待识别用户的总数量的第一占比,以及指定类型集合的各待识别用户对应的各多维度综合相关度的第一平均值;并确定非指定类型集合包含的待识别用户的数量与所有待识别用户的总数量的第二占比,以及非指定类型集合的各待识别用户对应的各多维度综合相关度的第二平均值;进一步地,根据第一平均值与第二平均值的差值的平方,第一占比,以及第二占比,确定差异方差;
具体的,确定差异方差时,可以采用以下公式:
g=w0·w1·(u0-u1)2 (1)
其中,g为差异方差,w0为第一占比,w1为第二占比,u0为第一平均值,u1为第二平均值。公式(1)是通过以下公式推理获得的:
u=w0u0+w1u1 (2)
g=w0(u0-u)2+w1(u1-u)2 (3)
这样,就可以将公式(2)带入公式(3),获得公式(1)。
其中,g为差异方差,w0为第一占比,w1为第二占比,u0为第一平均值,u1为第二平均值,u为所有待识别用户的多维度综合相关度的平均值。
然后,相似用户识别设备获取针对相关度矩阵的每一多维度综合相关度确定的差异方差后,确定出各差异方差中的最大差异方差。若最大差异方差对应的分隔阈值高于预设分隔阈值,则确定上述最大差异方差对应的分隔阈值为最优分隔阈值。
其中,预设分隔阈值为人为设置的。这是由于实际应用中所有待识别用户可能均为正常用户,即通过最优分隔阈值直接划分获得的指定类型集合可能也是正常用户,因此,根据实际需求设定预设分割阈值,在获得最优分隔阈值后,判断最优分割阈值是否高于预设分隔阈值,若是,则说明最优分割阈值较高,存在相似用户的可能性较高,否则,说明存在相似用户的可能性非常小,为节省后续的人工排查的繁琐步骤,仅对最优分割阈值高于预设分隔阈值的情况进行分类处理。
例如,预设分割阈值为0.8,相似用户识别设备确定的最优分隔阈值为0.2,显然,最优分隔阈值0.2低于预设分隔阈值0.8,则判定所有待识别用户均为普通用户,不存在相似用户。
可选的,在根据公式(1)确定最大差异方差时,还可以采用逐点计算法或牛顿迭代法。
这样,通过最大差异方差将用户进行划分的方式,可以实现对指定类型集合和非指定类型集合的合理划分,用户各维度的覆盖率也较高,提高了相似用户识别的精确度。
步骤205:相似用户识别设备将对应的多维度综合相关度高于最优分隔阈值的各待识别用户,判定为相似用户。
具体的,相似用户识别设备将对应的多维度综合相关度高于最优分隔阈值的各待识别用户组成最优指定类型集合,并将最优指定类型集合中的各用户判定为相似用户。
可选的,相似用户识别设备确定最优指定类型集合中包含的相似用户的数量高于预设数量门限值时,判定可能存在目标用户群,并向管理终端发出疑似存在目标用户群的警告信息。
可选的,相似用户识别设备还可以将多维度综合相关度高于最优分隔阈值的各用户通过高亮或不同颜色向用户显示。
这样,就可以对各待识别用户进行识别,并根据识别结果,判定存在目标用户的概率较高时,向用户发出通知信息,进而用户可以根据提示信息,进行人工分析判断,提高了相似用户的识别效率和精确度,给用户带来了便利。进一步地,也可以根据识别结果,为各用户设置特征标签集合,确定用户的用户画像。
下面采用一个具体的应用场景,对上述实施例进行进一步说明:
假设目标用户群为非法交易用户团伙,研究人员对非法交易用户团伙具有的属性进行分析后,设定非法交易团伙的多维度属性包含的各属性为:注册手机号,应用用户名,注册邮箱,邮箱用户名,登录时间,登录时间间隔,登录IP地址,登录设备ID,OS版本,浏览器以及短信或图片验证回传时间。
接着,相似用户识别设备根据多维度属性对用户进行识别时,分别获取每一待识别用户的上述多维度属性中各属性的特征参数值,并分别确定每两个待识别用户之间针对每一属性的维度距离,以及分别根据每一属性的维度距离确定相应的单属性相关度。
然后,相似用户识别设备分别根据每两个待识别用户之间的单属性相关度,确定每两个待识别用户的多维度综合相关度。
最后,相似用户识别设备根据多维度综合相关度,确定最优分隔阈值,并根据最优分隔阈值将各待识别用户进行划分,获得非法交易用户集合和正常用户集合。进一步地,相似用户识别设备向运营者发出疑似存在非法交易团伙的警告信息,使得运营者可以根据警告信息进行进一步人工分析,以及制定相应的维护措施。
下面采用另一个具体的应用场景,对上述实施例进行进一步说明:
假设指定类型集合为商户集合,用户对指定类型商户具有的属性进行分析,并根据分析结果设定商户的多维度属性包含的属性为:应用程序使用时长,应用程序更新时间间隔,年龄,以及学历。
相似用户识别设备对各用户进行识别时,分别确定每两个用户之间针对每一属性的维度距离,并分别根据每一属性的维度距离确定相应的单属性相关度,以及分别根据每两个用户之间的单属性相关度,确定每两个用户的多维度综合相关度。
进一步地,根据确定出的多维度综合相关度,确定最优分割阈值,并根据最优分隔阈值将各用户进行划分,获得商户集合。
最后,相似用户识别设备确定商户集合中包含的用户数量100高于预设数量门限值20,则向管理终端发出疑似存在目标商户集合的通知信息,使得管理人员通过管理终端可以接收通知信息,并根据通知信息对确定出的商户集合中的各用户进一步进行人工分析,以及确定商户集合中的各用户为目标人群后,向商户集合中的各用户发送相应促销消息。
基于同一发明构思,本申请实施例中还提供了一种相似用户识别装置,由于上述装置及设备解决问题的原理与一种相似用户识别方法相似,因此,上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图3所示,其为本申请实施例提供的一种相似用户识别装置的结构示意图,包括:
获取单元30,用于针对每个待识别用户,分别获取指定的多维度属性中每个属性的特征参数值;
确定单元31,用于针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,并分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待识别用户之间的多维度综合相关度;
获得单元32,用于根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,分隔阈值模型用于确定对各多维度综合相关度进行最优划分的分隔阈值;
判定单元33,用于将对应的多维度综合相关度高于最优分隔阈值的各待识别用户,判定为相似用户。
较佳的,确定单元31用于:
针对任意两个待识别用户,确定任一属性对应的特征参数值的单属性相关度时,执行以下步骤:
根据该任意两个待识别用户的该任一属性的特征参数值,确定该任意两个待识别用户之间针对该任一属性的维度距离,维度距离为两个用户在属性对应的维度上的差异性;
根据该任一属性对应的维度距离,确定该任意两个待识别用户之间针对该任一属性的单属性相关度,单属性相关度与维度距离呈负相关。
较佳的,确定单元31用于:
分别将每两个待识别用户之间的各个单属性相关度归一化后的和,确定为该每两个待识别用户之间的多维度综合相关度;或者,
分别将每两个待识别用户之间的各个单属性相关度归一化并进行加权后的和,确定为该每两个待识别用户之间的多维度综合相关度。
较佳的,获得单元32用于:
依次针对每一多维度综合相关度执行以下步骤:将该多维度综合相关度作为分隔阈值对各多维度综合相关度对应的待识别用户进行划分,获得指定类型集合和非指定类型集合;确定指定类型集合包含的待识别用户在所有待识别用户中的第一占比,以及指定类型集合的各待识别用户的多维度综合相关度的第一平均值,并确定非指定类型集合包含的待识别用户在所有待识别用户中的第二占比,以及非指定类型集合的各待识别用户的多维度综合相关度的第二平均值;根据第一平均值与第二平均值的差值的平方,第一占比,以及第二占比,确定差异方差;
确定获得的各差异方差中的最大差异方差;
若最大差异方差对应的分隔阈值高于预设分隔阈值,则确定最大差异方差对应的分隔阈值为最优分隔阈值。
较佳的,判定单元33还用于:
确定各相似用户的数量高于预设数量门限值时,向用户发出疑似存在目标用户群的警告信息。
本申请实施例提供的一种相似用户识别方法、装置、相似用户识别设备和介质中,可以预先针对指定类型的各用户共有的各个属性,制定相应的多维度属性;根据各待识别用户的指定的多维度属性中的各属性的特征参数值,确定各个待识别用户在多个维度上的多维度综合相关度;进而根据确定出的各用户之间的多维度综合相关度,确定最优分隔阈值,并根据最优分隔阈值将各待识别用户进行划分,获得相关度较高的各相似用户,这样,通过各待识别用户在各个指定维度上的相关度,可以识别出相似用户,提高了用户识别的效率和精确度。
参阅图4所示,为一种相似用户识别设备的结构示意图。基于同一技术构思,本申请实施例还提供了一种相似用户识别设备,相似用户识别设备400用于实施上述各个方法实施例记载的方法。相似用户识别设备400包括:处理器410、存储器420、电源430、显示单元440、输入单元450。
处理器410是相似用户识别设备400的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在存储器420内的软件程序和/或数据,执行相似用户识别设备400的各种功能,从而对服务器进行整体监控。
可选的,处理器410可包括一个或多个处理单元;优选的,处理器410可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器410中。在一些实施例中,处理器、存储器、可以在单一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、各种应用程序等;存储数据区可存储根据相似用户识别设备400的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件等。
相似用户识别设备400还包括给各个部件供电的电源430(比如电池),电源可以通过电源管理***与处理器410逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗等功能。
显示单元440可用于显示由用户输入的信息或提供给用户的信息以及相似用户识别设备400的各种菜单等,本申请实施例中主要用于显示相似用户识别设备400中各应用程序的显示界面以及显示界面中显示的文本、图片等实体。显示单元440可以包括显示面板141。显示面板141可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置。
输入单元450可用于接收用户输入的数字或字符等信息。输入单元450可包括触控面板451以及其他输入设备452。其中,触控面板451,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触摸笔等任何适合的物体或附件在触控面板451上或在触控面板451附近的操作)。
具体的,触控面板451可以检测用户的触摸操作,并检测触摸操作带来的信号,将这些信号转换成触点坐标,发送给处理器410,并接收处理器410发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板451。其他输入设备452可以包括但不限于物理键盘、功能键(比如音量控制按键、开关机按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
当然,触控面板451可覆盖显示面板441,当触控面板451检测到在其上或附近的触摸操作后,传送给处理器410以确定触摸事件的类型,随后处理器410根据触摸事件的类型在显示面板441上提供相应的视觉输出。虽然在图4中,触控面板451与显示面板441是作为两个独立的部件来实现相似用户识别设备400的输入和输出功能,但是在某些实施例中,可以将触控面板451与显示面板441集成而实现相似用户识别设备400的输入和输出功能。
相似用户识别设备400还可包括一个或多个传感器,例如压力传感器、重力加速度传感器、接近光传感器等。当然,根据具体应用中的需要,上述相似用户识别设备400还可以包括摄像头等其它部件,由于这些部件不是本申请实施例中重点使用的部件,因此,在图4中没有示出,且不再详述。
本领域技术人员可以理解,图4仅仅是相似用户识别设备的举例,并不构成对相似用户识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
基于同一技术构思,本申请实施例还提供了一种相似用户识别设备,参照图5所示,相似用户识别设备500用于实施上述各个方法实施例记载的方法,例如实施图2所示的实施例,相似用户识别设备500可以包括存储器501、处理器502、输入单元503和显示面板504。
存储器501,用于存储处理器502执行的计算机程序。存储器501可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据相似用户识别设备500的使用所创建的数据等。处理器502,可以是一个中央处理单元(central processing unit,CPU),或者为数字处理单元等等。输入单元503,可以用于获取用户输入的用户指令。显示面板504,用于显示由用户输入的信息或提供给用户的信息,本申请实施例中,显示面板504主要用于显示相似用户识别设备中各应用程序的显示界面以及各显示界面中显示的控件实体。可选的,显示面板504可以采用液晶显示器(liquid crystal display,LCD)或OLED(organic light-emitting diode,有机发光二极管)等形式来配置显示面板504。
本申请实施例中不限定上述存储器501、处理器502、输入单元503和显示面板504之间的具体连接介质。本申请实施例在图5中以存储器501、处理器502、输入单元503、显示面板504之间通过总线505连接,总线505在图5中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线505可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器501可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器501也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器501是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器501可以是上述存储器的组合。
处理器502,用于调用存储器501中存储的计算机程序执行如实施图2所示的实施例。
在一些可能的实施方式中,本申请提供的一种相似用户识别方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在相似用户识别设备上运行时,程序代码用于使相似用户识别设备执行本说明书上述描述的根据本申请各种示例性实施方式的一种相似用户识别方法中的步骤。例如,相似用户识别设备可以执行以下步骤:S0、针对每一待识别用户,分别通过用户终端获取指定的多维度属性中每个属性的特征参数值;S1、分别确定每两个待识别用户之间针对每一个属性的维度距离;S2、分别针对每两个待识别用户的每一属性的维度距离,分别确定每一属性对应的单属性相关度;S3、分别根据每两个待识别用户之间的各单属性相关度,确定每两个待识别用户的多维度综合相关度;S4、根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值;S5、将对应的多维度综合相关度高于最优分隔阈值的各待识别用户,判定为相似用户。
基于同一发明构思,本申请实施例还提供了一种计算机可读介质,其存储有可由相似用户识别设备执行的计算机程序,当所述程序在相似用户识别设备上运行时,使得所述相似用户识别设备执行打包应用程序的方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种相似用户识别方法,其特征在于,包括:
针对每个待识别用户,分别获取指定的多维度属性中每个属性的特征参数值;
针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,并分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待识别用户之间的多维度综合相关度;
根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,所述分隔阈值模型用于确定对各多维度综合相关度进行最优划分的分隔阈值;
将对应的多维度综合相关度高于所述最优分隔阈值的各待识别用户,判定为相似用户。
2.如权利要求1所述的方法,其特征在于,针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,包括:
针对任意两个待识别用户,确定任一属性对应的特征参数值的单属性相关度时,执行以下步骤:
根据该任意两个待识别用户的该任一属性的特征参数值,确定该任意两个待识别用户之间针对该任一属性的维度距离,所述维度距离为两个用户在属性对应的维度上的差异性;
根据该任一属性对应的维度距离,确定该任意两个待识别用户之间针对该任一属性的单属性相关度,所述单属性相关度与所述维度距离呈负相关。
3.如权利要求1所述的方法,其特征在于,分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待识别用户之间的多维度综合相关度,包括:
分别将每两个待识别用户之间的各个单属性相关度归一化后的和,确定为该每两个待识别用户之间的多维度综合相关度;或者,
分别将每两个待识别用户之间的各个单属性相关度归一化并进行加权后的和,确定为该每两个待识别用户之间的多维度综合相关度。
4.如权利要求1-3任一项所述的方法,其特征在于,根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,包括:
依次针对每一多维度综合相关度执行以下步骤:将该多维度综合相关度作为分隔阈值对各多维度综合相关度对应的待识别用户进行划分,获得指定类型集合和非指定类型集合;确定所述指定类型集合包含的待识别用户在所有待识别用户中的第一占比,以及所述指定类型集合的各待识别用户的多维度综合相关度的第一平均值,并确定所述非指定类型集合包含的待识别用户在所有待识别用户中的第二占比,以及所述非指定类型集合的各待识别用户的多维度综合相关度的第二平均值;根据所述第一平均值与所述第二平均值的差值的平方,所述第一占比,以及所述第二占比,确定差异方差;
确定获得的各差异方差中的最大差异方差;
若所述最大差异方差对应的分隔阈值高于预设分隔阈值,则确定所述最大差异方差对应的分隔阈值为最优分隔阈值。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
确定各相似用户的数量高于预设数量门限值时,向用户发出疑似存在目标用户群的警告信息。
6.一种相似用户识别装置,其特征在于,包括:
获取单元,用于针对每个待识别用户,分别获取指定的多维度属性中每个属性的特征参数值;
确定单元,用于针对每两个待识别用户,分别确定每个属性对应的特征参数值的单属性相关度,并分别根据每两个待识别用户之间的各个单属性相关度,确定每两个待识别用户之间的多维度综合相关度;
获得单元,用于根据每两个待识别用户之间的多维度综合相关度,采用预设的分隔阈值模型,获得最优分隔阈值,所述分隔阈值模型用于确定对各多维度综合相关度进行最优划分的分隔阈值;
判定单元,用于将对应的多维度综合相关度高于所述最优分隔阈值的各待识别用户,判定为相似用户。
7.如权利要求6所述的装置,其特征在于,所述确定单元用于:
针对任意两个待识别用户,确定任一属性对应的特征参数值的单属性相关度时,执行以下步骤:
根据该任意两个待识别用户的该任一属性的特征参数值,确定该任意两个待识别用户之间针对该任一属性的维度距离,所述维度距离为两个用户在属性对应的维度上的差异性;
根据该任一属性对应的维度距离,确定该任意两个待识别用户之间针对该任一属性的单属性相关度,所述单属性相关度与所述维度距离呈负相关。
8.如权利要求6所述的装置,其特征在于,所述确定单元用于:
分别将每两个待识别用户之间的各个单属性相关度归一化后的和,确定为该每两个待识别用户之间的多维度综合相关度;或者,
分别将每两个待识别用户之间的各个单属性相关度归一化并进行加权后的和,确定为该每两个待识别用户之间的多维度综合相关度。
9.一种相似用户识别设备,其特征在于,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~5任一所述方法的步骤。
10.一种计算机可读介质,其特征在于,其存储有可由相似用户识别设备执行的计算机程序,当所述程序在相似用户识别设备上运行时,使得所述相似用户识别设备执行权利要求1~5任一所述方法的步骤。
CN201811434297.7A 2018-11-28 2018-11-28 一种相似用户识别方法、装置、相似用户识别设备和介质 Pending CN110197375A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811434297.7A CN110197375A (zh) 2018-11-28 2018-11-28 一种相似用户识别方法、装置、相似用户识别设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811434297.7A CN110197375A (zh) 2018-11-28 2018-11-28 一种相似用户识别方法、装置、相似用户识别设备和介质

Publications (1)

Publication Number Publication Date
CN110197375A true CN110197375A (zh) 2019-09-03

Family

ID=67751413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811434297.7A Pending CN110197375A (zh) 2018-11-28 2018-11-28 一种相似用户识别方法、装置、相似用户识别设备和介质

Country Status (1)

Country Link
CN (1) CN110197375A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461186A (zh) * 2020-03-20 2020-07-28 支付宝(杭州)信息技术有限公司 数据相似度的处理方法、装置、存储介质和计算机设备
CN113672703A (zh) * 2021-08-26 2021-11-19 国家电网有限公司大数据中心 一种用户信息的更新方法、装置、设备及存储介质
CN115130621A (zh) * 2022-08-31 2022-09-30 支付宝(杭州)信息技术有限公司 一种模型训练方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203916A (zh) * 2016-03-17 2017-09-26 阿里巴巴集团控股有限公司 一种用户信用模型建立方法及装置
CN107464132A (zh) * 2017-07-04 2017-12-12 北京三快在线科技有限公司 一种相似用户挖掘方法及装置,电子设备
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置
CN108898505A (zh) * 2018-05-28 2018-11-27 武汉斗鱼网络科技有限公司 作弊团伙的识别方法、相关存储介质和电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203916A (zh) * 2016-03-17 2017-09-26 阿里巴巴集团控股有限公司 一种用户信用模型建立方法及装置
CN107464132A (zh) * 2017-07-04 2017-12-12 北京三快在线科技有限公司 一种相似用户挖掘方法及装置,电子设备
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置
CN108898505A (zh) * 2018-05-28 2018-11-27 武汉斗鱼网络科技有限公司 作弊团伙的识别方法、相关存储介质和电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JUSTIN_KO: "最大类间方差法(OTSU)求阈值", 《CSDN》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461186A (zh) * 2020-03-20 2020-07-28 支付宝(杭州)信息技术有限公司 数据相似度的处理方法、装置、存储介质和计算机设备
CN113672703A (zh) * 2021-08-26 2021-11-19 国家电网有限公司大数据中心 一种用户信息的更新方法、装置、设备及存储介质
CN115130621A (zh) * 2022-08-31 2022-09-30 支付宝(杭州)信息技术有限公司 一种模型训练方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN106716382B (zh) 用于移动装置行为的聚集多应用程序行为分析的方法和***
AU2016200905B2 (en) A system and method for identifying and analyzing personal context of a user
EP3779841A1 (en) Method, apparatus and system for sending information, and computer-readable storage medium
CN104541273B (zh) 推断关于兴趣点的信息的社交相关性
CN107515915B (zh) 基于用户行为数据的用户标识关联方法
CN108256568A (zh) 一种植物种类识别方法以及装置
CN108304758A (zh) 人脸特征点跟踪方法及装置
CN106164945A (zh) 情景建模和可视化
CN106548364A (zh) 信息发送方法及装置
CN109961296A (zh) 商户类型识别方法及装置
US10534978B2 (en) Classifying and grouping electronic images
WO2021120875A1 (zh) 搜索方法、装置、终端设备及存储介质
CN106575395A (zh) 包含来自各种数据源的数据的实体解析
CN106663036A (zh) 在多租户***中处理变化
CN108121803A (zh) 一种确定页面布局的方法和服务器
CN102710770A (zh) 一种上网设备识别方法及其实现***
JP2018077821A (ja) ユーザによって訪問される施設のカテゴリの予測モデルを生成する方法、プログラム、サーバ装置、及び処理装置
CN113190757A (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN110197375A (zh) 一种相似用户识别方法、装置、相似用户识别设备和介质
CN111652087A (zh) 验车方法、装置、电子设备和存储介质
CN109274639A (zh) 开放平台异常数据访问的识别方法和装置
CN106874936A (zh) 图像传播监测方法及装置
KR20200064148A (ko) 메시징 서비스 환경에서의 사용자 상황 감지 및 사용자 상황에 기반한 메시징 서비스와의 인터랙션
CN109478219A (zh) 用于显示网络分析的用户界面
Zhao et al. TrCMP: A dependable app usage inference design for user behavior analysis through cyber-physical parameters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination