CN110533500A - 用户识别方法、装置、计算机设备及存储介质 - Google Patents
用户识别方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110533500A CN110533500A CN201910696730.2A CN201910696730A CN110533500A CN 110533500 A CN110533500 A CN 110533500A CN 201910696730 A CN201910696730 A CN 201910696730A CN 110533500 A CN110533500 A CN 110533500A
- Authority
- CN
- China
- Prior art keywords
- user
- multiple users
- wool
- party
- wool party
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 210000002268 wool Anatomy 0.000 claims abstract description 169
- 230000000694 effects Effects 0.000 claims abstract description 54
- 238000004891 communication Methods 0.000 claims abstract description 31
- 230000006399 behavior Effects 0.000 claims description 81
- 238000010586 diagram Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 17
- 230000003542 behavioural effect Effects 0.000 claims description 11
- 241001494479 Pecora Species 0.000 claims description 4
- 210000004209 hair Anatomy 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 24
- 238000012544 monitoring process Methods 0.000 description 9
- 239000012141 concentrate Substances 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Remote Sensing (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及智能决策,利用聚类算法实现了羊毛党的识别,具体公开了一种羊毛党识别方法、装置、设备及存储介质。其中方法包括:监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码;基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图;根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党;若多个用户中存在部分用户为潜在羊毛党,获取多个用户的历史行为信息;根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。该方法提高了羊毛党的识别效率和准确率。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种羊毛党用户识别方法、装置、计算机设备及存储介质。
背景技术
随着移动互联网的快速发展,企业营销从线下向线上转移,借助移动互联网发布营销活动以实现品牌营销。比如,常见的营销活动包括赠送红包、赠送优惠券、赠送礼品或者首单免单等,通过营销活动吸引客户以取得更好的营销效果。由于商家的营销奖励获取手段价格低廉,出现了专门选择互联网公司的营销活动以低成本甚至零成本换取高额奖励的羊毛党,给商家造成了损失,目前多采用机器学习的方式挖掘识别羊毛党,但由于互联网数据泛杂且发散性大,致使羊毛党的识别效率较低且准确性较差,因此如何提高羊毛党的识别效率和准确率成为了亟需解决的问题。
发明内容
本申请提供了一种羊毛党识别方法、装置、计算机设备及存储介质,以在营销活动时快速准确地识别出羊毛党。
第一方面,本申请提供了一种羊毛党识别方法,所述方法包括:
监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码;
基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图;
根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党;
若多个用户中存在部分用户为潜在羊毛党,获取多个用户的历史行为信息;
根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。
第二方面,本申请还提供了一种羊毛党识别装置,所述装置包括:
监控获取单元,用于监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码;
定位生成单元,用于基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图;
用户判断单元,用于根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党;
信息获取单元,用于若多个用户中存在部分用户为潜在羊毛党,获取多个用户的历史行为信息;
聚类确定单元,用于根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的羊毛党识别方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的羊毛党识别方法。
本申请公开了一种羊毛党识别方法、装置、计算机设备及存储介质,在发现多个用户申请营销活动时,通过获取多个用户的通信识别码;利用通信识别码使用移动位置服务技术生成用户位置关系图;再根据用户位置关系图判断多个用户是否存在潜在羊毛党;若存在潜在羊毛党,则获取多个用户的历史行为信息;根据所述用户行为信息对多个用户进行聚类得到用户类群以确定哪些用户为羊毛党用户。相对于机器学习方式,该方法可快速准确地识别出申请营销活动的多个用户中哪些用户是羊毛党以及哪些用户是普通用户,进而提高了羊毛党的识别效率和准确率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的实施例提供的一种羊毛党识别方法的示意流程图;
图2是本申请的实施例提供的用户位置关系图的效果示意图;
图3是图1中的羊毛党识别方法的子步骤示意流程图;
图4是本申请的实施例提供的基于K中心点算法进行聚类的示意流程图;
图5是本申请的实施例提供的另一种羊毛党识别方法的示意流程图;
图6为本申请的实施例提供的一种羊毛党识别装置的示意性框图;
图7为本申请的实施例提供的另一种羊毛党识别装置的示意性框图;
图8为本申请的实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请的实施例提供了一种羊毛党识别方法、装置、计算机设备及存储介质。其中,该羊毛党识别方法可以应用于服务器中,通过实时监控商家发布的营销活动,实现羊毛党的识别。其中,该服务器可以为独立的服务器,也可以为服务器集群。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请的实施例提供的一种羊毛党识别方法的示意流程图。该羊毛党识别方法可应用于服务器中,用于对通过终端申请营销活动的用户进行识别,以确认是否存在羊毛党。
如图1所示,该羊毛党识别方法具体包括步骤S101至步骤S105。
S101、监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码。
目前,商家为了推广产品,一般会在相应的应用程序上发布与该推广产品相关的营销活动,比如赠送红包、优惠券、首单免单或首单打折等等。发布营销活动具体是:在所述应用程序中该产品所在的网页上添加营销活动对应的链接。其中所述应用程序包括本地应用或Web应用等。
监控商家在应用程序上发布的营销活动,是指监控商家在应用程序上发布的营销活动对应的链接是否被打开并申请该营销活动。用户申请该营销活动需要填写一些注册信息,以便参与并获得营销活动,填写一些注册信息比如手机号、身份证号、邮箱地址以及通讯地址等,其中手机号可作为通信识别码。
由于在营销活动发布后,可能会有羊毛党以及多个普通用户参与该营销活动,如何快速对羊毛党进行区分和识别至关重要。
S102、基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图。
其中,移动位置服务具体为LBS定位服务,LBS定位服务为基于位置服务(Location Based Services,LBS),通过移动通信的基站信号差异来计算出终端(用户)所在的位置。
具体地,使用LBS定位服务计算每一个用户使用的通信识别码对应的终端所在的地理位置信息,并根据定位得到的地理位置信息在预设的位置地图进行打点标记,以生成用户位置关系图。预设的位置地图可以使用一个仅仅包括位置信息的地图,该地图上只有位置信息,而不需要其他渲染层。
在一个实施例中,根据所述用户位置信息生成用户位置关系图,具体过程为:获取预设地图模板,根据所述用户位置信息将多个用户导入至所述预设地图模板中,并在所述预设地图模板中对多个用户进行连线以生成用户位置关系图。
具体地,预设地图模板可以为一个仅仅包括位置信息的地图,根据用户位置信息确定对应的坐标点,将这些坐标点导入至所述预设地图模板中,并在所述预设地图模板中对多个坐标点(用户)进行连线以生成用户位置关系图,可以将每个坐标点均与其他坐标点连接。
在一个实施例中,在所述预设地图模板中对多个用户进行连线以生成用户位置关系图,具体包括:
根据最短路径算法,在所述预设地图模板中对多个用户进行连线以生成用户位置关系图,所述用户位置关系图为一个闭环关系图。
具体地,在所述预设地图模板中选择任意一个用户对应的坐标点作为起始点,根据最短路径算法找到距离该起始点的最短路径的坐标点,并将该起始点和最短路径的坐标点进行连线,最短路径的坐标点作为起始点继续执行所述根据最短路径算法找到距离该起始点的最短路径的坐标点的步骤,直至遍历所述预设地图模板中的所有点,得到用户位置关系图。
具体参阅图2,以用户1为起始点,利用最短路径算法找到距离该起始点的最短路径的坐标点为用户3,则对用户1和用户3进行连线,再以用户3为起始点继续用最短路劲算法找到距离该用户3的最短路径的坐标点,依次循环执行直至遍历所有的用户对应的坐标点,得到用户位置关系图10。需要说明的是,用户位置关系图10只是一个简单的示例。
S103、根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党。
由于羊毛党的数量较多且是有组织的,因此羊毛党均具有对应的属性参数,比如羊毛党是专职申请营销活动的,一般均会待在某一个固定位置不变,由此可以根据用户位置关系图判断此次申请该营销活动的多个用户是否可能存在潜在羊毛党。例如,申请该营销活动的是否存在多个用户均在同一位置区域,该位置区域比如为基站对应的小区内,如果有多个用户在统一位置区域,比如有 20个用户均在同一个小区内,则可以初步判断多个用户中存在部分用户为潜在羊毛党。
在一个实施例中,根据所述用户位置关系图判断潜在羊毛党,采用判断是否存在预设数量的用户在所述用户位置关系图中对应相同位置。如图3所示,即步骤S103包括:子步骤S103a和S103b。
S103a、判断多个用户中是否存在预设数量的用户在所述用户位置关系图中对应相同位置;S103b、若存在所述预设数量的用户在所述用户位置关系图中对应相同位置,确定多个用户中存在部分用户为潜在羊毛党。
其中,预设数量可以根据实际经验进行设定,用于准确地判断出多个用户中存在部分用户为潜在羊毛党,具体数值在此不做限定。在所述用户位置关系图中对应相同位置,该相同位置可以为LBS位置服务的精度范围内,比如5M的距离范围内,当然也可以规定为预设区域范围内,比如基站对应的小区。
在一个实施例中,预设数量可以根据预设比例关系式和申请所述营销活动的多个用户对应的用户数量确定,预设比例关系式为:
m=a*n (1)
其中,公式(1)中,m为预设数量,a为比例系数,n为申请所述营销活动的多个用户对应的用户数量。比例系数可以根据历史监测到羊毛党和总申请用户的比例确定,当然还可以营销活动发布时间段内的历史监测到羊毛党和总申请用户的比例确定,以用于当前时间段内判断多个用户中是否存在部分用户为潜在羊毛党。比如,营销活动发布前一个小时的比例系数,一个小时到两个小时内的比例系数,或者营销活动发布一天内的比例系数。根据对应的时间段使用相应的比例系数确定预设数量,由此可以提高潜在羊毛党的识别准确率。
S104、若多个用户中存在部分用户为潜在羊毛党,获取多个用户的历史行为信息。
用户的历史行为信息包括用户的设备使用行为、信息修改行为、登录行为以及借贷行为等信息。例如设备使用行为包括使用一个设备关联了多个用户等信息;信息修改行为包括银行卡绑定后是否修改过联系人信息或住址信息;登录行为指的是过去预设时间长度的时间段内登录频次、登录地点以及登录时间等;借贷行为指的是过去一段时间申请借款频次以及金额、申请通过或拒绝的次数,借款成功后是否及时还款等。
在一个实施例中,所述获取多个用户的历史行为信息,包括:获取多个用户的历史行为记录信息,每个所述历史行为记录信息均包括多个行为特征数据;对所述历史行为记录信息中的行为特征数据进行数据清洗得到历史行为信息。
历史行为记录信息包括设备使用行为、信息修改行为、登录行为以及借贷行为等信息,这些信息即为行为特征数据;对所述历史行为记录信息中的行为特征数据进行预处理,预处理主要是数据清洗去重以及缺失值插值等,预处理后的历史行为记录信息作为用户的历史行为信息,以便根据历史行为信息执行以下聚类分析的步骤,进而提高羊毛党的识别准确率。
S105、根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。
在获得历史行为信息之后,采用聚类算法,根据所述历史行为信息对多个用户进行聚类得到用户类群,并确定具有某一类的用户类群对应的用户为羊毛党用户。其中聚类算法可采用划分聚类算法,比如K-means算法和CLARANS算法等,当然也可以采用其他类型的算法,比如模糊算法和基于密度算法等。
在一个实施例中,所述根据所述历史行为信息对多个用户进行聚类得到用户类群,包括:基于K中心点算法,根据所述历史行为信息对多个用户进行聚类以得到用户类群。
在一个实施例中,如图4所示,基于K中心点算法进行聚类具体包括以下内容:
S105a、在多个用户中选取一组用户作为目标中心点集,根据所述历史行为信息计算各用户到所述目标中心点集中的各中心点的距离;S105b、根据计算得到的距离将所述用户点归类至距离所述中心点最短的聚类簇中,计算各所述聚类簇中各个用户点与其他用户点的距离之和;S105c、确定与所述其他用户点的距离之和最短的用户点作为新的中心点构成新中心点集;S105d、将所述新中心点集作为目标中心点集,并返回执行根据所述历史行为信息计算各用户到所述目标中心点集中的各中心点的距离的步骤,直至所述新中心点集与所述目标中心点集相同时得到用户类群。
在确定目标中心点集后,计算目标中心点集中中心点之外的所有样本点(所述多个用户中除了中心点之外的用户)到各个中心点的距离。具体地,可以以欧氏距离。具体可以利用用户的历史行为信息作为特征数据,计算用户之间的欧氏距离。在计算得到用户点到各个中心点的距离后,将同一个用户点到不同的中心点的距离进行比较以确定最短距离,并将该用户点归到最短距离中心点对应的聚类簇中。
例如,若中心点集包括A、B以及C三个中心点,对于非中心点D,基于上述公式分别计算点D与中心点A、B以及C之间的距离La、Lb以及Lc,并将三个距离进行比较,确定距离最小值,若距离最小值为La,则将用户点D归类到中心点A对应的聚类簇中。对应各个非中心点执行相同的方式,从而获得多个聚类簇。
在归类得到各个聚类簇后,计算每个聚类簇内各个用户点与其他用户点的距离之和。比如,若中心点A对应的聚类簇内包括中心点为:A、D、E以及F,则分别计算A点与D、E以及F点的距离之和记为SUMa;计算D点与A、E以及 F点的距离之和记为SUMd;计算E点与A、D以及F点的距离之和记为SUMe;计算F点与A、D以及E点的距离之和记为SUMf。
确定与其他用户点距离之和最短的用户点,该各个用户点构成新中心点集;将所述新中心点集作为目标中心点集,并返回执行根据所述历史行为信息计算各用户到所述目标中心点集中的各中心点的距离的步骤,直至所述新中心点集与所述目标中心点集相同时得到用户类群,即直至所有中心点不发生变更,并终止计算,获得最终的聚类簇,将该最终的聚类簇作为用户类群。
上述羊毛党识别方法在发现多个用户申请营销活动时通过获取多个用户的通信识别码;利用通信识别码使用移动位置服务技术生成用户位置关系图;再根据用户位置关系图判断多个用户是否存在潜在羊毛党;若存在潜在羊毛党,则获取多个用户的历史行为信息;根据所述用户行为信息对多个用户进行聚类得到用户类群以确定哪些用户为羊毛党用户。相对于机器学习方式,该方法可快速准确地识别出申请营销活动的多个用户中哪些用户是羊毛党以及哪些用户是普通用户,进而提高了羊毛党的识别效率和准确率。
请参阅图4,图4是本申请的实施例提供的另一种羊毛党识别方法的示意流程图。如图4所示,该羊毛党识别方法具体包括步骤S201至S207。
S201、监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码。
监控商家在应用程序上发布的营销活动,并获取用户申请该营销活动时填写的手机号可作为通信识别码。
S202、基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图。
具体地,使用LBS定位服务计算每一个用户使用的通信识别码对应的终端所在的地理位置信息,并根据定位得到的地理位置信息在预设的位置地图进行打点标记,以生成用户位置关系图。
S203、获取羊毛位置关系图。
其中,羊毛位置关系图为预设设置的关系图,所述羊毛位置关系图包括已识别出的多个羊毛党以及多个羊毛党组成的羊毛关系网。该羊毛位置关系图可以存储在服务器对应的数据库,获取羊毛位置关系图具体为从数据库中读取预先存储的羊毛为何在关系图,用于判别多个用户中是否存在部分用户为潜在羊毛党。
S204、确定多个用户中是否包含位于所述羊毛关系网内的用户。
具体地,将所述用户位置关系图与所述羊毛位置关系图进行比对,确定多个用户中是否包含位于所述羊毛关系网内的用户。包含位于所述羊毛关系网内的用户是指:用户位置关系图中的多个用户与所述羊毛关系网中的羊毛党用户的位置相匹配,比如位置相同或者位置范围相同,比如均在基站对应的小区内;或者,用户位置关系图中的多个用户位于羊毛关系网内。
若多个用户中包含位于所述羊毛关系网内的用户,则执行步骤S205;若多个用户中未包含位于所述羊毛关系网内的用户,则返回执行步骤S201。
S205、确定多个用户中存在部分用户为潜在羊毛党。
具体地,若多个用户中包含位于所述羊毛关系网内的用户,确定多个用户中存在部分用户为潜在羊毛党,可以快速初步确定此次申请该营销活动中的多个用户是包括羊毛党的,有可能损坏商家的利益。
S206、获取多个用户的历史行为信息。
在确定多个用户中存在部分用户为潜在羊毛党后,获取多个用户的历史行为信息。其中,历史行为信息包括用户的设备使用行为、信息修改行为、登录行为以及借贷行为等信息。
S207、根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。
在获得历史行为信息之后,采用聚类算法,根据所述历史行为信息对多个用户进行聚类得到用户类群,并确定具有某一类的用户类群对应的用户为羊毛党用户。其中聚类算法可采用划分聚类算法,比如K-means算法和CLARANS算法等,当然也可以采用其他类型的算法,比如模糊算法和基于密度算法等。
上述羊毛党识别方法在发现多个用户申请营销活动时通过获取多个用户的通信识别码;利用通信识别码使用移动位置服务技术生成用户位置关系图;再结合预设的羊毛位置关系图快速准确地判断多个用户是否存在潜在羊毛党;若存在潜在羊毛党,则获取多个用户的历史行为信息;根据所述用户行为信息对多个用户进行聚类得到用户类群以确定哪些用户为羊毛党用户。相对于机器学习方式,该方法可快速准确地识别出申请营销活动的多个用户中哪些用户是羊毛党以及哪些用户是普通用户,进而提高了羊毛党的识别效率和准确率。
请参阅图6,图6是本申请的实施例提供一种羊毛党识别装置的示意性框图,该羊毛党识别装置用于执行前述的羊毛党识别方法。其中,该羊毛党识别装置可以配置于服务器。
如图6所示,该羊毛党识别装置400,包括:监控获取单元401、定位生成单元402、用户判断单元403、信息获取单元404和聚类确定单元405。
监控获取单元401,用于监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码。
定位生成单元402,用于基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图。
在一个实施例中,定位生成单元402具体用于:获取预设地图模板,根据所述用户位置信息将多个用户导入至所述预设地图模板中,并在所述预设地图模板中对多个用户进行连线以生成用户位置关系图。
用户判断单元403,用于根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党。
在一个实施例中,用户判断单元403,用于判断多个用户中是否存在预设数量的用户在所述用户位置关系图中对应相同位置;若存在所述预设数量的用户在所述用户位置关系图中对应相同位置,确定多个用户中存在部分用户为潜在羊毛党。
信息获取单元404,用于若多个用户中存在部分用户为潜在羊毛党,获取多个用户的历史行为信息。
在一个实施例中,信息获取单元404,具体用于:获取多个用户的历史行为记录信息,每个所述历史行为记录信息均包括多个行为特征数据;对所述历史行为记录信息中的行为特征数据进行数据清洗得到历史行为信息。
聚类确定单元405,用于根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。
在一个实施例中,聚类确定单元405,用于基于K中心点算法,根据所述历史行为信息对多个用户进行聚类以得到用户类群。
在一个实施例中,聚类确定单元405,具体用于:在多个用户中选取一组用户作为目标中心点集,根据所述历史行为信息计算各用户点到各中心点的距离,将各所述用户点放入距离所述中心点最短的聚类簇中;
计算各所述聚类簇中各个用户点与其他用户点的距离之和;确定与所述其他用户点的距离之和最短的用户点作为新的中心点构成新中心点集;将所述新中心点集作为目标中心点集,并返回执行根据所述历史行为信息计算各用户点到各中心点的距离的步骤,直至所述新中心点集与所述目标中心点集相同时得到用户类群。
请参阅图7,图7是本申请的实施例提供一种羊毛党识别装置的示意性框图,该羊毛党识别装置用于执行前述的羊毛党识别方法。其中,该羊毛党识别装置可以配置于服务器。
如图7所示,羊毛党识别装置500,包括:监控获取单元501、定位生成单元502、关系图获取单元503、用户确定单元504、羊毛党确定单元505、信息获取单元506和聚类确定单元507。
监控获取单元501,用于监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码。
定位生成单元502,用于基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图。
关系图获取单元503,用于获取羊毛位置关系图。
其中,所述羊毛位置关系图包括已识别出的多个羊毛党以及多个羊毛党组成的羊毛关系网。
用户确定单元504,用于将所述用户位置关系图与所述羊毛位置关系图进行比对,确定多个用户中是否包含位于所述羊毛关系网内的用户。
其中,若多个用户中包含位于所述羊毛关系网内的用户,则调用羊毛党确定单元505;若多个用户中未包含位于所述羊毛关系网内的用户,则返回调用监控获取单元501。
羊毛党确定单元505,用于若多个用户中包含位于所述羊毛关系网内的用户,确定多个用户中存在部分用户为潜在羊毛党。
信息获取单元506,用于获取多个用户的历史行为信息。
聚类确定单元507,用于根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
上述的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图8 所示的计算机设备上运行。
请参阅图8,图8是本申请的实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器。
参阅图8,该计算机设备包括通过***总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作***和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种羊毛党识别方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种羊毛党识别方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor, DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码;基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图;根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党;若多个用户中存在部分用户为潜在羊毛党,获取多个用户的历史行为信息;根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。
在一个实施例中,所述处理器在实现所述根据所述用户位置信息生成用户位置关系图时,用于实现:
获取预设地图模板,根据所述用户位置信息将多个用户导入至所述预设地图模板中,并在所述预设地图模板中对多个用户进行连线以生成用户位置关系图。
在一个实施例中,所述处理器在实现所述根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党时,用于实现:
判断多个用户中是否存在预设数量的用户在所述用户位置关系图中对应相同位置;若存在所述预设数量的用户在所述用户位置关系图中对应相同位置,确定多个用户中存在部分用户为潜在羊毛党。
在一个实施例中,所述处理器在实现所述根据所述所述根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党时,用于实现:
获取羊毛位置关系图,所述羊毛位置关系图包括已识别出的多个羊毛党以及多个羊毛党组成的羊毛关系网;将所述用户位置关系图与所述羊毛位置关系图进行比对,确定多个用户中是否包含位于所述羊毛关系网内的用户;若多个用户中包含位于所述羊毛关系网内的用户,确定多个用户中存在部分用户为潜在羊毛党。
在一个实施例中,所述处理器在实现所述获取多个用户的历史行为信息,用于实现:
获取多个用户的历史行为记录信息,每个所述历史行为记录信息均包括多个行为特征数据;对所述历史行为记录信息中的行为特征数据进行数据清洗得到历史行为信息。
在一个实施例中,所述处理器在实现所述根据所述历史行为信息对多个用户进行聚类得到用户类群时,用于实现:
基于K中心点算法,根据所述历史行为信息对多个用户进行聚类以得到用户类群。
在一个实施例中,所述处理器在实现所述基于K中心点算法,根据所述历史行为信息对多个用户进行聚类以得到用户类群时,用于实现:
在多个用户中选取一组用户作为目标中心点集,根据所述历史行为信息计算各用户到所述目标中心点集中的各中心点的距离;根据计算得到的距离将所述用户点归类至距离所述中心点最短的聚类簇中,计算各所述聚类簇中各个用户点与其他用户点的距离之和;确定与所述其他用户点的距离之和最短的用户点作为新的中心点构成新中心点集;将所述新中心点集作为目标中心点集,并返回执行根据所述历史行为信息计算各用户到所述目标中心点集中的各中心点的距离的步骤,直至所述新中心点集与所述目标中心点集相同时得到用户类群。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项羊毛党识别方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD) 卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种羊毛党识别方法,其特征在于,包括:
监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码;
基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图;
根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党;
若多个用户中存在部分用户为潜在羊毛党,获取多个用户的历史行为信息;
根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。
2.根据权利要求1所述的羊毛党识别方法,其特征在于,所述根据所述用户位置信息生成用户位置关系图,包括:
获取预设地图模板,根据所述用户位置信息将多个用户导入至所述预设地图模板中,并在所述预设地图模板中对多个用户进行连线以生成用户位置关系图。
3.根据权利要求1所述的羊毛党识别方法,其特征在于,所述根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党,包括:
判断多个用户中是否存在预设数量的用户在所述用户位置关系图中对应相同位置;
若存在所述预设数量的用户在所述用户位置关系图中对应相同位置,确定多个用户中存在部分用户为潜在羊毛党。
4.根据权利要求1所述的羊毛党识别方法,其特征在于,所述根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党,包括:
获取羊毛位置关系图,所述羊毛位置关系图包括已识别出的多个羊毛党以及多个羊毛党组成的羊毛关系网;
将所述用户位置关系图与所述羊毛位置关系图进行比对,确定多个用户中是否包含位于所述羊毛关系网内的用户;
若多个用户中包含位于所述羊毛关系网内的用户,确定多个用户中存在部分用户为潜在羊毛党。
5.根据权利要求1所述的羊毛党识别方法,其特征在于,所述获取多个用户的历史行为信息,包括:
获取多个用户的历史行为记录信息,每个所述历史行为记录信息均包括多个行为特征数据;
对所述历史行为记录信息中的行为特征数据进行数据清洗得到历史行为信息。
6.根据权利要求1至5任一项所述的羊毛党识别方法,其特征在于,所述根据所述历史行为信息对多个用户进行聚类得到用户类群,包括:
基于K中心点算法,根据所述历史行为信息对多个用户进行聚类以得到用户类群。
7.根据权利要求6所述的羊毛党识别方法,其特征在于,所述基于K中心点算法,根据所述历史行为信息对多个用户进行聚类,得到用户类群,包括:
在多个用户中选取一组用户作为目标中心点集,根据所述历史行为信息计算各用户到所述目标中心点集中的各中心点的距离;
根据计算得到的距离将所述用户点归类至距离所述中心点最短的聚类簇中,计算各所述聚类簇中各个用户点与其他用户点的距离之和;
确定与所述其他用户点的距离之和最短的用户点作为新的中心点构成新中心点集;
将所述新中心点集作为目标中心点集,并返回执行根据所述历史行为信息计算各用户到所述目标中心点集中的各中心点的距离的步骤,直至所述新中心点集与所述目标中心点集相同时得到用户类群。
8.一种羊毛党识别装置,其特征在于,包括:
监控获取单元,用于监控发布的营销活动,获取申请所述营销活动的多个用户的通信识别码;
定位生成单元,用于基于移动位置服务利用所述通信识别码对每个用户进行定位以得到用户位置信息,根据所述用户位置信息生成用户位置关系图;
用户判断单元,用于根据所述用户位置关系图判断多个用户中是否存在部分用户为潜在羊毛党;
信息获取单元,用于若多个用户中存在部分用户为潜在羊毛党,获取多个用户的历史行为信息;
聚类确定单元,用于根据所述历史行为信息对多个用户进行聚类得到用户类群,并根据所述用户类群从多个用户中确定羊毛党用户。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的羊毛党识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的羊毛党识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696730.2A CN110533500A (zh) | 2019-07-30 | 2019-07-30 | 用户识别方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696730.2A CN110533500A (zh) | 2019-07-30 | 2019-07-30 | 用户识别方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110533500A true CN110533500A (zh) | 2019-12-03 |
Family
ID=68661320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910696730.2A Pending CN110533500A (zh) | 2019-07-30 | 2019-07-30 | 用户识别方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110533500A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106301980A (zh) * | 2015-05-28 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 一种刷量工具检测方法和装置 |
CN106557942A (zh) * | 2015-09-30 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 一种用户关系的识别方法和装置 |
CN107798597A (zh) * | 2017-10-09 | 2018-03-13 | 上海二三四五金融科技有限公司 | 一种动态高风险客群检测方法及*** |
CN107958382A (zh) * | 2017-12-06 | 2018-04-24 | 北京小度信息科技有限公司 | 异常行为识别方法、装置、电子设备及存储介质 |
US20180218369A1 (en) * | 2017-02-01 | 2018-08-02 | Google Inc. | Detecting fraudulent data |
CN109102303A (zh) * | 2018-06-28 | 2018-12-28 | 招联消费金融有限公司 | 风险检测方法和相关装置 |
CN109118119A (zh) * | 2018-09-06 | 2019-01-01 | 多点生活(成都)科技有限公司 | 风控模型生成方法及装置 |
CN109409918A (zh) * | 2018-08-24 | 2019-03-01 | 深圳壹账通智能科技有限公司 | 基于用户行为的羊毛党识别方法、装置、设备及存储介质 |
CN109685643A (zh) * | 2018-12-13 | 2019-04-26 | 平安科技(深圳)有限公司 | 贷款审核中风险等级确定方法、装置、设备及存储介质 |
-
2019
- 2019-07-30 CN CN201910696730.2A patent/CN110533500A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106301980A (zh) * | 2015-05-28 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 一种刷量工具检测方法和装置 |
CN106557942A (zh) * | 2015-09-30 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 一种用户关系的识别方法和装置 |
US20180218369A1 (en) * | 2017-02-01 | 2018-08-02 | Google Inc. | Detecting fraudulent data |
CN107798597A (zh) * | 2017-10-09 | 2018-03-13 | 上海二三四五金融科技有限公司 | 一种动态高风险客群检测方法及*** |
CN107958382A (zh) * | 2017-12-06 | 2018-04-24 | 北京小度信息科技有限公司 | 异常行为识别方法、装置、电子设备及存储介质 |
CN109102303A (zh) * | 2018-06-28 | 2018-12-28 | 招联消费金融有限公司 | 风险检测方法和相关装置 |
CN109409918A (zh) * | 2018-08-24 | 2019-03-01 | 深圳壹账通智能科技有限公司 | 基于用户行为的羊毛党识别方法、装置、设备及存储介质 |
CN109118119A (zh) * | 2018-09-06 | 2019-01-01 | 多点生活(成都)科技有限公司 | 风控模型生成方法及装置 |
CN109685643A (zh) * | 2018-12-13 | 2019-04-26 | 平安科技(深圳)有限公司 | 贷款审核中风险等级确定方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Snyder et al. | OR/MS models for supply chain disruptions: A review | |
CN108295476A (zh) | 确定异常交互账户的方法和装置 | |
US8156172B2 (en) | Monitoring and reporting enterprise data using a message-based data exchange | |
US10637990B1 (en) | Call center load balancing and routing management | |
CN100334584C (zh) | 信息处理设备、信息处理方法和程序 | |
US20140180978A1 (en) | Instance weighted learning machine learning model | |
CN107146089A (zh) | 一种刷单识别方法及装置,电子设备 | |
CN105744005A (zh) | 客户定位分析方法及服务器 | |
CN106506454A (zh) | 欺诈业务识别方法及装置 | |
CN109670797A (zh) | 支付路由选取方法、装置、设备及存储介质 | |
CN107403334A (zh) | 数据处理方法及装置 | |
CN108304935A (zh) | 机器学习模型训练方法、装置和计算机设备 | |
CN102713881A (zh) | 多个服务实例的聚合 | |
CN106210163A (zh) | 基于ip地址的定位方法及装置 | |
CN108319598A (zh) | 数据缓存方法、装置和*** | |
Ferrucci | Pro-active dynamic vehicle routing: real-time control and request-forecasting approaches to improve customer service | |
CN108696597A (zh) | 推送营销信息的方法和装置 | |
CN109657998A (zh) | 一种资源分配方法、装置、设备及存储介质 | |
CN109241084A (zh) | 数据的查询方法、终端设备及介质 | |
CN108959048A (zh) | 模块化环境的性能分析方法、装置及可存储介质 | |
US20140222538A1 (en) | Customer experience management for an organization | |
Paurobally et al. | Automating negotiation for m-services | |
US11693579B2 (en) | Value-based replication of streaming data | |
CN109767333A (zh) | 选基方法、装置、电子设备及计算机可读存储介质 | |
Klundert et al. | ASAP: The after-salesman problem |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |