CN109657148B - 针对上报poi的异常操作识别方法、装置、服务器和介质 - Google Patents

针对上报poi的异常操作识别方法、装置、服务器和介质 Download PDF

Info

Publication number
CN109657148B
CN109657148B CN201811582770.6A CN201811582770A CN109657148B CN 109657148 B CN109657148 B CN 109657148B CN 201811582770 A CN201811582770 A CN 201811582770A CN 109657148 B CN109657148 B CN 109657148B
Authority
CN
China
Prior art keywords
poi
target user
reported
user
abnormal operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811582770.6A
Other languages
English (en)
Other versions
CN109657148A (zh
Inventor
何守伟
刘复新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811582770.6A priority Critical patent/CN109657148B/zh
Publication of CN109657148A publication Critical patent/CN109657148A/zh
Application granted granted Critical
Publication of CN109657148B publication Critical patent/CN109657148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Alarm Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种针对上报POI的异常操作识别方法、装置、服务器和介质,其中,该方法包括:从目标用户的历史上报数据中提取特征参数,其中,特征参数用于描述目标用户上报的历史POI的属性信息;根据特征参数识别目标用户是否为候选异常用户;如果目标用户为候选异常用户,则根据特征参数和预设规则,识别目标用户的异常操作类型。本发明实施例解决了现有技术中针对上报POI的异常操作识别精度较低以及不能识别出异常操作类型的问题,提高了针对异常操作的识别精度,并可准确识别出异常操作类型。

Description

针对上报POI的异常操作识别方法、装置、服务器和介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种针对上报POI的异常操作识别方法、装置、服务器和介质。
背景技术
兴趣点(Point of Interest,POI)包含名称、类别、经纬度、附近的酒店或商铺等信息,可用于地图导航等应用。POI数据是在线离线/线上到线下(Online To Offline,O2O)服务的基础,直接为广大用户提供全面且直观的需求信息。
现实生活场景中存在着数量庞大的POI,而对于这些POI数据的采集,除了应用开发商自行采集并标注外,通常也会通过用户上报的方式来获取数据。例如POI-UGC(UGC,User Generated Content,指用户原创内容)即作为地图POI数据免费标注的重要通道。然而,用户上报的POI数据质量参差不齐,甚至存在某些用户为了非法目的而虚报或报错等情况,导致在用户上报POI的场景下,应用开发商面临着严峻的数据异常操作问题,例如数据作弊等。
发明内容
本发明实施例提供一种针对上报POI的异常操作识别方法、装置、服务器和介质,以实现提高针对上报POI的异常操作的识别精度,并准确识别出异常操作类型的效果。
第一方面,本发明实施例提供了一种针对上报POI的异常操作识别方法,该方法包括:
从目标用户的历史上报数据中提取特征参数,其中,所述特征参数用于描述目标用户上报的历史POI的属性信息;
根据所述特征参数识别目标用户是否为候选异常用户;
如果目标用户为候选异常用户,则根据所述特征参数和预设规则,识别目标用户的异常操作类型。
第二方面,本发明实施例还提供了一种针对上报POI的异常操作识别装置,该装置包括:
特征参数提取模块,用于从目标用户的历史上报数据中提取特征参数,其中,所述特征参数用于描述目标用户上报的历史POI的属性信息;
候选异常用户识别模块,用于根据所述特征参数识别目标用户是否为候选异常用户;
异常操作类型识别模块,用于如果目标用户为候选异常用户,则根据所述特征参数和预设规则,识别目标用户的异常操作类型。
第三方面,本发明实施例还提供了一种服务器,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的针对上报POI的异常操作识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的针对上报POI的异常操作识别方法。
本发明实施例根据从目标用户的历史上报数据中提取的特征参数,识别目标用户是否为候选异常用户;如果目标用户为候选异常用户,则根据特征参数和预设规则,识别目标用户的异常操作类型,解决了现有技术中针对上报POI的异常操作识别精度较低以及不能识别出异常操作类型的问题,实现了提高针对异常操作的识别精度,并准确识别出异常操作类型的效果。
附图说明
图1是本发明实施例一提供的针对上报POI的异常操作识别方法的流程图;
图2是本发明实施例二提供的针对上报POI的异常操作识别方法的流程图;
图3是本发明实施例三提供的针对上报POI的异常操作识别方法的流程图;
图4是本发明实施例四提供的针对上报POI的异常操作识别方法的流程图;
图5是本发明实施例五提供的针对上报POI的异常操作识别方法的流程图;
图6是本发明实施例六提供的针对上报POI的异常操作识别装置的结构示意图;
图7是本发明实施例七提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的针对上报POI的异常操作识别方法的流程图,本实施例可适用于针对上报POI的异常操作进行识别的情况,该方法可以由针对上报POI的异常操作识别装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成在服务器上。
如图1所示,本实施例提供的针对上报POI的异常操作识别方法可以包括:
S110、从目标用户的历史上报数据中提取特征参数,其中,特征参数用于描述目标用户上报的历史POI的属性信息。
本实施例中目标用户可以是执行上报POI行为的任意用户。在提取特征参数之前,服务器通过提取目标用户工单的UID信息(User Identification,用户身份证明),识别出用户账号,进而基于用户账号获取目标用户的历史上报数据,从中提取与历史上报的POI相关的特征参数。
可选的,特征参数包括但不限于:POI名称、用户坐标、POI坐标、POI电话、上报工单类型和上报工单总数。工单类型包括新增、纠错和下线。相比于现有技术中在异常操作识别过程中考虑的特征参数比较单一,例如只考虑上报工单类型和上报工单总数,本实施例中还同时考虑其他的多个特征参数,可以保证异常操作识别的精度,降低识别误伤率。
S120、根据特征参数识别目标用户是否为候选异常用户。
示例性的,如果提取的特征参数中存在不符合预设参数要求的特征参数,则将目标用户确定为候选异常用户。预设参数要求可以是基于现有的异常操作识别经验而设置的针对一个或者多个特征参数的参考标准,用于初步识别用户上报POI的行为是否属于异常操作。
S130、如果目标用户为候选异常用户,则根据特征参数和预设规则,识别目标用户的异常操作类型。
其中,预设规则定义了与具体异常操作类型对应的特征参数所满足的条件。不同的异常操作类型对应不同的特征参数条件。如果根据特征参数初步确定目标用户为候选异常用户,则进一步基于特征参数判断用户是否为真正的异常用户,并基于不同异常操作类型对应的特征参数条件,区分出目标用户的异常操作的类型。
可选的,异常操作类型包括但不限于:代理上报、恶意竞品上报和恶意上报导流。代理上报是指将一些不合法的POI委托给中间代理商实现数据上报的行为;恶意竞品上报是指商业竞争对手之间通过不正当的POI上报而损害对手利益的行为;恶意上报导流是指基于将地点虚假上报的多个POI,利用与POI对应的通讯电话对接预约用户的行为。上述列举的异常操作类型是对本实施例方案的示例性说明,不应作为对本实施例的限定。
本实施例的技术方案根据从目标用户的历史上报数据中提取的特征参数,识别目标用户是否为候选异常用户;如果目标用户为候选异常用户,则根据特征参数和预设规则,识别目标用户的异常操作类型,解决了现有技术中针对上报POI的异常操作识别精度较低以及不能识别出异常操作类型的问题,实现了提高针对异常操作的识别精度,并准确识别出异常操作类型的效果,降低了识别误伤率;进一步为POI-UGC的反异常操作***提供数据支撑,保证了POI-UGC整体数据加工流程中的风险可控性。
实施例二
图2是本发明实施例二提供的针对上报POI的异常操作识别方法的流程图,本实施例是在上述实施例的基础上进一步进行优化。如图2所示,该方法可以包括:
S210、从目标用户的历史上报数据中提取特征参数。
S220、依据特征参数中目标用户的上报工单总数和第一预设阈值进行判断,如果上报工单总数高于第一预设阈值,则将目标用户作为候选异常用户。
目标用户的上报工单总数越多,则目标用户为异常用户的可能性越大。
其中,第一预设阈值可以根据实际情况进行设置。例如,将第一预设阈值设置为10,如果提取的特征参数中目标用户的上报工单总数超过10,则将目标用户确定为候选异常用户,如果目标用户的上报工单总数不超过10,则结束反异常操作的分类分析,以保证反异常操作识别的准确率。
S230、根据特征参数和预设规则,识别目标用户的异常操作类型。
可选的,该方法还包括:
如果识别出目标用户的异常操作类型为代理上报、恶意竞品上报或恶意导流上报中的任意一种,则确定目标用户为异常用户,并将其拉入黑名单。通过自动将异常用户拉入黑名单,阻断其上报的POI数据,从而减少地图上标注的不良POI,维护公众利益。
本实施例的技术方案依据特征参数中目标用户的上报工单总数和第一预设阈值的关系,将目标用户识别为候选异常用户,然后继续根据特征参数和预设规则,识别目标用户的异常操作类型,解决了现有技术中针对上报POI的异常操作识别精度较低以及不能识别出异常操作类型的问题,实现了提高针对异常操作的识别精度,并准确识别出异常操作类型的效果,降低了识别误伤率。
实施例三
图3是本发明实施例三提供的针对上报POI的异常操作识别方法的流程图,本实施例是在上述实施例的基础上进一步进行优化,以目标用户的异常操作类型为代理上报为例进行示例性说明。如图3所示,该方法可以包括:
S310、从目标用户的历史上报数据中提取特征参数。
S320、依据特征参数中目标用户的上报工单总数和第一预设阈值进行判断,如果上报工单总数高于第一预设阈值,则将目标用户作为候选异常用户。
S330、分别对目标用户的历史上报数据中的POI坐标和用户坐标进行聚类。
示例性的,利用现有的聚类算法,例如基于密度的聚类算法(db-scan算法),对POI坐标和用户坐标进行聚类,得到POI坐标簇和用户坐标簇。其中,根据坐标聚类计算的精度要求,聚类计算过程中的半径参数可以设置为不同的值,例如粗略估计城市的间隔,可以将半径参数设置为R1=100000m。
S340、针对聚类结果,如果用户坐标聚为一个簇,而POI坐标聚为多个POI坐标簇,并且POI坐标簇的数量达到第二预设阈值,则识别出目标用户的异常操作类型为代理上报。
其中,聚类结果中用户坐标聚为一个簇,即表示用户上报POI时的个人位置几乎不变;POI坐标聚为多个簇,即表示用户上报的POI地点包括多个不同的地点。例如,目标用户一共上报了20个工单,POI坐标可聚类为15个坐标簇,其中,至少10个POI坐标簇对应于同一个用户坐标,若第二预设阈值设置为工单数量的一半,即第二预设阈值为10,则目标用户的上报行为符合代理上报的特征,便将其异常操作类型识别为代理上报。
本实施例的技术方案首先根据目标用户的上报工单总数和第一预设阈值的关系,将目标用户识别为候选异常用户;然后通过对目标用户上报的POI坐标和用户坐标进行聚类与分析,将目标用户的异常操作类型识别为代理上报,解决了现有技术中针对上报POI的异常操作识别精度较低以及不能识别出异常操作类型的问题,实现了提高针对异常操作的识别精度,并准确识别出异常操作类型的效果,降低了识别误伤率。
实施例四
图4是本发明实施例四提供的针对上报POI的异常操作识别方法的流程图,本实施例是在上述实施例的基础上进一步进行优化,以目标用户的异常操作类型为恶意竞品上报为例进行示例性说明。如图4所示,该方法可以包括:
S410、从目标用户的历史上报数据中提取特征参数。
S420、依据特征参数中目标用户的上报工单总数和第一预设阈值进行判断,如果上报工单总数高于第一预设阈值,则将目标用户作为候选异常用户。
S430、分别对目标用户的历史上报数据中的POI名称和POI坐标进行聚类,得到多个POI名称簇和多个POI坐标簇。
示例性的,利用现有的相似度计算方法,例如Jaccard相似度算法,计算POI名称的行业聚集情况,得到多个POI名称簇;利用db-scan算法对上报POI坐标进行聚类,得到多个POI坐标簇,其中聚类计算过程中的半径参数可以设置为R2=200m。
S440、如果同时符合如下规则,则识别出目标用户的异常操作类型为恶意竞品上报:在多个POI名称簇中存在POI名称的个数达到第三预设阈值的名称簇;以及多个POI坐标簇的簇数量达到第四预设阈值;以及目标用户的历史上报数据中的上报工单类型为纠错和/或下线的工单数占上报工单总数的比例达到第五预设阈值。
其中,第三预设阈值、第四预设阈值和第五预设阈值可以根据实际需要进行灵活设置,可以设置为相同的值,也可以设置为不同的值。若一个POI名称簇中包括的POI名称超过第三预设阈值,则表示目标用户上报了大量的属于同类行业的POI;若得到的POI坐标簇的簇数量达到第四预设阈值,则表示目标用户上报了多个地点的POI。
示例性的,将第三预设阈值和第四预设阈值设置为目标用户的上报工单总数的50%,将第五预设阈值设置为目标用户的上报工单总数的80%。假设目标用户上报的工单总数为20,通过聚类分析,得到10个POI名称簇和10个POI坐标簇,其中一个POI名称簇中包括了11个属于同类行业POI名称,可见POI名称簇和POI坐标簇均达到第三预设阈值和第四预设阈值的要求。若继续判断出用户上报的工单类型中属于纠错类型的工单数至少为16个,或者上报的工单类型中属于下线类型的工单数至少为16个,或者上报的工单类型中属于纠错类型和下线类型的工单总数至少为16个,即三种情况下均达到用户上报工单总数的80%。可见,目标用户的上报行为符合恶意竞品上报的特征,则识别出其异常操作类型为恶意竞品上报。
需要说明的是,在识别异常操作类型是否为恶意竞品上报时,上述规则中三个识别条件缺一不可,当任意一个识别条件不满足时,则不能将目标用户的异常操作类型确定为恶意竞品上报,否则将出现识别误伤的现象,导致异常操作类型识别的精度下降。例如,某房产中介对全市各处新增店铺进行上报,通过对其上报数据的特征参数进行聚类,得到的POI名称簇中的名称数量和POI坐标簇的簇数量分别满足第三预设阈值和第四预设阈值,但由于其上报工单类型是新增,而非纠错和下线,因此该房产中介的上报POI行为不属于恶意竞品上报。
本实施例的技术方案首先根据目标用户的上报工单总数和第一预设阈值的关系,将目标用户识别为候选异常用户;然后分别对目标用户的上报的POI名称和POI坐标进行聚类,同时基于聚类结果与目标用户的上报工单类型,将目标用户的异常操作类型识别为恶意竞品上报,解决了现有技术中针对上报POI的异常操作识别精度较低以及不能识别出异常操作类型的问题,实现了提高针对异常操作的识别精度,并准确识别出异常操作类型的效果,降低了识别误伤率。
实施例五
图5是本发明实施例五提供的针对上报POI的异常操作识别方法的流程图,本实施例是在上述实施例的基础上进一步进行优化,以目标用户的异常操作类型为恶意上报导流为例进行示例性说明。如图5所示,该方法可以包括:
S510、从目标用户的历史上报数据中提取特征参数。
S520、依据特征参数中目标用户的上报工单总数和第一预设阈值进行判断,如果上报工单总数高于第一预设阈值,则将目标用户作为候选异常用户。
S530、对目标用户的历史上报数据中的POI名称进行聚类,得到多个POI名称簇。
示例性的,利用现有的相似度计算方法,例如Jaccard相似度算法,计算POI名称的行业聚集情况,得到多个POI名称簇。
S540、如果同时符合如下规则,则识别出目标用户的异常操作类型为恶意上报导流:在多个POI名称簇中存在POI名称的个数达到第六预设阈值的名称簇;以及目标用户上报的全部工单中具有POI电话的工单占上报工单总数的比例达到第七预设阈值;以及目标用户的历史上报数据中的上报工单类型为新增的工单数占上报工单总数的比例达到第八预设阈值。
其中,第六预设阈值、第七预设阈值和第八预设阈值可以根据实际需要进行灵活性设置。示例性的,将第六预设阈值设置为目标用户的上报工单总数的50%,将第七预设阈值设置为目标用户的上报工单总数的90%,将第八预设阈值设置为目标用户的上报工单总数的80%。假设目标用户上报的工单总数为20,通过聚类分析,得到10个POI名称簇,其中一个POI名称簇中包括了11个属于同类行业POI名称,上报的全部工单中具有POI电话的工单量至少为18个,且工单类型为新增的工单数至少为16个,可见目标用户的上报行为符合恶意上报导流的特征,则识别出其异常操作类型为恶意上报导流。针对该情景,例如在车站附近等人流密集地,不良商家通常同时将多家旅店的虚假地址上报至地图服务端,实现将旅店标注为车站附近,并且每个上报的POI均对应有POI电话,当接收到旅客预定房间的消息时,利用POI电话与旅客进行沟通对接,该商家行为便属于恶意上报导流。
需要说明的是,在识别异常操作类型是否为恶意上报导流时,上述规则中三个识别条件缺一不可,当任意一个识别条件不满足时,则不能将目标用户的异常操作类型确定为恶意上报导流,否则将出现识别误伤的现象,导致异常操作类型识别的精度下降。
本实施例的技术方案首先根据目标用户的上报工单总数和第一预设阈值的关系,将目标用户识别为候选异常用户;然后对目标用户上报的POI名称进行聚类,同时基于聚类结果、目标用户的上报工单类型和上报的具有POI电话的工单数量,将目标用户的异常操作类型识别为恶意上报导流,解决了现有技术中针对上报POI的异常操作识别精度较低以及不能识别出异常操作类型的问题,实现了提高针对异常操作的识别精度,并准确识别出异常操作类型的效果,降低了识别误伤率。
实施例六
图6是本发明实施例六提供的针对上报POI的异常操作识别装置的结构示意图,本实施例可适用于针对上报POI的异常操作进行识别的情况。该装置可以采用软件和/或硬件的方式实现,并可集成在服务器上。
如图6所示,本实施例提供的针对上报POI的异常操作识别装置可以包括特征参数提取模块610、候选异常用户识别模块620和异常操作类型识别模块630,其中:
特征参数提取模块610,用于从目标用户的历史上报数据中提取特征参数,其中,特征参数用于描述目标用户上报的历史POI的属性信息;
候选异常用户识别模块620,用于根据特征参数识别目标用户是否为候选异常用户;
异常操作类型识别模块630,用于如果目标用户为候选异常用户,则根据特征参数和预设规则,识别目标用户的异常操作类型。
可选的,特征参数至少包括:POI名称、用户坐标、POI坐标、POI电话、上报工单类型和上报工单总数。
可选的,候选异常用户识别模块620用于:
依据目标用户的上报工单总数和第一预设阈值进行判断,如果上报工单总数高于第一预设阈值,则将目标用户作为候选异常用户。
可选的,异常操作类型至少包括:代理上报、恶意竞品上报和恶意上报导流。
可选的,异常操作类型识别模块630包括:
第一聚类单元,用于如果目标用户为候选异常用户,则分别对目标用户的历史上报数据中的POI坐标和用户坐标进行聚类;
第一异常操作类型确定单元,用于针对聚类结果,如果用户坐标聚为一个簇,而POI坐标聚为多个POI坐标簇,并且POI坐标簇的数量达到第二预设阈值,则识别出目标用户的异常操作类型为代理上报。
可选的,异常操作类型识别模块630包括:
第二聚类单元,用于如果目标用户为候选异常用户,则分别对目标用户的历史上报数据中的POI名称和POI坐标进行聚类,得到多个POI名称簇和多个POI坐标簇;
第二异常操作类型确定单元,用于如果同时符合如下规则,则识别出目标用户的异常操作类型为恶意竞品上报:
在多个POI名称簇中存在POI名称的个数达到第三预设阈值的名称簇;以及
多个POI坐标簇的簇数量达到第四预设阈值;以及
目标用户的历史上报数据中的上报工单类型为纠错和/或下线的工单数占上报工单总数的比例达到第五预设阈值。
可选的,异常操作类型识别模块630包括:
第三聚类单元,用于如果目标用户为候选异常用户,则对目标用户的历史上报数据中的POI名称进行聚类,得到多个POI名称簇;
第三异常操作类型确定单元,用于如果同时符合如下规则,则识别出目标用户的异常操作类型为恶意上报导流:
在多个POI名称簇中存在POI名称的个数达到第六预设阈值的名称簇;以及
目标用户上报的全部工单中具有POI电话的工单占上报工单总数的比例达到第七预设阈值;以及
目标用户的历史上报数据中的上报工单类型为新增的工单数占上报工单总数的比例达到第八预设阈值。
可选的,该装置还包括:
黑名单确定模块,用于如果识别出目标用户的异常操作类型为代理上报、恶意竞品上报或恶意导流上报中的任意一种,则确定目标用户为异常用户,并将其拉入黑名单。
本发明实施例所提供的针对上报POI的异常操作识别装置可执行本发明任意实施例所提供的针对上报POI的异常操作识别方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意方法实施例的内容解释。
实施例七
图7是本发明实施例七提供的一种服务器的结构示意图。图7示出了适于用来实现本发明实施方式的示例***器712的框图。图7显示的服务器712仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,服务器712以通用服务器的形式表现。服务器712的组件可以包括但不限于:一个或者多个处理器716,存储装置728,连接不同***组件(包括存储装置728和处理器716)的总线718。
总线718表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry SubversiveAlliance,ISA)总线,微通道体系结构(Micro Channel Architecture,MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及***组件互连(Peripheral Component Interconnect,PCI)总线。
服务器712典型地包括多种计算机***可读介质。这些介质可以是任何能够被服务器712访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置728可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(Random Access Memory,RAM)730和/或高速缓存存储器732。服务器712可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***734可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘,例如只读光盘(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线718相连。存储装置728可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块742的程序/实用工具740,可以存储在例如存储装置728中,这样的程序模块742包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块742通常执行本发明所描述的实施例中的功能和/或方法。
服务器712也可以与一个或多个外部设备714(例如键盘、指向终端、显示器724等)通信,还可与一个或者多个使得用户能与该服务器712交互的终端通信,和/或与使得该服务器712能与一个或多个其它计算终端进行通信的任何终端(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口722进行。并且,服务器712还可以通过网络适配器720与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide AreaNetwork,WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器720通过总线718与服务器712的其它模块通信。应当明白,尽管图中未示出,可以结合服务器712使用其它硬件和/或软件模块,包括但不限于:微代码、终端驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)***、磁带驱动器以及数据备份存储***等。
处理器716通过运行存储在存储装置728中的程序,从而执行各种功能应用以及数据处理,例如实现本发明任意实施例所提供的针对上报POI的异常操作识别方法,该方法可以包括:
从目标用户的历史上报数据中提取特征参数,其中,特征参数用于描述目标用户上报的历史POI的属性信息;
根据特征参数识别目标用户是否为候选异常用户;
如果目标用户为候选异常用户,则根据特征参数和预设规则,识别目标用户的异常操作类型。
实施例八
本发明实施例八还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的针对上报POI的异常操作识别方法,该方法可以包括:
从目标用户的历史上报数据中提取特征参数,其中,特征参数用于描述目标用户上报的历史POI的属性信息;
根据特征参数识别目标用户是否为候选异常用户;
如果目标用户为候选异常用户,则根据特征参数和预设规则,识别目标用户的异常操作类型。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1.一种针对上报POI的异常操作识别方法,其特征在于,包括:
从目标用户的历史上报数据中提取特征参数,其中,所述特征参数用于描述目标用户上报的历史POI的属性信息;其中,所述特征参数至少包括:用户坐标和POI坐标;
根据所述特征参数识别目标用户是否为候选异常用户;
如果目标用户为候选异常用户,则根据所述特征参数和预设规则,识别目标用户的异常操作类型;
其中,根据所述特征参数和预设规则,识别目标用户的异常操作类型,包括:
分别对目标用户的历史上报数据中的POI坐标和用户坐标进行聚类;
针对聚类结果,如果用户坐标聚为一个簇,而POI坐标聚为多个POI坐标簇,并且POI坐标簇的数量达到第二预设阈值,则识别出目标用户的异常操作类型为代理上报。
2.根据权利要求1所述的方法,其特征在于,所述特征参数还至少包括:POI名称、POI电话、上报工单类型和上报工单总数。
3.根据权利要求2所述的方法,其特征在于,根据所述特征参数识别目标用户是否为候选异常用户,包括:
依据目标用户的上报工单总数和第一预设阈值进行判断,如果所述上报工单总数高于第一预设阈值,则将目标用户作为候选异常用户。
4.根据权利要求2所述的方法,其特征在于,所述异常操作类型还至少包括:恶意竞品上报和恶意上报导流。
5.根据权利要求4所述的方法,其特征在于,根据所述特征参数和预设规则,识别目标用户的异常操作类型,包括:
分别对目标用户的历史上报数据中的POI名称和POI坐标进行聚类,得到多个POI名称簇和多个POI坐标簇;
如果同时符合如下规则,则识别出目标用户的异常操作类型为恶意竞品上报:
在所述多个POI名称簇中存在POI名称的个数达到第三预设阈值的名称簇;以及
所述多个POI坐标簇的簇数量达到第四预设阈值;以及
目标用户的历史上报数据中的上报工单类型为纠错和/或下线的工单数占上报工单总数的比例达到第五预设阈值。
6.根据权利要求4所述的方法,其特征在于,根据所述特征参数和预设规则,识别目标用户的异常操作类型,包括:
对目标用户的历史上报数据中的POI名称进行聚类,得到多个POI名称簇;
如果同时符合如下规则,则识别出目标用户的异常操作类型为恶意上报导流:
在所述多个POI名称簇中存在POI名称的个数达到第六预设阈值的名称簇;以及
目标用户上报的全部工单中具有POI电话的工单占上报工单总数的比例达到第七预设阈值;以及
目标用户的历史上报数据中的上报工单类型为新增的工单数占上报工单总数的比例达到第八预设阈值。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果识别出目标用户的异常操作类型为代理上报、恶意竞品上报或恶意导流上报中的任意一种,则确定目标用户为异常用户,并将其拉入黑名单。
8.一种针对上报POI的异常操作识别装置,其特征在于,包括:
特征参数提取模块,用于从目标用户的历史上报数据中提取特征参数,其中,所述特征参数用于描述目标用户上报的历史POI的属性信息;其中,所述特征参数至少包括:用户坐标和POI坐标;
候选异常用户识别模块,用于根据所述特征参数识别目标用户是否为候选异常用户;
异常操作类型识别模块,用于如果目标用户为候选异常用户,则根据所述特征参数和预设规则,识别目标用户的异常操作类型;
其中,所述异常操作类型识别模块包括:
第一聚类单元,用于如果目标用户为候选异常用户,则分别对目标用户的历史上报数据中的POI坐标和用户坐标进行聚类;
第一异常操作类型确定单元,用于针对聚类结果,如果用户坐标聚为一个簇,而POI坐标聚为多个POI坐标簇,并且POI坐标簇的数量达到第二预设阈值,则识别出目标用户的异常操作类型为代理上报。
9.根据权利要求8所述的装置,其特征在于,所述特征参数还至少包括:POI名称、POI电话、上报工单类型和上报工单总数。
10.根据权利要求9所述的装置,其特征在于,所述候选异常用户识别模块用于:
依据目标用户的上报工单总数和第一预设阈值进行判断,如果所述上报工单总数高于第一预设阈值,则将目标用户作为候选异常用户。
11.根据权利要求9所述的装置,其特征在于,所述异常操作类型还至少包括:恶意竞品上报和恶意上报导流。
12.根据权利要求11所述的装置,其特征在于,所述异常操作类型识别模块包括:
第二聚类单元,用于如果目标用户为候选异常用户,则分别对目标用户的历史上报数据中的POI名称和POI坐标进行聚类,得到多个POI名称簇和多个POI坐标簇;
第二异常操作类型确定单元,用于如果同时符合如下规则,则识别出目标用户的异常操作类型为恶意竞品上报:
在所述多个POI名称簇中存在POI名称的个数达到第三预设阈值的名称簇;以及
所述多个POI坐标簇的簇数量达到第四预设阈值;以及
目标用户的历史上报数据中的上报工单类型为纠错和/或下线的工单数占上报工单总数的比例达到第五预设阈值。
13.根据权利要求11所述的装置,其特征在于,所述异常操作类型识别模块包括:
第三聚类单元,用于如果目标用户为候选异常用户,则对目标用户的历史上报数据中的POI名称进行聚类,得到多个POI名称簇;
第三异常操作类型确定单元,用于如果同时符合如下规则,则识别出目标用户的异常操作类型为恶意上报导流:
在所述多个POI名称簇中存在POI名称的个数达到第六预设阈值的名称簇;以及
目标用户上报的全部工单中具有POI电话的工单占上报工单总数的比例达到第七预设阈值;以及
目标用户的历史上报数据中的上报工单类型为新增的工单数占上报工单总数的比例达到第八预设阈值。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:
黑名单确定模块,用于如果识别出目标用户的异常操作类型为代理上报、恶意竞品上报或恶意导流上报中的任意一种,则确定目标用户为异常用户,并将其拉入黑名单。
15.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~7中任一所述的针对上报POI的异常操作识别方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~7中任一所述的针对上报POI的异常操作识别方法。
CN201811582770.6A 2018-12-24 2018-12-24 针对上报poi的异常操作识别方法、装置、服务器和介质 Active CN109657148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811582770.6A CN109657148B (zh) 2018-12-24 2018-12-24 针对上报poi的异常操作识别方法、装置、服务器和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811582770.6A CN109657148B (zh) 2018-12-24 2018-12-24 针对上报poi的异常操作识别方法、装置、服务器和介质

Publications (2)

Publication Number Publication Date
CN109657148A CN109657148A (zh) 2019-04-19
CN109657148B true CN109657148B (zh) 2020-10-13

Family

ID=66115007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811582770.6A Active CN109657148B (zh) 2018-12-24 2018-12-24 针对上报poi的异常操作识别方法、装置、服务器和介质

Country Status (1)

Country Link
CN (1) CN109657148B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347973B (zh) * 2019-07-15 2023-07-14 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN111625817B (zh) * 2020-05-12 2023-05-02 咪咕文化科技有限公司 异常用户识别方法、装置、电子设备及存储介质
CN112579907B (zh) * 2020-12-25 2023-08-11 北京百度网讯科技有限公司 一种异常任务检测方法、装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101467003A (zh) * 2006-06-30 2009-06-24 电子地图北美公司 用于收集关于地理数据的用户更新请求以支持自动化分析、处理和地理数据更新的方法和***
CN105528535A (zh) * 2015-12-25 2016-04-27 北京奇虎科技有限公司 基于行为日志信息的用户行为分析方法及装置
CN105608153A (zh) * 2015-12-18 2016-05-25 晶赞广告(上海)有限公司 一种通用的poi信息关联方法
CN106453357A (zh) * 2016-11-01 2017-02-22 北京红马传媒文化发展有限公司 一种网络购票异常行为的识别方法、***及设备
CN107888602A (zh) * 2017-11-23 2018-04-06 北京白山耘科技有限公司 一种检测异常用户的方法及装置
CN108156146A (zh) * 2017-12-19 2018-06-12 北京盖娅互娱网络科技股份有限公司 一种用于识别异常用户操作的方法与装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104080054B (zh) * 2014-07-18 2018-11-09 百度在线网络技术(北京)有限公司 一种异常兴趣点的获取方法及装置
US9432944B1 (en) * 2015-06-13 2016-08-30 KeepTrax, Inc. Determining whether a mobile device user is substantially stationary within a geo-fence
CN108345611B (zh) * 2017-01-24 2022-12-13 北京搜狗信息服务有限公司 一种地图搜索的运行监控方法、装置及电子设备
CN107729368A (zh) * 2017-09-08 2018-02-23 百度在线网络技术(北京)有限公司 一种用于poi数据校验的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101467003A (zh) * 2006-06-30 2009-06-24 电子地图北美公司 用于收集关于地理数据的用户更新请求以支持自动化分析、处理和地理数据更新的方法和***
CN105608153A (zh) * 2015-12-18 2016-05-25 晶赞广告(上海)有限公司 一种通用的poi信息关联方法
CN105528535A (zh) * 2015-12-25 2016-04-27 北京奇虎科技有限公司 基于行为日志信息的用户行为分析方法及装置
CN106453357A (zh) * 2016-11-01 2017-02-22 北京红马传媒文化发展有限公司 一种网络购票异常行为的识别方法、***及设备
CN107888602A (zh) * 2017-11-23 2018-04-06 北京白山耘科技有限公司 一种检测异常用户的方法及装置
CN108156146A (zh) * 2017-12-19 2018-06-12 北京盖娅互娱网络科技股份有限公司 一种用于识别异常用户操作的方法与装置

Also Published As

Publication number Publication date
CN109657148A (zh) 2019-04-19

Similar Documents

Publication Publication Date Title
CN109657148B (zh) 针对上报poi的异常操作识别方法、装置、服务器和介质
CN107273531B (zh) 电话号码分类识别方法、装置、设备及存储介质
CN109714636B (zh) 一种用户识别方法、装置、设备及介质
CN113205037B (zh) 事件检测的方法、装置、电子设备以及可读存储介质
CN110135912B (zh) 一种信息推送方法、装置、服务器和存储介质
CN112860993B (zh) 兴趣点的分类方法、装置、设备、存储介质及程序产品
CN112016855B (zh) 基于关系网匹配的用户行业识别方法、装置和电子设备
CN111666346A (zh) 信息归并方法、交易查询方法、装置、计算机及存储介质
CN111598713B (zh) 基于相似度权重更新的团伙识别方法、装置及电子设备
CN110909804B (zh) 基站异常数据的检测方法、装置、服务器和存储介质
CN106358220B (zh) 异常联系人信息的检测方法、装置及***
CN111400695B (zh) 一种设备指纹生成方法、装置、设备和介质
CN110647595B (zh) 一种新增兴趣点的确定方法、装置、设备和介质
CN115512146A (zh) Poi信息挖掘方法、装置、设备及存储介质
CN111125272B (zh) 一种区域特征获取方法、装置、计算机设备及介质
CN115456691A (zh) 线下广告位的推荐方法、装置、电子设备及存储介质
CN111353864B (zh) 一种产品推荐方法、装置、服务器及存储介质
CN110457705B (zh) 一种兴趣点数据处理方法、装置、设备和存储介质
CN111598714A (zh) 一种基于二阶段无监督的团伙识别方法、装置及电子设备
CN113225325A (zh) 一种ip黑名单确定方法、装置、设备及存储介质
CN113591787A (zh) 光纤链路部件的识别方法、装置、设备和存储介质
CN114077858A (zh) 向量数据处理方法、装置、设备及存储介质
CN116051287B (zh) 一种数据的分析方法、装置、电子设备及存储介质
CN112417310B (zh) 建立智能服务索引以及推荐智能服务的方法
CN107729446B (zh) 地图电话甄别方法、装置、服务器及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant