CN117573951A - 一种目标用户筛选方法、装置、介质及设备 - Google Patents

一种目标用户筛选方法、装置、介质及设备 Download PDF

Info

Publication number
CN117573951A
CN117573951A CN202410057424.5A CN202410057424A CN117573951A CN 117573951 A CN117573951 A CN 117573951A CN 202410057424 A CN202410057424 A CN 202410057424A CN 117573951 A CN117573951 A CN 117573951A
Authority
CN
China
Prior art keywords
target
users
candidate
wifi
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410057424.5A
Other languages
English (en)
Other versions
CN117573951B (zh
Inventor
董霖
方宏源
宋彤彤
段永康
李峤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Merit Interactive Co Ltd
Original Assignee
Merit Interactive Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Merit Interactive Co Ltd filed Critical Merit Interactive Co Ltd
Priority to CN202410057424.5A priority Critical patent/CN117573951B/zh
Publication of CN117573951A publication Critical patent/CN117573951A/zh
Application granted granted Critical
Publication of CN117573951B publication Critical patent/CN117573951B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理领域,尤其涉及一种目标用户筛选方法、装置、介质及设备,包括:根据wifi交互集合筛选到第一类关键用户,根据第一类关键用户对应的IP列表筛选到第一类目标IP,根据第一类目标IP对应的用户列表筛选到第二类关键用户,根据第N类关键用户对应的IP列表筛选得到第N类目标IP,根据第N类目标IP对应的用户列表筛选到第N+1类关键用户,当第N+1类关键用户的数量等于第N类关键用户的数量时,将第N+1类关键用户确定为目标用户,通过对目标IP和关键用户进行多次相互关联的更新,提高了关键用户和目标IP的筛选准确性,并完成了对目标IP和关键用户的多次扩量,从而提高了目标用户的筛选准确性。

Description

一种目标用户筛选方法、装置、介质及设备
技术领域
本发明涉及数据处理领域,特别是涉及一种目标用户筛选方法、装置、介质及设备。
背景技术
随着智能设备的普及以及网络的快速发展,公司员工的日常工作和日常生活与智能设备和网络息息相关,因此,在筛选公司员工时,可以依赖员工连接的网络信息对员工和网络、员工与员工之间的关联关系进行分析,从而筛选出属于对应公司的员工。
现阶段的用户筛选方法可以依据多个员工的工作情况和组织关系,得到员工组织关系图,在员工组织关系图中查询符合条件的候选员工作为目标员工,但是由于公司的员工信息始终处于动态变化的过程中,且员工组织图中一个员工节点会影响多个或者所有的员工节点,因此,为了提高目标员工的筛选准确性,该种方法中生成的员工组织关系图要随着员工信息的变化实时更新,需要耗费大量时间和计算资源,因此,在低成本要求中进行员工筛选时,会导致目标员工的筛选准确性较低。
因此,如何在低成本要求中提高目标员工的筛选准确性成为亟待解决的问题。
发明内容
针对上述技术问题,本发明采用的技术方案为一种目标用户筛选方法,所述目标用户筛选方法包括如下步骤:
获取到目标对象对应的第一候选用户,以及每一第一候选用户对应的wifi交互集合。
根据wifi交互集合,从所有的第一候选用户中筛选得到目标对象对应的第一类关键用户。
获取到每一第一类关键用户对应的IP列表和每一候选IP对应的用户列表,其中,IP列表中包括每一第一类关键用户对应的若干个候选IP,用户列表中包括每一候选IP对应的若干个第二候选用户。
根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第一类目标IP。
根据所有的第一类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第二类关键用户,其中,第二类关键用户的数量大于或者等于第一类关键用户的数量。
根据所有的第N类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第N类目标IP,其中,第N类目标IP的数量大于或者等于第N-1类目标IP的数量,N为大于1的整数,N=2时,第N类关键用户与第二类关键用户一致。
根据所有的第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第N+1类关键用户,其中,第N+1类关键用户的数量大于或者等于第N类关键用户的数量。
当第N+1类关键用户的数量等于第N类关键用户的数量时,将第N+1类关键用户确定为目标用户。
本发明还提供了一种目标用户筛选装置,所述目标用户筛选装置包括:
第一数据获取模块,用于获取到目标对象对应的第一候选用户,以及每一第一候选用户对应的wifi交互集合。
第一关键用户筛选模块,用于根据wifi交互集合,从所有的第一候选用户中筛选得到目标对象对应的第一类关键用户。
第二数据获取模块,用于获取到每一第一类关键用户对应的IP列表和每一候选IP对应的用户列表,其中,IP列表中包括每一第一类关键用户对应的若干个候选IP,用户列表中包括每一候选IP对应的若干个第二候选用户。
第一目标IP筛选模块,用于根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第一类目标IP。
第二关键用户筛选模块,用于根据所有的第一类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第二类关键用户,其中,第二类关键用户的数量大于或者等于第一类关键用户的数量。
第二目标IP筛选模块,用于根据所有的第N类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第N类目标IP,其中,第N类目标IP的数量大于或者等于第N-1类目标IP的数量,N为大于1的整数,N=2时,第N类关键用户与第二类关键用户一致。
第三关键用户筛选模块,用于根据所有的第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第N+1类关键用户,其中,第N+1类关键用户的数量大于或者等于第N类关键用户的数量。
第一目标用户筛选模块,用于当第N+1类关键用户的数量等于第N类关键用户的数量时,将第N+1类关键用户确定为目标用户。
本发明还提供了一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现上述的目标用户筛选方法。
本发明还提供了一种电子设备,包括处理器和上述的非瞬时性计算机可读存储介质。
本发明至少具有以下有益效果:根据wifi交互集合,从所有的第一候选用户中筛选得到目标对象对应的第一类关键用户,根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第一类目标IP,根据所有的第一类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第二类关键用户,作为进一步更新目标IP以及进一步更新关键用户的基础,提高了关键用户和目标IP的筛选准确性;根据所有的第N类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第N类目标IP,根据所有的第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第N+1类关键用户,作为进一步更新目标IP以及进一步更新关键用户的基础,进一步提高了关键用户和目标IP的筛选准确性,同时又一次完成了对目标IP和关键用户的扩量;当第N+1类关键用户的数量等于第N类关键用户的数量时,将第N+1类关键用户确定为目标用户,在关键用户的数量达到上限时获取到对应的目标用户,提高了目标用户的筛选准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种目标用户筛选方法的流程图;
图2为本发明实施例二提供的一种目标wifi筛选方法的流程图;
图3为本发明实施例三提供的一种目标对象筛选方法的流程图;
图4为本发明实施例四提供的一种目标用户筛选装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
本实施例一提供了一种目标用户筛选方法,所述目标用户筛选方法包括如下步骤,如图1所示:
S1,获取到目标对象对应的第一候选用户,以及每一第一候选用户对应的wifi交互集合。
其中,目标对象可以是指需要进行员工筛选的公司、企业、工作室、工厂等具有一定数量员工的对象;wifi交互集合中可以包括有若干个目标wifi,目标wifi是指目标对象对应使用的wifi,每一目标wifi唯一对应该目标对象;第一候选用户可以是指与目标对象对应的目标wifi有交互行为的用户,交互行为可以是指扫描行为,也可以是指连接行为,该目标用户筛选方法用于从第一候选用户中筛选出目标对象对应的员工并作为目标用户。
针对每一个wifi,用户可以在一定范围内扫描到该wifi,因此,扫描到目标wifi的第一候选用户可能是该目标对象的员工,也可能是该目标对象附近的其他对象的员工,或者可能是经过该目标对象的地理位置附近的其他用户;同时,该目标对象的每一个员工可以扫描并连接到目标wifi,也可以扫描到但不连接目标wifi。
单独根据第一候选用户与目标wifi之间的扫描交互行为,或者单独根据第一候选用户与目标wifi之间的连接交互行为,都不能准确地完成目标对象中目标用户的筛选,因此,为了提高目标用户的筛选准确性,本实施例获取到每一第一候选用户对应的wifi交互集合,结合第一候选用户与目标wifi之间的扫描交互行为和连接交互行为,来完成目标用户的筛选。
在一具体实施方式中,wifi交互集合包括wifi扫描子集合和wifi连接子集合,wifi扫描子集合中包括对应第一候选用户扫描到的若干个目标wifi,以及与扫描到的每一目标wifi之间的扫描次数,wifi连接子集合中包括对应第一候选用户连接的若干个目标wifi,以及与连接的每一目标wifi之间的连接次数。
其中,第一候选用户与目标wifi之间的扫描次数和连接次数越多,表示该第一候选用户与目标对象之间的关联关系越紧密,因此,本实施例在获取到每一第一候选用户扫描到的若干个目标wifi以及连接的若干个目标wifi之外,还获取到每一第一候选用户与扫描到的每一目标wifi之间的扫描次数以及与连接的每一目标wifi之间的连接次数,以充分表征第一候选用户与目标wifi之间的交互关系。
上述,获取到每一第一候选用户对应的wifi交互集合,来表征第一候选用户与目标wifi之间的扫描交互行为和连接交互行为,作为分析第一候选用户与目标对象之间的关联关系的基础,为目标用户的筛选提供了数据基础,从而提高了目标用户的筛选准确性。
S2,根据wifi交互集合,从所有的第一候选用户中筛选得到目标对象对应的第一类关键用户。
在一具体实施方式中,S2还包括如下步骤:
根据每一第一候选用户对应的wifi扫描子集合,获取到每一第一候选用户扫描的目标wifi的第一数量;
根据每一第一候选用户对应的wifi连接子集合,获取到每一第一候选用户连接的目标wifi的第二数量;
根据每一第一候选用户对应的第一数量在目标wifi的总数量中的第一占比、第二数量在目标wifi的总数量中的第二占比、对应的扫描次数的总和、对应的连接次数的总和,以及第一占比对应的第一权重、第二占比对应的第二权重、扫描次数对应的第三权重和连接次数对应的第四权重,获取到每一第一候选用户对应的选取概率;
当选取概率大于预设的选取概率阈值时,将选取概率对应的第一候选用户确定为第一类关键用户。
其中,第一候选用户与目标wifi之间的扫描次数和连接次数越多,表示该第一候选用户与目标对象之间的关联关系越紧密,因此,本实施例根据第一数量在目标wifi的总数量中的第一占比、第二数量在目标wifi的总数量中的第二占比、扫描次数的总和、连接次数的总和以及对应的权重,结合预设的选取概率公式,获取到每一第一候选用户对应的选取概率,来表征每一第一候选用户被选取为目标对象的第一关键用户的概率。
在一具体实施方式中,预设的选取概率公式为P=γ1 (x1/x0)+γ2/>(x2/x0)+γ3/>y14/>y2,其中,x1是指第一候选用户对应的第一数量,x1是指第一候选用户对应的第二数量,x0是指目标wifi的总数量,y1是指第一候选用户对应的扫描次数的总和,y2是指第一候选用户对应的连接次数的总和,γ1是指第一权重,γ2是指第二权重,γ3是指第三权重,γ4是指第四权重。
可以理解的,γ1<γ2,γ3<γ4,γ1、γ2、γ3和γ4的具体数值可由实施者根据实际情况进行设定。
上述,根据wifi交互集合,基于每一候选用户扫描的目标wifi的第一数量在目标wifi的总数量中的第一占比、每一候选用户连接的目标wifi的第二数量在目标wifi的总数量中的第二占比、扫描次数的总和、连接次数的总和以及对应的权重,获取到每一第一候选用户对应的选取概率,来表征每一第一候选用户被选取为目标对象的第一关键用户的概率,提高了筛选出的第一类关键用户的准确性。
S3,获取到每一第一类关键用户对应的IP列表和每一候选IP对应的用户列表,其中,IP列表中包括每一第一类关键用户对应的若干个候选IP,用户列表中包括每一候选IP对应的若干个第二候选用户。
其中,第一类关键用户对应的候选IP可以识别第一关键用户对应的设备,候选IP可以作为对应的第一类关键用户的身份标识。
第二候选用户是指与对应的候选IP相关的用户,第二候选用户与第一候选用户中可以存在一致的用户。
通过获取每一第一类关键用户对应的IP列表和每一候选IP对应的用户列表,可以分析第一类关键用户和候选IP之间的关联关系,从而根据已知的第一类关键用户来筛选与目标对象关联关系紧密的候选IP作为目标IP,并进一步根据已知的目标IP来筛选与目标对象关联关系紧密的第一类关键用户作为第二类关键用户,以此类推,直至满足筛选目标用户的筛选条件,从而完成目标用户的筛选任务。
S4,根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第一类目标IP。
其中,第一类目标IP是从候选IP中筛选得到的与目标对象的关联关系紧密的IP。
在一具体实施方式中,S4还包括如下步骤:
根据所有的第一类关键用户对应的IP列表,获取到每一候选IP对应的第一类关键用户的第三数量;
获取到第三数量在第一类关键用户的总数量中的第三占比;
当第三占比大于预设的第一数量占比阈值时,将第三占比对应的候选IP确定为第一类目标IP。
其中,每一候选IP对应的第一类关键用户的第三数量在第一类关键用户的总数量中的第三占比越大,表征对应的候选IP与目标对象的关联关系越紧密,因此,根据第三占比与预设的第一数量占比阈值的大小比较,来筛选得到第一类目标IP。
上述,根据每一候选IP对应的第一类关键用户的第三数量在第一类关键用户的总数量中的第三占比,以及第三占比与预设的第一数量占比阈值的大小比较,筛选得到第一类目标IP,作为更新关键用户以及进一步更新目标IP的基础,提高了关键用户和目标IP的筛选准确性。
S5,根据所有的第一类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第二类关键用户,其中,第二类关键用户的数量大于或者等于第一类关键用户的数量。
其中,第二类关键用户是从第二候选用户中筛选得到的与目标对象的关联关系紧密的用户,第二类关键用户包括了所有的第一类关键用户。
在一具体实施方式中,S5还包括如下步骤:
根据所有的第一类目标IP对应的用户列表,获取到除第一类关键用户之外的每一第二候选用户对应的第一类目标IP的第四数量;
获取到第四数量在第一类目标IP的总数量中的第四占比;
当第四占比大于预设的第二数量占比阈值时,将第四占比对应的第二候选用户确定为第一类中间候选用户;
将第一类关键用户和第一类中间候选用户确定为第二类关键用户。
其中,每一第二候选用户对应的第一类目标IP的第四数量在第一类目标IP的总数量中的第四占比越大,表征对应的第二候选用户与目标对象的关联关系越紧密,因此,根据第四占比与预设的第二数量占比阈值的大小比较,来筛选得到第一类中间候选用户,进一步结合第一类关键用户获取到第二类关键用户,则第二类关键用户的数量大于或者等于第一类关键用户的数量。
上述,根据每一第二候选用户对应的第一类目标IP的第四数量在第一类目标IP的总数量中的第四占比,第四占比与预设的第二数量占比阈值的大小比较,筛选得到第一类中间候选用户,作为更新目标IP以及进一步更新关键用户的基础,提高了关键用户和目标IP的筛选准确性,并完成了对关键用户的扩量,提高了目标用户的筛选准确性。
S6,根据所有的第N类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第N类目标IP,其中,第N类目标IP的数量大于或者等于第N-1类目标IP的数量,N为大于1的整数,N=2时,所述第N类关键用户与所述第二类关键用户一致。
在一具体实施方式中,S6还包括如下步骤:
根据所有的第N类关键用户对应的IP列表,获取到除第N-1类目标IP之外的每一候选IP对应的第N类关键用户的第五数量;
获取到第五数量在第N类关键用户的总数量中的第五占比;
当第五占比大于预设的第一数量占比阈值时,将第五占比对应的候选IP确定为第N-1类中间目标IP;
将第N-1类目标IP和第N-1类中间目标IP确定为第N类目标IP。
上述,在获取到第N类关键用户之后,进一步结合第N类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第N类目标IP,完成了目标IP的又一次更新,并作为更新关键用户以及进一步更新目标IP的基础,进一步提高了关键用户和目标IP的筛选准确性,同时完成了对目标IP的扩量,从而提高了目标用户的筛选准确性。
S7,根据所有的第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第N+1类关键用户,其中,第N+1类关键用户的数量大于或者等于第N类关键用户的数量。
在一具体实施方式中,S7还包括如下步骤:
根据所有的第N类目标IP对应的用户列表,获取到除第N类关键用户之外的每一第二候选用户对应的第N类目标IP的第六数量;
获取到第六数量在第N类目标IP的总数量中的第六占比;
当第六占比大于预设的第二数量占比阈值时,将第六占比对应的第二候选用户确定为第N类中间候选用户;
将第N类关键用户和第N类中间候选用户确定为第N+1类关键用户。
上述,在获取到第N类目标IP之后,进一步结合第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第N+1类关键用户,完成了关键用户的又一次更新,并作为更新目标IP以及进一步更新关键用户的基础,进一步提高了关键用户和目标IP的筛选准确性,同时又一次完成了对关键用户的扩量,从而提高了目标用户的筛选准确性。
S8,当第N+1类关键用户的数量等于第N类关键用户的数量时,将第N+1类关键用户确定为目标用户。
其中,当第N+1类关键用户的数量等于第N类关键用户的数量时,表示在获取第N+1类关键用户时对应的关键用户扩量数量为零,表征关键用户的数量达到上限,因此,第N+1类关键用户即为目标用户对应的所有的关键用户,因此,将第N+1类关键用户确定为目标用户。
上述,将第N+1类关键用户的数量等于第N类关键用户的数量作为最终的筛选条件,当满足该筛选条件时,表征关键用户的数量达到上限,据此获取到目标用户,提高了目标用户的获取准确性。
在一具体实施方式中,所述目标用户筛选方法还包括如下步骤:
获取到目标对象的中间用户数量;
根据第N类关键用户的数量、第N+1类关键用户的数量和中间用户数量,获取到第N+1类关键用户对应的扩量效率;
当第N+1类关键用户的数量大于第N类关键用户的数量,且扩量效率小于预设的效率阈值时,将第N+1类关键用户确定为目标用户。
其中,当N较大时,每次对关键用户进行扩量时,增加的关键用户的数量较少,因此,本实施例为了提高目标用户的筛选效率,节省筛选成本,根据第N类关键用户的数量、第N+1类关键用户的数量和中间用户数量,结合预设的扩量效率计算公式,计算得到第N+1类关键用户对应的扩量效率,在扩量效率小于预设的效率阈值时停止关键用户的扩量,并将第N+1类关键用户确定为目标用户。
其中,中间用户可以是指目标对象中的参保用户。
其中,预设的效率阈值可以由实施者根据实际情况进行设定。
在一具体实施方式中,预设的扩量效率计算公式为η=(QN+1-QN)/(2θ),其中,QN+1是指第N+1类关键用户的数量,QN是指第N类关键用户的数量,θ是指目标对象的中间用户数量。
上述,根据第N类关键用户的数量、第N+1类关键用户的数量和中间用户数量,计算得到第N+1类关键用户对应的扩量效率,在扩量效率小于预设的效率阈值时停止关键用户的扩量,提高了目标用户的筛选效率,节省了筛选成本。
上述,根据wifi交互集合,从所有的第一候选用户中筛选得到目标对象对应的第一类关键用户,根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第一类目标IP,根据所有的第一类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第二类关键用户,作为进一步更新目标IP以及进一步更新关键用户的基础,提高了关键用户和目标IP的筛选准确性;根据所有的第N类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第N类目标IP,根据所有的第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第N+1类关键用户,作为进一步更新目标IP以及进一步更新关键用户的基础,进一步提高了关键用户和目标IP的筛选准确性,同时又一次完成了对目标IP和关键用户的扩量;当第N+1类关键用户的数量等于第N类关键用户的数量时,将第N+1类关键用户确定为目标用户,在关键用户的数量达到上限时获取到对应的目标用户,提高了目标用户的筛选准确性。
实施例二
在上述实施例一的基础上,本实施例二提供了一种目标wifi筛选方法,所述目标wifi筛选方法包括如下步骤,如图2所示:
S10,获取到目标对象对应的目标信息列表,其中,目标信息包括目标名称信息、目标邮箱地址信息、目标网址信息、目标地址信息。
其中,目标对象可以是指需要进行员工筛选的公司、企业、工作室、工厂等具有一定数量员工的对象,目标名称信息可以是指目标对象的中文名称、英文名称等形式的名称;目标邮箱地址信息可以是指目标对象的专用邮箱的地址信息;目标网址信息可以是指目标对象的专用网站的网址信息;目标地址信息可以是指目标对象所处地理位置的位置信息。目标名称信息、目标邮箱地址信息、目标网址信息、目标地址信息与目标对象唯一对应,可以作为目标对象的身份标识,从而可以通过分析目标名称信息、目标邮箱地址信息、目标网址信息、目标地址信息和wifi之间的关联关系,来表征目标对象和wifi之间的关联关系,进而完成目标对象对应的目标wifi的筛选任务。
上述,将目标名称信息、目标邮箱地址信息、目标网址信息、目标地址信息作为目标对象的身份标识,将分析目标对象与wifi之间的关联关系的任务,转换成分析目标名称信息、目标邮箱地址信息、目标网址信息、目标地址信息和wifi之间的关联关系的任务,提高了目标wifi的筛选准确性。
在一具体实施方式中,目标信息列表通过如下步骤获取:
获取到目标对象对应的预设信息列表,其中,预设信息列表包括预设名称信息、预设邮箱地址信息、预设网址信息和预设地址信息;
对预设信息列表进行数据清洗,获取到目标对象对应的目标信息列表。
其中,预设名称信息、预设邮箱地址信息、预设网址信息和预设地址信息的表示形式多样,为了提高目标wifi的筛选准确性,本实施例对预设信息列表进行数据清洗,从而便于与对应的wifi进行相似性分析,提高目标对象和wifi之间的关联关系的表征准确性。
在一具体实施方式中,在对预设信息列表进行数据清洗,获取到目标对象对应的目标信息列表的步骤中还包括如下步骤:
获取到预设的第一名称关键词列表、预设的邮箱关键词列表、预设的网址关键词列表和预设字符,其中,预设的名称关键词列表中包括若干个预设的第一名称关键词,预设的邮箱关键词列表中包括若干个预设的邮箱关键词,预设的网址关键词列表中包括若干个预设的网址关键词;
从预设名称信息中剔除出现的所有第一名称关键词,获取到中间名称信息;
根据预设的字符转换形式对中间名称信息进行字符转换,获取到目标名称信息;
从预设邮箱地址信息中剔除出现的所有邮箱关键词,获取到中间邮箱地址信息;
将中间邮箱地址信息中对应的预设字符替换成空字符,获取到目标邮箱地址信息。
从预设网址信息中剔除出现的所有网址关键词,获取到中间网址信息;
将中间网址信息中对应的预设字符替换成空字符,获取到目标网址信息。
其中,第一名称关键词可以是指“有限公司”、“有限责任公司”、“股份有限公司”、“事务所”、“工作室”、“店”、“中心”、“厂”、“处”等预先设置的与公司名称相关的关键词;邮箱关键词可以是指“qq”、“163”、“126”、“gmail”、“vip”等预先设置的与邮箱名称相关的关键词;网址关键词可以是指“http”、“https”、“com”、“cn”等预先设置的与网络地址相关的关键词;预设字符可以是指“_”、“-”、“/”、“//”等预先设置的字符。
其中,第一名称关键词、邮箱关键词、网址关键词和预设字符均可以由实施者根据实际情况进行设定。
上述,通过对预设名称信息、预设邮箱地址信息和预设网址信息中的关键词进行剔除,以及对预设字符进行替换,提高了名称信息、邮箱地址信息和网址信息的规范性,在与wifi信息进行相似性计算时可以减少对应关键词和对应预设字符的干扰,从而提高目标对象和wifi之间的关联关系的表征准确性。
在一具体实施方式中,目标地址信息和预设地址信息可以是一致的。
S20,根据目标名称信息和目标地址信息,获取到目标对象对应的geohash字符串。
其中,当wifi与目标对象的距离较近时,可以将对应wifi看作是与目标对象可能存在关联关系的候选wifi,因此,为了获取到与目标对象可能存在关联关系的所有候选wifi并筛选得到对应的目标wifi,本实施例结合目标名称信息和目标地址信息,获取到目标对象对应的geohash字符串,来表征目标对象的位置信息,作为获取候选wifi的基础。
在一具体实施方式中,S20还包括如下步骤:
根据目标名称信息,获取到目标对象对应的中间用户数量;
根据预设的关键词提取算法获取到目标名称信息中的目标名称关键词;
当目标名称关键词与预设的第二名称关键词一致,或者中间用户数量小于或者等于预设的第一数量阈值时,确定目标对象对应的geohash级别为7级;
当目标名称关键词与预设的第三名称关键词一致,或者中间用户数量大于或者等于预设的第二数量阈值时,确定目标对象对应的geohash级别为5级;
当目标名称关键词与预设的第二名称关键词不一致、目标名称关键词与预设的第三名称关键词不一致、中间用户数量大于预设的第一数量阈值且中间用户数量小于预设的第二数量阈值时,确定目标对象对应的geohash级别为6级;
根据geohash的级别和目标地址信息,获取到目标对象对应的geohash字符串。
其中,geohash是一种地址编码方法,可以对整个地理区域进行区域分割,并将二维的空间经纬度数据编码成一个字符串,且geohash字符串的长度越大,对应分割出的每个区域的范围越小,对应的区域分割精度越高。
因此,为了提高geohash字符串的准确性,本实施例根据目标名称信息和目标地址信息来衡量该目标对象对应的geohash的级别,从而提高获取候选wifi的准确性。
具体地,目标名称关键词可以是指“公司”、“店”、“中心”、“厂”、“处”等目标名称信息中可以在一定程度上表征目标对象的规模大小的关键词,对应地,第二名称关键词可以是指“店”等表征对应的目标对象规模较小的关键词,第三名称关键词可以是指“厂”等表征对应的目标对象规模较大的关键词,同时,目标对象对应的中间用户数量可以在一定程度上表征目标对象的规模大小,因此,结合目标对象对应的中间用户数量,以及基于关键词提取算法从目标名称信息中提取到的目标名称关键词,确定出目标对象对应的geohash的级别。
其中,目标名称关键词、第二名称关键词和第三名称关键词均可以由实施者根据实际情况进行设定。
其中,本领域技术人员知晓现有技术中任一关键词提取算法落入到本发明的保护范围内,在此不再赘述。
上述,获取到目标对象对应的中间用户数量以及目标名称关键词,来表征目标对象的规模大小,从而确定出目标对象对应的geohash的级别数以及geohash字符串的长度,使得geohash字符串的精度与目标对象的规模相匹配,提高了根据geohash的级别和目标地址信息获取到的geohash字符串的准确性。
S30,将在geohash字符串对应的地理区域范围内的wifi确定为候选wifi。
其中,不同wifi信息可以覆盖的范围大小不同,为了降低wifi覆盖范围不同对wifi筛选结果产生的不利影响,本实施例将geohash字符串对应的地理区域范围内的所有wifi均确定为候选wifi,以尽量将目标对象对应的所有目标wifi均涵盖在候选wifi范围内,从而在进一步从候选wifi中筛选出目标wifi时,可以提高目标wifi的获取准确性。
S40,根据目标信息列表和所有的候选wifi的名称,获取到目标对象与每一候选wifi之间的相似度列表集,其中,相似度列表集包括目标名称信息与对应候选wifi的名称之间的第一相似度列表、目标邮箱地址信息与对应候选wifi的名称之间的第二相似度列表,以及目标网址信息与对应候选wifi的名称之间的第三相似度列表。
上述,分别获取到目标名称信息与每一候选wifi的名称之间的第一相似度、目标邮箱地址信息与每一候选wifi的名称之间的第二相似度,以及目标网址信息与每一候选wifi的名称之间的第三相似度,从目标对象在三个方面与每一候选wifi之间的相似度,来综合表征目标对象与每一候选wifi之间的关联关系,提高了目标对象和候选wifi之间的关联关系的表征准确性。
在一具体实施方式中,S40还包括如下步骤:
根据目标名称信息和每一候选wifi的名称,获取到目标名称信息和每一候选wifi的名称之间的第一编辑距离和第一公共字符串长度;
根据第一编辑距离,获取到目标名称信息和对应的候选wifi的名称之间的第一编辑距离相似度;
根据第一公共字符串长度、对应的候选wifi的名称对应的字符串长度和目标名称信息对应的字符串长度,获取到目标名称信息和对应的候选wifi的名称之间的第一公共字符串相似度;
根据第一编辑距离相似度和第一公共字符串相似度,获取到目标名称信息和对应的候选wifi之间的第一相似度列表。
其中,编辑距离是指从一个字符串变化到另一个字符串时需要经过的步骤数量,可以表征两个字符串之间的相似程度;公共字符串长度是指两个字符串之间的公共字符串的长度,也可以表征两个字符串之间的相似程度。
因此,本实施例将目标名称信息转换为对应的目标名称字符,获取到目标名称字符和每一候选wifi的名称之间的编辑距离和公共字符串长度,并确定为对应的目标名称信息和每一候选wifi的名称之间的第一编辑距离和第一公共字符串长度。
在一具体实施方式中,第一编辑距离相似度Similarity_lev符合如下条件:
Similarity_lev=1/(EditDistance+1),其中,EditDistance是指对应的第一编辑距离。
在一具体实施方式中,第一公共字符串相似度Similarity_common符合如下条件:
Similarity_common=(LengthO)/(max(Length1,Length2))。
其中,Length1是指对应的目标名称信息对应的字符串长度,Length2是指对应的候选wifi的名称对应的字符串长度,LengthO是指对应的第一公共字符串的长度,max()是指取最大值函数。
在一具体实施方式中,第一相似度Similarity1符合如下条件:
Similarity1=ψ1 Similarity_lev+ψ2/>Similarity_common,其中,ψ1是指编辑距离相似度对应的权重,ψ2是指公共字符串相似度对应的权重。
上述,结合编辑距离和公共字符串长度来表征目标名称信息和对应的候选wifi之间的第一相似度,提高了第一相似度的准确性。
在一具体实施方式中,S40还包括如下步骤:
根据目标邮箱地址信息和每一候选wifi的名称,获取到目标邮箱地址信息和每一候选wifi的名称之间的第二编辑距离和第二公共字符串长度;
根据第二编辑距离,获取到目标邮箱地址信息和对应的候选wifi的名称之间的第二编辑距离相似度;
根据第二公共字符串长度、对应的候选wifi的名称对应的字符串长度和目标邮箱地址信息对应的字符串长度,获取到目标邮箱地址信息和对应的候选wifi的名称之间的第二公共字符串相似度;
根据第二编辑距离相似度和第二公共字符串相似度,获取到目标邮箱地址信息和对应的候选wifi之间的第二相似度列表。
在一具体实施方式中,S40还包括如下步骤:
根据目标网址信息和每一候选wifi的名称,获取到目标网址信息和每一候选wifi的名称之间的第三编辑距离和第三公共字符串长度;
根据第三编辑距离,获取到目标网址信息和对应的候选wifi的名称之间的第三编辑距离相似度;
根据第三公共字符串长度、对应的候选wifi的名称对应的字符串长度和目标网址信息对应的字符串长度,获取到目标网址信息和对应的候选wifi的名称之间的第三公共字符串相似度;
根据第三编辑距离相似度和第三公共字符串相似度,获取到目标网址信息和对应的候选wifi之间的第三相似度列表。
S50,根据相似度列表集和预设的优先级列表,获取到目标对象与每一候选wifi之间的目标相似度。
其中,预设的优先级列表中包括第一相似度对应的第一优先级、第二相似度对应的第二优先级和第三相似度对应的第三优先级,则可根据相似度列表集和预设的优先级列表,获取到目标对象与每一候选wifi之间的目标相似度,来表征目标对象与每一候选wifi之间的关联程度。
其中,第一优先级、第二优先级和第三优先级的具体数值可以由实施者根据实际情况进行设定。
上述,考虑到目标名称信息对应的第一相似度、目标邮箱地址信息对应的第二相似度,以及目标网址信息与对应的第三相似度在衡量目标对象与对应候选wifi之间的关联程度时的重要程度,将预设的优先级作为对应相似度的权重,获取到目标对象与每一候选wifi之间的目标相似度,提高了目标相似度的准确性。
S60,将对应的目标相似度大于预设的相似度阈值的候选wifi,确定为目标wifi。
其中,目标相似度越大,表征目标对象与对应候选wifi之间的关联程度越高,因此,将对应的目标相似度大于预设的相似度阈值的候选wifi,确定为目标wifi。
其中,预设的相似度阈值的具体数值可以由实施者根据实际情况进行设定。
上述,根据目标名称信息和目标地址信息,获取到目标对象对应的中间用户数量以及目标名称关键词来表征目标对象的规模大小,从而确定出目标对象对应的geohash的级别数以及geohash字符串的长度,使得geohash字符串的精度与目标对象的规模相匹配,提高了根据geohash的级别和目标地址信息获取到的geohash字符串的准确性;将在geohash字符串对应的地理区域范围内的wifi确定为候选wifi,根据目标信息列表和所有的候选wifi的名称,分别获取到目标名称信息与每一候选wifi的名称之间的第一相似度、目标邮箱地址信息与每一候选wifi的名称之间的第二相似度,以及目标网址信息与每一候选wifi的名称之间的第三相似度,从目标对象在三个维度与每一候选wifi之间的相似度,来综合表征目标对象与每一候选wifi之间的关联关系,提高了目标对象和候选wifi之间的关联关系的表征准确性;并根据相似度列表和预设的优先级列表,获取到目标对象与每一候选wifi之间的目标相似度,将对应的目标相似度大于预设的相似度阈值的候选wifi,确定为目标wifi,从而提高了目标wifi的筛选准确性。
实施例三
在上述实施例一和实施例二的基础上,本实施例三提供了一种目标对象筛选方法,所述目标对象筛选方法包括如下步骤,如图3所示:
S100,获取目标用户对应的wifi连接信息列表A={A1,A2,……,Ai,……,Am},其中,Ai={Ai1,Ai2,……,Aij,……,Ain(i)},Aij={Aij 1,Aij 2,Aij 3},Aij 1是指第i个目标用户连接的第j个预设wifi,Aij 2={Aij 21,Aij 22,……,Aij 2h,……,Aij 2r(ij)},Aij 2h是指第i个目标用户在第h次与Aij 1连接时对应的连接时间点,Aij 3={Aij 31,Aij 32,……,Aij 3h,……,Aij 3r(ij)},Aij 3h是指第i个目标用户在第h次与Aij 1连接时对应的连接时长,i=1,2,……,m,m是指目标用户的数量,j=1,2,……,n(i),n(i)是指第i个目标用户连接的wifi的数量,h=1,2,……,r(ij),r(ij)是指第i个目标用户连接第j个wifi的次数。
其中,目标用户可以是指初始的目标对象的员工,初始的目标对象可以是指需要进行对象筛选的公司、企业、工作室、工厂等具有一定数量员工的目标对象,,预设wifi是指目标用户在一段时间内连接过的wifi,预设对象是指与目标对象具有一定关联关系的对象,例如,当初始的目标对象是公司时,预设对象可以是指目标对象的子公司,也可以是指与目标对象具有频繁业务往来的其他公司,该目标对象筛选方法可以筛选出该目标对象对应的子公司和具有业务往来的其他公司。
目标用户与预设wifi之间的连接时间点和连接时长可以用来表征目标用户与预设wifi之间的关联关系,目标用户与预设wifi之间的关联关系可以是日常生活上的关系,也可以是工作上的关联关系,因此,可以根据目标用户与预设wifi之间的关联关系对预设wifi进行筛选,以筛选出与目标用户具有工作关联关系的wifi,从而可以进一步根据筛选出来的wifi来对各个预设对象进行分类,完成目标对象的筛选任务。
上述,目标用户对应的wifi连接信息列表为筛选目标对象提供了数据基础。
S200,根据A、预设的第一工作时间范围[b1,c1]和预设的第二工作时间范围[b2,c2],获取到A对应的目标连接次数列表B={B1,B2,……,Bi,……,Bm},其中,Bi={Bi1,Bi2,……,Bij,……,Bin(i)},Aij 1对应的目标连接次数Bij通过如下步骤获取:
S210,当Aij 2h在[b1,c1]内或者在[b2,c2]内时,将第i个目标用户与Aij 1的第h次连接确定为Aij 1对应的目标连接行为。
S220,遍历Aij 2,获取到B(ij)=S(ij),其中,S(ij)是指将Aij 1对应的目标连接行为的总数量。
其中,通过判断目标用户与预设wifi的连接时间点是否在预设的第一工作时间范围[b1,c1]或者预设的第二工作时间范围[b2,c2]内,可以判断目标用户与预设wifi的对应连接行为是否为与工作相关的目标连接行为,从而对目标用户的wifi连接行为进行筛选,剔除与工作无关的wifi连接行为,筛选出目标连接行为并获取到目标连接行为的总数量,作为表征预设wifi与目标员工之间的工作关联关系的基础,从而找出业务关联wifi来完成目标对象的筛选,进而提高了目标对象的筛选准确性。
其中,预设的第一工作时间范围[b1,c1]和预设的第二工作时间范围[b2,c2]可以由实施者根据实际情况进行设定。例如,连接时间点可以是以24小时为周期的时间点,b1可以是指8:00,c1可以是指12:00,b2可以是指14:00,c2可以是指18:00。
上述,通过对目标用户与预设wifi的连接时间点、[b1,c1]和[b2,c2],从目标用户与预设wifi的所有连接行为中筛选出与工作相关的目标连接行为,并获取到目标连接行为的总数量,剔除了与工作无关的wifi连接行为对筛选目标对象的不利影响,从而提高了目标对象的筛选准确性。
S300,根据A和所有的目标连接行为,获取到A对应的目标连接时长列表C={C1,C2,……,Ci,……,Cm},其中,Ci={Ci1,Ci2,……,Cij,……,Cin(i)},Aij 1对应的目标连接时长Cij等于Aij 1对应的S(ij)个目标连接行为对应的S(ij)个连接时长的总和。
上述,根据每个目标用户与每个预设wifi之间的目标连接行为以及每个目标连接行为对应的连接时长,可以统计得到每个目标用户与每个预设wifi之间的目标连接时长,用来表征每个目标用户与每个预设wifi之间的工作关联程度,剔除了与工作无关的wifi连接行为的连接时长对筛选目标对象的不利影响,从而提高了目标对象的筛选准确性。
S400,根据B和C,获取到业务关联wifi列表D={D1,D2,……,Di,……,Dm},其中,Di={Di 1,Di 2,……,Di v,……,Di t(i)},Di v是指第i个目标用户对应的第v个业务关联wifi,v=1,2……,t(i),t(i)是指第i个目标用户对应的业务关联wifi的总数量。
其中,业务关联wifi是指与目标用户以及目标对象具有业务关联的wifi,作为确定业务关联公司的基础。
在一具体实施方式中,Di通过如下步骤获取:
S410,根据Bij和Cij,获取到第i个目标用户连接的第j个预设wifi对应的业务关联程度Eij1 Bij2/>Cij,其中,α1是指第一预设优先级,α2是指第二预设优先级;
S420,若Eij>E0,则将Aij 1确定为第i个目标用户对应的业务关联wifi,其中,E0是指预设的业务关联程度阈值;
S430,遍历Bi和Ci,获取到Di={Di 1,Di 2,……,Di v,……,Di t(i)}。
其中,目标用户与预设wifi之间的目标连接次数越多、目标用户与预设wifi之间的目标连接时长越长,对应的预设wifi与目标用户以及目标对象之间的业务关联程度越高。因此,根据Bij和Cij,结合预设的α1和α2,获取到业务关联程度Eij,并在Eij>E0时,将Aij 1确定为第i个目标用户对应的业务关联wifi,据此完成所有的业务关联wifi的筛选,作为进一步筛选业务关联wifi的基础。
其中,预设的业务关联程度阈值E0的具体数值可由实施者根据实际情况进行设定。
上述,结合目标用户与预设wifi之间的目标连接次数和目标连接时长,来表征预设wifi与目标用户以及目标对象之间的业务关联程度,并根据业务关联程度与业务关联程度阈值之间的大小比较,从所有的预设wifi中筛选出与目标用户以及目标对象具有业务关联的wifi,提高了业务关联wifi的筛选准确性,进而提高了目标对象的筛选准确性。
S500,根据D,将每一业务关联wifi对应的预设对象分类为第一目标对象或者第二目标对象。
其中,第一目标对象是指目标对象的子公司,第二目标对象是指除了子公司之外,与目标对象具有频繁业务往来的公司。
在一具体实施方式中,S500还包括如下步骤:
S510,根据D,获取到每一业务关联wifi对应的目标用户的数量;
S520,根据每一业务关联wifi对应的目标用户的数量,将每一业务关联wifi分类为第一业务关联wifi或者第二业务关联wifi;
S530,将第一业务关联wifi对应的预设对象确定为第一目标对象;
S540,将第二业务关联wifi对应的预设对象确定为第二目标对象。
在一具体实施方式中,S520还包括如下步骤:
S521,当业务关联wifi对应的目标用户的数量大于第一目标用户数量阈值时,将对应的业务关联wifi分类为第一业务关联wifi;
S522,当业务关联wifi对应的目标用户的数量小于或者等于第一目标用户数量阈值且大于第二目标用户数量阈值时,将对应的业务关联wifi分类为第二业务关联wifi。
其中,第二目标用户数量阈值小于第一目标用户数量阈值。
上述,通过对目标用户与预设wifi的连接时间点、[b1,c1]和[b2,c2],从目标用户与预设wifi的所有连接行为中筛选出与工作相关的目标连接行为,并获取到目标连接行为的总数量,剔除了与工作无关的wifi连接行为对筛选目标对象的不利影响;根据目标连接行为以及每个目标连接行为对应的连接时长,统计得到每个目标用户与每个预设wifi之间的目标连接时长,来表征每个目标用户与每个预设wifi之间的工作关联程度,剔除了与工作无关的wifi连接行为的连接时长对筛选目标对象的不利影响;结合目标用户与预设wifi之间的目标连接次数和目标连接时长,来表征预设wifi与目标用户以及目标对象之间的业务关联程度,并根据业务关联程度与业务关联程度阈值之间的大小比较,从所有的预设wifi中筛选出与目标用户以及目标对象具有业务关联的wifi,提高了业务关联wifi的筛选准确性;并将每一业务关联wifi对应的预设对象分类为第一目标对象或者第二目标对象,从而提高了目标对象的筛选准确性。
实施例四
本实施例四提供了一种目标用户筛选装置,所述目标用户筛选装置包括,如图4所示:
第一数据获取模块41,用于获取到目标对象对应的第一候选用户,以及每一第一候选用户对应的wifi交互集合。
第一关键用户筛选模块42,用于根据wifi交互集合,从所有的第一候选用户中筛选得到目标对象对应的第一类关键用户。
第二数据获取模块43,用于获取到每一第一类关键用户对应的IP列表和每一候选IP对应的用户列表,其中,IP列表中包括每一第一类关键用户对应的若干个候选IP,用户列表中包括每一候选IP对应的若干个第二候选用户。
第一目标IP筛选模块44,用于根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第一类目标IP。
第二关键用户筛选模块45,用于根据所有的第一类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第二类关键用户,其中,第二类关键用户的数量大于或者等于第一类关键用户的数量。
第二目标IP筛选模块46,用于根据所有的第N类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第N类目标IP,其中,第N类目标IP的数量大于或者等于第N-1类目标IP的数量,N为大于1的整数,N=2时,第N类关键用户与第二类关键用户一致。
第三关键用户筛选模块47,用于根据所有的第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第N+1类关键用户,其中,第N+1类关键用户的数量大于或者等于第N类关键用户的数量。
第一目标用户筛选模块48,用于当第N+1类关键用户的数量等于第N类关键用户的数量时,将第N+1类关键用户确定为目标用户。
在一具体实施方式中,wifi交互集合包括wifi扫描子集合和wifi连接子集合,wifi扫描子集合中包括对应第一候选用户扫描到的若干个目标wifi,以及与扫描到的每一目标wifi之间的扫描次数,wifi连接子集合中包括对应第一候选用户连接的若干个目标wifi,以及与连接的每一目标wifi之间的连接次数,第一关键用户筛选模块42包括如下子模块:
第一数量获取子模块,用于根据每一第一候选用户对应的wifi扫描子集合,获取到每一第一候选用户扫描的目标wifi的第一数量。
第二数量获取子模块,用于根据每一第一候选用户对应的wifi连接子集合,获取到每一第一候选用户连接的目标wifi的第二数量。
选取概率获取子模块,用于根据每一第一候选用户对应的第一数量在目标wifi的总数量中的第一占比、第二数量在目标wifi的总数量中的第二占比、对应的扫描次数的总和、对应的连接次数的总和,以及第一占比对应的第一权重、第二占比对应的第二权重、扫描次数对应的第三权重和连接次数对应的第四权重,获取到每一第一候选用户对应的选取概率。
第一关键用户筛选子模块,用于当选取概率大于预设的选取概率阈值时,将选取概率对应的第一候选用户确定为第一类关键用户。
在一具体实施方式中,第一目标IP筛选模块44包括如下子模块:
第三数量获取子模块,用于根据所有的第一类关键用户对应的IP列表,获取到每一候选IP对应的第一类关键用户的第三数量。
第三占比获取子模块,用于获取到第三数量在第一类关键用户的总数量中的第三占比。
第一目标IP筛选子模块,用于当第三占比大于预设的第一数量占比阈值时,将第三占比对应的候选IP确定为第一类目标IP。
在一具体实施方式中,第二关键用户筛选模块45包括如下子模块:
第四数量获取子模块,用于根据所有的第一类目标IP对应的用户列表,获取到除第一类关键用户之外的每一第二候选用户对应的第一类目标IP的第四数量。
第四占比获取子模块,用于获取到第四数量在第一类目标IP的总数量中的第四占比。
第一类中间候选用户筛选子模块,用于当第四占比大于预设的第二数量占比阈值时,将第四占比对应的第二候选用户确定为第一类中间候选用户。
第二关键用户筛选子模块,用于将第一类关键用户和第一类中间候选用户确定为第二类关键用户。
在一具体实施方式中,所述目标用户筛选装置还包括:
中间用户数量获取模块,用于获取到目标对象的中间用户数量。
扩量效率获取模块,用于根据第N类关键用户的数量、第N+1类关键用户的数量和中间用户数量,获取到第N+1类关键用户对应的扩量效率。
第二目标用户筛选模块,用于目标用户当第N+1类关键用户的数量大于第N类关键用户的数量,且扩量效率小于预设的效率阈值时,将第N+1类关键用户确定为目标用户。
需要说明的是,上述模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
实施例五
本发明实施例五提供一种非瞬时性计算机可读存储介质,该非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现步骤:
S1,获取到目标对象对应的第一候选用户,以及每一第一候选用户对应的wifi交互集合。
S2,根据wifi交互集合,从所有的第一候选用户中筛选得到目标对象对应的第一类关键用户。
S3,获取到每一第一类关键用户对应的IP列表和每一候选IP对应的用户列表,其中,IP列表中包括每一第一类关键用户对应的若干个候选IP,用户列表中包括每一候选IP对应的若干个第二候选用户。
S4,根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第一类目标IP。
S5,根据所有的第一类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第二类关键用户,其中,第二类关键用户的数量大于或者等于第一类关键用户的数量。
S6,根据所有的第N类关键用户对应的IP列表,从所有的候选IP中筛选得到目标对象对应的第N类目标IP,其中,第N类目标IP的数量大于或者等于第N-1类目标IP的数量,N为大于1的整数,N=2时,第N类关键用户与第二类关键用户一致。
S7,根据所有的第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到目标对象对应的第N+1类关键用户,其中,第N+1类关键用户的数量大于或者等于第N类关键用户的数量。
S8,当第N+1类关键用户的数量等于第N类关键用户的数量时,将第N+1类关键用户确定为目标用户。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器,存储,数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM),可编程ROM(PROM),电可编程ROM(EPROM),电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM),动态RAM(DRAM),同步DRAM(SDRAM),双数据率SDRAM(DDRSDRAM),增强型SDRAM(ESDRAM),同步链路(Synchlink)DRAM(SLDRAM),存储器总线(Rambus)直接RAM(RDRAM),直接存储器总线动态RAM(DRDRAM),以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元,模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元,模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
实施例六
本发明实施例六提供一种电子设备,该电子设备包括处理器和本发明实施例五中的非瞬时性计算机可读存储介质。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改,等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (10)

1.一种目标用户筛选方法,其特征在于,所述目标用户筛选方法包括如下步骤:
获取到目标对象对应的第一候选用户,以及每一第一候选用户对应的wifi交互集合;
根据所述wifi交互集合,从所有的第一候选用户中筛选得到所述目标对象对应的第一类关键用户;
获取到每一第一类关键用户对应的IP列表和每一候选IP对应的用户列表,其中,所述IP列表中包括所述每一第一类关键用户对应的若干个候选IP,所述用户列表中包括所述每一候选IP对应的若干个第二候选用户;
根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到所述目标对象对应的第一类目标IP;
根据所有的第一类目标IP对应的用户列表,从所有的第二候选用户中筛选得到所述目标对象对应的第二类关键用户,其中,所述第二类关键用户的数量大于或者等于所述第一类关键用户的数量;
根据所有的第N类关键用户对应的IP列表,从所有的候选IP中筛选得到所述目标对象对应的第N类目标IP,其中,所述第N类目标IP的数量大于或者等于第N-1类目标IP的数量,N为大于1的整数,N=2时,所述第N类关键用户与所述第二类关键用户一致;
根据所有的第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到所述目标对象对应的第N+1类关键用户,其中,所述第N+1类关键用户的数量大于或者等于第N类关键用户的数量;
当所述第N+1类关键用户的数量等于所述第N类关键用户的数量时,将所述第N+1类关键用户确定为目标用户。
2.根据权利要求1所述的目标用户筛选方法,其特征在于,所述wifi交互集合中包括若干个目标wifi,所述目标wifi通过如下步骤获取:
获取到所述目标对象对应的目标信息列表,其中,所述目标信息包括目标名称信息、目标邮箱地址信息、目标网址信息、目标地址信息;
根据所述目标名称信息和所述目标地址信息,获取到所述目标对象对应的geohash字符串;
将在所述geohash字符串对应的地理区域范围内的wifi确定为候选wifi;
根据所述目标信息列表和所有的候选wifi的名称,获取到所述目标对象与每一候选wifi之间的相似度列表集,其中,所述相似度列表集包括所述目标名称信息与对应候选wifi的名称之间的第一相似度列表、所述目标邮箱地址信息与对应候选wifi的名称之间的第二相似度列表,以及所述目标网址信息与对应候选wifi的名称之间的第三相似度列表;
根据所述相似度列表集和预设的优先级列表,获取到所述目标对象与每一候选wifi之间的目标相似度;
将对应的目标相似度大于预设的相似度阈值的候选wifi,确定为目标wifi。
3.根据权利要求2所述的目标用户筛选方法,其特征在于,所述目标信息列表通过如下步骤获取:
获取到目标对象对应的预设信息列表,其中,所述预设信息列表包括预设名称信息、预设邮箱地址信息、预设网址信息和预设地址信息;
对所述预设信息列表进行数据清洗,获取到所述目标对象对应的目标信息列表。
4.根据权利要求1所述的目标用户筛选方法,其特征在于,所述wifi交互集合包括wifi扫描子集合和wifi连接子集合,所述wifi扫描子集合中包括对应第一候选用户扫描到的若干个目标wifi,以及与扫描到的每一目标wifi之间的扫描次数,所述wifi连接子集合中包括对应第一候选用户连接的若干个目标wifi,以及与连接的每一目标wifi之间的连接次数;
在根据所述wifi交互集合,从所有的第一候选用户中筛选得到所述目标对象对应的第一类关键用户的步骤中还包括如下步骤:
根据每一第一候选用户对应的所述wifi扫描子集合,获取到每一第一候选用户扫描的目标wifi的第一数量;
根据每一第一候选用户对应的所述wifi连接子集合,获取到每一第一候选用户连接的目标wifi的第二数量;
根据每一第一候选用户对应的所述第一数量在目标wifi的总数量中的第一占比、所述第二数量在所述目标wifi的总数量中的第二占比、对应的扫描次数的总和、对应的连接次数的总和,以及第一占比对应的第一权重、第二占比对应的第二权重、扫描次数对应的第三权重和连接次数对应的第四权重,获取到每一第一候选用户对应的选取概率;
当所述选取概率大于预设的选取概率阈值时,将所述选取概率对应的第一候选用户确定为第一类关键用户。
5.根据权利要求1所述的目标用户筛选方法,其特征在于,在根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到所述目标对象对应的第一类目标IP的步骤中还包括如下步骤:
根据所有的第一类关键用户对应的IP列表,获取到每一候选IP对应的第一类关键用户的第三数量;
获取到所述第三数量在第一类关键用户的总数量中的第三占比;
当所述第三占比大于预设的第一数量占比阈值时,将所述第三占比对应的候选IP确定为第一类目标IP。
6.根据权利要求1所述的目标用户筛选方法,其特征在于,在根据所有的第一类目标IP和所有的用户列表,从所有的第二候选用户中筛选得到所述目标对象对应的第二类关键用户的步骤中还包括如下步骤:
根据所有的第一类目标IP对应的用户列表,获取到除所述第一类关键用户之外的每一第二候选用户对应的第一类目标IP的第四数量;
获取到所述第四数量在第一类目标IP的总数量中的第四占比;
当所述第四占比大于预设的第二数量占比阈值时,将所述第四占比对应的第二候选用户确定为第一类中间候选用户;
将所述第一类关键用户和所述第一类中间候选用户确定为第二类关键用户。
7.根据权利要求1所述的目标用户筛选方法,其特征在于,所述目标用户筛选方法还包括如下步骤:
获取到所述目标对象的中间用户数量;
根据所述第N类关键用户的数量、所述第N+1类关键用户的数量和所述中间用户数量,获取到所述第N+1类关键用户对应的扩量效率;
当所述第N+1类关键用户的数量大于所述第N类关键用户的数量,且所述扩量效率小于预设的效率阈值时,将所述第N+1类关键用户确定为目标用户。
8.一种目标用户筛选装置,其特征在于,所述目标用户筛选装置包括:
第一数据获取模块,用于获取到目标对象对应的第一候选用户,以及每一第一候选用户对应的wifi交互集合;
第一关键用户筛选模块,用于根据所述wifi交互集合,从所有的第一候选用户中筛选得到所述目标对象对应的第一类关键用户;
第二数据获取模块,用于获取到每一第一类关键用户对应的IP列表和每一候选IP对应的用户列表,其中,所述IP列表中包括所述每一第一类关键用户对应的若干个候选IP,所述用户列表中包括所述每一候选IP对应的若干个第二候选用户;
第一目标IP筛选模块,用于根据所有的第一类关键用户对应的IP列表,从所有的候选IP中筛选得到所述目标对象对应的第一类目标IP;
第二关键用户筛选模块,用于根据所有的第一类目标IP对应的用户列表,从所有的第二候选用户中筛选得到所述目标对象对应的第二类关键用户,其中,所述第二类关键用户的数量大于或者等于所述第一类关键用户的数量;
第二目标IP筛选模块,用于根据所有的第N类关键用户对应的IP列表,从所有的候选IP中筛选得到所述目标对象对应的第N类目标IP,其中,所述第N类目标IP的数量大于或者等于第N-1类目标IP的数量,N为大于1的整数,N=2时,所述第N类关键用户与所述第二类关键用户一致;
第三关键用户筛选模块,用于根据所有的第N类目标IP对应的用户列表,从所有的第二候选用户中筛选得到所述目标对象对应的第N+1类关键用户,其中,所述第N+1类关键用户的数量大于或者等于第N类关键用户的数量;
第一目标用户筛选模块,用于当所述第N+1类关键用户的数量等于所述第N类关键用户的数量时,将所述第N+1类关键用户确定为目标用户。
9.一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-7中任意一项所述的目标用户筛选方法。
10.一种电子设备,其特征在于,包括处理器和权利要求9中所述的非瞬时性计算机可读存储介质。
CN202410057424.5A 2024-01-16 2024-01-16 一种目标用户筛选方法、装置、介质及设备 Active CN117573951B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410057424.5A CN117573951B (zh) 2024-01-16 2024-01-16 一种目标用户筛选方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410057424.5A CN117573951B (zh) 2024-01-16 2024-01-16 一种目标用户筛选方法、装置、介质及设备

Publications (2)

Publication Number Publication Date
CN117573951A true CN117573951A (zh) 2024-02-20
CN117573951B CN117573951B (zh) 2024-04-12

Family

ID=89864718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410057424.5A Active CN117573951B (zh) 2024-01-16 2024-01-16 一种目标用户筛选方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN117573951B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110029364A1 (en) * 2009-07-29 2011-02-03 Cyriac Roeding Method and system for presentment and redemption of personalized discounts
CN105447044A (zh) * 2014-09-02 2016-03-30 阿里巴巴集团控股有限公司 一种确定用户关系的方法及装置
US20170323002A1 (en) * 2016-05-03 2017-11-09 Microsoft Technology Licensing, Llc Detecting social relationships from user activity logs
CN107896235A (zh) * 2016-09-29 2018-04-10 腾讯科技(深圳)有限公司 信息推送方法、装置、网络接入设备、终端及社交服务器
US20180278702A1 (en) * 2015-09-30 2018-09-27 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for recognizing user relationship, storage medium and server
CN110335070A (zh) * 2019-06-21 2019-10-15 北京淇瑀信息科技有限公司 一种基于wifi的用户群扩展的方法、装置和电子设备
US20190364422A1 (en) * 2017-02-13 2019-11-28 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for determining an affinity between users
CN110796488A (zh) * 2019-10-22 2020-02-14 北京奇艺世纪科技有限公司 用户扩展方法、装置、电子设备及计算机可读存储介质
CN111695047A (zh) * 2020-04-27 2020-09-22 汉海信息技术(上海)有限公司 用户聚类方法及装置,电子设备及存储介质
CN111814067A (zh) * 2020-06-30 2020-10-23 北京百度网讯科技有限公司 好友推荐方法、装置、设备及存储介质
CN112311612A (zh) * 2019-07-29 2021-02-02 腾讯科技(深圳)有限公司 一种家庭画像构建方法、装置及存储介质
CN113114770A (zh) * 2021-04-14 2021-07-13 每日互动股份有限公司 用户识别方法、电子设备和计算机可读存储介质
CN114722290A (zh) * 2022-04-15 2022-07-08 石河子大学 一种融合信任关系的排序学习poi推荐算法
CN115115322A (zh) * 2021-03-18 2022-09-27 腾讯科技(深圳)有限公司 目标群组识别方法、风险评估方法、装置、设备及介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110029364A1 (en) * 2009-07-29 2011-02-03 Cyriac Roeding Method and system for presentment and redemption of personalized discounts
CN105447044A (zh) * 2014-09-02 2016-03-30 阿里巴巴集团控股有限公司 一种确定用户关系的方法及装置
US20180278702A1 (en) * 2015-09-30 2018-09-27 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for recognizing user relationship, storage medium and server
US20170323002A1 (en) * 2016-05-03 2017-11-09 Microsoft Technology Licensing, Llc Detecting social relationships from user activity logs
CN107896235A (zh) * 2016-09-29 2018-04-10 腾讯科技(深圳)有限公司 信息推送方法、装置、网络接入设备、终端及社交服务器
US20190364422A1 (en) * 2017-02-13 2019-11-28 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for determining an affinity between users
CN110335070A (zh) * 2019-06-21 2019-10-15 北京淇瑀信息科技有限公司 一种基于wifi的用户群扩展的方法、装置和电子设备
CN112311612A (zh) * 2019-07-29 2021-02-02 腾讯科技(深圳)有限公司 一种家庭画像构建方法、装置及存储介质
CN110796488A (zh) * 2019-10-22 2020-02-14 北京奇艺世纪科技有限公司 用户扩展方法、装置、电子设备及计算机可读存储介质
CN111695047A (zh) * 2020-04-27 2020-09-22 汉海信息技术(上海)有限公司 用户聚类方法及装置,电子设备及存储介质
CN111814067A (zh) * 2020-06-30 2020-10-23 北京百度网讯科技有限公司 好友推荐方法、装置、设备及存储介质
CN115115322A (zh) * 2021-03-18 2022-09-27 腾讯科技(深圳)有限公司 目标群组识别方法、风险评估方法、装置、设备及介质
CN113114770A (zh) * 2021-04-14 2021-07-13 每日互动股份有限公司 用户识别方法、电子设备和计算机可读存储介质
CN114722290A (zh) * 2022-04-15 2022-07-08 石河子大学 一种融合信任关系的排序学习poi推荐算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田丰;马晓亮;: "利用数据分析关联用户信息的***及实现方法", 电信技术, no. 09, 25 September 2018 (2018-09-25), pages 24 - 28 *

Also Published As

Publication number Publication date
CN117573951B (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
CN109992601B (zh) 待办事项信息的推送方法、装置和计算机设备
CN109543925B (zh) 基于机器学习的风险预测方法、装置、计算机设备和存储介质
CN110569321B (zh) 基于城市地图的网格划分处理方法、装置和计算机设备
CN110751358A (zh) 一种机场地面服务人员的排班方法、电子设备及存储介质
CN112765235A (zh) 基于特征识别和大数据分析的人力资源智能管理***及云管理服务器
CN114511019A (zh) 一种敏感数据分类分级标识方法及***
CN111191123A (zh) 业务信息推送方法、装置、可读存储介质和计算机设备
CN110728301A (zh) 一种个人用户的信用评分方法、装置、终端及存储介质
CN111160797A (zh) 风控模型的构建方法、装置、存储介质及终端
CN110310127B (zh) 录音获取方法、装置、计算机设备及存储介质
Febrian et al. Decision support system employee performance appraisal method using topsis
CN117573951B (zh) 一种目标用户筛选方法、装置、介质及设备
CN112511384B (zh) 流量数据处理方法、装置、计算机设备和存储介质
CN112419124B (zh) 一种低效工业用地的快速识别方法、装置及其存储介质
CN113946363A (zh) 业务数据的执行配置方法、装置、计算机设备及存储介质
CN113660345A (zh) 一种快速定位方法、***、装置及计算机可读存储介质
CN117896771A (zh) 一种目标对象筛选方法、装置、介质及设备
CN117896717A (zh) 一种目标wifi筛选方法、装置、介质及设备
CN115935231A (zh) 一种数据分类方法、装置、设备及存储介质
CN115587694A (zh) 用于房屋租金批量评估的数据处理方法、装置及设备
CN111460268B (zh) 数据库查询请求的确定方法、装置和计算机设备
CN111340580B (zh) 房型的确定方法、装置、计算机设备和存储介质
CN110618979A (zh) 嵌套循环的数据处理方法、装置及计算机设备
CN113354004B (zh) 基于互联网和大数据的污水处理方法及***
CN110633430A (zh) 事件发现方法、装置、设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant