CN114331662A - 识别相同业务主体的方法及装置 - Google Patents

识别相同业务主体的方法及装置 Download PDF

Info

Publication number
CN114331662A
CN114331662A CN202210235325.2A CN202210235325A CN114331662A CN 114331662 A CN114331662 A CN 114331662A CN 202210235325 A CN202210235325 A CN 202210235325A CN 114331662 A CN114331662 A CN 114331662A
Authority
CN
China
Prior art keywords
user
similarity
track
tensor
same service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210235325.2A
Other languages
English (en)
Inventor
桂正科
高率荏
何雨潇
林昊
张喜
阳进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202210235325.2A priority Critical patent/CN114331662A/zh
Publication of CN114331662A publication Critical patent/CN114331662A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供一种识别相同业务主体的方法及装置,用于识别多个用户标识是否对应相同业务主体,或多个用户标识中是否存在对应相同业务主体的用户标识。其中的多个用户标识至少包括第一用户标识、第二用户标识,相应实施例中,可以获取第一用户标识对应的第一轨迹张量,以及第二用户标识对应的第二轨迹张量,并检测第一轨迹张量、第二轨迹张量的相似性,然后基于对第一轨迹张量、第二轨迹张量的相似性是否满足预定条件的判断结果,识别第一用户标识、第二用户标识是否对应相同业务主体。该实施方式可以提高针对流动性的业务目标的召回率。

Description

识别相同业务主体的方法及装置
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及识别相同业务主体的方法及装置。
背景技术
随着移动终端技术的发展,出现了各种数字支付平台。例如,随着数字支付的推进,固定位置商贩、流动商贩都可以通过二维码链接到相关支付平台实现收付款。从收付款账户管理的角度,流动商户属于长尾用户,其开设的收款账户通常具有经营者信息缺失、经营位置漂移、存续时间短等缺陷。刻画这类账户的精准画像,是开展账户管理、反洗钱等工作的前提。
发明内容
本说明书一个或多个实施例描述了一种识别相同业务主体的方法及装置,用以解决背景技术提到的一个或多个问题。
根据第一方面,提供一种识别相同业务主体方法,用于识别多个用户标识是否对应相同业务主体,或多个用户标识中是否存在对应相同业务主体的用户标识,所述多个用户标识包括第一用户标识、第二用户标识,所述方法包括:获取所述第一用户标识对应的第一轨迹张量,以及所述第二用户标识对应的第二轨迹张量,其中,单个轨迹张量基于相应用户标识在预定时间段内按照时间顺序对应的多个位置确定;检测所述第一轨迹张量与第二轨迹张量之间的相似性;基于对所述第一轨迹张量与第二轨迹张量之间的相似性是否满足预定条件的判断结果,识别第一用户标识、第二用户标识是否对应相同业务主体。
在一个实施例中,单个轨迹张量的单个元素由在预定时间段内按照时间顺序对应的多个位置中的1个位置或者连续的n个位置确定,其中,n为大于1的正整数。
在一个实施例中,所述多个位置的位置信息按照预定时间间隔从进行预定业务的相应客户端获取,或者在相应客户端进行预定业务时上传。
在一个进一步的实施例中,所述预定业务为数字支付业务。
在一个实施例中,所述第一轨迹张量与第二轨迹张量之间的相似性通过第一相似度来衡量。
在一个实施例中,所述第一轨迹张量与所述多个用户标识中的其他用户标识对应的各个轨迹张量一一对应有各个其他相似度,所述预定条件为,所述第一相似度在所述第一相似度和各个其他相似度中按照由大到小顺序排列在靠前的第一预定位数内。
在一个实施例中,所述多个用户标识两两构成候选标识对,单个候选标识对中的两个轨迹向量对应有单个相似度,所述预定条件为,所述第一相似度在各个候选标识对分别对应的各个相似度中按照由大到小顺序排列在靠前的第二预定位数内。
在一个实施例中,所述第一相似度为以下中的一项:杰卡德系数、余弦相似度、皮尔逊相似度、欧几里得距离、KL散度。
在一个实施例中,所述基于对所述第一轨迹张量与第二轨迹张量之间的相似性是否满足预定条件的判断结果,确定第一用户标识、第二用户标识是否对应相同业务主体包括:在所述第一相似度满足所述预定条件的情况下,将第一用户标识、第二用户标识识别为对应相同业务主体。
根据第二方面,提供一种识别相同业务主体的装置,用于识别多个用户标识是否对应相同业务主体,或多个用户标识中是否存在对应相同业务主体的用户标识,所述多个用户标识包括第一用户标识、第二用户标识,所述装置包括:
获取单元,配置为获取所述第一用户标识对应的第一轨迹张量,以及所述第二用户标识对应的第二轨迹张量,其中,单个轨迹张量基于相应用户标识在预定时间段内按照时间顺序对应的多个位置确定;
检测单元,配置为检测所述第一轨迹张量与第二轨迹张量之间的相似性;
识别单元,配置为基于对所述第一轨迹张量与第二轨迹张量之间的相似性是否满足预定条件的判断结果,识别第一用户标识、第二用户标识是否对应相同业务主体。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法和装置,在识别多个用户标识是否对应相同业务主体过程中,将用户标识对应的业务主体的地理位置按照时间顺序采样排列,从而构建相应轨迹张量,并利用轨迹张量之间的相似性识别不同用户标识是否属于同一实际使用者或控制者。该方式基于商户或流动商贩之类的业务主体在地理位置上的一致性,挖掘以不同用户标识注册的账户之间的关联关系,将实体链指所依赖的静态属性特征,升级到时序动态特征,从而提高具有流动性的相同业务主体的召回率,增加相同业务主体识别的有效性,从而提高业务处理的准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出根据本说明书的一个具体实施架构示意图;
图2示出根据本说明书一个实施例的识别相同业务主体的方法流程图;
图3示出根据一个具体例子的用户标识对应的业务主体的轨迹示意图;
图4示出根据一个实施例的用于识别相同业务主体的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的技术方案进行描述。
为了更清楚地理解本说明书的技术方案,首先结合一个具体实施场景描述本说明书中的技术方案提出的技术背景。
图1示出了本说明书的一个具体实施架构。该实施架构涉及一个数字支付场景,该数字支付场景可通过线下设备完成在线支付,如通过移动终端扫描二维码、通过POS机具刷卡等进行收付款操作。该支付场景中,所涉及的支付方、收款方需要预先在相应支付平台注册有账号(user name),账号例如可通过唯一的用户标识(如手机号、银行***等)描述。收款方通常为商户、企业等,如商品或服务的提供者。
通常,一个业务主体在一个支付平台可以注册一个账户。如图1中的用户2注册有账户3、用户3注册有账户4等。然而实践中,可能出现支付平台对业务主体进行激励而提高用户体验,或者其他业务方如监管方对业务主体进行财产监管等场景。例如,支付平台为了激励用户,可能提供一些附条件的权益,例如单日收款10笔奖励10元,或者,单日线下支付1笔奖励2元,等等。再例如,税务部门通过对同一商户的流水进行监管,并根据商户流水进行阶梯税收,等等。如此,一些业务主体(如以上例子中的用户、商户等)就可能产生分散账户的行为。即,一个业务主体,如一个商户或一个自然人等,注册并同时使用多个账户的行为。如图1所示的用户1,其可能通过自己的身份信息注册有账户1,通过他人身份信息注册有账户2等(还可以对应有更多账户)。如此,在支付平台提供附条件的权益激励场景下,该用户可能在单日获得2份(或更多)权益收益,在税务部门对流水进行监管的情况下,商户可能分散流水逃避全部或部分税收。为了支付平台的权益发放业务或者税务部门的合理征税等正常业务的合理进行,存在将对应于同一业务主体(用户标识的实际控制人或使用人,如图1中的用户)的不同用户标识(如图1中的不同账号)进行归并的业务需求。
基于这种需求,可以通过计算平台进行用户标识的归并操作,即识别出对应于同一业务主体的不同用户标识,从而在业务处理过程中将同一业务主体的不同用户标识产生的业务一并进行考虑。如图1所示,将对应于同一用户1的不同用户标识账号1、账号2找出来。必要时,还可以将同一业务主体对应的不同用户标识的业务信息合并,以进行相关业务处理。该归并操作例如通过图1示出的计算平台进行。图1中的计算平台可以设于任何具有一定计算能力的计算机、设备等,如可以设于图1的支付平台服务器上。
在本说明书的技术构思下,以上识别相同业务主体的不同用户标识的归并操作可以通过相关业务信息进行。例如,在商户收款业务场景下,相关业务信息可以是收款时的支付信息。可以理解,支付信息可以包含支付方信息、收款方信息、支付时间、支付地点、支付金额等中的一项或多项。在本说明书中,业务信息至少可以包括位置信息,如支付业务中的支付地点信息。更具体地,识别相同业务主体的不同用户标识可以通过业务信息中包含的位置信息构成的用户轨迹进行。可以理解的是,在在线数字支付业务场景下,对于有店面经营的商户而言,其支付信息中包含的位置通常较固定,而流动商户更可能在注册用户标识时,存在经营者信息缺失、经营位置漂移、存续时间短等问题。因此,本说明书提供的技术方案尤其适用于流动商户对应的不同账户的识别召回。
值得说明的是,以上关于图1的描述中,业务场景不限于以上的税务监管、权益激励等场景,实践中,可以是任意和位置相关的业务主体的不同用户标识归并需求的场景。另外,图1中示出的账号、用户数量均为示例性的,实践中可以是任意数量。
下面详细描述本说明书的技术构思。
图2示出了根据本说明书一个实施例的识别相同业务主体的流程。该流程的执行主体可以是具有一定计算能力的计算机、设备、服务器。更具体地,如可以是图1中的计算平台。该流程可以适用于任何具有流动性(与位置相关)的业务主体的用户标识(账户)归并场景,尤其适用于流动商户的信息归并。其中,业务主体可以是用户标识现实中对应的使用者、持有者或控制者等,例如可以是一个企业、一个商户、一个自然人等。
可以理解的是,图2示出的识别相同业务主体的流程可以是针对一个或多个目标用户标识,识别与其对应有相同业务主体的其他目标用户标识的场景,也可以是在多个用户标识中,全量挖掘可能对应一个业务主体的多个用户标识的场景,例如,对于用户标识集{1,2……N},识别结果包括该用户标识集中的用户标识1和N/2对应同一个用户A(业务主体),用户标识2、5和N对应同一个用户B(业务主体),等等。值得说明的是,以上场景中均包含至少两个用户标识,并识别这两个用户标识是否对应同一个业务主体(如同一个商户)。为了描述方便,可以将这两个用户标识记为第一用户标识和第二用户标识。下面在图3中以第一用户标识和第二用户标识为例,描述本说明书技术构思下的识别相同业务主体流程。
如图2所示,该识别相同业务主体的流程可以包括:步骤201,获取第一用户标识对应的第一轨迹张量,以及第二用户标识对应的第二轨迹张量,其中,单个轨迹张量基于相应用户标识在预定时间段内按照时间顺序对应的多个位置确定;步骤202,检测第一轨迹张量与第二轨迹张量之间的相似性;步骤203,基于对第一轨迹张量与第二轨迹张量之间的相似性是否满足预定条件的判断结果,识别第一用户标识、第二用户标识是否对应相同业务主体。
首先,在步骤201中,获取第一用户标识对应的第一轨迹张量,以及第二用户标识对应的第二轨迹张量。
在本说明书的技术构思下,可以通过轨迹张量来描述单个用户对应的业务主体的业务流动轨迹。可以理解,对于固定店铺商户而言,位置通常是固定的,因此,轨迹张量中各个元素可能均指向同一个地点。而对于流动商户而言,通过轨迹可以反映其位置流动信息。而相同业务主体的流动轨迹具有相似性。
用户的流动轨迹可以是在在预定的时间窗口(即时间段,如某一天的早上6点至晚上8点)内,随着业务主体在地理空间中的移动、所形成的LBS(Location-Based Service)序列,即基于位置服务的位置序列。例如,在某一天的早上6点至晚上8点的时间窗口内,每10分钟采集一次商户的位置信息,共得到14×6个元素构成LBS序列。LBS序列中的元素个数,同时取决于时间窗口的长度以及采样的频率。通常,在一定的采样频率下,时间窗口越长,LBS序列中的元素数越多,在确定的时间窗口内,采样频率越高,采样次数越高,LBS序列中的元素数越多。
在一个实施例中,可以通过预定的采样频率对用户标识对应的业务主体的位置进行采样。此时,位置采样依赖于收款方的用户标识,对位置的采样例如可以通过用户标识所关联的设备,如当前登录的移动终端、POS机具等设备进行采样。
在另一个实施例中,可以在用户标识产生收款业务时对当前支付业务的位置进行采样。此时,位置采样可以通过支付方关联的设备进行,也可以通过收款方关联的设备进行。例如,在二维码收款场景下,位置采样可以通过支付方的支付设备定位当前位置,从而获得更加符合实际场景的位置信息。此时,位置信息可以包含在支付信息中上传至支付平台的服务端。
在其他实施例中,还可以通过其他方式对实际控制或使用一个用户标识的业务主体的位置进行采样。其中,按照预定采样频率采样到的LBS序列长度是确定的,而在支付场景触发的采样方式下,采样频率不固定,因此,LBS序列长度也不确定。
LBS序列描述了在某个预定的时间段内实际控制或使用一个用户标识的业务主体的运动轨迹。如图3所示,假设L1、L2、L3、L4、L5、L6、L7、L8、L9是地图上的9个位置点分别对应的9个位置标识。针对一个用户标识(如第一用户标识)的位置采样结果依次为L1、L2、L2、L2、L2、L2、L2、L9、L9、L7、L7、L7、L7、L6、L4、L4、L4、L4、L4,则其对应的LBS序列可以记为{L1,L2,L2,L2,L2,L2,L2,L9,L9,L7,L7,L7,L7,L6,L4,L4,L4,L4,L4},则如图3所示,相应的轨迹可以包括其依次所到过的各个位置点,如为:L1,L2,L9,L7,L6,L4。同理,针对另一个用户标识(如第二用户标识),可以得到相应的轨迹:L8,L3,L5,L6。
其中,位置采样较多的位置点,可能是用户停留时间较久,或者支付业务发生较多的位置。根据以上结合图3示例进行的描述可以看出,用户标识对应的轨迹线可以将采样位置点中连续的重复点合并。因此,轨迹线中各个位置点按照时间顺序排列,而和停留时长无关,轨迹线中包含的位置点数量也不确定。根据在某个预定的时间段内采样的LBS序列,可以生成相应用户标识对应的轨迹张量。这里,轨迹张量可以用于描述用户标识对应的用户实体的轨迹特征。
在一个可选的实现方式中,可以按照LBS序列构建轨迹张量。例如,图3中两个用户标识分别对应的两个轨迹张量与LBS序列一致,分别为(L1,L2,L9,L7,L6,L4)和(L8,L3,L5,L6)。
在另一个可选的实现方式中,考虑到移动轨迹的位置之间的关联关系,还可以将LBS序列中,连续的n个位置点串联在一起,形成张量的一个元素。其中,n为预设的大于1的正整数。以n=3为例,以上例子中的LBS序列L1,L2,L9,L7,L6,L4可以形成轨迹张量(L1 L2L9,L2 L9L7,L9 L7L6,L7L6L4),LBS序列L8,L3,L5, L6可以形成轨迹张量(L8L3L5,L3L5L6)。如此,轨迹张量的元素数目相比LBS序列减少,从而有利于减少数据计算量。这种情况下,在一个预定的时间段内,如果用户标识对应的用户实体经过的地点小于n,如仅经过一个位置点{L1},则相应轨迹张量可以仅有一个元素,为(L1)或(L1L1L1)。可选地,轨迹张量中的单个元素还可以对应一个n维向量,如L1 L2 L9,用于表示n个连续位置点的串联结构。
在其他可选的实施例中,还可以按照其他合理的方式构建轨迹张量,在此不再赘述。进一步地,针对一个预定的时间段,如2022年2月1日上午6点至下午8点,第一用户标识可以对应有第一轨迹张量,第二用户标识可以对应有第二轨迹张量。各个用户标识对应的轨迹张量可以在图2的流程执行过程中构建,也可以在预定的时间段结束后,基于在该预定时间段内采集的位置数据预先构建,在此不做限定。
在得到第一用户标识对应的第一轨迹张量、第二用户标识对应的第二轨迹张量的基础上,可以进一步通过步骤202,检测第一轨迹张量与第二轨迹张量之间的相似性。
在一个实施例中,第一轨迹张量与第二轨迹张量之间的相似性可以通过元素匹配实现。例如,第一轨迹张量中预定比例(如90%)的元素在第二轨迹向量中可以匹配到相同元素,则第一轨迹张量、第二轨迹张量具有相似性,否则,第一轨迹张量、第二轨迹张量不具有相似性。
在另一个实施例中,第一轨迹张量、第二轨迹张量的相似性可以通过第一相似度来衡量。可以理解,向量的相似性通常可以通过诸如杰卡德(Jaccard)系数、余弦相似度、皮尔逊相似度、欧几里得距离、KL散度(Kullback–Leibler divergence,相对熵)之类的方法进行衡量。在第一轨迹张量、第二轨迹张量的相似性用第一相似度表示的情况下,第一相似度可以基于杰卡德(Jaccard)系数、余弦相似度、皮尔逊相似度、欧几里得距离、KL散度等等进行表示。具体衡量时,第一相似度可以与杰卡德(Jaccard)系数、余弦相似度、皮尔逊相似度等中的一项正相关,或与欧几里得距离、KL散度等中的一项负相关。
其中,以Jaccard系数为例,两个数据集A、B的相似性可以描述为:
Figure DEST_PATH_IMAGE001
。其中,
Figure 877529DEST_PATH_IMAGE002
表示两个数据集A和B中相同元素的个数,
Figure DEST_PATH_IMAGE003
表示两个数据集A和B中合并相同元素后总的元素的个数。在本步骤202中,集合A、集合B分别可以为第一轨迹张量、第二轨迹张量。
值得说明的是,Jaccard系数的计算方式不要求两个数据集A、B的元素数量是否相等,因此具有更强的普适性。而余弦相似度、皮尔逊相似度、欧几里得距离、KL散度之类的方法通常更适用于相同元素的集合(如相同维数的向量)之间的相似性衡量。
然后,经由步骤203,基于对第一轨迹张量与第二轨迹张量之间的相似性是否满足预定条件的判断结果,识别第一用户标识、第二用户标识是否对应相同业务主体。
预定条件可以是预先确定的对两个轨迹张量是否满足被同一个业务主体使用的评价标准。其中,在第一轨迹张量、第二轨迹张量的相似性通过第一相似度描述的情况下,预定条件可以是第一相似度满足的条件。在第一轨迹张量、第二轨迹张量的相似性满足预定条件的情况下,可以将第一用户标识、第二用户标识识别为对应同一用户的用户标识,例如是对应同一商户的两个不同账号
根据一个可能的设计,预定条件可以是相似度大于预定阈值(如0.5)。此时,在第一相似度大于该预定阈值的情况下,可以将第一用户标识、第二用户标识识别为对应同一业务主体的用户标识。这种情况下,各对用户标识之间的相似性是相互独立的,各自通过自身衡量相似性的相应相似度与预定阈值进行比较,从而不受前文列举的不同的具体识别场景限制。这种情况下,一个目标用户标识允许不存在对应相同业务主体的其他用户标识。另一方面,能够在所有和该目标用户标识组对的其他用户标识中,尽可能多地发现可能对应相同业务主体的用户标识。
根据另一个可能的设计,预定条件可以是选择各个用户标识对中,轨迹张量相似度排列靠前的第一预定位数(如k)个用户标识对,将其中的两个用户标识识别为对应同一业务主体的用户标识。这种情况下,第一用户标识、第二用户标识组成的用户标识对可以是各个用户标识对中的一对。这种情况下的预定条件也可以称为top k条件。此时,可以根据前文描述的两种业务场景分为两种情形。
一种情形的相应业务场景为,针对一个目标用户标识(如第一用户标识或者第二用户标识),识别与其对应相同业务主体的其他用户标识。在这种场景下,第一用户标识作为目标用户标识,第二用户标识可以和其他用户标识一起作为候选标识,第一轨迹张量和其他用户标识的轨迹张量之间一一对应有各个其他相似度。根据一个实施例中,预定条件可以是按照由大到小顺序排列在各个相似度(包括第一相似度和各个其他相似度)靠前的第一预定位数(如k=1)。相应地,如果第一相似度排列在各个相似度由大到小顺序的第一预定位数内,则可以确定第一相似度满足预定条件。这种情形下,针对目标用户标识通常可以识别到k个对应与相同业务主体的其他用户标识,因此,更适用于已确定与目标用户标识对应的业务主体(如某商户)还对应有其他用户标识的业务场景,或者仅识别与目标用户标识对应的业务主体(如某商户)还疑似对应有其他用户标识的业务场景。这种业务场景下k的取值相对较小,如为1。
另一种情形的相应业务场景为,对应于针对某个范围(例如一个知识图谱范围、一个地区范围等)内的各个用户标识,识别任意两个用户标识是否对应相同业务主体。在这种场景下,假设用户标识数量为m(m如为10万),则m个用户标识中任一两个用户标识组成的用户标识对,可以作为候选用户标识对,共有m(m-1)/2个用户标识对。第一用户标识和第二用户标识对是候选用户标识对之一。各个候选标识对分别对应有各个相似度。此时,根据一个实施例中,预定条件可以为,按照由大到小顺序排列在各个候选标识对的各个相似度(包括第一相似度)靠前的第二预定位数(如k=100)。进一步地,如果第一相似度排列在所述第二预定位数内,则可以确定第一相似度满足预定条件。这种业务场景更倾向于一种海选或盲选的业务场景,适用于例行检查是否有同一业务主体注册了多个用户标识的业务场景。这种业务场景下k的取值相对较大,可以与m的数量级有关,例如为m的千分之一数量级等。
识别第一用户标识、第二用户标识是否对应相同业务主体后,还可以根据识别结果进行相应业务处理。例如,如果识别结果为第一用户标识、第二用户标识对应相同业务主体,则至少针对其中一个用户标识不再提供相应的权益激励,或者,将第一用户标识、第二用户标识的流水叠加以追缴税款,等等。
回顾以上过程,在识别不同用户标识识别是否对应相同业务主体的过程中,充分利用相关设备采集业务主体的移动轨迹,并根据轨迹张量的相似性描述位置轨迹的重合度,从而将轨迹的重合度较高的用户标识识别为被相同业务主体实体控制或使用。这种方式通过计算LBS轨迹的重合程度,来衡量不同用户标识归属同一个业务主体的概率,将实体链指所依赖的静态属性特征,升级到时序动态特征,从而提高相同业务主体的召回率,增加相同业务主体识别的有效性,从而提高相关业务的准确性。
根据另一方面的实施例,还提供一种用于识别相同业务主体的装置。该装置可以用于识别多个用户标识是否对应相同业务主体,或多个用户标识中是否存在对应相同业务主体的用户标识。其中,多个用户标识至少包括第一用户标识、第二用户标识。图4示出了根据一个实施例的用于识别相同业务主体的装置400。如图4所示,装置400可以包括:
获取单元401,配置为获取第一用户标识对应的第一轨迹张量,以及第二用户标识对应的第二轨迹张量,其中,单个轨迹张量基于相应用户标识在预定时间段内按照时间顺序对应的多个位置确定;
检测单元402,配置为检测第一轨迹张量与第二轨迹张量之间的相似性;
识别单元403,配置为基于对第一轨迹张量与第二轨迹张量之间的相似性是否满足预定条件的判断结果,识别第一用户标识、第二用户标识是否对应相同业务主体。
在一个实施例中,单个轨迹张量的单个元素由在预定时间段内按照时间顺序排列的多个位置中的1个位置或者连续的n个位置确定,其中,n为大于1的正整数。
在另一个实施例中,多个位置的位置信息按照预定时间间隔从进行预定业务的相应客户端获取,或者在相应客户端进行预定业务时上传。
根据一个可选的实现方式,第一轨迹张量与第二轨迹张量之间的相似性通过第一相似度来衡量。
进一步地,在一个业务场景下,第一轨迹张量与多个用户标识中的其他用户标识对应的各个轨迹张量一一对应有各个其他相似度,预定条件为,所述第一相似度在第一相似度和各个其他相似度中按照由大到小顺序排列在靠前的第一预定位数内。
在另一个业务场景下,多个用户标识两两构成候选标识对,单个候选标识对中的两个轨迹向量对应有单个相似度,预定条件为:所述第一相似度在各个候选标识对分别对应的各个相似度中按照由大到小顺序排列在靠前的第二预定位数内。此时,第一相似度在排列在第二预定位数内的情况下满足预定条件。
其中,识别单元403进一步可以配置为:在第一相似度满足预定条件的情况下,将第一用户标识、第二用户标识识别为对应相同业务主体。
值得说明的是,图4所示的装置400与图2描述的方法相对应,图2的方法实施例中的相应描述同样适用于装置400,在此不再赘述。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2等所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2等所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所描述的具体实施方式,对本说明书的技术构思的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所描述仅为本说明书的技术构思的具体实施方式而已,并不用于限定本说明书的技术构思的保护范围,凡在本说明书实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的技术构思的保护范围之内。

Claims (12)

1.一种识别相同业务主体的方法,用于识别多个用户标识是否对应相同业务主体,或多个用户标识中是否存在对应相同业务主体的用户标识,所述多个用户标识包括第一用户标识、第二用户标识,所述方法包括:
获取所述第一用户标识对应的第一轨迹张量,以及所述第二用户标识对应的第二轨迹张量,其中,单个轨迹张量基于相应用户标识在预定时间段内按照时间顺序对应的多个位置确定;
检测所述第一轨迹张量与第二轨迹张量之间的相似性;
基于对所述第一轨迹张量与第二轨迹张量之间的相似性是否满足预定条件的判断结果,识别第一用户标识、第二用户标识是否对应相同业务主体。
2.根据权利要求1所述的方法,其中,单个轨迹张量的单个元素由在预定时间段内按照时间顺序对应的多个位置中的1个位置或者连续的n个位置确定,其中,n为大于1的正整数。
3.根据权利要求1所述的方法,其中,所述多个位置的位置信息按照预定时间间隔从进行预定业务的相应客户端获取,或者在相应客户端进行预定业务时上传。
4.根据权利要求3所述的方法,其中,所述预定业务为数字支付业务。
5.根据权利要求1所述的方法,其中,所述第一轨迹张量与第二轨迹张量之间的相似性通过第一相似度来衡量。
6.根据权利要求5所述的方法,其中,所述第一轨迹张量与所述多个用户标识中的其他用户标识对应的各个轨迹张量一一对应有各个其他相似度,所述预定条件为,所述第一相似度在所述第一相似度和各个其他相似度中按照由大到小顺序排列在靠前的第一预定位数内。
7.根据权利要求5所述的方法,其中,所述多个用户标识两两构成候选标识对,单个候选标识对中的两个轨迹向量对应有单个相似度,所述预定条件为,所述第一相似度在各个候选标识对分别对应的各个相似度中按照由大到小顺序排列在靠前的第二预定位数内。
8.根据权利要求5-7任一所述的方法,其中,所述第一相似度为以下中的一项:杰卡德系数、余弦相似度、皮尔逊相似度、欧几里得距离、KL散度。
9.根据权利要求6或7所述的方法,其中,所述基于对所述第一轨迹张量与第二轨迹张量之间的相似性是否满足预定条件的判断结果,确定第一用户标识、第二用户标识是否对应相同业务主体包括:
在所述第一相似度满足所述预定条件的情况下,将第一用户标识、第二用户标识识别为对应相同业务主体。
10.一种识别相同业务主体的装置,用于识别多个用户标识是否对应相同业务主体,或多个用户标识中是否存在对应相同业务主体的用户标识,所述多个用户标识包括第一用户标识、第二用户标识,所述装置包括:
获取单元,配置为获取所述第一用户标识对应的第一轨迹张量,以及所述第二用户标识对应的第二轨迹张量,其中,单个轨迹张量基于相应用户标识在预定时间段内按照时间顺序对应的多个位置确定;
检测单元,配置为检测所述第一轨迹张量与第二轨迹张量之间的相似性;
识别单元,配置为基于对所述第一轨迹张量与第二轨迹张量之间的相似性是否满足预定条件的判断结果,识别第一用户标识、第二用户标识是否对应相同业务主体。
11.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。
12.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。
CN202210235325.2A 2022-03-11 2022-03-11 识别相同业务主体的方法及装置 Pending CN114331662A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210235325.2A CN114331662A (zh) 2022-03-11 2022-03-11 识别相同业务主体的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210235325.2A CN114331662A (zh) 2022-03-11 2022-03-11 识别相同业务主体的方法及装置

Publications (1)

Publication Number Publication Date
CN114331662A true CN114331662A (zh) 2022-04-12

Family

ID=81034096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210235325.2A Pending CN114331662A (zh) 2022-03-11 2022-03-11 识别相同业务主体的方法及装置

Country Status (1)

Country Link
CN (1) CN114331662A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787104A (zh) * 2016-03-21 2016-07-20 百度在线网络技术(北京)有限公司 用户属性信息的获取方法和装置
WO2016202027A1 (zh) * 2015-06-18 2016-12-22 中兴通讯股份有限公司 一种物体移动轨迹识别方法及***
CN107341668A (zh) * 2016-04-29 2017-11-10 滴滴(中国)科技有限公司 一种判断真实数据的方法以及装置
CN110557726A (zh) * 2019-08-13 2019-12-10 深圳市天彦通信股份有限公司 信息推送方法及相关产品
CN110727756A (zh) * 2019-10-18 2020-01-24 北京明略软件***有限公司 时空轨迹数据的管理方法和装置
CN110766895A (zh) * 2019-09-17 2020-02-07 重庆特斯联智慧科技股份有限公司 基于目标轨迹分析的智慧社区异常报警***及方法
CN111695019A (zh) * 2020-06-11 2020-09-22 腾讯科技(深圳)有限公司 一种识别关联账号的方法及装置
CN111915381A (zh) * 2020-09-14 2020-11-10 北京嘀嘀无限科技发展有限公司 检测作弊行为的方法、装置、电子设备和存储介质
CN113641657A (zh) * 2021-08-23 2021-11-12 苏州良医汇网络科技有限公司 一种用户账号合并的方法、装置和设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016202027A1 (zh) * 2015-06-18 2016-12-22 中兴通讯股份有限公司 一种物体移动轨迹识别方法及***
CN105787104A (zh) * 2016-03-21 2016-07-20 百度在线网络技术(北京)有限公司 用户属性信息的获取方法和装置
CN107341668A (zh) * 2016-04-29 2017-11-10 滴滴(中国)科技有限公司 一种判断真实数据的方法以及装置
CN110557726A (zh) * 2019-08-13 2019-12-10 深圳市天彦通信股份有限公司 信息推送方法及相关产品
CN110766895A (zh) * 2019-09-17 2020-02-07 重庆特斯联智慧科技股份有限公司 基于目标轨迹分析的智慧社区异常报警***及方法
CN110727756A (zh) * 2019-10-18 2020-01-24 北京明略软件***有限公司 时空轨迹数据的管理方法和装置
CN111695019A (zh) * 2020-06-11 2020-09-22 腾讯科技(深圳)有限公司 一种识别关联账号的方法及装置
CN111915381A (zh) * 2020-09-14 2020-11-10 北京嘀嘀无限科技发展有限公司 检测作弊行为的方法、装置、电子设备和存储介质
CN113641657A (zh) * 2021-08-23 2021-11-12 苏州良医汇网络科技有限公司 一种用户账号合并的方法、装置和设备

Similar Documents

Publication Publication Date Title
CN108898418B (zh) 用户账号检测方法、装置、计算机设备和存储介质
US8942420B2 (en) Detecting embossed characters on form factor
CN107665432A (zh) 在用户与各种银行服务的交互中识别可疑用户行为的***和方法
WO2018164684A1 (en) System and method for fraud risk analysis in iot
US10685348B2 (en) System and method for secured tax refund for cross border transactions with mobile device wallet application
CN105407100A (zh) 使用通用id和生物特征的方法和***
CN110046201B (zh) 用于处理业务交易的总账科目数据的方法、装置及***
CN114385833A (zh) 更新知识图谱的方法及装置
KR101102896B1 (ko) 복수의 사용자가 동시에 콜렉션을 수행할 수 있도록 지원하기 위한 방법, 서버 및 컴퓨터 판독 가능한 기록 매체
US20230100993A1 (en) Methods and systems for deconflicting data from multiple sources in computer systems
Liu et al. Bitcoin address clustering based on change address improvement
KR102133474B1 (ko) 고객서비스 제공 시스템, 서버 및 방법
CN114331662A (zh) 识别相同业务主体的方法及装置
Wan et al. Early-stage phishing detection on the Ethereum transaction network
US20160328802A1 (en) System and method for determining merchant revenue using transaction data and geotemporal data
US20200233696A1 (en) Real Time User Matching Using Purchasing Behavior
CN107993155A (zh) 保单信息处理方法、装置、服务器和存储介质
CN110796379B (zh) 业务渠道的风险评估方法、装置、设备及存储介质
CN110210939B (zh) 信息推送方法、装置和计算机设备
US20200272846A1 (en) System and Method for Managing Loyalty Scheme Data
CN110442375A (zh) 移动支付产品渠道集成方法、装置、设备和存储介质
CN111429167B (zh) 一种数据交互方法及其***、商户终端、后台服务***
Gigli et al. Design and Development of a Mobile Dapp for Mobile Crowdsensing over EVM-enabled Blockchains
Tiwari et al. BanditPAM++: Faster $ k $-medoids Clustering
CN111447082B (zh) 关联账号的确定方法、装置和关联数据对象的确定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination