CN112800291B - 一种相似账户确定方法、装置、电子设备及存储介质 - Google Patents

一种相似账户确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112800291B
CN112800291B CN202110406247.3A CN202110406247A CN112800291B CN 112800291 B CN112800291 B CN 112800291B CN 202110406247 A CN202110406247 A CN 202110406247A CN 112800291 B CN112800291 B CN 112800291B
Authority
CN
China
Prior art keywords
accounts
distance
determining
character string
account
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110406247.3A
Other languages
English (en)
Other versions
CN112800291A (zh
Inventor
陈程
王贺
李涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Zhuoer Digital Media Technology Co ltd
Original Assignee
Wuhan Zhuoer Digital Media Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Zhuoer Digital Media Technology Co ltd filed Critical Wuhan Zhuoer Digital Media Technology Co ltd
Priority to CN202110406247.3A priority Critical patent/CN112800291B/zh
Publication of CN112800291A publication Critical patent/CN112800291A/zh
Application granted granted Critical
Publication of CN112800291B publication Critical patent/CN112800291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例适用于计算机技术领域,提供了一种相似账户确定方法、装置、电子设备及存储介质,其中,相似账户确定方法包括:确定至少两个第一账户中的每个第一账户对应的字符串;所述字符串中的每一个字符对应一个访问对象;所述访问对象被第一账户访问的频率大于第一设定值;确定所述至少两个第一账户中每两个第一账户之间的第一距离;所述第一距离表征两个第一账户对应的字符串的编辑距离;基于所述至少两个第一账户中每两个第一账户之间的第一距离,确定所述至少两个第一账户中的每个第一账户对应的相似账户。

Description

一种相似账户确定方法、装置、电子设备及存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种相似账户确定方法、装置、电子设备及存储介质。
背景技术
基于账户之间的相似度向账户推送各种信息、产品或服务,是网络应用中比较常见的一种互联网营销行为。相关技术通过获取账户的属性,将属性相似的账户划分为相似账户。但是,对于社交软件的账户,基于账户属性确定账户之间的相似度并不完全适用,确定出的账户相似度的准确性不高。
发明内容
有鉴于此,本发明实施例提供一种相似账户确定方法、装置、电子设备及存储介质,以至少解决相关技术中基于账户属性确定出的账户相似度的准确性不高的问题。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供了一种相似账户确定方法,该方法包括:
确定至少两个第一账户中的每个第一账户对应的字符串;所述字符串中的每一个字符对应一个访问对象;所述访问对象被第一账户访问的频率大于第一设定值;
确定所述至少两个第一账户中每两个第一账户之间的第一距离;所述第一距离表征两个第一账户对应的字符串的编辑距离;
基于所述至少两个第一账户中每两个第一账户之间的第一距离,确定所述至少两个第一账户中的每个第一账户对应的相似账户。
上述方案中,所述访问对象至少满足以下任意一项:
第一账户在设定时间段内访问所述访问对象的次数与访问所有访问对象的总次数的比值大于或等于第二设定值;
第一账户在所述设定时间段内访问所述访问对象的时长与访问所有访问对象的总时长的比值大于或等于第三设定值。
上述方案中,所述基于所述至少两个第一账户中每两个第一账户之间的第一距离,确定所述至少两个第一账户中的每个第一账户对应的相似账户,包括:
基于所述第一距离确定对应的两个第一账户之间的相似度;
在所述相似度小于第四设定值的情况下,确定对应的两个第一账户为相似账户。
上述方案中,所述相似度表征两个第一账户之间的第一距离与第一长度的第一比值;所述第一长度表征两个第一账户对应的字符串中字符串长度最大的字符串的长度。
上述方案中,所述基于所述第一距离确定对应的两个第一账户之间的相似度,包括:
确定两个第一账户对应的字符串的字符串长度的差值;
在所述差值小于第五设定值的情况下,基于所述第一距离确定对应的两个第一账户之间的相似度。
上述方案中,所述确定所述至少两个第一账户中每两个第一账户之间的第一距离,包括:
确定所述第一字符串转换为所述第二字符串的最少编辑操作次数,所述最少编辑操作次数表征所述第一距离;其中,所述第一字符串和所述第二字符串分别表征所述至少两个第一账户中的任意两个第一账户分别对应的字符串。
上述方案中,所述访问对象至少包括以下任意一项:
社交应用软件;
社交群组。
第二方面,本发明实施例提供了一种相似账户确定装置,该装置包括:
第一确定模块,用于确定至少两个第一账户中的每个第一账户对应的字符串;所述字符串中的每一个字符对应一个访问对象;所述访问对象被第一账户访问的频率大于第一设定值;
第二确定模块,用于确定所述至少两个第一账户中每两个第一账户之间的第一距离;所述第一距离表征两个第一账户对应的字符串的编辑距离;
第三确定模块,用于基于所述至少两个第一账户中每两个第一账户之间的第一距离,确定所述至少两个第一账户中的每个第一账户对应的相似账户。
第三方面,本发明实施例提供了一种电子设备,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行本发明实施例第一方面提供的相似账户确定方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,包括:所述计算机可读存储介质存储有计算机程序。所述计算机程序被处理器执行时实现如本发明实施例第一方面提供的相似账户确定方法的步骤。
本发明实施例通过确定至少两个第一账户中的每个第一账户对应的字符串,确定至少两个第一账户中每两个第一账户之间的第一距离,基于至少两个第一账户中每两个第一账户之间的第一距离,确定至少两个第一账户中的每个第一账户对应的相似账户。其中,字符串中的每一个字符对应一个访问对象,访问对象被第一账户访问的频率大于第一设定值,第一距离表征两个第一账户对应的字符串的编辑距离。本发明实施例通过编辑距离确定两个账户的相似度,可以提高相似账户识别的准确率,尤其在识别使用社交软件的账户的相似性上具有良好的效果。
附图说明
图1是本发明实施例提供的一种相似账户确定方法的实现流程示意图;
图2是本发明实施例提供的另一种相似账户确定方法的实现流程示意图;
图3是本发明实施例提供的另一种相似账户确定方法的实现流程示意图;
图4是本发明应用实施例提供的一种相似账户确定流程示意图;
图5是本发明实施例提供的一种相似账户确定装置的示意图;
图6是本发明一实施例提供的电子设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,主要通过账户属性来挖掘账户的相似度,比如将相同年龄或相同性别的账户确定为相似账户,这种相似度确定方法过于简单,确定的账户相似度的准确性低,尤其对于社交场景下的相似账户并不适用。
针对上述相关技术的缺点,本发明实施例提供了一种相似账户确定方法,至少能够提高账户相似度识别的准确性。为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1是本发明实施例提供的一种相似账户确定方法的实现流程示意图,所述相似账户确定方法的执行主体为电子设备,电子设备包括台式电脑、笔记本电脑和服务器等。参考图1,相似账户确定方法包括:
S101,确定至少两个第一账户中的每个第一账户对应的字符串;所述字符串中的每一个字符对应一个访问对象;所述访问对象被第一账户访问的频率大于第一设定值。
这里,所述访问对象至少包括以下任意一项:
社交应用软件;
社交群组。
访问对象是社交应用软件时,社交应用软件可以是微信、QQ、钉钉等通讯类软件,也可以是淘宝、京东等购物类软件,这些软件都带有社交功能,账户之间能够进行交互。
访问对象还可以是社交应用软件中的社交群组,例如,社交群组可以是微信中的微信群、QQ中的QQ群、钉钉中的钉钉群、购物软件中的购物群等。
此外,访问对象还可以是淘宝、京东等购物类软件中的电子店铺。
因理解,在一个实施例中具有多个访问对象时,所有访问对象只能仅是社交应用软件,或所有访问对象只能仅是社交群组,不能同时既包括社交应用软件又包括社交群组。
这里,至少两个第一账户指用于确定相似度的账户集群,例如,至少两个第一账户可以是同一个社交群组中的账户,至少两个第一账户还可以是同一个社交应用软件的使用账户。
在本发明实施例中,字符串中的每一个字符对应一个访问对象,例如,字符串abc,其中,a对应微信,b对应QQ,c对应钉钉。字符串对应的访问对象被第一账户访问的频率大于第一设定值,也就是说字符串中的每一个字符对应的访问对象都是第一账户访问频率较高的访问对象。
在一实施例中,所述访问对象至少满足以下任意一项:
第一账户在设定时间段内访问所述访问对象的次数与访问所有访问对象的总次数的比值大于或等于第二设定值;
第一账户在所述设定时间段内访问所述访问对象的时长与访问所有访问对象的总时长的比值大于或等于第三设定值。
在实际应用中,假设第一账户一共访问过4个访问对象,分别为微信、QQ、知乎和钉钉,第一账户在设定时间段内访问微信的次数为10次,访问QQ的次数为10次,访问知乎的次数为5次,访问钉钉的次数为5次。则访问微信的次数与访问所有访问对象的总次数的比值为10/30,假设第二设定值为0.2,则访问微信的次数与访问所有访问对象的总次数的比值大于第二设定值。
假设第一账户在设定时间段内访问微信的时长为4小时,访问QQ的时长为4小时,访问知乎的时长为2小时,访问钉钉的时长为2小时,则访问微信的时长与访问所有访问对象的总时长的比值为4/12,假设第三设定值为0.2,则访问微信的时长与访问所有访问对象的总时长的比值大于第三设定值。
这里,字符串中的每一个字符对应的访问对象可以只满足上述任意一项条件,或者字符对应的访问对象只有同时满足上述两项条件时才能写入字符串中。例如,上述实施例中微信同时满足了两项条件,说明微信是第一账户访问频率较高的访问对象,将微信对应的字符写入第一账户对应的字符串中。
按照上述方法统计至少两个第一账户中的每个第一账户对应的字符串,例如,账户1对应字符串为abc,账户2对应字符串为abcd。其中。a对应微信,b对应QQ,c对应知乎,d对应钉钉。或者,a对应微信群1,b对应微信群2,c对应QQ群3,d对应QQ群4。
S102,确定所述至少两个第一账户中每两个第一账户之间的第一距离;所述第一距离表征两个第一账户对应的字符串的编辑距离。
这里,第一距离是两个第一账户对应的字符串的编辑距离,编辑距离是针对两个字符串的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。这里的处理指单字符编辑操作,单字符编辑操作有且仅有三种:***(Insertion)、删除(Deletion)和替换(Substitution)。
在一实施例中,所述确定所述至少两个第一账户中每两个第一账户之间的第一距离,包括:
确定所述第一字符串转换为所述第二字符串的最少编辑操作次数,所述最少编辑操作次数表征所述第一距离;其中,所述第一字符串和所述第二字符串分别表征所述至少两个第一账户中的任意两个第一账户分别对应的字符串。
例如,第一字符串为abcd,第二字符串为abe,将abcd转换为abe,需要先用e替换第一字符串中的c,然后删除第一字符串中的d,由此将第一字符串转换为第二字符串,上述最少编辑操作次数为2,即第一距离为2。
S103,基于所述至少两个第一账户中每两个第一账户之间的第一距离,确定所述至少两个第一账户中的每个第一账户对应的相似账户。
这里,可以利用两个第一账户之间的第一距离来判断两个第一账户是否为相似账户,例如,两个第一账户的第一距离小于设定值时,判定两个第一账户为相似账户。
参考图2,在本发明一实施例中,所述基于所述至少两个第一账户中每两个第一账户之间的第一距离,确定所述至少两个第一账户中的每个第一账户对应的相似账户,包括:
S201,基于所述第一距离确定对应的两个第一账户之间的相似度。
在一实施例中,所述相似度表征两个第一账户之间的第一距离与第一长度的第一比值;所述第一长度表征两个第一账户对应的字符串中字符串长度最大的字符串的长度。
这里,第一长度指两个第一账户对应的字符串中字符串长度最大的字符串的长度,比如第一字符串为abcd,第二字符串为abe,其中,第一字符串长度为4,第二字符串长度为3,其中字符串长度较长的为第一字符串,所以第一长度为4。
相似度计算公式为:
Figure 655543DEST_PATH_IMAGE001
其中,
Figure 480542DEST_PATH_IMAGE002
是账户u和v之间的第一距离,
Figure 805213DEST_PATH_IMAGE003
是第一长度。
参考图3,在一实施例中,所述基于所述第一距离确定对应的两个第一账户之间的相似度,包括:
S301,确定两个第一账户对应的字符串的字符串长度的差值。
将第一字符串的长度减去第二字符串的长度,然后取绝对值,得到两个第一账户对应的字符串的字符串长度的差值。
S302,在所述差值小于第五设定值的情况下,基于所述第一距离确定对应的两个第一账户之间的相似度。
差值小于第五设定值,说明两个第一账户对应的字符串长度相差不大,两个第一账户是相似账户的可能性越大。如果差值大于第五设定值,则直接判定,两个第一账户不是相似账户。本发明实施例通过两个第一账户对应的字符串的字符串长度的差值,可以提前排除掉一部分非相似账户,避免这些账户进入下一步的相似度计算,节省了确定账户相似度的时间。
S202,在所述相似度小于第四设定值的情况下,确定对应的两个第一账户为相似账户。
在本发明实施例中,相似度UserSim值越小,账户越相似,在UserSim小于第四设定值的情况下,说明两个第一账户为相似账户。
基于上述实施例,可以计算得到至少两个第一账户中每个第一账户对于的相似账户,每个第一账户都可以得到一个相似账户集群,相似账户集群中的账户都是该第一账户的相似账户。在需要基于账户之间的相似度向账户推送信息、产品或服务时,可以直接向相似账户集群中的账户推送相关信息。
本发明实施例通过确定至少两个第一账户中的每个第一账户对应的字符串,确定至少两个第一账户中每两个第一账户之间的第一距离,基于至少两个第一账户中每两个第一账户之间的第一距离,确定至少两个第一账户中的每个第一账户对应的相似账户。其中,字符串中的每一个字符对应一个访问对象,访问对象被第一账户访问的频率大于第一设定值,第一距离表征两个第一账户对应的字符串的编辑距离。本发明实施例通过编辑距离确定账户的相似度,可以提高相似账户识别的准确率,尤其在识别使用社交软件的账户的相似性上具有良好的效果。
参考图4,图4是本发明应用实施例提供的一种相似账户确定流程的示意图,相似账户确定流程包括:
数据库中存储着每个第一账户对访问对象的访问数据,访问数据包括第一账户访问访问对象的次数和时长,根据访问数据确定每个第一账户对应的字符串,字符串中的每一个字符对应一个访问对象,字符对应的访问对象被第一账户访问的频率大于第一设定值。具体的,第一账户在设定时间段内访问访问对象的次数与访问所有访问对象的总次数的比值大于或等于第二设定值,且第一账户在设定时间段内访问访问对象的时长与访问所有访问对象的总时长的比值大于或等于第三设定值。然后根据字符串计算每两个第一账户之间的编辑距离,根据编辑距离确定每个第一账户对应的相似账户。这里,两个第一账户的相似度表征两个第一账户之间的编辑距离与第一长度的第一比值,第一长度表征两个第一账户对应的字符串中字符串长度最大的字符串的长度。本发明应用实施例通过编辑距离确定两个第一账户之间的相似度,综合了账户访问访问对象的时间维度信息,有效提升了确定账户相似度的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和 “包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
需要说明的是,本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
另外,在本发明实施例中,“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
参考图5,图5是本发明实施例提供的一种相似账户确定装置的示意图,如图5所示,该装置包括:第一确定模块、第二确定模块、和第三确定模块。
第一确定模块,用于确定至少两个第一账户中的每个第一账户对应的字符串;所述字符串中的每一个字符对应一个访问对象;所述访问对象被第一账户访问的频率大于第一设定值;
第二确定模块,用于确定所述至少两个第一账户中每两个第一账户之间的第一距离;所述第一距离表征两个第一账户对应的字符串的编辑距离;
第三确定模块,用于基于所述至少两个第一账户中每两个第一账户之间的第一距离,确定所述至少两个第一账户中的每个第一账户对应的相似账户。
所述访问对象至少满足以下任意一项:
第一账户在设定时间段内访问所述访问对象的次数与访问所有访问对象的总次数的比值大于或等于第二设定值;
第一账户在所述设定时间段内访问所述访问对象的时长与访问所有访问对象的总时长的比值大于或等于第三设定值。
第三确定模块具体用于:
基于所述第一距离确定对应的两个第一账户之间的相似度;
在所述相似度小于第四设定值的情况下,确定对应的两个第一账户为相似账户。
所述相似度表征两个第一账户之间的第一距离与第一长度的第一比值;所述第一长度表征两个第一账户对应的字符串中字符串长度最大的字符串的长度。
第三确定模块具体用于:
确定两个第一账户对应的字符串的字符串长度的差值;
在所述差值小于第五设定值的情况下,基于所述第一距离确定对应的两个第一账户之间的相似度。
第二确定模块具体用于:
确定所述第一字符串转换为所述第二字符串的最少编辑操作次数,所述最少编辑操作次数表征所述第一距离;其中,所述第一字符串和所述第二字符串分别表征所述至少两个第一账户中的任意两个第一账户分别对应的字符串。
所述访问对象至少包括以下任意一项:
社交应用软件;
社交群组。
实际应用时,所述第一确定模块、第二确定模块、和第三确定模块可通过电子设备中的处理器,比如中央处理器(CPU,Central Processing Unit)、数字信号处理器(DSP,Digital Signal Processor)、微控制单元(MCU,Microcontroller Unit)或可编程门阵列(FPGA,Field-Programmable Gate Array)等实现。
需要说明的是:上述实施例提供的相似账户确定装置在进行相似账户确定时,仅以上述各模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的模块完成,即将装置的内部结构划分成不同的模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的相似账户确定装置与相似账户确定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
基于上述程序模块的硬件实现,且为了实现本申请实施例的方法,本申请实施例还提供了一种电子设备。图6为本申请实施例电子设备的硬件组成结构示意图,如图6所示,电子设备包括:
通信接口,能够与其它设备比如网络设备等进行信息交互;
处理器,与所述通信接口连接,以实现与其它设备进行信息交互,用于运行计算机程序时,执行上述电子设备侧一个或多个技术方案提供的方法。而所述计算机程序存储在存储器上。
当然,实际应用时,电子设备中的各个组件通过总线***耦合在一起。可理解,总线***用于实现这些组件之间的连接通信。总线***除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图6中将各种总线都标为总线***。
本申请实施例中的存储器用于存储各种类型的数据以支持电子设备的操作。这些数据的示例包括:用于在电子设备上操作的任何计算机程序。
可以理解,存储器可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本申请实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
上述本申请实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、DSP,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器,处理器读取存储器中的程序,结合其硬件完成前述方法的步骤。
可选地,所述处理器执行所述程序时实现本申请实施例的各个方法中由电子设备实现的相应流程,为了简洁,在此不再赘述。
在示例性实施例中,本申请实施例还提供了一种存储介质,即计算机存储介质,具体为计算机可读存储介质,例如包括存储计算机程序的第一存储器,上述计算机程序可由电子设备的处理器执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置、电子设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、 RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本申请实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
另外,在本申请实例中,“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种相似账户确定方法,其特征在于,所述方法包括:
确定至少两个第一账户中的每个第一账户对应的字符串;所述字符串中的每一个字符对应一个访问对象;所述访问对象被第一账户访问的频率大于第一设定值;
确定所述至少两个第一账户中每两个第一账户之间的第一距离;所述第一距离表征两个第一账户对应的字符串的编辑距离;
基于所述第一距离确定对应的两个第一账户之间的相似度;所述相似度表征两个第一账户之间的第一距离与第一长度的第一比值;所述第一长度表征两个第一账户对应的字符串中字符串长度最大的字符串的长度;
在所述相似度小于第四设定值的情况下,确定对应的两个第一账户为相似账户。
2.根据权利要求1所述的方法,其特征在于,所述访问对象至少满足以下任意一项:
第一账户在设定时间段内访问所述访问对象的次数与访问所有访问对象的总次数的比值大于或等于第二设定值;
第一账户在所述设定时间段内访问所述访问对象的时长与访问所有访问对象的总时长的比值大于或等于第三设定值。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一距离确定对应的两个第一账户之间的相似度,包括:
确定两个第一账户对应的字符串的字符串长度的差值;
在所述差值小于第五设定值的情况下,基于所述第一距离确定对应的两个第一账户之间的相似度。
4.根据权利要求1所述的方法,其特征在于,所述确定所述至少两个第一账户中每两个第一账户之间的第一距离,包括:
确定第一字符串转换为第二字符串的最少编辑操作次数,所述最少编辑操作次数表征所述第一距离;其中,所述第一字符串和所述第二字符串分别表征所述至少两个第一账户中的任意两个第一账户分别对应的字符串。
5.根据权利要求1所述的方法,其特征在于,所述访问对象至少包括以下任意一项:
社交应用软件;
社交群组。
6.一种相似账户确定装置,其特征在于,包括:
第一确定模块,用于确定至少两个第一账户中的每个第一账户对应的字符串;所述字符串中的每一个字符对应一个访问对象;所述访问对象被第一账户访问的频率大于第一设定值;
第二确定模块,用于确定所述至少两个第一账户中每两个第一账户之间的第一距离;所述第一距离表征两个第一账户对应的字符串的编辑距离;
第三确定模块,用于基于所述第一距离确定对应的两个第一账户之间的相似度;所述相似度表征两个第一账户之间的第一距离与第一长度的第一比值;所述第一长度表征两个第一账户对应的字符串中字符串长度最大的字符串的长度;
在所述相似度小于第四设定值的情况下,确定对应的两个第一账户为相似账户。
7.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的相似账户确定方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的相似账户确定方法。
CN202110406247.3A 2021-04-15 2021-04-15 一种相似账户确定方法、装置、电子设备及存储介质 Active CN112800291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110406247.3A CN112800291B (zh) 2021-04-15 2021-04-15 一种相似账户确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110406247.3A CN112800291B (zh) 2021-04-15 2021-04-15 一种相似账户确定方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112800291A CN112800291A (zh) 2021-05-14
CN112800291B true CN112800291B (zh) 2021-07-16

Family

ID=75811457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110406247.3A Active CN112800291B (zh) 2021-04-15 2021-04-15 一种相似账户确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112800291B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113538108A (zh) * 2021-07-27 2021-10-22 北京沃东天骏信息技术有限公司 一种资源信息确定方法、装置、电子设备及存储介质
CN114742479B (zh) * 2022-06-10 2022-09-06 深圳竹云科技股份有限公司 账号识别方法、装置、服务器及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和***
CN105511869A (zh) * 2015-12-01 2016-04-20 福建工程学院 一种基于用户反馈的需求跟踪***及方法
CN107305559A (zh) * 2016-04-21 2017-10-31 ***通信集团广东有限公司 一种应用推荐方法和装置
WO2018018610A1 (zh) * 2016-07-29 2018-02-01 深圳越界创新科技有限公司 一种匹配度计算方法、装置以及用户设备
KR20180099073A (ko) * 2017-02-28 2018-09-05 주식회사 인카코커뮤니케이션즈 유저 맞춤형 어플을 자동으로 추천하기 위한 장치 및 그 방법

Also Published As

Publication number Publication date
CN112800291A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN111090628B (zh) 一种数据处理方法、装置、存储介质及电子设备
CN112800291B (zh) 一种相似账户确定方法、装置、电子设备及存储介质
WO2020211236A1 (zh) 基于b+树的读写冲突解决方法、装置及存储介质
WO2018040270A1 (zh) 在Windows***中加载Linux***ELF文件的方法及装置
EP4174677A1 (en) Data reading and writing method and device
CN112667405B (zh) 信息处理方法、装置、设备及存储介质
KR20220125198A (ko) 데이터의 추가 기록 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램매체
CN110569218B (zh) 一种ext文件***离线修改方法、装置及存储介质
CN115470156A (zh) 基于rdma的内存使用方法、***、电子设备和存储介质
CN115114232A (zh) 一种历史版本对象列举方法、装置及其介质
CN113010542B (zh) 业务数据处理方法、装置、计算机设备及存储介质
CN114374392A (zh) 一种数据压缩存储方法、装置、终端设备及可读存储介质
WO2022089235A1 (zh) 产品的演示方法、装置、计算机设备及存储介质
CN111414527B (zh) 相似项目的查询方法、装置及存储介质
US20230409235A1 (en) File system improvements for zoned storage device operations
CN111858590B (zh) 一种存储***元数据组织方法、***、终端及存储介质
CN113806803A (zh) 一种数据存储方法、***、终端设备及存储介质
CN111221817B (zh) 业务信息数据存储方法、装置、计算机设备及存储介质
CN112231232A (zh) 确定测试数据模型及生成测试数据的方法、装置及设备
CN107741992B (zh) 会议记录的网络存储方法、装置、智能平板和存储介质
CN112527745B (zh) 嵌入式文件***多分区解析方法、终端设备及存储介质
CN112506651A (zh) 一种大数据量环境中数据运算的方法和设备
CN113411395B (zh) 访问请求路由方法、装置、计算机设备和存储介质
CN117806709B (zh) ***级芯片的性能优化方法、装置、设备和存储介质
CN112380174B (zh) 含删除文件的xfs文件***解析方法、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant