CN111385136B - 一种用户通信标识的确定方法和装置 - Google Patents
一种用户通信标识的确定方法和装置 Download PDFInfo
- Publication number
- CN111385136B CN111385136B CN201811653353.6A CN201811653353A CN111385136B CN 111385136 B CN111385136 B CN 111385136B CN 201811653353 A CN201811653353 A CN 201811653353A CN 111385136 B CN111385136 B CN 111385136B
- Authority
- CN
- China
- Prior art keywords
- target
- feature
- target user
- determining
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明实施例公开了一种用户通信标识的确定方法和装置,该方法包括:获取目标账号在目标社交平台上发布的N条历史消息对应的N个消息属性信息。根据各历史消息对应的发布时刻确定出N个时间窗,根据任一时间窗内的目标话单数据确定出M个目标用户中任一目标用户在任一时间窗上的话单属性信息,以得到各目标用户在N个时间窗上的N个话单属性信息。基于N个消息属性信息和各目标用户在N个时间窗上的N个话单属性信息进行信息特征提取,以得到M个目标用户对应的M个目标特征集合。根据各目标用户对应的目标特征集合确定出与目标账号唯一关联的目标用户通信标识。采用本发明实施例,可提升通信网络的投诉反馈效率和用户体验。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户通信标识的确定方法和装置。
背景技术
随着计算机网络技术和通信技术的不断发展,越来越多的人可享受到互联网技术带来的便利。特别是社交网络的兴起,给人们的日常生活带来了很大的改变。社交网络已经渗透到我们生活的方方面面,它突破了传统媒体的信心传播方式,使得人们可以自由的以文本或多媒体(如图片或者视频)等方式在社交网络上发布我们认为有价值的信息内容。但是,社交网络的兴起,在给人们生活带来便利的同时,也给网络供应商带来了挑战。由于人们可以自由的社交网络中发布或者浏览消息,当人们发现网络服务质量不佳时,人们往往会选择在社交网络上发布网络故障申报或者诸如“xxx网路供应商的用户体验差”等网络投诉信息,这些投诉信息都是公开的,很容易被更多的用户所接收,从而对网络供应商的品牌质量造成不良影响。因此,如何准确定位发出投诉信息的用户并针对性的提升这些用户的网络质量体验,成为了网络维护领域一大研究热点。
现有技术中,网络供应商只有在与社交网络平台有固定合作关系的前提下,才能准确的定位出某一社交账号在网络通信***中对应的用户,从而针对性的提升用户体验。若网络供应商和某些社交网络平台没有固定合作关系,则网络供应商就无法针对某些社交网络平台的用户发布的投诉信息进行故障分析和处理,导致网络供应商提供的通信网络的投诉反馈效率低、用户体验差。
发明内容
本发明实施例提供一种用户通信标识的确定方法和装置,可使得通信网络能准确的定位出社交账号对应的网络用户,继而针对性的进行故障分析和解决,可提升通信网络的网络投诉反馈效率,提升通信网络的用户体验。
第一方面,本发明实施例提供了一种用户通信标识的确定方法。首先,可获取目标账号在目标社交平台上发布的N条历史消息对应的N个消息属性信息。这里,一条历史消息对应一个消息属性信息。然后,可根据各历史消息对应的发布时刻确定出N个时间窗。再根据任一时间窗内的目标话单数据确定出M个目标用户中任一目标用户在所述任一时间窗上的话单属性信息,以得到所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息。这里,目标用户为各时间窗内与所述目标社交平台有业务交互的通信网络用户,目标话单数据为与所述目标用户相关联的话单数据。基于所述N个消息属性信息和所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息进行信息特征提取,以得到所述M个目标用户对应的M个目标特征集合。根据所述各目标用户对应的目标特征集合确定出各目标用户对应的目标概率,根据所述各目标用户对应的目标概率确定出与所述目标账号唯一关联的目标用户,并将所述目标用户对应的用户通信标识确定为目标用户通信标识。这里,一个目标概率用于指示一个目标用户与所述目标账号之间的关联程度。
在本发明实施例中,在获取到目标社交账号在社交平台上发布的N个历史消息对应的N个消息属性信息,以及M个用户在各历史消息对应的时间窗上的话单属性信息后,可对上述消息属性信息和话单属性信息进行特征提取,以得到M个用户对应的M个目标特征集合。然后可根据上述M个特征集合确定出可用于指示目标用户与目标社交账号关联程度的M个目标概率。最后根据上述M个目标概率从上述M个目标用户中确定出与目标社交账号唯一关联的目标用户,并将该目标用户在通信***中对应的用户通信标识确定为目标用户通信标识。通过对历史消息的消息属性和某一用户在历史消息对应的时间窗上的话单属性信息之间的信息比对和统计确定出某一目标用户与目标社交账号的关联程度,并进一步确定出与目标社交账号唯一关联的目标用户通信标识,可使得通信网络能准确的定位出社交账号对应的网络用户,继而针对性的进行故障分析和解决,可提升通信网络的网络投诉反馈效率,提升通信网络的用户体验。
在一些可行的实施方式中,可获取预设的时段阈值t。然后根据所述预设时段阈值t和任一历史消息i对应的发布时刻Ti确定出所述任一历史消息i对应的时间窗TDi,以得到N条历史消息对应的N个时间窗。这里,所述TDi=[Ti-t,Ti+t]。这里以历史消息的发布时间为基准确定出多个时间窗,可保证在各时间窗内获取到的话单数据中一定包含发布该历史消息的业务对应的话单数据,使得后续的信息特征提取过程和目标用户通信标识的确定过程合理且有效。
在一些可行的实施方式中,可对所述M个目标用户中任意一个目标用户i进行以下消息属性信息和话单属性信息的信息特征提取操作:先根据对所述目标用户i在任一时间窗上的话单属性信息与所述任一时间窗上的消息属性信息的比对和统计确定出所述目标用户i在所述任一时间窗上的比对特征集合,以得到所述目标用户i在N个时间窗上对应的N个比对特征集合。这里,一个比对特征集合中包括S个种类不同的比对特征。然后对所述目标用户i在N个时间窗上对应的N个比对特征集合进行特征融合,以得到所述目标用户i对应的目标特征集合。最后根据所述各目标用户对应的消息属性信息和话单数据信息的信息特征提取结果,确定出所述M个目标用户对应的M个征集合。通过信息比对和统计得到各目标用户在N个时间窗上对应的比对特征集合,上述比对特征集合用于表征话单属性信息和历史消息的消息属性信息之间的匹配程度。然后融合得到用于表征目标用户与发布历史消息的目标账号之间的关联程度的目标特征集合。该方法易于实现且合理有效,可提升用户通信标识的确定方法的效率。
在一些可行的实施方式中,上述S个种类不同的比对特征至少包括以下一种或多种:发起终端的类型相同标志、业务发生时间差值、话单个数、上行流量大小、下行流量相对大小、历史消息大小、多媒体数据标志和多媒体数据大小。
在一些可行的实施方式中,可从所述目标用户i在N个时间窗上对应的N个对比特征集合中确定出U个待融合特征组。这里,一个待融合特征组中包括所述目标用户i在所述各时间窗上的一种或者多种比对特征。根据任一待融合特征组所包括的比对特征的特征融合的结果确定出所述任一待融合特征组对应的目标特征值,以得到所述U个待融合特征组对应的U个目标特征值。根据所述U个目标特征值确定出所述目标用户i对应的目标特征集合。对相同的一种比特特征或者多种比对特征进行特征融合,过程简单,并且可保证融合得到的目标特征集合能够充分反映出目标用户与目标账号之间的关联程度。
在一些可行的实施方式中,所述U个待融合特征组中包括第一待融合特征组,所述第一待融合特征组中包括所述目标用户i在所述各时间窗上的第一种比对特征。可计算所述各时间窗上的第一种比对特征的特征值的平均值,并将所述平均值确定为所述任一待融合特征组对应的目标特征值。
在一些可行的实施方式中,所述U个待融合特征组中包括第二待融合特征组,所述第二待融合特征组中包括所述目标用户i在所述各时间窗上的第二种比对特征和第三种比对特征。计算所述各时间窗上的第二种比对特征和所述各时间窗上的第三种比对特征之间的相似度值,并将所述相似度值确定为所述任一待融合特征组对应的目标特征值。
在一些可行的实施方式中,所述U个待融合特征组中包括第三待融合特征组,所述第三待融合特征组中包括所述目标用户i在所述各时间窗上的第四种比对特征。计算所述各时间窗上的第四种比对特征的特征值之和,并将所述特征值之和与历史消息个数N之间的比值确定为所述任一待融合特征组对应的目标特征值。
在一些可行的实施方式中,可将所述各目标用户对应的目标特征集合依次输入到预设的分类模型中,并基于所属分类模型对所述各目标用户对应的目标特征集合的分类结果确定出各目标用户对应的目标概率。通过预设的训练好的分类模型确定出各目标用户对应的目标概率,可提升目标概率的有效性。
在一些可行的实施方式中,可将所述各目标用户对应的目标概率中最大的目标概率对应的目标用户确定为与所述目标账号唯一关联的目标用户。
在本发明实施例中,通过对历史消息的消息属性和某一用户在历史消息对应的时间窗上的话单属性信息之间的信息比对和统计确定出某一目标用户与目标社交账号的关联程度,并进一步确定出与目标社交账号唯一关联的目标用户通信标识。可使得通信网络能准确的定位出社交账号对应的网络用户,继而针对性的进行故障分析和解决,可提升通信网络的网络投诉反馈效率,提升通信网络的用户体验。
第二方面,本发明实施例提供了一种用户通信标识的确定装置,该确定装置包括用于执行上述第一方面的任意一种可能的实现方式所提供的用户通信标识的确定方法的单元,因此也能是实现第一方面提供的用户通信标识的确定方法所具备的有益效果(或者优点)。
第三方面,本发明实施例提供了一种电子设备,该电子设备包括处理器和存储器,上述处理器和存储器相互连接。其中,上述存储器用于存储计算机程序,上述计算机程序包括程序指令,上述处理器被配置用于调用上述程序指令执行上述第一方面提供的用户通信标识的确定方法,也能实现上述第一方面提供的用户通信标识的确定方法所具备的有益效果。
第四方面,本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当该指令在计算机上运行时,使得计算机执行上述第一方面中任意一种可能的实现方式所提供的用户通信标识的确定方法,也能实现第一方面提供的用户通信标识的确定方法所具备的有益效果。
第五方面,本发明实施例提供了一种芯片***,该芯片***包括处理器,用于支持终端设备实现上述第一方面中所涉及的功能,例如,生成或者处理上述第一方面提供的用户通信标识的确定方法中所涉及的信息。在一种可能的设计中,上述芯片***还包括存储器,该存储器用于保存终端必需的程序指令和数据。该芯片***可以由芯片构成,也可以包含芯片和其他分立器件。
第六方面,本发明实施例提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述第一方面提供的用户通信标识的确定方法,也能实现第一方面提供的用户通信标识的确定方法所具备的有益效果。
附图说明
图1是本发明实施例提供的一种用户通信标识的确定方法的流程示意图;
图2是本发明实施例提供的比对特征集合与各时间窗的对应关系示意图;
图3是本发明实施例提供的一种用户通信标识的确定装置的结构示意图;
图4是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明实施例提供的用户通信标识确定方法可由具备数据处理能力的终端设备执行,如台式计算机、膝上计算机等,此处不作限定。在本发明实施例中,如第一待融合特征组、第二待融合特征组之前的第一和第二仅用于区别不同的一个或者多个待融合特征组,不具有其他限定作用,后续的第一中比特特征、第二种比对特征等名称前面的第一和第二同理也不具备其他限定作用。
实施例一
请参见图1,图1是本发明实施例提供的一种用户通信标识的确定方法的流程示意图。为方便理解和描述,本实施例以终端设备为执行主体对上述用户通信标识的确定方法进行描述。上述确定方法包括以下步骤:
S101,获取目标账号在目标社交平台上发布的N条历史消息对应的N个消息属性信息。
在一些可行的实施方式中,终端设备可获取到目标账号在过去的一定时段内在目标社交平台发布的N条历史消息对应的N个消息属性信息。这里,上述目标账号为上述目标社交平台上已经完成注册的合法账号。一个历史消息对应一个消息属性信息。
具体实现中,终端设备可通过目标社交平台提供的应用程序编程接口(application programming interface,API),利用网页数据抓取等方法获取到目标社交平台在过去的一定时段内对应的历史数据。然后对上述历史数据进行筛选,以得到上述目标账号在过去的一定时段内发布的N条历史消息及上述N条历史消息中各历史消息对应的关联信息。这里,历史消息对应的关联信息为在目标平台上公开的和历史消息的发布者相关联的信息,例如发布历史消息的终端设备等信息。最后,终端设备可根据预设的第一信息类型从上述N条历史消息和N条历史消息对应的关联信息中确定出N条历史消息对应的N个消息属性信息。可选的,上述第一信息类型可包括发布时刻、消息内容、发布终端类型、消息中包含的多媒体数据的属性信息。这里,上述多媒体数据包括图片数据、视频数据,此处不作限定。上述多媒体数据属性用于指示历史消息是否包含多媒体数据以及包含的多媒体数据的大小。同理,可以理解到的是,上述一个历史消息对应的消息属性信息中也至少包括历史消息的发布时刻、历史消息内容、发布历史消息的终端类型、历史消息中包含的多媒体数据的属性信息。下面以获取N条历史消息中历史消息L对应的消息属性信息为例,终端设备通过目标社交平台提供的API接口获取到目标社交平台的历史数据后,可从上述历史数据中筛选出目标用户发布的历史消息L,并同时获取到历史消息L对应的消息发布时刻、发布终端类型等关联信息。然后根据预设的信息类型,从历史消息L和历史消息L对应的关联信息中,挑选出符合上述信息类型的数据,并将之确定为历史消息L对应的消息属性信息。
S102,根据各历史消息对应的发布时刻确定出N个时间窗,根据任一时间窗内的目标话单数据确定出M个目标用户中任一目标用户在任一时间窗上的话单属性信息,以得到M个目标用户中各目标用户在N个时间窗上的N个话单属性信息。
在一些可行的实施方式中,终端设备在获取到上述N条历史消息后,可根据上述N条历史消息对应的发布时刻确定出N个时间窗(一个时间窗即为一个固定的时段)。然后获取到上述N个时间窗中各时间窗内的目标话单数据。上述目标话单数据为上述各个时间窗内与目标社交平台相关联的话单数据。然后,终端设备可根据任一时间窗内的目标话单数据确定出该任一时间窗内的一个或者多个目标用户对应的话单属性信息,重复上述操作,最终即可得到M个目标用户中各目标用户在N个时间窗上的N个话单属性信息。这里,上述目标用户为各时间窗内与所述目标社交平台有业务交互的通信网络用户。
可选的,具体实现中,终端设备在获取到上述N条历史消息后,可确定出上述N条历史消息对应的N个发布时刻。这里,一条历史消息对应一个发布时刻。然后,获取到预设的时间段阈值t,再根据所述预设时段阈值t和上述N个发布时刻中任一历史消息i对应的发布时刻Ti确定出所述任一历史消息i对应的时间窗TDi。这里,上述TDi=[Ti-t,Ti+t]。例如,假设预设的时段阈值t为1分钟,历史消息i对应的发布时刻为13点55分,则历史消息i对应的时间窗为[13点54分,13点56分]。终端设备对上述N个发布时刻中每个发布时刻均进行上述操作,即可得到N条历史消息对应的N个时间窗。这里以历史消息的发布时间为基准确定出多个时间窗,可保证在各时间窗内获取到的话单数据中一定包含发布该历史消息的业务对应的话单数据,使得后续的信息特征提取过程和目标用户通信标识的确定过程合理且有效。
终端设备在确定出上述N个时间窗后,可通过深度报文检测(deep packertinspection,DPI)技术获取到的上述N个时间窗中各时间窗内的DPI数据。然后,终端设备可从上述各时间窗内的DPI数据中提取出与目标社交平台相关联的话单数据,以确定出N个时间窗中各时间窗对应的目标话单数据。这里,需要说明的是,在某一个时间窗内与目标社交平台相关联的话单数据即为该时间窗内的一个或者多个目标用户发起的与目标社交平台相关的业务请求所对应的话单数据。不同的业务类型产生话单数据不同,比如目标用户浏览目标社交平台的网页和目标用户在目标社交平台上发布消息就会产生不同的话单数据,因此,一个目标用户在一个时间窗内可对应一个或者多个话单数据。例如,在时间窗TDi内,终端设备通过DPI检测确定出有目标用户1、目标用户2和目标用户3共三个用户与上述目标社交平台存在数据交互,则终端设备可将上述目标用户1在时间窗TDi内的所有话单数据、上述目标用户2在时间窗TDi内的所有话单数据和上述目标用户3在时间窗TDi内的所有话单数据确定为时间窗TDi对应的目标话单数据。然后,终端设备根据预设的第二信息类型从上述各时间窗对应的目标话单数据中确定出M个目标用户中各目标用户在上述N个时间窗上对应的N个话单属性信息。这里,上述第二信息类型可包括话单对应的终端类型、话单开始时间、话单中包括的用户通信标识、话单对应的上行流量大小和话单对应的下行流量大小。具体的,以确定目标用户i在时间窗时间TDi上对应的一个话单属性信息为例。终端设备在获取到时间窗TDi对应的目标话单数据后,可提取出目标用户i对应的一个或者多个话单数据,并将上述一个或多个话单数据中上行流量最大的话单数据确定为目标用户i对应的疑似话单数据。然后,终端设备可根据从上述疑似话单数据中提取出符号上述第二信息类型的话单属性信息,如话单对应的终端类型、话单开始时间、话单中包括的用户通信标识、话单对应的上行流量大小和话单对应的下行流量大小,再将疑似话单数据对应的话单属性信息确定为目标用户i在时间窗TDi上对应的话单属性信息。这里还需要说明的是,上述M个目标用户为上述N个时间窗内所有出现过的目标用户。比如,假设N为2,时间窗TD1内存在目标用户1、目标用户2、目标用户3和目标用户4,时间窗2内存在目标用户1、目标用户2和目标用户4,则终端设备在获取到2个时间窗对应的目标话单数据后,可确定出目标用户1、目标用户2、目标用户3和目标用户4共4个目标用户对应的4个话单属性信息(上述目标用户3在时间窗TD2内对应的话单属性信息为空)。
下面举例说明终端设备得到M个目标用户中各目标用户在N个时间窗上的N个话单属性信息的过程。假设终端设备确定出4个时间窗,分别为时间窗TD1、时间窗TD2、时间窗TD3和时间窗TD4。终端设备可通过DPI探针获取到时间窗TD1对应的第一目标话单数据、时间窗TD2对应的第二目标话单数据、时间窗TD3对应的第三目标话单数据和时间窗TD4对应的第四目标话单数据。这里,假设第一目标话单数据包括目标用户1、目标用户2、目标用户3、目标用户4对应的话单数据;第二目标话单数据包括目标用户1、目标用户3、目标用户4对应的话单数据;第三目标话单数据包括目标用户1、目标用户2、目标用户3、目标用户4对应的话单数据;第四目标话单数据包括目标用户1、目标用户2、目标用户3、对应的话单数据。然后,终端设备可根据上述第一目标话单数据、第二目标话单数据、第三目标话单数据和第四目标话单数据确定出目标用户1在时间窗TD1、时间窗TD2、时间窗TD3和时间窗TD4上对应的第一疑似话单、第二疑似话单、第三疑似话单和第四疑似话单,再提取出目标用户1对应的第一疑似话单、第二疑似话单、第三疑似话单和第四疑似话单中各疑似话单对应的终端类型、开始时间、用户通信标识、上行流量大小和下行流量大小,以得到目标用户1在时间窗TD1、时间窗TD2、时间窗TD3和时间窗TD4上对应的4个话单属性信息。同理,终端设备可确定出目标用户2、目标用户3和目标用户4在时间窗TD1、时间窗TD2、时间窗TD3和时间窗TD4上对应的4个话单属性信息,其中,目标用户2在时间窗TD2上对应的话单属性信息可为空,目标用户4在时间窗TD4上对应的话单属性信息可为空。最终,终端设备可确定出4个目标用户中各目标用户在各时间窗上对应的话单属性信息。
S103,基于N个消息属性信息和M个目标用户中各目标用户在N个时间窗上的N个话单属性信息进行信息特征提取,以得到M个目标用户对应的M个目标特征集合。
在一些可行的实施方式中,终端设备在获取到上述N个消息属性信息和M个目标用户中各目标用户在N个时间窗上的N个话单属性信息后,可基于N个消息属性信息和M个目标用户中各目标用户在N个时间窗上的N个话单属性信息进行信息特征提取,以得到M个目标用户对应的M个目标特征集合。这里,一个目标用户对应一个目标特征集合。为方便理解和描述,下面以确定出目标用户i对应的目标特征集合的过程为例,对终端设备确定M个目标用户对应的M个目标特征集合的过程进行描述。
可选的,具体实现中,终端设备在确定出目标用户i在各时间窗上对应的话单属性信息后,可将各时间窗中任一时间窗TDi上对应的消息属性信息和目标用户i对应的话单属性信息进行比对和统计,以得到目标用户i在时间窗TDi上对应的对比特征集合。这里,上述比对特征集合中包括S种类型的比对特征。可选的,上述比对特征集合中具体可包括发起终端的类型相同标志V1、业务发生时间差值V2、话单个数V3、上行流量大小V4、下行流量相对大小V5、历史消息大小V6、多媒体数据标志V7、和多媒体数据大小V8这8种比对特征。下文将以比对特征集合中包含上述8种比对特征为例进行描述。
假设时间窗TDi对应历史消息Z,对应消息属性信息Zi,其中,消息属性信息Zi包括了消息Z发布时刻t1、发布消息Z的终端类型、消息Z的内容大小Q1、消息Z的多媒体属性信息。目标用户i对应的话单属性信息包括话单终端类型、话单开始时间t2、话单内的用户通信标识、话单上行流量大小Q2和话单下行流量大小Q3。
终端设备可对比发布消息Z的终端类型与话单终端类型是否一致,若一致,则确定比对特征V1的特征值为1,否则确定为0。终端设备可计算消息Z发布时刻t1与话单开始时间t2的差值,并确定比对特征V2的值为t1-t2。终端设备可根据目标用户i在时间窗TDi内的话单个数确定比对特征V3的值。终端设备可将目标用户i对应的话单属性信息中的话单上行流量大小Q2确定为比对特征V4的值。终端设备可将目标用户i在时间窗TDi上的疑似话单的下行流量相对大小确定为比对特征V5的值。如终端设备可将目标用户i在时间窗TDi上的疑似话单的下行流量大小(即上述Q3)与该疑似话单发生时刻相邻的两个话单的下行流量大小进行比较,以确定出目标用户i的疑似话单的相对下行流量大小。例如,假设目标用户i在TDi时刻上的疑似话单的下行流量大小为y1,与其发生时刻前后相邻的两个话单的下行流量大小分别为y0和y2。预设的相对大小为1,2,3。终端设备可对比y0、y1和y2,得到y1在y0、y1和y2这三个数据中的大小顺序,假设顺序为y0<y1<y2,则终端设备可确定目标用户i的疑似话单的相对下行流量大小为2,即确定下行流量相对大小V5的值为2。终端设备还可将历史消息Z的内容大小Q1确定为比对特征V6的值。终端设备还可根据消息Z的多媒体属性信息判断消息Z中是否包含多媒体数据。若判断为是,则确定比对特征V7的值为1,否则,可确定比对特征V7的值为0。终端设备还可根据消息Z的多媒体属性信息中包括的多媒体数据的大小确定出比对特征V8的值。最终,终端设备可通过上述比对特征V1到比对特征V8组成目标用户i在时间窗TDi上对应的比对特征集合。同理,终端设备对各时间窗上的消息属性信息和目标用户i对应的话单属性信息均进行上述比对和统计操作,即可得到目标用户i在N个时间窗上对应的N个比对特征集合。并且,每个比特特征集合中均包含了上述8种比对特征。
这里,容易理解到的是,终端设备对M个目标用户中各目标用户均进行上述比对和统计操作,即可获取到M个目标用户中每个目标用户在各时间窗上对应的比对特征集合。为了方便理解,请参见图2,图2是本发明实施例提供的一种比对特征集合与各时间窗的对应关系示意图。由图中可知,M个目标用户中任一个目标用户在某一个时间窗上都会对应一个比对特征集合,也就是说,一个目标用户在N个时间窗上对应N个比对特征集合(如目标用户1对应比对特征集合1到比对特征集合N共N个比对特征集合),M个用户在N个时间窗上总共对应了M*N个比对特征集合。
在一些可行的实施方式中,终端设备确定出目标用户i中在N个时间窗上对应的N个比对特征集合后,可对上述N个比对特征集合进行特征融合,以得到目标用户i对应的目标特征集合。具体的,终端设备可先根据上述N个比对特征集合确定出U个待融合特征组。这里,一个待融合特征组中可包括目标用户i在所述各时间窗上的一种或者多种比对特征。例如,某一待融合特征组中可包括目标用户i在N个时间窗上的N个比对特征V1。某一待融合特征组中可包括目标用户i在N个时间窗上的N个比对特征V4和N个比对特征V6。然后,终端设备可对上述U个待融合特征组中包括的比对特征进行融合,以得到U个目标特征值。这里,一个待融合特征组融合得到一个目标特征值。最后,终端设备可将上述U个目标特征值组成所述目标用户i对应的目标特征集合。
具体实现中,可选的,假设上述U个待融合特征组中可包括第一待融合特征组,所述第一待融合特征组中包括所述目标用户i在所述各时间窗上的第一种比对特征。终端设备可计算所述各时间窗上的第一种比对特征的特征值的平均值,并将所述平均值确定为所述第一待融合特征组对应的目标特征值。可选的,假设所述U个待融合特征组中包括第二待融合特征组,所述第二待融合特征组中包括所述目标用户i在所述各时间窗上的第二种比对特征和第三种比对特征。终端设备可计算所述各时间窗上的第二种比对特征和所述各时间窗上的第三种比对特征之间的相似度值,并将所述相似度值确定为所述第二待融合特征组对应的目标特征值。可选的,假设所述U个待融合特征组中包括第三待融合特征组,所述第三待融合特征组中包括所述目标用户i在所述各时间窗上的第四种比对特征。终端设备可计算所述各时间窗上的第四种比对特征的特征值之和,并将所述特征值之和与历史消息个数N之间的比值确定为所述第三待融合特征组对应的目标特征值。
例如,假设预先设定了8个待融合特征组,第一待融合特征组中包括目标用户i在各时间窗上的N个对比特征V1。终端设备可计算出上述N个比对特征V1对应的特征值的和与历史消息个数N的比值B’,并将log10(B’)确定为第一待融合特征组对应的目标特征值。第二待融合特征组中包括目标用户i在各时间窗上的N个比对特征V2,终端设备可计算出上述N个比对特征V2的特征值的平均值,并将该平均值确定为第二待融合特征组对应的目标特征值。第三待融合特征组中包括目标用户i在各时间窗上的N个比对特征V3,终端设备可计算出上述N个比对特征V3的特征值的平均值,并将该平均值确定为第三待融合特征组对应的目标特征值。第四待融合特征组中包括目标用户i在各时间窗上的N个比对特征V4和比对特征V6,终端设备可计算出N个比对特征V4的特征值组成的第一序列与N个比对特征V6的特征值组成的第二序列的相似度值,并将该相似度值确定为第四待融合特征组对应的目标特征值。这里,可选的,终端设备可计算第一序列和第二序列的皮尔逊系数,并将该系数确定为第四待融合特征组对应的目标特征值。第五待融合特征组中包括了目标用户i在N个时间窗上的N个比对特征V5,终端设备可计算上述N个比对特征V5的均值,并将该均值确定为第五待融合特征组对应的目标特征值。第六待融合特征组中包括了目标用户在N个时间床上的N个比对特征V7,终端设备可计算上述N个比对特征V7的特征值之和,并将该特征值之和与历史消息个数N的比值确定为第六待融合特征组对应的目标特征值。第七待融合特征值包括了目标用户i在N个时间窗上对应的N个比对特征V4、N个比对特征V7和N个比对特征V8。终端设备可计算N个比对特征V8中各比对特征V8和N个比对特征V4中各比对特征V4的比值,以得到N个比值。例如,假设有4个比对特征V8,分别为V81、V82、V83和V84,有4个比对特征V4,分别为V41、V42、V43和V44,终端设备可计算出V81/V41,V82/V42,V83/V43,V84/V44这4个比值。然后,终端设备可求取上述N个比值之和,还可求取上述N个比对特征V7的特征值之和,最后将上述N个比值之和与上述N个比对特征V7的特征值之和之间的比例值确定为第七待融合特征值的目标特征值。第八待融合特征组中包括由目标用户i在N个时间窗上的N个比对特征V3。终端设备可根据上述N个比对特征值V3确定出的N个逻辑值,当比对特征V3的值不为0时,该逻辑值为1,当比对特征V3的值为0时,该逻辑值为0。终端设备可计算出上述N个逻辑值之和,并将上述N个逻辑值之和与历史消息个数N的比值确定为第八待融合特征组的目标特征值。最终,终端设备可将上述第一待融合特征组到第八待融合特征组对应的8个目标特征值组成目标用户i对应的目标特征值集合。
这里,很容易理解到的是,终端设备可对M个目标用户中各目标用户对用的N个比对特征重复上述特征融合操作,即可得到M个目标用户对应的M个目标特征集合。
S104,根据各目标用户对应的目标特征集合确定出各目标用户对应的目标概率,根据各目标用户对应的目标概率确定出与目标账号唯一关联的目标用户,并将目标用户对应的用户通信标识确定为目标用户通信标识。
在一些可行得实施方式中,终端设备在获取到上述M个目标用户对应的M个目标特征集合后,可对上述M个目标特征集合中各目标特征集合进行数据分析和处理,以得到各目标用户对应的目标概率。然后,终端设备可根据各目标用户对应的目标概率确定出与目标账号唯一关联的目标用户,并将目标用户对应的用户通信标识确定为目标用户通信标识。其中,目标用户对应的用户通信标识可由目标用户的话单数据确定。一个目标概率用于指示一个目标用户与所述目标账号之间的关联程度。
下面以根据目标用户i对应的目标特征集合j确定目标用户i对应的目标概率的过程为例,对终端设备根据各目标用户对应的目标特征集合确定出各目标用户对应的目标概率的过程进行描述。
可选的,具体实现中,终端设备可将目标特征集合j输入到预先训练好的分类模型中,然后根据该分类模型的输出结果确定出目标用户i对应的目标概率。这里,上述分类模型可包括基于随机森林机器学习算法的分类模型、基于神经网络算法的分类模型等,此处不作限定。同理,终端设备将M个目标用户中各目标用户对应的目标特征集合依次输入到上述分类模型中,即可根据分类模型的输出结果确定出上述M个目标用户对应的M个目标概率。
终端设备在获取到上述M个用户对应的M个目标概率后,终端设备可根据各目标用户对应的目标概率确定出与目标账号唯一关联的目标用户。可选的,终端设备可确定出上述M个目标概率中的最大的目标概率,并将最大的目标概率对应的目标用户确定为与所述目标账号唯一关联的目标用户。最后,终端设备可从该目标用户对应的话单数据中提取出该目标用户对应的用户通信标识,并将该目标用户对应的用户通信标识确定为与上述目标账号唯一匹配的目标用户通信标识。
可选的,终端设备还可对预设的待训练的分类模型进行训练,以得到训练后的分类模型。具体的,终端设备可获取到E个正样本用户对应的正样本特征集合与负样本特征集合。下面以终端设备获取到正样本用户c对应的正样本目标特征集合与负样本目标特征集合的过程为例。终端设备首先可获取正样本用户c在过去一个预设时段内通过样本账号在目标社交平台上发布的F条历史消息对应的消息属性信息。然后基于上述F条历史消息对应的F个发布时刻确定出F个时间窗。具体过程可参见前文所述的确定N个时间窗的过程,此处便不再赘述。然后终端设备可获取到正样本用户c在上述F个时间窗上对应的F个话单数据属性信息,并基于正样本用户c在上述F个时间窗上对应的F个话单数据属性信息和上述F条历史消息对应的消息属性信息确定出正样本用户c在上述F个时间窗上对应的F个样本比对特征集合最后,终端设备可基于上述F个样本比对特征集合确定出上述正样本用户c对应的正样本目标特征集合,具体过程可参见前文所述的终端设备确定目标用户的目标特征集合的过程,此处便不再赘述。同时,终端设备还可获取到除上述样本用户c以外的一个或者多个负样本用户中各负样本用户对应的负样本目标特征集合。同理,重复上述操作,终端设备可获取到上述E个正样本用户对应的E个正样本目标特征集合以及多个负样本用户对应的负样本目标特征集合。然后,终端设备可为上述E个正样本用户对应的E个正样本目标特征集合以及多个负样本用户对应的负样本目标特征集合打上标签。上述标签用于指示其对应的样本目标特征集合所关联的样本用户是否与样本账号唯一匹配。例如,正样本目标特征集合可标记为1,负样本目标特征集合可标记为0。最后,终端设备可将打上标签后的E个正样本目标特征集合以及多个负样本用户对应的负样本目标特征集合依次输入到待训练的分类模型中,对待训练的分类模型进行多次迭代训练,直至待训练的分类模型的模型参数收敛,则可得到训练后的分类模型。
可选的,实际应用中,为了扩充正样本或者负样本的数量,终端设备在获取到正样本用户c对应的F个样本比对特征集合后,可随机从上述F个样本比对特征集合中采样出一个或者多个样本比对特征集合。例如。可随机采样F次,第一次采样1个样本比对特征集合,第二次采样2个样本比对特征集合,如此类推,第F次采样F个样本比对特征集合。对上述F次采样得到的F个样本比对特征集合的组合进行特征融合,即可得到正样本用户对应的F个正样本目标特征集合。同理,负样本目标特征集合也可以采用上述方法得到样本过程。
在本发明实施例中,在获取到目标社交账号在社交平台上发布的N个历史消息对应的N个消息属性信息,以及M个用户在各历史消息对应的时间窗上的话单属性信息后,可对上述消息属性信息和话单属性信息进行特征提取,以得到M个用户对应的M个目标特征集合。然后可根据上述M个特征集合确定出可用于指示目标用户与目标社交账号关联程度的M个目标概率。最后根据上述M个目标概率从上述M个目标用户中确定出与目标社交账号唯一关联的目标用户,并将该目标用户在通信***中对应的用户通信标识确定为目标用户通信标识。通过对历史消息的消息属性和某一用户在历史消息对应的时间窗上的话单属性信息之间的信息比对和统计确定出某一目标用户与目标社交账号的关联程度,并进一步确定出与目标社交账号唯一关联的目标用户通信标识,可使得通信网络能准确的定位出社交账号对应的网络用户,继而针对性的进行故障分析和解决,可提升通信网络的网络投诉反馈效率,提升通信网络的用户体验。
实施例二
请参见图3,图3是本发明实施例提供的一种用户通信标识的确定装置的结构示意图。该确定装置包括:
消息属性信息确定单元10,用于获取目标账号在目标社交平台上发布的N条历史消息对应的N个消息属性信息。这里,一条历史消息对应一个消息属性信息。
话单属性信息确定单元20,用于根据消息属性信息确定单元10获取的各历史消息对应的发布时刻确定出N个时间窗,根据任一时间窗内的目标话单数据确定出M个目标用户中任一目标用户在所述任一时间窗上的话单属性信息,以得到所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息。这里,目标用户为各时间窗内与所述目标社交平台有业务交互的通信网络用户,目标话单数据为与所述目标用户相关联的话单数据。
信息特征提取单元30,用于基于所述消息属性信息确定单元10确定的所述N个消息属性信息和所述话单属性信息确定单元20确定的所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息进行信息特征提取,以得到所述M个目标用户对应的M个目标特征集合.
用户通信标识确定单元40,用于根据所述信息特征提取单元30确定的所述各目标用户对应的目标特征集合确定出各目标用户对应的目标概率。根据所述各目标用户对应的目标概率确定出与所述目标账号唯一关联的目标用户,并将所述目标用户对应的用户通信标识确定为目标用户通信标识。这里,一个目标概率用于指示一个目标用户与所述目标账号之间的关联程度。
在一些可行的实施方式中,所述话单属性信息确定单元20用于:
获取预设的时段阈值t。根据所述预设时段阈值t和任一历史消息i对应的发布时刻Ti确定出所述任一历史消息i对应的时间窗TDi,以得到N条历史消息对应的N个时间窗。这里,所述TDi=[Ti-t,Ti+t]。
在一些可行的实施方式中,所述信息特征提取单元30用于:
对所述M个目标用户中任意一个目标用户i进行以下消息属性信息和话单数据信息的信息特征提取操作:根据对所述话单属性信息确定单元20确定的所述目标用户i在任一时间窗上的话单属性信息与所述消息属性信息确定单元10确定的所述任一时间窗上的消息属性信息的比对和统计确定出所述目标用户i在所述任一时间窗上的比对特征集合,以得到所述目标用户i在N个时间窗上对应的N个比对特征集合。这里,一个比对特征集合中包括S个种类不同的比对特征。对所述目标用户i在N个时间窗上对应的N个比对特征集合进行特征融合,以得到所述目标用户i对应的目标特征集合。根据所述各目标用户对应的消息属性信息和话单属性信息的信息特征提取结果,确定出所述M个目标用户对应的M个目标特征集合。
在一些可行的实施方式中,所述S个种类不同的比对特征至少包括以下一种或多种:发起终端的类型相同标志、业务发生时间差值、话单个数、上行流量大小、下行流量相对大小、历史消息大小、多媒体数据标志和多媒体数据大小。
在一些可行的实施方式中,所述信息特征提取单元30用于:
从所述目标用户i在N个时间窗上对应的N个对比特征集合中确定出U个待融合特征组。其中,一个待融合特征组中包括所述目标用户i在所述各时间窗上的一种或者多种比对特征。根据任一待融合特征组所包括的比对特征的特征融合的结果确定出所述任一待融合特征组对应的目标特征值,以得到所述U个待融合特征组对应的U个目标特征值。根据所述U个目标特征值确定出所述目标用户i对应的目标特征集合。
在一些可行的实施方式中,所述U个待融合特征组中包括第一待融合特征组,所述第一待融合特征组中包括所述目标用户i在所述各时间窗上的第一种比对特征。所述信息特征提取单元30用于:计算所述各时间窗上的第一种比对特征的特征值的平均值,并将所述平均值确定为所述第一待融合特征组对应的目标特征值。
在一些可行的实施方式中,所述U个待融合特征组中包括第二待融合特征组,所述第二待融合特征组中包括所述目标用户i在所述各时间窗上的第二种比对特征和第三种比对特征。所述信息特征提取单元30用于:计算所述各时间窗上的第二种比对特征和所述各时间窗上的第三种比对特征之间的相似度值,并将所述相似度值确定为所述第二待融合特征组对应的目标特征值。
在一些可行的实施方式中,所述U个待融合特征组中包括第三待融合特征组,所述第三待融合特征组中包括所述目标用户i在所述各时间窗上的第四种比对特征。所述信息特征提取单元30用于:计算所述各时间窗上的第四种比对特征的特征值之和,并将所述特征值之和与历史消息个数N之间的比值确定为所述第三待融合特征组对应的目标特征值。
在一些可行的实施方式中,所述用户通信标识确定单元40用于:
将所述信息特征提取单元确定的所述各目标用户对应的目标特征集合依次输入到预设的分类模型中,并基于所属分类模型对所述各目标用户对应的目标特征集合的分类结果确定出各目标用户对应的目标概率。
在一些可行的实施方式中,所述用户通信标识确定单元40用于:
将所述各目标用户对应的目标概率中最大的目标概率对应的目标用户确定为与所述目标账号唯一关联的目标用户。
在一些可行的实施方式中,消息属性信息确定单元10可获取目标账号在目标社交平台上发布的N条历史消息对应的N个消息属性信息。其中,一条历史消息对应一个消息属性信息。具体过程可参见实施例一中步骤S101中所描述的获取N条历史消息对应的N个消息属性信息的过程,此处便不再赘述。话单属性信息确定单元20可用于根据消息属性信息确定单元10获取的各历史消息对应的发布时刻确定出N个时间窗,具体过程可参见实施例一中步骤S102中所描述逇确定N个时间窗的过程,此处便不再赘述。其后,话单属性信息确定单元20可根据任一时间窗内的目标话单数据确定出M个目标用户中任一目标用户在所述任一时间窗上的话单属性信息,以得到所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息。具体过程可参见实施例一中步骤S102内描述的确定个话单属性信息的过程,此处便不再赘述。其后,信息特征提取单元30可基于所述消息属性信息确定单元10确定的所述N个消息属性信息和所述话单属性信息确定单元20确定的所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息进行信息特征提取,以得到所述M个目标用户对应的M个目标特征集合。具体过程可参见实施例一步骤S103中所描述的确定M个目标用户对应的M个目标特征集合的过程,此处便不再赘述。最后,用户通信标识确定单元40可根据所述信息特征提取单元30确定的所述各目标用户对应的目标特征集合确定出各目标用户对应的目标概率。然后根据所述各目标用户对应的目标概率确定出与所述目标账号唯一关联的目标用户,并将所述目标用户对应的用户通信标识确定为目标用户通信标识。具体过程参见实施例一中步骤S104中所描述的确定目标用户通信标识的过程,此处便不再赘述。
在本发明实施例中,通过对历史消息的消息属性和某一用户在历史消息对应的时间窗上的话单属性信息之间的信息比对和统计确定出某一目标用户与目标社交账号的关联程度,并进一步确定出与目标社交账号唯一关联的目标用户通信标识,可使得通信网络能准确的定位出社交账号对应的网络用户,继而针对性的进行故障分析和解决,可提升通信网络的网络投诉反馈效率,提升通信网络的用户体验。
请参见图4,图4是本发明实施例提供的一种电子设备的结构示意图。本发明实施例提供的电子设备包括处理器401、存储器402和总线***403。其中,上述处理器401、存储器402通过总线***403连接。
上述存储器402用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器402包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmableread only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM)。图4中仅示出了一个存储器,当然,存储器也可以根据需要,设置为多个。
存储器402也可以是处理器401中的存储器,在此不做限制。
存储器402存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作***:包括各种***程序,用于实现各种基础业务以及处理基于硬件的任务。
上述处理器401控制电子设备的操作,处理器401可以是一个或多个中央处理器(central processing unit,CPU)。在处理器401是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
具体的应用中,电子设备的各个组件通过总线***403耦合在一起,其中总线***403除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图4中将各种总线都标为总线***403。为便于表示,图4中仅是示意性画出。
本发明实施例揭示的用户通信标识的方法,可以应用于处理器401中,或者由处理器401实现。处理器401可能是一种集成电路芯片,具有信号的处理能力。
本发明的实施例中提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当该指令在计算机上运行时,可实现上述实施例一中所描述的一种用户通信标识的确定方法。
上述计算机可读存储介质可以是前述实施例一所述的一种用户通信标识的确定装置的内部存储单元。上述计算机可读存储介质也可以是上述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,上述计算机可读存储介质还可以既包括上述终端设备的内部存储单元也包括外部存储设备。上述计算机可读存储介质用于存储上述计算机程序以及上述终端设备所需的其他程序和数据。上述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。
Claims (22)
1.一种用户通信标识的确定方法,其特征在于,所述方法包括:
获取目标账号在目标社交平台上发布的N条历史消息对应的N个消息属性信息,其中,一条历史消息对应一个消息属性信息;
根据各历史消息对应的发布时刻确定出N个时间窗,根据任一时间窗内的目标话单数据确定出M个目标用户中任一目标用户在所述任一时间窗上的话单属性信息,以得到所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息,其中,目标用户为各时间窗内与所述目标社交平台有业务交互的通信网络用户,目标话单数据为与所述目标用户相关联的话单数据;
基于所述N个消息属性信息和所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息进行信息特征提取,以得到所述M个目标用户对应的M个目标特征集合;
根据所述各目标用户对应的目标特征集合确定出各目标用户对应的目标概率,根据所述各目标用户对应的目标概率确定出与所述目标账号唯一关联的目标用户,并将所述目标用户对应的用户通信标识确定为目标用户通信标识,其中,一个目标概率用于指示一个目标用户与所述目标账号之间的关联程度。
2.如权利要求1所述的方法,其特征在于,所述根据各历史消息对应的发布时刻确定出N个时间窗包括:
获取预设的时段阈值t;
根据所述预设时段阈值t和任一历史消息i对应的发布时刻Ti确定出所述任一历史消息i对应的时间窗TDi,以得到N条历史消息对应的N个时间窗;
其中,所述TDi=[Ti-t,Ti+t]。
3.如权利要求2所述的方法,其特征在于,所述基于所述N个消息属性信息和所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息进行特征提取,以得到所述M个目标用户对应的M个目标特征集合包括:
对所述M个目标用户中任意一个目标用户i进行以下消息属性信息和话单数据信息的信息特征提取操作:
根据对所述目标用户i在任一时间窗上的话单属性信息与所述任一时间窗上的消息属性信息的比对和统计确定出所述目标用户i在所述任一时间窗上的比对特征集合,以得到所述目标用户i在N个时间窗上对应的N个比对特征集合,其中,一个比对特征集合中包括S个种类不同的比对特征;
对所述目标用户i在N个时间窗上对应的N个比对特征集合进行特征融合,以得到所述目标用户i对应的目标特征集合;
根据所述各目标用户对应的消息属性信息和话单属性信息的信息特征提取结果,确定出所述M个目标用户对应的M个目标特征集合。
4.根据权利要求3所述的方法,其特征在于,所述S个种类不同的比对特征至少包括以下一种或多种:发起终端的类型相同标志、业务发生时间差值、话单个数、上行流量大小、下行流量相对大小、历史消息大小、多媒体数据标志和多媒体数据大小。
5.根据权利要求4所述的方法,其特征在于,所述对所述目标用户i在N个时间窗上对应的N个比对特征集合进行特征融合,以得到所述目标用户i对应的目标特征集合包括:
从所述目标用户i在N个时间窗上对应的N个对比特征集合中确定出U个待融合特征组,其中,一个待融合特征组中包括所述目标用户i在所述各时间窗上的一种或者多种比对特征;
根据任一待融合特征组所包括的比对特征的特征融合的结果确定出所述任一待融合特征组对应的目标特征值,以得到所述U个待融合特征组对应的U个目标特征值;
根据所述U个目标特征值确定出所述目标用户i对应的目标特征集合。
6.根据权利要求5所述的方法,其特征在于,所述U个待融合特征组中包括第一待融合特征组,所述第一待融合特征组中包括所述目标用户i在所述各时间窗上的第一种比对特征;
所述根据任一待融合特征组所包括的比对特征的特征融合的结果确定出所述任一待融合特征组对应的目标特征值包括:
计算所述各时间窗上的第一种比对特征的特征值的平均值,并将所述平均值确定为所述第一待融合特征组对应的目标特征值。
7.根据权利要求5或6所述的方法,其特征在于,所述U个待融合特征组中包括第二待融合特征组,所述第二待融合特征组中包括所述目标用户i在所述各时间窗上的第二种比对特征和第三种比对特征;
所述根据任一待融合特征组所包括的比对特征的特征融合的结果确定出所述任一待融合特征组对应的目标特征值包括:
计算所述各时间窗上的第二种比对特征和所述各时间窗上的第三种比对特征之间的相似度值,并将所述相似度值确定为所述第二待融合特征组对应的目标特征值。
8.根据权利要求5或6所述的方法,其特征在于,所述U个待融合特征组中包括第三待融合特征组,所述第三待融合特征组中包括所述目标用户i在所述各时间窗上的第四种比对特征;
所述根据任一待融合特征组所包括的比对特征的特征融合的结果确定出所述任一待融合特征组对应的目标特征值包括:
计算所述各时间窗上的第四种比对特征的特征值之和,并将所述特征值之和与历史消息个数N之间的比值确定为所述第三待融合特征组对应的目标特征值。
9.根据权利要求8所述的方法,其特征在于,所述根据所述各目标用户对应的目标特征集合确定出各目标用户对应的目标概率包括:
将所述各目标用户对应的目标特征集合依次输入到预设的分类模型中,并基于所属分类模型对所述各目标用户对应的目标特征集合的分类结果确定出各目标用户对应的目标概率。
10.根据权利要求9所述的方法,其特征在于,所述根据所述各目标用户对应的目标概率确定出与所述目标账号唯一关联的目标用户包括:
将所述各目标用户对应的目标概率中最大的目标概率对应的目标用户确定为与所述目标账号唯一关联的目标用户。
11.一种用户通信标识的确定装置,其特征在于,所述装置包括:
消息属性信息确定单元,用于获取目标账号在目标社交平台上发布的N条历史消息对应的N个消息属性信息,其中,一条历史消息对应一个消息属性信息;
话单属性信息确定单元,用于根据各历史消息对应的发布时刻确定出N个时间窗,根据任一时间窗内的目标话单数据确定出M个目标用户中任一目标用户在所述任一时间窗上的话单属性信息,以得到所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息,其中,目标用户为各时间窗内与所述目标社交平台有业务交互的通信网络用户,目标话单数据为与所述目标用户相关联的话单数据;
信息特征提取单元,用于基于所述消息属性信息确定单元确定的所述N个消息属性信息和所述话单属性信息确定单元确定的所述M个目标用户中各目标用户在所述N个时间窗上的N个话单属性信息进行信息特征提取,以得到所述M个目标用户对应的M个目标特征集合;
用户通信标识确定单元,用于根据所述信息特征提取单元确定的所述各目标用户对应的目标特征集合确定出各目标用户对应的目标概率,根据所述各目标用户对应的目标概率确定出与所述目标账号唯一关联的目标用户,并将所述目标用户对应的用户通信标识确定为目标用户通信标识,其中,一个目标概率用于指示一个目标用户与所述目标账号之间的关联程度。
12.根据权利要求11所述的确定装置,其特征在于,所述话单属性信息确定单元用于:
获取预设的时段阈值t;
根据所述预设时段阈值t和任一历史消息i对应的发布时刻Ti确定出所述任一历史消息i对应的时间窗TDi,以得到N条历史消息对应的N个时间窗;
其中,所述TDi=[Ti-t,Ti+t]。
13.根据权利要求12所述的确定装置,其特征在于,所述信息特征提取单元用于:
对所述M个目标用户中任意一个目标用户i进行以下消息属性信息和话单数据信息的信息特征提取操作:
根据对所述话单属性信息确定单元确定的所述目标用户i在任一时间窗上的话单属性信息与所述消息属性信息确定单元确定的所述任一时间窗上的消息属性信息的比对和统计确定出所述目标用户i在所述任一时间窗上的比对特征集合,以得到所述目标用户i在N个时间窗上对应的N个比对特征集合,其中,一个比对特征集合中包括S个种类不同的比对特征;
对所述目标用户i在N个时间窗上对应的N个比对特征集合进行特征融合,以得到所述目标用户i对应的目标特征集合;
根据所述各目标用户对应的消息属性信息和话单属性信息的信息特征提取结果,确定出所述M个目标用户对应的M个目标特征集合。
14.根据权利要求13所述的确定装置,其特征在于,所述S个种类不同的比对特征至少包括以下一种或多种:发起终端的类型相同标志、业务发生时间差值、话单个数、上行流量大小、下行流量相对大小、历史消息大小、多媒体数据标志和多媒体数据大小。
15.根据权利要求14所述的确定装置,其特征在于,所述信息特征提取单元用于:
从所述目标用户i在N个时间窗上对应的N个对比特征集合中确定出U个待融合特征组,其中,一个待融合特征组中包括所述目标用户i在所述各时间窗上的一种或者多种比对特征;
根据任一待融合特征组所包括的比对特征的特征融合的结果确定出所述任一待融合特征组对应的目标特征值,以得到所述U个待融合特征组对应的U个目标特征值;
根据所述U个目标特征值确定出所述目标用户i对应的目标特征集合。
16.根据权利要求15所述的确定装置,其特征在于,所述U个待融合特征组中包括第一待融合特征组,所述第一待融合特征组中包括所述目标用户i在所述各时间窗上的第一种比对特征;
所述信息特征提取单元用于:计算所述各时间窗上的第一种比对特征的特征值的平均值,并将所述平均值确定为所述第一待融合特征组对应的目标特征值。
17.根据权利要求15或16所述的确定装置,其特征在于,所述U个待融合特征组中包括第二待融合特征组,所述第二待融合特征组中包括所述目标用户i在所述各时间窗上的第二种比对特征和第三种比对特征;
所述信息特征提取单元用于:计算所述各时间窗上的第二种比对特征和所述各时间窗上的第三种比对特征之间的相似度值,并将所述相似度值确定为所述第二待融合特征组对应的目标特征值。
18.根据权利要求15或16所述的确定装置,其特征在于,所述U个待融合特征组中包括第三待融合特征组,所述第三待融合特征组中包括所述目标用户i在所述各时间窗上的第四种比对特征;
所述信息特征提取单元用于:计算所述各时间窗上的第四种比对特征的特征值之和,并将所述特征值之和与历史消息个数N之间的比值确定为所述第三待融合特征组对应的目标特征值。
19.根据权利要求18所述的确定装置,其特征在于,所述用户通信标识确定单元用于:
将所述信息特征提取单元确定的所述各目标用户对应的目标特征集合依次输入到预设的分类模型中,并基于所属分类模型对所述各目标用户对应的目标特征集合的分类结果确定出各目标用户对应的目标概率。
20.根据权利要求19所述的确定装置,其特征在于,所述用户通信标识确定单元用于:
将所述各目标用户对应的目标概率中最大的目标概率对应的目标用户确定为与所述目标账号唯一关联的目标用户。
21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有程序指令,所述程序指令在计算机上运行时,使得计算机执行如权利要求1-10任一项所述的方法。
22.一种电子设备,其特征在于,所述电子设备包括存储器、处理器,所述存储器用于存储程序代码,所述处理器用于调用所述存储器存储的程序代码执行如权利要求1-10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811653353.6A CN111385136B (zh) | 2018-12-29 | 2018-12-29 | 一种用户通信标识的确定方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811653353.6A CN111385136B (zh) | 2018-12-29 | 2018-12-29 | 一种用户通信标识的确定方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111385136A CN111385136A (zh) | 2020-07-07 |
CN111385136B true CN111385136B (zh) | 2023-01-06 |
Family
ID=71221249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811653353.6A Active CN111385136B (zh) | 2018-12-29 | 2018-12-29 | 一种用户通信标识的确定方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111385136B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107800608A (zh) * | 2016-09-05 | 2018-03-13 | 腾讯科技(深圳)有限公司 | 一种用户信息的处理方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108076018A (zh) * | 2016-11-16 | 2018-05-25 | 阿里巴巴集团控股有限公司 | 身份认证***、方法、装置及账号认证方法 |
CN108171519A (zh) * | 2016-12-07 | 2018-06-15 | 阿里巴巴集团控股有限公司 | 业务数据的处理、账户识别方法及装置、计算机终端 |
CN107665442B (zh) * | 2017-05-10 | 2020-03-27 | 平安科技(深圳)有限公司 | 获取目标用户的方法及装置 |
CN107656918B (zh) * | 2017-05-10 | 2019-07-05 | 平安科技(深圳)有限公司 | 获取目标用户的方法及装置 |
CN107563429B (zh) * | 2017-07-27 | 2020-11-10 | 国家计算机网络与信息安全管理中心 | 一种网络用户群体的分类方法及装置 |
-
2018
- 2018-12-29 CN CN201811653353.6A patent/CN111385136B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107800608A (zh) * | 2016-09-05 | 2018-03-13 | 腾讯科技(深圳)有限公司 | 一种用户信息的处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111385136A (zh) | 2020-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112861648B (zh) | 文字识别方法、装置、电子设备及存储介质 | |
KR102002024B1 (ko) | 객체 라벨링 처리 방법 및 객체 관리 서버 | |
CN107153716B (zh) | 网页内容提取方法和装置 | |
CN112200067B (zh) | 智能视频事件检测方法、***、电子设备和存储介质 | |
CN109194689B (zh) | 异常行为识别方法、装置、服务器及存储介质 | |
CN111107423A (zh) | 一种视频业务播放卡顿的识别方法和装置 | |
CN113127633A (zh) | 智能会议管理方法、装置、计算机设备及存储介质 | |
CN112989348A (zh) | 攻击检测方法、模型训练方法、装置、服务器及存储介质 | |
CN109698798B (zh) | 一种应用的识别方法、装置、服务器和存储介质 | |
CN101183458A (zh) | 图片验证码生成方法和图片验证码生成装置 | |
CN104052737A (zh) | 一种网络数据报文的处理方法及装置 | |
CN112286815A (zh) | 一种接口测试脚本的生成方法及其相关设备 | |
CN112770129A (zh) | 基于直播的群聊建立方法、相关装置、设备及介质 | |
CN103544150A (zh) | 为移动终端浏览器提供推荐信息的方法及*** | |
US9665574B1 (en) | Automatically scraping and adding contact information | |
CN110807050B (zh) | 性能分析方法、装置、计算机设备及存储介质 | |
CN115564000A (zh) | 二维码生成方法、装置、计算机设备及存储介质 | |
CN115883187A (zh) | 网络流量数据中的异常信息识别方法、装置、设备和介质 | |
CN111586695A (zh) | 短信识别方法及相关设备 | |
CN104317847A (zh) | 一种识别网络文字信息的语种的方法及*** | |
CN111385136B (zh) | 一种用户通信标识的确定方法和装置 | |
CN108985059B (zh) | 一种网页后门检测方法、装置、设备及存储介质 | |
CN116192527A (zh) | 攻击流量检测规则生成方法、装置、设备及存储介质 | |
CN115168755A (zh) | 基于url特征的异常数据处理方法及*** | |
CN115774762A (zh) | 即时通讯信息处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |