CN110677269B - 通信用户关系的确定方法、装置和计算机可读存储介质 - Google Patents

通信用户关系的确定方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN110677269B
CN110677269B CN201810711771.XA CN201810711771A CN110677269B CN 110677269 B CN110677269 B CN 110677269B CN 201810711771 A CN201810711771 A CN 201810711771A CN 110677269 B CN110677269 B CN 110677269B
Authority
CN
China
Prior art keywords
user
information
communication
users
user group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810711771.XA
Other languages
English (en)
Other versions
CN110677269A (zh
Inventor
李力卡
张慧嫦
张青
付华峥
赖琮霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201810711771.XA priority Critical patent/CN110677269B/zh
Publication of CN110677269A publication Critical patent/CN110677269A/zh
Application granted granted Critical
Publication of CN110677269B publication Critical patent/CN110677269B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5061Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
    • H04L41/5064Customer relationship management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本公开涉及一种通信用户关系的确定方法、装置和计算机可读存储介质,涉及大数据技术领域。本公开的方法包括:根据通信记录信息确定用户组中用户之间的密切度衡量信息,用户组包括通信记录信息对应的任意用户对;根据用户组对应的密切度衡量信息,对用户组进行分类;根据分类结果,进一步确定用户之间的关系。本公开采用大数据处理方法,可以针对全网任意通信的两个用户的关系进行分析,并且通过对大量用户组的分类,再确定用户关系,实现了并行分析全网用户的关系,不会出现重复、循环运算,提高了分析效率。

Description

通信用户关系的确定方法、装置和计算机可读存储介质
技术领域
本公开涉及大数据技术领域,特别涉及一种通信用户关系的确定方法、装置和计算机可读存储介质。
背景技术
通信用户关系的挖掘具有很好的应用价值,运营商可以利用通信用户之间的关系为用户提供更加丰富和高质量的服务,例如家庭套餐、骚扰电话屏蔽等。
目前,通信关系分析技术主要通过目标个体通讯录、通信话单完成分析。即针对指定个人,建立单人的通信关系分析模型。
发明内容
发明人发现:目前针对个人的通信关系分析,难以实现对全网海量用户进行关系分析,若将全网用户关系分解为个体逐一分析关系,会有大量重复、循环运算,消耗巨大极难实现,同时数据存储、更新十分困难。
本公开所要解决的一个技术问题是:如何高效实现全网规模的用户关系分析。
根据本公开的一些实施例,提供的一种通信用户关系的确定方法,包括:根据通信记录信息确定用户组中用户之间的密切度衡量信息,用户组包括通信记录信息对应的任意两个用户;根据用户组对应的密切度衡量信息,对用户组进行分类;根据分类结果,确定用户组中用户之间的关系。
在一些实施例中,用户之间的密切度衡量信息包括:用户之间一次通信的密切度;根据通信记录信息确定用户组中用户之间的密切度衡量信息包括:根据用户之间一次通信中各项通信记录信息值,和各项通信记录信息值对应的权重,确定用户之间本次通信的密切度。
在一些实施例中,密切度衡量信息还包括:历史累积密切度;用户组中第一用户对第二用户的历史累积密切度是根据第一用户与第二用户之间每一次通信的密切度和本次通信方向权重确定的。
在一些实施例中,密切度衡量信息还包括:用户依赖度;用户组中第一用户对第二用户的用户依赖度是根据第一用户对第二用户之间历史累积密切度,对比第一用户对所有用户之间的历史累积密切度之和确定的。
在一些实施例中,根据所有用户组对应的密切度衡量信息,对用户组进行分类包括:将用户组对应的密切度衡量信息输入预先训练的机器学习模型,确定核心关系用户组与非核心关系用户组;对核心关系用户组进行分类。
在一些实施例中,根据用户组对应的密切度衡量信息,对用户组进行分类包括:将用户组对应的密切度衡量信息输入预先训练的分类模型,对用户组进行分类。
在一些实施例中,通信记录信息包括:用户之间通信时段信息、用户位置信息、通话时长信息、振铃时长信息中至少一项;该方法还包括:采集用户的通信信息,通信信息包括:信令记录信息、短信记录信息和话单信息中的至少一项信息;从通信信息中提取用户号码、起始时间、应答时间、结束时间、漫游位置、来源局向、采集位置、协议类型中至少一项,并生成通信记录信息。
在一些实施例中,对用户组进行分类还包括:对非核心关系用户组进行分类;该方法还包括:通过匹配相同分类的核心关系用户组和非核心关系用户组中的用户,形成分类的用户关系网。
根据本公开的另一些实施例,提供的一种通信用户关系的确定装置,包括:密切度信息确定模块,用于根据通信记录信息确定用户组中用户之间的密切度衡量信息,用户组包括通信记录信息对应的两个用户;分类模块,用于根据用户组对应的密切度衡量信息,对用户组进行分类;关系确定模块,用于根据分类结果,确定用户组中用户之间的关系。
在一些实施例中,用户之间的密切度衡量信息包括:用户之间一次通信的密切度;密切度信息确定模块用于根据用户之间一次通信中各项通信记录信息值,和各项通信记录信息值对应的权重,确定用户之间本次通信的密切度。
在一些实施例中,密切度衡量信息还包括:历史累积密切度;用户组中第一用户对第二用户的历史累积密切度是根据第一用户与第二用户之间每一次通信的密切度和本次通信方向权重确定的。
在一些实施例中,密切度衡量信息还包括:用户依赖度;用户组中第一用户对第二用户的用户依赖度是根据第一用户对第二用户之间历史累积密切度,对比第一用户对所有用户之间的历史累积密切度之和确定的。
在一些实施例中,分类模块用于将用户组对应的密切度衡量信息输入预先训练的机器学习模型,确定核心关系用户组与非核心关系用户组;对核心关系用户组进行分类。
在一些实施例中,分类模块用于将用户组对应的密切度衡量信息输入预先训练的分类或聚类模型,对用户组进行分类。
在一些实施例中,通信记录信息包括:用户之间通信时段信息、用户位置信息、通话时长信息、振铃时长信息中至少一项;该装置还包括:数据采集处理模块,用于采集用户通信信息,通信信息包括:信令记录信息、短信记录信息和话单信息中的至少一项信息;从通信信息中提取用户号码、起始时间、应答时间、结束时间、漫游位置、来源局向、采集位置、协议类型中至少一项,并生成通信记录信息。
在一些实施例中,分类模块还用于对非核心关系用户组进行分类;该装置还包括:关系网确定模块,用于通过匹配相同分类的核心关系用户组和非核心关系用户组中的用户,形成分类的用户关系网。
根据本公开的又一些实施例,提供的一种通信用户关系的确定装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器设备中的指令,执行前述任意实施例的通信用户关系的确定方法。
根据本公开的再一些实施例,提供的一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现前述任意实施例的通信用户关系的确定方法。
本公开的方法根据通信记录信息确定每个用户组对应的密切度衡量信息,对用户组根据密切度衡量信息进行分类,根据分类结果确定用户之间的关系。本公开采用大数据处理方法,可以针对全网任意通信的两个用户的关系进行分析,并且通过对大量用户组的分类,再确定用户关系,实现了并行分析全网用户的关系,不会出现重复、循环运算,提高了分析效率。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开的一些实施例的通信用户关系的确定方法的流程示意图。
图2示出本公开的另一些实施例的通信用户关系的确定方法的流程示意图。
图3示出本公开的一些实施例的通信用户关系的确定装置的结构示意图。
图4示出本公开的另一些实施例的通信用户关系的确定装置的结构示意图。
图5示出本公开的又一些实施例的通信用户关系的确定装置的结构示意图。
图6示出本公开的再一些实施例的通信用户关系的确定装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开提供一种通信用户关系的确定方法,下面结合图1进行描述。
图1为本公开通信用户关系的确定方法一些实施例的流程图。如图1所示,该实施例的方法包括:步骤S102~S106。
步骤S102,根据通信记录信息确定用户组中用户之间的密切度衡量信息。
通信记录信息可以是根据通信信息生成的。通信信息可以是在通信网络中采集信令记录信息、短信记录信息和话单信息中的至少一项信息。信令记录信息可以反映用户的全部通信过程,可以对没有接听的语音通信等的信息进行显示,可以弥补话单信息缺少的部分不产生费用的通信信息,进一步提高后续对用户关系分析的准确性。通信信息中可以提取用户(包括主叫和被叫)号码、起始时间、应答时间、结束时间、漫游位置、来源局向、采集位置、协议类型中至少一项用于生成通信记录信息。其中,漫游位置、来源局向、采集位置可用于确定用户位置信息。协议类型可以区分网络信令或协议的类型等。
在一些实施例中,通信记录信息包括:用户之间通信时段信息、用户位置信息、通话时长信息、振铃时长信息、通信类型中至少一项。
每一条通信记录都会对应主叫和被叫两个用户,可以将主叫和被叫两个用户组成用户组,即用户组包括通信记录信息对应的任意两个用户。进一步,可以针对每一条通信记录信息,计算对应的用户组在这一次通信中的密切度。例如,根据用户之间一次通信中各项通信记录信息值,和各项通信记录信息值对应的权重,确定用户之间本次通信的密切度。可以采用以下公式计算用户之间一次通信的密切度。
D=f(m1*Ti,m2*Po,m3*Ci,…) (1)
公式(1)中f(·)表示函数,例如,可以是对其中几项因子相加。Ti为用户之间通信时段信息值(例如,可以划分为工作时间和非工作时间,分别赋予不同的值),Po为用户位置信息值,可以表示用户的相对位置(例如,同基站、同城或异地,可以分别赋予不同的值),Ci为通信时间信息值(例如,振铃时长、通话时长,可以划分不同的时长范围,分别赋予不同的值),m1、m2、m3分别为不同通信记录信息值对应的权重。公式(1)中还可以包括其他通信记录信息值和对应的权重,例如通信类型和对应的权重,具体选取哪些通信记录信息值,以及权重如何设置,可以根据不同的需求灵活配置。
通信记录信息值的设置可以根据分析需求和场景进行动态调整。例如,主要想分析具备家庭关系的用户组,则可以将工作时间对应的用户之间通信时段信息值,调整为低于非工作时间对应的用户之间通信时段信息值等。通过这样的调整,可以使在非工作时间进行的通信对应的密切度更高,则表示两个用户在非工作时间的通信的密切度更高,后续分析时这些用户更有可能被分为具备家庭关系的用户组。
上述用户之间每一次通信的密切度可以作为用户之间的密切度衡量信息,在一些实施例中,密切度衡量信息还可以包括:历史累积密切度。在一些实施例中,用户组中第一用户对第二用户的历史累积密切度是根据第一用户与第二用户之间每一次通信的密切度和本次通信方向权重确定的。第一用户对第二用户的历史累积密切度可以根据以下公式计算。
DA=∑Di*Ki (2)
其中,Di表示第i次通信的密切度,Ki为对应的通信方向权重,例如,呼出的通信方向权重高于呼入的通信方向权重。通过上述公式可以看出两个用户例如A和B,由于通信方向权重的影响,A对B的历史累积密切度和B对A的历史累积密切度是不同的,因此,密切度衡量信息可以包括:用户组中第一用户对第二用户的历史累积密切度,以及第二用户对第一用户的历史累积密切度。
在一些实施例中,密切度衡量信息还包括:用户依赖度。在一些实施例中,用户组中第一用户对第二用户的用户依赖度是根据第一用户对第二用户之间历史累积密切度,对比第一用户对所有用户之间的历史累积密切度之和确定的。第一用户对第二用户的用户依赖度可以根据以下公式计算。
YD1=DA/Dtotal (3)
公式(3)中,DA表示第一用户对第二用户之间历史累积密切度,Dtotal表示第一用户对所有用户之间的历史累积密切度之和。
在一些实施例中,密切度衡量信息还包括:预设时间内用户平均依赖度。在一些实施例中,用户组中第一用户对第二用户的用户平均依赖度,是根据第一用户对第二用户的用户依赖度在预设时间内的平均值确定的,例如,统计半年内每个月的第一用户对第二用户的用户依赖度的平均值。
在一些实施例中,密切度衡量信息还包括:呼出次数,呼入次数,起始时间,最后时间中至少一项信息。
步骤S104,根据用户组对应的密切度衡量信息,对用户组进行分类。
通过步骤S102可以确定用户组对应的多项密切度衡量信息,可以根据预设规则对用户组进行分类。例如,设置不同的密切度衡量信息对应的阈值,将用户组对应的密切度衡量信息与阈值进行比对,从而确定用户组的分类。例如,密切度衡量信息低于一定阈值的用户组可以确定为异常关系,例如骚扰电话等。预设规则可以结合通信记录信息值的动态调整一起应用。例如,主要想分析具备家庭关系的用户组,将工作时间对应的用户之间通信时段信息值,调整为低于非工作时间对应的用户之间通信时段信息值,将同城对应的用户位置信息值设置为较高。进一步,在非工作时段、同城的两个用户通信的次数如果较多、则历史累积密切度、依赖度等就会高于其他用户之间的历史累积密切度、依赖度等,可以通过设置历史累积密切度、依赖度等阈值,将上述两个用户确定为家庭关系。具体的预设规则可以根据统计经验进行设定。
在一些实施例中,可以将用户组对应的密切度衡量信息输入预先训练的分类或聚类模型,对用户组进行分类。例如,可以应用聚类模型对用户组进行分类。用户组对应的密切度衡量信息可以包括多些,形成密切度衡量向量,输入聚类模型,则可以将用户组聚为不同的类。聚类算法为现有算法,在此不再赘述。
进一步,为了减少计算量,以及获取更加准确的分类结果,可以将用户组对应的密切度衡量信息输入预先训练的机器学习模型,确定核心关系用户组与非核心关系用户组;进一步对核心关系用户组进行分类。核心关系用户组即通信关系比较密切的用户组,可以将仅进行过很少次数的非核心关系用户组去除,降低计算量。机器学习模型例如为决策树模型。决策树模型为现有算法,在此不再赘述。
步骤S106,根据分类结果,确定用户组中用户之间的关系。
对用户进行分类后,根据每一类的用户组的特征确定用户关系。例如,通过分析一类用户组的通信特征,与预设的阈值进行比对,确定用户关系。例如,通信时间较长、大概率在工作时间通信、同城的用户组可以确定为工作关系。
在一些实施例中,还可以对非核心关系用户组进行分类;通过匹配相同分类的核心关系用户组和非核心关系用户组中的用户,形成分类的用户关系网。对于非核心关系用户组的分类,可以采取与核心关系用户组相同的分类方法。同一分类中,不同用户组中出现相同的用户,可以将这些用户组进行关联,形成用户关系网。例如,A和B为家庭关系,B和C为家庭关系,可以确定A、B、C为家庭关系。
上述实施例的方法可以基于信令数据实现用户的关系分析,无需依赖终端通信录等隐私数据。不是针对目标个体一次性分析,而是与面向全网的任意用户,支持全网任意号码核心关系挖掘和分类,实现代价低。解决按传统技术按个体节点为中心逐一建立个体关系网络再连接,需要大量循环、递归收敛,运算量庞大,关系数据难以存储的问题。可以动态根据通信数据进行更新,管理代价低。上述实施例的方法通过大数据技术、机器学习模型等算法实现用户关系分析,方法简单,易于实现,并且更加准确,可以发现未知关系,在差异化经营方面有实用价值。
下面结合图2描述本公开的通信用户关系的确定方法的另一些实施例。
图2为本公开通信用户关系的确定方法另一些实施例的流程图。如图2所示,该实施例的方法包括:步骤S202~S212。
步骤S202,采集通信信息。
通信信息包括:信令记录信息、短信记录信息和话单信息中的至少一项信息。可以通过数据采集处理模块进行采集,完成通信原始CDR(Call Details Record Database,呼叫细节记录数据库)数据(包括信令记录、短信记录、话单等)的汇聚,具有网络实时传送接口,支持数据文件预处理及存储。
步骤S204,提取相关信息生成通信记录信息。
可以利用数据ETL(Extract Transform Load,抽取、转换、加载)模块完成通信数据预处理,例如包括清洗、去重、号码格式规范一致,加载到集群数据库。
步骤S206,根据通信记录信息确定用户组中用户之间的密切度衡量信息。
可以采用大数据分布式计算集群,承载数据ETL、关系分析模块运行的基础计算能力平台,采用Hadoop+Spark集群开源技术架构支持海量数据的准实时批处理。利用数据库存储用户关系分析过程中的相关信息,例如数据库包括数据仓库和关系数据动态数据库,存放ETL表,各种分析表、配置参数和关系数据表等。例如,可以存储通信记录密切度表,该表中可以包括:主叫和被叫号码,呼出次数,呼入次数,用户对所有用户的历史累积密切度之和,起始时间,最后时间等,可以存储密切度衡量信息表,该表可以包括:主叫,被叫,起始时间,最后时间,呼叫次数,累计密切度,用户依赖度,用户平均依赖度,可以按主叫和被叫组合作为索引关键字。还可以存储每一次通信的密切度表、通信记录表、核心关系用户组表等。
步骤S208,将用户组对应的密切度衡量信息输入预先训练的机器学习模型,确定核心关系用户组与非核心关系用户组。
步骤S210,将核心关系用户组对应的密切度衡量信息输入预先训练的分类或聚类模型,对核心关系用户组进行分类。
可以采用关系分析模块执行步骤S206-S210,通过分层模型实现流水线式处理,逐级分析、筛选,避免大量重复循环或递归、大关联处理的问题,极大降低运算强度和***资源压力。
步骤S212,根据分类结果,确定核心关系用户组中用户之间的关系。
在一些实施例中,还可以对非核心关系用户组进行分类;通过匹配相同分类的核心关系用户组和非核心关系用户组中的用户,形成分类的用户关系网。
可以利用关系数据维护管理模块,对数据的动态更新、管理,以及各类数据查询,可呈现核心关系用户组的关系及用户关系网。
上述实施例的方法可支持在线并行计算,大批量用户关系的实时动态更新;直接挖掘核心关系进行分类,支持目标分类、个体关系网的快速检索。基于通信网络的叠加本***,采用免费开源技术架构搭建,实现成本低,部署快捷。上述实施例的方法可以针对不同应用场景进行,实现难度低,用途更广泛,价值更高。
下面描述本公开的一些应用例。
假设网络中存在A,B,C,D,E,F等六人,其中AB,CD为亲友,AC为商业伙伴,E为客服电话,F为骚扰/诈骗电话。
***通过全网用户一定时间通信数据,基于用户关系分析模型进行动态量化分析,进行核心关系用户组的识别和分类。
由于亲友存在稳定的相互通话记录、主要在非工作时段和节假日,通话质量也比较高,经过一定时间的累积,距离和相互依赖度值较高,***据此分出AB,CD两个强关系的核心关系用户组;
由于商业合作关系存在特定交互通信模式,主要在工作日、工作时段、存在一定的距离值和依赖度,***可以获得AC为较强核心关系组;
客服电话为呼入为主,表现为通话质量较高,平均距离小(虽量大而入呼距离系数小),因属于被动呼叫,对他人依赖度不强,属于异常情况,***可以识别出客服电话E;
骚扰电话以呼出为主,表现为通话质量较低,主动呼叫因而表现为对他人依赖度高,平均距离值大,属于异常情况,***可以识别出骚扰电话。最终输出结果:{A,B,亲友;C,D,亲友;A,C,商业;E,其他(客服);F,异常}
本公开还提供一种通信用户关系的确定装置,下面结合图3进行描述。
图3为本公开通信用户关系的确定装置的一些实施例的结构图。如图3所示,该实施例的装置30包括:密切度信息确定模块302,分类模块304,关系确定模块306。这三个模块可以组合形成上述实施例中提到的关系分析模块。
密切度信息确定模块302,用于根据通信记录信息确定用户组中用户之间的密切度衡量信息,用户组包括通信记录信息对应的两个用户。
在一些实施例中,通信记录信息包括:用户之间通信时段信息、用户位置信息、通话时长信息、振铃时长信息中至少一项;
在一些实施例中,用户之间的密切度衡量信息包括:用户之间一次通信的密切度;密切度信息确定模块302用于根据用户之间一次通信中各项通信记录信息值,和各项通信记录信息值对应的权重,确定用户之间本次通信的密切度。
在一些实施例中,密切度衡量信息还包括:历史累积密切度;用户组中第一用户对第二用户的历史累积密切度是根据第一用户与第二用户之间历史每一次通信的密切度和本次通信方向权重确定的。
在一些实施例中,密切度衡量信息还包括:用户依赖度;用户组中第一用户对第二用户的用户依赖度是根据第一用户对第二用户之间历史累积密切度,对比第一用户对所有用户之间的历史累积密切度之和确定的。
分类模块304,用于根据用户组对应的密切度衡量信息,对进行分类。
在一些实施例中,分类模块304用于将用户组对应的密切度衡量信息输入预先训练的分类或聚类模型,对用户组进行分类。
在一些实施例中,分类模块304用于将用户组对应的密切度衡量信息输入预先训练的机器学习模型,确定核心关系用户组与非核心关系用户组;对核心关系用户组进行分类。
关系确定模块306,用于根据分类结果,确定用户组中用户之间的关系。
图4为本公开通信用户关系的确定装置的另一些实施例的结构图。如图4所示,该实施例的装置40包括:密切度信息确定模块402,分类模块404,关系确定模块406,分别密切度信息确定模块302,分类模块304,关系确定模块306的功能类似;以及数据采集处理模块408。
数据采集处理模块408用于采集用户的通信信息,通信信息包括:信令记录信息、短信记录信息和话单信息中的至少一项信息;从通信信息中提取用户号码、起始时间、应答时间、结束时间、漫游位置、来源局向、采集位置、协议类型中至少一项,并生成通信记录信息。
在一些实施例中,分类模块404还用于对非核心关系用户组进行分类。装置40还包括:关系网确定模块410,用于通过匹配相同分类的核心关系用户组和非核心关系用户组中的用户,形成分类的用户关系网。该模块可以组成关系分析模块400。
进一步,通信用户关系的确定装置还可以包括:数据ETL模块412、数据库414、关系数据维护管理模块416等,具体功能可以参考前述实施例。
本公开的实施例中的通信用户关系的确定装置可各由各种计算设备或计算机***来实现,下面结合图5以及图6进行描述。
图5为本公开通信用户关系的确定装置的一些实施例的结构图。如图5所示,该实施例的装置50包括:存储器510以及耦接至该存储器510的处理器520,处理器520被配置为基于存储在存储器510中的指令,执行本公开中任意一些实施例中的通信用户关系的确定方法。
其中,存储器510例如可以包括***存储器、固定非易失性存储介质等。***存储器例如存储有操作***、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。
图6为本公开通信用户关系的确定装置的另一些实施例的结构图。如图6所示,该实施例的装置60包括:存储器610以及处理器620,分别与存储器510以及处理器520类似。还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630,640,650以及存储器610和处理器620之间例如可以通过总线660连接。其中,输入输出接口630为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口,例如可以连接到数据库服务器或者云端存储服务器等。存储接口650为SD卡、U盘等外置存储设备提供连接接口。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、***、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (16)

1.一种通信用户关系的确定方法,包括:
根据通信记录信息确定用户组中用户之间的密切度衡量信息,所述用户组包括通信记录信息对应的任意两个用户,其中,所述通信记录信息包括:用户之间通信时段信息、用户位置信息、通话时长信息、振铃时长信息;
根据用户组对应的密切度衡量信息,对用户组进行分类;
根据分类结果,确定用户组中用户之间的关系;
其中,所述用户之间的密切度衡量信息包括:用户之间每一次通信的密切度;所述根据通信记录信息确定用户组中用户之间的密切度衡量信息包括:
根据用户之间每一次通信中各项通信记录信息值,和各项通信记录信息值对应的权重,确定所述用户之间每一次通信的密切度。
2.根据权利要求1所述的确定方法,其中,
所述密切度衡量信息还包括:历史累积密切度;
用户组中第一用户对第二用户的历史累积密切度是根据所述第一用户与所述第二用户之间每一次通信的密切度和本次通信方向权重确定的。
3.根据权利要求2所述的确定方法,其中,
所述密切度衡量信息还包括:用户依赖度;
用户组中第一用户对第二用户的用户依赖度是根据所述第一用户对所述第二用户之间历史累积密切度,对比所述第一用户对所有用户之间的历史累积密切度之和确定的。
4.根据权利要求1所述的确定方法,其中,
所述根据所有用户组对应的密切度衡量信息,对用户组进行分类包括:
将用户组对应的密切度衡量信息输入预先训练的机器学习模型,确定核心关系用户组与非核心关系用户组;
对核心关系用户组进行分类。
5.根据权利要求1所述的确定方法,其中,
所述根据用户组对应的密切度衡量信息,对用户组进行分类包括:
将用户组对应的密切度衡量信息输入预先训练的分类或聚类模型,对用户组进行分类。
6.根据权利要求1所述的确定方法,其中,
所述方法还包括:
采集用户通信信息,所述通信信息包括:信令记录信息、短信记录信息和话单信息中的至少一项信息;
从所述通信信息中提取用户号码、起始时间、应答时间、结束时间、漫游位置、来源局向、采集位置、协议类型中至少一项,并生成通信记录信息。
7.根据权利要求4所述的确定方法,其中,
所述对用户组进行分类还包括:
对非核心关系用户组进行分类;
所述方法还包括:
通过匹配相同分类的核心关系用户组和非核心关系用户组中的用户,形成分类的用户关系网。
8.一种通信用户关系的确定装置,包括:
密切度信息确定模块,用于根据通信记录信息确定用户组中用户之间的密切度衡量信息,所述用户组包括通信记录信息对应的任意两个用户,其中,所述通信记录信息包括:用户之间通信时段信息、用户位置信息、通话时长信息、振铃时长信息;
分类模块,用于根据用户组对应的密切度衡量信息,对用户组进行分类;
关系确定模块,用于根据分类结果,确定用户组中用户之间的关系;
其中,所述用户之间的密切度衡量信息包括:用户之间每一次通信的密切度,所述密切度信息确定模块用于根据用户之间每一次通信中各项通信记录信息值,和各项通信记录信息值对应的权重,确定所述用户之间每一次通信的密切度。
9.根据权利要求8所述的确定装置,其中,
所述密切度衡量信息还包括:历史累积密切度;
用户组中第一用户对第二用户的历史累积密切度是根据所述第一用户与所述第二用户之间每一次通信的密切度和本次通信方向权重确定的。
10.根据权利要求9所述的确定装置,其中,
所述密切度衡量信息还包括:用户依赖度;
用户组中第一用户对第二用户的用户依赖度是根据所述第一用户对所述第二用户之间历史累积密切度,对比所述第一用户对所有用户之间的历史累积密切度之和确定的。
11.根据权利要求8所述的确定装置,其中,
所述分类模块用于将用户组对应的密切度衡量信息输入预先训练的机器学习模型,确定核心关系用户组与非核心关系用户组;对核心用户组进行分类。
12.根据权利要求8所述的确定装置,其中,
所述分类模块用于将用户组对应的密切度衡量信息输入预先训练的分类或聚类模型,对用户组进行分类。
13.根据权利要求8所述的确定装置,其中,
所述装置还包括:
数据采集处理模块,用于采集用户的通信信息,所述通信信息包括:信令记录信息、短信记录信息和话单信息中的至少一项信息;从所述通信信息中提取用户号码、起始时间、应答时间、结束时间、漫游位置、来源局向、采集位置、协议类型中至少一项,并生成通信记录信息。
14.根据权利要求11所述的确定装置,其中,
所述分类模块还用于对非核心关系用户组进行分类;
所述装置还包括:
关系网确定模块,用于通过匹配相同分类的核心关系用户组和非核心关系用户组中的用户,形成分类的用户关系网。
15.一种通信用户关系的确定装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器设备中的指令,执行如权利要求1-7任一项所述的通信用户关系的确定方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现权利要求1-7任一项所述方法的步骤。
CN201810711771.XA 2018-07-03 2018-07-03 通信用户关系的确定方法、装置和计算机可读存储介质 Active CN110677269B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810711771.XA CN110677269B (zh) 2018-07-03 2018-07-03 通信用户关系的确定方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810711771.XA CN110677269B (zh) 2018-07-03 2018-07-03 通信用户关系的确定方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110677269A CN110677269A (zh) 2020-01-10
CN110677269B true CN110677269B (zh) 2022-05-13

Family

ID=69065799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810711771.XA Active CN110677269B (zh) 2018-07-03 2018-07-03 通信用户关系的确定方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110677269B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860655B (zh) * 2020-07-23 2023-05-30 中国联合网络通信集团有限公司 用户的处理方法、装置和设备
CN112163885A (zh) * 2020-09-29 2021-01-01 贵州力创科技发展有限公司 一种基于移动通信数据的用户关系挖掘方法及***
CN114979369A (zh) * 2022-04-14 2022-08-30 马上消费金融股份有限公司 异常通话检测方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100527682C (zh) * 2003-11-12 2009-08-12 株式会社日立制作所 会话QoS控制装置
CN104636439B (zh) * 2015-01-04 2018-07-03 中国联合网络通信集团有限公司 一种分析用户社会关系的方法及装置
CN106791221B (zh) * 2016-12-06 2019-05-31 北京邮电大学 一种基于通话的亲友圈关系识别方法
CN107729940A (zh) * 2017-10-20 2018-02-23 北京工业大学 一种用户话单大数据基站连接信息用户关系推定方法
CN107958423A (zh) * 2017-12-20 2018-04-24 广东宜通世纪科技股份有限公司 用户社会关系分析方法及存储介质、服务端

Also Published As

Publication number Publication date
CN110677269A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN110337059B (zh) 一种用户家庭关系的分析算法、服务器及网络***
CN110677269B (zh) 通信用户关系的确定方法、装置和计算机可读存储介质
CN109640312B (zh) “黑卡”识别方法、电子设备及计算机可读取存储介质
US8788438B2 (en) Method performed in a computer system for aiding the assessment of an influence of a user in or interacting with a communication system by applying social network analysis, SNA, functions, a computer system, computer program and computer program product
CN107038449B (zh) 一种欺诈用户的识别方法及装置
CN109145050B (zh) 一种计算设备
CN110889526B (zh) 一种用户升级投诉行为预测方法及***
US20130211873A1 (en) Determining a churn risk
CN111148018A (zh) 基于通信数据识别定位区域价值的方法和装置
CN112200375A (zh) 预测模型生成方法、预测模型生成装置和计算机可读介质
CN108776857A (zh) Nps短信调研方法、***、计算机设备和存储介质
CN107784511A (zh) 一种用户流失预测方法及装置
CN115952398B (zh) 基于物联网的数据上传统计计算方法、***和存储介质
US10439919B2 (en) Real time event monitoring and analysis system
US9398441B2 (en) Method and apparatus for identifying re-subscribed user
KR100601885B1 (ko) 아웃바운드 콜센터를 위한 통화 추천 시스템
KR101568800B1 (ko) 실시간 이슈 검색어 선별 방법 및 시스템
CN112601228B (zh) 养***码检测方法和装置、计算机可读存储介质
CN115062002A (zh) 流式数据处理方法及装置
CN114268939B (zh) 一种移动通信中异常用户识别的方法及智能设备
CN114463011A (zh) 基于区块链的异常交易检测方法、装置、设备及存储介质
CN110399399B (zh) 用户分析的方法、装置、电子设备和存储介质
Abd-Allah et al. DyadChurn: customer churn prediction using strong social ties
Ghotekar Analysis and Data Mining of Call Detail Records using Big Data Technology
Albadawi et al. Telecom churn prediction model using data mining techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant