CN104636439B - 一种分析用户社会关系的方法及装置 - Google Patents
一种分析用户社会关系的方法及装置 Download PDFInfo
- Publication number
- CN104636439B CN104636439B CN201510004114.8A CN201510004114A CN104636439B CN 104636439 B CN104636439 B CN 104636439B CN 201510004114 A CN201510004114 A CN 201510004114A CN 104636439 B CN104636439 B CN 104636439B
- Authority
- CN
- China
- Prior art keywords
- call
- score
- working time
- grouping
- duration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004891 communication Methods 0.000 claims description 40
- 238000010606 normalization Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 abstract description 2
- 238000010295 mobile communication Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012850 discrimination method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种分析用户社会关系的方法及装置,包括:根据用户的位置信息,确定用户的工作时间和非工作时间;对预设时长内的所有通话记录,根据所有通话记录的平均通话时长,对每个通话对象的各通话记录的通话时长进行得分计算;按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算所有分组的分组得分平均值;将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,进行归一化处理,获得各通话对象相应的关系系数;根据所有通话对象的关系系数,确定社会关系。本发明通过对用户的通话记录按照分组统计后,通过获得的关系系数进行社会关系的准确定位,为运营商业务推广提供了依据,为相关的业务申请审核提供了重要的参考依据。
Description
技术领域
本申请涉及移动通信应用技术,尤指一种分析用户社会关系的方法及装置。
背景技术
当前,移动通信已经成为现代社会人们日常生活和工作进行有效沟通和交流的重要方式。对应网络空间中的用户群体关系与行为在很大程度上能够反映出用户的真实社会群体关系与行为。
随着移动通信技术的发展,业务推广和部分业务申请审核(消费贷)是基于移动通信行为进行的。现有的业务推广对于用户的选定主要通过设定与业务相关的参数对非相关用户进行过滤后,对过滤后的用户发送业务信息,如果接收业务信息的用户未对接收业务推广的内容或者未将业务信息进行传递,则业务推广的作用将十分有限。对于业务审核,一些用户在进行社会关系信息填写过程中,采用与用户关系不大的联系人或者无关人员的信息进行审核,对带有盈亏性质的业务,将给业务带来风险,同时现有的业务审核过程,会对提供的联系人进行简单的审核,不对具体社会关系进行判断,如果用户填写的社会关系信息中存在较多很少联系或关系不大的联系人(通过运营商的通话记录分析获得),将影响用户的业务申请审核。
综上,在进行业务推广和进行业务申请审核时,通过对用户通信对象进行简要的分析,不能确定准确的社会关系,无法达到很好的业务推广目的,或会对带有盈亏性质的业务带来风险。
发明内容
为了解决上述问题,本发明提供一种分析用户社会关系的方法及装置,能够准确确定用户的社会关系,有利于进行业务推广和为业务申请考核提供可靠依据。
为了达到本发明的目的,本申请提供一种分析用户社会关系的方法;包括:
根据用户的位置信息,确定用户的工作时间和非工作时间;
对预设时长内的所有通话记录,根据所有通话记录的平均通话时长,对每个通话对象的各通话记录的通话时长进行得分计算;
将计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值;
将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,进行归一化处理,获得各通话对象相应的关系系数;
根据所有通话对象的关系系数,确定社会关系。
进一步地,在所述计算通话记录的平均时长后,该方法还包括:
对所述通信记录删除非手机号码和数据库标记的无效手机号码的部分,按照预先设定的平均通话时长的百分比阈值作为有效通话时长对剩余的通话记录进行过滤,删除无效的通信记录。
进一步地,对每个通话对象的各通话记录的通话时长进行得分计算具体包括:
对每个通话对象的各通话记录的通话时长,根据通话时长小于所述平均通话时长的二分之一的,确定得分为0.5;
通话时长为所述平均通话时长二分之一到二倍的,确定得分为1;
通话时长为大于所述平均通话时长二倍而小于等于所述平均通话时长三倍的,确定得分为1.5;
通话时长大于所述平均通话时长三倍的,确定得分为2。
进一步地,进行归一化处理具体包括:
将所述各通话对象各分组得分与所述所有分组的分组得分平均值求差的平方后累加,除以该通话对象所有得分的累加的平方,完成归一化处理。
进一步地,根据关系系数,确定社会关系具体包括:
对所有通话对象的所述关系系数按照大小排序后,按照组内差别小于第一预设阈值和组间大于第二预设阈值,确定出家人分组;
对确定出的家人分组,对所述关系系数进行求平均获得系数平均值后,将大于系数平均值的通话对象确定社会关系为联系紧密的家人,其他确定为社会关系联系普通的家人;
根据预先确定的判别方式对确定出家人分组以外的其他通话对象,确定朋友和同事。
进一步地,根据预先确定的判别方式确定朋友和同事具体包括:
将所述各通话对象分组统计的非工作时间主叫与所有分组的分组得分平均值求差的平方、加上工作时间主叫与所有分组的分组得分平均值求差的平方,与工作时间主叫与所有分组的分组得分平均值求差的平方、加上非工作时间主叫与所有分组的分组得分平均值求差的平方进行大小比较,
非工作时间主叫与所有分组的分组得分平均值求差的平方、加上工作时间主叫与所有分组的分组得分平均值求差的平方较大时,确定为朋友;否则,确定为同事。
进一步地,当用户和家人分组的一个或一个以上通话对象为同一运营商的客户时,该方法还包括:当非工作时间的位置信息相同时,将相应的确定为联系紧密的家人更新为联系亲密的家人,将相应的确定为联系普通的家人更新为联系紧密的家人。
进一步地,该方法还包括:在进行分组统计时,对所述各通话对象的短信记录进行得分计算,并按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值,以获得各通话对象的关系系数;
所述对短信记录进行得分计算为:按照每条短信得分为0.1对短信记录的短信进行累加。
另一方面,本申请还提供一种分析用户社会关系的装置,包括:时间确定单元、得分计算单元、分组统计单元、关系系数单元和关系确定单元;其中,
时间确定单元,用于根据用户的位置信息,确定用户的工作时间和非工作时间;
得分计算单元,用于对预设时长内的所有通话记录,根据所有通话记录的平均通话时长,对每个通话对象的各通话记录的通话时长进行得分计算;
分组统计单元,用于将计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值;
关系系数单元,用于将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,进行归一化处理,获得各通话对象相应的关系系数;
关系确定单元,用于根据所有通话对象的关系系数,确定社会关系。
进一步地,得分计算单元还用于,在计算通话记录的平均时长后,对所述通信记录删除非手机号码和数据库标记的无效手机号码的部分,按照预先设定的平均通话时长的百分比阈值作为有效通话时长对剩余的通话记录进行过滤,删除无效的通信记录。
进一步地,得分计算单元具体用于,
对每个通话对象的各通话记录的通话时长,
根据通话时长小于所述平均通话时长的二分之一的,确定得分为0.5;
通话时长为所述平均通话时长二分之一到二倍的,确定得分为1;
通话时长为大于所述平均通话时长二倍而小于等于所述平均通话时长三倍的,确定得分为1.5;
通话时长大于所述平均通话时长三倍的,确定得分为2。
进一步地,关系系数单元具体用于,将各通话对象各分组得分与所述所有分组的分组得分平均值求差的平方后累加,除以该通话对象所有得分的累加的平方,完成归一化处理,获得各通话对象相应的关系系数。
进一步地,关系确定单元具体用于,
对所有通话对象的所述关系系数按照大小排序后,按照组内差别小于第一预设阈值和组间大于第二预设阈值,确定出家人分组;
对确定出的家人分组,对关系系数进行求平均获得系数平均值后,将大于系数平均值的通话对象确定社会关系为联系紧密的家人,其他确定为社会关系联系普通的家人;
根据预先确定的判别方式对确定出家人分组以外的其他通话对象,确定朋友和同事。
进一步地,关系确定单元具体用于,
对所有通话对象的所述关系系数按照大小排序后,按照组内差别小于第一预设阈值和组间大于第二预设阈值,确定出家人分组;
对确定出的家人分组,对关系系数进行求平均获得系数平均值后,将大于系数平均值的通话对象确定社会关系为联系紧密的家人,其他确定为社会关系联系普通的家人;
对确定出家人分组以外的其他通话对象,
将所述各通话对象分组统计的非工作时间主叫与所述所有分组的分组得分平均值求差的平方、加上工作时间主叫与所有分组的分组得分平均值求差的平方,与工作时间主叫与所有分组的分组得分平均值求差的平方、加上非工作时间主叫与所有分组的分组得分平均值求差的平方进行大小比较,
非工作时间主叫与所有分组的分组得分平均值求差的平方、加上工作时间主叫与所有分组的分组得分平均值求差的平方较大时,确定为朋友;否则,确定为同事。
进一步地,该装置还包括加权判断单元,用于当用户和家人分组的一个或一个以上通话对象为同一运营商的客户时,在非工作时间的位置信息相同时,将相应的确定为联系紧密的家人更新为联系亲密的家人,将相应的确定为联系普通的家人更新为联系紧密的家人。
进一步地,得分计算单元还用于,对各通话对象的短信记录进行得分计算;
对短信记录进行得分计算为:按照每条短信得分为0.1对短信记录的短信进行累加;
所述分组统计单元还用于,将短信记录计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫累加到相应的分组中进行统计并计算相应的所有分组的分组得分平均值。
与现有技术相比,本发明提供的技术方案,包括:根据用户的位置信息,确定用户的工作时间和非工作时间;对预设时长内的所有通话记录,根据所有通话记录的平均通话时长,对每个通话对象的各通话记录的通话时长进行得分计算;将计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值;将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,进行归一化处理,获得各通话对象相应的关系系数;根据所有通话对象的关系系数,确定社会关系。本发明通过对用户的通话记录按照分组统计后,获得的关系系数进行社会关系的判断,实现了对用户社会关系的准确定位,为运营商业务推广提供了依据,为相关的业务申请审核提供了重要的参考依据。
附图说明
附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本发明分析用户社会关系的方法的流程图;
图2为本发明实现资源分配的装置的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
图1为本发明分析用户社会关系的方法的流程图,如图1所示,包括:
步骤100、根据用户的位置信息,确定用户的工作时间和非工作时间;
需要说明的是,这里的位置信息是指从运营商获得的用于统计用户工作和非工作时间的一段时长内的用户的位置区编码(LAC)信息,在用户携带移动终端移动时,主要会在开机状态按1小时间隔周期性采集LAC信息;或用户出行发生基站切换时记录;或用户通话或上网时也会记录LAC信息。表1为用户LAC信息的简要示例。
根据表1的数据,结合一般工作者的工作时间规律,可以分析得出该用户在位置区编码为4317的时段为工作时间,其他LAC信息可以判断为上班前时间和下班后时间,即非工作时间。具体的,上班时间判断为7:45;下班时间确定为17:00。
LAC信息(位置区编码) | 位置采集时刻 | 注释 |
1303 | 06:00 | 开机 |
1303 | 07:00 | 出门 |
2314 | 07:05 | 乘坐交通工具 |
2315 | 07:10 | 乘坐交通工具 |
2316 | 07:15 | 乘坐交通工具 |
4317 | 07:45 | 到达公司 |
4317 | 10:10 | 打电话 |
4317 | 15:20 | 接电话 |
4317 | 17:00 | 下班 |
2316 | 17:15 | 乘坐交通工具 |
2315 | 17:25 | 乘坐交通工具 |
2314 | 17:45 | 乘坐交通工具 |
1303 | 18:00 | 在家 |
1303 | 19:30 | 接电话 |
1303 | 23:00 | 关机 |
表1
步骤101、对预设时长内的所有通话记录,根据所有通话记录的平均通话时长,对每个通话对象的各通话记录的通话时长进行得分计算。
本步骤中,对每个通话对象的各通话记录的通话时长进行得分计算具体包括:
对每个通话对象的各通话记录的通话时长,根据通话时长小于平均通话时长的二分之一的,确定得分为0.5;
通话时长为平均通话时长二分之一到二倍的,确定得分为1;
通话时长为大于平均通话时长二倍而小于等于平均通话时长三倍的,确定得分为1.5;
通话时长大于平均通话时长三倍的,确定得分为2。
需要说明的是,这里的预设时长是指根据本领域技术人员分析获得的较为合理的时长,一般的取3~6个月较为合适,通过3~6月的时长的通话记录可以确定较为真实的社会关系信息。
在计算通话记录的平均时长后,本发明方法还包括:
对通信记录删除非手机号码和数据库标记的无效社会关系的手机号码的通话记录,按照预先设定的平均通话时长的百分比阈值作为有效通话时长对剩余的通话记录进行过滤,删除无效的通信记录。
需要说明的是,非手机号码由于无法提供拨打的位置信息以及无法确定座机使用者为何人,因此需要删除、数据库标记的手机号码是指中介、快递以及其他营销类手机号码,该类号码在现有的数据分析软件、搜索引擎的数据库中都有统计,对确定社会关系而言,意义不大。如果进行分析,容易影响数据分析和造成资源消耗。百分比阈值为本领域技术人员预先设定的经验值,一般的可以设定为15%~25%中的任一数值。
为了清楚陈述该部分内容,以用户186*****111与通话对象186*****000、010xxxx的通话记录为例,表2为用户在一段时间内的通话记录。
序号 | 主叫手机号 | 主叫LAC | 被叫 | 被叫LAC | 呼叫时刻 | 通话时长 |
1 | 186*****111 | 186*****000 | 8:15 | 3分钟 | ||
2 | 186*****000 | 186*****111 | 9:15 | 2分钟 | ||
3 | 186*****000 | 186*****111 | 10:15 | 3秒 | ||
4 | 186*****111 | 186*****000 | 13:15 | 2分钟 | ||
5 | 186*****000 | 186*****111 | 14:15 | 1分钟 | ||
6 | 186*****000 | 186*****111 | 15:15 | 3分钟 | ||
7 | 186*****111 | 186*****000 | 20:15 | 10分钟 | ||
8 | 186*****000 | 186*****111 | 21:15 | 3分钟 |
表2
表2中序号为3的通话记录由于通信时长小于有效通话时长,因此,该部分通话记录会被删除,假设用户所有通话记录的平均通话时长为180.375秒,以剔除序号为3的表2作为一个通话对象的通话记录为例,则统计得分后,可以得到表3的得分统计;
序号 | 得分 |
1 | 1 |
2 | 1 |
4 | 1 |
5 | 0.5 |
6 | 1 |
7 | 2 |
8 | 1 |
表3
步骤102、将计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值。
根据序号对应的时间,可以对统计的得分进行分组,得到工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫的统计得分;这里通过表4的象限来表示,当然,还可以通过对不同通话对象设置相应的关键字,采用相应的数据库进行分组统计得分。
非工作时间 | 工作时间 | |
主叫 | 2 | 2(1+1) |
被叫 | 1 | 2.5(1+0.5+1) |
表4
步骤103、将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,进行归一化处理,获得各通话对象相应的关系系数。
进行归一化处理具体包括:
将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,除以该通话对象所有得分的累加的平方。
工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫的统计得分分别为2、1、2和2.5,所有分组的分组得分平均值为(2+1+2+2.5)/4=15/8,
各通话对象各分组得分与所有分组的分组得分平均值求差的平方累加后为:
(2-15/8)2+(1-15/8)2+(2-15/8)2+(2.5-15/8)2=1.1875;
该通话对象所有得分的累加的平方为:(1+1+1+0.5+1+2+1)2=56.25;
计算关系系数为:1.1875/56.25=0.021111
步骤104、根据所有通话对象的关系系数,确定社会关系。
本步骤具体包括:
对所有通话对象的关系系数按照大小排序后,按照组内差别小于第一预设阈值和组间大于第二预设阈值,确定出关系系数较低的一组为家人分组;
需要说明的是,根据关系系数的计算公式,涉及到工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫分别与所有分组的分组得分平均值,根据这一步的计算,可以确定用户和通话对象在工作时间和非工作时间、主叫和被叫是否都有保持比较常规通话频率的通话;一般的,如果上班和下班时间内,都有发生主叫和被叫,且通话次数和时长都相对稳定,则在社会关系中家人是比较符合通话对象身份的;对于同事和朋友,则由于同事在工作时间的主叫和工作时间被叫的得分统计往往远高于非工作时间的主叫和非工作时间的被叫,因此,各通话对象各分组得分与所有分组的分组得分平均值求差的平方累加为较大的一个数值;及正常用户的社会关系通过关系系数可以进行统计分析。
对确定出的家人分组,对关系系数进行求平均获得系数平均值后,将大于系数平均值的通话对象确定社会关系为联系紧密的家人,其他确定为社会关系联系普通的家人;
根据预先确定的判别方式对确定出家人分组以外的其他通话对象,确定朋友和同事。
以下,通过一组计算的关系系数进行说明:
186*****111与186*****000的关系系数0.021111;
186*****111与186*****222的关系系数0.051156;
186*****111与186*****333的关系系数0.061156;
186*****111与186*****444的关系系数0.321156;
186*****111与186*****555的关系系数0.331156;
186*****111与186*****666的关系系数0.341156。
其中,前面三组号码的关系系数差别小于0.021、前三组和后三组号码关系系数差别大于0.25、由此可以判断属于两个分组,关系系数越小说明工作时间和非工作时间都有比较常规的联系,由此,前面三组被判断为家人分组。
进一步地,根据预先确定的判别方式确定朋友和同事具体包括:
将各通话对象分组统计的非工作时间主叫与所有分组的分组得分平均值求差的平方、加上工作时间主叫与所有分组的分组得分平均值求差的平方,与工作时间主叫与所有分组的分组得分平均值求差的平方、加上非工作时间主叫与所有分组的分组得分平均值求差的平方进行大小比较,
非工作时间主叫与所有分组的分组得分平均值求差的平方、加上工作时间主叫与所有分组的分组得分平均值求差的平方较大时,确定为朋友;否则,确定为同事。
当用户和家人分组的一个或一个以上通话对象为同一运营商的客户时,本发明方法还包括:当非工作时间的位置信息相同时,将相应的确定为联系紧密的家人更新为联系亲密的家人,将相应的确定为联系普通的家人更新为联系紧密的家人。
本发明方法还包括:在进行分组统计时,对各通话对象的短信记录进行得分计算,并按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值,以获得各通话对象的关系系数;
对短信记录进行得分计算为:按照每条短信得分为0.1对短信记录的短信进行累加。
本发明通过对用户的通话记录按照分组统计后,获得的关系系数进行社会关系的判断,通过通信记录的分析,确定了准确的社会关系,为运营商业务推广提供了依据,为相关的业务申请审核提供了重要的参考依据。
图2为本发明分析用户社会关系的装置的结构框图,如图2所示,包括:时间确定单元、得分计算单元、分组统计单元、关系系数单元和关系确定单元;其中,
时间确定单元,用于根据用户的位置信息,确定用户的工作时间和非工作时间;
得分计算单元,用于对预设时长内的所有通话记录,根据所有通话记录的平均通话时长,对每个通话对象的各通话记录的通话时长进行得分计算;
得分计算单元具体用于,
对每个通话对象的各通话记录的通话时长,
根据通话时长小于平均通话时长的二分之一的,确定得分为0.5;
通话时长为平均通话时长二分之一到二倍的,确定得分为1;
通话时长为大于平均通话时长二倍而小于等于平均通话时长三倍的,确定得分为1.5;
通话时长大于平均通话时长三倍的,确定得分为2。
得分计算单元还用于,在计算通话记录的平均时长后,对通信记录删除非手机号码和数据库标记的无效手机号码的部分,按照预先设定的平均通话时长的百分比阈值作为有效通话时长对剩余的通话记录进行过滤,删除无效的通信记录。
分组统计单元,用于将计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值;
关系系数单元,用于将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,进行归一化处理,获得各通话对象相应的关系系数;
关系系数单元具体用于,将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,除以该通话对象所有得分的累加的平方,完成归一化处理,获得各通话对象相应的关系系数。
关系确定单元,用于根据所有通话对象的关系系数,确定社会关系。具体用于,
对所有通话对象的关系系数按照大小排序后,按照组内差别小于第一预设阈值和组间大于第二预设阈值,确定出家人分组;
对确定出的家人分组,对关系系数进行求平均获得系数平均值后,将大于系数平均值的通话对象确定社会关系为联系紧密的家人,其他确定为社会关系联系普通的家人;
对确定出家人分组以外的其他通话对象,
将各通话对象分组统计的非工作时间主叫与所有分组的分组得分平均值求差的平方、加上工作时间主叫与所有分组的分组得分平均值求差的平方,与工作时间主叫与所有分组的分组得分平均值求差的平方、加上非工作时间主叫与所有分组的分组得分平均值求差的平方进行大小比较,
非工作时间主叫与所有分组的分组得分平均值求差的平方、加上工作时间主叫与所有分组的分组得分平均值求差的平方较大时,确定为朋友;否则,确定为同事。
本发明装置还包括加权判断单元,用于当用户和家人分组的一个或一个以上通话对象为同一运营商的客户时,在非工作时间的位置信息相同时,将相应的确定为联系紧密的家人更新为联系亲密的家人,将相应的确定为联系普通的家人更新为联系紧密的家人。
本发明得分计算单元还用于,对各通话对象的短信记录进行得分计算;
对短信记录进行得分计算为:按照每条短信得分为0.1对短信记录的短信进行累加;
分组统计单元还用于,将短信记录计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫累加到相应的分组中进行统计并计算相应的所有分组的分组得分平均值。
虽然本申请所揭露的实施方式如上,但所述的内容仅为便于理解本申请而采用的实施方式,并非用以限定本申请,如本发明实施方式中的具体的实现方法。任何本申请所属领域内的技术人员,在不脱离本申请所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本申请的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (15)
1.一种分析用户社会关系的方法,其特征在于,包括:
根据用户的位置信息,确定用户的工作时间和非工作时间;
对预设时长内的所有通话记录,根据所有通话记录的平均通话时长,对每个通话对象的各通话记录的通话时长进行得分计算;
将计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值;
将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,进行归一化处理,获得各通话对象相应的关系系数;
根据所有通话对象的关系系数,确定社会关系。
2.根据权利要求1所述的方法,其特征在于,在所述计算通话记录的平均时长后,该方法还包括:
对所述通话记录删除非手机号码和数据库标记的无效手机号码的部分,按照预先设定的平均通话时长的百分比阈值作为有效通话时长对剩余的通话记录进行过滤,删除无效的通话记录。
3.根据权利要求1或2所述的方法,其特征在于,所述对每个通话对象的各通话记录的通话时长进行得分计算具体包括:
对每个通话对象的各通话记录的通话时长,根据通话时长小于所述平均通话时长的二分之一的,确定得分为0.5;
通话时长为所述平均通话时长二分之一到二倍的,确定得分为1;
通话时长为大于所述平均通话时长二倍而小于等于所述平均通话时长三倍的,确定得分为1.5;
通话时长大于所述平均通话时长三倍的,确定得分为2。
4.根据权利要求1或2所述的方法,其特征在于,所述进行归一化处理具体包括:
将所述各通话对象各分组得分与所述所有分组的分组得分平均值求差的平方后累加,除以该通话对象所有得分的累加的平方,完成归一化处理。
5.根据权利要求1或2所述的方法,其特征在于,所述根据关系系数,确定社会关系具体包括:
对所有通话对象的所述关系系数按照大小排序后,按照组内差别小于第一预设阈值和组间大于第二预设阈值,确定出家人分组;
对确定出的家人分组,对所述关系系数进行求平均获得系数平均值后,将大于系数平均值的通话对象确定社会关系为联系紧密的家人,其他确定为社会关系联系普通的家人;
根据预先确定的判别方式对确定出家人分组以外的其他通话对象,确定朋友和同事。
6.根据权利要求5所述的方法,其特征在于,当用户和家人分组的一个或一个以上通话对象为同一运营商的客户时,该方法还包括:当非工作时间的位置信息相同时,将相应的确定为联系紧密的家人更新为联系亲密的家人,将相应的确定为联系普通的家人更新为联系紧密的家人。
7.根据权利要求1或2所述的方法,其特征在于,该方法还包括:在进行分组统计时,对所述各通话对象的短信记录进行得分计算,并按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值,以获得各通话对象的关系系数;
所述对短信记录进行得分计算为:按照每条短信得分为0.1对短信记录的短信进行累加。
8.一种分析用户社会关系的装置,其特征在于,包括:时间确定单元、得分计算单元、分组统计单元、关系系数单元和关系确定单元;其中,
时间确定单元,用于根据用户的位置信息,确定用户的工作时间和非工作时间;
得分计算单元,用于对预设时长内的所有通话记录,根据所有通话记录的平均通话时长,对每个通话对象的各通话记录的通话时长进行得分计算;
分组统计单元,用于将计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫进行得分的分组统计并计算相应的所有分组的分组得分平均值;
关系系数单元,用于将各通话对象各分组得分与所有分组的分组得分平均值求差的平方后累加,进行归一化处理,获得各通话对象相应的关系系数;
关系确定单元,用于根据所有通话对象的关系系数,确定社会关系。
9.根据权利要求8所述的装置,其特征在于,所述得分计算单元还用于,在计算通话记录的平均时长后,对所述通话记录删除非手机号码和数据库标记的无效手机号码的部分,按照预先设定的平均通话时长的百分比阈值作为有效通话时长对剩余的通话记录进行过滤,删除无效的通话记录。
10.根据权利要求8所述的装置,其特征在于,所述得分计算单元具体用于,
对每个通话对象的各通话记录的通话时长,
根据通话时长小于所述平均通话时长的二分之一的,确定得分为0.5;
通话时长为所述平均通话时长二分之一到二倍的,确定得分为1;
通话时长为大于所述平均通话时长二倍而小于等于所述平均通话时长三倍的,确定得分为1.5;
通话时长大于所述平均通话时长三倍的,确定得分为2。
11.根据权利要求8~10任一项所述的装置,其特征在于,所述关系系数单元具体用于,将各通话对象各分组得分与所述所有分组的分组得分平均值求差的平方后累加,除以该通话对象所有得分的累加的平方,完成归一化处理,获得各通话对象相应的关系系数。
12.根据权利要求8~10任一项所述的装置,其特征在于,所述关系确定单元具体用于,
对所有通话对象的所述关系系数按照大小排序后,按照组内差别小于第一预设阈值和组间大于第二预设阈值,确定出家人分组;
对确定出的家人分组,对关系系数进行求平均获得系数平均值后,将大于系数平均值的通话对象确定社会关系为联系紧密的家人,其他确定为社会关系联系普通的家人;
根据预先确定的判别方式对确定出家人分组以外的其他通话对象,确定朋友和同事。
13.根据权利要求12所述的装置,其特征在于,所述关系确定单元具体用于,
对所有通话对象的所述关系系数按照大小排序后,按照组内差别小于第一预设阈值和组间大于第二预设阈值,确定出家人分组;
对确定出的家人分组,对关系系数进行求平均获得系数平均值后,将大于系数平均值的通话对象确定社会关系为联系紧密的家人,其他确定为社会关系联系普通的家人。
14.根据权利要求8所述的装置,其特征在于,该装置还包括加权判断单元,用于当用户和家人分组的一个或一个以上通话对象为同一运营商的客户时,在非工作时间的位置信息相同时,将相应的确定为联系紧密的家人更新为联系亲密的家人,将相应的确定为联系普通的家人更新为联系紧密的家人。
15.根据权利要求8~10任一项所述的装置,其特征在于,所述得分计算单元还用于,对各通话对象的短信记录进行得分计算;
所述对短信记录进行得分计算为:按照每条短信得分为0.1对短信记录的短信进行累加;
所述分组统计单元还用于,将短信记录计算的得分按照工作时间主叫、工作时间被叫、非工作时间主叫、非工作时间被叫累加到相应的分组中进行统计并计算相应的所有分组的分组得分平均值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510004114.8A CN104636439B (zh) | 2015-01-04 | 2015-01-04 | 一种分析用户社会关系的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510004114.8A CN104636439B (zh) | 2015-01-04 | 2015-01-04 | 一种分析用户社会关系的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104636439A CN104636439A (zh) | 2015-05-20 |
CN104636439B true CN104636439B (zh) | 2018-07-03 |
Family
ID=53215185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510004114.8A Active CN104636439B (zh) | 2015-01-04 | 2015-01-04 | 一种分析用户社会关系的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104636439B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372072B (zh) * | 2015-07-20 | 2019-11-01 | 北京大学 | 一种基于位置的移动社会网络用户关系的识别方法 |
CN105159926B (zh) * | 2015-08-04 | 2019-04-16 | 百度在线网络技术(北京)有限公司 | 建立用户的用户信息关联的方法和装置 |
CN105096144A (zh) * | 2015-08-24 | 2015-11-25 | 小米科技有限责任公司 | 社交关系分析方法及装置 |
CN106557942B (zh) * | 2015-09-30 | 2020-07-10 | 百度在线网络技术(北京)有限公司 | 一种用户关系的识别方法和装置 |
CN105354749A (zh) * | 2015-10-16 | 2016-02-24 | 重庆邮电大学 | 一种基于社会网络的移动终端用户分组方法 |
CN106170127A (zh) * | 2016-06-23 | 2016-11-30 | 中国联合网络通信集团有限公司 | 重入网用户识别的方法与装置 |
CN106339482A (zh) * | 2016-08-31 | 2017-01-18 | 五八同城信息技术有限公司 | 确定商家最佳沟通时间的方法及装置 |
CN108268477A (zh) * | 2016-12-30 | 2018-07-10 | 中国电信股份有限公司 | 一种基于话单的用户关系确定方法和装置 |
CN108737617A (zh) * | 2017-04-25 | 2018-11-02 | 北京小米移动软件有限公司 | 获取最相关联系人信息的方法及装置和移动终端 |
CN110019382B (zh) * | 2017-07-21 | 2021-09-24 | 东软集团股份有限公司 | 用户亲密度指数确定方法、装置、存储介质及电子设备 |
CN107609087A (zh) * | 2017-09-07 | 2018-01-19 | 马上消费金融股份有限公司 | 一种社交关系的分析方法及装置 |
CN110337059B (zh) * | 2018-03-30 | 2021-03-12 | 中国联合网络通信集团有限公司 | 一种用户家庭关系的分析算法、服务器及网络*** |
CN110677269B (zh) * | 2018-07-03 | 2022-05-13 | 中国电信股份有限公司 | 通信用户关系的确定方法、装置和计算机可读存储介质 |
CN111092764B (zh) * | 2019-12-18 | 2023-10-17 | 电信科学技术第五研究所有限公司 | 一种实时动态亲密度关系分析方法及*** |
CN111148044B (zh) * | 2019-12-30 | 2021-06-01 | 中国联合网络通信集团有限公司 | 企业位置信息获取方法、装置、设备和存储介质 |
CN112417311A (zh) * | 2020-10-29 | 2021-02-26 | 上海淇玥信息技术有限公司 | 一种基于影响因子执行业务的方法、装置和电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1612629A (zh) * | 2003-10-31 | 2005-05-04 | 英华达(上海)电子有限公司 | 一种依照人际关系指数排列电话簿资料的方法 |
CN102255890A (zh) * | 2011-05-30 | 2011-11-23 | 苏宁军 | 一种用户推荐与信息交互的***及方法 |
CN102281498A (zh) * | 2011-07-28 | 2011-12-14 | 北京大学 | 手机通话数据中用户通勤od的挖掘方法 |
CN102857605A (zh) * | 2012-07-23 | 2013-01-02 | 北京小米科技有限责任公司 | 一种联系人分组方法及装置 |
CN103905622A (zh) * | 2012-12-27 | 2014-07-02 | 上海鼎为电子科技(集团)有限公司 | 移动终端中联系人的区分方法、装置及移动终端 |
CN104065786A (zh) * | 2013-03-22 | 2014-09-24 | 腾讯科技(深圳)有限公司 | 标柱联系人常用号码的方法及移动终端 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8180807B2 (en) * | 2007-11-27 | 2012-05-15 | At&T Intellectual Property I, L.P. | System and method of determining relationship information |
-
2015
- 2015-01-04 CN CN201510004114.8A patent/CN104636439B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1612629A (zh) * | 2003-10-31 | 2005-05-04 | 英华达(上海)电子有限公司 | 一种依照人际关系指数排列电话簿资料的方法 |
CN102255890A (zh) * | 2011-05-30 | 2011-11-23 | 苏宁军 | 一种用户推荐与信息交互的***及方法 |
CN102281498A (zh) * | 2011-07-28 | 2011-12-14 | 北京大学 | 手机通话数据中用户通勤od的挖掘方法 |
CN102857605A (zh) * | 2012-07-23 | 2013-01-02 | 北京小米科技有限责任公司 | 一种联系人分组方法及装置 |
CN103905622A (zh) * | 2012-12-27 | 2014-07-02 | 上海鼎为电子科技(集团)有限公司 | 移动终端中联系人的区分方法、装置及移动终端 |
CN104065786A (zh) * | 2013-03-22 | 2014-09-24 | 腾讯科技(深圳)有限公司 | 标柱联系人常用号码的方法及移动终端 |
Also Published As
Publication number | Publication date |
---|---|
CN104636439A (zh) | 2015-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104636439B (zh) | 一种分析用户社会关系的方法及装置 | |
CN108924333B (zh) | 诈骗电话识别方法、装置和*** | |
WO2016197675A1 (zh) | 骚扰电话的识别方法及装置 | |
CN104038648B (zh) | 骚扰电话的识别方法和装置 | |
CN103124254B (zh) | 一种建立定向推送的方法、服务器和装置 | |
CN110337059B (zh) | 一种用户家庭关系的分析算法、服务器及网络*** | |
US20140129420A1 (en) | Telecom social network analysis driven fraud prediction and credit scoring | |
CN104104772B (zh) | 一种欺诈电话提示方法、服务器及*** | |
CN110381218B (zh) | 一种识别电话诈骗团伙的方法及装置 | |
CN106658564A (zh) | 一种家庭用户的识别方法及装置 | |
CN105451234A (zh) | 一种基于信令交互数据的可疑号码分析方法及装置 | |
CN110611929A (zh) | 异常用户识别方法及装置 | |
CN108810290B (zh) | 一种诈骗电话的识别的方法及*** | |
CN113206909A (zh) | 骚扰电话拦截方法及装置 | |
CN107295491A (zh) | 呼叫转移时自动筛选主叫用户的方法及*** | |
CN110113748B (zh) | 骚扰***控方法、装置 | |
CN108198086B (zh) | 用于依据通信行为特征来识别骚扰源的方法和装置 | |
WO2018144635A1 (en) | Identifying and scoring key influencers in a network | |
CN102238261A (zh) | 一种控制通话接收设备接听通话请求的控制方法及装置 | |
CN106982284A (zh) | 骚扰电话号码的识别方法及装置 | |
CN106875276A (zh) | 一种通信用户社交圈生成方法及*** | |
CN116016769A (zh) | 一种欺诈团伙的识别方法、装置及可读存储介质 | |
CN109600744B (zh) | 一种语音处理方法及*** | |
CN103167501A (zh) | 基于被叫离散度的提高骚扰电话号码识别正确率的方法 | |
CN107770734B (zh) | 移动用户常驻地识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |