CN106686261A

CN106686261A - 一种信息处理方法及***

Info

Publication number: CN106686261A
Application number: CN201710043787.3A
Authority: CN
Inventors: 蔡超维; 张华�; 卢扬
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-01-19
Filing date: 2017-01-19
Publication date: 2017-05-17
Anticipated expiration: 2037-01-19
Also published as: CN106686261B

Abstract

本发明实施例公开了一种信息处理方法及***。所述方法包括：采集通信记录信息；分析所述通信记录信息，获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数；基于所述特征参数按照预设分类规则对被叫号码进行分类，获得所述被叫号码对应的类别属性；其中，所述预设分类规则基于预先提取样本通信记录信息的样本特征参数、对所述样本特征参数进行训练获得；基于所述类别属性所表征的用户受骗程度执行相应的提醒操作。

Description

一种信息处理方法及***

技术领域

本发明涉及信息处理技术，具体涉及一种信息处理方法及***。

背景技术

当今社会中，诈骗电话很多，有数量不少的人群容易被诈骗电话蒙蔽从而损失钱财。现有技术中，防范诈骗电话的技术方案主要分为两种：一是普遍适用的提醒，例如通过黑名单的设置，只要用户接到黑名单数据库中的电话，则会接收到提醒该电话是诈骗电话的短信；二是对恶意号码直接关停，以防止用户被骗。

上述第一种技术方案对用户是无差别对待，无法真正起到防诈骗的作用，提醒效果较差。而上述第二种技术方案在实际运用中并没有起到较好的效果，因为换一个电话号码成本极低，即时号码被关停，诈骗人员也可以快速的更换号码继续行骗。

发明内容

为解决现有存在的技术问题，本发明实施例提供一种信息处理方法及***。

为达到上述目的，本发明实施例的技术方案是这样实现的：

本发明实施例提供了一种信息处理方法，所述方法包括：

采集通信记录信息；

分析所述通信记录信息，获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数；

基于所述特征参数按照预设分类规则对被叫号码进行分类，获得所述被叫号码对应的类别属性；其中，所述预设分类规则基于预先提取样本通信记录信息的样本特征参数、对所述样本特征参数进行训练获得；

基于所述类别属性所表征的用户受骗程度执行相应的提醒操作。

上述方案中，所述获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数，包括：

获得多个通信记录信息中第一通信记录信息中与主叫号码和/或被叫号码相关联的第一特征参数；所述第一通信记录信息为所述多个通信记录信息中的任一通信记录信息；以及获得所述多个通信记录信息中至少部分通信记录信息之间的与主叫号码和/或被叫号码相关联的第二特征参数；

依据所述第一特征参数和所述第二特征参数生成特征参数；其中，所述特征参数包括：主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离。

上述方案中，所述基于所述特征参数按照预设分类规则对被叫号码进行分类，获得所述被叫号码对应的类别属性，包括：

基于所述特征参数按照预设分类规则将被叫号码至少分为三类，获得所述被叫号码对应的类别属性包括第一类别属性、第二类别属性和第三类别属性。

上述方案中，所述基于所述类别属性所表征的用户受骗程度执行相应的提醒操作，包括：

当所述被叫号码对应第一类别属性时，生成提醒信息，发送所述提醒信息至所述被叫号码；

当所述被叫号码对应第二类别属性时，发送所述被叫号码至客服中心，以使所述客服中心的客服人员与所述被叫号码对应用户通话；

当所述被叫号码对应第三类别属性时，发送所述被叫号码至特定职能机构对应的服务平台，以使所述特定职能机构的人员与所述被叫号码对应用户通话。

上述方案中，所述基于所述特征参数按照预设分类规则对被叫号码进行分类之前，所述方法还包括：

采集样本通信记录信息，分析所述样本通信记录信息，获得所述样本通信记录信息中与主叫号码和/或被叫号码相关联的样本特征参数以及对应的被叫号码的类别属性；

基于所述样本特征参数以及对应的被叫号码的类别属性进行训练获得表征特定分类规则的分类模型。

上述方案中，所述采集通信记录信息，包括：采集多个原始通信记录信息，对所述原始通信记录信息进行预处理，滤除错误的原始通信记录信息，以及统一所述原始通信记录信息中的主叫号码和被叫号码的格式后，获得的原始通信记录信息作为所述通信记录信息。

本发明实施例还提供了一种信息处理***，所述***包括：采集单元、分类识别单元和提醒操作单元；其中，

所述采集单元，用于采集通信记录信息；

所述分类识别单元，用于分析所述采集单元采集的通信记录信息，获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数；基于所述特征参数按照预设分类规则对被叫号码进行分类，获得所述被叫号码对应的类别属性；其中，所述预设分类规则基于预先提取样本通信记录信息的样本特征参数、对所述样本特征参数进行训练获得；

所述提醒操作单元，用于基于所述分类识别单元获得的类别属性所表征的用户受骗程度执行相应的提醒操作。

上述方案中，所述分类识别单元，用于获得多个通信记录信息中第一通信记录信息中与主叫号码和/或被叫号码相关联的第一特征参数；所述第一通信记录信息为所述多个通信记录信息中的任一通信记录信息；以及获得所述多个通信记录信息中至少部分通信记录信息之间的与主叫号码和/或被叫号码相关联的第二特征参数；依据所述第一特征参数和所述第二特征参数生成特征参数；

其中，所述特征参数包括：主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离。

上述方案中，所述分类识别单元，用于基于所述特征参数按照预设分类规则将被叫号码至少分为三类，获得所述被叫号码对应的类别属性包括第一类别属性、第二类别属性和第三类别属性。

上述方案中，所述提醒操作单元，用于当所述被叫号码对应第一类别属性时，生成提醒信息，发送所述提醒信息至所述被叫号码；当所述被叫号码对应第二类别属性时，发送所述被叫号码至客服中心，以使所述客服中心的客服人员与所述被叫号码对应用户通话；当所述被叫号码对应第三类别属性时，发送所述被叫号码至特定职能机构对应的服务平台，以使所述特定职能机构的人员与所述被叫号码对应用户通话。

上述方案中，所述***还包括模型训练单元；

所述采集单元，还用于所述分类识别单元基于所述特征参数按照预设分类规则对被叫号码进行分类之前，采集样本通信记录信息；

所述分类识别单元，还用于分析所述采集单元采集的所述样本通信记录信息，获得所述样本通信记录信息中与主叫号码和/或被叫号码相关联的样本特征参数以及对应的被叫号码的类别属性；

所述模型训练单元，用于基于所述分类识别单元获得的所述样本特征参数以及对应的被叫号码的类别属性进行训练获得表征特定分类规则的分类模型。

上述方案中，所述采集单元，用于采集多个原始通信记录信息，对所述原始通信记录信息进行预处理，滤除错误的原始通信记录信息，以及统一所述原始通信记录信息中的主叫号码和被叫号码的格式后，获得的原始通信记录信息作为所述通信记录信息。

本发明实施例提供的信息处理方法及***，所述方法包括：采集通信记录信息；分析所述通信记录信息，获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数；基于所述特征参数按照预设分类规则对被叫号码进行分类，获得所述被叫号码对应的类别属性；其中，所述预设分类规则基于预先提取样本通信记录信息的样本特征参数、对所述样本特征参数进行训练获得；基于所述类别属性所表征的用户受骗程度执行相应的提醒操作。采用本发明实施例的技术方案，对被叫号码按照用户受骗程度进行分类，按照不同的分类属性执行相应的提醒操作，将人力资源最有效的利用到最可能受骗的用户群体上，在不影响普通用户体验的基础上，最大化的提高了提醒和劝阻的效果，减少了受骗用户群体的数量，降低了用户受骗的概率。

附图说明

图1为本发明实施例的信息处理方法的第一种流程示意图；

图2为本发明实施例的信息处理方法中对被叫号码分类的过程示意图；

图3为本发明实施例的信息处理方法的第二种流程示意图；

图4为本发明实施例的信息处理方法的一种应用流程示意图；

图5为本发明实施例的信息处理***的一种组成结构示意图；

图6为本发明实施例的信息处理***的另一种组成结构示意图；

图7为本发明实施例的信息处理***中各处理单元的处理过程示意图；

图8为本发明实施例的信息处理***作为硬件的组成结构示意图。

具体实施方式

发明人发现，电信诈骗主要类别有仿冒公检法，仿冒领导，仿冒客服等方式，每种类型都有非常成熟的套路，基本呈现三线运作的模式，从撒网、筛选、到转账，逐步对用户进行诈骗，这个过程可称之为具体情景。而接到诈骗电话的用户，大部分人是可以自己识破的，上当受骗的是小部分人。而现有的反诈骗技术中的普遍适用性的提醒短信并没有真正找到最容易受骗的用户，从而进行更深度的提醒和劝阻。也就是说，现有技术中并没有基于具体的情景(例如撒网、筛选、到转账的情景)针对处于不同阶段的用户采用不同的提醒方式，从而将人力资源有效的使用在最可能被骗的用户群体上。基于此，提出以下各实施例。

下面结合附图及具体实施例对本发明作进一步详细的说明。

实施例一

本发明实施例提供了一种信息处理方法。图1为本发明实施例的信息处理方法的第一种流程示意图；如图1所示，所述方法包括：

步骤101：采集通信记录信息。

步骤102：分析所述通信记录信息，获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数。

步骤103：基于所述特征参数按照预设分类规则对被叫号码进行分类，获得所述被叫号码对应的类别属性；其中，所述预设分类规则基于预先提取样本通信记录信息的样本特征参数、对所述样本特征参数进行训练获得。

步骤104：基于所述类别属性所表征的用户受骗程度执行相应的提醒操作。

本发明实施例的信息处理方法应用在信息处理***中，所述***可设置在服务器或服务器集群中，所述服务器具体可以是移动通信网络运营商部署的服务器；所述移动通信网络运营商例如移动、联通或电信等移动通信网络运营商。

本实施例中，所述通信记录信息具体为呼叫详细记录(CDR，Call DetailRecord)，也可称之为话单，所述通信记录信息具体可以包括：主叫号码、被叫号码、起始时间、结束时间、通话时长以及通话性质(所述通话性质例如本地通话、长途通话等性质)等等。则所述信息处理***可直接从运营商部署的服务器中获得所述通信记录信息。

作为一种实施方式，所述采集通信记录信息，包括：采集多个原始通信记录信息，对所述原始通信记录信息进行预处理，滤除错误的原始通信记录信息，以及统一所述原始通信记录信息中的主叫号码和被叫号码的格式后，获得的原始通信记录信息作为所述通信记录信息。

本实施例中，所述信息处理***可直接从运营商部署的服务器中获得通信记录信息，将直接获得的通信记录信息作为原始通信记录信息；进一步对原始通信记录信息进行预处理，在预处理过程中，滤除错误的原始通信记录信息；所述错误的原始通信记录信息例如号码(例如被叫号码错误)错误的原始通信记录信息、或者通话时长不足预设时长(例如通话时长不足2秒钟、通话接通即掉线的情况)的原始通信记录信息。滤除错误的原始通信记录信息后，统一所述原始通信记录信息中的主叫号码和被叫号码的格式，即对所述原始通信记录信息中的主叫号码和被叫号码归一化。例如，对于有些手机号码，会显示例如137xxxxxxxx，而有的手机号码会显示0086137xxxxxxxx，则在本实施例中，对所有的手机号码统一格式，例如统一为137xxxxxxxx这种格式而去除国家标识码。上述处理过程可称为话单预处理过程和话单清洗过程。按照上述预处理方式进行处理后，获得的通信记录信息可如表1所示。

主叫号码	被叫号码	通话时间	通话时长(秒)
				158xxxx0001	186xxxx0002	2016-01-15 15:36:42	134
0010086	139xxxx0001	2016-01-15 15:39:02	15
				138xxxx0001	139xxxx0002	2016-01-15 15:38:02	123

表1

作为一种实施方式，在对上述对原始通信记录信息进行预处理的过程还可以包括：按照主叫号码的属性特征进行分类，例如，按照手机号码、固定电话号码、公共服务号码进行分类；其中，手机号码和固定电话号码无需过多解释，所述公共服务号码例如特定企业对应的服务号码，例如10086是移动运营商对应的服务号码；又例如，10010是联通运营商对应的服务号码等等。

本实施例中，基于上述预处理方式进行预处理后获得的通信记录信息进行分析处理，获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数。作为一种实施方式，所述获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数，包括：获得多个通信记录信息中第一通信记录信息中与主叫号码和/或被叫号码相关联的第一特征参数；所述第一通信记录信息为所述多个通信记录信息中的任一通信记录信息；以及获得所述多个通信记录信息中至少部分通信记录信息之间的与主叫号码和/或被叫号码相关联的第二特征参数；依据所述第一特征参数和所述第二特征参数生成特征参数；其中，所述特征参数包括：主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离。当然，所述特征参数不限于上述列举的特征参数，还可以包括例如主叫号码的归属地、被叫号码的归属地、主叫号码的通信间隔等特征参数。

具体的，本实施方式中，所述信息处理***基于获得的通信记录信息，也即基于获得的话单进行特征参数的抽取和统计，获得例如主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离等特征参数；其中，所述主叫号码在单位时间内的通信次数例如主叫号码在一小时内的拨打次数；所述主叫号码和/或被叫号码的平均通话时长例如主叫号码和/或被叫号码相关联的所有通信记录信息中平均每个通信记录信息的通话时长；所述与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离具体可以为某一主叫号码相关联的相邻两个通信记录信息中两个被叫号码的差值，例如可以理解为：若某一主叫号码相关的通信记录信息中，第一个通信记录信息中的被叫号码为138xxxxxxx1，第二个通信记录信息中的被叫号码为138xxxxxxx2，则所述第二个通信记录信息和所述第一个通信记录信息中被叫号码的距离可以为相邻两个被叫号码的差值，在上述示例中，所述相邻两个被叫号码的差值为1。所述主叫号码的通信间隔具体指的是某一主叫号码的相邻两个通信记录信息中第二起始通话时刻与第一结束通话时刻的差值，或者第二起始通话时刻-(第一起始通话时刻+第一通话时长)；其中，在先的通信记录信息中的通讯参数标记为第一，在后的通信记录中的通讯参数标记为第二，即在先的通信记录信息中至少包括第一起始通话时刻、第一结束通话时刻和第一通话时长，在后的通信记录信息中至少包括第二起始通话时刻、第二结束通话时刻和第二通话时长。

本实施例中，所述基于所述特征参数按照预设分类规则对被叫号码进行分类之前，所述方法还包括：采集样本通信记录信息，分析所述样本通信记录信息，获得所述样本通信记录信息中与主叫号码和/或被叫号码相关联的样本特征参数以及对应的被叫号码的类别属性；基于所述样本特征参数以及对应的被叫号码的类别属性进行训练获得表征特定分类规则的分类模型。

具体的，所述信息处理***在执行本实施例步骤101至步骤104之前，也可以在执行步骤103之前，需要通过采集并分析样本通信记录信息，获得所述样本通信记录信息中与主叫号码和/或被叫号码相关联的样本特征参数以及对应的被叫号码的类别属性；其中，对样本通信记录信息的采集过程以及分析过程可参照上述描述所述，这里不再赘述。在所述样本通信记录信息中，还可以包括主叫号码是否是诈骗号码以及被叫号码是否容易受骗的判定结果。本实施例中，在模型训练过程中，可基于具体的实际情景配置训练算法条件，例如配置相应的通话时间和通话次数等算法条件进行训练，对应不同受骗程度的被叫号码用户。具体的，本实施例中可将用户的受骗程度分为浅度受骗用户、深度受骗用户和高危用户；所述浅度受骗用户可以理解为撒网用户，即诈骗者首先需要大范围的撒网，处于撒网阶段的被叫号码称为撒网号码，相应的，该被叫号码用户称为撒网用户。所述深度受骗用户可以理解为筛选用户，即诈骗者在大范围的撒网后、筛选出部分用户进行进一步的诈骗，处于筛选阶段的被叫号码称为筛选被叫号码，相应的，该被叫号码用户称为筛选用户；所述高危用户可以理解为即将进行转账的用户，即诈骗者筛选用户后对用户进行“洗脑”，容易受骗的用户会轻信诈骗者的骗局从而会按照诈骗者提供的方式进行转账，则处于即将转账状态的被叫号码称为高危号码。在上述三类被叫号码中，处于不同阶段的被叫号码对应的特征参数具有一定区分度，例如撒网号码拨打次数多，平均通话时长短，被叫号码距离短，通话间隔短；因此基于通信记录信息统计撒网号码的行为特征，在统计获得的行为特征的基础上，利用机器学习算法，对主叫号码是否是诈骗号码进行识别，对诈骗号码相关联的被叫号码处于上述哪一个阶段进行分类，建立表征特定分类规则的分类模型。其中，所述机器学习算法例如贝叶斯分类算法。

本实施例中，依据上述描述过程中将诈骗者的诈骗过程可分为的三个阶段包括：撒网阶段、筛选阶段和“重点洗脑”阶段，或者，依据用户的受骗程度包括：浅度受骗用户、深度受骗用户和高危用户可将被叫号码划分为至少三个类型，则所述基于所述特征参数按照预设分类规则对被叫号码进行分类，获得所述被叫号码对应的类别属性，包括：基于所述特征参数按照预设分类规则将被叫号码至少分为三类，获得所述被叫号码对应的类别属性包括第一类别属性、第二类别属性和第三类别属性。

具体的，图2为本发明实施例的信息处理方法中对被叫号码分类的过程示意图；如图2所示，在获得被叫号码相关联的特征参数后，输入预设分类模型基于所述预设分类模型中预先建立的分类算法(例如贝叶斯分类算法)以及输入的特征参数确定所述被叫号码的类别属性；其中，输入的特征参数可包括第一特征参数、第二特征参数直至第N特征参数；N为正整数；所输入的特征参数包括但不限于前述获得的特征参数，例如主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离等等。通过分类模型输出被叫号码对应的类别属性，所述类别属性具体包括第一类别属性、第二类别属性和第三类别属性；上述类别属性分别对应于轻度受骗用户、深度受骗用户和高危用户。

本实施例中，所述基于所述类别属性所表征的用户受骗程度执行相应的提醒操作，包括：当所述被叫号码对应第一类别属性时，生成提醒信息，发送所述提醒信息至所述被叫号码；当所述被叫号码对应第二类别属性时，发送所述被叫号码至客服中心，以使所述客服中心的客服人员与所述被叫号码对应用户通话；当所述被叫号码对应第三类别属性时，发送所述被叫号码至特定职能机构对应的服务平台，以使所述特定职能机构的人员与所述被叫号码对应用户通话。

具体的，对于不同类别属性的被叫号码，由于其对应处于不同阶段用户，则执行不同的提醒方式。当第一类别属性对应轻度受骗用户时，则生成提醒信息，可直接通过短消息的方式发送所述提醒信息至所述被叫号码。当第二类别属性对应深度受骗用户时，则将被叫号码发送至客服中心，由客服中心的客服人员按照所述被叫号码进行回访与所述被叫号码用户进行通话，以劝阻该被叫号码用户不要轻信骗子的话。当第三类别属性对应高危用户时，则直接将被叫号码发送至特定机构对应的服务平台，例如公安局等特定机构对应的服务平台，由公安局等特定机构指派的警务人员按照所述被叫号码与所述被叫号码用户进行通话，采用更加强制的劝阻方式进行劝阻。

实施例二

本发明实施例还提供了一种信息处理方法，应用于信息处理***中。图3为本发明实施例的信息处理方法的第二种流程示意图；如图3所示，所述方法包括：

步骤201：采集样本通信记录信息，分析所述样本通信记录信息，获得所述样本通信记录信息中与主叫号码和/或被叫号码相关联的样本特征参数以及对应的被叫号码的类别属性。

步骤202：基于所述样本特征参数以及对应的被叫号码的类别属性进行训练获得表征特定分类规则的分类模型。

步骤203：采集通信记录信息，分析所述通信记录信息，获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数。

步骤204：基于所述特征参数按照所述分类模型对被叫号码进行分类，获得所述被叫号码对应的类别属性。

步骤205a：当所述被叫号码对应第一类别属性时，生成提醒信息，发送所述提醒信息至所述被叫号码。

步骤205b：当所述被叫号码对应第二类别属性时，发送所述被叫号码至客服中心，以使所述客服中心的客服人员与所述被叫号码对应用户通话。

步骤205c：当所述被叫号码对应第三类别属性时，发送所述被叫号码至特定职能机构对应的服务平台，以使所述特定职能机构的人员与所述被叫号码对应用户通话。

本实施例中，***采集并分析大量的样本通信记录信息，获得所述样本通信记录信息中与主叫号码和/或被叫号码相关联的样本特征参数以及对应的被叫号码的类别属性；其中，对所述样本通信记录信息进行采集并分析的处理过程包括：采集多个样本通信记录信息，对所述样本通信记录信息进行预处理，滤除错误的样本通信记录信息，以及统一所述样本通信记录信息中的主叫号码和被叫号码的格式后，获得的样本通信记录信息作为所述样本通信记录信息。具体的，在预处理过程中，滤除错误的样本通信记录信息；所述错误的样本通信记录信息例如号码(例如被叫号码错误)错误的样本通信记录信息、或者通话时长不足预设时长(例如通话时长不足2秒钟、通话接通即掉线的情况)的样本通信记录信息。滤除错误的样本通信记录信息后，统一所述样本通信记录信息中的主叫号码和被叫号码的格式，即对所述样本通信记录信息中的主叫号码和被叫号码归一化。例如，对于有些手机号码，会显示例如137xxxxxxxx，而有的手机号码会显示0086137xxxxxxxx，则在本实施例中，对所有的手机号码统一格式，例如统一为137xxxxxxxx这种格式而去除国家标识码。上述处理过程可称为话单预处理过程和话单清洗过程。另一方面，对样本通信记录信息中可按照主叫号码的属性特征进行分类，例如，按照手机号码、固定电话号码、公共服务号码进行分类。

进一步地，对处理后的样本通信记录信息进行分析处理，获得所述样本通信记录信息中与主叫号码和/或被叫号码相关联的特征参数。作为一种实施方式，所述获得所述样本通信记录信息中与主叫号码和/或被叫号码相关联的特征参数，包括：获得多个样本通信记录信息中第一样本通信记录信息中与主叫号码和/或被叫号码相关联的第一特征参数；所述第一样本通信记录信息为所述多个样本通信记录信息中的任一样本通信记录信息；以及获得所述多个样本通信记录信息中至少部分样本通信记录信息之间的与主叫号码和/或被叫号码相关联的第二特征参数；依据所述第一特征参数和所述第二特征参数生成特征参数；其中，所述特征参数包括：主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻样本通信记录信息中被叫号码的距离。当然，所述特征参数不限于上述列举的特征参数，还可以包括例如主叫号码的归属地、被叫号码的归属地、主叫号码的通信间隔等特征参数。其中，所述主叫号码在单位时间内的通信次数例如主叫号码在一小时内的拨打次数；所述主叫号码和/或被叫号码的平均通话时长例如主叫号码和/或被叫号码相关联的所有通信记录信息中平均每个通信记录信息的通话时长；所述与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离具体可以为某一主叫号码相关联的相邻两个通信记录信息中两个被叫号码的差值，例如可以理解为：若某一主叫号码相关的通信记录信息中，第一个通信记录信息中的被叫号码为138xxxxxxx1，第二个通信记录信息中的被叫号码为138xxxxxxx2，则所述第二个通信记录信息和所述第一个通信记录信息中被叫号码的距离可以为相邻两个被叫号码的差值，在上述示例中，所述相邻两个被叫号码的差值为1。所述主叫号码的通信间隔具体指的是某一主叫号码的相邻两个通信记录信息中第二起始通话时刻与第一结束通话时刻的差值，或者第二起始通话时刻-(第一起始通话时刻+第一通话时长)；其中，在先的通信记录信息中的通讯参数标记为第一，在后的通信记录中的通讯参数标记为第二，即在先的通信记录信息中至少包括第一起始通话时刻、第一结束通话时刻和第一通话时长，在后的通信记录信息中至少包括第二起始通话时刻、第二结束通话时刻和第二通话时长。

本实施例中，在所述样本通信记录信息中，还可以包括主叫号码是否是诈骗号码以及被叫号码是否容易受骗的判定结果。本实施例中，在模型训练过程中，可基于具体的实际情景配置训练算法条件，例如配置相应的通话时间和通话次数等算法条件进行训练，对应不同受骗程度的被叫号码用户。具体的，本实施例中可将用户的受骗程度分为浅度受骗用户、深度受骗用户和高危用户；所述浅度受骗用户可以理解为撒网用户，即诈骗者首先需要大范围的撒网，处于撒网阶段的被叫号码称为撒网号码，相应的，该被叫号码用户称为撒网用户。所述深度受骗用户可以理解为筛选用户，即诈骗者在大范围的撒网后、筛选出部分用户进行进一步的诈骗，处于筛选阶段的被叫号码称为筛选被叫号码，相应的，该被叫号码用户称为筛选用户；所述高危用户可以理解为即将进行转账的用户，即诈骗者筛选用户后对用户进行“洗脑”，容易受骗的用户会轻信诈骗者的骗局从而会按照诈骗者提供的方式进行转账，则处于即将转账状态的被叫号码称为高危号码。在上述三类被叫号码中，处于不同阶段的被叫号码对应的特征参数具有一定区分度，例如撒网号码拨打次数多，平均通话时长短，被叫号码距离短，通话间隔短；因此基于通信记录信息统计撒网号码的行为特征，在统计获得的行为特征的基础上，利用机器学习算法，对主叫号码是否是诈骗号码进行识别，对诈骗号码相关联的被叫号码处于上述哪一个阶段进行分类，建立表征特定分类规则的分类模型。其中，所述机器学习算法例如贝叶斯分类算法。

进一步地，在采集到多个通信记录信息后，按照上述统计分析方式对所述多个通信记录信息进行统计分析，获得所述多个通信记录信息中与主叫号码和/或被叫号码相关联的特征参数，其中，所述特征参数包括：主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离等等，当然，所述特征参数不限于上述列举的特征参数，还可以包括例如主叫号码的归属地、被叫号码的归属地、主叫号码的通信间隔等特征参数。将所述特征参数输入所述分类模型中获得被叫号码的分类，即获得所述被叫号码对应的类别属性是第一类别属性、第二类别属性或是第三类别属性。

本实施例中，基于所述被叫号码对应的类别属性的不同，执行相应的提醒方式。例如，当第一类别属性对应轻度受骗用户时，则生成提醒信息，可直接通过短消息的方式发送所述提醒信息至所述被叫号码。再例如，当第二类别属性对应深度受骗用户时，则将被叫号码发送至客服中心，由客服中心的客服人员按照所述被叫号码进行回访与所述被叫号码用户进行通话，以劝阻该被叫号码用户不要轻信骗子的话。又例如，当第三类别属性对应高危用户时，则直接将被叫号码发送至特定机构对应的服务平台，例如公安局等特定机构对应的服务平台，由公安局等特定机构指派的警务人员按照所述被叫号码与所述被叫号码用户进行通话，采用更加强制的劝阻方式进行劝阻。

下面结合一具体应用场景对本发明实施例的信息处理方案进行描述。

图4为本发明实施例的信息处理方法的一种应用流程示意图；如图4所示，包括：

步骤301：信息处理***实时采集话单并检测分析，获得话单中包括的特征参数，所述特征参数具体可以包括主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离等等。进一步依据上述特征参数以及预先配置的分类规则(即分类模型)对话单中的被叫号码进行分类，获得被叫号码对应的分类属性；所述分类属性包括：撒网号码、筛选号码和即将转账号码；上述三种分类属性的具体定义可参照实施例一中所述，这里不再赘述。对于上述三种分类属性分别执行步骤302、步骤305和步骤307。

具体的，步骤302中，判断是否为撒网号码，当判定为撒网号码时，执行步骤304：通过短信提醒用户。相应的，当判定不是撒网号码时，不执行任何操作，即不提醒。

步骤305中，判断是否为筛选号码，当判定为筛选号码时，执行步骤306：通过客服回访的方式回访用户，以劝阻用户不要上当受骗。相应的，当判定不是筛选号码时，不执行任何操作，即不提醒。

步骤307中，判断是否为即将转账号码，当判定为即将转账号码时，执行步骤308：通过警务人员劝阻用户，采用更加强硬的劝阻方式，以劝阻用户不要上当受骗。相应的，当判定不是即将转账号码时，不执行任何操作，即不提醒。

本应用场景在诈骗方式采用三线运作模式下，对处于撒网阶段的用户，只发送短信温馨提醒；对于经过诈骗分子筛选，受骗较深的用户，客服进行语音回访；对于已经被深度洗脑，劝阻不听，即将转账的用户，采取更强制的劝阻方式，甚至转给警方进行劝阻。

采用本发明实施例的技术方案，对被叫号码按照用户受骗程度进行分类，按照不同的分类属性执行相应的提醒操作，将人力资源最有效的利用到最可能受骗的用户群体上，在不影响普通用户体验的基础上，最大化的提高了提醒和劝阻的效果，减少了受骗用户群体的数量，降低了用户受骗的概率。在实际应用中，采用本发明实施例的技术方案，诈骗的涉案金额同比出现了至少30％的下降。

实施例三

本发明实施例还提供了一种信息处理***。图5为本发明实施例的信息处理***的一种组成结构示意图；如图5所示，所述***包括：采集单元31、分类识别单元32和提醒操作单元33；其中，

所述采集单元31，用于采集通信记录信息；

所述分类识别单元32，用于分析所述采集单元31采集的通信记录信息，获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数；基于所述特征参数按照预设分类规则对被叫号码进行分类，获得所述被叫号码对应的类别属性；其中，所述预设分类规则基于预先提取样本通信记录信息的样本特征参数、对所述样本特征参数进行训练获得；

所述提醒操作单元33，用于基于所述分类识别单元32获得的类别属性所表征的用户受骗程度执行相应的提醒操作。

本发明实施例的信息处理***可设置在服务器或服务器集群中，所述服务器具体可以是移动通信网络运营商部署的服务器；所述移动通信网络运营商例如移动、联通或电信等移动通信网络运营商。

本实施例中，所述通信记录信息具体为呼叫详细记录(CDR)，也可称之为话单，所述通信记录信息具体可以包括：主叫号码、被叫号码、起始时间、结束时间、通话时长以及通话性质(所述通话性质例如本地通话、长途通话等性质)等等。则所述信息处理***可直接从运营商部署的服务器中获得所述通信记录信息。

作为一种实施方式，所述采集单元31，用于采集多个原始通信记录信息，对所述原始通信记录信息进行预处理，滤除错误的原始通信记录信息，以及统一所述原始通信记录信息中的主叫号码和被叫号码的格式后，获得的原始通信记录信息作为所述通信记录信息。

本实施例中，所述采集单元31可直接从运营商部署的服务器中获得通信记录信息，将直接获得的通信记录信息作为原始通信记录信息；进一步对原始通信记录信息进行预处理，在预处理过程中，滤除错误的原始通信记录信息；所述错误的原始通信记录信息例如号码(例如被叫号码错误)错误的原始通信记录信息、或者通话时长不足预设时长(例如通话时长不足2秒钟、通话接通即掉线的情况)的原始通信记录信息。滤除错误的原始通信记录信息后，统一所述原始通信记录信息中的主叫号码和被叫号码的格式，即对所述原始通信记录信息中的主叫号码和被叫号码归一化。例如，对于有些手机号码，会显示例如137xxxxxxxx，而有的手机号码会显示0086137xxxxxxxx，则在本实施例中，对所有的手机号码统一格式，例如统一为137xxxxxxxx这种格式而去除国家标识码。按照上述预处理方式进行处理后，获得的通信记录信息可如实施例中的表1所示。上述处理过程可称为话单预处理过程和话单清洗过程。

作为一种实施方式，所述采集单元31对上述对原始通信记录信息进行预处理的过程还可以包括：按照主叫号码的属性特征进行分类，例如，按照手机号码、固定电话号码、公共服务号码进行分类；其中，手机号码和固定电话号码无需过多解释，所述公共服务号码例如特定企业对应的服务号码，例如10086是移动运营商对应的服务号码；又例如，10010是联通运营商对应的服务号码等等。

本实施例中，所述分类识别单元32基于上述预处理方式进行预处理后获得的通信记录信息进行分析处理，获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数。作为一种实施方式，所述分类识别单元32，用于获得多个通信记录信息中第一通信记录信息中与主叫号码和/或被叫号码相关联的第一特征参数；所述第一通信记录信息为所述多个通信记录信息中的任一通信记录信息；以及获得所述多个通信记录信息中至少部分通信记录信息之间的与主叫号码和/或被叫号码相关联的第二特征参数；依据所述第一特征参数和所述第二特征参数生成特征参数；其中，所述特征参数包括：主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离。当然，所述特征参数不限于上述列举的特征参数，还可以包括例如主叫号码的归属地、被叫号码的归属地、主叫号码的通信间隔等特征参数。

具体的，本实施方式中，所述分类识别单元32基于获得的通信记录信息，也即基于获得的话单进行特征参数的抽取和统计，获得例如主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离等特征参数；其中，所述主叫号码在单位时间内的通信次数例如主叫号码在一小时内的拨打次数；所述主叫号码和/或被叫号码的平均通话时长例如主叫号码和/或被叫号码相关联的所有通信记录信息中平均每个通信记录信息的通话时长；所述与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离具体可以为某一主叫号码相关联的相邻两个通信记录信息中两个被叫号码的差值，例如可以理解为：若某一主叫号码相关的通信记录信息中，第一个通信记录信息中的被叫号码为138xxxxxxx1，第二个通信记录信息中的被叫号码为138xxxxxxx2，则所述第二个通信记录信息和所述第一个通信记录信息中被叫号码的距离可以为相邻两个被叫号码的差值，在上述示例中，所述相邻两个被叫号码的差值为1。所述主叫号码的通信间隔具体指的是某一主叫号码的相邻两个通信记录信息中第二起始通话时刻与第一结束通话时刻的差值，或者第二起始通话时刻-(第一起始通话时刻+第一通话时长)；其中，在先的通信记录信息中的通讯参数标记为第一，在后的通信记录中的通讯参数标记为第二，即在先的通信记录信息中至少包括第一起始通话时刻、第一结束通话时刻和第一通话时长，在后的通信记录信息中至少包括第二起始通话时刻、第二结束通话时刻和第二通话时长。

图6为本发明实施例的信息处理***的另一种组成结构示意图；如图6所示，所述***还包括模型训练单元34；

所述采集单元31，还用于所述分类识别单元32基于所述特征参数按照预设分类规则对被叫号码进行分类之前，采集样本通信记录信息；

所述分类识别单元32，还用于分析所述采集单元31采集的所述样本通信记录信息，获得所述样本通信记录信息中与主叫号码和/或被叫号码相关联的样本特征参数以及对应的被叫号码的类别属性；

所述模型训练单元34，用于基于所述分类识别单元32获得的所述样本特征参数以及对应的被叫号码的类别属性进行训练获得表征特定分类规则的分类模型。

具体的，所述采集单元31对样本通信记录信息的采集过程以及所述分类识别单元32分析过程可参照上述描述所述，这里不再赘述。在所述样本通信记录信息中，还可以包括主叫号码是否是诈骗号码以及被叫号码是否容易受骗的判定结果。本实施例中，在模型训练过程中，所述模型训练单元34可基于具体的实际情景配置训练算法条件，例如配置相应的通话时间和通话次数等算法条件进行训练，对应不同受骗程度的被叫号码用户。具体的，本实施例中可将用户的受骗程度分为浅度受骗用户、深度受骗用户和高危用户；所述浅度受骗用户可以理解为撒网用户，即诈骗者首先需要大范围的撒网，处于撒网阶段的被叫号码称为撒网号码，相应的，该被叫号码用户称为撒网用户。所述深度受骗用户可以理解为筛选用户，即诈骗者在大范围的撒网后、筛选出部分用户进行进一步的诈骗，处于筛选阶段的被叫号码称为筛选被叫号码，相应的，该被叫号码用户称为筛选用户；所述高危用户可以理解为即将进行转账的用户，即诈骗者筛选用户后对用户进行“洗脑”，容易受骗的用户会轻信诈骗者的骗局从而会按照诈骗者提供的方式进行转账，则处于即将转账状态的被叫号码称为高危号码。在上述三类被叫号码中，处于不同阶段的被叫号码对应的特征参数具有一定区分度，例如撒网号码拨打次数多，平均通话时长短，被叫号码距离短，通话间隔短；因此基于通信记录信息统计撒网号码的行为特征，在统计获得的行为特征的基础上，利用机器学习算法，对主叫号码是否是诈骗号码进行识别，对诈骗号码相关联的被叫号码处于上述哪一个阶段进行分类，建立表征特定分类规则的分类模型。其中，所述机器学习算法例如贝叶斯分类算法。

本实施例中，依据上述描述过程中将诈骗者的诈骗过程可分为的三个阶段包括：撒网阶段、筛选阶段和“重点洗脑”阶段，或者，依据用户的受骗程度包括：浅度受骗用户、深度受骗用户和高危用户可将被叫号码划分为至少三个类型，则所述分类识别单元32，用于基于所述特征参数按照预设分类规则将被叫号码至少分为三类，获得所述被叫号码对应的类别属性包括第一类别属性、第二类别属性和第三类别属性。

具体的，如图2所示，所述分类识别单元32在获得被叫号码相关联的特征参数后，输入预设分类模型基于所述预设分类模型中预先建立的分类算法(例如贝叶斯分类算法)以及输入的特征参数确定所述被叫号码的类别属性；其中，输入的特征参数可包括第一特征参数、第二特征参数直至第N特征参数；N为正整数；所输入的特征参数包括但不限于前述获得的特征参数，例如主叫号码在单位时间内的通信次数、主叫号码和/或被叫号码的平均通话时长、与同一主叫号码相关联的相邻通信记录信息中被叫号码的距离等等。通过分类模型输出被叫号码对应的类别属性，所述类别属性具体包括第一类别属性、第二类别属性和第三类别属性；上述类别属性分别对应于轻度受骗用户、深度受骗用户和高危用户。

本实施例中，所述提醒操作单元33，用于当所述被叫号码对应第一类别属性时，生成提醒信息，发送所述提醒信息至所述被叫号码；当所述被叫号码对应第二类别属性时，发送所述被叫号码至客服中心，以使所述客服中心的客服人员与所述被叫号码对应用户通话；当所述被叫号码对应第三类别属性时，发送所述被叫号码至特定职能机构对应的服务平台，以使所述特定职能机构的人员与所述被叫号码对应用户通话。

具体的，对于不同类别属性的被叫号码，由于其对应处于不同阶段用户，则所述提醒操作单元33执行不同的提醒方式。当第一类别属性对应轻度受骗用户时，则所述提醒操作单元33生成提醒信息，可直接通过短消息的方式发送所述提醒信息至所述被叫号码。当第二类别属性对应深度受骗用户时，则所述提醒操作单元33将被叫号码发送至客服中心，由客服中心的客服人员按照所述被叫号码进行回访与所述被叫号码用户进行通话，以劝阻该被叫号码用户不要轻信骗子的话。当第三类别属性对应高危用户时，则所述提醒操作单元33直接将被叫号码发送至特定机构对应的服务平台，例如公安局等特定机构对应的服务平台，由公安局等特定机构指派的警务人员按照所述被叫号码与所述被叫号码用户进行通话，采用更加强制的劝阻方式进行劝阻。

具体的，图7为本发明实施例的信息处理***中各处理单元的处理过程示意图；上述各处理单元的处理过程具体可参照图7所示。

本发明实施例中，所述信息处理***中的分类识别单元32和模型训练单元34，在实际应用中均可由所述***中的中央处理器(CPU，Central Processing Unit)、数字信号处理器(DSP，Digital Signal Processor)、微控制单元(MCU，Microcontroller Unit)或可编程门阵列(FPGA，Field－Programmable Gate Array)实现；所述***中的采集单元31和提醒操作单元33，在实际应用中可通过通信模组(包含：基础通信套件、操作***、通信模块、标准化接口和协议等)及收发天线实现。

本实施例中，信息处理***作为硬件实体的一个示例如图8所示。所述***包括处理器61、存储介质62以及至少一个外部通信接口63；所述处理器61、存储介质62以及外部通信接口63均通过总线64连接。

这里需要指出的是：以上涉及***项的描述，与上述方法描述是类似的，同方法的有益效果描述，不做赘述。对于本发明***实施例中未披露的技术细节，请参照本发明方法实施例的描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***和方法，可以通过其它的方式实现。以上所描述的***实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个***，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种信息处理方法，其特征在于，所述方法包括：

采集通信记录信息；

2.根据权利要求1所述的方法，其特征在于，所述获得所述通信记录信息中与主叫号码和/或被叫号码相关联的特征参数，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述基于所述特征参数按照预设分类规则对被叫号码进行分类，获得所述被叫号码对应的类别属性，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述类别属性所表征的用户受骗程度执行相应的提醒操作，包括：

5.根据权利要求1或2所述的方法，其特征在于，所述基于所述特征参数按照预设分类规则对被叫号码进行分类之前，所述方法还包括：

6.根据权利要求1或2所述的方法，其特征在于，所述采集通信记录信息，包括：

采集多个原始通信记录信息，对所述原始通信记录信息进行预处理，滤除错误的原始通信记录信息，以及统一所述原始通信记录信息中的主叫号码和被叫号码的格式后，获得的原始通信记录信息作为所述通信记录信息。

7.一种信息处理***，其特征在于，所述***包括：采集单元、分类识别单元和提醒操作单元；其中，

所述采集单元，用于采集通信记录信息；

8.根据权利要求7所述的***，其特征在于，所述分类识别单元，用于获得多个通信记录信息中第一通信记录信息中与主叫号码和/或被叫号码相关联的第一特征参数；所述第一通信记录信息为所述多个通信记录信息中的任一通信记录信息；以及获得所述多个通信记录信息中至少部分通信记录信息之间的与主叫号码和/或被叫号码相关联的第二特征参数；依据所述第一特征参数和所述第二特征参数生成特征参数；

9.根据权利要求7或8所述的***，其特征在于，所述分类识别单元，用于基于所述特征参数按照预设分类规则将被叫号码至少分为三类，获得所述被叫号码对应的类别属性包括第一类别属性、第二类别属性和第三类别属性。

10.根据权利要求9所述的***，其特征在于，所述提醒操作单元，用于当所述被叫号码对应第一类别属性时，生成提醒信息，发送所述提醒信息至所述被叫号码；当所述被叫号码对应第二类别属性时，发送所述被叫号码至客服中心，以使所述客服中心的客服人员与所述被叫号码对应用户通话；当所述被叫号码对应第三类别属性时，发送所述被叫号码至特定职能机构对应的服务平台，以使所述特定职能机构的人员与所述被叫号码对应用户通话。

11.根据权利要求7或8所述的***，其特征在于，所述***还包括模型训练单元；

12.根据权利要求7或8所述的***，其特征在于，所述采集单元，用于采集多个原始通信记录信息，对所述原始通信记录信息进行预处理，滤除错误的原始通信记录信息，以及统一所述原始通信记录信息中的主叫号码和被叫号码的格式后，获得的原始通信记录信息作为所述通信记录信息。