CN105430654A - 号码的归属信息的识别方法及装置 - Google Patents

号码的归属信息的识别方法及装置 Download PDF

Info

Publication number
CN105430654A
CN105430654A CN201510728723.8A CN201510728723A CN105430654A CN 105430654 A CN105430654 A CN 105430654A CN 201510728723 A CN201510728723 A CN 201510728723A CN 105430654 A CN105430654 A CN 105430654A
Authority
CN
China
Prior art keywords
note
title
sender
subsample
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510728723.8A
Other languages
English (en)
Other versions
CN105430654B (zh
Inventor
汪平仄
张涛
陈志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Technology Co Ltd
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510728723.8A priority Critical patent/CN105430654B/zh
Publication of CN105430654A publication Critical patent/CN105430654A/zh
Application granted granted Critical
Publication of CN105430654B publication Critical patent/CN105430654B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals
    • H04W4/185Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals by embedding added-value information into content, e.g. geo-tagging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/02Processing of mobility data, e.g. registration information at HLR [Home Location Register] or VLR [Visitor Location Register]; Transfer of mobility data, e.g. between HLR, VLR or external networks
    • H04W8/04Registration at HLR or HSS [Home Subscriber Server]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开是关于号码的归属信息的识别方法及装置,所述方法包括:获取样本短信集;从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题;将同一短信发送方号码对应的样本短信的标题进行合并;根据合并信息识别出所述短信发送方号码的归属信息,实现自动识别出样本短信集中短信发送方号码的归属信息,避免人工识别号码造成的人力资源浪费,同时提高了识别效率。

Description

号码的归属信息的识别方法及装置
技术领域
本申请涉及通信技术领域,尤其涉及号码的归属信息的识别方法及装置。
背景技术
随着移动通信技术的快速发展,终端已经成为很多现代人工作和生活的必备品,终端给人们带来方便的同时,也给人们的生活带来了隐患。例如接收到诈骗电话和垃圾短信等用户不期望收到的通讯信息。
相关技术中,人工对各个电话号码进行识别和标注,建立电话号码与归属信息的对应关系。在接收到呼叫方的电话号码或针对电话号码的拨号指令时,通过对应关系识别出电话号码对应的归属信息,并根据归属信息进行提醒。但由于号码多样化,人工需要识别的号码比较多,耗费大量的人力资源,且识别电话号码对应的归属信息的效率低。
发明内容
为克服相关技术中存在的问题,本公开提供了号码的归属信息的识别方法及装置。
根据本公开实施例的第一方面,提供一种号码的归属信息的识别方法,所述方法包括:获取样本短信集;
从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题;
将同一短信发送方号码对应的样本短信的标题进行合并;
根据合并信息识别出所述短信发送方号码的归属信息。
可选的,所述获取样本短信集包括:
获取预设时间段内的历史短信;
对所述历史短信的发送方号码进行识别;
将所述发送方号码为通知类短信号码的历史短信确定为样本短信,获得样本短信集。
可选的,所述从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题,包括:
当所述样本短信集的样本短信中包含特定符号组时,从所述样本短信中抽取特定符号组之间的信息,根据抽取的信息确定所述样本短信的标题;
当所述样本短信集的样本短信中不包含所述特定符号组时,将所述样本短信的标题确定为空信息。
可选的,所述方法还包括:
将所述样本短信集中包含所述特定符号组的样本短信对应的发送方号码确定为短信发送方号码;
从所述样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,所述子样本短信集中每个样本短信包括短信发送方号码、短信接收方号码和标题。
可选的,所述将同一短信发送方号码对应的样本短信的标题进行合并,包括:
计算子样本短信集中每个标题对应的短信接收方号码个数,获得子样本短信合并集,所述子样本短信合并集中每个样本短信包括短信发送方号码、标题、短信接收方号码个数,所述子样本短信集包括同一短信发送方号码对应的样本短信。
可选的,所述根据合并信息识别出所述短信发送方号码的归属信息,包括:
采用下述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值:
P ( title i ) = C ( title i ) Σ k = 1 n C ( title k ) , i ∈ ( 1 , n )
其中,P(titlei)表示标题titlei在子样本短信合并集中的概率值,C(titlei)表示子样本短信合并集中标题titlei对应的短信接收方号码个数,C(titlek)表示子样本短信合并集中标题titlek对应的短信接收方号码个数,n表示子样本短信合并集中标题个数;
将所述概率值大于概率阈值的标题确定为所述短信发送方号码的归属信息。
可选的,所述采用下述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值之前,还包括:
判断所述子样本短信合并集中标题对应的短信接收方号码个数是否小于个数阈值;
将小于个数阈值的短信接收方号码个数对应的标题删除。
可选的,所述方法还包括:
根据各短信发送方号码的归属信息确定短信发送方号码与归属信息的关联关系;
根据所述发送方号码与归属信息的关联关系对待识别的目标号码进行识别,确定所述目标号码的归属信息,所述目标号码包括主叫方待拨出的号码、被叫方接收的号码、短信发送方待发送的号码或短信接收方接收的号码。
根据本公开实施例的第二方面,提供一种号码的归属信息的识别装置,包括:
短信集获取模块,被配置为获取样本短信集;
标题抽取模块,被配置为从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题;
标题合并模块,被配置为将同一短信发送方号码对应的样本短信的标题进行合并;
第一归属信息识别模块,被配置为根据合并信息识别出所述短信发送方号码的归属信息。
可选的,所述短信集获取模块包括:
短信获取子模块,被配置获取预设时间段内的历史短信;
号码识别子模块,被配置对所述历史短信的发送方号码进行识别;
样本短信集确定子模块,被配置将所述发送方号码为通知类短信号码的历史短信确定为样本短信,获得样本短信集。
可选的,所述标题抽取模块包括:
标题抽取子模块,被配置为当所述样本短信集的样本短信中包含特定符号组时,从所述样本短信中抽取特定符号组之间的信息,根据抽取的信息确定所述样本短信的标题;当所述样本短信集的样本短信中不包含所述特定符号组时,将所述样本短信的标题确定为空信息。
可选的,所述装置还包括:
短信发送方号码确定模块,被配置为将所述样本短信集中包含所述特定符号组的样本短信对应的发送方号码确定为短信发送方号码;
子样本短信集确定模块,被配置为从所述样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,所述子样本短信集中每个样本短信包括短信发送方号码、短信接收方号码和标题。
可选的,所述标题合并模块包括:
合并集确定子模块,被配置为计算子样本短信集中每个标题对应的短信接收方号码个数,获得子样本短信合并集,所述子样本短信合并集中每个样本短信包括短信发送方号码、标题、短信接收方号码个数,所述子样本短信集包括同一短信发送方号码对应的样本短信。
可选的,所述第一归属信息识别模块包括:
概率值计算子模块,被配置为采用下述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值:
P ( title i ) = C ( title i ) Σ k = 1 n C ( title k ) , i ∈ ( 1 , n )
其中,P(titlei)表示标题titlei在子样本短信合并集中的概率值,C(titlei)表示子样本短信合并集中标题titlei对应的短信接收方号码个数,C(titlek)表示子样本短信合并集中标题titlek对应的短信接收方号码个数,n表示子样本短信合并集中标题个数;
归属信息确定子模块,被配置为将所述概率值大于概率阈值的标题确定为所述短信发送方号码的归属信息。
可选的,所述第一归属信息识别模块还包括:
归属信息过滤子模块,判断所述子样本短信合并集中标题对应的短信接收方号码个数是否小于个数阈值;将小于个数阈值的短信接收方号码个数对应的标题删除。
可选的,所述装置还包括:
关联关系确定模块,被配置为根据各短信发送方号码的归属信息确定短信发送方号码与归属信息的关联关系;
第二归属信息识别模块,被配置为根据所述发送方号码与归属信息的关联关系对待识别的目标号码进行识别,确定所述目标号码的归属信息,所述目标号码包括主叫方待拨出的号码、被叫方接收的号码、短信发送方待发送的号码或短信接收方接收的号码。
根据本公开实施例的第三方面,提供一种号码的归属信息的识别装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取样本短信集;
从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题;
将同一短信发送方号码对应的样本短信的标题进行合并;
根据合并信息识别出所述短信发送方号码的归属信息。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开获取样本短信集,然后从样本短信集的样本短信中抽取用于标识号码归属信息的标题,将同一短信发送方号码对应的样本短信的标题进行合并,根据合并信息识别出短信发送方号码的归属信息,实现自动识别出样本短信集中短信发送方号码的归属信息,避免人工识别号码造成的人力资源浪费,同时提高了识别效率。
本公开中,由于通知类短信的发送方号码与其他常规短信的发送方号码不同,因此本实施例可以通过发送方号码来识别历史短信是否为通知类短信,从而将通知类短信确定为样本短信,获得样本短信集,从而提高后续识别号码的归属信息的效率。
本公开中,当样本短信中包含所述特定符号组时,可以从样本短信中抽取特定符号组之间的信息,根据抽取的信息确定样本短信的标题,当样本短信中不包含特定符号组时,可以将该条样本短信的标题确定为空信息,从而提高了确定样本短信的标题的效率。
本公开可以将样本短信集中包含特定符号组的样本短信对应的发送方号码确定为短信发送方号码,从而避免合并信息为空的情况;另外,将样本短信集中包含特定符号组的样本短信对应的发送方号码确定为短信发送方号码;从样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,从而将短信发送方号码对应的样本短信全部囊括在子样本短信集中,子样本短信集中既包括了包含特定符号组的样本短信,还可以包括不包含特定符号组的样本短信,以便提高后续识别短信发送方号码的归属信息的准确性,避免在不包含特定符号组的样本短信数量较大时,只根据包含特定符号组的样本短信确定短信发送方号码对应的归属信息导致的误差。
本公开通过标题对应的短信接收方号码个数计算标题在子样本短信合并集中的概率,并将概率较大的标题确定为短信发送方号码的归属信息,提高了确定归属信息的准确性,并且减少了归属信息的数量,给用户带来了便利。
本公开在计算子样本短信合并集中每个标题在子样本短信合并集中的概率值之前,还包括:判断所述子样本短信合并集中标题对应的短信接收方号码个数是否小于个数阈值;将小于个数阈值的短信接收方号码个数对应的标题删除。在计算子样本短信合并集中每个标题在子样本短信合并集中的概率值时,计算删除标题后的子样本短信合并集中每个标题在子样本短信合并集中的概率值,从而减小计算概率的计算量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本公开一示例性实施例示出的一种号码的归属信息的识别方法的流程图。
图2是本公开根据一示例性实施例示出的一种号码的归属信息的识别方法的应用场景图。
图3是本公开根据一示例性实施例示出的一种号码的归属信息的识别装置的框图。
图4是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图。
图5是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图。
图6是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图。
图7是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图。
图8是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图。
图9是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图。
图10是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图。
图11本公开根据一示例性实施例示出的一种用于号码的归属信息的识别装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1所示,图1是本公开根据一示例性实施例示出的一种号码的归属信息的识别方法的流程图,包括以下步骤:
在步骤101中,获取样本短信集。
在步骤102中,从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题。
在步骤103中,将同一短信发送方号码对应的样本短信的标题进行合并。
在步骤104中,根据合并信息识别出所述短信发送方号码的归属信息。
本公开实施例可以用于终端中,所涉及的终端可以为智能终端,例如可以是具有通讯功能的智能手机、智能手环、智能手表等。智能终端可以从本地中获取样本短信集,可以从服务器中获取样本短信集,然后从样本短信集的样本短信中抽取用于标识号码归属信息的标题,将同一短信发送方号码对应的样本短信的标题进行合并,根据合并信息识别出短信发送方号码的归属信息。
本公开实施例也可以用于服务器中,所涉及的服务器可以是单个服务器,也可以是服务器集群,还可以是云服务器等。服务器获取样本短信集,然后从样本短信集的样本短信中抽取用于标识号码归属信息的标题,将同一短信发送方号码对应的样本短信的标题进行合并,根据合并信息识别出短信发送方号码的归属信息。
由上述实施例可见,可以获取样本短信集,然后从样本短信集的样本短信中抽取用于标识号码归属信息的标题,将同一短信发送方号码对应的样本短信的标题进行合并,根据合并信息识别出短信发送方号码的归属信息,实现自动识别出样本短信集中短信发送方号码的归属信息,避免人工识别号码造成的人力资源浪费,同时提高了识别效率。
在一个可选的实现方式中,本公开实施例可以用于终端中,终端识别出样本短信集中短信发送方号码的归属信息后,可以获得短信发送方号码与归属信息的关联关系,将关联关系进行存储。然后可以根据所述发送方号码与归属信息的关联关系对待识别的目标号码进行识别,确定所述目标号码的归属信息,所述目标号码可以包括主叫方待拨出的号码、被叫方接收的号码、短信发送方待发送的号码或短信接收方接收的号码。
针对发送方号码与归属信息的对应关系的应用,可以是终端在接收到呼叫方的电话号码时,通过对应关系识别出电话号码对应的归属信息,并根据归属信息进行提醒。提醒方式可以是在显示屏上显示归属信息,还可以是语音播报归属信息等,从而避免了因接听危险电话导致的损失。又如,终端在接收到针对电话号码的拨号指令前,通过对应关系识别出电话号码对应的归属信息,并根据归属信息进行提醒,避免了因拨打危险电话号码导致的损失,节省了通话成本。又如,终端在接收短信时,通过对应关系识别出短信的发送方号码对应的归属信息,并根据归属信息进行短信拦截或提醒,给用户带来了便利。在另一个可选的实现方式中,本公开实施例用于服务器中,服务器识别出样本短信集中短信发送方号码的归属信息后,可以获得短信发送方号码与归属信息的关联关系;再将关联关系发送至终端,以使终端根据关联关系对待识别的目标号码进行识别,确定所述目标号码的归属信息。
如图2所示,图2是本公开根据一示例性实施例示出的一种号码的归属信息的识别方法的应用场景图。本公开方案可以在云端服务器中执行,云端服务器在确定短信发送方号码与归属信息的关联关系后,可以将关联关系推送至终端,以使终端根据关联关系对待识别的目标号码进行识别,确定目标号码的归属信息。终端可以是智能手机、智能手环、ipad等。
其中,针对服务器发送关联关系的时间,可以是在确定关联关系后,将关联关系广播至各个终端,各终端可以将关联关系存储在本地;也可以是在服务器接收到终端发起的归属信息获取请求时,根据请求将短信发送方号码与归属信息的关联关系发送至终端。
其中,针对终端如何根据短信发送方号码与归属信息的关联关系进行识别和标注,在此不再限定。
在该实施例中,通过服务器集中识别出样本短信集中短信发送方号码的归属信息,确定短信发送方号码与归属信息的关联关系,并将关联关系推送至各终端,使各终端共享该关联关系,使短信发送方号码与归属信息的关联关系更具有全面性,同时由服务器集中确定关联关系,避免各终端都确定关联关系导致的资源浪费。
接着,本公开分别对图1中的各个步骤分别进行说明。
关于步骤101,样本短信集可以是在一段时间段内获取的短信的集合。为了节约计算量,样本短信集可以是在一段时间段内获取的通知类短信的集合。在一个可选的实现方式中,可以采用下述方式获取样本短信集:
A1:获取预设时间段内的历史短信。
其中,预设时间段可以预先设定,例如,预设时间段可以设定为一个月内、一周内等。历史短信可以是不同发送方发给不同接收方的短信。本步骤中,历史短信至少包括发送方号码。进一步的,还可以包括短信内容和接收方号码。
A2:对所述历史短信的发送方号码进行识别。
A3:将所述发送方号码为通知类短信号码的历史短信确定为样本短信,获得样本短信集。
由于通知类短信的发送方号码与其他常规短信的发送方号码不同,因此本实施例可以通过发送方号码来识别历史短信是否为通知类短信,从而将通知类短信确定为样本短信,获得样本短信集,从而提高后续确定号码与归属信息对应关系的效率。
应当理解的是,在判断历史短信是否为通知类短信时,除了上述方法,还可以采用相关技术中的判断方法,在此不再限定。
关于步骤102,可以从样本短信集的样本短信中抽取用于标识号码归属信息的标题。号码的归属信息可以是号码来源方名称,例如,可以是号码归属的公司名称或归属的机构名称等,号码的归属信息也可以是该号码通讯内容的目的信息,例如,该条短信的目的是“提醒”。
抽取标题的方法有很多种,例如,分词处理、关键字匹配等。本公开列举一种通过特定符号组抽取标题的方法,所述方法包括:
B1:当所述样本短信集的样本短信中包含特定符号组时,从所述样本短信中抽取特定符号组之间的信息,根据抽取的信息确定所述样本短信的标题。
B2:当所述样本短信集的样本短信中不包含所述特定符号组时,将所述样本短信的标题确定为空信息。
其中,特定符号组可以是具有注释性的符号组,例如括号,括号可以包括大括号“{}”、中括号“[]”、小括号“()”、六角括号“〔〕”、尖括号“<>”和方头括号“【】”等形式。
本实施例具体介绍了一种提取标题的方法,当样本短信中包含所述特定符号组时,可以从样本短信的短信内容中提取特定符号组之间的信息,例如,可以采用正则表达式的方式抽取特定符号组之间的信息。可以理解的是,提取的信息是样本短信的短信内容中的信息,例如,当特定符号组为方括号时,则提取短信内容中方括号内的内容。当样本短信中不包含特定符号组时,可以将该条样本短信的标题确定为空信息。所谓空信息,可以是没有字符,也可以是特定字符,该特定字符表示归属信息为空。
关于步骤103,在抽取标题后,样本短信集中的每条样本短信都有对应的标题,可以将同一短信发送方号码对应的样本短信的标题进行合并,获得合并信息。
在合并时,可以将子样本短信集中的所有标题进行合并,获得子样本短信集的短信发送方号码的合并信息,所述子样本短信集包括同一短信发送方号码对应的样本短信;也可以计算子样本短信集中每个标题对应的短信接收方号码个数,获得子样本短信合并集,所述子样本短信合并集中每个样本短信包括短信发送方号码、标题、短信接收方号码个数,所述子样本短信集包括同一短信发送方号码对应的样本短信。
另外,针对子样本短信集,短信发送方号码可以是样本短信集中所有样本短信的发送方号码,则可以将同一短信发送方号码对应的样本短信组合为子样本短信集,针对每个发送方号码都有对应的子样本短信集,可以直接将子样本短信集中的样本短信的标题进行合并,获得每个发送方号码对应的合并信息。然而由于在样本短信集中,样本短信的短信内容中可能存在标题,也可能不存在标题,则不一定每个发送方号码对应的子样本短信集中都存在标题,则采用上述方法可能存在合并信息为空的情况,增大了计算量。
为了避免这种情况,将同一短信发送方号码对应的样本短信的标题进行合并之前,还可以包括C1步骤和C2步骤:
C1:将所述样本短信集中包含所述特定符号组的样本短信对应的发送方号码确定为短信发送方号码。
C2:从所述样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,所述子样本短信集中每个样本短信包括短信发送方号码、短信接收方号码和标题。
因为特定符号组内会有该短信的注释性信息,因此可以将带有特定符号组的短信的发送方号码认为是可能关联有标题的短信发送方号码。
在样本短信集中,样本短信的短信内容中可能存在特定符号组,也可能不存在特定符号组,本实施例筛选出包含特定符号组的样本短信,可以将筛选出的样本短信的发送方号码确定为短信发送方号码,多个短信发送方号码可以组成短信发送方号码集,然后针对短信发送方号码进行划分子样本短信集,保证短信发送方号码是至少具有一个标题的号码,从而避免了合并信息为空的情况。
其中,从样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集是从样本短信集中筛选出发送方号码为短信发送方号码的样本短信,获得该短信发送方号码对应的子样本短信集。当短信发送方号码为多个时,则筛选出每个短信发送方号码对应的子样本短信集,实现一个短信发送方号码对应一个子样本短信集。针对每个子样本短信集,可以执行步骤103获得该短信发送方号码对应的子样本短信合并集。
其中,子样本短信集中每条样本短信存在对应的标题,标题的数量可以为一个或多个、还可以为空。由于同一子样本短信集中,不同样本短信下的标题可能不同,因此可以建立每条样本短信与标题的关联关系,例如可以建立每条样本短信的三元组信息,三元组信息可以包括短信发送方号码、短信接收方号码、标题。可以理解的是,同一个子样本短信集中,每条样本短信的三元组中的短信发送方号码相同。
本步骤将所述样本短信集中包含所述特定符号组的样本短信对应的发送方号码确定为短信发送方号码,可以避免合并信息为空的情况;另外,从样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,从而将短信发送方号码对应的样本短信全部囊括在子样本短信集中,子样本短信集中既包括了包含特定符号组的样本短信,还可以包括不包含特定符号组的样本短信,以便提高后续识别出短信发送方号码的归属信息的准确性,避免在不包含特定符号组的样本短信数量较大时,只根据包含特定符号组的样本短信确定短信发送方号码对应的归属信息导致的误差。
另外,可以理解的是,关于步骤102、步骤C1和步骤C2,可以先抽取样本短信集中每条样本短信的标题,再根据抽取结果划分子样本短信集;也可以先划分子样本短信集,再从子样本短信集中抽取每个样本短信的标题,最终目的都是为了获得包含有短信发送方号码、短信接收方号码和标题的子样本短信集合。
例如,可以先抽取所有样本短信中的标题,每个样本短信包括发送方号码、接收方号码、标题。然后将样本短信集中包含特定符号组的样本短信对应的发送方号码确定为短信发送方号码;从样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,所述子样本短信集中每个样本短信包括短信发送方号码、短信接收方号码和标题。
又如,在获取包含有短信内容、发送方号码、接收方号码的样本短信集后,可以将样本短信集中包含特定符号组的样本短信对应的发送方号码确定为短信发送方号码;从样本短信集中分别筛选出每个短信发送方号码对应的初始样本短信集,初始样本短信集中每条样本短信包括短信内容、发送方号码、接收方号码。然后从初始样本短信集的样本短信的短信内容中抽取用于标识号码归属信息的标题,获得该短信发送方号码对应的最终子样本短信集,该最终子样本短信集中每个样本短信包括短信发送方号码、短信接收方号码和标题。
基于此,采用上述方法获得包括短信发送方号码、短信接收方号码和标题的子样本短信集后,可以根据子样本短信集将同一短信发送方号码对应的样本短信的标题进行合并。
在一个可选的实现方式中,在获得包含短信发送方号码、短信接收方号码和标题的子样本短信集后,所述将同一短信发送方号码对应的样本短信的标题进行合并,可以包括:计算所述子样本短信集中每个标题对应的短信接收方号码个数,获得子样本短信合并集,所述子样本短信合并集中每个样本短信包括短信发送方号码、标题、短信接收方号码个数。
由于子样本短信集中记录有每条样本短信的短信发送方号码、短信接收方号码和标题,则可以统计出子样本短信集中每个标题对应的短信接收方号码个数,从而可以得到包含短信发送方号码、标题、短信接收方号码个数关联关系的子样本短信合并集。
在另一个可选的实现方式中,在获得包含短信发送方号码、短信接收方号码和标题的子样本短信集后,可以将子样本短信集中的所有标题进行合并,获得子样本短信集的短信发送方号码的合并信息。
关于步骤104,在一个可选的实现方式中,可以直接根据合并信息确定短信发送方号码的归属信息。例如,当步骤103中直接将子样本短信集中的标题进行合并时,将合并的标题作为该子样本短信集的短信发送方号码的归属信息。这种方式适合标题比较少的情况,且空信息比较少的情况,这种确定归属信息的方式效率较高。
在另一个可选的实现方式中,当步骤103中获得包含短信发送方号码、标题、短信接收方号码个数的子样本短信合并集时,可以判断子样本短信合并集中标题对应的短信接收方号码个数是否大于个数阈值;将大于个数阈值的短信接收方号码个数对应的标题作为该短信发送方号码的归属信息。这种方式可以减少归属信息的量。
在另一个可选的实现方式中,当步骤103中获得包含短信发送方号码、标题、短信接收方号码个数的子样本短信合并集时,可以采用下述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值:
P ( title i ) = C ( title i ) &Sigma; k = 1 n C ( title k ) , i &Element; ( 1 , n )
其中,P(titlei)表示标题titlei在子样本短信合并集中的概率值,C(titlei)表示子样本短信合并集中标题titlei对应的短信接收方号码个数,C(titlek)表示子样本短信合并集中标题titlek对应的短信接收方号码个数,n表示子样本短信合并集中标题个数;将所述概率值大于概率阈值的标题确定为所述短信发送方号码的归属信息。
在确定每个标题对应的短信接收方号码个数后,采用上述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值,从而将概率较大的标题确定为短信发送方号码的归属信息。
本实施例通过标题对应的短信接收方号码个数计算标题在子样本短信合并集中的概率,并将概率较大的标题确定为短信发送方号码的归属信息,提高了确定归属信息的准确性,并且减少了归属信息的数量,给用户带来了便利。
进一步的,将所述概率值大于概率阈值的标题确定为所述短信发送方号码的归属信息步骤,可以包括:从确定的概率值中筛选出最大概率值,当最大概率值大于概率阈值时,将最大概率值对应的标题确定为短信发送方号码的归属信息,从而可以将每个号码的归属信息限定为一个,进一步给用户带来了便利。
进一步的,在计算子样本短信合并集中每个标题在子样本短信合并集中的概率值之前,还包括:判断所述子样本短信合并集中标题对应的短信接收方号码个数是否小于个数阈值;将小于个数阈值的短信接收方号码个数对应的标题删除。计算子样本短信合并集中每个标题在子样本短信合并集中的概率值时,计算删除后的子样本短信合并集中每个标题在子样本短信合并集中的概率值,从而减小计算概率的计算量。
以上实施方式中的各种技术特征可以任意进行组合,只要特征之间的组合不存在冲突或矛盾,但是限于篇幅,未进行一一描述,因此上述实施方式中的各种技术特征的任意进行组合也属于本说明书公开的范围。
本公开还列举其中一个具体的示例进行说明。在该示例中,号码的归属信息的识别方法包括:
S1:获取通知类样本短信集S。
S2:从通知类样本短信集中筛选出包含特定符号组的样本短信,获得短信集Ssub。令短信集Ssub中的发送方号码为短信发送方号码,获得短信发送方号码集N(number(1),number(2)……number(t)…)。
针对每个短信发送方号码执行下述S3至S7的操作。
S3:从通知类样本短信集S中筛选出发送方号码为number(t)的初始子样本短信集Snumber,初始子样本短信集Snumber中每条样本短信可以包括三元组信息:<number(t),短信接收方号码,短信内容>。例如:
三元组1:<106988888888,13488888888,“【腾讯科技】【QQ邮箱邮件提醒】发件人:张先生,淘宝网主题:…”>。
三元组2:<106988888888,13444444444,“您本次操作的验证码是5889(20分钟内有效),请完成验证,【腾讯科技】【温馨提示】”>。
三元组3:<106988888888,13455555555,“张先生向你134*5555付款150.00元。马上查收。【支付宝】”>。
三元组4:<106988888888,13466666666,“敬的客户您好!张先生在5月10日10点30分给您来电,请及时回复”>。
S4:当初始子样本短信集中样本短信包含特定符号组时,通过正则表达式从样本短信中提取特定符号组之间的信息,根据提取的信息确定样本短信的标题;当样本短信中不包含特定符号组时,将样本短信的标题确定为空信息。根据所确定的各标题建立每条样本短信中短信发送方号码、短信接收方号码以及标题的关联关系,则可以将上述示例中的三元组替换为新三元组<number(t),短信接收方号码,标题>,获得最终的子样本短信集,分别如下:
新三元组1:<106988888888,13488888888,{腾讯科技、QQ邮箱邮件提醒}>。
新三元组2:<106988888888,13444444444,{腾讯科技、温馨提醒}>。
新三元组3:<106988888888,13455555555,{支付宝}>。
新三元组4:<106988888888,13466666666,“{}>。
S5:计算子样本短信集中每个标题对应的短信接收方号码个数,即计算子样本短信集中每个标题被多少个号码接收到。例如,上述示例中“腾讯科技”被“13488888888”和“13444444444”接收到,则“腾讯科技”对应的接收方号码个数为2。对此,可以生成短信发送方号码、标题、接收方号码个数的关联关系,获得子样本短信合并集,如下:
<106988888888,“腾讯科技”,2>;
<106988888888,“QQ邮箱邮件提醒”,1>;
<106988888888,“温馨提醒”,1>;
<106988888888,“支付宝”,1>;
<106988888888,“”,1>。
S6:可以预先设置一个个数阈值,将接收方号码个数小于个数阈值的标题删除。例如,将个数阈值设为2,则将号码个数小于个2的标题删除,删除后剩下如下信息:
<106988888888,“腾讯科技”,2>。
可以理解的是,当进行S6步骤的处理后,若只剩下一个标题,则可以直接将标题确定为归属信息。若还剩余多个标题,则可以执行S7步骤进行再次筛选。
S7:采用下述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值:
P ( title i ) = C ( title i ) &Sigma; k = 1 n C ( title k ) , i &Element; ( 1 , n )
其中,P(titlei)表示标题titlei在子样本短信合并集中的概率值,C(titlei)表示子样本短信合并集中标题titlei对应的短信接收方号码个数,C(titlek)表示子样本短信合并集中标题titlek对应的短信接收方号码个数,n表示子样本短信合并集中标题个数。将概率值大于概率阈值的标题确定为所述短信发送方号码的归属信息。
与前述号码的归属信息的识别方法的实施例相对应,本公开还提供了号码的归属信息的识别装置及其所应用的终端的实施例。
如图3所示,图3是本公开根据一示例性实施例示出的一种号码的归属信息的识别装置的框图,所述装置包括:短信集获取模块31、标题抽取模块32、标题合并模块33和第一归属信息识别模块34。
其中,短信集获取模块31,被配置为获取样本短信集。
标题抽取模块32,被配置为从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题。
标题合并模块33,被配置为将同一短信发送方号码对应的样本短信的标题进行合并。
第一归属信息识别模块34,被配置为根据合并信息识别出所述短信发送方号码的归属信息。
由上述实施例可见,获取样本短信集,然后从样本短信集的样本短信中抽取用于标识号码归属信息的标题,将同一短信发送方号码对应的样本短信的标题进行合并,根据合并信息识别出短信发送方号码的归属信息,实现自动识别出样本短信集中短信发送方号码的归属信息,避免人工识别号码造成的人力资源浪费,同时提高了识别效率。
如图4所示,图4是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图,该实施例在前述图3所示实施例的基础上,所述短信集获取模块31包括:短信获取子模块311、号码识别子模块312和样本短信集确定子模块313。
其中,短信获取子模块311,被配置获取预设时间段内的历史短信。
号码识别子模块312,被配置对所述历史短信的发送方号码进行识别。
样本短信集确定子模块313,被配置将所述发送方号码为通知类短信号码的历史短信确定为样本短信,获得样本短信集。
由上述实施例可见,由于通知类短信的发送方号码与其他常规短信的发送方号码不同,因此本实施例可以通过发送方号码来识别历史短信是否为通知类短信,从而将通知类短信确定为样本短信,获得样本短信集,从而提高后续识别号码的归属信息的效率。
如图5所示,图5是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图,该实施例在前述图3所示实施例的基础上,所述标题抽取模块32包括:标题抽取子模块321。
其中,标题抽取子模块321,被配置为当所述样本短信集的样本短信中包含特定符号组时,从所述样本短信中抽取特定符号组之间的信息,根据抽取的信息确定所述样本短信的标题;当所述样本短信集的样本短信中不包含所述特定符号组时,将所述样本短信的标题确定为空信息。
由上述实施例可见,当样本短信中包含所述特定符号组时,可以从样本短信中抽取特定符号组之间的信息,根据抽取的信息确定样本短信的标题,当样本短信中不包含特定符号组时,可以将该条样本短信的标题确定为空信息,从而提高了确定样本短信的标题的效率。
如图6所示,图6是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图,该实施例在前述图5所示实施例的基础上,所述装置还包括:短信发送方号码确定模块35和子样本短信集确定模块36。
其中,短信发送方号码确定模块35,被配置为将所述样本短信集中包含所述特定符号组的样本短信对应的发送方号码确定为短信发送方号码。
子样本短信集确定模块36,被配置为从所述样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,所述子样本短信集中每个样本短信包括短信发送方号码、短信接收方号码和标题。
由上述实施例可见,可以将样本短信集中包含特定符号组的样本短信对应的发送方号码确定为短信发送方号码;从样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,从而将短信发送方号码对应的样本短信全部囊括在子样本短信集中,子样本短信集中既包括了包含特定符号组的样本短信,还可以包括不包含特定符号组的样本短信,以便提高后续识别出短信发送方号码的归属信息的准确性,避免在不包含特定符号组的样本短信数量较大时,只根据包含特定符号组的样本短信确定短信发送方号码对应的归属信息导致的误差。
如图7所示,图7是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图,该实施例在前述图3所示实施例的基础上,所述标题合并模块33包括:合并集确定子模块331。
其中,合并集确定子模块331,被配置为计算子样本短信集中每个标题对应的短信接收方号码个数,获得子样本短信合并集,所述子样本短信合并集中每个样本短信包括短信发送方号码、标题、短信接收方号码个数,所述子样本短信集包括同一短信发送方号码对应的样本短信。
如图8所示,图8是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图,该实施例在前述图7所示实施例的基础上,所述第一归属信息识别模块34包括:概率值计算子模块341和归属信息确定子模块342。
其中,概率值计算子模块341,被配置为采用下述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值:
P ( title i ) = C ( title i ) &Sigma; k = 1 n C ( title k ) , i &Element; ( 1 , n )
其中,P(titlei)表示标题titlei在子样本短信合并集中的概率值,C(titlei)表示子样本短信合并集中标题titlei对应的短信接收方号码个数,C(titlek)表示子样本短信合并集中标题titlek对应的短信接收方号码个数,n表示子样本短信合并集中标题个数。
归属信息确定子模块342,被配置为将所述概率值大于概率阈值的标题确定为所述短信发送方号码的归属信息。
由上述实施例可见,通过标题对应的短信接收方号码个数计算标题在子样本短信合并集中的概率,并将概率较大的标题确定为短信发送方号码的归属信息,提高了确定归属信息的准确性,并且减少了归属信息的数量,给用户带来了便利。
如图9所示,图9是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图,该实施例在前述图8所示实施例的基础上,所述第一归属信息识别模块34还包括:归属信息过滤子模块343。
其中,归属信息过滤子模块343,判断所述子样本短信合并集中标题对应的短信接收方号码个数是否小于个数阈值;将小于个数阈值的短信接收方号码个数对应的标题删除。
由上述实施例可见,在计算子样本短信合并集中每个标题在子样本短信合并集中的概率值之前,还包括:判断所述子样本短信合并集中标题对应的短信接收方号码个数是否小于个数阈值;将小于个数阈值的短信接收方号码个数对应的标题删除。计算子样本短信合并集中每个标题在子样本短信合并集中的概率值时,计算删除后的子样本短信合并集中每个标题在子样本短信合并集中的概率值,从而减小计算概率的计算量。
如图10所示,图10是本公开根据一示例性实施例示出的另一种号码的归属信息的识别装置的框图,该实施例在前述图3所示实施例的基础上,所述装置还包括:关联关系确定模块37和第二归属信息识别模块38。
其中,关联关系确定模块37,被配置为根据各短信发送方号码的归属信息确定短信发送方号码与归属信息的关联关系。
第二归属信息识别模块38,被配置为根据所述发送方号码与归属信息的关联关系对待识别的目标号码进行识别,确定所述目标号码的归属信息,所述目标号码包括主叫方待拨出的号码、被叫方接收的号码、短信发送方待发送的号码或短信接收方接收的号码。
相应的,本公开还提供一种号码的归属信息的识别装置,所述装置包括有处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
获取样本短信集。
从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题。
将同一短信发送方号码对应的样本短信的标题进行合并。
根据合并信息识别出所述短信发送方号码的归属信息。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
如图11所示,图11是根据一示例性实施例示出的一种用于号码的归属信息的识别装置1100的一结构示意图。例如,装置1100可以被提供为一服务器。参照图11,装置1100包括处理组件1122,其进一步包括一个或多个处理器,以及由存储器1132所代表的存储器资源,用于存储可由处理部件1122的执行的指令,例如应用程序。存储器1132中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1122被配置为执行指令,以执行上述号码的归属信息的识别方法。
装置1100还可以包括一个电源组件1126被配置为执行装置1100的电源管理,一个有线或无线网络接口1150被配置为将装置1100连接到网络,和一个输入输出(I/O)接口1158。装置1100可以操作基于存储在存储器1132的操作***,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
以上所述仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开保护的范围之内。

Claims (17)

1.一种号码的归属信息的识别方法,其特征在于,所述方法包括:
获取样本短信集;
从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题;
将同一短信发送方号码对应的样本短信的标题进行合并;
根据合并信息识别出所述短信发送方号码的归属信息。
2.根据权利要求1所述的方法,其特征在于,所述获取样本短信集包括:
获取预设时间段内的历史短信;
对所述历史短信的发送方号码进行识别;
将所述发送方号码为通知类短信号码的历史短信确定为样本短信,获得样本短信集。
3.根据权利要求1所述的方法,其特征在于,所述从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题,包括:
当所述样本短信集的样本短信中包含特定符号组时,从所述样本短信中抽取特定符号组之间的信息,根据抽取的信息确定所述样本短信的标题;
当所述样本短信集的样本短信中不包含所述特定符号组时,将所述样本短信的标题确定为空信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述样本短信集中包含所述特定符号组的样本短信对应的发送方号码确定为短信发送方号码;
从所述样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,所述子样本短信集中每个样本短信包括短信发送方号码、短信接收方号码和标题。
5.根据权利要求1所述的方法,其特征在于,所述将同一短信发送方号码对应的样本短信的标题进行合并,包括:
计算子样本短信集中每个标题对应的短信接收方号码个数,获得子样本短信合并集,所述子样本短信合并集中每个样本短信包括短信发送方号码、标题、短信接收方号码个数,所述子样本短信集包括同一短信发送方号码对应的样本短信。
6.根据权利要求5所述的方法,其特征在于,所述根据合并信息识别出所述短信发送方号码的归属信息,包括:
采用下述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值:
P ( title i ) = C ( title i ) &Sigma; k = 1 n C ( title k ) , i &Element; ( 1 , n )
其中,P(titlei)表示标题titlei在子样本短信合并集中的概率值,C(titlei)表示子样本短信合并集中标题titlei对应的短信接收方号码个数,C(titlek)表示子样本短信合并集中标题titlek对应的短信接收方号码个数,n表示子样本短信合并集中标题个数;
将所述概率值大于概率阈值的标题确定为所述短信发送方号码的归属信息。
7.根据权利要求6所述的方法,其特征在于,所述采用下述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值之前,还包括:
判断所述子样本短信合并集中标题对应的短信接收方号码个数是否小于个数阈值;
将小于个数阈值的短信接收方号码个数对应的标题删除。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据各短信发送方号码的归属信息确定短信发送方号码与归属信息的关联关系;
根据所述发送方号码与归属信息的关联关系对待识别的目标号码进行识别,确定所述目标号码的归属信息,所述目标号码包括主叫方待拨出的号码、被叫方接收的号码、短信发送方待发送的号码或短信接收方接收的号码。
9.一种号码的归属信息的识别装置,其特征在于,所述装置包括:
短信集获取模块,被配置为获取样本短信集;
标题抽取模块,被配置为从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题;
标题合并模块,被配置为将同一短信发送方号码对应的样本短信的标题进行合并;
第一归属信息识别模块,被配置为根据合并信息识别出所述短信发送方号码的归属信息。
10.根据权利要求9所述的装置,其特征在于,所述短信集获取模块包括:
短信获取子模块,被配置获取预设时间段内的历史短信;
号码识别子模块,被配置对所述历史短信的发送方号码进行识别;
样本短信集确定子模块,被配置将所述发送方号码为通知类短信号码的历史短信确定为样本短信,获得样本短信集。
11.根据权利要求9所述的装置,其特征在于,所述标题抽取模块包括:
标题抽取子模块,被配置为当所述样本短信集的样本短信中包含特定符号组时,从所述样本短信中抽取特定符号组之间的信息,根据抽取的信息确定所述样本短信的标题;当所述样本短信集的样本短信中不包含所述特定符号组时,将所述样本短信的标题确定为空信息。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
短信发送方号码确定模块,被配置为将所述样本短信集中包含所述特定符号组的样本短信对应的发送方号码确定为短信发送方号码;
子样本短信集确定模块,被配置为从所述样本短信集中分别筛选出每个短信发送方号码对应的子样本短信集,所述子样本短信集中每个样本短信包括短信发送方号码、短信接收方号码和标题。
13.根据权利要求9所述的装置,其特征在于,所述标题合并模块包括:
合并集确定子模块,被配置为计算子样本短信集中每个标题对应的短信接收方号码个数,获得子样本短信合并集,所述子样本短信合并集中每个样本短信包括短信发送方号码、标题、短信接收方号码个数,所述子样本短信集包括同一短信发送方号码对应的样本短信。
14.根据权利要求13所述的装置,其特征在于,所述第一归属信息识别模块包括:
概率值计算子模块,被配置为采用下述公式计算子样本短信合并集中每个标题在子样本短信合并集中的概率值:
P ( title i ) = C ( title i ) &Sigma; k = 1 n C ( title k ) , i &Element; ( 1 , n )
其中,P(titlei)表示标题titlei在子样本短信合并集中的概率值,C(titlei)表示子样本短信合并集中标题titlei对应的短信接收方号码个数,C(titlek)表示子样本短信合并集中标题titlek对应的短信接收方号码个数,n表示子样本短信合并集中标题个数;
归属信息确定子模块,被配置为将所述概率值大于概率阈值的标题确定为所述短信发送方号码的归属信息。
15.根据权利要求14所述的装置,其特征在于,所述第一归属信息识别模块还包括:
归属信息过滤子模块,判断所述子样本短信合并集中标题对应的短信接收方号码个数是否小于个数阈值;将小于个数阈值的短信接收方号码个数对应的标题删除。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
关联关系确定模块,被配置为根据各短信发送方号码的归属信息确定短信发送方号码与归属信息的关联关系;
第二归属信息识别模块,被配置为根据所述发送方号码与归属信息的关联关系对待识别的目标号码进行识别,确定所述目标号码的归属信息,所述目标号码包括主叫方待拨出的号码、被叫方接收的号码、短信发送方待发送的号码或短信接收方接收的号码。
17.一种号码的归属信息的识别装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取样本短信集;
从所述样本短信集的样本短信中抽取用于标识号码归属信息的标题;
将同一短信发送方号码对应的样本短信的标题进行合并;
根据合并信息识别出所述短信发送方号码的归属信息。
CN201510728723.8A 2015-10-30 2015-10-30 号码的归属信息的识别方法及装置 Active CN105430654B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510728723.8A CN105430654B (zh) 2015-10-30 2015-10-30 号码的归属信息的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510728723.8A CN105430654B (zh) 2015-10-30 2015-10-30 号码的归属信息的识别方法及装置

Publications (2)

Publication Number Publication Date
CN105430654A true CN105430654A (zh) 2016-03-23
CN105430654B CN105430654B (zh) 2018-12-11

Family

ID=55508523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510728723.8A Active CN105430654B (zh) 2015-10-30 2015-10-30 号码的归属信息的识别方法及装置

Country Status (1)

Country Link
CN (1) CN105430654B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106101464A (zh) * 2016-05-26 2016-11-09 北京小米移动软件有限公司 号码标识方法及装置
CN108494977A (zh) * 2018-02-09 2018-09-04 北京泰迪熊移动科技有限公司 短信号码的识别方法、装置和***
CN109561402A (zh) * 2017-09-26 2019-04-02 中国电信股份有限公司 信息获取方法、装置和移动终端
CN113810547A (zh) * 2020-06-16 2021-12-17 ***通信集团重庆有限公司 语音呼叫安全防护的方法、装置及计算设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011126506A1 (en) * 2010-04-07 2011-10-13 Apple Inc. Transitioning between circuit switched calls and video calls
CN103369095A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 识别来电或短消息类型的方法和设备
CN104618877A (zh) * 2015-01-30 2015-05-13 广东欧珀移动通信有限公司 一种短信整理方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011126506A1 (en) * 2010-04-07 2011-10-13 Apple Inc. Transitioning between circuit switched calls and video calls
CN103369095A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 识别来电或短消息类型的方法和设备
CN104618877A (zh) * 2015-01-30 2015-05-13 广东欧珀移动通信有限公司 一种短信整理方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106101464A (zh) * 2016-05-26 2016-11-09 北京小米移动软件有限公司 号码标识方法及装置
CN109561402A (zh) * 2017-09-26 2019-04-02 中国电信股份有限公司 信息获取方法、装置和移动终端
CN108494977A (zh) * 2018-02-09 2018-09-04 北京泰迪熊移动科技有限公司 短信号码的识别方法、装置和***
CN113810547A (zh) * 2020-06-16 2021-12-17 ***通信集团重庆有限公司 语音呼叫安全防护的方法、装置及计算设备
CN113810547B (zh) * 2020-06-16 2023-12-15 ***通信集团重庆有限公司 语音呼叫安全防护的方法、装置及计算设备

Also Published As

Publication number Publication date
CN105430654B (zh) 2018-12-11

Similar Documents

Publication Publication Date Title
CN103546364B (zh) 提醒信息推送方法和***
CN101729639B (zh) 移动终端的通话记录方法和装置
CN105430654A (zh) 号码的归属信息的识别方法及装置
WO2013166922A1 (zh) 一种信息处理的方法和终端
CN103167089A (zh) 一种移动终端及其通讯录的维护方法
CN104407873A (zh) 基于日历管理应用的方法及装置
CN104754151A (zh) 一种银行排号通讯方法及***
CN104994209A (zh) 基于通讯软件聊天记录的联系人信息获取方法及***
CN102883289B (zh) 一种通信处理方法、客户端及移动终端
CN102833699A (zh) 模拟双通功能的方法、***及移动通信终端
CN105472581A (zh) 临时通讯录设置方法及装置
CN105611054A (zh) 一种提醒创建方法及终端
CN104881279A (zh) 一种群发消息的方法及装置
CN104052652A (zh) 一种实现消息自动删除的方法、客户端、***和电子设备
CN111917912A (zh) 显示来电号码对应的业务信息的方法、装置和智能终端
CN103916526B (zh) 联系人信息处理方法、装置及移动终端
US9277060B2 (en) Presenting to a user contextual information regarding a communication before the user takes action concerning the communication
CN103685742A (zh) 移动终端自动设置短信为日程的方法及其***
CN105827780B (zh) 一种来电显示方法及装置
WO2014023182A1 (zh) 一种处理消息业务的方法和终端
CN104184871A (zh) 一种提示骚扰电话号码的方法和装置
CN105208520A (zh) 一种移动终端自动发送信息的方法及装置
WO2013174315A1 (zh) 文本内容的发送方法和装置
CN104378489A (zh) 一种基于未接来电的信息显示方法和装置
CN104836881B (zh) 一种信息控制方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant