CN102932481A - 自动获取手机终端信息的***和方法 - Google Patents

自动获取手机终端信息的***和方法 Download PDF

Info

Publication number
CN102932481A
CN102932481A CN2012104618697A CN201210461869A CN102932481A CN 102932481 A CN102932481 A CN 102932481A CN 2012104618697 A CN2012104618697 A CN 2012104618697A CN 201210461869 A CN201210461869 A CN 201210461869A CN 102932481 A CN102932481 A CN 102932481A
Authority
CN
China
Prior art keywords
mobile phone
information
phone terminal
new architecture
short message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012104618697A
Other languages
English (en)
Inventor
嵇正鹏
袁黎轶
汪敏娟
袁海
胡仲刚
张聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU PUBLIC INFORMATION CO Ltd
Original Assignee
JIANGSU PUBLIC INFORMATION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU PUBLIC INFORMATION CO Ltd filed Critical JIANGSU PUBLIC INFORMATION CO Ltd
Priority to CN2012104618697A priority Critical patent/CN102932481A/zh
Publication of CN102932481A publication Critical patent/CN102932481A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

一种自动获取手机终端信息的***和方法,所述的***与短信业务网关连接,采集手机终端注册短信,所述的***对手机资讯门户进行搜索,该***在云端运行,它包括注册短信采集单元、注册短信解析单元、终端信息采集单元以及管理单元。本发明实现了用户手机终端信息的自动获取;并发对手机终端注册短信进行解析,提高了解析效率;同时对多个手机资讯门户进行爬虫搜索,提高了手机终端信息抓取的广度(更多终端信息)和深度(准确度)。

Description

自动获取手机终端信息的***和方法
技术领域
 本发明涉及移动互联网、计算机软件等领域,具体涉及一种自动获取手机终端信息的***和方法。
 
背景技术
目前,随着3G网络的商用,移动数据业务发展迅猛,运营商提供业务的种类不断增加。运营商对移动数据业务的关注正从“网络”向“用户”层面不断深化,如何管理好、发展好各类业务已经成为一个亟待解决的问题。
手机终端作为用户体验移动数据业务的物理设备,是用户对运营商服务的感知和体验效果的传导媒介,是用户选择业务类型的重要影响因素。在目前移动终端差异化、多样化、个性化的情况下,手机终端能力对业务体验、消费行为的影响也愈发凸显。在移动数据业务发展过程中,存在难以准确定位目标用户,确定适合用户的业务、内容和媒体格式等问题。
目前,通过分析手机终端注册短信、WAP上网行为等获取少量终端信息即机型参数和业务支持能力信息(机型参数例如:屏幕大小、分辨率,业务支持能力信息例如:是否支持Java),不能很好的满足精确营销需要;如果采用人工整理终端信息,则存在事务繁琐且工作量巨大的问题。机型参数和业务支持能力信息。
 
发明内容
名词解释:
终端信息:包括终端参数信息和业务支持能力信息等。终端参数信息,例如:屏幕大小、分辨率、操作***类型等。业务支持能力信息,例如:是否支持KJAVA、是否支持流媒体、是否支持QQ等。
手机终端注册短信:终端以普通短信方式向服务器发送“终端注册信息”,内容包括:本机型号,本机ESN或MEID,***本机UIM卡的IMSI,以及本机软件版本。注册过程完全在后台进行,即:无论是发送注册短消息,还是接收注册成功确认短消息,都不给用户以提示,也不在短消息收件箱和发件箱中显示短消息,避免干扰用户正常使用。
手机资讯门户:提供手机终端的行情资讯门户网站,可提供包括各类手机终端的参数和业务支持能力信息搜索和查询等服务,例如:手机信息网(http://shouji.tenaa.com.cn/),中关村在线(http://www.zol.com.cn/),太平洋电脑网(http://pconline.com.cn)。
爬虫种子门户:是选定用来通过爬虫程序获取机型参数和业务支持能力信息的手机资讯门户。
爬虫搜索或搜索爬虫:主要是通过爬虫程序抓取网页,对网页文本内容进行提取、分析的过程。
分布式并发技术:在此处指分布式处理技术,是分布式计算技术的一种。
一种自动获取手机终端信息的***,所述的***通过与短信业务网关连接,采集手机终端注册短信,所述的***对手机资讯门户进行搜索,其特征是该***在云端运行,它包括注册短信采集单元、注册短信解析单元、终端信息采集单元以及管理单元;
所述的注册短信采集单元用于从短信业务网关采集手机终端注册短信;
所述的注册短信解析单元用于解析手机终端注册短信获取用户信息;
所述的终端信息采集单元用于根据用户信息中的新机型名称在手机资讯门户进行搜索,获取终端信息即该新机型参数和业务支持能力信息;
所述的管理单元用于配置搜索相关信息和过滤搜索结果的相关信息。
本发明的管理单元包括爬虫种子和权重配置模块、终端信息名称配置模块和号段信息维护模块。
一种自动获取手机终端信息的方法,应用自动获取手机终端信息的***,它包括以下步骤:
步骤A、从短信业务网关采集手机终端注册短信的步骤; 
步骤B、解析手机终端注册短信获取用户信息的步骤;
步骤C、根据用户信息判断是否为新机型的步骤;如果不是新机型,则返回步骤A,如果是新机型,则转步骤D;
步骤D、根据新机型名称在手机资讯门户进行搜索获取该新机型相关网页的步骤;
步骤E、对步骤D获取的网页进行去重处理,对剩余的网页进行匹配过滤处理;
步骤F、对步骤E获取的数据进行聚合处理,获得机型参数和业务支持能力信息,并写入终端信息数据库的步骤。
本发明的步骤A具体为:注册短信采集单元从短信业务网关采集手机终端注册短信,送往云端进行解析。
本发明的步骤B具体为:云端的注册短信解析单元采用分布式并发计算技术对多个手机注册短信进行并发解析处理,获取各用户信息并存入注册短信解析单元中的用户信息数据库;所述的用户信息包括手机号码、手机机型等。
本发明的步骤D具体为:采用爬虫搜索,在手机资讯门户中选择若干作为爬虫种子门户,以新机型名称作为爬虫关键词,利用分布式并发计算技术,同时对多个爬虫种子门户进行搜索,获取该新机型参数和业务支持能力信息。
本发明的步骤E具体为:对多个爬虫种子门户获取的网页进行去重处理,对剩余的网页进行匹配过滤处理;所述的匹配过滤处理是对终端信息名称的匹配处理即根据机型参数和业务支持能力信息的名称进行过滤,获取终端信息即机型参数和业务支持能力信息。
本发明的有益效果:
本发明实现了用户手机终端信息的自动获取;并发对手机终端注册短信进行解析,提高了解析效率;同时对多个手机资讯门户进行爬虫搜索,提高了手机终端信息抓取的广度(更多终端信息)和深度(准确度)。手机终端信息可用于终端媒体格式实时适配,提升用户业务使用体验,用于移动业务精准营销和用户消费行为分析,支撑移动互联网流量经营。
 
附图说明
图1是本发明的流程示意图。
图2是本发明的应用场景示意图。
图3是本发明手机终端注册短信采集流程图。
图4是本发明手机终端信息采集流程图。
图5是本发明一实施例的结构示意图。
 
具体实施方式
下面结合附图和实施例对本发明作进一步的说明。
本发明提出了一种自动获取手机终端信息的***和方法。具体说明如下:
如图1所示,为本发明自动获取手机终端信息的***和方法的流程示意图。包括以下步骤:
步骤A、从短信业务网关采集手机终端注册短信,送往云端进行解析;
步骤B、云端采用分布式计算技术对手机注册短信进行并发解析处理,获取用户信息(如:手机号码、手机机型等),写入用户信息数据库;
步骤C、判断手机是否为新机型,如果不是,转步骤A,否则,转步骤D;
步骤D、以机型名称作为爬虫关键词,利用云平台分布式并发技术,同时对多个爬虫种子门户进行搜索;
步骤E、对各爬虫程序抓取的网页进行去重处理,对剩余的网页进行语义分析、匹配过滤处理;
步骤F、进行聚合分析处理,获得机型参数和业务支持能力信息,并写入终端信息数据库;
本发明的应用场景如图2所示,由手机终端、短信业务网关、自动获取手机终端信息的***和手机资讯门户等四部分构成。具体说明如下:
1、手机终端
用户开机时,判断终端的ESN(或pseudo-ESN 或MEID)和UIM卡的IMSI 参数对是否与上次关机时的参数对匹配。如果匹配,终端不做任何处理,继续执行后续的开机过程;如果不匹配,终端应将新的ESN/IMSI 参数对以及终端的软件版本和终端型号以短消息的方式上报短信业务网关。
2、短信业务网关
接收手机终端发送的注册短信,直接向手机终端信息自动采集***转发或提供交换机镜像端口供采集。
3、自动获取手机终端信息的***
从短信业务网关采集手机终端注册短信,解析获取用户号码、终端机型等信息,写入用户信息数据库。当发现手机终端为新机型时,利用爬虫技术,通过互联网从手机资讯门户进行爬虫搜索,然后对爬虫结果进行聚合分析处理,获得更多终端信息。
***采用云计算理念设计,对采集的注册短信进行并发解析处理,提高注册短信解析效率;采用分布式计算技术,同时对多个手机资讯门户网站进行爬虫搜索,对搜索结果进行分析、聚合处理,提高终端信息采集广度(更多终端信息)和深度(准确度);***采用分布式数据库技术,对数据进行众向分割处理,用户号码、机型信息存储在用户信息数据库,机型参数和业务支持能力信息存储在终端信息数据库,提高数据库的访问速度。
4、手机资讯门户
提供手机终端的行情资讯门户网站,可提供包括各类手机终端的参数和业务支持能力信息搜索和查询等服务。
手机终端注册短信采集和解析
1、手机终端注册短信采集
手机终端注册短信采集流程如图3所示,包括以下步骤:
步骤A、接收从短信业务网关转发或镜像的短消息;
步骤B、对接收短消息的目标端口、消息类型和目的接入号等进行判断;
步骤C、判断是否符合指定要求,如果符合,转步骤E,否则,转步骤D;
步骤D、丢弃该消息,继续接收下一条消息,转步骤A;
步骤E、将接收短消息发送到云端进行解析处理。
2、手机终端注册短信解析
手机终端信息存在于注册短信Content(内容)字段中,可根据相关技术规范进行解析。例如,Content字段解码后为:
<a1><b1>SAF-D9900</b1><b2>A1B2FD8E</b2><b3>460036120024361</b3><b4>5.2.20271.920C</b4></a1>DCFF32EB
    各字段含义:
    SAF-D9900:机型
    A1B2FD8E:ESN或MEID信息
    460036120024361:IMSI信息
    5.2.20271.920C:手机的软件版本
    DCFF32EB:CRC校验
终端信息采集
终端信息采集流程如图4所示,包括以下步骤:
步骤A、根据设置的爬虫种子(手机资讯门户URL),以机型名称作为关键词,并发进行爬虫搜索,抓取关联网页;
步骤B、对各爬虫程序抓取的网页进行去重复处理,对剩余的网页进行内容解析,根据设定的终端信息名称,分别进行语义分析和匹配过滤处理;
步骤C、对各爬虫程序分别搜索到的机型信息进行聚合分析处理,获得机型参数和业务支持能力信息;
爬虫结果分析处理
将各爬虫种子及其对应的权重使用                                               
Figure 2012104618697100002DEST_PATH_IMAGE002
表示。分别对各爬虫程序抓取的网页进行去重复处理,例如:对搜索结果按照地址是否相同进行过滤,只保留网址不同的搜索结果。
对剩余的网页进行内容解析,根据设定的各终端信息名称,分别进行语义分析和匹配过滤处理,获得各终端信息名称对应的搜索结果集
Figure 2012104618697100002DEST_PATH_IMAGE004
,同时,计算搜索结果集中
Figure 2012104618697100002DEST_PATH_IMAGE006
(m为
Figure 2012104618697100002DEST_PATH_IMAGE008
)在各爬虫结果中出现的次数
Figure 2012104618697100002DEST_PATH_IMAGE010
,搜索结果可信度使用
Figure 2012104618697100002DEST_PATH_IMAGE012
表示,计算
Figure 2012104618697100002DEST_PATH_IMAGE014
,m为
Figure 269329DEST_PATH_IMAGE008
,可信度
Figure 2012104618697100002DEST_PATH_IMAGE016
的最大值为
Figure 2012104618697100002DEST_PATH_IMAGE018
Figure 311103DEST_PATH_IMAGE018
对应的
Figure 2012104618697100002DEST_PATH_IMAGE020
即为该终端信息名称对应的最终搜索结果。
以同时从“手机信息网”、“太平洋电脑网”和“中关村在线”搜索新机型摩托罗拉ME811终端信息“JAVA功能”为例进行说明,设置三个手机资讯门户网站的对搜索结果的影响权重分别为0.5、0.3和0.2。经过去重复、语义分析和匹配过滤处理后,各手机资讯门户搜索结果见下表:
  搜索结果为“支持” 搜索结果为“不详”
手机信息网 5个 0个
太平洋电脑网 3个 1个
中关村在线 2个 0个
搜索结果为“支持”的可信度为3.8(), 搜索结果为“不详”的可信度为0.3(
Figure 2012104618697100002DEST_PATH_IMAGE024
)。根据可信度值大小,确认最终搜索结果为“支持”。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

Claims (7)

1.一种自动获取手机终端信息的***,所述的***通过与短信业务网关连接,采集手机终端注册短信,所述的***对手机资讯门户进行搜索,其特征是该***在云端运行,它包括注册短信采集单元、注册短信解析单元、终端信息采集单元以及管理单元;
所述的注册短信采集单元用于从短信业务网关采集手机终端注册短信;
所述的注册短信解析单元用于解析手机终端注册短信获取用户信息;
所述的终端信息采集单元用于根据用户信息中的新机型名称在手机资讯门户进行搜索,获取终端信息即该新机型参数和业务支持能力信息;
所述的管理单元用于配置搜索相关信息和过滤搜索结果的相关信息。
2.根据权利要求1所述的自动获取手机终端信息的***,其特征是所述的管理单元包括爬虫种子和权重配置模块、终端信息名称配置模块和号段信息维护模块。
3.一种自动获取手机终端信息的方法,应用权利要求1所述的自动获取手机终端信息的***,其特征是它包括以下步骤:
步骤A、从短信业务网关采集手机终端注册短信的步骤; 
步骤B、解析手机终端注册短信获取用户信息的步骤;
步骤C、根据用户信息判断是否为新机型的步骤;如果不是新机型,则返回步骤A,如果是新机型,则转步骤D;
步骤D、根据新机型名称在手机资讯门户进行搜索获取该新机型相关网页的步骤;
步骤E、对步骤D获取的网页进行去重处理,对剩余的网页进行匹配过滤处理;
步骤F、对步骤E获取的数据进行聚合处理,获得机型参数和业务支持能力信息,并写入终端信息数据库的步骤。
4.根据权利要求3所述的自动获取手机终端信息的方法,其特征是所述的步骤A具体为:注册短信采集单元从短信业务网关采集手机终端注册短信,送往云端进行解析。
5.根据权利要求3所述的自动获取手机终端信息的方法,其特征是所述的步骤B具体为:云端的注册短信解析单元采用分布式并发计算技术对多个手机注册短信进行并发解析处理,获取各用户信息并存入注册短信解析单元中的用户信息数据库;所述的用户信息包括手机号码、手机机型等。
6.根据权利要求3所述的自动获取手机终端信息的方法,其特征是所述的步骤D具体为:采用爬虫搜索,在手机资讯门户中选择若干作为爬虫种子门户,以新机型名称作为爬虫关键词,利用分布式并发计算技术,同时对多个爬虫种子门户进行搜索,获取该新机型参数和业务支持能力信息。
7.根据权利要求6所述的自动获取手机终端信息的方法,其特征是所述的步骤E具体为:对多个爬虫种子门户获取的网页进行去重处理,对剩余的网页进行匹配过滤处理;所述的匹配过滤处理是对终端信息名称的匹配处理即根据机型参数和业务支持能力信息的名称进行过滤,获取终端信息即机型参数和业务支持能力信息。
CN2012104618697A 2012-11-16 2012-11-16 自动获取手机终端信息的***和方法 Pending CN102932481A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012104618697A CN102932481A (zh) 2012-11-16 2012-11-16 自动获取手机终端信息的***和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012104618697A CN102932481A (zh) 2012-11-16 2012-11-16 自动获取手机终端信息的***和方法

Publications (1)

Publication Number Publication Date
CN102932481A true CN102932481A (zh) 2013-02-13

Family

ID=47647177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012104618697A Pending CN102932481A (zh) 2012-11-16 2012-11-16 自动获取手机终端信息的***和方法

Country Status (1)

Country Link
CN (1) CN102932481A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104023280A (zh) * 2014-05-22 2014-09-03 深圳天珑无线科技有限公司 一种远程控制手机短信的方法及移动终端

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1731800A (zh) * 2005-08-19 2006-02-08 北京新网互联科技有限公司 短信网址电话通信***及其方法
CN101022577A (zh) * 2007-01-09 2007-08-22 杨李颖 短信搜索方法及其***
US20090041013A1 (en) * 2007-08-07 2009-02-12 Mitchell Nathan A Dynamically Assigning A Policy For A Communication Session
US20090279492A1 (en) * 2008-05-12 2009-11-12 Research In Motion Limited Methods And Apparatus For Use In Facilitating Access To A Communication Service Via A WLAN Hotspot
CN101754126A (zh) * 2009-11-16 2010-06-23 华为终端有限公司 发送短信、接收短信的方法、装置和***
CN102075859A (zh) * 2010-12-24 2011-05-25 大唐移动通信设备有限公司 一种基于lte***的信息推送方法和***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1731800A (zh) * 2005-08-19 2006-02-08 北京新网互联科技有限公司 短信网址电话通信***及其方法
CN101022577A (zh) * 2007-01-09 2007-08-22 杨李颖 短信搜索方法及其***
US20090041013A1 (en) * 2007-08-07 2009-02-12 Mitchell Nathan A Dynamically Assigning A Policy For A Communication Session
US20090279492A1 (en) * 2008-05-12 2009-11-12 Research In Motion Limited Methods And Apparatus For Use In Facilitating Access To A Communication Service Via A WLAN Hotspot
CN101754126A (zh) * 2009-11-16 2010-06-23 华为终端有限公司 发送短信、接收短信的方法、装置和***
CN102075859A (zh) * 2010-12-24 2011-05-25 大唐移动通信设备有限公司 一种基于lte***的信息推送方法和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘名博,邓中亮,符丽姹: "基于短信注册的终端信息管理***的设计与实现", 《中国科技论文在线》, 28 March 2006 (2006-03-28) *
谢莹,范冰冰,黄兴平: "移动服务平台终端智能适配框架的研究", 《计算机技术与发展》, no. 12, 17 March 2011 (2011-03-17) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104023280A (zh) * 2014-05-22 2014-09-03 深圳天珑无线科技有限公司 一种远程控制手机短信的方法及移动终端

Similar Documents

Publication Publication Date Title
CN107862022B (zh) 文化资源推荐***
US10216848B2 (en) Method and system for recommending cloud websites based on terminal access statistics
CN103218431B (zh) 一种能识别网页信息自动采集的***
US20150213042A1 (en) Search term obtaining method and server, and search term recommendation system
US20150012519A1 (en) Recommendation search method for search engine, device and computer readable storage medium
CN102855309B (zh) 一种基于用户行为关联分析的信息推荐方法及装置
CN103744856A (zh) 联动性扩展搜索方法及装置、***
WO2014180130A1 (en) Method and system for recommending contents
CN102315953A (zh) 基于帖子的出现规律来检测垃圾帖子的方法及设备
CN103248677B (zh) 互联网行为分析***及其工作方法
CN103617266A (zh) 个性化扩展搜索方法及装置、***
CN106528777A (zh) 跨屏用户标识归一的方法及其***
KR101925950B1 (ko) 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치
CN107835132B (zh) 一种流量来源跟踪的方法及装置
CN102750352A (zh) 浏览器中分类收藏历史访问记录的方法及装置
CN103455758A (zh) 恶意网站的识别方法及装置
CN103823811A (zh) 用于处理日志的方法及其***
CN102298617A (zh) 一种用于获取目标页面的方法与设备
CN104156356A (zh) 个性化导航页面生成方法及装置
CN110020161B (zh) 数据处理方法、日志处理方法和终端
CN103020208A (zh) 一种与移动终端相适应的搜索方法及装置
CN109064067B (zh) 基于互联网的金融风险运营主体判定方法及装置
CN103248513A (zh) 基于Office办公套件的网络信息数据采集方法及***
CN117254983A (zh) 涉诈网址检测方法、装置、设备及存储介质
CN105095450A (zh) 一种用于确定用户移动互联网访问兴趣点的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130213