背景技术
随着时代发展和技术进步,越来越多的人希望在移动过程中高速接入互联网,随时随地获取所需的信息,完成想做的事情。因此,移动通信和互联网二者结合起来是历史的必然趋势。当前,移动互联网正逐渐渗透到人们生活、工作的各个领域,深刻改变信息时代的社会生活。
发展移动互联网仍然存在许多技术问题需要解决。例如人们普遍使用智能手机、平板电脑等移动通信终端浏览互联网,访问网站阅读网络信息。但是,现有的移动互联网访问方式-通过RSS信息阅读方式、通过WAP访问方式、使用第三方手机浏览器如UC浏览器访问等都存在很多亟待解决的问题,例如:
●网站与手机屏幕不适配
A.网站中都是根据电脑屏幕大小设计的Web网页,使用手机浏览器需要不停地缩放、移动,用户操作极不方便,甚至无法使用;
B.Web网页的字体普遍非常小,无法直接阅读;
C.过小的触摸屏键盘,晦涩的编辑操作使输入缓慢易错;
D.密集的页面链接经常造成点击误操作。
●WAP网站
A.呈现方式过于简单,与电脑上网的体验差距大,无法形成手机上网的使用感受;
B.需要独立的采编发布和持续的内容编辑投入,内容更新往往不能及时同步;
C.技术已经显得陈旧,不能支持复杂的多媒体呈现。
●第三方手机浏览器
A.需要用户下载后安装应用,通过运营商渠道推广困难;
B.很多页面样式和脚本与手机浏览器不兼容,失真比较严重;
C.网页呈现方式简陋,用户体验不佳。
为了解决上述的问题,在申请号为200910313007.8的中国发明专利申请中,提供了一种用于移动通讯设备终端的网页页面预读及整合浏览***及其应用方法。该网页浏览***包括采用预先操作读取当前网页的子页并保存的预读模块和用于把当前网页和子页组合成一个组合网页的网页组合模块,还包括用于对当前网页进行多子页读取的多子页读取模块。该技术方案中,对获取的子页与当前页面进行重新组合成一个统一的网页显示给用户,提高用户的浏览感受;对预读页面进行多层搜索,让用户浏览需要多次翻页的网页时更加方便;预读的操作在中转服务器中处理,减轻了移动通讯设备终端对硬件和网络传输的依赖。
另外,在申请号为200810091683.0的中国发明专利申请中,提出了一种以手持通讯装置浏览网络信息的方法,预先建立萃取规则于一个网页萃取服务器中,而允许一个手持通讯装置连结到该网页萃取服务器时可指定其中一个萃取规则,其中该网页萃取服务器根据该萃取规则通过因特网而查询一个目标网页,并自目标网页中萃取过滤出目标信息,萃取过滤出的目标信息供手持通讯装置直接显示。
但是,现有的解决方案往往需要在智能手机、平板电脑等移动通信终端中安装第三方手机浏览器,用户在使用上并不方便,也不利于市场推广。
发明内容
本发明所要解决的首要技术问题在于提供一种用于智能手机、平板电脑等移动通信终端的网络资讯导航***。该导航***可以适配多种类型的移动通信终端,不需要用户另行安装第三方浏览器。
本发明所要解决的另一个技术问题在于提供上述网络资讯导航***实现移动通信终端适配的具体方法。
为实现上述的发明目的,本发明采用下述的技术方案:
一种手机网络资讯导航***,其特征在于:
所述手机网络资讯导航***包括手机自动识别模块、手机自动适配模块、正文页适配模块、栏目页导航适配模块、知识文件分析模块、知识配置模块和采集服务模块;其中,
所述手机识别模块连接所述手机自动适配模块,所述手机自动适配模块将移动通信终端的适配信息送入所述正文页适配模块和所述栏目页导航适配模块,所述正文页适配模块和所述栏目页导航适配模块向所述移动通信终端的网络浏览器返回符合屏幕和网络浏览器要求的网页;
所述知识文件分析模块和所述知识配置模块向所述采集服务模块提供采集规则和分析规则,所述采集服务模块将经过分析、转换后的网络资讯发送给所述正文页适配模块和所述栏目页导航适配模块。
其中较优地,所述手机网络资讯导航***中还具有H2X服务模块,所述H2X服务模块分别与所述知识配置模块及所述采集服务模块进行连接,用于实现从非结构化的html文件到结构化的xml文件的转换。
其中较优地,所述手机自动识别模块通过与所述移动通信终端的信息交互获得国际移动设备识别码信息,所述手机自动适配模块通过用户代理和脚本语言识读所述移动通信终端的信息。
其中较优地,所述栏目页导航适配模块根据所述手机自动适配模块传送的适配信息计算得到字体的缩放比例和屏幕的缩放比例,使栏目字体大小按屏幕要求进行显示。
其中较优地,所述栏目页导航适配模块根据从所述知识配置模块获取的栏目页中每个栏目的宽度计算出屏幕中每个栏目要显示的宽度。
其中较优地,所述正文页适配模块从所述知识配置模块处获取键值以区分不同频道,并根据所述适配信息计算在上、下一页标签上显示的字数。
其中较优地,所述正文页适配模块实现正文页内容的缓存处理,并根据正文页的知识配置信息进行相应的显示处理。
一种上述手机网络资讯导航***实现移动通信终端适配的方法,其特征在于:
移动通信终端的用户在登录所述手机网络资讯导航***后,所述手机网络资讯导航***首先保存用户代理获取的信息,然后在手机型号适配库中查找,如果找到则加载相应的适配信息并转入导航网页,如果没有找到则调用手机自动适配模块,并提示用户选择最符合的机型;在用户提交选择之后,将用户选择的内容提交给手机自动适配模块;如果手机自动适配模块能够对用户选择的内容进行适配则进行相应的适配处理,按照新的适配信息加载导航网页;如果不能适配则向用户给出友好提示,由手机自动适配模块保存不能适配的移动通信终端的信息。
与现有技术相比较,本手机网络资讯导航***可以让手机通过自身携带的网络浏览器直接访问经过适配处理的导航网页,不需要安装第三方手机浏览器,从而扫清了用户使用上的障碍,非常有利于移动互联网环境下的市场推广。
具体实施方式
为描述方便起见,在下文中用手机一词统一指代智能手机、平板电脑等可直接访问移动互联网的移动通信终端。因此,本专利申请中的手机一词含义比通常理解的范围要广。如图1所示,本发明所提供的手机网络资讯导航***至少包括手机自动识别模块、手机自动适配模块、正文页适配模块、栏目页导航适配模块、知识文件分析模块、知识配置模块和采集服务模块,此外还可以根据需要设置H2X服务模块。其中手机自动适配模块、手机自动识别模块、正文页适配模块、栏目页导航适配模块作为整个手机网络资讯导航***的前台部分,直接为智能手机、平板电脑等移动通信终端中内置的网络浏览器服务,而知识文件分析模块、知识配置模块、H2X服务模块和采集服务模块作为整个手机网络资讯导航***的后台部分,用于采集、分析网络服务器中的网站信息,为前台部分提供内容支持。
如图2所示,用户通过手机中自带的网络浏览器访问本手机网络资讯导航***。当他通过网络浏览器发出浏览某一Web网页的请求时,该请求首先被送入手机识别模块,进而被送入手机自适应模块。这两个功能模块的作用在于识别手机的型号,并通过内部的手机型号适配库查阅某一型号所对应的手机参数信息,将这些手机参数信息作为适配信息送入正文页适配模块和栏目页导航适配模块中,使它们向网络浏览器返回符合手机屏幕和浏览器要求的网页。
正文页适配模块和栏目页导航适配模块所提供的网页内容是由位于后台的知识文件分析模块、知识配置模块、H2X服务模块和采集服务模块相互配合提供的。知识文件分析模块和知识配置模块向H2X服务模块和采集服务模块提供采集规则和分析规则。H2X服务模块用于实现从非结构化的html文件到结构化的xml文件的转换。它从海量的html格式文件中将有用的信息提取出来,组织成xml格式的结构化数据提供给用户。采集服务模块将经过分析、转换后的网络资讯发送给正文页适配模块和栏目页导航适配模块,由它们为手机用户提供网页导航服务。
下面对本手机网络资讯导航***中的各个功能模块进行详细的说明。
手机自动识别模块的作用在于识别手机等各类移动通信终端的品牌、型号信息。众所周知,合法的手机都具有国际移动设备识别码(IMEI),用于在移动通信网络中识别每一部独立的手机。该识别码由15位数字组成,前6位为原制造厂编码,中间8位为“流水号”,最后1位为备用码。手机自动识别模块可以通过与手机的信息交互获得手机的IMEI信息,进而利用手机制造商等提供的数据识别出手机的品牌、型号信息。
手机自动适配模块的作用在于自动识别并兼容主流的手机操作***,通过User-Agent(用户代理)和脚本语言自动识读手机的如下信息:
●屏幕分辨率
●网络浏览器内核和版本
●横、竖屏的判断
●手机操作***
●是否能旋转屏幕
●是否支持固定位置
●是否支持自动隐藏地址栏
●是否能动态改变虚拟的“窗口”(viewport)
●是否自动缩放文本到合适宽度
●是否支持CSS Transform(变形)
●是否支持触摸
●是否发送User-Agent
图3为手机自动适配模块的功能时序图。手机用户在登录手机网络资讯导航***后,手机网络资讯导航***首先保存User-Agent(用户代理)获取的信息,然后在手机型号适配库中查找,如果找到则加载相应的适配信息并转入导航网页,如果没有找到则调用手机自动适配模块,并提示用户选择最符合的机型。在用户提交选择之后,将用户选择的内容提交给手机自动适配模块。如果手机自动适配模块能够对用户所选择的内容进行适配则做相应的适配处理,并且按照新的适配信息加载导航网页;如果不能适配则向用户给出友好提示,由手机自动适配模块保存不能适配的手机信息。通过手机自动适配模块,可以使本手机网络资讯导航***实现良好的兼容性。
正文页适配模块和栏目页导航适配模块的作用在于实现网站栏目页与正文页的自动适配,它们通过知识配置模块可获取如下信息:
●公用的样式
●导航块的名称
●最小字节数、最大字节数
●导航块的宽度
●栏目需要补充的html代码
这两个功能模块通过脚本语言来适配正文页和栏目页,具体适配的内容包括:
●导航栏的固定
●字体按一定计算比例的缩放
●屏幕按一定计算比例的缩放
●根据配置情况改写或新添样式
●触摸事件按一定配置要求重写
●根据特定要求调整原网站的一些显示效果
●浏览器滚动条的控制
●横、竖屏及隐藏导航栏下图片的自动调整
●三种字体放大模式:单行点击放大、整体字体放大、屏幕放大镜
●栏目的连续滚动
下面通过具体实施例对正文页适配模块和栏目页导航适配模块进行详细的说明。当手机用户通过本手机网络资讯导航***访问某网站新闻频道的栏目页时,栏目页导航适配模块根据手机自动适配模块传送过来的适配信息计算得到字体的缩放比例和屏幕的缩放比例,使栏目字体大小按手机屏幕的要求进行显示,并根据手机屏幕是否是横、竖屏及屏幕分辨率等信息来计算标签显示的个数。另一方面,栏目页导航适配模块根据从知识配置模块获取的栏目页中每个栏目的宽度计算出手机屏幕中每个栏目要显示的宽度,以使手机屏幕的显示效果达到规定的要求。栏目页导航适配模块也从知识配置模块获取新闻频道的配置信息,例如需要添加什么样式以达到显示要求;各个导航块的名称、字符编码;新闻频道下每个栏目需要补充的html代码等以达到显示要求。栏目页导航适配模块可以实现频道栏目的连续滚动,即频道下所有栏目放在一屏,通过锚点来控制栏目标签名的同步。另外,栏目页导航适配模块可以实现三种字体放大模式:单行点击放大、整体字体放大、屏幕放大镜,其中单行点击放大是通过点击单行来实现对应行的放大,整体字体放大是通过点击字体放大按钮把整个屏幕的字体放大,屏幕放大镜是通过点击放大镜按钮把整个屏幕所有元素进行放大,即实现类似放大镜的作用。
正文页适配模块从知识配置模块处获取键值以区分不同频道,并可进一步获取上一页、下一页的链接,根据手机的适配信息自动计算在上、下一页标签上显示的字数。正文页适配模块可以实现正文页内容的缓存处理,并根据正文页的知识配置信息(例如是否是普通正文页、高清图、视频、专题;是否有分页等信息)进行相应的显示处理,将正文中相应的杂质如:正文标题下面只保留时间、来源及作者等描述信息,其它带链接功能性标签(字体、打印、评论等)过滤掉。
正文页适配模块和栏目页导航适配模块相互配合,可以生成手机网络资讯导航***的导航网页,实现对手机网络资讯的导航和网页对手机屏幕的适配,从而明显改善手机用户的使用体验。该导航网页使用通用的Web形式,自动识别并支持各种通用的手机操作***和网络浏览器,无需针对新增机型进行单独开发,因此具有如下的技术特点:
A.不需要在庞大的列表页中寻觅,精确地引导用户直接找到目标;
B.自动调整标题间隙,方便触摸屏操作;
C.直接定位到正文区域,减少用户操作;
D.智能匹配手机屏幕,自动缩放网页,调整字体大小,满足用户舒适阅读的要求。
E.上页、下页功能方便用户连续阅读。
F.可屏蔽无用信息,简化操作,提高效率。
知识文件分析模块的作用在于为采集服务模块、H2X服务模块提供各项采集规则和分析规则。这些规则可以以正则表达式、知识文件、标签等多种方式呈现,具体包括:
●频道、栏目名、字符集、宽度、字节大小区间值
●要抓取的规则,分为:频道、栏目、正文
●公用的样式
●过滤的规则,分为:栏目、正文
●专题的规则
●视频的规则
●高清图的规则
●分页的规则
在本发明中,网页的知识文件分为栏目知识与正文知识。栏目知识包括所属频道名称、字符编码集、公用的样式、专题的采集规则、各频道总的采集规则、每个栏目的采集规则和栏目特定补充html等。正文知识包括用于区分不同频道的键值、字符编码集、栏目的宽度、字节大小区间值及正文类型的判断处理规则,其中正文类型包括以下几类:普通正文、视频、高清图、分页。
下面,分别以高清图和分页为例,对知识文件的具体内容展开说明。
●高清图
要显示高清图,必须先在栏目知识文件中将相关高清图链接放入。目前,高清图支持4种形式:
形式1:在同一个页面可以获取所有图片地址、标题和简介的
形式2:有多个分页链接的
形式3:图片相关信息完全不在当前页,但可以通过另外一个URL获取的
形式4:在同一个页面里只有“上一页”、“下一页”,而没有所有的图片链接的
所有形式均是在<rule/>标签中加入<field name=”mobilepic”/>定义。这样采集服务模块会自动轮询所有<rule/>,直到找到合适的内容为止。
●分页
使用分页的前提是分页连接(比如“上一页”,“下一页”)必须保留在内容里。
分页使用<filed name=”mobilepage”/>标签定义,把包含所有分页连接的正则表达式放置到<searchExp></searchExp>之中,该正则表达式不需要特别的括号。需要注意的是,该正则表达式能匹配到的内容中的链接只能包含分页链接,不能包含其他链接。
对于一个页面同时包含多个分页的(上下、数字页号、下拉菜单等),可以填写多个<field name=”mobilepage”/>来支持。
知识配置模块的作用在于进行知识的自动配置与检查,具体功能如下:
●根据配置情况自动添加样式
●进行分析规则的检查,可通过预采集的标签是否成套来判断
●根据要求自动修改样式的属性或添加栏目的特有的样式
知识配置模块的上述功能是通过知识辅助配置工具配合实现的。知识辅助配置工具可以验证分析规则是否正确,并通过预采集频道的数据来进行一些校验,如标签是否成套、样式是否丢失等,并自动获取预采集频道的所有样式,通过界面人工修改样式属性以达到所希望的显示效果,可以人工添加栏目特有的样式,最后生成知识配置文件。
H2X服务模块是本手机网络资讯导航***引入H2X引擎服务的接口模块。该H2X引擎服务主要是从海量的html格式文件中将有用的信息提取出来,组织成xml格式的结构化数据提供给用户。在这个过程中,进行有关形式、行为、语义等方面的智能分析。关于H2X引擎服务的进一步说明,可以参阅本申请人另案提出的专利申请,在此就不详细赘述了。
图4是采集服务模块的工作原理示意图,其中的数字代表了执行顺序。以下对每个步骤进行详细的说明。
1)前端服务器尝试从缓存服务器中读取缓存;
2)缓存服务器上如果有需要的内容,就返回该内容;否则进入步骤3;
3)尝试从采集服务器中获取内容;
4)采集服务器中的Web服务尝试查找当前计算机上的文件缓存;
5)如果有文件缓存就直接返回给Web服务,而且直接进入步骤12;否则进入6;
6)Web服务调用采集程序;
7)采集程序发送请求到新闻网站,如新浪网、搜狐网等;
如果有特殊规则,则会请求H2X服务模块进行形式、行为、语义的智能分析。
8)采集程序对抓取内容进行分析;
9)采集程序将分析结果写入缓存;
10)采集程序将分析结果写入缓存服务器(Memcached);
11)采集程序将分析结果返回Web服务;
12)采集服务器将分析结果返回给前端服务器;
13)前端服务器将结果返回给用户,整个采集服务过程结束。
通过采集服务模块的定时启动,可以使本手机网络资讯导航***所提供的内容与互联网网站实时同步,满足用户通过手机访问移动互联网的心理预期。另外,采集服务模块与知识文件分析模块、知识配置模块等相互配合,自动进行网络信息的采集与过滤,使本手机网络资讯导航***不像同类产品那样需要大量的编辑人员来编辑、维护信息,而只需要维护一个知识配置文件即可,大大降低了整个手机网络资讯导航***的维护成本。
为了提供更佳的用户体验,本手机网络资讯导航***对采集服务模块所提供的网页信息按过滤规则进行处理,过滤的具体内容包括:
●样式的过滤
●JavaScript的过滤
●无用链接的过滤
●广告的过滤
●无用图片的过滤
●博客、论坛的过滤
●相关背景图片的过滤
●弹出页面的过滤
●不良信息的过滤
●其它杂质的过滤
关于过滤处理的进一步说明,可以参阅申请人在先提出的中国发明专利申请“面向互联网的不良信息过滤***及其方法”(申请号:201010200588.7,申请日:2010年6月13日),在此就不详细赘述了。
参见图5所示的业务整体流程,本手机网络资讯导航***对于手机用户而言,可以通过导航网页提供网站目录,在用户选择、打开某一网站之后进一步提供栏目区块的导航,从而提供便捷方便的资讯服务;对于运营工程师而言,利用内置的知识文件分析模块和知识配置模块生成网站的知识配置文件,经测试后进行上传,即可动态监控知识(即网站内容)的变化。
上面对本发明所述的手机网络资讯导航***及其实现方法进行了详细的说明,但显然本发明的具体实现形式并不局限于此。对于本技术领域的一般技术人员来说,在不背离本发明的精神和权利要求范围的情况下对它进行的各种显而易见的改变都在本发明的保护范围之内。