CN101179558B - 面向电视机显示的信息浏览业务提供***和方法 - Google Patents

面向电视机显示的信息浏览业务提供***和方法 Download PDF

Info

Publication number
CN101179558B
CN101179558B CN2006101383726A CN200610138372A CN101179558B CN 101179558 B CN101179558 B CN 101179558B CN 2006101383726 A CN2006101383726 A CN 2006101383726A CN 200610138372 A CN200610138372 A CN 200610138372A CN 101179558 B CN101179558 B CN 101179558B
Authority
CN
China
Prior art keywords
information
html
content
module
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006101383726A
Other languages
English (en)
Other versions
CN101179558A (zh
Inventor
胡永平
张明杰
蒋力
孟建庭
贾力鼎
包盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN2006101383726A priority Critical patent/CN101179558B/zh
Publication of CN101179558A publication Critical patent/CN101179558A/zh
Application granted granted Critical
Publication of CN101179558B publication Critical patent/CN101179558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

一种面向电视机显示的信息浏览业务提供***,包括:作为信息源的HTML信息网站;带有机顶盒的电视机终端;耦合在HTML信息网站和终端之间的信息入库、组织及发布平台,其抓取各HTML信息网站的内容并存储,适配成适合终端显示的形式,通过电视机终端的机顶盒显示。本发明还提供了相关方法。本发明的效果是方便地把互联网上的信息提供给IPTV、电视上网等业务使用,同样也可以为WAP的信息类业务提供素材,也解决了面向电视机显示的内容和web内容长期间得不到很好的适配的问题。

Description

面向电视机显示的信息浏览业务提供***和方法
技术领域
本发明涉及网络电视领域,尤其涉及用于在网络电视(IPTV)或电视上网中实现自动获取信息并于终端电视机上实现信息浏览的***和方法。
背景技术
传统的电视业务,只能够为用户提供视频广播服务,用户只能够被动的接受有限的内容。而IPTV和电视上网业务是基于电信宽带网络,以电视机加机顶盒作为主要终端设备,为用户提供多媒体服务的宽带增值业务。IPTV和电视上网平台能够提供音视频广播点播、通信服务、互动游戏、信息服务、卡拉OK、远程教育等许多增值业务。因此用户可以根据个人的喜好选择并定制喜欢的节目。在当前用户获取图片文字等信息的主要方式仍然以通过浏览器从互联网获取为主。而对老人或没有电脑的群体来说,通过IPTV或电视上网的方式来获取信息服务,将是不错的选择。
发明内容
综上所述,如何将互联网上的信息内容通过电视机提供给用户,以提供给用户等同于或更优于互联网浏览的信息服务,是本发明所要解决的问题。因此,本发明的一种目的在于,提供一种自动抓取互联网信息内容并发布到电视机终端显示的***和方法。
本发明的另一目的在于,解决了面向电视机显示的内容和web内容长期间得不到很好的适配的问题。
本发明提供了一种面向电视机显示的信息浏览业务提供***,包括:作为信息源的HTML信息网站;带有机顶盒的电视机终端;耦合在HTML信息网站和终端之间的信息入库、组织及发布平台,其抓取各HTML信息网站的内容并存储,适配成适合终端显示的形式,通过电视机终端的机顶盒显示。
本发明还提供了一种面向电视机显示的信息浏览业务提供方法,包括:向作为信息源的HTML信息网站抓取信息并存储;将抓取的信息适配成适合终端显示的形式,通过电视机终端的机顶盒显示。
本发明还提供了一种信息浏览业务提供***,包括:作为信息源的HTML信息网站;终端;耦合在HTML信息网站和终端之间的信息入库、组织及发布平台,其抓取各HTML信息网站的内容并存储,适配成适合终端显示的形式,向终端显示。
本发明的技术效果是使用本发明的信息入库、组织及发布平台,可以不断采集HTML信息网站的信息,将该信息存储,当用户需要时,以适合终端显示的形式将其提供给用户,从而方便地把互联网上的信息提供给IPTV、电视上网等业务使用,同样也可以为WAP的信息类业务提供素材,而不需要为这些业务重新制作信息网站,实现了同一种信息被多种终端使用。
同时,由于本发明将内容标题限定长度,适合页面显示,并去除数据库中存储内容中多余的html标签,将内容格式大小调整至适合电视机显示,解决了面向电视机显示的内容和web内容长期间得不到很好的适配的问题。
附图说明
图1是本发明的***结构图。
图2是图1中信息采集模块的模块图。
图3是图1中动态页面内容发布模块的模块图。
图4是本发明的后台信息获取流程图。
具体实施方式
下面根据图1给出本发明的较好实施例,并予以详细描述,该描述使本领域技术人员更易于理解本发明,但不是用来限定本发明的范围。
请参阅图1,如图所示,一种面向电视机显示的信息浏览业务的***包括:作为信息源的HTML信息网站(1);带有机顶盒的电视机终端(3);耦合在HTML信息网站(1)和终端(3)之间的信息入库、组织及发布平台(2),其抓取各HTML信息网站(1)的内容并存储,适配成适合终端(3)显示的形式,通过电视机终端(3)的机顶盒显示,该信息入库、组织及发布平台(2)例如可以是一个特殊的站点或服务器的形式,电视机终端与其相连,当电视机终端开机时,选择主菜单上的浏览网上信息的选项,该信息入库、组织及发布平台(2)就可以为用户提供网页浏览服务。
其中,信息入库、组织及发布平台(2)包括:
数据库(22),存储所抓取到的HTML信息网站(1)的内容。
信息入库模块(21)(本发明中的后台),耦合到数据库(22),抓取各HTML信息网站(1)的内容并将其存储在数据库(22)中。其包括:后台管理模块(211),管理要采集的HTML信息源,及添加、修改、删除要采集的HTML信息源,判断是否要添加、修改、删除要采集的HTML信息源可以由信息入库、组织及发布平台(2)的管理员进行输入,也可以由平台预先存储的对HTML信息源的添加、修改、删除标准来决定,这一点可以根据需要由本领域技术人员编程或通过其它方式实现;信息采集模块(212),从指定的HTML网站抓取信息,这种指定可以是由预先存储在信息入库、组织及发布平台上的一个标准来指定哪些网站上的信息是需要抓取的,可以由本领域技术人员根据需要实现;内容组织模块(213),分析新抓取到的网页信息中的标签,截取网页信息中有用的部分,并将这部分内容存入数据库,其中,所述的标签是指代表每个频道具有的特点的HTML标签;所述的有用的部分必须要包括信息的标题以及内容,而且要尽量少地抓取不必要的HTML标签。
动态页面内容发布模块(23)(本发明中的前台),向用户显示可供用户选择想观看的网页内容的界面,接收用户选择,从数据库(22)读取相应内容,将其适配成适合终端(3)显示的形式,通过动态页面经由电视机终端(3)的机顶盒显示(其中动态页面包括jsp、asp、asp.net、php等采用动态技术的页面)。
如图2所示,信息采集模块(212)又包括:从后台管理模块(211)获得要抓取的HTML网站信息的模块(2121),这些信息包括要采集的频道名称、频道的URL,其中所述的频道的URL是要采集的信息标题列表页面,所述获得要抓取的HTML网站信息的模块(2121)配置成周期采集信息;分析该页面中列出的信息标题,并找到信息内容的链接的模块(2122),最终存入数据库的是信息标题和对应的信息内容;判断要抓取的信息是否已抓取过,已抓取过的信息将不再让获得要抓取的HTML网站信息的模块(2121)去抓取的模块(2123),此部分是与从后台管理模块(211)获得要抓取的HTML网站信息的模块(2121)共同运行,一边抓取,一边判断抓取的内容是否已存在于数据库中。
如图3所示,动态页面内容发布模块(23)包括:提供包括所有可选频道的界面以便通过机顶盒在电视机终端(3)上显示的模块(231);根据用户选择,进入相应频道,并显示频道内容标题列表的模块(232),所述的内容标题要限定长度,适合页面显示;根据用户选择的标题,显示所选标题的具体内容页面的模块(233),所述的具体内容页面要去除数据库中存储内容中多余的html标签,并将内容格式大小调整至适合电视机显示(由于本发明将内容标题限定长度,适合页面显示,并去除数据库中存储内容中多余的html标签,将内容格式大小调整至适合电视机显示,解决了面向电视机显示的内容和web内容长期间得不到很好的适配的问题);响应于用户浏览完信息后的返回,返回标题列表页面以供用户选择其他信息或继续返回包括所有可选频道的界面以供用户选择其他频道的模块(234)。
本发明中的各模块,如模块211、212、213、23、2121、2122、2123、231、232、233、234,可由本领域技术人员根据上述功能通过编程或其它方式来实现。
综上所述,本发明提供了一种面向电视机显示的信息浏览业务提供方法,其可以概括成:向作为信息源的HTML信息网站(1)抓取信息并存储;将抓取的信息适配成适合终端(3)显示的形式,通过电视机终端(3)的机顶盒显示。
其中,所述向作为信息源的HTML信息网站(1)抓取信息并存储的步骤包括:管理要采集的HTML信息源,包括:添加、修改、删除要采集的HTML信息源(由后台管理模块执行);从指定的HTML网站抓取信息,包括:获得要抓取的HTML网站信息(该步骤相当于图4中的S1和S2,S1中读取后台管理模块配置,所谓后台管理模块配置即添加、修改、删除后的信息源,S2中抓取目标网站信息),这些信息包括要采集的频道名称、频道的URL,其中所述的频道的URL是要采集的信息标题列表页面,这种抓取是周期性的;分析该页面中列出的信息标题,并找到信息内容的链接;判断要抓取的信息是否已抓取过(即在图4中的S3中,判断网页是否存在于数据库中,如果存在于数据库中表示已抓取过,如果未存在于数据库中表示未抓取过),已抓取过的信息将不再抓取,如图4所示,回到“停止”,然后等待设定时间间隔后周期性地再进行抓取,如果在S3中判断未存储过,即未被抓取,如S4所示,准备将网页存储在本地;分析新抓取到的网页信息中的标签(如S5所示),截取网页信息中有用的部分,并将这部分内容存储到数据库(22)中(如S6所示)。
其中,所述将抓取的信息适配成适合终端(3)显示的形式,通过电视机终端(3)的机顶盒显示的步骤包括:提供包括所有可选频道的界面以便通过机顶盒在电视机终端(3)上显示;根据用户选择,进入相应频道,并显示频道内容标题列表,所述的内容标题要限定长度,适合页面显示;根据用户选择的标题,显示所选标题的具体内容页面,所述的具体内容页面要去除数据库中存储内容中多余的html标签,并将内容格式大小调整至适合电视机显示;响应于用户浏览完信息后的返回,返回标题列表页面以供用户选择其他信息或继续返回包括所有可选频道的界面以供用户选择其他频道。
由于本发明也同样适用于手机上网等支持WAP的信息类业务,因此本发明类似地对于这种业务提供了一种信息浏览业务提供***,包括:作为信息源的HTML信息网站(1);终端(3);耦合在HTML信息网站(1)和终端(3)之间的信息入库、组织及发布平台(2),其抓取各HTML信息网站(1)的内容并存储,适配成适合终端(3)显示的形式,向终端(3)显示。其道理与前面所述电视机的实施例基本上是一样的,本领域技术人员根据前面电视机的实施例完全可以实现,因此不再多加赘述。

Claims (7)

1.一种面向电视机显示的信息浏览业务提供***,包括:
作为信息源的HTML信息网站(1);
带有机顶盒的电视机终端(3);
耦合在HTML信息网站(1)和终端(3)之间的信息入库、组织及发布平台(2),在其中包括:数据库(22),存储所抓取到的HTML信息网站(1)的内容;
信息入库模块(21),耦合到数据库(22),抓取各HTML信息网站(1)的内容并将其存储在数据库(22)中;
动态页面内容发布模块(23),向用户显示可供用户选择想观看的网页内容的界面,接收用户选择,从数据库(22)读取相应内容,将其适配成适合终端(3)显示的形式,通过动态页面经由电视机终端(3)的机顶盒显示;
并且在所述信息入库模块(21)中包括:
后台管理模块(211),管理要采集的HTML信息源;
内容组织模块(213),分析新抓取到的网页信息中的标签,截取网页信息中有用的部分,并将这部分内容存入数据库;
信息采集模块(212),从指定的HTML网站抓取信息,其中包括:从后台管理模块(211)获得要抓取的HTML网站信息的模块(2121),这些信息包括要采集的频道名称、频道的URL,其中所述的频道的URL是要采集的信息标题列表页面,所述获得要抓取的HTML网站信息的模块(2121)配置成周期采集信息;分析该页面中列出的信息标题,并找到信息内容的链接的模块(2122),最终存入数据库的是信息标题和对应的信息内容;判断要抓取的信息是否已抓取过,已抓取过的信息将不再让获得要抓取的HTML网站信息的模块(2121)去抓取的模块(2123)。
2.根据权利要求1的***,其特征在于后台管理模块(211)是添加、修改、删除要采集的HTML信息源的后台管理模块。
3.根据权利要求1的***,其特征在于:内容组织模块(213)中,所述的标签是指代表每个频道具有的特点的HTML标签;所述的有用的部分必须要包括信息的标题以及内容,而且要尽量少地抓取不必要的HTML标签。
4.根据权利要求1的***,其特征在于动态页面内容发布模块(23)包括:
提供包括所有可选频道的界面以便通过机顶盒在电视机终端(3)上显示的模块(231);
根据用户选择,进入相应频道,并显示频道内容标题列表的模块(232),所述的内容标题要限定长度,适合页面显示;
根据用户选择的标题,显示所选标题的具体内容页面的模块(233),所述的具体内容页面要去除数据库中存储内容中多余的html标签,并将内容格式大小调整至适合电视机显示;
响应于用户浏览完信息后的返回,返回标题列表页面以供用户选择其他信息或继续返回包括所有可选频道的界面以供用户选择其他频道的模块(234)。
5.一种面向电视机显示的信息浏览业务提供方法,包括:
向作为信息源的HTML信息网站(1)抓取信息并存储;
将抓取的信息适配成适合终端(3)显示的形式,通过电视机终端(3)的机顶盒显示;
其中所述向作为信息源的HTML信息网站(1)抓取信息并存储的步骤包括:
管理要采集的HTML信息源,包括:添加、修改、删除要采集的HTML信息源;
从指定的HTML网站抓取信息,包括:获得要抓取的HTML网站信息,这些信息包括要采集的频道名称、频道的URL,其中所述的频道的URL是要采集的信息标题列表页面,这种抓取是周期性的;分析该页面中列出的信息标题,并找到信息内容的链接;判断要抓取的信息是否已抓取过,已抓取过的信息将不再抓取;
分析新抓取到的网页信息中的标签,截取网页信息中有用的部分,并将这部分内容存储。
6.根据权利要求5的方法,其特征在于所述将抓取的信息适配成适合终端(3)显示的形式,通过电视机终端(3)的机顶盒显示的步骤包括:
提供包括所有可选频道的界面以便通过机顶盒在电视机终端(3)上显示;
根据用户选择,进入相应频道,并显示频道内容标题列表,所述的内容标题要限定长度,适合页面显示;
根据用户选择的标题,显示所选标题的具体内容页面,所述的具体内容页面要去除数据库中存储内容中多余的html标签,并将内容格式大小调整至适合电视机显示;
响应于用户浏览完信息后的返回,返回标题列表页面以供用户选择其他信息或继续返回包括所有可选频道的界面以供用户选择其他频道。
7.一种信息浏览业务提供***,包括:
作为信息源的HTML信息网站(1);
终端(3);
耦合在HTML信息网站(1)和终端(3)之间的信息入库、组织及发布平台(2),在其中包括:数据库(22),存储所抓取到的HTML信息网站(1)的内容;
信息入库模块(21),耦合到数据库(22),抓取各HTML信息网站(1)的内容并将其存储在数据库(22)中;
动态页面内容发布模块(23),向用户显示可供用户选择想观看的网页内容的界面,接收用户选择,从数据库(22)读取相应内容,将其适配成适合终端(3)显示的形式,通过动态页面经由电视机终端(3)的机顶盒显示;
并且在所述信息入库模块(21)中包括:
后台管理模块(211),管理要采集的HTML信息源;
内容组织模块(213),分析新抓取到的网页信息中的标签,截取网页信息中有用的部分,并将这部分内容存入数据库;
信息采集模块(212),从指定的HTML网站抓取信息,其中包括:从后台管理模块(211)获得要抓取的HTML网站信息的模块(2121),这些信息包括要采集的频道名称、频道的URL,其中所述的频道的URL是要采集的信息标题列表页面,所述获得要抓取的HTML网站信息的模块(2121)配置成周期采集信息;分析该页面中列出的信息标题,并找到信息内容的链接的模块(2122),最终存入数据库的是信息标题和对应的信息内容;判断要抓取的信息是否已抓取过,已抓取过的信息将不再让获得要抓取的HTML网站信息的模块(2121)去抓取的模块(2123)。
CN2006101383726A 2006-11-09 2006-11-09 面向电视机显示的信息浏览业务提供***和方法 Active CN101179558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006101383726A CN101179558B (zh) 2006-11-09 2006-11-09 面向电视机显示的信息浏览业务提供***和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006101383726A CN101179558B (zh) 2006-11-09 2006-11-09 面向电视机显示的信息浏览业务提供***和方法

Publications (2)

Publication Number Publication Date
CN101179558A CN101179558A (zh) 2008-05-14
CN101179558B true CN101179558B (zh) 2010-11-10

Family

ID=39405644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101383726A Active CN101179558B (zh) 2006-11-09 2006-11-09 面向电视机显示的信息浏览业务提供***和方法

Country Status (1)

Country Link
CN (1) CN101179558B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101360117B (zh) * 2008-09-23 2011-10-12 中国联合网络通信集团有限公司 业务网关以及网络电视业务与互联网业务的切换***
CN101702763B (zh) * 2009-10-28 2012-12-12 深圳市龙视传媒有限公司 一种生成数字机顶盒单机网站的方法及***和设备
CN101853273A (zh) * 2010-04-30 2010-10-06 中山大学 一种实现网页浏览模式间的转换方法及网络设备
CN101867695A (zh) * 2010-05-21 2010-10-20 中山大学 一种基于浏览器的数字电视机顶盒
US20120084116A1 (en) * 2010-10-04 2012-04-05 Sailesh Kumar Sathish Method and apparatus for determining whether to allow creation of a content channel
CN102137306B (zh) * 2011-01-17 2013-11-13 深圳市龙视传媒有限公司 在电视上显示网页内容的方法及装置
CA2829484A1 (en) * 2011-03-08 2012-09-13 Tivo Inc. Multi source and destination media discovery and management platform
CN103020088A (zh) * 2011-09-27 2013-04-03 腾讯科技(深圳)有限公司 一种数据处理装置及方法
CN102546758B (zh) * 2011-12-13 2014-06-25 中国联合网络通信集团有限公司 内容发布方法、***及平台
CN103092999B (zh) * 2013-02-22 2016-06-29 人民搜索网络股份公司 一种网页抓取周期调整方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1338688A (zh) * 2000-08-16 2002-03-06 北京华诺信息技术有限公司 浏览器及利用该浏览器显示图像的方法
CN1509017A (zh) * 2002-12-13 2004-06-30 陈晓月 一种分类自动搜索互联网信息并广播到数字电视的***
KR20050012881A (ko) * 2005-01-13 2005-02-02 (주)씽크비즈 웹 브라우저 기반 알에스에스/에이티오엠 규격 문서실시간 구독 시스템 및 그 방법
CN1585479A (zh) * 1998-05-19 2005-02-23 联合视频制品公司 具有点播电视浏览功能的节目向导***
CN1677390A (zh) * 2005-02-02 2005-10-05 广州网上新生活软件技术服务有限公司 一种嵌入式***多种字体及大小和样式的显示***和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1585479A (zh) * 1998-05-19 2005-02-23 联合视频制品公司 具有点播电视浏览功能的节目向导***
CN1338688A (zh) * 2000-08-16 2002-03-06 北京华诺信息技术有限公司 浏览器及利用该浏览器显示图像的方法
CN1509017A (zh) * 2002-12-13 2004-06-30 陈晓月 一种分类自动搜索互联网信息并广播到数字电视的***
KR20050012881A (ko) * 2005-01-13 2005-02-02 (주)씽크비즈 웹 브라우저 기반 알에스에스/에이티오엠 규격 문서실시간 구독 시스템 및 그 방법
CN1677390A (zh) * 2005-02-02 2005-10-05 广州网上新生活软件技术服务有限公司 一种嵌入式***多种字体及大小和样式的显示***和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
全文.

Also Published As

Publication number Publication date
CN101179558A (zh) 2008-05-14

Similar Documents

Publication Publication Date Title
CN101179558B (zh) 面向电视机显示的信息浏览业务提供***和方法
CN103379362B (zh) 视频点播方法和***
CN101345852B (zh) 一种在线视频片段选播方法和***
CA2686601C (en) Providing personalized resources on-demand over a broadband network to consumer device applications
US9792353B2 (en) Method and system for providing sponsored information on electronic devices
US8321401B2 (en) User interface with available multimedia content from multiple multimedia websites
CN104217024B (zh) 网页数据处理方法和装置
AU2010203605B2 (en) Singular, collective and automated creation of a media guide for online content
CN1692354B (zh) 信息管理***、信息处理设备以及信息处理方法
CN101639841B (zh) 一种提供多媒体数据搜索和查询服务的方法及***
CN101390394B (zh) 节目广播***以及节目内容传送***
US20090228921A1 (en) Content Matching Information Presentation Device and Presentation Method Thereof
CN101217640B (zh) 一种p2p视频点播中实现节目收藏的方法和设备
CN103577392B (zh) 基于当前浏览页面的关键词推送方法及装置
CN100589552C (zh) 网络电视***中发送多媒体消息的***和方法
JP2001515246A (ja) 自動化コンテンツのスケジューリング装置と表示装置
CN103686375A (zh) 视频分享方法及装置
CN102769782B (zh) 数字电视收视率回传方法
CN101656688B (zh) 一种即时消息的展示方法、***和装置
CN102215434A (zh) 一种可自动适应多种屏幕显示的电子节目导航***
CN104615770A (zh) 一种移动终端收藏夹数据的推荐方法及装置
CN102263991A (zh) 基于网络电视浏览电子相册的方法及装置
CN103020126B (zh) 网络内容的访问控制方法和装置
JP2013541883A (ja) メディア・プログラム・メタデータのコールバック補足のための方法およびシステム
KR20040077914A (ko) 네트웍 자원의 효율적 사용 및 텔레비전 방송 정보 제공을위한 시스템 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant