CN104077323A - 一种网页内容转换彩信的方法和装置 - Google Patents
一种网页内容转换彩信的方法和装置 Download PDFInfo
- Publication number
- CN104077323A CN104077323A CN201310108973.2A CN201310108973A CN104077323A CN 104077323 A CN104077323 A CN 104077323A CN 201310108973 A CN201310108973 A CN 201310108973A CN 104077323 A CN104077323 A CN 104077323A
- Authority
- CN
- China
- Prior art keywords
- web page
- page contents
- multimedia message
- picture
- multimedia
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/986—Document structures and storage, e.g. HTML extensions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种网页内容转换彩信的方法及装置,其中,该装置包括:分析提取模块,用于对网页内容进行语义分析,根据语义分析结果提取网页内容;内容填入模块,用于对网页内容中的多媒体内容进行处理,将网页内容填入彩信模板的相应格式中;***生成模块,用于将已填入彩信模板的相应格式中的网页内容***彩信帧,生成彩信。本发明网页内容转换彩信的方法和装置,通过源代码语义分析,对所浏览的网页内容进行抽取、图片压缩和版式定制等,按照彩信格式协议生成彩信后,通过发送彩信,将网页内容发到好友的手机上,完成与好友的网页内容分享。
Description
技术领域
本发明涉及通信领域中互联网技术领域,具体地,涉及的方法及装置。
背景技术
互联网已成为人们获取信息的主要来源之一,海量的信息主要通过网页形式来呈现。
目前,网页内容分享方式主要有两大类:1)基于业务登陆账号的分享:通过微博、即时消息软件(飞信、MSN)等各种账号,将内容(或者内容摘要、网络链接)发布到自己的网络空间(网站)与好友分享,好友可以通过访问相关网页地址来查看分享的内容。2)通过短信方式分享内容:将网页内容标题、内容简短摘要或网页链接,通过短信方式,发给好友,好友可以通过点击链接来查看网页内容。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
对于第一类方案,即通过微博、即时消息软件(飞信、MSN)等各种账号,将内容(或者内容摘要、网络链接)发布到自己的网络空间(网站)与好友分享,好友可以通过访问相关网页地址来查看分享的内容。需要启动相关软件或者登陆特定网站才能查看到分享的内容。
对于第二类方案,通过短信方式分享内容:将网页内容标题、内容简短摘要或网页链接,通过短信方式,发给好友,好友可以通过点击链接来查看网页内容。由于短信字数(140个字符,70个汉字)限制、以及只能承载文本信息,而不能承载图片,因此,一般只能分享标题、内容简略介绍及网页链接,而无法承载完成的网页内容。
彩信能力是移动终端的基础能力,能承载多媒体内容(文本、图片、音频等),接收免费等特点,使得如果能通过彩信方式分享网页内容,用户将可以随时随地收到并查看网页全文内容,给用户带来更加便捷的体验。
如果将原文的内容通过彩信的方式到达用户的手机客户端,则可弥补以上的不足,毕竟彩信承载的信息量多而全面,同时也可以让用户可以随时随地的接收与查看分享的信息,让信息的分享更为便利与快捷。
发明内容
本发明是为了克服现有技术中网页内容与他人分享不方便的缺陷,根据本发明的一个方面,提出一种网页内容转换彩信的方法。
根据本发明实施例的网页内容转换彩信的方法,包括:
对网页内容进行语义分析,根据语义分析结果提取网页内容;
经过对网页内容中的多媒体内容进行处理后,将网页内容填入彩信模板的相应格式中;
将已填入彩信模板的相应格式中的网页内容***彩信帧,生成彩信。
本发明是为了克服现有技术中网页内容与他人分享不方便的缺陷,根据本发明的另一个方面,提出一种网页内容转换彩信的装置。
根据本发明实施例的网页内容转换彩信的装置,包括:
分析提取模块,用于对网页内容进行语义分析,根据语义分析结果提取网页内容;
内容填入模块,用于对网页内容中的多媒体内容进行处理,将网页内容填入彩信模板的相应格式中;
***生成模块,用于将已填入彩信模板的相应格式中的所述网页内容***彩信帧,生成彩信。
本发明网页内容转换彩信的方法和装置,通过源代码语义分析,对所浏览的网页内容进行抽取、图片压缩和版式定制等,按照彩信格式协议生成彩信后,通过发送彩信,将网页内容发到好友的手机上,完成与好友的网页内容分享。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为现有技术中彩信结构示意图;
图2为本发明网页内容转换彩信的装置结构示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
网页内容一般采用HTML脚本语言开发,网页内容的发布一般基于一定的网页模板,该网页模板对网页的标题、作者、发文时间、插图、主要内容等采用一定的标签来标识,可以分析源代码的标签语义来进行内容抽取,再根据抽取的内容来生成彩信。
本发明的网页内容转换彩信的方法包括:
步骤102:新建彩信包,对网页内容进行提取;
一般门户网站都有自己的网页模板,分析网站的网页内容的源代码标签,根据源代码标签的语义提取网页内容进行说明:
步骤1022:提取标题信息;
新闻标题:id=“artibodyTitle”,在该关键字第一个“>”之后,“<”之前内容为标题信息。
新闻出处:id=“art_source”,
新闻发布时间:id=“pub_date”,
新闻作者:id=“media_name”,
正文部分:id=“artibody”;
步骤1024:提取图片;
关键字:img_wrapper,关键字之后的src=“…”为图片地址,title=“…”为图片标题,class=“img_descr”>之后、“<”之前的内容为图片的描述,根据图片地址提取图片;
步骤1026:提取视频/音频;
关键字:flash player begin,关键字之后的href=“…”中如果带有“video.sina.com.cn”字符串,则该地址为视频/音频地址,之后的“视频/音频:…”为视频/标题,“来源:…”为视频/音频内容来源。
步骤1028:提取正文:
<p>与</p>之间的内容为正文内容,其中一组<p></p>代表一个段落。
步骤104:对网页内容中的多媒体内容进行处理,包括:
步骤1042:图片处理;
a、修改图片分辨率,例如图片宽度改为320像素,高度等比缩放;
b、压缩图片大小,例如将图片大小压缩到30k以下;
步骤1044:音频处理;
a.音频格式转换:例如可将音频转换成amr等彩信支持的格式;
b.压缩音频大小:将音频大小压缩到30k以下;
如果音频文件太大,例如大于3MB,记录音频文件的链接地址、标题信息和描述信息,将链接地址、标题信息和描述信息作为彩信正文内容处理。
步骤1046:视频处理;
记录视频文件的链接地址、标题信息和描述信息,将链接地址、标题信息和描述信息作为彩信正文内容处理。
步骤106:将网页内容填入彩信模板的相应格式中;
如图1所示,现有的彩信结构包括彩信头(MMS headers)和彩信体(MMSbody)两大部分,其最大特点在于支持多媒体功能,能够传递功能全面的内容和信息,包括文字、图像、声音和数据等各种格式的信息。
在步骤106中,将步骤102中提取的标题、图片、音频、视频和正文等信息分别填入相应格式中。
步骤108:将已填入彩信模板的相应格式中的网页内容***彩信帧,生成彩信向用户下发。
如果是正文内容,***彩信中文字帧,如果是插图,***彩信图片帧,如果是音频,***彩信音频帧,如果是视频,***彩信视频帧。
彩信大小一般要求在300KB以内,超过300KB,可拆分成若干条彩信,标题等基本信息不变。
本发明网页内容转换彩信的方法,通过源代码语义分析,对所浏览的网页内容进行抽取、图片压缩和版式定制等,按照彩信格式协议生成彩信后,通过发送彩信,将网页内容发到好友的手机上,完成与好友的网页内容分享。
如图2所示,本发明公开了一种网页内容转换彩信的装置,包括:
分析提取模块10,用于对网页内容进行语义分析,根据语义分析结果提取网页内容;
内容填入模块20,用于对网页内容中的多媒体内容进行处理,将网页内容填入彩信模板的相应格式中;
***生成模块30,用于将已填入彩信模板的相应格式中的网页内容***彩信帧,生成彩信。
其中:分析提取模块10包括:
标签分析子模块11,用于分析网页内容的源代码标签;
内容提取子模块12,用于根据标签的语义提取网页内容。
其中:内容填入模块20包括:
图片处理子模块21,用于修改图片分辨率和压缩图片大小;
音频处理子模块22,用于转换音频格式和压缩音频大小;
视频处理子模块23,用于记录视频的链接地址、标题信息和描述信息,将链接地址、标题信息和描述信息作为彩信正文内容处理。
其中:
音频处理子模块22,具体用于如果音频文件大小大于设定数值,记录音频文件的链接地址、标题信息和描述信息,将所述链接地址、标题信息和描述信息作为彩信正文内容处理。
其中:
内容提取子模块12,具体用于根据新闻标题、新闻出处、新闻发布时间和新闻作者提取标题信息;
内容提取子模块12,具体用于根据关键字、图片地址、图片标题和图片描述信息提取图片。
本发明网页内容转换彩信的装置,通过源代码语义分析,对所浏览的网页内容进行抽取、图片压缩和版式定制等,按照彩信格式协议生成彩信后,通过发送彩信,将网页内容发到好友的手机上,完成与好友的网页内容分享。
本发明能有多种不同形式的具体实施方式,上面以图1-图2为例结合附图对本发明的技术方案作举例说明,这并不意味着本发明所应用的具体实例只能局限在特定的流程或实施例结构中,本领域的普通技术人员应当了解,上文所提供的具体实施方案只是多种优选用法中的一些示例,任何体现本发明权利要求的实施方式均应在本发明技术方案所要求保护的范围之内。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种网页内容转换彩信的方法,其特征在于,包括:
对网页内容进行语义分析,根据所述语义分析结果提取网页内容;
经过对所述网页内容中的多媒体内容进行处理后,将所述网页内容填入彩信模板的相应格式中;
将已填入彩信模板的相应格式中的所述网页内容***彩信帧,生成彩信。
2.根据权利要求1所述的方法,其特征在于,所述对网页内容进行语义分析,根据所述语义分析结果提取网页内容的步骤包括:
分析所述网页内容的源代码标签,根据所述标签的语义提取网页内容;
所述网页内容包括:标题信息、图片信息、音视频信息和正文信息。
3.根据权利要求1或2所述的方法,其特征在于,所述多媒体内容的处理步骤包括:图片处理、音频处理和视频处理;
所述图片处理包括:修改图片分辨率和压缩图片大小;
所述音频处理包括:转换音频格式和压缩音频大小;
所述视频处理包括:记录视频的链接地址、标题信息和描述信息,将所述链接地址、标题信息和描述信息作为彩信正文内容处理。
4.根据权利要求3所述的方法,其特征在于,如果所述音频文件大小大于设定数值,记录音频文件的链接地址、标题信息和描述信息,将所述链接地址、标题信息和描述信息作为彩信正文内容处理。
5.根据权利要求2所述的方法,其特征在于,所述标题信息提取的步骤包括:根据新闻标题、新闻出处、新闻发布时间和新闻作者提取标题信息;
所述图片提取的步骤包括:根据关键字、图片地址、图片标题和图片描述信息提取图片。
6.一种网页内容转换彩信的装置,其特征在于,包括:
分析提取模块,用于对网页内容进行语义分析,根据所述语义分析结果提取网页内容;
内容填入模块,用于对所述网页内容中的多媒体内容进行处理,将所述网页内容填入彩信模板的相应格式中;
***生成模块,用于将已填入彩信模板的相应格式中的所述网页内容***彩信帧,生成彩信。
7.根据权利要求6所述的装置,其特征在于,所述分析提取模块包括:
标签分析子模块,用于分析所述网页内容的源代码标签;
内容提取子模块,用于根据所述标签的语义提取网页内容。
8.根据权利要求6或7所述的装置,其特征在于,所述内容填入模块包括:
图片处理子模块,用于修改图片分辨率和压缩图片大小;
音频处理子模块,用于转换音频格式和压缩音频大小;
视频处理子模块,用于记录视频的链接地址、标题信息和描述信息,将所述链接地址、标题信息和描述信息作为彩信正文内容处理。
9.根据权利要求8所述的装置,其特征在于,
所述音频处理子模块,具体用于如果所述音频文件大小大于设定数值,记录音频文件的链接地址、标题信息和描述信息,将所述链接地址、标题信息和描述信息作为彩信正文内容处理。
10.根据权利要求7所述的装置,其特征在于,
所述内容提取子模块,具体用于根据新闻标题、新闻出处、新闻发布时间和新闻作者提取标题信息;
所述内容提取子模块,具体用于根据关键字、图片地址、图片标题和图片描述信息提取图片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310108973.2A CN104077323A (zh) | 2013-03-29 | 2013-03-29 | 一种网页内容转换彩信的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310108973.2A CN104077323A (zh) | 2013-03-29 | 2013-03-29 | 一种网页内容转换彩信的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104077323A true CN104077323A (zh) | 2014-10-01 |
Family
ID=51598582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310108973.2A Pending CN104077323A (zh) | 2013-03-29 | 2013-03-29 | 一种网页内容转换彩信的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104077323A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850588A (zh) * | 2015-04-24 | 2015-08-19 | 深圳市梦网科技股份有限公司 | 媒体内容生成发布方法及*** |
CN106533926A (zh) * | 2016-12-27 | 2017-03-22 | 武汉斗鱼网络科技有限公司 | 一种网页信息传播方法以及装置 |
CN106815316A (zh) * | 2016-12-23 | 2017-06-09 | 北京奇虎科技有限公司 | 页面内容分享的方法、装置及移动终端 |
CN107562799A (zh) * | 2017-08-04 | 2018-01-09 | 海南智媒云图科技股份有限公司 | 一种内容转载分享的方法及装置 |
CN109408757A (zh) * | 2018-09-21 | 2019-03-01 | 广州神马移动信息科技有限公司 | 问答内容分享方法、装置、终端设备及计算机存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090037845A1 (en) * | 2007-08-03 | 2009-02-05 | Tzu-Han Kao | Method and System for Editing Web Data |
CN101552829A (zh) * | 2008-03-31 | 2009-10-07 | 比亚迪股份有限公司 | 一种彩信的编辑方法、***及信息终端 |
CN101945346A (zh) * | 2009-07-06 | 2011-01-12 | 北京亿阳信通软件研究院有限公司 | 彩信的自动生成方法和装置 |
CN102682105A (zh) * | 2012-05-04 | 2012-09-19 | 高凌 | 利用移动终端识别并获取相关网页信息的***及方法 |
-
2013
- 2013-03-29 CN CN201310108973.2A patent/CN104077323A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090037845A1 (en) * | 2007-08-03 | 2009-02-05 | Tzu-Han Kao | Method and System for Editing Web Data |
CN101552829A (zh) * | 2008-03-31 | 2009-10-07 | 比亚迪股份有限公司 | 一种彩信的编辑方法、***及信息终端 |
CN101945346A (zh) * | 2009-07-06 | 2011-01-12 | 北京亿阳信通软件研究院有限公司 | 彩信的自动生成方法和装置 |
CN102682105A (zh) * | 2012-05-04 | 2012-09-19 | 高凌 | 利用移动终端识别并获取相关网页信息的***及方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850588A (zh) * | 2015-04-24 | 2015-08-19 | 深圳市梦网科技股份有限公司 | 媒体内容生成发布方法及*** |
CN106815316A (zh) * | 2016-12-23 | 2017-06-09 | 北京奇虎科技有限公司 | 页面内容分享的方法、装置及移动终端 |
CN106533926A (zh) * | 2016-12-27 | 2017-03-22 | 武汉斗鱼网络科技有限公司 | 一种网页信息传播方法以及装置 |
CN107562799A (zh) * | 2017-08-04 | 2018-01-09 | 海南智媒云图科技股份有限公司 | 一种内容转载分享的方法及装置 |
CN109408757A (zh) * | 2018-09-21 | 2019-03-01 | 广州神马移动信息科技有限公司 | 问答内容分享方法、装置、终端设备及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220171915A1 (en) | Automated augmentation of text, web and physical environments using multimedia content | |
KR100490734B1 (ko) | 주석기반 문서 자동 생성장치 및 방법 | |
CN102254550B (zh) | 网页文字朗读方法和*** | |
CN104281827B (zh) | 识别二维码的方法及装置 | |
TWI519979B (zh) | 訊息推薦方法及其裝置與訊息資源推薦系統 | |
CN106897251B (zh) | 富文本展示方法及装置 | |
US20050262049A1 (en) | System, method, device, and computer code product for implementing an XML template | |
TWI592807B (zh) | Method and device for web style address merge | |
CN104077323A (zh) | 一种网页内容转换彩信的方法和装置 | |
CN104516892A (zh) | 关联富媒体信息的用户生成内容的发布方法、***和终端 | |
JP2014514629A (ja) | 一種のウェブページ再組版の方法 | |
JP2009064442A (ja) | モバイルウェブサービスシステムおよび方法 | |
CN102779167A (zh) | 在移动终端中显示网页的方法及*** | |
CN106547511A (zh) | 一种语音播读网页信息的方法、浏览器客户端及服务器 | |
CN112765516A (zh) | 页面内容的展示方法和装置、存储介质、电子装置 | |
CN105094775A (zh) | 网页生成方法和装置 | |
JP2019505911A (ja) | 世論に対するpr活動の実施方法、システム、ユーザ端末及びコンピュータ読取り可能な記憶媒体 | |
CN111625308B (zh) | 一种信息展示方法、装置和电子设备 | |
CN111859210B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN101620621A (zh) | 一种网页切分方法及*** | |
CN104426863B (zh) | 一种页面请求方法、页面请求装置、中转服务器及终端 | |
CN102693237B (zh) | 一种网页内容适配封装***及方法 | |
CN113127776A (zh) | 面包屑路径生成方法、装置及终端设备 | |
JP2007219763A (ja) | 日記サーバ、および日記システム | |
CN103701910B (zh) | 支持内容中心网络的资源请求处理方法及Web浏览器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20141001 |
|
RJ01 | Rejection of invention patent application after publication |