CN102156742A - 支持手机使用自带浏览器展示结构化文档的方法及中间件 - Google Patents

支持手机使用自带浏览器展示结构化文档的方法及中间件 Download PDF

Info

Publication number
CN102156742A
CN102156742A CN 201110097346 CN201110097346A CN102156742A CN 102156742 A CN102156742 A CN 102156742A CN 201110097346 CN201110097346 CN 201110097346 CN 201110097346 A CN201110097346 A CN 201110097346A CN 102156742 A CN102156742 A CN 102156742A
Authority
CN
China
Prior art keywords
file
document
mobile phone
html
browser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110097346
Other languages
English (en)
Inventor
孟剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING DIGITAL CHINA SI-TECH INFORMATION TECHNOLOGY Co Ltd
Beijing Si Tech Information Technology Co Ltd
Original Assignee
BEIJING DIGITAL CHINA SI-TECH INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING DIGITAL CHINA SI-TECH INFORMATION TECHNOLOGY Co Ltd filed Critical BEIJING DIGITAL CHINA SI-TECH INFORMATION TECHNOLOGY Co Ltd
Priority to CN 201110097346 priority Critical patent/CN102156742A/zh
Publication of CN102156742A publication Critical patent/CN102156742A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及一种支持手机使用自带浏览器展示结构化文档的中间件,它包括中间件,所述中间件包括获取文档文件的文件流的接收信息模块、将读入的文件流解析成XML格式的第一解析模块、将该XML格式的文件转换成HTML格式文件的第一转换模块、将HTML文件进行DOM结构解析的第二解析模块和将HTML文件转换成XHTML或WML的WAP网页格式的第二转换模块。本发明还涉及一种支持手机使用自带浏览器展示结构化文档的方法。本发明的有益效果是:手机可直接打开查看office2000-2007版本中doc,xls,ppt,以及AdobPDF,压缩格式的ZIP,文本TXT等类型文件,无需安装其他文档软件或下载文档。

Description

支持手机使用自带浏览器展示结构化文档的方法及中间件
技术领域
本发明涉及一种支持手机使用自带浏览器展示结构化文档的方法及中间件。
背景技术
通常手机如果需要对网络***中Microsoft office类文档,Adobe PDF格式文档,txt文档(文本文档),及zip压缩格式文件等的查看就必须安装相应的文档编辑软件才可以,而安装软件的形式用户不仅用起来麻烦,而且软件的安装对于手机终端的性能要求也比较高,打开稍大一些的文档就会因耗费资源较多而造成手机死机,用户体验极差。
XML(Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)。
HTML(Hyper Text Mark-up Language)即超文本标记语言或超文本链接标示语言,是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言。
DOM= Document Object Model,文档对象模型,DOM可以以一种独立于平台和语言的方式访问和修改一个文档的内容和结构。换句话说,这是表示和处理一个HTML或XML文档的常用方法。
XHTML可扩展超文本置标语言(eXtensible HyperText Markup Language),是一种置标语言,表现方式与超文本置标语言(HTML)类似,不过语法上更加严格。
WML(无线标记语言,Wireless Markup Language)是一种脚本语言, 它比HTML 编写的内容要消耗网络浏览器更少的内存和CPU时间, 使得WML对广域网和移动设备来说更加友好。
WAP(Wireless Application Protocol)为无线应用协议,是一项全球性的网络通信协议。
Office(全称:Microsoft Office),是一套由微软公司开发的办公软件,它为Microsoft Windows和Apple Macintosh操作***而开发。
PDF是Portable Document Format(便携文件格式)的缩写,是一种电子文件格式,与操作***平台无关,由Adobee 公司开发而成。
发明内容
为解决上述问题本发明提供一种支持手机使用自带浏览器展示结构化文档的方法及中间件。
本发明解决上述技术问题的技术方案如下:一种支持手机使用自带浏览器展示结构化文档的***,它包括中间件,所述中间件包括获取文档文件的文件流的接收信息模块、将读入的文件流解析成XML格式的第一解析模块、将该XML格式的文件转换成HTML格式文件的第一转换模块、将HTML文件进行DOM结构解析的第二解析模块和将HTML文件转换成XHTML或WML的WAP网页格式的第二转换模块。
一种支持手机使用自带浏览器展示结构化文档的方法,它包括以下步骤:
步骤1:移动信息转换中间件(中间件是一种独立的***软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源)获取文档文件的文件流;
步骤2:将读入的文件流解析成XML格式;
步骤3:将该XML格式的文件转换成HTML格式文件;
步骤4:将HTML文件进行DOM结构解析;
步骤5:将HTML文件转换成XHTML或WML的WAP网页格式。
进一步的,所述步骤1中获取文件流的过程为:
步骤1.1:接收用户的请求,并获取用户所要打开的文件的参数;
步骤1.2:判断设定的类型库中的参数是否与步骤1.1中的参数相对应,如对应则判断文件的类型并保存,如不对应则继续下一步骤;
步骤1.3:判断用户所要打开的文件是否为压缩文件,如果是则取得压缩文件的列表并返回步骤1.1,如果不是,则继续下一步骤;
步骤1.4:判断文件的类型是否为可以解析的文件类型,如果是则判断其类型并保存,如果不是则设置为默认的文件类型并保存。
进一步的,所述步骤2为通过开源工程POI(Point of Interest,将文件解析成XML的一个程序库)将读入的文件流解析成XML格式。
进一步的,所述步骤3为按照XML格式的文件与HTML格式的文件映射关系将该XML格式的文件转换成HTML格式文件。
进一步的,所述步骤5为按照设定的HTML与XHTML或WML的映射关系,将HTML文件转换成XHTML或WML等WAP网页格式文件。
进一步的,所述步骤4为:中间件将HTML文件进行DOM结构解析,对文件中不规范的格式进行校正。
本发明的有益效果是:手机可直接打开查看office2000-2007版本中doc,xls (XLS 就是 Microsoft Excel 工作表,是一种非常常用的电子表格格式),ppt(PPT,一种演示文稿图形程序,是Power Point简称),以及Adobe PDF,压缩格式的ZIP,文本TXT等类型文件,无需安装其他文档软件或下载文档。
附图说明
图1为本发明中间件的结构示意图;
图2为本发明支持手机使用自带浏览器展示结构化文档的方法的流程图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种支持手机使用自带浏览器展示结构化文档的***,它包括用于移动信息转换的中间件,所述中间件包括获取文档文件的文件流的接收信息模块、将读入的文件流解析成XML格式的第一解析模块、将该XML格式的文件转换成HTML格式文件的第一转换模块、将HTML文件进行DOM结构解析的第二解析模块和将HTML文件转换成XHTML或WML的WAP网页格式的第二转换模块。
如图2所示,一种支持手机使用自带浏览器展示结构化文档的方法,它包括以下步骤:
步骤1:中间件(中间件是一种独立的***软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源)获取文档文件的文件流;
步骤2:通过开源工程POI (Point of Interest,将文件解析成XML的一个程序库),中间件先将读入的文件流解析成XML格式;
步骤3:中间件将该XML格式的文件转换成HTML格式文件;
步骤4:中间件将HTML文件进行DOM结构解析;
步骤5:中间件将HTML文件转换成XHTML或WML的WAP网页格式。
所述步骤1中获取文件流的过程为:
步骤1.1:中间件接收用户的请求并获取用户所要打开的文件的参数;
步骤1.2:判断中间件的类型库中的参数是否与步骤1.1中的参数相对应,如对应则判断文件的类型并保存,如不对应则继续下一步骤;
步骤1.3:判断用户所要打开的文件是否为压缩文件,如果是则取得压缩文件的列表并返回步骤1.1,如果不是,则继续下一步骤;
步骤1.4:判断文件的类型是否为可以解析的文件类型,如果是则判断其类型并保存,如果不是则设置为默认的文件类型并保存。
所述步骤3为中间件通过XML格式的文件与HTML格式的文件映射关系将该XML格式的文件转换成HTML格式文件。
所述步骤5为中间件按照设定的HTML与XHTML或WML的映射关系,将HTML文件转换成XHTML或WML等WAP网页格式文件。
所述步骤4为:中间件将HTML文件进行DOM结构解析,对文件中不规范的格式进行校正,即将图片的格式转化为手机可以浏览的大小,将文件的排版改变为手机可以浏览的格式等。如:XHTML规范定义的成对标签<table>未写</table>时,可以校正自动添加</table>。
通过我们的移动信息转换中间件平台(MITM),可以直接将Microsoft office的word、excle等文档,Adobe PDF格式文档txt文档,及zip压缩格式文件等结构化文档直接转换成手机终端浏览器直接支持的XHTML或WML格式的文本网页形式,格式转换全在服务器端进行,手机终端只需自带浏览器即可在线阅读转换后的文档,而无需安装其他任何文档软件
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种支持手机使用自带浏览器展示结构化文档的方法,其特征在于,它包括以下步骤:
步骤1:获取文档文件的文件流;
步骤2:将读入的文件流解析成XML格式;
步骤3:将该XML格式的文件转换成HTML格式文件;
步骤4:将HTML文件进行DOM结构解析; 
步骤5:将HTML文件转换成XHTML或WML的WAP网页格式。
2.根据权利要求1所述的支持手机使用自带浏览器展示结构化文档的方法,其特征在于, 所述步骤1中获取文件流的过程为:
步骤1.1:接收用户的请求,并获取用户所要打开的文件的参数;
步骤1.2:判断设定的类型库中的参数是否与步骤1.1中的参数相对应,如对应,则判断文件的类型并保存,如不对应则继续下一步骤;
步骤1.3:判断用户所要打开的文件是否为压缩文件,如果是则取得压缩文件的列表并返回步骤1.1,如果不是,则继续下一步骤;
步骤1.4:判断文件的类型是否为可以解析的文件类型,如果是则判断其类型并保存,如果不是则设置为默认的文件类型并保存。
3.根据权利要求1所述的支持手机使用自带浏览器展示结构化文档的方法,其特征在于,所述步骤2为中间件通过开源工程POI将读入的文件流解析成XML格式。
4.根据权利要求1所述的支持手机使用自带浏览器展示结构化文档的方法,其特征在于,所述步骤3为将该XML格式的文件按照XML格式的文件与HTML格式的文件的映射关系转换成HTML格式文件。
5.根据权利要求1所述的支持手机使用自带浏览器展示结构化文档的方法,其特征在于,所述步骤5为中间件按照设定的HTML与XHTML或WML的映射关系,将HTML文件转换成XHTML或WML等WAP网页格式文件。
6.根据权利要求1所述的支持手机使用自带浏览器展示结构化文档的方法,其特征在于,所述步骤4为:中间件将HTML文件进行DOM结构解析,对文件中不规范的格式进行校正。
7.一种支持手机使用自带浏览器展示结构化文档的中间件,其特征在于,它包括获取文档文件的文件流的接收信息模块、将读入的文件流解析成XML格式的第一解析模块、将该XML格式的文件转换成HTML格式文件的第一转换模块、将HTML文件进行DOM结构解析的第二解析模块和将HTML文件转换成XHTML或WML的WAP网页格式的第二转换模块。
CN 201110097346 2011-04-19 2011-04-19 支持手机使用自带浏览器展示结构化文档的方法及中间件 Pending CN102156742A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110097346 CN102156742A (zh) 2011-04-19 2011-04-19 支持手机使用自带浏览器展示结构化文档的方法及中间件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110097346 CN102156742A (zh) 2011-04-19 2011-04-19 支持手机使用自带浏览器展示结构化文档的方法及中间件

Publications (1)

Publication Number Publication Date
CN102156742A true CN102156742A (zh) 2011-08-17

Family

ID=44438241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110097346 Pending CN102156742A (zh) 2011-04-19 2011-04-19 支持手机使用自带浏览器展示结构化文档的方法及中间件

Country Status (1)

Country Link
CN (1) CN102156742A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662984A (zh) * 2012-03-14 2012-09-12 南京新与力文化传播有限公司 基于html的多平台消息处理方法
CN102662985A (zh) * 2012-03-14 2012-09-12 南京新与力文化传播有限公司 一种在远程服务器上预览office文件的方法
CN102750372A (zh) * 2012-06-15 2012-10-24 翁时锋 自动获取网页结构化信息的分析方法
CN103166981A (zh) * 2011-12-08 2013-06-19 腾讯科技(深圳)有限公司 一种无线网页转码方法及装置
CN103389969A (zh) * 2012-05-07 2013-11-13 腾讯科技(深圳)有限公司 一种用于移动终端预览pdf文件的方法、装置和***
CN103631935A (zh) * 2013-12-05 2014-03-12 用友软件股份有限公司 移动端图文混排展示装置和移动端图文混排展示方法
CN103729338A (zh) * 2013-12-29 2014-04-16 国云科技股份有限公司 一种文件在线预览方法
CN103838797A (zh) * 2012-11-27 2014-06-04 大连灵动科技发展有限公司 一种移动搜索引擎优化方法
CN105630753A (zh) * 2015-12-28 2016-06-01 中广核核电运营有限公司 一种核电站数字化规程的升级转换方法及***
CN106250358A (zh) * 2016-08-25 2016-12-21 曾美枝 电子阅读方法和装置
CN106371844A (zh) * 2016-08-31 2017-02-01 北京奇艺世纪科技有限公司 一种用原生用户界面组件展示网页的方法及***
CN106909533A (zh) * 2016-11-14 2017-06-30 上海仪电鑫森科技发展有限公司 适用于多平台的考试编辑***
CN106991083A (zh) * 2017-03-20 2017-07-28 珠海格力电器股份有限公司 一种电子文档处理的方法及装置
CN107357769A (zh) * 2016-05-10 2017-11-17 北京慧点科技有限公司 基于移动终端的电子阅读方法和***
CN107943915A (zh) * 2017-11-20 2018-04-20 福建亿榕信息技术有限公司 基于html5的ofd文件在线显示的方法以及装置
CN109002335A (zh) * 2017-06-06 2018-12-14 北京京东尚科信息技术有限公司 页面文件播放方法和装置
CN109801192A (zh) * 2018-12-15 2019-05-24 深圳壹账通智能科技有限公司 电子合同签订方法、装置、计算机设备及存储介质
CN111324841A (zh) * 2018-12-14 2020-06-23 英业达科技有限公司 试题文件的格式转换***及其方法
CN112257387A (zh) * 2020-10-27 2021-01-22 合肥青谷信息科技有限公司 一种文档转换方法
CN112632165A (zh) * 2020-12-22 2021-04-09 平安普惠企业管理有限公司 页面表格导出excel方法、装置、计算机设备及存储介质
CN112861482A (zh) * 2021-02-07 2021-05-28 吉林省科学技术信息研究所 文件在线编辑方法
CN113011140A (zh) * 2021-02-10 2021-06-22 北京字跳网络技术有限公司 视图展示方法、装置和电子设备
CN113569535A (zh) * 2021-07-23 2021-10-29 上海微盟企业发展有限公司 一种基于nodejs应用的文件转换解析方法、***
CN113934955A (zh) * 2021-10-25 2022-01-14 稿定(厦门)科技有限公司 浏览器生成显示ppt文件的方法、浏览器及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101150803A (zh) * 2007-10-24 2008-03-26 优视动景(北京)技术服务有限公司 微浏览器处理网络数据的方法、微浏览器及其服务器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101150803A (zh) * 2007-10-24 2008-03-26 优视动景(北京)技术服务有限公司 微浏览器处理网络数据的方法、微浏览器及其服务器

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103166981A (zh) * 2011-12-08 2013-06-19 腾讯科技(深圳)有限公司 一种无线网页转码方法及装置
CN103166981B (zh) * 2011-12-08 2017-12-12 腾讯科技(深圳)有限公司 一种无线网页转码方法及装置
CN102662984A (zh) * 2012-03-14 2012-09-12 南京新与力文化传播有限公司 基于html的多平台消息处理方法
CN102662985A (zh) * 2012-03-14 2012-09-12 南京新与力文化传播有限公司 一种在远程服务器上预览office文件的方法
CN103389969A (zh) * 2012-05-07 2013-11-13 腾讯科技(深圳)有限公司 一种用于移动终端预览pdf文件的方法、装置和***
CN103389969B (zh) * 2012-05-07 2016-02-24 腾讯科技(深圳)有限公司 一种用于移动终端预览pdf文件的方法、装置和***
CN102750372A (zh) * 2012-06-15 2012-10-24 翁时锋 自动获取网页结构化信息的分析方法
CN103838797A (zh) * 2012-11-27 2014-06-04 大连灵动科技发展有限公司 一种移动搜索引擎优化方法
CN103631935A (zh) * 2013-12-05 2014-03-12 用友软件股份有限公司 移动端图文混排展示装置和移动端图文混排展示方法
CN103631935B (zh) * 2013-12-05 2017-04-05 用友优普信息技术有限公司 移动端图文混排展示装置和移动端图文混排展示方法
CN103729338A (zh) * 2013-12-29 2014-04-16 国云科技股份有限公司 一种文件在线预览方法
CN105630753A (zh) * 2015-12-28 2016-06-01 中广核核电运营有限公司 一种核电站数字化规程的升级转换方法及***
CN105630753B (zh) * 2015-12-28 2018-09-25 中广核核电运营有限公司 一种核电站数字化规程的升级转换方法及***
CN107357769A (zh) * 2016-05-10 2017-11-17 北京慧点科技有限公司 基于移动终端的电子阅读方法和***
CN106250358A (zh) * 2016-08-25 2016-12-21 曾美枝 电子阅读方法和装置
CN106371844B (zh) * 2016-08-31 2019-10-22 北京奇艺世纪科技有限公司 一种用原生用户界面组件展示网页的方法及***
CN106371844A (zh) * 2016-08-31 2017-02-01 北京奇艺世纪科技有限公司 一种用原生用户界面组件展示网页的方法及***
CN106909533A (zh) * 2016-11-14 2017-06-30 上海仪电鑫森科技发展有限公司 适用于多平台的考试编辑***
CN106991083A (zh) * 2017-03-20 2017-07-28 珠海格力电器股份有限公司 一种电子文档处理的方法及装置
CN109002335A (zh) * 2017-06-06 2018-12-14 北京京东尚科信息技术有限公司 页面文件播放方法和装置
CN107943915B (zh) * 2017-11-20 2020-05-08 福建亿榕信息技术有限公司 基于html5的ofd文件在线显示的方法以及装置
CN107943915A (zh) * 2017-11-20 2018-04-20 福建亿榕信息技术有限公司 基于html5的ofd文件在线显示的方法以及装置
CN111324841A (zh) * 2018-12-14 2020-06-23 英业达科技有限公司 试题文件的格式转换***及其方法
CN109801192A (zh) * 2018-12-15 2019-05-24 深圳壹账通智能科技有限公司 电子合同签订方法、装置、计算机设备及存储介质
CN112257387A (zh) * 2020-10-27 2021-01-22 合肥青谷信息科技有限公司 一种文档转换方法
CN112632165A (zh) * 2020-12-22 2021-04-09 平安普惠企业管理有限公司 页面表格导出excel方法、装置、计算机设备及存储介质
CN112861482A (zh) * 2021-02-07 2021-05-28 吉林省科学技术信息研究所 文件在线编辑方法
CN113011140A (zh) * 2021-02-10 2021-06-22 北京字跳网络技术有限公司 视图展示方法、装置和电子设备
CN113569535A (zh) * 2021-07-23 2021-10-29 上海微盟企业发展有限公司 一种基于nodejs应用的文件转换解析方法、***
CN113934955A (zh) * 2021-10-25 2022-01-14 稿定(厦门)科技有限公司 浏览器生成显示ppt文件的方法、浏览器及存储介质

Similar Documents

Publication Publication Date Title
CN102156742A (zh) 支持手机使用自带浏览器展示结构化文档的方法及中间件
US9686378B2 (en) Content management and transformation system for digital content
US8151183B2 (en) System and method for facilitating content display on portable devices
CN101567065B (zh) 跨平台的文档在线编辑***及其方法
US7895598B2 (en) Page and device-optimized cascading style sheets
CN109522018B (zh) 页面处理方法、装置及存储介质
US9053296B2 (en) Detecting plagiarism in computer markup language files
CN101160579B (zh) 实现页面灵活布局的装置和方法
US20060107206A1 (en) Form related data reduction
US20020111972A1 (en) Virtual access
CN100550007C (zh) 基于要素的多个文件的分析***和方法
TW201007563A (en) Mobile device application framework
FI118310B (fi) Verkkosivun esittäminen selainikkunassa ja menetelmä verkkosivun käsittelemiseksi
EP1880312A2 (en) System and method for providing data formatting
CN104182426A (zh) 一种网页更新内容的显示方法和装置
CN105528369A (zh) 网页转码方法、装置以及服务器
KR20020031691A (ko) 실시간 인터넷 콘텐츠 변환 방법 및 시스템
US20090037807A1 (en) Coordinated xml data parsing and processing from within separate computing processes
US20070156839A1 (en) Web services for wireless pervasive devices
CN102497478A (zh) 一种手机用户快速访问互联网的方法
CN101753537B (zh) 一种服务器以及网页发送、显示方法
CN101933011B (zh) 简介远程用户接口的***和方法
KR20060019709A (ko) 엑스엠엘을 기반으로 하는 마크업 언어 변환 방법 및 이를구현한 이동 통신 단말기
CN102664959A (zh) 一种移动平台无线中间件
CN110309454B (zh) 一种界面显示方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent for invention or patent application
CB02 Change of applicant information

Address after: 100085 Haidian District, Zhongguancun, South Street, No. 6,, building information, floor, No. 16

Applicant after: SI-TECH Information Technology Ltd.

Address before: 100085, Beijing, Haidian District on the nine Street 9 digital science and Technology Plaza, two floor

Applicant before: Beijing Digital China SI-TECH Information Technology Co., Ltd.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: BEIJING DIGITAL CHINA SI-TECH INFORMATION TECHNOLOGY LTD. TO: BEIJING SI-TECH INFORMATION TECHNOLOGY LTD.

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110817