CN112257387A - 一种文档转换方法 - Google Patents
一种文档转换方法 Download PDFInfo
- Publication number
- CN112257387A CN112257387A CN202011160314.XA CN202011160314A CN112257387A CN 112257387 A CN112257387 A CN 112257387A CN 202011160314 A CN202011160314 A CN 202011160314A CN 112257387 A CN112257387 A CN 112257387A
- Authority
- CN
- China
- Prior art keywords
- processing
- steps
- ppt
- document conversion
- following
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Image Processing (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明涉及文档的转换技术领域,具体为一种文档转换方法,ppt文件通过java代码解析,调用window中的ppt命令将ppt转换为pptx文件,然后将pptx文件变为zip包,之后打开zip包,将zip里面所有的xml文件进行解析,能够解决文档类文件在网页和手机端无法很好展示效果的问题,不需要单独下载一个ppt手机app和桌面应用。
Description
技术领域
本发明涉及文档的转换技术领域,具体为一种文档转换方法。
背景技术
背景技术
针对于现在市场上ppt,word,pdf文档转换为h5效果不好的问题,我们通过解析ppt,word,pdf内部源码,最大程度的在h5页面上面展示ppt的各种效果,动画。让文档连接网络,试大家的学习成本进一步降低。
现有技术一的技术方案,1、文档类文件转换为图片的工具,libreoffice:
LibreOffice是OpenOffice.org办公套件衍生版,同样自由开源,以MozillaPublic License V2.0许可证分发源代码,但相比OpenOffice增加了很多特色功能。LibreOffice拥有强大的数据导入和导出功能,能直接导入PDF文档、微软Works、LotusWord,支持主要的OpenXML格式,通过libreoffice将pdf和word转换为图片,然后再网页中展示出来。2、LibreOffice只能将文档转换为图片,导致ppt中的动画和步骤无法展示出来,达不到用户希望的效果。
现有技术所存在的文档转换功能相对来说比较单一,对于很多ppt无法解析,无法录音,文件在网页和手机端无法很好展示,需要单独下载一个ppt手机app和桌面应用。
发明内容
(一)解决的技术问题
为了解决现有技术的上述问题,本发明提供一种文档转换方法,能够解决文档类文件在网页和手机端无法很好展示效果的问题,不需要单独下载一个ppt手机app和桌面应用。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案:包括以下步骤:
步骤一:ppt文件通过java代码解析,调用window中的ppt命令将ppt转换为pptx文件,然后将pptx文件变为zip包,之后打开zip包,将zip里面所有的xml文件进行解析;
步骤二:对ppt里面的各种元素做不同的处理,元素处理包括;文字处理、动画处理、录音处理、音视频处理和图片处理;
步骤三:将解析出来的内容,通过ftl模板的方式渲染到页面,实现文档类文件的h5播放。
优选的,所述步骤二中文字处理的处理方法为:将文字的大小,字体,加粗,斜体,颜色,背景色,对齐状态,旋转状态,是否三维模型,阴影,解析出来,然后将这些解析出来的内容,通过ppt,还原为h5可用的。
优选的,所述步骤二中动画处理的处理方法为:将动画方式提取出来,结合ppt上的动画,一部分用2d图形制作工具将动画画出来,一部分用网页原生代码将动画渲染出来。
优选的,所述步骤二中录音处理的处理方法为:运用到微信端录音功能,通过微信,将录音录制下来,下载到本地服务器,在服务器中将录音的格式通过ffmpeg转换为mp3网页通用的音乐格式,然后再将mp3文件通过傅里叶变换算法,将录音中的部分杂音去除。
优选的,所述步骤二中音视频处理的处理方法为:通过ffmpeg将音频格式和编码转换为mp3格式aac编码,将视频转换为mp4 h264编码,适用于所有网页的播放。
优选的,所述步骤二中图片处理的处理方法为:首先解析图片信息,对于不需要剪切的图片,对图片进行压缩处理,使用到的压缩工具为pngquant,pngquant使用中值切割量化算法的修改版本和附加技术来减轻中值切割的缺陷,选择盒子以最小化其中值的方差,直方图建立在基本感知模型的基础之上的,这样可以减少图像噪点区域的重量,使用Voronoi迭代来校正颜色,这保证了局部最佳的调色板,pngquant在预乘alpha颜色空间中工作,减少透明颜色的重量,重新映射时,误差扩散应用于若干相邻像素量化为相同值剔除边缘的区域,避免了在没有抖动的情况下将视觉质量增加的区域。
优选的,改善颜色进程中,在类似于梯度下降的过程中调整直方图,其方法为:中值切割重复多次,在表现不佳的颜色上增加重量。
优选的,对于需要剪切的图片,先将图片通过java剪切出来,然后做压缩处理。对于一些三维旋转等无法出来的图片,通过windows机器将内容重新编译为图片。
(三)有益效果
本发明提供了一种文档转换方法。具备以下有益效果:
(1)、适用于企业培训,学校,培训机构等制作课件,通过h5和录音可以让一个不懂技术的人快速制作出一个网络微课,使用者只需要懂得制作文档,大大提高了录制课件的效率。让大家可以随时随地学习到自己想要了解的知识。
附图说明
图1为本发明处理流程结构图;
图2为本发明功能模块结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种文档转换方法,包括以下步骤:
步骤一:ppt文件通过java代码解析,调用window中的ppt命令将ppt转换为pptx文件,然后将pptx文件变为zip包,之后打开zip包,将zip里面所有的xml文件进行解析;
步骤二:对ppt里面的各种元素做不同的处理,元素处理包括;文字处理、动画处理、录音处理、音视频处理和图片处理;
步骤三:将解析出来的内容,通过ftl模板的方式渲染到页面,实现文档类文件的h5播放。
作为本发明的一种具体实施方式,所述步骤二中文字处理的处理方法为:将文字的大小,字体,加粗,斜体,颜色,背景色,对齐状态,旋转状态,是否三维模型,阴影,解析出来,然后将这些解析出来的内容,通过ppt,还原为h5可用的。
作为本发明的一种具体实施方式,所述步骤二中动画处理的处理方法为:将动画方式提取出来,结合ppt上的动画,一部分用2d图形制作工具将动画画出来,一部分用网页原生代码将动画渲染出来。
作为本发明的一种具体实施方式,所述步骤二中录音处理的处理方法为:运用到微信端录音功能,通过微信,将录音录制下来,下载到本地服务器,在服务器中将录音的格式通过ffmpeg转换为mp3网页通用的音乐格式,然后再将mp3文件通过傅里叶变换算法,将录音中的部分杂音去除。
作为本发明的一种具体实施方式,所述步骤二中音视频处理的处理方法为:通过ffmpeg将音频格式和编码转换为mp3格式aac编码,将视频转换为mp4 h264编码,适用于所有网页的播放。
作为本发明的一种具体实施方式,所述步骤二中图片处理的处理方法为:首先解析图片信息,对于不需要剪切的图片,对图片进行压缩处理,使用到的压缩工具为pngquant,pngquant使用中值切割量化算法的修改版本和附加技术来减轻中值切割的缺陷,选择盒子以最小化其中值的方差,直方图建立在基本感知模型的基础之上的,这样可以减少图像噪点区域的重量,使用Voronoi迭代来校正颜色,这保证了局部最佳的调色板,pngquant在预乘alpha颜色空间中工作,减少透明颜色的重量,重新映射时,误差扩散应用于若干相邻像素量化为相同值剔除边缘的区域,避免了在没有抖动的情况下将视觉质量增加的区域。
作为本发明的一种具体实施方式,改善颜色进程中,在类似于梯度下降的过程中调整直方图,其方法为:中值切割重复多次,在表现不佳的颜色上增加重量。
作为本发明的一种具体实施方式,对于需要剪切的图片,先将图片通过java剪切出来,然后做压缩处理,对于一些三维旋转等无法出来的图片,通过windows机器将内容重新编译为图片。
使用方法:A.在linux***中安装ffmpeg,字体库,GraphicsMagick,libreoffice,fonttools,LTS(分布式任务***),tomcat,postgres,redis
B.在windows***中安装ffmpeg,GraphicsMagick.
C.使用ruby文件执行linux或者windows命令。
D.配置java环境,将文档转换代码打包到windows***上,将业务***放入linux***,将音视频图片等转换代码可以布置到多台机器,不限于linux和windows,然后启动每个***就可以。
Claims (8)
1.一种文档转换方法,其特征在于:包括以下步骤:
步骤一:ppt文件通过java代码解析,调用window中的ppt命令将ppt转换为pptx文件,然后将pptx文件变为zip包,之后打开zip包,将zip里面所有的xml文件进行解析;
步骤二:对ppt里面的各种元素做不同的处理,元素处理包括;文字处理、动画处理、录音处理、音视频处理和图片处理;
步骤三:将解析出来的内容,通过ftl模板的方式渲染到页面,实现文档类文件的h5播放。
2.根据权利要求1所述的一种文档转换方法,其特征在于:所述步骤二中文字处理的处理方法为:将文字的大小,字体,加粗,斜体,颜色,背景色,对齐状态,旋转状态,是否三维模型,阴影,解析出来,然后将这些解析出来的内容,通过ppt,还原为h5可用的。
3.根据权利要求1所述的一种文档转换方法,其特征在于:所述步骤二中动画处理的处理方法为:将动画方式提取出来,结合ppt上的动画,一部分用2d图形制作工具将动画画出来,一部分用网页原生代码将动画渲染出来。
4.根据权利要求1所述的一种文档转换方法,其特征在于:所述步骤二中录音处理的处理方法为:运用到微信端录音功能,通过微信,将录音录制下来,下载到本地服务器,在服务器中将录音的格式通过ffmpeg转换为mp3网页通用的音乐格式,然后再将mp3文件通过傅里叶变换算法,将录音中的部分杂音去除。
5.根据权利要求1所述的一种文档转换方法,其特征在于:所述步骤二中音视频处理的处理方法为:通过ffmpeg将音频格式和编码转换为mp3格式aac编码,将视频转换为mp4h264编码,适用于所有网页的播放。
6.根据权利要求1所述的一种文档转换方法,其特征在于:所述步骤二中图片处理的处理方法为:首先解析图片信息,对于不需要剪切的图片,对图片进行压缩处理,使用到的压缩工具为pngquant,pngquant使用中值切割量化算法的修改版本和附加技术来减轻中值切割的缺陷,选择盒子以最小化其中值的方差,直方图建立在基本感知模型的基础之上的,使用Voronoi迭代来校正颜色,pngquant在预乘alpha颜色空间中工作,重新映射时,误差扩散应用于若干相邻像素量化为相同值剔除边缘的区域。
7.根据权利要求6所述的一种文档转换方法,其特征在于:改善颜色进程中,在类似于梯度下降的过程中调整直方图,其方法为:中值切割重复多次,在表现不佳的颜色上增加重量。
8.根据权利要求6所述的一种文档转换方法,其特征在于:对于需要剪切的图片,先将图片通过java剪切出来,然后做压缩处理,对于一些三维旋转等无法出来的图片,通过windows机器将内容重新编译为图片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011160314.XA CN112257387A (zh) | 2020-10-27 | 2020-10-27 | 一种文档转换方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011160314.XA CN112257387A (zh) | 2020-10-27 | 2020-10-27 | 一种文档转换方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112257387A true CN112257387A (zh) | 2021-01-22 |
Family
ID=74262494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011160314.XA Pending CN112257387A (zh) | 2020-10-27 | 2020-10-27 | 一种文档转换方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112257387A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156742A (zh) * | 2011-04-19 | 2011-08-17 | 北京神州数码思特奇信息技术股份有限公司 | 支持手机使用自带浏览器展示结构化文档的方法及中间件 |
CN105630459A (zh) * | 2014-10-25 | 2016-06-01 | 上海未达数码科技有限公司 | 一种将ppt转换为html页面的方法 |
CN107015950A (zh) * | 2017-03-20 | 2017-08-04 | 厦门云开云科技有限公司 | 一种scorm课件的生成方法及装置 |
CN108228843A (zh) * | 2018-01-09 | 2018-06-29 | 闫健 | 一种基于互联网的讲义压缩传输与还原方法 |
-
2020
- 2020-10-27 CN CN202011160314.XA patent/CN112257387A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156742A (zh) * | 2011-04-19 | 2011-08-17 | 北京神州数码思特奇信息技术股份有限公司 | 支持手机使用自带浏览器展示结构化文档的方法及中间件 |
CN105630459A (zh) * | 2014-10-25 | 2016-06-01 | 上海未达数码科技有限公司 | 一种将ppt转换为html页面的方法 |
CN107015950A (zh) * | 2017-03-20 | 2017-08-04 | 厦门云开云科技有限公司 | 一种scorm课件的生成方法及装置 |
CN108228843A (zh) * | 2018-01-09 | 2018-06-29 | 闫健 | 一种基于互联网的讲义压缩传输与还原方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11418832B2 (en) | Video processing method, electronic device and computer-readable storage medium | |
CN102368247B (zh) | 在手持终端上执行swf文件的方法 | |
CN109583952B (zh) | 广告文案处理方法、装置、设备及计算机可读存储介质 | |
GB2593327A (en) | Colour conversion within a hierarchical coding scheme | |
US11954455B2 (en) | Method for translating words in a picture, electronic device, and storage medium | |
US10600337B2 (en) | Intelligent content parsing with synthetic speech and tangible braille production | |
CN111221596A (zh) | 字体渲染方法、装置及计算机可读存储介质 | |
CN108495174B (zh) | 一种h5页面效果生成视频文件的方法及*** | |
US20230032417A1 (en) | Game special effect generation method and apparatus, and storage medium and electronic device | |
CN114495102A (zh) | 文本识别方法、文本识别网络的训练方法及装置 | |
CN112257387A (zh) | 一种文档转换方法 | |
CN114495977A (zh) | 语音翻译和模型训练方法、装置、电子设备以及存储介质 | |
US11915458B1 (en) | System and process for reducing time of transmission for single-band, multiple-band or hyperspectral imagery using machine learning based compression | |
CN111144071B (zh) | 一种跨平台的MathType公式转换方法及装置 | |
CN111554277B (zh) | 语音数据识别方法、装置、设备及介质 | |
CN113038134B (zh) | 一种图片处理方法、智能终端及存储介质 | |
KR20070115760A (ko) | 이미지에서 2-컴포넌트 메시지 임베딩 | |
US20230046763A1 (en) | Speech recognition apparatus, control method, and non-transitory storage medium | |
CA2521445A1 (en) | Code conversion method and apparatus | |
CN111949234B (zh) | 画作处理方法及***、终端设备、计算机设备及介质 | |
CN113343135A (zh) | 一种用于图片合成视频的方法、装置和电子设备 | |
CN116546272A (zh) | 视觉媒体数据的生成方法、装置、电子设备及存储介质 | |
CN117762368A (zh) | 图像显示方法及装置、存储介质及电子设备 | |
CN113034625B (zh) | 一种基于图片的无损压缩方法、智能终端及存储介质 | |
Redfern | Computational analysis of a horror film trailer soundtrack with Python |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |