CN105550165A - 可将网页文章导入网页文本编辑器的插件及方法 - Google Patents

可将网页文章导入网页文本编辑器的插件及方法 Download PDF

Info

Publication number
CN105550165A
CN105550165A CN201510981516.3A CN201510981516A CN105550165A CN 105550165 A CN105550165 A CN 105550165A CN 201510981516 A CN201510981516 A CN 201510981516A CN 105550165 A CN105550165 A CN 105550165A
Authority
CN
China
Prior art keywords
article
link
webpage
picture
plug
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510981516.3A
Other languages
English (en)
Inventor
张文冠
王铁岩
戴丛磊
贝金雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN 80S NETWORK TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN 80S NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN 80S NETWORK TECHNOLOGY Co Ltd filed Critical SHENZHEN 80S NETWORK TECHNOLOGY Co Ltd
Priority to CN201510981516.3A priority Critical patent/CN105550165A/zh
Publication of CN105550165A publication Critical patent/CN105550165A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算机程序技术领域,尤其涉及一种可将网页文章导入网页文本编辑器的插件及方法。插件包括链接输入模块,用于供用户输入网页文章链接;HTML源代码分析模块,用于分析所述网页文章链接的HTML源代码,并从所述HTML源代码中提取出所述网页文章的内容;文章生成模块,用于将提取的内容按所述网页文章的排版拼接成文章,并将所述文章导入网页文本编辑器中。与现有技术相比,本发明可导入网页文章,达到只需在网站上编辑发表一次文章,就可将该文章的内容导入其他网页文本编辑器中,省时省力,也不会破坏原文章的版面格式,提高了网页文本编辑工作效率。

Description

可将网页文章导入网页文本编辑器的插件及方法
技术领域
本发明涉及计算机程序技术领域,尤其涉及一种可将网页文章导入网页文本编辑器的插件及方法。
背景技术
微信公众平台是给个人、企业和组织提供业务服务与用户管理能力的全新服务平台,对于负责运营微信平台的文案编辑人员来说,通常会先在所运营的微信公众号中发表网页文章,但也或多或少还会有一些其他的宣传推广平台也需要发文。在非微信的其他宣传推广平台时,又需要重新用这些平台上所使用的网页文本编辑器上编辑调整一次文章,这样既耗时又费力。如果直接将公众号上的文章拷贝过来的话,格式也不能完全地匹配,还有文案内容中的图片有可能因为是站外图片而无法显示,由此产生出一系列问题。
发明内容
本发明所要解决的技术问题是,提供一种可将网页文章导入网页文本编辑器的插件及方法,以及包含这种插件的网页文本编辑器,以实现将网页文章导入网页文本编辑器。本发明是这样实现的:
一种可将网页文章导入网页文本编辑器的插件,包括:
链接输入模块,用于供用户输入网页文章链接;
HTML源代码分析模块,用于分析所述网页文章链接的HTML源代码,并从所述HTML源代码中提取出所述网页文章的内容;
文章生成模块,用于将提取的内容按所述网页文章的排版拼接成文章,并将所述文章导入网页文本编辑器中。
进一步地,所述HTML源代码分析模块包括图片分析子模块,所述图片分析子模块用于当所述网页文章的内容包括图片时从所述HTML源代码中提取出所述图片的链接,并将所述图片的链接作为拼接后的文章中的图片链接,或根据所述图片的链接将所述图片下载到本地服务器,并将所述图片在所述本地服务器中的链接作为拼接后的文章中的图片链接,或根据所述图片的链接将所述图片下载到云端,并将所述图片在所述云端的链接作为拼接后的文章中的图片链接。
进一步地,所述链接输入模块具有链接输入界面,所述链接输入界面上设置有链接输入栏和导入按钮,所述链接输入栏用于供用户输入网页文章链接,输入网页文章链接后,所述导入按钮在被点击后所述HTML源代码分析模块和文章生成模块将依次自动运行。
进一步地,所述网页文章为微信公众号文章。
一种网页文本编辑器,包括如上所述的任意一种插件,所述插件嵌入所述网页文本编辑器中,在所述网页文本编辑器的界面具有与所述插件对应的功能图标,通过点击该功能图标可启动所述插件。
进一步地,启动所述插件后将显示所述链接输入界面。
一种将网页文章导入网页文本编辑器的方法,包括如下步骤:
步骤1:接收用户输入的网页文章链接;
步骤2:分析所述网页文章链接的HTML源代码,并从所述HTML源代码中提取出所述网页文章的内容;
步骤3:将提取的内容按所述网页文章的排版拼接成文章,并将所述文章导入网页文本编辑器中。
进一步地,当所述网页文章的内容包括图片时,所述步骤2还包括:
从所述HTML源代码中提取出所述图片的链接,并将所述图片的链接作为拼接后的文章中的图片链接,或
根据所述图片的链接将所述图片下载到本地服务器,并将所述图片在所述本地服务器中的链接作为拼接后的文章中的图片链接,或
根据所述图片的链接将所述图片下载到云端,并将所述图片在所述云端的链接作为拼接后的文章中的图片链接。
进一步地,所述网页文章为微信公众号文章。
本发明通过分析所要导入的网页文章的链接的HTML源代码,并从中提取出网页文章的内容,再将内容导入网页文本编辑器中。与现有技术相比,本发明可导入网页文章,达到只需在网站上编辑发表一次文章,就可将该文章的内容导入其他网页文本编辑器中,省时省力,也不会破坏原文章的版面格式,提高了网页文本编辑工作效率。
附图说明
图1:本发明实施例提供的可将网页文章导入网页文本编辑器的插件组成示意图;
图2:上述插件的进一步组成示意图;
图3:本发明实施例提供的将网页文章导入网页文本编辑器的方法流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
如图1所示,本发明首先提供了一种可将网页文章导入网页文本编辑器的插件,包括链接输入模块1、HTML源代码分析模块2和文章生成模块3。网页文章可以是包括微信公众号文章在内的任何网页文章。其中:
链接输入模块1用于供用户输入网页文章链接。HTML源代码分析模块2用于分析网页文章链接的HTML源代码,并从HTML源代码中提取出网页文章的内容。文章生成模块3用于将提取的内容按网页文章的排版拼接成文章,并将文章导入网页文本编辑器中。
链接输入模块1具有链接输入界面,链接输入界面上设置有链接输入栏和导入按钮,链接输入栏用于供用户输入网页文章链接,输入网页文章链接后,点击导入按钮后HTML源代码分析模块2和文章生成模块3将依次自动运行,从而实现一键(即点击导入按钮)导入网页文章到网页文本编辑器,进一步提高网页文本编辑效率。
HTML源代码分析模块2提取出的网页文章的内容至少包括文章标题和正文等文字内容。如图2所示,为应对当网页文章中包含图片时的情况,HTML源代码分析模块2还包括图片分析子模块201。图片分析子模块201用于当网页文章的内容包括图片时从HTML源代码中提取出图片的链接。提取出图片的链接后,图片分析子模块201接下来有三种处理方式:
1、将图片的链接作为拼接后的文章中的图片链接;
2、根据图片的链接将图片下载到本地服务器4,并将图片在本地服务器4中的链接作为拼接后的文章中的图片链接;
3、根据图片的链接将图片下载到云端5,并将图片在云端5的链接作为拼接后的文章中的图片链接。
以上三种方式中,图片分析子模块201采用哪种方式取决于拼接后的文章所应用的站点对于图片来源是否有什么限制,如果没有限制,可采用第1种方式或第3种方式,如果有限制可采用第2种方式,根据实际情况选择是否将图片下载到本地或云端5可减轻本地服务器4或云端5的资源负担。
从HTML源代码中提取出图片的链接前,图片分析子模块201可先检测网页文章中是否包含图片,检测方法可根据用于表示图片的格式来检测。
同时,HTML源代码分析模块2还可进一步包括视频分析子模块和音频分析子模块,可分别检测网页文章中是否包括视频或音频,检测方法可根据用于表示音频或视频的格式来检测。
如果检测到文章中有视频或音频,则可通过视频分析子模块或音频分析子模块提取出视频链接或音频链接。视频分析子模块和音频分析子模块可分别对视频链接或音频链接进行后续处理,处理方式可参照对图片链接的处理方式。
本发明还提供了一种网页文本编辑器,该网页文本编辑器包括上述插件。上述插件可以计算机插件的形式嵌入网页文本编辑器中,形成可导入网页文章的网页文本编辑器。网页文本编辑器的界面具有与插件对应的功能图标,通过点击该功能图标可启动插件。启动插件后,将显示链接输入界面,用户可通过链接输入界面输入网页文章链接,输入的方式包括手动输入或粘贴。
与上述插件的工作原理同理,本发明还提供了一种将网页文章导入网页文本编辑器的方法,其中的网页文章可为包括微信公众号文章在内的任何网页文章。如图3所示,该方法包括如下流程:
步骤S1:接收用户输入的网页文章链接;
步骤S2:分析网页文章链接的HTML源代码,并从HTML源代码中提取出网页文章的内容;
步骤S3:将提取的内容按网页文章的排版拼接成文章,并将文章导入网页文本编辑器中。
当网页文章的内容包括图片时,步骤2还包括:
从HTML源代码中提取出图片的链接,并将图片的链接作为拼接后的文章中的图片链接,或
根据图片的链接将图片下载到本地服务器4,并将图片在本地服务器4中的链接作为拼接后的文章中的图片链接,或
根据图片的链接将图片下载到云端5,并将图片在云端5的链接作为拼接后的文章中的图片链接。
上述方法的具体工作原理与上述插件的工作原理同理,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种可将网页文章导入网页文本编辑器的插件,其特征在于,包括:
链接输入模块,用于供用户输入网页文章链接;
HTML源代码分析模块,用于分析所述网页文章链接的HTML源代码,并从所述HTML源代码中提取出所述网页文章的内容;
文章生成模块,用于将提取的内容按所述网页文章的排版拼接成文章,并将所述文章导入网页文本编辑器中。
2.如权利要求1所述的插件,其特征在于,所述HTML源代码分析模块包括图片分析子模块,所述图片分析子模块用于当所述网页文章的内容包括图片时从所述HTML源代码中提取出所述图片的链接,并将所述图片的链接作为拼接后的文章中的图片链接,或根据所述图片的链接将所述图片下载到本地服务器,并将所述图片在所述本地服务器中的链接作为拼接后的文章中的图片链接,或根据所述图片的链接将所述图片下载到云端,并将所述图片在所述云端的链接作为拼接后的文章中的图片链接。
3.如权利要求1所述的插件,其特征在于,所述链接输入模块具有链接输入界面,所述链接输入界面上设置有链接输入栏和导入按钮,所述链接输入栏用于供用户输入网页文章链接,输入网页文章链接后,所述导入按钮在被点击后所述HTML源代码分析模块和文章生成模块将依次自动运行。
4.如权利要求1所述的插件,其特征在于,所述网页文章为微信公众号文章。
5.一种网页文本编辑器,其特征在于,包括如权利要求1或2所述的插件,所述插件嵌入所述网页文本编辑器中,在所述网页文本编辑器的界面具有与所述插件对应的功能图标,通过点击该功能图标可启动所述插件。
6.如权利要求4所述的网页文本编辑器,其特征在于,启动所述插件后将显示所述链接输入界面。
7.一种将网页文章导入网页文本编辑器的方法,其特征在于,包括如下步骤:
步骤1:接收用户输入的网页文章链接;
步骤2:分析所述网页文章链接的HTML源代码,并从所述HTML源代码中提取出所述网页文章的内容;
步骤3:将提取的内容按所述网页文章的排版拼接成文章,并将所述文章导入网页文本编辑器中。
8.如权利要求7所述的方法,其特征在于,当所述网页文章的内容包括图片时,所述步骤2还包括:
从所述HTML源代码中提取出所述图片的链接,并将所述图片的链接作为拼接后的文章中的图片链接,或
根据所述图片的链接将所述图片下载到本地服务器,并将所述图片在所述本地服务器中的链接作为拼接后的文章中的图片链接,或
根据所述图片的链接将所述图片下载到云端,并将所述图片在所述云端的链接作为拼接后的文章中的图片链接。
9.如权利要求7所述的方法,其特征在于,所述网页文章为微信公众号文章。
CN201510981516.3A 2015-12-23 2015-12-23 可将网页文章导入网页文本编辑器的插件及方法 Pending CN105550165A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510981516.3A CN105550165A (zh) 2015-12-23 2015-12-23 可将网页文章导入网页文本编辑器的插件及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510981516.3A CN105550165A (zh) 2015-12-23 2015-12-23 可将网页文章导入网页文本编辑器的插件及方法

Publications (1)

Publication Number Publication Date
CN105550165A true CN105550165A (zh) 2016-05-04

Family

ID=55829354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510981516.3A Pending CN105550165A (zh) 2015-12-23 2015-12-23 可将网页文章导入网页文本编辑器的插件及方法

Country Status (1)

Country Link
CN (1) CN105550165A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106780663A (zh) * 2016-11-22 2017-05-31 维沃移动通信有限公司 一种模板边框文字的处理方法及装置
CN106911794A (zh) * 2017-03-23 2017-06-30 福建天泉教育科技有限公司 一种图片自动存储的方法及***
CN108270812A (zh) * 2016-12-30 2018-07-10 深圳市青果乐园网络科技有限公司 用于获取文章发布和分享情况的方法和***
CN110119289A (zh) * 2019-04-11 2019-08-13 北京字节跳动网络技术有限公司 一种在线页面粘贴方法、装置、介质和电子设备
CN110781418A (zh) * 2018-07-30 2020-02-11 上海哔哩哔哩科技有限公司 基于url识别的网页文本编辑方法、装置和存储介质
CN111104619A (zh) * 2018-10-25 2020-05-05 青岛海信移动通信技术股份有限公司 一种收藏文章的方法及移动终端
CN112667581A (zh) * 2020-12-07 2021-04-16 贝壳技术有限公司 用于文本编辑的文件链接处理方法、客户端、服务器

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094135A (zh) * 2006-06-23 2007-12-26 腾讯科技(深圳)有限公司 一种互联网内容信息的提取方法和提取***
CN102270206A (zh) * 2010-06-03 2011-12-07 北京迅捷英翔网络科技有限公司 一种有效网页内容的抓取方法及装置
CN102609456A (zh) * 2012-01-12 2012-07-25 凤凰在线(北京)信息技术有限公司 一种文章实时智能抓取***和方法
US20120260161A1 (en) * 2009-12-30 2012-10-11 Taggy, Inc. Method for classifying and organizing content in related web pages and freely reconstructing and displaying the content
CN103488484A (zh) * 2013-09-24 2014-01-01 长沙裕邦软件开发有限公司 一种在线编辑器的软件实现方法及***
CN103699591A (zh) * 2013-12-11 2014-04-02 湖南大学 一种基于示例页面的网页正文提取方法
CN104866517A (zh) * 2014-12-30 2015-08-26 智慧城市信息技术有限公司 一种抓取网页内容的方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094135A (zh) * 2006-06-23 2007-12-26 腾讯科技(深圳)有限公司 一种互联网内容信息的提取方法和提取***
US20120260161A1 (en) * 2009-12-30 2012-10-11 Taggy, Inc. Method for classifying and organizing content in related web pages and freely reconstructing and displaying the content
CN102270206A (zh) * 2010-06-03 2011-12-07 北京迅捷英翔网络科技有限公司 一种有效网页内容的抓取方法及装置
CN102609456A (zh) * 2012-01-12 2012-07-25 凤凰在线(北京)信息技术有限公司 一种文章实时智能抓取***和方法
CN103488484A (zh) * 2013-09-24 2014-01-01 长沙裕邦软件开发有限公司 一种在线编辑器的软件实现方法及***
CN103699591A (zh) * 2013-12-11 2014-04-02 湖南大学 一种基于示例页面的网页正文提取方法
CN104866517A (zh) * 2014-12-30 2015-08-26 智慧城市信息技术有限公司 一种抓取网页内容的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LANCE2008: "网页内容,图片及连接抓取通用类", 《GOOGLE》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106780663A (zh) * 2016-11-22 2017-05-31 维沃移动通信有限公司 一种模板边框文字的处理方法及装置
CN106780663B (zh) * 2016-11-22 2020-02-21 维沃移动通信有限公司 一种模板边框文字的处理方法及装置
CN108270812A (zh) * 2016-12-30 2018-07-10 深圳市青果乐园网络科技有限公司 用于获取文章发布和分享情况的方法和***
CN108270812B (zh) * 2016-12-30 2021-03-23 深圳市青果乐园网络科技有限公司 用于获取文章发布和分享情况的方法和***
CN106911794A (zh) * 2017-03-23 2017-06-30 福建天泉教育科技有限公司 一种图片自动存储的方法及***
CN106911794B (zh) * 2017-03-23 2020-06-23 福建天泉教育科技有限公司 一种图片自动存储的方法及***
CN110781418A (zh) * 2018-07-30 2020-02-11 上海哔哩哔哩科技有限公司 基于url识别的网页文本编辑方法、装置和存储介质
CN111104619A (zh) * 2018-10-25 2020-05-05 青岛海信移动通信技术股份有限公司 一种收藏文章的方法及移动终端
CN111104619B (zh) * 2018-10-25 2023-09-26 青岛海信移动通信技术有限公司 一种收藏文章的方法及移动终端
CN110119289A (zh) * 2019-04-11 2019-08-13 北京字节跳动网络技术有限公司 一种在线页面粘贴方法、装置、介质和电子设备
CN110119289B (zh) * 2019-04-11 2022-07-22 北京字节跳动网络技术有限公司 一种在线页面粘贴方法、装置、介质和电子设备
CN112667581A (zh) * 2020-12-07 2021-04-16 贝壳技术有限公司 用于文本编辑的文件链接处理方法、客户端、服务器

Similar Documents

Publication Publication Date Title
CN105550165A (zh) 可将网页文章导入网页文本编辑器的插件及方法
CN103389895A (zh) 一种前端页面的生成方法及***
CN102591880B (zh) 信息提供方法及装置
CN101526942A (zh) 在线、实时及自动生成动态网页的组件实现技术
CN106446195A (zh) 基于人工智能的新闻推荐方法及装置
CN104866512A (zh) 提取网页内容的方法、装置及***
CN104049978A (zh) 一种实现代码可视化编辑组合的方法及***
CN106951270B (zh) 一种代码处理方法、***及服务器
CN104899184A (zh) 文字处理方法、装置及***
CN109445794B (zh) 一种页面构造方法及装置
CN105808587A (zh) 在网页中嵌入信息的方法、网关设备及***
CN113377653B (zh) 生成测试用例的方法和装置
CN103870583A (zh) 一种基于关系型数据库的在线可控浏览pdf文档的方法
CN104866527A (zh) 一种动态匹配网页模板的方法及其装置
CN107977205A (zh) Gui界面自动创建方法及***
CN105550179A (zh) 一种网页收藏方法和浏览器插件
CN110232726A (zh) 创意素材的生成方法及装置
CN105260459A (zh) 搜索方法和装置
CN104899212A (zh) 网页展示方法、服务器及***
CN103699644A (zh) 一种资讯发布的方法、用户终端及***
CN108763279B (zh) 一种网页数据分布式模板采集方法及***
CN106934047B (zh) 一种将发帖内容在小程序中展示的方法及装置
CN104077323A (zh) 一种网页内容转换彩信的方法和装置
CN103678957A (zh) 生成图片信息并获取身份编码信息的方法、装置和设备
CN103136166B (zh) 字体确定方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160504

RJ01 Rejection of invention patent application after publication