CN1310391A - 互联网网页文本分布式保护方法 - Google Patents

互联网网页文本分布式保护方法 Download PDF

Info

Publication number
CN1310391A
CN1310391A CN 01103403 CN01103403A CN1310391A CN 1310391 A CN1310391 A CN 1310391A CN 01103403 CN01103403 CN 01103403 CN 01103403 A CN01103403 A CN 01103403A CN 1310391 A CN1310391 A CN 1310391A
Authority
CN
China
Prior art keywords
web page
text
present
page text
webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 01103403
Other languages
English (en)
Other versions
CN1128420C (zh
Inventor
王辉
陈�光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 01103403 priority Critical patent/CN1128420C/zh
Publication of CN1310391A publication Critical patent/CN1310391A/zh
Application granted granted Critical
Publication of CN1128420C publication Critical patent/CN1128420C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种互联网网页文本的保护方法。本发明对网页文本进行特殊处理,改变文本的逻辑排列顺序,但不改变文本的平面布局,使得用户可以正常浏览网页内容,但无法获取网页内容的正常电子拷贝。本发明适用于保护各类网站,尤其是新闻、出版、作家等网站的网页内容不被重新利用,可以达到防止转载、转抄等目的。

Description

互联网网页文本分布式保护方法
本发明涉及互联网网页内容的保护方法。
如今INTERNET蓬勃发展,它正在改变着我们的生活,同时也给各行各业带来了生机。由于互联网的开放性,用户可以不经过原作者的授权,很容易地利用各种工具获取网页信息,并可以在极短的时间内复制、粘贴网页文本从而达到重新利用的目的。但是,互联网的这种优点目前正被滥用,网站间抄袭新闻、论文和非法转抄作家网上文章等事件不断发生,致使知识产权、版权方面的投诉和纠纷也不断增加。互联网上的抄袭现象给新闻单位、研究机构、作者等带来了无法估量的经济损失,也成为众多网站迫切希望解决的问题。
在网页内容保护方面,国内外的部分网站也采取了一些措施,但其保护效果几乎等于零。这些网站的保护方法归纳如下:(1)使用程序控制访问一个新的网页时,弹出新窗口,并关闭窗口的菜单条、导航条、状态条等工具栏;(2)禁止鼠标右键功能。
使用以上一项或全部方法,其结果是:仅仅给用户带来了一点麻烦,仅使用户不能立即保存网页罢了。用户可以使用多种方式获得网页文本,例如:(1)利用鼠标选择网页上的内容,采用操作***的拷贝功能就可以轻松获得网页文本的电子拷贝;(2)用户还可以很轻易地获取网页的地址,只要在浏览器中输入此网页的地址,就可以得到正常的、未保护的网页,并可以立即保存网页副本;(3)用户甚至可以利用类似于WINZIP等网站下载软件在很短的时间里大量下载网站上的网页;(4)因为Windows及浏览器的特性,使用程序的生成的网页会同时在用户本机生成临时网页,高级用户可以查找并编辑这些临时网页文件,从而获得网页文本。
如果要从根本上防止互联网上的抄袭、转载现象,则必须达到如下的效果:用户可以正常浏览网页文本,但无法获取网页的源程序和网页文本的电子拷贝。因为互联网的开放性和网络协议的通用性,用户在互联网上可以使用多种不同的途径浏览网页并获得网页的源程序。要防止用户下载网页,从技术角度来讲,真是困难重重。
目前,世界范围内没有任何一家互联网网站具有有效的网页文本保护技术,也没有出现任何涉及网页文本保护方面的专利或类似技术,在互联网网页文本的保护领域一直存在着空白。
基于以上问题,本发明的目的是提供一种互联网网页文本的保护方法。本发明以一个新的思路,从“无法获得正常的网页文本”的角度解决了保护网页文本的课题。也就是,通过实施本发明,可以达到如下效果:用户可以正常浏览网页文本,但无法获取网页文本的正常电子拷贝。
本发明的主要思想是:改变网页文本的逻辑排列顺序,但不改网页文本的平面布局。使得网页在实施本发明的前后,视觉效果完全一致。
本发明包括如下步骤:
(1)将欲保护的网页文本从几何平面的角度分割成为不同的文字块;
(2)对文字块进行处理,以保持网页原有的平面布局方式。例如:在每个文字块的每一行的后面加上软回车(网页符号为<br>);
(3)按网页的原始平面布局,将文字块分别置入对应的表格(Table)或层(Layer)等网页***对象之中;
(4)设置网页对象的属性:将使用的表格、层等网页***对象消除边框和间距,并设置背景颜色和网页背景颜色相同。
实施本发明可以使用多种网页***对象,例如:表格、层、文本框、列表、按钮等等。下面结合附图对使用不同的网页***对象实施本发明进行详细说明。
图1为使用表格实现本发明的实例1中的原网页文本布局图;
图2为使用表格实现本发明的实例1中的文本划分示意图;
图3为使用表格实现本发明的实例1中的文本置入表格示意图;
图4为使用表格实现本发明的实例1中的文本处理效果示意图;
图5为使用表格实现本发明的实例2中的原网页文本布局图;
图6为使用表格实现本发明的实例2中的文本置入表格示意图;
图7为使用表格实现本发明的实例2中的文本处理效果示意图;
图8为使用层实现本发明的实例中的原网页文本布局图;
图9为使用层实现本发明的实例中的文本划分示意图;
图10为使用层实现本发明的实例中的两层合并示意图。
1、用表格(Table)实现。实例1:如图1所示,假设网页文本由4个字符组成,显示为2行,逻辑排列顺序为A1A2B1B2。按照本发明的方法处理,可将A1和B1划分为一个文字块T1,将A2和B2划分为另一个文字块T2(如图2所示);分别置入表格的第一格、第二格中(如图3所示);然后设置表格为无边框、无行距(如图4所示)。此时看到的文本视觉效果和和原文本完全一致。如果想获取网页文本的电子拷贝且重新利用,需要合并这些文字块,但是因为表格的原理,合并的结果是A1B1A2B2,与原文本内容不一致。
再使用含有更多的文本网页举例。实例2:假设网页文本由12个字符组成,显示为3行,逻辑排列顺序为A1A2A3A4B1B2B3B4C1C2C3C4(如图5所示)。使用本发明的方法,将该文字划分为3列,第1列每行2个字符,第2列和第3列每行都为1个字符,置入1行3列的表格中(如图6所示)。再设置表格为无边框、无行距,则视觉效果和原文字完全一致(如图7所示)。如果将表格合并,则得到的文字为:A1A2B1B2C1C2A3B3C3A4B4C4,与原内容不一致。如果想将这些内容手工还原为原正常顺序的文本,则工作量非常巨大。
2、用层(Layer)实现。如图8所示,假设网页文本由15个字符组成,分为5行,逻辑排列顺序为A1A2A3B1B2B3C1C2C3D1D2D3F1F2F3。按照本发明的方法处理,以隔行取文字的规则,将第1、3、5行置入层X1,将第2、4行置入层X2,各层相对于原文本无文字的地方则留空行(如图9所示);再将层X2完全覆盖在层X1上(如图10所示);设置各层为无边框、无背景色,则显示的效果和原内容完全一致。如果要得到正常文本,需要合并层X1和X2的文本,而层X1文本的逻辑排列顺序是A1A2A3C1C2C3F1F2F3,层X2文本的逻辑排列顺序是B1B2B3D1D2D3,直接合并的结果是A1A2A3C1C2C3F1F2F3B1B2B3D1D2D3,与原内容不一致。
3、用其他***对象实现。利用改变文本逻辑排列顺序的原理,可将文本分割置入不同的***对象中,达到保护的目的。例如:文本框、列表、按钮等。
4、各种方法的组合与派生应用。
将上述的多种方法进行不同的组合和派生,可以得到更多的实例。例如:将表格与层进行组合,按照方法1和方法2的方式,可先将文字分割置入不同的表格,再将各表格置入不同的层,就形成了一种更复杂的分布式实例。
利用计算机程序实施本发明将获得很高的效率。目前,可以使用绝大多数的计算机编程语言编程实现本发明。根据用户的不同需求可以增加参数控制,一次编程后就可以处理各种网页,可以很方便地调节参数实现不同的网页应用不同的加密保护方案。
按照本发明的原则,设置适当的参数,可以针对不同的网页文本使用不同的分布规则。下面举例说明使用计算机程序实现本发明的步骤。例如:以表格的方法实现本发明,定义表格为统一的1×3,即1行3列,每行放置30个字符。该实例包含如下步骤:
(1)将欲处理的网页文本定义为字符串Str;
(2)取字符串Str的第一段(文本的自然段)为S;
(3)以10个字符长为标准将S截为M个字符串;
(4)将每个字符串(共M个)后加上“<br>”(软回车符);
(5)将顺序为1+3*n(n为非负整数)的字符串相加后置入表格的第1格;
(6)将顺序为2+3*n(n为非负整数)的字符串相加后置入表格的第2格;
(7)将顺序为3+3*n(n为非负整数)的字符串相加后置入表格的第3格;
(8)进行判断:
●如果字符串Str还有下一段,则取字符串Str的下一段为
S,转到步骤(3)继续;
●否则,结束。
此时,制作好的装在表格中的文本即为已经受保护的文本。
采用本发明对网页进行保护,具有如下优点:
1、受保护的网页与普通网页在视觉上没有任何差异。因本发明在使用网页***对象时,设置***对象的颜色和背景色一致,边框都已取消,也没有行距和边距,所以视觉效果没有任何影响。
2、保护效果显著。用户如果下载或拷贝网页文本,就会发现文字已经被置入***对象之间。如果用户要在其他地方转载或重新利用这些网页文本,则需要整理这些文本。但因为本发明具有独特的随机性(在计算机程序中可以方便地调节相应参数),使得用户无法按照一定的规则通过编写程序的办法来处理文本,而手工来做这个工作所花费的时间将比重新输入网页文本还多,那将是得不偿失。
3、易于实施,成本低廉。按照用户的需求,经过一次编程后就可以利用程序处理网页,实施时非常方便。按照普通的保护需求,一个熟练的程序员可以在数小时完成编程工作,前期投入成本极低。
本发明的实施必将对新闻业、出版业、研究单位和作家等在互联网上的业务发展带来新的机遇,对保护知识产权、版权等都具有巨大的现实意义。

Claims (2)

1、一种网页内容的保护方法,其特征在于:将网页文本从几何平面的角度分割成为不同的文字块,置入表格、层等网页***对象之中。
2、与之类似的组合或派生的处理方法。
CN 01103403 2001-02-04 2001-02-04 互联网网页文本分布式保护方法 Expired - Fee Related CN1128420C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 01103403 CN1128420C (zh) 2001-02-04 2001-02-04 互联网网页文本分布式保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 01103403 CN1128420C (zh) 2001-02-04 2001-02-04 互联网网页文本分布式保护方法

Publications (2)

Publication Number Publication Date
CN1310391A true CN1310391A (zh) 2001-08-29
CN1128420C CN1128420C (zh) 2003-11-19

Family

ID=4653237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 01103403 Expired - Fee Related CN1128420C (zh) 2001-02-04 2001-02-04 互联网网页文本分布式保护方法

Country Status (1)

Country Link
CN (1) CN1128420C (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002084515A1 (en) * 2001-04-12 2002-10-24 Copyseal Pty Ltd System and method for preventing unauthorized copying of electronic documents
CN1303552C (zh) * 2003-06-02 2007-03-07 英业达股份有限公司 网页块浏览的方法
CN102073559A (zh) * 2011-01-12 2011-05-25 北京搜狗科技发展有限公司 一种网页输入数据保护方法及***
CN104766019A (zh) * 2014-01-08 2015-07-08 中兴通讯股份有限公司 网页中文本信息保护方法、装置和***
CN106961517A (zh) * 2017-02-27 2017-07-18 杨戈 一种基于手机网页的信息安全保护方法及***

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002084515A1 (en) * 2001-04-12 2002-10-24 Copyseal Pty Ltd System and method for preventing unauthorized copying of electronic documents
CN1303552C (zh) * 2003-06-02 2007-03-07 英业达股份有限公司 网页块浏览的方法
CN102073559A (zh) * 2011-01-12 2011-05-25 北京搜狗科技发展有限公司 一种网页输入数据保护方法及***
CN104766019A (zh) * 2014-01-08 2015-07-08 中兴通讯股份有限公司 网页中文本信息保护方法、装置和***
WO2015103849A1 (zh) * 2014-01-08 2015-07-16 中兴通讯股份有限公司 网页中文本信息保护方法、装置和***、计算机存储介质
CN106961517A (zh) * 2017-02-27 2017-07-18 杨戈 一种基于手机网页的信息安全保护方法及***

Also Published As

Publication number Publication date
CN1128420C (zh) 2003-11-19

Similar Documents

Publication Publication Date Title
CN101278283B (zh) 将源链接到复制文本的方法和***
US8028280B2 (en) Compiler optimisation of source code by determination and utilization of the equivalence of algebraic expressions in the source code
Gibson et al. The volume and evolution of web page templates
RU2419856C2 (ru) Различные виды оформления с гармоничной версткой для динамически агрегированных документов
CN103136184B (zh) 一种自动排版的方法及其装置
Helmer Measuring the structural similarity of semistructured documents using entropy
CN1783089A (zh) 用于文字搜寻的***与方法
CN104217036A (zh) 一种网页内容提取方法和设备
CN105989013A (zh) 去除文字水印的方法及装置
CN1128420C (zh) 互联网网页文本分布式保护方法
CN1300684C (zh) 确定图形用户界面中窗口剪切关系的方法
CN111859853A (zh) 基于随机字体的网页文本加密与解密方法
CN104572874A (zh) 一种网页信息的抽取方法及装置
CN109800547B (zh) 一种用于word文档保护和分发跟踪的信息快速嵌入和提取的方法
CN103942332A (zh) 一种Web页面逻辑链接块的识别方法
Bento et al. Full characterization of a class of graphs tailored for software watermarking
Nelson Zigzag (tech briefing)
CN102841890A (zh) 一种用于文档构建的数据加工方法和装置
CN1300971A (zh) 互联网网页内容保护方法
CN103488743A (zh) 网页元素抽取方法和网页元素抽取***
CN104615601A (zh) 基于网页的记录***及其方法
CA1184309A (en) Table-driven apparatus for data display and modification
Bellas et al. An automatic approach to displaying web applications as portlets
US8762835B2 (en) Objects having usage rules that exist outside of the document in which the object is used
Anisimov et al. Asynchronous composition of Petri nets via places

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee