CN101042688A - 一种报刊版面网络标引的方法及*** - Google Patents

一种报刊版面网络标引的方法及*** Download PDF

Info

Publication number
CN101042688A
CN101042688A CN 200610065665 CN200610065665A CN101042688A CN 101042688 A CN101042688 A CN 101042688A CN 200610065665 CN200610065665 CN 200610065665 CN 200610065665 A CN200610065665 A CN 200610065665A CN 101042688 A CN101042688 A CN 101042688A
Authority
CN
China
Prior art keywords
index
space
whole page
information
local
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610065665
Other languages
English (en)
Other versions
CN101042688B (zh
Inventor
刘万福
曹学军
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Beijing Founder Electronics Co Ltd filed Critical Peking University
Priority to CN2006100656656A priority Critical patent/CN101042688B/zh
Publication of CN101042688A publication Critical patent/CN101042688A/zh
Application granted granted Critical
Publication of CN101042688B publication Critical patent/CN101042688B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种报刊版面网络标引方法,包括以下步骤:S1、依据报刊版面属性查找网络中待标引版面;S2、对找到的待标引版面进行标引处理,在网络上保存标引处理后生成的版面标引信息。采用本发明所述的方法和***对报刊资料进行信息处理时,实现了版面标引信息的共享,通过引入标引状态信号量,解决了多人访问同一版面标引信息时产生的资源共享冲突的问题,通过本地标引然后提交版面结果到网络上共享的方式,提高了报刊标引的工作效率以及报刊标引的易用性和可靠性。

Description

一种报刊版面网络标引的方法及***
技术领域
本发明涉及一种计算机信息处理技术领域,尤其是指电子报刊版面网络标引的方法及***。
背景技术
随着互联网的普及和信息技术的快速发展,报纸以及期刊、杂志发布资料的信息数据对报社以及杂志社来讲变得越来越重要,以报纸为例,无论是报社电子报纸的制作还是见报资料的存储都离不开对报纸见报资料的标引和加工处理。现有的报纸见报资料标引方法都是采取本地化标引的方式来完成的,而没有一种网络化标引的方法实现版面标引结果的共享以及版面标引信息在网络环境下的多人加工处理。在报社常常出现要求版面标引信息结果的共享以及不同的人对版面标引信息再次进行加工处理的情况,如报社资料***人员非常想利用电子报的版面加工结果,并在此基础上进行加工从而达到节约人力物力和时间的目的;另一方面标引的版面信息常有再次编辑修改的问题,一旦操作人员离开或者***崩溃该版面信息就不得不重新标引加工,从而浪费很多人力物力。
发明内容
本发明的目的在于提供一种报刊版面网络标引的方法及***,用以解决现有报纸以及期刊等公布资料信息在加工过程中所存在的资源浪费的问题,并可以实现了版面标引信息结果的信息共享以及版面信息在不同用户之间的标引加工,还可以通过本地用户端的操作版面标引信息然后提交版面标引结果到网络上共享的方式,提高了网络标引效率。
本发明的技术方案是这样实现的:
本发明提供的一种报刊版面网络标引方法,包括以下步骤:
S1、依据报刊版面属性查找网络中待标引版面;
S2、对找到的待标引版面进行标引处理,在网络上保存标引处理后生成的版面标引信息。
所述报刊版面属性包括报刊版面所属报刊名、发行日期或版面版次。
所述的版面标引信息附带有标记时间,所述的标记时间与自然时间一致。
所述的版面标引信息还附带有标引状态信号量。
所述标引状态信号量为待标引、正在标引或标引完毕。
进一步包括以下步骤:
S3、确定网络上标引后的标引版面信息的标引状态信号量为待标引或标引完毕。
在步骤S1与步骤S2之间存在步骤S11:根据查找网络中是否存在待标引版面的版面标引信息,判断此次标引是否为首次标引的判断。
当待标引版面为首次标引时,步骤1与步骤2之间包括以下步骤:
S111、创建待标引版面的版面标引信息,确定版面标引信息的标引状态信号量为正在标引;
S112、创建版面标引信息的网络目录并保存在该目录下。
进一步包括创建版面标引信息的本地目录并将保存在该目录下的步骤。
在步骤S2中,是在所述网络目录或所述本地目录下对待标引版面进行标引,标引后将版面标引信息同时保存在该信息所在的网络目录及本地目录下。
待标引版面为非首次标引时,步骤1与步骤2之间包括以下步骤:
S11′、查找待标引版面以及该待标引版面的最近一次标引所存储的版面标引信息;
S12′、根据版面标引信息所带有的标引状态信号量确定是否开始标引,如所述标引状态信号量为正在标引,结束标引;如标引状态信号量为待标引,将网络上标引版面信息的标引状态信号量修改为正在标引。
该方法进一步包括以下步骤:
S13′:如最近一次标引所存储的版面标引信息在本地标引端未创建本地目录,则创建版面标引信息的本地目录,并将所述版面标引信息复制到本地目录执行步骤S2;
如最近的一次标引所存储的版面标引信息在本地标引端已创建本地目录,则根据两目录存储的待标引版面的版面标引信息带有的时间标记,在时间接近当前标引时间的一个版面标引信息的基础上执行步骤S2。
本发明还提供一种报刊版面网络标引***,包括:
网络服务器,存储待标引版面以及版面标引信息,控制版面标引信息的标引状态信号量变化;
多个本地标引端,与网络服务器通信,根据网络服务器对于版面标引信息信号量的控制而动作。
所述网络服务器至少包括:
第一存储单元,存储待标引版面以及标引版面信息;
标引信息控制单元,根据标引端的动作控制存储单元内的版面标引信息以及标引状态信号量。
所述的本地标引端至少包括:
信息收发单元,将查询待标引版面的信息传递给所述标引信息控制单元,并接收标引信息控制单元传送的版面标引信息;
标引执行单元,根据标引信息控制单元发送的信息对待标引版面做出标引;
本地控制单元,根据信息收发单元的传递的信息控制本地标引执行单元的动作。
所述的本地标引端还包括:第二存储单元,存储信息收发单元收到的版面标引信息。
本发明的效果是显著的:
采用本发明所述的方法和***对报刊资料进行信息处理时,实现了版面标引信息的共享,通过引入标引状态信号量,解决了多人访问同一版面标引信息时产生的资源共享冲突的问题,通过本地标引然后提交版面结果到网络上共享的方式,有效地降低了网络标引对网络带宽的要求,提高了标引的效率;另一方面本发明实现了报刊版面标引信息在多人之间透明的共享,无需用户手工操作标引信息文件,提高了报刊标引的工作效率以及报刊标引的易用性和可靠性。
附图说明
图1是本发明的方法流程图。
图2是本发明的一种具体实施方法的流程图。
图3是本发明的***框图。
具体实施方式
下面结合附图及具体实施方式对本发明做进一步的描述。
本发明给出一种报刊版面网络标引方法,如图1所示,该方法可以包括以下步骤:
S1、依据报刊版面属性查找网络中待标引版面;
S2、对找到的待标引版面进行标引处理,在网络上保存标引处理后生成的版面标引信息。
在本发明的方法中,在步骤S1中所提到的报刊版面属性包括,报刊版面所属报刊名、发行日期或版面版次,应用本发明的方法的时候,标引端采用上述三种属性中的一种或者几种在网络中进行待标引版面的查找,查找到该待标引版面后,标引端就对找到的待标引版面进行标引,并将标引后生成的版面标引信息存储在网络上,以便与网络中的标引端共享该信息,克服现有技术中存在的技术缺陷。本发明中所述的版面标引信息附带有标记时间,所述的标记时间与自然时间一致;所述的版面标引信息还附带有标引状态信号量,该标引状态信号量可为待标引、正在标引或标引完毕。
在本发明的方案中,进一步包括以下步骤:S3、确定网络上标引后的标引版面信息的标引状态信号量为待标引或标引完毕。
另外,在步骤S1与步骤S2之间还存在步骤S11:根据查找网络中是否存在待标引版面的版面标引信息,判断此次标引是否为首次标引的判断。
当待标引版面为首次标引时,参考图2所示的内容,在网络中查找到待标引版面,而没有版面标引信息时,确定该待标引版面为首次标引,结合图1所示,在图1所示的步骤S1与步骤S2之间,执行以下步骤:
S111、创建待标引版面的版面标引信息,将该版面标引信息的标引状态信号量确定为正在标引;
S112、创建版面标引信息的网络目录并保存在该目录下;然后执行步骤S2。
此时标引端可以直接在网络目录下对待标引版面进行标引,并直接存储在该网络目录下。而实际使用过程中,此时如果有其他用户也查找该待标引版面,并且找到该创建的版面标引信息,***会提醒用户有人正在进行操作,则其他用户无法对该版面标引信息执行其他的操作。
在本发明中,为了保护网络中的版面标引信息的安全,也可以将版面标引信息保存到本地目录下进行标引的操作,此时就需要执行创建版面标引信息的本地目录的步骤,然后在本地目录下执行步骤S2,标引后将最终生成的版面标引信息同时保存在该信息所在的网络目录及本地目录下。
当待标引版面为非首次标引时,参考图2所示,步骤1与步骤2之间包括以下步骤:
S11′、查找待标引版面以及该待标引版面的最近一次标引所存储的版面标引信息;
S12′、根据版面标引信息所带有的标引状态信号量确定是否开始对待标引版面进行标引,如所述标引状态信号量为正在标引,则结束标引;如标引状态信号量为待标引,将网络上标引版面信息的标引状态信号量修改为正在标引,然后执行步骤S2。
在执行步骤S2时,即可以在网络目录下直接进行标引,也可以在本地对待标引版面进行标引,此时就需要检查是否存在本地目录,也就是执行以下步骤:
S13′:如最近一次标引所存储的版面标引信息在本地标引端未创建本地目录,则创建版面标引信息本地目录,并将所述版面标引信息复制到本地目录执行步骤S2;
如最近的一次标引所存储的版面标引信息在本地标引端已创建本地目录,则根据两目录存储的待标引版面的版面标引信息带有的时间标记,在时间接近当前标引时间的一个版面标引信息的基础上执行步骤S2。例如,如果网络目录上存储的版面标引信息的时间标记是2006年3月10日,而本地目录上存储的版面标引信息的时间标记是2006年3月13日,此时本地目录上存储的版面标引信息比网络上的版面标引信息新,此时在本地目录上存储的版面标引信息的基础上进行标引。
在标引结束后,将最终生成的版面标引信息保存在本地目录,同时也将网络上之前存储的版面标引信息覆盖,在网络中保存最新的版面标引信息。
参看图2,如果版面标引信息的标引状态信号量为标引完毕状态,则需要判断是否进行再次标引,如果标引端做出需要再次进行标引的判断,则重复上述步骤,如果不再进行,则结束标引过程。
在本发明中,在标引状态信号量设成待标引状态时,也可以包括一个版面标引信息导出的步骤,如果将标引信息导出,则版面标引状态信号量自动设置成标引完毕状态,结束标引过程。
在本发明中,为保证版面标引信息的准确及时性,要求网络和本地保持时间同步。
对于上述方法,本发明还指出一种报刊版面网络标引***,如图3所示,在本发明的***中包括:网络服务器301,存储待标引版面以及标引版面信息,控制标引版面信息的标引状态信号量变化;多个本地标引端302,与网络服务器301通信,根据网络服务器301对于标引版面信息信号量的控制做出动作。
在本发明的***中,网络服务器301至少包括:第一存储单元3011,存储待标引版面以及标引版面信息;标引信息控制单元3012,根据标引端302的动作控制存储单元内的标引版面信息及其标引状态信号量。本地标引端302至少包括:信息收发单元3021,将查询待标引版面的信息传递给网络服务器301的标引信息控制单元3012,并接收标引信息控制单元3012传送的标引版面信息;标引执行单元3022,根据标引信息控制单元3012发送的信息对待标引版面做出标引;本地控制单元3023,根据信息收发单元的传递的信息控制本地标引执行单元的动作。
在本***中,本地标引端302还包括:存储信息收发单元3021收到的标引版面信息的第二存储单元。
采用以下具体实施例对本发明的方法和***进行说明,本实施例以在本地标引端对版面进行标引为例:
如图2所示,网络中的本地标引端302的信息收发单元3021向网络服务器301发出查找待标引版面的信息,该查找步骤是基于待标引版面的属性实现的,也就是基于报刊版面所属报刊名、发行日期、版面版次属性,在网络服务器301中的第一存储单元3011内中查找待标引版面。
网络服务器301的标引信息控制单元3012在第一存储单元3011内没有查找到版面标引信息,确定此标引是首次标引该版面,在第一存储单元3011中创建该版面的标引状态信号量,将其设置为“正在标引”状态,在网络服务器301中创建该版面标引信息的网络目录,在本地标引端302上创建该版面的本地标引目录。在本实施例中,版面标引消息的存取方式采用权限控制下的FTP网络协议方式进行存取,同时初始化版面标引信息文件到版面所属的网络目录和本地目录下,在本地目录下进行待标引版面的标引。
如果网络服务器301的标引信息控制单元3012在第一存储单元3011内查找到版面标引信息,该版面标引信息的标引状态信号量设置为“正在标引”状态,则标引信息控制单元3012提醒标引端301正在有人正在对该版面上进行标引操作,然后退出标引***;如果标引状态为“标引完毕”,标引信息控制单元3012提醒用户确认是否需要再次标引,如果用户不需要,退出标引***;如果需要进行标引,则标引信息控制单元3012通知标引端302的信息收发单元3021,同时传送标引版面信息给标引端302,信息收发单元3021通知标引执行单元3022继续对版面进行标引,同时将信息收发单元3021收到的标引版面信息存储在第二存储单元中。
在进行继续标引时,标引执行单元3022把该版面标引信息的标引状态信号量设置为“正在标引”状态;并由本地控制单元3023查找该版面的版面标引信息文件在本地标引端302是否存在,如果不存在,本地单元控制单元3023在本地工作目录下创建该版面的本地目录,复制网络目下的该版面标引信息文件到在本地目录中,再继续进行标引;如果存在版面标引信息文件,本地控制单元3023对比较本地版面标引信息文件与网络版面标引信息文件的修改时间标记进行比较,如果本地版面标引信息文件比网络版面标引信息文件新,本地控制单元3023用本地的版面标引信息文件覆盖掉网络上的版面标引信息文件,否则用网络版面标引信息文件覆盖掉本地的版面标引信息文件。
本地标引端302的标引执行单元3022打开本地标引信息文件进行标引工作,标引完毕后,由本地控制单元3023复制本地版面标引信息文件到该版面的网络目录中。标引状态置为“待标引”,当用户导出版面标引内容时,标引状态置为“标引完毕”,完成版面标引。
通过以上实施例可以看出,采用本发明所述的方法,一方面用户可以非常方便地进行网络标引的工作,实现了版面标引信息网络上的共享,通过引入网络标引状态信号量解决了共享访问中的资源冲突问题,同时用户无需直接操作版面标引文件就实现了版面标引信息共享和再加工,减少了网络标引在工作过程中发生错误的可能性。同时通过本地化标引然后提交版面结果到网络上共享的方式,大大降低了标引过程中网络流量,非常显著提高了标引工作的效率。
本发明所述的方法并不限于具体实施方式中所述的实施例,本领域技术人员根据本发明的技术方案得出其他的实施方式,同样属于本发明的技术创新范围。

Claims (16)

1、一种报刊版面网络标引方法,其特征在于,包括以下步骤:
S1、依据报刊版面属性查找网络中待标引版面;
S2、对找到的待标引版面进行标引处理,在网络上保存标引处理后生成的版面标引信息。
2、根据权利要求1所述的方法,其特征在于,所述报刊版面属性包括报刊版面所属报刊名、发行日期或版面版次。
3、根据权利要求1所述的方法,其特征在于,所述的版面标引信息附带有标记时间,所述的标记时间与自然时间一致。
4、根据权利要求3所述的方法,其特征在于,所述的版面标引信息还附带有标引状态信号量。
5、根据权利要求4所述的方法,其特征在于,所述标引状态信号量为待标引、正在标引或标引完毕。
6、根据权利要求5所述的方法,其特征在于,进一步包括以下步骤:
S3、确定网络上标引后的标引版面信息的标引状态信号量为待标引或标引完毕。
7、根据权利要求6所述的方法,其特征在于,在步骤S1与步骤S2之间存在步骤S11:根据查找网络中是否存在待标引版面的版面标引信息,判断此次标引是否为首次标引的判断。
8、根据权利要求7所述的方法,其特征在于,当待标引版面为首次标引时,步骤1与步骤2之间包括以下步骤:
S111、创建待标引版面的版面标引信息,确定版面标引信息的标引状态信号量为正在标引;
S112、创建版面标引信息的网络目录并保存在该目录下。
9、根据权利要求8所述的方法,其特征在于,进一步包括创建版面标引信息的本地目录并将保存在该目录下的步骤。
10、根据权利要求9所述的方法,其特征在于,在步骤S2中,是在所述网络目录或所述本地目录下对待标引版面进行标引,标引后将版面标引信息同时保存在该信息所在的网络目录及本地目录下。
11、根据权利要求7所述的方法,其特征在于,待标引版面为非首次标引时,步骤1与步骤2之间包括以下步骤:
S11′、查找待标引版面以及该待标引版面的最近一次标引所存储的版面标引信息;
S12′、根据版面标引信息所带有的标引状态信号量确定是否开始标引,如所述标引状态信号量为正在标引,结束标引;如标引状态信号量为待标引,将网络上标引版面信息的标引状态信号量修改为正在标引。
12、根据权利要求11所述的方法,其特征在于,进一步包括以下步骤:
S13′:如最近一次标引所存储的版面标引信息在本地标引端未创建本地目录,则创建版面标引信息本地目录,并将所述版面标引信息复制到本地目录执行步骤S2;
如最近的一次标引所存储的版面标引信息在本地标引端已创建本地目录,则根据两目录存储的待标引版面的版面标引信息带有的时间标记,在时间接近当前标引时间的一个版面标引信息的基础上执行步骤S2。
13、一种报刊版面网络标引***,其特征在于,包括:
网络服务器,存储待标引版面以及版面标引信息,控制版面标引信息的标引状态信号量变化;
多个本地标引端,与网络服务器通信,根据网络服务器对于版面标引信息信号量的控制而动作。
14、根据权利要求13所述的***,其特征在于,所述网络服务器至少包括:
第一存储单元,存储待标引版面以及标引版面信息;
标引信息控制单元,根据标引端的动作控制存储单元内的版面标引信息以及标引状态信号量。
15、根据权利要求13所述的***,其特征在于,所述的本地标引端至少包括:
信息收发单元,将查询待标引版面的信息传递给所述标引信息控制单元,并接收标引信息控制单元传送的版面标引信息;
标引执行单元,根据标引信息控制单元发送的信息对待标引版面做出标引;
本地控制单元,根据信息收发单元的传递的信息控制本地标引执行单元的动作。
16、根据权利要求15所述的***,其特征在于,所述的本地标引端还包括:第二存储单元,存储信息收发单元收到的版面标引信息。
CN2006100656656A 2006-03-21 2006-03-21 一种报刊版面网络标引的方法及*** Expired - Fee Related CN101042688B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006100656656A CN101042688B (zh) 2006-03-21 2006-03-21 一种报刊版面网络标引的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100656656A CN101042688B (zh) 2006-03-21 2006-03-21 一种报刊版面网络标引的方法及***

Publications (2)

Publication Number Publication Date
CN101042688A true CN101042688A (zh) 2007-09-26
CN101042688B CN101042688B (zh) 2011-06-01

Family

ID=38808204

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100656656A Expired - Fee Related CN101042688B (zh) 2006-03-21 2006-03-21 一种报刊版面网络标引的方法及***

Country Status (1)

Country Link
CN (1) CN101042688B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100543726C (zh) * 2007-10-08 2009-09-23 北大方正集团有限公司 一种校对的方法和***
CN103106677A (zh) * 2011-11-14 2013-05-15 北大方正集团有限公司 一种大样结果输出文件的处理方法及***
CN104572592A (zh) * 2013-10-10 2015-04-29 北大方正集团有限公司 一种基于版面组版的版面标引方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8010491B2 (en) * 2003-02-28 2011-08-30 Microsoft Corporation Method for managing multiple file states for replicated files

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100543726C (zh) * 2007-10-08 2009-09-23 北大方正集团有限公司 一种校对的方法和***
CN103106677A (zh) * 2011-11-14 2013-05-15 北大方正集团有限公司 一种大样结果输出文件的处理方法及***
CN104572592A (zh) * 2013-10-10 2015-04-29 北大方正集团有限公司 一种基于版面组版的版面标引方法及***
CN104572592B (zh) * 2013-10-10 2017-12-12 北大方正集团有限公司 一种基于版面组版的版面标引方法及***

Also Published As

Publication number Publication date
CN101042688B (zh) 2011-06-01

Similar Documents

Publication Publication Date Title
US8832077B1 (en) Selectively retrieving search results in accordance with different logical relationships
US20070250494A1 (en) Enhancing multilingual data querying
US20070250493A1 (en) Multilingual data querying
CN1439135A (zh) 根据印刷出版物和出版商所控制的链接向客户机设备提供网页的方法和装置
CN101075929A (zh) 信息查询***、信息查询服务器及信息查询方法
CN1916905A (zh) 基于倒排表进行检索提示的方法
CN1653448A (zh) 搜索数据源的***和方法
CN1497474A (zh) 带有正向和反向轴的流式xpath处理的方法
CN1685341A (zh) 跨语言搜索结果的闪烁注释标注加亮
CN101065729A (zh) 用于在分布式计算环境中确保服务质量的方法
CN1567301A (zh) 访问数据库的方法及装置
CN1687925A (zh) 一种实现双语网页搜索的方法
CN1932816A (zh) 基于密文的全文检索***
CN1731400A (zh) 分布式***中数据查询的方法及板间数据同步的方法
CN1968168A (zh) 刀片服务器的定位方法及定位***
CN1766875A (zh) 用于检索结构化文件的***和方法
CN101042688A (zh) 一种报刊版面网络标引的方法及***
CN1689298A (zh) 用于自主计算的合成服务
CN1492361A (zh) 嵌入式数据库查询的处理方法
CN101051319A (zh) 文件分配***中的文件名生成方法及生成装置
CN1831811A (zh) 文档处理装置
CN101030230A (zh) 一种图像检索方法及***
CN100568224C (zh) 一种翻译网页的方法和***
CN1684071A (zh) 序列索引方法及***
CN1791873A (zh) 还原数据库***中的对象和从属对象

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110601

Termination date: 20190321

CF01 Termination of patent right due to non-payment of annual fee