CN111125257B - 词典更新方法、装置、设备和存储介质 - Google Patents

词典更新方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111125257B
CN111125257B CN201911353606.2A CN201911353606A CN111125257B CN 111125257 B CN111125257 B CN 111125257B CN 201911353606 A CN201911353606 A CN 201911353606A CN 111125257 B CN111125257 B CN 111125257B
Authority
CN
China
Prior art keywords
dictionary
update
updating
target
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911353606.2A
Other languages
English (en)
Other versions
CN111125257A (zh
Inventor
王九硕
张丹
于琳琳
贾丹丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New Founder Holdings Development Co ltd, Beijing Founder Electronics Co Ltd filed Critical New Founder Holdings Development Co ltd
Priority to CN201911353606.2A priority Critical patent/CN111125257B/zh
Publication of CN111125257A publication Critical patent/CN111125257A/zh
Application granted granted Critical
Publication of CN111125257B publication Critical patent/CN111125257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种词典更新方法、装置、设备和存储介质,该方法包括:对与目标更新任务对应的数据进行组装,生成组装数据,其中,目标更新任务为对目标词典文件中各个词典进行更新的任务,目标更新任务包括增量更新任务和/或全量更新任务;基于组装数据对目标词典文件中各个词典进行更新,并生成各个词典对应的更新状态。根据本发明实施例的技术方案,能够确保客户端与服务器端词典更新的时效性和一致性。

Description

词典更新方法、装置、设备和存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种词典更新方法、装置、设备和存储介质。
背景技术
随着计算机技术的发展,计算机网络上产生了大量的数据,对这些数据进行分析的过程中,需要对数据进行分词处理,分词处理需要大量的词典,如何对词典的更新进行处理成为了关注的焦点。
在一种技术方案中,实现了词库服务器与词库客户端之间的同步,在词库中的词典发生更新时,用户将自定义的用户词典上传到词库服务器上或从词库服务器下载更新的词典。然而,在这种技术方案中,难以保证客户端与服务器之间的词典更新的时效性和一致性。
因此,如何在客户端与服务器之间及时地并且一致性地更新词典成为了亟待解决的技术难题。
发明内容
本发明实施例提供一种词典更新方法、装置、设备和存储介质,用于解决如何在客户端与服务器之间及时地并且一致性地更新词典的问题。
本发明实施例第一方面,提供了一种词典更新方法,包括:对与目标更新任务对应的数据进行组装,生成组装数据,其中,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务;基于所述组装数据对所述目标词典文件中各个词典进行更新,并生成各个词典对应的更新状态。
在本发明的一些实施例中,基于上述方案,所述目标更新任务包括所述增量更新任务,所述基于所述组装数据对所述目标词典文件中各个词典进行更新,包括:以第一预定时间段为周期,获取所述组装数据中与所述增量更新任务对应的增量数据,其中,所述增量数据包括在所述第一预定时间段内多个用户对所述目标词典文件中各个词典进行更新的数据;将所述增量数据更新到所述目标词典文件中的各个词典中。
在本发明的一些实施例中,基于上述方案,所述目标更新任务包括所述全量更新任务,所述基于所述组装数据对所述目标词典文件中各个词典进行更新,包括:以第二预定时间段为周期,获取所述组装数据中与所述全量更新任务对应的全量数据,其中,所述全量数据包括所述目标词典文件中各个词典的全部词语;将所述全量数据更新到所述目标词典文件中的各个词典中,所述第二预定时间段大于所述第一预定时间段。
在本发明的一些实施例中,基于上述方案,所述方法还包括:响应于所述客户端发送的更新状态查询请求,向所述客户端返回所述目标词典文件中各个词典的所述更新状态。
在本发明的一些实施例中,基于上述方案,所述词典包括通用词典、机构词典以及个人词典中的一种或多种。
在本发明的一些实施例中,基于上述方案,所述服务器端为分布式***端。
本发明实施例的第二方面,提供了一种词典更新方法,所述方法包括:从服务器端获取所述客户端中各个词典的更新状态,其中,所述更新状态用于指示所述词典在所述服务器端是否已更新;若所述更新状态指示所述词典在所述服务器端已更新,则从所述服务器端加载已更新的所述词典,其中,所述服务器端配置有目标更新任务,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务。
在本发明的一些实施例中,基于上述方案,所述词典包括个人词典,所述方法还包括:响应于对所述个人词典的更新任务,获取所述个人词典的所述更新状态;根据所述更新状态确定所述个人词典是否已更新;若已更新,则重新加载所述个人词典。
本发明实施例的第三方面,提供了一种词典更新装置,应用于服务器端,所述装置包括:数据组装模块,用于对与目标更新任务对应的数据进行组装,生成组装数据,其中,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务;更新模块,用于基于所述组装数据对所述目标词典文件中各个词典进行更新,并生成各个词典对应的更新状态。
在本发明的一些实施例中,基于上述方案,所述目标更新任务包括所述增量更新任务,所述更新模块包括:增量数据获取单元,用于以第一预定时间段为周期,获取所述组装数据中与所述增量更新任务对应的增量数据,其中,所述增量数据包括在所述第一预定时间段内多个用户对所述目标词典文件中各个词典进行更新的数据;增量更新单元,用于将所述增量数据更新到所述目标词典文件中的各个词典中。
在本发明的一些实施例中,基于上述方案,所述目标更新任务包括所述全量更新任务,所述更新模块包括:全量数据获取单元,用于以第二预定时间段为周期,获取所述组装数据中与所述全量更新任务对应的全量数据,其中,所述全量数据包括所述目标词典文件中各个词典的全部词语;全量更新单元,用于将所述全量数据更新到所述目标词典文件中的各个词典中,所述第二预定时间段大于所述第一预定时间段。
在本发明的一些实施例中,基于上述方案,所述装置还包括:状态发送单元,用于响应于所述客户端发送的更新状态查询请求,向所述客户端返回所述目标词典文件中各个词典的所述更新状态。
在本发明的一些实施例中,基于上述方案,所述词典包括通用词典、机构词典以及个人词典中的一种或多种。
在本发明的一些实施例中,基于上述方案,所述服务器端为分布式***端。
本发明实施例的第四方面,提供了一种词典更新装置,应用于客户端,所述装置包括:更新状态获取模块,用于从服务器端获取所述客户端中各个词典的更新状态,其中,所述更新状态用于指示所述词典在所述服务器端是否已更新;词典加载模块,用于若所述更新状态指示所述词典在所述服务器端已更新,则从所述服务器端加载已更新的所述词典,其中,所述服务器端配置有目标更新任务,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务。
在本发明的一些实施例中,基于上述方案,所述词典包括个人词典,所述装置还包括:个人词典更新状态获取模块,用于响应于对所述个人词典的更新任务,获取所述个人词典的所述更新状态;更新判断模块,用于根据所述更新状态确定所述个人词典是否已更新;重新加载模块,用于若已更新,则重新加载所述个人词典。
本发明实施例的第五方面,提供了一种词典更新设备,包括:接收器、处理器、存储器以及发送器;存储器用于存储计算机程序和数据,所述处理器调用存储器存储的计算机程序,以执行第一方面任一实施例提供的词典更新方法。
本发明第六方面提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序在被处理器执行时用于执行第一方面任一实施例提供的词典更新方法。
根据本发明实施例提供的词典更新方法、装置、设备和存储介质,一方面,通过对词库中的词典进行增量更新来快速实现词典的更新,保证词典更新的时效性;另一方面,通过对词库中的词典进行全量更新,来实现词典更新的一致性;再一方面,记录各个词典的更新状态,能够使客户端根据各个词典的更新状态更新词典,确保客户端与服务器端词典更新的时效性和一致性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明的一些实施例提供的词典更新方法的应用场景的示意图;
图2为根据本发明的一些实施例提供的词典更新方法的流程示意图;
图3为根据本发明的另一些实施例提供的词典更新方法的流程示意图;
图4为根据本发明的再一些实施例提供的词典更新方法的流程示意图;
图5为根据本发明的又一些实施例提供的词典更新方法的流程示意图;
图6为根据本发明的另一些实施例提供的词典更新方法的流程示意图;
图7为根据本发明的一些实施例提供的词典更新装置的示意框图;
图8为根据本发明的另一些实施例提供的词典更新装置的示意框图;
图9为根据本发明的一些实施例提供的词典更新设备实施例的示意框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,在一种技术方案中,实现了词库服务器与词库客户端之间的同步,在词库中的词典发生更新时,用户将自定义的用户词典上传到词库服务器上或从词库服务器下载更新的词典。然而,在这种技术方案中,在词库中的词典种类较多或者多个用户对词典进行更新时,容易导致词库中词典更新的不及时以及不一致的问题。
基于上述内容,本发明的基本思想在于:通过对服务器端各个词典进行增量更新来实现词典的快速更新,保证更新的时效性;通过对服务器端的词典进行全量更新,来实现词典更新的一致性;记录服务器端各个词典的更新状态,能够使得客户端根据各个词典的更新状态进行词典更新,确保客户端与服务器端词典更新的时效性和一致性。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施例。
图1为根据本发明的一些实施例提供的词典更新方法的应用场景的示意图。参照图1所示,该应用场景包括至少一个客户端110以及服务器端120。客户端110与服务器端120之间通过网络130进行通信。服务器端120上存储有多个词典,服务器端120上配置有目标更新任务,目标更新任务为对各个词典进行更新的任务,目标更新任务包括增量更新任务和/或全量更新任务,增量更新任务为对第一预定时间段的各个词典的增量数据进行更新的任务;全量更新任务为对第二预定时间段的各个词典的全量数据进行更新的任务。在服务器端120上对词典进行更新之后,记录词典的更新状态。客户端110上配置有词典引擎,客户端110通过词典引擎定期从服务器端120查询各个词典的更新状态,若该更新状态指示词典在服务器端120已更新,则从服务器端120加载已更新的词典。
需要说明的是,客户端110可以为手机、平板电脑、台式计算机、便携笔记本式计算机或车载计算机等。服务器120可以为包含独立主机的物理服务器,或者为主机集群承载的虚拟服务器,或者为云服务器。网络130可以为有线网络或无线网络,例如,网络130可以为公共交换电话网络(Public Switched Telephone Network,PSTN)或因特网。
下面结合图1的应用场景,参考附图来描述根据本发明的示例性实施例的词典更新方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施例在此方面不受任何限制。相反,本发明的实施例可以应用于适用的任何场景。
图2为根据本发明的一些实施例提供的词典更新方法的流程示意图。该词典更新方法应用于服务器端,包括步骤S210和步骤S220,下面结合附图对示例实施例中的词典更新方法进行详细的描述。
在步骤S210中,对与目标更新任务对应的数据进行组装,生成组装数据,其中,目标更新任务为对目标词典文件中各个词典进行更新的任务,目标更新任务包括增量更新任务和/或全量更新任务。
在示例实施例中,在服务器端配置有目标更新任务,目标更新任务为对目标词典文件中各个词典进行更新的任务,目标更新任务包括增量更新任务和/或全量更新任务。增量更新任务为对第一预定时间段的各个词典的增量数据进行更新的任务;全量更新任务为对第二预定时间段的各个词典的全量数据进行更新的任务,第二预定时间段大于第一预定时间段。
进一步地,对与目标更新任务对应的数据进行组装,生成组装数据,组装数据包括增量数据和/或全量数据。例如,对在第一预定时间段内用户对通用词典、机构词典、个人词典的增加、删除、修改等行为产生的数据进行组装;和/或对第二预定时间段内词典文件中的各个词典的数据进行组装。
需要说明的是,第一预定时间段可以为1小时,第二预定时间段可以为一周,也可以为其他适当的时间段,本发明对此不进行特殊限定。
在步骤S220中,基于组装数据对目标词典文件中各个词典进行更新,并生成各个词典对应的更新状态。
在示例实施例中,基于与目标任务对应的组装数据对目标词典文件中各个词典进行更新,例如,以第一预定时间段为周期,获取组装数据中与增量更新任务对应的增量数据,将该增量数据更新到目标词典文件中的各个词典中,其中,该增量数据包括在该第一预定时间段内多个用户对目标词典文件中各个词典进行更新的数据;和/或以第二预定时间段为周期,获取组装数据中与全量更新任务对应的全量数据,其中,该全量数据包括目标词典文件中各个词典的全部词语;将全量数据更新到所述目标词典文件中的各个词典中,该第二预定时间段大于该第一预定时间段。
进一步地,在更新完成之后,记录各个词典多个更新状态,各个词典可以包括通用词典、机构词典以及个人词典中的一种或多种。
根据图2的示例实施例中的技术方案,一方面,通过对词库中的词典进行增量更新来快速实现词典的更新,保证词典更新的时效性;另一方面,通过对词库中的词典进行全量更新,来实现词典更新的一致性;再一方面,记录各个词典的更新状态,能够使客户端根据各个词典的更新状态更新词典,确保客户端与服务器端词典更新的时效性和一致性。
进一步地,在示例实施例中,服务器端为分布式***服务器端,对与目标更新任务对应的数据进行组装,包括:从服务式***的各个节点获取与目标更新任务对应的数据,对获取的各个节点的数据进行组装,目标更新任务包括增量更新任务和/或全量更新任务;基于所述组装数据对分布式式***的各个节点的目标词典文件中各个词典进行更新。通过分布式的方式对词典文件进行更新,能够确保分布式***中各个节点中的词典更新的时效性和一致性。
图3为根据本发明的另一些实施例提供的词典更新方法的流程示意图。
参照图3所示,在步骤S310中,对与目标更新任务对应的数据进行组装。
在示例实施例中,目标更新任务包括增量更新任务和/或全量更新任务。增量更新任务为对第一预定时间段的各个词典的增量数据进行更新的任务;全量更新任务为对第二预定时间段的各个词典的全量数据进行更新的任务,第二预定时间段大于第一预定时间段。
进一步地,对与目标更新任务对应的数据进行组装,生成组装数据,组装数据包括增量数据和/或全量数据。例如,对在第一预定时间段内用户对通用词典、机构词典、个人词典的增加、删除、修改等行为产生的数据进行组装;和/或对第二预定时间段内词典文件中的各个词典的数据进行组装。
各个词典包括:通用词典、机构词典以及个人词典,其中,通用词典包括错词词典、译文词典、不规范名词词典、敏感词词典等词典;机构词典包括错词词典、不规范名词词典、敏感词词典等词典;个人词典包括错词词典、不规范名词词典、敏感词词典等词典。
在步骤S320中,获取目标更新任务对应的数据,将数据写入到词典文件中。
在示例实施例中,以第一预定时间段为周期,获取组与增量更新任务对应的增量数据,将该增量数据更新到目标词典文件中的各个词典中,其中,该增量数据包括在该第一预定时间段内多个用户对目标词典文件中各个词典进行更新的数据;和/或以第二预定时间段为周期,获取与全量更新任务对应的全量数据,其中,该全量数据包括目标词典文件中各个词典的全部词语;将全量数据更新到所述目标词典文件中的各个词典中,该第二预定时间段大于该第一预定时间段。
进一步地,在示例实施例中,词典文件命名格式为以下格式:
1)通用词库:错词库wrongword_1.dict;敏感词库worddetect_1.dict;不规范名词nonstandardword_1.dict;术语译文termtrans_1.dict
注:_1表示通用词库
2)机构词库:敏感词库worddetect_2_1.dict;worddetect_2_2.dict;……;worddetect_2_1000.dict
错词库wrongword_2_1.dict,;wrongword_2_2.dict;……:wrongword_2_1000.dict
不规范名词nonstandardword_2_1.dict
注:_2表示机构词库;_2_1表示机构词库下的第1个机构;_2_2表示机构词库下的第2个机构;……;_2_1000表示机构词库下的第1000个机构
3)个人词库:单个机构下的个人作为一个词典
敏感词库worddetect_3_1_1.dict,;worddetect_3_1_2.dict;……;worddetect_3_1_n.dict
错词库wrongword_3_1_1.dict;wrongword_3_1_2.dict;……;wrongword_3_1_n.dict
不规范名词:nonstandardword_3_1_1.dict;nonstandardword_3_1_2.dict;……;nonstandardword_3_1_n.dict
注:第一个位置“_3”表示单个机构下的个人词典,第二个位置“_1”表示对应的机构id,第二个位置“_n”表示对应机构下的个人id
需要说明的是,上述词典文件命名格式仅为示例性说明,本发明的实施例中也可以采用其他适当的词典文件命名格式,本申请对此不进行特殊限定。
在步骤S330中,对词典状态进行更新。
在示例实施例中,记录词典最后一次更新的时间戳,在完成一次更新之后,要定时检测是否存在新的目标更新任务,实现词典的定时迭代更新。
在步骤S340中,向客户端提供状态查询服务。
在示例实施例中,在接收到客户端或词典引擎端发送的状态查询请求,向客户端返回各个词典的更新状态。
在步骤S350中,若客户端检测到服务器端的目标词典已更新,则从服务器端的词典文件中重新加载该目标词典。
图4为根据本发明的再一些实施例提供的词典更新方法的流程示意图。
参照图4所示,在步骤S410中,加载各个词典,例如通用词典、机构词典、个人词典。
在示例实施例中,客户端启动词典服务时,获取词典文件中的全部词典,并加载全部词典,全部词典包括通用词典、机构词典、个人词典等。
在步骤S420中,获取各个词典的更新状态。
在示例实施例中,周期性从服务器端获取各个词典的更新状态码,检测各个词典的更新状态,更新状态码为表示词典是否已更新的代码,例如代码1表示已更新,0表示未更新。
在步骤S430中,基于各个词典的更新状态确定词典是否已更新,若词典已更新,则进行至步骤S440中,若词典未更新,则进行至步骤S420中。
在步骤S440中,从服务器端重新加载已更新的词典。
根据图4的示例实施例中的技术方案,一方面,通过在客户端定时或周期性从服务器端获取各个词典的更新状态,基于各个词典的更新状态更新各个词典,能够保持客户端与服务器端的词典更新的时效性与一致性;另一方面,使得不同的用户能够根据自己的业务需求,更新通用词库、机构词库、个人词库;再一方面,能够在业务不中断的情况下更新词库,并能够在客户端及时并且一致性地更新,同时方便维护人员对词库的管理。
图5为根据本发明的又一些实施例提供的词典更新方法的流程示意图。
参照图5所示,在步骤S510中,加载各个词典,例如通用词典、机构词典、个人词典。
在示例实施例中,客户端启动词典服务时,获取词典文件中的全部词典,并加载全部词典,全部词典包括通用词典、机构词典、个人词典等。
在步骤S520中,获取通用词典、机构词典的更新状态。
在示例实施例中,定时或周期性从服务器端获取通用词典、机构词典的更新状态码,检测通用词典、机构词典中各个词典的更新状态,更新状态码为表示词典是否已更新的代码,例如代码1表示已更新,0表示未更新。
在步骤S530中,基于各个词典的更新状态确定词典是否已更新,若词典已更新,则进行至步骤S540中,若词典未更新,则进行至步骤S520中。
在步骤S540中,从服务器端重新加载已更新的词典。
在步骤S550中,响应于个人词典更新请求任务,向服务器端发送个人词典更新状态查询请求。
在步骤S560中,从服务器端获取个人词典的更新状态。
在步骤S570中,基于个人词典的更新状态确定个人词典中是否存在已更新的词典,若存在已更新的词典,则进行至步骤S580;若不存在已更新的词典,则进行至步骤S560。
在步骤S580中,从服务器端重新加载该词典。
在示例实施例中个,个人词典的加载方式包括以下两种:(1)随客户端的词典服务的启动同步加载个人词典,个人词典在内存中长期存在;(2)响应于个人词典更新任务来启动加载个人词典。
根据图5的示例实施例中的技术方案,一方面,通过在客户端定时或周期性从服务器端获取各个词典的更新状态,基于各个词典的更新状态更新词典,能够保持客户端与服务器端的词典更新的时效性与一致性;另一方面,通过任务驱动个人词典更新,能够实现词典的动态更新,使得不同的用户能够根据自己的业务需求,更新个人词库;再一方面,能够在业务不中断的情况下更新词库,并能够在客户端及时并且一致性地更新,同时方便维护人员对词库的管理。
图6为根据本发明的另一些实施例提供的词典更新方法的流程示意图。
参照图6所示,在步骤S610中,在从服务器端获取所述客户端中各个词典的更新状态,其中,所述更新状态用于指示所述词典在所述服务器端是否已更新;
在步骤S620中,若所述更新状态指示所述词典在所述服务器端已更新,则从所述服务器端加载已更新的所述词典,其中,所述服务器端配置有目标更新任务,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务。
在本发明的一些实施例中,基于图6的技术方案,所述词典包括个人词典,所述方法还包括:响应于对所述个人词典的更新任务,获取所述个人词典的所述更新状态;根据所述更新状态确定所述个人词典是否已更新;若已更新,则重新加载所述个人词典。
根据图6的示例实施例中的技术方案,一方面,通过在客户端定时或周期性从服务器端获取各个词典的更新状态,基于各个词典的更新状态更新词典,能够保持客户端与服务器端的词典更新的时效性与一致性;另一方面,通过任务驱动个人词典更新,能够实现词典的动态更新,使得不同的用户能够根据自己的业务需求,更新个人词库;再一方面,能够在业务不中断的情况下更新词库,并能够在客户端及时并且一致性地更新,同时方便维护人员对词库的管理。
图6的示例实施例中的词典更新方法的步骤与上述图5中的词典更新方法的步骤的执行过程类似,在此不再赘述。
图7为根据本发明的一些实施例提供的词典更新装置的示意框图。参照图7所示,该词典更新装置700应用于服务器端,该词典更新装置700包括:数据组装模块710,用于对与目标更新任务对应的数据进行组装,生成组装数据,其中,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务;更新模块720,用于基于所述组装数据对所述目标词典文件中各个词典进行更新,并生成各个词典对应的更新状态。
在本发明的一些实施例中,基于上述方案,所述目标更新任务包括所述增量更新任务,所述更新模块包括:增量数据获取单元,用于以第一预定时间段为周期,获取所述组装数据中与所述增量更新任务对应的增量数据,其中,所述增量数据包括在所述第一预定时间段内多个用户对所述目标词典文件中各个词典进行更新的数据;增量更新单元,用于将所述增量数据更新到所述目标词典文件中的各个词典中。
在本发明的一些实施例中,基于上述方案,所述目标更新任务包括所述全量更新任务,所述更新模块包括:全量数据获取单元,用于以第二预定时间段为周期,获取所述组装数据中与所述全量更新任务对应的全量数据,其中,所述全量数据包括所述目标词典文件中各个词典的全部词语;全量更新单元,用于将所述全量数据更新到所述目标词典文件中的各个词典中,所述第二预定时间段大于所述第一预定时间段。
在本发明的一些实施例中,基于上述方案,所述装置还包括:状态发送单元,用于响应于所述客户端发送的更新状态查询请求,向所述客户端返回所述目标词典文件中各个词典的所述更新状态。
在本发明的一些实施例中,基于上述方案,所述词典包括通用词典、机构词典以及个人词典中的一种或多种。
在本发明的一些实施例中,基于上述方案,所述服务器端为分布式***端。
本申请实施例提供的词典更新装置能够实现前述方法实施例中的各个过程,并达到相同的功能和效果,这里不再重复。
图8为根据本发明的另一些实施例提供的词典更新装置的示意框图。参照图8所示,该词典更新装置800应用于客户端,该词典更新装置800包括:更新状态获取模块810,用于从服务器端获取所述客户端中各个词典的更新状态,其中,所述更新状态用于指示所述词典在所述服务器端是否已更新;词典加载模块820,用于若所述更新状态指示所述词典在所述服务器端已更新,则从所述服务器端加载已更新的所述词典,其中,所述服务器端配置有目标更新任务,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务。
在本发明的一些实施例中,基于上述方案,所述词典包括个人词典,所述装置还包括:个人词典更新状态获取模块,用于响应于对所述个人词典的更新任务,获取所述个人词典的所述更新状态;更新判断模块,用于根据所述更新状态确定所述个人词典是否已更新;重新加载模块,用于若已更新,则重新加载所述个人词典。
本申请实施例提供的词典更新装置能够实现前述方法实施例中的各个过程,并达到相同的功能和效果,这里不再重复。
图9示出了本发明的一些实施例提供的词典更新设备实施例一的结构示意图,如图9所示,本实施例提供的词典更新设备900可以包括:存储器910以及处理器920。
可选的,该词典更新设备还可以包括总线。其中,总线用于实现各元件之间的连接。
所述存储器用于存储计算机程序和数据,所述处理器调用存储器存储的计算机程序,以执行前述任一方法实施例提供的词典更新方法的技术方案。
其中,存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接,如可以通过总线连接。存储器中存储有实现数据访问控制方法的计算机执行指令,包括至少一个可以软件或固件的形式存储于存储器中的软件功能模块,处理器通过运行存储在存储器内的计算机程序以及模块,从而执行各种功能应用以及词典更新。
存储器可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(Programmable Read-OnlyMemory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。进一步地,上述存储器内的软件程序以及模块还可包括操作***,其可包括各种用于管理***任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通信,从而提供其他软件组件的运行环境。
处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、网络处理器(NetworkProcessor,简称:NP)等。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。可以理解,图9的结构仅为示意,还可以包括比图9中所示更多或者更少的组件,或者具有与图9所示不同的配置。图9中所示的各组件可以采用硬件和/或软件实现。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现上述任一方法实施例提供的词典更新方法。
本实施例中的计算机可读存储介质可以是计算机能够存取的任何可用介质,或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备,可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如SSD)等。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种词典更新方法,其特征在于,应用于服务器端,所述方法包括:
对与目标更新任务对应的数据进行组装,生成组装数据,其中,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务;
基于所述组装数据对所述目标词典文件中各个词典进行更新,并生成各个词典对应的更新状态;
所述目标更新任务包括所述增量更新任务,所述基于所述组装数据对所述目标词典文件中各个词典进行更新,包括:
以第一预定时间段为周期,获取所述组装数据中与所述增量更新任务对应的增量数据,其中,所述增量数据包括在所述第一预定时间段内多个用户对所述目标词典文件中各个词典进行更新的数据;
将所述增量数据更新到所述目标词典文件中的各个词典中;
所述目标更新任务包括所述全量更新任务,所述基于所述组装数据对所述目标词典文件中各个词典进行更新,包括:
以第二预定时间段为周期,获取所述组装数据中与所述全量更新任务对应的全量数据,其中,所述全量数据包括所述目标词典文件中各个词典的全部词语;
将所述全量数据更新到所述目标词典文件中的各个词典中,所述第二预定时间段大于所述第一预定时间段。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于客户端发送的更新状态查询请求,向客户端返回所述目标词典文件中各个词典的所述更新状态。
3.根据权利要求1或2所述的方法,其特征在于,所述词典包括通用词典、机构词典以及个人词典中的一种或多种。
4.根据权利要求3所述的方法,其特征在于,所述服务器端为分布式***端。
5.一种词典更新方法,其特征在于,应用于客户端,所述方法包括:
从服务器端获取所述客户端中各个词典的更新状态,其中,所述更新状态用于指示所述词典在所述服务器端是否已更新;
若所述更新状态指示所述词典在所述服务器端已更新,则从所述服务器端加载已更新的所述词典,其中,所述服务器端配置有目标更新任务,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务;增量数据是用于以第一预定时间段为周期对与所述增量更新任务对应的增量数据进行更新的数据,所述增量数据包括在第一预定时间段内多个用户对所述目标词典文件中各个词典进行更新的数据;全量数据是用于以第二预定时间段为周期对与所述全量更新任务对应的全量数据进行更新的数据,所述全量数据包括所述目标词典文件中各个词典的全部词语;所述第二预定时间段大于所述第一预定时间段。
6.根据权利要求5所述的方法,其特征在于,所述词典包括个人词典,所述方法还包括:
响应于对所述个人词典的更新任务,获取所述个人词典的所述更新状态;
根据所述更新状态确定所述个人词典是否已更新;
若已更新,则重新加载所述个人词典。
7.一种词典更新装置,其特征在于,应用于服务器端,所述装置包括:
数据组装模块,用于对与目标更新任务对应的数据进行组装,生成组装数据,其中,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务;
更新模块,用于基于所述组装数据对所述目标词典文件中各个词典进行更新,并生成各个词典对应的更新状态;
所述目标更新任务包括所述增量更新任务,所述更新模块包括:
增量数据获取单元,用于以第一预定时间段为周期,获取所述组装数据中与所述增量更新任务对应的增量数据,其中,所述增量数据包括在所述第一预定时间段内多个用户对所述目标词典文件中各个词典进行更新的数据;
增量更新单元,用于将所述增量数据更新到所述目标词典文件中的各个词典中;
所述目标更新任务包括所述全量更新任务,所述更新模块包括:
全量数据获取单元,用于以第二预定时间段为周期,获取所述组装数据中与所述全量更新任务对应的全量数据,其中,所述全量数据包括所述目标词典文件中各个词典的全部词语;
全量更新单元,用于将所述全量数据更新到所述目标词典文件中的各个词典中,所述第二预定时间段大于所述第一预定时间段。
8.一种词典更新装置,其特征在于,应用于客户端,所述装置包括:
更新状态获取模块,用于从服务器端获取所述客户端中各个词典的更新状态,其中,所述更新状态用于指示所述词典在所述服务器端是否已更新;
词典加载模块,用于若所述更新状态指示所述词典在所述服务器端已更新,则从所述服务器端加载已更新的所述词典,其中,所述服务器端配置有目标更新任务,所述目标更新任务为对目标词典文件中各个词典进行更新的任务,所述目标更新任务包括增量更新任务和/或全量更新任务;增量数据是用于以第一预定时间段为周期对与所述增量更新任务对应的增量数据进行更新的数据,所述增量数据包括在第一预定时间段内多个用户对所述目标词典文件中各个词典进行更新的数据;全量数据是用于以第二预定时间段为周期对与所述全量更新任务对应的全量数据进行更新的数据,所述全量数据包括所述目标词典文件中各个词典的全部词语;所述第二预定时间段大于所述第一预定时间段。
9.一种词典更新设备,其特征在于,包括:处理器以及存储器;所述存储器用于存储计算机程序和数据,所述处理器调用存储器存储的计算机程序,以执行权利要求1至6中任一项所述的词典更新方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机程序,所述计算机程序在被处理器执行时用于执行权利要求1至6中任一项所述的词典更新方法。
CN201911353606.2A 2019-12-25 2019-12-25 词典更新方法、装置、设备和存储介质 Active CN111125257B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911353606.2A CN111125257B (zh) 2019-12-25 2019-12-25 词典更新方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911353606.2A CN111125257B (zh) 2019-12-25 2019-12-25 词典更新方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111125257A CN111125257A (zh) 2020-05-08
CN111125257B true CN111125257B (zh) 2023-09-05

Family

ID=70502782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911353606.2A Active CN111125257B (zh) 2019-12-25 2019-12-25 词典更新方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111125257B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256669A (zh) * 2020-09-27 2021-01-22 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN112988690B (zh) * 2021-03-16 2023-02-17 挂号网(杭州)科技有限公司 词典文件同步方法、装置、服务器及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1294352A (zh) * 1999-10-20 2001-05-09 英业达集团(西安)电子技术有限公司 掌上型个人电脑的数据自动更新的装置与方法
CN1647072A (zh) * 2002-07-24 2005-07-27 卡西欧计算机株式会社 电子词典终端、电子词典服务器以及记录介质
JP2005222492A (ja) * 2004-02-09 2005-08-18 Sharp Corp 電子機器、電子辞書更新システム、辞書更新処理プログラムおよび辞書更新処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007034801A (ja) * 2005-07-28 2007-02-08 Orion Denki Kk 辞書更新システム及び辞書更新方法
CN101470745A (zh) * 2007-12-27 2009-07-01 英业达股份有限公司 电子字典的更新方法
CN109446205A (zh) * 2017-08-28 2019-03-08 中国电信股份有限公司 判断数据状态的装置和方法以及数据更新的装置和方法
CN109582344A (zh) * 2018-11-27 2019-04-05 北京车和家信息技术有限公司 增量更新方法、装置、云服务器及计算机可读存储介质
CN110298031A (zh) * 2019-05-28 2019-10-01 北京百度网讯科技有限公司 一种词典服务***及模型版本一致性配送方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004280574A (ja) * 2003-03-17 2004-10-07 Internatl Business Mach Corp <Ibm> 翻訳システム、辞書更新サーバ、翻訳方法、及び、これらのプログラムと記録媒体
US20100274839A1 (en) * 2009-04-28 2010-10-28 Inventec Corporation Updating system for word banks and the method thereof
CN106649415B (zh) * 2015-11-03 2019-12-20 广州市动景计算机科技有限公司 客户端数据检查更新方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1294352A (zh) * 1999-10-20 2001-05-09 英业达集团(西安)电子技术有限公司 掌上型个人电脑的数据自动更新的装置与方法
CN1647072A (zh) * 2002-07-24 2005-07-27 卡西欧计算机株式会社 电子词典终端、电子词典服务器以及记录介质
JP2005222492A (ja) * 2004-02-09 2005-08-18 Sharp Corp 電子機器、電子辞書更新システム、辞書更新処理プログラムおよび辞書更新処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007034801A (ja) * 2005-07-28 2007-02-08 Orion Denki Kk 辞書更新システム及び辞書更新方法
CN101470745A (zh) * 2007-12-27 2009-07-01 英业达股份有限公司 电子字典的更新方法
CN109446205A (zh) * 2017-08-28 2019-03-08 中国电信股份有限公司 判断数据状态的装置和方法以及数据更新的装置和方法
CN109582344A (zh) * 2018-11-27 2019-04-05 北京车和家信息技术有限公司 增量更新方法、装置、云服务器及计算机可读存储介质
CN110298031A (zh) * 2019-05-28 2019-10-01 北京百度网讯科技有限公司 一种词典服务***及模型版本一致性配送方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王维 ; 高晓利 ; .基于增量信息的分布式多周期决策融合方法.电子科技.2018,(第08期),全文. *

Also Published As

Publication number Publication date
CN111125257A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
US10824608B2 (en) Feature generation and storage in a multi-tenant environment
US11221995B2 (en) Data replication from a cloud-based storage resource
US20210149895A1 (en) Query conversion for querying disparate data sources
CN110266505B (zh) 一种管理会话群的方法与设备
CN105283847A (zh) 本地存储数据版本控制
US8856365B2 (en) Computer-implemented method, computer system and computer readable medium
CN111125257B (zh) 词典更新方法、装置、设备和存储介质
US20140365427A1 (en) Smart polling frequency
US9116808B2 (en) Method and system for determining device configuration settings
EP4052126A1 (en) Management of multiple physical function non-volatile memory devices
CN108667660B (zh) 路由管理和业务路由的方法和装置及路由***
CN112256676A (zh) 一种数据库迁移的方法、装置、设备和介质
CN112948498A (zh) 一种分布式***全局标识的生成方法和装置
CN111338834B (zh) 数据存储方法和装置
CN113806305A (zh) 数据导出方法及装置、计算机可读存储介质及电子设备
CN111581239A (zh) 缓存刷新方法和电子设备
CN111400350A (zh) 配置数据读取方法、***、电子设备和存储介质
CN114461691A (zh) 状态机的控制方法、装置、电子设备及存储介质
US20230205619A1 (en) Common platform for fulfilling different actions
CN114218013A (zh) 搜索方法、装置、电子设备存储介质
CN113507529A (zh) 基于Web应用实现文件下载的方法
CN113110846A (zh) 一种环境变量的获取方法及装置
CN114968216A (zh) 应用程序开发工程生成方法和装置
CN112948733A (zh) 接口维护方法、装置、计算设备以及介质
CN110168521B (zh) 数据处理装置及数据处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230703

Address after: 3007, Hengqin International Financial Center Building, No. 58 Huajin Street, Hengqin New District, Zhuhai City, Guangdong Province, 519030

Applicant after: New founder holdings development Co.,Ltd.

Applicant after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District, Cheng Fu Road, No. 298, Zhongguancun Fangzheng building, 9 floor

Applicant before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Applicant before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

GR01 Patent grant
GR01 Patent grant