CN109783444A - 多通道文件索引方法、装置、计算机设备和存储介质 - Google Patents

多通道文件索引方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109783444A
CN109783444A CN201811600546.5A CN201811600546A CN109783444A CN 109783444 A CN109783444 A CN 109783444A CN 201811600546 A CN201811600546 A CN 201811600546A CN 109783444 A CN109783444 A CN 109783444A
Authority
CN
China
Prior art keywords
index file
file
data
new
updated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811600546.5A
Other languages
English (en)
Inventor
张小军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asiainfo Technologies China Inc
Original Assignee
Asiainfo Technologies China Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asiainfo Technologies China Inc filed Critical Asiainfo Technologies China Inc
Priority to CN201811600546.5A priority Critical patent/CN109783444A/zh
Publication of CN109783444A publication Critical patent/CN109783444A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种多通道文件索引方法、装置、计算机设备和存储介质。所述方法包括:检测临时表中数据更新信息;根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道;通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新;其中,所述从索引文件通道用于进行文件查询。采用本方法能够保证数据查询和数据更新的实时性。

Description

多通道文件索引方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种多通道文件索引方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的发展,人们对数据搜索性能的要求越来越高,为了从海量数据快速搜索到目标文件,出现了Lucene索引技术,通过分布式搜索来提高文件的搜索效率。Lucene是一个基于Java的全文信息检索工具包,它不是一个完整的搜索应用程序,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标***中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎,大多数用于***的搜索应用,支持多种规则的搜索,比如全拼搜索、简拼搜索。基于目前Lucene索引技术,当用户需求查询文件的时,从一个类似文本文件的(index)直接查询,而不接触任何数据库,以保证数据的准确性和实时性。
然而,通过index进行文件查询时,无法进行数据更新,或者进行数据更新时,无法进行文件查询,无法保证数据查询的实时性。
发明内容
基于此,有必要针对上述技术问题,提供一种能够保证数据查询实时性的多通道文件索引方法、装置、计算机设备和存储介质。
一种多通道文件索引方法,所述方法包括:
检测临时表中数据更新信息;
根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道;
通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新;
其中,所述从索引文件通道用于进行文件查询。
在其中一个实施例中,在通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新之后,包括:
接收所述主索引文件更新成功信息;
根据所述更新成功信息,开启所述主索引文件通道,关闭所述从索引文件通道;
通过所述从索引文件通道获取所述临时表中更新数据,对从索引文件进行更新;
其中,所述主索引文件通道用于进行文件查询。
在其中一个实施例中,所述从索引文件通道至少为一个。
在其中一个实施例中,所述对索引文件进行更新包括:在索引文件的目录中对所述更新数据添加新条目,所述索引文件包括主索引文件和从索引文件;在所述新条目中保存所述更新数据在数据库中的地址,其中,所述新条目用于对所述更新数据进行查询。
在其中一个实施例中,所述方法还包括:判断当前时间是否为目录更新时间;如果当前时间为目录更新时间,对所述索引文件的目录进行更新;其中所述更新包括:将所述目录中的条目合并到同一条目下和/或将所述目录中的条目删除。
在其中一个实施例中,所述索引文件包括目录关联源文件、分词器、索引配置信息和拼音信息存放文档中至少一种。
在其中一个实施例中,所述方法还包括:根据查询条件获取预先定义的分词规则;根据所述分词规则查询所述文件。
一种多通道文件索引装置,所述装置包括:
数据更新检测模块,用于检测临时表中数据更新信息;
通道选择模块,用于根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道;
更新模块,用于通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新;
其中,所述从索引文件通道用于进行文件查询。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
检测临时表中数据更新信息;
根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道;
通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新;
其中,所述从索引文件通道用于进行文件查询。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
检测临时表中数据更新信息;
根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道;
通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新;
其中,所述从索引文件通道用于进行文件查询。
上述多通道文件索引方法、装置、计算机设备和存储介质,通过设置多个文件索引通道,当需要进行数据更新时,对主索引文件通道进行数据更新,通过从索引文件通道进行文件查询,保证了数据查询和数据更新的实时性。
附图说明
图1为一个实施例中多通道文件索引方法的流程示意图;
图2为一个实施例中从索引文件通道数据更新步骤的流程示意图;
图3为一个具体实施例中从索引文件通道数据更新的流程示意图;
图4为一个实施例中多通道文件索引装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种多通道文件索引方法,包括以下步骤:
步骤S110,检测临时表中数据更新信息。
其中,数据库进行数据更新时,更新的数据首先会保存在临时表中,通过查看临时表能够获取数据更新信息。
步骤S120,根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道。
其中,所述开启和关闭是针对文件查询而言,关闭主索引文件通道表示不能通过主索引文件通道进行文件查询,启动从索引文件通道表示能够通过从索引文件通道进行文件查询。
其中,在步骤S120之前,主索引文件通道和从索引文件通道数据是一致的。所述从索引文件通道至少为一个,在主索引文件通道进行数据更新或者不可用时,通过从索引文件通道进行文件查询。
具体的,在进行数据更新时,优先对主索引文件通道进行数据更新,再对从索引文件通道进行数据更新。从索引文件通道可以通过复制主索引文件通道数据建立,或者对主索引文件通道进行映射来建立从索引文件通道。
步骤S130,通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新。
其中,对主索引文件进行更新包括:在主索引文件的目录中对所述更新数据添加新条目;在所述新条目中保存所述更新数据在数据库中的地址,其中,所述新条目可用于对所述更新数据进行查询。
本实施例中,所述从索引文件通道用于进行文件查询。
在其中一个实施例中,一种多通道文件索引方法,还包括:判断当前时间是否为目录更新时间;如果当前时间为目录更新时间,对所述索引文件的目录进行更新;其中,所述更新包括:将所述目录中的条目合并到同一条目下和/或将所述目录中的条目删除。其中,索引文件包括主索引文件和从索引文件。索引文件的目录进行更新后,目录下会新增许多条目,条目的增多会影响文件的查询效率,因此,在目录更新时间对所述索引文件的目录进行优化,对条目进行整合,以提高文件的查询效率。目录更新时间可以人为设置,可以设置为周期性的目录更新时间,目录更新时间的间隔可以为一周、一个月或者半年,可以根据目录更新的情况设定。
在其中一个实施例中,所述索引文件包括目录关联源文件、分词器、索引配置信息和拼音信息存放文档中至少一种。其中,所述目录关联源文件用于将每台服务主机的文件目录映射到执行主机的目录,便于lucene索引文件分发至各台服务主机,在lucene框架下包括多台主机,能够同时提供多个服务;所述分词器用于对用户输入的搜索文本按规则取出所包含的所有关键字;所述索引配置信息用于根据分词器取出的关键字,确定索引的打开方式,打开方式包括新建和追加,再对存储器配置缓冲区大小、更新缓存文档的个数,还可对缓冲区进行合并或删除;所述拼音信息存放文档用于存放全拼搜索或简拼搜索时的拼音信息。
上述多通道文件索引方法中,通过设置多个文件索引通道,当需要进行数据更新时,对主索引文件通道进行数据更新,通过从索引文件通道进行文件查询,保证了数据查询和数据更新的实时性。
在其中一个实施例中,如图2所示,在通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新之后,包括步骤:
步骤S140,接收所述主索引文件更新成功信息。
其中,主索引文件进行更新之后会生成所述主索引文件更新成功信息,用于表示数据已经更新成功。
具体的,所述主索引文件更新成功信息可以通过一个第一标识来表示,当然,主索引文件更新失败或者未更新完全,可以通过第二标识来表示。
步骤S150,根据所述更新成功信息,开启所述主索引文件通道,关闭所述从索引文件通道。
其中,所述开启和关闭是针对文件查询而言,开启所述主索引文件通道表示能够通过所述主索引文件通道进行文件查询,关闭所述从索引文件通道表示不能通过所述从索引文件通道进行文件查询。
步骤S160,通过所述从索引文件通道获取所述临时表中更新数据,对从索引文件进行更新。
其中,所述主索引文件通道用于进行文件查询。对从索引文件进行更新包括:在从索引文件的目录中对所述更新数据添加新条目;在所述新条目中保存所述更新数据在数据库中的地址,其中,所述新条目可用于对所述更新数据进行查询。
在其中一个实施例中,一种多通道文件索引方法,还包括:根据查询条件获取预先定义的分词规则;根据所述分词规则查询所述文件。其中,查询条件可以结合用户所使用的应用确定,例如,用户使用网页进行搜索,则采用网页分词规则,用户采用客户端进行搜索,则采用客户端分词规则。每个分词规则有一个与之匹配的分词器,分词器用于对用户输入的搜索文本按规则取出所包含的所有关键字。
在一个具体实施例中,如图3所示,展示了从索引文件通道数据更新的流程示意图。在图3中,用户发出搜索命令,lucene框架生成lucene索引文件,根据主索引文件通道的状态选择文件查询通道,此时,主索引文件通道是开启的,从索引文件通道是关闭的;根据lucene索引文件,通过主索引文件通道,队列查询数据库全量地址资源数据,在执行主机(执行主机地址:10.10.104.192)生成索引文件、并对索引文件写入数据,并根据执行主机的目录查询服务主机的文件目录,将写入数据的索引文件分发到服务主机(服务主机的地址分别为:10.10.104.191、10.10.104.193、10.10.104.194);此时,lucene框架队列查询数据库全量地址资源数据,增量数据写入临时表,从索引文件通道队列读取临时表中数据,通过磁盘映射的方式更新多台主机(主机的地址分别为:10.10.104.191、10.10.104.192、10.10.104.193、10.10.104.194)中的索引文件。
应该理解的是,虽然图1-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种多通道文件索引装置,包括:数据更新检测模块210、通道选择模块220和更新模块230,其中:
数据更新检测模块210,用于检测临时表中数据更新信息。
通道选择模块220,用于根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道。
更新模块230,用于通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新。
其中,对主索引文件进行更新包括:在主索引文件的目录中对所述更新数据添加新条目;在所述新条目中保存所述更新数据在数据库中的地址,其中,所述新条目可用于对所述更新数据进行查询。
其中,所述从索引文件通道用于进行文件查询。
在其中一个实施例中,一种多通道文件索引装置,还包括:优化模块,用于判断当前时间是否为目录更新时间,如果当前时间为目录更新时间,对所述索引文件的目录进行更新;其中,所述更新包括:将所述目录中的条目合并到同一条目下和/或将所述目录中的条目删除。其中,索引文件包括主索引文件和从索引文件。索引文件的目录进行更新后,目录下会新增许多条目,条目的增多会影响文件的查询效率,因此,在目录更新时间对所述索引文件的目录进行优化,对条目进行整合,以提高文件的查询效率。目录更新时间可以人为设置,可以设置为周期性的目录更新时间,目录更新时间的间隔可以为一周、一个月或者半年,可以根据目录更新的情况设定。
在其中一个实施例中,所述索引文件包括目录关联源文件、分词器、索引配置信息和拼音信息存放文档中至少一种。其中,所述目录关联源文件用于将每台服务主机的文件目录映射到执行主机的目录,便于lucene索引文件分发至各台服务主机,在lucene框架下包括多台主机,能够同时提供多个服务;所述分词器用于对用户输入的搜索文本按规则取出所包含的所有关键字;所述索引配置信息用于根据分词器取出的关键字,确定索引的打开方式,打开方式包括新建和追加,再对存储器配置缓冲区大小、更新缓存文档的个数,还可对缓冲区进行合并或删除;所述拼音信息存放文档用于存放全拼搜索或简拼搜索时的拼音信息。
在其中一个实施例中,一种多通道文件索引装置,还包括:更新成功信息获取模块,用于接收所述主索引文件更新成功信息;所述通道选择模块220,还用于根据所述更新成功信息,开启所述主索引文件通道,关闭所述从索引文件通道;所述更新模块230,还用于通过所述从索引文件通道获取所述临时表中更新数据,对从索引文件进行更新。
其中,所述主索引文件通道用于进行文件查询。对从索引文件进行更新包括:在从索引文件的目录中对所述更新数据添加新条目;在所述新条目中保存所述更新数据在数据库中的地址,其中,所述新条目可用于对所述更新数据进行查询。
在其中一个实施例中,一种多通道文件索引装置,还包括:分词规则定义模块,用于根据查询条件获取预先定义的分词规则;查询模块,用于根据所述分词规则查询所述文件。其中,查询条件可以结合用户所使用的应用确定,例如,用户使用网页进行搜索,则采用网页分词规则,用户采用客户端进行搜索,则采用客户端分词规则。每个分词规则有一个与之匹配的分词器,分词器用于对用户输入的搜索文本按规则取出所包含的所有关键字。
关于多通道文件索引装置的具体限定可以参见上文中对于多通道文件索引方法的限定,在此不再赘述。上述多通道文件索引装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储全量地址资源数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多通道文件索引方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
检测临时表中数据更新信息;
根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道;
通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新;
其中,所述从索引文件通道用于进行文件查询。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:接收所述主索引文件更新成功信息;根据所述更新成功信息,开启所述主索引文件通道,关闭所述从索引文件通道;通过所述从索引文件通道获取所述临时表中更新数据,对从索引文件进行更新;其中,所述主索引文件通道用于进行文件查询。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
检测临时表中数据更新信息;
根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道;
通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新;
其中,所述从索引文件通道用于进行文件查询。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收所述主索引文件更新成功信息;根据所述更新成功信息,开启所述主索引文件通道,关闭所述从索引文件通道;通过所述从索引文件通道获取所述临时表中更新数据,对从索引文件进行更新;其中,所述主索引文件通道用于进行文件查询。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种多通道文件索引方法,其特征在于,所述方法包括:
检测临时表中数据更新信息;
根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道;
通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新;
其中,所述从索引文件通道用于进行文件查询。
2.根据权利要求1所述的方法,其特征在于,在通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新之后,包括:
接收所述主索引文件更新成功信息;
根据所述更新成功信息,开启所述主索引文件通道,关闭所述从索引文件通道;
通过所述从索引文件通道获取所述临时表中更新数据,对从索引文件进行更新;
其中,所述主索引文件通道用于进行文件查询。
3.根据权利要求1或2所述的方法,其特征在于,所述从索引文件通道至少为一个。
4.根据权利要求2所述的方法,其特征在于,所述对索引文件进行更新包括:
在索引文件的目录中对所述更新数据添加新条目,所述索引文件包括主索引文件和从索引文件;
在所述新条目中保存所述更新数据在数据库中的地址,其中,所述新条目用于对所述更新数据进行查询。
5.根据权利要求4所述的方法,其特征在于,还包括:
判断当前时间是否为目录更新时间;
如果当前时间为目录更新时间,对所述索引文件的目录进行更新;其中所述更新包括:将所述目录中的条目合并到同一条目下和/或将所述目录中的条目删除。
6.根据权利要求1所述的方法,其特征在于,所述索引文件包括目录关联源文件、分词器、索引配置信息和拼音信息存放文档中至少一种。
7.根据权利要求1或2所述的方法,其特征在于,所述方法,还包括:
根据查询条件获取预先定义的分词规则;
根据所述分词规则查询所述文件。
8.一种多通道文件索引装置,其特征在于,所述装置包括:
数据更新检测模块,用于检测临时表中数据更新信息;
通道选择模块,用于根据所述数据更新信息,关闭主索引文件通道,启动从索引文件通道;
更新模块,用于通过所述主索引文件通道获取所述临时表中更新数据,对主索引文件进行更新;
其中,所述从索引文件通道用于进行文件查询。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201811600546.5A 2018-12-26 2018-12-26 多通道文件索引方法、装置、计算机设备和存储介质 Pending CN109783444A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811600546.5A CN109783444A (zh) 2018-12-26 2018-12-26 多通道文件索引方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811600546.5A CN109783444A (zh) 2018-12-26 2018-12-26 多通道文件索引方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN109783444A true CN109783444A (zh) 2019-05-21

Family

ID=66498398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811600546.5A Pending CN109783444A (zh) 2018-12-26 2018-12-26 多通道文件索引方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109783444A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080046396A1 (en) * 2006-05-23 2008-02-21 Jens Gelhar Indexing big word lists in databases
CN101246500A (zh) * 2008-03-27 2008-08-20 腾讯科技(深圳)有限公司 一种实现数据快速索引的检索***和方法
CN101295323A (zh) * 2008-06-30 2008-10-29 腾讯科技(深圳)有限公司 一种用于索引更新的处理方法和***
CN102339315A (zh) * 2011-09-30 2012-02-01 亿赞普(北京)科技有限公司 一种广告数据的索引更新方法和***
CN103198108A (zh) * 2013-03-27 2013-07-10 新浪网技术(中国)有限公司 一种索引数据更新方法、检索服务器及***
CN103678694A (zh) * 2013-12-26 2014-03-26 乐视网信息技术(北京)股份有限公司 视频资源的倒排索引文件建立方法及其***
CN105988996A (zh) * 2015-01-27 2016-10-05 腾讯科技(深圳)有限公司 一种索引文件生成方法及装置
CN108874956A (zh) * 2018-06-05 2018-11-23 中国平安人寿保险股份有限公司 海量文件检索方法、装置、计算机设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080046396A1 (en) * 2006-05-23 2008-02-21 Jens Gelhar Indexing big word lists in databases
CN101246500A (zh) * 2008-03-27 2008-08-20 腾讯科技(深圳)有限公司 一种实现数据快速索引的检索***和方法
CN101295323A (zh) * 2008-06-30 2008-10-29 腾讯科技(深圳)有限公司 一种用于索引更新的处理方法和***
CN102339315A (zh) * 2011-09-30 2012-02-01 亿赞普(北京)科技有限公司 一种广告数据的索引更新方法和***
CN103198108A (zh) * 2013-03-27 2013-07-10 新浪网技术(中国)有限公司 一种索引数据更新方法、检索服务器及***
CN103678694A (zh) * 2013-12-26 2014-03-26 乐视网信息技术(北京)股份有限公司 视频资源的倒排索引文件建立方法及其***
CN105988996A (zh) * 2015-01-27 2016-10-05 腾讯科技(深圳)有限公司 一种索引文件生成方法及装置
CN108874956A (zh) * 2018-06-05 2018-11-23 中国平安人寿保险股份有限公司 海量文件检索方法、装置、计算机设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
樊重俊等: "《大数据分析与应用》", 31 January 2016 *
王玉娇等: "《SQL Server 2008数据库任务教程》", 31 August 2014, 中国铁道出版社 *
赵宇兰: "《oracle数据库应用技术》", 31 May 2014 *

Similar Documents

Publication Publication Date Title
US20150199433A1 (en) Method and system for search engine indexing and searching using the index
CN105808633A (zh) 数据归档方法和***
US11176110B2 (en) Data updating method and device for a distributed database system
CN105279213A (zh) 一种日志数据库检索装置及检索方法
US9292341B2 (en) RPC acceleration based on previously memorized flows
EP3567490B1 (en) Systems and methods for accessing federated data
CN110069264A (zh) 构建资源包的方法、装置、计算机设备和存储介质
CN111083054B (zh) 路由配置处理方法、装置、计算机设备和存储介质
EP3660696B1 (en) Systems and methods for facilitating data transformation
US10241716B2 (en) Global occupancy aggregator for global garbage collection scheduling
US11599396B2 (en) Resegmenting chunks of data based on source type to facilitate load balancing
CN113377789A (zh) 数据库变更数据的处理方法、装置、计算机设备和介质
US11394748B2 (en) Authentication method for anonymous account and server
CN109783444A (zh) 多通道文件索引方法、装置、计算机设备和存储介质
KR20190129474A (ko) 데이터 검색 장치 및 방법
CN112783866B (zh) 数据读取方法、装置、计算机设备和存储介质
CN111625500B (zh) 文件快照方法及装置、电子设备和存储介质
US20210165772A1 (en) Discovering and merging entity record fragments of a same entity across multiple entity stores for improved named entity disambiguation
CN108694219B (zh) 一种数据处理方法及装置
US10037155B2 (en) Preventing write amplification during frequent data updates
US9069751B1 (en) Systems and methods for managing document pedigrees
CN112579705A (zh) 元数据采集方法、装置、计算机设备和存储介质
CN111209304A (zh) 数据处理方法、装置及***
US11734281B1 (en) Database management systems using query-compliant hashing techniques
US11741103B1 (en) Database management systems using query-compliant hashing techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190521