WO2023093607A1

WO2023093607A1 - 一种离线数据模糊搜索方法、装置、设备和介质

Info

Publication number: WO2023093607A1
Application number: PCT/CN2022/132523
Authority: WO
Inventors: 唐智强
Original assignee: 天翼数字生活科技有限公司
Priority date: 2021-11-23
Filing date: 2022-11-17
Publication date: 2023-06-01
Also published as: CN114116762A

Abstract

本发明公开了一种离线数据模糊搜索方法、装置、设备和介质，方法包括：当接收到任一用户端发送的模糊搜索请求信息时，对所述模糊搜索请求信息进行校验；若校验通过，则从所述模糊搜索请求信息提取模糊搜索字段和搜索参数；从预设的缓存数据库逐一获取所述搜索参数对应的分页标识；按照每个所述分页标识依次查询预设的存储数据库，得到每个所述分页标识分别对应的待筛选数据集；按照所述模糊搜索字段筛选每个所述待筛选数据集，得到至少一个目标搜索数据；汇总全部所述目标搜索数据，生成目标搜索数据集并返回至所述用户端。在满足用户需求的同时有效降低服务器负荷，进而有效维护***稳定性。

Description

一种离线数据模糊搜索方法、装置、设备和介质

技术领域

本发明涉及模糊搜索技术领域，尤其涉及一种离线数据模糊搜索方法、装置、设备和介质。

背景技术

随着信息时代的到来，需要处理的数据海量增长。在数据处理之中，经常要在海量数据之中搜索所需的数据，因此如何既迅速又准确地搜索、定位数据对于数据的高效处理至关重要。

现有技术中存在多种数据搜索方法，通常主要采用待搜索的源数据与作为比较标准的模式数据逐个比较，按照相似度进行选取，或是传统语句级别的方式进行数据搜索。

但上述方案在面对海量数据的情况下需要进行不断迭代，难以维持***稳定性，无法灵活快速地进行数据搜索。

发明内容

本发明提供了一种离线数据模糊搜索方法、装置、设备和介质，解决了现有技术在面对海量数据的情况下需要进行不断迭代，难以维持***稳定性，无法灵活快速地进行数据搜索的技术问题。

本发明第一方面提供的一种离线数据模糊搜索方法，包括：

当接收到任一用户端发送的模糊搜索请求信息时，对所述模糊搜索请求信息进行校验；

若校验通过，则从所述模糊搜索请求信息提取模糊搜索字段和搜索参数；

从预设的缓存数据库逐一获取所述搜索参数对应的分页标识；

按照每个所述分页标识依次查询预设的存储数据库，得到每个所述分页标识分别对应的待筛选数据集；

按照所述模糊搜索字段筛选每个所述待筛选数据集，得到至少一个目标搜索数据；

汇总全部所述目标搜索数据，生成目标搜索数据集并返回至所述用户端。

可选地，在所述当接收到任一用户端发送的模糊搜索请求信息时，对所述模糊搜索请求信息进行校验的步骤之前，还包括：

响应接收到的用户配置信息，生成对应的配置文件；

解析所述配置文件，获取所述配置文件内的数据切割规格信息并从所述数据切割规格信息对应的目标数据库读取待切割数据集；

根据所述数据切割规格信息对所述待切割数据集进行数据切割，得到多个已切割数据集；

提取每个所述已切割数据集分别对应的分页标识；

将各个所述分页标识缓存至预设的缓存数据库，并将各个所述已切割数据集缓存至预设的存储数据库。

可选地，所述解析所述配置文件，获取所述配置文件内的数据切割规格信息并从所述数据切割规格信息对应的目标数据库读取待切割数据集的步骤，包括：

解析所述配置文件，获取所述配置文件内的数据切割规格信息；所述数据切割规格信息包括定时任务标识；

若所述定时任务标识为第一预设标识，则按照预设周期读取所述数据切割规格信息对应的目标数据库，获取待切割数据集；

当所述目标数据库读取失败时，返回读取失败提示；

若所述定时任务标识为第二预设标识，则返回所述读取失败提示。

可选地，所述数据切割规格信息包括分段切割规格，所述待切割数据集包括多行待切割数据，每行所述待切割数据具有对应的数据标识；所述根据所述数据切割规格信息对所述待切割数据集进行数据切割，得到多个已切割数据集的步骤，包括：

获取所述数据标识的最小值作为起始标识；

从所述起始标识依次读取所述数据标识，并实时记录读取数量；

当所述读取数量等于所述分段切割规格时，将已读取的数据标识对应的待切割数据确定为已切割数据集并获取已读取的最后一个数据标识；

将所述已读取的最后一个数据标识的下一个数据标识作为新的起始标识，跳转执行所述从所述起始标识依次读取所述数据标识，并实时记录读取数量的步骤，直至全部所述数据标识均已读取，得到多个已切割数据集。

可选地，所述当接收到任一用户端发送的模糊搜索请求信息时，对所述模糊搜索请求信息进行校验的步骤，包括：

当接收到任一用户端发送的模糊搜索请求信息时，解析所述模糊搜索请求信息，得到多个模糊搜索参数；

判断所述模糊搜索参数内是否包括所述模糊搜索字段和所述搜索参数；

若是，则判定校验通过；

若否，则判定校验不通过。

可选地，所述按照每个所述分页标识依次查询预设的存储数据库，得到每个所述分页标识分别对应的待筛选数据集的步骤，包括：

按照每个所述分页标识结合预设的语句规则，分别构建查询语句；

采用所述查询语句查询预设的存储数据库，依次得到每个分页标识分别对应的待筛选数据集。

可选地，所述待筛选数据集包括多行待筛选数据；所述按照所述模糊搜索字段筛选每个所述待筛选数据集，得到至少一个目标搜索数据的步骤，包括：

分别计算各行所述待筛选数据与所述模糊搜索字段之间的字段相似度；

将所述字段相似度大于预设的相似度阈值的待筛选数据确定为目标搜索数据。

本发明第二方面提供了一种离线数据模糊搜索装置，包括：

信息校验模块，用于当接收到任一用户端发送的模糊搜索请求信息时，对所述模糊搜索请求信息进行校验；

模糊查询信息提取模块，用于若校验通过，则从所述模糊搜索请求信息提取模糊搜索字段和搜索参数；

分页标识获取模块，用于从预设的缓存数据库逐一获取所述搜索参数对应的分页标识；

分页标识查询模块，用于按照每个所述分页标识依次查询预设的存储数据库，得到每个所述分页标识分别对应的待筛选数据集；

数据筛选模块，用于按照所述模糊搜索字段筛选每个所述待筛选数据集，得到至少一个目标搜索数据；

数据汇总与返回模块，用于汇总全部所述目标搜索数据，生成目标搜索数据集并返回至所述用户端。

本发明第三方面提供了一种电子设备，包括存储器及处理器，所述存储器中储存有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如本发明第一方面任一项所述的离线数据模糊搜索方法的步骤。

本发明第四方面提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被执行时实现如本发明第一方面任一项所述的离线数据模糊搜索方法。

从以上技术方案可以看出，本发明具有以下优点：

当接收到任一用户端发送的模糊搜索请求信息时，对模糊搜索请求信息进行校验；若校验通过，则从模糊搜索请求信息提取模糊搜索字段和搜索参数；从预设的缓存数据库逐一获取搜索参数对应的分页标识；按照每个分页标识依次查询预设的存储数据库，得到每个分页标识分别对应的待筛选数据集；按照模糊搜索字段筛选每个待筛选数据集，得到至少一个目标搜索数据；汇总全部目标搜索数据，生成目标搜索数据集并返回至用户端。从而将查询大表的操作，分为多个小步骤进行模糊搜索，最后将查询结果进行合并返回，在满足用户需求的同时有效降低服务器负荷，进而有效维护***稳定性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的一种离线数据模糊搜索方法的步骤流程图；

图2为本发明实施例提供的数据库缓存过程的步骤流程图；

图3为本发明实施例的一种离线数据模糊搜索过程的实现框架图；

图4为本发明实施例提供的一种离线数据模糊搜索装置的结构框图。

具体实施方式

本发明实施例提供了一种离线数据模糊搜索方法、装置、设备和介质，用于解决现有技术在面对海量数据的情况下需要进行不断迭代，难以维持***稳定性，无法灵活快速地进行数据搜索的技术问题。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1，图1为本发明实施例提供的一种离线数据模糊搜索方法的步骤流程图。

本发明提供的一种离线数据模糊搜索方法，包括：

步骤101，当接收到任一用户端发送的模糊搜索请求信息时，对模糊搜索请求信息进行校验；

可选地，步骤101可以包括以下子步骤：

当接收到任一用户端发送的模糊搜索请求信息时，解析模糊搜索请求信息，得到多个模糊搜索参数；

判断模糊搜索参数内是否包括模糊搜索字段和搜索参数；

若是，则判定校验通过；

若否，则判定校验不通过。

模糊搜索请求信息指的是用户按照需求输入的携带多个模糊搜索参数，例如搜索条件，搜索类型，搜索字段等内容的信息。

在本发明实施例中，当接收到任一用户端发送的模糊搜索请求信息时，解析该模糊搜索请求信息，以获取到其中包含的多个模糊搜索参数。为判断后续模糊搜索能否正常进行，可以在获取到多个模糊搜索参数后，进一步判断其中是否包含有模糊搜索所需求的固定字段。此时可以通过检索模糊搜索参数中是否包括模糊搜索字段和搜索参数，若是全部都包括，则可以判定为校验通过，等待下一步的模糊搜索，若是存在任一个未包括或均未包括的情况，则判定为校验不通过，返回校验失败信息或直接结束模糊搜索。

请参阅图2，在执行步骤101之前，本方法还包括以下步骤S11-S15：

S11、响应接收到的用户配置信息，生成对应的配置文件；

在具体实现中，项目模糊搜索通常需要不断的重新部署，为实现秒级切换项目配置的过程，可以通过预设的配置软件例如Apollo配置中心接收用户输入的用户配置信息，生成对应的配置文件。

其中，Apollo部署简单，它是基于Spring Boot和Spring Cloud开发，打包后可以直接运行，不需要额外安装Tomcat等应用容器。它能够统一管理不同环境、不同集群的配置，也能实现配置修改实时生效(热发布)，用户在Apollo修改完配置并发布后，客户端能实时(1秒)接收到最新的配置，并通知到应用程序。详细信息如下：

PageSize：数据切割规格信息，可以根据实际情况进行设置

TableName：数据表名，支持多张表，多张表使用英文逗号“，”分割

ProgramDown：定时任务标识(1：关闭，0：正常运行)

SearchTime：定时任务执行周期，间隔越小，时效性越强，性能消耗越大

nextRunTime：运行时间间隔，单位秒

resultSize：结果集最大条数，默认1000

spring.datasource.url：数据库连接地址

spring.datasource.username：数据库用户名

spring.datasource.password：数据库密码

spring.datasource.driver-class-name：数据库驱动

S12、解析配置文件，获取配置文件内的数据切割规格信息并从数据切割规格信息对应的目标数据库读取待切割数据集；

进一步地，S12可以包括以下子步骤：

解析配置文件，获取配置文件内的数据切割规格信息；数据切割规格信息包括定时任务标识；

若定时任务标识为第一预设标识，则按照预设周期读取数据切割规格信息对应的目标数据库，获取待切割数据集；

当目标数据库读取失败时，返回读取失败提示；

若定时任务标识为第二预设标识，则返回读取失败提示。

在本发明实施例中，在获取到配置文件后，可以通过解析配置文件获取到其中的数据切割规格信息，其中数据切割规格信息包括定时任务标识。再基于定时任务标识的类型，若是定时任务标识为第一预设标识，则可以按照预设周期读取数据切割规格信息所对应的目标数据库，从目标数据库中获取到待切割数据集，以按照定时任务执行周期获取到目标数据库内所保存的待切割数据集。

若是定时任务标识为第二预设标识，则表明此时并未设置有数据切割定时任务，此时可以返回读取失败提示，结束模糊搜索过程。

S13、根据数据切割规格信息对待切割数据集进行数据切割，得到多个已切割数据集；

进一步地，数据切割规格信息包括分段切割规格，待切割数据集包括多行待切割数据，每行待切割数据具有对应的数据标识，S13可以包括以下子步骤：

获取数据标识的最小值作为起始标识；

从起始标识依次读取数据标识，并实时记录读取数量；

当读取数量等于分段切割规格时，将已读取的数据标识对应的待切割数据确定为已切割数据集并获取已读取的最后一个数据标识；

将已读取的最后一个数据标识的下一个数据标识作为新的起始标识，跳转执行从起始标识依次读取数据标识，并实时记录读取数量的步骤，直至全部数据标识均已读取，得到多个已切割数据集。

在本发明的一个示例中，通常待切割数据集可以由多行待切割数据组成，而每行待切割数据均具有对应的数据标识，例如每行待切割数据对应的数据行ID。常用的查询方式是使用mysql的语法limit[offset，]rows进行查询，刚开始查询会很快，查询越到后面就越慢，当查询到几十万以后会导致mysql扫描几十万行，这会严重消耗mysql的性能。为提高获取与数据切割效率，在获取到待切割数据集后，可以获取各个待切割数据集内的数据标识的最小值作为起始标识，从起始标识开始依次读取数据标识并实时记录标识的读取数量，若读取数量等于分段切割规格时，则可以将已读取的数据标识对应的带七个数据确定为已切割数据集，并获取已读取的最后一个标识的下一个数据标识作为新的起始标识，再次读取数据标识，直至全部数据标识均被读取，此时可以得到多个已切割数据集。

在具体实现中，通过指定ID的大小，通过ID限定的方式跳过mysql的扫描行数，再使用limit rows方式进行查询，从而实现毫秒级数据返回，若是查询数据集为空，则可以继续读取下一待切割数据集，直至全部待切割数据集均被处理。

S14、提取每个已切割数据集分别对应的分页标识；

S15、将各个分页标识缓存至预设的缓存数据库，并将各个已切割数据集缓存至预设的存储数据库。

在得到多个已切割数据集后，可以选取各个已切割数据集内的最小ID作为各个已切割数据集对应的分页标识，例如可以在上述查询的过程中直接对每个数据标识也就是数据行ID进行排序，得到最小ID。再将各个分页标识缓存至缓存数据库，同时将各个已切割数据集缓存至预设的存储数据集。

需要说明的是，将分页标识缓存至缓存数据库可以使用Redis，缓存格式如下：

tableName-[tableName]-[pageNum]-minId：[minId]

tableName-[tableName]-[pageNum]-minId：为写入缓存中键的值，中括号为变量值，分别为具体的已切割数据集表名，及页码编号

[minId]：为存储的最小id值，即分页标识；

Redis，是一个开源的，内存中的数据结构存储***，它可以用作数据库、缓存和消息中间件。它支持多种类型的数据结构，如字符串(strings)，散列(hashes)，列表(lists)，集合(sets)，有序集合(sorted sets)等。

步骤102，若校验通过，则从模糊搜索请求信息提取模糊搜索字段和搜索参数；

在本发明实施例中，在校验通过的情况下，可以从模糊搜索请求信息中提取到模糊搜索字段和搜索参数。

在具体实现中，模糊搜索字段可以为具体的文字模糊搜索字段，搜索参数可以包括但不限于已切割数据集表名、页码编号等参数。

步骤103，从预设的缓存数据库逐一获取搜索参数对应的分页标识；

与此同时，在获取到搜索参数后，可以按照搜索参数从缓存数据库逐一获取所关联的分页标识。

在具体实现中，由于页码编号的存在，在缓存数据库可以逐页获取最小ID，也就是可以从缓存数据库内逐页获取到tableName-[tableName]-[pageNum]-minId，以获取到后续存储数据库的查询数据基础。

步骤104，按照每个分页标识依次查询预设的存储数据库，得到每个分页标识分别对应的待筛选数据集；

可选地，步骤104可以包括以下子步骤：

按照每个分页标识结合预设的语句规则，分别构建查询语句；

采用查询语句查询预设的存储数据库，依次得到每个分页标识分别对应的待筛选数据集。

在本发明实施例中，可以按照各个分页标识结合预设的语句规则，分别构建各个分页标识对应的查询语句，再采用查询语句查询预设的存储数据库，以的各个分页标识分别对应的待筛选数据集。

具体的，查询语句可以为sql语句：select*from TableName where id＞[分页标识]limit PageSize。

步骤105，按照模糊搜索字段筛选每个待筛选数据集，得到至少一个目标搜索数据；

可选地，待筛选数据集包括多行待筛选数据，步骤105可以包括以下子步骤：

分别计算各行待筛选数据与模糊搜索字段之间的字段相似度；

将字段相似度大于预设的相似度阈值的待筛选数据确定为目标搜索数据。

在本发明的一个示例中，在获取到待筛选数据集后，可以分别计算其中各行待筛选数据和模糊搜索字段之间的字段相似度，再将字段相似度大于预设的相似度阈值的待筛选数据确定为目标搜索数据。

值得一提的是，使用数据库中查询的数据与用户需要搜索的信息进行模糊比较，主要解决是文字数据模糊搜索，将数据库中有包含搜索信息的记录进行归总合并。在每次循环计算开始时，需要判断收集好的数据记录总数是否达到总的记录数，如果达到则跳出循环，程序结束。

步骤106，汇总全部目标搜索数据，生成目标搜索数据集并返回至用户端。

请参阅图3，图3示出了本发明实施例的一种离线数据模糊搜索过程的实现框架图。

在本发明的另一个示例中，可以通过以下过程实现离线数据模糊搜索：

一、搭建使用统一的Apollo配置中心，用于灵活的配置程序需要的参数信息，在不重新部署项目的情况下，实现秒级切换项目配置。Apollo是分布式配置中心，能够集中化管理应用不同环境、不同集群的配置，配置修改后能够实时推送到应用端，并且具备规范的权限、流程治理等特性，适用于微服务配置管理场景。

二、开发一个数据切割定时任务，用于切割海量数据，并将分段标识保存在缓存中。数据切割定时任务，可以通过Apollo配置中心进行控制，实现数据库的连接、读取需要接入的表信息、切割数据大小、运行周期、启动/停止等功能。能够定时执行按照指定切割大小将亿级数据切割成若干份，获取每一份的开始标识，最后将开始标识按照缓存命名规则存入缓存中。

三、开发一个模糊搜索业务模块，结合缓存与数据库，最终将查询的结果返回给客户端。根据搜索的表名，循环从缓存中获取分页标识，通过分页标识查询到每段记录信息，然后根据需要搜索的字段，在内存中进行计算计较，将每段计算后的记录进行归总合并，最后将合并后的数据集合进行返回，完成整个搜索的业务逻辑。

在不改变数据库架构，也不接入搜索引擎的情况下，将一次模糊查询进行N次分发，直到查询到结果为止。有效的避免在海量数据中进行全文检索，保证了数据库的稳定性，又满足了用户的查询要求，提供最好的查询性能。

在本发明实施例中，当接收到任一用户端发送的模糊搜索请求信息时，对模糊搜索请求信息进行校验；若校验通过，则从模糊搜索请求信息提取模糊搜索字段和搜索参数；从预设的缓存数据库逐一获取搜索参数对应的分页标识；按照每个分页标识依次查询预设的存储数据库，得到每个分页标识分别对应的待筛选数据集；按照模糊搜索字段筛选每个待筛选数据集，得到至少一个目标搜索数据；汇总全部目标搜索数据，生成目标搜索数据集并返回至用户端。从而将查询大表的操作，分为多个小步骤进行模糊搜索，最后将查询结果进行合并返回，在满足用户需求的同时有效降低服务器负荷，进而有效维护***稳定性。

请参阅图4，图4为本发明实施例提供的一种离线数据模糊搜索装置的结构框图。

本发明实施例提供了一种离线数据模糊搜索装置，包括：

信息校验模块401，用于当接收到任一用户端发送的模糊搜索请求信息时，对模糊搜索请求信息进行校验；

模糊查询信息提取模块402，用于若校验通过，则从模糊搜索请求信息提取模糊搜索字段和搜索参数；

分页标识获取模块403，用于从预设的缓存数据库逐一获取搜索参数对应的分页标识；

分页标识查询模块404，用于按照每个分页标识依次查询预设的存储数据库，得到每个分页标识分别对应的待筛选数据集；

数据筛选模块405，用于按照模糊搜索字段筛选每个待筛选数据集，得到至少一个目标搜索数据；

数据汇总与返回模块406，用于汇总全部目标搜索数据，生成目标搜索数据集并返回至用户端。

可选地，本装置还包括：

配置文件生成模块，用于响应接收到的用户配置信息，生成对应的配置文件；

配置文件解析模块，用于解析配置文件，获取配置文件内的数据切割规格信息并从数据切割规格信息对应的目标数据库读取待切割数据集；

数据切割模块，用于根据数据切割规格信息对待切割数据集进行数据切割，得到多个已切割数据集；

分页标识提取模块，用于提取每个已切割数据集分别对应的分页标识；

数据缓存模块，用于将各个分页标识缓存至预设的缓存数据库，并将各个已切割数据集缓存至预设的存储数据库。

可选地，配置文件解析模块具体用于：

当目标数据库读取失败时，返回读取失败提示；

若定时任务标识为第二预设标识，则返回读取失败提示。

可选地，数据切割规格信息包括分段切割规格，待切割数据集包括多行待切割数据，每行待切割数据具有对应的数据标识；数据切割模块具体用于：

获取数据标识的最小值作为起始标识；

从起始标识依次读取数据标识，并实时记录读取数量；

可选地，信息校验模块401具体用于：

判断模糊搜索参数内是否包括模糊搜索字段和搜索参数；

若是，则判定校验通过；

若否，则判定校验不通过。

可选地，分页标识查询模块404具体用于：

可选地，待筛选数据集包括多行待筛选数据；数据筛选模块405具体用于：

本发明实施例还提供了一种电子设备，包括存储器及处理器，所述存储器中储存有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如本发明任一实施例所述的离线数据模糊搜索方法的步骤。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被执行时实现如本发明任一实施例所述的离线数据模糊搜索方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

一种离线数据模糊搜索方法，其特征在于，包括：

当接收到任一用户端发送的模糊搜索请求信息时，对所述模糊搜索请求信息进行校验；

若校验通过，则从所述模糊搜索请求信息提取模糊搜索字段和搜索参数；

从预设的缓存数据库逐一获取所述搜索参数对应的分页标识；

按照每个所述分页标识依次查询预设的存储数据库，得到每个所述分页标识分别对应的待筛选数据集；

按照所述模糊搜索字段筛选每个所述待筛选数据集，得到至少一个目标搜索数据；

汇总全部所述目标搜索数据，生成目标搜索数据集并返回至所述用户端。
根据权利要求1所述的方法，其特征在于，在所述当接收到任一用户端发送的模糊搜索请求信息时，对所述模糊搜索请求信息进行校验的步骤之前，还包括：

响应接收到的用户配置信息，生成对应的配置文件；

解析所述配置文件，获取所述配置文件内的数据切割规格信息并从所述数据切割规格信息对应的目标数据库读取待切割数据集；

根据所述数据切割规格信息对所述待切割数据集进行数据切割，得到多个已切割数据集；

提取每个所述已切割数据集分别对应的分页标识；

将各个所述分页标识缓存至预设的缓存数据库，并将各个所述已切割数据集缓存至预设的存储数据库。
根据权利要求2所述的方法，其特征在于，所述解析所述配置文件，获取所述配置文件内的数据切割规格信息并从所述数据切割规格信息对应的目标数据库读取待切割数据集的步骤，包括：

解析所述配置文件，获取所述配置文件内的数据切割规格信息；所述数据切割规格信息包括定时任务标识；

若所述定时任务标识为第一预设标识，则按照预设周期读取所述数据切割规格信息对应的目标数据库，获取待切割数据集；

当所述目标数据库读取失败时，返回读取失败提示；

若所述定时任务标识为第二预设标识，则返回所述读取失败提示。
根据权利要求2所述的方法，其特征在于，所述数据切割规格信息包括分段切割规格，所述待切割数据集包括多行待切割数据，每行所述待切割数据具有对应的数据标识；所述根据所述数据切割规格信息对所述待切割数据集进行数据切割，得到多个已切割数据集的步骤，包括：

获取所述数据标识的最小值作为起始标识；

从所述起始标识依次读取所述数据标识，并实时记录读取数量；

当所述读取数量等于所述分段切割规格时，将已读取的数据标识对应的待切割数据确定为已切割数据集并获取已读取的最后一个数据标识；

将所述已读取的最后一个数据标识的下一个数据标识作为新的起始标识，跳转执行所述从所述起始标识依次读取所述数据标识，并实时记录读取数量的步骤，直至全部所述数据标识均已读取，得到多个已切割数据集。
根据权利要求1所述的方法，其特征在于，所述当接收到任一用户端发送的模糊搜索请求信息时，对所述模糊搜索请求信息进行校验的步骤，包括：

当接收到任一用户端发送的模糊搜索请求信息时，解析所述模糊搜索请求信息，得到多个模糊搜索参数；

判断所述模糊搜索参数内是否包括所述模糊搜索字段和所述搜索参数；

若是，则判定校验通过；

若否，则判定校验不通过。
根据权利要求1所述的方法，其特征在于，所述按照每个所述分页标识依次查询预设的存储数据库，得到每个所述分页标识分别对应的待筛选数据集的步骤，包括：

按照每个所述分页标识结合预设的语句规则，分别构建查询语句；

采用所述查询语句查询预设的存储数据库，依次得到每个分页标识分别对应的待筛选数据集。
根据权利要求1所述的方法，其特征在于，所述待筛选数据集包括多行待筛选数据；所述按照所述模糊搜索字段筛选每个所述待筛选数据集，得到至少一个目标搜索数据的步骤，包括：

分别计算各行所述待筛选数据与所述模糊搜索字段之间的字段相似度；

将所述字段相似度大于预设的相似度阈值的待筛选数据确定为目标搜索数据。
一种离线数据模糊搜索装置，其特征在于，包括：

信息校验模块，用于当接收到任一用户端发送的模糊搜索请求信息时，对所述模糊搜索请求信息进行校验；

模糊查询信息提取模块，用于若校验通过，则从所述模糊搜索请求信息提取模糊搜索字段和搜索参数；

分页标识获取模块，用于从预设的缓存数据库逐一获取所述搜索参数对应的分页标识；

分页标识查询模块，用于按照每个所述分页标识依次查询预设的存储数据库，得到每个所述分页标识分别对应的待筛选数据集；

数据筛选模块，用于按照所述模糊搜索字段筛选每个所述待筛选数据集，得到至少一个目标搜索数据；

数据汇总与返回模块，用于汇总全部所述目标搜索数据，生成目标搜索数据集并返回至所述用户端。
一种电子设备，其特征在于，包括存储器及处理器，所述存储器中储存有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1-7任一项所述的离线数据模糊搜索方法的步骤。
一种电子设备，其特征在于，包括存储器及处理器，所述存储器中储存有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1-7任一项所述的离线数据模糊搜索方法的步骤。