WO2019148497A1

WO2019148497A1 - 一种数据查询方法及装置

Info

Publication number: WO2019148497A1
Application number: PCT/CN2018/075300
Authority: WO
Inventors: 高翔; 杜维; 陈俊彦; 汪宁
Original assignee: 华为技术有限公司
Priority date: 2018-02-05
Filing date: 2018-02-05
Publication date: 2019-08-08
Also published as: EP3736705A4; US20210224225A1; CN110709824B; CN110709824A; EP3736705A1; US11507533B2

Abstract

一种数据查询方法及装置，涉及计算机技术领域，解决了查询待访问文件名效率较低的问题。该方法包括：确定包括m个目录项和m个文件名的目标目录块，m个目录项和m个文件名一一对应且按照预设规则顺序排列；根据二分查找算法和目标目录块，确定当前第一集合和当前第二集合，当前第一集合包括m个文件名中连续的x个文件名，当前第二集合包括x个文件名、第一文件名以及第二文件名，m≥x≥1；确定待访问文件名与当前第二集合中的文件名之间的第一公共前缀；从第一公共前缀之后的首位字符起，逐字符对比待访问文件名与第三文件名；若待访问文件名与第三文件名相同，则根据与第三文件名对应的目录项获取待访问文件的数据。

Description

一种数据查询方法及装置

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种数据查询方法及装置。

背景技术

文件***通常采用树形结构组织文件的拓扑关系，这里，文件仅涉及目录文件和普通文件。一般的，树形结构中的叶节点表示普通文件，除叶节点之外的其他节点表示目录文件。目录文件包括多个目录项，每个目录项均包括文件名、文件类型以及索引(inode)号，计算机根据索引号所标识的索引能够获取到文件的数据。计算机在获取某一文件(以文件A为例)时，需要在目录文件中查询文件名，以获取与文件A的文件名对应的目录项，进而根据获取到的目录项获取文件A的数据。

目前，一些文件***(如闪存友好文件***(Flash Friendly File System，F2FS)、***扩展文件***(Fourth Extended File System，EXT4等)中目录的结构为包括多级哈希表的哈希(hash)树，每一级哈希表均包括多个哈希值、与每个哈希值对应的文件名以及文件的索引号；另一些文件***(如新技术文件***(New technology file system，Ntfs)、B树文件***(B-tree file system，Btrfs)中目录的结构为n(n≥1)阶B+树。

在文件***只读的应用场景中：若该文件***中目录的结构为包括多级哈希表的哈希树，计算机在获取待访问文件的数据时，需逐级查询哈希表，且在查询的每一哈希表中均先遍历哈希值再匹配文件名，在哈希表的级别较高的情况下，在哈希表中查询待访问文件名的效率较低；此外，哈希树包括有大量的哈希值，导致存储空间的有效利用率较低，而且在哈希表的级别较高的情况下，可能存在高级别哈希表未写满的情况，进一步降低了存储空间的有效利用率；若该文件***中目录的结构为n阶B+树，计算机在获取待访问文件的数据时，该计算机从最小关键字开始顺序查询，或者从根节点开始随机查询，查询待访问文件名的效率比较低；此外，n阶B+树的叶子节点中的关键字出现在中间节点中，降低了存储空间的有效利用率。

综上，在文件***只读的应用场景中，基于现有的目录结构，计算机查询待访问文件名的效率较低，且计算机的存储空间有效利用率较低。

发明内容

本申请实施例提供一种数据查询方法及装置，能够解决计算机查询待访问文件名的效率较低，且计算机的存储空间有效利用率较低的问题。

为达到上述目的，本申请实施例采用如下技术方案：

第一方面，提供一种数据查询方法，该数据查询方法应用于包括n(n≥1)个目录块的只读文件***中，每个目录块包括目录项区域和文件名区域。具体的，该数据查询方法为：数据查询装置从上述n个目录块中确定目标目录块，该目标目录块的目录项区域包括m个目录项，目标目录块的文件名区域包括m个文件名，m个目录项与m个文件名一一对应，m个目录项和m个文件名均按照预设规则顺序排列，待访问文件名位于文件名范围中，文件名范围是由目标目录块的首个文件名与目标目录块的最后一个文件名组成的范围，m≥1；在确定出目标目录块后，数据查询装置依次执行步骤A1、步骤B1以及步骤C1，这里的步骤A1为：根据二分查找算法和目标目录块，确定当前第一集合和当前第二集合，当前第一集合包括m个文件名中连续的x个文件名，当前第二集合包括x(m≥x≥1)个文件名、第一文件名以及第二文件名，第一文件名为排列于x个文件名中的首个文件名之前且与x个文件名中的首个文件名相邻的文件名，第二文件名为排列于x个文件名中的最后一个文件名之后且与x个文件名中的最后一个文件名相邻的文件名；步骤B1为：确定待访问文件名与当前第二集合中的文件名之间的第一公共前缀；步骤C1为：从第一公共前缀之后的首位字符起，逐字符对比待访问文件名与第三文件名，该第三文件名为当前第一集合中第一预设位置的文件名；在执行完步骤C1之后，若待访问文件名与第三文件名相同，则数据查询装置根据与第三文件名对应的目录项获取待访问文件的数据。

本申请中的数据查询装置确定了待访问文件名与当前第二集合中的文件名之间的第一公共前缀，由于当前第二集合覆盖第一集合，因此，当前第一集合中的所有文件名与待访问文件名之间也存在第一公共前缀，这样，数据查询装置直接从第一公共前缀之后的首位字符起，逐字符对比待访问文件名与第三文件名即可，有效的提高了查询待访问文件的速率。

此外，与现有的目录树结构相比，本申请实施例中的目录结构仅存储有目录项与文件名，并未存储与文件名或目录项相关的其他信息，有效的提高了存储空间的利用率。

可选的，在本申请的一种可能的实现方式中，若待访问文件名与第三文件名不同，则数据查询装置根据二分查找算法、当前第一集合和当前第二集合，重新确定第一集合和第二集合，并根据重新确定的第一集合和重新确定的第二集合，执行上述步骤B1和上述步骤C1，直到获取到待访问文件的数据或确定目标目录块未包括待访问文件名。

结合二分查找算法的定义可知，若待访问文件名与第三文件名不同，则数据查询装置进一步缩小查询范围(即重新确定第一集合)，并重新确定第一公共前缀。

可选的，在本申请的另一种可能的实现方式中，上述预设规则为字典序顺序，这样，上述“若待访问文件名与第三文件名不同，则根据二分查找算法、当前第一集合和当前第二集合，重新确定第一集合和第二集合”的方法为：若待访问文件名的特征值小于第三文件名的特征值，确定重新确定的第一集合包括当前第一集合中位于第三文件名之前的所有文件名，重新确定的第二集合包括第一文件名、当前第一集合中位于第三文件名之前的所有文件名以及第三文件名；或者，若待访问文件名的特征值大于第三文件名的特征值，确定重新确定的第一集合包括当前第一集合中位于第三文件名之后的所有文件名，重新确定的第二集合包括第三文件名、当前第一集合中位于第三文件名之后的所有文件名以及第二文件名。

可选的，在本申请的另一种可能的实现方式中，上述“确定待访问文件名与当前第二集合中的文件名之间的第一公共前缀”的方法为：确定待访问文件名与第一文件名之间共有的第一前缀；确定待访问文件名与第二文件名之间共有的第二前缀；将第一前缀与第二前缀中长度最小的一个确定为第一公共前缀。

本申请实施例中当前第二集合中的所有文件名组成的文件名范围大于当前第一集合中的所有文件名组成的文件名范围，由于每个目录块中的所有文件名均按照预设规则顺序排列，因此，数据查询装置通过确定待访问文件名与第一文件名之间共有的第一前缀，以及确定待访问文件名与第二文件名之间共有的第二前缀，可将第一前缀与第二前缀中长度最小的一个确定为第一公共前缀。

可选的，在本申请的另一种可能的实现方式中，上述“数据查询装置从n个目录块中确定目标目录块”的方法为：数据查询装置依次执行步骤A2、B2、C2；其中，步骤A2为：根据二分查找算法和n个目录块，确定当前第三集合和当前第四集合；其中，当前第三集合包括p个文件名，p个文件名包括p个目录块中每个目录块中第二预设位置的文件名，且当前第三集合中的文件名按照预设规则顺序排列，p个目录块为n个目录块中连续的目录块，当前第四集合包括p个文件名、第四文件名以及第五文件名，第四文件名为排列于p个文件名中的首个文件名之前且与p个文件名中的首个文件名相邻的文件名，第五文件名为排列于p个文件名中的最后一个文件名之后且与p个文件名中的最后一个文件名相邻的文件名，1≤p≤n；步骤B2为：确定待访问文件名与当前第四集合中的文件名之间的第二公共前缀；步骤C2为：从第二公共前缀之后的首位字符起，逐字符对比待访问文件名与第六文件名；其中，第六文件名为当前第三集合中第三预设位置的文件名；这样，在执行步骤C2之后，若待访问文件名与第六文件名相同，则数据查询装置确定第六文件名归属的目录块为目标目录块。

当n个目录块的存储方式为块间顺序存储时，数据查询装置确定目标目录块的方法与该数据查询装置查询待访问文件名的方法类似。

可选的，在本申请的另一种可能的实现方式中，在待访问文件名与第六文件名不同的情况下，当2≤p≤n时，数据查询装置根据当前第三集合、当前第四集合和二分查找算法，重新确定第三集合和第四集合，并根据重新确定的第三集合和重新确定的第四集合，执行上述步骤B2和上述步骤C2；当p＝1时，数据查询装置根据当前第三集合包括的文件名确定目标目录块。

可选的，在本申请的另一种可能的实现方式中，在上述预设规则为字典序顺序，对于每个目录块，第二预设位置的文件名为该目录块的首个文件名的情况下，上述“当p＝1时，数据查询装置根据当前第三集合包括的文件名确定目标目录块”的方法为：若待访问文件名的特征值大于当前第三集合中的文件名的特征值，则数据查询装置将当前第三集合中的文件名归属的目录块确定为目标目录块；或者，若待访问文件名的特征值小于当前第三集合中的文件名的特征值，则数据查询装置将位于当前第三集合中的文件名之前且与当前第三集合中的文件名相邻的文件名归属的目录块确定为目标目录块。

可选的，在本申请的另一种可能的实现方式中，在预设规则为字典序顺序的情况下，上述“根据当前第三集合、当前第四集合和二分查找算法，重新确定第三集合和第四集合”的方法为：若待访问文件名的特征值小于第六文件名的特征值，确定重新确定的第三集合包括当前第三集合中位于第六文件名之前的所有文件名，重新确定的第四集合包括第四文件名、当前第三集合中位于第六文件名之前的所有文件名以及第六文件名；或者，若待访问文件名的特征值大于第六文件名的特征值，确定重新确定的第三集合包括当前第三集合中位于第六文件名之后的所有文件名，重新确定的第四集合包括第六文件名、当前第三集合中位于第六文件名之后的所有文件名以及第五文件名。

可选的，在本申请的另一种可能的实现方式中，在上述预设规则为字典序顺序，对于每个目录块，第二预设位置的文件名为该目录块的首个文件名的情况下，若第六文件名为当前第三集合中的首个文件名，待访问文件名的特征值小于第六文件名的特征值，则将位于第六文件名之前且与第六文件名相邻的文件名归属的目录块确定为目标目录块；若第六文件名为当前第三集合中的最后一个文件名，待访问文件名的特征值大于第六文件名的特征值，则将第六文件名归属的目录块确定为目标目录块。

可选的，在本申请的另一种可能的实现方式中，上述“确定待访问文件名与当前第四集合中的文件名之间的第二公共前缀”的方法为：确定待访问文件名与第四文件名之间共有的第三前缀；确定待访问文件名与第五文件名之间共有的第四前缀；将第三前缀与第四前缀中长度最小的一个确定为第二公共前缀。

可选的，在本申请的另一种可能的实现方式中，在上述n个目录块按照预设规则顺序排列，并采用完全二叉树方式存储的场景中，上述“数据查询装置从n个目录块中确定目标目录块”的方法为：数据查询装置依次执行步骤A3和步骤B3，其中步骤A3为：确定当前候选目录块和当前第三公共前缀；步骤B3为：从当前第三公共前缀之后的首位字符起，逐字符对比待访问文件名与第i个文件名，第i个文件名为n个目录块中第i个目录块中第四预设位置的文件名，0≤i＜n；这样，在执行步骤B3后，若待访问文件名与第i个文件名相同，则数据查询装置重新确定候选目录块为第i个文件名归属的目录块，并将重新确定的候选目录块确定为目标目录块。

可选的，在本申请的另一种可能的实现方式中，若待访问文件名与第i个文件名不同，则数据查询装置重新确定第三公共前缀、候选目录块以及第i个文件名，重新确定的第i个文件名为n个目录块中第j个目录块中第四预设位置的文件名；其中，若待访问文件名的特征值大于第i个文件名的特征值，j＝2i+2；若待访问文件名的特征值小于第i个文件名的特征值，j＝2i+1，0≤i＜j＜n；数据查询装置根据重新确定的第三公共前缀、重新确定的候选目录块以及重新确定的第i个文件名，重新执行步骤B3，直到确定出目标目录块。

可选的，在本申请的另一种可能的实现方式中，在上述预设规则顺序为字典序，第四预设位置的文件名为对应目录块中的首个文件名的情况下，上述“若待访问文件名与第i个文件名不同，则重新确定候选目录块”的方法为：若待访问文件名的特征值大于第i个文件名的特征值，则确定重新确定的候选目录块为第i个文件名归属的目录块；若待访问文件名的特征值小于第i个文件名的特征值，则确定重新确定的候选目录块为当前候选目录块。

可选的，在本申请的另一种可能的实现方式中，在上述预设规则顺序为字典序，第四预设位置的文件名为对应目录块中的首个文件名的情况下，上述“若待访问文件名与第i个文件名不同，则重新确定第三公共前缀”的方法为：当待访问文件名的特征值大于第i个文件名的特征值时，将当前第一目标前缀更新为待访问文件名与第i个文件名之间共有的前缀；将更新后的第一目标前缀与当前第二目标前缀中长度最小的一个确定为重新确定的第三公共前缀；或者，当待访问文件名的特征值小于第i个文件名的特征值时，将当前第二目标前缀更新为待访问文件名与第i个文件名之间共有的前缀；将当前第一目标前缀与更新后的第二目标前缀中长度最小的一个确定为重新确定的第三公共前缀；其中，第一目标前缀的长度和第二目标前缀的长度的初始值均为零，且第一目标前缀的长度和第二目标前缀的长度随着待访问文件名的特征值与第i个文件名的特征值的大小关系发生变化。

第二方面，提供一种只读文件***，该只读文件***的对象包括目录文件，目录文件由n个目录块组成，每个目录块均包括目录项区域和文件名区域，目录项区域包括至少一个目录项，文件名区域包括至少一个文件名。对应同一目录块而言，该目录块中目录项的数量与文件名的数量相同，且该目录块中的所有目录项以及所有文件名均按照预设规则顺序排列。

可选的，在本申请的一种可能的实现方式中，上述至少一个目录项中的每个目录项均包括索引号、文件类型和与该目录项对应的文件名在所归属的目录块的偏移量；上述文件名区域与目录项区域相邻，且文件名区域位于目录项区域之后。

第三方面，提供一种数据查询装置，该数据查询装置具备如上述第二方面及其任意一种可能的实现方式所述的只读文件***。该数据查询装置包括处理单元和获取单元。

具体的，上述处理单元，用于从只读文件***的n个目录块中确定目标目录块，目标目录块的目录项区域包括m个目录项，目标目录块的文件名区域包括m个文件名，m个目录项与m个文件名一一对应，m个目录项和m个文件名均按照预设规则顺序排列，待访问文件名位于文件名范围中，文件名范围是由目标目录块的首个文件名与目标目录块的最后一个文件名组成的范围，m≥1。上述处理单元，还用于执行步骤A1、步骤B1以及步骤C1；其中，步骤A1为：根据二分查找算法和目标目录块，确定当前第一集合和当前第二集合，当前第一集合包括m个文件名中连续的x个文件名，当前第二集合包括x个文件名、第一文件名以及第二文件名，第一文件名为排列于x个文件名中的首个文件名之前且与x个文件名中的首个文件名相邻的文件名，第二文件名为排列于x个文件名中的最后一个文件名之后且与x个文件名中的最后一个文件名相邻的文件名，m≥x≥1；步骤B1为：确定待访问文件名与当前第二集合中的文件名之间的第一公共前缀；步骤C1为：从第一公共前缀之后的首位字符起，逐字符对比待访问文件名与第三文件名；其中，第三文件名为当前第一集合中第一预设位置的文件名。上述获取单元，用于若上述处理单元判断出待访问文件名与第三文件名相同，则根据与第三文件名对应的目录项获取待访问文件的数据。

可选的，在本申请的一种可能的实现方式中，上述处理单元，还用于若待访问文件名与第三文件名不同，则根据二分查找算法、当前第一集合和当前第二集合，重新确定第一集合和第二集合，并根据重新确定的第一集合和重新确定的第二集合，执行步骤B1和步骤C1，直到上述获取单元获取到待访问文件的数据或处理单元确定目标目录块未包括待访问文件名。

可选的，在本申请的另一种可能的实现方式中，上述预设规则为字典序顺序，上述处理单元具体用于：若待访问文件名的特征值小于第三文件名的特征值，确定重新确定的第一集合包括当前第一集合中位于第三文件名之前的所有文件名，重新确定的第二集合包括第一文件名、当前第一集合中位于第三文件名之前的所有文件名以及第三文件名；或者，若待访问文件名的特征值大于第三文件名的特征值，确定重新确定的第一集合包括当前第一集合中位于第三文件名之后的所有文件名，重新确定的第二集合包括第三文件名、当前第一集合中位于第三文件名之后的所有文件名以及第二文件名。

可选的，在本申请的另一种可能的实现方式中，上述处理单元具体用于：确定待访问文件名与第一文件名之间共有的第一前缀；确定待访问文件名与第二文件名之间共有的第二前缀；将第一前缀与第二前缀中长度最小的一个确定为第一公共前缀。

可选的，在本申请的另一种可能的实现方式中，上述处理单元还用于执行步骤A2、步骤B2以及步骤C2；其中，步骤A2为：根据二分查找算法和n个目录块，确定当前第三集合和当前第四集合；其中，当前第三集合包括p个文件名，p个文件名包括p个目录块中每个目录块中第二预设位置的文件名，且当前第三集合中的文件名按照预设规则顺序排列，p个目录块为n个目录块中连续的目录块，当前第四集合包括p个文件名、第四文件名以及第五文件名，第四文件名为排列于p个文件名中的首个文件名之前且与p个文件名中的首个文件名相邻的文件名，第五文件名为排列于p个文件名中的最后一个文件名之后且与p个文件名中的最后一个文件名相邻的文件名，1≤p≤n；步骤B2为：确定待访问文件名与当前第四集合中的文件名之间的第二公共前缀；步骤C2为：从第二公共前缀之后的首位字符起，逐字符对比待访问文件名与第六文件名；其中，第六文件名为当前第三集合中第三预设位置的文件名。上述处理单元还用于若待访问文件名与第六文件名相同，则确定第六文件名归属的目录块为目标目录块。

可选的，在本申请的另一种可能的实现方式中，上述处理单元具体用于：当2≤p≤n时，根据当前第三集合、当前第四集合和二分查找算法，重新确定第三集合和第四集合，并根据重新确定的第三集合和重新确定的第四集合，执行步骤B2和步骤C2；当p＝1时，根据当前第三集合包括的文件名确定目标目录块。

可选的，在本申请的另一种可能的实现方式中，上述预设规则为字典序顺序，对于每个目录块，第二预设位置的文件名为该目录块的首个文件名；当p＝1时，上述处理单元具体用于：若待访问文件名的特征值大于当前第三集合中的文件名的特征值，则将当前第三集合中的文件名归属的目录块确定为目标目录块；或者，若待访问文件名的特征值小于当前第三集合中的文件名的特征值，则将位于当前第三集合中的文件名之前且与当前第三集合中的文件名相邻的文件名归属的目录块确定为目标目录块。

可选的，在本申请的另一种可能的实现方式中，上述预设规则为字典序顺序；上述处理单元具体用于：若待访问文件名的特征值小于第六文件名的特征值，确定重新确定的第三集合包括当前第三集合中位于第六文件名之前的所有文件名，重新确定的第四集合包括第四文件名、当前第三集合中位于第六文件名之前的所有文件名以及第六文件名；或者，若待访问文件名的特征值大于第六文件名的特征值，确定重新确定的第三集合包括当前第三集合中位于第六文件名之后的所有文件名，重新确定的第四集合包括第六文件名、当前第三集合中位于第六文件名之后的所有文件名以及第五文件名。

可选的，在本申请的另一种可能的实现方式中，上述预设规则为字典序顺序，对于每个目录块，第二预设位置的文件名为该目录块的首个文件名，上述处理单元还用于：若第六文件名为当前第三集合中的首个文件名，待访问文件名的特征值小于第六文件名的特征值，则将位于第六文件名之前且与第六文件名相邻的文件名归属的目录块确定为目标目录块；若第六文件名为当前第三集合中的最后一个文件名，待访问文件名的特征值大于第六文件名的特征值，则将第六文件名归属的目录块确定为目标目录块。

可选的，在本申请的另一种可能的实现方式中，上述处理单元具体用于：确定待访问文件名与第四文件名之间共有的第三前缀；确定待访问文件名与第五文件名之间共有的第四前缀；将第三前缀与第四前缀中长度最小的一个确定为第二公共前缀。

可选的，在本申请的另一种可能的实现方式中，上述n个目录块按照预设规则顺序排列，并采用完全二叉树方式存储。相应的，上述处理单元，还用于执行步骤A3和步骤B3；其中，步骤A3为：确定当前候选目录块和当前第三公共前缀；步骤B3为：从当前第三公共前缀之后的首位字符起，逐字符对比待访问文件名与第i个文件名，第i个文件名为n个目录块中第i个目录块中第四预设位置的文件名，0≤i＜n。上述处理单元，还用于若待访问文件名与第i个文件名相同，则重新确定候选目录块为第i个文件名归属的目录块，并将重新确定的候选目录块确定为目标目录块。

可选的，在本申请的另一种可能的实现方式中，上述处理单元，还用于若待访问文件名与第i个文件名不同，则重新确定第三公共前缀、候选目录块以及第i个文件名，重新确定的第i个文件名为n个目录块中第j个目录块中第四预设位置的文件名；其中，若待访问文件名的特征值大于第i个文件名的特征值，j＝2i+2；若待访问文件名的特征值小于第i个文件名的特征值，j＝2i+1，0≤i＜j＜n。上述处理单元，还用于根据重新确定的第三公共前缀、重新确定的候选目录块以及重新确定的第i个文件名，重新执行步骤B3，直到确定出目标目录块。

可选的，在本申请的另一种可能的实现方式中，上述预设规则顺序为字典序，第四预设位置的文件名为对应目录块中的首个文件名。相应的，上述处理单元具体用于：若待访问文件名的特征值大于第i个文件名的特征值，则确定重新确定的候选目录块为第i个文件名归属的目录块；若待访问文件名的特征值小于第i个文件名的特征值，则确定重新确定的候选目录块为当前候选目录块。

可选的，在本申请的另一种可能的实现方式中，上述预设规则顺序为字典序，第四预设位置的文件名为对应目录块中的首个文件名。相应的，上述处理单元具体用于：当待访问文件名的特征值大于第i个文件名的特征值时，将当前第一目标前缀更新为待访问文件名与第i个文件名之间共有的前缀；将更新后的第一目标前缀与当前第二目标前缀中长度最小的一个确定为重新确定的第三公共前缀；或者，当待访问文件名的特征值小于第i个文件名的特征值时，将当前第二目标前缀更新为待访问文件名与第i个文件名之间共有的前缀；将当前第一目标前缀与更新后的第二目标前缀中长度最小的一个确定为重新确定的第三公共前缀；其中，第一目标前缀的长度和第二目标前缀的长度的初始值均为零，且第一目标前缀的长度和第二目标前缀的长度随着待访问文件名的特征值与第i个文件名的特征值的大小关系发生变化。

第四方面，提供一种终端，该终端包括：一个或多个处理器、存储器、通信接口。该存储器、通信接口与一个或多个处理器耦合；存储器用于存储计算机程序代码，计算机程序代码包括指令，当一个或多个处理器执行指令时，终端执行如上述第一方面及其任意一种可能的实现方式所述的数据查询方法。

第五方面，提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在上述第四方面所述的终端上运行时，使得所述终端执行如上述第一方面及其任意一种可能的实现方式所述的数据查询方法。

第六方面，提供一种包含指令的计算机程序产品，当该计算机程序产品在上述第四方面所述的终端上运行时，使得所述终端执行如上述第一方面及其任意一种可能的实现方式所述的数据查询方法。

在本申请中，上述数据查询装置的名字对设备或功能模块本身不构成限定，在实际实现中，这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本申请类似，属于本申请权利要求及其等同技术的范围之内。

本申请中第二方面到第六方面，及其各种实现方式的具体描述，可以参考第一方面及其各种实现方式中的详细描述；并且，第二方面到第六方面，及其各种实现方式的有益效果，可以参考第一方面及其各种实现方式中的有益效果分析，此处不再赘述。

本申请的这些方面或其他方面在以下的描述中会更加简明易懂。

附图说明

图1为查找二分算法的查询流程示意图；

图2为现有技术中Linux操作***中的分区结构示意图；

图3为F2FS文件***的目录结构示意图；

图4为本申请实施例中数据查询装置的硬件结构示意图；

图5为本申请实施例中数据查询装置的外部存储器42～2的分区结构示意图；

图6为本申请实施例中数据查询装置的目录块的结构分布示意图；

图7为本申请实施例中数据查询装置的目录块的排列结构示意图一；

图8为本申请实施例中数据查询装置的目录块的排列结构示意图二；

图9为本申请实施例提供的数据查询方法的流程示意图；

图10为本申请实施例中数据查询装置确定目标目录块的流程示意图一；

图11为本申请实施例中数据查询装置确定目标目录块的流程示意图二；

图12为本申请实施例中第二集合的结构示意图；

图13为本申请实施例中数据查询装置查询待访问文件名的流程示意图一；

图14为本申请实施例中数据查询装置的结构示意图一；

图15为本申请实施例中数据查询装置的结构示意图二。

具体实施方式

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象，而不是用于限定特定顺序。

在本申请实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

为了便于理解本申请实施例，这里先解释本申请实施例涉及到的相关要素。

二分查找：又称为折半查找，其基本思想是：在m个升序排列的元素(如A1、A2、……、Am)中查询数据x，取

与x比较，如果二者相等，则查询终止；如果x小于

则在小于

的所有元素中进一步查询，直至找到与x相等的元素；如果x大于

则在大于

的所有元素中进一步查询，直至找到与x相等的元素。其中，

用于表示下取整。

示例性的，如图1所示，7个升序排列的数值为{1、4、7、8、10、15、20}，若待查询的数值为“7”，则查询过程为：

(1)、比较{1、4、7、8、10、15、20}中第

个数值“8”与“7”的大小。

由于“7”小于“8”，因此继续在小于“8”的所有数值{1、4、7}中查询。

(2)、比较{1、4、7}中的第

个数值“4”与“7”的大小。

由于“7”大于“4”，进一步继续在大于“4”的数值{7}中查询。

(3)、{7}中的数值“7”与待查询的“7”相等，查询终止。

本申请实施例用于查询文件名，因此，在本申请实施例中上述m个元素为m个文件名。不同文件名之间的大小可以通过文件名的特征值(如在按照字典序排列文件名后，某一文件名的排列顺序等)确定。

文件***提供了一个结构化的数据存储和组织形式，其采用树形结构组织文件的拓扑关系，为用户访问和查询文件提供了方便。为了管理目录下的子文件和子目录，目录文件需要保存该目录下所有子文件的名字和索引(inode)号。其中，文件名是用户可见的，用户通过文件名管理和访问文件；inode包括文件的基础信息(如文件大小、文件创建时间、文件修改时间等)和多个指向存储有该文件的数据的各个数据块的指针信息，计算机根据inode号能够获取到相应的inode。当应用程序需要读取某一文件时，根据该文件的inode所包括的指针信息，即可确定出存储有该文件数据的各个数据块，进而从确定出的数据块中获取该文件的数据。由于文件***会记录文件的文件名和索引号，因此，在文件***的应用场景中，用户无需关心文件的数据存储在哪些数据块上，只需要记住文件所属的目录和文件名即可完成文件数据的访问。

一般的，存储介质所提供的存储空间包括多个分区(partition)，所述多个分区均被挂载在一个或多个文件***。每个文件的数据均被存入到存储介质的某个分区中。存储介质的每个分区被划分为多个块(block)。对于同一文件***，每个block的大小相同。典型的，每个block的大小是1024字节(byte)或者4096字节。为了便于描述，本申请实施例将存储有目录文件的数据的block称为目录块，将存储有其他类型文件的数据的block称为数据块。

如图2所示，Linux操作***中，存储介质的每个分区包含有超级区(Super block)、索引区和数据区。超级区存储有文件***的相关信息，例如：文件***的类型，block的数目、block的大小等信息。索引区包括k(k≥1)个inode，每个inode均包括文件的基础信息(如文件大小、文件创建时间、文件修改时间等)和多个指向存储有该文件的数据的各个数据块的指针信息。数据区包括普通文件和目录文件的数据，其中，目录文件由n(n≥1)个目录块组成，每个目录块均包括多个目录项，一个目录项与一个文件对应，每个目录项均包括一个文件的索引(inode)号、该文件的文件名以及该文件的文件类型等。

目前，一些文件***(如F2FS文件***、EXT4文件***等)中目录的结构为包括多级哈希表的哈希树，每一级哈希表均包括多个哈希值、与每个哈希值对应的文件名以及文件的索引号。

以F2FS文件***为例，F2FS文件***中目录的结构为包括多级哈希表的哈希树，每一级都有一个使用专用数字的哈希桶(bucket)的哈希表。每个哈希bucket均为目录项数组，哈希bucket中的每个目录项包括一个哈希值、与该哈希值对应的文件名以及文件的索引号。表1示出了F2FS文件***中目录的结构，该结构为包括N级哈希表的哈希树。表1中A表示bucket，B表示目录块，N表示哈希最大级，A(2B)表示一个哈希bucket包括两个目录块，A(4B)表示一个哈希bucket包括四个目录块。

表1

第0级	A(2B)
第1级	A(2B)-A(2B)
第2级	A(2B)-A(2B)-A(2B)-A(2B)
……	……
第N/2级	A(2B)-A(2B)-A(2B)-……A(2B)
第N/2+1级	A(4B)-A(4B)-A(4B)-……A(4B)
……	……
第N级	A(4B)-A(4B)-A(4B)-A(4B)-……A(4B)

结合表1可以看出：F2FS文件***中目录的结构中，从第0级哈希表开始到第N/2级哈希表，每一级哈希表中的每个哈希bucket均包括两个目录块；从第N/2+1级哈希表开始到第N级哈希表，每一级哈希表中的每个哈希bucket均包括四个目录块。第i(i＜N/2)级哈希表包括2^i个哈希bucket，第j(j≥N/2)级哈希表包括2^(N/2-1)个哈希bucket。

图3示出了上述表1所示的哈希树。第0级哈希表包括一个哈希bucket：Bucket 0，Bucket 0包括目录块0和目录块1两个目录块。其他级哈希表的内容与第0级哈希表、第1级哈希表均类似，这里不再进行详细赘述。

基于上述哈希树结构，计算机在F2FS文件***的目录中查询待访问文件名时，首先计算该待访问文件名的哈希值，然后在第0级哈希表中扫描哈希值查询包括该待访问文件名和该待访问文件的索引号的目录项。如果没有找到，计算机在第1级哈希表中扫描。也就是说，若计算机在上一级哈希表中未找到包括待访问文件名的目录项，则计算机以递增的方式扫描下一级哈希表。在每一级哈希表中，计算机仅需要扫描一个哈希bucket，该哈希bucket的编号是由待访问文件名的哈希值与该级别中的哈希buckets数量的相除取余得到的。

在F2FS文件***只读的应用场景中，计算机查询待访问文件名时，该计算机需要线性搜索目录项。在哈希表的级别较高、目录项的数量较大的情况下，计算机需要搜索很多个目录块，查询效率较低。

此外，上述哈希树包括有大量的哈希值，导致存储空间的有效利用率较低。随着级别的增加，高级别哈希表中哈希bucket的数量也在适应性的增加。这样，极有可能出现高级别的哈希表未写满的情况，进一步降低了存储空间的有效利用率。

除了哈希树结构的目录之外，还有一些文件***(如Ntfs文件***、Btrfs文件***)中目录的结构为n(n≥1)阶B+树。

n阶B+树是一个n叉排序树。一个B+树包括根节点、内部节点和叶子节点。其中，根节点可能是一个叶子节点，也可能是一个包括至少两个子节点的节点。n阶B+树的所有节点包括n个关键字，每个关键字不保存数据，只用于索引，所有数据保存在叶子节点。n阶B+树的所有叶子节点包括了全部关键字的信息，以及指向这些关键字的指针信息，且叶子节点本身按照关键字的大小自小而大顺序链接。

基于上述n阶B+树，计算机在目录中查询待访问文件名时，该计算机从最小关键字开始顺序查询，或者从根节点开始随机查询，查询效率比较低。

此外，B+树的叶子节点中的关键字会在中间节点出现，这种结构导致存储空间的有效利用率较低。

基于上述查询效率低以及计算机存储空间的有效利用率低的问题，本申请实施例提供一种数据查询方法，该方法应用于包括n(n≥1)个目录块的只读文件***中，每个目录块包括目录项区域和文件名区域，目录项区域包括至少一个目录项，文件名区域包括至少一个文件名，同一目录块中目录项的数量与文件名的数量相同，且同一目录块中的所有目录项以及所有文件名均按照预设规则顺序排列，不同目录块中的目录项的数量可能相同，也可能不同。示例性的，n个目录块中目标目录块的文件名区域包括m(m≥1)个文件名，目标目录块的目录项区域包括m个目录项，m个文件名与m个目录项一一对应，所述m个目录项和所述m个文件名均按照预设规则顺序排列。

本申请实施例中的数据查询装置在确定出待访问文件名位于目标目录块中的m个文件名所组成的文件名范围后，即数据查询装置在确定出目标目录块后，根据二分查找算法和该目标目录块，确定包括所述m个文件名中连续的x个文件名的当前第一集合以及包括所述x个文件名、第一文件名和第二文件名的当前第二集合，并确定待访问文件名与当前第二集合中的文件名之间的第一公共前缀，这样，该数据查询装置从第一公共前缀之后的首位字符起，逐字符对比待访问文件名与当前第一集合中第一预设位置的文件名(即第三文件名)，当待访问文件名与第三文件名相同时，该数据查询装置根据与第三文件名对应的目录项获取待访问文件的数据。数据查询装置确定了待访问文件名与当前第二集合中的文件名之间的第一公共前缀，由于当前第二集合覆盖第一集合，因此，当前第一集合中的所有文件名与待访问文件名之间也存在第一公共前缀，这样，数据查询装置直接从第一公共前缀之后的首位字符起，逐字符对比待访问文件名与第三文件名即可，有效的提高了查询待访问文件的速率。此外，与现有的目录树结构相比，本申请实施例中的目录结构仅存储有目录项与文件名，并未存储与文件名或目录项相关的其他信息，有效的提高了存储空间的利用率。

本申请实施例中的数据查询装置可以为电脑、手机、平板电脑等终端。图4是本申请实施例提供的一种数据查询装置的结构示意图。参见图4，该数据查询装置包括：通信接口40、处理器41和存储介质42。其中，通信接口40、处理器41和存储介质42之间通过***总线44连接，并完成相互间通信。

通信接口40用于与其他设备通信，例如向其他设备共享某一文件的数据。

存储介质42可用于存储目录文件的数据，也可以用于存储普通文件的数据，还可以用于存储软件程序以及应用模块，处理器41通过运行存储在存储介质42的软件程序以及应用模块，从而执行数据查询装置的各种功能应用。

存储介质42包括内存42～1和外部存储器42～2。内存42～1用于暂时存储处理器41的运算数据，以及与外部存储器42～2交换的数据等。外部存储器42～2用于存储应用程序、目录文件以及普通文件的数据。本申请实施例中，目录文件由n(n≥1)个目录块组成，每个目录块包括目录项区域和文件名区域，目录项区域包括至少一个目录项，文件名区域包括至少一个文件名，同一目录块中目录项的数量与文件名的数量相同，且同一目录块中的所有目录项以及所有文件名均按照预设规则顺序排列，不同目录块中的目录项的数量可能相同，也可能不同。目录块的详细解释参考后续描述，这里不对其进行详细描述。在本申请实施方式中，所述操作***可以为Windows操作***，也可以是Linux操作***。

在本申请实施例中，外部存储器42～2为非易失性存储器，例如至少一个磁盘存储器件、电子可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、闪存器件，例如反或闪存(NOR flash memory)或是反及闪存(NAND flash memory)。非易失存储器存储处理器41所执行的操作***及应用程序。处理器41可以从非易失存储器加载运行程序与数据到内存42～1，并将数据内容存储于专门用于存储的存储设备中。

存储介质42可以是独立存在，通过***总线44与处理器41相连接。存储介质42也可以和处理器41集成在一起。

处理器41是数据查询装置的控制中心。处理器41利用各种接口和线路连接整个数据查询装置的各个部分，通过运行或执行存储在存储介质42内的软件程序和/或应用模块，以及调用存储在存储介质42内的数据，执行存储设备的各种功能和处理数据，从而对数据查询装置整体监控。

处理器41可以仅包括中央处理器(Central Processing Unit，CPU)，也可以是CPU、数字信号处理器(Digital Signal Processor，DSP)以及通信单元中的控制芯片的组合。在本申请实施方式中，CPU可以是单运算核心，也可以包括多运算核心。在具体实现中，作为一种实施例，处理器41可以包括一个或多个CPU，例如图4中的处理器41包括CPU 0和CPU 1。

***总线44可以是将上述元件相互连接并在上述元件之间传递通信的电路，例如：该***总线44是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component Interconnect，PCI)总线、扩展工业标准体系结构(Extended Industry Standard Architecture，EISA)总线或高级微控制器总线架构(Advanced Microcontroller Bus Architecture，AMBA)等。该***总线44可以分为地址总线、数据总线、控制总线等。本申请实施例中为了清楚说明，在图4中将各种总线都示意为***总线44。

需要说明的是，本申请实施例提供的数据查询方法适用于上述数据查询装置的文件***为只读文件***的应用场景中。

为了便于理解本申请实施例提供的数据查询方法，首先介绍本申请实施例中数据查询装置的外部存储器42～2存储的目录结构。

本申请实施例中数据查询装置的外部存储器42～2中，每个分区包括超级区、索引区和数据区。其中，超级区、索引区和数据区可以参考上述图2所示的结构的描述，这里不再进行详细赘述。

与图2所示的结构相同，本申请实施例的数据区中的目录文件也包括n个目录块。不同的是，本申请实施例中，n个目录块中的每个目录块均包括目录项区域和文件名区域，目录项区域包括多个目录项(以m个目录项为例进行说明，m≥1)，文件名区域包括多个文件名(以m个文件名为例进行说明)，m个目录项与m个文件名一一对应，且m个目录项和m个文件名均按照预设规则顺序排列。由于目录项与文件名一一对应，因此，目录项中记录有与其对应的文件名的存储地址。

需要说明的是，不同的目录块所包括的目录项的数量可以相同，也可以不同，本申请实施例对此不作具体限定。

本申请实施例中的目录项与现有的目录项有略微的不同。现有的目录项包括文件名、索引号和文件类型等信息。本申请实施例中的目录项包括索引号、文件类型和文件名在目录块的偏移量等信息，并不包括文件名。例如，对于索引号为S1的普通文件ABC而言，现有的与文件名“ABC”对应的目录项包括S1、ABC、普通文件类型等信息；本申请实施例中将该文件的文件名存储于文件名区域，若该文件在目录块的偏移量为32，则本申请实施例中与文件名“ABC”对应的目录项包括S1、32、普通文件类型等信息。

为了便于说明，后续内容中的目录项均表示未包括文件名的目录项。

由于文件名的长度是可变的，因此，本申请实施例中目录项和文件名独立存储的结构使得数据查询装置的存储空间得到有效利用，有效的提高了数据查询装置的存储空间的利用率。

本申请实施例中的文件名区域位于目录项区域之后，且二者相邻，这样，目录项区域中的首个目录项包括的文件名在目录块的偏移量不仅用于指示首个文件名的存储地址，还用于指示目录项区域结束。由于同一目录块中目录项的大小相同，因此，在首个目录项用于指示目录项区域结束的情况下，数据获取装置能够计算出目录项的数量。

在一个示例中，图5示出了本申请实施例中数据查询装置的存储介质42的分区结构。数据区包括n个目录块(目录块1、目录块2、……、目录块n)，每个目录块均包括目录项区域和文件名区域，目录块1的目录项区域包括m个目录项(目录项1、目录项2、……、目录项m)，目录块1的文件名区域包括m个文件名(文件名1、文件名2、……、文件名m)，目录项1包括文件名1的存储位置，目录项2包括文件名2的存储位置，以此类推，目录项m包括文件名m的存储位置。数据获取装置根据文件名1的存储位置和目录块的起始位置，能够计算出该目录块1中目录项的数量为m。

由于文件名的长度是变化的，因此，一个目录块包括目录项的数量是不固定的。特别的，若文件A的文件名较长，则目录块可能仅包括一个目录项和文件A的文件名。图6示出了仅包括一个目录项和一个文件名的目录块。

可选的，若本申请实施例中的某一目录块的存储空间不足以容纳该文件名，则可以将该文件名存储于该目录块的下一目录块的首个目录项中，也可以将该文件名存储于某一数据块中，并在该目录块的文件名区域中存储用于指向所述某一数据块的偏移信息。

本申请实施例中的n个目录块以及每个目录块中的所有文件名均按照预设规则顺序排列。

其中，预设规则可以为字典序顺序，也可以为字典序逆序，还可以按照其他有序排列方式，本申请实施例对此不作具体限定。

每个目录块中，目录项与文件名之间一一对应，因此，目录块中的所有目录项的排列顺序与该目录块中的所有文件名的排列顺序相同。

为了便于理解，本申请实施例后续涉及到的预设规则均以字典序顺序为例进行说明。

本申请实施例中n个目录块的存储方式可以为块间顺序存储或块间按照完全二叉树方式存储。

块间顺序存储是指n个目录块是根据n个文件名按照预设规则顺序排列存储的，这里，n个文件名中的每个文件名是指与该文件名对应的目录块中第二预设位置的文件名。

其中，目录块中第二预设位置的文件名可以为该目录块的首个文件名，也可以为该目录块的最后一个文件名，还可以为该目录块中除首个文件名和最后一个文件名之外的其他任一文件名，本申请实施例对此不作具体限定。

为了便于理解，后续均以目录块中第二预设位置的文件名为该目录块中的首个文件名或该目录块中的最后一个文件名为例进行说明。

示例性的，如图7所示，数据查询装置包括的目录块中第一个文件名有ANDY、BABY、CAFE、DASH以及EMMA，按照字典序顺序排列，这5个文件名的排列顺序依次为：ANDY、BABY、CAFE、DASH、EMMA，因此，数据查询装置中的目录块1为第一个文件名为ANDY的目录块，目录块2为第一个文件名为BABY的目录块，目录块3为第一个文件名为CAFE的目录块，目录块4为第一个文件名为DASH的目录块，目录块5为第一个文件名为EMMA的目录块。

块间按照完全二叉树方式存储是指n个目录块是按照完全二叉树方式存储的。本申请实施例中的n个目录块根据每个目录块中第四预设位置的文件名按照所述预设规则排列。

其中，目录块中第四预设位置的文件名可以为该目录块的首个文件名，也可以为该目录块的最后一个文件名，还可以为该目录块中除首个文件名和最后一个文件名之外的其他任一文件名，本申请实施例对此不作具体限定。

示例性的，如图8所示，目录块中第四预设位置的文件名为该目录块中的第一个文件名，数据查询装置包括的目录块中第一个文件名有ANDY、BABY、CAFE、DASH以及EMMA，按照字典序顺序排列，这5个文件名的排列顺序依次为：ANDY、BABY、CAFE、DASH、EMMA。这5个文件名按照完全二叉树方式存储后，其排列顺序依次为：DASH、BABY、EMMA、ANDY、CAFE。相应的，数据查询装置中的目录块1为第一个文件名为DASH的目录块，目录块2为第一个文件名为BABY的目录块，目录块3为第一个文件名为EMMA的目录块，目录块4为第一个文件名为ANDY的目录块，目录块5为第一个文件名为CAFE的目录块。

现以n个目录块的存储方式为块间顺序存储为例说明本申请提供的数据查询方法。具体的，结合上述图4所示的数据查询装置的结构示意图、上述图5所示的数据查询装置的存储介质42的分区结构、上述图7所示的数据查询装置中目录块的一种结构示意图进行详细描述。

具体的，请参见图9，图9为本申请实施例提供的一种数据查询方法的流程示意图。

如图9所示，本申请实施例提供的数据查询方法具体包括如下步骤。

S900、数据查询装置获取文件访问请求，该文件访问请求包括待访问文件名。

可选的，数据查询装置中的某一应用程序在运行过程中触发了获取待访问文件的命令，本申请实施例中将待访问文件的名称统称为待访问文件名。这里，获取待访问文件的命令也称为文件访问请求，该文件访问请求包括待访问文件名。

示例性的，数据查询装置中的某一应用程序在运行过程中触发了命令“file*fp；fp＝(“file a”)”，则数据查询装置获取到了访问文件a的请求。

S901、响应于上述文件访问请求，数据查询装置从n个目录块中确定目标目录块。

结合上述描述可知，本申请实施例中的数据查询装置包括n个目录块，每个目录块均包括目录项区域和文件名区域，目录项区域包括至少一个目录项，文件名区域包括至少一个文件名。

本申请实施例中每个目录块中的文件名按照预设规则顺序排序，因此，每个目录块的文件名均可组成一个文件名范围。

示例性的，结合上述图7，若目录块1包括3个文件名：ANDY、APPLE和ATTENT，则该目录块1中的文件名组成的文件名范围为：[ANDY，ATTENT]。

这样，数据查询装置在获取到文件访问请求后，需要首先确定出待访问文件名具***于哪一目录块的文件名所组成的文件名范围内，进而从确定出的目录块中查找待访问文件名。

具体的，本申请实施例中的数据查询装置从n个目录块中确定目标目录块，即待访问文件名位于目标目录块的文件名所组成的文件名范围内。

容易理解的是，待访问文件名位于目标目录块的文件名所组成的文件名范围内，但待访问文件名可以不属于目标目录块包括的文件名。也就是说，目标目录块可能包括待访问文件名。

结合上一示例，目录块1包括3个文件名：ANDY、APPLE和ATTENT，该目录块1中的文件名组成的文件名范围为：[ANDY，ATTENT]，待访问文件名ANGEL位于文件名范围[ANDY，ATTENT]内，但待访问文件名ANGEL不是目录块1包括的文件名。

本申请实施例中的目标目录块的目录项区域包括m个目录项，目标目录块的文件名区域包括m个文件名，且m个目录项与m个文件名之间一一对应。目录项包括索引号、文件类型以及文件名在目录块的偏移量等信息。

具体的，数据查询装置确定目标目录块的方法为：

步骤A2：数据查询装置根据二分查找算法和n个目录块，确定当前第三集合和当前第四集合，当前第三集合包括p个文件名，该p个文件名包括p个目录块中每个目录块中第二预设位置的文件名，且p个文件名按照预设规则顺序排列，这里，p个目录块为n个目录块中连续的目录块，当前第四集合包括所述p个文件名、第四文件名以及第五文件名，第四文件名为排列于p个文件名中的首个文件名之前且与p个文件名中的首个文件名相邻的文件名，第五文件名为排列述p个文件名中的最后一个文件名之后且与p个文件名中的最后一个文件名相邻的文件名，1≤p≤n；

步骤B2：确定待访问文件名与当前第四集合中的文件名之间的第二公共前缀；

步骤C2：从第二公共前缀之后的首位字符起，逐字符对比待访问文件名与第六文件名；其中，第六文件名为当前第三集合中第三预设位置的文件名；

若待访问文件名与第六文件名相同，则数据查询装置确定第六文件名归属的目录块为目标目录块。

从上述集合的定义可以看出，当前第四集合的文件名组成的文件名范围大于当前第三集合的文件名组成的文件名范围，且当前第四集合包括第四文件名以及第五文件名。特殊的，在p＝n的情况下，第四文件名与第五文件名为空。

由于当前第四集合的文件名组成的文件名范围大于当前第三集合的文件名组成的文件名范围，因此，当前第三集合中的文件名也存在待访问文件名与当前第四集合中的文件名之间的第二公共前缀，这样的话，数据查询装置在确定出第二公共前缀后，可从第二公共前缀后的首位字符起，逐字符对比待访问文件名与第六文件名，提高了查询的效率。

容易理解的是，在第四文件名与第五文件名为空的情况下，第二公共前缀初始化为空。

具体的，数据查询装置确定待访问文件名与当前第四集合中的文件名之间的第二公共前缀的方法为：数据查询装置确定待访问文件名与第四文件名之间共有的第三前缀，并确定待访问文件名与第五文件名之间共有的第四前缀；然后，该数据查询装置将第三前缀与第四前缀中长度最小的一个确定为第二公共前缀。

在一个示例中，结合上述图7，令当前第四集合为{ANDY、BABY、CAFE、DASH、EMMA}，当前第三集合为{BABY、CAFE、DASH}，第四文件名为ANDY，第五文件名为EMMA，待访问文件名为CORE，则数据查询装置确定第三前缀为空，第四前缀为空，则该数据查询装置确定第二公共前缀为空。

在另一个示例中，令当前第四集合为{A、AC、ACB、ACD、AD、B、C}，当前第三集合为{AC、ACB、ACD、AD、B}，若待访问文件名为ACC，第四文件名为A，第五文件名为C，数据查询装置确定第三前缀为A，第四前缀为空，则该数据查询装置确定第二公共前缀为空。

第六文件名为当前第三集合中第三预设位置的文件名，该第三预设位置的文件名可以为当前第三集合中的第

个文件名，也可以为当前第三集合中其他位置的文件名，本申请实施例对此不作具体限定。

数据查询装置逐字符对比待访问文件名与第六文件名后，可确定出待访问文件名与第六文件名是否相同。

若待访问文件名与第六文件名相同，则数据查询装置确定第六文件名归属的目录块为目标目录块。可选的，若待访问文件名与第六文件名相同，数据查询装置可以无需再确定目标目录块，该数据查询装置可直接根据第六文件名确定出与待访问文件名对应的目录项，进而根据与待访问文件名对应的目录项，获取到待访问文件的数据。

由于数据查询装置在确定目标目录块的过程中直接找到与待访问文件名相同的文件名的过程较为简单，本申请实施例对这一情况不作详细描述。

若待访问文件名与第六文件名不同，当2≤p≤n时，数据查询装置根据当前第三集合、当前第四集合和二分查找算法，重新确定第三集合和第四集合，并根据重新确定的第三集合和重新确定的第四集合，执行上述步骤B2和上述步骤C2。

结合前面对二分查找的描述可知，重新确定的第三集合包括当前第三集合中排列于第六文件名之前或之后的所有文件名。

具体的，若待访问文件名的特征值大于第六文件名的特征值，则重新确定的第三集合包括当前第三集合中排列于第六文件名之后的所有文件名。若待访问文件名的特征值小于第六文件名的特征值，则重新确定的第三集合包括当前第三集合中排列于第六文件名之前的所有文件名。

示例性的，结合上述图7，令当前第三集合包括的文件名为图7中的ANDY、BABY、CAFE、DASH和EMMA，第六文件名为CAFE。若待访问文件名为ANDY，则重新确定的第三集合包括的文件名为ANDY和BABY。若待访问文件名为DASH，则重新确定的第三集合包括的文件名为DASH和EMMA。

数据查询装置根据重新确定的第四集合执行上述步骤B2，重新确定第二公共前缀。

在一个示例中，令当前第四集合为{A、AC、ACB、ACD、AD、B、C}，当前第三集合为{AC、ACB、ACD、AD、B}，若待访问文件名为ACC，第六文件名为ACD，第四文件名为A，第五文件名为C，数据查询装置确定当前的第二公共前缀为空(当前的第三前缀为A，当前的第四前缀为空，因此，当前的第二公共前缀为空)，并根据该该当前的第二公共前缀从首位字符起逐字符对比待访问文件名ACC与文件名ACD。由于待访问文件名ACC的特征值小于文件名ACD的特征值，因此，该数据查询装置重新确定第三集合和第四集合，重新确定的第三集合为{AC、ACB}，重新确定的第四集合为{A、AC、ACB、ACD}。数据查询装置根据重新确定的第四集合重新确定第二公共前缀。重新确定的第四集合中的第四文件名为A，重新确定的第四集合中的第五文件名为ACD，因此，在重新确定第二公共前缀的过程中，第三前缀为A，第四前缀为AC，数据查询装置将A与AC中长度最小的一个确定为第二公共前缀，即数据查询装置重新确定的第二公共前缀为A。

若待访问文件名与第六文件名不同，当p＝1时，数据查询装置根据当前第三集合包括的文件名确定目标目录块。具体的，在第二预设位置的文件名为目录块的首个文件名的情况下，若待访问文件名的特征值大于当前第三集合中的文件名的特征值，则数据查询装置将当前第三集合中的文件名归属的目录块确定为目标目录块；若待访问文件名的特征值小于当前第三集合中的文件名的特征值，则数据查询装置将位于当前第三集合中的文件名之前且与当前第三集合中的文件名相邻的文件名归属的目录块确定为目标目录块。

在一个示例中，每一文件名为对应目录块中的首个文件名，若当前第三集合包括A、B、C、D、E、F、G、H以及I这九个文件名，第六文件名为E，待访问文件名为EA，则数据查询装置确定目标目录块的过程为：①、第二公共前缀为空，数据查询装置根据第二公共前缀从首位字符起逐字符对比待访问文件名EA与第六文件名E；由于待访问文件名EA的特征值大于文件名E的特征值，该数据查询装置重新确定第三集合为{F、G、H、I}；②、步骤①中，数据查询装置重新确定的第三集合为{F、G、H、I}，因此，这一步骤中，当前第三集合为{F、G、H、I}，若第六文件名为当前第三集合中的第

个文件名，则第六文件名为G，这一步骤中第二公共前缀为空，数据查询装置根据第二公共前缀从首位字符起逐字符对比待访问文件名EA与文件名G；由于待访问文件名EA的特征值小于文件名G的特征值，该数据查询装置重新确定第三集合为{F}，重新确定的第四集合为{E、F、G}；③、步骤②中，数据查询装置重新确定的第三集合为{F}，重新确定的第四集合为{E、F、G}，因此，这一步骤中，当前第三集合为{F}，当前第四集合为{E、F、G}，数据查询装置根据{E、F、G}确定的第二公共前缀为空；数据查询装置根据当前的第二公共前缀从首位字符起逐字符对比待访问文件名EA与文件名F；由于当前第三集合仅包括一个文件名F，且待访问文件名EA的特征值小于F的特征值，因此，目标目录块为位于F之前且与F相邻的文件名E归属的目录块。

在另一个示例中，结合上述图7，如图10所示，若当前第三集合为{ANDY、BABY、CAFE、DASH、EMMA}，待访问文件名为CORE，数据查询装置确定目标目录块的过程为：①、此时，第四文件名与第五文件名为空，第二公共前缀为空，若第六文件名为CAFE，数据查询装置根据该第三公共前缀从首字符逐字符对比待访问文件名CORE与文件名CAFE；由于待访问文件名CORE的特征值大于文件名CAFE的特征值，数据查询装置重新确定第三集合为{DASH、EMMA}，并重新确定第二公共前缀为空(待访问文件名CORE与文件名CAFE之间共有的第三前缀为“C”；待访问文件名CORE与第五文件名之间共有的第四前缀为空；因此，重新确定的第二公共前缀为空)；②、步骤①中数据查询装置重新确定的第三集合为{DASH、EMMA}，因此在这一步骤中，当前第三集合为{DASH、EMMA}，若第六文件名为EMMA，数据查询装置根据当前的第二公共前缀从首字符逐字符对比待访问文件名CORE与文件名EMMA；③、由于待访问文件名CORE的特征值小于文件名EMMA的特征值，数据查询装置重新确定第三集合为{DASH}，并重新确定第二公共前缀为空；此时，当前第三集合为{DASH}，当前的第二公共前缀为空，数据查询装置根据当前的第二公共前缀从首位字符起逐字符对比待访问文件名CORE与文件名DASH；由于当前第三集合仅包括一个文件名DASH，且待访问文件名CORE的特征值小于文件名DASH的特征值，因此，数据查询装置确定目标目录块为位于DASH之前且与DASH相邻的文件名CAFE归属的目录块；④、数据查询装置确定目标目录块为目录块3。

在一个示例中，每一文件名为对应目录块中的首个文件名，若当前第三集合为{A、AC、ACB、ACD、AD、B、C}，第四文件名与第五文件名为空，第六文件名为ACD，待访问文件名为ACC，则数据查询装置确定目标目录块的过程为：①、由于第四文件名与第五文件名为空，因此当前的第二公共前缀为空，数据查询装置根据该第二公共前缀从首位字符起逐字符对比待访问文件名ACC与第六文件名ACD；由于待访问文件名ACC的特征值小于文件名ACD的特征值，该数据查询装置重新确定第三集合为{A、AC、ACB}，重新确定第四集合为{空、A、AC、ACB、ACD}；②、在步骤①中，数据查询装置重新确定的第三集合为{A、AC、ACB}，因此，步骤②中当前第三集合为{A、AC、ACB}，若第六文件名为当前第三集合中的第

个文件名，则第六文件名为AC；步骤①中重新确定第四集合为{空、A、AC、ACB、ACD}，因此，步骤②中当前第四集合为{空、A、AC、ACB、ACD}，当前第四集合中的第四文件名为空，当前第四集合中的第五文件名为ACD，相应的，当前的第三前缀为空，当前的第四前缀为AC，因此，数据查询装置重新确定的第二公共前缀为空；数据查询装置根据该第二公共前缀从首位字符起逐字符对比待访问文件名ACC与文件名AC；由于待访问文件名ACC的特征值大于文件名AC的特征值，该数据查询装置重新确定第三集合为{ACB}，重新确定的第四集合为{AC、ACB、ACD}；③、在步骤②中，数据查询装置重新确定的第三集合为{ACB}，重新确定的第四集合为{AC、ACB、ACD}，因此，在步骤③中，当前第三集合为{ACB}，当前第四集合为{AC、ACB、ACD}；当前第四集合中的第四文件名为AC，因此，第三前缀为“AC”；当前第四集合中的第五文件名为ACD，因此，第四前缀为“AC”；数据查询装置将第三前缀“AC”与第四前缀“AC”中长度最小的一个作为第二公共前缀，因此，当前的第二公共前缀为“AC”；数据查询装置该第二公共前缀从“AC”之后的首位字符起逐字符对比待访问文件名ACC与文件名ACB；由于当前第三集合仅包括一个文件名ACB，且待访问文件名ACC的特征值大于ACB的特征值，因此，目标目录块为ACB归属的目录块。

特殊的，在第二预设位置的文件名为目录块中首个文件名，第三预设位置的文件名为当前第三集合中的首个文件名，即第六文件名为当前第三集合中的首个文件名的情况下，若待访问文件名的特征值小于第六文件名的特征值，无论p的数值是否大于1，数据查询装置均将位于第六文件名之前且与第六文件名相邻的文件名归属的目录块确定为目标目录块。

在一个示例中，结合上述图7，若当前第三集合为{ANDY、BABY、CAFE、DASH、EMMA}，待访问文件名为CORE，数据查询装置确定目标目录块的过程为：①、此时，第四文件名与第五文件名为空，第二公共前缀为空，若第六文件名为CAFE，数据查询装置根据该第三公共前缀从首字符逐字符对比待访问文件名CORE与文件名CAFE；由于待访问文件名CORE的特征值大于文件名CAFE的特征值，数据查询装置重新确定第三集合为{DASH、EMMA}，并重新确定第二公共前缀为空(待访问文件名CORE与文件名CAFE之间共有的第三前缀为“C”；待访问文件名CORE与第五文件名之间共有的第四前缀为空；因此，重新确定的第二公共前缀为空)；②、步骤①中数据查询装置重新确定的第三集合为{DASH、EMMA}，因此在这一步骤中，当前第三集合为{DASH、EMMA}，若第六文件名为DASH，数据查询装置根据当前的第二公共前缀从首字符逐字符对比待访问文件名CORE与文件名DASH；③、由于待访问文件名CORE的特征值小于文件名DASH的特征值，数据查询装置确定目标目录块为位于DASH之前且与DASH相邻的文件名CAFE归属的目录块，即确定目标目录块为目录块3。

在第二预设位置的文件名为目录块中首个文件名，第三预设位置的文件名为当前第三集合中的最后一个文件名，即第六文件名为当前第三集合中的最后一个文件名的情况下，若待访问文件名的特征值大于第六文件名的特征值，数据查询装置均将该第六文件名归属的目录块确定为目标目录块。

在一个示例中，结合上述图7，若当前第三集合为{ANDY、BABY、CAFE、DASH、EMMA}，待访问文件名为END，第六文件名为当前第三集合中的最后一个文件名EMMA，由于待访问文件名END的特征值大于文件名EMMA的特征值，因此，数据查询装置确定文件名EMMA归属的目录块为目标目录块。

可选的，在n个目录块的存储方式为块间顺序存储的场景中，若上述第六文件名为当前第三集合中的第

个文件名，对于每个目录块，若第二预设位置的文件名为该目录块中首个文件名，本申请实施例中的数据查询装置确定目标目录块的伪代码可以为如下代码：

该代码中的headprefix为第三前缀，endprefix为第四前缀，上述查询闭区间等效于上述第三集合。

可以看出，在确定目标目录块之前，数据查询装置的查询闭区间在不断缩小，且在每一查询闭区间中，数据查询装置均是从公共前缀后的首个字符起，逐字符对比待访问文件名fname与位于该查询闭区间中间位置的文件名dirent0name[mid]，有效的提高了查询目标目录块的速率。

数据查询装置在S901中确定出目标目录块后，从该目标目录块中查找与待访问文件名相同的文件名。本申请实施例中将与待访问文件名对应的目录项称为目标目录项。数据查询装置在查找到与待访问文件名相同的文件名后，可确定出目标目录项，进而根据目标目录项获取待访问文件的数据。

具体的，数据查询装置在执行S901后，执行S902，并顺序执行后续步骤。

S902、数据查询装置根据二分查找算法和目标目录块，确定当前第一集合和当前第二集合。

这里，当前第一集合包括m个文件名中连续的x个文件名，当前第二集合包括所述x个文件名、第一文件名以及第二文件名，m≥x≥1。第一文件名为排列于x个文件名中的首个文件名之前且与x个文件名中的首个文件名相邻的文件名，第二文件名为排列于x个文件名中的最后一个文件名之后且与x个文件名中的最后一个文件名相邻的文件名。

目标目录块包括m个文件名，数据查询装置根据二分查找算法在目标目录块中的m个文件名中进行查询。

具体的，数据查询装置根据二分查找算法和目标目录块，确定包括x个文件名的当前第一集合以及包括所述x个文件名、第一文件名以及第二文件名的当前第二集合。

容易理解的是，从上述对二分查找的描述以及图1示出的流程可知，在数据查询装置的查询过程，查询区间不断缩小，且在每一查询区间内数据查询装置均需比较待访问文件名的特征值与该查询区间中间位置的文件名的特征值的大小。为了便于描述，本申请实施例以当前的查询区间为当前第一集合为例进行说明。

特殊的，若x＝m，则第一文件名与第二文件名为空。

S903、数据查询装置确定待访问文件名与当前第二集合中的文件名之间的第一公共前缀。

从上述当前第一集合和当前第二集合的描述可知，当前第二集合中所有文件名组成的文件名范围大于当前第一集合中所有文件名组成的文件名范围，因此，当前第一集合中的所有文件名均存在第一公共前缀。

容易理解的是，第一文件名与第二文件名为空的情况下，第一公共前缀初始化为空。

具体的，数据查询装置确定第一公共前缀的方法为：数据查询装置确定待访问文件名与第一文件名之间共有的第一前缀，并确定待访问文件名与第二文件名之间共有的第二前缀；然后，该数据查询装置将第一前缀与第二前缀中长度最小的一个确定为第一公共前缀。

在一个示例中，如图11所示，目标目录块包括7个顺序排列的文件名：CAFE、CAGE、CAK、CELL、CORN、DAB、DACE。若当前第一集合为{CAFE、CAGE、CAK、CELL、CORN、DAB、DACE}，第一文件名和第二文件名均为空，第三文件名为CELL，待访问文件名为CAK，由于第一文件名和第二文件名均为空，因此，第一前缀和第二前缀均为空，相应的，当前的第一公共前缀为空。

若当前第一集合为{CAFE、CAGE、CAK}，则第一文件名为空，第二文件名为CELL，第一文件名与待访问文件名CAK之间共有的第一前缀为空，待访问文件名CAK与第二文件名CELL之间共有的第二前缀为“C”，第一前缀的长度小于第二前缀，因此，当前的第一公共前缀为空。

S904、数据查询装置从第一公共前缀之后的首位字符起，逐字符对比待访问文件名与第三文件名。

其中，第三文件名为当前第一集合中第一预设位置的文件名。

可选的，第一预设位置的文件名可以为当前第一集合中的第

个文件名，也可以为当前第一集合中其他位置的文件名，本申请实施例对此不作具体限定。

由于当前第一集合中的所有文件名均存在第一公共前缀，因此，数据查询装置在确定出第一公共前缀之后，从第一公共前缀之后的首位字符起，逐字符对比待访问文件名与第三文件名，提高了数据查询装置查找与待访问文件名相同的文件名的速率。

数据查询装置逐字符对比待访问文件名与第三文件名后，可确定出待访问文件名与第三文件名是否相同。

若待访问文件名与第三文件名相同，则说明第三文件名所对应的文件为待访问文件，此时，目标目录项为与第三文件名对应的目录项。数据查询装置根据目标目录项可获取到待访问文件的数据。在这种情况下，数据查询装置在执行S904后，继续执行下述步骤S905。

若待访问文件名与第三文件名不相同，数据查询装置需确定待访问文件名的特征值与第三文件名的特征值之间的大小关系，进而根据该大小关系重新确定第一集合和第二集合，并根据重新确定的第一集合和重新确定的第二集合，执行上述步骤B1和上述步骤C1，直到获取到待访问文件的数据或确定目标目录块未包括待访问文件名。

具体的，若待访问文件名的特征值小于第三文件名的特征值，数据查询装置重新确定的第一集合包括当前第一集合中位于第三文件名之前的所有文件名。若待访问文件名的特征值大于第三文件名的特征值，数据查询装置重新确定的第一集合包括当前第一集合中位于第三文件名之后的所有文件名。

示例性的，结合上述图11，令第一集合为{CAFE、CAGE、CAK、CELL、CORN、 DAB、DACE}，第三文件名为CELL。若待访问文件名为DACE，则待访问文件名DACE的特征值大于第三文件名CELL的特征值，重新确定的第一集合为{CORN、DAB、DACE}。若待访问文件名为CAGE，则待访问文件名CAGE的特征值小于第三文件名CELL的特征值，重新确定的第一集合为{CAFE、CAGE、CAK}。

相应的，若待访问文件名的特征值小于第三文件名的特征值，数据查询装置重新确定的重新确定的第二集合包括第一文件名、当前第一集合中位于第三文件名之前的所有文件名以及第三文件名。

若待访问文件名的特征值大于第三文件名的特征值，数据查询装置重新确定的第二集合包括第三文件名、当前第一集合中位于第三文件名之后的所有文件名以及第二文件名。

S905、数据查询装置根据目标目录项获取待访问文件的数据。

具体的，数据查询装置从目标目录项中获取待访问文件的索引号，并根据待访问文件的索引号获取待访问文件的索引，进而，该数据查询装置根据待访问文件的索引即可获取到待访问文件的数据。

现结合具体示例说明数据查询装置在目标目录块中查找与待访问文件名相同的文件名的过程。

在一个示例中，结合图11，如图12所示，当前第一集合为{CAFE、CAGE、CAK、CELL、CORN、DAB、DACE}，第三文件名为CELL，第一文件名和第二文件名均为空，待访问文件名为CAK。数据查询装置查询待访问文件名的过程为：①、此时，第一公共前缀初始化为空，数据查询装置根据该第一公共前缀逐字符对比待访问文件名CAK与文件名CELL；由于待访问文件名CAK的特征值小于文件名CELL的特征值，数据查询装置重新确定第一集合为{CAFE、CAGE、CAK}，重新确定第二集合中第一文件名为空，第二文件名为CELL，因此，重新确定的第一公共前缀为空(待访问文件名CAK与文件名CELL之间共有的第二前缀为“C”，待访问文件名CAK与第一文件名之间共有的第一前缀为空，因此，重新确定的第一公共前缀为空)；②、在步骤①中重新确定的第一集合为{CAFE、CAGE、CAK}，因此，在步骤②中的当前第一集合为{CAFE、CAGE、CAK}，相应的，当前的第一公共前缀为空，若第三文件名为CAGE，数据查询装置根据当前的第一公共前缀逐字符对比待访问文件名CAK与文件名CAGE，由于待访问文件名CAK的特征值大于文件名CAGE的特征值，数据查询装置重新确定第一集合为{CAK}，重新确定第二集合为{CAGE、CAK、CELL}；③、在步骤②中重新确定的第一集合为{CAK}，重新确定第二集合为{CAGE、CAK、CELL}，因此，在步骤③中的当前第一集合为{CAK}，当前第二集合为{CAGE、CAK、CELL}，数据查询装置确定当前的第一公共前缀为“C”，数据查询装置从“C”后的首个字符开始逐字符对比待访问文件名CAK与当前第一集合中的文件名CAK。由于当前第一集合中的文件名CAK与待访问文件名CAK相同，因此，数据查询装置确定目标目录项为与CAK对应的目录项。进而，数据查询装置根据目标目录项获取待访问文件的数据。

可选的，本申请实施例中数据查询装置在目标目录块中查询待访问文件名的伪代码可以为如下代码：

该代码中的headprefix为第一前缀，endprefix为第二前缀，fname为待访问文件名，上述查询闭区间等效于上述第一集合。

可以看出，在找到与待访问文件名相同的文件名之前，数据查询装置的查询区间在不断缩小，且在每一查询区间中，数据查询装置均是从公共前缀后的首个字符起，逐字符对比待访问文件名fname与位于该查询区间中间位置的文件名direntname[mid]，有效的提高了查询速率。

当本申请实施例中n个目录块的存储方式为块间按照完全二叉树方式存储时，本申请实施例提供的数据查询方法的流程依旧为图9示出的流程，数据查询装置也可执行S900～S905。但是，在n个目录块的存储方式为块间按照完全二叉树方式存储的场景和n个目录块的存储方式为块间顺序存储的场景中，数据查询装置从n个目录块中确定目标目录块的方法不同。

现在对在n个目录块的存储方式为块间按照完全二叉树方式存储的场景中，数据查询装置从n个目录块中确定目标目录块的方法进行解释。

具体的，在n个目录块的存储方式为块间按照完全二叉树方式存储的场景中，数据查询装置确定目标目录块的方法为：

步骤A3：数据查询装置确定当前候选目录块和当前第三公共前缀；

步骤B3：数据查询装置从当前第三公共前缀之后的首位字符起，逐字符对比待访问文件名与第i个文件名，该第i个文件名为n个目录块中第i个目录块中第四预设位置的文件名，0≤i＜n；

若待访问文件名与第i个文件名相同，则数据查询装置重新确定候选目录块为第i个文件名归属的目录块，并将重新确定的候选目录块确定为目标目录块。

第i个文件名为n个目录块中第i个目录块中第四预设位置的文件名。这里，第四预设位置的文件名可以为对应目录块中的首个文件名，也可以为对应目录块中的最后一个文件名，还可以为对应目录块中的其他文件名，本申请实施例对此不作具体限定。

数据查询装置从当前第三公共前缀之后的首位字符起，逐字符对比待访问文件名与第i个文件名之后，可确定出待访问文件名与第i个文件名是否相同。

若待访问文件名与第i个文件名相同，则说明第i个文件名归属的目录块为目标目录块。此时，数据查询装置可直接根据第i个文件名确定出与待访问文件名对应的目录项，进而根据与待访问文件名对应的目录项，获取到待访问文件的数据。

若待访问文件名与第i个文件名不同，则数据查询装置重新确定第三公共前缀、候选目录块以及第i个文件名，并根据重新确定的第三公共前缀、重新确定的候选目录块以及重新确定的第i个文件名，重新执行上述步骤B3，直到确定出目标目录块。

上述重新确定的第i个文件名为n个目录块中第j个目录块中第四预设位置的文件名。其中，若待访问文件名的特征值大于第i个文件名的特征值，j＝2i+2；若待访问文件名的特征值小于第i个文件名的特征值，j＝2i+1，0≤i＜j＜n。

与在n个目录块的存储方式为块间顺序存储的场景中数据查询装置确定公共前缀的方法类似，在n个目录块的存储方式为块间按照完全二叉树方式存储的场景中，数据查询装置也确定公共前缀。

在n个目录块的存储方式为块间按照完全二叉树方式存储的场景中，数据查询装置确定第三公共前缀。

若第四预设位置的文件名为对应目录块中的首个文件名，则数据查询装置重新确定第三公共前缀的方法为：当待访问文件名的特征值大于第i个文件名的特征值时，数据查询装置将当前第一目标前缀更新为待访问文件名与第i个文件名之间共有的前缀，并将更新后的第一目标前缀与当前第二目标前缀中长度最小的一个确定为重新确定的第三公共前缀。当待访问文件名的特征值小于第i个文件名的特征值时，数据查询装置将当前第二目标前缀更新为待访问文件名与第i个文件名之间共有的前缀，并将当前第一目标前缀与更新后的第二目标前缀中长度最小的一个确定为重新确定的第三公共前缀。

其中，第一目标前缀的长度和第二目标前缀的长度的初始值均为零，且第一目标前缀的长度和第二目标前缀的长度随着待访问文件名的特征值与第i个文件名的特征值的大小关系发生变化。

此外，在第四预设位置的文件名为对应目录块中的首个文件名的情况下，数据查询装置重新确定候选目录块的方法为：若待访问文件名的特征值大于第i个文件名的特征值，则数据查询装置确定候选目录块为第i个文件名归属的目录块；若待访问文件名的特征值小于第i个文件名的特征值，则数据查询装置确定候选目录块与当前候选目录块相同。

容易理解的是，若i＝0，当前候选目录块为空，当前第三公共前缀为空。

现结合具体示例说明在n个目录块的存储方式为块间按照完全二叉树方式存储的场景中，数据查询装置在目标目录块中查找与待访问文件名相同的文件名的过程。

示例性的，结合上述图8，如图13所示，若待访问文件名为CORE，数据查询装置确定目标目录块的过程为：①、候选目录块的初始值为空，第三公共前缀初始值为空，数据查询装置从首位字符起逐字符对比待访问文件名CORE与第0个文件名DASH，由于待访问文件名CORE的特征值小于DASH的特征值，数据查询装置需要进一步比较待访问文件名CORE与第1(2*0+1)个文件名BABY。数据查询装置重新确定的第三公共前缀依旧为空，此时，候选目录块保持不变，依旧为空；②、数据查询装置从首位字符起逐字符对比待访问文件名CORE与第1个文件名BABY，由于待访问文件名CORE的特征值大于BABY的特征值，数据查询装置将候选目录块变更为BABY归属的目录块(即目录块2)，此外，该查询装置需要进一步比较待访问文件名CORE与第4(2*1+2)个文件名CAFE。数据查询装置重新确定的第三公共前缀依旧为空。③、数据查询装置从首位字符起逐字符对比待访问文件名CORE与第4个文件名CAFE。由于待访问文件名CORE的特征值大于CAFE的特征值，数据查询装置将候选目录块变更为CAFE归属的目录块(即目录块5)；此外，数据查询装置需要进一步比较待访问文件名与第10(2*4+2)个文件名；但是，第10个文件名不存在；因此，数据查询装置确定CAFE归属的目录块为目标目录块，即确定目标目录块为目录块5。

可选的，在n个目录块的存储方式为块间按照完全二叉树方式存储的场景中，对于每个目录块，若第四预设位置的文件名为该目录块中首个文件名，本申请实施例中的数据查询装置确定目标目录块的伪代码可以为如下代码：

该代码中的headprefix相当于第一目标前缀，endprefix相当于第二目标前缀。

可以看出，数据查询装置均是从公共前缀后的首个字符起，逐字符对比待访问文件名fname与第i个文件名dirent0name[i]，有效的提高了查询目标目录块的速率。

综上所述，无论n个目录块的存储方式是块间顺序存储，还是块间按照完全二叉树方式存储，本申请实施例提供的数据查找方法均可有效的提高查询待访问文件的速率。

本申请实施例提供一种数据查询装置，该数据查询装置用于执行以上数据查询方法中的数据查询装置所执行的步骤。本申请实施例提供的数据查询装置可以包括相应步骤所对应的模块。

本申请实施例可以根据上述方法示例对数据查询装置进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

在采用对应各个功能划分各个功能模块的情况下，图14示出上述实施例中所涉及的数据查询装置的一种可能的结构示意图。如图14所示，数据查询装置140包括处理单元1400和获取单元1401。

处理单元1400用于支持该数据查询装置10执行上述实施例中的S901、S902、S903、S904等，和/或用于本文所描述的技术的其它过程。

获取单元1401用于支持该数据查询装置10执行上述实施例中的S900、S905等，和/或用于本文所描述的技术的其它过程。

其中，上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述，在此不再赘述。

当然，本申请实施例提供的数据查询装置140包括但不限于上述模块，例如：数据查询装置还可以包括存储单元1402。

存储单元1402可以用于存储该数据查询装置140的程序代码和数据。

在采用集成的单元的情况下，本申请实施例提供的数据查询装置的结构示意图如图15所示。在图15中，数据查询装置150包括：处理模块1500和通信模块1501。处理模块1500用于对数据查询装置150的动作进行控制管理，例如，执行上述处理单元1400执行的步骤，和/或用于执行本文所描述的技术的其它过程。通信模块1501用于支持数据查询装置150与其他设备之间的交互，例如，执行上述获取单元1401执行的步骤。如图15所示，数据查询装置150还可以包括存储模块1502，存储模块1502用于存储数据查询装置150的程序代码和数据，例如存储上述存储单元1402所保存的内容。

其中，处理模块1500可以是处理器或控制器，例如可以是CPU，通用处理器，DSP，专用集成电路(Application-Specific Integrated Circuit，ASIC)，现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。通信模块1501可以是收发器、RF电路或通信接口等。存储模块1502可以是存储器。

结合图4，处理模块1500可以为图4中的处理器41，通信模块1501可以为图4中的通信接口40，存储模块1502可以为图2中的存储介质42。

其中，上述方法实施例涉及的各场景的所有相关内容均可以援引到对应功能模块的功能描述，在此不再赘述。

上述数据查询装置140和数据查询装置150均可执行上述图9所示的数据查询方法，数据查询装置140和数据查询装置150具体可以是终端。

本申请还提供一种终端，该终端包括：一个或多个处理器、存储器、通信接口。该存储器、通信接口与一个或多个处理器耦合；存储器用于存储计算机程序代码，计算机程序代码包括指令，当一个或多个处理器执行指令时，终端执行本申请实施例的数据查询方法。

这里的终端可以是视频显示设备，智能手机，便携式电脑以及其它可以处理视频或者播放视频的设备。

本申请另一实施例还提供一种计算机可读存储介质，该计算机可读存储介质包括一个或多个程序代码，该一个或多个程序包括指令，当终端中的处理器在执行该程序代码时，该终端执行如图9所示的数据查询方法。

在本申请的另一实施例中，还提供一种计算机程序产品，该计算机程序产品包括计算机执行指令，该计算机执行指令存储在计算机可读存储介质中；终端的至少一个处理器可以从计算机可读存储介质读取该计算机执行指令，至少一个处理器执行该计算机执行指令使得终端实施执行图9所示的数据查询方法中的数据查询装置的步骤。

在上述实施例中，可以全部或部分的通过软件，硬件，固件或者其任意组合来实现。当使用软件程序实现时，可以全部或部分地以计算机程序产品的形式出现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。

所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质，(例如，软盘，硬盘、磁带)、光介质(例如，DVD)或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是一个物理单元或多个物理单元，即可以位于一个地方，或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何在本申请揭露的技术范围内的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种数据查询方法，其特征在于，应用于包括n个目录块的只读文件***中，每个目录块包括目录项区域和文件名区域，n≥1，所述数据查询方法包括：

从所述n个目录块中确定目标目录块，所述目标目录块的目录项区域包括m个目录项，所述目标目录块的文件名区域包括m个文件名，所述m个目录项与所述m个文件名一一对应，所述m个目录项和所述m个文件名均按照预设规则顺序排列，所述待访问文件名位于文件名范围中，所述文件名范围是由所述目标目录块的首个文件名与所述目标目录块的最后一个文件名组成的范围，m≥1；

步骤A1：根据二分查找算法和目标目录块，确定当前第一集合和当前第二集合，所述当前第一集合包括所述m个文件名中连续的x个文件名，所述当前第二集合包括所述x个文件名、第一文件名以及第二文件名，所述第一文件名为排列于所述x个文件名中的首个文件名之前且与所述x个文件名中的首个文件名相邻的文件名，所述第二文件名为排列于所述x个文件名中的最后一个文件名之后且与所述x个文件名中的最后一个文件名相邻的文件名，m≥x≥1；

步骤B1：确定所述待访问文件名与所述当前第二集合中的文件名之间的第一公共前缀；

步骤C1：从所述第一公共前缀之后的首位字符起，逐字符对比所述待访问文件名与第三文件名；其中，所述第三文件名为所述当前第一集合中第一预设位置的文件名；

若所述待访问文件名与所述第三文件名相同，则根据与所述第三文件名对应的目录项获取待访问文件的数据。
根据权利要求1所述的数据查询方法，其特征在于，所述数据查询方法还包括：

若所述待访问文件名与所述第三文件名不同，则根据所述二分查找算法、所述当前第一集合和所述当前第二集合，重新确定第一集合和第二集合，并根据重新确定的第一集合和重新确定的第二集合，执行所述步骤B1和所述步骤C1，直到获取到所述待访问文件的数据或确定所述目标目录块未包括所述待访问文件名。
根据权利要求2所述的数据查询方法，其特征在于，所述预设规则为字典序顺序；

所述若所述待访问文件名与所述第三文件名不同，则根据所述二分查找算法、所述当前第一集合和所述当前第二集合，重新确定第一集合和第二集合，具体包括：

若所述待访问文件名的特征值小于所述第三文件名的特征值，确定所述重新确定的第一集合包括所述当前第一集合中位于所述第三文件名之前的所有文件名，所述重新确定的第二集合包括所述第一文件名、所述当前第一集合中位于所述第三文件名之前的所有文件名以及所述第三文件名；

或者，

若所述待访问文件名的特征值大于所述第三文件名的特征值，确定所述重新确定的第一集合包括所述当前第一集合中位于所述第三文件名之后的所有文件名，所述重新确定的第二集合包括所述第三文件名、所述当前第一集合中位于所述第三文件名之后的所有文件名以及所述第二文件名。
根据权利要求1-3中任意一项所述的数据查询方法，其特征在于，所述确定所述待访问文件名与所述当前第二集合中的文件名之间的第一公共前缀，具体包括：

确定所述待访问文件名与所述第一文件名之间共有的第一前缀；

确定所述待访问文件名与所述第二文件名之间共有的第二前缀；

将所述第一前缀与所述第二前缀中长度最小的一个确定为所述第一公共前缀。
根据权利要求1-4中任意一项所述的数据查询方法，其特征在于，所述从所述n个目录块中确定目标目录块，具体包括：

步骤A2：根据所述二分查找算法和所述n个目录块，确定当前第三集合和当前第四集合；其中，所述当前第三集合包括p个文件名，所述p个文件名包括p个目录块中每个目录块中第二预设位置的文件名，且所述当前第三集合中的文件名按照所述预设规则顺序排列，所述p个目录块为所述n个目录块中连续的目录块，所述当前第四集合包括所述p个文件名、第四文件名以及第五文件名，所述第四文件名为排列于所述p个文件名中的首个文件名之前且与所述p个文件名中的首个文件名相邻的文件名，所述第五文件名为排列于所述p个文件名中的最后一个文件名之后且与所述p个文件名中的最后一个文件名相邻的文件名，1≤p≤n；

步骤B2：确定所述待访问文件名与所述当前第四集合中的文件名之间的第二公共前缀；

步骤C2：从所述第二公共前缀之后的首位字符起，逐字符对比所述待访问文件名与第六文件名；其中，所述第六文件名为所述当前第三集合中第三预设位置的文件名；

若所述待访问文件名与所述第六文件名相同，则确定所述第六文件名归属的目录块为所述目标目录块。
根据权利要求5所述的数据查询方法，其特征在于，若所述待访问文件名与所述第六文件名不同，所述数据查询方法还包括：

当2≤p≤n时，根据所述当前第三集合、所述当前第四集合和所述二分查找算法，重新确定第三集合和第四集合，并根据重新确定的第三集合和重新确定的第四集合，执行所述步骤B2和所述步骤C2；

当p＝1时，根据所述当前第三集合包括的文件名确定所述目标目录块。
根据权利要求6所述的数据查询方法，其特征在于，所述预设规则为字典序顺序，对于每个目录块，所述第二预设位置的文件名为该目录块的首个文件名；

所述当p＝1时，根据所述当前第三集合包括的文件名确定所述目标目录块，具体包括：

若所述待访问文件名的特征值大于所述当前第三集合中的文件名的特征值，则将所述当前第三集合中的文件名归属的目录块确定为所述目标目录块；

或者，

若所述待访问文件名的特征值小于所述当前第三集合中的文件名的特征值，则将位于所述当前第三集合中的文件名之前且与所述当前第三集合中的文件名相邻的文件名归属的目录块确定为所述目标目录块。
根据权利要求6或7所述的数据查询方法，其特征在于，所述预设规则为字典序顺序；

所述根据所述当前第三集合、所述当前第四集合和所述二分查找算法，重新确定第三集合和第四集合，具体包括：

若所述待访问文件名的特征值小于所述第六文件名的特征值，确定所述重新确定的第三集合包括所述当前第三集合中位于所述第六文件名之前的所有文件名，所述重新确定的第四集合包括所述第四文件名、所述当前第三集合中位于所述第六文件名之前的所有文件名以及所述第六文件名；

或者，

若所述待访问文件名的特征值大于所述第六文件名的特征值，确定所述重新确定的第三集合包括所述当前第三集合中位于所述第六文件名之后的所有文件名，所述重新确定的第四集合包括所述第六文件名、所述当前第三集合中位于所述第六文件名之后的所有文件名以及所述第五文件名。
根据权利要求5所述的数据查询方法，其特征在于，所述预设规则为字典序顺序，对于每个目录块，所述第二预设位置的文件名为该目录块的首个文件名，所述数据查询方法还包括：

若所述第六文件名为所述当前第三集合中的首个文件名，所述待访问文件名的特征值小于所述第六文件名的特征值，则将位于所述第六文件名之前且与所述第六文件名相邻的文件名归属的目录块确定为所述目标目录块；

若所述第六文件名为所述当前第三集合中的最后一个文件名，所述待访问文件名的特征值大于所述第六文件名的特征值，则将所述第六文件名归属的目录块确定为所述目标目录块。
根据权利要求6-9中任意一项所述的数据查询方法，其特征在于，所述确定所述待访问文件名与所述当前第四集合中的文件名之间的第二公共前缀，具体包括：

确定所述待访问文件名与所述第四文件名之间共有的第三前缀；

确定所述待访问文件名与所述第五文件名之间共有的第四前缀；

将所述第三前缀与所述第四前缀中长度最小的一个确定为所述第二公共前缀。
根据权利要求1-4中任意一项所述的数据查询方法，其特征在于，所述n个目录块按照所述预设规则顺序排列，并采用完全二叉树方式存储，所述从所述n个目录块中确定所述目标目录块，具体包括：

步骤A3：确定当前候选目录块和当前第三公共前缀；

步骤B3：从所述当前第三公共前缀之后的首位字符起，逐字符对比待访问文件名与第i个文件名，所述第i个文件名为所述n个目录块中第i个目录块中第四预设位置的文件名，0≤i＜n；

若所述待访问文件名与所述第i个文件名相同，则重新确定候选目录块为所述第i个文件名归属的目录块，并将重新确定的候选目录块确定为所述目标目录块。
根据权利要求11所述的数据查询方法，其特征在于，所述数据查询方法还包括：

若所述待访问文件名与所述第i个文件名不同，则重新确定第三公共前缀、候选目录块以及所述第i个文件名，重新确定的第i个文件名为所述n个目录块中第j个目录块中所述第四预设位置的文件名；其中，若所述待访问文件名的特征值大于所述第i个文件名的特征值，j＝2i+2；若所述待访问文件名的特征值小于所述第i个文件名的特征值，j＝2i+1，0≤i＜j＜n；

根据重新确定的第三公共前缀、重新确定的候选目录块以及所述重新确定的第i个文件名，重新执行所述步骤B3，直到确定出所述目标目录块。
根据权利要求12所述的数据查询方法，其特征在于，所述预设规则顺序为字典序，所述第四预设位置的文件名为对应目录块中的首个文件名，所述若所述待访问文件名与所述第i个文件名不同，则重新确定候选目录块，具体包括：

若所述待访问文件名的特征值大于所述第i个文件名的特征值，则确定所述重新确定的候选目录块为所述第i个文件名归属的目录块；

若所述待访问文件名的特征值小于所述第i个文件名的特征值，则确定所述重新确定的候选目录块为所述当前候选目录块。
根据权利要求12或13所述的数据查询方法，其特征在于，所述预设规则顺序为字典序，所述第四预设位置的文件名为对应目录块中的首个文件名，所述若所述待访问文件名与所述第i个文件名不同，则重新确定第三公共前缀，具体包括：

当所述待访问文件名的特征值大于所述第i个文件名的特征值时，将当前第一目标前缀更新为所述待访问文件名与所述第i个文件名之间共有的前缀；将更新后的第一目标前缀与当前第二目标前缀中长度最小的一个确定为所述重新确定的第三公共前缀；

或者，

当所述待访问文件名的特征值小于所述第i个文件名的特征值时，将所述当前第二目标前缀更新为所述待访问文件名与所述第i个文件名之间共有的前缀；将所述当前第一目标前缀与更新后的第二目标前缀中长度最小的一个确定为所述重新确定的第三公共前缀；

其中，所述第一目标前缀的长度和所述第二目标前缀的长度的初始值均为零，且所述第一目标前缀的长度和所述第二目标前缀的长度随着所述待访问文件名的特征值与所述第i个文件名的特征值的大小关系发生变化。
一种只读文件***，其特征在于，所述只读文件***的对象包括目录文件，所述目录文件由n个目录块组成，每个目录块均包括目录项区域和文件名区域，所述目录项区域包括至少一个目录项，所述文件名区域包括至少一个文件名；

对应同一目录块而言，该目录块中目录项的数量与文件名的数量相同，且该目录块中的所有目录项以及所有文件名均按照预设规则顺序排列。
根据权利要求15所述的只读文件***，其特征在于，

所述至少一个目录项中的每个目录项均包括索引号、文件类型和与该目录项对应的文件名在所归属的目录块的偏移量；

所述文件名区域与所述目录项区域相邻，且所述文件名区域位于所述目录项区域之后。
一种数据查询装置，其特征在于，所述数据查询装置具备如权利要求15或16所述的只读文件***，所述数据查询装置包括：

处理单元，用于从所述只读文件***的n个目录块中确定目标目录块，所述目标目录块的目录项区域包括m个目录项，所述目标目录块的文件名区域包括m个文件名，所述m个目录项与所述m个文件名一一对应，所述m个目录项和所述m个文件名均按照预设规则顺序排列，所述待访问文件名位于文件名范围中，所述文件名范围是由所述目标目录块的首个文件名与所述目标目录块的最后一个文件名组成的范围，m≥1；

所述处理单元，还用于执行步骤A1、步骤B1以及步骤C1；其中，

所述步骤A1为：根据二分查找算法和目标目录块，确定当前第一集合和当前第二集合，所述当前第一集合包括所述m个文件名中连续的x个文件名，所述当前第二集合包括所述x个文件名、第一文件名以及第二文件名，所述第一文件名为排列于所述x个文件名中的首个文件名之前且与所述x个文件名中的首个文件名相邻的文件名，所述第二文件名为排列于所述x个文件名中的最后一个文件名之后且与所述x个文件名中的最后一个文件名相邻的文件名，m≥x≥1；

所述步骤B1为：确定所述待访问文件名与所述当前第二集合中的文件名之间的第一公共前缀；

所述步骤C1为：从所述第一公共前缀之后的首位字符起，逐字符对比所述待访问文件名与第三文件名；其中，所述第三文件名为所述当前第一集合中第一预设位置的文件名；

获取单元，用于若所述处理单元判断出所述待访问文件名与所述第三文件名相同，则根据与所述第三文件名对应的目录项获取待访问文件的数据。
根据权利要求17所述的数据查询装置，其特征在于，

所述处理单元，还用于若所述待访问文件名与所述第三文件名不同，则根据所述二分查找算法、所述当前第一集合和所述当前第二集合，重新确定第一集合和第二集合，并根据重新确定的第一集合和重新确定的第二集合，执行所述步骤B1和所述步骤C1，直到所述获取单元获取到所述待访问文件的数据或所述处理单元确定所述目标目录块未包括所述待访问文件名。
根据权利要求18所述的数据查询装置，其特征在于，所述预设规则为字典序顺序，所述处理单元具体用于：

若所述待访问文件名的特征值小于所述第三文件名的特征值，确定所述重新确定的第一集合包括所述当前第一集合中位于所述第三文件名之前的所有文件名，所述重新确定的第二集合包括所述第一文件名、所述当前第一集合中位于所述第三文件名之前的所有文件名以及所述第三文件名；

或者，

若所述待访问文件名的特征值大于所述第三文件名的特征值，确定所述重新确定的第一集合包括所述当前第一集合中位于所述第三文件名之后的所有文件名，所述重新确定的第二集合包括所述第三文件名、所述当前第一集合中位于所述第三文件名之后的所有文件名以及所述第二文件名。
根据权利要求17-19中任意一项所述的数据查询装置，其特征在于，所述处理单元具体用于：

确定所述待访问文件名与所述第一文件名之间共有的第一前缀；

确定所述待访问文件名与所述第二文件名之间共有的第二前缀；

将所述第一前缀与所述第二前缀中长度最小的一个确定为所述第一公共前缀。
根据权利要求17-20中任意一项所述的数据查询装置，其特征在于，

所述处理单元，还用于执行步骤A2、步骤B2以及步骤C2；其中，

所述步骤A2为：根据所述二分查找算法和所述n个目录块，确定当前第三集合和当前第四集合；其中，所述当前第三集合包括p个文件名，所述p个文件名包括p个目录块中每个目录块中第二预设位置的文件名，且所述当前第三集合中的文件名按照所述预设规则顺序排列，所述p个目录块为所述n个目录块中连续的目录块，所述当前第四集合包括所述p个文件名、第四文件名以及第五文件名，所述第四文件名为排列于所述p个文件名中的首个文件名之前且与所述p个文件名中的首个文件名相邻的文件名，所述第五文件名为排列于所述p个文件名中的最后一个文件名之后且与所述p个文件名中的最后一个文件名相邻的文件名，1≤p≤n；

所述步骤B2为：确定所述待访问文件名与所述当前第四集合中的文件名之间的第二公共前缀；

所述步骤C2为：从所述第二公共前缀之后的首位字符起，逐字符对比所述待访问文件名与第六文件名；其中，所述第六文件名为所述当前第三集合中第三预设位置的文件名；

所述处理单元，还用于若所述待访问文件名与所述第六文件名相同，则确定所述第六文件名归属的目录块为所述目标目录块。
根据权利要求21所述的数据查询装置，其特征在于，所述处理单元具体用于：

当2≤p≤n时，根据所述当前第三集合、所述当前第四集合和所述二分查找算法，重新确定第三集合和第四集合，并根据重新确定的第三集合和重新确定的第四集合，执行所述步骤B2和所述步骤C2；

当p＝1时，根据所述当前第三集合包括的文件名确定所述目标目录块。
根据权利要求22所述的数据查询装置，其特征在于，所述预设规则为字典序顺序，对于每个目录块，所述第二预设位置的文件名为该目录块的首个文件名；当p＝1时，所述处理单元具体用于：

若所述待访问文件名的特征值大于所述当前第三集合中的文件名的特征值，则将所述当前第三集合中的文件名归属的目录块确定为所述目标目录块；

或者，

若所述待访问文件名的特征值小于所述当前第三集合中的文件名的特征值，则将位于所述当前第三集合中的文件名之前且与所述当前第三集合中的文件名相邻的文件名归属的目录块确定为所述目标目录块。
根据权利要求22或23所述的数据查询装置，其特征在于，所述预设规则为字典序顺序；所述处理单元具体用于：

若所述待访问文件名的特征值小于所述第六文件名的特征值，确定所述重新确定的第三集合包括所述当前第三集合中位于所述第六文件名之前的所有文件名，所述重新确定的第四集合包括所述第四文件名、所述当前第三集合中位于所述第六文件名之前的所有文件名以及所述第六文件名；

或者，

若所述待访问文件名的特征值大于所述第六文件名的特征值，确定所述重新确定的第三集合包括所述当前第三集合中位于所述第六文件名之后的所有文件名，所述重新确定的第四集合包括所述第六文件名、所述当前第三集合中位于所述第六文件名之后的所有文件名以及所述第五文件名。
根据权利要求21所述的数据查询装置，其特征在于，所述预设规则为字典序顺序，对于每个目录块，所述第二预设位置的文件名为该目录块的首个文件名，所述处理单元还用于：

若所述第六文件名为所述当前第三集合中的首个文件名，所述待访问文件名的特征值小于所述第六文件名的特征值，则将位于所述第六文件名之前且与所述第六文件名相邻的文件名归属的目录块确定为所述目标目录块；

若所述第六文件名为所述当前第三集合中的最后一个文件名，所述待访问文件名的特征值大于所述第六文件名的特征值，则将所述第六文件名归属的目录块确定为所述目标目录块。
根据权利要求22-25中任意一项所述的数据查询装置，其特征在于，所述处理单元具体用于：

确定所述待访问文件名与所述第四文件名之间共有的第三前缀；

确定所述待访问文件名与所述第五文件名之间共有的第四前缀；

将所述第三前缀与所述第四前缀中长度最小的一个确定为所述第二公共前缀。
根据权利要求17-20中任意一项所述的数据查询装置，其特征在于，所述n个目录块按照所述预设规则顺序排列，并采用完全二叉树方式存储；

所述处理单元，还用于执行步骤A3和步骤B3；其中，

所述步骤A3为：确定当前候选目录块和当前第三公共前缀；

所述步骤B3为：从所述当前第三公共前缀之后的首位字符起，逐字符对比待访问文件名与第i个文件名，所述第i个文件名为所述n个目录块中第i个目录块中第四预设位置的文件名，0≤i＜n；

所述处理单元，还用于若所述待访问文件名与所述第i个文件名相同，则重新确定候选目录块为所述第i个文件名归属的目录块，并将重新确定的候选目录块确定为所述目标目录块。
根据权利要求27所述的数据查询装置，其特征在于，

所述处理单元，还用于若所述待访问文件名与所述第i个文件名不同，则重新确定第三公共前缀、候选目录块以及所述第i个文件名，重新确定的第i个文件名为所述n个目录块中第j个目录块中所述第四预设位置的文件名；其中，若所述待访问文件名的特征值大于所述第i个文件名的特征值，j＝2i+2；若所述待访问文件名的特征值小于所述第i个文件名的特征值，j＝2i+1，0≤i＜j＜n；

所述处理单元，还用于根据重新确定的第三公共前缀、重新确定的候选目录块以及所述重新确定的第i个文件名，重新执行所述步骤B3，直到确定出所述目标目录块。
根据权利要求28所述的数据查询装置，其特征在于，所述预设规则顺序为字典序，所述第四预设位置的文件名为对应目录块中的首个文件名；所述处理单元具体用于：

若所述待访问文件名的特征值大于所述第i个文件名的特征值，则确定所述重新确定的候选目录块为所述第i个文件名归属的目录块；

若所述待访问文件名的特征值小于所述第i个文件名的特征值，则确定所述重新确定的候选目录块为所述当前候选目录块。
根据权利要求28或29所述的数据查询装置，其特征在于，所述预设规则顺序为字典序，所述第四预设位置的文件名为对应目录块中的首个文件名；所述处理单元具体用于：

当所述待访问文件名的特征值大于所述第i个文件名的特征值时，将当前第一目标前缀更新为所述待访问文件名与所述第i个文件名之间共有的前缀；将更新后的第一目标前缀与当前第二目标前缀中长度最小的一个确定为所述重新确定的第三公共前缀；

或者，

当所述待访问文件名的特征值小于所述第i个文件名的特征值时，将所述当前第二目标前缀更新为所述待访问文件名与所述第i个文件名之间共有的前缀；将所述当前第一目标前缀与更新后的第二目标前缀中长度最小的一个确定为所述重新确定的第三公共前缀；

其中，所述第一目标前缀的长度和所述第二目标前缀的长度的初始值均为零，且所述第一目标前缀的长度和所述第二目标前缀的长度随着所述待访问文件名的特征值与所述第i个文件名的特征值的大小关系发生变化。
一种终端，其特征在于，所述终端包括：一个或多个处理器、存储器、通信接口；

所述存储器、所述通信接口与所述一个或多个处理器耦合；所述存储器用于存储计算机程序代码，所述计算机程序代码包括指令，当所述一个或多个处理器执行所述指令时，所述终端执行如权利要求1-14中任意一项所述的数据查询方法。
一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，其特征在于，当所述指令在终端上运行时，使得所述终端执行如权利要求1-14中任意一项所述的数据查询方法。
一种包含指令的计算机程序产品，其特征在于，当所述计算机程序产品在终端上运行时，使得所述终端执行如权利要求1-14中任意一项所述的数据查询方法。