CN112732796B - 一种模糊查询匹配方法 - Google Patents

一种模糊查询匹配方法 Download PDF

Info

Publication number
CN112732796B
CN112732796B CN202110091480.7A CN202110091480A CN112732796B CN 112732796 B CN112732796 B CN 112732796B CN 202110091480 A CN202110091480 A CN 202110091480A CN 112732796 B CN112732796 B CN 112732796B
Authority
CN
China
Prior art keywords
template
character
wildcard
character string
retrieval position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110091480.7A
Other languages
English (en)
Other versions
CN112732796A (zh
Inventor
王志强
盖素丽
檀改芳
梅欢
马艳东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute Of Applied Mathematics Hebei Academy Of Sciences
Original Assignee
Institute Of Applied Mathematics Hebei Academy Of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Applied Mathematics Hebei Academy Of Sciences filed Critical Institute Of Applied Mathematics Hebei Academy Of Sciences
Priority to CN202110091480.7A priority Critical patent/CN112732796B/zh
Publication of CN112732796A publication Critical patent/CN112732796A/zh
Application granted granted Critical
Publication of CN112732796B publication Critical patent/CN112732796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Fuzzy Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种模糊查询匹配方法。属于应用开发方法实现领域,用于对模板字符串和目标字符串之间进行快速匹配,该方法是对模板字符串中的任意通配符进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度;且对于模板字符串最后一位不是该任意通配符的情况,在模板字符串先进行到结尾时,需对目标字符串进行反向匹配步骤。本发明能够针对各种场景做出全模糊与半模糊的匹配优化。具有快速高效的特点,且能适用于大批量数据的查询匹配。

Description

一种模糊查询匹配方法
技术领域
本发明涉及应用开发方法实现领域,尤指一种模糊查询匹配方法。
背景技术
数据湖分析是目前炙手可热的、全新的大数据方向,其主要应用在低成本、无限容量的对象存储***中,可存储各种各样的数据,并以存储计算分离架构方式,构建出结构化的元信息,最终围绕这些元信息和数据,在上层构建各种各样的分析和计算服务。其一般包含结构化、半结构化、非结构化等类型的数据,并且数据量巨大,分析难度很高。其中,结构化和半结构化数据是数据湖目前主要的处理对象。
由于在数据湖场景中,往往需要通过对大数据集信息的发现,并结合索引优化,模糊匹配等相关技术,对给定的条件,快速过滤并准确计算出满足条件的数据信息。经发明人的不懈努力,本发明实现了这样一种快速模糊匹配的方法,其能够针对各种场景做出全模糊与半模糊的匹配优化。
鉴于现有的模糊匹配方法多为数据库中的类似“like“的查询语句,而且这些现有应用开发中的模糊匹配方法不适用于海量数据的查询匹配的情况,本发明公开了一种新的模糊匹配方法,其具有快速高效的特点,且能适用于大批量数据的查询匹配。
发明内容
为解决上述问题,本发明主要目的在于,提供一种模糊查询匹配方法,其能够针对各种极端场景做出全模糊与半模糊的匹配优化。其次一目的在于,提供一种具有快速高效的特点,且能适用于大批量数据的查询匹配的模糊匹配方法。
为实现上述目的,本发明提供了一种模糊查询匹配方法,用于对模板字符串和目标字符串之间进行快速匹配,所述模板字符串包含任意通配符、单字通配符、及转义通配符,该方法是对模板字符串中的任意通配符进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度;且对于模板字符串最后一位不是该任意通配符的情况,在模板字符串先进行到结尾时,需对目标字符串进行反向匹配步骤。该反向匹配步骤只需要反向从模板字符串结尾匹配到通配符标记位置即可。该方法可适用于各种数据类型和编码格式,比如:包括但不限于字节数组(byte[])、字符型数组(char[])、字符串类(String)、数据流(Stream)等。通配符也一样,任意通配符也可能是“*”或其它字符,单字符通配符也可能是“?”或其它字符。
较佳的是,该方法包含步骤:
(1)将可匹配任意长度字符串的该任意通配符,看作是一段匹配的开始,对该任意通配符进行位置标记,其初始标记为-1;如果有在模板中有匹配到新的任意通配符就对标记进行更新;如果在其它字符匹配中失败就返回标记位置;当返回位置为-1时,表示当前匹配段中没有任意通配符,匹配失败;如果返回位置不小于0,则任意通配符存在,继续匹配,直到模板字符串和目标字符串中的某一个结束;
(2)对于模板字符串最后一位是任意通配符的情况,如果匹配字符串进行完毕,则匹配成功;如果目标字符串先于模板前一位结束,则匹配失败;
(3)对于模板字符串最后一位不是该任意通配符的情况,则在模板字符串先进行到结尾时还需要进行反向匹配。
其中,上述方法在步骤(3)中,可反向从模板字符串结尾匹配到标记位置即可。
较佳的是,该方法的具体步骤如下:
1.先将模板字符串中的任意通配符标记为-1;
2.模板字符检索位置,将目标字符串检索位置置位为字符开头;
3.在满足模板字符检索位置小于模板字符长度并且目标字符串检索位置小于目标字符长度的条件下,开始对模板检索位置字符和目标检索位置字符进行比较,如不满足该条件则转到步骤7;
4.如果模板检索位置字符和目标检索位置字符相同,则模板检索位置和目标字符检索位置均加1,并回到步骤3;
5.如果模板检索位置字符和目标检索位置字符不相同,则:
5.1如果模板字符串中的任意通配符标记位置等于-1,则转到步骤7;
5.2如果模板字符串中的任意通配符标记位置小于模板检索位置;
5.2.1如果模板字符串中的任意通配符标记位置在模板检索位置的前一位并且模板字符串中的任意通配符标记位置的字符为转义通配符,则目标字符检索位置均加1,将模板检索位置重置为模板字符串中的任意通配符标记位置;
5.2.2不满足模板字符串中的任意通配符标记位置在模板检索位置的前一位并且模板字符串中的任意通配符标记位置的字符为转义通配符,则将模板检索位置重置为模板字符串中的任意通配符标记位置;
5.3如为其他情况,则将目标字符检索位置均加1,
6.回到步骤3;
7.如果模板字符检索位置等于模板字符长度并且目标字符串检索位置等于目标字符长度,则说明匹配成功,此时,模板字符串和目标字符串均结束;
8.如果目标字符串检索位置等于目标字符长度,模板字符检索位置为模板字符串结束位置,那么当模板字符串结束字符为任意通配符时匹配成功,此时目标字符串结束;
9.模板字符检索位置等于模板字符长度,此时模板字符串结束;
9.1如果模板字符串长度大于1,当模板字符串是以任意通配符结束时,匹配成功;
9.2如果模板字符串长度大于1,且模板字符串不是以任意通配符结束时,此时需要反向匹配未结束的目标字符串;
9.2.1目标字符串反向检索位置置位为字符串最后一位,模板反向检索位置置位为模板最后一位;
9.2.2反向对比模板任意通配符到结束位置的字符;
A.如果模板反向检索位置的字符不是转义通配符,而是单一通配符,且前一位不是转义通配符时,目标反向检索位置减1;继续9.2.2
B.如果模板反向检索位置的字符不是转义通配符,当模板反向检索位置和目标字符反向检索位置字符不相同时,匹配失败;当模板反向检索位置和目标字符反向检索位置字符相同时,目标反向检索位置减1;继续步骤9.2.2;
C.如果模板反向检索位置的字符为转义通配符;当模板反向检索位置的前一位是转义通配符且目标字符的反向检索位置不是转义通配符,则匹配失败;当模板反向检索位置的前一位是转义通配符且目标字符的反向检索位置也是转义通配符时,则目标反向检索位置减1;继续步骤9.2.2;
9.2.3反向比对正常结束,则匹配成功;
9.3如果模板字符串长度小于1,如果模板字符串为任意通配符,则匹配成功,如果不是通配符则匹配失败;
10.其他情况,匹配失败。
进一步的,其中的步骤3的比较步骤如下:
3.1如果模板检索位置字符为任意通配符,则模板检索位置加1,任意通配符标记为当前模板检索位置,并回到步骤3;
3.2如果模板检索位置字符为单一通配符,则视为与目标字符相同,模板检索位置和目标字符检索位置均加1,然后回到步骤3;
3.3如果模板检索位置字符为转义通配符,则为转义符,模板检索位置加1。
本发明有益效果在于,借助上述技术方案,本发明具体实现了一种快速模糊匹配的方法。其能够针对各种极端场景做出全模糊与半模糊的匹配优化,且即可适用于数据湖分析,也可以应用到其他应用开发领域。
附图说明
图1本发明的一种模糊查询匹配方法方框示意图。
图2为本发明的一种模糊查询匹配方法步骤示意图的一部分。
图3为图2所示的一种模糊查询匹配方法步骤示意图的另一部分。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案做进一步具体的说明。
目前,字符串在数据中有很多种存在形式,包括各种数据类型和编码格式,比如:包括但不限于字节数组(byte[])、字符型数组(char[])、字符串类(String)、数据流(Stream)等。通配符也一样,任意通配符也可能是“*”或其它字符,单字符通配符也可能是“?”或其它字符。
以下具体实施例是以任意通配符是“%”,单字通配符是“_”,转义通配符是“/”为例进行示范说明。本发明的一种模糊查询匹配方法,是针对Byte化数据开发了模糊查询引擎,能够完成超长字段的快速查询;
其是用于对模板字符串(在本具体实施例中是以包含“%”、“_”、“/”为例)和目标字符串之间进行快速匹配的一种方法。
其核心思想是对模板字符串中的通配符“%”进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度。而对于模板字符串最后一位不是“%”通配符的情况下,则在模板字符串先进行到结尾时还需要反向对目标字符串进行匹配,该步骤只需要反向从模板字符串结尾匹配到通配符标记位置即可。
由于该方法是对模板字符串中的通配符“%”进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度。因而本发明利用该方法可以简单,快速精准的判断字符串是否匹配,该方法可使用于大数据量进行匹配判断的环境。
如图1所示,为本发明的一种模糊查询匹配方法方框示意图。其中主要步骤可表示为:
(1)由于通配符“%”可匹配任意长度字符串,那么可以把“%”看作是一段匹配的开始,因此对通配符“%”进行位置标记,其初始标记为-1。如果有在模板中有匹配到新的“%”就对标记进行更新;如果在其它字符匹配中失败就返回标记位置。当返回位置为-1时,意味着当前匹配段中没有任意通配符,匹配失败。如果返回位置不小于0,则说明任意通配符“%”存在,可以继续匹配,直到模板字符串和目标字符串中的某一个结束。
(2)对于模板字符串最后一位是“%”的情况,如果匹配字符串进行完毕,则说明匹配成功。如果目标字符串先于模板前一位结束,则说明匹配失败。
(3)对于模板字符串最后一位不是“%”的情况,则在模板字符串先进行到结尾时还需要进行反向匹配。“%”的标记位置在反向匹配中再次发挥了作用,只需要反向从模板字符串结尾匹配到标记位置即可,不用考虑“%”的存在。
作为一个具体的实施例,请参见图2及图3,为本发明的一种模糊查询匹配方法步骤示意图,在本具体实施例中,采用的具体步骤如下:
1.先将模板字符串中的通配符“%”标记为-1;
2.模板字符检索位置,将目标字符串检索位置置位为字符开头;
3.在满足模板字符检索位置小于模板字符长度并且目标字符串检索位置小于目标字符长度的条件下,开始对模板检索位置字符和目标检索位置字符进行比较,如不满足该条件则转到步骤7;
3.1如果模板检索位置字符为“%”,则模板检索位置加1,通配符“%”标记为当前模板检索位置,并回到步骤3;
3.2如果模板检索位置字符为“_”,则视为与目标字符相同,模板检索位置和目标字符检索位置均加1,然后回到步骤3;
3.3如果模板检索位置字符为“\”,则为转义符,模板检索位置加1;
4.如果模板检索位置字符和目标检索位置字符相同,则模板检索位置和目标字符检索位置均加1,并回到步骤3;
5.如果模板检索位置字符和目标检索位置字符不相同,则:
5.1如果模板字符串中的通配符“%”标记位置等于-1,则转到步骤7;
5.2如果模板字符串中的通配符“%”标记位置小于模板检索位置;
5.2.1如果模板字符串中的通配符“%”标记位置在模板检索位置的前一位并且模板字符串中的通配符“%”标记位置的字符为“\”,则目标字符检索位置均加1,将模板检索位置重置为模板字符串中的通配符“%”标记位置;
5.2.2不满足模板字符串中的通配符“%”标记位置在模板检索位置的前一位并且模板字符串中的通配符“%”标记位置的字符为“\”,则将模板检索位置重置为模板字符串中的通配符“%”标记位置;
5.3如为其他情况,则将目标字符检索位置均加1,
6.回到步骤3;
7.如果模板字符检索位置等于模板字符长度并且目标字符串检索位置等于目标字符长度,则说明匹配成功;(模板字符串和目标字符串均结束)
8.如果目标字符串检索位置等于目标字符长度,模板字符检索位置为模板字符串结束位置,那么当模板字符串结束字符为通配符“%”时匹配成功;(目标字符串结束)
9.模板字符检索位置等于模板字符长度;(模板字符串结束)
9.1如果模板字符串长度大于1,当模板字符串是以通配符“%”结束时,匹配成功;
9.2如果模板字符串长度大于1,且模板字符串不是以通配符“%”结束时,此时需要反向匹配未结束的目标字符串;
9.2.1目标字符串反向检索位置置位为字符串最后一位,模板反向检索位置置位为模板最后一位;
9.2.2反向对比模板通配符“%”到结束位置的字符;
A.如果模板反向检索位置的字符不是转义符“\”,而是“_”且前一位不是转义符“\”时,目标反向检索位置减1;继续9.2.2
B.如果模板反向检索位置的字符不是转义符“\”,当模板反向检索位置和目标字符反向检索位置字符不相同时,匹配失败。当模板反向检索位置和目标字符反向检索位置字符相同时,目标反向检索位置减一;继续步骤9.2.2;
C.如果模板反向检索位置的字符为转义符“\”;当模板反向检索位置的前一位是转义符“\”且目标字符的反向检索位置不是转义符“\”,则匹配失败;当模板反向检索位置的前一位是转义符“\”且目标字符的反向检索位置也是转义符“\”时,则目标反向检索位置减1;继续步骤9.2.2;
9.2.3反向比对正常结束,则匹配成功;
9.3如果模板字符串长度小于1,如果模板字符串为通配符“%”,则匹配成功,如果不是通配符则匹配失败;
10.其他情况,匹配失败。
图1、图2是表示验证时,设定模板字符为matchMould,目标字符串为matchObject,模板字符串长度为mmLen,目标字符串长度为btEnd,模板通配符“%”位置标记为retreatLoc,模板字符检索位置为i,目标字符检索位置Z,模板字符反向检索位置为iRev,目标字符检索位置zRev。
其中,所述的字符串可为在数据中存在的各种形式,本发明可适用于各种数据类型和编码格式,比如:包括但不限于字节数组(byte[])、字符型数组(char[])、字符串类(String)、数据流(Stream)等;任意通配符也可能是“*”或其它字符,单字符通配符也可能是“?”或其它字符。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解,依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种模糊查询匹配方法,用于批量数据的查询匹配中对模板字符串和目标字符串之间进行快速匹配,所述模板字符串包含任意通配符、单字通配符、及转义通配符,其特征在于,该方法是对模板字符串中的任意通配符进行标记,和目标字符串顺序比对,不重复以提高匹配对比速度;且对于模板字符串最后一位不是该任意通配符的情况,在模板字符串先进行到结尾时,需对目标字符串进行反向匹配步骤。
2.根据权利要求1所述的一种模糊查询匹配方法,其特征在于,该方法如下步骤:
(1)将可匹配任意长度字符串的该任意通配符,看作是一段匹配的开始,对该任意通配符进行位置标记,其初始标记为-1;如果有在模板中有匹配到新的任意通配符就对标记进行更新;如果在其它字符匹配中失败就返回标记位置;当返回位置为-1时,表示当前匹配段中没有任意通配符,匹配失败;如果返回位置不小于0,则任意通配符存在,继续匹配,直到模板字符串和目标字符串中的某一个结束;
(2)对于模板字符串最后一位是任意通配符的情况,如果匹配字符串进行完毕,则匹配成功;如果目标字符串先于模板前一位结束,则匹配失败;
(3)对于模板字符串最后一位不是该任意通配符的情况,则在模板字符串先进行到结尾时还需要进行反向匹配。
3.根据权利要求2所述的一种模糊查询匹配方法,其特征在于,在步骤(3)中,只需要反向从模板字符串结尾匹配到标记位置即可。
4.根据权利要求2或3所述的一种模糊查询匹配方法,其特征在于,该方法的具体步骤为:
1.先将模板字符串中的任意通配符标记为-1;
2.模板字符检索位置,将目标字符串检索位置置位为字符开头;
3.在满足模板字符检索位置小于模板字符长度并且目标字符串检索位置小于目标字符长度的条件下,开始对模板检索位置字符和目标检索位置字符进行比较,如不满足该条件则转到步骤7;
4.如果模板检索位置字符和目标检索位置字符相同,则模板检索位置和目标字符检索位置均加1,并回到步骤3;
5.如果模板检索位置字符和目标检索位置字符不相同,则:
5.1如果模板字符串中的任意通配符标记位置等于-1,则转到步骤7;
5.2如果模板字符串中的任意通配符标记位置小于模板检索位置;
5.2.1如果模板字符串中的任意通配符标记位置在模板检索位置的前一位并且模板字符串中的任意通配符标记位置的字符为转义通配符,则目标字符检索位置均加1,将模板检索位置重置为模板字符串中的任意通配符标记位置;
5.2.2不满足模板字符串中的任意通配符标记位置在模板检索位置的前一位并且模板字符串中的任意通配符标记位置的字符为转义通配符,则将模板检索位置重置为模板字符串中的任意通配符标记位置;
5.3如为其他情况,则将目标字符检索位置均加1,
6.回到步骤3;
7.如果模板字符检索位置等于模板字符长度并且目标字符串检索位置等于目标字符长度,则说明匹配成功,此时,模板字符串和目标字符串均结束;
8.如果目标字符串检索位置等于目标字符长度,模板字符检索位置为模板字符串结束位置,那么当模板字符串结束字符为任意通配符时匹配成功,此时目标字符串结束;
9.模板字符检索位置等于模板字符长度,此时模板字符串结束;
9.1如果模板字符串长度大于1,当模板字符串是以任意通配符结束时,匹配成功;
9.2如果模板字符串长度大于1,且模板字符串不是以任意通配符结束时,此时需要反向匹配未结束的目标字符串;
9.2.1目标字符串反向检索位置置位为字符串最后一位,模板反向检索位置置位为模板最后一位;
9.2.2反向对比模板任意通配符到结束位置的字符;
A.如果模板反向检索位置的字符不是转义通配符,而是单一通配符,且前一位不是转义通配符时,目标反向检索位置减1;继续9.2.2
B.如果模板反向检索位置的字符不是转义通配符,当模板反向检索位置和目标字符反向检索位置字符不相同时,匹配失败;当模板反向检索位置和目标字符反向检索位置字符相同时,目标反向检索位置减1;继续步骤9.2.2;
C.如果模板反向检索位置的字符为转义通配符;当模板反向检索位置的前一位是转义通配符且目标字符的反向检索位置不是转义通配符,则匹配失败;当模板反向检索位置的前一位是转义通配符且目标字符的反向检索位置也是转义通配符时,则目标反向检索位置减1;继续步骤9.2.2;
9.2.3反向比对正常结束,则匹配成功;
9.3如果模板字符串长度小于1,如果模板字符串为任意通配符,则匹配成功,如果不是通配符则匹配失败;
10.其他情况,匹配失败。
5.根据权利要求4所述的一种模糊查询匹配方法,其特征在于,步骤3的比较步骤如下:
3.1如果模板检索位置字符为任意通配符,则模板检索位置加1,任意通配符标记为当前模板检索位置,并回到步骤3;
3.2如果模板检索位置字符为单一通配符,则视为与目标字符相同,模板检索位置和目标字符检索位置均加1,然后回到步骤3;
3.3如果模板检索位置字符为转义通配符,则为转义符,模板检索位置加1。
6.根据权利要求5所述的一种模糊查询匹配方法,其特征在于,所述任意通配符、单字通配符、及转义通配符分别为“%”、“_”、“/”。
CN202110091480.7A 2021-01-23 2021-01-23 一种模糊查询匹配方法 Active CN112732796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110091480.7A CN112732796B (zh) 2021-01-23 2021-01-23 一种模糊查询匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110091480.7A CN112732796B (zh) 2021-01-23 2021-01-23 一种模糊查询匹配方法

Publications (2)

Publication Number Publication Date
CN112732796A CN112732796A (zh) 2021-04-30
CN112732796B true CN112732796B (zh) 2023-01-24

Family

ID=75595230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110091480.7A Active CN112732796B (zh) 2021-01-23 2021-01-23 一种模糊查询匹配方法

Country Status (1)

Country Link
CN (1) CN112732796B (zh)

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2683870B2 (ja) * 1994-05-23 1997-12-03 日本アイ・ビー・エム株式会社 文字列検索システム及び方法
US6199062B1 (en) * 1998-11-19 2001-03-06 International Business Machines Corporation Reverse string indexing in a relational database for wildcard searching
JP5007743B2 (ja) * 2007-05-24 2012-08-22 富士通株式会社 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法
US8073869B2 (en) * 2008-07-03 2011-12-06 The Regents Of The University Of California Method for efficiently supporting interactive, fuzzy search on structured data
CN101794283A (zh) * 2009-02-03 2010-08-04 华为技术有限公司 字符串处理方法及***和匹配器
CN101807184B (zh) * 2009-02-16 2013-05-01 阿尔卡特朗讯 用于检索包含通配符的字符串的方法和***
CN102929900B (zh) * 2012-01-16 2015-08-12 中国科学院北京基因组研究所 一种字符串匹配的方法及装置
US9626594B2 (en) * 2015-01-21 2017-04-18 Xerox Corporation Method and system to perform text-to-image queries with wildcards
CN106446122B (zh) * 2016-09-19 2020-03-10 华为技术有限公司 信息检索的方法、装置与计算设备
CN106874401B (zh) * 2016-12-30 2020-06-23 中安威士(北京)科技有限公司 一种面向数据库加密字段模糊检索的密文索引方法
CN107122222B (zh) * 2017-04-20 2019-02-19 深圳大普微电子科技有限公司 一种字符串的搜索***及方法
CN106934069B (zh) * 2017-04-24 2021-01-01 中国工商银行股份有限公司 数据检索方法及***
CN108549679B (zh) * 2018-04-03 2022-03-25 国家计算机网络与信息安全管理中心 用于url分析***的文件扩展名快速匹配方法和装置
CN112260872B (zh) * 2020-10-22 2022-03-04 北京理工大学 一种基于字符串匹配的标识异构识别方法及***

Also Published As

Publication number Publication date
CN112732796A (zh) 2021-04-30

Similar Documents

Publication Publication Date Title
US8838551B2 (en) Multi-level database compression
US8095526B2 (en) Efficient retrieval of variable-length character string data
CN105589838A (zh) 一种基于文件比较的电子公文痕迹保留方法
JPH10187410A (ja) データ圧縮方法及び装置
CN109977276A (zh) 一种基于Sunday算法改进的单模式匹配方法
CN102867049B (zh) 一种基于单词查找树实现的汉语拼音快速分词方法
CN108829772B (zh) 一种基于文件的区块链区块存储和读取方法
EP1552429A1 (en) Searching for symbol string
CN116628083B (zh) 区块链交易数据扩容存储方法及***
US7130859B2 (en) Data structure for search
CN114647764B (zh) 图结构的查询方法、装置及存储介质
CN112732796B (zh) 一种模糊查询匹配方法
CN115688779A (zh) 一种基于自监督深度学习的地址识别方法
CN113010477B (zh) 持久内存文件***元数据的检索方法和装置、存储结构
CN104052749B (zh) 一种链路层协议数据类型识别的方法
CN109684438A (zh) 一种具有父子层级结构检索数据的方法
CN116170026A (zh) 一种适用于类物联网设备生成数据领域的数据压缩和模糊搜索方法
CN107911196A (zh) 一种雷达航迹报文传输方法
CN116301656A (zh) 基于日志结构合并树的数据存储方法、***及设备
CN111814009B (zh) 一种基于搜索引擎检索信息的模式匹配方法
CN115934873B (zh) 一种基于地图经纬度坐标的事件查询方法
CN109508345A (zh) 基于汽车vin搜索的数据库索引查询方法
CN112307138B (zh) 地域信息的存储和查询方法、***与介质
CN111126043B (zh) Vin码多重校验方法、vin码识别方法及装置
Zhang et al. Approximate Pattern Matching Using the Burrows-Wheeler Transform.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant