CN116719476B - 一种手机号的压缩存储方法、装置、电子设备及存储介质 - Google Patents
一种手机号的压缩存储方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116719476B CN116719476B CN202310612933.5A CN202310612933A CN116719476B CN 116719476 B CN116719476 B CN 116719476B CN 202310612933 A CN202310612933 A CN 202310612933A CN 116719476 B CN116719476 B CN 116719476B
- Authority
- CN
- China
- Prior art keywords
- packet
- global
- grouping
- numbers
- minimum value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000009467 reduction Effects 0.000 claims abstract description 37
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 230000008569 process Effects 0.000 claims abstract description 10
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 239000002699 waste material Substances 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2237—Vectors, bitmaps or matrices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种手机号的压缩存储方法、装置、电子设备及存储介质,方法包括:获取所有待存储手机号;对各待存储手机号的统一特征位进行去除,得到若干待压缩号码;遍历确定待压缩号码中的全局分组最小值,基于全局分组最小值对所有待压缩号码进行全局号码降值,得到全局分组;基于全局降值号码的目标号码位,对全局分组进行多级分组,并基于多级分组过程中各级分组的最小值依次对多级分组中各级分组的号码进行降值处理,得到多个目标分组;将各级分组的最小值和目标降值号码通过位图算法进行存储。本发明实现手机号压缩得到紧凑型的数据结构,进而适配位图算法进行号码存储,避免数据分布稀疏造成存储空间浪费,可广泛应用于数据处理技术领域。
Description
技术领域
本发明涉及数据处理技术领域,尤其是一种手机号的压缩存储方法、装置、电子设备及存储介质。
背景技术
目前,现有的手机号码存储主要包括以下几种存储方式:使用字符串存储,手机号码有11个字符,最少需要11个字节,有的编程语言每个字符需要4个字节,会占用44个字节,这个方案没有对手机号码的存储做任何优化,是最浪费存储空间的方法;以及基于手机号码数值类型特点使用长整型数字的存储方式和使用短整型+整型组合的存储方式。但是,上述方法均是针对单个手机号的存储方式,对于大量手机号的存储,上述方法导致存储空间累加。
发明内容
有鉴于此,本发明实施例提供一种手机号的压缩存储方法、装置、电子设备及存储介质,能够优化大量手机号的压缩存储方式,节约存储空间。
一方面,本发明的实施例提供了一种手机号的压缩存储方法,包括:
获取所有待存储手机号;
对各待存储手机号的统一特征位进行去除,得到若干待压缩号码;
遍历确定待压缩号码中的全局分组最小值,基于全局分组最小值对所有待压缩号码进行全局号码降值,得到全局分组;其中,全局分组包括全局分组最小值和若干全局降值号码;
基于全局降值号码的目标号码位,对全局分组进行多级分组,并基于多级分组过程中各级分组的最小值依次对多级分组中各级分组的号码进行降值处理,得到多个目标分组;其中,目标分组包括各级分组的最小值和若干目标降值号码;
将各级分组的最小值和目标降值号码通过位图算法进行存储。
可选地,待存储手机号为移动目录号码结构,对各待存储手机号的统一特征位进行去除,得到若干待压缩号码,包括:
对各待存储手机号的移动接入码的首位和国家码进行去除,得到若干待压缩号码;
其中,移动目录号码结构包括国家码、移动接入码、归属位置寄存器识别码和随机号码。
可选地,全局分组最小值表征所有待压缩号码中的最小值,基于全局分组最小值对所有待压缩号码进行全局号码降值,得到全局分组,包括:
通过各待压缩号码减去全局分组最小值,得到若干全局降值号码;
将全局分组最小值和全局降值号码组合得到全局分组。
可选地,基于全局降值号码的目标号码位,对全局分组进行多级分组,并基于多级分组过程中各级分组的最小值依次对多级分组中各级分组的号码进行降值处理,得到多个目标分组,包括:
基于全局降值号码的前两个号码位,对全局分组进行第一分组,得到至少一个一级分组;并基于各一级分组中的一级分组最小值对各一级分组中的号码进行一级号码降值;其中,一级号码降值后的一级分组包括若干一级降值号码;
基于一级降值号码的第三至第六号码位,对各一级分组进行第二分组,得到多个二级分组;并基于各二级分组中的二级分组最小值对各二级分组中的号码进行二级号码降值;其中,二级号码降值后的二级分组包括若干二级降值号码;
将全局分组最小值、一级分组最小值、二级分组最小值和各二级分组中的二级降值号码组合得到多个目标分组。
可选地,基于各一级分组中的一级分组最小值对各一级分组中的号码进行一级号码降值,包括:
遍历各一级分组中的号码,确定各一级分组的一级分组最小值;
通过各一级分组中的各个号码减去各一级分组对应的一级分组最小值,得到各一级分组中的一级降值号码。
可选地,基于各二级分组中的二级分组最小值对各二级分组中的号码进行二级号码降值,包括:
遍历各二级分组中的号码,确定各二级分组的二级分组最小值;
通过各二级分组中的各个号码减去各二级分组对应的二级分组最小值,得到各二级分组中的二级降值号码。
可选地,将各级分组的最小值和目标降值号码通过位图算法进行存储,包括:
以各级分组的最小值作为参照标识,通过位图算法对目标降值号码进行存储。
另一方面,本发明的实施例提供了一种手机号的压缩存储装置,包括:
第一模块,用于获取所有待存储手机号;
第二模块,用于对各待存储手机号的统一特征位进行去除,得到若干待压缩号码;
第三模块,用于遍历确定待压缩号码中的全局分组最小值,基于全局分组最小值对所有待压缩号码进行全局号码降值,得到全局分组;其中,全局分组包括全局分组最小值和若干全局降值号码;
第四模块,用于基于全局降值号码的目标号码位,对全局分组进行多级分组,并基于多级分组过程中各级分组的最小值依次对多级分组中各级分组的号码进行降值处理,得到多个目标分组;其中,目标分组包括各级分组的最小值和若干目标降值号码;
第五模块,用于将各级分组的最小值和目标降值号码通过位图算法进行存储。
另一方面,本发明的实施例提供了一种电子设备,包括处理器以及存储器;
存储器用于存储程序;
处理器执行程序实现如前面的方法。
另一方面,本发明的实施例提供了一种计算机可读存储介质,存储介质存储有程序,程序被处理器执行实现如前面的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
本发明实施例首先获取所有待存储手机号;对各待存储手机号的统一特征位进行去除,得到若干待压缩号码;通过去除统一特征位,避免计算冗余,提升压缩存储效率;遍历确定待压缩号码中的全局分组最小值,基于全局分组最小值对所有待压缩号码进行全局号码降值,得到全局分组;其中,全局分组包括全局分组最小值和若干全局降值号码;基于全局降值号码的目标号码位,对全局分组进行多级分组,并基于多级分组过程中各级分组的最小值依次对多级分组中各级分组的号码进行降值处理,得到多个目标分组;其中,目标分组包括各级分组的最小值和若干目标降值号码;基于手机号的数据格式特性,通过全局分组和基于目标号码位的多级分组,使每一分组数据下的各组数据基于其分组最小值进行号码的降值,经过降值后,变成了一个紧凑型的数据结构,以适配后续位图算法的存储方式;将各级分组的最小值和目标降值号码通过位图算法进行存储;通过前述步骤实现手机号压缩得到紧凑型的数据结构,进而适配位图算法进行号码存储,避免数据分布稀疏造成存储空间浪费的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种手机号的压缩存储方法的流程示意图;
图2为本发明实施例提供的传统位图算法存储手机号的示意图;
图3为本发明实施例提供的位图算法存储降值手机号的示意图;
图4为本发明实施例提供的手机号的压缩存储方法的整体流程示意图;
图5为本发明实施例提供的手机号多级分组降值后的数据结构的示意图;
图6为本发明实施例提供的一种手机号的压缩存储装置的结构示意图;
图7为本发明实施例提供的一种电子设备的框架示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一方面,如图1所示,本发明的实施例提供了一种手机号的压缩存储方法,包括:
S100、获取所有待存储手机号;
S200、对各待存储手机号的统一特征位进行去除,得到若干待压缩号码;
需要说明的是,待存储手机号为移动目录号码结构,一些实施例中,步骤S200可以包括:对各待存储手机号的移动接入码的首位和国家码进行去除,得到若干待压缩号码;其中,移动目录号码结构包括国家码、移动接入码、归属位置寄存器识别码和随机号码。
其中,手机号有一定的编号规则,编号规则采用MDN结构(CC+MAC+H0 H1 H2 H3+ABCD),MDN全称为Mobile Directory Number,移动目录号码,例如一个手机号8613560123456,CC:是国家码,中国使用86;MAC:是移动接入码,例如135;H0 H1 H2H3:为HLR识别码,全称Home Location Register,归属位置寄存器,由运营商统一分配,例如6012;ABCD:为随机号码,由运营商自由分配;一些实施例中,在日常情形下,手机号的存储仅考虑后11位,国家码可以不作考虑,即仅可以对移动接入码的首位(固定为1)进行去除,以得到若干待压缩号码。
具体地,例如有一批号码:13888888883、13888888882、13888888881、13888877771、14777777773、14777777772、14777777771、13111111111。把号码开头的1去除,得出以下号码;3888888883、3888888882、3888888881、3888877771、4777777773、4777777772、4777777771、3111111111。
S300、遍历确定待压缩号码中的全局分组最小值,基于全局分组最小值对所有待压缩号码进行全局号码降值,得到全局分组;
需要说明的是,全局分组包括全局分组最小值和若干全局降值号码;一些实施例中,基于全局分组最小值对所有待压缩号码进行全局号码降值,得到全局分组,可以包括:通过各待压缩号码减去全局分组最小值,得到若干全局降值号码;将全局分组最小值和全局降值号码组合得到全局分组。
具体地,以步骤S200中具体号码为例,找到所有号码的最小值作为全局分组最小值,并把所有号码都整体减去这个最小值,把这个最小值作为该分组最小值保存,用于后续数据查找,得到全局分组为:[全局分组最小值3111111111]0777777772、0777777771、0777777770、0777766660、1666666662、1666666661、1666666660、0000000000。
S400、基于全局降值号码的目标号码位,对全局分组进行多级分组,并基于多级分组过程中各级分组的最小值依次对多级分组中各级分组的号码进行降值处理,得到多个目标分组;
需要说明的是,目标分组包括各级分组的最小值和若干目标降值号码;一些实施例中,步骤S400可以包括:基于全局降值号码的前两个号码位,对全局分组进行第一分组,得到至少一个一级分组;并基于各一级分组中的一级分组最小值对各一级分组中的号码进行一级号码降值;其中,一级号码降值后的一级分组包括若干一级降值号码;基于一级降值号码的第三至第六号码位,对各一级分组进行第二分组,得到多个二级分组;并基于各二级分组中的二级分组最小值对各二级分组中的号码进行二级号码降值;其中,二级号码降值后的二级分组包括若干二级降值号码;将全局分组最小值、一级分组最小值、二级分组最小值和各二级分组中的二级降值号码组合得到多个目标分组。
其中,一些实施例中,基于各一级分组中的一级分组最小值对各一级分组中的号码进行一级号码降值,包括:遍历各一级分组中的号码,确定各一级分组的一级分组最小值;通过各一级分组中的各个号码减去各一级分组对应的一级分组最小值,得到各一级分组中的一级降值号码。
其中,一些实施例中,基于各二级分组中的二级分组最小值对各二级分组中的号码进行二级号码降值,可以包括:遍历各二级分组中的号码,确定各二级分组的二级分组最小值;通过各二级分组中的各个号码减去各二级分组对应的二级分组最小值,得到各二级分组中的二级降值号码。
具体地,可以通过如下步骤实现多级分组,任以前述步骤的具体号码(步骤S300的全局)作为处理对象为例:
第一步【对号码做一级分组】:按照号码的第1至2位进行分组,作为一级分组,取值范围是0至99,得到一级分组为:
[全局分组最小值3111111111]07-77777772、07-77777771、07-77777770、07-77766660;
[全局分组最小值3111111111]16-66666662、16-66666661、16-66666660;
[全局分组最小值3111111111]00-00000000。
第二步【对一级分组号码降值】:把一级分组后各个分组号码的第3至10位进行降值,找到分组中的最小值,并把分组中所有号码都整体减去这个分组最小值,把这个分组最小值保存,用于后续数据查找,降值后的一级分组为:
[全局分组最小值3111111111][一级分组最小值77766660]07-00011112、07-00011111、07-00011110、07-00000000;
[全局分组最小值3111111111][一级分组最小值66666660]16-00000002、16-00000001、16-00000000;
[全局分组最小值3111111111][一级分组最小值00000000]00-00000000。
第三步【对号码做二级分组】:按照手机号码的第3至6位进行分组,作为二级分组,取值范围是0~9999,得到二级分组为:
[全局分组最小值3111111111][一级分组最小值77766660]07-0001-1112、07-0001-1111、07-0001-1110;
[全局分组最小值3111111111][一级分组最小值77766660]07-0000-0000;
[全局分组最小值3111111111][一级分组最小值66666660]16-0000-0002、16-0000-0001、16-0000-0000;
[全局分组最小值3111111111][一级分组最小值00000000]00-0000-0000。
第四步【对二级分组号码降值】:把二级分组后各个分组号码的第7至10位进行降值,找到分组中的最小值,并把分组中所有号码都整体减去这个分组最小值,把这个分组最小值保存,用于后续数据查找,降值后的二级分组为:
[全局分组最小值3111111111][一级分组最小值66666660][二级分组最小值1110]07-0001-0002、07-0001-0001、07-0001-0000;
[全局分组最小值3111111111][一级分组最小值66666660][二级分组最小值0000]07-0000-0000;
[全局分组最小值3111111111][一级分组最小值66666660][二级分组最小值0000]16-0000-0002、16-0000-0001、16-0000-0000;
[全局分组最小值3111111111][一级分组最小值00000000][二级分组最小值0000]00-0000-0000。
S500、将各级分组的最小值和目标降值号码通过位图算法进行存储。
需要说明的是,一些实施例中,步骤S500可以包括:以各级分组的最小值作为参照标识,通过位图算法对目标降值号码进行存储。
具体地,经过降值后的数据,每一级每个分组的最小值肯定是0了,这时结合位图算法存储这些数据可以把稀疏的数据规整得更加密集,以达到存储空间占用更少的效果。
其中,使用传统位图算法存储:例如需要使用传统的位图算法来存储15625122330、15625122332、15625122333三个号码,如图2所示,需要创建至少15625122333个数据位,按照一个字节占用8位来计算:
需要的存储空间=15625122333/8=1953140291.125字节
=1907363.565KB
=1862.659MB
=1.819GB
但是因为从0-15625122329位都没有存储数据,那么会出现从0-15625122329位的存储空间浪费。
把首位1去除,并且,经过一次全局降值后,会变成如图3所示,需要的存储空间为全局分组最小值占用空间(4个字节)+降值后位图占用空间(1个字节)=5字节,大大减少存储空间占用。
一些具体实施方式中,如图4所示,手机号的压缩存储的整体流程可以通过如下步骤实现:
1.去除号码首位数字“1”;
2.全局号码降值;
3.对号码做一级分组;
4.对一级分组号码降值;
5.对号码做二级分组;
6.对二级分组号码降值;
7.对降值后的数据进行存储。
具体地,根据前述处理步骤及流程细节,经过两次分级降值后,可以得到如图5所示的数据结构,每一分级数据下的各组数据都保留其分组最小值,在存储手机号时,由于都是较大的数据,经过降值后,每一分级的数据都是从0开始,变成了一个紧凑型的数据结构,减少了不必要的空间浪费;当需要查找数据时,逐级往下减去各自的每一级别的最小值,最终在叶子节点对应的数据位标志为1则表示该号码存在。
综上,本发明结合了对于数值类型数据存储有明显优化效果的位图算法,以及对手机号码的特性做了更加深入的挖掘使用,使得手机号码的存储空间占用进一步降低。
另一方面,如图6所示,本发明的实施例提供了一种手机号的压缩存储装置600,包括:第一模块,用于获取所有待存储手机号;第二模块,用于对各待存储手机号的统一特征位进行去除,得到若干待压缩号码;第三模块,用于遍历确定待压缩号码中的全局分组最小值,基于全局分组最小值对所有待压缩号码进行全局号码降值,得到全局分组;其中,全局分组包括全局分组最小值和若干全局降值号码;第四模块,用于基于全局降值号码的目标号码位,对全局分组进行多级分组,并基于多级分组过程中各级分组的最小值依次对多级分组中各级分组的号码进行降值处理,得到多个目标分组;其中,目标分组包括各级分组的最小值和若干目标降值号码;第五模块,用于将各级分组的最小值和目标降值号码通过位图算法进行存储。
本发明方法实施例的内容均适用于本装置实施例,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
如图7所示,本发明实施例的另一方面还提供了一种电子设备700,包括处理器710以及存储器720;
存储器720用于存储程序;
处理器710执行程序实现如前面的方法。
本发明方法实施例的内容均适用于本电子设备实施例,本电子设备实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例的另一方面还提供了一种计算机可读存储介质,存储介质存储有程序,程序被处理器执行实现如前面的方法。
本发明方法实施例的内容均适用于本计算机可读存储介质实施例,本计算机可读存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行装置、装置或设备(如基于计算机的装置、包括处理器的装置或其他可以从指令执行装置、装置或设备取指令并执行指令的装置)使用,或结合这些指令执行装置、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行装置、装置或设备或结合这些指令执行装置、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。
Claims (10)
1.一种手机号的压缩存储方法,其特征在于,包括:
获取所有待存储手机号;
对各所述待存储手机号的统一特征位进行去除,得到若干待压缩号码;
遍历确定所述待压缩号码中的全局分组最小值,基于所述全局分组最小值对所有所述待压缩号码进行全局号码降值,得到全局分组;其中,所述全局分组包括所述全局分组最小值和若干全局降值号码;
基于所述全局降值号码的目标号码位,对所述全局分组进行多级分组,并基于所述多级分组过程中各级分组的最小值依次对所述多级分组中各级分组的号码进行降值处理,得到多个目标分组;其中,所述目标分组包括所述各级分组的最小值和若干目标降值号码;
将所述各级分组的最小值和所述目标降值号码通过位图算法进行存储。
2.根据权利要求1所述的一种手机号的压缩存储方法,其特征在于,所述待存储手机号为移动目录号码结构,所述对各所述待存储手机号的统一特征位进行去除,得到若干待压缩号码,包括:
对各所述待存储手机号的移动接入码的首位和国家码进行去除,得到若干待压缩号码;
其中,所述移动目录号码结构包括国家码、移动接入码、归属位置寄存器识别码和随机号码。
3.根据权利要求1所述的一种手机号的压缩存储方法,其特征在于,所述全局分组最小值表征所有所述待压缩号码中的最小值,所述基于所述全局分组最小值对所有所述待压缩号码进行全局号码降值,得到全局分组,包括:
通过各所述待压缩号码减去所述全局分组最小值,得到若干全局降值号码;
将所述全局分组最小值和所述全局降值号码组合得到全局分组。
4.根据权利要求1所述的一种手机号的压缩存储方法,其特征在于,所述基于所述全局降值号码的目标号码位,对所述全局分组进行多级分组,并基于所述多级分组过程中各级分组的最小值依次对所述多级分组中各级分组的号码进行降值处理,得到多个目标分组,包括:
基于所述全局降值号码的前两个号码位,对所述全局分组进行第一分组,得到至少一个一级分组;并基于各所述一级分组中的一级分组最小值对各所述一级分组中的号码进行一级号码降值;其中,所述一级号码降值后的所述一级分组包括若干一级降值号码;
基于所述一级降值号码的第三至第六号码位,对各所述一级分组进行第二分组,得到多个二级分组;并基于各所述二级分组中的二级分组最小值对各所述二级分组中的号码进行二级号码降值;其中,所述二级号码降值后的所述二级分组包括若干二级降值号码;
将所述全局分组最小值、所述一级分组最小值、所述二级分组最小值和各所述二级分组中的所述二级降值号码组合得到多个目标分组。
5.根据权利要求4所述的一种手机号的压缩存储方法,其特征在于,所述基于各所述一级分组中的一级分组最小值对各所述一级分组中的号码进行一级号码降值,包括:
遍历各所述一级分组中的号码,确定各所述一级分组的一级分组最小值;
通过各所述一级分组中的各个号码减去各所述一级分组对应的所述一级分组最小值,得到各所述一级分组中的一级降值号码。
6.根据权利要求4所述的一种手机号的压缩存储方法,其特征在于,所述基于各所述二级分组中的二级分组最小值对各所述二级分组中的号码进行二级号码降值,包括:
遍历各所述二级分组中的号码,确定各所述二级分组的二级分组最小值;
通过各所述二级分组中的各个号码减去各所述二级分组对应的所述二级分组最小值,得到各所述二级分组中的二级降值号码。
7.根据权利要求1所述的一种手机号的压缩存储方法,其特征在于,所述将所述各级分组的最小值和所述目标降值号码通过位图算法进行存储,包括:
以所述各级分组的最小值作为参照标识,通过位图算法对所述目标降值号码进行存储。
8.一种手机号的压缩存储装置,其特征在于,包括:
第一模块,用于获取所有待存储手机号;
第二模块,用于对各所述待存储手机号的统一特征位进行去除,得到若干待压缩号码;
第三模块,用于遍历确定所述待压缩号码中的全局分组最小值,基于所述全局分组最小值对所有所述待压缩号码进行全局号码降值,得到全局分组;其中,所述全局分组包括所述全局分组最小值和若干全局降值号码;
第四模块,用于基于所述全局降值号码的目标号码位,对所述全局分组进行多级分组,并基于所述多级分组过程中各级分组的最小值依次对所述多级分组中各级分组的号码进行降值处理,得到多个目标分组;其中,所述目标分组包括所述各级分组的最小值和若干目标降值号码;
第五模块,用于将所述各级分组的最小值和所述目标降值号码通过位图算法进行存储。
9.一种电子设备,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310612933.5A CN116719476B (zh) | 2023-05-26 | 2023-05-26 | 一种手机号的压缩存储方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310612933.5A CN116719476B (zh) | 2023-05-26 | 2023-05-26 | 一种手机号的压缩存储方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116719476A CN116719476A (zh) | 2023-09-08 |
CN116719476B true CN116719476B (zh) | 2024-01-02 |
Family
ID=87865212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310612933.5A Active CN116719476B (zh) | 2023-05-26 | 2023-05-26 | 一种手机号的压缩存储方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116719476B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104579360A (zh) * | 2015-02-04 | 2015-04-29 | 华为技术有限公司 | 一种数据处理的方法和设备 |
WO2015085087A1 (en) * | 2013-12-04 | 2015-06-11 | Db Networks, Inc. | Ordering traffic captured on a data connection |
WO2017166619A1 (zh) * | 2016-03-31 | 2017-10-05 | 乐视控股(北京)有限公司 | 一种紧急通信号码确定方法、装置和电子设备 |
CN112395468A (zh) * | 2020-11-27 | 2021-02-23 | 浙江诺诺网络科技有限公司 | 一种号码管理方法、装置及电子设备和存储介质 |
CN114372337A (zh) * | 2021-12-24 | 2022-04-19 | 华南理工大学 | 一种针对分布式边缘学习中的模型聚合的分组优化方法 |
CN115442799A (zh) * | 2022-09-01 | 2022-12-06 | 中国电信股份有限公司 | 号码的查询方法及装置、非易失性存储介质、处理器 |
-
2023
- 2023-05-26 CN CN202310612933.5A patent/CN116719476B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015085087A1 (en) * | 2013-12-04 | 2015-06-11 | Db Networks, Inc. | Ordering traffic captured on a data connection |
CN104579360A (zh) * | 2015-02-04 | 2015-04-29 | 华为技术有限公司 | 一种数据处理的方法和设备 |
WO2017166619A1 (zh) * | 2016-03-31 | 2017-10-05 | 乐视控股(北京)有限公司 | 一种紧急通信号码确定方法、装置和电子设备 |
CN112395468A (zh) * | 2020-11-27 | 2021-02-23 | 浙江诺诺网络科技有限公司 | 一种号码管理方法、装置及电子设备和存储介质 |
CN114372337A (zh) * | 2021-12-24 | 2022-04-19 | 华南理工大学 | 一种针对分布式边缘学习中的模型聚合的分组优化方法 |
CN115442799A (zh) * | 2022-09-01 | 2022-12-06 | 中国电信股份有限公司 | 号码的查询方法及装置、非易失性存储介质、处理器 |
Also Published As
Publication number | Publication date |
---|---|
CN116719476A (zh) | 2023-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7283072B1 (en) | Methods of creating a dictionary for data compression | |
CN110399104B (zh) | 数据存储方法、数据存储装置、电子设备、存储介质 | |
US8791843B2 (en) | Optimized bitstream encoding for compression | |
US7403494B2 (en) | Method for generating nodes in multiway search tree and search method using the same | |
CN110147536B (zh) | 一种基于文件映射的数据处理方法、装置及设备 | |
CN106649217A (zh) | 数据的匹配方法及装置 | |
US9236881B2 (en) | Compression of bitmaps and values | |
CN104410424B (zh) | 嵌入式设备内存数据的快速无损压缩方法 | |
KR20030071327A (ko) | 개선된 허프만 디코딩 방법 및 장치 | |
CN113746487B (zh) | 一种数据压缩方法、装置及电子设备和存储介质 | |
CN116719476B (zh) | 一种手机号的压缩存储方法、装置、电子设备及存储介质 | |
CN111384972A (zh) | 多进制ldpc解码算法的优化方法、装置及解码器 | |
CN111402958B (zh) | 一种建立基因比对表的方法、***、设备及介质 | |
CN105320609A (zh) | 一种基于移动终端的数据存储方法及*** | |
CN107832341B (zh) | Agnss用户去重统计方法 | |
CN108829872A (zh) | 无损压缩文件的快速处理方法、设备、***及存储介质 | |
CN115865843A (zh) | 规则存储方法、报文处理方法、装置、电子设备及介质 | |
CN1536768A (zh) | 2字节字符数据的压缩方法 | |
US20220350576A1 (en) | Compression Of Firmware Updates | |
CN111538730B (zh) | 一种基于哈希桶算法的数据统计的方法及其*** | |
CN111382086B (zh) | 一种前缀树存储方法、装置、存储介质和计算机设备 | |
CN111221816B (zh) | 基于位图汇总模型的原子指标存储方法 | |
CN117272989B (zh) | 基于字符编码压缩的屏蔽词识别方法、装置、设备及介质 | |
US9851943B2 (en) | Method and system for number comparison during stream processing | |
CN115665092A (zh) | 一种用于网络通信和内容分发领域的ip识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |