CN106788454B - 一种局部性不相等码的构造方法 - Google Patents

一种局部性不相等码的构造方法 Download PDF

Info

Publication number
CN106788454B
CN106788454B CN201611071571.XA CN201611071571A CN106788454B CN 106788454 B CN106788454 B CN 106788454B CN 201611071571 A CN201611071571 A CN 201611071571A CN 106788454 B CN106788454 B CN 106788454B
Authority
CN
China
Prior art keywords
code
locality
symbols
information
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611071571.XA
Other languages
English (en)
Other versions
CN106788454A (zh
Inventor
朱丹
周晓波
朱洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Shangpin Information Technology Co ltd
Original Assignee
Shaanxi Shangpin Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Shangpin Information Technology Co ltd filed Critical Shaanxi Shangpin Information Technology Co ltd
Priority to CN201611071571.XA priority Critical patent/CN106788454B/zh
Publication of CN106788454A publication Critical patent/CN106788454A/zh
Application granted granted Critical
Publication of CN106788454B publication Critical patent/CN106788454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/09Error detection only, e.g. using cyclic redundancy check [CRC] codes or single parity bit

Landscapes

  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Error Detection And Correction (AREA)

Abstract

本发明公开了一种局部性不相等码的构造方法,其实现方案是:信息符号局部性不相等的情况是首先对最大距离可分码MDS的奇偶校验位矩阵进行分离,然后对分离所得的任意一个子集按照一定的规则进一步分离,得到信息符号局部性不相等码。全符号局部性不相等的情况是首先对
Figure DDA0001165284900000011
域上的向量
Figure DDA0001165284900000012
进行Gabidulin编码,然后对编码结果进行两轮划分,对第二次划分的结果再进行最大距离可分码MDS进行编码,得到全符号局部性不相等码。本发明有效解决了现有局部修复码最小距离无法达到上界的问题,相应地减少了修复局部性和修复过程中的I/O操作,保持了修复过程中一个较低的修复带宽。

Description

一种局部性不相等码的构造方法
技术领域
本发明属于数据编码存储领域,尤其涉及一种局部性不相等码的构造方法。
背景技术
近几年,随着便携式互联网设备与移动互联网的快速发展,人们对存储的需求日益增长。分布式存储作为海量存储的主要解决方案正悄然兴起,它将数据分散存储在多***立的设备中。为了节约成本,节点通常采用普通的交换设备和廉价的服务器,因此在替换节点、硬件出现故障、软件需要升级的情况下,存储***中的节点非常容易失效,从而造成存储节点中数据的丢失。为保证数据可靠性,***会频繁的进行节点修复,因此,如何有效地进行节点修复就成为了亟待解决的问题。现下,修复节点采用的系列方案如复制策略、再生码、纠删码等,会造成存储空间的浪费,占用大量的修复带宽,需要较大的修复局部性(即在数据节点修复过程中需要连接的其他节点数量多)。
局部修复码LRCs是指将一个码的所有信息符号分成多个分组,且每个分组分别产生一个奇偶校验位。当某个分组中的一个信息符号丢失或损坏时,只需要利用本组中的其他信息符号和本组的奇偶校验位就可以恢复出这个丢失或损坏的数据,而不需要通过所有的编码符号来恢复。由此可见,局部修复码LRCs可以减小修复局部性,从而减少修复过程中的I/O操作,同时可以保持一个较低的修复带宽。
对于一个局部修复码LRCs而言,它的最小距离d越大,数据节点修复过程中需要连接的节点数就越少,所需修复带宽也就越小。而在现有的局部修复码构造方法中,很少能够使局部修复码的最小距离达到上界。
发明内容
本发明针对现有的局部修复码LRCs构造方法修复局部性较大的不足,提出了新的局部性不相等码的构造方法。基于局部修复码信息符号局部性不相等和全符号局部性不相等两种情况,构造出新的局部性不相等码。
使得局部性不相等码的修复局部性最小,本发明所述技术方案:
一种局部性不相等码的构造方法,包括两种优选实施方式:
第一优选实施方式:其特征信息符号局部性不相等,构造信息符号局部性不相等码,对最大距离可分MDS码的奇偶校验位矩阵进行分离,对分离所得的任意一个子集进一步分离,得到编码符号长度n的信息符号局部性不相等码生成矩阵,该矩阵生成的码字即为最小距离d达到上界的信息符号局部性不相等码;
第二优选实施方式:其特征全符号局部性不相等,包括信息符号和奇偶校验符号,采用Gabidulin码进行编码,再将编码结果利用最大距离可分MDS码再一次进行编码,得到达到最小距离上界的(n,k,d)全符号局部性不相等码,码字长度n,该矩阵生成的码字即为最小距离d达到上界的信息符号局部性不相等码。
进一步根据所述局部性不相等码的构造方法,包括:
Fq表示q元域;
Figure BDA0001165284880000021
中F表示域,qm表示q元的m次扩展,其中域内多项式的最高次数为k-1;
一个长度为n的编码中含有k个信息符号,其中某个符号i可以通过码中的其他ri个符号恢复出来,那么i的局部性为ri,若一个码所包含的k个信息符号中的每个信息符号的局部性最大为r,则所述码的局部性为r;
***码
Figure BDA0001165284880000022
n表示编码长度,k表示信息符号长度,d表示最小距离,若信息符号可以被分为不相交的子集,不同子集的信息符号具有不同的局部性,即码为信息符号局部性不相等码。
所述***码
Figure BDA0001165284880000023
其信息符号局部性轮廓为
Figure BDA0001165284880000024
kj为局部性为j(1≤j≤r)的信息符号的个数;
所述全符号局部性不相等码是信息符号局部性不相等码的进一步扩展,编码符号,包括信息符号和奇偶校验符号,可以被分为不相交的子集,不同子集的编码符号具有不同的局部性,表示奇偶校验符号也具有局部性约束的码;
所述***码
Figure BDA0001165284880000025
若奇偶校验符号也具有局部性约束时,类似于信息符号局部性轮廓,定义全符号局部性轮廓,ri表示码中第i个符号的局部性,1≤i≤n,令ra=max(r1,r2,…,rn),那么它的全符号局部性轮廓表示为
Figure BDA0001165284880000026
nj是局部性为j(1≤j≤ra)的信息符号的数量;
若Xn为有限域GF(q)上的n维向量空间,q为素数或素数幂,Xn中的元素向量x在GF(q)上的秩为R(x),Xn的两个元素x、y之间的秩距离dR(X,Y)定义为dR(x,y)=R(x-y);码c的所有不同两个码字的秩距离的最小值为码c的最小秩距离,记作dR(c);码长为N,信息符号数为K,最小秩距离为D的线性码称作秩距离(N,K,D)码;
所述
Figure BDA00011652848800000210
上的一个Gabidulin码记为(N,K,N-K+1)码,其中N为编码符号个数,K为信息符号个数,N-K+1为码字最小距离。
Figure BDA0001165284880000027
为其中的一个码字,定义为
Figure BDA0001165284880000028
f(x)是m*q阶有限域内的一个系数为信息符号的线性多项式,即有限域内的元素个数为m*q,g1,…,gN
Figure BDA0001165284880000029
上的特定的点;
所述Gabidulin码属于秩距离码;
若(N,N-Y,Y+1)码,码长为N,冗余度为Y,最小距离为Y+1的线性码,为最大距离可分MDS码;所述最大距离可分MDS码,若N-Y个信息符号位经过编码之后扩展为N个信息符号位,当N-Y个信息符号位中的任一符号位丢失或损坏时,利用现有的N-1个符号位中的K个符号位即可恢复出丢失或损坏的信息符号位;
若先采用Gabidulin码进行编码,再采用最大距离可分MDS码进行编码,最后得到的编码结果就可以达到Singleton上界,即达到了码字最小距离的上界;
所述Singleton上界为码字的一个度量,是当码字长度及最小距离给定时码字个数的一个上界;Aq(n,d)为q元码码字个数可能达到的最大值,即Aq(n,d)≤qn-d+1,其中q表示码字是一个q元码;若一个码字达到Singleton上界时,所述码字的最小距离可达到最大值;若
Figure BDA0001165284880000031
域上的(N,K,D)秩距离码
Figure BDA0001165284880000032
其编码符号个数为N,信息符号个数为K,最小秩距离为D,其Singleton上界可以转化为与码字最小距离相关的表示,即:
Figure BDA0001165284880000033
进一步根据所述局部性不相等码的构造方法,第一优选实施方式中信息符号局部性不相等时;
Figure BDA0001165284880000034
其中k+d-1表示编码长度,d-1表示奇偶校验位长度,d表示最小距离,若奇偶检验位长度仅比最小距离少一位,满足最大距离可分MDS码的构造条件,最大距离可分MDS的生成矩阵是由单位矩阵与奇偶校验位矩阵构造而成,其中单位矩阵的列数与码的信息符号长度相同;
Figure BDA0001165284880000035
的生成矩阵可以表示为
Figure BDA0001165284880000036
其中
Figure BDA0001165284880000037
是k*k的单位矩阵的第j列向量,
Figure BDA0001165284880000038
是k*(d-1)的奇偶校验位矩阵中的第j列向量,即:
Figure BDA0001165284880000039
每一个信息符号的局部性对G′中的
Figure BDA00011652848800000310
划分子集,记jp代表坐标点在奇偶校验位矩阵第j列中局部性为p(l≤p≤m,m≤r),将
Figure BDA00011652848800000311
中所有局部性为p的坐标放到同一个子集sp,则
Figure BDA00011652848800000312
Figure BDA00011652848800000313
被分为m个不相交的子集s1,…,sm,|sp|表示集合sp中元素的个数,
Figure BDA00011652848800000314
表示jp的个数;
将sp任意划分为
Figure BDA00011652848800000315
个不相交的子集,每个子集的大小不能超过局部性p,即
Figure BDA00011652848800000316
Figure BDA00011652848800000317
为k维的向量,集合S包含于这个k维的向量,
Figure BDA00011652848800000318
表示集合S中的元素取自
Figure BDA00011652848800000319
中的任意|S|行;
最终得到的码字生成矩阵为G:
Figure BDA00011652848800000320
所述分解向量
Figure BDA0001165284880000041
仅以此为例,但不局限于此例;
若原始信息码字为
Figure BDA0001165284880000042
得到编码码字为
Figure BDA0001165284880000043
得到的码字长度n:
Figure BDA0001165284880000044
最小距离d的上界:
Figure BDA0001165284880000045
则构造出最小距离d达到上界的信息符号局部性不相等码。
进一步根据所述局部性不相等码的构造方法,第二优选实施方式中全符号局部性不相等时,包括信息符号和奇偶校验符号;
向量
Figure BDA0001165284880000046
属于
Figure BDA0001165284880000047
域,长度为k,
Figure BDA0001165284880000048
的全符号局部性轮廓为
Figure BDA0001165284880000049
即局部性为j的符号个数有nj个,1≤j≤ra;
Figure BDA00011652848800000410
求得每个局部性j所对应的nj,由式
Figure BDA00011652848800000411
进一步求得N,即得到Gabidulin码的码字长度N;
根据码字长度N,信息符号长度k以及最小距离N-k+1对
Figure BDA00011652848800000412
进行Gabidulin编码,得到码字
Figure BDA00011652848800000413
码字
Figure BDA00011652848800000414
中的符号根据每个符号的局部性划分成ra个不相交组
Figure BDA00011652848800000415
即每个组中的元素局部性为j,每一个组
Figure BDA00011652848800000416
中符号个数为Nj
若Nj=0,则组
Figure BDA00011652848800000417
则不再划分此类组;
若Nj>0,即组
Figure BDA00011652848800000418
则进一步将Nj对应的组
Figure BDA00011652848800000419
中的符号任意划分成Nj/j个不相交的局部性分组,每组中的符号数为j,则
Figure BDA00011652848800000420
对于每一个包含j个符号的局部性分组
Figure BDA00011652848800000421
利用Fq上的(j+1,j,2)最大距离可分MDS码再次进行编码,使每个分组的符号个数由j变为j+1;
得到达到最小距离上界的(n,k,d)全符号局部性不相等码,码字长度n:
Figure BDA00011652848800000422
最小距离d的上界:
Figure BDA0001165284880000051
则构造出最小距离d达到上界的全符号局部性不相等码。
本发明与现有技术相比,具有如下优点:
(1)本发明采用的局部性不相等码构造方法,使码字的修复局部性达到一个最小值,从而减少I\O操作,减少修复带宽。
(2)由于局部性不相等码对不相等的局部性进行了划分,形成一个局部性轮廓,给定对码字多次划分子集的依据,使得最小距离d达到上界。
附图说明
图1为局部性不相等码的两种优选方式。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,首先对本发明所述方法涉及的一些定义及参数,进行如下解释:
Fq:表示q元域。
Figure BDA0001165284880000052
F表示域,qm表示q元的m次扩展,其中域内多项式的最高次数为k-1。
局部性:设一个长度为n的编码中含有k个信息符号,其中某个符号i可以通过码中的其他ri个符号恢复出来,那么i的局部性为ri。如果一个码所包含的k个信息符号中的每个信息符号的局部性最大为r,说时此码的局部性为r。
信息符号局部性不相等码:对于一个***码
Figure BDA0001165284880000053
n表示编码长度,k表示信息符号长度,d表示最小距离。如果信息符号可以被分为不相交的子集,不同子集的信息符号具有不同的局部性,称这种码为信息符号局部性不相等码。
信息符号局部性轮廓:对于一个***码
Figure BDA0001165284880000054
它的信息符号局部性轮廓表示为
Figure BDA0001165284880000055
kj表示局部性为j(1≤j≤r)的信息符号的个数。
全符号局部性不相等码:全符号局部性不相等码是信息符号局部性不相等码的进一步扩展,用来表示奇偶校验符号也具有局部性约束的码。对于一个***码,如果它的编码符号(包括信息符号和奇偶校验符号)可以被分为不相交的子集,不同子集的编码符号具有不同的局部性,称这种码为全符号局部性不相等码。
全符号局部性轮廓:当奇偶校验符号也具有局部性约束时,类似于信息符号局部性轮廓,可以定义一个全符号局部性轮廓。首先对于一个***码
Figure BDA0001165284880000056
ri表示码中第i个符号的局部性,1≤i≤n,然后令ra=max(r1,r2,…,rn),那么它的全符号局部性轮廓表示为
Figure BDA0001165284880000057
nj是局部性为j(1≤j≤ra)的信息符号的数量。
秩距离:令Xn表示有限域GF(q)上的n维向量空间,这里q为素数或素数幂。Xn中的元素向量x在GF(q)上的秩为R(x)。Xn的两个元素x、y之间的秩距离dR(X,Y)定义为dR(x,y)=R(x-y)。码c的所有不同两个码字的秩距离的最小值为码c的最小秩距离,记作dR(c)。码长为N,信息符号数为K,最小秩距离为D的线性码称作秩距离(N,K,D)码。
Gabidulin码:
Figure BDA0001165284880000061
上的一个Gabidulin码记为(N,K,N-K+1)码,其中N为编码符号个数,K为信息符号个数,N-K+1为码字最小距离。
Figure BDA0001165284880000062
为其中的一个码字,定义为
Figure BDA0001165284880000063
f(x)是m*q阶有限域(即有限域内的元素个数为m*q)内的一个系数为信息符号的线性多项式,g1,…,gN
Figure BDA0001165284880000064
上的特定的点。Gabidulin码属于秩距离码。
MDS码:一个形如(N,N-Y,Y+1)码称为最大距离可分MDS码,它是码长为N,冗余度为Y,最小距离为Y+1的线性码。其具有这样的属性:若N-Y个信息符号位经过编码之后扩展为N个信息符号位,当N-Y个信息符号位中的任一符号位丢失或损坏时,只需利用现有的N-1个符号位中的K个符号位即可恢复出丢失或损坏的信息符号位。
如果先采用Gabidulin码进行编码,再采用最大距离可分MDS码进行编码,最后得到的编码结果就可以达到Singleton上界,也就达到了码字最小距离的上界。
Singleton上界:Singleton上界是码字的一个度量,它是当码字长度及最小距离给定时码字个数的一个上界。Singleton上界给出了码字的长度和最小距离之间的关系,Aq(n,d)表示q元码码字个数可能达到的最大值,即Aq(n,d)≤qn-d+1,其中q表示码字是一个q元码。当一个码达到Singleton上界时,这个码字的最小距离可达到最大值。一个
Figure BDA0001165284880000065
域上的(N,K,D)秩距离码
Figure BDA0001165284880000066
其编码符号个数为N,信息符号个数为K,最小秩距离为D。此类码,其Singleton上界可以转化为与码字最小距离相关的表示,即
Figure BDA0001165284880000067
为使本发明的目的、技术方案及优点更加清楚明白,下面结合附图具体描述本发明所述的局部性不相等码的构造方法,如图1所示,本发明所述方法优选的包括第一优选实施方式和第二优选实施方式。
第一优选实施方式:
第一优选实施方式适用于信息符号局部性不相等的情况,为了构造出信息符号局部性不相等码,首先对最大距离可分MDS码的奇偶校验位矩阵进行分离,然后对分离所得的任意一个子集进一步分离,进而得到编码符号长度为
Figure BDA0001165284880000068
的信息符号局部性不相等码生成矩阵,该矩阵生成的码字即为最小距离d达到上界的信息符号局部性不相等码。
给定一个码
Figure BDA0001165284880000069
其中k+d-1表示编码长度,d-1表示奇偶校验位长度,d表示最小距离,当奇偶检验位长度仅比最小距离少一位时,满足最大距离可分MDS码的构造条件,最大距离可分MDS的生成矩阵是由单位矩阵与奇偶校验位矩阵构造而成,其中单位矩阵的列数与码的信息符号长度相同,所以码
Figure BDA00011652848800000610
的生成矩阵可以表示为
Figure BDA00011652848800000611
其中
Figure BDA00011652848800000612
是k*k的单位矩阵的第j列向量,
Figure BDA00011652848800000613
是k*(d-1)的奇偶校验位矩阵中的第j列向量。即
Figure BDA0001165284880000071
根据每一个信息符号的局部性对G′中的
Figure BDA0001165284880000072
划分子集,记jp代表坐标点在奇偶校验位矩阵第j列中局部性为p(1≤p≤m,m≤r)。具体地,将
Figure BDA0001165284880000073
中所有局部性为p的坐标放到同一个子集sp,则
Figure BDA0001165284880000074
|sp|表示集合sp中元素的个数,
Figure BDA0001165284880000075
表示jp的个数。
Figure BDA0001165284880000076
被分为m个不相交的子集s1,…,sm
将sp任意划分为
Figure BDA0001165284880000077
个不相交的子集,每个子集的大小不能超过局部性p,即
Figure BDA0001165284880000078
在这里,定义在一个k维的向量
Figure BDA0001165284880000079
中,集合S包含于这个k维的向量,
Figure BDA00011652848800000710
表示集合S中的元素取自
Figure BDA00011652848800000711
中的任意|S|行。以分解向量
Figure BDA00011652848800000712
为例,仅以此为例,但不局限于此例,最终得到的码字生成矩阵为G:
Figure BDA00011652848800000713
如果原始信息码字为
Figure BDA00011652848800000714
那么得到编码码字为
Figure BDA00011652848800000715
得到的码字长度n:
Figure BDA00011652848800000716
最小距离d的上界为:
Figure BDA00011652848800000717
则构造出最小距离d达到上界的信息符号局部性不相等码。
第二优选实施方式:
第二优选实施方式适用于全符号局部性不相等的情况,包括信息符号和奇偶校验符号,先采用Gabidulin码进行编码,然后将编码结果利用最大距离可分MDS码再一次进行编码。
选取一个属于
Figure BDA00011652848800000718
域的向量
Figure BDA00011652848800000719
长度为k,
Figure BDA00011652848800000720
的全符号局部性轮廓为
Figure BDA00011652848800000721
即局部性为j的符号个数有nj个,1≤j≤ra。令
Figure BDA00011652848800000722
从而求得每个局部性j所对应的nj,再由式
Figure BDA00011652848800000723
进一步求得N,即得到Gabidulin码的码字长度N。然后依据码字长度N,信息符号长度k以及最小距离N-k+1对
Figure BDA0001165284880000081
进行Gabidulin编码,得到码字
Figure BDA0001165284880000082
将码字
Figure BDA0001165284880000083
中的符号根据每个符号的局部性划分成ra个不相交组
Figure BDA0001165284880000084
即每个组中的元素局部性为j,每一个组
Figure BDA0001165284880000085
中符号个数为Nj。若Nj=0,则组
Figure BDA0001165284880000086
则不再划分此类组;若Nj>0,即组
Figure BDA0001165284880000087
则进一步将Nj对应的组
Figure BDA0001165284880000088
中的符号任意划分成Nj/j个不相交的局部性分组,每组中的符号数为j,则
Figure BDA0001165284880000089
对于每一个包含j个符号的局部性分组
Figure BDA00011652848800000810
利用Eq上的(j+1,j,2)最大距离可分MDS码再次进行编码,使每个分组的符号个数由j变为j+1。由此得到达到最小距离上界的(n,k,d)全符号局部性不相等码,码字长度:
Figure BDA00011652848800000811
最小距离d的上界:
Figure BDA00011652848800000812
则构造出最小距离d达到上界的全符号局部性不相等码。
上述实施例仅仅是为清楚地说明本发明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举,而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围之中。

Claims (1)

1.一种局部性不相等码的构造方法,其特征在于,包括:
步骤一:当信息符号局部性不相等时,构造信息符号局部性不相等码,对最大距离可分MDS码的奇偶校验位矩阵进行分离,对分离所得的任意一个子集进一步分离,得到编码符号长度n的信息符号局部性不相等码生成矩阵,该矩阵生成的码字即为最小距离d达到上界的信息符号局部性不相等码:
Figure FDA0002370438590000011
其中k+d-1表示编码长度,k表示信息符号的个数,d-1表示奇偶校验位长度,d表示最小距离,当奇偶检验位长度仅比最小距离少一位时,满足最大距离可分MDS码的构造条件,最大距离可分MDS码的生成矩阵是由单位矩阵与奇偶校验位矩阵构造而成,其中单位矩阵的列数与最大距离可分MDS码的信息符号长度相同;
Figure FDA0002370438590000012
的生成矩阵可以表示为
Figure FDA0002370438590000013
其中
Figure FDA0002370438590000014
是k*k的单位矩阵的第j列向量,
Figure FDA0002370438590000015
是k*(d-1)的奇偶校验位矩阵中的第j列向量,即:
Figure FDA0002370438590000016
每一个信息符号的局部性对G′中的
Figure FDA0002370438590000017
划分子集,记jp代表坐标点在奇偶校验位矩阵第j列中局部性为p(1≤p≤m,m≤r),将
Figure FDA0002370438590000018
中所有局部性为p的坐标放到同一个子集sp,则
Figure FDA0002370438590000019
Figure FDA00023704385900000110
被分为m个不相交的子集s1,…,sm,|sp|表示集合sp中元素的个数,
Figure FDA00023704385900000111
表示jp的个数;
将sp任意划分为
Figure FDA00023704385900000112
个不相交的子集,每个子集中元素的个数不能超过局部性p,即
Figure FDA00023704385900000113
Figure FDA00023704385900000114
为k维的向量,集合S包含于这个k维的向量,
Figure FDA00023704385900000115
表示集合S中的元素取自
Figure FDA00023704385900000116
中的任意|S|行;
以分解向量
Figure FDA00023704385900000117
为例,最终得到的码字生成矩阵为G:
Figure FDA00023704385900000118
若原始信息码字为
Figure FDA00023704385900000119
得到编码码字为
Figure FDA00023704385900000120
得到的码字长度n:
Figure FDA00023704385900000121
最小距离d的上界:
Figure FDA0002370438590000021
则构造出最小距离d达到上界的信息符号局部性不相等码;
步骤二:当全符号局部性不相等时,包括信息符号和奇偶校验符号,采用Gabidulin码进行编码,再将编码结果利用最大距离可分MDS码再一次进行编码,得到达到最小距离上界的(n,k,d)全符号局部性不相等码,码字长度n,信息符号长度k,该矩阵生成的码字即为最小距离d达到上界的信息符号局部性不相等码:
向量
Figure FDA0002370438590000022
属于
Figure FDA0002370438590000023
域,长度为k,
Figure FDA0002370438590000024
的全符号局部性轮廓为
Figure FDA0002370438590000025
即局部性为j的符号个数有nj个,1≤j≤ra
Figure FDA0002370438590000026
求得每个局部性j所对应的Nj ,由式
Figure FDA0002370438590000027
进一步求得N,即得到Gabidulin码的码字长度N;根据码字长度N,信息符号长度k以及最小距离N-k+1对
Figure FDA0002370438590000028
进行Gabidulin编码,得到码字
Figure FDA0002370438590000029
码字
Figure FDA00023704385900000210
中的符号根据每个符号的局部性划分成ra个不相交组
Figure FDA00023704385900000211
即每个组中的元素局部性为j,每一个组
Figure FDA00023704385900000212
中符号个数为Nj
若Nj=0,则组
Figure FDA00023704385900000213
则不再划分此类组;
若Nj>0,即组
Figure FDA00023704385900000214
则进一步将Nj对应的组
Figure FDA00023704385900000215
中的符号任意划分成Nj/j个不相
Figure FDA00023704385900000216
再次进行编码,使每个分组的符号个数由j变为j+1;
得到达到最小距离上界的(n,k,d)全符号局部性不相等码,码字长度n:
Figure FDA00023704385900000217
最小距离d的上界:
Figure FDA00023704385900000218
则构造出最小距离d达到上界的全符号局部性不相等码;
其中,所述Fq表示q元域;
所述
Figure FDA00023704385900000219
中F表示域,qm表示q元的m次扩展,其中域内多项式的最高次数为k-1;
一个长度为n的编码中含有k个信息符号,其中某个符号i可以通过码中的其他ri个符号恢复出来,那么i的局部性为ri,若一个码所包含的k个信息符号中的每个信息符号的局部性最大为r,则所述码的局部性为r;
***码
Figure FDA0002370438590000031
n表示编码长度,k表示信息符号长度,d表示最小距离,若信息符号可以被分为不相交的子集,不同子集的信息符号具有不同的局部性,即信息符号局部性不相等码;
所述***码
Figure FDA0002370438590000032
其信息符号局部性轮廓为
Figure FDA0002370438590000033
kj为局部性为j(1≤j≤r)的信息符号的个数;
所述全符号局部性不相等码是信息符号局部性不相等码的进一步扩展,编码符号,包括信息符号和奇偶校验符号,可以被分为不相交的子集,不同子集的编码符号具有不同的局部性,表示奇偶校验符号也具有局部性约束的码;
所述***码
Figure FDA0002370438590000034
若奇偶校验符号也具有局部性约束时,定义全符号局部性轮廓,ri表示码中第i个符号的局部性,1≤i≤n,令ra=max(r1,r2,…,rn),那么它的全符号局部性轮廓表示为
Figure FDA0002370438590000035
nj是局部性为j(1≤j≤ra)的信息符号的数量;
若Xn为有限域GF(q)上的n维向量空间,q为素数或素数幂,Xn中的元素向量x在GF(q)上的秩为R(x),Xn的两个元素x、y之间的秩距离dR(X,Y)定义为dR(x,y)=R(x-y);码c的所有不同两个码字的秩距离的最小值为码c的最小秩距离,记作dR(c);码长为N,信息符号数为K,最小秩距离为D的线性码称作秩距离(N,K,D)码;
所述
Figure FDA0002370438590000036
上的一个Gabidulin码记为(N,K,N-K+1)码,其中N为编码符号个数,K为信息符号个数,N-K+1为码字最小距离;
Figure FDA0002370438590000037
为其中的一个码字,定义为
Figure FDA0002370438590000038
f(x)是m*q阶有限域内的一个系数为信息符号的线性多项式,即有限域内的元素个数为m*q,g1,…,gN
Figure FDA0002370438590000039
上的特定的点;
所述Gabidulin码属于秩距离码;
若线性码满足码长为M,冗余度为Y,最小距离为Y+1,则(M,M-Y,Y+1)码为最大距离可分MDS码;所述最大距离可分MDS码,若M-Y个信息符号位经过编码之后扩展为M个信息符号位,当M-Y个信息符号位中的任一符号位丢失或损坏时,利用现有的M-1个符号位中的K个符号位即可恢复出丢失或损坏的信息符号位;
若先采用Gabidulin码进行编码,再采用最大距离可分MDS码进行编码,最后得到的编码结果就可以达到Singleton上界,即达到了码字最小距离的上界;
所述Singleton上界为码字的一个度量,即当码字长度及最小距离给定时码字个数的一个上界;Aq(n,d)为q元码码字个数可能达到的最大值,即Aq(n,d)≤qn-d+1,其中q表示码字是一个q元码;若一个码字达到Singleton上界时,所述码字的最小距离可达到最大值;若
Figure FDA00023704385900000310
域上的(N,K,D)秩距离码
Figure FDA00023704385900000311
其编码符号个数为N,信息符号个数为K,最小秩距离为D,则其Singleton上界可以转化为码字的最小距离的表达式,即:
Figure FDA0002370438590000041
CN201611071571.XA 2016-11-29 2016-11-29 一种局部性不相等码的构造方法 Active CN106788454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611071571.XA CN106788454B (zh) 2016-11-29 2016-11-29 一种局部性不相等码的构造方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611071571.XA CN106788454B (zh) 2016-11-29 2016-11-29 一种局部性不相等码的构造方法

Publications (2)

Publication Number Publication Date
CN106788454A CN106788454A (zh) 2017-05-31
CN106788454B true CN106788454B (zh) 2020-04-24

Family

ID=58902555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611071571.XA Active CN106788454B (zh) 2016-11-29 2016-11-29 一种局部性不相等码的构造方法

Country Status (1)

Country Link
CN (1) CN106788454B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109257049B (zh) * 2018-08-09 2020-11-06 东莞理工学院 一种修复二进制阵列码校验矩阵的构造方法及修复方法
CN113381772B (zh) * 2021-07-02 2022-11-25 广东工业大学 一种基于包的最优局部修复码构造方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1933336A (zh) * 2005-01-10 2007-03-21 美国博通公司 使用grs码构建ldpc码的方法和装置
CN101895742A (zh) * 2010-02-08 2010-11-24 北京韦加航通科技有限责任公司 将不相等错保护应用于单载波***视频传输的方法
CN105260259A (zh) * 2015-09-16 2016-01-20 长安大学 一种基于***最小存储再生码的局部性修复编码方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8181096B2 (en) * 2007-12-17 2012-05-15 Lsi Corporation Configurable Reed-Solomon decoder based on modified Forney syndromes
US8621330B2 (en) * 2011-03-21 2013-12-31 Microsoft Corporation High rate locally decodable codes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1933336A (zh) * 2005-01-10 2007-03-21 美国博通公司 使用grs码构建ldpc码的方法和装置
CN101895742A (zh) * 2010-02-08 2010-11-24 北京韦加航通科技有限责任公司 将不相等错保护应用于单载波***视频传输的方法
CN105260259A (zh) * 2015-09-16 2016-01-20 长安大学 一种基于***最小存储再生码的局部性修复编码方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Optimal Locally Repairable Codes and Connections to Matroid Theory;Itzhak Tamo等;《2013 IEEE International Symposium on Information Theory》;20131008;1814-1818 *
基于FRC码的分布式存储编码优化算法研究;郭星;《中国优秀硕士学位论文全文数据库 信息科技辑》;20151215(第12期);I137-30 *

Also Published As

Publication number Publication date
CN106788454A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
Cohen et al. Covering codes
US7930611B2 (en) Erasure-resilient codes having multiple protection groups
Cluzeau Block code reconstruction using iterative decoding techniques
US20040153938A1 (en) Error correcting code decoding device, program and method used in the same
EP1798861B1 (en) LDPC encoding through decoding algorithm
Sung et al. A ZigZag-decodable code with the MDS property for distributed storage systems
Das et al. Distributed matrix-vector multiplication: A convolutional coding approach
CN111078460B (zh) 一种快速纠删码计算方法
US20140152476A1 (en) Data encoding methods, data decoding methods, data reconstruction methods, data encoding devices, data decoding devices, and data reconstruction devices
EP1941347A2 (en) Method and apparatus for a restartable hash in a trie
Shahabinejad et al. A class of binary locally repairable codes
Rurik et al. Hamming codes as error-reducing codes
CN106788454B (zh) 一种局部性不相等码的构造方法
CN108762978B (zh) 一种局部部分重复循环码的分组构造方法
Li et al. Repairing Reed-Solomon Codes Over $ GF (2^\ell) $
CN108429553B (zh) 极化码的编码方法、编码装置及设备
Hou et al. Multi-layer transformed MDS codes with optimal repair access and low sub-packetization
Battail Error-correcting codes and information in biology
KR101923116B1 (ko) 분산 저장 시스템에서 부분접속 복구 부호를 이용하는 부호화/복호화 장치 및 방법
Antoniou et al. Compressing biological sequences using self adjusting data structures
CN110990188B (zh) 一种基于Hadamard矩阵的部分重复码的构造方法
JP2009182421A (ja) 復号化方法及び復号化装置
EP3841673B1 (en) Apparatuses and methods for mapping frozen sets between product codes and component polar codes
Fruchtman et al. Weighted adaptive coding
JP2021141369A (ja) メモリシステム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant