上海交通大学学报, 2024, 58(10): 1596-1605 doi: 10.16183/j.cnki.jsjtu.2023.151

电子信息与电气工程

三角形结合方案的最优局部修复码构造

王静,, 李静辉, 杨佳蓉, 王娥

长安大学 信息工程学院,西安 710018

Construction of Optimal Locally Repairable Codes of Triangular Association Schemes

WANG Jing,, LI Jinghui, YANG Jiarong, WANG E

School of Information Engineering, Chang’an University, Xi’an 710018, China

责任编辑: 孙伟

收稿日期: 2023-04-21   修回日期: 2023-09-22   接受日期: 2023-09-25  

基金资助: 国家自然科学基金(62001059)
陕西省自然科学基金资助项目(2022JM-056)
长安大学大学生创新创业训练计划项目(S202310710121)

Received: 2023-04-21   Revised: 2023-09-22   Accepted: 2023-09-25  

作者简介 About authors

王静(1982—),博士,教授,从事网络编码及分布式存储编码等方面的研究;E-mail:jingwang@chd.edu.cn.

摘要

局部修复码(LRCs)为用于分布式存储系统中的新型纠删码,能够有效实现海量数据的可靠高效存储,构造具有(r, t)局部性的LRCs已成为当前研究热点.为此,提出基于三角形结合方案的LRCs构造方法,可构造具有任意(r, t)局部性的二元最优LRCs.性能分析结果表明,构造的可用性t=2的LRCs达到了最优码率界,构造的具有任意局部性r>2和可用性t>2的LRCs达到了最优最小距离界.与基于近正则图及基于直积码等构造方法相比,本文构造出的LRCs在码率上表现更优且参数选择更灵活.

关键词: 分布式存储系统; 局部修复码; 三角形结合方案; 最小距离

Abstract

As a new erasure code for distributed storage systems, locally repairable codes (LRCs) can effectively realize the reliable and efficient storage of massive data. The construction of locally repairable codes with (r,t) locality has become a research hotspot recently. Therefore, the construction methods of locally repairable codes based on triangular association schemes are proposed, which can construct optimal binary locally repairable codes with arbitrary (r,t) locality. Performance analyses show that the LRCs constructed with availability t=2 reach the optimal code rate bound, the LRCs constructed with arbitrary locality r>2 and availability t>2 reach the optimal minimum distance bound. The LRC constructed in this paper performs better in terms of code rate and more flexible parameter selection than those constructed based on near-regular graphs and direct product codes, etc.

Keywords: distributed storage system; locally repairable code (LRC); triangular association schemes; minimum distance

PDF (958KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王静, 李静辉, 杨佳蓉, 王娥. 三角形结合方案的最优局部修复码构造[J]. 上海交通大学学报, 2024, 58(10): 1596-1605 doi:10.16183/j.cnki.jsjtu.2023.151

WANG Jing, LI Jinghui, YANG Jiarong, WANG E. Construction of Optimal Locally Repairable Codes of Triangular Association Schemes[J]. Journal of Shanghai Jiaotong University, 2024, 58(10): 1596-1605 doi:10.16183/j.cnki.jsjtu.2023.151

随着信息技术的发展,数据信息出现爆炸式增长,大型分布式存储系统因海量存储能力、高可扩展性以及低成本等显著优点得到了广泛应用[1].在分布式存储系统中,数据存储在多个分布式存储节点中[2].存储系统在运行过程中难免出现不可预期的故障,为了确保数据存储的可靠性,通常采取数据冗余技术.三副本技术需要很大的存储开销,纠删码技术能够降低存储开销,但会耗费大量的网络带宽.Papailiopoulos等[3]提出局部修复码(locally repairable codes, LRCs),既可以降低故障节点修复过程中所需的存活节点数量,又可以降低故障节点的修复带宽开销.

如果一个编码符号可以通过访问最多r个其他编码符号来恢复,那么该编码符号具有修复局部性,该参数用r表示,这r个编码符号的集合称为修复集[4-5].Gopalan等[5]提出了修复局部性r,这一参数是衡量修复效率的重要指标,对于信息符号具有局部性r的LRCs,给出了码的最小距离上界.文献[6-9]中给出了最小距离达到此上界的LRCs的相关构造.除了局部性r外,LRCs的另一个重要特性是可用性.如果一个编码符号具有t个修复集,那么称该编码符号具有可用性,该参数用t表示.这个特性与热数据密切相关,具有可用性的LRCs可以确保对热数据进行并行读取和多路径修复[10].为了在多个节点故障的情况下实现局部恢复,Rawat等[11]提出了(r,t)局部性的概念,并且证明了信息符号具有(r,t)局部性的单校验LRCs最小距离的上界.Tamo等[12]提出并证明了所有符号具有(r,t)局部性的LRCs的最小距离和码率上界.

目前大量文献对具有(r,t)局部性的LRCs构造进行研究.文献[12]中基于t个二进制(r+1,r)奇偶校验码的直积,构造具有(r,t)局部性的二元局部修复码(binary locally repairable codes, BLRCs),该BLRCs虽然能够实现任意的局部性r和可用性t,但是其码率较小.文献[13]中利用有限域上的迹函数构造了一类循环(r,t) 局部修复码,构造出的BLRCs达到了最优最小距离,但是此构造方法只能构造特定参数的BLRCs且码率较小.Hao等[14]采用有限几何低密度奇偶校验码(LDPC)和阵列LDPC 构造了具有 (r,t) 局部性的BLRCs,该BLRCs虽然达到了最优最小距离,不足之处是参数条件限制较多且码率较小.文献[15]中基于分区和特定结构的函数构造了两种具有严格可用性t的BLRCs,然而提出的两种LRCs只在某些参数条件下存在.文献[16]中基于超图构造的BLRCs达到了最优最小距离界,但是超图的存在需要满足一些参数条件的限制,参数选择不够灵活,并且码率较小.

为了解决上述LRCs构造中存在的参数限制较多且码率较小的问题,基于三角形结合方案,提出具有(r,t)局部性的最优BLRCs的构造方法.首先利用三角形结合方案的结合关系,基于校验矩阵构造可用性t=2的BLRCs,进一步基于生成矩阵构造局部性r=2的BLRCs;为了使BLRCs的参数选择更加灵活,对基于三角形结合方案构造的BLRCs进行扩展,构造能够实现任意局部性r>2和任意可用性t>2的BLRCs.通过性能分析,基于三角形结合方案构造的具有(r,2)局部性的BLRCs达到了最优码率界,构造的具有任意局部性r>2和可用性t>2的BLRCs达到了最优最小距离界.与基于近正则图构造的BLRCs和基于直积码构造的BLRCs等方法相比,本文BLRCs在码率上表现更优且参数选择更灵活.

1 预备知识

1.1 局部修复码

C是有限域Fq上的(n,k)线性码,其中n为码长,k为维度.给定[n]={1,2,…,n},c=(c1,c2,…,cn)是一个码字,下面给出具有(r,t)局部性的码C定义.

定义1[11] 如果编码符号ci具有(r,t)局部性,那么需要满足下列条件:

(1) 存在t个子集,满足φ1(i),…,φi(i)⊂[n]\{i},需ci能够从φj(i) (j∈[t])中恢复出来,φj(i) (j∈[t])称为ci的修复集.

(2) |φj(i)|≤r,j∈[t].

(3) φj(i)∩φl(i)=⌀,jl∈[t].

如仅有信息符号具有(r,t)局部性,则此码称作(n, k, r, t)i LRCs.如所有符号具有(r,t)局部性,则此码称作(n, k, r, t)a LRCs.

定义2[15] 对于v=[v1v2vn]∈Fqn,v中非零元素下标的集合为v的支持集,记作supp(v),即

supp(v)={i∈[n]: vi≠0}

定理1[17] 对于信息位具有(r,t)局部性的(n,k,d) LRCs,最小距离应满足:

dt+1

定理2[11] 若LRCs的所有信息位码元的每个修复集中只包含一个校验位,那么该单校验(n, k, r, t)i LRCs的最小距离满足:

$d \leqslant n-k-\left\lceil\frac{k t}{r}\right\rceil+t+1$

称达到边界式(3)的LRCs是最小距离最优的单校验(n, k, r, t)i LRCs.

定理3[13] 若(n,k,r,t) LRCs的每个码元具有t个大小为r的不相交修复集,那么该码码率满足:

R≤ 1i=1t1+1ir

称达到边界式(4)的LRCs是码率最优的(n,k,r,t) LRCs.

定理4 特别地,Prakash等[18]进一步提出了(n,k,r,t=2) LRCs的码率上界:

R≤ rr+2

称达到边界式(5)的LRCs是码率最优的(n, k, r, 2) LRCs.

定理5 对于具有严格可用性的LRCs,Balaji等[19]提出其码长需要满足:

n≥(r+1)2- r(r+1)t

1.2 三角形结合方案

结合方案是关于集合Ω中元素对之间的关系,Ω×ΩΩ中有序元素对的集合,即Ω×Ω={(α,β): αΩ, βΩ}.BΩ×Ω的任意子集,其对偶子集是B',其中B'={(β, α): (α, β)∈B},如果B=B',则称B是对称的.一个特殊的对称子集是对角子集,对角子集Diag(Ω)可以表示为Diag(Ω)={(ω,ω): ωΩ}.

定义3[20] 称为结合方案.有限集Ω上具有s个结合类的结合方案是将Ω×Ω划分成集合D0, D1, …, Ds,称为结合类,满足以下条件:

(1) D0=Diag(Ω).

(2) Di是对称的,其中i=1,2,…,s.

(3) 对于{0,1,…,s}中所有的i,j,k,有正整数pijk,对Dk中所有(α,β),满足

{γΩ: (α, γ)Di, (γ, β)Dj}=pijk

定义4[20] 称为三角形结合方案.设Ω是由m元集Γ中所有二元子集构成的集合族,对于Ω中的元素α,令

D1(α)={βΩ: |αβ|=1}

D2(α)={βΩ: αβ=⌀}

βD1(α),即满足|αβ|=1,则称αβ具有第一类结合关系;若βD2(α),则称αβ具有第二类结合关系,即三角形结合方案.

2 基于三角形结合方案构造BLRCs

基于三角形结合方案中的结合关系可构造可用性t=2的BLRCs,进一步基于生成矩阵可构造出局部性r=2的BLRCs;为了使BLRCs的参数更加灵活,对基于三角形结合方案构造的BLRCs进行扩展,进一步构造能够实现任意局部性r>2和任意可用性t>2的BLRCs.

2.1 构造可用性t=2的BLRCs

首先基于三角形结合方案构造关联矩阵,基于关联矩阵构造可用性t=2的BLRCs.通过构造生成矩阵进一步得到局部性r=2的BLRCs.构造关联矩阵的具体步骤如下:

步骤1 用Ω表示三角形结合方案中m+1元集Γ={1,2,…,m+1}全部二元子集构成的集合族,则此集合族中共有m(m+1)/2个元素,其中m≥2.

步骤2 对任意二元子集LΩ,令Bi={L|iL},B={B1,B2,…,Bm+1},其中iΓ.

步骤3 构造关联矩阵

M=[mij],1≤im+1,1≤jm(m+1)/2

其中

mij=1,ΩjBi0,ΩjBi

由|Bi|=m可知,关联矩阵M的行重为m;对任意二元子集LΩ,必定存在Bi1Bi2,其中i1i2,i1,i2Γ,使得LBi1LBi2,可知关联矩阵M的列重为2.因此,关联矩阵M可以表示为(m+1)×(m(m+1)/2)阶的二元稀疏(r=m,t=2)-正则矩阵.

基于以上关联矩阵构造校验矩阵,考虑由校验矩阵定义二元码,有如下构造.

构造1 由校验矩阵H1=[M|I(m+1)]构造的码C1是所有符号具有局部性r和可用性t的单校验(n, k, r, t)aBLRCs,其中满足参数条件

$\begin{array}{l} n=\frac{(m+1)(m+2)}{2} \\ k=\frac{m(m+1)}{2} \\ r=m, t=2 \end{array}$

证明 由文献[15]可知,如果C中的每个码元符号ci(i∈[n]),在对偶码中都存在t个码字h1i, h2i, …, hti,每个码字汉明重量≤r+1,且supp(hgi)∩supp(hli)={i}, ∀1≤glt,那么码C被称为所有符号具有可用性t的LRCs.从校验矩阵 H1 可以确定码C1的码长、维度和所有符号局部性.接下来证明码C的所有符号具有可用性t=2.

对于码元符号cii[1,k],校验矩阵H1在第i列非零的2行即为满足上述条件的2个码字.将校验矩阵H1的所有行相加,可以得到对偶码c1的一个码字c=0m(m+1)2,1m+1.对于码元符号cii[k+1, n],校验矩阵在第i列非零的行与码字c即为满足上述条件的两个码字.因此,码C1具有所有符号可用性 t=2.

例1 以m=4为例构造可用性t=2的BLRCs,则$\Gamma=\{1,2,3,4,5\}, \Omega=\{(i, j\} \mid i<j \in \Gamma\}, B=\{\{\{1,2\},\{1,3\},\{1,4\},\{1,5\}\},\{\{1,2\}, \\ \{2,3\},\{2,4\},\{2,5\}\},\{\{1,3\},\{2,3\},\{3,4\}, \{3,5\}\},\{\{1,4\},\{2,4\},\{3,4\},\{4,5\}\},\{\{1,5\}, \{2,5\}, \{3,5\},\{4,5\}\}\}$,将B中元素与矩阵的行关联,将Ω中元素与矩阵的列关联,那么可知关联矩阵M是一个5×10阶的正则矩阵,关联矩阵M可具体表示如下:

M=11110000001000111000010010011000100101010001001011

由校验矩阵H1=[M|I5]构造的码是所有符号具有局部性r和可用性t的(n=15, k=10, r=4, t=2)aBLRCs,码的最小距离d=3.若信息位c1发生故障,则由BLRCs的校验矩阵H1可知,信息位c1可用c1=c11-c2-c3-c4=c12-c5-c6-c7来恢复,那么信息位c1的修复集可表示为

φ1(1)={2,3,4,11}, φ2(1)={5,6,7,12}

每个信息符号的修复集均含有一个校验位符号.若校验位c11发生故障,则由BLRCs的校验矩阵H1可知,校验位c11可用c11=c1+c2+c3+c4=c12+c13+c14+c15来恢复,那么校验位c11的修复集可表示为

φ1(11)={1,2,3,4}, φ2(11)={12,13,14,15}

可以看出校验符号同样具有两种修复方式.

推论1 由生成矩阵

G=[Im+1|M]

定义的码C2是所有符号具有局部性r和可用性t的单校验(n, k, r, t)aBLRCs,其中参数满足条件

n=(m+1)(m+2)/2
k=m+1, r=2, t=m

证明 该推论的证明与构造1相似.

推论2 由关联矩阵M作为校验矩阵定义的码C3是所有符号具有严格可用性的(n, k, r, t)aBLRCs,其中参数满足条件

n=m(m+1)/2, k=(m-1)m/2
r=m-1, t=2

且构造的BLRCs 的码长达到了Balaji等[19]提出的具有严格可用性的BLRCs的码长界.

证明 若a×b阶校验矩阵的行重为r+1,列重为t,满足bt=a(r+1),且校验矩阵中第i列具有非零项的行的支持集由Sj(i), j=1, 2, …, t给出,满足

Sj(i)Sl(i)={i}, ∀1≤jlt

由此类校验矩阵构造的码称为具有严格可用性t的码[15].因此,由关联矩阵M作为校验矩阵定义的码是具有严格可用性的码.

由关联矩阵M的形式可以确定码C3的码长、所有符号局部性和可用性.然后对码C3的维度进行证明.由于构造的关联矩阵M的秩为行数减1,所以码C3的维度

k=n-rank(M)=m(m+1)/2-(m+1-1)=(m-1)m/2

由码C3的参数条件可知

(r+1)2-r(r+1)/t=m2-(m-1)m/2= m(m+1)/2=n

即构造出的码长达到了Balaji等[19]提出的具有严格可用性的码具有的码长界.

2.2 构造具有任意局部性和可用性的BLRCs

现有码结构主要是针对给定参数的系统,因此缺乏适应系统参数变化的能力.使用构造1仅能构造可用性t=2的BLRCs.本文对构造1进行推广,进一步构造具有任意局部性r>2和可用性t>2的BLRCs.

矩阵构造示意图如图1所示.用Φm,p表示行重为m、列重为p的正则矩阵.由于基于三角形结合方案构造的关联矩阵M的行重为m,列重为2,因此,用Φm,2表示行重为m的关联矩阵M.m, p>2时,给定m, p,使用矩阵

Φm,p=Φm,p-10IΦTp, m-1

图1

图1   矩阵构造示意图

Fig.1   Diagram of matrix construction


可进一步构造行重为m、列重为p的正则矩阵.矩阵Φm,p中的块最终均能用Φl,2(2<lm)、ΦTv,2(2<vp)、单位矩阵及零矩阵表示.例如,由Φ3,2ΦT3,2、单位矩阵及零矩阵可表示出Φ3, 3,即

Φ3, 3=Φ3,20IΦT3,2

其中:Φ3,2即为由三角形结合方案构造得到的行重为3、列重为2的关联矩阵.

构造2 由校验矩阵

H2=Φm,p-10IΦTp, m-1 I

定义的码C4是信息符号,可以实现任意局部性r>2和任意可用性t>2的(n=(m+1)(m+2)… (m+p)/p!, k=m(m+1)…(m+p-1)/p!, r=m, t=p)iBLRCs.

证明 首先计算矩阵Φm,p的大小.由构造1可知Φm,2的行数为m+1,列数为m(m+1)/2.由于矩阵ΦT3, m-1Φm-1, 3的行数及列数相同,当p=3时,为了计算方便,使用如下矩阵计算Φm,3的行数和列数:

Φm,20IΦm-1,3=Φm,20I Φm-1,20I    Φ4,20I Φ3,20IΦ2,3¯¯¯¯

根据矩阵形式,Φm,3的行数可表示为

m+1+m(m+1)2=(m+1)(m+2)2

Φm,3的列数可表示为

(m+1)m2+m(m-1)2+…+4×32+4= m(m+1)(m+2)2×3

Φm,4的行数可表示为

(m+1)(m+2)2+m(m+1)(m+2)6= (m+1)(m+2)(m+3)2×3

Φm,4的列数可表示为

(m+2)(m+1)m6+(m+1)m(m-1)6+…+5×4×36+5=m(m+1)(m+2)(m+3)2×3×4

p>2时,假设Φm,p的行数为(m+1)(m+2)…(m+p-1)/(p-1)!,Φm,p的列数为m(m+1)…(m+p-1)/p!.由于矩阵ΦTp+1, m-1Φm-1, p+1的行数及列数相同,为了计算方便,使用如下矩阵计算Φm,p+1的行数和列数:

Φm,p0IΦm-1, p+1=Φm,p0I Φm-1,p0I    Φ4,p0I Φ3,p0IΦ2,p+1¯¯¯¯

矩阵Φm,p+1的行数为

(m+1)(m+2)(m+p-1)(p-1)!+m(m+1)(m+p-1)p!=(m+1)(m+2)(m+p)p!

矩阵Φm,p+1的列数为

m(m+1)(m+p-1)p!+

(m-1)m(m+p-2)p!+…+

3×4(p+2)p!+p+2=

m(m+1)(m+p)(p+1)!

假设成立.

因此,当p>2时,Φm,p的行数为(m+1)(m+2)…(m+p-1)/(p-1)!,Φm,p的列数为m(m+1)…(m+p-1)/p!.则由校验矩阵H2=[Φm,p|I]定义的码长

n=(m+1)(m+2)…(m+p)/p!

维度

k=m(m+1)…(m+p-1)/p!

当需要构造给定局部性r及可用性t的BLRCs时,可以基于三角形结合方案构造所需的列重为2的关联矩阵,由这些关联矩阵构造得到校验矩阵H2=[Φr, t|I]进而构造BLRCs.

例2 以r=3, t=5为例构造BLRCs,由上述构造方法可知:

Φ3,5=Φ3, 40IΦT5,2=Φ3, 30IΦT4,2_0IΦT5,2=

Φ3,20IΦT3,2_0IΦT4,2_0IΦT5,2

其中,基于三角形结合方案构造关联矩阵的方法,矩阵Φ3,2可以表示为

Φ3,2=111000100110010101001011

矩阵Φ4,2Φ5,2也同样可以表示出来.可以看出,矩阵Φ3,5中的块最终能用Φ3,2Φ3,2TΦ4,2TΦ5,2T、单位矩阵及零矩阵表示.由校验矩阵H2=[Φ3,5|I]定义的码是信息符号可以实现局部性和可用性的(n=56, k=21, r=3, t=5)i BLRCs.

3 性能分析

3.1 最小距离

定理6 由构造1中校验矩阵H1构造得到的(n, k, r, 2)aBLRCs的最小距离为d=3.

证明 通过观察构造1中校验矩阵H1可知,由于关联矩阵M的列重为2,且关联矩阵M的右边是一个单位矩阵,所以校验矩阵H1中存在线性相关的3列.因此,构造得到的LRCs的最小距离d≤3.另一方面,从校验矩阵中任取两列,若两列都来自关联矩阵M或两列都来自单位矩阵I(m+1),显然它们线性无关;若一列来自关联矩阵M,另一列来自单位矩阵I(m+1),由于列重不同,它们必然线性无关.因此,构造得到的BLRCs的最小距离d≥3.综上可知,构造1构造的BLRCs的最小距离为d=3.

定理7 由构造2中校验矩阵H2构造得到的信息符号可以实现任意局部性r>2和任意可用性t>2的(n, k, r, t)iBLRCs是最小距离最优的BLRCs,且码的最小距离d=t+1.

证明 由构造2中的校验矩阵H2可知,矩阵Φm,p的列重为p,且矩阵Φm,p的右边是一个单位矩阵,可知从矩阵Φm,p中任选一列是单位阵中p列的线性组合,即校验矩阵H2中存在线性相关的p+1列.因此,由校验矩阵H2构造得到的BLRCs的最小距离dp+1.另一方面,根据矩阵Φm,p的形式可知,矩阵Φm,p的行重为m,列重为p,每列“1”元素所在p行中任意两行的支撑集只在该元素处相交,因此每个信息符号的修复局部性为m且具有p个不相交的修复集.根据定理1,最小距离应满足dp+1.综上所述,可知由校验矩阵H2构造所得的BLRCs的最小距离d=p+1.

又因为由校验矩阵H2构造的BLRCs的参数满足

n=(m+1)(m+2)…(m+p)/p!
k=m(m+1)…(m+p-1)/p!
r=m, t=p

将这些参数代入式(3),可得:

$\begin{array}{l} d \leqslant n-k-\left\lceil\frac{k t}{r}\right\rceil+t+1= \\ \frac{(m+1)(m+2) \cdots(m+p)}{p!}- \\ \frac{m(m+1) \cdots(m+p-1)}{p!}- \\ \left\lceil\frac{m(m+1) \cdots(m+p-1)}{p!} \frac{p}{m}\right\rceil+p+1=p+1 \end{array}$

因为p=t,所以构造出的BLRCs的最小距离d=t+1,且达到了式(3)中的最小距离边界,即该码是最小距离最优的BLRCs,证毕.

3.2 构造参数分析

表1可知,当可用性t=2时,有

rr+2>rr+12

表1   构造1参数比较分析

Tab.1  Comparative analysis of parameters of Construction 1

构造方式构造参数最小距离相对距离
构造1构造的BLRCsn=(r+1)(r+2)2, k=r(r+1)2, r,t=2dmin=36(r+1)(r+2)
基于近正则图构造的BLRCs[18]$n=k+\left\lceil\frac{2 k}{r}\right\rceil,\left\lceil\frac{2 k}{r}\right\rceil \geqslant r+2, t=2$dmin=33k+2kr
基于单位矩阵变换构造的BLRCs[21]n=r2+2r, k=r2, r,t=2dmin=33r(r+2)
基于直积码构造的BLRCs[12](t=2)n=(r+1)2, k=r2, r,t=2dmin=44(r+1)2

新窗口打开| 下载CSV


即由构造1构造的BLRCs的码率高于基于直积码构造的BLRCs的码率.虽然基于直积码构造的BLRCs 的最小距离大于构造1构造的BLRCs最小距离,但当局部性r>1时,由于

6(r+1)(r+2)>4(r+1)2

即构造1构造的BLRCs的相对距离大于基于直积码构造的BLRCs的相对距离.当r|2k且2k=r(r+2)时,基于近正则图构造的BLRCs的相对距离

6(r+2)2<6(r+1)(r+2)

即基于近正则图构造的BLRCs的相对距离小于构造1构造的BLRCs.构造1构造的BLRCs与基于单位矩阵变换构造的BLRCs能够达到相同的最小距离和码率,但是当局部性r取相同值并且r>1时,可知其相对距离

6(r+1)(r+2)>3r(r+2)

即构造1构造的BLRCs的相对距离大于基于单位矩阵变换构造的BLRCs.

图2给出了构造1构造的BLRCs、基于近正则图、基于直积码构造的BLRCs的码率R随局部性r变化曲线以及Prakash等[18]提出的码率上界曲线.可以看出,当可用性t=2时,随着局部性r的增大,码率同时呈增大的趋势;当局部性r取相同值时,构造1构造的BLRCs的码率高于基于直积码构造的BLRCs;当局部性r取奇数时,构造1构造的BLRCs 的码率高于基于近正则图构造的BLRCs.此外,构造1构造的BLRCs的码率R=r/(r+2),达到了Prakash等[18]提出的码率上界.

图2

图2   可用性t=2时码率随局部性的变化

Fig.2   Code rate versus locality at availabity t=2


由于推论1仅能构造局部性r=2的BLRCs,将其与基于单纯形码构造的BLRCs以及基于直积码构造的BLRCs进行比较.由表2可知,当基于直积码构造的BLRCs的局部性取为(2,t)且t>1时,有

22+t>23t

表2   推论1参数比较分析

Tab.2  Comparative analysis of parameters of Corollary 1

构造方式构造参数最小距离相对距离
推论1构造的BLRCsn=(t+1)(t+2)2, k=t+1, r=2,tdmin=t+12t+2
基于单纯形码构造的BLRCs[22]n=2m-1, k=m, r=2, t=2m-1-1dmin=t+1t+12t+1
基于直积码构造的BLRCs[12] (r = 2)n=3t, k=2t, r=2,tdmin=2t23t

新窗口打开| 下载CSV


即由推论1得到的BLRCs的码率高于基于直积码构造的BLRCs.此外,由推论1得到的BLRCs的相对距离也大于基于直积码构造的BLRCs.基于单纯形码仅能构造可用性t=2m-1-1的BLRCs,限制了可用性的参数选择,而基于推论1可以构造具有任意可用性的BLRCs.

图3给出了局部性r=2时,3种码的码率R随可用性t变化曲线以及Tamo等[12]提出的码率上界曲线.可以看出,当局部性r一定,随着可用性t的增大,码率同时呈减小的趋势;当可用性t取相同值时,推论1构造的BLRCs的码率高于基于直积码构造的BLRCs.虽然基于单纯形码构造的BLRCs的码率高于推论1构造的BLRCs,但是其可用性t具有较大的参数限制,推论1构造的BLRCs的参数选择更加灵活.

图3

图3   局部性r=2时,码率随可用性的变化

Fig.3   Code rate versus availability at locality r=2


由构造2可以构造任意局部性r>2和可用性t>2的BLRCs,将其与基于迹函数构造的BLRCs、基于超图构造的BLRCs、基于阵列LDPC码构造的BLRCs以及基于直积码构造的BLRCs进行比较.由表3可知,将码的局部性都取为(r,t),当t>2时,可知

1+1rt>1+tr

表3   构造2构造参数比较分析

Tab.3  Comparative analysis of parameters of Construction 2

构造方式nkrtR
构造2构造的BLRCs(r+1)(r+2)(r+t)t!r(r+1)(r+t-1)t!r>2t>2rr+t
基于迹函数构造的BLRCs[13]2m-12m-1-1m-1m2r-12r+1-1
基于超图构造的BLRCs[16]v+1rvtvvt(r-1)+1, r|vtrr+t
基于阵列LDPC码构造的BLRCs[14]r2+rt+1r2r(奇素数)t(偶数)r2r2+rt+1
基于直积码构造的BLRCs[12](r+1)trtrtrr+1t

新窗口打开| 下载CSV


因此基于直积码构造的BLRCs的码率

rr+1t=1r+1rt<11+tr=rr+t

经分析可知,构造2构造的BLRCs的码率总高于基于直积码构造的BLRCs.由于

rr+t>r2r2+rt+1

即构造2构造的BLRCs的码率总高于基于阵列LDPC码构造的BLRCs.基于迹函数构造出的BLRCs 需要满足可用性t=r+1,只能构造特定参数的BLRCs,具有较大的参数限制,并且仅能构造码率2r-12r+1-1<12的BLRCs.基于超图构造的BLRCs与构造2构造的BLRCs码率相同,但是超图存在的必要条件是超图的顶点数vt(r-1)+1并且r|vt,基于超图构造出的BLRCs具有极大的参数限制,主要针对特定参数的系统.

图4所示为当局部性r=11时,构造2构造的BLRCs 和几种典型BLRCs的码率随可用性的变化曲线,以及Tamo等[12]提出的码率上界曲线.当局部性r一定,随着可用性t的增加,码率降低.当可用性t取相同值时,构造2构造的BLRCs的码率尽管没有达到Tamo等[12]提出的码率上界,但高于基于直积码构造的BLRCs的码率.此外,当局部性 r=11时,基于阵列LDPC码仅能构造可用性t取偶数的BLRCs,具有一定的参数限制.基于迹函数构造的BLRCs的码率略高于构造2构造的 BLRCs,但是当局部性r=11时,基于迹函数仅能构造可用性 t=12的BLRCs,参数选择不够灵活.

图4

图4   局部性r=11时码率随可用性的变化

Fig.4   Code rate versus availability at locality r=11


当可用性t=4时,码率随局部性的变化曲线以及Tamo等[12]提出的码率上界曲线如图5所示.随着局部性r的增大,码率同时呈增大的趋势;当局部性r取相同值时,构造2构造的BLRCs的码率仍高于基于直积码构造的BLRCs.此外,基于迹函数构造的BLRCs的码率高于构造2构造的BLRCs,但是当可用性t=4时,基于迹函数仅能构造局部性 r=3的BLRCs,基于阵列LDPC码仅能构造局部性r取奇素数的BLRCs,具有一定的参数限制且码率略低于构造2构造的BLRCs.

图5

图5   可用性t=4时码率随局部性的变化

Fig.5   Code rate versus locality at availabity t=4


4 结语

局部修复码能够有效实现分布式存储系统对海量数据的高可靠、高效率存储.提出基于三角形结合方案及其扩展的BLRCs构造方法,可以得到具有任意(r,t)局部性BLRCs.运用三角形结合方案的结合关系,基于校验矩阵构造可用性t=2的BLRCs,进一步基于生成矩阵构造局部性r=2的BLRCs;为了使BLRCs的参数选择更加灵活,对基于三角形结合方案构造的BLRCs进行扩展,进一步构造能够实现任意局部性r>2和任意可用性t>2的BLRCs.构造的具有(r,2)局部性的BLRCs达到了最优码率界;构造的具有任意局部性r>2和可用性 t>2的BLRCs达到了最优最小距离界.分析表明,与基于近正则图构造的BLRCs以及基于直积码构造的BLRCs等相比,本文构造的BLRCs在码率上表现更优且参数选择更灵活.

参考文献

FANG W J, CHEN B, XIA S T, et al.

Singleton-optimal LRCs and perfect LRCs via cyclic codes

[C]// 2021 IEEE International Symposium on Information Theory. Melbourne, Australia: IEEE, 2021: 3261-3266.

[本文引用: 1]

YAVARI E, ESMAEILI M.

Locally repairable codes: Joint sequential-parallel repair for multiple node failures

[J]. IEEE Transactions on Information Theory, 2020, 66(1): 222-232.

[本文引用: 1]

PAPAILIOPOULOS D S, DIMAKIS A G.

Locally repairable codes

[J]. IEEE Transactions on Information Theory, 2014, 60(10): 5843-5855.

[本文引用: 1]

WANG A Y, ZHANG Z F, LIN D D.

Bounds for binary linear locally repairable codes via a sphere-packing approach

[J]. IEEE Transactions on Information Theory, 2019, 65(7): 4167-4179.

[本文引用: 1]

GOPALAN P, HUANG C, SIMITCI H, et al.

On the locality of codeword symbols

[J]. IEEE Transactions on Information Theory, 2012, 58(11): 6925-6934.

[本文引用: 2]

LUO Y, XING C P, YUAN C.

Optimal locally repairable codes of distance 3 and 4 via cyclic codes

[J]. IEEE Transactions on Information Theory, 2019, 65(2): 1048-1053.

[本文引用: 1]

JIN L F.

Explicit construction of optimal locally recoverable codes of distance 5 and 6 via binary constant weight codes

[J]. IEEE Transactions on Information Theory, 2019, 65(8): 4658-4663.

[本文引用: 1]

HAO J, XIA S T, SHUM K W, et al.

Bounds and constructions of locally repairable codes: Parity-check matrix approach

[J]. IEEE Transactions on Information Theory, 2020, 66(12): 7465-7474.

[本文引用: 1]

FU Q, GUO L B, LI R H, et al.

On the locality of some optimal ternary codes with dimension 6

[C]// 2020 13th International Symposium on Computational Intelligence and Design. Hangzhou, China: IEEE, 2020: 155-158.

[本文引用: 1]

CAI H, CHENG M Q, FAN C L, et al.

Optimal locally repairable systematic codes based on packings

[J]. IEEE Transactions on Communications, 2019, 67(1): 39-49.

[本文引用: 1]

RAWAT A S, PAPAILIOPOULOS D S, DIMAKIS A G, et al.

Locality and availability in distributed storage

[J]. IEEE Transactions on Information Theory, 2016, 62(8): 4481-4493.

[本文引用: 3]

TAMO I, BARG A.

Bounds on locally recoverable codes with multiple recovering sets

[C]// 2014 IEEE International Symposium on Information Theory. Honolulu, USA: IEEE, 2014: 691-695.

[本文引用: 9]

WANG A Y, ZHANG Z F, LIN D D.

Two classes of (r, t)-locally repairable codes

[C]// 2016 IEEE International Symposium on Information Theory. Barcelona, Spain:IEEE, 2016: 445-449.

[本文引用: 3]

HAO J, XIA S T, CHEN B.

On the single-parity locally repairable codes with availability

[C]// 2016 IEEE/CIC International Conference on Communications in China. Chengdu, China: IEEE, 2016: 1-4.

[本文引用: 2]

BALAJI S B, KUMAR P V.

Bounds on the rate and minimum distance of codes with availability

[C]// 2017 IEEE International Symposium on Information Theory. Aachen, Germany: IEEE, 2017: 3155-3159.

[本文引用: 4]

KIM J H, SONG H Y.

Hypergraph-based binary locally repairable codes with availability

[J]. IEEE Communications Letters, 2017, 21(11): 2332-2335.

[本文引用: 2]

TAN P, ZHOU Z C, SIDORENKO V, et al.

Two classes of optimal LRCs with information (r, t)-locality

[J]. Designs, Codes and Cryptography, 2020, 88(9): 1741-1757.

[本文引用: 1]

PRAKASH N, LALITHA V, BALAJI S B, et al.

Codes with locality for two erasures

[J]. IEEE Transactions on Information Theory, 2019, 65(12): 7771-7789.

[本文引用: 4]

BALAJI S B, PRASANTH K P, KUMAR P V.

Binary codes with locality for multiple erasures having short block length

[C]// 2016 IEEE International Symposium on Information Theory. Barcelona, Spain:IEEE, 2016: 655-659.

[本文引用: 3]

BAILEY R. Association schemes: Designed experiments, algebra, and combinatorics[M]. Cambridge: Cambridge University Press, 2004.

[本文引用: 2]

WANG J, SHEN K Q, LIU X Y, et al.

Construction of binary locally repairable codes with optimal distance and code rate

[J]. IEEE Communications Letters, 2021, 25(7): 2109-2113.

[本文引用: 1]

WANG A Y, ZHANG Z F, LIU M L.

Achieving arbitrary locality and availability in binary codes

[C]// 2015 IEEE International Symposium on Information Theory. Hong Kong, China: IEEE, 2015: 1866-1870.

[本文引用: 1]

/