CN104103060A - 一种稀疏模型中字典的表示方法和设备 - Google Patents

一种稀疏模型中字典的表示方法和设备 Download PDF

Info

Publication number
CN104103060A
CN104103060A CN201310115751.3A CN201310115751A CN104103060A CN 104103060 A CN104103060 A CN 104103060A CN 201310115751 A CN201310115751 A CN 201310115751A CN 104103060 A CN104103060 A CN 104103060A
Authority
CN
China
Prior art keywords
sample
dictionary
sparse
sample set
discrete
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310115751.3A
Other languages
English (en)
Other versions
CN104103060B (zh
Inventor
王宇
张宇
王栋
唐胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TONGLING HUIHENG ELECTRONIC TECHNOLOGY Co.,Ltd.
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310115751.3A priority Critical patent/CN104103060B/zh
Publication of CN104103060A publication Critical patent/CN104103060A/zh
Application granted granted Critical
Publication of CN104103060B publication Critical patent/CN104103060B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明实施例提供一种稀疏模型中字典的表示方法和设备,涉及信号处理领域,通过利用离散字典的求解过程降低重构误差,并通过求解过程得到明确的样本类别信息。该方法包括:根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个信号样本进行统计组成新的信号;输出通过统计所述样本子集得到的所述新的信号。本发明的实施例应用于数字信号处理和图像处理技术。

Description

一种稀疏模型中字典的表示方法和设备
技术领域
本发明涉及信号处理领域,尤其涉及一种稀疏模型中字典的表示方法和设备。
背景技术
在信号技术发展中,传统信号处理方法面临着大量的数据储存和数据传输的问题,对于处理大量数据存储和数据传输的问题,随着压缩感知理论的提出以远低于传统奈奎斯特采样率的方式对信号进行处理,其中,压缩感知是在一个合适的过完备基元集上获取和重构信号的理论。这里输入信号只需若干个基元就可以被准确重构,所以重构信号在过完备基元集上可以求得稀疏编码,通过求得稀疏编码,由信号集合生成过完备字典的过程为稀疏建模。所述稀疏模型包括所述稀疏编码和所述由信号集合生成的过完备字典。
由于稀疏模型中重构信号出现的重构误差大,为了减小重构误差,在字典学习上现有技术大体分为两大类:第一,人工选择样本集合作为冗余的大字典,其中,人工选择大量高质量的信号样本作为字典,从而保证稀疏编码具有较好的分类能力,但是由于人工选择的方式不能保证减少重构误差,而且过大的字典会导致过高的计算复杂度和存储负担,并且由于无法选择有效的样本子集从而选择大量的样本作为字典,进而增加计算和存储的负担;
第二,采用连续的方法求解相对紧凑的字典,其中,连续方法的目标是降低重构误差,通过求解得到误差矩阵,然后采用矩阵分解方法求解特征向量作为字典基元来减少误差,进而将重构误差作为目标函数中的一项,采用随机梯度下降等方法,求解可以降低误差的字典基元。但是,由于连续字典中的基元不属于样本集合,所以可解释性差也不具有语义;在连续字典上得到的稀疏编码不具有明确的类别信息。
发明内容
本发明的实施例提供一种稀疏模型中字典的表示方法和设备,通过利用离散字典的求解过程降低重构误差,并通过求解过程得到明确的样本类别信息。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种稀疏模型中字典的表示方法,包括:
根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;
根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;
将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个信号样本进行统计组成新的信号;
输出通过统计所述样本子集得到的所述新的信号。
在第一种可能的实现方式中,结合第一方面具体包括,所述稀疏模型具体表现为: min { d 1 , d 2 , . . . d k } , a Σ i = 1 N | | x i - Σ j d j a i j | | 2 2 + λ | | a i | | 1 , 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为所述样本子集中的样本,xi为组成所述样本集合X的单个样本,N为样本个数,系数λ用于限定所述稀疏编码的稀疏程度,其中,所述稀疏程度为所述稀疏编码中的非零元个数。
在第二种可能的实现方式中,结合第一方面或第一方面中的第一种可能的实现方式具体包括,在所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码之前,所述方法还包括:
设定循环总数为T,最大误差值为eta,所述循环总数T为所述稀疏模型循环迭代计算的循环次数,所述最大误差值eta为通过所述稀疏模型计算重构误差时设定的误差值的阈值,其中,所述循环总数或所述最大误差值为循环迭代计算结束的判断条件;
将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,所述样本集归一化为将所述样本集中的样本通过平方求和化为常量1,所述样本集{x1,x2,……,xN}归一化表示为所述样本个数K为所述样本集中任意选择的样本个数。
在第三种可能的实现方式中,结合第一方面或第一方面包含的任一种可能的实现方式具体包括,所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码,包括:
设定所述离散字典为已知条件,并将所述离散字典带入所述稀疏模型的表达式 min a Σ i = 1 N | | x i - D a i | | 2 2 + λ | | a i | | 1 ;
根据所述表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,所述N个样本的稀疏编码为所述稀疏编码的对应多个样本的编码个数,所述稀疏编码为{a1,a2,……,aN}。
在第四种可能的实现方式中,结合第一方面或第一方面包含的任一种可能的实现方式具体包括,所述将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,包括:
设定所述稀疏编码为已知条件,并将所述稀疏编码代入所述稀疏模型的表达式中得到计算离散字典的表达式,所述计算离散字典的表达式为当{d1,d2,...,dk}∈X时,所述稀疏编码为A={a1,a2,……,aN},其中,为所述稀疏编码设定为已知条件后代入所述稀疏模型表达式用于求解所述离散字典的范式,所述X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算所述离散字典的表达式中的代换为E,使得所述计算离散字典的表达式转换为 f ( d k ) = min { d k } | | X - Σ i ≠ k d i A - d k A | | 2 = min { d k } | | E - d k A | | 2 并计算离散字典,其中X为已知的样本集合,A为所述稀疏编码,di为已知字典基元,E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号,为X-DA在字典基元di依次代入后扩展得到。
在第五种可能的实现方式中,结合第四种可能的实现方式具体包括,所述当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,包括:
根据所述稀疏编码选取引用所述第K个字典基元的样本子集,所述样本子集为
将所述样本子集中每个样本代入所述计算离散字典的表达式的转换式计算所述样本在所述转换式中的误差值,并将所述误差值与当前误差值进行比较,所述当前误差值为
若所述误差值大于所述当前误差值,则舍弃所述误差值,并在所述样本子集中除去所述误差值对应的样本;
或者,
若所述误差值小于所述当前误差值,则保留所述样本对应的误差值,并更新为第一当前误差值,且在所述样本子集中除去所述误差值对应的样本,循环将所述样本子集中的样本带入所述转换式中计算误差值,直至所述样本子集为空集。
第二方面,提供一种电子设备,包括:
采集单元,用于根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;
计算单元,用于根据所述采集单元采集的所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;
所述计算单元,还用于将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个信号样本进行统计组成新的信号;
发送单元,用于输出通过统计所述样本子集得到的所述新的信号。
在第一种可能的实现方式中,结合第二方面具体包括,所述稀疏模型具体表现为: min { d 1 , d 2 , . . . d k } , a Σ i = 1 N | | x i - Σ j d j a i j | | 2 2 + λ | | a i | | 1 , 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为所述样本子集中的样本,xi为组成所述样本集合X的单个样本,N为样本个数,系数λ用于限定所述稀疏编码的稀疏程度,其中,所述稀疏程度为所述稀疏编码中的非零元个数。
在第二种可能的实现方式中,结合第二方面或第一种可能的实现方式具体包括,所述设备还包括:
设置单元,用于在根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码之前,设定循环总数为T,最大误差值为eta,所述循环总数T为所述稀疏模型循环迭代计算的循环次数,所述最大误差值eta为通过所述稀疏模型计算重构误差时设定的误差值的阈值,其中,所述循环总数或所述最大误差值为计算循环迭代结束的判断条件;
选取单元,用于将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,所述样本集归一化为将所述样本集中的样本通过平方求和化为常量1,所述样本集{x1,x2,……,xN}归一化表示为所述样本个数K为所述样本集中任意选择的样本个数。
在第三种可能的实现方式中,结合第二方面或第二方面包含的任一种可能的实现方式具体包括,所述计算单元包括:
计算子单元,用于设定所述离散字典为已知条件,并将所述离散字典带入所述稀疏模型的表达式 min a Σ i = 1 N | | x i - D a i | | 2 2 + λ | | a i | | 1 ;
所述计算子单元,还用于根据所述表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,所述N个样本的稀疏编码为所述稀疏编码的对应多个样本的编码个数,所述稀疏编码为{a1,a2,……,aN}。
在第四种可能的实现方式中,结合第二方面或第二方面包含的任一种可能的实现方式具体包括,所述计算单元,还包括:
转换子单元,用于设定所述稀疏编码为已知条件,并将所述稀疏编码代入所述稀疏模型的表达式中得到计算离散字典的表达式,所述计算离散字典的表达式为当{d1,d2,...,dk}∈X时,所述稀疏编码为A={a1,a2,……,aN},其中,为所述稀疏编码设定为已知条件后代入所述稀疏模型表达式用于求解所述离散字典的范式,所述X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
所述转换子单元,还用于当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算所述离散字典的表达式中的代换为E,使得所述计算离散字典的表达式转换为 f ( d k ) = min { d k } | | X - Σ i ≠ k d i A - d k A | | 2 = min { d k } | | E - d k A | | 2 并计算离散字典,其中X为已知的样本集合,A为所述稀疏编码,di为已知字典基元,E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号,为X-DA在字典基元di依次代入后扩展得到。
在第五种可能的实现方式中,结合第四种可能的实现方式具体包括,所述计算单元,具体用于根据所述稀疏编码选取引用所述第K个字典基元的样本子集,所述样本子集为
将所述样本子集中每个样本代入所述计算离散字典的表达式的转换式计算所述样本在所述转换式中的误差值,并将所述误差值与当前误差值进行比较,所述当前误差值为
若所述误差值大于所述当前误差值,则舍弃所述误差值,并在所述样本子集中除去所述误差值对应的样本;
或者,
若所述误差值小于所述当前误差值,则保留所述样本对应的误差值,并更新为第一当前误差值,且在所述样本子集中除去所述误差值对应的样本,循环将所述样本子集中的样本带入所述转换式中计算误差值,直至所述样本子集为空集。
本发明实施例提供的稀疏模型中字典的表示方法和设备,通过计算稀疏模型得到稀疏编码,然后通过迭代计算根据该稀疏编码得到离散字典,其中通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过学习离散字典进而解决了重构误差大的问题,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种稀疏模型中字典的表示方法的流程示意图;
图2为本发明实施例提供的另一种稀疏模型中字典的表示方法的流程示意图;
图3为本发明实施例提供的一种稀疏模型中字典的表示方法的技术效果示意图;
图4为本发明实施例提供的一种电子设备的结构示意图;
图5为本发明实施例提供的另一种电子设备的结构示意图;
图6为本发明实施例提供的又一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的一种稀疏模型中字典的表示方法,参照图1所示,具体包括以下流程:
101、电子设备根据接收的信号采集信号样本,并通过该信号样本的数据分布特征建立稀疏模型。
其中,稀疏模型具体表现为: min { d 1 , d 2 , . . . d k } , a Σ i = 1 N | | x i - Σ j d j a i j | | 2 2 + λ | | a i | | 1 , 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,为稀疏编码的j次方,{d1,d2,...,dk}为样本集合X的样本子集,dj为样本子集中的样本,xi为组成样本集合X的单个样本,N为样本个数,系数λ用于限定稀疏编码的稀疏程度,这里稀疏程度为稀疏编码中的非零元个数。
102、电子设备根据该信号样本通过计算稀疏模型得到信号的稀疏编码。
这里电子设备通过采用最小绝对收缩选择算子Lasso(LeastAbsolute Shrinkage and Selection Operator)算法求解稀疏编码,首先归一化样本集{x1,x2,……,xN},使得并任意选择K个样本作为初始化字典D,并通过固定字典D,将
变换为再由最小角回归Lasso-LARS算法(Least Angle Regression)求解变换式,分别得到N个样本的稀疏编码{a1,a2,……,aN}。
本发明实施例提供的稀疏模型的表达式中的||·||为范式,本发明实施例提到的范式为一范式与二范式。
103、电子设备将该稀疏编码迭代入稀疏模型计算得到离散字典,通过循环迭代离散字典处理得到至少一个信号样本的样本子集,直至满足预定的判断条件时终止循环迭代,并将至少一个信号样本进行统计组成新的信号。
其中,该离散字典为样本集合X中的样本子集D,这里样本子集D为字典基元dj组成的。
这里通过固定稀疏编码A={a1,a2,……,aN},将A迭代回得到求解离散字典的转换式其中{d1,d2,...,dk}∈X。通过将字典基元di更新至第K个,并固定其他字典基元,将转换式中的代换为E再次转换得到 f ( d k ) = min { d k } | | X - Σ i ≠ k d i A - d k A | | 2 = min { d k } | | E - d k A | | 2 .
具体的,E中A为固定的稀疏编码矩阵,字典基元di也是固定值,X是已知样本集合,故E可以通过计算得知,这里通过更新字典基元di至字典基元dk解得离散字典,即通过字典基元对应样本子集筛选求解的离散字典中的字典基元,使得求解得出的离散字典能够保留样本的数据分布特征,且能够得到稀疏编码并具有明确的类别信息。
104、电子设备输出通过统计样本子集得到的新的信号。
本发明实施例提供的稀疏模型中字典的表示方法,通过计算稀疏模型得到稀疏编码,然后通过迭代计算根据该稀疏编码得到离散字典,其中通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过学习离散字典进而解决了重构误差大的问题,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
具体的,以下结合具体的实施例进行说明。
可以在图1所示的实施例的基础上,参照图2所示,本发明的实施例提供了一种稀疏模型中字典的表示方法,主要包括:电子设备通过计算稀疏模型得到稀疏编码,再根据稀疏编码迭代回稀疏模型表达式计算得到离散字典;参照图2所示,为电子设备通过计算得到稀疏编码,再通过迭代根据计算该稀疏编码得到离散字典的过程,具体步骤如下:
201、电子设备根据接收的信号采集信号样本,并通过该信号样本的数据分布特征建立稀疏模型。
其中,稀疏模型具体表现为: min { d 1 , d 2 , . . . d k } , a Σ i = 1 N | | x i - Σ j d j a i j | | 2 2 + λ | | a i | | 1 , 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,为稀疏编码的j次方,{d1,d2,...,dk}为样本集合X的样本子集,dj为样本子集中的样本,xi为组成样本集合X的单个样本,N为样本个数,系数λ用于限定稀疏编码的稀疏程度,这里稀疏程度为稀疏编码中的非零元个数。
202、电子设备设定循环总数为T,最大误差值为eta。
其中,该循环总数T为稀疏模型循环迭代计算的循环次数,该最大误差值eta为通过稀疏模型计算重构误差时设定的误差值的阈值,其中,循环总数或最大误差值为计算结束的判定条件。
这里预先设定循环总数和最大误差值,用于判定在迭代计算离散字典时,多次为离散字典选取样本提供判定标准,当循环迭代的次数达到T次时,计算结束;或者,当选取的样本的误差值小于最大误差值eta时,计算结束。
203、电子设备将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典。
其中,该样本集归一化为将样本集中的样本通过平方求和化为常量1,该样本集{x1,x2,……,xN}归一化表示为样本个数K为该样本集中任意选择的样本个数。
这里本发明实施例计算离散字典采用先固定一离散字典再计算出稀疏编码,再由稀疏编码迭代回原式进行变换计算得到离散字典。故步骤203在进行计算稀疏编码前首先确定初始化字典,使得通过固定初始化字典这一变量计算稀疏编码。
204、电子设备根据该信号样本通过计算稀疏模型得到信号的稀疏编码。
这里电子设备通过采用最小绝对收缩选择算子Lasso(LeastAbsolute Shrinkage and Selection Operator)算法求解稀疏编码,首先归一化样本集{x1,x2,……,xN},使得并任意选择K个样本作为初始化字典D,并通过设定字典D为已知条件,将 min { d 1 , d 2 , . . . d k } , a Σ i = 1 N | | x i - Σ j d j a i j | | 2 2 + λ | | a i | | 1 变换为 min a Σ i = 1 N | | x i - D a i | | 2 2 + λ | | a i | | 1 , 再由最小角回归Lasso-LARS算法(Least Angle Regression)求解变换式,分别得到N个样本的稀疏编码{a1,a2,……,aN},其中,N个样本的稀疏编码为该稀疏编码的对应多个样本的编码个数,。
本发明实施例提供的稀疏模型的表达式中的||·||为范式,本发明实施例提到的范式为一范式与二范式。
在求解过程中,设定的λ值越大,稀疏编码中的非零项越少,重构误差也越大。故在本发明实施例提供设定的系数λ为0.1~0.25范围内的任一值用于限定该稀疏编码的稀疏程度,其中,当系数λ为0.15时,稀疏模型的分类能力达到峰值,具体的,系数λ波动通常在0.15正负误差在0.05之间计算得到峰值,这里稀疏程度为该稀疏编码中的非零元个数。这里不仅可以得到合适的稀疏编码还能够减小重构误差,具体的当使用Lasso-LARS算法计算稀疏编码时,会为该字典基元分配系数,该系数通常较小,使得重构后的样本误差位于该字典基元与其他字典基元的等分线上,循环分配过程,知道选择足够的字典基元来重构样本。
当稀疏编码的非零元个数远远小于字典基元的个数时,Lasso算法是稳定且收敛的,此时通过控制λ的值大于等于0.01则可以保证稀疏编码的稀疏程度。
205、电子设备将该稀疏编码迭代入稀疏模型计算得到离散字典,通过循环迭代离散字典处理得到至少一个信号样本的样本子集,直至满足预定的判断条件时终止循环迭代,并将至少一个信号样本进行统计组成新的信号。
其中,该离散字典为样本集合X中的样本子集D,这里样本子集D为字典基元dj组成的。
这里通过设定稀疏编码A={a1,a2,……,aN}为已知条件,将A迭代回得到求解离散字典的转换式,当{d1,d2,...,dk}∈X时, f ( D ) = min { d 1 , d 2 , . . . , d k } ∈ D | | X - DA | | 2 , 其中, min { d 1 , d 2 , . . . d k } ∈ D | | X - DA | | 2 为稀疏编码设定为已知条件后代入稀疏模型表达式用于求解所述离散字典的范式,X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合。通过将字典基元di更新至第K个,并设定其他字典基元为已知条件,将转换式中的代换为E再次转换得到 f ( d k ) = min { d k } | | X - Σ i ≠ k d i A - d k A | | 2 = min { d k } | | E - d k A | | 2 并计算离散字典,其中X为已知的样本集合,A为稀疏编码,di为字典基元,E-dkA用于通过筛选样本计算得到离散字典,以便构成新的输出信号,为X-DA在字典基元di依次代入后扩展得到。
具体的,E中A为固定的稀疏编码矩阵,字典基元di也是固定值,X是已知样本集合,故E可以通过计算得知,这里通过更新字典基元di至字典基元dk解得离散字典,即通过字典基元对应样本子集筛选求解的离散字典中的字典基元,使得求解得出的离散字典能够保留样本的数据分布特征,且能够得到稀疏编码并具有明确的类别信息。
进一步的,当样本子集中的字典基元di依次代入计算离散字典的表达式,并更新至第K个字典基元时,包括:
205a、电子设备根据稀疏编码选取引用第K个字典基元的样本子集。
其中,该样本子集为
205b、电子设备将样本子集中每个样本代入计算离散字典的表达式的转换式计算该样本在转换式中的误差值,并将该误差值与当前误差值进行比较。
其中,该当前误差值表示为‖E-dkA||2
205c、若误差值大于当前误差值,则舍弃误差值,并在样本子集中除去误差值对应的样本。
或者,
205d、若误差值小于当前误差值,则保留样本对应的误差值,并更新为第一当前误差值,且在样本子集中除去误差值对应的样本,循环将该样本子集中的样本带入转换式中计算误差值,直至样本子集为空集。
具体的,本发明实施例提供的通过使用Lasso算法计算离散字典是通过循环迭代实现的,即当步骤204根据固定的离散字典计算稀疏编码后,进一步的通过步骤205固定稀疏编码计算离散字典得到组成字典的字典基元,然后再进行步骤204固定新的离散字典求解稀疏编码进而通过步骤205得到新的字典基元如此循环,直至得到能够对应已知样本集合X的离散字典。
206、电子设备输出通过统计样本子集得到的新的信号。
这里本发明实施例提供计算离散字典的方法中,由于离散字典中的字典基元来自样本集合X,故在样本选取的时候总会存在与字典基元dk相同的样本xj。根据Lasso算法,样本集合X中的xj会选择dk,故在更新dk时,如果存在其它样本不能减少e的样本,则xj会被选为字典基元,且e不变;相反的,如果存在其他样本能够减少e的样本,则新样本被保存,e减小。其中,在字典更新的过程中,重构误差会保持不变或减少。
其中,本发明实施例提供的稀疏模型中字典的表示方法还可以通过正交匹配追踪算法(Orthogonal Matching Pursuit,OMP)算法实现,由于OMP算法更适合正交基元字典,且本发明实施例提供实现稀疏模型中字典的表示方法的处理对象是过完备字典,故使用Lasso算法使得到的过完备字典更稳定更准确。
本发明实施例提供的稀疏模型中字典的表示方法,通过计算稀疏模型字典得到稀疏编码,并通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过迭代计算根据该稀疏编码得到离散字典,且在计算离散字典部分通过对样本的选取使得重构误差保持不变或者减少,从而整体的减小了重构误差,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
具体的,本发明实施例提供的稀疏模型中字典的表示方法具体参照图3所示,以三维样本为例,从100个三维数据集合中学习得到一个3×10的离散字典,左图为样本集空间部分,右图为离散字典的字典基元分布(为右图所示的叉点),其中,该离散字典中的基元为样本子集。
这里通过计算稀疏模型中的离散字典保留了样本集空间的数据分布特征,即在处理接收到的信号后在显示该信号时能够保证原有信号的特征。
本发明实施例提供的稀疏模型中字典的表示方法,通过对离散字典的分析发现通过学习离散字典可以保留信号样本的数据分布特征,并由于离散字典中没有混淆的字典基元,使得在离散字典上能够得到的稀疏编码有明确的类别信息。
本发明实施例提供一种电子设备3,该电子设备具体为信号处理***中任一种电子设备,如计算机、笔记本电脑等在信号处理***中任一能够实现稀疏模型中字典的表示方法的设备,以可以实现本发明的实施例所提供的上述任一稀疏模型中字典的表示方法为准,参照图4所示,包括:
采集单元31,用于根据接收的信号采集信号样本,并通过该信号样本的数据分布特征建立稀疏模型;
计算单元32,用于根据采集单元采集的信号样本通过计算稀疏模型得到该信号的稀疏编码;
计算单元32,还用于将该稀疏编码迭代入稀疏模型计算得到离散字典,通过循环迭代离散字典处理得到至少一个信号样本的样本子集,直至满足预定的判断条件时终止循环迭代,并将至少一个信号样本进行统计组成新的信号;
发送单元33,用于输出通过统计样本子集得到的新的信号。
本发明实施例提供的电子设备,通过计算稀疏模型得到稀疏编码,然后通过迭代计算根据该稀疏编码得到离散字典,其中通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过学习离散字典进而解决了重构误差大的问题,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
进一步的,稀疏模型具体表现为: min { d 1 , d 2 , . . . d k } , a Σ i = 1 N | | x i - Σ j d j a i j | | 2 2 + λ | | a i | | 1 , 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为样本子集中的样本,x为组成样本集合X的单个样本,N为样本个数,系数λ用于限定稀疏编码的稀疏程度,其中,该稀疏程度为稀疏编码中的非零元个数。
可选的,参照图5所示,电子设备3还包括:
设置单元34,用于在根据信号样本通过计算稀疏模型得到信号的稀疏编码之前,设定循环总数为T,最大误差值为eta,该循环总数T为稀疏模型循环迭代计算的循环次数,最大误差值eta为通过稀疏模型计算重构误差时设定的误差值的阈值,其中,循环总数或最大误差值为计算结束的判定条件;
选取单元35,用于将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,该样本集归一化为将样本集中的样本通过平方求和化为常量1,该样本集{x1,x2,……,xN}归一化表示为该样本个数K为样本集中任意选择的样本个数。
可选的,参照图6所示,计算单元32包括:
计算子单元321,用于设定离散字典为已知条件,并将离散字典带入稀疏模型的表达式 min a Σ i = 1 N | | x i - D a i | | 2 2 + λ | | a i | | 1 ;
计算子单元321,还用于根据表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,N个样本的稀疏编码为稀疏编码的对应多个样本的编码个数,稀疏编码为{a1,a2,……,aN}。
进一步的,参照图6所示,计算单元32,还包括:
转换子单元322,用于设定稀疏编码为已知条件,并将稀疏编码代入稀疏模型的表达式中得到计算离散字典的表达式,计算离散字典的表达式为当{d1,d2,...,dk}∈X时,稀疏编码为A={a1,a2,……,aN},其中,为稀疏编码设定为已知条件后代入稀疏模型表达式用于求解离散字典的范式,X为已知的样本集合,D为离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
转换子单元322,还用于当该样本子集中的字典基元di依次代入计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算离散字典的表达式中的代换为E,使得该计算离散字典的表达式转换为 f ( d k ) = min { d k } | | X - Σ i ≠ k d i A - d k A | | 2 = min { d k } | | E - d k A | | 2 并计算离散字典,其中X为已知的样本集合,A为稀疏编码,di为已知字典基元,E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号,为X-DA在字典基元di依次代入后扩展得到。
进一步的,计算单元32,具体用于根据稀疏编码选取引用第K个字典基元的样本子集,样本子集为
将样本子集中每个样本代入计算离散字典的表达式的转换式计算样本在转换式中的误差值,并将误差值与当前误差值进行比较,该当前误差值为||E-dkA||2
若误差值大于当前误差值,则舍弃该误差值,并在样本子集中除去该误差值对应的样本;
或者,
若误差值小于当前误差值,则保留样本对应的误差值,并更新为第一当前误差值,且在该样本子集中除去误差值对应的样本,循环将样本子集中的样本带入转换式中计算误差值,直至样本子集为空集。
本发明实施例提供的电子设备,通过计算稀疏模型字典得到稀疏编码,并通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过迭代计算根据该稀疏编码得到离散字典,且在计算离散字典部分通过对样本的选取使得重构误差保持不变或者减少,从而整体的减小了重构误差,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种稀疏模型中字典的表示方法,其特征在于,包括:
根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;
根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;
将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个信号样本进行统计组成新的信号;
输出通过统计所述样本子集得到的所述新的信号。
2.根据权利要求1所述的方法,其特征在于,所述稀疏模型具体表现为: min { d 1 , d 2 , . . . d k } , a Σ i = 1 N | | x i - Σ j d j a i j | | 2 2 + λ | | a i | | 1 , 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,di为所述样本子集中的样本,xi为组成所述样本集合X的单个样本,N为样本个数,系数λ用于限定所述稀疏编码的稀疏程度,其中,所述稀疏程度为所述稀疏编码中的非零元个数。
3.根据权利要求1或2所述的方法,其特征在于,在所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码之前,所述方法还包括:
设定循环总数为T,最大误差值为eta,所述循环总数T为所述稀疏模型循环迭代计算的循环次数,所述最大误差值eta为通过所述稀疏模型计算重构误差时设定的误差值的阈值,其中,所述循环总数或所述最大误差值为循环迭代计算结束的判断条件;
将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,所述样本集归一化为将所述样本集中的样本通过平方求和化为常量1,所述样本集{x1,x2,……,xN}归一化表示为所述样本个数K为所述样本集中任意选择的样本个数。
4.根据权利要求1~3任一所述的方法,其特征在于,所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码,包括:
设定所述离散字典为已知条件,并将所述离散字典带入所述稀疏模型的表达式 min a Σ i = 1 N | | x i - D a i | | 2 2 + λ | | a i | | 1 ;
根据所述表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,所述N个样本的稀疏编码为所述稀疏编码的对应多个样本的编码个数,所述稀疏编码为{a1,a2,……,aN}。
5.根据权利要求1~4任一所述的方法,其特征在于,所述将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,包括:
设定所述稀疏编码为已知条件,并将所述稀疏编码代入所述稀疏模型的表达式中得到计算离散字典的表达式,所述计算离散字典的表达式为当{d1,d2,...,dk}∈X时,所述稀疏编码为A={a1,a2,……,aN},其中,为所述稀疏编码设定为已知条件后代入所述稀疏模型表达式用于求解所述离散字典的范式,所述X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算所述离散字典的表达式中的代换为E,使得所述计算离散字典的表达式转换为 f ( d k ) = min { d k } | | X - Σ i ≠ k d i A - d k A | | 2 = min { d k } | | E - d k A | | 2 并计算离散字典,其中X为已知的样本集合,A为所述稀疏编码,di为已知字典基元,所述E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号,所述为X-DA在字典基元di依次代入后扩展得到。
6.根据权利要求5所述的方法,其特征在于,所述当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,包括:
根据所述稀疏编码选取引用所述第K个字典基元的样本子集,所述样本子集为
将所述样本子集中每个样本代入所述计算离散字典的表达式的转换式计算所述样本在所述转换式中的误差值,并将所述误差值与当前误差值进行比较,所述当前误差值为‖E-dkA||2
若所述误差值大于所述当前误差值,则舍弃所述误差值,并在所述样本子集中除去所述误差值对应的样本;
或者,
若所述误差值小于所述当前误差值,则保留所述样本对应的误差值,并更新为第一当前误差值,且在所述样本子集中除去所述误差值对应的样本,循环将所述样本子集中的样本带入所述转换式中计算误差值,直至所述样本子集为空集。
7.一种电子设备,其特征在于,包括:
采集单元,用于根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;
计算单元,用于根据所述采集单元采集的所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;
所述计算单元,还用于将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个信号样本进行统计组成新的信号;
发送单元,用于输出通过统计所述样本子集得到的所述新的信号。
8.根据权利要求7所述的设备,其特征在于,所述稀疏模型具体表现为: min { d 1 , d 2 , . . . d k } , a Σ i = 1 N | | x i - Σ j d j a i j | | 2 2 + λ | | a i | | 1 , 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为所述样本子集中的样本,xi为组成所述样本集合X的单个样本,N为样本个数,系数λ用于限定所述稀疏编码的稀疏程度,其中,所述稀疏程度为所述稀疏编码中的非零元个数。
9.根据权利要求7或8所述的设备,其特征在于,所述设备还包括:
设置单元,用于在根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码之前,设定循环总数为T,最大误差值为eta,所述循环总数T为所述稀疏模型循环迭代计算的循环次数,所述最大误差值eta为通过所述稀疏模型计算重构误差时设定的误差值的阈值,其中,所述循环总数或所述最大误差值为循环迭代计算结束的判断条件;
选取单元,用于将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,所述样本集归一化为将所述样本集中的样本通过平方求和化为常量1,所述样本集{x1,x2,……,xN}归一化表示为所述样本个数K为所述样本集中任意选择的样本个数。
10.根据权利要求7~9任一所述的设备,其特征在于,所述计算单元包括:
计算子单元,用于设定所述离散字典为已知条件,并将所述离散字典带入所述稀疏模型的表达式
所述计算子单元,还用于根据所述表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,所述N个样本的稀疏编码为所述稀疏编码的对应多个样本的编码个数,所述稀疏编码为{a1,a2,……,aN}。
11.根据权利要求7~10任一所述的设备,其特征在于,所述计算单元,还包括:
转换子单元,用于设定所述稀疏编码为已知条件,并将所述稀疏编码代入所述稀疏模型的表达式中得到计算离散字典的表达式,所述计算离散字典的表达式为当{d1,d2,...,dk}∈X时,所述稀疏编码为A={a1,a2,……,aN},其中,为所述稀疏编码设定为已知条件后代入所述稀疏模型表达式用于求解所述离散字典的范式,所述X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
所述转换子单元,还用于当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算所述离散字典的表达式中的代换为E,使得所述计算离散字典的表达式转换为 f ( d k ) = min { d k } | | X - Σ i ≠ k d i A - d k A | | 2 = min { d k } | | E - d k A | | 2 并计算离散字典,其中X为已知的样本集合,A为所述稀疏编码,di为已知字典基元,E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号,为X-DA在字典基元di依次代入后扩展得到。
12.根据权利要求11所述的设备,其特征在于,所述计算单元,具体用于根据所述稀疏编码选取引用所述第K个字典基元的样本子集,所述样本子集为
将所述样本子集中每个样本代入所述计算离散字典的表达式的转换式计算所述样本在所述转换式中的误差值,并将所述误差值与当前误差值进行比较,所述当前误差值为‖E-dkA||2
若所述误差值大于所述当前误差值,则舍弃所述误差值,并在所述样本子集中除去所述误差值对应的样本;
或者,
若所述误差值小于所述当前误差值,则保留所述样本对应的误差值,并更新为第一当前误差值,且在所述样本子集中除去所述误差值对应的样本,循环将所述样本子集中的样本带入所述转换式中计算误差值,直至所述样本子集为空集。
CN201310115751.3A 2013-04-03 2013-04-03 一种稀疏模型中字典的表示方法和设备 Active CN104103060B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310115751.3A CN104103060B (zh) 2013-04-03 2013-04-03 一种稀疏模型中字典的表示方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310115751.3A CN104103060B (zh) 2013-04-03 2013-04-03 一种稀疏模型中字典的表示方法和设备

Publications (2)

Publication Number Publication Date
CN104103060A true CN104103060A (zh) 2014-10-15
CN104103060B CN104103060B (zh) 2017-09-12

Family

ID=51671184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310115751.3A Active CN104103060B (zh) 2013-04-03 2013-04-03 一种稀疏模型中字典的表示方法和设备

Country Status (1)

Country Link
CN (1) CN104103060B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112203089A (zh) * 2020-12-03 2021-01-08 中国科学院自动化研究所 基于稀疏编码的码率控制的图像压缩方法、***及装置
CN113297879A (zh) * 2020-02-23 2021-08-24 深圳中科飞测科技股份有限公司 测量模型组的获取方法、测量方法及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102354395A (zh) * 2011-09-22 2012-02-15 西北工业大学 基于稀疏表示的模糊图像盲复原方法
CN102708576A (zh) * 2012-05-18 2012-10-03 西安电子科技大学 基于结构字典的分块图像压缩感知重建方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102354395A (zh) * 2011-09-22 2012-02-15 西北工业大学 基于稀疏表示的模糊图像盲复原方法
CN102708576A (zh) * 2012-05-18 2012-10-03 西安电子科技大学 基于结构字典的分块图像压缩感知重建方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
向馗等: "主元分析中的稀疏性", 《电子学报》 *
王春光: "基于稀疏分解的心电信号特征波检测及心电数据压缩", 《中国博士学位论文全文数据库 医药卫生科技辑》 *
顾莹: "基于压缩感知的分布式视频编码及其图像超分辨率重建研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297879A (zh) * 2020-02-23 2021-08-24 深圳中科飞测科技股份有限公司 测量模型组的获取方法、测量方法及相关设备
CN112203089A (zh) * 2020-12-03 2021-01-08 中国科学院自动化研究所 基于稀疏编码的码率控制的图像压缩方法、***及装置

Also Published As

Publication number Publication date
CN104103060B (zh) 2017-09-12

Similar Documents

Publication Publication Date Title
CN108337000B (zh) 用于转换到较低精度数据格式的自动方法
CN111652368B (zh) 一种数据处理方法及相关产品
US20190156215A1 (en) Systems and methods for exchange of data in distributed training of machine learning algorithms
Nagahara et al. Sparse packetized predictive control for networked control over erasure channels
CN112418482B (zh) 一种基于时间序列聚类的云计算能耗预测方法
CN111488986A (zh) 一种模型压缩方法、图像处理方法以及装置
Liang et al. Mgard+: Optimizing multilevel methods for error-bounded scientific data reduction
Raposo et al. Positnn: Training deep neural networks with mixed low-precision posit
Vershynin Four lectures on probabilistic methods for data science
Yin et al. Batude: Budget-aware neural network compression based on tucker decomposition
CN115017178A (zh) 数据到文本生成模型的训练方法和装置
CN115809705A (zh) 基于量子计算的流体动力学计算***及量子计算机
CN104468272A (zh) 流量矩阵的估计方法和装置
CN104103060A (zh) 一种稀疏模型中字典的表示方法和设备
Wivoda et al. Application of discretized light-cone quantization to a model field theory in 3+ 1 dimensions
WO2020223850A1 (en) System and method for quantum circuit simulation
CN116011682A (zh) 一种气象数据预测方法、装置、存储介质及电子装置
CN115688905A (zh) 对深度学习模型进行加速处理的方法
CN114125070B (zh) 一种量化压缩的通信方法、***、电子装置及存储介质
Garcia-Donoro et al. Higher-order finite element electromagnetics code for HPC environments
CN114970822A (zh) 一种神经网络模型量化方法、***、设备及计算机介质
Zeng et al. Slice-based online convolutional dictionary learning
DE102018101166A1 (de) Automatisierte verfahren zur umwandlung in ein datenformat geringerer genauigkeit
CN115169426A (zh) 一种基于相似性学习融合模型的异常检测方法及***
Zhu et al. Stochastic parallel block coordinate descent for large-scale saddle point problems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20171214

Address after: 510640 Guangdong City, Tianhe District Province, No. five, road, public education building, unit 371-1, unit 2401

Patentee after: Guangdong Gaohang Intellectual Property Operation Co., Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: Huawei Technologies Co., Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20171219

Address after: 402260 Chongqing city Jiangjin Jijiang 90 Minsheng Road No. 1-7-2 Building 1

Patentee after: Chongqing GA doll Technology Co., Ltd.

Address before: 510640 Guangdong City, Tianhe District Province, No. five, road, public education building, unit 371-1, unit 2401

Patentee before: Guangdong Gaohang Intellectual Property Operation Co., Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181220

Address after: 401120 Yubei District, Chongqing, Longxi street, Hong Jin Avenue 498, Jiale, Violet 1, 5- business.

Patentee after: Chongqing Kai Tuo development in science and technology company limited

Address before: 402260 Jiangjin 90 District, Chongqing City, No. 1, No. 1, No.

Patentee before: Chongqing GA doll Technology Co., Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201110

Address after: No. ZC030, College Students Pioneer Park, Tongling City, Anhui Province, 244000

Patentee after: TONGLING HUIHENG ELECTRONIC TECHNOLOGY Co.,Ltd.

Address before: 401120 Jiale Ziguang Building 5-Business, 498 Hongjin Avenue, Longxi Street, Yubei District, Chongqing

Patentee before: CHONGQING KAITUO TECHNOLOGY DEVELOPMENT Co.,Ltd.