CN102867513A - 一种基于伪Zernike矩的语音内容认证方法 - Google Patents

一种基于伪Zernike矩的语音内容认证方法 Download PDF

Info

Publication number
CN102867513A
CN102867513A CN2012102787243A CN201210278724A CN102867513A CN 102867513 A CN102867513 A CN 102867513A CN 2012102787243 A CN2012102787243 A CN 2012102787243A CN 201210278724 A CN201210278724 A CN 201210278724A CN 102867513 A CN102867513 A CN 102867513A
Authority
CN
China
Prior art keywords
frame
watermark
pseudo
voice
zernike
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102787243A
Other languages
English (en)
Other versions
CN102867513B (zh
Inventor
王宏霞
刘正辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN201210278724.3A priority Critical patent/CN102867513B/zh
Publication of CN102867513A publication Critical patent/CN102867513A/zh
Application granted granted Critical
Publication of CN102867513B publication Critical patent/CN102867513B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)

Abstract

本发明公开了一种基于伪Zernike矩的语音内容认证方法,水印嵌入时将原始语音信号A分为P帧,每帧分为N段。然后,由每帧前N/2段DCT低频系数的n阶伪Zernike矩幅值的平均值生成水印W,并通过量化每帧的后N/2段DCT低频系数的伪Zernike矩来嵌入水印,得到含水印语音A′。本发明充分利用了语音信号DCT低频系数的伪Zernike矩幅值与语音内容紧密相关的特性,以及对常规语音信号处理的鲁棒性,既保证了对恶意篡改攻击的敏感性,又保证了良好的容忍一定常规语音信号处理能力。

Description

一种基于伪Zernike矩的语音内容认证方法
技术领域
本发明涉及一种语音识别,尤其是语音内容真实性和完整性认证问题的解决方法。 
背景技术
近年来,数字化语音通信的迅猛发展和各种语音产品的广泛普及,以及各种功能强大的音频处理软件的出现,使得数字语音的传输与应用日益变得频繁与广泛。与此同时,篡改传输和存储的语音内容数据变得相对容易。例如,一段重要的法庭证词录音,在存储、传输过程中如果要害部分内容被恶意篡改,其后果可想而知!。因此,如何鉴别一段重要或敏感的语音内容是否被篡改过,哪里被篡改了,语音记录来源是否真实、可信,这些涉及数字语音真实性的认证问题,引起了国内外学者极大的研究兴趣。音频水印技术作为一种保护音频的技术手段,从上世纪90年代出现就受到了人们的重视,并成为信息安全研究领域的热点。 
与音频信号相比,语音信号具有采样率低,对常规信号处理更加敏感等特点。因此,现有的很多音频内容认证算法无法用于语音内容认证,或者用于语音内容认证的效果不是很理想。现实生活中,针对音频更多的是解决版权保护问题,而针对语音则更多的是解决内容真实性和完整性认证问题。基于数字水印的语音内容认证技术,如果嵌入的水印与语音自身内容无关,一方面会增加信息的传输量,另一方面也存在一定的安全隐患,所以基于语音自身特征或内容来生成水印的语音认证算法就更具有研究意义和实用价值。 
伪Zernike矩(Zernike矩)的幅值具有旋转不变性的特征,该特征已广泛地 应用于图像表示、图像检索和图像水印等领域,而在音频上的应用还很少。文献“Robust audio watermarking based on low-order Zernike moments”(Xiang Shi-jun,Huang Ji-wu,Yang Rui,5th International Workshop on Digital Watermarking,pp226-240,Oct.2006)首先对音频进行一维到二维的变换,然后对相应的二维信号进行Zernike变换。通过实验证明了Zernike矩的幅值对常规信号处理具有很强的鲁棒性;同时分析了Zernike矩的幅值和音频样本值的线性关系,由此提出了基于低阶Zernike矩的鲁棒音频水印算法。文献“A pseudo-Zernike moments based audio watermarking scheme robust against desynchronization attacks”(Wang Xiang-yang,Ma Tian-xiao,Niu Pan-pan,Computers and Electrical Engineering,vol.37,no.4,pp.425-443,July 2011)首先在时域基于统计均值嵌入同步码,然后量化伪Zernike矩的幅值嵌入水印,提出了基于伪Zernike矩的抗同步攻击的音频水印算法。对于上述的基于伪Zernike矩(Zernike矩)的水印算法,一方面,需要计算所有样本点的伪Zernike矩,计算量较大,耗费的时间较长。水印的嵌入是通过同比例地缩放各音频段的样本值来完成的。分析表明,直接缩放音频样本值对原始音频的改变量较大,对原始音频信号的质量造成较大的破坏;另一方面,水印的嵌入位置和方法是公开的,各音频帧的特征(伪Zernike矩)的计算也是已知的。于是,攻击者可以找到各音频帧的位置并计算每帧的特征,重新量化伪Zernike矩来去除嵌入的水印,使算法失去保护版权的作用。或者,攻击者可以使用其它的音频段来替换含水印的音频,然后量化替换后的音频内容,使其满足水印正确提取的条件,对其内容实施攻击。因此,研究基于内容的抗攻击能力强的语音内容认证算法具有重要的现实意义。 
发明内容
鉴于现有技术的不足,本发明的目的在于提供一种基于伪Zernike矩的语音内容认证算法,该算法能够有效地区分对语音的常规信号处理操作和恶意攻击,并能有效定位语音内容恶意篡改的位置,从而实现语音内容的真实性和完整性认证。 
为实现这样的目的,本发明以DCT低频系数的伪Zernike矩幅值对常规信号处理的鲁棒性为依据,设计了一种新的水印生成和嵌入方法。 
一种基于伪Zernike矩的语音内容认证方法,能够有效区分常规信号处理操作和恶意攻击,同时对恶意攻击能够有效地篡改定位。从而实现语音内容的真实性和完整性认证,包括如下具体步骤: 
(1)水印嵌入:首先从语音信号的第K个样本点开始将原始语音信号A分为P帧(K作为水印***的密钥),并将每帧分为N段。然后计算每帧前N/2段DCT低频系数的n阶伪Zernike矩幅值之和,并求出伪Zernike矩幅值的均值,由均值生成水印W。将得到的水印通过量化DCT低频系数的伪Zernike矩嵌入在每帧的后N/2段中,得到的含水印的语音信号记为A′ 
(2)语音内容认证过程:与水印嵌入过程类似,首先从待检测语音信号的第k1个样本点开始将A*分为P帧,每帧分为N段。计算每帧前N/2段DCT低频系数的n阶伪Zernike矩幅值之和,并求其均值,由均值生成水印W′。计算每帧后N/2段DCT低频系数的n阶伪Zernike矩幅值,由Zernike矩的幅值提取出水印W*。比较W*和W′,判断那些对应位不同的地方为语音信号被篡改过的位置,从而实现了语音内容真实性和完整性认证。 
与现有的用于内容认证的语音水印算法相比,本发明利用语音的内容来生成水印,接收端在收到语音信号的同时也收到了嵌入在语音信号中的水印。从而减少了传输带宽,节约了资源;同时也增强了水印传送的安全性。水印的嵌 入只需要对DCT低频系数进行伪Zernike变换,提高了算法的效率和水印容忍常规信号处理的能力。于是本发明更易于实际应用。 
附图说明 
图1为本发明实施例的含水印语音信号图。 
图2为对图1部分语音内容静音攻击后的语音信号图。 
图3为对图1部分内容替换攻击后对应的语音信号图。 
图4为图2的篡改定位结果。 
图5为图3的篡改定位结果。 
图6为不可听性测试结果列表。 
图7为对常规信号处理的鲁棒性测试结果列表。 
具体实施方式
以下结合附录和实施例对本发明的技术方案作进一步描述。 
1、水印的生成和嵌入: 
(1)语音数据的分帧以及每帧语音段的划分。将原始语音信号A={a(l),1≤l≤LA+K}分为P帧(K作为水印***的密钥),每帧长为I=LA/P,第i帧记为A(i)(i=1,2,...,P)。每帧等分为N段,每段的长为I/N,第i帧第j段记为A(i,j),1≤i≤P,1≤j≤N。 
(2)DCT变换。对A(i,j)做DCT变换,D(i,j)表示第i帧第j段的DCT系数,取i帧前N/2段的DCT系数记为D1(i,j)。 
(3)计算n阶m重伪Zernike矩。将D1(i,j)的前m1×m1个低频系数变换为二维信号。按照如下方法计算其n阶m重伪Zernike矩: 
记{Vnm}为伪Zernike多项式,它是一系列复值多项式构成的集合,{Vnm}构成单位圆内的完备正交基,其定义如下式 
Vnm(x,y)=Vnm(ρ,θ)=Rnm(ρ)exp(imθ) 
其中n为非负整数,m为满足|m|≤n的整数。记坐标原点到点(x,y)的向量为l,ρ=|l|,θ为x轴正向到向量l逆时针方向的夹角。Rnm(ρ)为径向多项式,即 
R nm ( ρ ) = Σ s = 0 n - | m | ( - 1 ) s ( 2 n + 1 - s ) ! s ! ( n + | m | + 1 - s ) ! ( n - | m | - s ) ! ρ n - s
坐标平面内的二维信号f(x,y)(x2+y2≤1)可以表示为Vnm(x,y)的线性组合,如下式 
f ( x , y ) = Σ n = 0 ∞ Σ m = - n n A nm V nm * ( x , y )
其中 
Figure BDA00001983247500053
和Vnm(x,y)互为共轭复数,Anm为n阶m重伪Zernike矩,定义如下: 
A nm = n + 1 π Σ x Σ y f ( x , y ) V nm * ( x , y ) , x 2 + y 2 ≤ 1
(4)语音水印的生成。取各帧的前N/2段来生成水印。记 1≤i≤P,1≤j≤N/2为n阶伪Zernike矩的幅值之和,计算C1(i,j)的均值 C ‾ 1 ( i ) = Σ j = 1 N / 2 C 1 ( i , j ) / N / 2 . 记 
Figure BDA00001983247500057
的最高位为M1(i),M1(i)对应的二进制设为W1(i)={w1(i,t),1≤t≤N/2},W1(i)即为i帧生成的水印。 
(5)水印的嵌入。取i帧后N/2段的DCT系数记为D2(i,j),N2+1≤j≤N,将D2(i,j)的前m2×m2个低频系数变换为二维信号,并计算其n阶伪Zernike矩幅值之和,记为C2(i,j)。记 
Figure BDA00001983247500058
的最高位为M2(i,j),水印按照下面的方法嵌入: 
当w1(i,t)=1时 
M 2 ′ ( i , j ) = M 2 ( i , j ) , M 2 ( i , j ) mod 2 = 1 M 2 ( i , j ) + 1 , M 2 ( i , j ) mod 2 = 0
当w1(i,j)=0时 
M 2 ′ ( i , j ) = M 2 ( i , j ) , M 2 ( i , j ) mod 2 = 0 M 2 ( i , j ) + 1 , M 2 ( i , j ) mod 2 = 1
上式中,当M2(i,j)=9时,M2′(i,j)=M2(i,j)-1;j=t+N2,1≤t≤N2。用M2′(i,j)替换C2(i,j)整数部分最高位,并将次高位量化为5,对应的值记为C2′(i,j)。 
将D2(i,j)的前m2×m2个低频系数扩大α2(i,j)倍,对应的值记为D2′(i,j),α2(i,j)可由下式得到: 
α 2 ( i , j ) = C 2 ′ ( i , j ) C 2 ( i , j ) , N / 2 + 1 ≤ j ≤ N
对D2′(i,j)做逆DCT,得到的信号即为i帧的后半部分内容,i帧前半部分和后半部分结合在一起即为i帧含水印语音信号。 
(6)对P个语音帧依次进行这样的嵌入,直至嵌完所有语音帧,便得到含水印语音A′。 
2、语音内容认证: 
(1)类似水印生成及嵌入过程的步骤(1)~(4),对待检测的语音信号A*从K个样本点开始等分为P帧,每帧等分为N段,第i帧记为A*(i)(i=1,2,...,P),第i帧第j段记为A*(i,j),1≤j≤N;对A*(i,j)做DCT,对应的DCT系数记为D*(i,j)。取i帧前N/2段的DCT系数记为 
Figure BDA00001983247500063
将 的前m1×m1个低频系数变换为二维信号,并计算其n阶伪Zernike矩幅值之和,记为 
Figure BDA00001983247500065
1≤j≤N/2。计算 
Figure BDA00001983247500066
1≤j≤N/2的均值  C ‾ 1 * ( i ) = Σ j = 1 N / 2 C 1 * ( i , j ) / N / 2 . 记 
Figure BDA00001983247500069
的最高位为 
Figure BDA000019832475000611
二值化为  W 1 * ( i ) = { w 1 * ( i , t ) , 1 ≤ t ≤ N / 2 } ,
Figure BDA000019832475000613
即为i帧生成重构的水印。 
(2)取i帧后N/2段的DCT系数记为 
Figure BDA000019832475000614
将 
Figure BDA000019832475000615
的前m2×m2个低频系数变换为二维信号,并计算其n阶伪Zernike矩幅值之和,记为 
Figure BDA000019832475000616
N2+1≤j≤N。记 
Figure BDA000019832475000617
的最高位为 
Figure BDA000019832475000618
进行如下计算获得提取的水印 
W ^ 1 * ( i ) = { w ^ 1 * ( i , t ) , 1 ≤ t ≤ N / 2 }
w ^ 1 * ( i , t ) = 1 M 2 * ( i , t + N / 2 ) mod 2 = 1 0 , M 2 * ( i , t + N / 2 ) mod 2 = 0
(3)定义认证序列TA(i)为 
TA ( i ) = Σ t = 1 N / 2 w ^ 1 * ( i , t ) ⊕ w 1 * ( i , t ) , T ∈ { 0,1 }
如果TA(i)=0,则表明第i帧语音内容是真实的,否则,TA(i)=1表明第i帧语音内容被篡改。 
本发明方法的效果可以通过以下的性能分析验证: 
1、不可听性 
选取采样率为22.05kHz,样本长度为1024078,16位量化的单声道语音信号来做不可听性测试。图6给出了3种语音类型的SNR值,由测试结果可以看出本文算法具有很好的不可听性。 
2、对常规信号处理的鲁棒性 
用误码率BER(bit error rate)来测试本文算法对常规信号处理的鲁棒性,BER的定义如下式 
BER = E T × 100 %
其中,E为提取水印错误比特数,T为语音信号所嵌水印总比特数。BER值越小说明算法对常规信号处理的鲁棒性越强。 
图7列出了成年男声在经过一些常规信号处理后的BER值(其它类型语音信号的测试结果与此相似),可以看出本发明方法对MP3压缩、低通滤波、重采样等常规语音信号处理具有较强的鲁棒性。 
3、恶意篡改定位 
对如图1所示的含水印语音信号分别进行了静音和替换攻击。攻击后的语 音信号分别如图2和图3所示,对应的篡改定位结果分别如图4和图5所示。图4、图5中,TA(i)=1的帧表示被恶意攻击的部分,TA(i)=0的帧表示没有恶意攻击的部分。从篡改定位的结果来看,本发明方法对恶意攻击能够有效地篡改定位。 
上述针对较佳实施例的描述过于具体,本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助阅读者理解本发明的原理,应被理解为发明的保护范围并不局限于这样的特别陈述和实施例。 

Claims (1)

1.一种基于伪Zernike矩的语音内容认证方法,用以区分常规信号处理操作和恶意攻击,同时对恶意攻击能够有效地篡改定位,具体步骤包括:
(1)水印嵌入:首先从语音信号的第K个样本点开始将原始语音信号A分为P帧,并将每帧分为N段;然后计算每帧前N/2段离散余弦变DCT低频系数的n阶伪Zernike矩幅值之和,并求出伪Zernike矩幅值的均值,由均值生成水印W;将得到的水印通过量化DCT低频系数的伪Zernike矩嵌入在每帧的后N/2段中,得到含水印语音A′;
(2)语音内容认证过程:与水印嵌入过程类似,首先从待检测语音信号A*的第k1个样本点开始将语音分为P帧,每帧分为N段。计算每帧前N/2段DCT低频系数的n阶伪Zernike矩幅值之和,并求其均值,由均值生成水印W′;计算每帧后N/2段DCT低频系数的n阶伪Zernike矩幅值,由Zernike矩的幅值提取出水印W*;比较W*和W′,判断对应位不同的地方为语音信号被篡改过的位置,从而实现了语音内容真实性和完整性认证。
CN201210278724.3A 2012-08-07 2012-08-07 一种基于伪Zernike矩的语音内容认证方法 Expired - Fee Related CN102867513B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210278724.3A CN102867513B (zh) 2012-08-07 2012-08-07 一种基于伪Zernike矩的语音内容认证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210278724.3A CN102867513B (zh) 2012-08-07 2012-08-07 一种基于伪Zernike矩的语音内容认证方法

Publications (2)

Publication Number Publication Date
CN102867513A true CN102867513A (zh) 2013-01-09
CN102867513B CN102867513B (zh) 2014-02-19

Family

ID=47446337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210278724.3A Expired - Fee Related CN102867513B (zh) 2012-08-07 2012-08-07 一种基于伪Zernike矩的语音内容认证方法

Country Status (1)

Country Link
CN (1) CN102867513B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103456308A (zh) * 2013-08-05 2013-12-18 西南交通大学 一种可恢复的密文域语音内容认证方法
CN105304091A (zh) * 2015-06-26 2016-02-03 信阳师范学院 一种基于dct的语音篡改恢复方法
CN106157972A (zh) * 2015-05-12 2016-11-23 恩智浦有限公司 使用局部二进制模式进行声学情境辨识的方法和设备
CN107886956A (zh) * 2017-11-13 2018-04-06 广州酷狗计算机科技有限公司 音频识别方法、装置及计算机存储介质
CN111213203A (zh) * 2017-10-20 2020-05-29 思睿逻辑国际半导体有限公司 安全语音生物测定认证

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7280970B2 (en) * 1999-10-04 2007-10-09 Beepcard Ltd. Sonic/ultrasonic authentication device
CN101609675A (zh) * 2009-07-27 2009-12-23 西南交通大学 一种基于质心的脆弱音频水印方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7280970B2 (en) * 1999-10-04 2007-10-09 Beepcard Ltd. Sonic/ultrasonic authentication device
CN101609675A (zh) * 2009-07-27 2009-12-23 西南交通大学 一种基于质心的脆弱音频水印方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHIJUN XIANG ET AL.: "Robust Audio Watermarking Based on Low-Order Zernike Moments", 《DIGITAL WATERMARKING LECTURE NOTES IN COMPUTER SCIENCE》 *
XIANG-YANG WANG ET AL.: "A pseudo-Zernike moment based audio watermarking scheme robust against desynchronization attacks", 《COMPUTERS AND ELECTRICAL ENGINEERING》 *
XIONG YI-QUN ET AL.: "An Audio Zero-watermark Algorithm Combined DCT with Zernike Moments", 《INTERNATIONAL CONFERENCE ON CYBERWORLDS 2008》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103456308A (zh) * 2013-08-05 2013-12-18 西南交通大学 一种可恢复的密文域语音内容认证方法
CN103456308B (zh) * 2013-08-05 2015-08-19 西南交通大学 一种可恢复的密文域语音内容认证方法
CN106157972A (zh) * 2015-05-12 2016-11-23 恩智浦有限公司 使用局部二进制模式进行声学情境辨识的方法和设备
CN105304091A (zh) * 2015-06-26 2016-02-03 信阳师范学院 一种基于dct的语音篡改恢复方法
CN105304091B (zh) * 2015-06-26 2018-10-26 信阳师范学院 一种基于dct的语音篡改恢复方法
CN111213203A (zh) * 2017-10-20 2020-05-29 思睿逻辑国际半导体有限公司 安全语音生物测定认证
CN111213203B (zh) * 2017-10-20 2021-03-02 思睿逻辑国际半导体有限公司 安全语音生物测定认证
CN107886956A (zh) * 2017-11-13 2018-04-06 广州酷狗计算机科技有限公司 音频识别方法、装置及计算机存储介质

Also Published As

Publication number Publication date
CN102867513B (zh) 2014-02-19

Similar Documents

Publication Publication Date Title
CN101345054B (zh) 用于声频文件的数字水印制作及识别方法
Fan et al. Chaos-based discrete fractional Sine transform domain audio watermarking scheme
CN102867513B (zh) 一种基于伪Zernike矩的语音内容认证方法
CN100596061C (zh) 一种基于盲源分离的小波域数字音频多目的水印方法
CN102157154B (zh) 基于音频内容的非均匀离散余弦变换音频可靠性认证方法
Liu et al. A novel speech content authentication algorithm based on Bessel–Fourier moments
CN101290772A (zh) 基于混合域系数矢量量化的音频零水印嵌入和提取方法
CN107993669B (zh) 基于修改最低有效位数权重的语音内容认证和篡改恢复方法
CN103208288A (zh) 基于双重加密的dwt—dct域音频公开水印算法
CN105632506A (zh) 基于极谐变换的鲁棒数字音频水印嵌入及检测方法
CN104795071A (zh) 一种盲音频水印嵌入及水印提取的处理方法
CN101441870A (zh) 一种基于离散分数变换的鲁棒数字音频水印方法
Wang et al. An algorithm of detecting audio copy-move forgery based on DCT and SVD
Maha et al. DCT based blind audio watermarking scheme
CN102324234A (zh) 一种基于mp3编码原理的音频水印方法
CN105304091A (zh) 一种基于dct的语音篡改恢复方法
CN101872466B (zh) 水印嵌入方法、水印检测方法及装置
CN101609675B (zh) 一种基于质心的脆弱音频水印方法
CN105895109A (zh) 一种基于dwt和dct的数字语音取证和篡改恢复方法
Liu et al. Pseudo-zernike moments-based audio content authentication algorithm robust against feature-analysed substitution attack
CN108877819B (zh) 一种基于系数自相关度的语音内容取证方法
Lalitha et al. Localization of copy-move forgery in speech signals through watermarking using DCT-QIM
Chen et al. A multipurpose audio watermarking scheme for copyright protection and content authentication
Wu et al. BCH Code-Based Robust Audio Watermarking Algorithm in the DWT Domain
CN103745725B (zh) 一种基于常数q变换的音频水印嵌入方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140219

Termination date: 20160807