CN101350198B - 基于骨导的语音压缩水印方法 - Google Patents

基于骨导的语音压缩水印方法 Download PDF

Info

Publication number
CN101350198B
CN101350198B CN2008101507573A CN200810150757A CN101350198B CN 101350198 B CN101350198 B CN 101350198B CN 2008101507573 A CN2008101507573 A CN 2008101507573A CN 200810150757 A CN200810150757 A CN 200810150757A CN 101350198 B CN101350198 B CN 101350198B
Authority
CN
China
Prior art keywords
frame
watermark
group
organizes
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101507573A
Other languages
English (en)
Other versions
CN101350198A (zh
Inventor
同鸣
姬红兵
陈巍
闫涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN2008101507573A priority Critical patent/CN101350198B/zh
Publication of CN101350198A publication Critical patent/CN101350198A/zh
Application granted granted Critical
Publication of CN101350198B publication Critical patent/CN101350198B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种基于骨导的语音压缩水印方法,主要解决了现有的同类方法不能检测出攻击的位置和类型的问题。在水印嵌入过程中,由当前帧的线谱频率系数、下一帧提取的基音周期和前一帧的水印生成嵌入在当前帧的水印,并根据不同帧的位置选择不同的水印生成规则,再将当前帧的水印嵌入在语音编码的多脉冲激励的位置序号中;在水印验证过程中,从选定的脉冲激励的位置序号中提取水印,并将提取的水印与验证水印进行比较,根据不同攻击位置和攻击类型产生的不同结果,检测出攻击位置和攻击类型。本发明具有良好的抑噪能力和低频拾音能力,可用于录音设备,为数字语音的完整性和真实性提供保证。

Description

基于骨导的语音压缩水印方法
技术领域
本发明属于信息处理领域,具体涉及到水印压缩的方法,可用于录音设备,为数字语音完整性和真实性提供保证。
背景技术
数字水印是近年来多媒体信息处理的研究热点,数字语音水印作为数字水印领域的一个重要分类,有其自身的特点。语音信号带宽较窄,在传输上比图像和视频信号更为便利,形式也更为多样,如电话,音频广播,以及视频伴音等都是日常生活中所常见的,其覆盖面非常广泛。随着现代信号处理技术的发展,人们可以很容易按照自己的意图篡改数字语音信号,因此为了证明数字语音信号内容的有效性,研究人员提出了易碎水印的概念。与鲁棒性水印完全相反,易碎水印对攻击具有高度的灵敏性,对已嵌入水印的语音信号作任何微小的改变都将使水印无法恢复或不完全恢复,从而判断语音信号是否被篡改。
目前已提出的易碎语音水印方法主要有:
1.Chung-Ping Wu,Kuo,C.C.J.Speech content integrity verification integrated with ITUG.723.1 speech coding.Proc.IEEE Int.Conf.Inf.Technol.:Coding Comput.,2001,pp:680-684,这种方法抽取语音的一些特征,经处理后作为水印嵌入,通过比较提取的水印和选择的特征来判断语音的完整性。由于这种方法依赖于一个门限值来判断语音是否被更改,易造成误判。
2.Chen Ning,Zhu Jie.An Efficient Approach to Integrate Watermarking with SpeechCoding Algorithm.Communications and Networking in China,CHINACOM’07.2007:355-359,这种方法将水印嵌入在语音线性预测系数的二级矢量量化参数中,其缺陷是只能判断宿主载体是否被攻击,而不能判断出攻击类型。
3.Chung-Ping Wu,Kuo C.-C.J.Fragile speech watermarking based on exponential scalequantization for tamper detection.Acoustics,Speech,and Signal Processing,2002.Proceedings.(ICASSP′02).2002(4):13-17,这种方法虽然能够分辨出重采样、高斯加噪、G.711语音压缩和G.721语音压缩编码等攻击的类型,但不能分辨出***、替换和剪切等攻击的类型。
4.Chia-Hsiung Liu,Chen O.T.-C.A content-based fragile watermark scheme for speechwaveform authentication.Circuits and Systems,2005.2005(1):432-435,这种方法虽然能够检测出***、替换、删除等攻击的位置和类型,但属于时域水印,不适用于压缩格式的语音。
综上所述,现有的易碎语音水印具有以下不足:1)嵌入水印固定,易被删除或伪造;2)大多基于时域或变换域,无法满足实时性的要求,而且嵌入的水印经过压缩处理后易丢失,随着语音压缩技术的发展,越来越多的语音信号是以压缩后的格式存在的,采用时域或变换域的方法嵌入水印则要面对复杂的编解码过程;3)大多的易碎水印方法只能判断宿主载体是否被篡改,不能检测出攻击位置和攻击类型。
发明内容
本发明目的是针对上述不足,提出一种能够检测出攻击位置和攻击类型的基于骨导的语音压缩水印方法,为数字语音完整性和真实性提供保证。
实现本发明目的的技术关键是:在水印嵌入过程中,将语音信号初始分成组,每一组包含若干帧。嵌入到当前帧的水印由当前帧的线谱频率系数、下一帧提取的基音周期和前一帧的水印产生,并根据不同帧的位置选择不同的水印生成规则。在水印验证过程中,用提取的水印与验证水印比较,根据不同攻击位置和攻击类型产生的不同结果,检测出被攻击的帧的位置和攻击类型。具体方案如下:
一、水印嵌入过程
(1)利用骨导器件信号对语音信号进行去除噪声和其它杂音预处理,并提取骨导设备的编号IDD和语音信号的编号IDS
(2)将预处理后的语音信号根据语音的长度分成若干个固定长度的帧,每帧长度30ms,将n帧分为一组,最后一组除外,即最后一组的帧数为总的帧数除以n的余数;
(3)利用G.723.1语音压缩编码标准,提取每一帧线谱频率系数Lg,i和基音周期Pg,i,用以后续的水印生成,其中g表示帧所在的组的序号,i表示帧在组中的位置;
(4)利用Hash散列函数将提取的骨导设备的编号IDD、语音信号的编号IDS、当前帧的线谱频率系数Lg,i、下一帧提取的基音周期Pg,i+1和前一帧的水印Wg,i-1,生成嵌入在当前帧的水印Wg,i
(5)将当前帧的水印Wg,i嵌入在语音编码的多脉冲激励的位置序号中,即用水印替换脉冲激励的位置序号的最不重要位,最终得到含水印的语音压缩编码流。
二、水印提取验证过程
1)对含水印的压缩编码流进行解码处理;
2)从选定的脉冲激励的位置序号中提取水印
Figure G2008101507573D00021
3)利用Hash散列函数将骨导设备的编号IDD、语音信号的编号IDS、当前帧的线谱频率系数Lg,i、下一帧提取的基音周期Pg,i+1和前一帧提取的水印
Figure G2008101507573D00031
生成验证水印
4)比较第g组第i帧提取的水印
Figure G2008101507573D00033
和生成的验证水印
Figure G2008101507573D00034
Figure G2008101507573D00035
不等于
Figure G2008101507573D00036
则判定第g组第i帧错误,根据错误出现的位置和分布,判断攻击的位置和类型。
本方法具有以下优点:
1)本发明由于嵌入到当前帧的水印由当前帧的线谱频率系数、下一帧提取的基音周期和前一帧的水印产生,并根据不同帧的位置选择不同的水印生成规则,在水印验证过程中,比较提取的水印与验证水印,根据不同攻击位置和攻击类型产生的不同结果,检测出攻击位置和攻击类型,从而可以更加有效的保证数字录音等数字多媒体产品的完整性。
2)本发明由于利用了骨导器件良好的抑噪能力和低频拾音能力,对语音信号进行预处理去除噪声和其它杂音,并提取骨导设备编号用来生成水印,增加了水印的安全性。
附图说明
图1是本发明水印嵌入过程框图;
图2是本发明水印提取过程框图;
图3是本发明对***攻击的仿真图;
图4是本发明对替换攻击的仿真图;
图5是本发明对删除攻击的仿真图;
图6是本发明对替换和***联合攻击的仿真图。
具体实施方式
一.基础理论介绍
1.骨导器件
近年来,由于骨导器件独特的语音处理特性,获得了语音信号处理领域越来越多的关注。该器件是一种高灵敏的固体音频传感器,具有良好的抑噪能力和低频拾音能力,其原理是当人们说话时,头部的骨骼会产生振动,紧贴骨骼的骨导会捕捉到这些振动信息作为语音检测的依据。此外,作为一种固体震动传感器,骨导器件对环境噪声不敏感,具有天然的抑噪优势。骨导器件只能接收到语音信号3.5~4kHz以下频率的成分,而语音的绝大部分能量都集中在这一频段内,同时它对外界空气中的振动不灵敏。
2.G.723.1语音压缩编码标准
G.723.1标准是ITU-T组织于1996年推出的一种低码率编码算法。主要用于对语音及其他多媒体声音信号的压缩,如可视电话***、数字传输***和高质语音压缩***等。该编码器是一个双速率的语音编码器,两个编码速率分别为6.3kbps和5.3kbps。6.3kbps的高速率采用多脉冲激励最大似然量化MP MLQ算法,5.3kbps的低速率采用代数码本激励线性预测ACELP算法。这两种算法具有相同的理论基础,都是基于线性预侧LPC,采用非周期性分量的激励源。
G.723.1标准是基于码激励线性预测CELP编码模型的算法,在编码端,模拟输入信号首先经过语音频带滤波,再将滤波输出经8khz采样转换成16bit线性PCM语音信号,每一帧为30ms,相应有240个样点,然后,通过对延时语音进行分析提取CELP参数,将这些参数编码传送。在解码端,用这些参数构造激励信号和合成滤波器,将激励信号通过合成滤波器获得重构语音信号。
3.Hash函数
Hash函数是一种用于信息安全领域中的加密算法,它可以把一些不同长度的信息转化成一组固定长度的编码,即Hash值。Hash值长度通常远小于输入的长度。一个安全的Hash函数应该至少满足以下几个条件:1)输入长度是任意的;2)输出长度是固定的;3)对每一个给定的输入,计算输出即Hash值是很容易的;4)给定Hash函数的描述和一个随机选择的消息,找到另一个与该消息不同的消息使得它们Hash到同一个值是计算上不可行的。
Hash函数主要用于完整性校验和提高数字签名的有效性,目前已有很多方案,如:MD4、MD5、SHA1等。由于MD5Hash算法具有"数字指纹"特性,成为目前应用最广泛的一种文件完整性校验算法,因此本文采用MD5Hash算法生成水印。
二、相关符号说明
IDD骨导设备的编号
IDS语音的编号
Lg,i第g组第i帧的线谱频率系数
Pg,i第g组第i帧的基音周期
Wg,i嵌入在第g组第i帧的水印信息
LSB(x)x的最不重要位
Exc(i)第i个选定的脉冲的位置序号
W(i)水印信息的第i比特
从合成语音第g组第i帧中提取的水印
Figure G2008101507573D00042
由合成语音生成的第g组第i帧的验证水印
三、基于骨导的压缩域语音水印方法
参照图1,本发明的数字水印嵌入过程如下:
步骤1,对语音信号进行预处理。
由于骨导器件具有良好的抑噪能力,而且语音信号与骨导信号是完全同步的,因此计算骨导信号的短时能量分布,并设定一门限e,若某一时间段的骨导信号能量大于e,则这一时间段的语音信号不变,否则可以认为这一时间段的语音信号为噪声或杂音,将这一时间段的语音置零,从而去除语音信号中的噪声和杂音;并提取骨导设备的编号IDD和语音的编号IDS,用以生成水印。其中骨导设备的编号IDD与数字录音***有关,保证了不同设备录制的相同的语音段产生不同的水印;语音信号的编号IDS与录音的时间和次数有关,它保证了相同的设备录制的相同的语音数据在不同的时间会产生不同的水印。
步骤2,分帧、分组处理。
将预处理后的语音信号根据语音的长度分成若干个固定长度的帧,每帧长度30ms,将n帧分为一组,最后一组除外,即最后一组的帧数为总的帧数除以n的余数;
步骤3,提取参数Lg,i和Pg,i
利用G.723.1语音压缩编码标准,提取每一帧线谱频率系数Lg,i和基音周期Pg,i,用以后续的水印生成,其中g表示帧所在的组的序号,i表示帧在组中的位置。
步骤4,生成水印。
利用Hash散列函数将提取的骨导设备的编号IDD、语音信号的编号IDS、当前帧的线谱频率系数Lg,i、下一帧提取的基音周期Pg,i+1和前一帧的水印Wg,i-1,按如下三种情况生成嵌入当前帧的水印Wg,i
(1)若当前帧为每一组的第一帧,则按下式生成水印Wg,1,即
Wg,1=Hx(IDD,IDS,g,Wg-1,n,Lg,1,Pg,2)
式中,Hx()表示Hash函数,
Wg,1为第g组第一帧生成的水印,当g=1时,令W0,n为私钥Key,
Wg-1,n为第g-1组的第n帧的水印,即前一帧的水印,
Lg,1为第g组第1帧的线谱频率系数,
Pg,2为第g组第2帧的基音周期。
(2)若当前帧为最后一组的最后一帧,设最后一组有m帧,则按下式生成水印WT,m,即
WT,m=Hx(IDD,IDS,WT,m-1,LT,m,(T-1)×n+m)
式中,WT,m为第T组第m帧生成的水印,
WT,m-1为第T组的第m-1帧的水印,
LT,m为第T组第m帧的线谱频率系数,
(T-1)×n+m为语音总帧数。
(3)其它情况,则按下式生成水印Wg,i,即
Wg,i=Hx(IDD,IDS,Wg,i-1,Lg,i,Pg,i+1)
式中,Wg,i为第g组的第i帧生成的水印,
Wg,i-1为第g组的第i-1帧的水印,
Lg,i为第g组的第i帧的线谱频率系数,
Pg,i+1为第g组第i+1帧的基音周期。
步骤5,水印嵌入。
由于G.723.1标准是基于码激励线性预测CELP编码模型的算法,激励信号对语音质量的影响最小,因此要将当前帧的水印Wg,i嵌入在语音编码的多脉冲激励的位置序号中,即用水印替换脉冲激励的位置序号的最不重要位,最终得到含水印的语音压缩编码流。
参照图2,本发明的数字水印提取过程如下:
步骤A,解码处理。
参照G.723.1语音压缩编码标准,对含水印的语音编码流进行解码处理,并提取出每帧的线谱频率的系数Lg,i和基音周期Pg,i
步骤B,水印提取。
由于水印是嵌入在选定的脉冲激励的位置序号的最不重要位上,按下式水印提取。
W′(i)=LSB(Exc(i))
其中,W′(i)表示提取的水印信息的第i比特。
步骤C,生成验证水印。
利用Hash散列函数将骨导设备的编号IDD、语音信号的编号IDS、当前帧的线谱频率系数Lg,i、下一帧提取的基音周期Pg,i+1和前一帧提取的水印
Figure G2008101507573D00061
按如下三种情况生成验证水印
Figure G2008101507573D00062
(1)若当前帧为每一组的第一帧,则按下式生成水印
Figure G2008101507573D00063
W g , 1 ′ ′ = H x ( ID D , ID S , g , W g - 1 , n ′ , L g , 1 , P g , 2 )
式中,Hx()表示Hash函数,
为第g组第1帧的验证水印,当g=1时,W0,n为私钥Key,
Figure G2008101507573D00066
为第g-1组的第n帧的水印,即前一帧提取的水印,
Lg,1为第g组第1帧的线谱频率系数,
Pg,2为第g组第2帧的基音周期;
(2)若当前帧为最后一组的最后一帧,设最后一组有m帧,则按下式生成水印
Figure G2008101507573D00071
W T , m ′ ′ = H x ( ID D , ID S , W T , m - 1 ′ , L T , m , ( T - 1 ) × n + m )
式中,
Figure G2008101507573D00073
为第T组第m帧生成的验证水印,
为第T组的第m-1帧提取的水印,
LT,m为第T组第m帧的线谱频率系数,
(T-1)×n+m为语音总帧数。
(3)其它情况,则按下式生成水印Wg,i,即
W g , i ′ ′ = H x ( ID D , ID S , W g , i - 1 ′ , L g , i , P g , i + 1 )
式中,
Figure G2008101507573D00076
为第g组的第i帧生成的验证水印,
Figure G2008101507573D00077
为第g组的第i-1帧提取的水印,
Lg,i为第g组的第i帧的线谱频率系数,
Pg,i+1为第g组第i+1帧的基音周期。
步骤D,水印验证。
比较第g组第i帧提取的水印
Figure G2008101507573D00078
和生成的验证水印
Figure G2008101507573D00079
Figure G2008101507573D000710
不等于
Figure G2008101507573D000711
则判定第g组第i帧错误,根据错误出现的位置和分布,按照如下过程判断攻击的位置和类型:
(4a)检测攻击位置
从第一组第一帧开始,比较提取的水印
Figure G2008101507573D000712
和生成的验证水印
Figure G2008101507573D000713
Figure G2008101507573D000714
Figure G2008101507573D000715
一致,则继续比较下一帧;若 W g , i ′ ′ ≠ W g , i ′ ′ , 判定第g组第i帧错误,则受攻击的位置为第g组第i帧;
(4b)设定错误类型
第一类错误:某一组的第一帧提取水印与验证水印不一致,但其前一帧和后一帧的提取水印与验证水印一致,即: W g , 1 ′ ≠ W g , 1 ′ ′ , W g - 1 , n ′ = W g - 1 , n ′ ′ , W g , 2 ′ = W g , 2 ′ ′ ;
第二类错误:最后一组的最后一帧提取水印与验证水印不一致,但其前一帧的提取水印与验证水印一致;
第三类错误:其它的错误为第三类错误;
(4c)根据不同错误类型的不同分布判断攻击类型
若攻击类型为***攻击,则***攻击的位置出现连续的第三类错误,在连续的第三类错误后等间隔的出现第一类和第三类错误,最后一帧出现第二类错误,间隔为每组包含的帧数;
若攻击类型为替换攻击,则替换攻击的位置出现连续的第三类错误,其它帧无错误;
若攻击类型为删除攻击,则在删除攻击的位置之后等间隔的出现第一类和第三类错误,间隔为每组的包含帧数,最后一帧会出现第二类错误。
本发明的效果可通过以下实验仿真进一步说明:
1.仿真条件
选择采样频率8khz,量化位数16bit的单声道wav格式的语音信号作为水印嵌入载体,语音长度为25.5s,分为850帧,每帧长度30ms,分为17组,每组包含50帧。实验软件环境为Matlab7.0。设计了下面几种攻击测试:
(1)***攻击,将长为216帧的一段不含水印的信号***到合成语音的第325帧的位置。
(2)换攻击,用长为216帧的一段不含水印的信号替换合成语音的第325帧到540帧。
(3)删除攻击,删除合成语音的第325帧到第500帧。
(4)联合攻击,用长为116帧的一段不含水印的信号替换合成语音的第175帧到290帧,将长为116帧的一段不含水印的信号***到合成语音的第475帧的位置。
2.仿真结果及分析
实验结果分别如图3、图4、图5和图6,它们分别为在***、替换、删除和联合攻击后的语音波形图和水印检测结果。其中:
图3a为语音信号在***攻击后的波形图,该图显示在第325帧~540帧的位置被***了一段长为216帧的不含水印的信号。
图3b为水印检测结果,从该图中可以看出,从其第325帧~540帧开始出现一段长度为216帧的连续第三类错误,在该连续的第三类错误的后面等间隔出现第一类错误和第三类错误,其间隔长度50帧,即为每组包含的帧数,在语音的最后一帧则出现第二类错误,因此可以判断受攻击的位置为第325帧,由于替换攻击在连续的第三类错误后不会出现其他错误,而删除攻击不会出现连续的第三类错误,因此可以判断语音所受的攻击为***攻击,***长度为216帧。
图4a为语音信号在替换攻击后的波形图,该图显示在第325帧~540帧被等长的一段不含水印的信号替换。
图4b为水印检测结果,从该图中可以看出:从第325帧~540帧出现连续第三类错误,其后的帧无错误,因此可以判断受攻击的位置为第325帧,由于***攻击在连续的第三类错误后会出现其他错误,而删除攻击不会出现连续的第三类错误,因此可以判断语音所受的攻击为替换攻击,替换的范围为第325帧~540帧。
图5a为语音信号在删除攻击后的波形图,该图显示第325帧~500帧被删除。
图5b为水印检测结果,在该图的第325帧之后等间隔出现第一类错误和第三类错误,其间隔长度为每组包含的帧数即50帧,在语音的最后一帧则出现第二类错误。由此可以判断受攻击的位置为第325帧,由于***攻击在连续的第三类错误后会出现其他错误,而替换攻击在连续的第三类错误后不会出现其他错误,因此可以判断语音所受的攻击为删除攻击,由于等间隔出现的第三类错误出现的帧的位置为325、375、425...,其除以每组的帧数50的余数都为25,因此删除的长度L为:L=50×N+25+1,N=0,1…重新计算最后一帧的验证水印
Figure G2008101507573D00091
得:
W T , m ′ ′ = H x ( D , S , W T , m - 1 , L T , m , ( T - 1 ) × n + m + 50 × N + 25 + 1 )
搜索得N=3,使 W T , m ′ ′ = W T , m ′ , 从而计算出删除长度为176帧。
图6a为语音信号在联合攻击后的波形图,该图显示从第175帧~290帧被等长的一段不含水印的信号替换,第475帧的位置被***了长为116帧一段的不含水印的信号。
图6b为水印检测结果,从该图中可以看出:在第175~290帧和第475帧~590帧都出现连续的第三类错误,由于替换攻击之后的帧没有错误,***攻击之后的帧则等间隔的出现第一类错误和第三类错误,因此可以判断语音在第175~290帧受到替换攻击,第475~590帧受到***攻击。
以上仿真结果表明,本发明不但能够判断宿主载体是否被攻击,而且能够准确检测出攻击的位置和攻击类型。

Claims (5)

1.一种基于骨导的语音压缩水印嵌入方法,包括如下过程:
(1)利用骨导器件信号对语音信号进行去除噪声和其它杂音预处理,并提取骨导设备的编号IDD和语音信号的编号IDS
(2)将预处理后的语音信号根据语音的长度分成若干个固定长度的帧,每帧长度30ms,将n帧分为一组,最后一组除外,即最后一组的帧数为总的帧数除以n的余数;
(3)利用G. 723.1语音压缩编码标准,提取每一帧线谱频率的系数Lg,i和基音周期Pg,i,其中Lg,i和Pg,i分别表示第g组第i帧的线谱频率系数和基音周期;
(4)利用Hash散列函数将提取的骨导设备的编号IDD、语音信号的编号IDS、当前帧的线谱频率系数Lg,i、下一帧提取的基音周期Pg,i+1和前一帧的水印Wg,i-1,生成嵌入在当前帧的水印Wg,i
(5)将当前帧的水印Wg,i嵌入在语音编码的多脉冲激励的位置序号中,即用水印替换脉冲激励的位置序号的最不重要位,最终得到含水印的语音压缩编码流。
2.根据权利要求1所述的水印嵌入方法,其中步骤(4)的按如下三种情况进行:(4a)若当前帧为每一组的第一帧,则按下式生成水印Wg,1,即
Wg,1=Hx(IDD,IDS,g,Wg-1,n,Lg,1,Pg,2)
式中,Hx()表示Hash函数,
Wg,1为第g组第一帧生成的水印,当g=1时,令W0,n为私钥Key,
Wg-1,n为第g-1组的第n帧的水印,即前一帧的水印,
Lg,1为第g组第1帧的线谱频率系数,
Pg,2为第g组第2帧的基音周期;
(4b)若当前帧为最后一组的最后一帧,设最后一组有m帧,则按下式生成水印WT,m,即
WT,m=Hx(IDD,IDS,WT,m-1,LT,m,(T-1)×n+m)
式中,WT,m为第T组第m帧生成的水印,
WT,m-1为第T组的第m-1帧的水印,
LT,m为第T组第m帧的线谱频率系数,
(T-1)×n+m为语音总帧数;
(4c)其它情况,则按下式生成水印Wg,i,即
Wg,i=Hx(IDD,IDS,Wg,i-1,Lg,i,Pg,i+1)
式中,Wg,i为第g组的第i帧生成的水印,
Wg,i-1为第g组的第i-1帧的水印,
Lg,i为第g组的第i帧的线谱频率系数,
Pg,i+1为第g组第i+1帧的基音周期。
3.一种基于骨导的语音压缩水印提取验证方法,包括如下过程:
1)对含水印的压缩编码流进行解码处理;
2)从选定的脉冲激励的位置序号中提取水印
Figure F2008101507573C00024
3)利用Hash散列函数将骨导设备的编号IDD、语音信号的编号IDS、当前帧的线谱频率系数Lg,i、下一帧提取的基音周期Pg,i+1和前一帧提取的水印
Figure F2008101507573C00022
生成验证水印
Figure F2008101507573C00023
4)比较第g组第i帧提取的水印
Figure 2008101507573100001F2008101507573C00024
和生成的验证水印
Figure F2008101507573C00025
Figure F2008101507573C00026
不等于
Figure F2008101507573C00027
则判定第g组第i帧错误,根据错误出现的位置和分布,判断攻击的位置和类型。
4.根据权利要求3所述的水印提取验证方法,其中步骤3)的按如下三种情况进行:(3a)若当前帧为每一组的第一帧,则按下式生成水印
Figure F2008101507573C00028
Figure F2008101507573C00029
式中,Hx()表示Hash函数,
Figure F2008101507573C000210
为第g组第1帧的验证水印,当g=1时,W0,n为私钥Key,
Figure F2008101507573C000211
为第g-1组的第n帧的水印,即前一帧提取的水印,
Lg,1为第g组第1帧的线谱频率系数,
Pg,2为第g组第2帧的基音周期;
(3b)若当前帧为最后一组的最后一帧,设最后一组有m帧,则按下式生成水印 
Figure F2008101507573C000212
式中,
Figure F2008101507573C000214
为第T组第m帧生成的验证水印,
Figure F2008101507573C000215
为第T组的第m-1帧提取的水印,
LT,m为第T组第m帧的线谱频率系数,
(T-1)×n+m为语音总帧数;
(3c)其它情况,则按下式生成水印Wg,i,即
Figure F2008101507573C00031
式中,
Figure F2008101507573C00032
为第g组的第i帧生成的验证水印,
Figure F2008101507573C00033
为第g组的第i-1帧提取的水印,
Lg,i为第g组的第i帧的线谱频率系数,
Pg,i+1为第g组第i+1帧的基音周期。
5.根据权利要求3所述的水印提取验证方法,其中步骤4)所述的判断攻击的位置和类型,按如下过程进行:
(4a)检测攻击位置
从第一组第一帧开始,比较提取的水印和生成的验证水印
Figure F2008101507573C00035
Figure F2008101507573C00037
一致,则继续比较下一帧;若 
Figure F2008101507573C00038
判定第g组第i帧错误,则受攻击的位置为第g组第i帧;
(4b)设定错误类型
第一类错误:某一组的第一帧提取水印与验证水印不一致,但其前一帧和后一帧的提取水印与验证水印一致,即: 
Figure F2008101507573C00039
Figure F2008101507573C000310
第二类错误:最后一组的最后一帧提取水印与验证水印不一致,但其前一帧的提取水印与验证水印一致;
第三类错误:其它的错误为第三类错误;
(4c)根据不同错误类型的不同分布判断攻击类型
若攻击类型为***攻击,则***攻击的位置出现连续的第三类错误,在连续的第三类错误后等间隔的出现第一类和第三类错误,最后一帧出现第二类错误,间隔为每组包含的帧数;
若攻击类型为替换攻击,则替换攻击的位置出现连续的第三类错误,其它帧无错误;
若攻击类型为删除攻击,则在删除攻击的位置之后等间隔的出现第一类和第三类错误,间隔为每组的包含帧数,最后一帧会出现第二类错误。
CN2008101507573A 2008-08-29 2008-08-29 基于骨导的语音压缩水印方法 Expired - Fee Related CN101350198B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101507573A CN101350198B (zh) 2008-08-29 2008-08-29 基于骨导的语音压缩水印方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101507573A CN101350198B (zh) 2008-08-29 2008-08-29 基于骨导的语音压缩水印方法

Publications (2)

Publication Number Publication Date
CN101350198A CN101350198A (zh) 2009-01-21
CN101350198B true CN101350198B (zh) 2011-09-21

Family

ID=40268955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101507573A Expired - Fee Related CN101350198B (zh) 2008-08-29 2008-08-29 基于骨导的语音压缩水印方法

Country Status (1)

Country Link
CN (1) CN101350198B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011155323A (ja) * 2010-01-25 2011-08-11 Sony Corp 電子透かし生成装置、電子透かし検証装置、電子透かし生成方法及び電子透かし検証方法
CN107545899B (zh) * 2017-09-06 2021-02-19 武汉大学 一种基于清音基音延迟抖动特性的amr隐写方法
CN114333859A (zh) * 2020-09-30 2022-04-12 华为技术有限公司 一种音频水印添加、解析方法、设备及介质
US20220303642A1 (en) * 2021-03-19 2022-09-22 Product Development Associates, Inc. Securing video distribution

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李静.基于骨导信号的语音重构技术.《西北工业大学硕士论文》.2004, *
陈明奇,钮心忻,杨义先.数字水印的攻击方法.《电子与信息学报》.2001,705-711. *

Also Published As

Publication number Publication date
CN101350198A (zh) 2009-01-21

Similar Documents

Publication Publication Date Title
CN101345054B (zh) 用于声频文件的数字水印制作及识别方法
Nematollahi et al. Digital watermarking
Li et al. Detection of quantization index modulation steganography in G. 723.1 bit stream based on quantization index sequence analysis
CN101271690B (zh) 保护音频数据的音频扩频水印处理方法
US7140043B2 (en) Watermark embedding and detecting method by quantization of a characteristic value of a signal
CN107993669B (zh) 基于修改最低有效位数权重的语音内容认证和篡改恢复方法
CN101350198B (zh) 基于骨导的语音压缩水印方法
Chen et al. Content-dependent watermarking scheme in compressed speech with identifying manner and location of attacks
CN105304091B (zh) 一种基于dct的语音篡改恢复方法
CN103456308B (zh) 一种可恢复的密文域语音内容认证方法
Park et al. Speech authentication system using digital watermarking and pattern recovery
CN105895109B (zh) 一种基于dwt和dct的数字语音取证和篡改恢复方法
Wang et al. Tampering Detection Scheme for Speech Signals using Formant Enhancement based Watermarking.
Wu et al. Audio watermarking algorithm with a synchronization mechanism based on spectrum distribution
Wu et al. Fragile speech watermarking for content integrity verification
CN114999502B (zh) 基于自适应字分帧的语音内容水印生成、嵌入方法、语音内容的完整性认证及篡改定位方法
CN100353444C (zh) 一种数字音频防篡改方法
Wu et al. Speech Content Authentication Integrated With Celp Speech Coders.
CN113035213B (zh) 数字音频水印检测方法及装置
Yargıçoğlu et al. Hidden data transmission in mixed excitation linear prediction coded speech using quantisation index modulation
CN108877819B (zh) 一种基于系数自相关度的语音内容取证方法
Wu et al. Comparison of two speech content authentication approaches
Jiao et al. Compressed domain perceptual hashing for MELP coded speech
Trivedi et al. An algorithmic digital audio watermarking in perceptual domain using direct sequence spread spectrum
Blackledge et al. Audio data verification and authentication using frequency modulation based watermarking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110921

Termination date: 20140829

EXPY Termination of patent right or utility model