CN105976823B - 基于相位编码的自适应音频水印方法及*** - Google Patents

基于相位编码的自适应音频水印方法及*** Download PDF

Info

Publication number
CN105976823B
CN105976823B CN201610458411.4A CN201610458411A CN105976823B CN 105976823 B CN105976823 B CN 105976823B CN 201610458411 A CN201610458411 A CN 201610458411A CN 105976823 B CN105976823 B CN 105976823B
Authority
CN
China
Prior art keywords
frequency
watermark
signal
audio
phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610458411.4A
Other languages
English (en)
Other versions
CN105976823A (zh
Inventor
陈怡�
高戈
张康
刘影
吕冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong Normal University
Original Assignee
Huazhong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong Normal University filed Critical Huazhong Normal University
Priority to CN201610458411.4A priority Critical patent/CN105976823B/zh
Publication of CN105976823A publication Critical patent/CN105976823A/zh
Application granted granted Critical
Publication of CN105976823B publication Critical patent/CN105976823B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明提供基于相位编码的自适应音频水印方法及***,嵌入过程包括做FFT时频变换,计算各帧频域信号能够嵌入水印的范围,生成二进制伪随机的扩频序列,进行对于音调成分的判断,采用全局掩蔽阈值得到相位谱的相位掩蔽阈值;得到嵌入水印后的相位谱,生成带有水印的音频文件;检测过程包括做FFT的时频变换,计算各帧频域信号能够嵌入水印的范围,生成二进制伪随机的扩频序列,进行相关统计检验得到水印比特。本发明放宽频谱有音调区域的判断,使得计算的全局掩蔽阈值更精确,在相位谱上根据相位角度的掩蔽阈值自适应的调整水印的嵌入强度,确保音频水印在不可感知的情况下,使水印的嵌入强度最大来确保音频水印的鲁棒性。

Description

基于相位编码的自适应音频水印方法及***
技术领域
本发明涉及数字音频水印领域,尤其涉及基于相位编码的自适应音频水印方法及***。
背景技术
数字音频水印是向音频信号中添加某些数字信息以达到文件真伪鉴别、版权保护、信息隐藏等目的的信号处理操作。基于相位编码的自适应音频水印***是指根据心理声学模型在相位谱上动态的调整水印的嵌入强度,确保音频水印在满足不可感知性的条件下鲁棒性最大。传统的基于相位编码的音频水印嵌入算法,直接在相位谱上添加固定强度水印。如果嵌入水印的强度过大,很容易产生噪声,影响音质;如果嵌入水印的强度过小,在检测是不易检查出来,影响鲁棒性。另外音频信号是动态变化的,即使在某些区域嵌入的强度适宜,但对另一些区域来说可能嵌入强度过大或过小。这样的水印嵌入方式使音频水印不能同时满足不可感知性和鲁棒性。
发明内容
本发明的目的是提供基于相位编码的自适应音频水印技术方案,使在相位谱的水印嵌入强度根据音频信号自适应的调整,来达到音频水印不可感知性和鲁棒性的折衷。
本发明技术方案提供一种基于相位编码的自适应音频水印方法,包括嵌入过程和检测过程,
所述嵌入过程包括以下步骤,
步骤A1,读取音频文件,得到时域的音频信号x和采样率fs1,对时域的音频信号x先分帧,帧长用N表示,xn表示第n帧时域信号,再做时频变换,得到频域的音频信号的幅值谱Xn以及相位谱
步骤A2,根据采样率fs1、帧长度N以及根据人耳感知敏感的频率部分预设的嵌入的开始频率FWMIN、结束频率FWMAX,计算各帧频域信号能够嵌入水印的范围,得到此范围的最大值freqmax1和最小值freqmin1,选取此范围内的频域音频信号;
freqmin1=floor((FWMIN×2.0/fs1)×N)
freqmax1=floor((FWMAX×2.0/fs1)×N)
其中,floor是向下取整函数;
步骤A3,利用密钥key作为随机数种子,生成长度为freqmax1-freqmin1+1的二进制伪随机的扩频序列u;
步骤A4,进行对于音调成分的判断如下,
其中,k表示所在的频率局部最大值点,j表示离局部最大值点k的距离,Pn[k]dB表示第n帧信号的在局部最大值点k处的信号功率,Pn[k-j]dB表示距离最大值点j处的信号功率值;
根据判断结果,采用全局掩蔽阈值Thn,得到相位谱的相位掩蔽阈值θn
步骤A5,根据伪随机序列u、相位掩蔽阈值θn和水印比特b,利用以下公式在音频的相位谱上进行水印的嵌入,得到嵌入水印后的相位谱如下,
其中,α为常数,控制水印嵌入的强度;
利用频域信号的幅度谱Xn和嵌入水印后的相位谱然后通过欧拉公式得到嵌入水印后的频域信号如下,
其中,Yn为嵌入水印后的频域信号,e为自然指数;
步骤A6,将嵌入水印后的频域信号Yn变换到时域信号yn,生成带有水印的音频文件;所述检测过程包括以下步骤,
步骤B1,读取带有水印的时域音频文件,得到时域的带有水印的音频信号的幅值数据z和采样率fs2,对时域信号先分帧,帧长为N,zn为待检测信号的第n帧;再做时频变换,得到频域的音频信号的幅度谱Zn和相位谱ξn
步骤B2,根据采样率fs2,帧长度N以及根据人耳感知敏感的频率部分预设的嵌入的开始频率FWMIN、结束频率FWMAX,计算各帧频域信号能够嵌入水印的范围,得到此范围的最大值freqmax2和最小值freqmin2,选取此范围内的音频的幅度谱;
freqmin2=floor((FWMIN×2.0/fs2)×N)
freqmax2=floor((FWMAX×2.0/fs2)×N)
其中,floor是向下取整函数;
步骤B3,利用密钥key作为随机数种子,生成长度为freqmax2-freqmin2+1的二进制伪随机的扩频序列u;
步骤B4,根据以下相关统计检验公式,对伪随机序列u和待检测信号第n帧的相位谱ξn,做相关计算,得到待检信号第n帧信号的检测充分统计量rn
其中,<·>表示信号的内积计算;
如果检测充分统计量rn≥0,那么检测到的水印比特b=1;否则为b=0。
而且,步骤A4中,利用三角关系得到相位谱的相位掩蔽阈值θn
本发明相应提供一种基于相位编码的自适应音频水印***,包括音频水印嵌入子***和自适应音频水印检测子***,
所述音频水印嵌入子***包括以下模块,
第一时频转换模块,用于读取音频文件,得到时域的音频信号x和采样率fs1,对时域的音频信号x先分帧,帧长用N表示,xn表示第n帧时域信号,再做时频变换,得到频域的音频信号的幅值谱Xn以及相位谱
第一嵌入范围选择模块,用于根据采样率fs1、帧长度N以及根据人耳感知敏感的频率部分预设的嵌入的开始频率FWMIN、结束频率FWMAX,计算各帧频域信号能够嵌入水印的范围,得到此范围的最大值freqmax1和最小值freqmin1,选取此范围内的频域音频信号;
freqmin1=floor((FWMIN×2.0/fs1)×N)
freqmax1=floor((FWMAX×2.0/fs1)×N)
其中,floor是向下取整函数;
第一扩频序列生成模块,用于利用密钥key作为随机数种子,生成长度为freqmax1-freqmin1+1的二进制伪随机的扩频序列u;
改进的心理声学模块,用于进行对于音调成分的判断如下,
其中,k表示所在的频率局部最大值点,j表示离局部最大值点k的距离,Pn[k]dB表示第n帧信号的在局部最大值点k处的信号功率,Pn[k-j]dB表示距离最大值点j处的信号功率值;
根据判断结果,采用全局掩蔽阈值Thn,得到相位谱的相位掩蔽阈值θn
加性嵌入模块,用于根据伪随机序列u、相位掩蔽阈值θn和水印比特b,利用以下公式在音频的相位谱上进行水印的嵌入,得到嵌入水印后的相位谱如下,
其中,α为常数,控制水印嵌入的强度;
利用频域信号的幅度谱Xn和嵌入水印后的相位谱然后通过欧拉公式得到嵌入水印后的频域信号如下,
其中,Yn为嵌入水印后的频域信号,e为自然指数;
时频逆变换模块,用于将嵌入水印后的频域信号Yn变换到时域信号yn,生成带有水印的音频文件;
所述自适应音频水印检测子***包括以下模块,
第二时频转换模块,用于读取带有水印的时域音频文件,得到时域的带有水印的音频信号的幅值数据z和采样率fs2,对时域信号先分帧,帧长为N,zn为待检测信号的第n帧;再做时频变换,得到频域的音频信号的幅度谱Zn和相位谱ξn
第二嵌入范围选择模块,用于根据采样率fs2,帧长度N以及根据人耳感知敏感的频率部分预设的嵌入的开始频率FWMIN、结束频率FWMAX,计算各帧频域信号能够嵌入水印的范围,得到此范围的最大值freqmax2和最小值freqmin2,选取此范围内的音频的幅度谱;
freqmin2=floor((FWMIN×2.0/fs2)×N)
freqmax2=floor((FWMAX×2.0/fs2)×N)
其中,floor是向下取整函数;
第二扩频序列生成模块,用于利用密钥key作为随机数种子,生成长度为freqmax2-freqmin2+1的二进制伪随机的扩频序列u;
相关提取模块,用于根据以下相关统计检验公式,对伪随机序列u和待检测信号第n帧的相位谱ξn,做相关计算,得到待检信号第n帧信号的检测充分统计量rn
其中,<·>表示信号的内积计算;
如果检测充分统计量rn≥0,那么检测到的水印比特b=1;否则为b=0。
而且,改进的心理声学模块中,利用三角关系得到相位谱的相位掩蔽阈值θn
本发明选择在音频信号的相位谱上嵌入水印依赖于人耳对相位修改的不敏感。通过放宽对心理声学模型一中频谱有音调区域的判断,来得到更多的有音调的成分,使得计算的全局掩蔽阈值更精确,利用可修改的幅度与可修改相位角度之间的三角关系得到相位角度的掩蔽阈值,从而能够在相位谱上根据相位角度的掩蔽阈值自适应的调整水印的嵌入强度,确保音频水印在不可感知的情况下,使水印的嵌入强度最大来确保音频水印的鲁棒性。本发明技术方案具有重要的市场价值。
附图说明
图1是本发明实施例的嵌入子***结构框图。
图2是本发明实施例的检测子***结构框图。
图3是本发明实施例的嵌入过程流程图
图4是本发明实施例的检测过程流程图。
具体实施方式
下面以具体实施例结合附图对本发明的技术方案作进一步说明。
本发明实施例提供的一种基于相位编码的自适应音频水印***,包括音频水印嵌入子***和自适应音频水印检测子***。
参见图1,本发明实施例提供的基于相位编码的自适应音频水印嵌入子***,包括第一时频转换模块1、第一嵌入范围选择模块2、第一扩频序列生成模块3、改进的心理声学模块4、加性嵌入模块5和时频逆变换模块6,具体实施时可以采用软件固化技术实现各模块。
所述第一时频转换模块1,用于将读取到的时域音频信号转换为频域信号,并将时域音频信号的相关信息以及频域信号输出给第一嵌入范围选择模块2;
所述第一嵌入范围选择模块2,根据读取到的时域音频信号的信息(采样率)和频域信号以及人耳较为敏感的频率范围计算此频域信号可以嵌入水印的范围,将该嵌入范围的最大值和最小值输出给第一扩频序列生成模块3;
所述第一扩频序列生成模块3,用于根据随机数种子和嵌入范围选择模块2输入的嵌入范围的最大值和最小值生成与嵌入范围同长度的幅值为1或-1均匀分布的随机序列,并将此随机序列输出给加性嵌入模块5;
所述改进的心理声学模块4,通过放宽心理声学模型一中有声调区域的判决条件,来得到更多的有声调区,从而提供更好的幅值掩蔽阈值,然后根据可改变阈值与原始幅值的三角关系得到可以调整的相位角度阈值,并将相位角度阈值输出给加性嵌入模块5;
所述加性嵌入模块5,用于根据生成频域的带有水印信息的音频信号输出给时频逆变换模块6;
所述时频逆变换模块6,用于将加性嵌入模块5输入的频域的带有水印信息的音频信号转换为时域的带有水印信息的音频信号,并生成音频文件,得到的带有水印信息的音频文件。
参见图2,本发明实施例提供的基于相位编码的自适应音频水印检测子***,包括第二时频转换模块7、第二嵌入范围选择模块8、第二扩频序列生成模块9、相关提取模块10,具体实施时可以采用软件固化技术实现各模块。
所述第二时频转换模块7与模块1的功能基本相同,将产生的结果输出给嵌入范围选择模块8;
所述第二嵌入范围选择模块8与模块2的功能基本相同,将嵌入范围的最大值和最小值输出给扩频序列生成模块9,将嵌入范围内的信号输出相关检测模块10;
所述第二扩频序列生成模块9与模块3的功能基本相同,将产生的结果输出给相关检测模块10;
所述相关检测模块10,用于根据嵌入范围选择模块8输入的信号和扩频序列生成模块9输入的扩频序列,计算相关值,根据相关值的符号,判断出水印。
各模块具体实现参见方法相应步骤,本发明不予赘述。本发明实施例提供的一种基于相位编码的自适应音频水印方法,包括嵌入过程和检测过程。
参见图3,本发明实施例提供的基于相位编码的自适应音频水印嵌入过程,可以采用计算机软件技术手段自动进行流程,具体包括以下步骤:
步骤A1,读取音频文件,得到时域的音频信号x和采样率fs1,对时域信号先分帧(帧长用N表示,xn表示第n帧时域信号)再做时频变换(例如FFT快速傅里叶变换),分别取频域音频信号幅值谱Xn以及相位谱
步骤A2,根据采样率fs1,帧长度N以及人耳较为敏感的频率范围(本领域技术人员可根据人耳感知特性自行设定,例如1000-7000Hz)计算频域信号帧可以嵌入水印的范围,得到此范围的最大值为freqmax1,最小值为freqmin1,选取此范围内的频域音频信号;
freqmin1=floor((FWMIN×2.0/fs1)×N) (1)
freqmax1=floor((FWMAX×2.0/fs1)×N) (2)
FWMIN,FWMAX分别表示人耳较为敏感的最低频率和最高频率,即根据人耳感知敏感的频率部分预设的嵌入的开始频率、结束频率;floor是向下取整函数。
步骤A3,利用密钥key作为随机数种子,生成长度为freqmax1-freqmin1+1的二进制伪随机的扩频序列u;
在MATLAB中的实施例具体过程如下:
首先,利用密钥key,调用RandStream函数(随机种子函数)对rand函数(随机数生成函数)进行初始化,然后调用rand函数生成随机数,由于rand函数生成的随机数是0~1之间的数,还需对这些数进行四舍五入变成0和1的二进制伪随机序列,然后将此单极性的伪随机序列,转为双极性只含有+1和-1的伪随机序列u。
步骤A4,修改ISO-MPEG心理声学模型一对于音调成分的判断,通过得到更多的音调成分来得到更准确的幅度信号的掩蔽阈值,对于最后的掩蔽阈值不采用子带内的最小掩蔽阈值,而是直接采用全局掩蔽阈值Thn,然后利用三角关系得到相位谱的相位掩蔽阈值θn
实施例具体过程如下:
将ISO-MPEG心理声学模型一中频谱有声调区域判断条件,在功率谱Pn的局部最大值点k必须大于附近所有频率点7dB,修改为大于附近所有样本频率1dB,并且存在大于7dB的情况即可。
其中,k表示所在的频率局部最大值点,j表示离局部最大值点k的距离,Pn[k]dB表示第n帧信号的在局部最大值点k处的信号功率,Pn[k-j]dB表示距离最大值点j处的信号功率值。
基于以上修改后判断条件,得到对于音调成分的判断结果后,计算得到全局掩蔽阈值Thn。全局掩蔽阈值为信号幅度在不失真情况下可修改的最大的值。在实轴和虚轴组成的二维平面内,针对频域点,以掩蔽阈值为半径构成的圆为该频域点可以修改的区域,当修改后的频域点与原点的连线与圆相切时,变动的相位值最大,即为相位角度可变的最大值,作为相位掩蔽阈值,利用三角关系可以得到相位掩蔽阈值θn
步骤A5,根据伪随机序列u、相位掩蔽阈值θn和水印比特b,利用下面的公式在音频的相位谱上进行水印的嵌入,得到嵌入水印后的相位谱
其中,α为常数,控制水印嵌入的强度,具体实施时本领域技术人员可预设取值。
利用频域信号的幅度谱Xn和嵌入水印后的相位谱然后通过欧拉公式得到嵌入水印后的频域信号
其中,Yn为嵌入水印后的频域信号,e为自然指数。
步骤A6,将嵌入水印后的频域信号Yn变换到时域信号yn,最后生成音频文件,即得到带有水印的音频文件。
各模块具体实现参见方法相应步骤,本发明不予赘述。本发明实施例提供的基于相位编码的自适应音频水印检测方法,包括嵌入过程和检测过程。
参见图4,本发明实施例提供的基于相位编码的自适应音频水印检测方式,可以采用计算机软件技术手段自动进行流程,具体包括以下步骤:
步骤B1,读取带有水印的时域音频文件,得到时域的带有水印的音频信号的幅值数据z和采样率fs2,对时域信号先分帧(帧长同样为N,zn为待检测信号的第n帧)再做时频变换(例如FFT快速傅里叶变换),得到频域的音频信号的幅度谱Zn和相位谱ξn
步骤B2,根据采样率fs2,帧长度N以及人耳较为敏感的频率范围计算此频域信号可以嵌入水印的范围,得到此范围的最大值为freqmax2,最小值为freqmin2,选取此范围内的音频的幅度谱;
freqmin2=floor((FWMIN×2.0/fs2)×N) (8)
freqmax2=floor((FWMAX×2.0/fs2)×N) (9)
FWMIN,FWMAX分别表示人耳较为敏感的最低频率和最高频率,即根据人耳感知敏感的频率部分预设的嵌入的开始频率、结束频率;floor是MATLAB里面的向下取整函数。
步骤B3,利用密钥key,采取和水印嵌入时一样的方式生成双极性只有+1和-1的二值伪随机序列u。即利用密钥key作为随机数种子,生成长度为freqmax2-freqmin2+1的二进制伪随机的扩频序列u。
步骤B4,根据相关统计检验公式(10),对伪随机序列u和待检测信号第n帧的相位谱ξn,做相关计算,得到待检信号第n帧信号的检测充分统计量rn
式中<·>表示信号的内积计算。
如果检测充分统计量rn≥0,那么检测到的水印比特b=1;否则为b=0。
本发明中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (4)

1.一种基于相位编码的自适应音频水印方法,其特征在于:包括嵌入过程和检测过程,
所述嵌入过程包括以下步骤,
步骤A1,读取音频文件,得到时域的音频信号x和采样率fs1,对时域的音频信号x先分帧,帧长用N表示,xn表示第n帧时域信号,再做时频变换,得到频域的音频信号的幅值谱Xn以及相位谱
步骤A2,根据采样率fs1、帧长N以及根据人耳感知敏感的频率部分预设的嵌入的开始频率FWMIN、结束频率FWMAX,计算各帧频域信号能够嵌入水印的范围,得到此范围的最大值freqmax1和最小值freqmin1,选取此范围内的频域音频信号;
freqmin1=floor((FWMIN×2.0/fs1)×N)
freqmax1=floor((FWMAX×2.0/fs1)×N)
其中,floor是向下取整函数;
步骤A3,利用密钥key作为随机数种子,生成长度为freqmax1-freqmin1+1的二进制伪随机的扩频序列u;
步骤A4,进行对于音调成分的判断如下,
Pn[k]dB-Pn[k-j]dB≥1
Pn[k]dB-Pn[k-j]dB≥7
其中,k表示所在的频率局部最大值点,j表示离局部最大值点k的距离,Pn[k]dB表示第n帧信号的在局部最大值点k处的信号功率,Pn[k-j]dB表示距离最大值点j处的信号功率值;
根据判断结果,采用全局掩蔽阈值Thn,得到相位谱的相位掩蔽阈值θn
步骤A5,根据伪随机序列u、相位掩蔽阈值θn和水印比特b,利用以下公式在音频的相位谱上进行水印的嵌入,得到嵌入水印后的相位谱如下,
其中,α为常数,控制水印嵌入的强度;
利用频域信号的幅度谱Xn和嵌入水印后的相位谱然后通过欧拉公式得到嵌入水印后的频域信号如下,
其中,Yn为嵌入水印后的频域信号,e为自然指数;
步骤A6,将嵌入水印后的频域信号Yn变换到时域信号yn,生成带有水印的音频文件;所述检测过程包括以下步骤,
步骤B1,读取带有水印的时域音频文件,得到时域的带有水印的音频信号的幅值数据z和采样率fs2,对时域信号先分帧,帧长为N,zn为待检测信号的第n帧;再做时频变换,得到频域的音频信号的幅度谱Zn和相位谱ξn
步骤B2,根据采样率fs2,帧长N以及根据人耳感知敏感的频率部分预设的嵌入的开始频率FWMIN、结束频率FWMAX,计算各帧频域信号能够嵌入水印的范围,得到此范围的最大值freqmax2和最小值freqmin2,选取此范围内的音频的幅度谱;
freqmin2=floor((FWMIN×2.0/fs2)×N)
freqmax2=floor((FWMAX×2.0/fs2)×N)
其中,floor是向下取整函数;
步骤B3,利用密钥key作为随机数种子,生成长度为freqmax2-freqmin2+1的二进制伪随机的扩频序列u;
步骤B4,根据以下相关统计检验公式,对伪随机序列u和待检测信号第n帧的相位谱ξn,做相关计算,得到待检信号第n帧信号的检测充分统计量rn
其中,<>表示信号的内积计算;
如果检测充分统计量rn≥0,那么检测到的水印比特b=1;否则为b=0。
2.根据权利要求1所述基于相位编码的自适应音频水印方法,其特征在于:步骤A4中,利用三角关系得到相位谱的相位掩蔽阈值θn
3.一种基于相位编码的自适应音频水印***,其特征在于:包括音频水印嵌入子***和自适应音频水印检测子***,
所述音频水印嵌入子***包括以下模块,
第一时频转换模块,用于读取音频文件,得到时域的音频信号x和采样率fs1,对时域的音频信号x先分帧,帧长用N表示,xn表示第n帧时域信号,再做时频变换,得到频域的音频信号的幅值谱Xn以及相位谱
第一嵌入范围选择模块,用于根据采样率fs1、帧长N以及根据人耳感知敏感的频率部分预设的嵌入的开始频率FWMIN、结束频率FWMAX,计算各帧频域信号能够嵌入水印的范围,得到此范围的最大值freqmax1和最小值freqmin1,选取此范围内的频域音频信号;
freqmin1=floor((FWMIN×2.0/fs1)×N)
freqmax1=floor((FWMAX×2.0/fs1)×N)
其中,floor是向下取整函数;
第一扩频序列生成模块,用于利用密钥key作为随机数种子,生成长度为freqmax1-freqmin1+1的二进制伪随机的扩频序列u;
改进的心理声学模块,用于进行对于音调成分的判断如下,
Pn[k]dB-Pn[k-j]dB≥1
Pn[k]dB-Pn[k-j]dB≥7
其中,k表示所在的频率局部最大值点,j表示离局部最大值点k的距离,Pn[k]dB表示第n帧信号的在局部最大值点k处的信号功率,Pn[k-j]dB表示距离最大值点j处的信号功率值;
根据判断结果,采用全局掩蔽阈值Thn,得到相位谱的相位掩蔽阈值θn
加性嵌入模块,用于根据伪随机序列u、相位掩蔽阈值θn和水印比特b,利用以下公式在音频的相位谱上进行水印的嵌入,得到嵌入水印后的相位谱如下,
其中,α为常数,控制水印嵌入的强度;
利用频域信号的幅度谱Xn和嵌入水印后的相位谱然后通过欧拉公式得到嵌入水印后的频域信号如下,
其中,Yn为嵌入水印后的频域信号,e为自然指数;
时频逆变换模块,用于将嵌入水印后的频域信号Yn变换到时域信号yn,生成带有水印的音频文件;
所述自适应音频水印检测子***包括以下模块,
第二时频转换模块,用于读取带有水印的时域音频文件,得到时域的带有水印的音频信号的幅值数据z和采样率fs2,对时域信号先分帧,帧长为N,zn为待检测信号的第n帧;再做时频变换,得到频域的音频信号的幅度谱Zn和相位谱ξn
第二嵌入范围选择模块,用于根据采样率fs2,帧长N以及根据人耳感知敏感的频率部分预设的嵌入的开始频率FWMIN、结束频率FWMAX,计算各帧频域信号能够嵌入水印的范围,得到此范围的最大值freqmax2和最小值freqmin2,选取此范围内的音频的幅度谱;
freqmin2=floor((FWMIN×2.0/fs2)×N)
freqmax2=floor((FWMAX×2.0/fs2)×N)
其中,floor是向下取整函数;
第二扩频序列生成模块,用于利用密钥key作为随机数种子,生成长度为freqmax2-freqmin2+1的二进制伪随机的扩频序列u;
相关提取模块,用于根据以下相关统计检验公式,对伪随机序列u和待检测信号第n帧的相位谱ξn,做相关计算,得到待检信号第n帧信号的检测充分统计量rn
其中,<>表示信号的内积计算;
如果检测充分统计量rn≥0,那么检测到的水印比特b=1;否则为b=0。
4.根据权利要求3所述基于相位编码的自适应音频水印***,其特征在于:改进的心理声学模块中,利用三角关系得到相位谱的相位掩蔽阈值θn
CN201610458411.4A 2016-06-22 2016-06-22 基于相位编码的自适应音频水印方法及*** Expired - Fee Related CN105976823B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610458411.4A CN105976823B (zh) 2016-06-22 2016-06-22 基于相位编码的自适应音频水印方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610458411.4A CN105976823B (zh) 2016-06-22 2016-06-22 基于相位编码的自适应音频水印方法及***

Publications (2)

Publication Number Publication Date
CN105976823A CN105976823A (zh) 2016-09-28
CN105976823B true CN105976823B (zh) 2019-06-25

Family

ID=57021552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610458411.4A Expired - Fee Related CN105976823B (zh) 2016-06-22 2016-06-22 基于相位编码的自适应音频水印方法及***

Country Status (1)

Country Link
CN (1) CN105976823B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220020383A1 (en) * 2020-02-04 2022-01-20 Beijing Dajia Internet Information Technology Co., Ltd. Method for adding watermark information, method for extracting watermark information, and electronic device

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2881941A1 (en) * 2013-12-09 2015-06-10 Thomson Licensing Method and apparatus for watermarking an audio signal
CN109102814B (zh) * 2018-09-13 2020-12-01 河海大学 一种dct变换下面向相位的音频水印方法
CN109714284B (zh) * 2018-11-27 2020-06-30 华中科技大学 一种基于k-s检测的射频水印检测方法
US11914090B2 (en) * 2019-08-28 2024-02-27 Pgs Geophysical As Mitigating residual noise in a marine survey with orthogonal coded pseudo-random sweeps
CN113362835B (zh) * 2020-03-05 2024-06-07 杭州网易云音乐科技有限公司 音频水印处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539095B1 (en) * 1993-11-18 2003-03-25 Geoffrey B. Rhoads Audio watermarking to convey auxiliary control information, and media embodying same
CN101101754A (zh) * 2007-06-25 2008-01-09 中山大学 一种基于傅立叶离散对数坐标变换的稳健音频水印方法
CN101740033A (zh) * 2008-11-24 2010-06-16 华为技术有限公司 一种音频编码方法和音频编码器
CN102074240A (zh) * 2010-12-24 2011-05-25 中国科学院声学研究所 一种用于版权管理的数字音频水印算法
CN102142258A (zh) * 2011-03-31 2011-08-03 上海第二工业大学 一种基于小波变换和Arnold的自适应灰度水印嵌入方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9401153B2 (en) * 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539095B1 (en) * 1993-11-18 2003-03-25 Geoffrey B. Rhoads Audio watermarking to convey auxiliary control information, and media embodying same
CN101101754A (zh) * 2007-06-25 2008-01-09 中山大学 一种基于傅立叶离散对数坐标变换的稳健音频水印方法
CN101740033A (zh) * 2008-11-24 2010-06-16 华为技术有限公司 一种音频编码方法和音频编码器
CN102074240A (zh) * 2010-12-24 2011-05-25 中国科学院声学研究所 一种用于版权管理的数字音频水印算法
CN102142258A (zh) * 2011-03-31 2011-08-03 上海第二工业大学 一种基于小波变换和Arnold的自适应灰度水印嵌入方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于相位的音频数字水印算法;曾满红等;《微处理机》;20060430(第2期);第48-49,52页

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220020383A1 (en) * 2020-02-04 2022-01-20 Beijing Dajia Internet Information Technology Co., Ltd. Method for adding watermark information, method for extracting watermark information, and electronic device

Also Published As

Publication number Publication date
CN105976823A (zh) 2016-09-28

Similar Documents

Publication Publication Date Title
CN105976823B (zh) 基于相位编码的自适应音频水印方法及***
Lei et al. Robust SVD-based audio watermarking scheme with differential evolution optimization
Djebbar et al. A view on latest audio steganography techniques
US9812147B2 (en) System and method for generating an audio signal representing the speech of a user
CN101101754B (zh) 一种基于傅立叶离散对数坐标变换的稳健音频水印方法
US20140119548A1 (en) Device comprising a plurality of audio sensors and a method of operating the same
JP4896455B2 (ja) データ埋込装置、データ埋込方法、データ抽出装置、及び、データ抽出方法
CN106409302B (zh) 基于嵌入区域选择的音频水印方法及***
CN110163787A (zh) 基于双树复小波变换的音频数字鲁棒盲水印嵌入方法
Baras et al. Controlling the inaudibility and maximizing the robustness in an audio annotation watermarking system
CN1647186A (zh) 多媒体信号的时域加水印
KR100814792B1 (ko) 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법
Singh A survey on audio steganography approaches
Khademi et al. Audio watermarking based on quantization index modulation in the frequency domain
Dieu et al. An improved technique for hiding data in audio
Nita et al. Tic-tac, forgery time has run-up! live acoustic watermarking for integrity check in forensic applications
Wu et al. Adaptive audio watermarking based on SNR in localized regions
Wu et al. Comparison of two speech content authentication approaches
Nishimura Data hiding for audio signals that are robust with respect to air transmission and a speech codec
Li et al. A novel audio watermarking in wavelet domain
Chowdhury et al. A tutorial for audio watermarking in the cepstrum domain
Hernaez et al. Speech watermarking based on coding of the harmonic phase
Xiong et al. An Optimized Anti-Noise Receiving Method Based on Spreading Spectrum Audio Watermarking System
US20160379653A1 (en) Method and apparatus for increasing the strength of phase-based watermarking of an audio signal
Ratanasanya et al. New psychoacoustic models for wavelet based audio watermarking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190625

CF01 Termination of patent right due to non-payment of annual fee