KR101201076B1 - 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법 - Google Patents

오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법 Download PDF

Info

Publication number
KR101201076B1
KR101201076B1 KR1020090072453A KR20090072453A KR101201076B1 KR 101201076 B1 KR101201076 B1 KR 101201076B1 KR 1020090072453 A KR1020090072453 A KR 1020090072453A KR 20090072453 A KR20090072453 A KR 20090072453A KR 101201076 B1 KR101201076 B1 KR 101201076B1
Authority
KR
South Korea
Prior art keywords
coefficients
watermark
fft
peak
applying
Prior art date
Application number
KR1020090072453A
Other languages
English (en)
Other versions
KR20110014871A (ko
Inventor
정의필
조상진
반투안 도
Original Assignee
울산대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산대학교 산학협력단 filed Critical 울산대학교 산학협력단
Priority to KR1020090072453A priority Critical patent/KR101201076B1/ko
Publication of KR20110014871A publication Critical patent/KR20110014871A/ko
Application granted granted Critical
Publication of KR101201076B1 publication Critical patent/KR101201076B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • G10L19/0216Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation using wavelet decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Optimization (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법이 개시된다. 본 발명은 멀티 비트 워터마크가 오디오의 the important frequency peaks로 삽입되는 알고리즘에 관한 것으로서, Advance Wigner distribution method는 오디오 파일의 특정 주파수 대역을 추정하는데 사용된다. 특정 주파수 대역에서 추출된 주요 피크에 워터마크가 삽입된다. 이는, 오디오 신호의 주요 특징 중 하나는 본원에서 사용되는 주요 피크가 불변한다는 것이다. 본 발명에 의해 워터마크가 삽입된 오디오 파일이 방송되면, 오디오 파일은 압축, 양자화 같은 공격에 의해서도 효과적인 강인성을 보여준다.
워터마크, 오디오, 강인성

Description

오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법{Apparatus and method for embedding audio watermark, and apparatus and method for detecting audio watermark}
본 발명은 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법에 관한 것으로, 더욱 상세하게는 주요 주파수 피크에 워터마크를 삽입하는 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법에 관한 것이다.
오디오 워터마킹(robust watermarking) 기술은 원 오디오 신호의 저작권을 보호하기 위한 기법 중 하나로서, 저작물에 저작권정보, 즉, 워터마크를 삽입하며, 삽입된 워터마크는 저작물의 다양한 변형에 의해서도 사라지지 않으므로 소유권을 주장할 수 있는 증거물로 사용된다. 오디오 워터마킹은 압축, 샘플링 등의 신호 처리에 강인해야 하며, 동시에 인간의 청각에 들리지 않도록 오디오 품질을 유지해야 한다.
그러나, 종래의 워터마킹 기술은 신호처리시 충분한 강인성(robustness)을 보여주지 못한다. 이는, 워터마크를 삽입할 최상의 변환 영역(transform domain) 계수를 선택하는데 어려움이 따르기 때문이다. 따라서, 신호 처리에 강인하며 워터마크의 삽입 및 검출이 용이한 방식이 필요하다.
따라서, 본 발명의 목적은 디지털 오디오신호에 워터마크를 삽입 후에도 오디오 신호의 음질을 유지하면서 신호처리에 강인하며, 디지털 오디오신호에 삽입된 워터마크를 손쉽게 검출할 수 있는 오디오 워터마크 삽입장치 및 그 방법, 그리고, 워터마크 검출장치 및 그 방법을 제공하고자 하는 데 있다.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 워터마크 삽입장치는, 원오디오 신호에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역 중 특정 주파수 대역을 선택하는 대역 선택부; 상기 선택된 특정 주파수 대역의 웨이블렛 계수들을 다수의 서브세트로 분리하고, 상기 각 서브세트의 피크에 대응하는 웨이블렛 계수인 피크 계수를 선택하는 피크 계수 선택부; 상기 서브세트 별로 선택되는 피크 계수에 워터마크를 삽입하는 워터마크 삽입부; 및 상기 워터마크가 삽입된 피크 계수와 상기 대역 선택부에서 선택되지 않은 주파수 대역들에 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 워터마크가 삽입된 오디오 신호를 복원하는 재구성부;를 포함한다.
상기 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주요 주파수 대역을 추정하는 대역 추정부;를 더 포함하며, 상기 대역 선택부는 상기 다수의 주파수 대역 중 상기 추정된 주요 주파수 대역을 포함하는 대역을 상기 특정 주파수 대역으로 선택한다.
상기 대역 추정부는 Wigner Distribution 방식과 STFT(Short-time Fourier transform) 방식을 이용하여 상기 스펙트럼을 산출한다.
대역 선택부는 상기 원오디오 신호에 DWT를 적용하여 상기 다수의 주파수 대역으로 분리하는 DWT부; 상기 다수의 주파수 대역 중 상기 특정 주파수 대역을 선택하는 선택부; 및 상기 선택된 특정 주파수 대역의 웨이블렛 계수들에 IDWT를 적용하여 재구성된 웨이블렛 계수들을 생성하는 IDWT부;를 포함한다.
상기 피크 계수 선택부는, 상기 재구성된 웨이블렛 계수들에 FFT(Fast Fourier transform)를 적용하여 FFT 계수들을 생성하는 FFT부; 및 상기 획득된 FFT 계수들을 각각 n개의 계수를 포함하는 상기 다수의 서브세트로 분리하고, 상기 각 서브세트 별로 피크를 확인한 후, 상기 확인된 각 피크에 대응하는 피크 계수들을 선택하는 선택부;를 포함한다.
상기 재구성부는, 상기 워터마크가 삽입된 피크 계수들과 상기 워터마크가 삽입되지 않은 웨이블렛 계수들을 결합한 후 IFFT(Inverse Fast Fourier transform)를 적용하여 상기 각 서브세트를 복원하는 IFFT부; 상기 복원된 각 서브세트에 상기 DWT를 적용하여 새로운 웨이블렛 계수를 생성하는 DWT부; 및 상기 다수의 주파수 대역에서 선택되지 않은 주파수 대역들의 웨이블렛 계수들과 상기 새로운 웨이블렛 계수들에 상기 IDWT를 적용하여 워터마크가 삽입된 오디오 신호를 출력하는 IDWT부;를 포함한다.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 워터마크 삽입방법은, 원오디오 신호에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역 중 특정 주파수 대역을 선택하는 단계; 상기 선택된 특정 주파수 대역의 웨이블렛 계수들을 다수의 서브세트로 분리하고, 상기 각 서브세트의 각 피크에 대 응하는 웨이블렛 계수인 피크 계수를 선택하는 단계; 상기 서브세트 별로 선택되는 피크 계수에 워터마크를 삽입하는 단계; 및 상기 워터마크가 삽입된 피크 계수와 상기 대역 선택부에서 선택되지 않은 주파수 대역들에 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 워터마크가 삽입된 오디오 신호를 출력하는 단계;를 포함한다.
상기 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주요 주파수 대역을 추정하는 단계;를 더 포함하며, 상기 대역을 선택하는 단계는, 상기 분리되는 다수의 주파수 대역 중 상기 추정된 주요 주파수 대역을 포함하는 대역을 상기 특정 주파수 대역으로 선택한다.
상기 추정하는 단계는. Wigner Distribution 방식과 STFT(Short-time Fourier transform) 방식을 이용하여 상기 스펙트럼을 산출한다.
상기 특정 주파수 대역을 선택하는 단계는, 상기 원오디오 신호에 DWT를 적용하여 상기 다수의 주파수 대역으로 분리하는 단계; 상기 다수의 주파수 대역 중 상기 특정 주파수 대역을 선택하는 단계; 및 상기 선택된 특정 주파수 대역의 웨이블렛 계수들에 IDWT를 적용하여 재구성된 웨이블렛 계수들을 생성하는 단계;를 포함한다.
상기 피크 계수를 선택하는 단계는, 상기 재구성된 웨이블렛 계수들에 FFT(Fast Fourier transform)를 적용하여 FFT 계수들을 생성하는 단계; 및 상기 획득된 FFT 계수를 각각 n개의 계수를 포함하는 상기 다수의 서브세트로 분리하고, 상기 각 서브세트 별로 피크를 확인한 후, 상기 확인된 각 피크에 대응하는 피크 계수들을 선택하는 단계;를 포함한다.
상기 출력하는 단계는, 상기 워터마크가 삽입된 피크 계수들과 상기 워터마크가 삽입되지 않은 웨이블렛 계수들을 결합한 후 IFFT(Inverse Fast Fourier transform)를 적용하여 상기 각 서브세트를 복원하는 단계; 상기 복원된 각 서브세트에 상기 DWT를 적용하여 새로운 웨이블렛 계수를 생성하는 단계; 및 상기 다수의 주파수 대역에서 선택되지 않은 주파수 대역들의 웨이블렛 계수들과 상기 새로운 상기 새로운 웨이블렛 계수들에 상기 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 워터마크가 삽입된 오디오 신호를 출력하는 단계;를 포함한다.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 워터마크 검출장치는, 원오디오 신호와 워터마크된 오디오 신호 각각에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역으로부터 제1특정 주파수 대역과 제2특정 주파수 대역을 각각 선택하는 대역 선택부; 상기 선택된 제1 및 제2특정 주파수 대역에 대해 FFT(Fast Fourier transform)를 적용하여 제1 및 제2FFT 계수를 획득하는 FFT부; 상기 제1FFT 계수를 다수의 제1서브세트로 분리하고, 상기 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수를 선택하며, 상기 제2FFT 계수를 다수의 제2서브세트로 분리하고, 상기 각 제2서브 세트의 피크에 대응하는 제2FFT 피크 계수를 선택하는 피크 계수 선택부; 및 상기 선택되는 제1 및 제2FFT 피크 계수를 비교하여 상기 워터마크를 검출하는 워터마크 검출부;를 포함한다.
상기 워터마크 검출부는 다음 조건에 의해 상기 워터마크를 검출한다.
Wij'=1, if Cij'-Cij≥0, 그리고,
Wij'=0, if Cij'-Cij<0
(i=1, 2, …, I, 그리고, j=1, 2, …, J)
여기서, Wij'는 워터마크, Cij는 상기 각 제1서브세트 중 i번째 서브세트에서 선택된 제1FFT 피크 계수, Cij'는 상기 각 제2서브세트 중 i번째 서브세트에서 선택된 제2FFT 피크 계수, j는 i번째 서브세트에서 각 제1 및 제2FFT 피그 계수의 위치이다.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 워터마크 검출방법은, 원오디오 신호와 워터마크된 오디오 신호 각각에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역으로부터 제1특정 주파수 대역과 제2특정 주파수 대역을 각각 선택하는 단계; 상기 선택된 제1 및 제2특정 주파수 대역에 대해 FFT(Fast Fourier transform)를 적용하여 제1 및 제2FFT 계수를 획득하는 단계; 상기 제1FFT 계수를 다수의 제1서브세트로 분리하고, 상기 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수를 선택하며, 상기 제2FFT 계수를 다수의 제2서브세트로 분리하고, 상기 각 제2서브 세트의 피크에 대응하는 제2FFT 피크 계수를 선택하는 단계;및 상기 선택되는 제1 및 제2FFT 피크 계수를 비교하여 상기 워터마크를 검출하는 단계;를 포함한다.
이하 첨부된 도면들을 참조하여 본 발명의 일 실시예를 보다 상세하게 설명 한다. 다만, 본 발명을 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다.
도 1은 본 발명의 실시예에 따른 오디오 워터마크 삽입장치를 도시한 블록도이다.
도 1을 참조하면, 오디오 워터마크 삽입장치(100)는 대역 추정부(110), 대역 선택부(120), 피크 계수 선택부(130), 워터마크 삽입부(140) 및 재구성부(150)를 포함한다.
대역 추정부(110)는 원오디오 신호(S)의 스펙트럼 중 최대 에너지를 포함하는 주요 주파수 대역(the important frequency band, A)을 추정한다.
대역 추정부(110)는 Wigner Distribution 방식과 STFT(Short-time Fourier transform) 방식을 이용하여 생성된 Advanced Wigner Distribution 방식을 이용하여 원오디오 신호(S)의 스펙트럼을 산출한다.
먼저, 오디오 신호의 스펙트럼을 제공하는 방식은 다양하며 일 예로 FFT(Fast Fourier transform) 방식, STFT(Short-time Fourier transform) 방식, Wigner Distribution 방식, Wavelet 방식을 들 수 있다. FFT 방식과 STFT 방식은 정확한 스펙트럼을 제공하나 다른 방식에 비해 거칠므로(rough), 신호가 스무스할 때 선택하는 것이 어렵다. Wigner Distribution 방식은 스무스한 스펙트럼을 제공하나, cross-term appearance가 스펙트럼을 부정확하게 한다. 따라서, 최상의 결과를 획득하기 위하여, 본 발명에서는 Wigner Distribution 방식과 STFT 방식의 장 점을 이용하며, 이로써 새로운 Advanced Wigner Distribution 방식을 제안한다.
Advanced Wigner Distribution 방식은 다음 과정에 의해 산출된다.
먼저, STFT는 다음과 같이 정의된다.
Figure 112009048161812-pat00001
[수학식 1]에 의한 스펙트로그램은 상기 STFT 트랜스폼의 절대값으로 정의되며, [수학식 2]로 표현한다.
Figure 112009048161812-pat00002
[수학식 1] 및 [수학식 2]에서 FSP는 STFT 함수, h(t)는 윈도우, s(t)는 아날로그 신호, STFT(t,w)는 FSP의 스펙트로그램이다. 본 발명의 실시예에서는 각 주파수(angular frequency)인 w를 사용하며, j는 -1의 제곱근인
Figure 112009048161812-pat00003
과 동일한 허수 단위이다.
Wigner distribution 함수는 시간 도메인과 주파수 도메인에서 [수학식 3]과 같이 표현될 수 있다.
Figure 112009048161812-pat00004
Figure 112009048161812-pat00005
여기서, s(t)와 S(w)는 각각 시간 및 주파수 도메인에서의 신호이며, S*(w)는 S(w)의 complex conjugate이다.
PWD(Pseudo-Wigner Distribution)은 시간 도메인에서 다음과 같이 설명된다.
Figure 112009048161812-pat00006
상술한 STFT, PWD 및 a narrow window P(Θ)를 사용한 Advanced wigner distribution은 다음과 같이 정의된다.
Figure 112009048161812-pat00007
스펙트로그램의 이산형태(discrete form)는 다음 [수학식 6]과 같다.
Figure 112009048161812-pat00008
Figure 112009048161812-pat00009
여기서, s(n)은 이산 신호, h(i)는 윈도우 h(t)의 이산 형태, N은 신호 s(n)에 있는 Fourier Transform Windows의 개수이다.
Discrete advanced Wigner method의 산출은 [수학식 7]과 같다
Figure 112009048161812-pat00010
p(i)가 직사각형 윈도우라고 가정하는 경우, ADWD(n,k)는 [수학식 8]과 같이 정의된다.
Figure 112009048161812-pat00011
Figure 112009048161812-pat00012
여기서, 2L+1은 discrete 윈도우 p(i)의 길이(length)이다. 상기 수학식에서, p(i)가 이산 델타 함수(discrete delta function)이면, ADWD(n, k)는 STFT로 감소하며, p(i)가 all values of 1(for all i)를 가지면, ADWD(n,k)는 Wigner distribution spectrum이 될 것이다. 도 2를 참조하면, p(i)는 직사각형 윈도우이 고, 2Q+1은 상기 윈도우의 폭(width)이다.
Standard Wigner distribution에서, cross term은 두 개의 주파수 성분들 중 크로스 산출(computation)의 결과를 나타낸다. Cross term은 실제이며, 사용하지 않는 값이며, 이는 분석의 결과를 심사하기 어렵게 한다. 그러나, 윈도우의 크기를 조정하는 것에 의해, cross term은 완전히 제거될 수 있다.
실험에서, 1초당 44,100 샘플의 샘플링 주파수를 가지는 음악 파일의 신호에 FFT, STFT, Wigner distribution 및 Advanced Wigner distribution을 적용하였다. 도 3a 내지 도 3d는 상기 4가지 방식들의 스펙트럼 결과를 보여준다. 도 3a 내지 도 3d에서, magnitude는 스펙트럼 에너지의 크기, frequency는 주파수, time은 시간을 나타낸다. Advanced Wigner Distribution 방식은 다른 방식에 비해 보다 스무스하고 더 가시적인 스펙트럼(visible spectrum)을 보여준다.
원오디오 신호(S)의 스펙트럼 결과가 도 3d와 같은 경우, 대역 추정부(110)는 가장 큰 에너지를 포함하는 밴드를 주요 주파수 대역(A)으로 추정한다. 여기서, 주요 주파수 대역(A)은 가장 큰 에너지만을 포함하거나, 또는, 가장 큰 에너지가 속하는 대역일 수 있다. 가장 큰 에너지를 포함하는 주요 주파수 대역(A)은 설계시 엔지니어에 의해 조정될 수 있다.
대역 선택부(120)는 원오디오 신호(S)를 레벨 L에서 분리하기 위하여, 원오디오 신호(S)에 DWT(Discrete Wavelet Transform)를 적용하여 원오디오 신호(S)를 다수의 주파수 대역으로 분리하며, 분리되는 다수의 주파수 대역 중 특정 주파수 대역(the most significant frequency band)을 선택한다. 특히, 대역 선택부(120) 는 분리되는 다수의 주파수 대역 중 대역 추정부(110)에서 추정된 주요 주파수 대역(A)을 포함(cover)하는 대역을 특정 주파수 대역(A')으로 선택한다. 이를 위하여 대역 선택부(120)는 도 4에 도시된 바와 같이 DWT부(121), 선택부(122) 및 IDWT부(123)를 포함한다.
DWT부(121)는 원오디오 신호(S)에 DWT를 적용하여 도 5에 도시된 바와 같이 원오디오 신호(S)를 멀티플 주파수 대역으로, 즉, 고주파 대역과 저주파 대역으로 분리한다. 도 5의 경우, 원오디오 신호(S)는 6개의 주파수 대역으로 분리되었다.
선택부(122)는 분리된 다수의 주파수 대역 중 특정 주파수 대역(A')을 선택한다. 특정 주파수 대역(A')은 분리된 다수의 주파수 대역 중 대역 추정부(110)에서 추정된 주요 주파수 대역(A)을 커버, 즉, 포함하는 대역을 의미한다.
IDWT부(123)는 선택된 특정 주파수 대역(A')의 웨이블렛 계수들, 즉, DWT 계수들에 IDWT(Inverse Discrete Wavelet Transform)를 적용하며, 그 결과 재구성된 신호(B)를 생성한다.
다시 도 1을 참조하면, 피크 계수 선택부(130)는 대역 선택부(120)에서 선택된 특정 주파수 대역(A')의 FFT 계수를 다수의 서브세트(Ci)로 분리하고, 각 서브세트(Ci)의 피크에 대응하는 FFT 계수를 선택한다. 이하에서는 각 서브세트(Ci)의 피크(즉, the important frequency peak)에 대응하는 FFT 계수를 피크 계수라 한다.
이를 위하여, 피크 계수 선택부(130)는 도 6에 도시된 바와 같이 FFT부(131) 및 선택부(132)를 포함한다. FFT부(131)는 IDWT부(123)에서 재구성된 신호(B)에 FFT(Fast Fourier transform)를 적용하여 FFT 계수들을 생성한다. 이하에서는 FFT 계수들을 FFT 계수 세트(C)라 한다.
선택부(132)는 획득된 FFT 계수 세트(C)를 각각 n개의 계수(샘플)를 포함하는 다수의 서브세트(Ci)로 분리하고, 각 서브세트(Ci) 별로 피크(the important frequency peak)를 확인한 후, 확인된 각 피크에 대응하는 피크 계수들(Cij)을 선택한다.
예를 들어, 선택부(132)는 FFT 계수 세트(C)를 200-sample 서브세트로 분리하며, 이로써 I개의 서브세트를 획득한다. Ci(i=1, 2, …, I)는 총 I개의 서브세트 중 i번째의 서브세트에 있는 계수들 세트로 가정할 수 있다. 선택부(132)는 서브세트 Ci에 포함된 다수의 계수들 중 피크를 확인하고, 확인된 피크에 대응하는 계수를 피크 계수(Cij)로 선택한다. 여기서 j(j=1, 2, …, J)는 i번째의 서브세트에 있는 계수들 중 선택된 피크 계수가 j번째에 위치함을 의미한다.
선택부(132)는 각 서브세트(Ci) 별로 임계값 이상의 크기를 가지는 계수를 피그 계수로 선택할 수 있다. 따라서, 선택부(132)는 각 서브세트(Ci) 별로 다수의 피크 계수(Cij)를 선택할 수 있으며, 임계값은 메모리(미도시)에 저장된다.
워터마크 삽입부(140)는 서브세트(Ci) 별로 선택되는 각 피크 계수(Cij)에 워 터마크를 삽입한다. 삽입되는 워터마크는 멀티비트 워터마크로서, 0 또는 1의 값을 가지며, 워터마크 삽입부(140)는 다음 조건에 따라 멀티비트 워터마크를 각 피크 계수(Cij)에 삽입한다.
If Wij=1, Cij'=Cij +λ× abs(Cij)
otherwise, if Wij=0, Cij'=Cij -λ× abs(Cij)
[수학식 9], [수학식 10]에서 Cij'는 워터마크가 삽입된 피크 계수, Cij는 워터마크가 삽입되기 이전에 피크 계수, λ는 설계자에 의해 선택가능한 상수, abs(Cij)는 Cij의 절대값이다.
구체적으로, 워터마크 삽입부(140)는 멀티비트 워터마크를 주파수 도메인에서 주요 대역의 FFT 계수에 삽입하는 것을 특징으로 한다. The important frequency peaks는 특정 주파수 대역(A')에서 추출된다. 각 피크, 다시 말하면, 각 피크에 대응하는 FFT 계수에 대하여, 1비트의 워터마크는 [수학식 9] 및 [수학식 10]에서와 같이 피크의 크기(magnitude)를 변경하는 것에 의해 삽입된다. 워터마크된 오디오 신호는 재구성부(150)에서 변경된 계수와 변경되지 않은 계수를 재구성(reconstruction)함으로써 획득된다.
재구성부(150)는 워터마크가 삽입된 피크 계수들(Cij')과 대역 선택부(120) 에서 선택되지 않은 그 외 주파수 대역들에 IDWT를 적용하여, 워터마크가 삽입된 오디오 신호(S')로 재구성한다. 도 7을 참조하면, 재구성부(150)는 IFFT부(151), DWT부(152) 및 IDWT부(153)를 포함한다.
IFFT부(151)는 워터마크가 삽입된 피크 계수들(Cij')과 워터마크가 삽입되지 않은 FFT 계수들을 결합한 후, 결합된 신호에 대해 IFFT(Inverse Fast Fourier transform)를 적용하여 각 서브세트를 재구성(reconstruction)한다. 워터마크가 삽입되지 않은 FFT 계수들은 서브세트(Ci)에서 피크가 아닌 FFT 계수들이며, 재구성에 의해 출력되는 각 서브세트들에 해당하는 신호(B)는 특정 주파수 대역(A')을 이루는 신호(B)가 된다.
DWT부(152)는 재구성에 의해 출력되는 신호(B)에 DWT를 적용하여 새로운 웨이블렛 계수(C')를 생성한다.
IDWT부(153)는 대역 선택부(120)에서 선택되지 않은 주파수 대역들, 즉 다수의 주파수 대역들 중 특정 주파수 대역(A')을 제외한 나머지 주파수 대역들의 웨이블렛 계수들과 새로운 웨이블렛 계수들(C')에 IDWT를 적용하여 워터마크가 삽입된 오디오 신호(S')를 출력한다.
도 8은 도 1에 의한 오디오 워터마크 삽입방법을 설명하기 위한 흐름도이다.
도 8을 참조하면, 대역 추정부(110)는 원오디오 신호(S)의 스펙트럼으로부터 주요 주파수 대역(A)을 추정한다(S810). 대역 추정부(110)는 상술한 Advanced Wigner Distribution 방식을 이용하여 원오디오 신호(S)의 스펙트럼을 산출한다.
대역 선택부(120)는 원오디오 신호(S)에 DWT를 적용하여 원오디오 신호(S)를 다수의 주파수 대역으로 분리하며(S820), 분리되는 다수의 주파수 대역 중 주요 주파수 대역(A)을 포함하는 특정 주파수 대역(A')을 선택한다(S830).
그리고, 대역 선택부(120)는 선택된 특정 주파수 대역(A')의 웨이블렛 계수들에 IDWT를 적용하여 재구성된 신호(B)를 생성한다(S840).
피크 계수 선택부(130)는 IDWT에 의해 생성된 신호(B)에 FFT를 적용하여 FFT 계수 세트(C)를 생성한다(S850).
피크 계수 선택부(130)는 획득된 FFT 계수 세트(C)를 다수의 서브세트(Ci)로 분리하고, 각 서브세트(Ci) 별로 피크(the important frequency peak)에 대응하는 피크 계수(Cij)를 선택한다(S860).
워터마크 삽입부(140)는 각 서브세트(Ci) 별로 선택되는 각 피크 계수(Cij)에 워터마크를 [수학식 9] 또는 [수학식 10]을 이용하여 삽입한다(S870).
재구성부(150)는 워터마크가 삽입된 피크 계수들(Cij')과 워터마크가 삽입되지 않은 FFT 계수들을 결합한 후, 결합된 신호에 대해 IFFT를 적용하여 각 서브세트를 재구성(reconstruction)한다(S880).
재구성부(150)는 재구성된 신호(B), 즉, 재구성된 다수의 서브세트와 S830단계에서 선택되지 않은 나머지 주파수 대역들을 이용하여 워터마크가 삽입된 오디오 신호(S')를 생성 및 출력한다(S890). 이는, 다수의 서브세트는 특정 주파수 대 역(A')을 이루는 신호이기 때문이다.
도 9는 본 발명의 실시예에 따른 오디오 워터마크 검출장치를 도시한 블록도이다.
워터마크가 삽입된 오디오 신호(S')로부터 워터마크를 추출하는 것은 삽입된 워터마크 알고리즘의 역처리에 해당한다고 할 수 있다. 본 발명에서는 워터마크를 검출하기 위하여 원오디오 신호를 이용한다. 공격을 당한 후에, 불법 복제와 같은 공격이 있은 후, 워터마크가 삽입된 오디오 신호는 S', 원오디오 신호는 S, 원 멀티비트 워터마크는 W라 한다. 본 발명에서 제안하는 알고리즘에서, bits(W') 시퀀스는 S'에서 추출되며, 연속적으로 원워터마크 W와 비교된다. 상기 비트는, W와 W'가 동일한 경우 검출된다.
이를 위하여, 오디오 워터마크 검출장치(900)는 대역 선택부(910), FFT부(920), 피크 계수 선택부(930) 및 워터마크 검출부(940)를 포함한다.
대역 선택부(910)는 원오디오 신호(S)를 레벨 L에서 분리하기 위하여, 원오디오 신호(S)에 DWT를 적용하여 다수의 주파수 대역으로 분리한 후, 분리된 다수의 주파수 대역으로부터 제1특정 주파수 대역(B)을 선택한다. 또한, 대역 선택부(120)는 워터마크된 오디오 신호(S')를 레벨 L에서 분리하기 위하여, 워터마크된 오디오 신호(S')에 DWT를 적용하여 다수의 주파수 대역으로 분리한 후, 분리되는 다수의 주파수 대역으로부터 제2특정 주파수 대역(B')을 선택한다.
제1 및 제2특정 주파수 대역(B, B')을 선택하는 알고리즘은 도 1을 참조하여 설명한 바와 같이, 각각의 the most significant frequency band를 포함하는 제1 및 제2특정 주파수 대역(B, B')을 선택하는 것이며, 이를 위하여 Advanced Wigner Distribution을 사용한다. 이에 대한 상세한 설명은 생략한다.
FFT부(920)는 선택된 제1 및 제2특정 주파수 대역(B, B')에 대해 FFT를 적용하여 각각 제1 및 제2FFT 계수(C, C')를 획득한다.
피크 계수 선택부(930)는 제1특정 주파수 대역(B)으로부터 획득된 제1FFT 계수(C)를 다수의 제1서브세트로 분리하고, 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수(Cij)를 선택하며, 제2특정 주파수 대역(B')으로부터 획득된 제2FFT 계수(C')를 다수의 제2서브세트로 분리하고, 각 제2서브세트의 피크에 대응하는 제2FFT 피크 계수(Cij')를 선택한다. J 피크들이 이러한 서브세트에 대해 생성된다. j번째 피크는 Cij와 Cij'로 정의한다(i=1, 2, …, I, j=1, 2, …, J).
따라서, 제1 및 제2FFT 피크 계수는 각각 제1 및 제2서브세트의 개수만큼 선택된다. 또는, 도 1의 워터마크 삽입장치(100)에서 각 서브세트 별로 m개의 피크를 선택한 경우, 피크 계수 선택부(930)는 각각 m개의 제1 및 제2FFT 피크 계수를 선택한다.
예를 들어, 피크 계수 선택부(930)는 C와 C'를 200-샘플 서브세트로 분리하여 각각 I개의 서브세트를 획득한다. 이는, C와 C'가 동일한 길이(same length)를 가지며, 동일한 서브세트의 개수가 리턴되기 때문이다). i=1, 2, …, I인 Ci와 Ci'를 가정하며, I는 각각 두 경우에 있어서, i번째 서브세트 내 계수들의 세트라 한다.
워터마크 검출부(940)는 선택된 제1FFT 계수와 제2FFT 피크 계수를 비교하여 워터마크(W')를 검출한다. 워터마크 검출부(940)는 다음 조건에 의해 워터마크(또는 워터마크 비트)를 검출한다.
Wij'=1, if Cij'-Cij≥0,
(i=1, 2, …, I, 그리고, j=1, 2, …, J)
Wij'=0, if Cij'-Cij<0
(i=1, 2, …, I, 그리고, j=1, 2, …, J)
여기서, Wij'는 워터마크, Cij는 각 제1서브세트 중 i번째 서브세트에서 선택된 제1FFT 피크 계수, Cij'는 상기 각 제2서브세트 중 i번째 서브세트에서 선택된 제2FFT 피크 계수, j는 i번째 서브세트에서 각 제1 및 제2FFT 피그 계수의 위치이다.
도 10은 도 9에 의한 오디오 워터마크 검출방법을 설명하기 위한 흐름도이다.
도 10을 참조하면, 대역 선택부(910)는 원오디오 신호(S)와 워터마크가 삽입된 오디오 신호(S')에 DWT를 적용하여 다수의 주파수 대역으로 분리한 후, 분리된 다수의 주파수 대역으로부터 제1 및 제2특정 주파수 대역(B, B')을 선택한다(S1010).
FFT부(920)는 선택된 제1 및 제2특정 주파수 대역(B, B')에 대해 FFT를 적용하여 각각 제1 및 제2FFT 계수(C, C')를 획득한다(S1020).
피크 계수 선택부(930)는 제1FFT 계수(C)를 다수의 제1서브세트로 분리하고, 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수를 선택하며, 제2FFT 계수(C')를 다수의 제2서브세트로 분리하고, 각 제2서브 세트의 피크에 대응하는 제2FFT 피크 계수를 선택한다(S1030, S1040).
워터마크 검출부(940)는 선택된 제1FFT 계수와 제2FFT 피크 계수를 [수학식 12] 및 [수학식 13]을 토대로 비교하여 워터마크(W')를 검출한다(S1050).
상술한 과정은 모든 숨겨진 워터마크가 검출될 때까지 반복된다. 검출된 워터마크(W')는 워터마크의 강인성(robustness)를 추정하기 위하여 원 워터마크(W)와 비교되는데 사용된다.
[표 1]은 상수 λ와 검출된 워터마크 비트의 probability 사이의 관계를 보여준다.
λ Total bits embedded Number of bits detecged
0.05 30,138 30,138
0.1 30,138 30,136
0.2 30,138 30,130
0.3 30,138 30,074
0.4 30,138 30,058
0.5 30,138 30,050
0.6 30,138 30,048
0.7 30,138 30,042
0.8 30,138 30,040
[표 1]을 참조하면, λ가 작을수록 검출 확률이 높아지고, 비지각성(imperceptibility)이 향상됨을 알 수 있다. λ=0.1인 경우, 멀티비트 워터마크의 검출이 보다 정확하게 검출되면서 [수학식 11]을 만족시키도록 한다. λ는 적용되는 알고리즘, 어플리케이션 뿐만 아니라, 퍼포먼스의 결과에 의존하여 0.05~0.1 내에서 가변할 수 있다.
멀티비트 워터마크를 원오디오 신호의 the important frequency peaks에 상술한 알고리즘을 이용하여 삽입하여 워터마크가 삽입된 오디오 신호를 획득할 수 있다. 원오디오 신호와 워터마크가 삽입된 오디오 신호의 각 스펙트럼 사이에는 작은 차이가 있으나, 두 신호의 사운드는 도 11a 및 도 11b에 도시된 바와 같이 거의 동일하다. 다시 말해서, 본원의 워터마킹 알고리즘은 상당히 강인함을 의미한다. 도 11a 및 도 11b는 Advanced Wigner Distribution을 사용한 원오디오 신호와 워터마크된 오디오 신호의 스펙트럼을 보여준다.
오디오 파일이 방송되면, 오디오 파일은 다양한 dispersion 또는 강력한 공격(예를 들어, 불법 복제)을 당할 수 있다. 워터마킹 기술의 주요 목적은 공격에 대한 강인성에 있으며, 강인성의 개념은 명료하다. 즉, 사용되지 않는 공격된 데이터를 렌더링하지 않아도 워터마크가 손상(impair)되지 않으면, 이 워터마크는 강인하다. 워터마크 손상(impairment)은 오율(miss probability), 비트 에러의 확률 또는 채널 용량과 같은 기준에 의해 측정될 수 있다. 멀티미디어에서, 공격된 데이터의 유용성은 그것의 지각 품질(perceptual quality) 또는 왜곡(distortion)을 고려하여 평가될 수 있다. 따라서, 강인성은 워터마크의 손상과 공격당한 데이터의 왜곡을 고려하여 동시에 평가될 수 있다. 공격당한 데이터의 지각 품질을 유지하는 동안 수용가능한 제한 내에서 워터마크가 손상되면, 공격은 성공하게 된다. 따라서, 워터마킹을 위한 좋은 방식은 the high embedded watermark message를 추출하기 위하여 이러한 강한 공격을 처리해야만 한다.
워터마크 메시지의 강인성은 다양한 방식(MP3 압축, 리샘플링, 로패스 필터링, 노이즈 추가 등)으로 워터마크 메시지를 공격함으로써 평가된다. 공격 이후 검출되는 비트의 개수는 워터마크의 강인성에 직접 비례한다.
도 12 내지 도 15는 다양한 공격에 따른 테스트 실시예를 설명하기 위한 도면이다.
도 12는 MP3 압축 공격을 테스트하는 모델을 보여주는 도면이다. 도 12를 참조하면, 이 모델에서, *.wav 파일 형태의 워터마크된 오디오 신호(S')는 MP3 압축(128kbps)에 의해 압축되어 MP3 파일로 생성된다. 생성된 MP3 파일은 웨이브 파일로 디코딩된다. 따라서, 워터마크가 삽입된 파일이 웨이브 파일로 변환되면, MP3 압축 공격에 직면하게 된다.
도 13은 잡음 추가 공격을 테스트하는 모델을 보여주는 도면이다. 도 13을 참조하면, 잡음 추가 공격의 경우, 백색 가우시안 잡음이 워터마크가 삽입된 오디오 신호(S')에 낮은 노이즈 레벨로 추가되어, 원오디오 신호와 변경된 신호가 구별될 수 없도록 한다. 따라서, 본 발명에서는 SNR=30인 가우시안 잡음 추가를 선택된다.
도 14는 필터링 공격을 테스트하는 모델을 보여준다. 도 14를 참조하면, 하이 또는 로우 주파수 대역은 LPF(Low Pass Filter) 또는 HPF(High Pass Filter)를 사용하여 분리된다. 사운드 품질에 기인하여, the most significant frequency band는 컷오프(cut off)될 수 없으나, 사운드는 변경된다. 본 발명에서는, 워터마크가 삽입된 오디오 파일(S')을 위하여 Butterworth LPF가 사용되며, 여기서 컷오프 주파수(Wn)는 0.9이다.
도 15는 리샘플링 공격을 테스트하는 모델을 도시한 도면이다. 도 15를 참조하면, 샘플링의 업 또는 다운은 원오디오 신호의 샘플링 주파수를 변경할 수 있다. 본 발명의 테스트에서, 워터마크가 삽입된 오디오 파일(S')은 44100에서 22100Hz로 리샘플된다.
도 12 내지 도 15를 참조하여 설명한 공격들로부터 획득되는 웨이브 파일은, 멀티비트 워터마크 메시지를 검출하기 위하여, 본 발명에서 제안된 검출 알고리즘에 적용된다. 각 공격에 대하여, 각각의 검출된 비트는 원워터마크 메시지와 비교된다. 검출된 비트가 원워터마크 비트와 동일한 값(0 또는 1)이면, 비트가 검출된 것을 의미한다.
다음 [표 2]는 상기 테스트들의 결과를 보여준다.
Attacks Total bits embedded Number of bits detected Percentage of bits detected
MP3 30,138 29,466 97.77
Noise addition 30,138 30,136 99.99
Low Pass Filtering 30,138 30,136 99.99
Re-sampling 30,138 30,134 99.98
[표 2]를 참조하면, 각 공격으로부터 검출된 비트의 개수가 많으므로, 상기 결과는 워터마크의 강인성이 좋음을 보여준다. 즉, 본원에서 제안하는 워터마킹 방식은 노이즈 추가, 필터링, 리샘플링 및 MP3 압축 공격과 같은 강한 공격에도 강인함을 알 수 있다.
한편, 기술의 발전에 따라, 음악 성능은 방송국, 인터넷 등을 통해 직접 전파된다. 상기 성능의 품질 및 지적 재산권 보호는 확립되어야 한다. 이를 위하여 이용되는 본 오디오 워터마킹 기술의 경우, 실시간 동작을 위한 효율적인 computational complexity가 요구된다. 따라서, 본원은 다른 기술에 상대적인 computational complexity를 고려하는 것에 의해, 실시간 동작을 위한 워터마킹 기술의 효율성을 추정한다.
본원은 Advanced Wigner distribution 프로세스와 삽입된 워터마크 프로세스를 고려한다. Advanced Wigner 프로세스의 경우, Advanced Wigner distribution와 원 Wigner distribution 사이의 비교가, 필요한 산술 동작의 개수에 관해서 제공된다. Advanced Wigner distribution의 이산 형태는 [수학식 7]과 [수학식 8]에서 보여진다. Advanced Wigner 방식을 산출하기 위하여, 시간 n에서 STFT의 산출이 필요한다. 이는 시간 n-1에서 구해된 이전 STFT의 값으로부터, 회귀식(resursive formula)에 의해 수행될 수 있다.
본원은 실시예에서, [수학식 1]에서 정의한 윈도우 h(i)가 상승 코사인 윈도우(raised consine window)이고 N개의 샘플을 포함하는 것으로 가정한다. 상기 STFT 계수에 대한 회귀식은 다음 [수학식 14]와 같이 정의된다.
Figure 112009048161812-pat00013
[수학식 8] 및 [수학식 14](Papoulis, 1977)로부터, Advanced Wigner 방식의 복소수 승산(Complex Multiplication)과 복소수 가산(Complex addition)은 각각 'N(3+Q)/2'와 'N(6+Q)/2'이다. 여기서, Q는 [수학식 8]에 의해 정의된다. 그러나, Original Wigner Distribution의 복소수 승산과 복소수 가산은 각각 'N(4_log2N)/2'와 'N(log22N)'이다(Mecklenbrauker and Hlawatsch, 1997). Q는 N보다 작으며, 따라서, Advanced Wigner 방식은 보다 효율적인 complexity를 제공한다. 본 발명의 실험에서 N=256, Q=4이다.
제안된 워터마킹 삽입 프로세스의 computational complexity를 고려하기 위하여, 본원은 제안된 워터마킹 기술과 standard watermark-embedding practices를 비교한다. 일반적인 watermark-embedding 기술에서, 워터마크 메시지는 오리지널 신호의 각 FFT 계수에 삽입된다. 그러나, 본원의 알고리즘에서는, 워터마크 메시지는 the importane peaks에 삽입된다. 이러한 피크를 발견하기 위하여, 본원은 서로 인접하는 적어도 3개의 샘플(즉, 계수)을 사용한다. 따라서, 샘플의 절반 이하가 워터마크 메시지를 삽입하는데 사용된다.
또한, the most imporant frequency band는 레벨 L의 웨이블렛을 사용한 후에 사용되므로, 오리지널 신호가 P개의 샘플을 포함하면, the most imporant frequency band는 P/2L개의 샘플을 포함한다(Strand and Nguyen, 1997). 본 발명에서는, 오리지널 신호로 삽입되는 P 워터마크 메시지를 사용하는 대신, 단지 P/2L+1 워터마크 메시지가 사용된다. 따라서, Computational Time이 단축될 수 있다.
상술한 설명에서 워터마크, 멀티비트 워터마크, 워터마크 비트, 워터마크 메시지 등은 동일한 것이며, 또한, Adavnced Wigner Distribution, Adavnced Wigner 방식 등의 표현 역시 동일한 것이며, 설명의 편의상 다양하게 사용된다.
한편, 결과적으로, 본 발명은 원오디오 신호의 주파수 도메인에서 변하지 않는 특징을 이용하는 오디오 워터마킹 기술을 제공한다. 이용되는 불변의 특징들은 피크 계수, 즉, the important frequency peaks이다. 또한, The Advanced Wigner Distribution은 사운드의 특성을 보여주는 특정 주파수 대역(the most significant frequency band)를 추정하는데 사용된다. 제안된 워터마킹 기술에서, 멀티비트 워터마크는 the important frequency peaks의 크기(magnitude)를 미세하기 조정함으로써 the important frequency peaks에 삽입(embeded)된다. 본 발명에서 제안하는 알고리즘에 의한 테스트 결과는 워터마킹 기술이 노이즈 추가, 필터링, 리샘플링 및 MP3 압축 공격과 같은 강한 공격에도 강인함을 보여준다. 또한, 본원의 효율적인 computational complexity는 실시간 응용에 효과가 크다.
이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형 실시예들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
도 1은 본 발명의 실시예에 따른 오디오 워터마크 삽입장치를 도시한 블록도,
도 2는 직사각형 윈도우(p(i))의 일 예를 도시한 도면,
도 3a 내지 도 3d는 상기 4가지 방식들의 스펙트럼 결과를 보여주는 도면,
도 4는 도 1의 대역 선택부를 자세히 도시한 도면,
도 5는 도 4의 DWT부에 의해 멀티플 주파수 대역으로 분리되는 과정을 설명하기 위한 도면,
도 6는 도 1의 피크 계수 선택부를 자세히 도시한 도면,
도 7은 도 1의 복원부를 자세히 도시한 도면,
도 8은 도 1에 의한 오디오 워터마크 삽입방법을 설명하기 위한 흐름도,
도 9는 본 발명의 실시예에 따른 오디오 워터마크 검출장치를 도시한 블록도,
도 10은 도 9에 의한 오디오 워터마크 검출방법을 설명하기 위한 흐름도,
도 11a 및 도 11b는 Advanced Wigner Distribution을 사용한 원오디오 신호와 워터마크된 오디오 신호의 스펙트럼을 도시한 도면, 그리고,
도 12 내지 도 15는 다양한 공격에 따른 테스트 실시예를 설명하기 위한 도면이다.
* 도면의 주요부분에 대한 부호의 설명 *
100 : 오디오 워터마크 삽입장치 110 : 추정부
120 : 대역 선택부 130 : 피크 계수 선택부
140 : 워터마크 삽입부 150 : 재구성부

Claims (16)

  1. 원오디오 신호에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역 중 최대 에너지 주파수 대역을 선택하고, 상기 최대 에너지 주파수 대역의 웨이블렛 계수에 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 재구성된 신호를 생성하는 대역 선택부;
    상기 재구성된 신호에 FFT(Fast Fourier Transform)을 적용하여 생성된 FFT 계수들을 다수의 서브세트로 분리하고, 상기 각 서브세트의 피크 계수를 선택하는 피크 계수 선택부;
    상기 서브세트 별로 선택되는 피크 계수에 워터마크를 삽입하는 워터마크 삽입부; 및
    상기 워터마크가 삽입된 피크 계수와 상기 워터마크가 삽입되지 않은 계수들에 IFFT(Inverse Fast Fourier Transform)을 적용하여 출력된 신호에 DWT(Discrete Wavelet Transform)를 적용하여 새로운 웨이블렛 계수를 생성하고, 상기 새로운 웨이블렛 계수와 상기 대역 선택부에서 선택되지 않은 주파수 대역들의 웨이블렛 계수들에 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 워터마크가 삽입된 오디오 신호를 복원하는 재구성부;를 포함하는 것을 특징으로 하는 오디오 워터마크 삽입장치.
  2. 제 1항에 있어서,
    상기 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주요 주파수 대역을 추정하는 대역 추정부;를 더 포함하며,
    상기 대역 선택부는 상기 다수의 주파수 대역 중 상기 추정된 주요 주파수 대역을 포함하는 대역을 상기 최대 에너지 주파수 대역으로 선택하는 것을 특징으로 하는 오디오 워터마크 삽입장치.
  3. 제 2항에 있어서,
    상기 대역 추정부는 Wigner Distribution 방식과 STFT(Short-time Fourier transform) 방식을 이용하여 상기 스펙트럼을 산출하는 것을 특징으로 하는 오디오 워터마크 삽입장치.
  4. 제 1항에 있어서,
    상기 대역 선택부는,
    상기 원오디오 신호에 DWT를 적용하여 상기 다수의 주파수 대역으로 분리하는 DWT부;
    상기 다수의 주파수 대역 중 상기 최대 에너지 주파수 대역을 선택하는 선택부; 및
    상기 선택된 최대 에너지 주파수 대역의 웨이블렛 계수들에 IDWT를 적용하여 상기 재구성된 신호를 생성하는 IDWT부;를 포함하는 것을 특징으로 하는 오디오 워터마크 삽입장치.
  5. 제 1항에 있어서,
    상기 피크 계수 선택부는,
    상기 재구성된 신호에 FFT(Fast Fourier transform)를 적용하여 FFT 계수들을 생성하는 FFT부; 및
    상기 획득된 FFT 계수들을 각각 n개의 계수를 포함하는 상기 다수의 서브세트로 분리하고, 상기 각 서브세트 별로 피크를 확인한 후, 상기 확인된 각 피크에 대응하는 피크 계수들을 선택하는 선택부;를 포함하는 것을 특징으로 하는 오디오 워터마크 삽입장치.
  6. 제 5항에 있어서,
    상기 재구성부는,
    상기 워터마크가 삽입된 피크 계수들과 상기 워터마크가 삽입되지 않은 FFT 계수들을 결합한 후, IFFT(Inverse Fast Fourier transform)를 적용하여 출력하는 IFFT부;
    상기 IFFT부의 출력 신호에 상기 DWT를 적용하여 새로운 웨이블렛 계수를 생성하는 DWT부; 및
    상기 다수의 주파수 대역에서 선택되지 않은 주파수 대역들의 웨이블렛 계수들과 상기 새로운 웨이블렛 계수들에 상기 IDWT를 적용하여 워터마크가 삽입된 오디오 신호를 출력하는 IDWT부;를 포함하는 것을 특징으로 하는 오디오 워터마크 삽입장치.
  7. 원오디오 신호에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역 중 최대 에너지 주파수 대역을 선택하는 단계;
    상기 최대 에너지 주파수 대역의 웨이블렛 계수들에 대해 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 재구성된 신호를 생성하는 단계;
    상기 재구성된 신호에 FFT(Fast Fourier Transform)을 적용하여 생성된 FFT 계수들을 다수의 서브세트로 분리하고, 상기 각 서브세트의 피크 계수를 선택하는 단계;
    상기 서브세트 별로 선택되는 피크 계수에 워터마크를 삽입하는 단계;
    상기 워터마크가 삽입된 피크 계수와 상기 워터마크가 삽입되지 않은 계수들에 IFFT(Inverse Fast Fourier Transform)을 적용하여 출력된 신호에 DWT(Discrete Wavelet Transform)를 적용하여 새로운 웨이블렛 계수를 생성하는 단계; 및
    상기 새로운 웨이블렛 계수와 상기 주파수 대역을 선택하는 단계에서 선택되지 않은 주파수 대역들의 웨이블렛 계수들에 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 워터마크가 삽입된 오디오 신호를 출력하는 단계;를 포함하는 것을 특징으로 하는 오디오 워터마크 삽입방법.
  8. 제 7항에 있어서,
    상기 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주요 주파수 대역을 추정하는 단계;를 더 포함하며,
    상기 대역을 선택하는 단계는, 상기 분리되는 다수의 주파수 대역 중 상기 추정된 주요 주파수 대역을 포함하는 대역을 상기 최대 에너지 주파수 대역으로 선택하는 것을 특징으로 하는 오디오 워터마크 삽입방법.
  9. 제 8항에 있어서,
    상기 추정하는 단계는. Wigner Distribution 방식과 STFT(Short-time Fourier transform) 방식을 이용하여 상기 스펙트럼을 산출하는 것을 특징으로 하는 오디오 워터마크 삽입방법.
  10. 제 7항에 있어서,
    상기 최대 에너지 주파수 대역을 선택하는 단계는,
    상기 원오디오 신호에 DWT를 적용하여 상기 다수의 주파수 대역으로 분리하는 단계;
    상기 다수의 주파수 대역 중 상기 최대 에너지 주파수 대역을 선택하는 단계; 및
    상기 선택된 최대 에너지 주파수 대역의 웨이블렛 계수들에 IDWT를 적용하여 재구성된 신호를 생성하는 단계;를 포함하는 것을 특징으로 하는 오디오 워터마크 삽입방법.
  11. 제 7항에 있어서,
    상기 피크 계수를 선택하는 단계는,
    상기 재구성된 신호에 FFT(Fast Fourier transform)를 적용하여 FFT 계수들을 생성하는 단계; 및
    상기 획득된 FFT 계수를 각각 n개의 계수를 포함하는 상기 다수의 서브세트로 분리하고, 상기 각 서브세트 별로 피크를 확인한 후, 상기 확인된 각 피크에 대응하는 피크 계수들을 선택하는 단계;를 포함하는 것을 특징으로 하는 오디오 워터마크 삽입방법.
  12. 제 11항에 있어서,
    상기 출력하는 단계는,
    상기 워터마크가 삽입된 피크 계수들과 상기 워터마크가 삽입되지 않은 FFT 계수들을 결합한 후, IFFT(Inverse Fast Fourier transform)를 적용하는 단계;
    상기 IFFT(Inverse Fast Fourier transform)를 적용하여 출력된 신호에 상기 DWT를 적용하여 새로운 웨이블렛 계수를 생성하는 단계; 및
    상기 다수의 주파수 대역에서 선택되지 않은 주파수 대역들의 웨이블렛 계수들과 상기 새로운 상기 새로운 웨이블렛 계수들에 상기 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 워터마크가 삽입된 오디오 신호를 출력하는 단계;를 포함하는 것을 특징으로 하는 오디오 워터마크 삽입방법.
  13. 원오디오 신호와 워터마크된 오디오 신호 각각에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역으로부터 제1특정 주파수 대역과 제2특정 주파수 대역을 각각 선택하는 대역 선택부;
    상기 선택된 제1 및 제2특정 주파수 대역에 대해 FFT(Fast Fourier transform)를 적용하여 제1 및 제2FFT 계수를 획득하는 FFT부;
    상기 제1FFT 계수를 다수의 제1서브세트로 분리하고, 상기 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수를 선택하며, 상기 제2FFT 계수를 다수의 제2서브세트로 분리하고, 상기 각 제2서브 세트의 피크에 대응하는 제2FFT 피크 계수를 선택하는 피크 계수 선택부; 및
    상기 선택되는 제1 및 제2FFT 피크 계수를 비교하여 상기 워터마크를 검출하는 워터마크 검출부;를 포함하며,
    상기 제1특정 주파수 대역은, 상기 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주파수 대역이며,
    상기 제2특정 주파수 대역은, 상기 워터마크된 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주파수 대역인 것을 특징으로 하는 오디오 워터마크 검출장치.
  14. 제 13항에 있어서,
    상기 워터마크 검출부는 다음 조건에 의해 상기 워터마크를 검출하는 것을 특징으로 하는 오디오 워터마크 검출장치:
    Wij'=1, if Cij'-Cij≥0, 그리고,
    Wij'=0, if Cij'-Cij<0
    (i=1, 2, …, I, 그리고, j=1, 2, …, J)
    여기서, Wij'는 워터마크, Cij는 상기 각 제1서브세트 중 i번째 서브세트에서 선택된 제1FFT 피크 계수, Cij'는 상기 각 제2서브세트 중 i번째 서브세트에서 선택된 제2FFT 피크 계수, j는 i번째 서브세트에서 각 제1 및 제2FFT 피그 계수의 위치.
  15. 원오디오 신호와 워터마크된 오디오 신호 각각에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역으로부터 제1특정 주파수 대역과 제2특정 주파수 대역을 각각 선택하는 단계;
    상기 선택된 제1 및 제2특정 주파수 대역에 대해 FFT(Fast Fourier transform)를 적용하여 제1 및 제2FFT 계수를 획득하는 단계;
    상기 제1FFT 계수를 다수의 제1서브세트로 분리하고, 상기 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수를 선택하며, 상기 제2FFT 계수를 다수의 제2서브세트로 분리하고, 상기 각 제2서브 세트의 피크에 대응하는 제2FFT 피크 계수를 선택하는 단계;및
    상기 선택되는 제1 및 제2FFT 피크 계수를 비교하여 상기 워터마크를 검출하는 단계;를 포함하며,
    상기 제1특정 주파수 대역은, 상기 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주파수 대역이며,
    상기 제2특정 주파수 대역은, 상기 워터마크된 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주파수 대역인 것을 특징으로 하는 오디오 워터마크 검출방법.
  16. 제 15항에 있어서,
    상기 워터마크를 검출하는 단계는 다음 조건에 의해 상기 워터마크를 검출하는 것을 특징으로 하는 오디오 워터마크 검출방법:
    Wij'=1, if Cij'-Cij≥0, 그리고,
    Wij'=0, if Cij'-Cij<0
    (i=1, 2, …, I, 그리고, j=1, 2, …, J)
    여기서, Wij'는 워터마크, Cij는 상기 각 제1서브세트 중 i번째 서브세트에서 선택된 제1FFT 피크 계수, Cij'는 상기 각 제2서브세트 중 i번째 서브세트에서 선택된 제2FFT 피크 계수, j는 i번째 서브세트에서 각 제1 및 제2FFT 피그 계수의 위치.
KR1020090072453A 2009-08-06 2009-08-06 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법 KR101201076B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090072453A KR101201076B1 (ko) 2009-08-06 2009-08-06 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090072453A KR101201076B1 (ko) 2009-08-06 2009-08-06 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법

Publications (2)

Publication Number Publication Date
KR20110014871A KR20110014871A (ko) 2011-02-14
KR101201076B1 true KR101201076B1 (ko) 2012-11-20

Family

ID=43773861

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090072453A KR101201076B1 (ko) 2009-08-06 2009-08-06 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법

Country Status (1)

Country Link
KR (1) KR101201076B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102651318B1 (ko) 2022-10-28 2024-03-26 주식회사 뮤즈블라썸 트랜지언트 기반의 사이드체인 오디오 워터마크 코딩 시스템
KR20240093227A (ko) 2022-12-15 2024-06-24 광운대학교 산학협력단 저작권 보호를 위한 블라인드 워터마킹 시스템

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496367A (zh) * 2011-12-06 2012-06-13 北京邮电大学 基于dwt-dct-svd的音频盲水印算法
KR101426596B1 (ko) * 2012-07-11 2014-08-05 조선대학교산학협력단 오디오 인코딩 방법
WO2015108535A1 (en) * 2014-01-17 2015-07-23 Intel Corporation Mechanism for facilitating watermarking-based management of echoes for content transmission at communication devices

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049409A (ja) 2003-07-29 2005-02-24 Meiji Univ オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049409A (ja) 2003-07-29 2005-02-24 Meiji Univ オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102651318B1 (ko) 2022-10-28 2024-03-26 주식회사 뮤즈블라썸 트랜지언트 기반의 사이드체인 오디오 워터마크 코딩 시스템
KR20240093227A (ko) 2022-12-15 2024-06-24 광운대학교 산학협력단 저작권 보호를 위한 블라인드 워터마킹 시스템

Also Published As

Publication number Publication date
KR20110014871A (ko) 2011-02-14

Similar Documents

Publication Publication Date Title
KR100458492B1 (ko) 디지털 오디오 컨텐츠 저작권 보호 및 복사 방지를 위한워터마크의 삽입/추출 방법 및 이를 이용한 장치
Lei et al. Blind and robust audio watermarking scheme based on SVD–DCT
Al-Haj et al. DWT-based audio watermarking.
Kirovski et al. Spread-spectrum watermarking of audio signals
CN101271690B (zh) 保护音频数据的音频扩频水印处理方法
CN102142258A (zh) 一种基于小波变换和Arnold的自适应灰度水印嵌入方法
KR101201076B1 (ko) 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법
Orović et al. Time-frequency-based speech regions characterization and eigenvalue decomposition applied to speech watermarking
Wang et al. A robust digital audio watermarking scheme using wavelet moment invariance
Kirovski et al. Spread-spectrum audio watermarking: requirements, applications, and limitations
Zhao et al. A robust audio watermarking algorithm based on SVD-DWT
Malik et al. Robust audio watermarking using frequency-selective spread spectrum
Li et al. An audio watermarking technique that is robust against random cropping
Stanković et al. Robust speech watermarking procedure in the time-frequency domain
Hemis et al. Digital watermarking in audio for copyright protection
JP6316288B2 (ja) 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
Dhar et al. An SVD-based audio watermarking using variable embedding strength and exponential-log operations
Singh et al. Multiplicative watermarking of audio in DFT magnitude
Trivedi et al. An algorithmic digital audio watermarking in perceptual domain using direct sequence spread spectrum
He et al. Efficiently Synchronized Spread-Spectrum Audio Watermarking with Improved Psychoacoustic Model.
Li et al. A novel audio watermarking in wavelet domain
Saraswathi Speech authentication based on audio watermarking
Fujimoto et al. A method of high bit-rate data hiding in music using spline interpolation
Kim et al. An audio watermarking scheme robust to MPEG audio compression.
Cvejic et al. Audio prewhitening based on polynomial filtering for optimal watermark detection

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150922

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20161021

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee