KR20070061285A - Digital audio watermarking method using hybrid transform - Google Patents

Digital audio watermarking method using hybrid transform Download PDF

Info

Publication number
KR20070061285A
KR20070061285A KR1020060083242A KR20060083242A KR20070061285A KR 20070061285 A KR20070061285 A KR 20070061285A KR 1020060083242 A KR1020060083242 A KR 1020060083242A KR 20060083242 A KR20060083242 A KR 20060083242A KR 20070061285 A KR20070061285 A KR 20070061285A
Authority
KR
South Korea
Prior art keywords
signal
watermark
frequency coefficient
transform
digital audio
Prior art date
Application number
KR1020060083242A
Other languages
Korean (ko)
Other versions
KR100814792B1 (en
Inventor
이상광
이승재
이준석
서영호
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20070061285A publication Critical patent/KR20070061285A/en
Application granted granted Critical
Publication of KR100814792B1 publication Critical patent/KR100814792B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

A method for watermarking an audio signal is provided to embed a watermark in a digital audio signal by using hybrid transform to maximize embedding strength while minimizing deterioration of quality of the audio signal after the audio signal is watermarked. A method for watermarking a digital audio signal includes a step of grouping 1024 samples of original audio signals into one frame and performing DCT(Discrete Cosine Transform) on the signals, a step of dividing the audio signals into a low-frequency coefficient and a high-frequency coefficient by using DCT coefficients, a step of embedding a watermark in the low-frequency coefficient by using a watermark embedder and performing IDCT(Inverse Discrete Cosine Transform) on the low-frequency coefficient to generate a tonal signal, a step of embedding a watermark in the high-frequency coefficient to generate a nontonal signal, and a step of summing up the tonal signal and the nontonal signal to generate a watermarked signal.

Description

하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법{DIGITAL AUDIO WATERMARKING METHOD USING HYBRID TRANSFORM} Digital Audio Watermarking Method using Hybrid Transformation {DIGITAL AUDIO WATERMARKING METHOD USING HYBRID TRANSFORM}

도 1은 본 발명에 따른 워터마크 삽입 과정을 나타낸 도면, 1 is a view showing a watermark embedding process according to the present invention;

도 2는 본 발명에 따른 음조 신호와 비음조 신호 분리 결과를 나타낸 도면, 2 is a view showing a separation result of the tonal signal and the non-tone signal according to the present invention;

도 3은 본 발명에 따른 워터마크 삽입기인 QIM 방법을 나타낸 도면, 3 is a view showing a QIM method which is a watermark inserter according to the present invention;

도 4는 본 발명에 따른 워터마크 추출 과정을 나타낸 도면이다. 4 is a diagram illustrating a watermark extraction process according to the present invention.

본 발명은 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법에 관한 것으로, 더욱 상세하게는 오디오 신호에 강인하게 워터마크를 삽입하기 위해 오디오 신호를 분리한 후, 그 특성에 따라 워터마크가 삽입되는 변환영역을 달리 적용하는 하이브리드 변환을 이용하여 강인하게 워터마킹를 삽입하고 추출하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법에 관한 것이다. The present invention relates to a digital audio watermarking method using a hybrid transformation. More particularly, the present invention relates to a digital audio watermarking method. The present invention relates to a digital audio watermarking method using a hybrid transform in which a watermark is strongly inserted and extracted using a hybrid transform applied differently.

일반적으로 오디오 워터마킹은 압축, 신호처리 등에 강인해야 하며 동시에 인간의 청각에 들리지 않도록 오디오 품질을 유지해야 한다. 과거의 오디오 워터마킹 방법은 크게 삽입영역에 따라 시간영역과 변환영역으로 나뉘어 진다. 시간영역에서 오디오 신호에 워터마크를 삽입하는 방법은 일반적으로 압축 등의 공격에 취약하고 인간의 청각시스템에 대한 정보를 효과적으로 활용하지 못할 수 있다. 이를 보완하고자 주파수 상의 정보를 이용하는 변환영역에서의 워터마킹 방법이 제안되었다. In general, audio watermarking must be robust to compression, signal processing, and at the same time maintain audio quality so that it is inaudible to human hearing. The audio watermarking method of the past is largely divided into a time domain and a conversion domain according to an insertion region. The method of embedding a watermark in an audio signal in the time domain is generally vulnerable to an attack such as compression and may not effectively utilize information about a human hearing system. To compensate for this, a watermarking method in a transform domain using information on frequency has been proposed.

시간영역에서의 오디오 워터마킹 방법으로, 선행논문 “P. Bassia,As an audio watermarking method in the time domain, the preceding paper “P. Bassia,

I. Pitas, and N. Nikolaidis, Robust Audio Watermarking in the Time Domain, IEEE Trans.On Multimedia, vol.3, no. 2, pp. 232-241, June 2001.”에서는 오디오를 하나의 작은 단위로 나누고 워터마크를 신호의 강도에 따라 조절해가며 삽입하였고 워터마크 신호와의 상관(correlation)값을 이용하여 추출하였다. 반복적인 삽입을 통하여 검출 성능을 높이었으나, 동기를 검출하기 위해서 한 주기만큼의 신호에 대해서 모든 경우 상관값을 계산해야 하는 문제점이 있으며 주파수 영역에서의 인간의 청각에 대한 정보를 제대로 활용하지 못하였다. I.ピ itas, and N. Nikolaidis, Robust Audio Watermarking in the Time Domain, IEEETrans.On Multimedia, vol.3, no. 2, i. In the case of 232-242, audio is divided into one small unit, and the watermark is inserted by adjusting the signal strength, and extracted using the correlation with the watermark signal. The detection performance is improved through repetitive insertion. However, in order to detect synchronization, the correlation value has to be calculated for every signal of one cycle, and the information about human hearing in the frequency domain is not properly utilized. .

변환영역에서의 오디오 워터마킹 방법으로, 선행 논문 “N. Cvejic and T. Seppanen, Spread spectrum audio watermarking using frequency hopping and att ack characterization, Signal Processing, no. 84, pp. 207-213, 2004.”에서는 압축에 대한 강인성을 높이기 위해서 주파수 영역에서의 대역 확산 기반 워터마킹에 압축 공격의 특성을 반영하여 워터마킹하는 방법을 제안하였다. 이 방법은 여러 압축 중에서 MP3 압축의 특징을 반영하여 범용적인 압축 과정에 따른 공격이 있을 경우 취약점을 보일 수 있다. As an audio watermarking method in the transform domain, the preceding paper “N. Cvejic and T. Seppanen, Spread spectrum audio watermarking using frequency hopping and att ackcaa, a 84, pp. In order to increase the robustness against compression, the proposed method of watermarking reflects the characteristics of compression attack in spread spectrum based watermarking in the frequency domain. This method reflects the characteristics of MP3 compression among various compressions and can be vulnerable if there is an attack by a general compression process.

위의 두 논문의 경우 모두 시간영역 혹은 변환영역에서만 정보를 삽입하고 있다. 즉, 기존에는 단일 변환만을 이용하여 워터마크를 삽입함으로써 압축, 시간영역에서의 공격에 취약점을 드러내는 단점이 있었다. In both papers, information is inserted only in the time domain or the transform domain. In other words, in the past, a watermark was inserted using only a single transform to expose a weakness in compression and attack in the time domain.

따라서, 본 발명은 상기한 종래 기술의 문제점을 해결하기 위해 이루어진 것으로서, 본 발명의 목적은 디지털 오디오 신호에 워터마크를 삽입함에 있어 삽입 후에 오디오 신호의 음질을 최소화하면서 삽입 강도는 최대화할 수 있도록 하이브리드 변환(hybrid transform)을 이용하게 되는데, 구체적으로 DCT 계수를 이용하여 오디오 신호를 음조 신호와 비음조 신호로 나눈 후, 음조 신호는 DCT(discrete cosine transform) 영역에서, 비음조 신호는 DWT(discrete wavelet transform) 영역에서 QIM(quantization index modulation) 방법을 이용하여 워터마크를 삽입한다. 음조 신호는 몇 개의 DCT 저주파 계수들로, 비음조 신호는 몇 개의 DWT 저주파 계수들로 효과적으로 표현되므로 QIM 방법을 통해 강인하게 워터마크를 삽입할 수 있는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법을 제공하는데 있다. Accordingly, the present invention has been made to solve the above-mentioned problems of the prior art, and an object of the present invention is to insert a watermark into a digital audio signal, thereby minimizing the sound quality of the audio signal after insertion, and to maximize the insertion strength. In particular, after the audio signal is divided into a tonal signal and a non-tone signal by using a DCT coefficient, the tonal signal is in a discrete cosine transform (DCT) region, and the non-toned signal is a discrete wavelet. In the transform region, a watermark is inserted using a quantization index modulation (QIM) method. Since the tonal signal is effectively represented by several DCT low frequency coefficients and the non-tuned signal by several DWT low frequency coefficients, the QIM method provides a digital audio watermarking method using a hybrid transformation that can strongly insert a watermark. have.

상기와 같은 목적을 달성하기 위한 본 발명의 하이브리드 변환을 이용한 디지털 오디오 워터마킹의 워터마크 삽입 방법은, (a) 원본 오디오 신호(ORIGINAL SIGNAL)를 1024개의 샘플을 한 프레임으로 하여 나누고, DCT(discrete cosine transform)를 수행하는 단계; (b) 상기 DCT 계수값들을 이용하여 저주파 계수와 고주파 계수로 구분하는 단계; (c) 상기 저주파 계수에 대해 워터마크 삽입기(WATERMARK EMBEDDER(TONAL))에서 워터마크를 삽입한 후, IDCT(inverse discrete cosine transform)를 수행하여 음조 신호를 생성하는 단계; (d) 상기 고주파 계수에 대해 IDCT를 통해 비음조 신호를 구성한 후, DWT(discrete wavelet transform)가 수행되며 워터마크 삽입기(WATERMARK EMBEDDER(TRANSIENT))에서 워터마크를 삽입한 후, IDWT(inverse discrete wavelet transform)를 수행하여 비음조 신호를 생성하는 단계; 및 (e) 상기 (c) 단계와 (d) 단계에서 생성된 음조 신호와 비음조 신호를 더하여 워터마크가 삽입된 오디오 신호(WATERMARKED SIGNAL)를 생성하는 단계를 포함하는 것을 특징으로 한다. In order to achieve the above object, a watermark embedding method of digital audio watermarking using hybrid transformation of the present invention comprises: (a) dividing an original audio signal (ORIGINAL SIGNAL) into 1024 samples by one frame, cosine transform); (b) dividing the low frequency coefficient and the high frequency coefficient using the DCT coefficient values; (c) generating a tonal signal by performing an inverse discrete cosine transform (IDCT) after inserting a watermark in a watermark inserter (TONAL) for the low frequency coefficient; (d) After constructing a non-toned signal for the high frequency coefficient through IDCT, a discrete wavelet transform (DWT) is performed, and after inserting a watermark in a watermark inserter (WATERMARK EMBEDDER (TRANSIENT)), IDWT (inverse discrete) performing a wavelet transform to generate a non-toned signal; And (e) generating a watermarked audio signal by adding the tone signal and the non-tone signal generated in steps (c) and (d).

한편, 본 발명의 하이브리드 변환을 이용한 디지털 오디오 워터마킹의 워터마크 추출 방법은, (a) 워터마크가 삽입된 신호(WATERMARKED SIGNAL)를 1024개의 샘플을 한 프레임으로 하여 나누고, DCT(discrete cosine transform)를 수행하는 단계; (b) 상기 DCT 계수값들을 이용하여 저주파 계수와 고주파 계수로 구분하는 단계; (c) 상기 저주파 계수에 대해 워터마크 추출기(WATERMARK EXTRACTOR(TONAL))에서 워터마크를 추출하는 단계; 및 (d) 상기 고주파 계수에 대해 IDCT를 통해 비음조 신호를 구성한 후, DWT(discrete wavelet transform)가 수행되며 워터마크 추출기(WATERMARK EXTRACTOR(TRANSIENT))에서 워터마크를 추출하는 단계를 포함하는 것을 특징으로 한다. Meanwhile, in the watermark extraction method of digital audio watermarking using the hybrid transformation of the present invention, (a) a watermarked signal (WATERMARKED SIGNAL) is divided into 1024 samples by one frame, and a discrete cosine transform (DCT) is performed. Performing; (b) dividing the low frequency coefficient and the high frequency coefficient using the DCT coefficient values; (c) extracting a watermark from a watermark extractor (WATERMARK EXTRACTOR (TONAL)) for the low frequency coefficient; And (d) after constructing a non-tuned signal for the high frequency coefficient through IDCT, performing a discrete wavelet transform (DWT) and extracting a watermark from a watermark extractor (WATERMARK EXTRACTOR (TRANSIENT)). It is done.

이하, 본 발명의 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법에 대하여 첨부된 도면을 참조하여 상세히 설명하기로 한다. Hereinafter, a digital audio watermarking method using a hybrid transformation of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 워터마크 삽입 과정을 나타낸 도면이다. 1 is a diagram illustrating a watermark embedding process according to the present invention.

도 1을 참조하면, 원본 오디오 신호(ORIGINAL SIGNAL)를 1024개의 샘플을 한 프레임으로 하여 나누고 이를 기반으로 DCT(discrete cosine transform)를 수행한다. DCT를 이용하여 음조 신호(tonal signal)를 예측하기 위해서 DCT 값의 임계치를 구한다. 본 발명에서는 절대값의 32번째 값을 이용하였다. 임계값 이상의 32개의 저주파 계수(LOW FREQ)들은 워터마크 삽입기(WATERMARK EMBEDDER(TONAL))를 통해 워터마크가 삽입된 후, IDCT(inverse discrete cosine transform)되어 워터마크가 삽입된 음조 신호가 된다. 임계값 이하의 나머지 고주파 계수(HIGH FREQ)들은 IDCT를 통해 비음조 신호(nontonal signal)를 구성한 후, DWT(discrete wavelet transform)가 수행되며 계수들은 워터마크 삽입기(WATERMARK EMBEDDER(TRANSIENT))를 통해 워터마크가 삽입된 후, IDWT(inverse discrete wavelet transform)을 통해 워터마크가 삽입된 비음조 신호가 된다. 마지막으로, 워터마크가 삽입된 음조 신호 와 비음조 신호를 더하여 워터마크가 삽입된 오디오 신호(WATERMARKED SIGNAL)를 만든다. Referring to FIG. 1, an original audio signal (ORIGINAL SIGNAL) is divided into 1024 samples into one frame and a discrete cosine transform (DCT) is performed based on the same. In order to predict a tonal signal using the DCT, a threshold of the DCT value is obtained. In the present invention, the 32nd value of the absolute value is used. The 32 low frequency coefficients (LOW FREQ) above the threshold are inserted into the watermark through a watermark inserter (WATERMARK EMBEDDER (TONAL)), and then are inverse discrete cosine transform (IDCT) to form a tonal signal with the watermark embedded therein. The remaining high frequency coefficients below the threshold are composed of a nontonal signal through IDCT, followed by a discrete wavelet transform (DWT), and the coefficients are passed through a watermark inserter (TRANSIENT). After the watermark is inserted, the watermark is inserted into a non-tone signal through an inverse discrete wavelet transform (IDWT). Finally, the watermarked tonal signal and the non-toned signal are added to create a watermarked audio signal (WATERMARKED SIGNAL).

여기서, 상기 DCT, DWT, IDCT, IDWT는 각각 연산을 수행하는 장치로서 구성할 수 있으며, 이를 통해 하이브리드 변환을 이용한 디지털 오디오 워터마킹 삽입기를 구성할 수 있다. 상기 DCT 장치, DWT 장치, IDCT 장치, IDWT 장치의 기능은 상기한 동작 설명을 통해 충분히 설명되고 있으므로 중복 설명은 생략하기로 한다. In this case, the DCT, DWT, IDCT, and IDWT may be configured as a device for performing arithmetic operation, and thus, a digital audio watermarking inserter using hybrid transformation may be configured. Functions of the DCT device, the DWT device, the IDCT device, and the IDWT device are fully described through the above-described operation description, and thus redundant descriptions thereof will be omitted.

도 2는 본 발명에 따른 음조 신호와 비음조 신호 분리 결과를 나타낸 도면이다. 2 is a diagram illustrating a separation result of a tonal signal and a non-tone signal according to the present invention.

오디오 신호는 크게 음조 신호와 비음조 신호로 분리될 수 있으며 이는 DCT를 통해 분리할 수 있다. 음조 신호는 주기적인 특성을 나타내는 신호로 저주파 영역에서의 음조 신호는 사람의 귀에 덜 민감한 동시에 긴 주기를 가지고 있어 변화에 강인하다. 도시된 바와 같이, 도 2a가 원본의 오디오 신호이고, 상하 각각은 왼쪽 채널과 오른쪽 채널의 오디오 신호를 나타낸다. 도 2b는 음조 신호로, 도 2c의 비음조 신호와 다르게 표현되며, 비음조 신호의 경우 잡음에 가까운 신호 파형을 띄게 된다. The audio signal can be largely divided into tonal and non-tone signals, which can be separated by DCT. The tonal signal is a signal showing periodic characteristics. The tonal signal in the low frequency region is less sensitive to the human ear and has a long period, which is robust to change. As shown, Fig. 2A is the original audio signal, and each of the top and bottom shows the audio signal of the left channel and the right channel. FIG. 2B is a tonal signal, which is expressed differently from the non-tuned signal of FIG. 2C, and in the case of the non-tuned signal, has a signal waveform close to noise.

도 3은 본 발명에 따른 워터마크 삽입기인 QIM 방법을 나타낸 도면이다. 3 is a diagram illustrating a QIM method, which is a watermark inserter according to the present invention.

도 3을 참조하면, 본 발명에서 사용되는 워터마크 삽입기는 QIM(quantization index modulation)으로, 이는 워터마크를 삽입하는데 있어 삽입 정보값에 따라 다른 양자화 테이블을 사용하는 방법이다. 도 3a 내지 도 3c에 도시된 바와 같이, 삽입될 영역을 양자화 값(Q)의 절반인 Q/2로 나누고, 홀수 번째 혹은 짝수 번째에 해당되는 영역을 0 혹은 1의 정보가 삽입되는 영역으로 정한다. 예를 들어, 정보 0을 삽입할 경우 삽입 영역에서의 위치가 P점이었다고 하면, 그 위치를 정보 0의 영역에 대한 대표값으로 바꾸어 준다. 물론, 정보 1인 경우에는 그 반대로 수행하게 된다. 이렇게 정보가 삽입된 경우 추출은 오디오 신호를 삽입 영역으로 변환한 후에 계수들의 값들이 포함되는 영역이 어디인가를 판단하여 추출하게 된다. Referring to FIG. 3, the watermark inserter used in the present invention is quantization index modulation (QIM), which is a method of using a quantization table according to an insertion information value in inserting a watermark. As shown in FIGS. 3A to 3C, the region to be inserted is divided by Q / 2, which is half of the quantization value Q, and the region corresponding to the odd or even number is defined as the region into which information of 0 or 1 is inserted. . For example, when the information 0 is inserted, if the position in the insertion region is point P, the position is changed to the representative value for the region of the information 0. Of course, in the case of information 1, the reverse operation is performed. When the information is inserted as described above, the extraction converts the audio signal into the insertion region and then determines whether the region including the values of the coefficients is included and extracted.

도 4는 본 발명에 따른 워터마크 추출 과정을 나타낸 도면이다. 4 is a diagram illustrating a watermark extraction process according to the present invention.

도 4를 참조하면, 워터마크 추출을 위해서는 워터마크가 삽입된 신호(WATERMARKED SIGNAL)를 앞서 삽입과 동일하게 1,024개의 샘플을 한 프레임으로 하여 DCT를 수행한다. DCT 계수의 에너지값을 분석하여 음조 신호를 예측하기 위한 임계값을 구하고, 임계값 이상의 저주파 계수(LOW FREQ)들은 워터마크 추출기(WATERMARK EXTRACTOR(TONAL))를 통해 워터마크(WATERMARK SIGNAL(TONAL))를 추출하는데 이용된다. 한편, 임계값 이하의 고주파 계수(HIGH FREQ)들은 IDCT를 통해 비음조 신호를 구성한 후, DWT가 수행된다. DWT 계수들은 워터마크 추출기(WATERMARK EXTRACTOR(TRANSIENT))를 통해 워터마크(WATERMARK SIGNAL(TRANSIENT))를 추출하는데 이용된다. Referring to FIG. 4, in order to extract watermarks, DCT is performed by using a watermark-embedded signal (WATERMARKED SIGNAL) as 1,024 samples as one frame. The energy value of the DCT coefficient is analyzed to obtain a threshold value for predicting the tonal signal, and the low frequency coefficients (LOW FREQ) of the threshold value or more are WATERMARK SIGNAL (TONAL) through a watermark extractor (WATERMARK EXTRACTOR (TONAL)). It is used to extract On the other hand, the high frequency coefficients below the threshold (HIGH FREQ) configures the non-tuned signal through IDCT, and then DWT is performed. DWT coefficients are used to extract a watermark (WATERMARK SIGNAL (TRANSIENT)) via a watermark extractor (WATERMARK EXTRACTOR (TRANSIENT)).

여기서, 상기 DCT, DWT, IDCT, IDWT는 각각 연산을 수행하는 장치로서 구성 할 수 있으며, 이를 통해 하이브리드 변환을 이용한 디지털 오디오 워터마킹 추출기를 구성할 수 있다. 상기 DCT 장치, DWT 장치, IDCT 장치, IDWT 장치의 기능은 상기한 동작 설명을 통해 충분히 설명되고 있으므로 중복 설명은 생략하기로 한다. Here, the DCT, DWT, IDCT, and IDWT may be configured as a device for performing arithmetic operation, respectively, through which a digital audio watermarking extractor using a hybrid transformation may be configured. Functions of the DCT device, the DWT device, the IDCT device, and the IDWT device are fully described through the above-described operation description, and thus redundant descriptions thereof will be omitted.

이와 같이, 두 가지 영역에 이용함으로써 상호 보완관계를 지닐 수 있으며 다양한 오디오 신호처리에 강인할 수 있다. In this way, the two areas can be complementary and robust to various audio signal processing.

예를 들어 저주파 영역에만 워터마크를 삽입할 경우 고주파 필터링에 의해 제거될 수도 있는데, 본 발명에서는 비음조 신호에 DWT를 기반으로 하여 이러한 문제점을 극복하고 있다. 또한, 과거의 주파수 영역에서의 대역확산 방식 또한 이러한 문제점을 극복할 수 있으나, 복잡한 심리 음향 모델이 필요하며 대역확산 방식의 경우 추출에 상관값을 이용하여 검출 속도가 상대적으로 느릴 뿐만 아니라, 공격 특성을 반영한 논문에서 보듯이 상관값을 이용하는 경우가 주파수에 따라 다른 공격을 받는 환경에서는 최적이 아니므로, 본 발명에서 제안한 하이브리드 방식은 이러한 단점을 보완할 수 있다. For example, when a watermark is inserted only in a low frequency region, the watermark may be removed by high frequency filtering. The present invention overcomes this problem based on DWT in a non-tone signal. In addition, the spread spectrum method in the past frequency domain can also overcome this problem, but a complex psychoacoustic model is required, and in the spread spectrum method, the detection speed is relatively slow by using a correlation value for extraction, and the attack characteristics As shown in this paper, the use of correlation values is not optimal in environments that are subject to different attacks according to frequency, and the hybrid scheme proposed by the present invention can compensate for these disadvantages.

이상에서 몇 가지 실시예를 들어 본 발명을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것이 아니고 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형실시될 수 있다. Although the present invention has been described in more detail with reference to some embodiments, the present invention is not necessarily limited to these embodiments, and various modifications can be made without departing from the spirit of the present invention.

상술한 바와 같이, 본 발명에 의한 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법에 따르면, DCT, DWT, DFT(digital Fourier transform) 등과 같은 단일 변환만을 이용한 워터마크 삽입 방법에 비해 워터마크 삽입 후, 압축, 샘플링 레이트 변환 등과 같은 여러 공격에 강인하다. As described above, according to the digital audio watermarking method using the hybrid transformation according to the present invention, after the watermark is inserted, the compression, the watermark, compared to the watermark embedding method using only a single transform, such as DCT, DWT, digital Fourier transform (DFT), etc. It is robust against various attacks such as sampling rate conversion.

Claims (9)

원본 오디오 신호(ORIGINAL SIGNAL)에 대해 음조 신호와 비음조 신호를 구분하기 위한 변환을 수행하는 단계; Performing conversion for distinguishing a tonal signal from a non-tone signal on an original audio signal (ORIGINAL SIGNAL); 상기 변환의 결과값에 대해 설정값을 기준으로 저주파 계수와 고주파 계수로 구분하는 단계; Dividing the resultant value of the transform into a low frequency coefficient and a high frequency coefficient based on a set value; 상기 저주파 계수에 워터마크를 삽입하여 음조 신호를 생성함과 아울러, 상기 고주파 계수에 워터마크를 삽입하여 비음조 신호를 생성하는 단계; 및 Inserting a watermark into the low frequency coefficient to generate a tonal signal, and inserting a watermark into the high frequency coefficient to generate a non-tone signal; And 상기 생성된 음조신호와 비음조 신호를 더하여 워터마크가 삽입된 오디오 신호(WATERMARKED SIGNAL)를 생성하는 단계Generating an audio signal WATERMARKED SIGNAL by adding the generated tone signal and the non-tone signal. 를 포함하는 것을 특징으로 하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법. Digital audio watermarking method using a hybrid transformation, characterized in that it comprises a. 제1항에 있어서, 상기 음조 신호와 비음조 신호를 구분하기 위한 변환은, The method of claim 1, wherein the conversion for distinguishing the tone signal and the non-tone signal, DCT(discrete cosine transform)인 것을 특징으로 하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법. Digital audio watermarking method using a hybrid transform, characterized in that the DCT (discrete cosine transform). 제1항에 있어서, 상기 저주파 계수에 워터마크를 삽입하여 음조 신호를 생성하는 과정은, The method of claim 1, wherein the step of generating a tonal signal by embedding a watermark in the low frequency coefficient, 상기 저주파 계수에 대해 워터마크 삽입기(WATERMARK EMBEDDER(TONAL))에서 워터마크를 삽입한 후, IDCT(inverse discrete cosine transform)를 수행하여 음조 신호를 생성하는 것을 특징으로 하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법. Watermark inserter for the low frequency coefficient (WATERMARK EMBEDDER (TONAL)), the digital audio water using a hybrid transformation, characterized in that to generate a tonal signal by performing inverse discrete cosine transform (IDCT) Marking method. 제1항에 있어서, 상기 고주파 계수 각각에 워터마크를 삽입하여 비음조 신호를 생성하는 과정은, The process of claim 1, wherein the non-tuned signal is generated by inserting a watermark into each of the high frequency coefficients. 상기 고주파 계수에 대해 IDCT를 통해 비음조 신호를 구성한 후 DWT(discrete wavelet transform)가 수행되며, 워터마크 삽입기(WATERMARK EMBEDDER(TRANSIENT))에서 워터마크를 삽입한 후 IDWT(inverse discrete wavelet transform)를 수행하여 비음조 신호를 생성하는 것을 특징으로 하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법. After constructing a non-toned signal through the IDCT for the high frequency coefficient, a discrete wavelet transform (DWT) is performed. Digital audio watermarking method using a hybrid transformation, characterized in that to generate a non-tone signal by performing. 제3항 또는 제4항에 있어서, 상기 워터마크 삽입기는 삽입 정보값에 따라 다른 양자화 테이블을 사용하는 QIM(quantization index modulation)인 것을 특징으로 하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법. The method of claim 3 or 4, wherein the watermark inserter is a quantization index modulation (QIM) using a different quantization table according to the embedding information value. 원본 오디오 신호(ORIGINAL SIGNAL)에 대해 음조 신호와 비음조 신호를 구분하기 위한 변환을 수행하는 단계; Performing conversion for distinguishing a tonal signal from a non-tone signal on an original audio signal (ORIGINAL SIGNAL); 상기 변환의 결과값에 대해 설정값을 기준으로 저주파 계수와 고주파 계수로 구분하는 단계; Dividing the resultant value of the transform into a low frequency coefficient and a high frequency coefficient based on a set value; 상기 저주파 계수에서 워터마크를 추출함과 아울러, 상기 고주파 계수에서 워터마크를 추출하는 단계; 및 Extracting a watermark from the low frequency coefficient and extracting a watermark from the high frequency coefficient; And 를 포함하는 것을 특징으로 하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법. Digital audio watermarking method using a hybrid transformation, characterized in that it comprises a. 제6항에 있어서, 상기 음조 신호와 비음조 신호를 구분하기 위한 변환은, The method of claim 6, wherein the conversion for distinguishing the tone signal and the non-tone signal, DCT(discrete cosine transform)인 것을 특징으로 하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법. Digital audio watermarking method using a hybrid transform, characterized in that the DCT (discrete cosine transform). 제6항 또는 제7항에 있어서, 상기 저주파 계수에서 워터마크를 추출하는 과정은 The method of claim 6 or 7, wherein the extracting the watermark from the low frequency coefficient 상기 저주파 계수에 대해 워터마크 추출기(WATERMARK EXTRACTOR(TONAL))에서 워터마크를 추출하는 것을 특징으로 하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법. Watermark extractor (WATERMARK EXTRACTOR (TONAL)) to extract the watermark for the low frequency coefficient digital audio watermarking method using a hybrid transform. 제6항 또는 제7항에 있어서, 상기 고주파 계수에서 워터마크를 추출하는 과정은, The method of claim 6 or 7, wherein the extracting the watermark from the high frequency coefficient 상기 고주파 계수에 대해 IDCT를 통해 비음조 신호를 구성한 후 DWT(discrete wavelet transform)가 수행되며, 워터마크 추출기(WATERMARK EXTRACTOR(TRANSIENT))에서 워터마크를 추출하는 것을 특징으로 하는 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법. After constructing a non-toned signal through the IDCT for the high frequency coefficient, a discrete wavelet transform (DWT) is performed, and a watermark is extracted from a watermark extractor (WATERMARK EXTRACTOR (TRANSIENT)). Watermarking method.
KR1020060083242A 2005-12-08 2006-08-31 Digital audio watermarking method using hybrid transform KR100814792B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020050119712 2005-12-08
KR20050119712 2005-12-08

Publications (2)

Publication Number Publication Date
KR20070061285A true KR20070061285A (en) 2007-06-13
KR100814792B1 KR100814792B1 (en) 2008-03-19

Family

ID=38357219

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060083242A KR100814792B1 (en) 2005-12-08 2006-08-31 Digital audio watermarking method using hybrid transform

Country Status (1)

Country Link
KR (1) KR100814792B1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101333825B1 (en) * 2012-06-18 2013-11-29 울산대학교 산학협력단 Apparatus and method of audio watermarking, and, apparatus and method of audio watermark detecting
CN108074578A (en) * 2016-11-17 2018-05-25 中国科学院声学研究所 A kind of transmission of audio frequency watermark and the system and method for information exchange
CN111105337A (en) * 2019-12-19 2020-05-05 腾讯科技(深圳)有限公司 Watermark processing method, information display method and related device
CN111968654A (en) * 2020-08-24 2020-11-20 成都潜在人工智能科技有限公司 Self-adaptive mixed domain audio watermark embedding method
CN113506580A (en) * 2021-04-28 2021-10-15 合肥工业大学 Audio watermarking method and system capable of resisting random cutting and dubbing

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3685823B2 (en) * 1993-09-28 2005-08-24 ソニー株式会社 Signal encoding method and apparatus, and signal decoding method and apparatus
KR100289365B1 (en) * 1998-09-10 2001-05-02 최종욱 Method for watermarking digital image using wavelet transform and discrete cosine transform
US6442283B1 (en) 1999-01-11 2002-08-27 Digimarc Corporation Multimedia data embedding
KR100333163B1 (en) * 1999-03-29 2002-04-18 최종욱 Digital watermarking method and apparatus
KR19990046546A (en) * 1999-03-29 1999-07-05 최종욱 A Digital Watermarking Techique For Digital Audio
KR20040034465A (en) * 2002-10-16 2004-04-28 (주)메이즈텍 Encryption processing method and device of a voice signal

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101333825B1 (en) * 2012-06-18 2013-11-29 울산대학교 산학협력단 Apparatus and method of audio watermarking, and, apparatus and method of audio watermark detecting
CN108074578A (en) * 2016-11-17 2018-05-25 中国科学院声学研究所 A kind of transmission of audio frequency watermark and the system and method for information exchange
CN111105337A (en) * 2019-12-19 2020-05-05 腾讯科技(深圳)有限公司 Watermark processing method, information display method and related device
CN111105337B (en) * 2019-12-19 2022-05-17 腾讯科技(深圳)有限公司 Watermark processing method, information display method and related device
CN111968654A (en) * 2020-08-24 2020-11-20 成都潜在人工智能科技有限公司 Self-adaptive mixed domain audio watermark embedding method
CN113506580A (en) * 2021-04-28 2021-10-15 合肥工业大学 Audio watermarking method and system capable of resisting random cutting and dubbing
CN113506580B (en) * 2021-04-28 2024-05-07 合肥工业大学 Audio watermarking method and system capable of resisting random cutting and transcription

Also Published As

Publication number Publication date
KR100814792B1 (en) 2008-03-19

Similar Documents

Publication Publication Date Title
Lei et al. Blind and robust audio watermarking scheme based on SVD–DCT
Xiang et al. Histogram-based audio watermarking against time-scale modification and cropping attacks
Lemma et al. A temporal domain audio watermarking technique
Dhar et al. A new audio watermarking system using discrete fourier transform for copyright protection
EP0766468A3 (en) Method and system for inserting a spread spectrum watermark into multimedia data
Wang et al. A robust digital audio watermarking based on statistics characteristics
CN113782041B (en) Method for embedding and positioning watermark based on audio variable frequency domain
KR100814792B1 (en) Digital audio watermarking method using hybrid transform
Dhar et al. Digital watermarking scheme based on fast Fourier transformation for audio copyright protection
Nikmehr et al. A new approach to audio watermarking using discrete wavelet and cosine transforms
KR100355033B1 (en) Apparatus and Method for Watermark Embedding and Detection using the Linear Prediction Analysis
Park et al. Speech authentication system using digital watermarking and pattern recovery
Attari et al. Robust and transparent audio watermarking based on spread spectrum in wavelet domain
Vivekananda et al. Audio watermarking based on mean quantization in cepstrum domain
EP1639826B1 (en) Raising detectability of additional data in a media signal having few frequency components
Radhakrishnan et al. Audio content authentication based on psycho-acoustic model
Subhashini et al. Robust audio watermarking for monitoring and information embedding
Patel et al. Secure transmission of password using speech watermarking
Wu et al. Adaptive audio watermarking based on SNR in localized regions
Singh et al. Multiplicative watermarking of audio in DFT magnitude
US20070286450A1 (en) Method and apparatus for detecting a watermark in a signal
KR20060112667A (en) Watermark embedding
Dhar et al. An audio watermarking scheme using discrete fourier transformation and singular value decomposition
Li et al. A novel audio watermarking in wavelet domain
Himeur et al. Secure and robust audio watermarking system for copyright protection

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Publication of correction
FPAY Annual fee payment

Payment date: 20130308

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140312

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee