KR20160050186A - Apparatus for reducing wind noise and method thereof - Google Patents

Apparatus for reducing wind noise and method thereof Download PDF

Info

Publication number
KR20160050186A
KR20160050186A KR1020140147655A KR20140147655A KR20160050186A KR 20160050186 A KR20160050186 A KR 20160050186A KR 1020140147655 A KR1020140147655 A KR 1020140147655A KR 20140147655 A KR20140147655 A KR 20140147655A KR 20160050186 A KR20160050186 A KR 20160050186A
Authority
KR
South Korea
Prior art keywords
noise
wind
wind noise
frequency component
spectrum
Prior art date
Application number
KR1020140147655A
Other languages
Korean (ko)
Inventor
서명환
Original Assignee
현대엠엔소프트 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대엠엔소프트 주식회사 filed Critical 현대엠엔소프트 주식회사
Priority to KR1020140147655A priority Critical patent/KR20160050186A/en
Publication of KR20160050186A publication Critical patent/KR20160050186A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

The present invention relates to a wind noise reduction apparatus and a method thereof. The wind noise reduction apparatus includes: a short-term Fourier conversion unit which receives a sound signal and converts the received sound signal to a frequency component; a wind noise detection unit which calculates a wind noise detection coefficient in accordance with whether the sound signal converted to the frequency component includes a sound area of wind noise; a wind noise spectrum extraction unit which extracts a wind noise spectrum component from the sound signal converted to the frequency component in accordance with the wind noise detection coefficient; a wind noise reduction unit which uses a wind noise spectrum component to reduce the wind noise included in the sound signal converted to the frequency component; and a reverse short-term Fourier conversion unit which converts the sound signal of the frequency component with reduced wind noise to a time component and outputs the converted time component.

Description

풍음 잡음 경감 장치와 방법{APPARATUS FOR REDUCING WIND NOISE AND METHOD THEREOF}[0001] APPARATUS FOR REDUCING WIND NOISE AND METHOD THEREOF [0002]

본 발명은 풍음 잡음 경감 장치와 방법에 관한 것으로, 보다 상세하게는 실제 음성 통신 환경에서 풍음 잡음만으로 구성된 구간의 스펙트럼 성분을 이용하여 음성에 포함된 풍음 잡음을 제거할 수 있도록 하는 풍음 잡음 경감 장치와 방법에 관한 것이다.
More particularly, the present invention relates to an apparatus and method for reducing wind noise included in a voice by using a spectral component of a section composed only of a pitch noise in an actual voice communication environment ≪ / RTI >

일반적으로 차량은 주행 중 다양한 종류의 잡음이 발생되며, 그 중 풍음 잡음은 자동차의 주행 시 바람에 의해 발생되는 잡음을 의미한다. 따라서 다양한 차량 잡음을 제거하기 위한 장치와 방법이 개발되고 있다.Generally, various kinds of noise are generated in a vehicle while wind noise refers to noise generated by the wind when the vehicle is running. Accordingly, devices and methods for eliminating various vehicle noise have been developed.

한편 최근에는 사고 방지를 위하여 차량 내에서의 전화 통화가 제한되며 통화를 위해서는 핸즈프리를 이용하도록 제도화 되어 있다. 따라서 최근에는 핸즈프리를 이용해 통화하는 운전자가 증가하고 있다.In recent years, however, telephone calls within the vehicle have been restricted to prevent accidents, and the hands-free system has been used to make calls. Therefore, in recent years, the number of operators using handsfree has increased.

그런데 상기와 같이 차량 내에서의 핸즈프리를 이용한 음성 통화 시 차량의 풍음 잡음으로 인해 음질이 열화되는 문제점이 발생한다. However, there is a problem that sound quality is deteriorated due to the wind noise of the vehicle during the voice call using the handsfree in the vehicle as described above.

본 발명의 배경기술은 대한민국 등록특허 10-0976003호(2010.08.09.등록, 자동 풍음 저감 회로 및 자동 풍음 저감 방법)에 개시되어 있다.
BACKGROUND ART [0002] The background art of the present invention is disclosed in Korean Registered Patent No. 10-0976003 (registered on Aug., 2010, Sep. 2010, automatic tone reduction circuit and automatic tone reduction method).

본 발명은 상기와 같은 문제점을 해결하기 위해 창작된 것으로서, 실제 음성 통신 환경에서 풍음 잡음만으로 구성된 구간의 스펙트럼 성분을 이용하여 음성에 포함된 풍음 잡음을 제거할 수 있도록 하는 풍음 잡음 경감 장치와 방법을 제공하는데 그 목적이 있다. The present invention has been made in order to solve the above-mentioned problems, and it is an object of the present invention to provide a pitch noise reduction device and method capable of eliminating wind noise included in a voice using a spectrum component of a section composed only of pitch noise in a real voice communication environment The purpose is to provide.

또한 본 발명은 실제 음성 통신 환경에서 장기 스펙트럼 인벨로프(Long-term spectral envelop) 풍음 검출 방식을 이용하여 풍음 검출 성능을 향상시킴으로써 풍음이 아닌 음성의 왜곡을 최소화시킬 수 있도록 하는 풍음 잡음 경감 장치와 방법을 제공하는데 그 목적이 있다.
The present invention also relates to a wind noise reducing device for minimizing distortion of a sound by improving a sound detection performance by using a long-term spectral envelop sound detection method in a real voice communication environment The purpose of the method is to provide.

본 발명의 일 측면에 따른 풍음 잡음 경감 장치는, 음성 신호를 입력받아 주파수 성분으로 변환하는 단기간 푸리에 변환부; 상기 주파수 성분으로 변환된 음성 신호에서 풍음 잡음에 음성 영역이 포함되어 있는지 여부에 따라 풍음 검출 계수를 연산하는 풍음 잡음 검출부; 상기 풍음 검출 계수에 따라 상기 주파수 성분으로 변환된 음성 신호에서 풍음 잡음 스펙트럼 성분을 추출하는 풍음 잡음 스펙트럼 추출부; 상기 풍음 잡음 스펙트럼 성분을 사용하여 상기 주파수 성분으로 변환된 음성 신호에 포함된 풍음 잡음을 경감시키는 풍음 잡음 경감부; 및 상기 풍음 잡음이 경감된 주파수 성분의 음성 신호를 시간 성분으로 변환하여 출력하는 역 단기간 푸리에 변환부;를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided a pitch noise reduction apparatus comprising: a short term Fourier transform unit for receiving a voice signal and converting the voice signal into a frequency component; A wind noise detector for calculating a wind noise detection coefficient depending on whether a sound region is included in the wind noise in the speech signal converted into the frequency component; A wind noise spectrum extractor for extracting a wind noise spectrum component from the speech signal converted into the frequency component according to the wind sound detection coefficient; A pitch noise reducing unit for reducing the pitch noise included in the voice signal converted into the frequency component by using the pitch noise spectrum component; And an anti-short-term Fourier transformer for converting the voice signal of the frequency component in which the pitch noise is reduced to a time component and outputting the converted time component.

본 발명에 있어서, 상기 풍음 잡음 검출부는, 상기 주파수 성분으로 변환된 음성 신호의 전체 프레임에서 각 주파수 성분의 최대값을 취득하여 장기 스펙트럼 인벨로프 값을 연산하는 장기 스펙트럼 인벨로프 연산부; 상기 주파수 성분으로 변환된 음성 신호의 전체 프레임 중 임의로 설정된 음성 프레임에서 각 주파수 성분의 최소값을 취득하여 입력 잡음 스펙트럼 정보를 연산하는 잡음 스펙트럼 연산부; 상기 장기 스펙트럼 인벨로프 값과 입력 잡음 스펙트럼 정보를 이용하여 장기 스펙트럼 발산 정보를 연산하는 장기 스펙트럼 발산 연산부; 상기 주파수 성분으로 변환된 음성 신호로부터 풍음 잡음과 음성 영역을 구분하는 임계값을 연산하는 임계값 연산부; 및 상기 장기 스펙트럼 발산 정보와 상기 임계값을 입력받아 풍음 검출 계수를 연산하는 풍음 계수 연산부;를 포함하는 것을 특징으로 한다.In the present invention, the wind noise detection unit may be a long-term spectrum that calculates a long-term spectrum value by obtaining a maximum value of each frequency component in an entire frame of the voice signal converted into the frequency component; A noise spectrum operation unit for obtaining a minimum value of each frequency component in a voice frame arbitrarily set among all the frames of the voice signal converted into the frequency component and calculating input noise spectrum information; A long-term spectral divergence calculation unit for calculating long-term spectral divergence information using the long-term spectral bellows value and the input noise spectrum information; A threshold value computing unit for computing a threshold value for distinguishing the sound noise and the speech region from the speech signal converted into the frequency component; And a wind noise coefficient operation unit for receiving the long-term spectrum divergence information and the threshold value to calculate a wind noise detection coefficient.

본 발명에 있어서, 상기 임계값 연산부는, 이전 음성 프레임에서의 풍음 검출 유무에 따라 풍음 검출 계수가 "1"이면 입력 잡음 전력 정보를 연산하고, 상기 풍음 검출 계수가 "0"이면 입력 음성의 전력 정보를 연산하고, 상기 연산된 전력 정보들을 이용하여 신호 잡음비를 산출하고, 상기 전력 정보들에 대한 신호 잡음비를 미리 설정된 임의의 산술식에 적용하여 임계값을 연산하는 것을 특징으로 한다.In the present invention, the threshold arithmetic unit calculates input noise power information when the wind noise detection coefficient is "1" according to presence / absence of wind sound detection in the previous speech frame, and when the wind sound detection coefficient is "0" Calculating a signal-to-noise ratio using the calculated power information, and applying a signal-to-noise ratio of the power information to a predetermined arithmetic expression to calculate a threshold value.

본 발명에 있어서, 상기 풍음 검출 계수가 "1"이면 풍음만으로 구성된 것이고, 상기 풍음 검출 계수가 "0"이면 풍음에 음성이 포함된 것을 의미하는 것을 특징으로 한다.In the present invention, when the wind sound detection coefficient is "1", it is composed only of wind sounds, and when the wind sound detection coefficient is "0", it means that wind sounds include sound.

본 발명에 있어서, 상기 풍음 잡음 경감부는, 상기 풍음 검출 계수가 "1"인 경우, 풍음 잡음 스펙트럼 추출부에서 추출된 풍음 잡음 스펙트럼 성분과 입력 음성 신호의 스펙트럼 성분을 이용하여 포스테리오리(posteriori) 신호 잡음비를 산출하고, 상기 포스테리오리 신호 잡음비를 사용하여 미리 설정된 임의의 산출식에 적용하여 경감이득을 산출하고, 상기 경감이득을 입력 음성 신호에 곱하여 상기 음성 신호의 풍음 잡음을 경감 시키는 것을 특징으로 한다.In the present invention, when the wind sound detection coefficient is "1 ", the wind noise reduction unit uses the wind noise spectrum component extracted from the wind noise spectrum extraction unit and the spectral component of the input speech signal to calculate a posteriori Calculating a reduction gain by applying the noise reduction ratio to an arbitrary calculation formula which is set in advance by using the above-mentioned Fourier-Ratio signal-to-noise ratio and multiplying the reduction gain by the input voice signal to reduce wind noise of the voice signal; .

본 발명에 있어서, 상기 풍음 잡음 경감부는, 상기 풍음 검출 계수가 "0"인 경우, 현재 음성 프레임에 풍음 잡음과 음성이 함께 포함된 것을 의미하는 것으로서, 풍음 잡음만으로 구성된 이전 프레임에서 산출된 경감이득을 현재 프레임의 입력 음성 신호에 곱하여 출력하는 것을 특징으로 한다.
In the present invention, the pitch-tone noise reduction unit means that the current sound frame includes both pitch noise and speech when the pitch sound detection coefficient is "0 ", and the subtraction gain Is multiplied by the input speech signal of the current frame and output.

본 발명의 다른 측면에 따른 풍음 잡음 경감 방법은, 단기간 푸리에 변환부가 음성 신호를 입력받아 주파수 성분으로 변환하는 단계; 풍음 잡음 검출부가 상기 주파수 성분으로 변환된 음성 신호에서 풍음 잡음에 음성 영역이 포함되어 있는지 여부에 따라 풍음 검출 계수를 연산하는 단계; 풍음 잡음 스펙트럼 추출부가 상기 풍음 검출 계수에 따라 상기 주파수 성분으로 변환된 음성 신호에서 풍음 잡음 스펙트럼 성분을 추출하는 단계; 풍음 잡음 경감부가 상기 풍음 잡음 스펙트럼 성분을 사용하여 상기 주파수 성분으로 변환된 음성 신호에 포함된 풍음 잡음을 경감시키는 단계; 역 단기간 푸리에 변환부가 상기 풍음 잡음이 경감된 주파수 성분의 음성 신호를 시간 성분으로 변환하여 출력하는 단계;를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a wind noise reduction method, comprising: a short-term Fourier transform unit receiving a speech signal and converting the speech signal into a frequency component; Calculating a wind sound detection coefficient according to whether or not a sound region is included in the wind noise in the speech signal in which the wind noise detection unit converts the frequency component; Extracting a wind noise spectrum component in the speech signal converted into the frequency component according to the wind sound detection coefficient; Reducing the pitch noise included in the voice signal converted into the frequency component using the pitch noise spectrum component; And the short-term Fourier transform unit converts the sound signal of the frequency component in which the wind noise is reduced to a time component and outputs the time component.

본 발명에 있어서, 상기 풍음 검출 계수를 연산하는 단계에서, 상기 풍음 잡음 검출부는, 장기 스펙트럼 인벨로프 연산부를 통해 상기 주파수 성분으로 변환된 음성 신호의 전체 프레임에서 각 주파수 성분의 최대값을 취득하여 장기 스펙트럼 인벨로프 값을 연산하는 단계; 잡음 스펙트럼 연산부를 통해 상기 주파수 성분으로 변환된 음성 신호의 전체 프레임 중 임의로 설정된 음성 프레임에서 각 주파수 성분의 최소값을 취득하여 입력 잡음 스펙트럼 정보를 연산하는 단계; 장기 스펙트럼 발산 연산부를 통해 상기 장기 스펙트럼 인벨로프 값과 입력 잡음 스펙트럼 정보를 이용하여 장기 스펙트럼 발산 정보를 연산하는 단계; 임계값 연산부를 통해 상기 주파수 성분으로 변환된 음성 신호로부터 풍음 잡음과 음성 영역을 구분하는 임계값을 연산하는 단계; 및 풍음 계수 연산부를 통해 상기 장기 스펙트럼 발산 정보와 상기 임계값을 입력받아 풍음 검출 계수를 연산하는 단계;를 포함하는 것을 특징으로 한다.In the present invention, in the step of calculating the wind sound detection coefficient, the wind noise detection unit obtains the maximum value of each frequency component in the entire frame of the voice signal converted into the frequency component through the velocity calculation unit as the long-term spectrum Computing a Velocity value that is a long term spectrum; Acquiring a minimum value of each frequency component in a voice frame arbitrarily set among all the frames of the voice signal converted into the frequency component through a noise spectrum operation unit and calculating input noise spectrum information; Computing long-term spectral divergence information by using a long-term spectral divergence unit and a long-term spectral envelope value and input noise spectrum information; Calculating a threshold value for distinguishing the wind noise and the speech region from the speech signal converted into the frequency component through the threshold value operation unit; And computing the wind speed detection coefficient by receiving the long-term spectrum divergence information and the threshold value through a wind speed coefficient operation unit.

본 발명에 있어서, 상기 임계값을 연산하는 단계에서, 상기 임계값 연산부는, 이전 음성 프레임에서의 풍음 검출 유무에 따라 풍음 검출 계수가 "1"이면 입력 잡음 전력 정보를 연산하고, 상기 풍음 검출 계수가 "0"이면 입력 음성의 전력 정보를 연산하며, 상기 연산된 전력 정보들을 이용하여 신호 잡음비를 산출하고, 상기 전력 정보들에 대한 신호 잡음비를 미리 설정된 임의의 산술식에 적용하여 임계값을 연산하는 것을 특징으로 한다.In the present invention, in the step of calculating the threshold value, the threshold arithmetic unit may calculate the input noise power information when the wind noise detection coefficient is "1" according to presence / absence of wind sound detection in the previous speech frame, Is calculated by calculating the power information of the input voice, calculating the signal-to-noise ratio using the calculated power information, and applying the signal-to-noise ratio of the power information to a predetermined arithmetic expression to calculate a threshold value .

본 발명에 있어서, 상기 풍음 검출 계수가 "1"이면 풍음만으로 구성된 것이고, 상기 풍음 검출 계수가 "0"이면 풍음에 음성이 포함된 것을 의미하는 것을 특징으로 한다.In the present invention, when the wind sound detection coefficient is "1", it is composed only of wind sounds, and when the wind sound detection coefficient is "0", it means that wind sounds include sound.

본 발명에 있어서, 상기 풍음 잡음을 경감시키는 단계에서, 상기 풍음 잡음 경감부는, 상기 풍음 검출 계수가 "1"인 경우, 풍음 잡음 스펙트럼 추출부에서 추출된 풍음 잡음 스펙트럼 성분과 입력 음성 신호의 스펙트럼 성분을 이용하여 포스테리오리(posteriori) 신호 잡음비를 산출하며, 상기 포스테리오리 신호 잡음비를 사용하여 미리 설정된 임의의 산출식에 적용하여 경감이득을 산출하고, 상기 경감이득을 입력 음성 신호에 곱하여 상기 음성 신호의 풍음 잡음을 경감 시키는 것을 특징으로 한다.In the present invention, in the step of alleviating the pitch noise, the pitch noise suppression unit may be configured such that when the pitch sound detection coefficient is "1 ", the pitch noise spectrum component extracted by the pitch noise spectrum extracting unit and the spectral component Calculating a posteriori signal-to-noise ratio using the posteriori signal-to-noise ratio, applying the calculated posteriori signal-to-noise ratio to an arbitrary calculation formula set in advance using the posteriori signal-to-noise ratio, multiplying the reduction gain by the input voice signal, Thereby reducing wind noise of the signal.

본 발명에 있어서, 상기 풍음 잡음 경감부는, 상기 풍음 검출 계수가 "0"인 경우, 현재 음성 프레임에 풍음 잡음과 음성이 함께 포함된 것을 의미하는 것으로서, 풍음 잡음만으로 구성된 이전 프레임에서 산출된 경감이득을 현재 프레임의 입력 음성 신호에 곱하여 출력하는 것을 특징으로 한다.
In the present invention, the pitch-tone noise reduction unit means that the current sound frame includes both pitch noise and speech when the pitch sound detection coefficient is "0 ", and the subtraction gain Is multiplied by the input speech signal of the current frame and output.

본 발명은 실제 음성 통신 환경에서 풍음 잡음만으로 구성된 구간의 스펙트럼 성분을 이용하여 음성에 포함된 풍음 잡음을 제거할 수 있도록 하며, 장기 스펙트럼 인벨로프(Long-term spectral envelop) 풍음 검출 방식을 이용하여 풍음 검출 성능을 향상시킴으로써 풍음이 아닌 음성의 왜곡을 최소화시키며, 또한 음성 통화 중 일정 구간의 음성 프레임들에 대한 주파수 성분 최소값을 초기 입력 잡음 주파수 성분으로 사용함으로써 초기 입력 잡음을 임의로 설정할 수 없는 실제 음성 통신 환경에 유동적으로 대응할 수 있도록 하며, 차량 내에서 이루어지는 음성인식률을 향상시킬 수 있도록 한다.
The present invention is capable of eliminating wind noise included in speech by using a spectrum component of a section composed only of wind noise in an actual voice communication environment and using a long-term spectral envelop sound detection method It is an object of the present invention to provide a real voice which can not arbitrarily set an initial input noise by minimizing the distortion of voice other than the wind sound by improving the sound detection performance and by using the frequency component minimum value for voice frames of a certain interval during voice communication as an initial input noise frequency component. It is possible to flexibly cope with the communication environment and improve the voice recognition rate in the vehicle.

도 1은 본 발명의 일 실시예에 따른 풍음 잡음 경감 장치의 개략적인 구성을 보인 예시도.
도 2는 본 발명의 일 실시예에 따른 풍음 잡음 경감 방법을 설명하기 위한 흐름도.
BRIEF DESCRIPTION OF THE DRAWINGS Fig. 1 is an exemplary diagram showing a schematic configuration of a wind noise reduction device according to an embodiment of the present invention; Fig.
2 is a flowchart illustrating a wind noise reduction method according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명에 따른 풍음 잡음 경감 장치와 방법의 일 실시예를 설명한다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT Hereinafter, an embodiment of a wind noise reduction apparatus and method according to the present invention will be described with reference to the accompanying drawings.

이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.In this process, the thicknesses of the lines and the sizes of the components shown in the drawings may be exaggerated for clarity and convenience of explanation. In addition, the terms described below are defined in consideration of the functions of the present invention, which may vary depending on the intention or custom of the user, the operator. Therefore, definitions of these terms should be made based on the contents throughout this specification.

도 1은 본 발명의 일 실시예에 따른 풍음 잡음 경감 장치의 개략적인 구성을 보인 예시도이다.FIG. 1 is a diagram illustrating a schematic configuration of a wind noise reduction apparatus according to an embodiment of the present invention. Referring to FIG.

도 1에 도시된 바와 같이, 본 실시예에 따른 풍음 잡음 경감 장치는, 단기간 푸리에 변환(STFT : Short Time Fourier Transform)부(101), 장기 스펙트럼 인벨로프(LTSE : Long Time Spectrum Envelope) 연산부(102), 잡음 스펙트럼 연산부(103), 임계값 연산부(104), 장기 스펙트럼 발산(LTSD : Long Time Spectrum Divergence) 연산부(105), 풍음 계수 연산부(106), 풍음 잡음 스펙트럼 추출부(108), 풍음 잡음 경감부(109), 및 역 단기간 푸리에 변환(Inverse Short Time Fourier Transform)부(110)를 포함한다. 1, the wind noise reduction apparatus according to the present embodiment includes a short time Fourier transform (STFT) unit 101, a long time spectrum envelope (LTSE) 102, a noise spectrum calculator 103, a threshold calculator 104, a long time spectrum divergence (LTSD) calculator 105, a sound coefficient calculator 106, a sound noise spectrum extractor 108, A noise reduction unit 109, and an inverse short time Fourier transform unit 110. [

상기 단기간 푸리에 변환부(101)는 접속선(100)을 통해 음성 신호가 입력되면 단기간 푸리에 변환(Short Time Fourier Transform)을 수행한다.The short-term Fourier transform unit 101 performs a short-time Fourier transform when a voice signal is input through the connection line 100.

상기 단기간 푸리에 변환부(101)는 상기 입력된 음성 신호를 주파수 성분으로 변환하여 출력한다. The short-term Fourier transform unit 101 converts the input speech signal into frequency components and outputs the frequency components.

상기 단기간 푸리에 변환부(101)에서 출력되는 주파수 성분은 장기 스펙트럼 인벨로프 연산부(102)에 입력된다.The frequency component output from the short-term Fourier transform unit 101 is input to the envelope calculator 102, which is a long-term spectrum.

상기 장기 스펙트럼 인벨로프 연산부(102)는 N개(전체 프레임의 개수)의 음성 프레임에서 각 주파수 성분의 최대값을 취득하여 장기 스펙트럼 인벨로프 값을 연산한다. 이때 상기 음성 프레임의 개수(N) 설정에 따라 풍음 잡음 검출 성능이 변경된다.The envelope calculator 102, which is the long-term spectrum, obtains the maximum value of each frequency component in N (voice frames of the total number of frames) to calculate the long-term spectrum velocity value. At this time, the wind noise detection performance is changed according to the number N of the voice frames.

상기 잡음 스펙트럼 연산부(103)는 M개(전체 프레임 중 사용자가 임의로 설정한 프레임 개수)의 음성 프레임에서 각 주파수 성분의 최소값, 즉, 초기 입력 잡음 스펙트럼 정보를 취득하여 입력 잡음 스펙트럼 정보를 연산한다.The noise spectrum calculation unit 103 obtains the minimum value of each frequency component, that is, the initial input noise spectrum information, in the voice frames of M (the number of frames arbitrarily set by the user in all frames), and calculates input noise spectrum information.

상기 장기 스펙트럼 발산 연산부(105)는 상기 장기 스펙트럼 인벨로프 연산부(102)와 상기 잡음 스펙트럼 연산부(103)에서 연산하여 산출된 정보(예 : 장기 스펙트럼 인벨로프 값, 입력 잡음 스펙트럼 정보)를 이용하여 장기 스펙트럼 발산 정보를 연산한다.The long-term spectrum divergence arithmetic operation unit 105 uses the information (for example, the long-term spectrum value, the input noise spectrum information) calculated by the envelope arithmetic unit 102 and the noise spectrum arithmetic unit 103, Thereby calculating the long-term spectrum divergence information.

상기 장기 스펙트럼 발산 정보는 상기 풍음 계수 연산부(106)에 입력된다. The long-term spectrum divergence information is input to the tone value calculation unit 106.

아울러, 상기 임계값 연산부(104)는 이전 음성 프레임에서의 풍음 검출 유무에 따라 검출 계수가 "1"이면 입력 잡음 전력 정보를 연산하고, 상기 검출 계수가 "0"이면 입력 음성의 전력 정보를 연산한다. 그리고 상기 연산된 전력 정보들(예 : 입력 잡음 전력 정보 및 입력 음성 전력 정보)을 이용하여 신호 잡음비를 산출하고, 상기 전력 정보들에 대한 신호 잡음비를 미리 설정된 임의의 산술식에 적용하여 임계값(즉, 풍음 잡음과 음성 영역을 구분 짓는 임계값)을 연산한다. The threshold computing unit 104 computes input noise power information when the detection coefficient is "1 " according to presence / absence of wind noise detection in the previous speech frame, and if the detection coefficient is" 0 & do. The signal noise ratio is calculated using the calculated power information (e.g., input noise power information and input voice power information), and the signal noise ratio for the power information is applied to an arbitrary predetermined arithmetic expression to calculate a threshold value That is, a threshold value that distinguishes the pitch noise from the speech area).

그리고 상기 임계값은 풍음 계수 연산부(106)에 입력된다.The threshold value is input to the tone value calculation unit 106.

상기 풍음 계수 연산부(106)은 상기 장기 스펙트럼 발산 정보와 상기 임계값을 입력받아 풍음 검출 계수를 연산한다. 상기 풍음 검출 계수는 풍음 검출 유무를 판단하는 요소로서 사용된다.The tune coefficient operation unit 106 receives the long-term spectrum divergence information and the threshold value, and calculates a tune sound detection coefficient. The wind sound detection coefficient is used as an element for judging presence / absence of wind sound detection.

상기 풍음 검출 계수는 상기 풍음 잡음 스펙트럼 추출부(108)에 입력된다.The wind noise detection coefficient is input to the wind noise spectrum extracting unit 108.

상기 풍음 잡음 스펙트럼 추출부(108)는 상기 풍음 검출 계수를 사용하여 풍음 잡음 스펙트럼 성분을 추출한다. 즉, 상기 풍음 잡음 스펙트럼 추출부(108)는 풍음 검출 계수(1 또는 0)에 따라 풍음 잡음의 스펙트럼 성분을 추출한다.The wind noise spectrum extracting unit 108 extracts wind noise spectrum components using the wind sound detection coefficient. That is, the wind noise spectrum extracting unit 108 extracts spectral components of the wind noise according to the wind sound detection coefficient (1 or 0).

예컨대 상기 풍음 검출 계수가 "1"이면 풍음 잡음 신호의 전력을 구하여 풍음 잡음 스펙트럼 성분을 추출하고, 상기 풍음 검출 계수가 "0"이면 이 과정을 수행하지 않는다. For example, if the wind noise detection coefficient is "1 ", the power of the wind noise signal is obtained to extract the wind noise spectrum component. If the wind noise detection coefficient is" 0 "

상기 풍음 잡음 스펙트럼 추출부(108)에서 추출된 풍음 잡음 스펙트럼 성분은 풍음 잡음 경감부(109)에 입력된다.The wind noise spectrum component extracted by the wind noise spectrum extracting unit 108 is input to the wind noise reduction unit 109.

상기 풍음 잡음 경감부(109)는 상기 풍음 잡음 스펙트럼 성분을 사용하여 음성에 포함된 풍음 잡음을 제거한다. The pitch noise reduction unit 109 removes pitch noise included in the speech using the pitch noise spectrum component.

상기 풍음 잡음 경감부(109)는 상기 풍음 검출 계수가 "1"이면 풍음 잡음 스펙트럼 추출부(108)에서 추출된 풍음 잡음 스펙트럼 성분과 입력 음성 신호의 스펙트럼 성분을 이용하여 포스테리오리(posteriori) 신호 잡음비를 산출하고, 상기 포스테리오리 신호 잡음비를 사용하여 미리 설정된 임의의 산출식에 적용하여 경감이득을 산출한다. If the wind noise detection coefficient is "1 ", the wind noise reduction unit 109 uses the wind noise spectrum component extracted from the wind noise spectrum extraction unit 108 and the spectral components of the input speech signal to generate a posteriori signal Noise ratio is calculated, and the reduction gain is calculated by applying the calculated noise ratios to an arbitrary calculation formula set in advance using the Fourier signal noise ratio.

반면에 상기 풍음 검출 계수가 "0"이면, 현재 음성 프레임에 풍음 잡음과 음성이 함께 포함된 것을 의미하므로, 이전 프레임에서 연산된 풍음 잡음 스펙트럼 성분을 이용하여, 상기 풍음 검출 계수가 "1"일 때와 같은 연산 과정을 거쳐 경감이득(즉, 풍음 잡음이 포함된 이전 프레임에서 산출된 포스테리오리 신호 잡음비를 사용하여 미리 설정된 임의의 산출식에 적용하여 산출된 경감이득)을 산출한다. 그리고 상기 경감이득을 입력 음성 신호의 주파수 성분에 곱함으로써 음성에 포함된 풍음 잡음을 경감 시킨다.On the other hand, if the wind noise detection coefficient is "0 ", it means that the wind noise noise and the voice are included together in the current speech frame. Therefore, by using the wind noise spectrum component calculated in the previous frame, (I.e., a reduction gain calculated by applying to the predetermined calculation formula previously set using the Fourier noise signal noise ratio calculated in the previous frame including the pitch noise). And reduces the wind noise included in the speech by multiplying the frequency gain of the input speech signal by the reduction gain.

상기 경감이득이 곱해진 입력 음성 신호의 주파수 성분은 상기 역 단기간 푸리에 변환부(110)에 입력된다.The frequency component of the input speech signal multiplied by the reduction gain is input to the inverse Fourier transform unit 110.

상기 역 단기간 푸리에 변환부(110)는 상기 경감이득이 곱해진 입력 음성 신호의 주파수 성분을 시간 성분으로 변환하여 연결선(111)을 통해 출력한다. 즉, 상기 연결선(111)을 통해 풍음 잡음이 경감된 음성 신호가 출력된다.The reverse short-term Fourier transform unit 110 converts the frequency component of the input speech signal multiplied by the relief gain into a time component and outputs the time component through a connection line 111. That is, a voice signal with reduced wind noise is output through the connection line 111.

한편 본 실시예에서는 상기 장기 스펙트럼 인벨로프 연산부(102), 잡음 스펙트럼 연산부(103), 임계값 연산부(104), 장기 스펙트럼 발산 연산부(105), 풍음 계수 연산부(106)을 별도의 구성 수단으로서 설명하였으나, 실시예에 따라서는 하나의 풍음 잡음 검출부(107)로서 구현할 수도 있다.In the present embodiment, the long-term spectral envelope calculator 102, the noise spectrum calculator 103, the threshold calculator 104, the long-term spectrum divergence calculator 105, However, it may be implemented as one wind noise detection unit 107 according to the embodiment.

도 2는 본 발명의 일 실시예에 따른 풍음 잡음 경감 방법을 설명하기 위한 흐름도이다. 2 is a flowchart illustrating a wind noise reduction method according to an embodiment of the present invention.

도 2에 도시된 바와 같이, 음성 신호가 입력되면(S101), 단기간 푸리에 변환부(101)는 단기간 푸리에 변환(Short Time Fourier Transform)을 수행하여 상기 입력된 음성 신호를 주파수 성분으로 변환하여 출력한다(S102). As shown in FIG. 2, when a speech signal is input (S101), the short-term Fourier transform unit 101 performs a short-time Fourier transform (Short Time Fourier Transform) to convert the input speech signal into a frequency component (S102).

이에 따라 장기 스펙트럼 인벨로프 연산부(102)는 상기 주파수 성분으로 변환된 음성 신호의 전체(N 개) 음성 프레임에서 각 주파수 성분의 최대값을 취득하여 장기 스펙트럼 인벨로프 값을 연산하고(S103), 잡음 스펙트럼 연산부(103)는 사용자가 임의로 설정한 개수(M 개)의 음성 프레임에서 각 주파수 성분의 최소값을 취득하여 입력 잡음 스펙트럼 정보를 연산한다(S104).Accordingly, the long-term spectral envelope calculator 102 obtains the maximum value of each frequency component in all (N) speech frames of the speech signal converted into the frequency component, and calculates a long-term spectrum velocity value (S103) , The noise spectrum calculation unit 103 obtains the minimum value of each frequency component in the number (M) of speech frames arbitrarily set by the user and calculates the input noise spectrum information (S104).

그리고 장기 스펙트럼 발산 연산부(105)는 상기 장기 스펙트럼 인벨로프 연산부(102)와 상기 잡음 스펙트럼 연산부(103)에서 연산하여 산출된 정보(예 : 장기 스펙트럼 인벨로프 값, 입력 잡음 스펙트럼 정보)를 이용하여 장기 스펙트럼 발산 정보를 연산한다(S106).The long-term spectrum divergence arithmetic unit 105 uses the information (for example, the long-term spectrum value, the input noise spectrum information) calculated by the long-term spectrum arithmetic unit 102 and the noise spectrum arithmetic unit 103 To calculate the long-term spectrum divergence information (S106).

아울러 상기 임계값 연산부(104)는 이전 음성 프레임에서의 풍음 검출 유무에 따라 검출 계수가 "1"이면 입력 잡음 전력 정보를 연산하고, 상기 검출 계수가 "0"이면 입력 음성의 전력 정보를 연산한다. 그리고 상기 연산된 전력 정보들(예 : 입력 잡음 전력 정보 및 입력 음성 전력 정보)을 이용하여 신호 잡음비를 산출하고, 상기 연산된 전력 정보들에 대한 신호 잡음비를 미리 설정된 임의의 산술식에 적용하여 임계값(즉, 풍음 잡음과 음성 영역을 구분 짓는 임계값)을 연산한다(S105).In addition, the threshold value calculation unit 104 calculates input noise power information when the detection coefficient is "1" according to presence / absence of wind sound detection in the previous voice frame, and calculates power information of the input voice when the detection coefficient is "0" . The signal noise ratio is calculated using the calculated power information (e.g., input noise power information and input voice power information), and the signal noise ratio for the calculated power information is applied to an arbitrary predetermined arithmetic expression, (That is, a threshold value that distinguishes the pitch noise from the speech region) (S105).

그리고 풍음 계수 연산부(106)는 상기 장기 스펙트럼 발산 정보와 임계값 연산부(104)에서 산출된 임계값을 입력받아 풍음 검출 계수를 연산한다(S107).The tune coefficient operation unit 106 receives the long-term spectrum divergence information and the threshold value calculated by the threshold value operation unit 104, and calculates a tune sound detection coefficient (S107).

상기 풍음 검출 계수가 "1"인 경우에는 풍음만으로 구성된 것을 의미하고, 상기 풍음 검출 계수가 "0"인 경우에는 풍음에 음성이 포함된 것을 의미한다. If the sound detection coefficient is "1 ", it means that the sound is composed only of sound, and when the sound detection coefficient is" 0 "

그리고 풍음 잡음 스펙트럼 추출부(108)는 상기 풍음 검출 계수를 사용하여 풍음 잡음 스펙트럼 성분을 추출한다(S108). 즉, 상기 풍음 검출 계수가 "1"이면 풍음 잡음 신호의 전력을 구하여 풍음 잡음 스펙트럼 성분을 추출하고, 상기 풍음 검출 계수가 "0"이면 이 과정을 수행하지 않는다. The wind noise spectrum extracting unit 108 extracts wind noise spectrum components using the wind sound detection coefficient (S108). That is, when the wind sound detection coefficient is "1 ", the power of the wind noise signal is obtained to extract the wind noise spectrum component. If the wind sound detection coefficient is" 0 "

이에 따라 상기 풍음 잡음 경감부(109)는 상기 풍음 검출 계수가 "1"이면 풍음 잡음 스펙트럼 추출부(108)에서 추출된 풍음 잡음 스펙트럼 성분과 입력 음성 신호의 스펙트럼 성분을 이용하여 포스테리오리(posteriori) 신호 잡음비를 산출하고, 상기 포스테리오리 신호 잡음비를 미리 설정된 임의의 산출식에 적용하여 경감이득을 산출하고, 상기 경감이득을 입력 음성 신호의 주파수 성분에 곱하여 풍음 잡음을 경감 시킨다(S109).Accordingly, when the wind sound detection coefficient is "1 ", the wind noise reduction unit 109 uses the wind noise spectrum component extracted from the wind noise spectrum extraction unit 108 and the spectral components of the input speech signal to calculate the posteriori ) Signal noise ratio is calculated, the reduction gain is calculated by applying the RSSI to the predetermined arbitrary calculation formula, and the reduction gain is multiplied by the frequency component of the input speech signal to reduce wind noise (S109).

반면에 상기 풍음 검출 계수가 "0"이면, 현재 음성 프레임에 풍음 잡음과 음성이 함께 포함된 것을 의미하므로, 이전 프레임에서 연산된 풍음 잡음 스펙트럼 성분을 이용하여, 상기 풍음 검출 계수가 "1"일 때와 같은 연산 과정을 거쳐 경감이득(즉, 풍음 잡음이 포함된 이전 프레임에서 산출된 포스테리오리 신호 잡음비를 사용하여 미리 설정된 임의의 산출식에 적용하여 산출된 경감이득)을 산출한다. On the other hand, if the wind noise detection coefficient is "0 ", it means that the wind noise noise and the voice are included together in the current speech frame. Therefore, by using the wind noise spectrum component calculated in the previous frame, (I.e., a reduction gain calculated by applying to the predetermined calculation formula previously set using the Fourier noise signal noise ratio calculated in the previous frame including the pitch noise).

그리고 역 단기간 푸리에 변환부(110)는 상기 경감이득이 곱해진 입력 음성 신호(즉, 풍음이 경감된 음성 신호)를 다시 시간 성분으로 변환하고(S110), 상기 시간 성분으로 변환되고 풍음이 경감된 음성 신호를 출력한다(S111).Then, the reverse short-term Fourier transform unit 110 converts the input speech signal multiplied by the relief gain (that is, the speech signal whose wind noise is reduced) to a time component again (S110) And outputs a voice signal (S111).

일반적으로 실제 음성 통신 환경에서는 신호 잡음비가 일정하지 않기 때문에 초기 입력 잡음 에너지를 임의로 설정해 줄 수 없다. 그런데 종래에는 발생되는 잡음 크기에 상관없이 초기 입력 잡음 에너지를 고정적으로 설정하여 풍음 잡음과 음성을 구분하기 때문에 검출 성능 저하로 음질 열화를 초래한다. 그러나 본 발명에 따른 실시예는 M개 프레임의 주파수 성분의 최소값을 초기 입력 잡음 주파수 에너지로 설정함으로써 실제 음성 통신 환경의 잡음 크기에 유동적으로 적용되어 음질 열화를 최소화 시킬 수 있는 장점이 있다.Generally, in the actual voice communication environment, since the signal to noise ratio is not constant, the initial input noise energy can not be arbitrarily set. However, since the initial input noise energy is fixedly set irrespective of the noise size, the sound quality is deteriorated due to the deterioration of the detection performance because the noise is separated from the sound. However, according to the embodiment of the present invention, the minimum value of the frequency components of M frames is set as the initial input noise frequency energy, which is applied to the noise size of the actual voice communication environment to minimize the deterioration of sound quality.

즉, 종래에는 풍음 잡음과 음성 영역을 구분 짓는 임계값을 고정 임계값으로 사용하기 때문에 신호 잡음비 변동이 심한 음성 통신 환경에서 잡음 크기가 달라지면 음성이 풍음 잡음으로 오검출되어 음질 열화를 초래한다. 그러나 본 발명은 신호 잡음비 변동이 심한 음성 통신 환경에서 각 시간 구간 마다 연산된 신호 잡음비에 따라 임계값이 가변적으로 변하게 됨으로써 풍음 검출 성능을 향상 시킬 수 있다. In other words, conventionally, since the threshold value for distinguishing sound and noise regions is used as a fixed threshold value, if the noise size is changed in a voice communication environment in which signal-to-noise ratio variation is severe, the voice is erroneously detected as a pitched noise. However, according to the present invention, the threshold value is variably changed according to the signal to noise ratio calculated for each time interval in the voice communication environment where the signal to noise ratio variation is severe, thereby improving the tone detection performance.

이상으로 본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, I will understand the point. Accordingly, the technical scope of the present invention should be defined by the following claims.

101 : 단기간 푸리에 변환부
102 : 장기 스펙트럼 인벨로프 연산부
103 : 잡음 스펙트럼 연산부
104 : 임계값 연산부
105 : 장기 스펙트럼 발산 연산부
106 : 풍음 계수 연산부
107 : 풍음 잡음 검출부
108 : 풍음 잡음 스펙트럼 추출부
109 : 풍음 잡음 경감부
110 : 역 단기간 푸리에 변환부
101: Short-term Fourier transform unit
102: Long-term spectral envelope operator
103: Noise spectrum calculation unit
104:
105: long-term spectrum divergence calculation unit
106:
107: wind noise detector
108: wind noise spectrum extracting unit
109: Wind noise reduction part
110: reverse short-term Fourier transform unit

Claims (12)

음성 신호를 입력받아 주파수 성분으로 변환하는 단기간 푸리에 변환부;
상기 주파수 성분으로 변환된 음성 신호에서 풍음 잡음에 음성 영역이 포함되어 있는지 여부에 따라 풍음 검출 계수를 연산하는 풍음 잡음 검출부;
상기 풍음 검출 계수에 따라 상기 주파수 성분으로 변환된 음성 신호에서 풍음 잡음 스펙트럼 성분을 추출하는 풍음 잡음 스펙트럼 추출부;
상기 풍음 잡음 스펙트럼 성분을 사용하여 상기 주파수 성분으로 변환된 음성 신호에 포함된 풍음 잡음을 경감시키는 풍음 잡음 경감부; 및
상기 풍음 잡음이 경감된 주파수 성분의 음성 신호를 시간 성분으로 변환하여 출력하는 역 단기간 푸리에 변환부;를 포함하는 것을 특징으로 하는 풍음 잡음 경감 장치.
A short term Fourier transform unit for receiving a voice signal and converting it into a frequency component;
A wind noise detector for calculating a wind noise detection coefficient depending on whether a sound region is included in the wind noise in the speech signal converted into the frequency component;
A wind noise spectrum extractor for extracting a wind noise spectrum component from the speech signal converted into the frequency component according to the wind sound detection coefficient;
A pitch noise reducing unit for reducing the pitch noise included in the voice signal converted into the frequency component by using the pitch noise spectrum component; And
And a reverse short-term Fourier transformer for converting the voice signal of the frequency component in which the pitch noise is reduced to a time component and outputting the converted time component.
제 1항에 있어서, 상기 풍음 잡음 검출부는,
상기 주파수 성분으로 변환된 음성 신호의 전체 프레임에서 각 주파수 성분의 최대값을 취득하여 장기 스펙트럼 인벨로프 값을 연산하는 장기 스펙트럼 인벨로프 연산부;
상기 주파수 성분으로 변환된 음성 신호의 전체 프레임 중 임의로 설정된 음성 프레임에서 각 주파수 성분의 최소값을 취득하여 입력 잡음 스펙트럼 정보를 연산하는 잡음 스펙트럼 연산부;
상기 장기 스펙트럼 인벨로프 값과 입력 잡음 스펙트럼 정보를 이용하여 장기 스펙트럼 발산 정보를 연산하는 장기 스펙트럼 발산 연산부;
상기 주파수 성분으로 변환된 음성 신호로부터 풍음 잡음과 음성 영역을 구분하는 임계값을 연산하는 임계값 연산부; 및
상기 장기 스펙트럼 발산 정보와 상기 임계값을 입력받아 풍음 검출 계수를 연산하는 풍음 계수 연산부;를 포함하는 것을 특징으로 하는 풍음 잡음 경감 장치.
The apparatus of claim 1, wherein the wind noise detector comprises:
A long-term spectrum calculation unit for calculating a long-term spectrum value by obtaining a maximum value of each frequency component in a whole frame of the voice signal converted into the frequency component;
A noise spectrum operation unit for obtaining a minimum value of each frequency component in a voice frame arbitrarily set among all the frames of the voice signal converted into the frequency component and calculating input noise spectrum information;
A long-term spectral divergence calculation unit for calculating long-term spectral divergence information using the long-term spectral bellows value and the input noise spectrum information;
A threshold value computing unit for computing a threshold value for distinguishing the sound noise and the speech region from the speech signal converted into the frequency component; And
And a wind noise coefficient operating unit for receiving the long-term spectrum divergence information and the threshold value to calculate a wind noise detection coefficient.
제 2항에 있어서, 상기 임계값 연산부는,
이전 음성 프레임에서의 풍음 검출 유무에 따라 풍음 검출 계수가 "1"이면 입력 잡음 전력 정보를 연산하고, 상기 풍음 검출 계수가 "0"이면 입력 음성의 전력 정보를 연산하고,
상기 연산된 전력 정보들을 이용하여 신호 잡음비를 산출하고,
상기 전력 정보들에 대한 신호 잡음비를 미리 설정된 임의의 산술식에 적용하여 임계값을 연산하는 것을 특징으로 하는 풍음 잡음 경감 장치.
3. The apparatus of claim 2,
Calculates input noise power information when the wind noise detection coefficient is "1 " according to presence / absence of wind noise detection in the previous speech frame, and calculates power information of the input speech if the wind noise detection coefficient is &
Calculating a signal-to-noise ratio using the calculated power information,
And a threshold value is calculated by applying a signal-to-noise ratio of the power information to a predetermined arithmetic expression.
제 3항에 있어서,
상기 풍음 검출 계수가 "1"이면 풍음만으로 구성된 것이고, 상기 풍음 검출 계수가 "0"이면 풍음에 음성이 포함된 것을 의미하는 것을 특징으로 하는 풍음 잡음 경감 장치.
The method of claim 3,
Wherein when the wind sound detection coefficient is "1 ", only wind sounds are included, and if the wind sound detection coefficient is" 0 ", it means that sound is included in wind sounds.
제 1항에 있어서, 상기 풍음 잡음 경감부는,
상기 풍음 검출 계수가 "1"인 경우, 풍음 잡음 스펙트럼 추출부에서 추출된 풍음 잡음 스펙트럼 성분과 입력 음성 신호의 스펙트럼 성분을 이용하여 포스테리오리(posteriori) 신호 잡음비를 산출하고,
상기 포스테리오리 신호 잡음비를 사용하여 미리 설정된 임의의 산출식에 적용하여 경감이득을 산출하고,
상기 경감이득을 입력 음성 신호에 곱하여 상기 음성 신호의 풍음 잡음을 경감 시키는 것을 특징으로 하는 풍음 잡음 경감 장치.
The sound information processing apparatus according to claim 1,
When the wind noise detection coefficient is "1 ", the posteriori signal-to-noise ratio is calculated using the wind noise spectrum component extracted from the wind noise spectrum extraction unit and the spectral component of the input speech signal,
Calculating a reduction gain by applying to the predetermined calculation formula which is set in advance using the Fourier signal noise ratio,
And multiplying the reduction gain by the input voice signal to reduce wind noise of the voice signal.
제 5항에 있어서, 상기 풍음 잡음 경감부는,
상기 풍음 검출 계수가 "0"인 경우, 현재 음성 프레임에 풍음 잡음과 음성이 함께 포함된 것을 의미하는 것으로서, 풍음 잡음만으로 구성된 이전 프레임에서 산출된 경감이득을 현재 프레임의 입력 음성 신호에 곱하여 출력하는 것을 특징으로 하는 풍음 잡음 경감 장치.
6. The apparatus of claim 5, wherein the pitch-
If the sound detection coefficient is "0 ", it means that the current sound frame includes wind noise and voice. That is, the reduction gain calculated in the previous frame consisting of only wind noise is multiplied by the input sound signal of the current frame and output Wherein the noise canceling device comprises:
단기간 푸리에 변환부가 음성 신호를 입력받아 주파수 성분으로 변환하는 단계;
풍음 잡음 검출부가 상기 주파수 성분으로 변환된 음성 신호에서 풍음 잡음에 음성 영역이 포함되어 있는지 여부에 따라 풍음 검출 계수를 연산하는 단계;
풍음 잡음 스펙트럼 추출부가 상기 풍음 검출 계수에 따라 상기 주파수 성분으로 변환된 음성 신호에서 풍음 잡음 스펙트럼 성분을 추출하는 단계;
풍음 잡음 경감부가 상기 풍음 잡음 스펙트럼 성분을 사용하여 상기 주파수 성분으로 변환된 음성 신호에 포함된 풍음 잡음을 경감시키는 단계;
역 단기간 푸리에 변환부가 상기 풍음 잡음이 경감된 주파수 성분의 음성 신호를 시간 성분으로 변환하여 출력하는 단계;를 포함하는 것을 특징으로 하는 풍음 잡음 경감 방법.
A short-term Fourier transform section receiving a speech signal and converting the speech signal into a frequency component;
Calculating a wind sound detection coefficient according to whether or not a sound region is included in the wind noise in the speech signal in which the wind noise detection unit converts the frequency component;
Extracting a wind noise spectrum component in the speech signal converted into the frequency component according to the wind sound detection coefficient;
Reducing the pitch noise included in the voice signal converted into the frequency component using the pitch noise spectrum component;
Wherein the short-term Fourier transform unit converts the voice signal of the frequency component in which the wind noise is reduced to a time component and outputs the time component.
제 7항에 있어서, 상기 풍음 검출 계수를 연산하는 단계에서,
상기 풍음 잡음 검출부는,
장기 스펙트럼 인벨로프 연산부를 통해 상기 주파수 성분으로 변환된 음성 신호의 전체 프레임에서 각 주파수 성분의 최대값을 취득하여 장기 스펙트럼 인벨로프 값을 연산하는 단계;
잡음 스펙트럼 연산부를 통해 상기 주파수 성분으로 변환된 음성 신호의 전체 프레임 중 임의로 설정된 음성 프레임에서 각 주파수 성분의 최소값을 취득하여 입력 잡음 스펙트럼 정보를 연산하는 단계;
장기 스펙트럼 발산 연산부를 통해 상기 장기 스펙트럼 인벨로프 값과 입력 잡음 스펙트럼 정보를 이용하여 장기 스펙트럼 발산 정보를 연산하는 단계;
임계값 연산부를 통해 상기 주파수 성분으로 변환된 음성 신호로부터 풍음 잡음과 음성 영역을 구분하는 임계값을 연산하는 단계; 및
풍음 계수 연산부를 통해 상기 장기 스펙트럼 발산 정보와 상기 임계값을 입력받아 풍음 검출 계수를 연산하는 단계;를 포함하는 것을 특징으로 하는 풍음 잡음 경감 방법.
8. The method according to claim 7, wherein, in the step of calculating the sound detection coefficient,
Wherein the wind noise detection unit comprises:
Acquiring a maximum value of each frequency component in a whole frame of the voice signal converted into the frequency component through a Velocity operator, which is a long-term spectrum, to calculate a long-term spectrum velocity value;
Acquiring a minimum value of each frequency component in a voice frame arbitrarily set among all the frames of the voice signal converted into the frequency component through a noise spectrum operation unit and calculating input noise spectrum information;
Computing long-term spectral divergence information by using a long-term spectral divergence calculation unit and a long-term spectral blob value and input noise spectrum information;
Calculating a threshold value for distinguishing the wind noise and the speech region from the speech signal converted into the frequency component through the threshold value operation unit; And
And calculating the tune sound detection coefficient by receiving the long-term spectrum divergence information and the threshold value through the tune coefficient calculator.
제 8항에 있어서, 상기 임계값을 연산하는 단계에서,
상기 임계값 연산부는,
이전 음성 프레임에서의 풍음 검출 유무에 따라 풍음 검출 계수가 "1"이면 입력 잡음 전력 정보를 연산하고, 상기 풍음 검출 계수가 "0"이면 입력 음성의 전력 정보를 연산하며,
상기 연산된 전력 정보들을 이용하여 신호 잡음비를 산출하고,
상기 전력 정보들에 대한 신호 잡음비를 미리 설정된 임의의 산술식에 적용하여 임계값을 연산하는 것을 특징으로 하는 풍음 잡음 경감 방법.
9. The method according to claim 8, wherein in the step of calculating the threshold value,
Wherein the threshold computing unit comprises:
Calculates input noise power information if the wind noise detection coefficient is "1 " according to presence / absence of wind sound detection in the previous speech frame, and calculates power information of the input speech if the wind sound detection coefficient is" 0 &
Calculating a signal-to-noise ratio using the calculated power information,
And a threshold value is calculated by applying a signal-to-noise ratio for the power information to an arbitrary predetermined arithmetic expression.
제 9항에 있어서,
상기 풍음 검출 계수가 "1"이면 풍음만으로 구성된 것이고,
상기 풍음 검출 계수가 "0"이면 풍음에 음성이 포함된 것을 의미하는 것을 특징으로 하는 풍음 잡음 경감 방법.
10. The method of claim 9,
If the wind sound detection coefficient is "1 ", only wind sounds are generated.
And if the wind sound detection coefficient is "0 ", it means that the wind sound includes sound.
제 7항에 있어서, 상기 풍음 잡음을 경감시키는 단계에서,
상기 풍음 잡음 경감부는,
상기 풍음 검출 계수가 "1"인 경우, 풍음 잡음 스펙트럼 추출부에서 추출된 풍음 잡음 스펙트럼 성분과 입력 음성 신호의 스펙트럼 성분을 이용하여 포스테리오리(posteriori) 신호 잡음비를 산출하며,
상기 포스테리오리 신호 잡음비를 사용하여 미리 설정된 임의의 산출식에 적용하여 경감이득을 산출하고,
상기 경감이득을 입력 음성 신호에 곱하여 상기 음성 신호의 풍음 잡음을 경감 시키는 것을 특징으로 하는 풍음 잡음 경감 방법.
8. The method according to claim 7, wherein in reducing the pitch noise,
Wherein the wind noise reducing unit comprises:
If the wind noise detection coefficient is "1 ", the posteriori signal noise ratio is calculated using the wind noise spectrum component extracted from the wind noise spectrum extraction unit and the spectral component of the input speech signal,
Calculating a reduction gain by applying to the predetermined calculation formula which is set in advance using the Fourier signal noise ratio,
And multiplying the reduction gain by the input voice signal to reduce wind noise of the voice signal.
제 11항에 있어서, 상기 풍음 잡음 경감부는,
상기 풍음 검출 계수가 "0"인 경우, 현재 음성 프레임에 풍음 잡음과 음성이 함께 포함된 것을 의미하는 것으로서, 풍음 잡음만으로 구성된 이전 프레임에서 산출된 경감이득을 현재 프레임의 입력 음성 신호에 곱하여 출력하는 것을 특징으로 하는 풍음 잡음 경감 방법.
12. The apparatus of claim 11, wherein the wind noise reduction unit comprises:
If the sound detection coefficient is "0 ", it means that the current sound frame includes wind noise and voice. That is, the reduction gain calculated in the previous frame consisting of only wind noise is multiplied by the input sound signal of the current frame and output Wherein the method comprises the steps of:
KR1020140147655A 2014-10-28 2014-10-28 Apparatus for reducing wind noise and method thereof KR20160050186A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140147655A KR20160050186A (en) 2014-10-28 2014-10-28 Apparatus for reducing wind noise and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140147655A KR20160050186A (en) 2014-10-28 2014-10-28 Apparatus for reducing wind noise and method thereof

Publications (1)

Publication Number Publication Date
KR20160050186A true KR20160050186A (en) 2016-05-11

Family

ID=56025194

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140147655A KR20160050186A (en) 2014-10-28 2014-10-28 Apparatus for reducing wind noise and method thereof

Country Status (1)

Country Link
KR (1) KR20160050186A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113613112A (en) * 2021-09-23 2021-11-05 三星半导体(中国)研究开发有限公司 Method and electronic device for suppressing wind noise of microphone
CN116168719A (en) * 2022-12-26 2023-05-26 杭州爱听科技有限公司 Sound gain adjusting method and system based on context analysis

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113613112A (en) * 2021-09-23 2021-11-05 三星半导体(中国)研究开发有限公司 Method and electronic device for suppressing wind noise of microphone
US11575989B1 (en) 2021-09-23 2023-02-07 Samsung Electronics Co., Ltd. Method of suppressing wind noise of microphone and electronic device
CN116168719A (en) * 2022-12-26 2023-05-26 杭州爱听科技有限公司 Sound gain adjusting method and system based on context analysis

Similar Documents

Publication Publication Date Title
US8903721B1 (en) Smart auto mute
JP6328627B2 (en) Loudness control by noise detection and low loudness detection
US9906882B2 (en) Method and apparatus for wind noise detection
US8085930B2 (en) Communication system
US9467775B2 (en) Method and a system for noise suppressing an audio signal
US9842599B2 (en) Voice processing apparatus and voice processing method
KR20100002300A (en) Automatic volume and dynamic range adjustment for mobile audio devices
WO2009117084A2 (en) System and method for envelope-based acoustic echo cancellation
US10249322B2 (en) Audio processing devices and audio processing methods
US10516941B2 (en) Reducing instantaneous wind noise
US9330677B2 (en) Method and apparatus for generating a noise reduced audio signal using a microphone array
KR102591447B1 (en) Voice signal leveling
EP2460156A1 (en) Method and device for eliminating background noise
US20140064529A1 (en) Apparatus and method of shielding external noise for use in hearing aid device
US20150039300A1 (en) Vehicle-mounted communication device
US11373669B2 (en) Acoustic processing method and acoustic device
KR20160050186A (en) Apparatus for reducing wind noise and method thereof
US10997987B2 (en) Signal processor for speech enhancement and recognition by using two output terminals designated for noise reduction
CN112802492B (en) Method, device, chip and module equipment for inhibiting howling
JP7196002B2 (en) Echo suppression device, echo suppression method and echo suppression program
KR20120091701A (en) Method for outputting an audio signal and apparatus for outputting an audio signal thereof
KR101993003B1 (en) Apparatus and method for noise reduction
KR20120016709A (en) Apparatus and method for improving the voice quality in portable communication system
KR101394504B1 (en) Apparatus and method for adaptive noise processing
Premananda et al. Speech enhancement to overcome the effect of near-end noise in mobile phones using psychoacoustics

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application