KR100843926B1 - 고주파수 압축을 통한 음성 인식 향상 시스템 - Google Patents

고주파수 압축을 통한 음성 인식 향상 시스템 Download PDF

Info

Publication number
KR100843926B1
KR100843926B1 KR1020060119849A KR20060119849A KR100843926B1 KR 100843926 B1 KR100843926 B1 KR 100843926B1 KR 1020060119849 A KR1020060119849 A KR 1020060119849A KR 20060119849 A KR20060119849 A KR 20060119849A KR 100843926 B1 KR100843926 B1 KR 100843926B1
Authority
KR
South Korea
Prior art keywords
speech
signal
frequency
high frequency
band
Prior art date
Application number
KR1020060119849A
Other languages
English (en)
Other versions
KR20070061360A (ko
Inventor
에이. 헤더링톤 필립
리 쥐에맨
Original Assignee
큐엔엑스 소프트웨어 시스템즈 (웨이브마커스) 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 큐엔엑스 소프트웨어 시스템즈 (웨이브마커스) 인코포레이티드 filed Critical 큐엔엑스 소프트웨어 시스템즈 (웨이브마커스) 인코포레이티드
Publication of KR20070061360A publication Critical patent/KR20070061360A/ko
Application granted granted Critical
Publication of KR100843926B1 publication Critical patent/KR100843926B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 처리 음성의 인지도 및 인지 품질을 향상시키는 음성 시스템에 관한 것으로, 이 시스템은 주파수 변환기와 스펙트럼 압축기를 포함한다. 주파수 변환기는 음성 신호를 시간 도메인에서 주파수 도메인으로 변환시킨다. 스펙트럼 압축기는 고주파 대역의 미리 선택된 부분을 압축하고, 그 압축된 고주파 대역을 낮은 대역 제한 주파수 범위로 매핑시킨다.

Description

고주파수 압축을 통한 음성 인식 향상 시스템{SYSTEM FOR IMPROVING SPEECH INTELLIGIBILITY THROUGH HIGH FREQUENCY COMPRESSION}
도 1은 음성 향상 시스템의 블록도이다.
도 2는 비압축 상태와 압축 상태의 신호의 그래프이다.
도 3은 기저 함수의 그룹의 그래프이다.
도 4는 원시의 예시 음성 신호와 그 신호의 압축된 부분을 나타내는 그래프이다.
도 5는 원시의 예시 음성 신호와 그 신호의 압축된 부분을 나타내는 제2의 그래프이다.
도 6은 원시의 예시 음성 신호와 그 신호의 압축된 부분을 나타내는 제3의 그래프이다.
도 7은 차량 및/또는 전화기 또는 기타 통신 기기 내의 음성 향상 시스템의 블록도이다.
도 8은 차량 및/또는 전화기 또는 기타 통신 기기 내의 자동 음성 인식 시스템에 결합된 음성 향상 시스템의 블록도이다.
본 발명은 통신 시스템에 관한 것으로, 보다 상세하게는 음성의 명료도(이하, 인식) 향상 시스템에 관한 것이다.
음성 신호는 많은 종류의 통신 기기에 의해 수신되어 동조화되고 전달된다. 음성 신호는 통신 매체를 통해 하나의 시스템에서 다른 시스템으로 전파한다. 모든 통신 시스템, 특히 무선 통신 시스템은 대역폭 제한의 문제를 갖고 있다. 일부 전화 시스템을 포함한 몇몇 시스템에서는 음성 신호의 명료도가 시스템에 있어서의 고주파수 및 저주파수에 대한 통과 능력에 의해 좌우된다. 다수의 저주파수가 통신 시스템의 통과 대역에 놓여 있을 수 있지만, 통신 시스템은 일부 무성 자음에서 발견되는 고주파수 성분을 포함한 고주파수 신호를 차단하거나 감쇠시킬 수 있다.
일부 통신 기기는 이 고주파수 감쇠를 스펙트럼 처리에 의해 극복할 수 있다. 이들 시스템은 음성/무음 스위치 및 유성음/무성음 스위치를 사용하여 무성음의 음성을 식별하여 처리할 수 있다. 유성음 세그먼트와 무성음 세그먼트 간의 전환은 검출하기 어려울 수 있으므로, 일부 시스템, 특히 노이즈 또는 잔향(reverberation)에 민감한 시스템은 신뢰할 수 없으며, 실시간 처리에 사용되지 못할 수 있다. 일부 시스템의 경우, 상기 스위치들은 고가일 뿐만 아니라, 음성의 인식을 왜곡하는 아티팩트(artifact)를 생성한다.
따라서, 제한된 주파수 범위의 음성 중 음의 인지 가능성을 향상시키는 시스템에 대한 요구가 존재한다.
본 발명의 목적은 음성 신호의 인지도를 향상시키는 음성 향상 시스템을 제공하는 것이다.
음성 향상 시스템은 주파수 변환기(transformer)와 스펙트럼 압축기(compressor)를 포함한다. 상기 주파수 변환기는 음성 신호를 시간 도메인에서 주파수 도메인으로 변환시킨다. 상기 스펙트럼 압축기는 고주파 대역에서 미리 선택된 부분을 압축하고 그 압축된 고주파 대역을 낮은 대역 제한 주파수 범위로 매핑시킨다.
본 발명의 다른 시스템, 방법, 특징 및 장점들은 아래의 도면 및 상세한 설명의 검토를 통해 당업자에게는 분명하거나 분명하게 될 것이다. 이러한 추가적인 시스템, 방법, 특징 및 장점들 모두는 본 설명 부분 내에 포함되고 발명의 범위 내에 있으며 또한 이후의 특허청구범위에 의해 보호되도록 의도된 것이다.
본 발명은 아래의 도면 및 상세한 설명을 참조하여 보다 잘 이해될 수 있다. 도면 내의 구성 요소들은 반드시 비율에 맞춰지지 않고 대신에 본 발명의 원리의 설명시에 강조되어 있다. 또한, 도면 내에서 동일 참조 번호는 다른 도면에 걸쳐서도 대응하는 부분을 지정한다.
향상 로직(enhancement logic)은 처리된 음성의 인지도를 향상시킨다. 상기 로직은 처리 대상의 음성 세그먼트를 식별하여 압축할 수 있다. 선택된 유성음 및/또는 무성음의 세그먼트는 처리된 후 하나 이상의 주파수 대역으로 시프트될 수 있다. 인지 품질의 향상을 위해, 시간 또는 주파수 도메인에서 적응적 이득 조정을 행할 수 있다. 시스템은 음성 세그먼트 전체 또는 일부의 이득을 조정할 수 있다. 시스템의 유용성은 일부의 적용에 있어 음성이 제2의 시스템으로 통과되기 이전에 로직에 의해 향상되도록 한다. 음성과 오디오는 무선으로 또는 시간 및/또는 주파수 도메인으로 음성을 포획하여 추출할 수 있는 통신 버스를 통해 자동 음성 인식(ASR: Automatic Speech Recognition) 엔진으로 전파될 수 있다.
어떠한 대역 제한 기기도 이들 시스템으로부터 이익을 얻을 수 있다. 이들 시스템은 소정의 대역 제한 기기 내에 구성되거나, 그 단위 부분이 되거나, 그 기기와 접속(interface)하도록 구성될 수 있다. 상기 시스템은 (유사한 대역제한 통과 대역을 가질 수 있는) 교통 제어 기기와 같은 라디오 어플리케이션과, 라디오 인터콤(상호 통신하는 요원 또는 사용자용의 이동식 또는 고정식 시스템)과, 하나 이상의 블루투스 링크에 걸쳐 제한된 대역폭을 가질 수 있는) 헤드셋과 같은 블루투스 가능 기기 등의 일부이거나 그것과 접속할 수 있다. 상기 시스템은 차량, 상업적 어플리케이션, 또는 사용자의 가정(homes)을 제어할 수 있는 (예, 음성 제어와 같은) 기기와 접속할 수 있는 기타의 개인용 또는 상업용의 제한된 대역폭 통신 시스템의 일부일 수 있다.
다른 방식의 예로서, 시스템은 다른 처리나 시스템에 우선할 수 있다. 일부 시스템은 향상 로직의 행위를 무력화시킬 수 있는 적응성 필터, 다른 회로 또는 프로그래밍을 사용할 수 있다. 일부의 시스템에서 상기 향상 로직은 선행하여 반향(echo) 제거기(예컨대, 원치않는 음향을 감쇠시키거나 실질적으로 감쇠시키는 시스템 또는 처리)에 결합될 수 있다. 반향 검출시 또는 처리시, 향상 로직은 자동적으로 기능 억제되거나 완화된 후 기능 활성화되어 압축과 매핑, 그리고 일부의 경우, 반향의 이득 조정을 방지할 수 있다. 시스템이 선행하거나 빔 형성기(beamformer)에 결합시, 제어기 또는 빔 형성기(예, 신호 합성기)는 향상 로직의 동작을 제어할 수 있다(예, 향상 로직의 자동 기능 활성화, 기능 억제 또는 완화). 일부 시스템에서, 이러한 제어는 다-경로 왜곡 및/또는 공통-채널 간섭과 같은 왜곡을 더욱 억제할 수 있다. 다른 시스템 또는 용례에서, 향상 로직은 포스트 적응 시스템 또는 처리에 결합된다. 일부 용례에서, 향상 로직은 제어되거나, 또는 바람직하지 않은 신호의 향상을 방지하거나 최소화하는 제어기에 접속된다.
도 1은 향상 로직(100)의 블록도이다. 향상 로직(100)은 하드웨어 및/또는 하나 이상의 운영 체계에서 동작하거나 그것에 접속될 수 있는 소프트웨어를 포함할 수 있다. 시간 도메인에서, 향상 로직(100)은 변형 로직과 압축 로직을 포함할 수 있다. 도 1에서, 변형 로직은 주파수 변환기(102)로 이루어진다. 주파수 변환기(102)는 입력 신호의 주파수 변환에 시간을 부여한다. 수신시, 주파수 변환기는 입력 신호를 그 주파수 스펙트럼으로 변환하도록 프로그램되거나 구성된다. 주파수 변환기는 아날로그의 오디오 또는 음성 신호를 프로그래밍된 주파수 범위로 지연된 시간 또는 실시간으로 변환할 수 있다. 일부 주파수 변환기(102)는 통과 대역을 벗어난 주파수를 제거, 최소화 또는 감쇠시키면서 소정의 주파수를 선별적으로 통과시키는 협 대역통과 필터 세트를 구비할 수 있다. 다른 향상 시스템(100)은 고속 푸리에 변환(FFT: Fast Fourier Transform)에 기초하여 디지털 주파수 스펙트럼을 생성하도록 프로그래밍되거나 구성된 주파수 변환기(102)를 사용한다. 이들 주파수 변환기(102)는 선택된 범위 또는 전 주파수 대역으로부터 신호를 수집 하여 실시간, 근접 실시간 또는 지연 시간의 주파수 스펙트럼을 생성할 수 있다. 일부 향상 시스템에서, 주파수 변환기(102)는 오디오 또는 음성 신호를 자동 검출하여, 프로그래밍된 범위의 주파수로 자동 변환한다.
압축 로직은 스펙트럼 압축 기기 또는 스펙트럼 압축기(104)로 구성되어 있다. 스펙트럼 압축기(104)는 높은 주파수 범위 내의 주파수 성분의 넓은 범위를 낮은 주파수 범위, 일부 향상 시스템의 경우, 좁은 주파수 범위로 매핑시킨다. 도 1에서, 스펙트럼 압축기(104)는 선택된 높은 주파수 대역을 압축한 후 그 압축된 대역을 낮은 대역 제한 주파수 범위로 매핑함으로써 오디오 또는 음성 범위를 처리한다. 전화 대역폭과 같은 통신 대역을 통해 전송된 음성 또는 오디오 신호에 적용시, 압축기는 일부의 높은 주파수 성분을 압축하여 상기 전화 또는 통신 대역폭 내에 있는 대역으로 매핑시킨다. 소정의 향상 시스템에서, 스펙트럼 압축기(104)는 제1 주파수와 관심 대상의 최고 주파수의 거의 2배인 제2 주파수 사이의 주파수 성분을 짧거나 작은 대역 제한 범위로 매핑시킨다. 이들 향상 시스템에서, 대역 제한 범위의 상부 컷오프 주파수는 전화 또는 다른 통신 대역폭의 상부 컷오프 주파수와 실질적으로 일치할 수 있다.
도 2에서, 도 1에 도시된 스펙트럼 압축기(104)는 지정된 컷오프 주파수 "A"와 나이키스트(Nyquist) 주파수 사이의 주파수 성분을 압축하여 컷오프 주파수 "A"와 "B" 사이에 있는 대역 제한 범위로 매핑한다. 도시된 바와 같이, 약 2800Hz와 5550Hz 사이에 있는 무성 자음(여기서는 철자 "S")의 압축은 약 2800Hz와 약 3600Hz를 경계로 하는 주파수 범위로 압축 및 매핑된다. 컷오프 주파수 "A" 아래의 주파수 성분은 변경되지 않거나 거의 변경되지 않는다. 약 0Hz와 약 3600Hz 사이의 대역폭은 전화 시스템 또는 기타 통신 시스템의 대역폭과 일치할 수 있다. 다른 통신 대역폭과 일치하는 다른 주파수 범위 역시 사용될 수 있다.
일부 향상 시스템에 의해 사용되는 하나의 주파수 압축 방식은 주파수 압축과 주파수 전환(frequency transposition)을 결합하는 것이다. 이들 향상 시스템에서, 향상 제어기는 압축된 높은 주파수 성분을 끌어내도록 프로그래밍될 수 있다. 일부 향상 시스템에서 수학식 1이 사용되는데, 수학식에서 Cm은 압축 고주파 성분의 진폭, gm은 이득 인자, Sk는 원시 름성 신호의 주파수 성분, φm(k)은 압축 기저 함수, 및 k는 개별 주파수 지수(discrete frequency index)이다.
Figure 112006089033766-pat00001
비선형 압축 기저 함수(φm(k))로서 예컨대, 삼각형, 해닝(Hanning), 해밍(Hamming), 가우시안, 가보(Gabor) 또는 웨이블렛(wavelet) 윈도우를 포함한 소정 형태의 윈도우 함수가 사용되는 동안, 도 3은 일부 향상 시스템에 사용되는 전형적으로 50% 중복되는 기저 함수의 그룹을 보여주고 있다. 이들 삼각형의 기저 함수는 좁은 주파수 범위를 커버하는 낮은 저파수 기저 함수와 넓은 주파수 범위를 커버하는 높은 주파수 기저 함수를 포함한다.
그 후 주파수 성분은 낮은 주파수 범위로 매핑된다. 일부 향상 시스템에서, 향상 제어기는 주파수를 수학식 2에 나타낸 함수로 매핑하도록 프로그래밍되거나 구성될 수 있다.
Figure 112006089033766-pat00002
수학식 2에서,
Figure 112008011422721-pat00003
는 압축된 음성 신호의 주파수 성분이고, f0는 컷오프 주파수 지수이다. 이 압축 방식에 기초하여, 상기 컷오프 주파수 지수(f0) 아래의 원시 음성의 모든 주파수 성분은 변화되지 않거나 거의 변화되지 않는 상태로 남는다. 컷오프 주파수 "A"와 나이키스트 주파수 사이의 주파수 성분은 압축되어 낮은 주파수 범위로 시프트된다. 주파수 범위는 하부 컷오프 주파수 "A"로부터, 전화 또는 통신 통과-대역의 상한도 구성할 수 있는 상부 컷오프 주파수 "B"로 확장된다. 이 향상 시스템에서, 높은 주파수 성분은 상부 컷오프 주파수 "B"에 근접한 주파수보다 높은 압축비와 많은 주파수 편이를 갖는다. 이들 향상 시스템은 컷오프 주파수 "B" 이상의 주파수가 정확한 음성 인식에서 결정적일 수 있는 중요한 자음 정보를 가지고 있기 때문에 음성 신호의 인지도 및/또는 인지 품질을 향상시킨다.
청각 배경을 실질적으로 평활하게 및/또는 실질상 일정하게 유지하기 위해, 압축 신호에 적응적 고주파수 이득 조정을 적용할 수 있다. 도 1에서, 이득 제어기(gain controller)(106)는 배경 노이즈 신호와 같은 독립적인 외부 신호를 노이즈 검출기(108)를 통해 실시간, 근접 시간 또는 지연된 시간으로 측정하거나 산정(추정; estimate)하는 것에 의해 압축 신호에 고주파 적응 제어를 적용할 수 있다. 노이즈 검출기(108)는 배경 노이즈를 검출하여 이를 측정 및/또는 추정할 수 있다. 배경 노이즈는 통신선, 통신 매체, 통신 로직 또는 통신 회로 내에 내재되거나, 및/또는 음성 또는 음성 신호에 무관할 수 있다. 일부 향상 시스템에서, 실질상 일정한 분별 가능한 배경 노이즈 또는 음향이 예컨대, 전화 또는 통신 대역폭의 주파수 "A"와 "B" 사이와 같은 선택된 대역폭 내에 유지된다.
이득 제어기(106)는 일부 용례에서는 수학식 3에 보여지는 함수에 따라 노이즈를 포함하는 압축 스펙트럼 신호만을 증폭하거나 및/또는 감쇠하도록 프로그래밍될 수 있다. 수학식 3에서 출력 이득(gm)은 다음과 같이 얻어진다:
Figure 112006089033766-pat00004
이때, Nk는 입력 배경 노이즈의 주파수 성분이다. 이득을 측정 또는 추정된 노이즈 레벨로 트래킹하는 것에 의해, 일부 향상 시스템은 압축되고 압축되지 않은 대역폭에 걸쳐 바닥 잡음(noise floor)을 유지한다. 도 4에 도시된 바와 같이, 주파수가 압축된 주파수 대역에서 증가함에 따라 노이즈가 하방 경사를 이루면, 신호의 압축된 부분은 압축 이전에 비해 압축 이후에 보다 적은 에너지를 가질 수 있다. 이들 조건에서, 압축 신호에 비례 이득이 적용되어 압축 신호의 기울기를 조정할 수 있다. 도 4에서, 압축 신호의 기울기는 압축된 주파수 대역 내에서 원시 신호의 기울기와 실질상 동일하도록 조정된다. 일부 향상 시스템에서, 이득 제어기(106)는 도 4에 도시된 압축 신호를 1 이상의 크기를 가지고 압축 신호의 주파수에 따라 변화하는 승수(multiplier)로 곱할 것이다. 도 4에서, 압축된 대역폭에 걸쳐 승수의 증분차는 양적인(positive) 경향을 가질 것이다.
도 5에 도시된 압축 신호에서 배경 노이즈가 증가하는 효과를 극복하기 위해, 이득 제어기(106)는 신호 중 압축된 부분의 이득을 완화 또는 감쇠할 수 있다. 이들 조건에서, 압축 신호의 강도는 완화 또는 감쇠되어 압축 신호의 기울기를 조정할 것이다. 도 5에서, 기울기 조정은 기울기가 압축 주파수 대역 내에서 원시 신호의 기울기와 실질상 동일하도록 행해진다. 일부 향상 시스템에서, 이득 제어기(106)는 도 5에 도시된 압축 신호를 0 보다 크고 1 이하의 크기의 승수로 곱할 것이다. 도 5에서, 상기 승수는 압축 신호의 주파수에 따라 변한다. 도 5에 도시된 압축 대역에 걸쳐 승수의 증분차는 음적인(negative) 경향을 가질 것이다.
도 6에 도시된 바와 같이, 배경 노이즈가 소망하는 대역폭 내의 모든 주파수에 걸쳐 동일하거나 거의 동일한 경우, 이득 제어기(106)는 압축 신호를 증폭하거나 감쇠함이 없이 통과시킨다. 일부 향상 시스템에서, 이득 제어기(106)는 이들 조건에 사용되지 않지만, 입력 신호를 정규화하는 전제조건화(preconditioning) 제어기는 음성 향상 시스템의 전단에 접속되어 원시 입력 음성 세그먼트를 생성한다.
대역 제한 주파수 범위에서 음성 손실을 최소화하기 위해, 향상 시스템의 컷오프 주파수는 통신 시스템의 대역폭에 따라 변한다. 대략 3600Hz 까지의 대역폭을 갖는 일부 전화 시스템에서, 컷오프 주파수는 약 2500Hz와 약 3600Hz 사이에 있을 수 있다. 이들 시스템에서, 최저의 컷오프 주파수 아래에서는 압축이 거의 또는 전혀 행해지지 않지만, 보다 높은 주파수는 압축되고 보다 확실하게 전치된다(transposed). 결국, 피치를 부여하고 사람의 귀에서 인지될 수 있는 낮은 고조파 관계가 유지된다.
압축 및 비압축 신호의 신호 대 잡음비(SNR)을 분석하는 것에 의해 음성 향상 시스템의 또 다른 예를 얻을 수 있다. 이 예는 모음의 제2 포먼트(formant) 피크가 약 3200Hz의 주파수 아래에 지배적으로 위치하고 있고 그 에너지는 보다 높은 주파수에 따라 급속히 감쇠되는 것을 인정한다. 이것은 /s/, /f/, /t/, /ts/와 같은 일부 무성 자음의 경우가 아닐 수 있다. 자음을 나타내는 에너지는 보다 높은 범위의 주파수를 커버할 수 있다. 일부 시스템에서, 자음은 약 3000Hz와 12000Hz 사이에 있을 수 있다. 자동차와 같은 차량에서 검출될 수 있는 높은 배경 노이즈가 검출되면, 자음은 낮은 주파수 대역에서 보다 높은 주파수 대역에서 보다 높은 신호 대 잡음비를 갖기 쉬울 것이다. 이 대체예에서, 컷오프 주파수 "A"와 "B" 사이에 있는 비압축 범위의 평균 SNR(SNRA-B uncompressed)은 제어기에 의해 컷오프 주파수 "A"와 "B" 사이에 있는 압축되는 경우의 주파수 범위의 평균 SNR(SNRA-B compressed)과 비교된다. 평균 SNRA-B uncompressed이 평균 SNRA-B compressed 보다 높거나 같으면, 압축은 일어나지 않는다. 평균 SNRA-B uncompressed이 평균 SNRA-B compressed 보다 작으면, 압축과 일부의 경우에 이득 조정이 일어난다. 이 대체예에서, A-B는 주파수 대역을 나타낸다. 이 대체예에서 제어기는 무선으로 또는 통신 버스와 같은 실감형(tangible) 통신 매체를 통해 스펙트럼 압축기(104)를 조절할 수 있는 프로세서로 이루어진다.
다른 대체예에 따른 음성 향상 시스템 및 방법은 스펙트럼 압축기에 결합된 제2 제어기를 통해 입력 신호의 각 주파수 성분의 진폭과 동일 주파수 대역 내에 있는 압축 신호의 대응하는 진폭을 비교한다. 수학식 4에 나타낸 이 대체예에서, 컷오프 주파수 "A"와 "B" 사이에 있는 각 주파수 빈(bin)의 진폭은 어떤 것이든 높은 압축 및 비압축 스펙트럼의 진폭이 되도록 선택된다.
Figure 112006089033766-pat00005
전술한 제어기, 시스템 및 방법 각각은 하나 이상의 집적 회로와 같은 소자 내에 프로그래밍되거나 제어기나 컴퓨터에 의해 처리된 메모리와 같은 컴퓨터 판독 가능 매체인 신호 보유 매체에 인코딩된다. 상기 방법이 소프트웨어에 의해 수행될 때, 그 소프트웨어는 스펙트럼 압축기(104), 노이즈 검출기(108), 이득 조정기(106), 주파수-시간 변환기(110), 또는 음성 향상 로직에 접속되거나 상주하는 기타 종류의 비휘발성 또는 휘발성 메모리에 접속되거나 상주하는 메모리 내에 상주할 수 있다. 상기 메모리는 로직 함수를 실행하기 위한 실행 가능 명령의 순서 리스트를 포함할 수 있다. 로직 함수는 디지털 회로를 통해, 소스 코드를 통해, 아날로그 회로를 통해, 또는 아날로그 전기 신호나 광학 신호를 통하는 것과 같은 아날로그 소스를 통해 실행될 수 있다. 소프트웨어는 명령 실행 가능 시스템, 장치 또는 소자에 의해 또는 그와 관련하여 사용되도록 소정의 컴퓨터 판독 가능 매체 또는 신호 보유 매체에 포함될 수 있다. 이러한 시스템은 컴퓨터에 기초한 시스템, 프로세서 장착 시스템, 또는 명령을 또한 실행할 수 있는 명령 실행 가능 시스템, 장치 또는 소자로부터 선택적으로 명령을 페치할 수 있는 소정의 시스템을 포함할 수 있다.
"컴퓨터 판독 가능 매체", "머신 판독 가능 매체", "전파-신호 매체", 및/또는 "신호 보유 매체"는 명령 실행 가능 시스템, 장치 또는 소자에 의해 또는 그와 관련하여 사용되는 소프트웨어를 포함하고, 저장하고, 그것과 통신하고, 그것을 전파하거나, 운반하는 소정의 장치를 포함할 수 있다. 머신 판독 가능 매체는, 그에 한정되지는 않지만, 선택적으로, 전자적, 자기적, 광학적, 전자기적, 적외선, 또는 반도체의 시스템, 소자 또는 전파 매체일 수 있다. 머신 판독 가능 매체의 일례인 비-소모성의 리스트는 전기 접속부, 휴대형 자기 또는 광학 디스크, "RAM"(전자)과 같은 휘발성 메모리, "ROM"(전자), 소거 프로그램 가능 ROM(EPROM 또는 플래시 메모리)(전자), 또는 광섬유(광학)("전자"는 하나 이상의 배선을 갖는다)를 포함한다. 머신 판독 가능 매체는 소프트웨어가 화상으로서 또는 다른 형식으로 전자적으로 저장된 후(예, 광학적 주사를 통해), 컴파일되거나 및/또는 해석되거나 기타 처리될 수 있으므로, 그 소프트웨어가 인쇄된 실감형 매체를 또한 포함할 수 있다. 처리된 매체는 그후 컴퓨터 및/또는 머신 메모리에 저장될 수 있다.
음성 향상 로직(100)은 소정의 기술 또는 장치에 적용 가능하다. 일부 음성 향상 시스템은 도 1에 도시된 바와 같이 주파수-시간 변환기(110)에 접속 또는 결합된다. 주파수-시간 변환기(100)는 주파수 도메인의 신호를 시간 도메인의 신호로 변환한다. 일부 주파수-시간 변환기는 입력 주파수 일부 또는 전체를 거의 동시에 처리할 수 있기 때문에, 일부 주파수-시간 변환기는 입력 신호를 실시간, 근접 실시간 또는 소정의 지연 시간으로 변환하도록 프로그램되거나 구성될 수 있다. 일부 음성 향상 로직 또는 성분은 도 8(전화 로직 또는 차량 제어 로직 단독에 포함될 수 있는 차량에 도시됨)에 도시된 원격 또는 지역 ASR 엔진을 접속하거나 결합한다. 상기 ASR 엔진은 음성 또는 기타 음향을 원격지로 전송할 수 있는 형태로 변환하는 기구 내에 포함될 수 있는데, 상기 원격지는 전화 및 오디오 설비를 포함할 수 있고 또한 사람이나 물건을 운송하는 장치나 구조(예, 차량) 내에 있거나, 그 장치 내에 단독으로 기립된 지상 통신선 및 무선 통신 장치와 같은 것이다. 유사하게, 음성 향상 시스템은 도 7에 도시된 ASR을 장착하거나 장착하지 않은 차량에 외부의 또는 차량에 접속된, 워키토키, 블루투스 가능 장치(예, 헤드셋)를 포함하는 개인 통신 장치 내에 구현될 수 있다.
음성 향상 로직은 또한 적응 가능하며, 무선이나, 전기적 또는 광학적 접속을 통해 음향을 검출 및/또는 모니터링하는 시스템과 인터페이스할 수 있다. 소정 음향이 고주파 대역 내에서 검출시, 상기 시스템은 향상 로직을 기능 정지하거나 완화시켜, 압축, 매핑, 그리고 일부의 경우, 이들 신호의 이득 조정을 방지한다. 통신 버스와 같은 버스를 통해, 노이즈 검출기는 이들 음향의 향상을 방지하거나 완화시키는 인터럽트(소프트웨어 인터럽트의 하드웨어) 또는 메시지를 전송할 수 있다. 이들 용례에서, 향상 로직은 본원에 참조로 포함되는 미국 특허 출원 제11/006,935호의 "지속 소음 억제 시스템"에 설명된 하나 이상의 회로, 로직, 시스템 또는 방법에 접속하거나 그것에 포함될 수 있다.
음성 향상 로직은 음성 신호의 인지도를 향상시킨다. 로직은 처리 대상의 음성 세그먼트를 자동으로 식별하여 압축할 수 있다. 선택된 유성음 및/또는 무성음의 세그먼트는 처리되어 하나 이상의 주파수 대역으로 시프트된다. 인지 품질을 향상시키기 위해, 적응 이득 조정이 시간 도메인 또는 주파수 도메인에서 이루어질 수 있다. 시스템은 음성 세그먼트의 전체 또는 일부만의 이득을 조정할 수 있으며, 일부의 조정은 감지 또는 추정된 신호에 기초한다. 이러한 시스템의 다능성은 음성이 제2의 시스템에 의해 통과되거나 처리되기 이전에 로직에 의해 음성을 향상시킬 수 있게 한다. 일부 용례에서, 음성 또는 기타 오디오 신호는 시간/ 및/또는 주파수 도메인의 음성을 포획하고 추출할 수 있는 원격지, 지역, 또는 이동형 ASR 엔진으로 전파될 수 있다. 일부 음성 향상 시스템은 음성과 묵음 또는 유성음과 무성음 세그먼트 사이를 전환하지 않으며, 따라서, 스퀴크음(squeaks), 스쿼크음(squawks), 첩음(chirps), 클릭음(clicks), 드립음(drips), 팝음(pops), 저주파 톤, 또는 음성을 포획하거나 재건하는 일부 음성 시스템 내에서 발생될 수 있는 기타의 음향 아티팩트에 덜 민감하게 된다.
본 발명의 다양한 실시예들이 설명되었지만, 당업자들에게 있어서는 본 발명의 범위 내에서 보다 많은 다양한 실시예 및 실행예가 가능함이 분명할 것이다. 따라서, 본 발명은 특허청구범위 및 그 등가물의 관점을 제외하고 제한되지 않는다.
전술한 구성에 따르면, 본 발명은 음성 신호의 인지도를 향상시키는 음성 향상 시스템을 제공한다.

Claims (21)

  1. 처리 음성의 인지도 및 품질을 향상시키는 음성 시스템으로서:
    음성 신호를 주파수의 스펙트럼으로 변환시키는 주파수 변환기와;
    상기 주파수 변환기에 전기적으로 결합되어, 미리 선택된 고주파 대역을 압축하고, 그 압축된 고주파 대역을 낮은 대역 제한 주파수 범위로 매핑시키는 스펙트럼 압축기와,
    음성 신호 검출시 존재하는 노이즈의 레벨을 검출하고 또 상기 노이즈 레벨을 측정 또는 추정하도록 구성된 노이즈 검출기
    를 포함하는 것인 음성 시스템.
  2. 제1항에 있어서, 상기 주파수 변환기는 음성 신호를 그 주파수 스펙트럼으로 근접 실시간으로 자동 변환하도록 프로그래밍된 것인 음성 시스템.
  3. 제1항에 있어서, 상기 주파수 변환기는 음성 신호를 주파수의 스펙트럼으로 실시간으로 자동 변환하도록 프로그램밍 또는 구성된 것인 음성 시스템.
  4. 제1항에 있어서, 상기 고주파 대역은 상기 낮은 대역 제한 주파수 범위 보다 큰 주파수의 범위를 갖는 것인 음성 시스템.
  5. 제1항에 있어서, 상기 스펙트럼 압축기는 비선형 압축 기저 함수를 갖는 것인 음성 시스템.
  6. 제1항에 있어서, 상기 낮은 대역 제한 주파수 범위는 아날로그 대역의 부분을 갖는 것인 음성 시스템.
  7. 제1항에 있어서, 상기 낮은 대역 제한 주파수 범위는 전화 대역의 부분을 갖는 것인 음성 시스템.
  8. 삭제
  9. 삭제
  10. 제1항에 있어서, 독립적 외부 신호와 관련하여 압축된 고주파 대역의 이득을 조정하도록 구성된 이득 제어기를 더 포함하는 음성 시스템.
  11. 제10항에 있어서, 상기 독립적 외부 신호는 배경 노이즈를 포함하는 것인 음성 시스템.
  12. 제1항에 있어서, 상기 스펙트럼 압축기에 결합되는 이득 제어기를 더 포함하고, 상기 스펙트럼 압축기는 낮은 대역 제한 주파수 범위에서 상기 압축된 고주파 대역에 있어서의 거의 이득만을 조정하도록 구성되는 것인 음성 시스템.
  13. 제12항에 있어서, 상기 스펙트럼 압축기는 검출된 음성 신호에 독립적인 신호에 따라 변하는 복수의 이득 조정을 적용하도록 구성되는 것인 음성 시스템.
  14. 처리 음성의 인지도을 향상시키는 음성 시스템으로서:
    음성 신호를 그 주파수 도메인으로 변환시키는 주파수 변환기와;
    상기 주파수 변환기에 결합되어, 미리 선택된 고주파 대역을 압축하고, 상기 압축된 고주파 대역을 낮은 주파수 대역으로 매핑시키는 스펙트럼 압축기와;
    존재하는 노이즈의 레벨을 검출 및 추정하도록 구성된 노이즈 검출기와;
    독립적인 외부 신호의 레벨 변화에 비례하여 압축 고주파 대역의 이득을 조정하도록 구성된 이득 제어기
    를 포함하는 것인 음성 시스템.
  15. 제14항에 있어서, 상기 스펙트럼 압축기를 조절하는 제어기를 더 포함하고, 이 제어기는 압축된 신호의 신호 대 잡음비와 그 압축되기 전의 신호의 신호 대 잡음비를 비교하는 모니터를 포함하는 것인 음성 시스템.
  16. 제14항에 있어서, 상기 이득 제어기는 상기 외부 신호의 레벨 변화에 따라 변하는 이득을 적용하도록 구성되는 것인 음성 시스템.
  17. 제14항에 있어서, 상기 이득 제어기는 압축된 신호의 레벨이 독립적인 외부 신호의 레벨과 실질적으로 일치하도록 하는 가변 이득을 적용하도록 구성되는 것인 음성 시스템.
  18. 처리 음성의 인지도을 향상시키는 음성 시스템으로서:
    음성 신호를 시간 도메인에서 주파수 도메인으로 실시간으로 변환시키는 주파수 변환기와;
    상기 주파수 변환기에 결합되어, 미리 선택된 고주파 대역을 압축하고, 그 압축된 고주파 대역을 전화 통과 대역 내의 낮은 주파수 대역으로 매핑시키는 스펙트럼 압축기와;
    음성 신호의 배경 노이즈 레벨을 검출 및 측정하도록 구성된 노이즈 검출기와;
    상기 배경 노이즈 레벨과 관련하여 가변 이득을 압축된 고주파 대역에 적용하도록 구성된 이득 제어기
    를 포함하는 것인 음성 시스템.
  19. 제18항에 있어서, 통신 버스를 통해 스펙트럼 압축기를 조절하는 제어기를 더 포함하고, 이 제어기는 검출된 음성 신호의 일부의 신호 대 잡음비와 압축된 신호의 일부의 신호 대 잡음비를 비교하는 것인 음성 시스템.
  20. 제19항에 있어서, 상기 제어기는 주파수 빈의 비교를 통해 진폭을 비교하도록 프로그래밍된 것인 음성 시스템.
  21. 제19항에 있어서, 상기 이득 제어기에 결합된 자동 음성 인식 시스템을 더 포함하는 음성 시스템.
KR1020060119849A 2005-12-09 2006-11-30 고주파수 압축을 통한 음성 인식 향상 시스템 KR100843926B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/298,053 2005-12-09
US11/298,053 US8086451B2 (en) 2005-04-20 2005-12-09 System for improving speech intelligibility through high frequency compression

Publications (2)

Publication Number Publication Date
KR20070061360A KR20070061360A (ko) 2007-06-13
KR100843926B1 true KR100843926B1 (ko) 2008-07-03

Family

ID=37719203

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060119849A KR100843926B1 (ko) 2005-12-09 2006-11-30 고주파수 압축을 통한 음성 인식 향상 시스템

Country Status (6)

Country Link
US (2) US8086451B2 (ko)
EP (2) EP1796082A1 (ko)
JP (2) JP2007164169A (ko)
KR (1) KR100843926B1 (ko)
CN (1) CN101030382A (ko)
CA (1) CA2569221C (ko)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
KR101414233B1 (ko) * 2007-01-05 2014-07-02 삼성전자 주식회사 음성 신호의 명료도를 향상시키는 장치 및 방법
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
KR100876794B1 (ko) 2007-04-03 2009-01-09 삼성전자주식회사 이동 단말에서 음성의 명료도 향상 장치 및 방법
US8983832B2 (en) * 2008-07-03 2015-03-17 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
EP2211339B1 (en) 2009-01-23 2017-05-31 Oticon A/s Listening system
EP2372707B1 (en) 2010-03-15 2013-03-13 Svox AG Adaptive spectral transformation for acoustic speech signals
JP2012103395A (ja) * 2010-11-09 2012-05-31 Sony Corp 符号化装置、符号化方法、およびプログラム
US20120197643A1 (en) * 2011-01-27 2012-08-02 General Motors Llc Mapping obstruent speech energy to lower frequencies
US20150281853A1 (en) * 2011-07-11 2015-10-01 SoundFest, Inc. Systems and methods for enhancing targeted audibility
CN102291496B (zh) * 2011-09-06 2013-08-07 华为终端有限公司 终端的通话方法及使用该通话方法的终端
WO2013136742A1 (ja) * 2012-03-14 2013-09-19 パナソニック株式会社 車載通話装置
JP6135106B2 (ja) * 2012-11-29 2017-05-31 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
DE112014000945B4 (de) 2013-02-22 2021-10-28 Mitsubishi Electric Corporation Sprachbetonungsgerät
US9060223B2 (en) 2013-03-07 2015-06-16 Aphex, Llc Method and circuitry for processing audio signals
US20140278415A1 (en) * 2013-03-12 2014-09-18 Motorola Mobility Llc Voice Recognition Configuration Selector and Method of Operation Therefor
US9084050B2 (en) * 2013-07-12 2015-07-14 Elwha Llc Systems and methods for remapping an audio range to a human perceivable range
CN104681032B (zh) * 2013-11-28 2018-05-11 ***通信集团公司 一种语音通信方法和设备
CN106340306A (zh) * 2016-11-04 2017-01-18 厦门盈趣科技股份有限公司 一种提高语音识别度的方法及装置
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
EP3324407A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
TWI588819B (zh) * 2016-11-25 2017-06-21 元鼎音訊股份有限公司 語音處理之方法、語音通訊裝置及其電腦程式產品
CN108461081B (zh) * 2018-03-21 2020-07-31 北京金山安全软件有限公司 语音控制的方法、装置、设备和存储介质
TWI662544B (zh) * 2018-05-28 2019-06-11 塞席爾商元鼎音訊股份有限公司 偵測環境噪音以改變播放語音頻率之方法及其聲音播放裝置
CN110570875A (zh) * 2018-06-05 2019-12-13 塞舌尔商元鼎音讯股份有限公司 检测环境噪音以改变播放语音频率的方法及声音播放装置
IT201900016328A1 (it) * 2019-09-13 2021-03-13 Elenos S R L Metodo per la misurazione e la visualizzazione del rapporto segnale/rumore audio
WO2024136902A1 (en) * 2022-12-23 2024-06-27 Innopeak Technology, Inc. Data augmentation for noise detection and classification

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980073078A (ko) * 1997-03-12 1998-11-05 윤종용 오디오 부호화/복호화 장치 및 방법
KR20020024742A (ko) * 2000-09-26 2002-04-01 김대중 비선형 방법에 의한 음성신호의 특징 추출 장치 및 그 방법
KR20020066921A (ko) * 2001-02-13 2002-08-21 가부시키가이샤 히타치세이사쿠쇼 음성 처리 방법, 이를 이용한 전화 및 중계국
US20040170228A1 (en) 2000-08-31 2004-09-02 Nokia Corporation Frequency domain partial response signaling with high spectral efficiency and low peak to average power ratio
US20040181393A1 (en) 2003-03-14 2004-09-16 Agere Systems, Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
WO2005015952A1 (en) * 2003-08-11 2005-02-17 Vast Audio Pty Ltd Sound enhancement for hearing-impaired listeners

Family Cites Families (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1424133A (en) 1972-02-24 1976-02-11 Int Standard Electric Corp Transmission of wide-band sound signals
US4130734A (en) 1977-12-23 1978-12-19 Lockheed Missiles & Space Company, Inc. Analog audio signal bandwidth compressor
US4255620A (en) 1978-01-09 1981-03-10 Vbc, Inc. Method and apparatus for bandwidth reduction
US4170719A (en) 1978-06-14 1979-10-09 Bell Telephone Laboratories, Incorporated Speech transmission system
US4419544A (en) * 1982-04-26 1983-12-06 Adelman Roger A Signal processing apparatus
US4374304A (en) 1980-09-26 1983-02-15 Bell Telephone Laboratories, Incorporated Spectrum division/multiplication communication arrangement for speech signals
FR2494988B1 (fr) 1980-11-28 1985-07-05 Lafon Jean Claude Perfectionnements aux dispositifs de prothese auditive
US4343005A (en) 1980-12-29 1982-08-03 Ford Aerospace & Communications Corporation Microwave antenna system having enhanced band width and reduced cross-polarization
US4454609A (en) * 1981-10-05 1984-06-12 Signatron, Inc. Speech intelligibility enhancement
US4741039A (en) 1982-01-26 1988-04-26 Metme Corporation System for maximum efficient transfer of modulated energy
JPS59122135A (ja) 1982-12-28 1984-07-14 Fujitsu Ltd 音声圧縮伝送方式
US4600902A (en) 1983-07-01 1986-07-15 Wegener Communications, Inc. Compandor noise reduction circuit
US4700360A (en) 1984-12-19 1987-10-13 Extrema Systems International Corporation Extrema coding digitizing signal processing method and apparatus
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
EP0305603B1 (en) 1987-09-03 1993-03-10 Koninklijke Philips Electronics N.V. Gain and phase correction in a dual branch receiver
JPH03136100A (ja) 1989-10-20 1991-06-10 Canon Inc 音声処理方法及び装置
JP3137995B2 (ja) 1991-01-31 2001-02-26 パイオニア株式会社 Pcmディジタルオーディオ信号再生装置
KR940006623B1 (ko) 1991-02-01 1994-07-23 삼성전자 주식회사 영상신호 처리 시스템
US5416787A (en) 1991-07-30 1995-05-16 Kabushiki Kaisha Toshiba Method and apparatus for encoding and decoding convolutional codes
US5396414A (en) 1992-09-25 1995-03-07 Hughes Aircraft Company Adaptive noise cancellation
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JPH0775339B2 (ja) 1992-11-16 1995-08-09 株式会社小電力高速通信研究所 音声符号化方法及び装置
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3396506B2 (ja) 1993-04-09 2003-04-14 東光株式会社 音声信号の圧縮装置と伸張装置
US5345200A (en) 1993-08-26 1994-09-06 Gte Government Systems Corporation Coupling network
JP2570603B2 (ja) 1993-11-24 1997-01-08 日本電気株式会社 音声信号伝送装置およびノイズ抑圧装置
US5471527A (en) * 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
US5497090A (en) 1994-04-20 1996-03-05 Macovski; Albert Bandwidth extension system using periodic switching
JPH08102687A (ja) 1994-09-29 1996-04-16 Yamaha Corp 音声送受信方式
ATE284121T1 (de) 1994-10-06 2004-12-15 Fidelix Y K Verfahren zur wiedergabe von audiosignalen und vorrichtung dafür
US5828756A (en) 1994-11-22 1998-10-27 Lucent Technologies Inc. Stereophonic acoustic echo cancellation using non-linear transformations
JPH08321792A (ja) 1995-05-26 1996-12-03 Tohoku Electric Power Co Inc 音声信号帯域圧縮伝送方法
US5774841A (en) * 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US5790671A (en) * 1996-04-04 1998-08-04 Ericsson Inc. Method for automatically adjusting audio response for improved intelligibility
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US5771299A (en) 1996-06-20 1998-06-23 Audiologic, Inc. Spectral transposition of a digital audio signal
WO1998006090A1 (en) 1996-08-02 1998-02-12 Universite De Sherbrooke Speech/audio coding with non-linear spectral-amplitude transformation
JPH10124098A (ja) 1996-10-23 1998-05-15 Kokusai Electric Co Ltd 音声処理装置
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
US6275596B1 (en) * 1997-01-10 2001-08-14 Gn Resound Corporation Open ear canal hearing aid system
US6115363A (en) 1997-02-19 2000-09-05 Nortel Networks Corporation Transceiver bandwidth extension using double mixing
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US6577739B1 (en) 1997-09-19 2003-06-10 University Of Iowa Research Foundation Apparatus and methods for proportional audio compression and frequency shifting
CA2249792C (en) 1997-10-03 2009-04-07 Matsushita Electric Industrial Co. Ltd. Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
US6154643A (en) 1997-12-17 2000-11-28 Nortel Networks Limited Band with provisioning in a telecommunications system having radio links
EP0945852A1 (en) 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
US6157682A (en) 1998-03-30 2000-12-05 Nortel Networks Corporation Wideband receiver with bandwidth extension
KR100269216B1 (ko) 1998-04-16 2000-10-16 윤종용 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
US6295322B1 (en) 1998-07-09 2001-09-25 North Shore Laboratories, Inc. Processing apparatus for synthetically extending the bandwidth of a spatially-sampled video image
US6504935B1 (en) 1998-08-19 2003-01-07 Douglas L. Jackson Method and apparatus for the modeling and synthesis of harmonic distortion
US6539355B1 (en) 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
US6195394B1 (en) 1998-11-30 2001-02-27 North Shore Laboratories, Inc. Processing apparatus for use in reducing visible artifacts in the display of statistically compressed and then decompressed digital motion pictures
US6144244A (en) 1999-01-29 2000-11-07 Analog Devices, Inc. Logarithmic amplifier with self-compensating gain for frequency range extension
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
SE517525C2 (sv) 1999-09-07 2002-06-18 Ericsson Telefon Ab L M Förfarande och anordning för konstruktion av digitala filter
FI19992350A (fi) 1999-10-29 2001-04-30 Nokia Mobile Phones Ltd Parannettu puheentunnistus
WO2001035395A1 (en) 1999-11-10 2001-05-17 Koninklijke Philips Electronics N.V. Wide band speech synthesis by means of a mapping matrix
US7027981B2 (en) * 1999-11-29 2006-04-11 Bizjak Karl M System output control method and apparatus
JP2001196934A (ja) 2000-01-05 2001-07-19 Yamaha Corp 音声信号帯域圧縮回路
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6766292B1 (en) * 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
DE10041512B4 (de) 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
JP3576941B2 (ja) 2000-08-25 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
US6819275B2 (en) * 2000-09-08 2004-11-16 Koninklijke Philips Electronics N.V. Audio signal compression
US6615169B1 (en) 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
EP1211671A3 (en) * 2000-11-16 2003-09-10 Alst Innovation Technologies Automatic gain control with noise suppression
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US20020128839A1 (en) 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US6741966B2 (en) 2001-01-22 2004-05-25 Telefonaktiebolaget L.M. Ericsson Methods, devices and computer program products for compressing an audio signal
US7113522B2 (en) * 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
US7076316B2 (en) * 2001-02-02 2006-07-11 Nortel Networks Limited Method and apparatus for controlling an operative setting of a communications link
AUPR438601A0 (en) 2001-04-11 2001-05-17 Cochlear Limited Variable sensitivity control for a cochlear implant
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
WO2003003350A1 (en) 2001-06-28 2003-01-09 Koninklijke Philips Electronics N.V. Wideband signal transmission system
JP2004521574A (ja) * 2001-06-28 2004-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 知覚的な低周波増強を備えた狭帯域音声信号伝送システム
JP2003084790A (ja) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
FR2831717A1 (fr) 2001-10-25 2003-05-02 France Telecom Methode et systeme d'elimination d'interference pour antenne multicapteur
WO2003038812A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
DE60214027T2 (de) * 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
US7630507B2 (en) 2002-01-28 2009-12-08 Gn Resound A/S Binaural compression system
AU2003212285A1 (en) 2002-03-08 2003-09-22 Koninklijke Kpn N.V. Method and system for measuring a system's transmission quality
JP2003280691A (ja) * 2002-03-19 2003-10-02 Sanyo Electric Co Ltd 音声処理方法および音声処理装置
US7613310B2 (en) 2003-08-27 2009-11-03 Sony Computer Entertainment Inc. Audio input system
US20040022404A1 (en) * 2002-07-30 2004-02-05 Ryuichi Negishi Sound processing apparatus and hearing aid
AU2003260958A1 (en) * 2002-09-19 2004-04-08 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
US7062040B2 (en) 2002-09-20 2006-06-13 Agere Systems Inc. Suppression of echo signals and the like
US7430300B2 (en) * 2002-11-18 2008-09-30 Digisenz Llc Sound production systems and methods for providing sound inside a headgear unit
US20040175010A1 (en) 2003-03-06 2004-09-09 Silvia Allegro Method for frequency transposition in a hearing device and a hearing device
US7248711B2 (en) 2003-03-06 2007-07-24 Phonak Ag Method for frequency transposition and use of the method in a hearing device and a communication device
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
EP1494208A1 (en) 2003-06-30 2005-01-05 Harman Becker Automotive Systems GmbH Method for controlling a speech dialog system and speech dialog system
US7333618B2 (en) * 2003-09-24 2008-02-19 Harman International Industries, Incorporated Ambient noise sound level compensation
US7580531B2 (en) 2004-02-06 2009-08-25 Cirrus Logic, Inc Dynamic range reducing volume control
US7415117B2 (en) 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
US7856240B2 (en) 2004-06-07 2010-12-21 Clarity Technologies, Inc. Distributed sound enhancement
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
ATE515021T1 (de) 2004-10-27 2011-07-15 Yamaha Corp Tonhöhenumsetzungsvorrichtung
KR100842590B1 (ko) 2004-11-09 2008-07-01 삼성전자주식회사 이동 단말에서 음향 반향 제거 방법 및 장치
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8275120B2 (en) 2006-05-30 2012-09-25 Microsoft Corp. Adaptive acoustic echo cancellation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980073078A (ko) * 1997-03-12 1998-11-05 윤종용 오디오 부호화/복호화 장치 및 방법
US20040170228A1 (en) 2000-08-31 2004-09-02 Nokia Corporation Frequency domain partial response signaling with high spectral efficiency and low peak to average power ratio
KR20020024742A (ko) * 2000-09-26 2002-04-01 김대중 비선형 방법에 의한 음성신호의 특징 추출 장치 및 그 방법
KR20020066921A (ko) * 2001-02-13 2002-08-21 가부시키가이샤 히타치세이사쿠쇼 음성 처리 방법, 이를 이용한 전화 및 중계국
US20040181393A1 (en) 2003-03-14 2004-09-16 Agere Systems, Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
WO2005015952A1 (en) * 2003-08-11 2005-02-17 Vast Audio Pty Ltd Sound enhancement for hearing-impaired listeners

Also Published As

Publication number Publication date
JP2007164169A (ja) 2007-06-28
US8219389B2 (en) 2012-07-10
US20120095759A1 (en) 2012-04-19
JP2011141551A (ja) 2011-07-21
JP5463306B2 (ja) 2014-04-09
CA2569221C (en) 2013-02-19
EP1796082A1 (en) 2007-06-13
CN101030382A (zh) 2007-09-05
US8086451B2 (en) 2011-12-27
EP3089162B1 (en) 2018-01-31
KR20070061360A (ko) 2007-06-13
EP3089162A1 (en) 2016-11-02
CA2569221A1 (en) 2007-06-09
US20060241938A1 (en) 2006-10-26

Similar Documents

Publication Publication Date Title
KR100843926B1 (ko) 고주파수 압축을 통한 음성 인식 향상 시스템
US8249861B2 (en) High frequency compression integration
EP2056296B1 (en) Dynamic noise reduction
EP2283484B1 (en) System and method for dynamic sound delivery
EP1739657B1 (en) Speech signal enhancement
KR100860805B1 (ko) 음성 강화 시스템
US9361901B2 (en) Integrated speech intelligibility enhancement system and acoustic echo canceller
US8913754B2 (en) System for dynamic spectral correction of audio signals to compensate for ambient noise
EP2244254B1 (en) Ambient noise compensation system robust to high excitation noise
EP2141695B1 (en) Speech sound enhancement device
EP1801788A1 (en) Advanced periodic signal enhancement
KR100876794B1 (ko) 이동 단말에서 음성의 명료도 향상 장치 및 방법
US7835773B2 (en) Systems and methods for adjustable audio operation in a mobile communication device
AU2002367002B2 (en) System and method for controlling a filter to enhance speakerphone performance
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130604

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140611

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150608

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160616

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170614

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180614

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190614

Year of fee payment: 12