KR100333049B1 - 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법 - Google Patents

심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법 Download PDF

Info

Publication number
KR100333049B1
KR100333049B1 KR1020000003476A KR20000003476A KR100333049B1 KR 100333049 B1 KR100333049 B1 KR 100333049B1 KR 1020000003476 A KR1020000003476 A KR 1020000003476A KR 20000003476 A KR20000003476 A KR 20000003476A KR 100333049 B1 KR100333049 B1 KR 100333049B1
Authority
KR
South Korea
Prior art keywords
sound quality
distorted
psychoacoustic
speech signal
original
Prior art date
Application number
KR1020000003476A
Other languages
English (en)
Other versions
KR20010074412A (ko
Inventor
윤대희
윤종진
박상욱
Original Assignee
박종섭
주식회사 하이닉스반도체
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 박종섭, 주식회사 하이닉스반도체 filed Critical 박종섭
Priority to KR1020000003476A priority Critical patent/KR100333049B1/ko
Publication of KR20010074412A publication Critical patent/KR20010074412A/ko
Application granted granted Critical
Publication of KR100333049B1 publication Critical patent/KR100333049B1/ko

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B33/00Constructional parts, details or accessories not provided for in the other groups of this subclass
    • G11B33/10Indicating arrangements; Warning arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B33/00Constructional parts, details or accessories not provided for in the other groups of this subclass
    • G11B33/12Disposition of constructional parts in the apparatus, e.g. of power supply, of modules
    • G11B33/121Disposition of constructional parts in the apparatus, e.g. of power supply, of modules the apparatus comprising a single recording/reproducing device
    • G11B33/122Arrangements for providing electrical connections, e.g. connectors, cables, switches
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J7/00Circuit arrangements for charging or depolarising batteries or for supplying loads from batteries
    • H02J7/0029Circuit arrangements for charging or depolarising batteries or for supplying loads from batteries with safety or protection devices or circuits
    • H02J7/0034Circuit arrangements for charging or depolarising batteries or for supplying loads from batteries with safety or protection devices or circuits using reverse polarity correcting or protecting circuits
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J7/00Circuit arrangements for charging or depolarising batteries or for supplying loads from batteries
    • H02J7/0047Circuit arrangements for charging or depolarising batteries or for supplying loads from batteries with monitoring or indicating devices or circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

본 발명에 따른 심리 음향 캡스트럼 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법은 인간의 청각적 특성을 고려한 PLD-CMS(Perceptual Linear Predictive-Cepstrum Mean Substraction) 음질 평가방법을 정의하고, 이를 이용하여 객관적 음질 평가를 수행하도록 한 것으로, 입력되는 원음성과 CDMA와 PSTN 채널을 통한 왜곡된 음성신호의 상호 상관으로 지연시간을 측정하는 단계와; 상기 측정한 지연시간을 이용하여 입력되는 원음성과 왜곡된 음성신호를 동기화시키는 단계와; 입력되는 원 음성신호와 상기 동기화된 왜곡된 음성신호 스펙트럼 각각에 인간의 청각적 특성을 반영하여 심리 음향 선형 예측을 분석하는 단계와; 상기 원음성과 왜곡된 음성신호에 대해 각각 심리 음향 선형 예측 분석이 완료되면, 원음성과 왜곡된 음성신호 전구간에 걸쳐 영향을 주고 있는 채널에 의한 영향을 켑스트럴 평균 차감을 이용하여 제거하는 단계와; 원음성과 왜곡된 음성신호의 심리 음향 켑스트럴 거리를 계산하여 입력된 음성의 왜곡정보를 측정하는 단계로 이루어진 것이다.

Description

심리 음향 캡스트럴 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법{Method for testing voice quality in a mobile communication system using perceptual linear predictive-cepstrum mean substraction}
본 발명은 이동통신 시스템에서의 음질 평가방법에 관한 것으로서, 특히 인간의 청각적 특성을 고려한 PLD-CMS(Perceptual Linear Predictive-Cepstrum Mean Substraction) 음질 평가방법을 정의하고, 이를 이용하여 객관적 음질 평가를 수행하는 심리 음향 캡스트럼 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법에 관한 것이다. 즉, 본 발명은 많은 비용과 시간이 요구되는 주관적 음질 평가를 대체할 객관적 음질 평가 기술로서, CDMA이동전화, 차세대 이동통신(IMT-2000)시스템의 설치, 성능 평가와 유지보수등의 작업에 효과적으로 이용할 수 있도록 한 것이다.
일반적으로 시간과 장소에 구해받지 않고 자유로운 통신을 하고자 하는 인간의 욕구에 부합하여 최근 몇 년간 이동전화가 널리 보편화되었다. 이러한 이동전화의 품질을 결정하는 가장 중요한 요소는 통화성공률과 통화품질이며, 특히 통화품질 즉, 음질은 사용자의 청각에 따른 주관에 의해 결정된다.
그러므로, 이동 전화망의 설치 및 유지보수를 위해서는 객관적 품질인 통화성공률과 함계 지속적인 음질평가가 반드시 필요하다.
현재 이동전화망을 통해 전송되는 음성신호는 음성 부호화기로 압축된 디지탈신호들로 표현되며, 이 신호들이 재생되는 음성신호의 음질에서 차지하는 중요도는 크게 차이가 있다. 따라서, 이동 전화망의 음질은 음성신호의 특성을 고려한 방법으로 평가하여야 한다.
음질 평가는 기본적으로 여러 사용자의 반복 청취실험을 통한 주관적 음질 평가 방법에 의해 이루어질 수 있다. 하지만 이 방법은 이용자의 체감 음질과 직접적인 관계가 있다는 장점에도 불구하고, 많은 실험자를 대상으로 긴 시간동안 실험을 하여야 하기 때문에 다양한 환경에서 반복해서 수행하기에는 많은 시간과 노력, 비용이 소모되기 때문에 적합하지 않다.
따라서, 주관적 음질과 상관관계가 높은 객관적 척도로 주관적 음질을 예측하는 것이 바람직하다.
음질 평가는 평가하고자 하는 음성신호를 음질 평가 실험자가 직접 듣고 주관적 판단에 따라 음질을 평가하는 주관적 음질 평가방법과, 계산에 의한 원 음성신호와 왜곡 음성신호의 대수적 차이를 이용하는 객관적 음질 평가방법이 있다.
주관적 음질 평가는 양방향 청취에 의한 대화식 평가법과 단방향 청취에 의한 청취식 방법이 있다. 이중 대화식 평가법은 완벽한 통신 시스템에 완성된 단계에서만이 이루어질 수 있으며, 음성 부호화기의 개발단계나 이동전화망의 설치단계등에서는 적용이 불가능하다. 따라서, 수행이 용이한 청취식 평가법이 보편적으로 사용된다.
청취식 평가법에는 왜곡된 음성 신호만을 듣고 평가를 내리는 절대 음질 평가법(ACR:Absolute Category Rating), 원음성 신호와 왜곡된 음성신호를 듣고 왜곡정도를 평가하는 왜곡음질 평가법(DCR:Degradation Category Rating)과 두개의 왜곡된 음성신호를 듣고 비교하는 비교 음질 평가법(CCR: Comparison Category Rating)이 있다.
상기 절대 음질 평가법중 MOS(Mean Opinion Score)평가는 실험자가 왜곡된 음성신호를 들은 후, 아래의 표 1에 제시된 바와 같이 음성신호의 왜곡정도를 5단계로 평가하는 방법이다.
Rate SpeechQuality Level of Distortion
5 Excellent Imperceptible
4 Good Just Perceptiblebut not annoying
3 Fair Perceptible and slightly annoying
2 Poor Annoying but not objectionable
1 Bad Very annoying and objectionable
이어, 객관적 음질평가는 평가가 이루어지는 영역에 따라 시간 영역에서의 평가, 주파수 영역에서의 평가 및 심리 음향 영역에서의 평가로 분류할 수 있다.
시간영역에서의 평가는 신호 대 잡음비(SNR: Signal-to -Noise Ratio), 구간별 신호대 잡음비가 있다. 이 방법들은 원 음성신호와 왜곡된 음성신호간의 자승 평균 오차를 이용하는 방법으로 32Kbps이상의 전송률을 갖는 파형 부호화기의 성능 평가에 적합하다.
주파수 영역에서의 평가는 스펙트럴 거리(Spectral Distance:SD), 대수적 스펙트럴 거리(Log Spectral Distance:LSD), 선형 예측 캡스트럼 거리(Linear Predictive Cofficient-Capstrum Distance:LPC-CD)등이 있다. 이러한 방법중 LPC-CD는 음성신호의 주파수 성분 포락선 차이를 계산하며, 16-32Kbps의 전송률을 갖는 음성부호화기의 성능 평가에 적합하다.
심리 음향 영역에서의 평가는 원 음성신호와 왜곡된 음성신호에 인간의 청각적 특성을 반영한 심리 음향 모델을 이용하여 두 음성 신호의 왜곡정도를 측정하는 방법으로 BSD(Bark Spectral Distortion), PLP-CD(Perceptual Linear Predictive-Cepstrum Distance), MNB(Measuring Normalizing Block), PSQM(Perceptual SpeechQuality Measure)등이 있다. 특히 PSQM과 MNB는 ITU-T(International Telecommunication Union-Telecommunication)의 권고안으로 PSQM은 4Kbps 이상의 음성 부호화기의 성능 평가에, MNB는 4Kbps 미만의 음성부호화기와 비트에러, 프레임 삭제가 발생하는 음성 부호화기의 성능 평가에 적합하다.
이러한 객관적 음질 평가방법은원 음성신호와 입력 음성 신호이 시간축 동기화가 이루어지지 않았다면 입력 음성신호의 음질과 원 음성신호의 음질이 동일하다 하더라도 매우 왜곡된 음질로 평가할 정도로 정상적인 음질평가를 수행할 수 없다. 따라서, 객관적 음질 평가방법에 있어 동기화는 매우 중요하며, 객관적 음질 평가를 수행하기 위해서는 두 음성파형의 정확한 시간축 동기화가 반드시 이루어져야 한다.
이하, 종래 기술에 따른 음질 평가방법에 대하여 도 1을 참조하여 간단하게 살펴보도록 하자. 도 1은 종래 기술에 따른 음질 평가방법의 기본적인 구조를 나타낸 도면이다.
도 1에서 Phase Ⅰ의 트래이닝(Training)단계에서는 입력되는 원 음성과 이동통신 시스템을 통한 왜곡된 음성신호에 대해 사람들이 느끼는 보편적인 경향을 직접 소리를 듣고 평가하는 주관적 평가방법(Subjective Test)을 통하여 분석한 뒤, 이에 대한 객관적 평가방법(Objective Test)관계를 회귀분석(Regression Analysis)한다.
이를 통하여 Phase Ⅱ의 평가(Evaluation)단계에서 객관적 평가방법만으로도 왜곡된 음성에 대해 사람들이 느끼는 주관적 음질을 계산을 통해 예측할 수 있도록한다.
이리하여 주관적 음질 평가방법을 계산에 의한 객관적 음질 평가방법으로 대체함으로써, 이에 소모되는 많은 시간과 비용 및 노력을 줄일 수 있다.
이하, 기존의 음질 평가방법인 PSQM과 PLP-CD가 보이는 성능 저하에 대하여 살펴보자.
먼저, 일반적인 이동전화 환경에서 음성신호는 주로 도 2와 같은 경로를 통해 전달된다. 즉, 도 2는 일반적인 이동통신 시스템의 이동 전화 경로를 나타낸 도면이다.
또한, 양쪽이 모두 이동전화 환경인 경우 왜곡의 발생이 어느 이동전화 환경으로 인한 것인지 알 수 없기 때문에 음질 평가 실험 역시 도 2와 같은 경로를 통해 음성신호를 전송하게 되는 것이다.
이 과정에서 디지털 시스템 영역에서는 음성 패킷 손실에 의한 음질 저하가 발생하며, 아날로그 시스템 영역에서는 PSTN 경로 과정에서 선형 필터링으로 인해 스펙트럼 왜곡 등의 음질 저하가 발생하게 된다.
이러한 왜곡중 PSTN 경로에 따른 채널 영향에 의한 음질 저하는 주관적 음질에 크게 영향을 미치지 않으며, 모든 시간 영역에 존재하는 특성으로 인해 전화 사용자들에게 있어서는 미미한 왜곡으로 인식되거나 심지어 전혀 인식되지 않기도 한다. 예를 들면, 서로 다른 장소에서 사용하는 전화에서 통화를 하더라도 사용자는 통화하는데 있어 큰 차이를 느끼지 못하며, 심한 경우에는 그다지 통화 자체에 어려움을 겪지는 않는다. 그러나, 이러한 차이는 주파수 영역에서 음성신호를 비교하여 보면, 도 3과 같이 서로 다른 특성을 갖고 있음을 알 수 있다.
도 3은 일반적인 채널 환경에 따른 음성신호의 스팩트럼 변화를 나타낸 그래프로서, 도 3에 도시된 바와 같이, 다른 채널 경로의 영향으로 인해 스펙트럼의 포락선이 크게 다른 두 음성 신호에 대하여 실험자들은 거의 동일한 MOS점수를 부가함을 확인할 수 있다.
그러나, 도 3에과 같은 스펙트럼의 차이는 객관적 음질 평가에 큰 영향을 미치며. 성능 저하를 야기할 수 있다. 도 3은 A세트의 MOS점수 2.99인 음성신호의 스펙트럼과 B세트의 MOS점수 3.01인 음성신호의 스펙트럼을 보이고 있다.
이러한 현상으로 인해 PSTN경로가 다른 것 이외에는 모든 녹음 환경이 동일한 A세트와 B세트의 음성신호에 대해 MOS와 PSQM 및 PLP-CD결과의 분포도 도 4를 보면, 각 세트의 음성신호들은 유사한 MOS점수의 분포를 보이고 있으나, PSQM, PLP-CD의 결과값들은 각 세트에 따라 확연히 이원화된 분포를 보인다.
도 4는 CDMA 음성에 대한 종래 기술에 따른 음질 평가방법에 대한 결과값을 나타낸 도면으로서, 도 4a는 절대 평가방법인 MOS점수와 MOS값의 발생빈도와의 관계를 나타낸 도면, 도 4b는 PSQM값과 그 값의 발생빈도와의 관계를 나타낸 도면, 도 4c는 PLP-CD값과 그 값의 발생빈도와의 관계를 나타낸 도면으로서, 도 4에서 가로축은 MOS점수, PSQM값, PLP-CD 값을 나타내며, 세로축은 각 값의 발생 빈도를 나타낸다. 여기서, MOS점수는 점수가 클 수록 양질의 음질이나, PSQM값과 PLP-CD값은 왜곡된 음성신호의 왜곡정도를 나타내므로 값이 작을 수 록 좋은 음질임을 의미한다.
도 4의 결과에 따르면, 실험자들은 A세트와 B세트에 대하여 유사한 MOS점수를 부여했으나, 기존의 객관적 방법들은 채널 경로에 의한 A세트와 B세트의 스펙트럼 차이로 인해 A세트와 B세트에 대하여 매우 상이한 점수로 계산함을 알 수 있다. 즉, 도 4b에 도시된 PSQM의 경우 B세트에서 음질이 가장 좋지 않은 음성신호는 PSQM값이 5이나 이는 A세트에서는 음질이 가장 좋은 값에 해당하며, A세트의 MOS 4점의 음성신호와 B세트의 MOS 1점의 음성신호와 유사한 음질의 음성신호로 평가하고 있다. 도 4C에 도시된 바와 같이 PLP-CD의 경우 훈련과정이 이루어진 채널 환경이 아닌 다른 환경에서 성능을 평가할 경우 채널 영향의 변화로 큰 성능 저하가 발생하게 된다. 이러한 현상은 음성 부호화기의 성능 평가를 목적으로 한 기존의 음질 평가 알고리즘에서는 고려하지 않은 점으로 음질 평가 알고리즘의 성능에 큰 영향을 끼치게 된다.
한편, 서로 다른 채널 경로의 음성신호 A세트와 B세트 각각에 대하여 PSQM과 PLP-CD의 객관적 음질 평가 결과를 비교하면, 도 5와 도 6과 같다.
도 5a 및 도 5b는 서로 다른 체널 환경에서의 MOS점수와 PSQM결과값의 상관관계를 나타낸 도면이고, 도 6a 및 도 6b는 서로 다른 채널 환경에서의 MOS점수와 PLP-CD결과값의 상관관계를 나타낸 도면이다.
도 5와 6에서 r은 상관 계수를 나타내면, 곡선은 회귀분석에 이용된 함수의 곡선을 나타낸다.
PSQM방법의 경우 도 5에 도시된 바와 같이, A세트에 대해서는 0.79, B세트에 대해서는 0.92의 매우 높은 주관적 음질과의 상관관계를 보이고 있다.
또한, 도 6에 도시된 바와 같이, PLP-CD의 경우 A세트에 대해서는 0.51의 상관관계를 B세트에 대해서는 0.80의 상관관계를 나타낸다.
PLP-CD의 경우 상대적으로, 채널의 영향을 많이 받는 A세트의 음성신호에 대해 낮은 상관관계를 갖는 것으로 보아 채널 환경이 좋지 않은 환경에 대해서는 더욱 나쁜 성능을 보임을 예상할 수 있다.
이러한 기존의 두가지 객관적 음질 평가방법에 대해 A세트와 B세트 모두에 대해 주관적 음질과의 상관관계를 비교하면, 도 7과 같다.
도 7a는 서로 다른 채널 환경에서의 CDMA음성신호 모두에 대한 MOS점수와 PSQM결과값의 상관관계를 나타낸 도면, 도 7b는 서로 다른 채널 환경에서의 CDMA음성신호 모두에 대한 MOS점수와 PLP-CD결과값의 상관관계를 나타낸 도면이다.
이 경우 PSQM방법은 도 7a에서와 같이 0.59, PLD-CD는 도 7b에서와 같이 0.49의 매우 낮은 상관관계를 보이고 있으며, 이는 앞의 각 세트에 대한 상관계수와 비교할 때, 채널 환경의 변환에 따른 영향으로 극심한 성능저하가 발생했음을 알 수 있다. MOS결과와 객관적 방법의 결과의 상관도 도 7a, 도 7b를 보면, 도 도 5 및 도 6에서와는 달리 분포점들이 이원화되어 있다. 이는 A세트에 대한 분포와 B세트에 대한 분포점들이 이원화된 것으로 도 3과 도 4에서 관찰한 바와 같이 채널 경로에 따른 스펙트럼 변화가 각각 다르기 때문에 비롯된 것이다.
따라서, 기존의 음질 평가방법인 PSQM과 PLP-CD는 채널 경로가 다양한 이동전화 환경에서 사용할 수 없으며, 이에 대한 대안이 필요하다.
즉, ITU-T의 객관적 음질 평가방법 권고안인 PSQM, MNB, PLP-CD와 같은 기존의 방법은 음성신호가 아날로그 채널 경로에 따른 영향을 받았을 경우 그 왜곡 특성으로 인한 주파수 영역에서의 스펙트럼 특성이 달라지게 된다는 점을 고려하지 않았다. 따라서, 기존의 방법으로 채널 경로가 서로 다른 음성 신호에 대해 음질 평가를 수행할 경우 주관적 평가에 의해 동일한 음질로 평가된 음성신호이더라도 그 음질을 매우 다르게 평가하게 된다, 이로 인해 기존의 음질 평가 방법들은 심한 성능 저하를 겪게 되는 문제점이 있다.
따라서, 본 발명은 상기한 종래 기술에 따른 제반 문제점을 해결하기 위하여 안출한 것으로, 본 발명의 목적은 인간의 청각적 특성을 고려한 PLD-CMS(Per ceptrum Linear Predictive-Cepstral Mean Substraction) 음질 평가방법을 정의하고, 이를 이용하여 객관적 음질 평가를 수행하는 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법을 제공함에 있다.
상기한 목적을 달성하기 위한 본 발명의 특징은 입력되는 원음성과 CDMA와 PSTN 채널을 통한 왜곡된 음성신호의 상호 상관으로 지연시간을 측정하는 단계와; 상기 측정한 지연시간을 이용하여 입력되는 원음성과 왜곡된 음성신호를 동기화시키는 단계와; 입력되는 원 음성신호와 상기 동기화된 왜곡된 음성신호 스펙트럼 각각에 인간의 청각적 특성을 반영하여 심리 음향 선형 예측을 분석하는 단계와; 상기 원음성과 왜곡된 음성신호에 대해 각각 심리 음향 선형 예측 분석이 완료되면, 원음성과 왜곡된 음성신호 전구간에 걸쳐 영향을 주고 있는 채널에 의한 영향을 켑스트럴 평균 차감을 이용하여 제거하는 단계와; 원음성과 왜곡된 음성신호의 심리 음향 켑스트럴 거리를 계산하여 입력된 음성의 왜곡정보를 측정하는 단계로 이루어짐에 있다.
도 1은 종래 기술에 따른 이동통신 시스템에서의 객관적 음질 평가방법에 대한 개념을 나타낸 도면,
도 2는 일반적인 이동통신 시스템의 이동 전화 경로를 나타낸 도면,
도 3은 일반적인 채널 환경에 따른 음성신호의 스팩트럼 변화를 나타낸 그래프,
도 4는 CDMA 음성에 대한 종래 기술에 따른 음질 평가방법에 대한 결과값을 나타낸 도면으로서, 도 4a는 절대 평가방법인 MOS점수와 MOS값의 발생빈도와의 관계를 나타낸 도면, 도 4b는 PSQM값과 그 값의 발생빈도와의 관계를 나타낸 도면, 도 4c는 PLP-CD값과 그 값의 발생빈도와의 관계를 나타낸 도면,
도 5a 및 도 5b는 서로 다른 체널 환경에서의 MOS점수와 PSQM결과값의 상관관계를 나타낸 도면,
도 6a 및 도 6b는 서로 다른 채널 환경에서의 MOS점수와 PLP-CD결과값의 상관관계를 나타낸 도면,
도 7a는 서로 다른 채널 환경에서의 CDMA음성신호 모두에 대한 MOS점수와PSQM결과값의 상관관계를 나타낸 도면, 도 7b는 서로 다른 채널 환경에서의 CDMA음성신호 모두에 대한 MOS점수와 PLP-CD결과값의 상관관계를 나타낸 도면,
도 8은 본 발명에 따른 심리 음향 캡스트럼 평균 차감법(PLP-CMS)을 이용한 이동통신 시스템에서의 음질 평가방법에 대한 동작 플로우를 나타낸 도면,
도 9a 및 도 9b는 서로 다른 채널 환경에 대한 본 발명에 따른 심리음향 갭스트럼 평균 차감법을 이용한 음질 평가 결과값과 MOS점수와의 상관관계를 나타낸 도면,
도 10은 CDMA 음성에 대한 MOS와 PLD-CMS의 분포를 나타낸 도면으로서, 도 10a는 MOS점수와 그 점수의 발생빈도와의 상관관계를 나타낸 도면이고, 도 10b는 본 발명에서 제안한 PLD-CMS의 결과값과 그 값의 발생빈도의 상관관계를 나타낸 도면,
도 11은 각 채널 환경 모두에 대한 CDMA 음성신호의 MOS점수와 PLD-CMS결과값과의 상관관계를 나타낸 도면,
이하, 본 발명에 따른 이동통신 시스템에서의 음질 평가방법에 대하여 첨부한 도면을 참조하여 상세하게 살펴보도록 한다.
도 8은 본 발명에 따른 심리 음향 캡스트럴 평균 차감법(PLP-CMS)을 이용한 이동통신 시스템에서의 음질 평가방법에 대한 동작 플로우를 나타낸 도면으로서, 그 계산과정은 도 8에 도시된 바와 같이 지연측정, 심리 음향 선형 예측, 켑스트럴 평균 차감(Cepstrum Mean Subtraction) 및 거리계산의 네 단계로 이루어진다.
즉, 본 발명에 따른 심리 음향 켑스트럴 평균 차감법을 이용한 음질 평가방법인 PLP-CMS는 원 음성에 대한 왜곡 음성의 지연시간을 측정하고, 두 음성신호를 동기화시키며, 원 음성과 왜곡된 음성신호에 대해 심리 음향 선형 예측분석(PLD Analysis)을 수행함으로써, 입력 음성신호의 스펙트럼에 인간의 청각적 특성을 반영한다.
또한, 켑스트럴 평균 차감 단계에서는 원 음성신호 및 왜곡된 음성신호의 전 구간에 걸쳐 영향을 주고 있는 채널에 의한 영향을 각각 제거한다.
이어, 두 음성신호의 PLP 켑스트럴 거리를(PLP-CD)계산하여 입력된 음성신호의 왜곡정도를 측정하는 것이다.
상기한 각각의 단계에 대하여 좀 더 상세하게 살펴보기로 하자.
먼저, 지연 측정단계에 대하여 살펴보면, 일반적으로 두 음성신호(원음성과 CDMA & PSTN 채널을 통과한 왜곡된 음성신호)의 상호 상관으로 입력신호의 지연시간을 측정한다. 그러나, CDMA PCS 음성신호는 음성 부호화기, 채널 에러와 PSTN의 복합적인 영향으로 원 음성신호의 특성이 유지되지 않으며, 부분적으로는 음성신호가 전혀 복원되지 않는 경우도 있다.
원 음성신호와 왜곡된 음성신호의 포락선을 맞추어 넓은 영역에서 지연시간을 측정한 뒤, 주파수 영역에서 짧은 구간의 스펙트럼을 이용하여 미세한 지연시간을 측정하는 ANSI의 알고리듬은 파형이 완벽하게 보존된 신호에 대해서는 정확한 지연시간을 계산하나, 짧은구간의 스펙트럼을 비교하기 때문에 CDMA PCS 음성신호와 같이 다양한 형태의 왜곡을 지닌 음성 신호의 지연시간 측정에 적합하지 않다. 실제로 실험결과, ANSI의 알고리듬은 CDMA 망에서 왜곡된 음성신호의 지연시간 계산에 있어 많은 오차를 보였다.
따라서, 본 발명에서는 짧은 구간의 스펙트럼을 이용하는 대신 CDMA 망에서도 대체적으로 유지되는 음성신호의 전 구간 파형을 이용한 것이다. 즉, 음성신호의 포락선을 이용하여 넓은 영역에 대해 낮은 분해능으로 대체적인 지연시간을 계산하여 계산량을 줄였으며, 시간 영역에서 두 음성신호간의 전 구간 상호 관계를 이용하여 세밀한 지연시간을 계산한 것이다. 이러한 방법을 이용하여 모든 음성신호에 대하여 동기화를 수행한다.
이어, 심리 선형 예측 분석에 대하여 살펴보면, 심리 음향 선형 예측 분석단계에서는 사람의 청각적 특성의 모델링을 이용하여 보다 높은 상관관계를 갖고 주관적 음질을 예측할 수 있도록 한 것이다.
인간의 귀는 저주파 대역에서는 세밀한 청각 분해능을 갖으나, 고주파 대역에서는 그렇지 못하여 일정한 임계 주파수 영역에서는 각 주파수 별 에너지가 상호 영향을 끼친다고 알려져 있다. 이러한 특성을 고려한 것이 임계 대역 분석이다.
또한, 사람의 귀는 주파수 별로 자극에 대해 다르게 민감하다. 예를 들면, 100Hz의 톤이 1,000Hz의 톤과 동일한 크기로 들리려면 35dB 더 큰 세기(Intensity)를 가져야 한다. 이러한 청각적 특징을 고려하여 각각의 주파수에 대하여서도 사람에 의해 지각되는 소리의 크기가 동일하도록 보정할 필요가 있는데, 이를 표현한 것이 등감 곡선이며, 이에 의한 소리의 단위를 폰(Phon)이라 한다. 뿐 만 아니라 Phon 단위의 물리적 소리 크기 변화는 실제로 사람이 인지하는 Sone단위의 소리 크기의 변화와는 주파수 대역별로 다른 특성을 보이는데, 이를 비선형 관계로 모델링하여 보정한 것이다.
그리고, 켑스트럴 평균 차감 및 거리 계산단계에 대하여 살펴보도록 하자.
본 발명에 따른 PLP-CMS는 두 음성신호간의 거리측정 인자로 PLP 켑스트럴 계수를 이용한다. PLP켑스트럴 계수는 인간의 청각적 특성을 고려한 스펙트럼 포락선을 표현하는 계수이다. 그러나 LPC와는 달리 각 계수간의 상관관계가 없어 거리 측정 계산에 용이한 유클리디안 거리(Euclidean Distance)방법을 적용할 수 있으며, 객관적 음질 평가에 있어서도 우수한 성능을 보인다.
또한, PLP-CMS는 켑스트럴 평균 차감법을 이용함으로써, 다양한 PSTN 경로에의해 음성신호 전구간에서 발생하는 스펙트럼 영향을 제거하여 어떠한 PSTN 경로를 거친 음성신호에 대해서도 신뢰할 수 있는 객관적 음질 평가를 수행하도록 한 것이다.
따라서, PLP-CMS는 다음과 같이 평균 차감법을 이용한 PLP켑스트럴 거리 계산으로 원 음성신호에 대한 왜곡된 음성신호의 왜곡 정도를 아래의 수학식 1과 같이 계산한다.
여기서, Cxk cms[i] = Ck x[i] - E{Cx[i]}, Cyk cms[i] = Ck y[i] - E{Cy[i]}이며, Ck x[i], Ck y[i]는 원 음성신호와 왜곡된 음성신호의 k번째 프레임의 i번째 PLP 켑스트럴 계수, E{Cx[i]}, E{Cy[i]}는 원 음성신호와 왜곡된 음성신호의 모든 프레임의 평균 PLP켑스트럴 계수, N은 PLP켑스트럴 차수이다.
이하, 주관적 음질과 객관적 음질과의 상관성 분석을 통한 객관적 음질 평가방법의 성능 비교방법과, 본 발명에 따른 PLP-CMS와 종래 기술에 따른 음질 평가방법인 PSQM및 PLP-CD를 비교설명해 보기로 하자.
먼저, 주관적 음질과 객관적 음질의 상관성 분석은, 객관적 음질 평가 결과로써, 주관적 음질을 예측하기 위하여 아래의 수학식 2의 2차 회귀분석 함수를 사용하였다. 이를 통하여 객관적 음질 평가 결과의 범위를 MOS점수와 동일한 범위를갖도록 하였다.
여기서, x는 객관적 음질 평갇결과이고, y는 객관적 음질 평가 결과로 예측된 MOS값이며, βi는 회귀 분석 계수이다.
또한, 객관적 음질 평가방법의 성능을 평가하기 위하여 실제 MOS값과 상기 수학식 2로 부터 예측된 MOS 값과의 상관계수를 아래의 수학식 3과 같이 이용하였다. 상관 계수의 값이 1이면, 객관적 음질이 주관적 음질을 완벽하게 예측함을 의미한다.
여기서, yia는 평균 MOS값 이고, y와 yi는 예측 및 실제 MOS값이다.
본 발명에 따른 PLP-CMS의 경우 도 9a 및 도 9b와 같이 A세트와 B세트에 대해 각각 0.89와 0.88의 매우 높은 상관관계를 보이고 있다. 즉, 도 9a 및 도 9b는 서로 다른 채널 환경에 대한 본 발명에 따른 심리음향 갭스트럼 평균 차감법을 이용한 음질 평가 결과값과 MOS점수와의 상관관계를 나타낸 도면으로서, 특히 A세트의 상관관계가 PLP-CD의 경우, 도 6a에서와 같이 0.51이었음에 반해 PLP-CMS의 경우 0.89로 비교적 채널 환경이 양호한 B세트의 경우 보다 높다. 이는 PLP-CMS가 심리 음향 모델의 적용이 적절했을 뿐만 아니라 켑스트럴 평균 차감법의 적용으로 채널의 영향을 최소화했음을 알 수 있다.
또한, MOS점수와 PLP-CMS결과의 분포도 도 10a 및 도 10b를 보면, PSQM과 PLP-CD와는 다르게 A세트의 결과와 B세트의 결과가 MOS분포와 같이 거의 동일한 영역에 분포한다.
도 10은 CDMA 음성에 대한 MOS와 PLD-CMS의 분포를 나타낸 도면으로서, 도 10a는 MOS점수와 그 점수의 발생빈도와의 상관관계를 나타낸 도면이고, 도 10b는 본 발명에서 제안한 PLD-CMS의 결과값과 그 값의 발생빈도의 상관관계를 나타낸 도면이다. 특히 PLP-CMS와 PLP-CD를 비교하면, 도 4에서 본 바와 같이 A세트와 B세트의 채널 영향이 서로 달랐음에도 PLP-CMS는 PLP-CD에 비해 켑스트럴 평균 차감법의 적용으로 채널 경로의 영향을 효과적으로 제거함을 알 수 있다.
이렇게 채널 경로가 다른 환경에 대해 고려한 PLP-CMS방법의 A세트와 B세트 모두에 대한 상관도와 상관계수를 보면, 도 11과 같다.
도 11은 각 채널 환경 모두에 대한 CDMA 음성신호의 MOS점수와 PLD-CMS결과값과의 상관관계를 나타낸 도면이다.
도 10으로 부터 예상한 바와 같이 PSQM과 PLP-CD와는 달리 A세트와 B세트의 분포가 이원화되지 않고, 하나의 회귀분석 함수의 곡선을 중심으로 일관되게 분포하며, 이에 따라 PSQM과 PLP-CD는 이 경우 0.59와 0.49로 매우 작은 상관 계수를 보인 반면, PLP-CMS는 0.89의 높은 상관계수를 보이고 있다. 이로 보아 PLP-CMS는 채널 환경이 다른 음성신호에 대해서도 일관된 성능을 갖음을 확인 할 수 있다.
PLP-CMS의 성능을 평가하기 위하여 녹음한 CDMA 시스템의 PCS 음성신호에 대하여 PSQM과 평균 차감법을 이용하지 않은 PLP-CD와 함께 객관적 음질 평가를 수행하여 객관적 음질 평가방법의 성능 지표인 주관적 음질과의 상관 계수를 비교해 보면, 아래의 표 2와 같다.
A B A+B
PSQM 0.79 0.92 0.59
PLP-CD 0.51 0.80 0.49
PLP-CMS 0.89 0.88 0.89
표 2에 도시된 PSQM의 결과를 보면, 서로 다른 채널 환경의 음성신호 A세트와 B세트에 대한 주관적 음질과의 상관관계는 0.79와 0.92로 우수한 성능을 보이고 있다. 그러나, A세트와 B세트 모두에 대한 상관관계는 0.59로 크게 낮아졌음을 알 수 있다.
또한, PLP-CD의 경우를 보면, 채널에 의한 영향을 많이 받는 A세트에 대해 0.51의 상관관계를, 상대적으로 채널에 의한 영향이 적은 B세트에 대해서는 0.80의 상관관계를 보이고 있다. 그리고, 모든 세트에 대한 상관관계는 0.49로 크게 낮은 상관관계를 보임을 알 수 있다. 이는 도 3에서 본 바와 같이 두 방법 모두 채널의 영향을 고려하지 않았기 때문이며, 이로 인해 실제 이동전화 환경에서 이용하기에 적합치 않다는 것을 알 수 있다.
반면, 본 발명에 따른 PLP-CMS의 경우 채널의 영향 정도에 무관하게 각 세트에 대하여 PSQ,과 PLP-CD보다 높거나 유사한 0.89, 0.88의 상관관계를 보이고 있으며, 두 가지 세트 모두에 대해서도 성능의 저하없이 0.89의 상관관계를 유지하고있다. 실제로 PLP-CMS결과의 분포를 보면 각 세트에 대한 분포가 MOS분포와 같이 동일한 영역에 함계 분포하고 있음을 알 수 있다. 이는 채널 환경이 다른 음성 신호에 대하여서는 일관된 성능을 보임을 의미한다.
결국, 실제 이동전화망에서 왜곡된 음성신호중 채널 경로에 의한 영향이 많은 음성신호와 비교적 채널 경로에 의한 영향이 적은 음성신호를 녹음하여 주관적 음질 평가를 수행하였다. 이러한 음성신호에 대해 기존의 대표적 객관적 음질 평가방인 PSQM과 PLP-CD에 대해 성능을 확인한 결과 각각의 채널 경로의 음성신호에 대하여서는 일정이상의 상관관계를 보이나 채널 경로에 대한 구분없이 모든 음성신호에 대해 실험한 결과 채널 경로에 따른 영향으로 인해 심한 성능 저하가 일어나며, 대책이 필요함을 확인하였다.
따라서, 본 발명은 상기한 채널 경로에 따른 영향으로 발생하는 성능 저하문제를 해결하기 위하여 PLP-CMS라는 객관적 음질 평가방법을 제안하였다.
이와 같은 본 발명에 따른 객관적 음질 평가방법인 PLP-CMS는 심리 음향 선형 예측 분석을 이용하여 주관적 음질과의 상관관계를 높였으며, 캡스트럴 평균 차감법을 통하여 채널 경로에 따른 영향과 무관하게 일관된 성능을 갖는다. 이는 실제 CDMA PCS 이동전화 음성신호에 대하여 PLP-CMS 결과와 주관적 음질과의 상관관계로서 확인하였다. 즉, PSQ,과 PLP-CD와 같은 기존의 방법들은 서로 다른 채널 경로를 거친 음성신호에 대한 상관계수가 0.59와 0.49로 크게 낮아졌으나, PLP-CMS는 0.89로 여전히 높은 상관계수를 유지하였다.
이와 같은 본 발명에 따른 음질 평가방법은 이동 전화망의 음질 평가에 적용할 수 있을 뿐 아니라 음성 통신과 관련된 거의 모든 분야에 적용할 수 있다. 대표적인 예로 기존의 시내, 시외 및 국제전화를 포함하는 유선전화망의 음질 평가등에도 실시할 수 있음은 통상의 지식을 가진자라면 누구나 알 수 있는 사실이다.
상술한 바와 같은 본 발명에 따른 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법은, 기존에는 이동전화망의 통화품질을 측정하려면 이동 전화망에서 왜곡된 음성신호에 대하여 최소 25명이 넘는 인원으로 긴 시간동안 주관적 음질 평가를 수행하여야 그 결과에 대해 신뢰할 수 있었다. 이러한 방법은 많은 사람들을 동원하여 긴 시간동안 실시하여야 하기 때문에 많은 비용과 시간이 소요될 뿐 아니라 이로 인해 다양한 경우에 대해 반복하여 실시할 수 없고 또 사람의 주관적 느낌에 따른 결과이기 때문에 그 신뢰성에도 의문을 제기할 수 있다. 그러나, 본 발명에 따른 PLP-CMS 방법을 이용하여 음질 평가를 수행할 경우 저렴한 비용으로 짧은 시간안에 음질 평가를 수행할 있을 뿐 아니라 다양한 환경에 대해 반복해서 음질 평가를 실시하여도 신뢰도가 높은 결과를 얻을 수 있는 이점이 있다.
이러한 기술을 이동 전화 서비스 사업자를 비롯한 여러 전화 사업자가 사용할 경우 그 시스템의 관리 비용을 크게 줄일 수 있으며, 그 업무 또한 간단하게 수행할 수 있기 때문에 경제적인 효과를 기대할 수 있다.

Claims (6)

  1. 입력되는 원음성과 CDMA와 PSTN 채널을 통한 왜곡된 음성신호의 상호 상관으로 지연시간을 측정하는 단계와;
    상기 측정한 지연시간을 이용하여 입력되는 원음성과 왜곡된 음성신호를 동기화시키는 단계와;
    입력되는 원 음성신호와 상기 동기화된 왜곡된 음성신호 스펙트럼 각각에 인간의 청각적 특성을 반영하여 심리 음향 선형 예측을 분석하는 단계와;
    상기 원음성과 왜곡된 음성신호에 대해 각각 심리 음향 선형 예측 분석이 완료되면, 원음성과 왜곡된 음성신호 전구간에 걸쳐 영향을 주고 있는 채널에 의한 영향을 켑스트럴 평균 차감을 이용하여 제거하는 단계와;
    원음성과 왜곡된 음성신호의 심리 음향 켑스트럴 거리를 계산하여 입력된 음성의 왜곡정보를 측정하는 단계로 이루어짐을 특징으로 하는 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법.
  2. 제 1 항에 있어서,
    상기 지연시간의 측정은 음성신호의 포락선을 이용하여 넓은 영역에 대해 낮은 분해능으로 대체적인 지연시간을 계산하는 것을 특징으로 하는 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법.
  3. 제 1 항에 있어서,
    상기 지연시간은 시간 영역에서 원음성과 왜곡된 음성신호간의 전 구간 상호 상관관계를 이용하여 세밀한 지연시간을 계산하는 것을 특징으로 하는 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법.
  4. 제 1 항에 있어서,
    상기 원음성과 왜곡된 음성신호의 심리 음향 켑스트럴 거리를 계산하여 입력된 음성의 왜곡정보를 측정하는 단계에서 켑스트럴 거리의 계산은 아래의 수학식을 이용하는 것을 특징으로 하는 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법.
    여기서, Cxk cms[i] = Ck x[i] - E{Cx[i]}, Cyk cms[i] = Ck y[i] - E{Cy[i]}이며, Ck x[i], Ck y[i]는 원 음성신호와 왜곡된 음성신호의 k번째 프레임의 i번째 PLP 켑스트럴 계수, E{Cx[i]}, E{Cy[i]}는 원 음성신호와 왜곡된 음성신호의 모든 프레임의 평균 PLP켑스트럴 계수, N은 PLP켑스트럴 차수이다.
  5. 제 1 항에 있어서,
    상기 켑스트럴 평균 차감방법은 원음성과 왜곡된 음성신호간의 거리측정 인자로 인간의 청각적 특성을 고려한 스펙트럼 포락선을 표현하는 PLP 켑스트럴 계수를 이용하는 것을 특징으로 하는 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법.
  6. 제 5 항에 있어서,
    상기 PLP 켑스트럴 계수는 거리 측정 계산에 용이한 Euclidean Distance방법을 이용하는 것을 특징으로 하는 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신 시스템에서의 음질 평가방법.
KR1020000003476A 2000-01-25 2000-01-25 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법 KR100333049B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000003476A KR100333049B1 (ko) 2000-01-25 2000-01-25 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000003476A KR100333049B1 (ko) 2000-01-25 2000-01-25 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법

Publications (2)

Publication Number Publication Date
KR20010074412A KR20010074412A (ko) 2001-08-04
KR100333049B1 true KR100333049B1 (ko) 2002-04-22

Family

ID=19641290

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000003476A KR100333049B1 (ko) 2000-01-25 2000-01-25 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법

Country Status (1)

Country Link
KR (1) KR100333049B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103474083A (zh) * 2013-09-18 2013-12-25 中国人民解放军电子工程学院 基于正交正弦脉冲序列定位标签的语音时间规整方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100729555B1 (ko) * 2005-10-31 2007-06-19 연세대학교 산학협력단 음성 품질의 객관적인 평가방법
KR101460492B1 (ko) * 2013-09-11 2014-11-20 주식회사 이노와이어리스 Mos 측정 장비 검증 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0990990A (ja) * 1995-09-25 1997-04-04 Kokusai Denshin Denwa Co Ltd <Kdd> 音声認識のための音響分析方法および装置
JPH1185200A (ja) * 1997-09-12 1999-03-30 Kokusai Denshin Denwa Co Ltd <Kdd> 音声認識のための音響分析方法
KR19990036857A (ko) * 1997-10-03 1999-05-25 모리시타 요이찌 오디오 신호 압축 방법, 오디오 신호 압축 장치, 음성 신호 압축 방법, 음성 신호 압축 장치, 음성 인식 방법 및 음성 인식장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0990990A (ja) * 1995-09-25 1997-04-04 Kokusai Denshin Denwa Co Ltd <Kdd> 音声認識のための音響分析方法および装置
JPH1185200A (ja) * 1997-09-12 1999-03-30 Kokusai Denshin Denwa Co Ltd <Kdd> 音声認識のための音響分析方法
KR19990036857A (ko) * 1997-10-03 1999-05-25 모리시타 요이찌 오디오 신호 압축 방법, 오디오 신호 압축 장치, 음성 신호 압축 방법, 음성 신호 압축 장치, 음성 인식 방법 및 음성 인식장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103474083A (zh) * 2013-09-18 2013-12-25 中国人民解放军电子工程学院 基于正交正弦脉冲序列定位标签的语音时间规整方法

Also Published As

Publication number Publication date
KR20010074412A (ko) 2001-08-04

Similar Documents

Publication Publication Date Title
Hines et al. ViSQOL: an objective speech quality model
Rix et al. Perceptual evaluation of speech quality (PESQ)-a new method for speech quality assessment of telephone networks and codecs
Voran Objective estimation of perceived speech quality. i. development of the measuring normalizing block technique
Yang Enhanced modified bark spectral distortion (EMBSD): An objective speech quality measure based on audible distortion and cognition model
Thorpe et al. Performance of current perceptual objective speech quality measures
JP3964456B2 (ja) 電気通信装置の客観的音声品質測定の方法および装置
Rix Perceptual speech quality assessment-a review
KR101430321B1 (ko) 오디오 시스템의 지각 품질을 결정하기 위한 방법 및 시스템
Rix et al. PESQ-the new ITU standard for end-to-end speech quality assessment
US7313517B2 (en) Method and system for speech quality prediction of an audio transmission system
Guéguin et al. On the evaluation of the conversational speech quality in telecommunications
US7315812B2 (en) Method for determining the quality of a speech signal
Ding et al. Non-intrusive single-ended speech quality assessment in VoIP
KR100333049B1 (ko) 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법
Lin et al. A composite objective measure on subjective evaluation of speech enhancement algorithms
Ding et al. Measurement of the effects of temporal clipping on speech quality
Reimes et al. The relative approach algorithm and its applications in new perceptual models for noisy speech and echo performance
Kim A cue for objective speech quality estimation in temporal envelope representations
Gierlich et al. Advanced speech quality testing of modern telecommunication equipment: An overview
KR100347752B1 (ko) 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법
Möller Telephone transmission impact on synthesized speech: quality assessment and prediction
Goldstein et al. Perceptual speech quality assessment in acoustic and binaural applications
Ghimire Speech intelligibility measurement on the basis of ITU-T Recommendation P. 863
Kitawaki et al. Objective quality assessment of wideband speech coding
Voran Estimation of speech intelligibility and quality

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070330

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee