KR100347752B1 - 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법 - Google Patents

이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법 Download PDF

Info

Publication number
KR100347752B1
KR100347752B1 KR1020000003478A KR20000003478A KR100347752B1 KR 100347752 B1 KR100347752 B1 KR 100347752B1 KR 1020000003478 A KR1020000003478 A KR 1020000003478A KR 20000003478 A KR20000003478 A KR 20000003478A KR 100347752 B1 KR100347752 B1 KR 100347752B1
Authority
KR
South Korea
Prior art keywords
bark
signal
sound quality
spectrum
speech
Prior art date
Application number
KR1020000003478A
Other languages
English (en)
Other versions
KR20010076069A (ko
Inventor
윤대희
윤종진
박상욱
Original Assignee
주식회사 하이닉스반도체
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 하이닉스반도체 filed Critical 주식회사 하이닉스반도체
Priority to KR1020000003478A priority Critical patent/KR100347752B1/ko
Publication of KR20010076069A publication Critical patent/KR20010076069A/ko
Application granted granted Critical
Publication of KR100347752B1 publication Critical patent/KR100347752B1/ko

Links

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B53/00Golf clubs
    • A63B53/04Heads
    • A63B53/06Heads adjustable
    • A63B53/065Heads adjustable for putters
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B53/00Golf clubs
    • A63B53/007Putters
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B53/00Golf clubs
    • A63B53/04Heads
    • A63B53/0441Heads with visual indicators for aligning the golf club
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B60/00Details or accessories of golf clubs, bats, rackets or the like
    • A63B60/02Ballast means for adjusting the centre of mass
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B53/00Golf clubs
    • A63B53/04Heads
    • A63B2053/0491Heads with added weights, e.g. changeable, replaceable
    • A63B2053/0495Heads with added weights, e.g. changeable, replaceable moving on impact, slidable, spring or otherwise elastically biased

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

본 발명은 인간의 청각적 특징을 반영하여 바크 코히어런스 함수(Bark Coherence Function)를 정의하고, 이를 이용하여 주관적 음질과 상관 관계가 높은 객관적 음질 평가가 가능토록 한 이동통신 시스템에서 객관적 음질 평가장치 및 그 방법에 관한 것으로서, 이러한 본 발명은, 셀룰러 시스템으로 입력되는 음성 신호의 바크 스펙트럼을 산출하고, 상기 셀룰러 시스템에서 출력되는 음성 신호의 바크 스펙트럼을 산출하며, 상기 입력 및 출력 음성 신호의 상호 바크 스펙트럼을 산출한다. 그런 후 산출한 두 개의 바크 스펙트럼과 상호 바크 스펙트럼을 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 계산하고, 계산된 결과치를 바크 잡음 대 신호비로 변환하여 얻어진 결과치를 객관적 음질 평가치로 출력한다.

Description

이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법{Apparatus and Method for objective speech quality measure in a Mobile Communication System}
본 발명은 이동통신 시스템에서 객관적 음질 평가(objective speech quality measure)에 관한 것으로, 특히 인간의 청각적 특징을 반영하여 바크 코히어런스 함수(Bark Coherence Function)를 정의하고, 이를 이용하여 주관적 음질과 상관 관계가 높은 객관적 음질 평가가 가능토록 한 이동통신 시스템에서 객관적 음질 평가장치 및 그 방법에 관한 것이다.
시간과 장소에 구애받지 않고 자유로운 통신을 하고자하는 인간의 욕구에 부합하여 최근 몇 년간 이동 전화가 널리 보편화되었다. 이러한 이동 전화의 품질을 결정하는 가장 중요한 요소는 통화 성공률과 통화 품질이며, 특히 통화 품질, 즉 음질은 사용자의 청각에 따른 주관에 의해 결정된다. 그러므로 이동 전화망의 설치 및 유지, 보수를 위해서는 지속적인 음질 평가가 반드시 필요하다.
현재 이동 전화망을 통해 전송되는 음성 신호는 음성 부호화기로 압축된 디지털 신호들로 표현되며, 이 신호들이 재생되는 음성 신호의 음질에서 차지하는 중요도는 크게 차이가 있다. 따라서 이동 전화망의 음질은 음성 신호의 특성을 고려한 방법으로 평가하여야 한다.
음질 평가는 기본적으로 여러 사용자의 반복 청취실험을 통한 주관적 음질 평가 방법에 의해 이루어질 수 있다. 그러나 이 방법은 이용자의 체감 음질과 직접적인 관계가 있다는 장점에도 불구하고, 다양한 환경에서 반복해서 수행하기에는 많은 시간과 노력 및 비용이 소모되므로 적합하지 않다. 따라서 주관적 음질과 상관 관계가 높은 객관적 척도로 주관적 음질을 예측하는 것이 바람직하다.
한편, 음질 평가는 평가하고자 하는 음성 신호를 음질 평가 실험자가 직접 듣고 주관적 판단에 따라 음질을 평가하는 주관적 음질 평가 방법과 계산에 의한 원 음성 신호와 왜곡 음성 신호의 대수적 차이를 이용하는 객관적 음질 평가 방법이 있다.
먼저, 주관적 음질 평가 방법은, 양방향 청취에 의한 대화식 평가법과 단방향 청취에 의한 청취법으로 대별된다. 이중 대화식 평가법은 완벽한 통신 시스템이 완성된 단계에서만이 이루어질 수 있으며, 음성 부호화기의 개발 단계나 이동 전화망의 설치 단계 등에서는 적용이 불가능하다. 따라서 수행이 용이한 청취식 평가법이 보편적으로 사용된다.
청취식 평가법에는 왜곡된 음성 신호만을 듣고 평가를 내리는 절대 음질 평가법(ACR : Absolute Category Rating), 원 음성 신호와 왜곡된 음성 신호를 듣고왜곡 정도를 평가하는 왜곡 음질 평가법(DCR : Degradation Category Rating)과 두 개의 왜곡된 음성 신호를 듣고 비교하는 비교 음질 평가법(CCR : Comparison Category Rating)이 있다.
그 중에서 실제 전화 이용 환경과 가장 유사하게 비교 음성 신호 없이 음질 평가를 실시하는 절대 음질 평가법은, MOS(Mean Opinion Score) 평가방법을 이용한다. 상기 MOS 평가방법은 실험자가 왜곡된 음성 신호를 들은 후 음성 신호의 왜곡 정도를 아래의 [표1]과 같이 5단계로 평가하는 방법이다.
MOS 평가 등급
Rate Speech Quality Level of Distortion
5 Excellent Imperceptible
4 Good Just perceptible but not annoying
3 Fair Perceptible and slightly
2 Poor Annoying but not objetionable
1 Bad Very annoying and objectionable
그러나 이러한 주관적 음질 평가 방법은 주지한 바와 같이, 사람에 의해서 직접적으로 평가되므로 실제 사용자의 체감 음질을 가장 잘 표현할 수 있다는 장점이 있는 반면에, 시간과 비용이 많이 소요되는 단점이 있다.
이러한 주관적 음질 평가 방법의 단점을 개선하기 위해서, 근래 각광받고 있는 음질 평가 방법이 객관적 음질 평가 방법이다.
객관적 음질 평가 방법은, 평가가 이루어지는 영역에 따라 시간 영역에서의 평가, 주파수 영역에서의 평가 및 심리 음향 영역에서의 평가로 분류할 수 있다.
먼저 시간 영역에서의 객관적 음질 평가는 신호 대 잡음비(SNR : Signal toNoise Ratio), 구간별 신호대 잡음비(SegSNR : Segmental SNR)가 있다. 이 방법들은 원 음성 신호와 왜곡된 음성 신호간의 자승 평균 오차를 이용하는 방법으로, 32Kbps이상의 전송률을 갖는 파형 부호화기의 성능 평가에 적합하다.
주파수 영역에서의 객관적 음질 평가는 스펙트랄 거리(SD : Spectral Distance), 대수적 스펙트랄 거리(LSD : Log Spectral Distance) 등이 있다. 이러한 방법 중 LPC-CD는 음성 신호의 포락선 성분의 차이를 계산하며, 16 ~ 32 Kbps의 전송률을 갖는 음성 부호화기의 성능 평가에 적합하다.
심리 음향 영역에서의 객관적 음질 평가는 원 음성 신호와 왜곡된 음성 신호에 인간의 청각적 특성을 반영한 심리 음향 모델을 이용하여 두 음성 신호의 왜곡정도를 측정하는 방법으로, BSD(Bark Spectral Distortion), PLP-CD(Perceptual Linear Predictive-Cepstum Distance), MNB(Measuring Normalizing Blocks), PSQM(Perceptual Speech Quality Measure) 등이 있다. 특히 PSQM과 MNB는 ITU-T의 권고안으로 PSQM은 4Kbps 이상의 음성 부호화기의 성능 평가에, MNB는 비트 에러, 프레임 삭제가 발생하는 음성 부호화기의 성능 평가에 적합하다.
상기 심리 음향 영역에서의 객관적 음질 평가 방법중 PSQM, MNB를 좀 더 구체적으로 살펴 보면, ITU-T(International Telecommunication Union - Teeelecommunication)에서는 개관적 음질 평가법으로 Rec.P.861에서 PSQM을, Rec.P.861 Appendix Ⅱ에서 MNB를 권고하고 있다. 상기 PSQM은 4kbps이상 CELPCode Excited Linear Prediction) 음성 부호화기의 객관적 음질 평가에 적당하며, MNB는 음성 부호화기 음성 패킷의 프레임 삭제와 ATM(Asynchronous Transfer Mode)의 셀손실 등이 발생할 때 적당하다. PSQM과 MNB는 원음과 왜곡음 스펙트럼을 인간의 청각적 특성을 이용하여 심리 음향 영역으로 천이 시킨 후 그 차이로서 음성이 왜곡된 정도를 나타낸다.
두 방법은 모두 음성 부호화기를 대상으로 개발되었으므로 실제 이동 전화나 패킷 음성 전송 시스템의 음질을 평가할 때 성능이 저하된다. 실제 음성 전달 시스템은 디지털 시스템과 더불어 아날로그 시스템으로 이루어진다. 유선 전화 등의 아날로그 시스템은 선형왜곡을 일으키는데, 이것은 주관적 음질에는 영향을 거의 주지 않으나, 객관적 음질에는 영향을 미쳐 객관적 음질평가 시스템의 성능을 저하시킨다.
첨부한 도면 도 1은 CDMA PCS 시스템을 통과한 음성의 MOS와 PSQM의 분포를 나타낸 도면으로, 도 1a는 MOS 분포도이고, 도 1b는 PSQM 분포도이다.
각 음성 데이터는 A군과 B군의 두 군으로 나뉘어 지는데, 이 두 군중 A 군은 사설 교환기를 거쳐 저주파 영역이 약간 감소되는 특성을 가진 음성들로 이루어져 있다. 두 군의 MOS 분포도가 서로 비슷함으로 보아 서로 통과 대역이 다른 아날로그 시스템을 통과한 음성들이 비슷한 음질을 지니고 있음을 알 수 있다.
그러나 주관적 음질과 상관 관계가 높다고 알려진 객관적 음질 평가 척도인 PSQM은 스펙트럼의 차이를 구하므로 저주파 영역에서 스펙트럼 거리가 많아져, 서로 다른 분포를 보인다. A군의 데이터로 회귀분석을 하여 B군의 데이터를 평가한다면 일치된 결과를 얻을 수 없다. 예를 들어, A군에서 PSQM값이 4.5로 비교적 작아 음질이 양호하다고 생각되는 음성을 B군에서 훈련된 회귀 함수로 주관적 음질을 예측하게 되면, B군에서는 4.5의 값이 음질이 나쁜 영역에 속하게 되므로 잘못된 예측을 하게 된다.
따라서 본 발명은 상기와 같은 종래 객관적 음질 평가시 발생하는 제반 문제점을 해결하기 위해서 제안된 것으로서,
본 발명의 목적은, 인간의 청각적 특징을 반영하여 바크 코히어런스 함수(Bark Coherence Function)를 정의하고, 이를 이용하여 주관적 음질과 상관 관계가 높은 객관적 음질 평가가 가능토록 한 이동통신 시스템에서 객관적 음질 평가장치 및 그 방법을 제공하는 데 있다.
상기와 같은 목적을 달성하기 위한 본 발명은,
아날로그 시스템에서 발생하는 선형 왜곡의 영향을 극복하기 위하여 바크 코히어런스 함수(BCF : Bark Coherence Function)를 정의하고, 셀룰러 시스템의 입력 신호와 출력 신호 각각에 대해서 바크 스펙트럼과 상호 바크 스펙트럼을 구한 후, 상기 바크 코히어런스 함수에 상기 바크 스펙트럼과 상호 바크 스펙트럼을 적용하여 바크 코히어런스 함수를 구한다. 그런 후 얻어진 결과치를 바크 신호 대 잡음비로 변환하여 음질 평가치를 산출함으로써, 선형왜곡의 영향을 극복할 수 있으며, 주관적 음질과 상관 관계가 높은 객관적 음질 평가가 가능하다.
도 1은 종래 CDMA PCS 시스템을 통과한 음성의 MOS와 PSQM의 분포를 나타낸 도면으로서, 도 1a는 MOS의 분포도이고, 도 1b는 PSQM의 분포도이며,
도 2는 본 발명에 의한 이동통신 시스템에서 객관적 음질 평가 장치를 보인 블록도이고,
도 3은 본 발명에 의한 이동통신 시스템에서 객관적 음질 평가 방법을 보인 흐름도이고,
도 4는 도 3의 음성 신호의 바크 스펙트럼 산출과정을 보인 흐름도이고,
도 5는 도 3의 음성 신호의 상호 바크 스펙트럼 산출과정을 보인 흐름도이고,
도 6은 본 발명에 적용된 심리 가중 필터의 특성도이고,
도 7은 본 발명에 의한 BCF 분포와 종래 MOS 분포를 비교한 도면으로써, 도 7a는 종래 MOS 분포도이고, 도 7b는 본 발명에 의한 BCF 분포도이고,
도 8은 종래 객관적 음질 평가 방법에 적용된 PSQM의 상관 계수와 본 발명에 의한 BCF의 상관 계수를 비교한 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
10 : 셀룰러 시스템
20, 30 : 제 1 및 제 2 바크 스펙트럼 산출부
40 : 상호 바크 스펙트럼 산출부
50 : 바크 코히어런스 함수 계산부
60 : 바크 잡음 대 신호비 계산부
이하 상기와 같은 기술적 사상에 따른 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다.
일반적으로, Magnitude-Squared Coherence(MSC)는 주파수 영역에서 두 신호간의 상관 관계를 나타내며 아래의 [수학식1]과 같이 정의된다.
여기서 Sxy(f)는 입력 음성 신호 x(n)과 출력 음성 신호 y(n) 사이의 상호 스펙트럼, Sxx(f)와 Syy(f)는 각각 입력 음성 신호 x(n)과 출력 음성 신호 y(n)의 오토 스펙트럼이다. 잡음이 없는 이상적인 환경에서는 1의 값을 가지며, 반대로 잡음만이 존재하는 경우 MSC는 0값을 갖는다. 이러한 MSC는 객관적 음질 평가, 시스템 확인 및 응답, 전달 경로 추정, 지연 측정 등의 다양한 분야에 사용된다.
심리 음향을 사용하면 물리적인 소리의 세기와는 달리 인간이 귀에서 직접 느끼는 소리 영역에서 MSC를 사용할 수 있다. 심리 음향 영역에서 정의하는 MSC인 BCF는 인간의 심리 음향 특성인, 임계 대역 스펙트럼 분해능(Critical-band spectral resolution), 등감 곡선 보정(Equal-loudness preemphasis), 주관적 소리세기(Intensity-loudness power law) 특성을 이용한다.
즉, 잡음에 의해서 톤이 마스킹되는 마스킹 특성을 반영한 것이 임계대역 스펙트럼 분해능이다. 임계 대역 필터는 비선형적인 바크 주파수에 따라 로그 스케일로 증가하는 통과 대역 폭을 갖는 여러 개의 필터로 이루어진다. 인간의 귀는 각 주파수에 따라 민감도가 틀리다. 즉, 인간의 주파수 분해능은 고주파 영역 보다 저주파 영역에 민감하다. 예를 들어, 100Hz의 톤이 1000Hz톤과 같은 크기로 들리려면 35dB 더 큰 세기(intensity)를 가져야 한다. 이러한 특성은 등감 곡선으로 이미 잘 알려져 있으며 이를 이용한 것이 상기 등감 곡선 보정이다. 등감 곡선 보정후 소리의 세기는 폰(Phone)으로 표현되는 데, 이는 1Khz의 톤과 같은 크기로 들리도록 보정되었음을 의미한다. 그리고 주관적 소리 보정은 청각 세기의 비선형성을 반영한다. 이것은 두 배의 크기로 느끼기 위해 필요한 소리 세기가 폰 단위에서 항상 일정하지 않고, 세기 레벨(loudness level)에 따라 달라짐을 나타낸다. 폰 단위는 실제적인 주관적 세기 레벨을 의미하는 손(sone) 단위로 변환되어진다. 이러한 세가지 특성을 이용하여 음성의 스펙트럼을 변환시킨 것이 바크 스펙트럼이다.
본 발명은 상기와 같은 일반적인 바크 스펙트럼 함수를 정의하고 이를 이용하여 객관적 음질 평가를 위한 음질 평가치를 추출한다.
<실시예1>
첨부한 도면 도 2는 본 발명에 의한 객관적 음질 평가 장치의 구성을 보인 블록도이다.
여기서, 참조부호 10은 실험용 셀룰러 시스템을 나타내고, 참조부호 20은 상기 셀룰러 시스템(10)에 입력되는 음성 신호의 바크 스펙트럼을 구하는 제 1 바크 스펙트럼 산출부를 나타내고, 참조부호 30은 상기 셀룰러 시스템(10)에서 출력되는 음성 신호의 바크 스펙트럼을 구하는 제 2 바크 스펙트럼 산출부를 나타내고, 참조부호 40은 상기 셀룰러 시스템(10)으로 입력되는 음성 신호와 상기 셀룰러 시스템(10)에서 출력되는 음성 신호의 상호 바크 스펙트럼을 구하는 상호 바크 스펙트럼 산출부를 나타내며, 참조부호 50은 상기 제 1 및 제2 바크 스펙트럼 산출부(20)(30)에서 얻어지는 각각의 바크 스펙트럼과 상기 상호 바크 스펙트럼 산출부(40)에서 얻어지는 상호 바크 스펙트럼을 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 계산하는 바크 코히어런스 함수 계산부를 나타내고, 참조부호 60은 상기 바크 코히어런스 함수 계산부(50)에서 출력되는 신호를 바크 잡음 대 신호비로 변환하여 그 결과치를 객관적 음질 평가치로 출력하는 바크 잡음 대 신호비 계산부를 나타낸다.
이와 같이 구성되는 본 발명에 의한 이동통신 시스템에서 객관적 음질 평가 장치는, 먼저 셀룰러 시스템(10)은 입력되는 음성 신호(x(n))를 일반적인 음성 처리 방법과 동일한 방법으로 처리한 후 출력하게 된다. 여기서 출력되는 음성 신호(y(n))는 선형 왜곡된 음성 신호이다.
다음으로, 제 1 바크 스펙트럼 산출부(20)는 상기 셀룰러 시스템(10)으로 입력되는 음성 신호(x(n))의 바크 스펙트럼을 산출한다. 즉, 입력 신호에 윈도우 함수를 씌우고, 그 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하고, 그 후 음성의 파워 스펙트럼을 구한다. 그리고 구해진 파워 스펙트럼을 심리 가중 필터로 필터링한다. 여기서 심리 가중 필터링은 도 6과 같은 주파수 영역의 심리 가중 필터의 가중 합으로 구한다. 그리고 심리 가중 필터는 인간의 심리 음향 특성중 임계 대역 스펙트럼 분해능과 등감 곡선 보정의 특성을 고려한 것이다. 이렇게 해서 얻어지는 신호의 주관적 소리 세기를 보정한 후 그 결과치를 입력 음성 신호에 대한 바크 스펙트럼(Lxx(i))으로 출력한다. 여기서 계산 결과인 바크 스펙트럼은 인간의 청각영역에서 느끼는 음성의 스펙트럼을 의미한다.
아울러, 제 2 바크 스펙트럼 산출부(30)는 상기 셀룰러 시스템(10)에서 출력되는 음성 신호(y(n))의 바크 스펙트럼을 산출한다. 즉, 출력 음성 신호에 윈도우 함수를 씌우고, 그 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하고, 그 후 음성의 파워 스펙트럼을 구한다. 그리고 구해진 파워 스펙트럼을 심리 가중 필터로 필터링한다. 그렇게 해서 얻어지는 신호의 주관적 소리 세기를 보정한 후 그 결과치를 출력 음성 신호에 대한 바크 스펙트럼(Lyy(i))으로 출력한다.
또한, 상호 바크 스펙트럼 산출부(40)는 상기 입력 음성 신호(x(n))와 출력 음성 신호(y(n))의 상호 바크 스펙트럼을 산출한다. 즉, 두 입력 신호[x(n),y(n)]에 각각 윈도우 함수를 씌우고, 그 윈도우 함수내의 신호를 각각 고속 푸리에 변환한다. 그런 후 두 음성 신호의 상호 파워 스펙트럼을 구한다. 이후 얻어진 신호를 심리 가중 필터로 필터링하고, 이후 필터링된 신호의 주관적 소리 세기를 보정한 후 그 결과치를 상호 바크 스펙트럼(Lxy(i))으로 출력한다.
이에 따라 바크 코히어런스 함수 계산부(50)는 상기 제 1 및 제 2 바크 스펙트럼 산출부(20)(30)에서 각각 출력되는 바크 스펙트럼(Lxx(i), Lyy(i))과 상기 상호 바크 스펙트럼 산출부(40)에서 출력되는 상호 바크 스펙트럼(Lxy(i))을 아래와 같은[수학식2], 즉 바크 코히어런스 함수(BCF(i))에 대입하여 바크 코히어런스 함수를 구하게 된다.
여기서 i는 바크 주파수를 의미한다.
다음으로, 바크 잡음 대 신호비 계산부(60)는 상기 바크 코히어런스 함수 게산부(50)에서 얻어지는 결과치를 사용하여 바크 잡음 대 신호비(Bark Distortion to Signal Ratio : BDSR)를 구하고, 그 결과치를 객관적 음질 평가치로 출력한다.
여기서, BDSR은 심리 음향에서 원음에 대한 왜곡음의 왜곡정도를 나타내며, 아래의 [수학식3]과 같다.
도 7은 본 발명에 의한 BCF 분포와 종래 MOS 분포를 비교한 도면으로써, 도 7a는 종래 MOS 분포도이고, 도 7b는 본 발명에 의한 BCF 분포도이다. 도 1과는 달리 서로 특성이 다른 PSTN 채널을 통과한 A군과 B군의 BCF값의 분포가 서로 비슷함을 알 수 있다. 즉, BCF에는 심리 음향 영역에서 MSC를 이용하므로, 평균 유클리디언 거리를 이용하는 기존의 다른 객관적 음질평가와는 달리 주관적 음질에 영향을 주지 않는 아날로그 시스템의 영향을 받지 않는다.
도 8은 종래 객관적 음질 평가 방법에 적용된 PSQM의 상관 계수와 본 발명에 의한 BCF의 상관 계수를 비교한 도면이다.
제안된 BCF의 성능을 평가하기 위하여 도 1에서 사용된 음성 데이터와 회귀분석을 하였다. 객관적 음질 평가의 성능은 실제 주관적 음질평가 결과와 예측된 주관적 음질과의 피어슨 상관계수로 평가된다.
ITU-T 표준안인 PSQM의 경우 A군과 B군에 대해서 개별적으로는 높은 상관계수값을 가지나 A군과 B군에 섞이는 경우 매우 낮은 상관계수 값을 갖는다. BCF는 선형왜곡의 영향을 받지 않으므로 모든 경우에 대하여 높은 상관계수 값을 갖는다. 그러므로 BCF가 셀룰러 시스템을 통과한 실제 데이터의 음질을 평가하는 데 적합함을 알 수 있다.
<실시예2>
첨부한 도면 도 3은 본 발명에 의한 이동통신 시스템에서 객관적 음질 평가 방법을 보인 흐름도이다.
이에 도시된 바와 같이, 입력 음성 신호의 바크 스펙트럼을 산출하는 단계(S10)와, 출력 음성 신호의 바크 스펙트럼을 산출하는 단계(S20)와, 상기 입력 및 출력 음성 신호의 상호 바크 스펙트럼을 산출하는 단계(S30)와, 상기 산출한 두 개의 바크 스펙트럼과 상호 바크 스펙트럼을 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 구하는 단계(S40)와, 상기 단계(S40)에서 구해진 결과치를 바크 잡음 대 신호비로 변환하여 얻어진 결과치를 객관적 음질 평가치로 출력하는 단계(S50)로 이루어진다.
이와 같이 이루어지는 객관적 음질 평가 방법은, 먼저 단계 S10에서 셀룰러 시스템으로 입력되는 음성 신호의 바크 스펙트럼을 산출한다. 여기서 입력되는 음성 신호의 바크 스펙트럼 산출은, 도 4에 도시된 바와 같이 단계 S11에서 입력 음성신호에 윈도우 함수를 씌우고, 단계 S12에서 상기 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하여 음성의 파워 스펙트럼을 구한다. 그리고 단계 S13에서 상기 음성의 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하고, 단계 S14에서 라우디니스 보정을 통하여 최종적인 입력 음성 신호의 바크 스펙트럼을 산출한다.
다음으로, 단계 S12에서 상기 셀룰러 시스템에서 출력되는 왜곡된 출력 음성 신호의 바크 스펙트럼을 산출한다. 여기서 출력되는 음성신호의 바크 스펙트럼 산출은 도 4에 도시된 입력 음성 신호의 바크 스펙트럼 산출과 동일한 방법으로 출력 음성 신호의 바크 스펙트럼을 산출한다. 즉, 출력 음성신호에 윈도우 함수를 씌우고, 상기 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하여 음성의 파워 스펙트럼을 구한다. 그리고 구해진 음성의 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하고, 라우디니스 보정을 통하여 최종적인 출력 음성 신호의 바크 스펙트럼을 산출한다.
다음으로, 단계 S30에서 상기 입력 음성 신호 및 출력 음성 신호의 상호 바크 스펙트럼을 산출한다. 즉, 도 5에 도시된 바와 같이 상호 바크 스펙트럼 산출은, 단계 S31에서 상기 두 신호에 각각 윈도우 함수를 씌우고, 단계 S32에서 상기 윈도우 함수내의 신호를 고속 푸리에 변환한 후 음성의 상호 파워 스펙트럼을 구한다. 그리고 단계 S33에서 심리 가중 필터링을 수행하여 객관적 라우디니스 영역으로 변환하고, 단계 S34에서 주관적 소리 세기 보정을 통하여 최종적인 입력 및 출력 음성 신호의 상호 바크 스펙트럼을 산출한다.
다음으로, 단계 S40에서 상기 산출한 두 개의 바크 스펙트럼과 상호 바크 스펙트럼을 주지한 [수학식2]인 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 계산하고, 단계 S50에서 상기 계산하여 얻어진 결과치를 바크 잡음 대 신호비로 변환하여 음질 평가치를 출력한다.
이상에서 상술한 본 발명 " 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법"에 따르면, 아날로그 환경에 상관없이 주관적 음질과 높은 상관관계를 가지는 객관적 음질 평가가 가능한 이점이 있으며, 아울러 시스템 구축 및 고객만족을 위한 서비스 제공을 위해 계속적인 음질평가가 필요한 부분에 적용할 경우 정확한 음질 평가가 가능할 뿐만 아니라 음질 평가에 소요되는 시간 및 비용을 절감할 수 있는 이점이 있다.

Claims (12)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 이동통신 시스템에서 객관적 음질 평가 방법에 있어서,
    입력 음성신호에 윈도우 함수를 씌우는 단계, 상기 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하고 음성의 파워 스펙트럼을 구하는 단계, 상기 음성의 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하는 단계, 상기 심리 가중 필터링이 수행된 신호를 라우디니스 보정하는 단계를 수행하여 최종적인 입력 음성 신호의 바크 스펙트럼을 산출하는 제 1 과정과;
    출력 음성신호에 윈도우 함수를 씌우는 단계, 상기 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하고 음성의 파워 스펙트럼을 구하는 단계, 상기 음성의 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하는 단계, 상기 심리 가중 필터링이 수행된 신호를 라우디니스 보정하는 단계를 수행하여 최종적인 출력 음성 신호의 바크 스펙트럼을 산출하는 제 2 과정과;
    상기 입력/출력 음성 신호에 각각 윈도우 함수를 씌우는 단계, 상기 윈도우 함수내의 신호를 고속 푸리에 변환한 후 음성의 상호 파워 스펙트럼을 구하는 단계, 상기 음성의 상호 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하는 단계, 상기 심리 가중 필터링이 수행된 신호를 라우디니스 보정하는 단계를 수행하여 최종적인 입력 및 출력 음성 신호의 상호 바크 스펙트럼을 산출하는 제 3 과정과;
    상기 산출한 두 개의 바크 스펙트럼과 상호 바크 스펙트럼을 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 구하는 제 4 과정과;
    상기 제 4 과정에서 구해진 결과치를 바크 잡음 대 신호비로 변환하여 얻어진 결과치를 객관적 음질 평가치로 출력하는 제 5 과정을 포함하여 이루어짐을 특징으로 하는 이동통신 시스템에서 객관적 음질 평가 방법.
  8. 삭제
  9. 삭제
  10. 삭제
  11. 제 7 항에 있어서, 상기 제 4 과정의 바크 코히어런스 함수 계산은, 상기 제 1 및 제 2 과정에서 얻어지는 각각의 바크 스펙트럼과 상기 제 3 과정에서 얻어지는 상호 바크 스펙트럼을 아래의 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 계산하는 것을 특징으로 하는 이동통신 시스템에서 객관적 음질 평가 방법.
    여기서 Lxy(i)는 상호 바크 스펙트럼, Lxx(i)는 입력 음성 신호의 바크 스펙트럼, Lyy(i)는 출력 음성신호의 바크 스펙트럼, i는 바크 주파수를 각각 나타낸다.
  12. 제 7 항에 있어서, 상기 제 5 과정의 바크 잡음 대 신호비 계산은, 상기 제 4 과정에서 얻어지는 신호를 아래와 같은 바크 잡음 대 신호비 계산 수학식으로 변환하고, 그 결과치를 객관적 음질 평가치로 출력하는 것을 특징으로 하는 이동통신 시스템에서 객관적 음질 평가 방법.
    여기서, i는 바크 주파수를 나타내고, BCF는 바크 코히어런스 함수에 의해 계산된 값을 나타낸다.
KR1020000003478A 2000-01-25 2000-01-25 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법 KR100347752B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000003478A KR100347752B1 (ko) 2000-01-25 2000-01-25 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000003478A KR100347752B1 (ko) 2000-01-25 2000-01-25 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20010076069A KR20010076069A (ko) 2001-08-11
KR100347752B1 true KR100347752B1 (ko) 2002-08-09

Family

ID=19641294

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000003478A KR100347752B1 (ko) 2000-01-25 2000-01-25 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100347752B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100729555B1 (ko) * 2005-10-31 2007-06-19 연세대학교 산학협력단 음성 품질의 객관적인 평가방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0748596A (ja) * 1993-01-27 1995-02-21 Rhone Poulenc Chim 生物分解性の非吸湿性ポリカルボン酸ポリマー少なくとも1種を含有する固体状洗浄用組成物
JPH0784596A (ja) * 1993-09-13 1995-03-31 Nippon Telegr & Teleph Corp <Ntt> 符号化音声の品質評価方法
KR960702146A (ko) * 1994-02-17 1996-03-28 안쏘니 제이.살리, 주니어 부호화 신호의 그룹화 방법 및 장치(method and apparatus for group encoding signals)
US5864794A (en) * 1994-03-18 1999-01-26 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system using auditory parameters and bark spectrum
KR19990077753A (ko) * 1998-03-11 1999-10-25 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0748596A (ja) * 1993-01-27 1995-02-21 Rhone Poulenc Chim 生物分解性の非吸湿性ポリカルボン酸ポリマー少なくとも1種を含有する固体状洗浄用組成物
JPH0784596A (ja) * 1993-09-13 1995-03-31 Nippon Telegr & Teleph Corp <Ntt> 符号化音声の品質評価方法
KR960702146A (ko) * 1994-02-17 1996-03-28 안쏘니 제이.살리, 주니어 부호화 신호의 그룹화 방법 및 장치(method and apparatus for group encoding signals)
US5864794A (en) * 1994-03-18 1999-01-26 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system using auditory parameters and bark spectrum
KR19990077753A (ko) * 1998-03-11 1999-10-25 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치

Also Published As

Publication number Publication date
KR20010076069A (ko) 2001-08-11

Similar Documents

Publication Publication Date Title
Beerends et al. Perceptual evaluation of speech quality (pesq) the new itu standard for end-to-end speech quality assessment part ii: psychoacoustic model
Voran Objective estimation of perceived speech quality. i. development of the measuring normalizing block technique
CA2334906C (en) Method for executing automatic evaluation of transmission quality of audio signals
Rix Perceptual speech quality assessment-a review
Thorpe et al. Performance of current perceptual objective speech quality measures
Rix et al. PESQ-the new ITU standard for end-to-end speech quality assessment
RU2312405C2 (ru) Способ осуществления машинной оценки качества звуковых сигналов
Möller et al. Telephone speech quality prediction: towards network planning and monitoring models for modern network scenarios
Zhang et al. A new method of objective speech quality assessment in communication system
Yang et al. Improvement of MBSD by scaling noise masking threshold and correlation analysis with MOS difference instead of MOS
KR100347752B1 (ko) 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법
Kim A cue for objective speech quality estimation in temporal envelope representations
KR100333049B1 (ko) 심리 음향 캡스트럴 평균 차감법을 이용한 이동통신시스템에서의 음질 평가방법
KR100323231B1 (ko) 객관적 음질 평가 척도를 이용한 주관적 음질 예측방법
Goldstein et al. Perceptual speech quality assessment in acoustic and binaural applications
Mahdi Voice quality measurement in modern telecommunication networks
Somek et al. Speech quality assessment
Rix et al. Perceptual SpeechQuality Assessment from Narrowband Telephony to Wideband Audio
Singh et al. Non-Intrusive Speech Quality with Different Time Scale
Aburas et al. Symbian Based Perceptual Evaluation of Speech Quality for Telecommunication Networks
Côté et al. Analysis of a quality prediction model for wideband speech quality, the WB-PESQ
Takahashi QoE Assessment and Management of VoIP Services
Ipswich PESQ: An Introduction White Paper
Mahdi Advances in Perceptual Speech Quality Assessment
Mahdi et al. Perceptual Voice Quality Measurement-Can You Hear Me Loud and Clear?

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20060721

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee