KR101301843B1 - 스피치 프레임내의 정보의 분실을 방지하는 시스템 및 방법 - Google Patents

스피치 프레임내의 정보의 분실을 방지하는 시스템 및 방법 Download PDF

Info

Publication number
KR101301843B1
KR101301843B1 KR1020127000170A KR20127000170A KR101301843B1 KR 101301843 B1 KR101301843 B1 KR 101301843B1 KR 1020127000170 A KR1020127000170 A KR 1020127000170A KR 20127000170 A KR20127000170 A KR 20127000170A KR 101301843 B1 KR101301843 B1 KR 101301843B1
Authority
KR
South Korea
Prior art keywords
speech
speech frame
frame
mode
data rate
Prior art date
Application number
KR1020127000170A
Other languages
English (en)
Other versions
KR20120024934A (ko
Inventor
정 팡
다니엘 제이 신더
아난타파드마나반 아라사니팔라이 칸다다이
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20120024934A publication Critical patent/KR20120024934A/ko
Application granted granted Critical
Publication of KR101301843B1 publication Critical patent/KR101301843B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0009Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/47Error detection, forward error correction or error protection, not provided for in groups H03M13/01 - H03M13/37
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/007Unequal error protection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0078Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
    • H04L1/0083Formatting with frames or packets; Protocol or part of protocol for error control

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Abstract

스피치 프레임내의 정보의 분실을 방지하는 방법이 설명된다. 인코딩될 제 1 스피치 프레임이 선택된다. 제 2 스피치 프레임 및 하나 이상의 인접 스피치 프레임들내의 정보에 기초하여 제 2 스피치 프레임이 임계 스피치 프레임인지 여부에 관한 결정이 이루어진다. 제 2 스피치 프레임이 임계 스피치 프레임이면, 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부가 선택된 순방향 에러 정정 (FEC) 모드에 따라 생성된다. 제 1 스피치 프레임 및 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부가 송신된다.

Description

스피치 프레임내의 정보의 분실을 방지하는 시스템 및 방법{SYSTEMS AND METHODS FOR PREVENTING THE LOSS OF INFORMATION WITHIN A SPEECH FRAME}
본 시스템들 및 방법들은 통신 및 무선 관련 기술에 관한 것이다. 특히, 본 시스템들 및 방법들은 스피치 프레임내의 정보의 분실을 방지하는 시스템들 및 방법들에 관한 것이다.
디지털 음성 통신은 회로 스위칭 네트워크들을 통해 수행된다. 회로 스위칭 네트워크는 물리적 경로가 셀의 지속기간 동안 2개의 단말기들 사이에서 확립되는 네트워크이다. 회로 스위칭 애플리케이션들에서, 송신 단말기는 물리적 경로를 통해 음성 정보를 포함하는 패킷들의 시퀀스를 수신 단말기로 전송한다. 수신 단말기는 패킷들에 포함된 음성 정보를 사용하여 스피치를 합성한다.
디지털 음성 통신은 패킷 스위칭 네트워크들을 통해 수행되도록 시작되었다. 패킷 스위칭 네트워크는 수신지 어드레스에 기초하여 네트워크를 통해 패킷들이 라우팅되는 네트워크이다. 패킷 스위칭 통신으로, 라우터들은 수신지에 도달하기 위한 임의의 이용가능한 경로로 패킷을 개별적으로 전송하는, 각 패킷에 대한 경로를 결정한다. 그 결과, 패킷들은 동시에 또는 동일한 순서로 수신 단말기에 도달하지 못한다. 디-지터 버퍼가 패킷들을 적절하게 제자리에 두고, 이들을 연속 순차적 방식으로 재생시키기 위해 수신 단말기에서 사용될 수도 있다.
몇몇 경우들에서, 패킷은 송신 단말기로부터 수신 단말기로의 천이에서 분실된다. 분실된 패킷은 합성된 스피치의 품질을 열화시킬 수도 있다. 이와 같이, 스피치 프레임내의 정보의 분실을 방지하는 시스템들 및 방법들을 제공함으로써 이점들이 실현될 수도 있다.
EP 0984570 A2 는 무선 통신 시스템상에서 송신된 스피치 신호들의 품질을 향상시키는 시스템을 설명한다. 송신 이전에, 시스템은 프레임이 임계인지를 결정하고, 프레임이 임계인 것으로 결정되면, 시스템은 더 높은 전력 레벨에서 송신함으로써 그 프레임의 강건성을 증가시키도록 작용한다.
도 1 은 송신 매체를 통한 송신 단말기 및 수신 단말기의 예를 예시하는 블록도이다.
도 2 는 송신 단말기의 다른 구성을 예시하는 블록도이다.
도 3 은 순방향 에러 정정 (FEC) 모듈의 일 구성을 예시하는 블록도이다.
도 4 는 임계 프레임 식별 모듈의 일 구성을 예시하는 블록도이다.
도 5 는 FEC 모드 선택 알고리즘의 일 예를 예시하는 블록도이다.
도 6 은 채널 상태 피드백 모듈의 일 구성을 예시하는 블록도이다.
도 7 은 동적 레이트 제어 모듈의 일 예를 예시하는 블록도이다.
도 8 은 수신 단말기의 일 구성을 예시하는 블록도이다.
도 9 는 VoIP (Voice over Internet Protocol) 에 대한 순방향 에러 정정 (FEC) 의 방법의 일 예를 예시하는 흐름도이다.
도 10 은 도 9 에 도시된 방법에 대응하는 수단과 기능을 합한 블록들을 예시한다.
도 11 은 무선 통신 디바이스에서 활용될 수도 있는 다양한 컴포넌트들을 예시한다.
도 12 는 개시된 시스템들 및 방법들의 일 예에 따른 기지국의 블록도이다.
다양한 애플리케이션들이 패킷 스위칭 네트워크에서 구현될 수도 있다. 예를 들어, 음성 애플리케이션은 VoIP (Voice over Internet Protocol) 네트워크에서 구현될 수도 있다. 음성 정보를 갖는 패킷들은 네트워크상에서 제 1 디바이스로부터 제 2 디바이스로 송신될 수도 있다. 그러나, 패킷들 중 몇몇은 패킷들의 송신 동안 분실될 수도 있다. 예를 들어, 다중 패킷들의 분실 (때때로, 버스티 패킷 분실이라 칭함) 은 수신 디바이스에서 인지된 스피치 품질의 저하에 대한 원인일 수도 있다. 일 구성에서, 패킷은 하나 이상의 프레임들을 포함할 수도 있다.
VoIP 네트워크에서 패킷 분실에 의해 야기된 인지된 스피치 품질의 저하를 완화시키기 위해, 2개 타입의 솔루션들이 존재한다. 제 1 솔루션은 수신기 기반 패킷 분실 은폐 (PLC) 방법일 수도 있다. PLC 방법들은 VoIP 통신에서 패킷 분실의 영향을 마스킹하는 기법일 수도 있다. 예를 들어, PLC 방법들은 송신 동안 분실된 것 대신에 대체 패킷을 생성하기 위해 구현될 수도 있다. PLC 방법은 분실된 것과 가능한 한 유사한 패킷의 생성을 시도할 수도 있다. 수신기 기반 PLC 방법들은 대체 패킷을 생성하기 위해 임의의 추가의 자원들 또는 전송자로부터의 도움을 필요로 하지 않을 수도 있다. 그러나, PLC 방법들은 중요한 스피치 프레임들이 분실될 때 패킷 분실의 영향을 효과적으로 마스킹하지 않을 수도 있다.
제 2 솔루션은 전송자 기반 패킷 분실 회복 방식일 수도 있다. 이러한 방식의 일 예가 순방향 에러 정정 (FEC) 방법일 수도 있다. FEC 방법은 각 패킷을 갖는 몇몇 추가의 데이터를 전송하는 단계를 포함할 수도 있다. 추가의 데이터는 송신 동안 데이터의 분실에 의해 야기된 에러들을 복원하기 위해 사용될 수도 있다. 예를 들어, FEC 방식들은 리던던트 스피치 프레임들을 송신할 수도 있다. 다시 말해, 스피치 프레임의 하나 보다 많은 카피 (통상적으로 2개) 가 전송자에 의해 송신된다. 이들 2개의 프레임들을 프라이머리 카피 및 리던던트 카피로 칭할 수도 있다.
전송자 기반 패킷 분실 회복 방식들이 디코딩된 스피치의 지각 품질을 개선시킬 수도 있지만, 이들 방식들은 또한 스피치의 송신 동안 사용된 대역폭을 증가시킬 수도 있다. 종래의 FEC 방식들은 또한, 단 대 단 (end-to-end) 지연을 증가시킬 수도 있고, 이것은 실시간 대화를 위해 용인할 수 없다. 예를 들어, 종래의 전송자 기반 방식은 동일한 스피치 프레임을 2개의 상이한 시간 주기에서 2회 전송한다. 이것은 데이터 레이트를 적어도 2배로 할 수도 있다. 몇몇 종래의 방식들은 데이터 레이트를 감소시키기 위해 리던던트 카피에 대해 낮은 비트 레이트 코덱을 사용할 수도 있다. 그러나, 낮은 비트 레이트 코덱의 사용은 인코더에서의 복잡성을 증가시킬 수도 있다. 또한, 몇몇 종래의 방식들은 프레임의 프라이머리 카피 및 프레임의 리던던트 카피 양자에 대해 동일한 낮은 비트 레이트 코덱을 사용할 수도 있다. 이것이 인코더에서의 복잡성을 감소시킬 수도 있을 뿐만 아니라 데이터 레이트를 감소시킬 수도 있지만, 베이스라인 스피치 품질 (즉, 분실된 프레임들이 없을 때의 스피치 품질) 이 매우 감소된다. 또한, 종래의 전송자 기반 방식들은 적어도 하나의 프레임 간격의 추가의 지연의 가정 하에서 동작한다.
본 시스템들 및 방법들은 스피치 품질, 지연 및 데이터 레이트 사이에서 최적의 트레이드-오프를 획득하기 위해 소스 및 채널 제어된 FEC 방식을 제공한다. 일 구성에서, 이러한 FEC 방식에 추가의 지연은 도입되지 않는다. 중간 데이터 레이트 증가 하에서 스피치 품질의 고품질 개선이 달성될 수도 있다. 후술되는 FEC 방식은 또한 임의의 타겟 데이터 레이트에서 동작할 수도 있다. 일 예에서, FEC 방식 및 타겟 데이터 레이트는 송신 채널의 조건 뿐만 아니라 외부 제어에 기초하여 적응적으로 조정될 수도 있다. 제안된 FEC 방식은 또한 레거시 통신 디바이스들 (예를 들어, 레거시 핸드셋들) 과 호환가능할 수도 있다.
스피치 신호내의 정보의 분실을 방지하는 방법이 개시된다. 이 방법은 인코딩될 제 1 스피치 프레임을 선택하는 단계를 포함할 수도 있다. 이 방법은 또한, 제 2 스피치 프레임이 그 제 2 스피치 프레임 및 하나 이상의 인접한 스피치 프레임들내의 정보에 기초하여 임계 스피치 프레임인지를 결정하는 단계를 포함할 수도 있다. 이 방법은 또한, 제 2 스피치 프레임이 임계 스피치 프레임이면 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 생성하는 단계를 포함할 수도 있다. 이 방법은 또한, 제 1 스피치 프레임 및 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 송신하는 단계를 포함할 수도 있다.
스피치 프레임내의 정보의 분실을 방지하는 무선 디바이스가 개시된다. 이 무선 디바이스는 제 2 스피치 프레임 및 하나 이상의 인접 스피치 프레임들내의 정보를 사용하여 제 2 스피치 프레임이 임계 스피치 프레임인지 결정하도록 구성된 임계 프레임 식별 모듈을 포함할 수도 있다. 이 무선 디바이스는 또한, 제 2 스피치 프레임이 임계 스피치 프레임인 경우 선택된 순방향 에러 정정 모드에 따라 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 생성하도록 구성된 순방향 에러 정정 (FEC) 모듈을 포함할 수도 있다. 이 무선 디바이스는 또한, 제 1 스피치 프레임 및 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 송신하도록 구성된 송신기를 포함할 수도 있다.
스피치 신호내의 정보의 분실을 방지하는 장치가 개시된다. 이 장치는 인코딩될 제 1 스피치 프레임을 선택하는 수단을 포함할 수도 있다. 이 장치는 또한, 제 2 스피치 프레임이 그 제 2 스피치 프레임 및 하나 이상의 인접한 스피치 프레임들내의 정보에 기초하여 임계 스피치 프레임인지를 결정하는 수단을 포함할 수도 있다. 이 장치는 또한, 제 2 스피치 프레임이 임계 스피치 프레임이면 선택된 순방향 에러 정정 모드에 따라 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 생성하는 수단을 포함할 수도 있다. 이 장치는 제 1 스피치 프레임 및 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 송신하는 수단을 더 포함할 수도 있다.
스피치 신호내의 정보의 분실을 방지하는 컴퓨터 프로그램 제품이 개시된다. 이 컴퓨터 프로그램 제품은 명령들을 갖는 컴퓨터 판독가능한 매체를 포함할 수도 있다. 명령들은 인코딩될 제 1 스피치 프레임을 선택하는 코드를 포함할 수도 있다. 명령들은 또한, 제 2 스피치 프레임이 그 제 2 스피치 프레임 및 하나 이상의 인접한 스피치 프레임들내의 정보에 기초하여 임계 스피치 프레임인지를 결정하는 코드를 포함할 수도 있다. 명령들은, 제 2 스피치 프레임이 임계 스피치 프레임이면 선택된 순방향 에러 정정 모드에 따라 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 생성하는 코드를 더 포함할 수도 있다. 명령들은 또한, 제 1 스피치 프레임 및 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 송신하는 코드를 포함할 수도 있다.
도 1 은 송신 매체 (114) 를 통한 송신 단말기 (102) 및 수신 단말기 (104) 의 일 예를 예시하는 블록도 (100) 이다. 송신 및 수신 단말기들 (102, 104) 은 전화, 컴퓨터, 오디오 브로드캐스트 및 수신 장비, 비디오 회의 장비 등을 포함하는 음선 통신을 지원할 수 있는 임의의 디바이스들이다. 일 구성에서, 송신 및 수신 단말기들 (102, 104) 은 코드 분할 다중 액세스 (CDMA) 능력과 같은 무선 다중 액세스 기술로 구현될 수도 있다. CDMA 는 확산 스펙트럼 통신에 기초한 변조 및 다중 액세스 방식이다.
송신 단말기 (102) 는 음성 인코더 (106) 를 포함할 수도 있고, 수신 단말기 (104) 는 음성 디코더 (108) 를 포함할 수도 있다. 음성 인코더 (106) 는 인간의 스피치 생성의 모델에 기초한 파라미터들을 추출함으로써 제 1 사용자 인터페이스 (110) 로부터의 스피치를 압축하기 위해 사용될 수도 있다. 송신기 (112) 는 송신 매체 (114) 를 가로질러 이들 파라미터들을 포함하는 패킷들을 송신하기 위해 사용될 수도 있다. 송신 매체 (114) 는 인터넷 또는 통합 인트라넷, 또는 임의의 다른 송신 매체와 같은 패킷 기반 네트워크일 수도 있다. 송신 매체 (114) 의 타단에서의 수신기 (116) 는 패킷들을 수신하기 위해 사용될 수도 있다. 음성 디코더 (108) 가 패킷들에서의 파라미터들을 사용하여 스피치를 합성할 수도 있다. 합성된 스피치가 수신 단말기 (104) 상이 제 2 사용자 인터페이스 (118) 에 제공될 수도 있다. 도시되지는 않았지만, 다양한 신호 프로세싱 기능들이 순환 중복 검사 (CRC) 기능들, 인터리빙, 디지털 변조, 확산 스펙트럼 프로세싱 등을 포함하는 콘볼루셔널 인코딩과 같이 송신기와 수신기 (112, 116) 양자 사이에서 수행될 수도 있다.
통신에 대한 각 파티가 송신 뿐만 아니라 수신할 수도 있다. 각 단말기는 음성 인코더 및 디코더를 포함할 수도 있다. 음성 인코더 및 디코더는 개별 디바이스들일 수도 있거나 "보코더"로서 알려진 단일 디바이스로 집적될 수도 있다. 후속하는 상세한 설명에서, 단말기들 (102, 104) 은 송신 매체 (114)의 일 단에서 음성 인코더 (106) 및 타단에서 음성 디코더 (108) 로 설명될 것이다.
송신 단말기 (102) 의 적어도 하나의 구성에서, 스피치는 프레임들에서 제 1 사용자 인터페이스 (110) 로부터 음성 인코더 (106) 로 입력될 수도 있고, 각 프레임은 서브-프레임들로 더 파티셔닝된다. 이들 임의의 프레임 경계들은, 몇몇 블록 프로세싱이 수행되는 경우에 사용될 수도 있다. 그러나, 스피치 샘플들은, 블록 프로세싱 보다는 연속 프로세싱이 구현되는 경우에 프레임들 (및 서브-프레임들) 로 파티셔닝되지 않을 수도 있다. 설명된 예들에서, 송신 매체(114) 를 가로질러 송신된 각 패킷은 특정한 애플리케이션 및 전체 설계 제약들에 의존하여 하나 이상의 프레임들을 포함할 수도 있다.
음성 인코더 (106) 는 가변 레이트 또는 고정 레이트 인코더일 수도 있다. 가변 레이트 인코더는 스피치 컨텐츠에 의존하여, 프레임으로부터 프레임으로 다중의 인코더 모드들 사이에서 동적으로 스위칭할 수도 있다. 음성 디코더 (108) 는 또한, 프레임으로부터 프레임으로 대응하는 디코더 모드들 사이에서 동적으로 스위칭할 수도 있다. 특정한 모드가 수신 단말기 (104) 에서 수용가능한 신호 재생을 유지하면서 이용가능한 최저의 비트 레이트를 달성하기 위해 각 프레임에 대해 선택될 수도 있다.
일 구성에서, 수신기 단말기 (104) 는 또한 채널 상태 정보 (120) 를 송신 단말기 (102) 로 피드백할 수도 있다. 일 예에서, 수신 단말기 (104) 는 송신 단말기 (102) 로부터 패킷들을 송신하기 위해 사용된 채널의 품질에 관한 정보를 수집한다. 수신 단말기 (104) 는 채널의 품질을 추정하기 위해 수집된 정보를 사용할 수도 있다. 그 후, 이러한 추정치는 채널 상태 정보 (120) 로서 송신 단말기 (102) 로 피드백될 수도 있다. 송신 단말기 (102) 는 전송자 기반 패킷 분실 회복 방식 (즉, FEC 방식) 과 관련된 하나 이상의 기능들을 적용하기 위해 채널 상태 정보 (120) 를 사용할 수도 있다. 수신된 채널 상태 정보 (120) 에 기초한 FEC 방식의 적용에 관한 상세가 더욱 완벽하게 후술된다.
음성 인코더 (106) 및 디코더 (108) 는 선형 예측 코딩 (LPC) 을 사용할 수도 있다. LPC 인코딩으로, 스피치는 그것의 강도 및 피치에 의해 특징화되는 스피치 소스 (성대) 에 의해 모델링될 수도 있다. 성대로부터의 스피치는 "포르만트 (formant)" 라 불리는 그것의 공명에 의해 특징화되는 성도 (목 및 입) 를 통해 이동한다. LPC 음성 인코더는 포르만트들을 추정하고, 스피치로부터 그들의 효과를 제거하며, 잔류 스피치의 강도 및 피치를 추정함으로써 스피치를 분석할 수도 있다. 수신단에서의 LPC 음성 디코더는 프로세스를 반전시킴으로써 스피치를 합성할 수도 있다. 특히, LPC 음성 디코더는 스피치 소스를 생성하기 위해 잔류 스피치를 사용하고, (성도를 표현하는) 필터를 생성하기 위해 포르만트들을 사용하며, 스피치를 합성하기 위해 필터를 통해 스피치 소스를 구동할 수도 있다.
도 2 는 LPC 음성 인코더 (206) 의 일 예를 예시하는 블록도이다. LPC 음성 인코더 (206) 는 현재 또는 N번째 스피치 프레임 (216) 에서의 스피치로부터 포르만트들을 추정하는 PLC 모듈 (202) 을 포함할 수도 있다. 기본 솔루션은 프레임에서의 각 스피치 샘플을 이전의 스피치 샘플들의 선형 조합 (스피치 샘플들의 단기간 관계) 으로서 표현하는 상이한 방정식일 수도 있다. 상이한 방정식의 계수들은 포르만트들을 특징으로 한다. LPC 계수들 (222) 은 스피치로부터 포르만트들의 효과를 제거할 수도 있는 인버스 필터 (214) 에 적용될 수도 있다. LPC 계수들과 함께, 잔류 스피치는 송신 매체를 통해 송신될 수도 있어서, 스피치는 수신단에서 재구성될 수 있다. LPC 음성 인코더 (206) 의 적어도 하나의 구성에서, LPC 계수들은 변환 모듈 (204) 에 의해 선형 스펙트럼 쌍들 (LSP) 로 변환된다. 계수들은 더 양호한 송신 및 수학적 조작 효율을 위해 변환될 수도 있다.
다른 압축 기법들이 리던던트 자료를 추정함으로써 스피치를 표현하기 위해 요구된 정보를 동적으로 감소시키기 위해 사용될 수도 있다. 이것은 인간의 성대의 주기적 진동에 의해 야기된 특정한 기본 주파수들이 존재한다는 사실을 활용함으로써 달성될 수도 있다. 이들 기본 주파수들을 종종 "피치" 로 칭한다. 피치는 (1) 스피치 세그먼트의 자동상관 기능을 최대화하는 스피치 샘플들의 수에서의 "지연", 및 (2) "적응형 코드북 이득" (218) 을 포함하는 "적응형 코드북 파라미터들" 에 의해 정량화될 수 있다. 적응형 코드북 이득은, 스피치의 장기간 주기성들이 서브-프레임에 얼마나 강하게 기초하는지를 측정할 수 있다 (218). 이들 장기간 주기성들은 수신 단말기로의 송신 이전에 잔류 스피치로부터 감산될 수도 있다 (210).
감산기 (210) 로부터의 잔류 스피치는 임의의 수의 방식으로 더 인코딩될 수도 있다. 예를 들어, 파라미터들을 가장 통상의 스피치 잔류 신호들에 할당하는 테이블인 코드북 (212) 이 사용될 수도 있다. 동작중에, 감산기 (210) 로부터의 잔류 스피치는 코드북 (212) 에서의 모든 엔트리들에 비교된다. 가장 근접한 정합을 갖는 엔트리에 대한 파라미터들이 선택된다. 고정된 코드북 파라미터들은 "고정된 코드북 인덱스들" 및 "고정된 코드북 이득" 을 포함한다. 고정된 코드북 계수들은 프레임에 대한 새로운 정보 (에너지) 를 포함한다. 이것은 기본적으로 프레임들 사이의 차이들의 인코딩된 표현이다. 고정된 코드북 이득은, 수신 단말기 (104) 에서의 음성 디코더 (108) 가 스피치의 현재의 서브-프레임에 새로운 정보 (고정된 코드북 계수들) 를 적용하기 위해 사용해야 하는 이득을 표현한다.
피치 추정기 (208) 가 또한, "Delta Delay" 또는 "DDelay" 라 불리는 추가의 적응형 코드북 파라미터를 생성하기 위해 사용될 수도 있다. DDelay 는 현재와 이전 프레임 사이의 측정된 지연에서의 차이이다. 이것은 한정된 범위를 갖지만, 2개의 프레임들 사이의 지연에서의 차이가 과다하면 제로로 설정될 수도 있다. 이러한 파라미터는 스피치를 합성하기 위해 수신 단말기 (104) 에서의 음성 디코더 (108) 에 의해 사용되지 않을 수도 있다. 대신에, 이것은 분실 또는 손상 프레임들에 대한 스피치 샘플들의 피치를 계산하기 위해 사용된다.
일 구성에서, 인코더 (206) 는 또한 FEC 모듈 (220) 을 포함할 수도 있다. FEC 모듈 (220) 은 K번째 스피치 프레임 (215) 을 수신할 수도 있고, 여기서, K 는 N 이하이다. FEC 모듈 (220) 은 또한, FEC 모듈 (220) 이 K번째 스피치 프레임 (215) 을 분석할 때 이들 인코딩된 프레임들 (217) 이 존재하면, K번째 스피치 프레임 (215) 이전에 발생하는 하나 이상의 인코딩된 프레임들 (217) 및/또는 K번째 스피치 프레임 (215) 이후에 발생하는 하나 이상의 인코딩된 프레임들 (217) 을 수신할 수도 있다.
FEC 모듈 (220) 은 K번째 스피치 프레임 (215) 을 분석할 수도 있다. FEC 모듈 (220) 은, K번째 스피치 프레임 (215) 이 임계 프레임인지를 결정할 수도 있다. 분석된 K번째 스피치 프레임 (215) 은 FEC 모듈 (220) 에 의해 수신되는 K번째 스피치 프레임 (215) 이전 및/또는 이후에 발생하는 하나 이상의 인코딩된 프레임들 (217) 및 K번째 스피치 프레임 (215) 에 포함된 정보에 기초하여 임계 프레임으로 고려될 수도 있다. FEC 모듈 (220) 은 또한, K번째 스피치 프레임 (215) 이 임계 프레임이면, K번째 스피치 프레임 (215) 을 "보호"하는 구현할 프로세스를 결정할 수도 있다.
임계 프레임을 보호하기 위한 프로세스들은, 임계 프레임의 리던던트 카피를 생성하는 것을 포함할 수도 있다. 임계 프레임의 리던던트 카피는 임계 프레임의 파라미터들 중 일부 또는 전부를 포함할 수도 있다. FEC 모듈 (220) 은, K번째 스피치 프레임 (215) 이 임계 프레임인 경우에 K번째 스피치 프레임 (215) 을 보호하는 것을 결정할 수도 있고, 수신 단말기 (104) 로의 송신 동안 분실될 수도 있다. FEC 모듈 (220) 에 관한 더욱 상세한 설명이 후술된다.
도 3 은 FEC 모듈 (320) 의 일 구성을 예시하는 블록도이다. FEC 모듈 (320) 은 스피치 프레임을 분석하고, 스피치 프레임이 임계 프레임인지 결정하며, 스피치 프레임의 리던던트 카피를 생성함으로써 스피치 프레임을 보고하기 위해 사용되는 하나 이상의 추가의 모듈들을 포함할 수도 있다. 카피될 프레임을 여기에서 프라이머리 프레임으로 칭할 수도 있다. 리던던트 카피는 프라이머리 프레임의 파라미터들 중 일부 또는 모두를 복제함으로써 발생될 수도 있거나, 프라이머리 프레임을 인코딩하기 위해 사용된 것과는 상이한 코딩 방법을 사용하여 프라이머리 프레임을 인코딩함으로써 발생될 수도 있다. 일반적으로, 이러한 코딩 방법은 프라이머리 프레임 보다 낮은 레이트를 갖는다.
일 예에서, FEC 모듈 (320) 은 (도 4 와 관련하여 논의되는) 임계 프레임 식별 (ID) 모듈 (302), (도 5 와 관련하여 논의되는) 부분 프레임 보호 모듈 (304), (도 5 와 관련하여 논의되는) 전체 프레임 보호 모듈 (306), (도 5 와 관련하여 논의되는) FEC 모드 선택 알고리즘 (308), (도 6 과 관련하여 논의되는) 채널 상태 피드백 모듈 (310), 및 (도 7 과 관련하여 논의되는) 동적 레이트 제어 모듈 (312) 을 포함한다. 임계 프레임 ID 모듈 (302) 은 스피치 프레임이 임계 프레임인지 여부를 결정할 수도 있다. 일 구성에서, 이러한 모듈 (302) 은 패킷 분실 조건하에서 가장 중요한 프레임들을 식별하기 위해 사용될 수도 있다.
도 4 는 임계 프레임 식별 모듈 (402) 의 일 구성을 예시하는 블록도이다. 모듈 (402) 은 프레임의 특성들 (430) 뿐만 아니라 인접 프레임 특성들 (432) 을 분석함으로써 프레임이 임계 프레임인지를 결정할 수도 있다. 임계 프레임은 분실될 때, 현저한 품질 저하를 야기할 수도 있는 프레임일 수도 있다. 예를 들어, 몇몇 중요한 파라미터들이 이전의 프레임으로부터 현재의 프레임으로 매우 (어떤 소정의 임계값 보다 크게) 변화하는 경우에, 현재의 프레임은, 그 현재의 프레임이 이전의 프레임으로부터 쉽게 예측되지 않을 수도 있기 때문에 임계 프레임일 수도 있다. 또한, 임계 프레임 ID 모듈 (402) 은, 스피치 프레임이 프레임 및 인접 프레임들의 스피치 모드 (434)에 기초하여 임계 프레임인지 결정할 수도 있다. 임계 프레임 결정은 또한, 프레임 및 인접 프레임들의 코딩 타입 (435) 에 기초할 수도 있다. 예를 들어, 스피치 모드 (434) 는 모든 프레임의 특징을 나타낼 수도 있다. 스피치 프레임 코딩타입은 현재의 프레임을 인코딩하기 위해 사용된 인코딩 프로세스를 나타낼 수도 있다. 스피치 프레임 코딩 타입들의 예들은 코딩 여기 선형 예측 (CELP), 잡음 여기 선형 예측 (NELP), 프로토타입 피치 주기 (PPP) 등을 포함할 수도 있다. 스피치 모드의 예들은 유성음, 무성음, 묵음, 과도음, 유성음 개시 (onset) 등을 포함할 수도 있다. 예를 들어, 임계 CELP 프레임은 임계 NELP 프레임 보다 더욱 임계적일 수도 있고, 음성 개시 프레임은 안정된 유성음 프레임 보다 더욱 임계적일 수도 있다. 일 구성에서, 임계 프레임 식별 모듈 (402) 은 스피치 프레임이 임계 프레임인지 여부를 결정하기 위해 어떠한 추가의 인코딩 지연을 요구하지 않을 수도 있다.
임계 프레임 식별 모듈은 프레임이 임계 프레임인지를 결정할 수도 있을 뿐만 아니라 프레임의 임계 레벨을 결정할 수도 있다. 이것은 파라미터들, 특징들, 코딩 타입들, 및 스피치 프레임 및 그 인접 프레임들의 모드들에 기초할 수도 있다. 상이한 임계 프레임들은 상이한 레벨의 임계를 가질 수도 있다. 예를 들어, 2개의 임계 프레임들, A 및 B 에 대해, A 다음의 프레임이 A 로부터 매우 예측가능하고 B 다음의 프레임이 B 에 전혀 의존하지 않으면, A 를 분실하는 것이 하나 보다 많은 프레임에 걸쳐 품질 저하를 야기할 수도 있기 때문에 A 가 B 보다 더욱 임계일 수도 있다.
도 3 으로 돌아가서, FEC 모듈 (320) 은 또한 FEC 모드 선택 알고리즘 (308) 을 포함할 수도 있다. 선택 알고리즘 (308) 은 프레임이 임계 프레임인 것으로 결정될 때 구현하기 위한 보호 모드를 선택할 수도 있다. 보호 모드는 임계 프레임의 리던던트 카피로 카피될 임계 프레임의 파라미터들의 양을 나타낼 수도 있다. 보호 모드의 예들은 전체 보호 모드 및 하나 이상의 부분 보호 모드들을 포함할 수도 있다. 예를 들어, 부분 보호 모드는 파라미터들의 일 세트 또는 파라미터들의 다중 세트만을 보호할 수도 있다.
일 예에서, 전체 보호 모드는 전체 프레임 보호 모듈 (306) 에 의해 구현될 수도 있다. 전체 보호 모드는 임계 프레임에서의 모든 파라미터가 카피되고 프레임의 리던던트 카피에 포함된다는 것을 나타낼 수도 있다. 일 구성에서, 부분 보호 모드는 부분 프레임 보호 모듈 (304) 에 의해 구현될 수도 있다. 부분 보호 모드는, 임계 프레임의 파라미터들 중 일부만이 카피되고 임계 프레임의 리던던트 카피에 포함된다는 것을 나타낼 수도 있다. 부분 보호 모드는 또한, 프레임이 낮은 레이트 인코딩 방법에 의해 인코딩된다는 것을 나타낼 수도 있다.
도 5 에 예시된 바와 같이, FEC 모드 선택 알고리즘 (508) 은 선택된 보호 모드를 구현하기 위해 부분 프레임 보호 모듈 (504) 또는 전체 프레임 보호 모듈 (506) 을 선택할 수도 있다. 전체 보호 모드 및 부분 보호 모드들은 가용 대역폭을 효과적으로 활용할 수도 있고, 레거시 통신 디바이스들과의 백워드 호환성을 제공할 수도 있다. 일 구성에서, 부분 보호 모드들은 전체 보호 모드가 선택될 때 디스에이블될 수도 있다. FEC 모드 선택 알고리즘 (508) 은, 송신 단말기 (102) 로부터 수신 단말기 (104) 로 패킷들을 송신하기 위해 사용된 송신 채널의 물리적 특성들에 기초하여 어느 보호 모드를 구현할지 선택할 수도 있다. 어느 모드를 사용할지의 선택은 또한 프레임의 특징에 기초할 수도 있다. 파라미터들의 서브세트들만이 이전의 프레임과 현재의 프레임 사이에서 매우 변화하면, 이러한 파라미터들의 서브세트만이 보호될 필요가 있다. 이러한 경우에서, 보호되지 않는 다른 파라미터들은 프레임 분실이 발생하면 이전의 프레임으로부터 예측될 수도 있다. 또한, FEC 모드 선택 알고리즘 (508) 은 송신 단말기 (102) 에 의해 지원되는 보호 모드들에 기초하여 보호 모드를 선택할 수도 있다.
도 3 으로 돌아가서, FEC 모듈 (320) 은 또한 채널 상태 피드백 모듈 (310) 을 포함할 수도 있다. 도 6 에 도시되어 있는 바와 같이, 채널 상태 피드백 모듈 (610) 은 채널 상태 정보 (620) 를 수신할 수도 있다. 채널 상태 정보 (620) 는 이전에 설명한 바와 같이, 수신 단말기 (104) 에서 수집 및 추정될 수도 있다. 채널 상태 정보 (620) 는 송신 단말기 (102) 로 되송신될 수도 있다. 일 구성에서, 채널 상태 피드백 모듈 (620) 은 수신된 채널 상태 정보 (620) 를 분석한다. 이 정보 (620) 는 송신 단말기 (102) 와 수신 단말기 (104) 사이의 송신을 위해 사용된 채널의 품질을 나타낼 수도 있다. 피드백 모듈 (610) 은 채널의 품질을 분석할 수도 있고, 그 결과를 FEC 모드 선택 알고리즘 (308) 으로 제공할 수도 있다.
(채널 상태 피드백 모듈 (610) 에 의해 제공된) 채널의 품질에 기초하여, 선택 알고리즘 (308) 은 선택된 보호 모드를 적응적으로 변경할 수도 있다. 다시 말해, 채널의 품질이 열화할 때, FEC 모드 선택 알고리즘 (308) 은 임계 프레임의 리던던트 카피를 수신 단말기 (104) 로 전송하기 위해 필요한 데이터 레이트를 감소시키기 위해 부분 보호 모드를 선택할 수도 있다. 채널의 품질이 증가할 때, FEC 모드 선택 알고리즘 (308) 은 전체 보호 모드를 적용하고 선택할 수도 있다. 전체 보호 모드로, 임계 프레임의 각 파라미터가 카피되고 프레임의 리던던트 카피에 포함된다. 채널 품질의 증가는 더 높은 데이터 레이트가 달성될 수도 있다는 것을 나타낼 수도 있다.
일 구성에서, 채널 상태 피드백 모듈 (610) 은 또한 오프셋 계산기 (622) 를 포함할 수도 있다. 일 예에서, 오프셋 계산기 (622) 는 FEC 오프셋의 값을 결정한다. 오프셋은 프레임의 프라이머리 카피의 송신 시간과 프레임의 리던던트 카피의 송신 시간 사이의 간격일 수도 있다. 다시 말해, 오프셋 계산기 (622) 는 임계 프레임의 리던던트 카피가 수신 단말기 (104) 로 송신될 때를 결정할 수도 있다. 일반적으로, 패킷 스위칭 네트워크에서의 패킷 분실들은 버스티이고, 버스티 길이들은 상이한 네트워크 조건하에서 상이할 수도 있다. 따라서, 동적으로 조정된 오프셋의 사용은 더 양호한 에러 보호 성능을 발생시킬 수도 있다. 최적의 오프셋은 수신기에 의해 전송된 채널 상태 정보를 사용하여 추정될 수도 있다.
도 3 으로 돌아가서, FEC 모듈 (320) 은 동적 레이트 제어 모듈 (312) 을 더 포함할 수도 있다. 레이트 제어 모듈 (312) 은 타겟 데이터 레이트를 충족시키기 위해 각 프레임에 대한 최종 보호 모드를 결정할 수도 있다. 도 7 에 예시된 바와 같이, 동적 레이트 제어 모듈 (712) 은 채널 상태 피드백 모듈 (710) 로부터 수신된 채널 상태 정보 (120) 및 특정 타겟 데이터 레이트 (734) 에 기초하여 최종 보호 모드를 결정할 수도 있다.
최종 보호 모드를 결정하기 위해, 레이트 제어 모듈 (712) 은 소정의 타겟 레이트에 접근하기 위해 2개의 단계들을 구현할 수도 있다. 제 1 단계에서, 2개의 인접한 동작 포인트들이 결정될 수도 있다. 동작 포인트들은 데이터 레이트들이다. 이들 2개의 인접한 동작 포인트들은, 타겟 데이터 레이트 (734) 의 값이 2개의 동작 포인트들의 값들 사이에 있도록 선택될 수도 있다. 일 구성에서, 동작 포인트는 스피치 프레임 에러 회복 특성들에 기초하는 소정의 보호 결정일 수도 있다. 제 1 동작 포인트가 제 2 동작 포인트 보다 높은 데이터 레이트를 가지면, 제 1 동작 포인트와 관련된 보호 결정의 성능은 제 2 동작 포인트와 관련된 보호 결정 보다 패킷 분실 조건하에서 더 양호할 수도 있다.
제 2 단계에서, 제 1 단계에서의 2개의 인접한 동작 포인트들에 의해 정의된 보호 결정의 범위내에서, 동적 레이트 제어 모듈 (712) 은 타겟 데이터 레이트 (734) 를 충족시키기 위해 보호 결정을 적응적으로 조정할 수도 있다. 일 구성에서, 2개의 동적 제어 알고리즘들, 예를 들어, 랜덤 레이트 제어 알고리즘 (730) 및 결정 레이트 제어 알고리즘 (732) 이 제공될 수도 있다. 랜덤 레이트 제어 알고리즘 (730) 은 각 프레임의 보호 결정을 결정하기 위해 랜덤 알고리즘을 사용할 수도 있다. 랜덤 알고리즘은 평균 데이터 레이트 (734) 가 타겟 데이터 레이트에 접근하도록 구성될 수도 있다. 다르게는, 결정 레이트 제어 알고리즘은 결정 방식을 통해 각 프레임의 보호 결정을 결정할 수도 있다. 평균 레이트는 모든 프레임에 대해 계산될 수도 있다. 평균 레이트가 타겟 레이트 보다 크면, 더 낮은 데이터 레이트 보호 또는 비보호가 현재의 프레임에 대해 사용될 수도 있고, 그렇지 않으면, 더 높은 데이터 레이트가 현재의 프레임에 대해 사용될 수도 있다. 현재의 프레임의 보호 결정은 또한, 제 1 단계에서 2개의 인접한 동작 포인트들에 의해 정의된 보호 결정의 범위에 의해 경계가 정해질 수도 있다. 타겟 데이터 레이트 (734) 는 용량 요구에 기초하여 외부적으로 특정될 수도 있다. 다르게는, 타겟 데이터 레이트 (734) 는 채널 상태 정보 (120) 의 피드백에 기초하여 내부적으로 특정될 수도 있다.
도 8 은 수신 단말기 (804) 의 블록도이다. 이러한 구성에서, VoIP 클라이언트 (830) 는 디-지터 버퍼 (802) 를 포함한다. 수신 단말기 (804) 는 또한 음성 디코더 (808) 를 포함할 수도 있다. 디코더 (808) 는 스피치 생성기 (832) 를 포함할 수도 있다. 음성 디코더 (808) 는 보코더의 일부로서, 독립형 엔터티로서 구현될 수도 있거나, 수신 단말기 (804) 내의 하나 이상의 엔터티에 걸쳐 분포될 수도 있다. 음성 디코더 (808) 는 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 임의의 조합으로서 구현될 수도 있다. 예로서, 음성 디코더 (808) 는 마이크로프로세서, 디지털 신호 프로세서 (DSP), 프로그램가능한 로직, 전용 하드웨어 또는 임의의 다른 하드웨어 및/또는 소프트웨어 기반 프로세싱 엔터티로 구현될 수도 있다. 음성 디코더 (808) 는 그것의 기능성과 관련하여 후술될 것이다. 그것이 구현되는 방식은 특정한 애플리케이션 및 전체 시스템에 부과되는 설계 제약들에 의존할 수도 있다.
디-지터 버퍼 (802) 는 네트워크 혼잡, 타이밍 드리프트, 및 라우트 변화들로 인한 패킷 도달 시간에서의 변동들에 의해 야기된 지터를 제거하는 하드웨어 디바이스 또는 소프트웨어 프로세스일 수도 있다. 디-지터 버퍼 (802) 는 음성 패킷들에서 스피치 프레임 (842) 을 수신할 수도 있다. 또한, 디-지터 버퍼 (802) 는 새롭게 도달하는 패킷들을 지연시킬 수도 있어서, 이전에 도달한 패킷들은 정확한 순서로 스피치 생성기 (832) 에 연속적으로 제공되고, 이것은 오디오 왜곡을 거의 갖지 않은 깨끗한 접속을 발생시킨다. 디-지터 버퍼 (802) 는 고정형 또는 적응형일 수도 있다. 고정형 디-지터 버퍼는 패킷에 고정된 지연을 도입할 수도 있다. 한편, 적응형 디-지터 버퍼는 네트워크의 지연에서의 변화들에 적응할 수도 있다. 디-지터 버퍼 (802) 는 디코더 (808) 에 스피치 프레임들을 제공할 수도 있다.
프레임의 프라이머리 카피가 디-지터 버퍼에 의해 수신되지 않으면, FEC가 사용되지 않는 경우에 프레임 분실이 야기될 수도 있다. FEC 가 사용되고 현재의 재생될 프레임의 프라이머리 카피가 분실되면, 디-지터 버퍼는, 버퍼에 프레임의 리던던트 카피가 존재하는지를 체크할 수도 있다. 현지의 프레임에 대해 리던던트 카피가 존재하면, 리던던트 카피가 디코딩되어 스피치 샘플들을 생성할 수도 있다. 리던던트 카피는 전체 프레임 또는 부분 프레임일 수도 있다.
또한, 디-지터 버퍼 (802) 는 프라이머리 프레임 (즉, 원래의 임계 프레임) 및 리던던트 프레임 (즉, 원래의 임계 프레임의 일부 또는 전부) 을 상이하게 프로세싱하도록 변경될 수도 있다. 버퍼 (802) 는 이들 2개의 프레임들을 상이하게 프로세싱할 수도 있어서, FEC 모듈 (220) 의 기능을 구현하는 것과 관련된 평균 지연은 FEC 모듈 (220) 의 기능들이 구현되지 않을 때의 평균 지연 보다 크지 않다. 프라이머리 카피의 파라미터들의 일부 (즉, 부분) 를 포함하는 프레임들의 리던던트 카피들은 디-지터 버퍼 (802) 로부터 부분 프레임 디코딩 모듈 (850) 로 패스될 수도 있다.
이전에 언급한 바와 같이, 순환 중복 검사 (CRC) 기능들, 인터리빙, 디지털 변조, 및 확산 스펙트럼 프로세싱을 포함하는 콘볼루셔널 인코딩과 같은 다양한 신호 프로세싱 기능들이 송신 단말기 (102) 에 의해 수행될 수도 있다.
디-지터 버퍼 (802) 로부터 릴리즈된 스피치 프레임들 (842) 은 스피치 생성기 (832) 에 제공되어 합성된 스피치 (844) 를 생성할 수도 있다. 스피치 생성기 (832) 는 합성된 스피치 (844) 를 생성하기 위해 여러 기능들을 포함할 수도 있다. 스피치를 당업계에 알려진 합성된 스피치로 디코딩하는 임의의 방법이 사용될 수도 있다. 도시된 실시형태에서, 스피치 생성기는, 인버스 코드북 (812) 이 고정된 코드북 파라미터들 (838) 을 사용할 수도 있는 CELP 디코딩 방법을 사용할 수도 있다. 예를 들어, 인버스 코드북 (812) 은 고정된 코드북 계수들을 잔류 스피치로 변환하고, 고정된 코드북 이득을 그 잔류 스피치에 적용하기 위해 사용될 수도 있다. 피치 정보가 잔류 스피치로 역으로 가산될 수도 있다 (818). 피치 정보는 "지연" 으로부터 피치 디코더 (814) 에 의해 계산될 수도 있다. 피치 디코더 (814) 는 스피치 샘플들의 이전의 프레임을 발생시킨 정보의 메모리일 수도 있다. 적응형 코드북 이득과 같은 적응형 코드북 파라미터들 (836) 이 잔류 스피치에 가산되기 (818) 이전에 피치 디코더 (814) 에 의해 각 서브-프레임에서의 메모리 정보에 적용될 수도 있다. 잔류 스피치는 스피치에 포르만트들을 가산하기 위해, 인버스 변환 (822) 으로부터의 LPC 계수와 같은 선 스펙트럼 쌍들 (834) 을 사용하여 필터 (820) 를 통해 구동될 수도 있다. 그 후, 로우 (raw) 합성된 스피치가 필터 (820) 로부터 포스트-필터 (824)에 제공될 수도 있다. 포스트-필터 (824) 는 스피치를 평활화시킬 수도 있고 대역외 성분을 감소시킬 수도 있는 오디오 대역의 디지털 필터일 수도 있다. 다르게는 또는 제한하지 않고, 스피치 생성기 (832) 는 NELP 또는 PPP 전체 프레임 디코딩 방법들을 사용할 수도 있다.
도 9 는 VoIP 에 대한 순방향 에러 정정 (FEC) 의 방법 (900) 의 일 예를 예시하는 흐름도이다. 방법 (900) 은 송신 단말기 (102) 에 의해 구현될 수도 있다. 송신 단말기 (102) 와 수신 단말기 (104) 사이의 VoIP 호의 셋업 동안, 적합한 FEC 모드 (예를 들어, 전체 보호 모드 또는 부분 보호 모드) 가 선택될 수도 있다 (902). 모드는 물리적 송신 채널들 및 송신 단말기 (102) 와 수신 단말기 (104) 의 지원에 기초하여 선택될 수도 있다. 타겟 데이터 레이트가 또한 결정될 수도 있다. 일 예에서, 타겟 데이터 레이트는 용량 요구에 따라 결정된다 (904). FEC 오프셋 값이 또한 결정될 수도 있다. 일 예에서, FEC 오프셋 값은 사전 결정된다. 다른 예에서, FEC 오프셋 값은 채널 조건에 기초하여 적응적으로 조정될 수 있다.
인코딩될 스피치 프레임, 프레임 N이 선택될 수도 있다 (906). 그 후, K번째 스피치 프레임 (K≤N) 이 분석될 수도 있고 (906), K번째 스피치 프레임이 임계 프레임인지 여부에 관한 결정 (908) 이 이루어질 수도 있다. 어느 프레임을 분석할지 선택하는 것 (906) 은 FEC 오프셋에 의존할 수도 있다. 예를 들어, FEC 오프셋이 2이면, N-2개의 프레임이 분석될 수도 있다. 일 구성에서, VoIP 호 동안, 모든 인코딩된 프레임에 대해, 송신 단말기 (102) 내의 인코더 (106) 는 K번째 스피치 프레임이 보호되어야 하는지 (즉, K번째 스피치 프레임이 임계 프레임인지 여부) 를 결정할 수도 있다. 인코더 (106) 는 또한, 타겟 데이터 레이트, 결정 (908) 의 결과, 및 선택된 FEC 모드에 기초하여 K번째 스피치 프레임이 어떻게 보호되어야 하는지 결정할 수도 있다. 일 구성에서, 타겟 데이터 레이트 및 FEC 오프셋 값은 수신 단말기 (104) 로부터 피드백된 채널 상태 정보 (120) 에 기초하여 런-타임 동안 조정될 수도 있다.
K번째 스피치 프레임이 임계 프레임이 아니면, 인코딩된 스피치 프레임 (N) 만이 수신 단말기로 송신된다 (914). K번째 스피치 프레임이 임계 프레임이다는 것이 결정되면 (908), K번째 스피치 프레임의 리던던트 카피가 생성될 수도 있다 (910). K번째 스피치 프레임의 리던던트 카피의 생성은 선택된 FEC 모드에 기초할 수도 있다. 예를 들어, 리던던트 카피는 선택된 FEC 모드가 전체 보호 모드 또는 부분 보호 모드인지에 의존하여 임계 K번째 스피치 프레임에 포함된 파라미터들 중 일부 또는 전부로 생성될 수도 있다. 다르게는, 리던던트 카피는 프라이머리 카피에 대한 코딩 방법 보다 낮은 레이트를 가질 수도 있는 다른 코딩 방법을 사용하여 생성될 수도 있다.
일 구성에서, 프라이머리 카피 (즉, 현재의 스피치 프레임 N) 및 임계 K번째 스피치 프레임의 리던던트 카피는 실시간 프로토콜 (RTP) 패킷들로 패킷화될 수도 있고 수신 단말기 (104) 로 송신될 수도 있다 (912, 914). 다른 구성에서, 동시에 생성되더라도, 프레임의 프라이머리 카피 및 K번째 스피치 프레임의 리던던트 카피는 2개의 상이한 RTP 패킷들로 개별적으로 팩킹될 수도 있고 수신 단말기로 송신될 수도 있다. 어느 포맷을 사용할지의 결정은 단말기들 양자의 능력에 기초할 수도 있다. 포맷들 양자가 각 단말기에서 지원되면, 더 낮은 데이터 레이트를 야기하는 포맷이 사용된다. 수신기측에서, 스피치 프레임들은 적응형 디-지터 버퍼 (802) 에 저장될 수도 있다. 이전에 언급한 바와 같이, 디-지터 버퍼 (802) 는 스피치 프레임들에 대한 평균 지연이 FEC 기법을 이용하지 않는 평균 지연 보다 크지 않도록 설계될 수도 있다. 프레임들은 디-지터 버퍼(802) 로부터 적절한 순서로 디코더 (108) 로 전송될 수도 있다. 스피치 프레임이 프라이머리 카피의 파라미터들 중 일부를 갖는 리던던트 카피이면, 부분 프레임 디코딩 모듈 (850) 이 사용된다.
상술한 소스 및 채널 제어된 FEC 방식은 데이터 레이트에서 중간의 증가만을 초래하지만 분실의 버스트성 (bursiness) 및 패킷 분실의 수를 감소시킬 수도 있다. 임계 프레임 식별 및 부분 프레임 보호 모드는, 스피치 지각 품질과 데이터 레이트 사이의 양호한 트레이드-오프를 보장할 수도 있다. 디-지터 버퍼에 대한 변형은 추가의 단 대 단 지연을 도입하지 않을 수도 있다. 동적 레이트 제어 모듈 (312) 은 상술한 FEC 방식이 임의의 특정한 데이터 레이트에서 수행되게 할 수도 있어서, 오퍼레이터는 용량 요구에 기초하여 데이터 레이트를 결정할 수도 있다. 최종으로, FEC 모드 선택 알고리즘 (308) 에 의해 수행된 FEC 모드 선택은, 부분 프레임 보호 모드가 핸드셋들 (예를 들어, 송신 단말기 (102) 및 수신 단말기 (104)) 의 능력들 및 물리적 채널 특성들에 기초하여 사용되는지를 결정할 수도 있다. 상술한 FEC 방식은 가용 대역폭을 낭비하지 않을 수도 있고 레거시 통신 디바이스들과 백워드 호환할 수도 있다.
FEC 기능성을 갖는 단말기가 (전체 프레임들을 단지 디코딩할 수 있는) 레거시 단말기와 통신하면, 부분 프레임 보호가 디스에이블될 수도 있어서, 레거시 핸드셋은 FEC 리던던시로부터 이익을 얻을 수도 있다. 부분 프레임이 레거시 단말기로 전송되면, 레거시 단말기는, 부분 프레임의 포맷을 이해하지 못할 수도 있기 때문에 부분 프레임을 무시할 수도 있고, 이것은 가용 대역폭의 낭비를 잠재적으로 초래한다.
상술한 도 9 의 방법은 도 10 에 예시된 수단과 기능이 합해진 블록들에 대응하는 다양한 하드웨어 및/또는 소프트웨어 컴포넌트(들) 및/또는 모듈(들)에 의해 수행될 수도 있다. 다시 말해, 도 9 에 예시된 블록들 (902 내지 914) 는 도 10 에 예시된 수단과 기능이 합해진 블록들 (1002 내지 1014) 에 대응한다.
도 11 은 무선 디바이스 (1102) 에서 활용될 수도 있는 다양한 컴포넌트들을 예시한다. 무선 디바이스 (1102) 는 여기에 설명된 다양한 방법들을 구현하도록 구성될 수도 있는 디바이스의 일 예이다. 무선 디바이스 (1102) 는 원격 스테이션, 액세스 단말기, 핸드셋, 휴대 정보 단말기 (PDA), 셀룰러 전화 등일 수도 있다.
무선 디바이스 (1102) 는 무선 디바이스 (1102) 의 동작을 제어하는 프로세서 (1104) 를 포함할 수도 있다. 프로세서 (1104) 는 또한 중앙 처리 유닛 (CPU) 으로서 칭할 수도 있다. 판독 전용 메모리 (ROM) 및 랜덤 액세스 메모리 (RAM) 양자를 포함할 수도 있는 메모리 (1106) 가 명령들 및 데이터를 프로세서 (1104) 에 제공한다. 메모리 (1106) 의 일부가 비휘발성 랜덤 액세스 메모리 (NVRAM) 를 또한 포함할 수도 있다. 프로세서 (1104) 는 통상적으로, 메모리 (1106) 내에 저장된 프로그램 명령들에 기초하여 논리적 및 산술적 연산들을 수행한다. 메모리 (1106) 에서의 명령들은 여기에 설명된 방법들을 구현하기 위해 실행가능할 수도 있다.
무선 디바이스 (1102) 는 무선 디바이스 (1102) 와 원격 위치 사이에서 데이터의 송신 및 수신을 허용하기 위해 송신기 (1110) 및 수신기 (1112) 를 포함할 수도 있는 하우징 (1108) 을 또한 포함할 수도 있다. 송신기 (1110) 및 수신기 (1112) 는 트랜시버 (1114) 로 결합될 수도 있다. 안테나 (1116) 가 하우징 (1108) 에 부착될 수도 있고, 트랜시버 (1114) 에 전기적으로 커플링될 수도 있다. 무선 디바이스 (1102) 는 또한, (도시되지 않은) 다중의 송신기들, 다중의 수신기들, 다중의 트랜시버들 및/또는 다중의 안테나를 포함할 수도 있다.
무선 디바이스 (1102) 는 또한, 트랜시버 (1114) 에 의해 수신된 신호의 레벨을 검출하고 정량화하기 위해 사용될 수도 있는 신호 검출기 (1118) 를 포함할 수도 있다. 신호 검출기 (1118) 는 이러한 신호들을 총 에너지, 의사잡음(PN) 칩들 당 파일럿 에너지, 전력 스펙트럼 밀도, 및 다른 신호들로서 검출할 수도 있다. 무선 디바이스 (1102) 는 또한, 신호들을 프로세싱하는데 사용하기 위한 디지털 신호 프로세서 (DSP) (1120) 를 포함할 수도 있다.
무선 디바이스 (1102) 의 다양한 컴포넌트들이 데이터 버스에 부가하여 전력 버스, 제어 신호 버스, 및 상태 신호 버스를 포함할 수도 있는 버스 시스템 (1122) 에 의해 함께 커플링될 수도 있다. 그러나, 명확화를 위해, 다양한 버스들은 버스 시스템 (1122) 으로서 도 11 에 예시된다.
도 12 는 개시된 시스템들 및 방법들의 일 예에 따른 기지국 (1208) 의 블록도이다. 기지국 (1208) 의 상이한 구현의 예들은, eNB (evolved NodeB), 기지국 제어기, 기지국 트랜시버, 액세스 라우터 등을 포함하지만 이에 한정되지 않는다. 기지국 (1208) 은 송신기 (1210) 및 수신기 (1212) 를 포함하는 트랜시버 (1220) 를 포함한다. 트랜시버 (1220) 는 안테나 (1218) 에 커플링될 수도 있다. 기지국 (1208) 은 디지털 신호 프로세서 (DSP) (1214), 범용 프로세서 (1202), 메모리 (1204), 및 통신 인터페이스 (1206) 를 더 포함한다. 기지국 (1208) 의 다양한 컴포넌트들은 하우징 (1222) 내에 포함될 수도 있다.
프로세서 (1202) 는 기지국 (1208) 의 동작을 제어할 수도 있다. 프로세서 (1202) 는 또한 CPU 로서 칭할 수도 있다. 판독 전용 메모리 (ROM) 및 랜덤 액세스 메모리 (RAM) 양자를 포함할 수도 있는 메모리 (1204) 는 명령들 및 데이터를 프로세서 (1202) 에 제공한다. 메모리 (1204) 의 일부는 또한 비휘발성 랜덤 액세스 메모리 (NVRAM) 를 포함할 수도 있다. 메모리 (1204) 는 전자 정보를 저장할 수 있는 임의의 전자 컴포넌트를 포함할 수도 있고, ROM, RAM, 자기 디스크 저장 매체, 광 저장 매체, 플래시 메모리, 프로세서 (1202) 에 포함된 온-보드 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈식 디스크, CD-ROM 등으로서 구현될 수도 있다. 메모리 (1204) 는 프로그램 명령들 및 다른 타입의 데이터를 저장할 수도 있다. 프로그램 명령들은 여기에 개시된 방법의 일부 또는 전부를 구현하기 위해 프로세서 (1202) 에 의해 실행될 수도 있다.
개시된 시스템들 및 방법들에 따르면, 안테나 (1218) 는 근처의 통신 디바이스 (1102) 에 의해 송신된 역방향 링크 신호들을 수신할 수도 있다. 안테나 (1218) 는 이들 수신된 신호들을 그 신호들을 필터링하고 증폭하는 트랜시버 (1220) 로 제공한다. 신호들은 복조, 디코딩, 추가의 필터링 등을 위해 트랜시버 (1220) 로부터 DSP (1214) 및 범용 프로세서 (1202) 로 제공된다.
기지국 (1208) 의 다양한 컴포넌트들은 데이터 버스에 부가하여 전력 버스, 제어 신호 버스, 및 상태 신호 버스를 포함할 수도 있는 버스 시스템 (1226) 에 의해 함께 커플링된다. 그러나, 명확화를 위해, 다양한 버스들은 버스 시스템 (1226) 으로서 도 12 에 예시된다.
여기에서 사용되는 바와 같이, 용어 "결정하는" 은 광범위한 액션들을 포함하고, 따라서, "결정하는" 은 계산하는, 컴퓨팅하는, 프로세싱하는, 유도하는, 조사하는, 룩업하는 (예를 들어, 테이블, 데이터베이스, 또는 다른 데이터 구조에서 룩업하는), 확인하는 등을 포함할 수 있다. 또한, "결정하는" 은 수신하는 (예를 들어, 정보를 수신하는), 액세스하는 (예를 들어, 메모리에서의 데이터에 액세스하는) 등을 포함할 수 있다. 또한, "결정하는" 은 분석하는, 선택하는, 택하는, 확립하는 등을 포함할 수도 있다.
어구 "기초하는" 은 다르게 명시적으로 표현되지 않으면 "오직 기초하는" 을 의미하지는 않는다. 다시 말해, "기초하는" 은 "오직 기초하는" 및 "적어도 기초하는" 양자를 설명한다.
본 개시물과 관련하여 설명한 다양한 예시적인 논리 블록들, 모듈들, 및 회로들은 범용 프로세서, 디지털 신호 프로세서 (DSP), 응용 주문형 집적 회로 (ASIC), 필드 프로그래머블 게이트 어레이 (FPGA) 또는 다른 프로그래머블 로직 디바이스, 개별 게이트 또는 트랜지스터 로직, 개별 하드웨어 컴포넌트, 또는 본 명세서에 설명된 기능들을 수행하도록 설계된 임의의 조합으로 구현 또는 수행될 수도 있다. 범용 프로세서는 마이크로프로세서일 수도 있지만, 다르게는, 프로세서는 임의의 상업적으로 입수가능한 프로세서, 제어기, 마이크로제어기, 또는 상태 머신일 수도 있다. 프로세서는 또한, 컴퓨팅 디바이스의 조합, 예를 들어, DSP 와 마이크로프로세서의 조합, 복수의 마이크로프로세서, DSP 코어와 결합한 하나 이상의 마이크로프로세서, 또는 임의의 다른 이러한 구성으로서 구현될 수도 있다.
본 개시물과 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어, 프로세서에 의해 실행된 소프트웨어 모듈, 또는 이 둘의 조합으로 직접 구현될 수도 있다. 소프트웨어 모듈은 당업계에 알려진 임의의 형태의 저장 매체에 상주할 수도 있다. 사용될 수도 있는 저장 매체들의 몇몇 예들은, RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈식 디스크, CD-ROM 등을 포함한다. 소프트웨어 모듈은 단일 명령 또는 다수의 명령들을 포함할 수도 있고, 여러 상이한 코드 세그먼트들상에, 상이한 프로그램 중에 및 다중의 저장 매체를 가로질러 분포될 수도 있다. 저장 매체는 프로세서에 커플링될 수 있어서, 프로세서는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정보를 기입할 수 있다. 다르게는, 저장 매체는 프로세서와 일체형일 수도 있다.
여기에 개시된 방법들은 설명한 방법을 달성하기 위한 하나 이상의 단계들 또는 액션들을 포함한다. 방법 단계들 및/또는 액션들은 청구항들의 범위를 벗어나지 않고 서로 상호교환될 수도 있다. 다시 말해, 특정한 순서의 단계들 또는 액션들이 특정되지 않으면, 특정한 단계들 및/또는 액션들의 순서 및/또는 사용은 청구항들의 범위를 벗어나지 않고 변경될 수도 있다.
설명된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 그 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현되면, 기능들은 컴퓨터 판독가능 매체 상에 하나 이상의 명령으로서 저장될 수도 있다. 컴퓨터 판독가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 이용가능한 매체일 수도 있다. 제한하지 않는 예로서, 컴퓨터 판독가능 매체는 RAM, ROM, EEPROM, CD-ROM 또는 다른 광 디스크 저장 디바이스, 자기 디스크 저장 디바이스 또는 다른 자기 저장 디바이스, 또는 명령 또는 데이터 구조의 형태로 원하는 프로그램 코드를 반송하거나 저장하기 위해 사용될 수 있고 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 본 명세서에 사용된 바와 같이, 디스크 (disk) 및 디스크 (disc) 는 컴팩트 디스크 (CD), 레이저 디스크, 광 디스크, DVD (digital versatile disc), 플로피 디스크 및 Blu-ray® 디스크를 포함하며, 여기서, 디스크 (disk) 는 일반적으로 데이터를 자기적으로 재생하지만, 디스크 (disc) 는 일반적으로 데이터를 레이저로 광학적으로 재생한다.
소프트웨어 또는 명령들이 송신 매체를 통해 또한 송신될 수도 있다. 예를 들어, 소프트웨어가 동축 케이블, 광섬유 케이블, 트위스트드 페어, 디지털 가입자 라인 (DSL), 또는 적외선, 라디오 및 마이크로파와 같은 무선 기술을 사용하여 웹사이트, 서버, 또는 다른 원격 소스로부터 송신되면, 동축 케이블, 광섬유 케이블, 트위스트드 페어, DSL, 또는 적외선, 라디오 및 마이크로파와 같은 무선 기술은 매체의 정의에 포함된다.
또한, 도 9 및 도 10 에 의해 예시된 바와 같은, 여기에 설명된 방법들 및 기법들을 수행하는 모듈들 및/또는 다른 적합한 수단들이 적용가능한 것으로서 모바일 디바이스 및/또는 기지국에 의해 다운로딩될 수 있고/있거나 그렇지 않으면 획득될 수 있다. 예를 들어, 이러한 디바이스는 여기에 설명된 방법들을 수행하는 수단의 전송을 용이하게 하기 위해 서버에 커플링될 수 있다. 다르게는, 여기에 설명된 다양한 방법들은 저장 수단 (예를 들어, 랜덤 액세스 메모리 (RAM), 판독 전용 메모리 (ROM), 컴팩트 디스크 (CD) 또는 플로피 디스크와 같은 물리적 저장 매체 등) 을 통해 제공될 수 있어서, 모바일 디바이스 및/또는 기지국은 저장 수단을 디바이스에 커플링하거나 제공할 때 다양한 방법들을 획득할 수 있다. 또한, 여기에 설명된 방법들 및 기법들을 디바이스에 제공하는 임의의 다른 적합한 기법이 활용될 수 있다.
청구항들이 상기 예시된 정밀한 구성 및 컴포넌트들에 제한되지 않는다는 것을 이해해야 한다. 다양한 변형물, 변경물 및 변동물들이 청구항들의 범위를 벗어나지 않고 여기에 설명된 시스템들, 방법들, 및 장치들의 배열, 동작 및 상세에서 이루어질 수도 있다.

Claims (55)

  1. 스피치 신호내의 정보의 분실을 방지하는 방법으로서,
    인코딩될 제 1 스피치 프레임을 선택하는 단계 (906);
    제 2 스피치 프레임 및 하나 이상의 인접 스피치 프레임들내의 정보에 기초하여 상기 제 2 스피치 프레임이 임계 스피치 프레임인지를 결정하는 단계 (908);
    상기 제 2 스피치 프레임이 임계 스피치 프레임인 경우에 상기 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 생성하는 단계 (910);
    상기 제 1 스피치 프레임 및 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 적어도 일부를 송신하는 단계 (912, 914); 및
    상기 제 2 스피치 프레임을 송신하는 단계를 포함하고,
    오프셋 값이, 상기 제 2 스피치 프레임의 송신 시간과 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 송신 시간 사이의 간격을 결정하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  2. 제 1 항에 있어서,
    타겟 데이터 레이트를 결정하는 단계 (904); 및
    상기 결정된 타겟 데이터 레이트에 따라 순방향 에러 정정 (FEC) 모드를 선택하는 단계 (902) 를 더 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  3. 제 1 항에 있어서,
    상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부는 상기 제 2 스피치 프레임과 동일한, 스피치 신호내의 정보의 분실을 방지하는 방법.
  4. 제 2 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드는 전체 보호 모드를 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  5. 제 2 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드는 복수의 부분 보호 모드 중 하나를 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  6. 제 1 항에 있어서,
    상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부는 상기 제 2 스피치 프레임내의 상기 정보의 서브세트를 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  7. 제 6 항에 있어서,
    상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부는, 상기 제 2 스피치 프레임을 인코딩하기 위해 사용된 것 보다 낮은 비트 레이트 인코딩 타입을 사용하여 구성되는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  8. 제 1 항에 있어서,
    상기 제 2 스피치 프레임이 임계 스피치 프레임인지를 결정하는 단계는, 상기 제 2 스피치 프레임 및 하나 이상의 인접 스피치 프레임들의 특성들을 분석하는 단계를 더 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  9. 제 1 항에 있어서,
    상기 제 2 스피치 프레임이 임계 스피치 프레임인지를 결정하는 단계는, 상기 제 2 스피치 프레임을 인코딩하기 위해 사용된 스피치 모드에 더 기초하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  10. 제 9 항에 있어서,
    상기 스피치 프레임들의 상기 스피치 모드는, 유성음, 무성음, 과도음 (transient), 안정-유성음 (steady-voiced), 또는 유성음 개시 (onset) 인, 스피치 신호내의 정보의 분실을 방지하는 방법.
  11. 제 1 항에 있어서,
    상기 제 2 스피치 프레임이 임계 스피치 프레임인지를 결정하는 단계는, 상기 제 2 스피치 프레임을 인코딩하기 위해 사용된 스피치 코딩 타입에 더 기초하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  12. 제 11 항에 있어서,
    상기 스피치 코딩 타입은 코드 여기 선형 예측 (CELP), 잡음 여기 선형 예측 (NELP), 또는 프로토타입 피치 주기 (PPP) 를 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  13. 제 5 항에 있어서,
    풀 보호 모드가 선택되면, 상기 부분 보호 모드를 디스에이블하는 단계를 더 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  14. 제 2 항에 있어서,
    상기 제 1 스피치 프레임 및 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부를 송신하기 위해 사용된 채널의 채널 상태 정보에 기초하여 상기 타겟 데이터 레이트를 조정하는 단계를 더 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  15. 제 1 항에 있어서,
    상기 오프셋은 스피치 프레임들을 송신하기 위해 사용된 채널의 채널 상태 정보를 사용하여 추정되고, 상기 오프셋은 동적으로 조정될 수 있는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  16. 제 2 항에 있어서,
    상기 타겟 데이터 레이트를 결정하는 단계는 용량 요구에 기초하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  17. 제 2 항에 있어서,
    상기 타겟 데이터 레이트를 결정하는 단계는 채널 상태 정보의 피드백에 기초하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  18. 제 2 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드를 선택하는 단계는,
    상기 제 2 스피치 프레임의 임계성 레벨을 결정하는 단계;
    상기 타겟 데이터 레이트 보다 높은 제 1 동작 데이터 레이트를 결정하는 단계;
    상기 타겟 데이터 레이트 보다 낮은 제 2 동작 데이터 레이트를 결정하는 단계; 및
    상기 타겟 데이터 레이트를 충족시키기 위한 FEC 모드를 선택하는 단계를 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  19. 제 2 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드는, 상기 모드를 구현하는 스피치 프레임들의 데이터 레이트들의 평균이 상기 타겟 데이터 레이트에 접근하도록 랜덤하게 선택되는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  20. 제 2 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드는, 상기 모드를 구현하는 상기 스피치 프레임의 상기 데이터 레이트가 상기 타겟 데이터 레이트에 접근하도록 선택되는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  21. 제 1 항에 있어서,
    상기 제 2 스피치 프레임이 임계 스피치 프레임인지를 결정하는 단계는, 상기 제 2 스피치 프레임과 하나 이상의 인접 스피치 프레임들 사이의 차이를 계산하는 단계를 포함하고, 상기 제 2 스피치 프레임은, 상기 차이가 소정의 임계값 보다 큰 경우에 임계인, 스피치 신호내의 정보의 분실을 방지하는 방법.
  22. 제 9 항에 있어서,
    상기 제 2 스피치 프레임이 임계 스피치 프레임인지를 결정하는 단계는, 상기 제 2 스피치 프레임의 상기 스피치 모드에 기초하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  23. 제 1 항에 있어서,
    임계 스피치 프레임의 임계성은, 임계 제 2 스피치 프레임 및 인접 스피치 프레임들의 파라미터들, 특징들, 코딩 타입들 및 모드들에 기초하여 결정되는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  24. 제 1 항에 있어서,
    상기 제 1 스피치 프레임 및 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부를 하나 이상의 실시간 프로토콜 (RTP) 패킷들로 팩킹하는 단계를 더 포함하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  25. 제 24 항에 있어서,
    상기 하나 이상의 RTP 패킷들의 포맷은 송신 단말기 및 수신 단말기의 능력들에 기초하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  26. 제 5 항에 있어서,
    상기 부분 보호 모드의 선택은, 상기 제 1 스피치 프레임, 상기 제 2 스피치 프레임, 및 인접 스피치 프레임들의 대역폭 가용성, 상기 타겟 데이터 레이트, 및 특징들에 기초하는, 스피치 신호내의 정보의 분실을 방지하는 방법.
  27. 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스로서,
    제 2 스피치 프레임이 임계 스피치 프레임인지 결정하기 위해 상기 제 2 스피치 프레임 및 하나 이상의 인접 스피치 프레임들내의 정보를 사용하도록 구성된 임계 프레임 식별 모듈 (302);
    상기 제 2 스피치 프레임이 임계 스피치 프레임인 경우에 선택된 순방향 에러 정정 모드에 따라 상기 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 생성하도록 구성된 순방향 에러 정정 (FEC) 모듈 (220, 320); 및
    제 1 스피치 프레임 및 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부를 송신하도록 구성되고, 상기 제 2 스피치 프레임을 송신하도록 구성된 송신기 (112) 를 포함하고,
    오프셋 값이, 상기 제 2 스피치 프레임의 송신 시간과 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 송신 시간 사이의 간격을 결정하는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  28. 제 27 항에 있어서,
    타겟 데이터 레이트; 및
    상기 타겟 데이터 레이트에 따라 상기 순방향 에러 정정 모드를 선택하도록 구성된 레이트 제어 모듈을 더 포함하는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  29. 제 28 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드는, 상기 선택된 순방향 에러 정정 모드에 따라 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부를 생성하도록 구성되는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  30. 제 28 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드는 풀 보호 모드를 포함하는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  31. 제 27 항에 있어서,
    상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부는 상기 제 2 스피치 프레임과 동일한, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  32. 제 28 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드는 복수의 부분 보호 모드 중 하나를 포함하는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  33. 제 27 항에 있어서,
    상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부는 상기 제 2 스피치 프레임내의 상기 정보의 서브세트를 포함하는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  34. 제 27 항에 있어서,
    상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부는, 상기 제 2 스피치 프레임에 대해 사용된 것 보다 낮은 비트 레이트 인코딩 타입을 사용하여 구성되는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  35. 제 27 항에 있어서,
    상기 무선 디바이스는 핸드셋인, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  36. 제 27 항에 있어서,
    상기 무선 디바이스는 기지국인, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  37. 제 29 항에 있어서,
    상기 오프셋은 스피치 프레임들을 송신하기 위해 사용된 채널의 채널 상태 정보를 사용하여 추정되고, 상기 오프셋은 동적으로 조정될 수 있는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  38. 제 28 항에 있어서,
    상기 타겟 데이터 레이트는 용량 요구에 기초하여 결정되는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  39. 제 28 항에 있어서,
    상기 타겟 데이터 레이트는 채널 상태 정보의 피드백에 기초하여 결정되는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  40. 제 28 항에 있어서,
    상기 레이트 제어 모듈은 또한,
    상기 제 2 스피치 프레임의 임계성 레벨을 결정하고;
    상기 타겟 데이터 레이트 보다 높은 제 1 동작 데이터 레이트를 결정하고;
    상기 타겟 데이터 레이트 보다 낮은 제 2 동작 데이터 레이트를 결정하며;
    상기 타겟 데이터 레이트를 충족시키기 위한 순방향 에러 정정 (FEC) 모드를 선택하도록 구성되는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  41. 제 28 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드는, 상기 모드를 구현하는 스피치 프레임들의 데이터 레이트들의 평균이 상기 타겟 데이터 레이트에 접근하도록 랜덤하게 선택되는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  42. 제 28 항에 있어서,
    상기 순방향 에러 정정 (FEC) 모드는, 상기 모드를 구현하는 상기 스피치 프레임의 상기 데이터 레이트가 상기 타겟 데이터 레이트에 접근하도록 선택되는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  43. 제 27 항에 있어서,
    상기 제 2 스피치 프레임이 임계 스피치 프레임인지를 결정하는 것은, 상기 제 2 스피치 프레임과 하나 이상의 인접 스피치 프레임들 사이의 차이를 계산하는 것을 포함하고, 상기 제 2 스피치 프레임은, 상기 차이가 소정의 임계값 보다 큰 경우에 임계인, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  44. 제 27 항에 있어서,
    상기 제 2 스피치 프레임이 임계 스피치 프레임인지를 결정하는 것은, 상기 제 2 스피치 프레임의 상기 스피치 모드에 기초하는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  45. 제 44 항에 있어서,
    상기 스피치 프레임들의 상기 스피치 모드는, 유성음, 무성음, 과도음 (transient), 안정-유성음 (steady-voiced), 또는 유성음 개시인, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  46. 제 27 항에 있어서,
    임계 스피치 프레임의 임계성은, 임계 제 2 스피치 프레임 및 인접 스피치 프레임들의 파라미터들, 특징들, 코딩 타입들 및 모드들에 기초하여 결정되는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  47. 제 27 항에 있어서,
    상기 제 1 스피치 프레임 및 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 상기 적어도 일부는 하나 이상의 실시간 프로토콜 (RTP) 패킷들로 팩킹되는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  48. 제 47 항에 있어서,
    상기 하나 이상의 RTP 패킷들의 포맷은 송신 단말기 및 수신 단말기의 능력들에 기초하는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  49. 제 32 항에 있어서,
    상기 부분 보호 모드의 선택은, 상기 제 1 스피치 프레임, 상기 제 2 스피치 프레임, 및 인접 스피치 프레임들의 대역폭 가용성, 상기 타겟 데이터 레이트, 및 특징들에 기초하는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  50. 제 27 항에 있어서,
    스피치 프레임 및 상기 스피치 프레임 중 일부 또는 전부의 카피를 상이하게 프로세싱하도록 변경된 디-지터 버퍼를 더 포함하는, 스피치 신호내의 정보의 분실을 방지하는 무선 디바이스.
  51. 스피치 신호내의 정보의 분실을 방지하는 장치로서,
    인코딩될 제 1 스피치 프레임을 선택하는 수단 (1006);
    제 2 스피치 프레임 및 하나 이상의 인접 스피치 프레임들내의 정보에 기초하여 상기 제 2 스피치 프레임이 임계 스피치 프레임인지를 결정하는 수단 (1008);
    상기 제 2 스피치 프레임이 임계 스피치 프레임인 경우에 선택된 순방향 에러 정정 (FEC) 모드에 따라 상기 제 2 스피치 프레임의 인코딩된 버전의 적어도 일부를 생성하는 수단 (1010);
    상기 제 1 스피치 프레임 및 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 적어도 일부를 송신하는 수단 (1012, 1014);
    상기 제 2 스피치 프레임을 송신하는 수단; 및
    상기 제 2 스피치 프레임의 송신 시간과 상기 제 2 스피치 프레임의 상기 인코딩된 버전의 송신 시간 사이의 간격을 정의하는 오프셋을 제공하는 수단을 포함하는, 스피치 신호내의 정보의 분실을 방지하는 장치.
  52. 스피치 신호내의 정보의 분실을 방지하는 컴퓨터 프로그램 제품으로서,
    상기 컴퓨터 프로그램 제품은, 제 1 항 내지 제 22 항 중 어느 한 항에 기재된 방법을 실행하는 명령들을 갖는 컴퓨터 판독가능한 매체를 포함하는, 컴퓨터 프로그램 제품.
  53. 삭제
  54. 삭제
  55. 삭제
KR1020127000170A 2009-06-04 2010-06-03 스피치 프레임내의 정보의 분실을 방지하는 시스템 및 방법 KR101301843B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/478,492 2009-06-04
US12/478,492 US8352252B2 (en) 2009-06-04 2009-06-04 Systems and methods for preventing the loss of information within a speech frame
PCT/US2010/037310 WO2010141762A1 (en) 2009-06-04 2010-06-03 Systems and methods for preventing the loss of information within a speech frame

Publications (2)

Publication Number Publication Date
KR20120024934A KR20120024934A (ko) 2012-03-14
KR101301843B1 true KR101301843B1 (ko) 2013-08-30

Family

ID=42340364

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127000170A KR101301843B1 (ko) 2009-06-04 2010-06-03 스피치 프레임내의 정보의 분실을 방지하는 시스템 및 방법

Country Status (8)

Country Link
US (1) US8352252B2 (ko)
EP (1) EP2438701B1 (ko)
JP (1) JP5587405B2 (ko)
KR (1) KR101301843B1 (ko)
CN (1) CN102461040B (ko)
BR (1) BRPI1011637B1 (ko)
TW (1) TWI464734B (ko)
WO (1) WO2010141762A1 (ko)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9026434B2 (en) * 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
US9047863B2 (en) 2012-01-12 2015-06-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for criticality threshold control
US9275644B2 (en) * 2012-01-20 2016-03-01 Qualcomm Incorporated Devices for redundant frame coding and decoding
US9236053B2 (en) * 2012-07-05 2016-01-12 Panasonic Intellectual Property Management Co., Ltd. Encoding and decoding system, decoding apparatus, encoding apparatus, encoding and decoding method
AU2013287309B2 (en) * 2012-07-09 2015-12-24 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for distributing information during broadcast delivery
CN103796345B (zh) * 2012-10-30 2018-01-05 中兴通讯股份有限公司 一种提升tfo的语音质量的方法及装置
CN103812824A (zh) * 2012-11-07 2014-05-21 中兴通讯股份有限公司 音频多编码传输方法及相应装置
US9263054B2 (en) * 2013-02-21 2016-02-16 Qualcomm Incorporated Systems and methods for controlling an average encoding rate for speech signal encoding
WO2014180794A1 (en) 2013-05-05 2014-11-13 Lantiq Deutschland Gmbh Low power modes for data transmission from a distribution point
CN103280222B (zh) * 2013-06-03 2014-08-06 腾讯科技(深圳)有限公司 音频编码、解码方法及其***
GB201316575D0 (en) * 2013-09-18 2013-10-30 Hellosoft Inc Voice data transmission with adaptive redundancy
US9209929B2 (en) 2013-09-19 2015-12-08 International Business Machines Corporation Managing quality of service for communication sessions
US10614816B2 (en) * 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
JP6433146B2 (ja) * 2014-04-22 2018-12-05 キヤノン株式会社 情報処理装置、システム、情報処理方法、コンピュータプログラム
GB2527365B (en) 2014-06-20 2018-09-12 Starleaf Ltd A telecommunication end-point device data transmission controller
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9680507B2 (en) * 2014-07-22 2017-06-13 Qualcomm Incorporated Offset selection for error correction data
US9712287B2 (en) * 2014-07-31 2017-07-18 Qualcomm Incorporated System and method of redundancy based packet transmission error recovery
US9913167B2 (en) 2015-02-02 2018-03-06 Accelerated Media Technologies, Inc. Systems and methods for assigning bit rate
US9948578B2 (en) * 2015-04-14 2018-04-17 Qualcomm Incorporated De-jitter buffer update
IL239333B (en) 2015-06-10 2020-06-30 Elta Systems Ltd A system for creating, transmitting and receiving additional signals and the useful methods by the way
JP2017009663A (ja) * 2015-06-17 2017-01-12 ソニー株式会社 録音装置、録音システム、および、録音方法
US10313685B2 (en) 2015-09-08 2019-06-04 Microsoft Technology Licensing, Llc Video coding
US10595025B2 (en) * 2015-09-08 2020-03-17 Microsoft Technology Licensing, Llc Video coding
US20170084280A1 (en) * 2015-09-22 2017-03-23 Microsoft Technology Licensing, Llc Speech Encoding
US10504525B2 (en) * 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
US10142049B2 (en) 2015-10-10 2018-11-27 Dolby Laboratories Licensing Corporation Near optimal forward error correction system and method
US10049682B2 (en) * 2015-10-29 2018-08-14 Qualcomm Incorporated Packet bearing signaling information indicative of whether to decode a primary coding or a redundant coding of the packet
US20170187635A1 (en) * 2015-12-28 2017-06-29 Qualcomm Incorporated System and method of jitter buffer management
US10447430B2 (en) 2016-08-01 2019-10-15 Sony Interactive Entertainment LLC Forward error correction for streaming data
CN107241166A (zh) 2017-06-12 2017-10-10 京信通信***(中国)有限公司 一种长期演进上的语音Volte数据保障方法和设备
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
US11271685B2 (en) 2017-12-29 2022-03-08 Limited Liability Company “Radio Gigabit” Method of hybrid automatic repeat request implementation for data transmission with multilevel coding
RU2674316C1 (ru) * 2017-12-29 2018-12-06 Общество с ограниченной ответственностью "Радио Гигабит" Способ реализации гибридного автоматического запроса на передачу при использовании многоуровневого кодирования данных
CN110890945B (zh) * 2019-11-20 2022-02-22 腾讯科技(深圳)有限公司 数据传输方法、装置、终端及存储介质
CN110838894B (zh) * 2019-11-27 2023-09-26 腾讯科技(深圳)有限公司 语音处理方法、装置、计算机可读存储介质和计算机设备
CN112820306B (zh) * 2020-02-20 2023-08-15 腾讯科技(深圳)有限公司 语音传输方法、***、装置、计算机可读存储介质和设备
CN112767953B (zh) * 2020-06-24 2024-01-23 腾讯科技(深圳)有限公司 语音编码方法、装置、计算机设备和存储介质
CN112767955B (zh) * 2020-07-22 2024-01-23 腾讯科技(深圳)有限公司 音频编码方法及装置、存储介质、电子设备
TWM619473U (zh) * 2021-01-13 2021-11-11 神盾股份有限公司 語音助理系統
CN116959458A (zh) * 2022-04-18 2023-10-27 腾讯科技(深圳)有限公司 音频传输方法、装置、终端、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000022906A (ko) * 1998-09-03 2000-04-25 루센트 테크놀러지스 인크 무선 통신 설비로 전송된 음성 신호의 질을 향상시키기위한 방법 및 장치
US6141353A (en) 1994-09-15 2000-10-31 Oki Telecom, Inc. Subsequent frame variable data rate indication method for various variable data rate systems
US6611804B1 (en) 1999-06-15 2003-08-26 Telefonaktiebolaget Lm Ericsson (Publ) Universal TTY/TDD devices for robust text and data transmission via PSTN and cellular phone networks
KR20040076857A (ko) * 2001-10-29 2004-09-03 엠피네트 인터네셔널, 인크. 멀티미디어 통신을 위한 방법, 시스템 및 데이터 구조

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331069A (ja) * 1998-02-24 1999-11-30 Lucent Technol Inc ディジタルコ―ドレス電話機のベ―スバンドプロセッサ
US6785262B1 (en) * 1999-09-28 2004-08-31 Qualcomm, Incorporated Method and apparatus for voice latency reduction in a voice-over-data wireless communication system
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
EP1376537B1 (en) * 2002-05-27 2009-04-08 Pioneer Corporation Apparatus, method, and computer-readable recording medium for recognition of keywords from spontaneous speech
US7133934B1 (en) * 2002-08-27 2006-11-07 Mindspeed Technologies, Inc. Adaptive error correction for communications over packet networks
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
TWI315865B (en) * 2004-11-03 2009-10-11 Nokia Corp Method and device for low bit rate speech coding
TWI297987B (en) * 2004-11-23 2008-06-11 Miracom Technology Co Ltd The apparatus for providing data service between mobile and mobile in wireless communication system
CA2649667C (en) * 2006-04-29 2014-08-26 Thomson Licensing Seamless handover of multicast sessions in internet protocol based wireless networks using staggercasting
CN101098173A (zh) * 2006-06-30 2008-01-02 华为技术有限公司 动态调整无线网络中传输的业务服务质量的方法
CN101573951B (zh) * 2006-12-07 2012-12-12 适应性频谱和信号校正股份有限公司 Dsl响铃信号兼容

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6141353A (en) 1994-09-15 2000-10-31 Oki Telecom, Inc. Subsequent frame variable data rate indication method for various variable data rate systems
KR20000022906A (ko) * 1998-09-03 2000-04-25 루센트 테크놀러지스 인크 무선 통신 설비로 전송된 음성 신호의 질을 향상시키기위한 방법 및 장치
US6611804B1 (en) 1999-06-15 2003-08-26 Telefonaktiebolaget Lm Ericsson (Publ) Universal TTY/TDD devices for robust text and data transmission via PSTN and cellular phone networks
KR20040076857A (ko) * 2001-10-29 2004-09-03 엠피네트 인터네셔널, 인크. 멀티미디어 통신을 위한 방법, 시스템 및 데이터 구조

Also Published As

Publication number Publication date
JP5587405B2 (ja) 2014-09-10
TWI464734B (zh) 2014-12-11
TW201131550A (en) 2011-09-16
WO2010141762A1 (en) 2010-12-09
EP2438701B1 (en) 2014-07-30
US8352252B2 (en) 2013-01-08
CN102461040A (zh) 2012-05-16
EP2438701A1 (en) 2012-04-11
BRPI1011637B1 (pt) 2021-01-19
BRPI1011637A2 (pt) 2018-02-27
JP2012529243A (ja) 2012-11-15
KR20120024934A (ko) 2012-03-14
CN102461040B (zh) 2014-10-22
US20100312552A1 (en) 2010-12-09

Similar Documents

Publication Publication Date Title
KR101301843B1 (ko) 스피치 프레임내의 정보의 분실을 방지하는 시스템 및 방법
US10424306B2 (en) Frame erasure concealment for a multi-rate speech and audio codec
KR101290425B1 (ko) 소거된 스피치 프레임을 복원하는 시스템 및 방법
US7519535B2 (en) Frame erasure concealment in voice communications
CN112786060B (zh) 用于对音频内容进行编码和解码的编码器、解码器和方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190624

Year of fee payment: 7