TWI439086B - 顫動緩衝器調整技術 - Google Patents
顫動緩衝器調整技術 Download PDFInfo
- Publication number
- TWI439086B TWI439086B TW096130721A TW96130721A TWI439086B TW I439086 B TWI439086 B TW I439086B TW 096130721 A TW096130721 A TW 096130721A TW 96130721 A TW96130721 A TW 96130721A TW I439086 B TWI439086 B TW I439086B
- Authority
- TW
- Taiwan
- Prior art keywords
- time
- response time
- estimated
- delay
- adjustment
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
- H04L43/087—Jitter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/22—Traffic shaping
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/28—Flow control; Congestion control in relation to timing considerations
- H04L47/283—Flow control; Congestion control in relation to timing considerations in response to processing delays, e.g. caused by jitter or round trip time [RTT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/90—Buffering arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/90—Buffering arrangements
- H04L49/9023—Buffering arrangements for implementing a jitter-buffer
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
- Dc Digital Transmission (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Communication Control (AREA)
- Telephone Function (AREA)
Description
本發明係有關一種顫動緩衝器調整技術。
針對語音傳輸目的,可在發送器上編碼語音訊框、經由網路來發送、並且再次地在接收器上解碼以對使用者呈現。
在發送器沒有活動語音需要發送的期間中,可關閉語音訊框的正常傳輸動作。此稱為不連續傳輸(DTX)機構。當沒有有用資訊需要發送時,不連續傳輸機構可節省傳輸資源。例如,在一會談中,通常一次僅有一位牽涉在內的人士正在談話,這暗示著平均來說,在大約百分之五十的時間中,呈一方向的信號僅含容活動語音。發送器可在該等期間中產生描述出現在發送器上之背景雜訊的一組舒適雜訊參數。可把該等舒適雜訊參數傳送到接收器。舒適雜訊參數的傳送動作通常於縮減位元率進行,及/或以低於語音訊框的傳輸區間進行該傳輸動作。接收器可隨後使用所接收到的舒適雜訊參數來合成一人造、似雜訊的信號,其特徵近似於出現在發送器上的背景雜訊。
例如,在適應性多重位元率(AMR)語音編碼解碼器以及AMR寬頻(AMR-WB)語音編碼解碼器中,將在活動語音期間中以20 ms的區間產生一新進語音訊框。一旦檢測到一活動語音期間結束,該不連續傳輸機構將使編碼器處於活動狀態達另外7個訊框,以形成一殘留(hangover)期間。此期間係用於一接收端以製備用以非語音期間中產生舒適雜訊的一項背景雜訊預估。在該殘留期間之後,傳輸動作便被切換為舒適雜訊狀態,其中將以靜寂描述幀(SID)訊框於160 ms區間傳送已更新的舒適雜訊參數。在一新進會談的開始,將把發送器設定為活動狀態。此暗示著一新進會談的至少前面7個訊框將受到編碼並且作為語音來發送,即便該音訊信號並不包括語音。
在DTX實例中,可透過封包交換網路(例如網際網路)把包括語音訊框的音訊信號以及舒適雜訊參數從一發送器發送至一接收器。
封包交換通訊的本質典型地對封包的傳輸時間帶來變化,稱為顫動,其為接收器視為於不規則區間到達的封包。除了封包遺失狀況之外,網路顫動為主要的障礙,尤其是利用封包交換網路提供的會談式語音服務。
更確切來說,即時運作之音訊接收器的音訊重放部件需要一持續輸入來維持良好的聲音品質。即使是短暫的中斷,都應該要避免。因此,如果包含音訊訊框的某些封包僅在需要進行解碼以及進一步處理的音訊訊框之後到達,該等封包以及所包括的音訊訊框將因著過晚到達的關係而被視為遺失的。音訊解碼器將進行錯誤隱匿功能,以補償遺失訊框攜載的音訊信號。明顯地,大範圍的錯誤隱藏動作亦會降低聲音品質。
典型地,將因此使用一顫動緩衝器來隱藏不規則封包到達時間並且提供一連續輸入給解碼器以及一後續音訊重放部件。該顫動緩衝器儲存此終端進入音訊訊框達一段預定時間。例如,可在接收到一封包串的第一封包時指定此時間。然而,一顫動緩衝器將帶來一額外延遲部件,因為所接收到的封包係在進行進一步處理之前就先被儲存起來。此動作可增加端對端延遲。可使一顫動緩衝器特徵化,例如利用平均緩衝延遲以及所有已接收訊框間的所得延遲訊框比例。
使用固定重放時序的顫動緩衝器無可避免地成為一種低度端對端延遲以及一種低延遲訊框量之間的妥協,且找出最理想的交換方式並不是容易的任務。雖然可以有能預估預期顫動量以維持於預定限度內的特殊環境以及應用方式,該顫動可大致上不同,從0到數百微秒,甚至在相同會談內。利用一種固定重放時序並結合設定為夠大數值以根據預期最差情景來涵蓋顫動的最初緩衝延遲將能控制延遲訊框量,然同時間會產生端對端延遲的風險,此種延遲因為過長而無法致能自然會談。因此,在透過封包交換網路運作的大部分音訊傳輸應用程式中,套用一固定緩衝動作並不是最佳的選擇。
一種適應性顫動緩衝器管理技術可用來動態地控制一充分短延遲以及一充分低延遲訊框量之間的平衡。在此方法中,將持續地監看進入封包串,並且根據所觀察到之進入封包串的延遲行為變化來調整緩衝延遲。如果傳輸延遲看似增加或者顫動狀況變得較糟,將增加緩衝延遲以符合網路狀況。在相反的情況中,可縮減緩衝延遲,且可因此最小化整體的端對端延遲。
本發明以控制端對端延遲作為適應性顫動緩衝器管理技術之一項挑戰的觀點來考量。在一種典型狀況中,接收器並不具有端對端延遲的任何資訊。因此,適應性顫動緩衝器管理技術典型地僅藉著使延遲訊框量維持在一所欲臨界值之下來進行調整。儘管可使用此方法以在多種傳輸狀況中使語音品質保持於可接受位準,在某些狀況中,調整動作將使端對端延遲增加而高於可接受位準,且因此使自然會談無法進行。
本發明提出一種方法,其包含下列步驟:在一第一裝置上利用作為一參數的一預估延遲來判定一顫動緩衝器的一所欲調整量,該延遲包含在一會談中呈至少一方向的至少一端對端延遲。係針對該會談透過一封包交換網路在該第一裝置與一第二裝置之間發送呈封包形式的語音信號。該方法另包含根據該經判定的調整量來進行該顫動緩衝器的一調整動作。
再者,本發明提出一種設備,其包含一控制部件,其係組配為在一第一裝置上利用作為一參數的一預估延遲來判定一顫動緩衝器的一所欲調整量,該延遲包含在一會談中呈至少一方向的至少一端對端延遲。係針對該會談透過一封包交換網路在該第一裝置與一第二裝置之間發送呈封包形式的語音信號。該設備另包含一調整部件,其係組配為根據該經判定調整量來進行該顫動緩衝器的一調整動作。
可把控制部件以及調整部件實行於硬體及/或軟體中。例如,該設備可為一音訊接收器、一音訊收發器等。可另以晶片形式或較複雜裝置形式來實行該設備。
再者,本發明提出一種電子裝置,其包含本發明請求的設備以及一音訊輸入部件,如麥克風,以及一音訊輸出部件,如揚聲器。
再者,本發明提出一種系統,其包含本發明請求的電子裝置以及另一個電子裝置。該另一個電子裝置係組配為能透過封包交換網路與該第一電子裝置交換用於一會談的語音信號。
最後,本發明提出一種當中一程式碼係儲存在一電腦可讀媒體中的電腦程式產品。該程式碼在受一處理器執行時實現本發明請求的方法。
例如,該電腦程式產品可為一種分別記憶體裝置,或者為一種整合在電子裝置中的記憶體等。
本發明涵蓋獨立於一電腦程式產品的該種電腦程式碼以及一種電腦可讀媒體。
藉著在調整顫動緩衝器時考量呈至少一方向的端對端延遲,可改善適應性顫動緩衝器效能。如果除了訊框量之外,另考量在排程解碼時間之後才到達之呈至少一方向的端對端延遲,可發現該等二個面向之間的最佳交換動作。
在排程解碼時間之後到達的訊框係典型地由緩衝器丟棄,因為該解碼器已經因為晚到達的原因而利用錯誤隱匿功能來置換它們。以解碼器的觀點來看,該等訊框將因此被視為遺失訊框。該等訊框的數量亦因此被稱為過晚遺失率。
例如,所考量的預估延遲可為預估單向端對端延遲或者為預估雙向端對端延遲。例如,單向端對端延遲可為一裝置之使用者開始談話的時間以及另一裝置之使用者開始傾聽語音之間的延遲。以下將把雙向端對端延遲稱為響應時間。
在會談式狀況中,以使用者的角度來看,可能仍然會把該會談的互動性視為比單向端對端延遲來得重要。一種用於該種互動性的測量方式為由已停止談話且正等待要傾聽回應之使用者所經歷的響應時間,且除了雙向傳輸與處理延遲之外,可包括使用者反應時間。因此將針對一實施例提出的是,預估響應時間將作為用以選出適應性顫動緩衝器之最適合調整方式的特定預估延遲。例如,該預估響應時間可為來自第一裝置之使用者之一語音區段的結束以及由第一裝置呈現出之來自第二裝置之使用者之一語音區段的開始之間的時間。
在本發明的一實施例中,判定一調整量的動作包含判定該數量,因此只要該預估延遲低於一第一臨界值,便使在排程解碼時間之後到達的訊框量維持為低於一第一限度。此外,將判定該調整量,因此當該預估延遲超出該第一臨界值時,便使在排程解碼時間之後到達的訊框量維持為低於一第二限度,例如介於該等第一臨界值以及第二且較高臨界值之間。
該第一臨界值、該第二臨界值、該第一限度、以及該第二限度可為預定值。然而,替代地,一或多個該等數值可為彈性的。例如,可把第二限度計算為預估延遲的一函數。利用一段預估較長延遲,可使用較高的第二限度。此概念是當延遲變得較高而導致互動性降低時,將允許過晚遺失率,以藉著增加緩衝時間而使過晚遺失率維持為低的來避免進一步地增加延遲。
可藉著使用任何可得機構來以預估該延遲。該預估可根據可得資訊或依據專屬的測量結果。
例如,可使用一種外部時間參考式方法,例如針對RFC 3550中即時傳輸協定(RTP)/即時控制協定(RTCP)說明的網路時間協定(NTP)式方法:2003年7月由H.Schulzrinne等人發表的〝RTP:一種用於即時應用程式的傳輸協定〞。
如果使用一段預估響應時間作為一段預估延遲,亦可在考量了一會談的大致結構之後,大約地預估該段響應時間。通常把一會談劃分為會談式轉折,其中一方正在談話而另一方正在傾聽。可利用此種會談結構來預估響應時間。
可因此把響應時間預估為檢測到第一裝置之使用者在第一裝置上從談話切換到傾聽之時間以及檢測到第二裝置之使用者在第一裝置上從傾聽切換到談話之時間之間的一段期間。
一電子裝置通常知悉其本身的傳輸與接收狀態,且此種知悉狀況可用來預估行為的變化以作為響應時間的基礎。
例如,在檢測到第二裝置之使用者從傾聽切換到談話的預估時間為在已經接收了不包含活動語音之一語音信號的至少一區段之後,第一裝置透過該封包交換網路接收包含活動語音之該語音信號之一第一區段的一時間。例如,第一裝置的解碼器可提供已接收語音信號內容之目前類型的一項指示、特定內容類型出現的一項指示、內容改變的一項指示。內容類型表示第一裝置的目前接收狀態以及第二裝置的目前傳輸狀態。例如,接收到舒適雜訊訊框的動作表示第二裝置的使用者正在傾聽,而接收到語音訊框的動作表示該第二裝置的使用者正在談話。
檢測到第一裝置之使用者從談話切換到傾聽的預估時間可為該第一裝置開始產生舒適雜訊參數的時間。該第一裝置的編碼器可提供一項對應指示。
替代地,如果該電子裝置使用語音活動檢測(VAD),在檢測到第一裝置之使用者從談話切換到傾聽的預估時間為該第一裝置的語音活動檢測部件把一旗標設定為指出欲透過該封包交換網路傳送之一語音信號的一目前區段並不含容語音之一數值的一時間。該第一裝置的VAD部件可提供一項對應指示。如果使用一段DTX殘留期間,相較於表示產生了舒適雜訊的一項指示,VAD部件設定的一旗標可提供有關一語音區段結束的較快速以及較正確資訊。
例如,在網際網路語音協定(VoIP)中,VoIP客戶機可根據語音活動檢測的目前結果以及根據不連續傳輸操作的狀態而知悉其本身的傳輸狀態。
必須注意的是,除了控制適應性顫動緩衝器之外,所提出的大約預估響應時間選擇亦可用於其他目的。再者,它是一種有用的額外服務品質制度。
本發明可用於針對語音信號而使用適應性顫動緩衝器的任何應用程式。實例之一為使用AMR或AMR-WB編碼解碼器的VoIP。
要了解的是,所有展示出的例示實施例亦可用於任何適當組合中。
可從下面的詳細說明並結合圖式而清楚地了解本發明的其他目的與特徵。然而,要了解的是,該等圖式並非單單設計為用於展示目的,然本發明的範圍並不受其界定,而是受到申請專利範圍的界定。另外應該了解的是,該等圖式並非按照比例來繪製,且它們僅意圖概念化地展示出本發明所述的結構與程序。
第1圖為一概要方塊圖,其展示出根據本發明一實施例的一種系統;第2圖展出一種會談結構;第3圖為一流程圖,其展示出第1圖之該系統中之一種用以預估一會談中之一段目前響應時間的操作;第4圖為一流程圖,其展示出第1圖之該系統中之一種用以根據一段目前響應時間來調整一顫動緩衝的操作;以及第5圖為一概要方塊圖,其展示出根據本發明另一實施例的一種電子裝置。
第1圖為一概要方塊圖,其展示出根據本發明一實施例的一種例示系統,該系統致能根據一段預估響應時間來調整適應性顫動緩衝的動作。
該系統包含第一電子裝置110、第二電子裝置150、以及使該等二個裝置110、150互連的封包交換通訊網路160。例如,封包交換通訊網路160可為網際網路或者包含網際網路。
電子裝置110包含音訊接收器111、連接到音訊接收器111之輸出端的重放部件118、音訊發送器122、連接到音訊發送器122之輸入端的麥克風121、以及連接到音訊接收器111以及音訊發送器122二者的響應時間(Tresp
)預估部件130。Tresp
預估部件130另連接到計時器131。裝置110連接於封包交換通訊網路160的一介面(未展示)係在電子裝置110內部連接到音訊接收器111的輸入端以及音訊發送器122的輸出端。
例如,音訊接收器111、音訊發送器122、Tresp
預估部件130、以及計時器131可實行於單一晶片140或者一晶片組中。
音訊接收器111之輸入端的一邊係在音訊接收器111中連接至顫動緩衝器112,而其另一邊則連接至網路分析器113。顫動緩衝器112透過解碼器114與調整部件115連接至音訊接收器111的輸出端,且因此連接至重放部件118。網路分析器113的控制信號輸出端連接至控制部件116的第一控制輸入端,而顫動緩衝器112的控制信號輸出端則連接至控制部件116的第二控制輸入端。控制部件116的控制信號輸出端另連接至調整部件115的控制輸入端。
例如,重放部件118可包含揚聲器。
電子裝置110之音訊發送器122的輸入端透過類比對數位轉換器(ADC)123而在音訊接收器122中連接至編碼器124。例如,編碼器124可包含語音編碼器125、語音活動檢測(VAD)部件126、以及舒適雜訊參數產生器127。
將把Tresp
預估部件130配置為接收來自解碼器114以及編碼器124的輸入。Tresp
預估部件130的輸出端連接至控制部件116。
可把電子裝置110視為代表根據本發明之一種電子裝置的例示實施例,而把晶片140視為代表根據本發明之一種設備的例示實施例。
要了解的是,並未展示出電子裝置110位於音訊接收器111與音訊發送器122內部以及外部的各種不同部件,且所展示出的任何鏈結可同樣地表示透過未展示出之其他部件來連接的鏈結。例如,電子裝置110包含連接至網路160之上述介面以外的介面。此外,它可包含用於傳輸鏈的一種分別不連續傳輸控制部件、一通道編碼器、以及一封包器。再者,它可包含用於接收鏈的一解封包器、一通道解碼器、以及一數位對類比轉換器等。再者,可良好地以整合收發器形式來實現音訊接收器111與音訊發送器122。再者,亦可把Tresp
預估部件130與計時器131整合到音訊接收器111、音訊發送器122、或者一音訊收發器中。
可利用相同於電子裝置110的方式來實行電子裝置150,但並非強制性的。然它應該被組配為能透過網路160且利用與電子裝置110所使用之編碼解碼器相容的一種編碼解碼器而於不連續傳輸動作中接收與發送音訊封包。為了展示出該等收發性能,係把電子裝置150展示為包含音訊收發器(TRX)151。
例如,在電子裝置110、150中進行的音訊信號編碼與解碼動作可根據AMR編碼解碼器或AMR-WB編碼解碼器來進行。
電子裝置110與電子裝置150可由個別使用者透過封包交換通訊網路160用於VoIP會談中。
在一項進行中VoIP會談中,麥克風121在電子裝置110的環境中記錄下音訊信號,特別是使用者A發出的語音。麥克風121把所記錄下的類比音訊信號轉送到音訊發送器122。在音訊發送器122中,該類比音訊信號係由ADC 123轉換為一數位信號,並且提供給編碼器124。在編碼器124中,VAD部件126檢測目前音訊信號是否包含活動語音。當檢測到活動語音時,它便把VAD旗標設定為'1',而如果並未檢測到活動語音,它便把VAD旗標設定為'0'。如果把VAD旗標設定為'1',語音編碼器125便把目前音訊訊框編碼為活動語音訊框。否則,舒適雜訊參數產生器127將產生SID訊框。SID訊框包含描述發送端之背景雜訊的35位元舒適雜訊參數,而並沒有活動語音出現。將隨後使活動語音訊框與SID訊框受到通道編碼、封包化、並且透過封包交換通訊網路160發送到電子裝置150。係以20 ms的間隔來發送活動語音訊框,而以160 ms的間隔來發送SID訊框。
在電子裝置150中,音訊收發器151處理所接收到的封包,以便能夠對使用者B呈現一對應重建構音訊信號。再者,音訊收發器151處理在電子裝置150環境中記錄下的音訊信號,特別是使用者B發出的語音,這相似於音訊發送器122處理在電子裝置110環境中記錄下的音訊信號。所得封包透過封包交換通訊網路160發送到電子裝置110。
電子裝置110接收該等封包、使該等封包解封包化、並且對所含容的音訊訊框進行通道解碼。
隨後將使用顫動緩衝器112來儲存所接收到的音訊訊框,而同時該等訊框正等待著受到解碼與重放。顫動緩衝器112具有能把所接收訊框配置為正確解碼順序的效能以及提供經配置訊框的效能,或者具有有關遺失訊框的資訊--在受到要求時依序地配置到解碼器114。此外,顫動緩衝器112對控制部件116提供有關其狀態的資訊。網路分析器113計算出根據訊框接收統計數字以及已接收訊框時序來說明目前接收特徵的一組參數,並且提供該組參數給控制部件116。根據所接收到的資訊,控制部件116判定出需要改變緩衝延遲,並且給予調整部件115對應的時間縮放命令。大致上,最佳平均緩衝延遲為能最小化緩衝時間的延遲,而在排程解碼時間之後,解碼器114中並沒有任何晚到訊框。然而,將根據本發明來添補控制部件116,以考量從Tresp
預估部件130接收到的額外資訊,如以下詳細解說地。
每當重放部件118要求新資料時,解碼器114使來自緩衝器112的音訊訊框恢復。它解碼所恢復的音訊訊框,並且把已解碼訊框轉送到調整部件115。當接收到已編碼語音訊框時,該已編碼語音訊框便被解碼以取得經解碼語音訊框。當接收到SID訊框時,將根據所包含的舒適雜訊參數來產生舒適雜訊,並且分配給形成解碼訊框的一串舒適雜訊訊框。調整部件115進行控制部件116要求的縮放動作,即它可增長或縮短已接收到的解碼訊框。將對重放部件118提供經過解碼以及可能經過時間縮放的訊框,以供對使用者A呈現。
第2圖展示出使用者A與使用者B之間的一種會談結構,該結構係根據裝置110的使用者A正在談話而裝置150的使用者B正在傾聽的一項假設,且反之亦然。
當使用者A談話時(201),使用者B以某種延遲TAtoB
而傾聽到(202),TAtoB
為從使用者A到使用者B的傳輸時間。當使用者B注意到使用者A已停止談話,使用者B將在反應時間Treact
之後回覆。
當使用者B談話時(203),使用者A以某種延遲TBtoA
而傾聽到(204),TBtoA
為從使用者B到使用者A的傳輸時間。
使用者A所經歷之從使用者A停止談話到使用者A開始傾聽到來自使用者B聲音之時間的期間稱為從使用者A到使用者B再返回使用者A的響應時間Tresp
。可用下列方程式表示此響應時間Tresp
:Tresp =
TAtoB
+Treact
+TBtoA
。
應該要注意的是,這是針對完整響應時間的一種簡化模型。例如,此模型並未明確地展示出緩衝延遲,以及所使用之語音處理部件中的演繹法與處理延遲,然係假設它們包含在傳輸時間TAtoB
與TBtoA
中。儘管使用者A之裝置中的緩衝延遲為響應時間的一個重要部份,可容易地在使用者A的裝置中找到此延遲部件。除此之外,相關面向為響應時間的雙向本質。應該亦要注意的是,響應時間未必是對稱的。因為不同的路由及/或鏈結行為,響應時間A-B-A可不同於響應時間B-A-B。再者,使用者A與使用者B的反應時間可能不同。
從使用者的觀點來看,由個別響應時間Tresp
表示的會談互動性為一個重要面向。換言之,個別響應時間Tresp
不應該變得過長。
電子裝置110的Tresp
預估部件130係用來預估目前響應時間Tresp
。
第3圖為一流程圖,其展示出由Tresp
預估部件130進行而用以判定響應時間Tresp
的一項操作。
編碼器124係組配為每當已接收音訊信號的內容從活動語音轉變為背景雜訊時,便對Tresp
預估部件130提供一指示。
每當舒適雜訊參數產生器127在一段活動語音期間之後開始產生舒適雜訊參數時,編碼器124可傳送一對應中斷,其表示使用者A已經停止談話。
然而,在某些編碼解碼器中,如AMR以及AMR-WB編碼解碼器,不連續傳輸(DTX)機構使用一種DTX殘留期間。換言之,只在語音編碼器127編碼了接續一語音叢訊而沒有活動語音的7個訊框時,才把編碼動作從語音模式切換為舒適雜訊模式。於此,可藉著監看表示目前訊框之語音活動的VAD旗標狀態,來早點檢測到從"談話"變換到"傾聽"的動作。
解碼器114係組配為在它已收到僅具有舒適雜訊參數的訊框之後接收到具有活動語音的第一訊框時,對Tresp
預估部件130提供一指示。該種轉變表示使用者B已經從"傾聽"轉換到〝談話〞。
為了判定響應時間Tresp
,Tresp
預估部件130監看它是否接收到來自編碼器124而表示產生舒適雜訊參數之開始的一中斷(步驟301)。替代地,Tresp
預估部件130監看VAD部件126提供而表示一語音叢訊之結束的VAD旗標是否從'1'轉變到'0'(步驟302)。此種替代方式係以虛線展示於第3圖中。二種替代方式均適於通知Tresp
預估部件130使用者A已從"談話"轉變為"傾聽"。
如果檢測到產生了舒適雜訊參數或檢測到一語音叢訊的結束,Tresp
預估部件130便啟動計時器131(步驟303)。
儘管計時器131從0開始計算經過的時間,Tresp
預估部件130監看它是否接收到來自解碼器114而表示使用者B已經從"傾聽"轉換到"談話"的一指示(步驟304)。
當檢測到該種轉換時,Tresp
預估部件130便停止計時器131(步驟305),並且讀取所計算的時間(步驟306)。
將把該計算時間作為響應時間Tresp
提供給控制部件116。
可同樣地把第3圖的方塊視為Tresp
預估部件130的子部件。換言之,可把方塊301或302以及方塊304視為檢測部件,而把方塊303、305與306視為計時器存取部件,其均組配為能進行所表示的功能。
如果使用者A與B交替地談話,而非同時間談話,所表示的機構僅提供一種有用的結果。例如,在其他使用者已結束其會談式轉向之前,該等使用者中之一已給予回應時,可因此顧慮到此部分以避免使預估結果出錯。於此,可能可把解碼器114組配為表示出它何時開始接收訊框達一段新語音叢訊。當最後從解碼器114接收到的資訊並未表示使用者B已開始談話時,Tresp
預估部件130可隨後考量表示出使用者A僅在步驟301或302開始傾聽的一指示。
儘管所表示的操作僅針對響應時間Tresp
提供相對粗略的預估,它仍可被視為用於適應性顫動緩衝器管理方式的有用資訊。然必須要注意的是,亦必須以某些其他方式來評估或測量響應時間Tresp
,例如依據上述RFC 3550文件所述的方式。
第4圖為一流程圖,其展示出一種由控制部件116進行而根據響應時間Tresp
來調整顫動緩衝器的操作。
在控制部件116中,係針對響應時間Tresp
來設定第一、較低預定臨界值THR1以及第二、較高預定臨界值THR2。此外,將針對已接收訊框的過晚遺失率(LLR)來設定第一、較低預定限度LLR1以及第二、較高預定限度LLR2。如上所示,過晚遺失率為在排程解碼時間之後才到達的訊框量。換言之,過晚遺失率可對應於重放部件118向解碼器114要求的訊框量,但因為過晚到達的原因,解碼器114並無法從緩衝器112恢復該訊框量,且因此將把該訊框量視為解碼器114所遺失且典型地由錯誤隱匿功能置換的訊框量。
根據ITU-T推薦方案G.114,200 ms以下的端對端延遲並不被視為降低會談品質,而因為縮減的互動性,400 ms以上的端對端延遲則被視為導致無法令人接受的會談品質。有鑑於此推薦方案,可把臨界值THR1設為400 ms,且可把臨界值THR2設為800 ms。再者,可把設定過晚遺失率的限度,例如LLR1=0%以及LLR2=1.5%。
然而,亦可由控制部件116計算該第二、較高限度LLR2,作為已接收預估響應時間Tresp
的一函數。換言之,較高限度LLR2係用於較高預估響應時間Tresp
,進而接受用以達成較佳互動性的較高遺失率。
當控制部件116接收預估響應時間Tresp
,它首先判定該響應時間Tresp
是否低於臨界值THR1(步驟401)。
如果響應時間Tresp
低於臨界值THR1,控制部件116選出適於使過晚遺失率保持為低於預定臨界限度LLR1的縮放值(步驟402)。要注意的是,因為響應時間包括緩衝時間,該縮放操作將改變響應時間的數值。為了考量此相關性,可在突然進行已接收談話的開始來初始化響應時間預估Tresp
,並且根據各個縮放操作來進行更新。
當預估響應時間Tresp
高於臨界值THR1但低於臨界值THR2時(步驟403),控制部件116選出適於使過晚遺失率保持為低於預定臨界限度LLR2的一縮放值(步驟405)。
替代地,控制部件116可首先計算過晚遺失率的限度LLR2,作為預估響應時間Tresp
的函數,即當響應時間介於THR1<Tresp
<THR2的範圍,LLR2=f(Tresp
)。此選項係以虛線展示於第4圖中(步驟404)。控制部件116隨後選出適於使過晚遺失率維持為低於所計算臨界限度LLR2的一縮放值(步驟405)。
不允許預估響應時間Tresp
高於臨界值THR2。
係在一縮放命令中把步驟402或步驟405中選出的縮放值提供給調整部件115。調整部件115可隨後根據所接收到的縮放值繼續縮放已接收訊框的動作(步驟406)。
可把第4圖的方塊視為控制部件116的子部件。換言之,可把方塊402與404視為比較器,而把方塊401、403與405視為組配為進行所指出功能的處理部件。
要了解的是,所展示出的操作僅為使用響應時間來控制調整程序之顫動緩衝器管理方式的一般實例。此種方法有多種不同的變化方式。
可把展示於第1圖中的電子裝置110的部件111、122、130與131實行於硬體中,例如晶片或晶片組上的電路。例如,可把整個總成實現為積體電路(IC)。替代地,可以電腦程式碼形式來部分地或完整地實行該等功能。
第5圖為一方塊圖,其展示出根據本發明之一種電子裝置的另一種例示實施例,其中係由電腦程式碼來實行該等功能。
電子裝置510包含處理器520以及連結到此處理器520的音訊輸入部件530、音訊輸出部件540、介面550、以及記憶體560。例如,音訊輸入部件530可包含一麥克風。例如,音訊輸出部件540可包含揚聲器。例如,介面550可為用於一封包交換網路的一介面。
係把處理器520組配為能執行可得電腦程式碼。
記憶體560儲存有各種不同的電腦程式碼。所儲存的程式碼包含電腦程式碼,其係設計為編碼音訊資料、利用適應性顫動緩衝器來解碼音訊資料、以及判定在調整顫動緩衝器時作為一輸入變數的響應時間Tresp
。
當已經建立了一VoIP會談時,處理器520可從記憶體560恢復此程式碼,且它可執行用以實現編碼與解碼操作的該程式碼,例如包括參照第3圖與第4圖所述的操作。
要了解的是,此種處理器520可執行實現電子裝置110之其他功能的額外電腦程式碼。
儘管已經針對使用預估響應時間Tresp
作為調整一顫動緩衝動作之參數的替代方案來說明第1圖至第5圖的例示實施例,要了解的是,亦可使用相似的方式來作為使用單向端對端延遲Dend_to_end
的參數。在第1圖中,響應時間預估部件130可為端對端延遲預估部件。它可測量或預估單向延遲,例如使用上述的NTP式方法。第4圖的程序可藉著簡單地針對預估響應時間Tresp
置換預估端對端延遲Dend_to_end
來呈現響應時間,此在第4圖中亦展示於括號中的選項。可因此設定選定臨界值THR1與THR2。同樣在,第5圖的實施例中,使用單向端對端延遲Dend_to_end
而不是響應時間Tresp
的選項已經展示於括號中。
可同樣地把第1圖之控制部件116或第5圖之電腦程式碼表示的功能視為用以利用一參數作為預估延遲而在第一裝置上判定顫動緩衝器之所欲調整量的構件,該延遲包含一會談中呈至少一方向的至少一端對端延遲,而係在第一裝置與第二裝置之間透過封包交換網路發送呈封包形式的會談語音信號。可同樣地把第1圖之調整部件115或第5圖之電腦程式碼表示的功能視為用以根據經判定調整量來進行顫動緩衝器之調整動作的構件。可把第1圖的Tresp
預估部件130或第5圖的電腦程式碼表示的功能視為用以預估延遲的構件。
儘管已根據本發明的較佳實施例來展示、說明且指出本發明的基本新穎特徵,可了解的是,對熟知技藝者來說,在不偏離本發明精神的條件下,可對本文所述之裝置與方法的形式與細節套用各種不同的省略方案與置換方案。例如,所意圖的是以實質上相同方式來進行實質上相同功能以達成相同結果之該等元件及/或方法步驟的所有組合均屬於本發明的範圍。再者,應該要了解的是,大致的設計選擇是,結合本發明任何揭露形式或實施例來展示及/或說明的結構及/或元件及/或方法步驟可包含在任何其他揭露或說明或暗示形式或實施例中。因此,所意圖的是,本發明僅受到申請專利範圍的界定。再者,在申請專利範圍中,構件加上功能的字句係意圖涵蓋本文所述結構,以作為進行本文所述功能,非僅作為結構性等效方案,但亦為等效結構。
110...第一電子裝置
111...音訊接收器
112...顫動緩衝器
113...網路分析器
114...解碼器
115...調整部件
116...控制部件
118...重放部件
121...麥克風
122...音訊發送器
123...類比對數位轉換器(ADC)
124...編碼器
125...語音編碼器
126...語音活動檢測(VAD)部件
127...舒適雜訊參數產生器
130...響應時間(Tresp
)預估部件
131...計時器
140...晶片
150...第二電子裝置
151...音訊收發器(TRX)
160...封包交換通訊網路
201...使用者A談話
202...使用者B傾聽
203...使用者B談話
204...使用者A傾聽
301~306...步驟
401~406...步驟
510...電子裝置
520...處理器
530...音訊輸入部件
540...音訊輸出部件
550...介面
560...記憶體
第1圖為一概要方塊圖,其展示出根據本發明一實施例的一種系統;第2圖展出一種會談結構;第3圖為一流程圖,其展示出第1圖之該系統中之一種用以預估一會談中之一段目前響應時間的操作;第4圖為一流程圖,其展示出第1圖之該系統中之一種用以根據一段目前響應時間來調整一顫動緩衝的操作;以及第5圖為一概要方塊圖,其展示出根據本發明另一實施例的一種電子裝置。
110...第一電子裝置
111...音訊接收器
112...顫動緩衝器
113...網路分析器
114...解碼器
115...調整部件
116...控制部件
118...重放部件
121...麥克風
122...音訊發送器
123...類比對數位轉換器(ADC)
124...編碼器
125...語音編碼器
126...語音活動檢測(VAD)部件
127...舒適雜訊參數產生器
130...響應時間(Tresp
)預估部件
131...計時器
140...晶片
150...第二電子裝置
151...音訊收發器(TRX)
160...封包交換通訊網路
Claims (59)
- 一種用於顫動緩衝器調整之方法,其包含下列步驟:在一第一裝置上利用作為一參數的一預估延遲來判定一顫動緩衝器的一所欲調整量,該延遲包含在一會談中在至少一方向的至少一端對端延遲,針對該會談,透過一封包交換網路在該第一裝置與一第二裝置之間發送呈封包形式的語音信號,其中判定一調整量包含:判定該調整量,而使得只要該預估延遲低於一第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第一限度;及判定該調整量,而使得當該預估延遲超過該第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第二限度;及根據該經判定的調整量來進行該顫動緩衝器的一調整動作。
- 如請求項1之方法,其中該預估延遲為一會談中的一預估響應時間,該預估響應時間為來自該第一裝置之一使用者之一語音區段的一結束以及由該第一裝置呈現出之來自該第二裝置之一使用者之一語音區段的一開始之間的一時間。
- 如請求項2之方法,其另包含預估該響應時間的步驟,其中該響應時間係考量到一會談的大致結構而預估出來。
- 如請求項1之方法,其另包含把該第二限度判定為該預估延遲之一函數的步驟。
- 如請求項1之方法,其另包含預估該延遲的步驟。
- 如請求項2之方法,其另包含預估該響應時間的步驟,其中係把該響應時間預估為介於下面二段時間之間的一期間:檢測到該第一裝置之一使用者在該第一裝置上從談話切換到傾聽的一時間;以及檢測到該第二裝置之一使用者在該第一裝置上從傾聽切換到談話的一時間。
- 如請求項6之方法,其中檢測到該第二裝置之一使用者從傾聽切換到談話的一時間為在已經接收了不含活動語音之一語音信號的至少一區段之後,該第一裝置透過該封包交換網路接收含活動語音之該語音信號之一第一區段的一時間。
- 如請求項6之方法,其中檢測到該第一裝置之一使用者從談話切換到傾聽的一時間為該第一裝置開始產生舒適雜訊參數的一時間。
- 如請求項6之方法,其中檢測到該第一裝置之一使用者從談話切換到傾聽的一時間為該第一裝置的一聲音活動檢測部件把一旗標設定為指出欲透過該封包交換網路傳送之一語音信號的一目前區段並不含聲音之一數值的一時間。
- 一種用於顫動緩衝器調整之設備,其包含: 一控制部件,其係組配為在一第一裝置上利用作為一參數的一預估延遲來判定一顫動緩衝器的一所欲調整量,該延遲包含在一會談中在至少一方向的至少一端對端延遲,針對該會談,透過一封包交換網路在該第一裝置與一第二裝置之間發送呈封包形式的語音信號,其中判定一調整量包含:判定該調整量,而使得只要該預估延遲低於一第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第一限度;及判定該調整量,而使得當該預估延遲超過該第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第二限度;及一調整部件,其係組配為根據該經判定調整量來進行該顫動緩衝器的一調整動作。
- 如請求項10之設備,其另包含組配為預估該延遲的一預估部件。
- 如請求項10之設備,其中該預估延遲為一會談中的一預估響應時間,該預估響應時間為來自該第一裝置之一使用者之一語音區段的一結束以及由該第一裝置呈現出之來自該第二裝置之一使用者之一語音區段的一開始之間的一時間。
- 如請求項11之設備,其中該控制部件係另組配為把該第二限度判定為該預估延遲的一函數。
- 一種電子裝置,其包含: 請求項10請求的一設備;與該設備操作上接合之一音訊輸入部件;以及與該設備操作上接合之一音訊輸出部件。
- 一種電子系統,其包含:請求項14請求的一第一電子裝置;及與該第一電子裝置操作上接合之一第二電子裝置,該第二電子裝置係組配為針對一會談透過一封包交換網路與該第一電子裝置交換語音信號。
- 如請求項12之設備,其另包含組配為考量到一會談的大致結構來預估該響應時間的一響應時間預估部件。
- 如請求項12之設備,其另包含組配為把該響應時間預估為介於下面二段時間之間的一期間的一響應時間預估部件:檢測到該第一裝置之一使用者在該第一裝置上從談話切換到傾聽的時間;以及檢測到該第二裝置之一使用者在該第一裝置上從傾聽切換到談話的時間。
- 如請求項17之設備,其中該響應時間預估部件係組配為把檢測到該第二裝置之一使用者從傾聽切換到談話的一時間預估為在已經接收了不含活動語音之一語音信號的至少一區段之後,該第一裝置透過該封包交換網路接收含活動語音之該語音信號之一第一區段的一時間。
- 如請求項18之設備,其另包含一解碼器,其係組配為對該響應時間預估部件指出已經接收了不含活動語音之一語音信號的至少一區段之後,何時接收到含活動語音之該語音信號之一第一區段。
- 如請求項17之設備,其中該響應時間預估部件係組配為把檢測到該第一裝置之一使用者從談話切換到傾聽的一時間預估為該第一裝置開始產生舒適雜訊參數的一時間。
- 如請求項20之設備,其另包含一解碼器,其係組配為對該響應時間預估部件指出它何時開始產生舒適雜訊參數。
- 如請求項17之設備,其中該響應時間預估部件係組配為把檢測到該第一裝置之一使用者從談話切換到傾聽的一時間預估為該第一裝置的一聲音活動檢測部件把一旗標設定為指出欲透過該封包交換網路傳送之一語音信號的一目前區段並不含聲音之一數值的一時間。
- 如請求項22之設備,其另包含該聲音活動檢測部件。
- 一種把一程式碼儲存在一電腦可讀媒體中的電腦程式產品,該程式碼在受一處理器執行時將實現下列動作:在一第一裝置上利用作為一參數的一預估延遲來判定一顫動緩衝器的一所欲調整量,該延遲包含在一會談中在至少一方向的至少一端對端延遲,針對該會談,透過一封包交換網路在該第一裝置與一第二裝置之間發送呈封包形式的語音信號,其中判定一調整量包含: 判定該調整量,而使得只要該預估延遲低於一第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第一限度;及判定該調整量,而使得當該延遲超過該第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第二限度;及根據該經判定的調整量來進行該顫動緩衝器的一調整動作。
- 如請求項24之電腦程式產品,其中該預估延遲為一會談中的一預估響應時間,該預估響應時間為來自該第一裝置之一使用者之一語音區段的一結束以及由該第一裝置呈現出之來自該第二裝置之一使用者之一語音區段的一開始之間的一時間。
- 如請求項25之電腦程式產品,其中該電腦程式碼係另設計為可實現下列動作:考量到一會談的大致結構而預估該響應時間。
- 如請求項25之電腦程式產品,其中該電腦程式碼係另設計為可實現下列動作:預估該響應時間,其中係把該響應時間預估為介於檢測到該第一裝置之一使用者在該第一裝置上從談話切換到傾聽之一時間以及檢測到該第二裝置之一使用者在該第一裝置上從傾聽切換到談話之一時間之間的一期間。
- 如請求項27之電腦程式產品,其中檢測到該第二裝置之一使用者從傾聽切換到談話的一時間為在已經接收了不含活動語音之一語音信號的至少一區段之後,該第一裝置透過該封包交換網路接收含活動語音之該語音信號之一第一區段的一時間。
- 如請求項24之電腦程式產品,其中該電腦程式碼係另設計為可實現下列動作:把該第二限度判定為該預估延遲的一函數。
- 如請求項24之電腦程式產品,其中該電腦程式碼係另設計為可實現下列動作:預估該延遲。
- 如請求項27之電腦程式產品,其中檢測到該第一裝置之一使用者從談話切換到傾聽的一時間為該第一裝置開始產生舒適雜訊參數的一時間。
- 如請求項27項之電腦程式產品,其中檢測到該第一裝置之一使用者從談話切換到傾聽的一時間為該第一裝置的一聲音活動檢測部件把一旗標設定為指出欲透過該封包交換網路傳送之一語音信號的一目前區段並不含聲音之一數值的一時間。
- 一種用於顫動緩衝器調整之設備,其包含:用以在一第一裝置上利用作為一參數的一預估延遲來判定一顫動緩衝器之一所欲調整量的構件,該延遲包含在一會談中呈至少一方向的至少一端對端延遲,針對該會談,將透過一封包交換網路在該第一裝置與一第 二裝置之間發送呈封包形式的語音信號,其中判定一調整量包含:判定該調整量,而使得只要該預估延遲低於一第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第一限度;及判定該調整量,而使得當該預估延遲超過該第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第二限度;及用以根據該經判定的調整量來進行該顫動緩衝器之一調整動作的構件。
- 如請求項33之設備,其中該預估延遲為一會談中的一預估響應時間,該預估響應時間為來自該第一裝置之一使用者之一語音區段的一結束以及由該第一裝置呈現出之來自該第二裝置之一使用者之一語音區段的一開始之間的一時間。
- 如請求項33之設備,其另包含用以預估該延遲的構件。
- 一種用於顫動緩衝器調整之方法,其包含:在一第一裝置上利用作為一參數之一會談中的一預估響應時間來判定一顫動緩衝器的一所欲調整量,針對該會談,透過一封包交換網路在該第一裝置與一第二裝置之間發送呈封包形式的語音信號;及根據該經判定的調整量來進行該顫動緩衝器的一調整動作,其中該響應時間被預估為介於:該第一裝置之一使 用者在該第一裝置被檢測到由談話切換至傾聽之一時間、與該第二裝置之一使用者在該第二裝置被檢測到由傾聽切換至談話之一時間,二者之間的一段期間。
- 如請求項36之方法,其中該第一裝置之一使用者被檢測到由談話切換至傾聽之一時間係為該第一裝置之一聲音活動檢測部件把一旗標設定為指出欲透過該封包交換網路傳送之一語音信號的一目前區段並不含聲音之一數值的一時間。
- 如請求項36之方法,其中該第一裝置之一使用者被檢測到由談話切換至傾聽之一時間係為該第一裝置開始產生舒適雜訊參數之一時間。
- 如請求項36之方法,其中該第二裝置之一使用者被檢測到由談話切換至傾聽之一時間係為該第一裝置在已接收不含活動語音之該語音信號的至少一區段後,經由該封包交換網路接收含活動語音之一語音信號的一第一區段之一時間。
- 如請求項36之方法,其中判定一調整量包含:判定該調整量,而使得只要該預估延遲低於一第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第一限度;及判定該調整量,而使得當該預估延遲超過該第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第二限度。
- 如請求項40之方法,更包含判定該第二限度為該預估響 應時間之一函數。
- 如請求項36之方法,更包含預估該響應時間。
- 一種用於顫動緩衝器調整之設備,包含:一控制部件,其組配來在一第一裝置處使用作為一參數之一會談中的一預估響應時間來判定一顫動緩衝器之一所欲調整量,針對該會談,透過一封包交換網路在該第一裝置及一第二裝置間發送呈封包形式之語音信號;及一調整部件,其組配來根據該經判定調整量來進行該顫動緩衝器之一調整動作,其中該響應時間預估為介於:該第一裝置之一使用者在該第一裝置被檢測到由談話切換至傾聽之一時間、與該第二裝置之一使用者在該第一裝置被檢測到由傾聽切換至談話之一時間,二者之間的一段期間。
- 如請求項43之設備,其中該響應時間預估部件係組配來把該第一裝置之一使用者被檢測到由談話切換至傾聽之一時間預估為該第一裝置之一聲音活動檢測部件把一旗標設定為指出欲透過該封包交換網路傳送之一語音信號的一目前區段並不含聲音之一數值的一時間。
- 如請求項44之設備,更包含該聲音活動檢測部件。
- 如請求項43之設備,更包含一編碼器,其係組配來對該響應時間預估部件指出它何時開始產生舒適雜訊參數。
- 如請求項43之設備,其中該控制部件係組配來藉由下列步驟判定一調整量: 判定該調整量,而使得只要該預估延遲低於一第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第一限度;及判定該調整量,而使得當該預估延遲超過該第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第二限度。
- 如請求項47之設備,其中該控制部件更組配來判定該第二限度作為該預估響應時間之一函數。
- 如請求項43之設備,更包含組配來預估該響應時間之一預估部件。
- 如請求項43之設備,其中該響應時間預估部件係組配來把該第二裝置之一使用者被檢測到由談話切換至傾聽之一時間預估為在已經接收了不含活動語音之一語音信號的至少一區段之後,該第一裝置透過該封包交換網路接收含活動語音之該語音信號之一第一區段的一時間。
- 如請求項43之設備,更包含一解碼器,其係組配來對該響應時間預估部件指出在已接收不含活動語音之一語音信號的至少一區段後,何時接收含活動語音之一語音信號的一第一區段。
- 如請求項43之設備,其中該響應時間預估部件係組配來把該第一裝置之一使用者被檢測到由談話切換至傾聽之一時間預估為該第一裝置開始產生舒適雜訊參數之一時間。
- 一種將一程式碼儲存於一電腦可讀媒體中之電腦程式產品,該程式碼在一處理器執行時將實現下列動作:在一第一裝置上使用作為一參數之一會談中的一預估響應時間來判定一顫動緩衝器的一所欲調整量,針對該會談,透過一封包交換網路在該第一裝置及一第二裝置間發送呈封包形式之語音信號;及根據該經判定的調整量來進行該顫動緩衝器的一調整動作,其中該響應時間被預估為介於:該第一裝置之一使用者在該第一裝置被檢測到由談話切換至傾聽之一時間、與該第二裝置之一使用者在該第二裝置被檢測到由傾聽切換至談話之一時間,二者之間的一段期間。
- 如請求項53之電腦程式產品,其中該第一裝置之一使用者被檢測到由談話切換至傾聽之一時間係為該第一裝置之一聲音活動檢測部件把一旗標設定為指出欲透過該封包交換網路傳送之一語音信號的一目前區段並不含聲音之一數值的一時間。
- 如請求項53之電腦程式產品,其中該第一裝置之一使用者被檢測到由談話切換至傾聽之一時間係為該第一裝置開始產生舒適雜訊參數之一時間。
- 如請求項53之電腦程式產品,其中第二裝置之一使用者被檢測到由談話切換至傾聽之一時間係為該第一裝置在已接收不含活動語音之該語音信號的至少一區段後,經由該封包交換網路接收含活動語音之一語音信號 的一第一區段之一時間。
- 如請求項53之電腦程式產品,其中判定一調整量包含:判定該調整量,而使得只要該預估延遲低於一第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第一限度;及判定該調整量,而使得當該預估延遲超過該第一臨界值時,在一經排程解碼時間後到達該第一裝置之一訊框量維持低於一第二限度。
- 如請求項57之電腦程式產品,其中該電腦程式碼係另設計為可實現下列動作:判定該第二限度為該預估響應時間之一函數。
- 如請求項53之電腦程式產品,其中該電腦程式碼係另設計為可實現下列動作:預估該響應時間。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/508,562 US7680099B2 (en) | 2006-08-22 | 2006-08-22 | Jitter buffer adjustment |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200818786A TW200818786A (en) | 2008-04-16 |
TWI439086B true TWI439086B (zh) | 2014-05-21 |
Family
ID=38926381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW096130721A TWI439086B (zh) | 2006-08-22 | 2007-08-20 | 顫動緩衝器調整技術 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7680099B2 (zh) |
EP (2) | EP2055055B1 (zh) |
CN (1) | CN101507203B (zh) |
AT (1) | ATE528892T1 (zh) |
HK (1) | HK1130378A1 (zh) |
TW (1) | TWI439086B (zh) |
WO (1) | WO2008023303A2 (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8111720B2 (en) * | 2007-01-09 | 2012-02-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus to indicate maximum scheduling delay for jitter buffer implementations |
GB0705329D0 (en) | 2007-03-20 | 2007-04-25 | Skype Ltd | Method of transmitting data in a communication system |
US8412209B2 (en) * | 2007-06-18 | 2013-04-02 | Motorola Mobility Llc | Use of the physical uplink control channel in a 3rd generation partnership project communication system |
US8254376B2 (en) * | 2008-01-25 | 2012-08-28 | Telefonaktiebolaget L M Ericsson (Publ) | Simple adaptive jitter buffering algorithm for network nodes |
WO2009128753A1 (en) | 2008-04-17 | 2009-10-22 | Telefonaktiebolaget Lm Ericsson (Publ) | Coversational interactivity measurement and estimation for real-time media |
TR201901706T4 (tr) | 2008-09-18 | 2019-02-21 | Koninklijke Philips Nv | Bir sistemin ve sinyal işleme sisteminin kontrol edilmesine yönelik yöntem. |
US7920475B2 (en) * | 2008-12-15 | 2011-04-05 | Verizon Patent And Licensing Inc. | System and method for adaptive removal of delay jitter effect and low end-to-end delay |
US8611337B2 (en) * | 2009-03-31 | 2013-12-17 | Adobe Systems Incorporated | Adaptive subscriber buffering policy with persistent delay detection for live audio streams |
US20100265834A1 (en) * | 2009-04-17 | 2010-10-21 | Avaya Inc. | Variable latency jitter buffer based upon conversational dynamics |
JP5443918B2 (ja) * | 2009-09-18 | 2014-03-19 | 株式会社ソニー・コンピュータエンタテインメント | 端末装置、音声出力方法および情報処理システム |
US8089992B2 (en) * | 2009-09-30 | 2012-01-03 | At&T Intellectual Property I, L.P. | Systems and methods to measure the performance of a de-jitter buffer |
KR101399604B1 (ko) * | 2010-09-30 | 2014-05-28 | 한국전자통신연구원 | 지터버퍼 조정장치, 전자장치 및 그 방법 |
US20120290810A1 (en) * | 2011-04-18 | 2012-11-15 | Jean-Jacques Lecler | Memory Access Latency Metering |
GB2495927B (en) | 2011-10-25 | 2015-07-15 | Skype | Jitter buffer |
US20130163417A1 (en) * | 2011-12-27 | 2013-06-27 | Mitel Networks Corporation | Application level admission overload control |
CN103888381A (zh) | 2012-12-20 | 2014-06-25 | 杜比实验室特许公司 | 用于控制抖动缓冲器的装置和方法 |
US9107159B2 (en) * | 2013-06-07 | 2015-08-11 | Apple Inc. | Enhancing jitter buffer performance through radio level feedback |
WO2015100290A1 (en) * | 2013-12-23 | 2015-07-02 | Yost David Arthur | System for intelligible audio conversation over unreliable digital transmission media |
US9258421B2 (en) * | 2014-05-02 | 2016-02-09 | Avaya Inc. | Speech analytics: conversation timing and adjustment |
US9838544B2 (en) | 2014-06-27 | 2017-12-05 | Agora Lab, Inc. | Systems and methods for improved quality of a call over network with load leveling and last mile signal indication |
US9787565B2 (en) * | 2014-06-27 | 2017-10-10 | Agora Lab, Inc. | Systems and methods for a call over network with a visualized summary |
US11343301B2 (en) * | 2017-11-30 | 2022-05-24 | Goto Group, Inc. | Managing jitter buffer length for improved audio quality |
CN110351201B (zh) * | 2018-04-04 | 2021-09-14 | 华为技术有限公司 | 一种数据处理方法及装置 |
US20240064217A1 (en) * | 2022-08-19 | 2024-02-22 | Mediatek Inc. | Timing Control Management Method and Timing Control Management System Capable of Adjusting Reordering Timer |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3784993B2 (ja) | 1998-06-26 | 2006-06-14 | 株式会社リコー | 音響信号の符号化・量子化方法 |
US6452950B1 (en) * | 1999-01-14 | 2002-09-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive jitter buffering |
EP1142257A1 (en) * | 1999-01-14 | 2001-10-10 | Nokia Corporation | Response time measurement for adaptive playout algorithms |
US6512761B1 (en) | 1999-02-02 | 2003-01-28 | 3Com Corporation | System for adjusting billing for real-time media transmissions based on delay |
US6882711B1 (en) | 1999-09-20 | 2005-04-19 | Broadcom Corporation | Packet based network exchange with rate synchronization |
US6735192B1 (en) | 1999-09-29 | 2004-05-11 | Lucent Technologies Inc. | Method and apparatus for dynamically varying a packet delay in a packet network based on a log-normal delay distribution |
US6859460B1 (en) * | 1999-10-22 | 2005-02-22 | Cisco Technology, Inc. | System and method for providing multimedia jitter buffer adjustment for packet-switched networks |
US6985501B2 (en) * | 2000-04-07 | 2006-01-10 | Ntt Docomo, Inc. | Device and method for reducing delay jitter in data transmission |
US7289451B2 (en) * | 2002-10-25 | 2007-10-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Delay trading between communication links |
CA2515952A1 (en) * | 2003-02-13 | 2004-08-26 | Nokia Corporation | Method for signaling streaming quality adaptation and control mechanisms in multimedia streaming |
TWI284889B (en) * | 2003-09-26 | 2007-08-01 | Sony Corp | Information processing apparatus |
EP1787290B1 (en) | 2004-08-30 | 2010-11-17 | Qualcomm Incorporated | Method and apparatus for an adaptive de-jitter buffer |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
-
2006
- 2006-08-22 US US11/508,562 patent/US7680099B2/en active Active
-
2007
- 2007-08-14 CN CN2007800310294A patent/CN101507203B/zh active Active
- 2007-08-14 WO PCT/IB2007/053225 patent/WO2008023303A2/en active Application Filing
- 2007-08-14 AT AT10165603T patent/ATE528892T1/de not_active IP Right Cessation
- 2007-08-14 EP EP07805403A patent/EP2055055B1/en active Active
- 2007-08-14 EP EP10165603A patent/EP2222038B1/en active Active
- 2007-08-20 TW TW096130721A patent/TWI439086B/zh active
-
2009
- 2009-10-29 HK HK09110108.9A patent/HK1130378A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
TW200818786A (en) | 2008-04-16 |
CN101507203B (zh) | 2013-05-29 |
ATE528892T1 (de) | 2011-10-15 |
CN101507203A (zh) | 2009-08-12 |
HK1130378A1 (en) | 2009-12-24 |
EP2222038A1 (en) | 2010-08-25 |
WO2008023303A2 (en) | 2008-02-28 |
WO2008023303A3 (en) | 2008-04-24 |
US20080049795A1 (en) | 2008-02-28 |
US7680099B2 (en) | 2010-03-16 |
EP2222038B1 (en) | 2011-10-12 |
EP2055055A2 (en) | 2009-05-06 |
EP2055055B1 (en) | 2012-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI439086B (zh) | 顫動緩衝器調整技術 | |
JP4426454B2 (ja) | 通信リンク間の遅延トレードオフ | |
JP4367657B2 (ja) | 音声通信方法及び装置 | |
JP2006238445A (ja) | 仮想ジッタ・バッファおよび時間スケール修正を使用した、VoiceoverIP通信ネットワークにおいてネットワーク・ジッタを処理する方法および装置 | |
US7573907B2 (en) | Discontinuous transmission of speech signals | |
JP2008085798A (ja) | 音声伝送装置 | |
JP5079870B2 (ja) | 無線通信装置 | |
US8369310B2 (en) | Method for reliable detection of the status of an RTP packet stream | |
JP5048539B2 (ja) | 無線通信装置 | |
WO2007080788A1 (ja) | Tv会議制御装置およびtv会議制御方法 | |
EP2158753B1 (en) | Selection of audio signals to be mixed in an audio conference | |
WO2014207978A1 (ja) | 送信装置、受信装置および中継装置 | |
JP4050961B2 (ja) | パケット型音声通信端末 | |
JP4117301B2 (ja) | 音声データ補間装置と音声データ補間方法 | |
JP5128974B2 (ja) | 無線通信装置 | |
JP5053071B2 (ja) | 無線通信装置 | |
JP2012049914A (ja) | 通信装置 | |
JP2009182653A (ja) | 無線通信装置 | |
JP2005266411A (ja) | 音声圧縮方法および電話器 | |
WO2012014275A1 (ja) | 音声送受信装置、音声送受信システム及びサーバ装置 | |
AU2012200349A1 (en) | Method of transmitting data in a communication system |