TWI700630B

TWI700630B - 聲控顯示裝置及擷取語音訊號的方法

Info

Publication number: TWI700630B
Application number: TW107118622A
Authority: TW
Inventors: 林成龍; 張燕雲; 黃芝成; 張世濱
Original assignee: 技嘉科技股份有限公司
Priority date: 2018-05-31
Filing date: 2018-05-31
Publication date: 2020-08-01
Also published as: TW202004487A; US20190369955A1; EP3576086A2; EP3576086A3

Abstract

一種聲控顯示裝置，包括：顯示面板、訊號輸入埠、收音器、微處理器以及顯示控制器。訊號輸入埠用於自主機接收第一影像訊號。收音器具有收音端以供接收外部音訊，收音端鄰近設置於顯示面板且收音端及顯示面板位於聲控顯示裝置的同一側。微處理器電性連接收音器，微處理器根據外部音訊執行語音辨識程序以獲得一指令。顯示控制器電性連接訊號輸入埠、顯示面板及微處理器，顯示控制器根據所獲得的指令將第一影像訊號調整為第二影像訊號，且顯示面板呈現第一影像訊號或第二影像訊號。

Description

聲控顯示裝置及擷取語音訊號的方法

本發明係關於一種顯示裝置及擷取語音訊號的方法，特別是一種透過聲控調整畫面的顯示裝置以及透過雙麥克風擷取語音訊號的方法。

目前市面上的電腦螢幕皆提供使用者自行調整例如亮度、對比度、色溫、水平位置、垂直位置、掃描頻率等顯示模式設定。更詳細地來說，使用者需要手動按壓或觸碰位於螢幕下方、側邊或後方的實體按鍵來調整個人習慣的顯示模式。然而大部分的電腦螢幕提供的實體按鍵數量有限，因此經常具有一鍵多用的設計。例如同一個按鍵按一下跳出主選單，在數秒內按第二下則進入當前選定的子選單。

然而，對於一般使用者而言，調整顯示模式並非屬於經常性操作，因此往往不熟練如何透過實體按鍵調整顯示模式，而經常出現如下情況：在按壓按鍵作細部調整的過程中因為按壓過久而導致設定跑掉，或是因為不想超過而浪費時間慢慢一次一次按，又或者因為在考慮設定數值的過程中超過等待時間而跳回其他選單，致使前面作過的繁瑣的按鍵動作重作一次。尤其是對於專業玩家而言，螢幕的顯示模式影響遊戲操作的程度不容忽視，若為了調整螢幕時而耗費諸多時間，無疑將造成使用者諸多不便。

有鑑於此，本發明提出一種聲控顯示裝置，係透過截取使用者聲音中包括的顯示畫面操作指令，藉以解決上述提及的透過實體按鈕調整顯示裝置的不便之處。

依據本發明一實施例的所敘述的一種聲控顯示裝置，包括：顯示面板、訊號輸入埠、第一收音器、第二收音器、微處理器以及顯示控制器。訊號輸入埠從主機接收第一影像訊號。第一收音器具有第一收音端以供接收外部音訊，第一收音端鄰近設置於顯示面板且第一收音端及顯示面板位於聲控顯示裝置的同一側。第二收音器具有第二收音端以供接收外部音訊，第二收音器鄰近設置於顯示面板及第一收音器且第二收音端及顯示面板位於聲控顯示裝置的同一側微處理器電性連接收音器，微處理器根據外部音訊執行語音辨識程序以獲得一指令。顯示控制器電性連接訊號輸入埠、顯示面板及微處理器，顯示控制器根據所獲得的指令將第一影像訊號調整為第二影像訊號，且顯示面板呈現第一影像訊號或第二影像訊號。

依據本發明一實施例所敘述的一種擷取語音訊號的方法，包括：第一收音器及一第二收音器分別取得外部音訊，其中第一收音器之收音端及第二收音器之收音端皆鄰近設置於顯示面板的同一側；微處理器計算兩個外部音訊各自之特徵波形；微處理器根據兩個特徵波形計算一差異量；當差異量小於預設閾值時，微處理器根據外部音訊執行語音辨識程序以獲得指令，否則微處理器捨棄外部音訊。

藉由上述架構，本發明所揭露的聲控顯示裝置，讓使用者可透過語音控制螢幕的各項設定，進一步地在本發明所揭露的聲控顯示裝置的一實施例中，搭配本發明所揭露的擷取語音訊號的方法，透過雙麥克風配置於顯示面板同一側邊的特殊設計，達成較佳收取使用者語音的效果。因此，一般使用者得以輕鬆地調整螢幕的顯示模式，達到最佳的螢幕觀看視覺體驗。除此之外，對於專業玩家而言，更可即時地透過語音去轉換遊戲畫面與場景，節省了玩家手動操作滑鼠去轉換畫面與遊戲場景的時間。整體而言，本發明所揭露的聲控顯示裝置及擷取語音訊號的方法提供了更人性化的方式來操控螢幕，提升使用者更便利的螢幕調整與遊戲操作體驗。

以上之關於本揭露內容之說明及以下之實施方式之說明係用以示範與解釋本發明之精神與原理，並且提供本發明之專利申請範圍更進一步之解釋。

以下在實施方式中詳細敘述本發明之詳細特徵以及優點，其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施，且根據本說明書所揭露之內容、申請專利範圍及圖式，任何熟習相關技藝者可輕易地理解本發明相關之目的及優點。以下之實施例係進一步詳細說明本發明之觀點，但非以任何觀點限制本發明之範疇。

請參考圖1，其係繪示本發明之一實施例所敘述的聲控顯示裝置的方塊架構示意圖，包括：顯示面板1、訊號輸入埠3、收音器5、微處理器7及顯示控制器9。

顯示面板1係一呈現畫面供使用者觀看的裝置。實務上，顯示面板1例如：扭曲向列面板（Twisted Nematic，TN）、平面切換（In-Plane-Switching，IPS）面板或垂直對齊（Vertical Alignment，VA）面板，然而顯示面板1之硬體結構並不以上述為限。

訊號輸入埠3用於自主機接收第一影像訊號，所述的主機例如係具有中央處理器的個人電腦、伺服器、智慧型手機或平板電腦等，但不以上述為限。實務上，訊號輸出埠3可採用常見的D-SUB（Subminiature）、數位視訊介面（Digital Video Interface，DVI）、高畫質多媒體介面（High Definition Multimedia Interface，HDMI）或DisplayPort等介面。

收音器5用於接收外部音訊。實務上，收音器5例如係一微機電系統（MicroElectrical Mechanical Systems，MEMS）麥克風。值得強調的是，在本發明一實施例中係採用雙麥克風的設計，如圖1所繪示的第一收音器52及第二收音器54。收音器5具有收音端接收外部音訊用的收音端，收音端較佳鄰近設置於顯示面板1，且收音端及顯示面板1皆位於聲控顯示裝置的同一側。請參考圖2，其係繪示第一收音器52的第一收音端52a與第二收音器52的第二收音端54a裝設於顯示面板1的示意圖，如圖2所示，第一收音端52a、第二收音端54a及顯示面板1皆位於聲控顯示裝置面向使用者的一側。

請參考圖3，其係繪示指向性麥克風的一場型圖及一收音範圍的示意圖。在本發明一實施例中，第一收音器52及第二收音器54係屬同一規格的指向性麥克風，且其指向性為心形（Cardioid）指向，如圖3左半部的場型圖（polar pattern）所示，心形區域係一指向性麥克風的收音範圍。進一步地，在麥克風前方由夾角A所形成的區域係指向性麥克風的最佳收音範圍。在本發明一實施例中，此夾角A為15-60度，實務上可設定為45度。另外，第一收音端52a及第二收音端54a之距離為2至4公分。請參考圖3右半部，第一收音器52的最佳收音範圍與第二收音器54的最佳收音範圍具有一交集區域P，此交集區域P表示為兩麥克風的最佳收音範圍。實務上，可透過調整第一收音端52a及第二收音端54a之間的距離或兩收音端擺放的角度而改變交集區域P的範圍大小。

請參考圖1。微處理器7電性連接第一收音器52及第二收音器54以接收外部音訊。實務上，從麥克風收入外部音訊後，可透過微機電指向性麥克風本身內建的類比數位轉換器（Analog-to-Digital Converter，ADC）或是透過外部的ADC晶片將外部音訊的類比訊號轉換為數位訊號，然後透過I² S（Inter-IC Sound或Integrated Interchip Sound）介面將第一收音器52及第二收音器54所收到的數位聲音訊號傳送到微處理器7，微處理器7再根據外部音訊執行一語音辨識程序以獲得一指令，實務上，微處理器7例如係一語音辨識積體電路（Integrated Circuit，IC）或一微控制器（Micro Control Unit），本發明對於微處理器7之硬體結構並未特別限制。另外，在本發明另一實施例中，微處理器7更包括一韌體更新介面，此韌體更新介面用以下載不同語言的語音辨識資料庫，俾使本發明所揭露的聲控顯示裝置得以適用於各個國家。

在本發明一實施例中，所述的語音辨識程序主要關聯於一演算法。詳言之，在微處理器7取得外部音訊後，語音辨識程序計算兩個麥克風收到相同聲音的時間差。當此時間差小於或等於一預設閾值時，語音辨識程序採用此外部音訊進行語音辨識，以獲得該此外部音訊中所包含的語音指令；當此時間差超過一預設閾值時，語音辨識程序濾除此外部音訊。預設閾值的數值設定係關聯於第一收音端52及第二收音端54之間的距離。換個角度觀之，當外部音訊在交集區域P範圍以外的區域產生且被收音器5接收時，語音辨識程序可直接濾除這種聲音訊號，以免將聲控顯示裝置兩旁的環境雜音誤譯為語音指令。基於上述機制，本發明一實施例所敘述的微處理器7得以只針對交集區域P範圍內的聲音訊號進行語音辨識。另外需補充說明的是，除了採用時間差作為比較基準，亦可採用強度差或是其他可反映聲音傳遞距離的性質作為比較基準，本發明對此並未特別限制。

請參考圖1。顯示控制器9電性連接訊號輸入埠3、顯示面板1及微處理器7。一般而言，顯示控制器9用以將主機傳送來的影像訊號呈現於顯示面板1供使用者觀看。實務上，顯示控制器9例如係一用於螢幕控制的系統單晶片（System on Chip，SoC），並透過通用非同步接收發送傳輸器（Universal Asynchronous Receiver/Transmitter，UART）介面電性連接至微處理器7以接收指令。在本發明一實施例中，顯示控制器9更用以根據語音辨識程序獲得的指令將第一影像訊號調整為第二影像訊號，顯示面板1用以呈現第一影像訊號或第二影像訊號。第一影像訊號係由主機傳送的原始影像，在第一影像訊號於顯示面板1呈現的範圍中，顯示控制器9可設置一預設區域。第二影像訊號的一種實施態樣是：由顯示控制器9基於原本的第一影像訊號，在預設區域疊加另一局部影像。舉例來說，若語音指令為「提高亮度」，則顯示控制器9在預設區域中以圖像或文字形式呈現當前顯示面板1亮度的狀態，藉此告知使用者聲控顯示裝置已完成用戶指示的調整動作。

第二影像訊號的另一種實施態樣是：顯示控制器9使第二影像訊號中包括預設區域的一放大影像訊號。舉例來說，遊戲玩家經常需在遊戲進行中，針對遊戲畫面的某部分放大觀看，以便於後續的遊戲操作。請一併參考圖4A及圖4B，圖4A係第一影像訊號呈現於顯示面板1的示意圖，其係繪示一第一人稱視角的射擊遊戲畫面，其中包括四個預設區域D1~D4，由分隔線L1、L2所區隔。當玩家發出「放大左上角」的語音指令後，微處理器7所辨識出的指令可驅動顯示控制器9將屬於預設區域D1的第一影像訊號放大調整為第二影像訊號，顯示控制器9再將此第二影像訊號呈現於顯示面板1，如圖4B所示。因此，遊戲玩家可更快速地確認是否存在射擊目標或更準確地瞄準射擊目標，提升遊戲時的樂趣。

在本發明另一實施例中，聲控顯示裝置更具有一發光模組電性連接至顯示控制器9，且發光模組係用以根據指令地發出一指定顏色之色光。實務上，發光模組例如係設置於聲控顯示裝置背向於顯示面板1的發光二極體（Light Emitting Diode，LED），其發光時機與發光顏色皆可透過位於顯示面板1正面的第一收音器52及第二收音器54所接收的語音指令進行控制。相較於傳統的顯示裝置僅作為一種影像輸出裝置，本發明所揭露的聲控顯示裝置更可作為一種用於操控周邊燈光的輸入裝置，增進使用者觀看螢幕時的視覺體驗。此外，相較於以往遊戲主機提供的發光模組僅能透過廠商提供的操作介面自行編寫光線配置檔案以進行控制，本發明一實施例揭露的聲控顯示裝置所採用的語音指令控制方式無疑在操作方式上更為直覺且單純，減輕使用者須額外學習各種設定方式的負擔。

請參考圖5，其係繪示本發明一實施例的擷取語音訊號的方法的流程圖，此方法適用於前述的聲控顯示裝置。請參考步驟S1：第一收音器52及第二收音器54分別取得外部音訊。具體來說，此外部音訊例如是使用者發出的一螢幕控制指令，或是啟動微處理器7開始執行語音辨識程序的一啟動指令。請參考步驟S2：微處理器7計算兩個外部音訊各自的特徵波形。詳言之，本步驟係用以判斷第一收音器52及第二收音器54各自取得的外部音訊中屬於相同的聲音訊號的部分。詳言之，第一收音器52及第二收音器54所錄入的外部音訊可包含多個特徵波形，例如第一特徵波形是在圖3所示的交集區域P之外收錄的環境雜音，第二特徵波形是在交集區域P之內收錄的使用者語音。請參考步驟S3：微處理器7根據上述計算的特徵波形計算一差異量，其中差異量係一時間差或一強度差。以上述例子來說，微處理器7計算第一收音器52收錄的第一特徵波形與第二收音器54收錄的第一特徵波形之間的差異量，以及計算第一收音器52收錄的第二特徵波形與第二收音器54收錄的第二特徵波形之間的差異量。請參考步驟S4至步驟S5：當差異量小於一預設閾值時，微處理器7根據外部音訊中差異量小於一預設閾值的特徵波形執行語音辨識程序以獲得指令（以上述例子而言其係第二特徵波形）。反過來說當差異量大於或等於此預設閾值時，請參考步驟S4至步驟S6，微處理器7濾除外部音訊中差異量大於或等於此預設閾值的特徵波形（以上述例子而言其係第一特徵波形），以避免誤輸出使用者未發出的語音指令。

綜合以上所述，本發明所揭露的聲控顯示裝置，採用裝設於顯示面板同一側的兩個指向性麥克風接收相同的外部音訊，經由微處理器比對聲音訊號的相對強弱關係，將最佳收音範圍以外的外部音訊視為環境雜音並予以濾除。由於本發明揭露的擷取語音訊號的方法並非採用傳統以硬體電路從外部音訊中扣除環境音的方式，而是透過可持續微調改進的演算法提升對於使用者語音與環境雜音的辨識率。因此，由微處理器執行的語音辨識程序可確實根據使用者發出的聲音進行辨識而輸出對應的語音指令，顯示控制器再將獲取的語音指令用於將第一影像調整為第二影像，並透過顯示面板呈現第一影像或第二影像。因此，一般使用者得以輕鬆地調整螢幕的顯示模式，達到最佳的螢幕觀看視覺體驗。除此之外，對於專業玩家而言，更可即時地透過語音去轉換遊戲畫面與場景，節省了玩家手動操作滑鼠去轉換畫面與遊戲場景的時間。整體而言，本發明所揭露的聲控顯示裝置及擷取語音訊號的方法提供了更人性化的方式讓使用者操控螢幕，提升使用者更便利的螢幕調整與遊戲操作體驗。

雖然本發明以前述之實施例揭露如上，然其並非用以限定本發明。在不脫離本發明之精神和範圍內，所為之更動與潤飾，均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。

1‧‧‧顯示面板3‧‧‧訊號輸入埠52‧‧‧第一收音器52a‧‧‧第一收音端54‧‧‧第二收音器54a‧‧‧第二收音端7‧‧‧微處理器9‧‧‧顯示控制器A‧‧‧夾角P‧‧‧交集區域D1~D4‧‧‧預設區域L1、L2‧‧‧分隔線S1~S6‧‧‧步驟

圖1係依據本發明一實施例所繪示的聲控顯示裝置的方塊架構示意圖。圖2係依據本發明一實施例所繪示的顯示面板與收音端位置示意圖。圖3係依據本發明一實施例所繪示的場型圖及收音範圍示意圖。圖4A係第一影像訊號呈現於顯示面板的示意圖。圖4B係第二影像訊號呈現於顯示面板的示意圖。圖5係依據本發明一實施例所繪示的擷取語音訊號的方法流程圖。

1‧‧‧顯示面板

3‧‧‧訊號輸入埠

5‧‧‧收音器

52‧‧‧第一收音器

54‧‧‧第二收音器

7‧‧‧微處理器

9‧‧‧顯示控制器

Claims

一種聲控顯示裝置，包括：一顯示面板，具有複數邊；一訊號輸入埠，用於自一主機接收一第一影像訊號；一第一收音器，具有一第一收音端以供接收一外部音訊，該第一收音端鄰近設置於該顯示面板且該第一收音端及該顯示面板位於該聲控顯示裝置的同一側；一第二收音器，具有一第二收音端以供接收該外部音訊，該第二收音端及該第一收音端之間的距離小於該顯示面板的該些邊之中任一邊的長度；一微處理器，電性連接該第一收音器及該第二收音器，該微處理器用以根據該外部音訊執行一語音辨識程序以獲得一指令；以及一顯示控制器，電性連接該訊號輸入埠、該顯示面板及該微處理器，該顯示控制器用以根據該指令將該第一影像訊號調整為一第二影像訊號；其中，該顯示面板用以呈現該第一影像訊號或該第二影像訊號；該第一收音端及該第二收音端之距離為2至4公分；該第一收音器及該第二收音器皆係一指向性麥克風；以及該些指向性麥克風具有15-60度的收音範圍，且該第一收音器的收音範圍與該第二收音器的收音範圍具有一交集區域。
如請求項1所述的聲控顯示裝置，其中該第一影像訊號中包括一預設區域，且該指令用以驅動該顯示控制器使該第二影像訊號中包括該預設區域的一放大影像訊號。
如請求項1所述的聲控顯示裝置，其中該聲控顯示裝置更具有一發光模組電性連接至該顯示控制器，且該發光模組係用以根據該指令地發出一指定顏色之色光。
一種擷取語音訊號的方法，包括：以一第一收音器及一第二收音器分別取得一外部音訊，其中該第一收音器之一第一收音端及該第二收音器之一第二收音端皆鄰近設置於一顯示面板的同一側，該第一收音端及該第二收音端之間的距離小於該顯示面板的複數邊之中任一邊的長度；以一微處理器計算該些外部音訊各自之一特徵波形；以該微處理器根據該些特徵波形計算一差異量；當該差異量小於一預設閾值時，以該微處理器根據該外部音訊執行一語音辨識程序以獲得一指令，否則以該微處理器捨棄該特徵波形；其中該第一收音器之該第一收音端與該第二收音器之該第二收音端之距離為2至4公分；該第一收音器及該第二收音器皆係一指向性麥克風；以及該些指向性麥克風具有15-60度的收音範圍，且該第一收音器的收音範圍與該第二收音器的收音範圍具有一交集區域。
如請求項4所述的擷取語音訊號的方法，其中該差異量係一時間差或一強度差。