TWI700630B - 聲控顯示裝置及擷取語音訊號的方法 - Google Patents

聲控顯示裝置及擷取語音訊號的方法 Download PDF

Info

Publication number
TWI700630B
TWI700630B TW107118622A TW107118622A TWI700630B TW I700630 B TWI700630 B TW I700630B TW 107118622 A TW107118622 A TW 107118622A TW 107118622 A TW107118622 A TW 107118622A TW I700630 B TWI700630 B TW I700630B
Authority
TW
Taiwan
Prior art keywords
microphone
radio
voice
display panel
microprocessor
Prior art date
Application number
TW107118622A
Other languages
English (en)
Other versions
TW202004487A (zh
Inventor
林成龍
張燕雲
黃芝成
張世濱
Original Assignee
技嘉科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 技嘉科技股份有限公司 filed Critical 技嘉科技股份有限公司
Priority to TW107118622A priority Critical patent/TWI700630B/zh
Priority to US16/379,714 priority patent/US20190369955A1/en
Priority to EP19170483.2A priority patent/EP3576086A3/en
Publication of TW202004487A publication Critical patent/TW202004487A/zh
Application granted granted Critical
Publication of TWI700630B publication Critical patent/TWI700630B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/40Processing input control signals of video game devices, e.g. signals generated by the player or derived from the environment
    • A63F13/42Processing input control signals of video game devices, e.g. signals generated by the player or derived from the environment by mapping the input signals into game commands, e.g. mapping the displacement of a stylus on a touch screen to the steering angle of a virtual vehicle
    • A63F13/424Processing input control signals of video game devices, e.g. signals generated by the player or derived from the environment by mapping the input signals into game commands, e.g. mapping the displacement of a stylus on a touch screen to the steering angle of a virtual vehicle involving acoustic input signals, e.g. by using the results of pitch or rhythm extraction or voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • User Interface Of Digital Computer (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

一種聲控顯示裝置,包括:顯示面板、訊號輸入埠、收音器、微處理器以及顯示控制器。訊號輸入埠用於自主機接收第一影像訊號。收音器具有收音端以供接收外部音訊,收音端鄰近設置於顯示面板且收音端及顯示面板位於聲控顯示裝置的同一側。微處理器電性連接收音器,微處理器根據外部音訊執行語音辨識程序以獲得一指令。顯示控制器電性連接訊號輸入埠、顯示面板及微處理器,顯示控制器根據所獲得的指令將第一影像訊號調整為第二影像訊號,且顯示面板呈現第一影像訊號或第二影像訊號。

Description

聲控顯示裝置及擷取語音訊號的方法
本發明係關於一種顯示裝置及擷取語音訊號的方法,特別是一種透過聲控調整畫面的顯示裝置以及透過雙麥克風擷取語音訊號的方法。
目前市面上的電腦螢幕皆提供使用者自行調整例如亮度、對比度、色溫、水平位置、垂直位置、掃描頻率等顯示模式設定。更詳細地來說,使用者需要手動按壓或觸碰位於螢幕下方、側邊或後方的實體按鍵來調整個人習慣的顯示模式。然而大部分的電腦螢幕提供的實體按鍵數量有限,因此經常具有一鍵多用的設計。例如同一個按鍵按一下跳出主選單,在數秒內按第二下則進入當前選定的子選單。
然而,對於一般使用者而言,調整顯示模式並非屬於經常性操作,因此往往不熟練如何透過實體按鍵調整顯示模式,而經常出現如下情況:在按壓按鍵作細部調整的過程中因為按壓過久而導致設定跑掉,或是因為不想超過而浪費時間慢慢一次一次按,又或者因為在考慮設定數值的過程中超過等待時間而跳回其他選單,致使前面作過的繁瑣的按鍵動作重作一次。尤其是對於專業玩家而言,螢幕的顯示模式影響遊戲操作的程度不容忽視,若為了調整螢幕時而耗費諸多時間,無疑將造成使用者諸多不便。
有鑑於此,本發明提出一種聲控顯示裝置,係透過截取使用者聲音中包括的顯示畫面操作指令,藉以解決上述提及的透過實體按鈕調整顯示裝置的不便之處。
依據本發明一實施例的所敘述的一種聲控顯示裝置,包括:顯示面板、訊號輸入埠、第一收音器、第二收音器、微處理器以及顯示控制器。訊號輸入埠從主機接收第一影像訊號。第一收音器具有第一收音端以供接收外部音訊,第一收音端鄰近設置於顯示面板且第一收音端及顯示面板位於聲控顯示裝置的同一側。第二收音器具有第二收音端以供接收外部音訊,第二收音器鄰近設置於顯示面板及第一收音器且第二收音端及顯示面板位於聲控顯示裝置的同一側微處理器電性連接收音器,微處理器根據外部音訊執行語音辨識程序以獲得一指令。顯示控制器電性連接訊號輸入埠、顯示面板及微處理器,顯示控制器根據所獲得的指令將第一影像訊號調整為第二影像訊號,且顯示面板呈現第一影像訊號或第二影像訊號。
依據本發明一實施例所敘述的一種擷取語音訊號的方法,包括:第一收音器及一第二收音器分別取得外部音訊,其中第一收音器之收音端及第二收音器之收音端皆鄰近設置於顯示面板的同一側;微處理器計算兩個外部音訊各自之特徵波形;微處理器根據兩個特徵波形計算一差異量;當差異量小於預設閾值時,微處理器根據外部音訊執行語音辨識程序以獲得指令,否則微處理器捨棄外部音訊。
藉由上述架構,本發明所揭露的聲控顯示裝置,讓使用者可透過語音控制螢幕的各項設定,進一步地在本發明所揭露的聲控顯示裝置的一實施例中,搭配本發明所揭露的擷取語音訊號的方法,透過雙麥克風配置於顯示面板同一側邊的特殊設計,達成較佳收取使用者語音的效果。因此,一般使用者得以輕鬆地調整螢幕的顯示模式,達到最佳的螢幕觀看視覺體驗。除此之外,對於專業玩家而言,更可即時地透過語音去轉換遊戲畫面與場景,節省了玩家手動操作滑鼠去轉換畫面與遊戲場景的時間。整體而言,本發明所揭露的聲控顯示裝置及擷取語音訊號的方法提供了更人性化的方式來操控螢幕,提升使用者更便利的螢幕調整與遊戲操作體驗。
以上之關於本揭露內容之說明及以下之實施方式之說明係用以示範與解釋本發明之精神與原理,並且提供本發明之專利申請範圍更進一步之解釋。
以下在實施方式中詳細敘述本發明之詳細特徵以及優點,其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施,且根據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理解本發明相關之目的及優點。以下之實施例係進一步詳細說明本發明之觀點,但非以任何觀點限制本發明之範疇。
請參考圖1,其係繪示本發明之一實施例所敘述的聲控顯示裝置的方塊架構示意圖,包括:顯示面板1、訊號輸入埠3、收音器5、微處理器7及顯示控制器9。
顯示面板1係一呈現畫面供使用者觀看的裝置。實務上,顯示面板1例如:扭曲向列面板(Twisted Nematic,TN)、平面切換(In-Plane-Switching,IPS)面板或垂直對齊(Vertical Alignment,VA)面板,然而顯示面板1之硬體結構並不以上述為限。
訊號輸入埠3用於自主機接收第一影像訊號,所述的主機例如係具有中央處理器的個人電腦、伺服器、智慧型手機或平板電腦等,但不以上述為限。實務上,訊號輸出埠3可採用常見的D-SUB(Subminiature)、數位視訊介面(Digital Video Interface,DVI)、高畫質多媒體介面(High Definition Multimedia Interface,HDMI)或DisplayPort等介面。
收音器5用於接收外部音訊。實務上,收音器5例如係一微機電系統(MicroElectrical Mechanical Systems,MEMS)麥克風。值得強調的是,在本發明一實施例中係採用雙麥克風的設計,如圖1所繪示的第一收音器52及第二收音器54。收音器5具有收音端接收外部音訊用的收音端,收音端較佳鄰近設置於顯示面板1,且收音端及顯示面板1皆位於聲控顯示裝置的同一側。請參考圖2,其係繪示第一收音器52的第一收音端52a與第二收音器52的第二收音端54a裝設於顯示面板1的示意圖,如圖2所示,第一收音端52a、第二收音端54a及顯示面板1皆位於聲控顯示裝置面向使用者的一側。
請參考圖3,其係繪示指向性麥克風的一場型圖及一收音範圍的示意圖。在本發明一實施例中,第一收音器52及第二收音器54係屬同一規格的指向性麥克風,且其指向性為心形(Cardioid)指向,如圖3左半部的場型圖(polar pattern)所示,心形區域係一指向性麥克風的收音範圍。進一步地,在麥克風前方由夾角A所形成的區域係指向性麥克風的最佳收音範圍。在本發明一實施例中,此夾角A為15-60度,實務上可設定為45度。另外,第一收音端52a及第二收音端54a之距離為2至4公分。請參考圖3右半部,第一收音器52的最佳收音範圍與第二收音器54的最佳收音範圍具有一交集區域P,此交集區域P表示為兩麥克風的最佳收音範圍。實務上,可透過調整第一收音端52a及第二收音端54a之間的距離或兩收音端擺放的角度而改變交集區域P的範圍大小。
請參考圖1。微處理器7電性連接第一收音器52及第二收音器54以接收外部音訊。實務上,從麥克風收入外部音訊後,可透過微機電指向性麥克風本身內建的類比數位轉換器(Analog-to-Digital Converter,ADC)或是透過外部的ADC晶片將外部音訊的類比訊號轉換為數位訊號,然後透過I2 S(Inter-IC Sound或Integrated Interchip Sound)介面將第一收音器52及第二收音器54所收到的數位聲音訊號傳送到微處理器7,微處理器7再根據外部音訊執行一語音辨識程序以獲得一指令,實務上,微處理器7例如係一語音辨識積體電路(Integrated Circuit,IC)或一微控制器(Micro Control Unit),本發明對於微處理器7之硬體結構並未特別限制。另外,在本發明另一實施例中,微處理器7更包括一韌體更新介面,此韌體更新介面用以下載不同語言的語音辨識資料庫,俾使本發明所揭露的聲控顯示裝置得以適用於各個國家。
在本發明一實施例中,所述的語音辨識程序主要關聯於一演算法。詳言之,在微處理器7取得外部音訊後,語音辨識程序計算兩個麥克風收到相同聲音的時間差。當此時間差小於或等於一預設閾值時,語音辨識程序採用此外部音訊進行語音辨識,以獲得該此外部音訊中所包含的語音指令;當此時間差超過一預設閾值時,語音辨識程序濾除此外部音訊。預設閾值的數值設定係關聯於第一收音端52及第二收音端54之間的距離。換個角度觀之,當外部音訊在交集區域P範圍以外的區域產生且被收音器5接收時,語音辨識程序可直接濾除這種聲音訊號,以免將聲控顯示裝置兩旁的環境雜音誤譯為語音指令。基於上述機制,本發明一實施例所敘述的微處理器7得以只針對交集區域P範圍內的聲音訊號進行語音辨識。另外需補充說明的是,除了採用時間差作為比較基準,亦可採用強度差或是其他可反映聲音傳遞距離的性質作為比較基準,本發明對此並未特別限制。
請參考圖1。顯示控制器9電性連接訊號輸入埠3、顯示面板1及微處理器7。一般而言,顯示控制器9用以將主機傳送來的影像訊號呈現於顯示面板1供使用者觀看。實務上,顯示控制器9例如係一用於螢幕控制的系統單晶片(System on Chip,SoC),並透過通用非同步接收發送傳輸器(Universal Asynchronous Receiver/Transmitter,UART)介面電性連接至微處理器7以接收指令。在本發明一實施例中,顯示控制器9更用以根據語音辨識程序獲得的指令將第一影像訊號調整為第二影像訊號,顯示面板1用以呈現第一影像訊號或第二影像訊號。第一影像訊號係由主機傳送的原始影像,在第一影像訊號於顯示面板1呈現的範圍中,顯示控制器9可設置一預設區域。第二影像訊號的一種實施態樣是:由顯示控制器9基於原本的第一影像訊號,在預設區域疊加另一局部影像。舉例來說,若語音指令為「提高亮度」,則顯示控制器9在預設區域中以圖像或文字形式呈現當前顯示面板1亮度的狀態,藉此告知使用者聲控顯示裝置已完成用戶指示的調整動作。
第二影像訊號的另一種實施態樣是:顯示控制器9使第二影像訊號中包括預設區域的一放大影像訊號。舉例來說,遊戲玩家經常需在遊戲進行中,針對遊戲畫面的某部分放大觀看,以便於後續的遊戲操作。請一併參考圖4A及圖4B,圖4A係第一影像訊號呈現於顯示面板1的示意圖,其係繪示一第一人稱視角的射擊遊戲畫面,其中包括四個預設區域D1~D4,由分隔線L1、L2所區隔。當玩家發出「放大左上角」的語音指令後,微處理器7所辨識出的指令可驅動顯示控制器9將屬於預設區域D1的第一影像訊號放大調整為第二影像訊號,顯示控制器9再將此第二影像訊號呈現於顯示面板1,如圖4B所示。因此,遊戲玩家可更快速地確認是否存在射擊目標或更準確地瞄準射擊目標,提升遊戲時的樂趣。
在本發明另一實施例中,聲控顯示裝置更具有一發光模組電性連接至顯示控制器9,且發光模組係用以根據指令地發出一指定顏色之色光。實務上,發光模組例如係設置於聲控顯示裝置背向於顯示面板1的發光二極體(Light Emitting Diode,LED),其發光時機與發光顏色皆可透過位於顯示面板1正面的第一收音器52及第二收音器54所接收的語音指令進行控制。相較於傳統的顯示裝置僅作為一種影像輸出裝置,本發明所揭露的聲控顯示裝置更可作為一種用於操控周邊燈光的輸入裝置,增進使用者觀看螢幕時的視覺體驗。此外,相較於以往遊戲主機提供的發光模組僅能透過廠商提供的操作介面自行編寫光線配置檔案以進行控制,本發明一實施例揭露的聲控顯示裝置所採用的語音指令控制方式無疑在操作方式上更為直覺且單純,減輕使用者須額外學習各種設定方式的負擔。
請參考圖5,其係繪示本發明一實施例的擷取語音訊號的方法的流程圖,此方法適用於前述的聲控顯示裝置。請參考步驟S1:第一收音器52及第二收音器54分別取得外部音訊。具體來說,此外部音訊例如是使用者發出的一螢幕控制指令,或是啟動微處理器7開始執行語音辨識程序的一啟動指令。請參考步驟S2:微處理器7計算兩個外部音訊各自的特徵波形。詳言之,本步驟係用以判斷第一收音器52及第二收音器54各自取得的外部音訊中屬於相同的聲音訊號的部分。詳言之,第一收音器52及第二收音器54所錄入的外部音訊可包含多個特徵波形,例如第一特徵波形是在圖3所示的交集區域P之外收錄的環境雜音,第二特徵波形是在交集區域P之內收錄的使用者語音。請參考步驟S3:微處理器7根據上述計算的特徵波形計算一差異量,其中差異量係一時間差或一強度差。以上述例子來說,微處理器7計算第一收音器52收錄的第一特徵波形與第二收音器54收錄的第一特徵波形之間的差異量,以及計算第一收音器52收錄的第二特徵波形與第二收音器54收錄的第二特徵波形之間的差異量。請參考步驟S4至步驟S5:當差異量小於一預設閾值時,微處理器7根據外部音訊中差異量小於一預設閾值的特徵波形執行語音辨識程序以獲得指令(以上述例子而言其係第二特徵波形)。反過來說當差異量大於或等於此預設閾值時,請參考步驟S4至步驟S6,微處理器7濾除外部音訊中差異量大於或等於此預設閾值的特徵波形(以上述例子而言其係第一特徵波形),以避免誤輸出使用者未發出的語音指令。
綜合以上所述,本發明所揭露的聲控顯示裝置,採用裝設於顯示面板同一側的兩個指向性麥克風接收相同的外部音訊,經由微處理器比對聲音訊號的相對強弱關係,將最佳收音範圍以外的外部音訊視為環境雜音並予以濾除。由於本發明揭露的擷取語音訊號的方法並非採用傳統以硬體電路從外部音訊中扣除環境音的方式,而是透過可持續微調改進的演算法提升對於使用者語音與環境雜音的辨識率。因此,由微處理器執行的語音辨識程序可確實根據使用者發出的聲音進行辨識而輸出對應的語音指令,顯示控制器再將獲取的語音指令用於將第一影像調整為第二影像,並透過顯示面板呈現第一影像或第二影像。因此,一般使用者得以輕鬆地調整螢幕的顯示模式,達到最佳的螢幕觀看視覺體驗。除此之外,對於專業玩家而言,更可即時地透過語音去轉換遊戲畫面與場景,節省了玩家手動操作滑鼠去轉換畫面與遊戲場景的時間。整體而言,本發明所揭露的聲控顯示裝置及擷取語音訊號的方法提供了更人性化的方式讓使用者操控螢幕,提升使用者更便利的螢幕調整與遊戲操作體驗。
雖然本發明以前述之實施例揭露如上,然其並非用以限定本發明。在不脫離本發明之精神和範圍內,所為之更動與潤飾,均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。
1‧‧‧顯示面板3‧‧‧訊號輸入埠52‧‧‧第一收音器52a‧‧‧第一收音端54‧‧‧第二收音器54a‧‧‧第二收音端7‧‧‧微處理器9‧‧‧顯示控制器A‧‧‧夾角P‧‧‧交集區域D1~D4‧‧‧預設區域L1、L2‧‧‧分隔線S1~S6‧‧‧步驟
圖1係依據本發明一實施例所繪示的聲控顯示裝置的方塊架構示意圖。 圖2係依據本發明一實施例所繪示的顯示面板與收音端位置示意圖。 圖3係依據本發明一實施例所繪示的場型圖及收音範圍示意圖。 圖4A係第一影像訊號呈現於顯示面板的示意圖。 圖4B係第二影像訊號呈現於顯示面板的示意圖。 圖5係依據本發明一實施例所繪示的擷取語音訊號的方法流程圖。
1‧‧‧顯示面板
3‧‧‧訊號輸入埠
5‧‧‧收音器
52‧‧‧第一收音器
54‧‧‧第二收音器
7‧‧‧微處理器
9‧‧‧顯示控制器

Claims (5)

  1. 一種聲控顯示裝置,包括:一顯示面板,具有複數邊;一訊號輸入埠,用於自一主機接收一第一影像訊號;一第一收音器,具有一第一收音端以供接收一外部音訊,該第一收音端鄰近設置於該顯示面板且該第一收音端及該顯示面板位於該聲控顯示裝置的同一側;一第二收音器,具有一第二收音端以供接收該外部音訊,該第二收音端及該第一收音端之間的距離小於該顯示面板的該些邊之中任一邊的長度;一微處理器,電性連接該第一收音器及該第二收音器,該微處理器用以根據該外部音訊執行一語音辨識程序以獲得一指令;以及一顯示控制器,電性連接該訊號輸入埠、該顯示面板及該微處理器,該顯示控制器用以根據該指令將該第一影像訊號調整為一第二影像訊號;其中,該顯示面板用以呈現該第一影像訊號或該第二影像訊號;該第一收音端及該第二收音端之距離為2至4公分;該第一收音器及該第二收音器皆係一指向性麥克風;以及該些指向性麥克風具有15-60度的收音範圍,且該第一收音器的收音範圍與該第二收音器的收音範圍具有一交集區域。
  2. 如請求項1所述的聲控顯示裝置,其中該第一影像訊號中包括一預設區域,且該指令用以驅動該顯示控制器使該第二影像訊號中包括該預設區域的一放大影像訊號。
  3. 如請求項1所述的聲控顯示裝置,其中該聲控顯示裝置更具有一發光模組電性連接至該顯示控制器,且該發光模組係用以根據該指令地發出一指定顏色之色光。
  4. 一種擷取語音訊號的方法,包括:以一第一收音器及一第二收音器分別取得一外部音訊,其中該第一收音器之一第一收音端及該第二收音器之一第二收音端皆鄰近設置於一顯示面板的同一側,該第一收音端及該第二收音端之間的距離小於該顯示面板的複數邊之中任一邊的長度;以一微處理器計算該些外部音訊各自之一特徵波形;以該微處理器根據該些特徵波形計算一差異量;當該差異量小於一預設閾值時,以該微處理器根據該外部音訊執行一語音辨識程序以獲得一指令,否則以該微處理器捨棄該特徵波形;其中該第一收音器之該第一收音端與該第二收音器之該第二收音端之距離為2至4公分;該第一收音器及該第二收音器皆係一指向性麥克風;以及該些指向性麥克風具有15-60度的收音範圍,且該第一收音器的收音範圍與該第二收音器的收音範圍具有一交集區域。
  5. 如請求項4所述的擷取語音訊號的方法,其中該差異量係一時間差或一強度差。
TW107118622A 2018-05-31 2018-05-31 聲控顯示裝置及擷取語音訊號的方法 TWI700630B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW107118622A TWI700630B (zh) 2018-05-31 2018-05-31 聲控顯示裝置及擷取語音訊號的方法
US16/379,714 US20190369955A1 (en) 2018-05-31 2019-04-09 Voice-controlled display device and method for extracting voice signals
EP19170483.2A EP3576086A3 (en) 2018-05-31 2019-04-23 Voice-controlled display device and method for extracting voice signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW107118622A TWI700630B (zh) 2018-05-31 2018-05-31 聲控顯示裝置及擷取語音訊號的方法

Publications (2)

Publication Number Publication Date
TW202004487A TW202004487A (zh) 2020-01-16
TWI700630B true TWI700630B (zh) 2020-08-01

Family

ID=66541997

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107118622A TWI700630B (zh) 2018-05-31 2018-05-31 聲控顯示裝置及擷取語音訊號的方法

Country Status (3)

Country Link
US (1) US20190369955A1 (zh)
EP (1) EP3576086A3 (zh)
TW (1) TWI700630B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111554278A (zh) * 2020-05-07 2020-08-18 Oppo广东移动通信有限公司 视频录制方法、装置、电子设备以及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030125959A1 (en) * 2001-12-31 2003-07-03 Palmquist Robert D. Translation device with planar microphone array
US6675027B1 (en) * 1999-11-22 2004-01-06 Microsoft Corp Personal mobile computing device having antenna microphone for improved speech recognition
US20050209066A1 (en) * 2004-03-12 2005-09-22 Penney Martial Arts Exercise Device and Method
TW200840312A (en) * 2007-03-29 2008-10-01 Jung-Tang Huang A personal reminding apparatus and method thereof
US20090254959A1 (en) * 2006-06-13 2009-10-08 Koninklijke Philips Electronics N.V. Distribution of ambience and content
US20100188929A1 (en) * 2009-01-23 2010-07-29 Victor Company Of Japan, Ltd. Electronic apparatus operable by external sound
TWI334703B (en) * 2004-09-02 2010-12-11 Inventec Multimedia & Telecom Voice-activated remote control system
US20120020485A1 (en) * 2010-07-26 2012-01-26 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
US20130041670A1 (en) * 1998-12-17 2013-02-14 Nuance Communications, Inc. Speech command input recognition system for interactive computer display with interpretation of ancillary relevant speech query terms into commands
US20150356972A1 (en) * 2013-03-25 2015-12-10 Panasonic Intellectual Property Management Co., Ltd. Voice recognition device and voice recognition method

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130041670A1 (en) * 1998-12-17 2013-02-14 Nuance Communications, Inc. Speech command input recognition system for interactive computer display with interpretation of ancillary relevant speech query terms into commands
US6675027B1 (en) * 1999-11-22 2004-01-06 Microsoft Corp Personal mobile computing device having antenna microphone for improved speech recognition
US20030125959A1 (en) * 2001-12-31 2003-07-03 Palmquist Robert D. Translation device with planar microphone array
US20050209066A1 (en) * 2004-03-12 2005-09-22 Penney Martial Arts Exercise Device and Method
TWI334703B (en) * 2004-09-02 2010-12-11 Inventec Multimedia & Telecom Voice-activated remote control system
US20090254959A1 (en) * 2006-06-13 2009-10-08 Koninklijke Philips Electronics N.V. Distribution of ambience and content
TW200840312A (en) * 2007-03-29 2008-10-01 Jung-Tang Huang A personal reminding apparatus and method thereof
US20100188929A1 (en) * 2009-01-23 2010-07-29 Victor Company Of Japan, Ltd. Electronic apparatus operable by external sound
US20120020485A1 (en) * 2010-07-26 2012-01-26 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
US20150356972A1 (en) * 2013-03-25 2015-12-10 Panasonic Intellectual Property Management Co., Ltd. Voice recognition device and voice recognition method

Also Published As

Publication number Publication date
TW202004487A (zh) 2020-01-16
US20190369955A1 (en) 2019-12-05
EP3576086A2 (en) 2019-12-04
EP3576086A3 (en) 2020-01-15

Similar Documents

Publication Publication Date Title
RU2617927C2 (ru) Устройство отображения и его способ управления
US10635386B2 (en) Systems and methods for providing audio to a user based on gaze input
TW201344597A (zh) 顯示裝置控制方法、控制器及多媒體系統
JP4796209B1 (ja) 表示装置、制御装置、テレビジョン受像機、表示装置の制御方法、プログラム及び記録媒体
US10564712B2 (en) Information processing device, information processing method, and program
WO2015037177A1 (en) Information processing apparatus method and program combining voice recognition with gaze detection
US20150262005A1 (en) Information processing apparatus, information processing method, and program
US20150055808A1 (en) Systems and methods for providing audio to a user based on gaze input
JP2017518691A (ja) 画像の取り込みを支援するためにハプティックフィードバックを提供するためのシステムおよび方法
WO2016045088A1 (zh) 控制应用程序的方法、装置和电子设备
JP2014048936A (ja) ジェスチャ認識装置、その制御方法、表示機器、および制御プログラム
US8766941B2 (en) Display device with on-screen display menu function
JP2011229141A (ja) テレビ受信機、およびテレビ受信機の動作モード自動設定方法
JP2023529589A (ja) リフレッシュ・レート調整方法及び電子デバイス
KR20160034944A (ko) 디바이스 상태를 표시하기 위해 광을 투사하는 방법, 시스템 및 매체
TWI700630B (zh) 聲控顯示裝置及擷取語音訊號的方法
KR102328121B1 (ko) 전자 장치 및 그 동작 방법
WO2017166684A1 (zh) 电子设备的音箱控制方法及装置
TWM569884U (zh) 可降噪的顯示系統
CN1913602A (zh) 一种具有播放模式选择功能的电视机
CN110556096A (zh) 声控显示装置及获取语音信号的方法
TWI783529B (zh) 模式切換方法及其顯示設備
CN205622752U (zh) 一种新型智能语音感应触摸识读液晶电视机
US7697072B2 (en) Image displaying method and apparatus for television when powering on/off
WO2019123754A1 (ja) 情報処理装置、情報処理方法、および記録媒体