TWI658404B - 語音辨識系統及其方法 - Google Patents
語音辨識系統及其方法 Download PDFInfo
- Publication number
- TWI658404B TWI658404B TW107104585A TW107104585A TWI658404B TW I658404 B TWI658404 B TW I658404B TW 107104585 A TW107104585 A TW 107104585A TW 107104585 A TW107104585 A TW 107104585A TW I658404 B TWI658404 B TW I658404B
- Authority
- TW
- Taiwan
- Prior art keywords
- electronic device
- instruction
- software
- speech recognition
- parameter
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000013515 script Methods 0.000 claims abstract description 84
- 230000003213 activating effect Effects 0.000 claims 1
- 230000005236 sound signal Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 241000238558 Eucarida Species 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
本發明提出一種語音辨識系統及其方法。所述系統包括頭戴式裝置以及電子裝置。電子裝置具有語音助理以及語音辨識軟體。語音助理根據第一語音訊號取得第一指令。語音辨識軟體根據電子裝置目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本。語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。第一應用程式根據第一參數執行對應於第一指令的第一操作。頭戴式裝置以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。
Description
本發明是有關於一種語音辨識系統及其方法。
當使用者在使用頭戴式裝置(例如,虛擬實境的頭盔)時,由於使用者無法看到鍵盤及滑鼠,即使有配套的遙控器,但該遙控器能夠輸入的指令仍然有限。此外,近年來語音助理技術(例如,iOS的Siri、Windows的Cortana或Android的GOOGLE NOW等)的發展已漸趨完整,而如何將語音助理技術應用在虛擬實境的內容中,仍是本領域技術人員所欲解決的問題之一。
本發明提供一種語音辨識系統與語音辨識方法,可以讓使用者在戴著頭戴式裝置時,使用者直接發出聲音下達指令以使得電子裝置辨識並執行包含參數的複雜指令。
本發明提出一種語音辨識系統。此系統包括頭戴式裝置以及電子裝置。電子裝置具有語音助理以及語音辨識軟體。語音助理根據第一語音訊號取得第一指令。語音辨識軟體根據電子裝置目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本。語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。第一應用程式根據第一參數執行對應於第一指令的第一操作。頭戴式裝置以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。
在本發明的一實施例中,其中在語音助理根據第一語音訊號取得第一指令的運作之前,語音助理根據第二語音訊號取得第二指令。電子裝置根據第二指令啟動語音辨識軟體。
在本發明的一實施例中,其中電子裝置包括第一電子裝置以及第二電子裝置。語音辨識軟體包括第一軟體以及第二軟體。其中,第一電子裝置用以執行第一軟體以及語音助理,第二電子裝置用以執行第二軟體以及第一應用程式。
在本發明的一實施例中,其中在語音辨識軟體根據電子裝置目前所執行的第一應用程式,從所述腳本中取得對應於第一應用程式的第一腳本的運作中,第一電子裝置執行第一軟體以根據第二電子裝置目前所執行的第一應用程式,從所述腳本中取得對應於第一應用程式的第一腳本。
在本發明的一實施例中,其中在語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數的運作中,第一電子裝置執行第一軟體以藉由第一軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。
在本發明的一實施例中,其中在第一應用程式根據第一參數執行對應於第一指令的第一操作的運作中,第二電子裝置所執行的第二軟體從第一電子裝置接收辨識結果,此辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數。第二電子裝置所執行的第一應用程式根據第一參數執行對應於第一指令的第一操作。
在本發明的一實施例中,其中所述腳本儲存於電子裝置或雲端資料庫中。
本發明提出一種語音辨識方法,用於語音辨識系統。此語音辨識系統包括頭戴式裝置以及電子裝置,其中電子裝置具有語音助理以及語音辨識軟體,所述方法包括:藉由語音助理根據第一語音訊號取得第一指令;藉由語音辨識軟體根據電子裝置目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本;藉由語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數;藉由第一應用程式根據第一參數執行對應於第一指令的第一操作;以及藉由頭戴式裝置以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。
在本發明的一實施例中,其中在藉由語音助理根據第一語音訊號取得第一指令的運作之前,所述方法更包括:藉由語音助理根據第二語音訊號取得第二指令;以及藉由電子裝置根據第二指令啟動語音辨識軟體。
在本發明的一實施例中,其中電子裝置包括第一電子裝置以及第二電子裝置,語音辨識軟體包括第一軟體以及第二軟體,所述方法更包括:藉由第一電子裝置執行第一軟體以及語音助理;以及藉由第二電子裝置執行第二軟體以及第一應用程式。
在本發明的一實施例中,其中藉由語音辨識軟體根據電子裝置目前所執行的第一應用程式,從所述腳本中取得對應於第一應用程式的第一腳本的步驟包括:藉由第一電子裝置執行第一軟體以根據第二電子裝置目前所執行的第一應用程式,從所述腳本中取得對應於第一應用程式的第一腳本。
在本發明的一實施例中,其中藉由語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數的步驟包括:藉由第一電子裝置執行第一軟體以藉由第一軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。
在本發明的一實施例中,其中藉由第一應用程式根據第一參數執行對應於第一指令的第一操作的步驟包括:藉由第二電子裝置所執行的第二軟體從第一電子裝置接收辨識結果,其中辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數;以及藉由第二電子裝置所執行的第一應用程式根據第一參數執行對應於第一指令的第一操作。
在本發明的一實施例中,其中所述腳本儲存於電子裝置或雲端資料庫中。
基於上述,本發明的語音辨識系統可以讓使用者在戴著頭戴式裝置時,使用者直接發出聲音下達指令以使得電子裝置辨識並執行包含參數的複雜指令。此外,本發明的語音辨識系統還可以將第一實施例中的語音辨識軟體分為第一軟體與第二軟體並分散儲存在第一電子裝置與第二電子裝置中,並藉由第一電子裝置執行第一軟體以辨識使用者下達的指令,並藉由第二電子裝置執行第二軟體以從第一電子裝置的第一軟體接收辨識結果以讓第二電子裝置所執行的第一應用程式根據辨識結果執行對應的操作。藉此,第二電子裝置可以不需具備語音助理且當第一電子裝置連結不同的第二電子裝置時,可以達到不需要每次重新設定對應於應用程式的腳本的技術效果。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
現將詳細參考本發明之示範性實施例,在附圖中說明所述示範性實施例之實例。另外,凡可能之處,在圖式及實施方式中使用相同標號的元件/構件代表相同或類似部分。
以下以多個實施例來描述本發明的語音辨識系統的運作方式。
[第一實施例]
圖1是依照本發明的第一實施例所繪示的語音辨識系統的示意圖。
請參照圖1,語音辨識系統1000包括頭戴式裝置100與電子裝置120。其中,頭戴式裝置100與電子裝置120彼此之間可以進行有線或無線的傳輸。
在本範例實施例中,頭戴式裝置100可以包括處理單元30、顯示單元32、通訊單元34以及儲存單元36。其中,顯示單元32、通訊單元34以及儲存單元36分別耦接至處理單元30。頭戴式裝置100例如是用以顯示虛擬實境的穿戴式顯示裝置(例如,頭戴式顯示裝置),在此不設限。
處理單元30可以是中央處理單元(Central Processing Unit,CPU),或是其他可程式化之一般用途或特殊用途的微處理器(Microprocessor)、數位信號處理器(Digital Signal Processor,DSP)、可程式化控制器、特殊應用積體電路(Application Specific Integrated Circuit,ASIC)或其他類似元件或上述元件的組合。
顯示單元32可以在頭戴式裝置100的顯示區域內提供顯示功能的顯示裝置。顯示單元32可為液晶顯示器(liquid crystal display, LCD)、發光二極體(light-emitting diode, LED)、場發射顯示器(field emission display, FED)等提供顯示功能的顯示裝置。
通訊單元34可為支援全球行動通信(global system for mobile communication, GSM)、個人手持式電話系統(personal handy-phone system, PHS)、碼多重擷取(code division multiple access, CDMA)系統、寬頻碼分多址(wideband code division multiple access, WCDMA)系統、長期演進(long term evolution, LTE)系統、全球互通微波存取(worldwide interoperability for microwave access, WiMAX)系統、無線保真(wireless fidelity, Wi-Fi)系統、藍牙、無線千兆聯盟(Wireless Gigabit Alliance,WiGig)技術或其他有線的信號傳輸的元件。頭戴式裝置100可以通過通訊單元34來與電子裝置120進行有線或無線的通訊。
儲存單元36可以是任何型態的固定或可移動隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)或類似元件或上述元件的組合。
在本範例實施例中,頭戴式裝置100的儲存單元36中儲存有多個程式碼片段,在上述程式碼片段被安裝後,會由處理單元30來執行。例如,儲存單元36中包括多個模組,藉由這些模組來分別執行頭戴式裝置100應用於語音辨識系統1000中的各個運作,其中各模組是由一或多個程式碼片段所組成。然而本發明不限於此,頭戴式裝置100的各個運作也可以是使用其他硬體形式的方式來實現。
此外,本實施例的電子裝置120包括處理單元40、輸入單元41、通訊單元42以及儲存單元44。其中,輸入單元41、通訊單元42以及儲存單元44分別耦接至處理單元40。處理單元40、通訊單元42以及儲存單元44可以分別是與上述處理單元30、通訊單元34以及儲存單元36相類似的元件,在此並不贅述。
輸入單元41可以是用於取得語音訊號(例如,聲音)的裝置或元件,例如麥克風。
在本範例實施例中,電子裝置120的儲存單元44中儲存有多個程式碼片段,在上述程式碼片段被安裝後,會由處理單元40來執行。例如,儲存單元44中包括多個模組,藉由這些模組來分別執行電子裝置120應用於語音辨識系統1000中的各個運作,其中各模組是由一或多個程式碼片段所組成。然而本發明不限於此,電子裝置120的各個運作也可以是使用其他硬體形式的方式來實現。
圖2A至圖2B是依照本發明的第一實施例所繪示的語音辨識系統的運作的示意圖。
請參照圖2A,在本範例實施例中,電子裝置120會被安裝語音助理50(例如,iOS的Siri、Windows的Cortana或Android的GOOGLE NOW等)以及語音辨識軟體52。當語音辨識軟體52尚未被啟動時,穿戴頭戴式裝置100的使用者可以發出聲音以下達指令。例如,穿戴頭戴式裝置100的使用者可以說出「launch voice command」。此時,語音助理50會透過輸入單元41取得「launch voice command」的語音訊號(在此稱為,第二語音訊號)。語音助理50會根據此第二語音訊號辨識並取得一指令(在此稱為,第二指令),此第二指令(例如為「launch」)用於開啟語音辨識軟體52。之後,電子裝置120會根據上述的第二指令啟動語音辨識軟體52。
此外,語音辨識軟體52還會根據電子裝置120目前所執行的應用程式(在此稱為,第一應用程式),從多個腳本中取得對應於第一應用程式的腳本(在此稱為,第一腳本)。舉例來說,圖3是依照本發明的一實施例所繪示的第一腳本的示意圖。請參照圖3,假設電子裝置120目前所執行的第一應用程式為「Call of Duty 2. exe」,則語音辨識軟體52會取得對應於「Call of Duty 2. exe」的第一腳本300。其中,第一腳本300中例如包括使用者可以下達的指令以及指令所對應的操作。須注意的是,不同的應用程式可以對應到不同的腳本。此外,上述的腳本可以是儲存於電子裝置120或雲端資料庫(未繪示)中。
舉例來說,請同時參照圖2B以及圖3,當電子裝置120已啟動語音辨識軟體52且目前所執行的第一應用程式為「Call of Duty 2. exe」時,語音辨識軟體52可以取得對應於「Call of Duty 2. exe」的第一腳本300。當使用者說出「voice command “Jump”」時,語音助理50會透過輸入單元41取得「voice command “Jump”」的語音訊號(在此稱為,第一語音訊號)。語音助理50會根據此第一語音訊號辨識並取得一指令(在此稱為,第一指令)。在本範例實施例中,第一指令為「Jump」。語音辨識軟體52會根據第一腳本300辨識對應第一指令的操作(在此稱為,第一操作) 以及在第一指令中的參數(在此稱為,第一參數)。如第一腳本300中的欄位60所示,當第一指令為「Jump」時,此時第一指令中不具有參數,而對應於此第一指令的第一操作為「Click space button」(即,按下空白鍵)。在辨識出第一指令所對應的操作後,第一應用程式(即,名為「Call of Duty 2. exe」的程式)可以執行對應於第一指令的第一操作。換句話說,當第一指令為「Jump」時,第一應用程式可以執行按下空白鍵的功能。之後,頭戴式裝置100會以虛擬實境的方式顯示執行對應於第一指令的第一操作的執行結果。
而在另一實施例中,當電子裝置120已啟動語音辨識軟體且目前所執行的第一應用程式為「Call of Duty 2. exe」時,語音辨識軟體52可以取得對應於「Call of Duty 2. exe」的第一腳本300。而當使用者說出「Jump after 3 seconds」時,語音助理50會透過輸入單元41取得「Jump after 3 seconds」的語音訊號(在此稱為,第一語音訊號)。語音助理50會根據此第一語音訊號辨識並取得一指令(在此稱為,第一指令)。在本範例實施例中,第一指令為「[command] after [number] seconds」。語音辨識軟體52會根據第一腳本300辨識對應第一指令的操作(在此稱為,第一操作) 以及第一指令中的參數(在此稱為,第一參數)。如第一腳本300中的欄位62所示,當第一指令為「[command] after [number] seconds」時,代表該第一指令中具有第一參數。由於第一語音訊號為「Jump after 3 seconds」,故第一參數包括「Jump」與「3」。而對應於第一指令的第一操作為「Do [command] action after [number] seconds」。在辨識出第一指令所對應的操作以及第一指令中的第一參數後,第一應用程式(即,名為「Call of Duty 2. exe」的程式)可以根據第一參數執行對應於第一指令的第一操作。換句話說,當第一語音訊號為「Jump after 3 seconds」時,第一應用程式可以執行在三秒之後按下空白鍵的功能。之後,頭戴式裝置100會以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。
圖4是依照本發明的第一實施例所繪示的語音辨識方法的流程圖。
請參照圖4,在步驟S401中,語音助理50根據第一語音訊號取得第一指令。在步驟S403中,語音辨識軟體52根據電子裝置120目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本。在步驟S405中,語音辨識軟體52根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。在步驟S407中,第一應用程式根據第一參數執行對應於第一指令的第一操作。最後在步驟S409中,頭戴式裝置100以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。須注意的是,本發明也可以先執行步驟S403再執行步驟S401。
藉由上述方式,針對電子裝置120目前所執行的應用程式,語音辨識軟體52會自動搜尋出對應的腳本。而當使用者在戴著頭戴式裝置100時,可以直接發出聲音下達指令以使得電子裝置100執行包含參數的複雜指令。然而須注意的是,一般的語音辨識系統並無法辨識包含參數的複雜指令。
[第二實施例]
圖5是依照本發明的第二實施例所繪示的語音辨識系統的示意圖。
請參照圖5,語音辨識系統2000包括頭戴式裝置100與電子裝置120。與第一實施例不同的是,第二實施例中的電子裝置120包括第一電子裝置120a與第二電子裝置120b且在本發明的第二實施例中,前述的語音辨識軟體52包括第一軟體與第二軟體。第一電子裝置120a用以執行第一軟體以及語音助理50,而第二電子裝置120b用以執行第二軟體以及前述的第一應用程式(例如名為「Call of Duty 2. exe」的程式)。
此外,在第二實施例中,第一電子裝置120a例如是行動裝置(例如,手機)或者是穿戴式裝置(例如,智慧型手表)。第二電子裝置120b例如是桌上型電腦。然而,本發明並不用於限定第一電子裝置120a與第二電子裝置120b的裝置種類。此外,第一電子裝置120a與第二電子裝置120b所需的元件可以如圖1中電子裝置120所繪示的元件,在此並不再贅述。此外,第一電子裝置120a與第二電子裝置120b彼此之間可以進行有線或無線的通訊。
圖6是依照本發明的第二實施例所繪示的語音辨識系統的運作的示意圖。
請參照圖6,在本範例實施例中,第一電子裝置120a會被安裝語音助理50(例如,iOS的Siri、Windows的Cortana或Android的GOOGLE NOW等)以及第一軟體70。第二電子裝置120b會被安裝第二軟體72以及第一應用程式74。
第一電子裝置120a首先會執行第一軟體70以根據第二電子裝置120b目前所執行的第一應用程式74,從多個腳本中取得對應於第一應用程式的腳本(在此稱為,第一腳本)。舉例來說,請再次參照圖3,假設第二電子裝置120b目前所執行的第一應用程式為「Call of Duty 2. exe」,則第一軟體70會取得對應於「Call of Duty 2. exe」的第一腳本300。
請同時參照圖6以及圖3,當第二電子裝置120b已啟動第二軟體72且目前所執行的第一應用程式74為「Call of Duty 2. exe」時,第一電子裝置120a的第一軟體70可以取得對應於「Call of Duty 2. exe」的第一腳本300。當使用者說出「voice command “Jump”」時,第一電子裝置120a的語音助理50會透過第一電子裝置120a的輸入單元取得「voice command “Jump”」的語音訊號(在此稱為,第一語音訊號)。語音助理50會根據此第一語音訊號辨識並取得一指令(在此稱為,第一指令)。在本範例實施例中,第一指令為「Jump」。第一電子裝置120a所執行的第一軟體70會根據第一腳本300辨識對應第一指令的操作(在此稱為,第一操作) 以及在第一指令中的參數(在此稱為,第一參數)。如第一腳本300中的欄位60所示,當第一指令為「Jump」時,此時第一指令中不具有參數,而對應於此第一指令的第一操作為「Click space button」(即,按下空白鍵)。在辨識出第一指令所對應的操作後,第二電子裝置120b所執行的第二軟體72會從第一電子裝置120a接收一辨識結果,此辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數。之後,第二軟體72可以將辨識結果中對應第一指令的第一操作以及第一指令中的第一參數傳送給第一應用程式74,第一應用程式74可以執行對應於第一指令的第一操作。換句話說,當第一指令為「Jump」時,第一應用程式可以執行按下空白鍵的功能。之後,頭戴式裝置100會以虛擬實境的方式顯示執行對應於第一指令的第一操作的執行結果。
而在另一實施例中,當第二電子裝置120b已啟動第二軟體72且目前所執行的第一應用程式74為「Call of Duty 2. exe」時,第一電子裝置120a的第一軟體70可以取得對應於「Call of Duty 2. exe」的第一腳本300。而當使用者說出「Jump after 3 seconds」時,第一電子裝置120a的語音助理50會透過第一電子裝置120a的輸入單元取得「Jump after 3 seconds」的語音訊號(在此稱為,第一語音訊號)。語音助理50會根據此第一語音訊號辨識並取得一指令(在此稱為,第一指令)。在本範例實施例中,第一指令為「[command] after [number] seconds」。第一電子裝置120a所執行的第一軟體70會根據第一腳本300辨識對應第一指令的操作(在此稱為,第一操作) 以及第一指令中的參數(在此稱為,第一參數)。如第一腳本300中的欄位62所示,當第一指令為「[command] after [number] seconds」代表該第一指令中具有第一參數。由於第一語音訊號為「Jump after 3 seconds」,故第一參數包括「Jump」與「3」。而對應於第一指令的第一操作為「Do [command] action after [number] seconds」。在辨識出第一指令所對應的操作以及第一指令中的第一參數後,第二電子裝置120b所執行的第二軟體72會從第一電子裝置120a接收一辨識結果,此辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數。之後,第二軟體72可以將辨識結果中對應第一指令的第一操作以及第一指令中的第一參數傳送給第一應用程式74,第一應用程式74可以根據第一參數執行對應於第一指令的第一操作。換句話說,當第一語音訊號為「Jump after 3 seconds」時,第一應用程式74可以執行在三秒之後按下空白鍵的功能。之後,頭戴式裝置100會以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。
圖7是依照本發明的第二實施例所繪示的語音辨識方法的流程圖。
請參照圖7,在步驟S701中,第一電子裝置120a執行語音助理50以根據第一語音訊號取得第一指令。在步驟S703中,第一電子裝置120a執行第一軟體70以根據第二電子裝置120b目前所執行的第一應用程式74,從腳本中取得對應於第一應用程式74的第一腳本。在步驟S705中,第一電子裝置120a執行第一軟體70以藉由第一軟體70根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。在步驟S707中,第二電子裝置120b所執行的第二軟體72從第一電子裝置120a接收一辨識結果,此辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數。最後在步驟S709中,第二電子裝置120b所執行的第一應用程式74根據第一參數執行對應於第一指令的第一操作。須注意的是,本發明也可以先執行步驟S703再執行步驟S701。
藉由上述方式,在第二實施例中,當第一電子裝置120a是行動式或穿戴式裝置時,由於行動式或穿戴式裝置的語音助理已相當成熟,故利用行動式或穿戴式裝置的語音助理實現解析指令的動作,一來可以避免第二電子裝置120b(例如,桌上型電腦)本身不具備語音助理的功能,二來用戶所設定的腳本設定也可以不需綁定第二電子裝置120b,藉由此方式,當第一電子裝置120a連結不同的第二電子裝置120b時,可以達到不需要每次重新設定對應於應用程式的腳本的技術效果。
綜上所述,在第一實施例中,本發明的語音辨識系統可以讓使用者在戴著頭戴式裝置時,使用者直接發出聲音下達指令以使得電子裝置辨識並執行包含參數的複雜指令。此外,在第二實施例中,可以將第一實施例中的語音辨識軟體分為第一軟體與第二軟體並分散儲存在第一電子裝置與第二電子裝置中,並藉由第一電子裝置執行第一軟體以辨識使用者下達的指令,並藉由第二電子裝置執行第二軟體以從第一電子裝置的第一軟體接收辨識結果以讓第二電子裝置所執行的第一應用程式根據辨識結果執行對應的操作。藉此,第二電子裝置可以不需具備語音助理且當第一電子裝置連結不同的第二電子裝置時,可以達到不需要每次重新設定對應於應用程式的腳本的技術效果。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
1000、2000‧‧‧語音辨識系統
100‧‧‧頭戴式裝置
120‧‧‧電子裝置
120a‧‧‧第一電子裝置
120b‧‧‧第二電子裝置
30、40‧‧‧處理單元
32‧‧‧顯示單元
34、42‧‧‧通訊單元
36、44‧‧‧儲存單元
41‧‧‧輸入單元
50‧‧‧語音助理
52‧‧‧語音辨識軟體
300‧‧‧第一腳本
60、62‧‧‧欄位
S401‧‧‧語音助理根據第一語音訊號取得第一指令的步驟
S403‧‧‧語音辨識軟體根據電子裝置目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本的步驟
S405‧‧‧語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數的步驟
S407‧‧‧第一應用程式根據第一參數執行對應於第一指令的第一操作的步驟
S409‧‧‧頭戴式裝置以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果的步驟
70‧‧‧第一軟體
72‧‧‧第二軟體
74‧‧‧第一應用程式
S701‧‧‧第一電子裝置執行語音助理以根據第一語音訊號取得第一指令的步驟
S703‧‧‧第一電子裝置執行第一軟體以根據第二電子裝置目前所執行的第一應用程式,從腳本中取得對應於第一應用程式的第一腳本的步驟
S705‧‧‧第一電子裝置執行第一軟體以藉由第一軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數的步驟
S707‧‧‧第二電子裝置所執行的第二軟體從第一電子裝置接收一辨識結果,辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數的步驟
S709‧‧‧第二電子裝置所執行的第一應用程式根據第一參數執行對應於第一指令的第一操作的步驟
圖1是依照本發明的第一實施例所繪示的語音辨識系統的示意圖。 圖2A至圖2B是依照本發明的第一實施例所繪示的語音辨識系統的運作的示意圖。 圖3是依照本發明的一實施例所繪示的第一腳本的示意圖。 圖4是依照本發明的第一實施例所繪示的語音辨識方法的流程圖。 圖5是依照本發明的第二實施例所繪示的語音辨識系統的示意圖。 圖6是依照本發明的第二實施例所繪示的語音辨識系統的運作的示意圖。 圖7是依照本發明的第二實施例所繪示的語音辨識方法的流程圖。
Claims (12)
- 一種語音辨識系統,包括:一頭戴式裝置;以及一電子裝置,具有一語音助理以及一語音辨識軟體,其中該語音助理根據一第一語音訊號取得一第一指令,該語音辨識軟體根據該電子裝置目前所執行的一第一應用程式,從多個腳本中取得對應於該第一應用程式的一第一腳本,該語音辨識軟體根據該第一腳本辨識對應該第一指令的一第一操作以及該第一指令中的一第一參數,該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作,以及該頭戴式裝置以虛擬實境的方式顯示根據該第一參數執行對應於該第一指令的該第一操作的一執行結果,其中在該語音助理根據該第一語音訊號取得該第一指令的運作之前,該語音助理根據一第二語音訊號取得一第二指令,以及該電子裝置根據該第二指令啟動該語音辨識軟體。
- 如申請專利範圍第1項所述的語音辨識系統,其中該電子裝置包括一第一電子裝置以及一第二電子裝置,該語音辨識軟體包括一第一軟體以及一第二軟體,其中該第一電子裝置用以執行該第一軟體以及該語音助理,以及該第二電子裝置用以執行該第二軟體以及該第一應用程式。
- 如申請專利範圍第2項所述的語音辨識系統,其中在該語音辨識軟體根據該電子裝置目前所執行的該第一應用程式,從該些腳本中取得對應於該第一應用程式的該第一腳本的運作中,該第一電子裝置執行該第一軟體以根據該第二電子裝置目前所執行的該第一應用程式,從該些腳本中取得對應於該第一應用程式的該第一腳本。
- 如申請專利範圍第3項所述的語音辨識系統,其中在該語音辨識軟體根據該第一腳本辨識對應該第一指令的該第一操作以及該第一指令中的該第一參數的運作中,該第一電子裝置執行該第一軟體以藉由該第一軟體根據該第一腳本辨識對應該第一指令的該第一操作以及該第一指令中的該第一參數。
- 如申請專利範圍第4項所述的語音辨識系統,其中在該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作的運作中,該第二電子裝置所執行的該第二軟體從該第一電子裝置接收一辨識結果,該辨識結果包括對應該第一指令的該第一操作以及該第一指令中的該第一參數,以及該第二電子裝置所執行的該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作。
- 如申請專利範圍第1項所述的語音辨識系統,其中該些腳本儲存於該電子裝置或一雲端資料庫中。
- 一種語音辨識方法,用於一語音辨識系統,該語音辨識系統包括一頭戴式裝置以及一電子裝置,其中該電子裝置具有一語音助理以及一語音辨識軟體,所述方法包括:藉由該語音助理根據一第一語音訊號取得一第一指令;藉由該語音辨識軟體根據該電子裝置目前所執行的一第一應用程式,從多個腳本中取得對應於該第一應用程式的一第一腳本;藉由該語音辨識軟體根據該第一腳本辨識對應該第一指令的一第一操作以及該第一指令中的一第一參數;藉由該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作;以及藉由該頭戴式裝置以虛擬實境的方式顯示根據該第一參數執行對應於該第一指令的該第一操作的一執行結果,其中在藉由該語音助理根據該第一語音訊號取得該第一指令的運作之前,所述方法更包括:藉由該語音助理根據一第二語音訊號取得一第二指令;以及藉由該電子裝置根據該第二指令啟動該語音辨識軟體。
- 如申請專利範圍第7項所述的語音辨識方法,其中該電子裝置包括一第一電子裝置以及一第二電子裝置,該語音辨識軟體包括一第一軟體以及一第二軟體,所述方法更包括:藉由該第一電子裝置執行該第一軟體以及該語音助理;以及藉由該第二電子裝置執行該第二軟體以及該第一應用程式。
- 如申請專利範圍第8項所述的語音辨識方法,其中藉由該語音辨識軟體根據該電子裝置目前所執行的該第一應用程式,從該些腳本中取得對應於該第一應用程式的該第一腳本的步驟包括藉由該第一電子裝置執行該第一軟體以根據該第二電子裝置目前所執行的該第一應用程式,從該些腳本中取得對應於該第一應用程式的該第一腳本。
- 如申請專利範圍第9項所述的語音辨識方法,其中藉由該語音辨識軟體根據該第一腳本辨識對應該第一指令的該第一操作以及該第一指令中的該第一參數的步驟包括:藉由該第一電子裝置執行該第一軟體以藉由該第一軟體根據該第一腳本辨識對應該第一指令的該第一操作以及該第一指令中的該第一參數。
- 如申請專利範圍第10項所述的語音辨識方法,其中藉由該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作的步驟包括:藉由該第二電子裝置所執行的該第二軟體從該第一電子裝置接收一辨識結果,其中該辨識結果包括對應該第一指令的該第一操作以及該第一指令中的該第一參數;以及藉由該第二電子裝置所執行的該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作。
- 如申請專利範圍第7項所述的語音辨識方法,其中該些腳本儲存於該電子裝置或一雲端資料庫中。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107104585A TWI658404B (zh) | 2018-02-09 | 2018-02-09 | 語音辨識系統及其方法 |
CN201810330094.7A CN110136702B (zh) | 2018-02-09 | 2018-04-13 | 语音识别***及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107104585A TWI658404B (zh) | 2018-02-09 | 2018-02-09 | 語音辨識系統及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI658404B true TWI658404B (zh) | 2019-05-01 |
TW201935228A TW201935228A (zh) | 2019-09-01 |
Family
ID=67347890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107104585A TWI658404B (zh) | 2018-02-09 | 2018-02-09 | 語音辨識系統及其方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110136702B (zh) |
TW (1) | TWI658404B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517683A (zh) * | 2019-09-04 | 2019-11-29 | 上海六感科技有限公司 | 头戴式vr/ar设备及其控制方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200843469A (en) * | 2007-04-26 | 2008-11-01 | Acer Inc | Smart phone providing remote data retrieval service and method of remote data retrieval thereof |
CN103180800A (zh) * | 2010-09-20 | 2013-06-26 | 寇平公司 | 使用动作及语音命令的主机应用程序的高级远程控制 |
CN104521223A (zh) * | 2012-07-25 | 2015-04-15 | 寇平公司 | 具有无需手动的紧急反应的头戴式电脑 |
CN105188516A (zh) * | 2013-03-11 | 2015-12-23 | 奇跃公司 | 用于增强和虚拟现实的***与方法 |
US20160284351A1 (en) * | 2015-03-26 | 2016-09-29 | Samsung Electronics Co., Ltd. | Method and electronic device for providing content |
US20170116987A1 (en) * | 2015-10-22 | 2017-04-27 | Samsung Electronics Co., Ltd. | Electronic device and method for executing function using speech recognition thereof |
CN206822084U (zh) * | 2017-04-11 | 2018-01-02 | 重庆银钢科技(集团)有限公司 | 一种头盔 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6871179B1 (en) * | 1999-07-07 | 2005-03-22 | International Business Machines Corporation | Method and apparatus for executing voice commands having dictation as a parameter |
US8041570B2 (en) * | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US8108853B2 (en) * | 2006-05-05 | 2012-01-31 | Honeywell International Inc. | Apparatus and method for allowing a fail-back to a prior software release in a process control system |
CN101923484A (zh) * | 2009-06-16 | 2010-12-22 | 宏碁股份有限公司 | 电子装置、计算机可执行***、及应用程序显示控制方法 |
CN103150250B (zh) * | 2013-02-25 | 2016-01-20 | 用友网络科技股份有限公司 | 应用程序性能检测***和应用程序性能检测方法 |
CN103200329A (zh) * | 2013-04-10 | 2013-07-10 | 威盛电子股份有限公司 | 语音操控方法、移动终端装置及语音操控*** |
CN104423941A (zh) * | 2013-08-27 | 2015-03-18 | 宏碁股份有限公司 | 电子装置及操控方法 |
CN106484119A (zh) * | 2016-10-24 | 2017-03-08 | 网易(杭州)网络有限公司 | 虚拟现实***及虚拟现实***输入方法 |
-
2018
- 2018-02-09 TW TW107104585A patent/TWI658404B/zh active
- 2018-04-13 CN CN201810330094.7A patent/CN110136702B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200843469A (en) * | 2007-04-26 | 2008-11-01 | Acer Inc | Smart phone providing remote data retrieval service and method of remote data retrieval thereof |
CN103180800A (zh) * | 2010-09-20 | 2013-06-26 | 寇平公司 | 使用动作及语音命令的主机应用程序的高级远程控制 |
CN104521223A (zh) * | 2012-07-25 | 2015-04-15 | 寇平公司 | 具有无需手动的紧急反应的头戴式电脑 |
CN105188516A (zh) * | 2013-03-11 | 2015-12-23 | 奇跃公司 | 用于增强和虚拟现实的***与方法 |
US20160284351A1 (en) * | 2015-03-26 | 2016-09-29 | Samsung Electronics Co., Ltd. | Method and electronic device for providing content |
US20170116987A1 (en) * | 2015-10-22 | 2017-04-27 | Samsung Electronics Co., Ltd. | Electronic device and method for executing function using speech recognition thereof |
CN206822084U (zh) * | 2017-04-11 | 2018-01-02 | 重庆银钢科技(集团)有限公司 | 一种头盔 |
Also Published As
Publication number | Publication date |
---|---|
CN110136702B (zh) | 2021-05-04 |
TW201935228A (zh) | 2019-09-01 |
CN110136702A (zh) | 2019-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11429439B2 (en) | Task scheduling based on performance control conditions for multiple processing units | |
EP3000345B1 (en) | Buckle apparatus for wearable device | |
TWI679578B (zh) | 外掛程式化打包方法、裝置、終端及存儲介質 | |
US10354643B2 (en) | Method for recognizing voice signal and electronic device supporting the same | |
EP3007416B1 (en) | Multi-connection method and electronic device supporting the same | |
EP3355304B1 (en) | Voice input method and electronic device supporting the same | |
US9871330B2 (en) | Waterproof key apparatus | |
US10146582B2 (en) | Method for assigning priority to multiprocessor tasks and electronic device supporting the same | |
WO2017185253A1 (zh) | 基于补丁升级的文件处理方法、装置、终端以及存储介质 | |
US20170083281A1 (en) | Method and electronic device for providing content | |
US9690618B2 (en) | Method for task scheduling and electronic device using the same | |
JP2016224966A5 (zh) | ||
US20240106932A1 (en) | Electronic apparatus for providing voice recognition control and operating method therefor | |
US10051370B2 (en) | Method for outputting audio signal and electronic device supporting the same | |
US20170265079A1 (en) | Electronic device and method for acquiring biometric information thereof | |
US20170262855A1 (en) | System and Method for Authentication and Payment in a Virtual Reality Environment | |
US20230024608A1 (en) | Automatic software performance optimization | |
US10115409B2 (en) | Adaptive processing of sound data | |
TWI658404B (zh) | 語音辨識系統及其方法 | |
US10319341B2 (en) | Electronic device and method for displaying content thereof | |
CN110945455A (zh) | 处理用户话语以用于控制外部电子装置的电子装置及其控制方法 | |
US20240070044A1 (en) | Staged release of updates with anomaly monitoring | |
KR102255361B1 (ko) | 인텐트 처리 방법 및 그 전자 장치 | |
KR102253091B1 (ko) | 기능 제어 방법 및 그 전자 장치 | |
TW202044021A (zh) | 頭戴式顯示系統及其軟體更新方法 |