TWI658404B - 語音辨識系統及其方法 - Google Patents

語音辨識系統及其方法 Download PDF

Info

Publication number
TWI658404B
TWI658404B TW107104585A TW107104585A TWI658404B TW I658404 B TWI658404 B TW I658404B TW 107104585 A TW107104585 A TW 107104585A TW 107104585 A TW107104585 A TW 107104585A TW I658404 B TWI658404 B TW I658404B
Authority
TW
Taiwan
Prior art keywords
electronic device
instruction
software
speech recognition
parameter
Prior art date
Application number
TW107104585A
Other languages
English (en)
Other versions
TW201935228A (zh
Inventor
黃志文
徐瑞慶
楊朝光
Original Assignee
宏碁股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 宏碁股份有限公司 filed Critical 宏碁股份有限公司
Priority to TW107104585A priority Critical patent/TWI658404B/zh
Priority to CN201810330094.7A priority patent/CN110136702B/zh
Application granted granted Critical
Publication of TWI658404B publication Critical patent/TWI658404B/zh
Publication of TW201935228A publication Critical patent/TW201935228A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

本發明提出一種語音辨識系統及其方法。所述系統包括頭戴式裝置以及電子裝置。電子裝置具有語音助理以及語音辨識軟體。語音助理根據第一語音訊號取得第一指令。語音辨識軟體根據電子裝置目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本。語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。第一應用程式根據第一參數執行對應於第一指令的第一操作。頭戴式裝置以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。

Description

語音辨識系統及其方法
本發明是有關於一種語音辨識系統及其方法。
當使用者在使用頭戴式裝置(例如,虛擬實境的頭盔)時,由於使用者無法看到鍵盤及滑鼠,即使有配套的遙控器,但該遙控器能夠輸入的指令仍然有限。此外,近年來語音助理技術(例如,iOS的Siri、Windows的Cortana或Android的GOOGLE NOW等)的發展已漸趨完整,而如何將語音助理技術應用在虛擬實境的內容中,仍是本領域技術人員所欲解決的問題之一。
本發明提供一種語音辨識系統與語音辨識方法,可以讓使用者在戴著頭戴式裝置時,使用者直接發出聲音下達指令以使得電子裝置辨識並執行包含參數的複雜指令。
本發明提出一種語音辨識系統。此系統包括頭戴式裝置以及電子裝置。電子裝置具有語音助理以及語音辨識軟體。語音助理根據第一語音訊號取得第一指令。語音辨識軟體根據電子裝置目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本。語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。第一應用程式根據第一參數執行對應於第一指令的第一操作。頭戴式裝置以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。
在本發明的一實施例中,其中在語音助理根據第一語音訊號取得第一指令的運作之前,語音助理根據第二語音訊號取得第二指令。電子裝置根據第二指令啟動語音辨識軟體。
在本發明的一實施例中,其中電子裝置包括第一電子裝置以及第二電子裝置。語音辨識軟體包括第一軟體以及第二軟體。其中,第一電子裝置用以執行第一軟體以及語音助理,第二電子裝置用以執行第二軟體以及第一應用程式。
在本發明的一實施例中,其中在語音辨識軟體根據電子裝置目前所執行的第一應用程式,從所述腳本中取得對應於第一應用程式的第一腳本的運作中,第一電子裝置執行第一軟體以根據第二電子裝置目前所執行的第一應用程式,從所述腳本中取得對應於第一應用程式的第一腳本。
在本發明的一實施例中,其中在語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數的運作中,第一電子裝置執行第一軟體以藉由第一軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。
在本發明的一實施例中,其中在第一應用程式根據第一參數執行對應於第一指令的第一操作的運作中,第二電子裝置所執行的第二軟體從第一電子裝置接收辨識結果,此辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數。第二電子裝置所執行的第一應用程式根據第一參數執行對應於第一指令的第一操作。
在本發明的一實施例中,其中所述腳本儲存於電子裝置或雲端資料庫中。
本發明提出一種語音辨識方法,用於語音辨識系統。此語音辨識系統包括頭戴式裝置以及電子裝置,其中電子裝置具有語音助理以及語音辨識軟體,所述方法包括:藉由語音助理根據第一語音訊號取得第一指令;藉由語音辨識軟體根據電子裝置目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本;藉由語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數;藉由第一應用程式根據第一參數執行對應於第一指令的第一操作;以及藉由頭戴式裝置以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。
在本發明的一實施例中,其中在藉由語音助理根據第一語音訊號取得第一指令的運作之前,所述方法更包括:藉由語音助理根據第二語音訊號取得第二指令;以及藉由電子裝置根據第二指令啟動語音辨識軟體。
在本發明的一實施例中,其中電子裝置包括第一電子裝置以及第二電子裝置,語音辨識軟體包括第一軟體以及第二軟體,所述方法更包括:藉由第一電子裝置執行第一軟體以及語音助理;以及藉由第二電子裝置執行第二軟體以及第一應用程式。
在本發明的一實施例中,其中藉由語音辨識軟體根據電子裝置目前所執行的第一應用程式,從所述腳本中取得對應於第一應用程式的第一腳本的步驟包括:藉由第一電子裝置執行第一軟體以根據第二電子裝置目前所執行的第一應用程式,從所述腳本中取得對應於第一應用程式的第一腳本。
在本發明的一實施例中,其中藉由語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數的步驟包括:藉由第一電子裝置執行第一軟體以藉由第一軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。
在本發明的一實施例中,其中藉由第一應用程式根據第一參數執行對應於第一指令的第一操作的步驟包括:藉由第二電子裝置所執行的第二軟體從第一電子裝置接收辨識結果,其中辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數;以及藉由第二電子裝置所執行的第一應用程式根據第一參數執行對應於第一指令的第一操作。
在本發明的一實施例中,其中所述腳本儲存於電子裝置或雲端資料庫中。
基於上述,本發明的語音辨識系統可以讓使用者在戴著頭戴式裝置時,使用者直接發出聲音下達指令以使得電子裝置辨識並執行包含參數的複雜指令。此外,本發明的語音辨識系統還可以將第一實施例中的語音辨識軟體分為第一軟體與第二軟體並分散儲存在第一電子裝置與第二電子裝置中,並藉由第一電子裝置執行第一軟體以辨識使用者下達的指令,並藉由第二電子裝置執行第二軟體以從第一電子裝置的第一軟體接收辨識結果以讓第二電子裝置所執行的第一應用程式根據辨識結果執行對應的操作。藉此,第二電子裝置可以不需具備語音助理且當第一電子裝置連結不同的第二電子裝置時,可以達到不需要每次重新設定對應於應用程式的腳本的技術效果。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
現將詳細參考本發明之示範性實施例,在附圖中說明所述示範性實施例之實例。另外,凡可能之處,在圖式及實施方式中使用相同標號的元件/構件代表相同或類似部分。
以下以多個實施例來描述本發明的語音辨識系統的運作方式。
[第一實施例]
圖1是依照本發明的第一實施例所繪示的語音辨識系統的示意圖。
請參照圖1,語音辨識系統1000包括頭戴式裝置100與電子裝置120。其中,頭戴式裝置100與電子裝置120彼此之間可以進行有線或無線的傳輸。
在本範例實施例中,頭戴式裝置100可以包括處理單元30、顯示單元32、通訊單元34以及儲存單元36。其中,顯示單元32、通訊單元34以及儲存單元36分別耦接至處理單元30。頭戴式裝置100例如是用以顯示虛擬實境的穿戴式顯示裝置(例如,頭戴式顯示裝置),在此不設限。
處理單元30可以是中央處理單元(Central Processing Unit,CPU),或是其他可程式化之一般用途或特殊用途的微處理器(Microprocessor)、數位信號處理器(Digital Signal Processor,DSP)、可程式化控制器、特殊應用積體電路(Application Specific Integrated Circuit,ASIC)或其他類似元件或上述元件的組合。
顯示單元32可以在頭戴式裝置100的顯示區域內提供顯示功能的顯示裝置。顯示單元32可為液晶顯示器(liquid crystal display, LCD)、發光二極體(light-emitting diode, LED)、場發射顯示器(field emission display, FED)等提供顯示功能的顯示裝置。
通訊單元34可為支援全球行動通信(global system for mobile communication, GSM)、個人手持式電話系統(personal handy-phone system, PHS)、碼多重擷取(code division multiple access, CDMA)系統、寬頻碼分多址(wideband code division multiple access, WCDMA)系統、長期演進(long term evolution, LTE)系統、全球互通微波存取(worldwide interoperability for microwave access, WiMAX)系統、無線保真(wireless fidelity, Wi-Fi)系統、藍牙、無線千兆聯盟(Wireless Gigabit Alliance,WiGig)技術或其他有線的信號傳輸的元件。頭戴式裝置100可以通過通訊單元34來與電子裝置120進行有線或無線的通訊。
儲存單元36可以是任何型態的固定或可移動隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)或類似元件或上述元件的組合。
在本範例實施例中,頭戴式裝置100的儲存單元36中儲存有多個程式碼片段,在上述程式碼片段被安裝後,會由處理單元30來執行。例如,儲存單元36中包括多個模組,藉由這些模組來分別執行頭戴式裝置100應用於語音辨識系統1000中的各個運作,其中各模組是由一或多個程式碼片段所組成。然而本發明不限於此,頭戴式裝置100的各個運作也可以是使用其他硬體形式的方式來實現。
此外,本實施例的電子裝置120包括處理單元40、輸入單元41、通訊單元42以及儲存單元44。其中,輸入單元41、通訊單元42以及儲存單元44分別耦接至處理單元40。處理單元40、通訊單元42以及儲存單元44可以分別是與上述處理單元30、通訊單元34以及儲存單元36相類似的元件,在此並不贅述。
輸入單元41可以是用於取得語音訊號(例如,聲音)的裝置或元件,例如麥克風。
在本範例實施例中,電子裝置120的儲存單元44中儲存有多個程式碼片段,在上述程式碼片段被安裝後,會由處理單元40來執行。例如,儲存單元44中包括多個模組,藉由這些模組來分別執行電子裝置120應用於語音辨識系統1000中的各個運作,其中各模組是由一或多個程式碼片段所組成。然而本發明不限於此,電子裝置120的各個運作也可以是使用其他硬體形式的方式來實現。
圖2A至圖2B是依照本發明的第一實施例所繪示的語音辨識系統的運作的示意圖。
請參照圖2A,在本範例實施例中,電子裝置120會被安裝語音助理50(例如,iOS的Siri、Windows的Cortana或Android的GOOGLE NOW等)以及語音辨識軟體52。當語音辨識軟體52尚未被啟動時,穿戴頭戴式裝置100的使用者可以發出聲音以下達指令。例如,穿戴頭戴式裝置100的使用者可以說出「launch voice command」。此時,語音助理50會透過輸入單元41取得「launch voice command」的語音訊號(在此稱為,第二語音訊號)。語音助理50會根據此第二語音訊號辨識並取得一指令(在此稱為,第二指令),此第二指令(例如為「launch」)用於開啟語音辨識軟體52。之後,電子裝置120會根據上述的第二指令啟動語音辨識軟體52。
此外,語音辨識軟體52還會根據電子裝置120目前所執行的應用程式(在此稱為,第一應用程式),從多個腳本中取得對應於第一應用程式的腳本(在此稱為,第一腳本)。舉例來說,圖3是依照本發明的一實施例所繪示的第一腳本的示意圖。請參照圖3,假設電子裝置120目前所執行的第一應用程式為「Call of Duty 2. exe」,則語音辨識軟體52會取得對應於「Call of Duty 2. exe」的第一腳本300。其中,第一腳本300中例如包括使用者可以下達的指令以及指令所對應的操作。須注意的是,不同的應用程式可以對應到不同的腳本。此外,上述的腳本可以是儲存於電子裝置120或雲端資料庫(未繪示)中。
舉例來說,請同時參照圖2B以及圖3,當電子裝置120已啟動語音辨識軟體52且目前所執行的第一應用程式為「Call of Duty 2. exe」時,語音辨識軟體52可以取得對應於「Call of Duty 2. exe」的第一腳本300。當使用者說出「voice command “Jump”」時,語音助理50會透過輸入單元41取得「voice command “Jump”」的語音訊號(在此稱為,第一語音訊號)。語音助理50會根據此第一語音訊號辨識並取得一指令(在此稱為,第一指令)。在本範例實施例中,第一指令為「Jump」。語音辨識軟體52會根據第一腳本300辨識對應第一指令的操作(在此稱為,第一操作) 以及在第一指令中的參數(在此稱為,第一參數)。如第一腳本300中的欄位60所示,當第一指令為「Jump」時,此時第一指令中不具有參數,而對應於此第一指令的第一操作為「Click space button」(即,按下空白鍵)。在辨識出第一指令所對應的操作後,第一應用程式(即,名為「Call of Duty 2. exe」的程式)可以執行對應於第一指令的第一操作。換句話說,當第一指令為「Jump」時,第一應用程式可以執行按下空白鍵的功能。之後,頭戴式裝置100會以虛擬實境的方式顯示執行對應於第一指令的第一操作的執行結果。
而在另一實施例中,當電子裝置120已啟動語音辨識軟體且目前所執行的第一應用程式為「Call of Duty 2. exe」時,語音辨識軟體52可以取得對應於「Call of Duty 2. exe」的第一腳本300。而當使用者說出「Jump after 3 seconds」時,語音助理50會透過輸入單元41取得「Jump after 3 seconds」的語音訊號(在此稱為,第一語音訊號)。語音助理50會根據此第一語音訊號辨識並取得一指令(在此稱為,第一指令)。在本範例實施例中,第一指令為「[command] after [number] seconds」。語音辨識軟體52會根據第一腳本300辨識對應第一指令的操作(在此稱為,第一操作) 以及第一指令中的參數(在此稱為,第一參數)。如第一腳本300中的欄位62所示,當第一指令為「[command] after [number] seconds」時,代表該第一指令中具有第一參數。由於第一語音訊號為「Jump after 3 seconds」,故第一參數包括「Jump」與「3」。而對應於第一指令的第一操作為「Do [command] action after [number] seconds」。在辨識出第一指令所對應的操作以及第一指令中的第一參數後,第一應用程式(即,名為「Call of Duty 2. exe」的程式)可以根據第一參數執行對應於第一指令的第一操作。換句話說,當第一語音訊號為「Jump after 3 seconds」時,第一應用程式可以執行在三秒之後按下空白鍵的功能。之後,頭戴式裝置100會以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。
圖4是依照本發明的第一實施例所繪示的語音辨識方法的流程圖。
請參照圖4,在步驟S401中,語音助理50根據第一語音訊號取得第一指令。在步驟S403中,語音辨識軟體52根據電子裝置120目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本。在步驟S405中,語音辨識軟體52根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。在步驟S407中,第一應用程式根據第一參數執行對應於第一指令的第一操作。最後在步驟S409中,頭戴式裝置100以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。須注意的是,本發明也可以先執行步驟S403再執行步驟S401。
藉由上述方式,針對電子裝置120目前所執行的應用程式,語音辨識軟體52會自動搜尋出對應的腳本。而當使用者在戴著頭戴式裝置100時,可以直接發出聲音下達指令以使得電子裝置100執行包含參數的複雜指令。然而須注意的是,一般的語音辨識系統並無法辨識包含參數的複雜指令。
[第二實施例]
圖5是依照本發明的第二實施例所繪示的語音辨識系統的示意圖。
請參照圖5,語音辨識系統2000包括頭戴式裝置100與電子裝置120。與第一實施例不同的是,第二實施例中的電子裝置120包括第一電子裝置120a與第二電子裝置120b且在本發明的第二實施例中,前述的語音辨識軟體52包括第一軟體與第二軟體。第一電子裝置120a用以執行第一軟體以及語音助理50,而第二電子裝置120b用以執行第二軟體以及前述的第一應用程式(例如名為「Call of Duty 2. exe」的程式)。
此外,在第二實施例中,第一電子裝置120a例如是行動裝置(例如,手機)或者是穿戴式裝置(例如,智慧型手表)。第二電子裝置120b例如是桌上型電腦。然而,本發明並不用於限定第一電子裝置120a與第二電子裝置120b的裝置種類。此外,第一電子裝置120a與第二電子裝置120b所需的元件可以如圖1中電子裝置120所繪示的元件,在此並不再贅述。此外,第一電子裝置120a與第二電子裝置120b彼此之間可以進行有線或無線的通訊。
圖6是依照本發明的第二實施例所繪示的語音辨識系統的運作的示意圖。
請參照圖6,在本範例實施例中,第一電子裝置120a會被安裝語音助理50(例如,iOS的Siri、Windows的Cortana或Android的GOOGLE NOW等)以及第一軟體70。第二電子裝置120b會被安裝第二軟體72以及第一應用程式74。
第一電子裝置120a首先會執行第一軟體70以根據第二電子裝置120b目前所執行的第一應用程式74,從多個腳本中取得對應於第一應用程式的腳本(在此稱為,第一腳本)。舉例來說,請再次參照圖3,假設第二電子裝置120b目前所執行的第一應用程式為「Call of Duty 2. exe」,則第一軟體70會取得對應於「Call of Duty 2. exe」的第一腳本300。
請同時參照圖6以及圖3,當第二電子裝置120b已啟動第二軟體72且目前所執行的第一應用程式74為「Call of Duty 2. exe」時,第一電子裝置120a的第一軟體70可以取得對應於「Call of Duty 2. exe」的第一腳本300。當使用者說出「voice command “Jump”」時,第一電子裝置120a的語音助理50會透過第一電子裝置120a的輸入單元取得「voice command “Jump”」的語音訊號(在此稱為,第一語音訊號)。語音助理50會根據此第一語音訊號辨識並取得一指令(在此稱為,第一指令)。在本範例實施例中,第一指令為「Jump」。第一電子裝置120a所執行的第一軟體70會根據第一腳本300辨識對應第一指令的操作(在此稱為,第一操作) 以及在第一指令中的參數(在此稱為,第一參數)。如第一腳本300中的欄位60所示,當第一指令為「Jump」時,此時第一指令中不具有參數,而對應於此第一指令的第一操作為「Click space button」(即,按下空白鍵)。在辨識出第一指令所對應的操作後,第二電子裝置120b所執行的第二軟體72會從第一電子裝置120a接收一辨識結果,此辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數。之後,第二軟體72可以將辨識結果中對應第一指令的第一操作以及第一指令中的第一參數傳送給第一應用程式74,第一應用程式74可以執行對應於第一指令的第一操作。換句話說,當第一指令為「Jump」時,第一應用程式可以執行按下空白鍵的功能。之後,頭戴式裝置100會以虛擬實境的方式顯示執行對應於第一指令的第一操作的執行結果。
而在另一實施例中,當第二電子裝置120b已啟動第二軟體72且目前所執行的第一應用程式74為「Call of Duty 2. exe」時,第一電子裝置120a的第一軟體70可以取得對應於「Call of Duty 2. exe」的第一腳本300。而當使用者說出「Jump after 3 seconds」時,第一電子裝置120a的語音助理50會透過第一電子裝置120a的輸入單元取得「Jump after 3 seconds」的語音訊號(在此稱為,第一語音訊號)。語音助理50會根據此第一語音訊號辨識並取得一指令(在此稱為,第一指令)。在本範例實施例中,第一指令為「[command] after [number] seconds」。第一電子裝置120a所執行的第一軟體70會根據第一腳本300辨識對應第一指令的操作(在此稱為,第一操作) 以及第一指令中的參數(在此稱為,第一參數)。如第一腳本300中的欄位62所示,當第一指令為「[command] after [number] seconds」代表該第一指令中具有第一參數。由於第一語音訊號為「Jump after 3 seconds」,故第一參數包括「Jump」與「3」。而對應於第一指令的第一操作為「Do [command] action after [number] seconds」。在辨識出第一指令所對應的操作以及第一指令中的第一參數後,第二電子裝置120b所執行的第二軟體72會從第一電子裝置120a接收一辨識結果,此辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數。之後,第二軟體72可以將辨識結果中對應第一指令的第一操作以及第一指令中的第一參數傳送給第一應用程式74,第一應用程式74可以根據第一參數執行對應於第一指令的第一操作。換句話說,當第一語音訊號為「Jump after 3 seconds」時,第一應用程式74可以執行在三秒之後按下空白鍵的功能。之後,頭戴式裝置100會以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果。
圖7是依照本發明的第二實施例所繪示的語音辨識方法的流程圖。
請參照圖7,在步驟S701中,第一電子裝置120a執行語音助理50以根據第一語音訊號取得第一指令。在步驟S703中,第一電子裝置120a執行第一軟體70以根據第二電子裝置120b目前所執行的第一應用程式74,從腳本中取得對應於第一應用程式74的第一腳本。在步驟S705中,第一電子裝置120a執行第一軟體70以藉由第一軟體70根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數。在步驟S707中,第二電子裝置120b所執行的第二軟體72從第一電子裝置120a接收一辨識結果,此辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數。最後在步驟S709中,第二電子裝置120b所執行的第一應用程式74根據第一參數執行對應於第一指令的第一操作。須注意的是,本發明也可以先執行步驟S703再執行步驟S701。
藉由上述方式,在第二實施例中,當第一電子裝置120a是行動式或穿戴式裝置時,由於行動式或穿戴式裝置的語音助理已相當成熟,故利用行動式或穿戴式裝置的語音助理實現解析指令的動作,一來可以避免第二電子裝置120b(例如,桌上型電腦)本身不具備語音助理的功能,二來用戶所設定的腳本設定也可以不需綁定第二電子裝置120b,藉由此方式,當第一電子裝置120a連結不同的第二電子裝置120b時,可以達到不需要每次重新設定對應於應用程式的腳本的技術效果。
綜上所述,在第一實施例中,本發明的語音辨識系統可以讓使用者在戴著頭戴式裝置時,使用者直接發出聲音下達指令以使得電子裝置辨識並執行包含參數的複雜指令。此外,在第二實施例中,可以將第一實施例中的語音辨識軟體分為第一軟體與第二軟體並分散儲存在第一電子裝置與第二電子裝置中,並藉由第一電子裝置執行第一軟體以辨識使用者下達的指令,並藉由第二電子裝置執行第二軟體以從第一電子裝置的第一軟體接收辨識結果以讓第二電子裝置所執行的第一應用程式根據辨識結果執行對應的操作。藉此,第二電子裝置可以不需具備語音助理且當第一電子裝置連結不同的第二電子裝置時,可以達到不需要每次重新設定對應於應用程式的腳本的技術效果。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
1000、2000‧‧‧語音辨識系統
100‧‧‧頭戴式裝置
120‧‧‧電子裝置
120a‧‧‧第一電子裝置
120b‧‧‧第二電子裝置
30、40‧‧‧處理單元
32‧‧‧顯示單元
34、42‧‧‧通訊單元
36、44‧‧‧儲存單元
41‧‧‧輸入單元
50‧‧‧語音助理
52‧‧‧語音辨識軟體
300‧‧‧第一腳本
60、62‧‧‧欄位
S401‧‧‧語音助理根據第一語音訊號取得第一指令的步驟
S403‧‧‧語音辨識軟體根據電子裝置目前所執行的第一應用程式,從多個腳本中取得對應於第一應用程式的第一腳本的步驟
S405‧‧‧語音辨識軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數的步驟
S407‧‧‧第一應用程式根據第一參數執行對應於第一指令的第一操作的步驟
S409‧‧‧頭戴式裝置以虛擬實境的方式顯示根據第一參數執行對應於第一指令的第一操作的執行結果的步驟
70‧‧‧第一軟體
72‧‧‧第二軟體
74‧‧‧第一應用程式
S701‧‧‧第一電子裝置執行語音助理以根據第一語音訊號取得第一指令的步驟
S703‧‧‧第一電子裝置執行第一軟體以根據第二電子裝置目前所執行的第一應用程式,從腳本中取得對應於第一應用程式的第一腳本的步驟
S705‧‧‧第一電子裝置執行第一軟體以藉由第一軟體根據第一腳本辨識對應第一指令的第一操作以及第一指令中的第一參數的步驟
S707‧‧‧第二電子裝置所執行的第二軟體從第一電子裝置接收一辨識結果,辨識結果包括對應第一指令的第一操作以及第一指令中的第一參數的步驟
S709‧‧‧第二電子裝置所執行的第一應用程式根據第一參數執行對應於第一指令的第一操作的步驟
圖1是依照本發明的第一實施例所繪示的語音辨識系統的示意圖。 圖2A至圖2B是依照本發明的第一實施例所繪示的語音辨識系統的運作的示意圖。 圖3是依照本發明的一實施例所繪示的第一腳本的示意圖。 圖4是依照本發明的第一實施例所繪示的語音辨識方法的流程圖。 圖5是依照本發明的第二實施例所繪示的語音辨識系統的示意圖。 圖6是依照本發明的第二實施例所繪示的語音辨識系統的運作的示意圖。 圖7是依照本發明的第二實施例所繪示的語音辨識方法的流程圖。

Claims (12)

  1. 一種語音辨識系統,包括:一頭戴式裝置;以及一電子裝置,具有一語音助理以及一語音辨識軟體,其中該語音助理根據一第一語音訊號取得一第一指令,該語音辨識軟體根據該電子裝置目前所執行的一第一應用程式,從多個腳本中取得對應於該第一應用程式的一第一腳本,該語音辨識軟體根據該第一腳本辨識對應該第一指令的一第一操作以及該第一指令中的一第一參數,該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作,以及該頭戴式裝置以虛擬實境的方式顯示根據該第一參數執行對應於該第一指令的該第一操作的一執行結果,其中在該語音助理根據該第一語音訊號取得該第一指令的運作之前,該語音助理根據一第二語音訊號取得一第二指令,以及該電子裝置根據該第二指令啟動該語音辨識軟體。
  2. 如申請專利範圍第1項所述的語音辨識系統,其中該電子裝置包括一第一電子裝置以及一第二電子裝置,該語音辨識軟體包括一第一軟體以及一第二軟體,其中該第一電子裝置用以執行該第一軟體以及該語音助理,以及該第二電子裝置用以執行該第二軟體以及該第一應用程式。
  3. 如申請專利範圍第2項所述的語音辨識系統,其中在該語音辨識軟體根據該電子裝置目前所執行的該第一應用程式,從該些腳本中取得對應於該第一應用程式的該第一腳本的運作中,該第一電子裝置執行該第一軟體以根據該第二電子裝置目前所執行的該第一應用程式,從該些腳本中取得對應於該第一應用程式的該第一腳本。
  4. 如申請專利範圍第3項所述的語音辨識系統,其中在該語音辨識軟體根據該第一腳本辨識對應該第一指令的該第一操作以及該第一指令中的該第一參數的運作中,該第一電子裝置執行該第一軟體以藉由該第一軟體根據該第一腳本辨識對應該第一指令的該第一操作以及該第一指令中的該第一參數。
  5. 如申請專利範圍第4項所述的語音辨識系統,其中在該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作的運作中,該第二電子裝置所執行的該第二軟體從該第一電子裝置接收一辨識結果,該辨識結果包括對應該第一指令的該第一操作以及該第一指令中的該第一參數,以及該第二電子裝置所執行的該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作。
  6. 如申請專利範圍第1項所述的語音辨識系統,其中該些腳本儲存於該電子裝置或一雲端資料庫中。
  7. 一種語音辨識方法,用於一語音辨識系統,該語音辨識系統包括一頭戴式裝置以及一電子裝置,其中該電子裝置具有一語音助理以及一語音辨識軟體,所述方法包括:藉由該語音助理根據一第一語音訊號取得一第一指令;藉由該語音辨識軟體根據該電子裝置目前所執行的一第一應用程式,從多個腳本中取得對應於該第一應用程式的一第一腳本;藉由該語音辨識軟體根據該第一腳本辨識對應該第一指令的一第一操作以及該第一指令中的一第一參數;藉由該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作;以及藉由該頭戴式裝置以虛擬實境的方式顯示根據該第一參數執行對應於該第一指令的該第一操作的一執行結果,其中在藉由該語音助理根據該第一語音訊號取得該第一指令的運作之前,所述方法更包括:藉由該語音助理根據一第二語音訊號取得一第二指令;以及藉由該電子裝置根據該第二指令啟動該語音辨識軟體。
  8. 如申請專利範圍第7項所述的語音辨識方法,其中該電子裝置包括一第一電子裝置以及一第二電子裝置,該語音辨識軟體包括一第一軟體以及一第二軟體,所述方法更包括:藉由該第一電子裝置執行該第一軟體以及該語音助理;以及藉由該第二電子裝置執行該第二軟體以及該第一應用程式。
  9. 如申請專利範圍第8項所述的語音辨識方法,其中藉由該語音辨識軟體根據該電子裝置目前所執行的該第一應用程式,從該些腳本中取得對應於該第一應用程式的該第一腳本的步驟包括藉由該第一電子裝置執行該第一軟體以根據該第二電子裝置目前所執行的該第一應用程式,從該些腳本中取得對應於該第一應用程式的該第一腳本。
  10. 如申請專利範圍第9項所述的語音辨識方法,其中藉由該語音辨識軟體根據該第一腳本辨識對應該第一指令的該第一操作以及該第一指令中的該第一參數的步驟包括:藉由該第一電子裝置執行該第一軟體以藉由該第一軟體根據該第一腳本辨識對應該第一指令的該第一操作以及該第一指令中的該第一參數。
  11. 如申請專利範圍第10項所述的語音辨識方法,其中藉由該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作的步驟包括:藉由該第二電子裝置所執行的該第二軟體從該第一電子裝置接收一辨識結果,其中該辨識結果包括對應該第一指令的該第一操作以及該第一指令中的該第一參數;以及藉由該第二電子裝置所執行的該第一應用程式根據該第一參數執行對應於該第一指令的該第一操作。
  12. 如申請專利範圍第7項所述的語音辨識方法,其中該些腳本儲存於該電子裝置或一雲端資料庫中。
TW107104585A 2018-02-09 2018-02-09 語音辨識系統及其方法 TWI658404B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW107104585A TWI658404B (zh) 2018-02-09 2018-02-09 語音辨識系統及其方法
CN201810330094.7A CN110136702B (zh) 2018-02-09 2018-04-13 语音识别***及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW107104585A TWI658404B (zh) 2018-02-09 2018-02-09 語音辨識系統及其方法

Publications (2)

Publication Number Publication Date
TWI658404B true TWI658404B (zh) 2019-05-01
TW201935228A TW201935228A (zh) 2019-09-01

Family

ID=67347890

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107104585A TWI658404B (zh) 2018-02-09 2018-02-09 語音辨識系統及其方法

Country Status (2)

Country Link
CN (1) CN110136702B (zh)
TW (1) TWI658404B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110517683A (zh) * 2019-09-04 2019-11-29 上海六感科技有限公司 头戴式vr/ar设备及其控制方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200843469A (en) * 2007-04-26 2008-11-01 Acer Inc Smart phone providing remote data retrieval service and method of remote data retrieval thereof
CN103180800A (zh) * 2010-09-20 2013-06-26 寇平公司 使用动作及语音命令的主机应用程序的高级远程控制
CN104521223A (zh) * 2012-07-25 2015-04-15 寇平公司 具有无需手动的紧急反应的头戴式电脑
CN105188516A (zh) * 2013-03-11 2015-12-23 奇跃公司 用于增强和虚拟现实的***与方法
US20160284351A1 (en) * 2015-03-26 2016-09-29 Samsung Electronics Co., Ltd. Method and electronic device for providing content
US20170116987A1 (en) * 2015-10-22 2017-04-27 Samsung Electronics Co., Ltd. Electronic device and method for executing function using speech recognition thereof
CN206822084U (zh) * 2017-04-11 2018-01-02 重庆银钢科技(集团)有限公司 一种头盔

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6871179B1 (en) * 1999-07-07 2005-03-22 International Business Machines Corporation Method and apparatus for executing voice commands having dictation as a parameter
US8041570B2 (en) * 2005-05-31 2011-10-18 Robert Bosch Corporation Dialogue management using scripts
US8108853B2 (en) * 2006-05-05 2012-01-31 Honeywell International Inc. Apparatus and method for allowing a fail-back to a prior software release in a process control system
CN101923484A (zh) * 2009-06-16 2010-12-22 宏碁股份有限公司 电子装置、计算机可执行***、及应用程序显示控制方法
CN103150250B (zh) * 2013-02-25 2016-01-20 用友网络科技股份有限公司 应用程序性能检测***和应用程序性能检测方法
CN103200329A (zh) * 2013-04-10 2013-07-10 威盛电子股份有限公司 语音操控方法、移动终端装置及语音操控***
CN104423941A (zh) * 2013-08-27 2015-03-18 宏碁股份有限公司 电子装置及操控方法
CN106484119A (zh) * 2016-10-24 2017-03-08 网易(杭州)网络有限公司 虚拟现实***及虚拟现实***输入方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200843469A (en) * 2007-04-26 2008-11-01 Acer Inc Smart phone providing remote data retrieval service and method of remote data retrieval thereof
CN103180800A (zh) * 2010-09-20 2013-06-26 寇平公司 使用动作及语音命令的主机应用程序的高级远程控制
CN104521223A (zh) * 2012-07-25 2015-04-15 寇平公司 具有无需手动的紧急反应的头戴式电脑
CN105188516A (zh) * 2013-03-11 2015-12-23 奇跃公司 用于增强和虚拟现实的***与方法
US20160284351A1 (en) * 2015-03-26 2016-09-29 Samsung Electronics Co., Ltd. Method and electronic device for providing content
US20170116987A1 (en) * 2015-10-22 2017-04-27 Samsung Electronics Co., Ltd. Electronic device and method for executing function using speech recognition thereof
CN206822084U (zh) * 2017-04-11 2018-01-02 重庆银钢科技(集团)有限公司 一种头盔

Also Published As

Publication number Publication date
CN110136702B (zh) 2021-05-04
TW201935228A (zh) 2019-09-01
CN110136702A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
US11429439B2 (en) Task scheduling based on performance control conditions for multiple processing units
EP3000345B1 (en) Buckle apparatus for wearable device
TWI679578B (zh) 外掛程式化打包方法、裝置、終端及存儲介質
US10354643B2 (en) Method for recognizing voice signal and electronic device supporting the same
EP3007416B1 (en) Multi-connection method and electronic device supporting the same
EP3355304B1 (en) Voice input method and electronic device supporting the same
US9871330B2 (en) Waterproof key apparatus
US10146582B2 (en) Method for assigning priority to multiprocessor tasks and electronic device supporting the same
WO2017185253A1 (zh) 基于补丁升级的文件处理方法、装置、终端以及存储介质
US20170083281A1 (en) Method and electronic device for providing content
US9690618B2 (en) Method for task scheduling and electronic device using the same
JP2016224966A5 (zh)
US20240106932A1 (en) Electronic apparatus for providing voice recognition control and operating method therefor
US10051370B2 (en) Method for outputting audio signal and electronic device supporting the same
US20170265079A1 (en) Electronic device and method for acquiring biometric information thereof
US20170262855A1 (en) System and Method for Authentication and Payment in a Virtual Reality Environment
US20230024608A1 (en) Automatic software performance optimization
US10115409B2 (en) Adaptive processing of sound data
TWI658404B (zh) 語音辨識系統及其方法
US10319341B2 (en) Electronic device and method for displaying content thereof
CN110945455A (zh) 处理用户话语以用于控制外部电子装置的电子装置及其控制方法
US20240070044A1 (en) Staged release of updates with anomaly monitoring
KR102255361B1 (ko) 인텐트 처리 방법 및 그 전자 장치
KR102253091B1 (ko) 기능 제어 방법 및 그 전자 장치
TW202044021A (zh) 頭戴式顯示系統及其軟體更新方法