TWI508057B - 語音辨識系統以及方法 - Google Patents
語音辨識系統以及方法 Download PDFInfo
- Publication number
- TWI508057B TWI508057B TW102125241A TW102125241A TWI508057B TW I508057 B TWI508057 B TW I508057B TW 102125241 A TW102125241 A TW 102125241A TW 102125241 A TW102125241 A TW 102125241A TW I508057 B TWI508057 B TW I508057B
- Authority
- TW
- Taiwan
- Prior art keywords
- voice recognition
- user
- voice
- server
- dictionary
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 26
- 230000005540 biological transmission Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本發明是有關於一種語音辨識系統以及方法。
語音識別技術係用以將人類的語音中的詞彙內容轉換為計算機可存取的輸入,例如按鍵、二進制編碼或者字元序列。目前一般常用規則模型或是統計模型,來進行語音辨識的搜尋和比對。規則模型會分析語音中的語言文法、結構等,來進行語音辨識。統計模型則會使用機率統計的方式,來搜尋語言單位內的資料。不管應用何者進行語音辨識,皆有一定的複雜度。
傳統的語音辨識系統中,常會將全部的系統實作在單一使用者裝置上。然而,此種作法多半需要耗費使用者裝置上較多的計算資源,才能夠達到即時的語音辨識且具有一定的辨識正確率。此外,此類的使用者裝置多半採用封閉系統架構,不方便使用者更新字典檔。
因此,如何降低使用者裝置進行語音辨識所需耗費之計算資源,實屬當前重要研發課題之一,亦成為當前相關領域亟需改進的目標。
因此,本發明之一態樣是在提供一種語音辨識系統,用以根據使用者對應之個人字典檔,進行語音辨識。語音辨識系統包含一伺服器、一資料傳輸界面以及一語音辨識裝置。語音辨識裝置透過資料傳輸界面與伺服器建立連結。語音辨識裝置包含一麥克風、一輸出元件以及一處理元件。處理元件電性連接麥克風以及輸出元件。處理元件包含一使用者資訊接收模組、一個人字典取得模組、一語音接收模組、一音訊轉換模組以及一搜尋模組。使用者資訊接收模組接收一使用者之一使用者資訊。個人字典取得模組透過資料傳輸界面,傳送使用者資訊至伺服器,以取得使用者資訊對應之一個人字典檔。語音接收模組透過麥克風接收使用者之一待辨識語音訊號。音訊轉換模組根據使用者對應之一聲紋檔案,將待辨識語音訊號轉換為一數位特徵檔。搜尋模組根據數位特徵檔搜尋個人字典檔,以取得一語音辨識結果,並透過輸出元件,輸出語音辨識結果。
本發明之另一態樣是在提供一種語音辨識方法,其包含以下步驟:(a)由一語音辨識裝置,接收一使用者之一使用者資訊;(b)由語音辨識裝置傳送使用者資訊至一伺服器,以取得使用者資訊對應之一個人字典檔;(c)透過語音辨識裝置之一麥克風接收使用者之一待辨識語音訊號;
(d)由語音辨識裝置根據使用者對應之一聲紋檔案,將待辨識語音訊號轉換為一數位特徵檔;以及(e)由語音辨識裝置根據數位特徵檔搜尋個人字典檔,以取得一語音辨識結果,並輸出語音辨識結果。
100‧‧‧伺服器
110‧‧‧更新模組
120‧‧‧相關字典提供模組
200‧‧‧資料傳輸界面
300‧‧‧語音辨識裝置
310‧‧‧麥克風
320‧‧‧輸出元件
330‧‧‧處理元件
331‧‧‧使用者資訊接收模組
332‧‧‧個人字典取得模組
333‧‧‧語音接收模組
334‧‧‧音訊轉換模組
335‧‧‧搜尋模組
336‧‧‧聲音辨識模組
337‧‧‧辨識錯誤判斷模組
400‧‧‧語音辨識方法
410-450‧‧‧步驟
第1圖繪示依照本發明一實施例的一種語音辨識系統之功能方塊圖。
第2圖為依照本發明一實施方式的一種語音辨識方法之流程圖。
以下將以圖式及詳細說明本發明之精神,任何所屬技術領域中具有通常知識者在瞭解本發明之較佳實施例後,當可由本發明所教示之技術加以改變及修飾,其並不脫離本發明之精神與範圍。
請參照第1圖,其繪示依照本發明一實施例的一種語音辨識系統之功能方塊圖。語音辨識系統根據使用者對應之個人字典檔,進行語音辨識。
語音辨識系統包含一伺服器100、一資料傳輸界面200以及一語音辨識裝置300。其中,伺服器100可由至少一個伺服器所提供。當伺服器100由多個伺服器所提供時,此些伺服器可包含至少一當地伺服器、至少一雲端伺服器
或其組合。其中,當地伺服器可儲存當地字典檔,以服務當地使用者;雲端伺服器則可儲存專業字典檔,服務所有使用者。
資料傳輸界面200可為有線或無線網路通訊協定。然而,在其他實施例中,資料傳輸界面200可為其他類型有線或無線之資料傳輸界面,並不限於本揭露書中。
語音辨識裝置300透過資料傳輸界面200與伺服器100建立連結。語音辨識裝置300包含一麥克風310、一輸出元件320以及一處理元件330。處理元件330電性連接麥克風310以及輸出元件320。
處理元件330包含一使用者資訊接收模組331、一個人字典取得模組332、一語音接收模組333、一音訊轉換模組334以及一搜尋模組335。使用者資訊接收模組331接收一使用者之一使用者資訊。在本發明之一些實施例中,使用者可透過鍵盤、滑鼠、圖形化使用者界面(Graphical User Interface,GUI)或其他類型之輸入界面,輸入其使用者資訊。在本發明之另一些實施例中,處理元件330之一聲音辨識模組336可透過麥克風310接收一使用者聲音訊號,根據使用者聲音訊號,判斷使用者為何,並對應產生使用者之使用者資訊,供使用者資訊接收模組331接收。其中,聲音辨識模組336可辨識出使用者對應之使用者識別資訊,作為其使用者資訊。此外,聲音辨識模組336可根據使用者聲音訊號,辨識出使用者之聲音類別(如語言、腔調或其他類型之聲音類別),作為其使用者資訊。
個人字典取得模組332透過資料傳輸界面200,傳送使用者資訊至伺服器100,以取得使用者資訊對應之一個人字典檔。其中,個人字典檔的產生可取決於使用者的語音辨識結果的歷史資料,以及他人近期使用的相關資料。舉例來說,個人字典取得模組332可取得收錄使用者常用字彙之個人字典檔。又例如說,個人字典取得模組332可根據使用者資訊中之語言、腔調或其他類型之聲音類別,取得相應之個人字典檔。
語音接收模組333透過麥克風310接收使用者之一待辨識語音訊號。音訊轉換模組334根據使用者對應之一聲紋檔案,將待辨識語音訊號轉換為一數位特徵檔。如此一來,可避免因為使用者聲音特性不同,所造成的語音辨識正確率低落之缺點。此外,數位特徵檔的檔案大小將小於待辨識語音訊號,因此可縮短進一步語音辨識所需之時間。
搜尋模組335根據數位特徵檔搜尋個人字典檔,以取得一語音辨識結果,並透過輸出元件320,輸出語音辨識結果。在本發明之一些實施例中,輸出元件320可為一顯示元件,用以顯示語音辨識結果。在本發明之另一些實施例中,輸出元件320可為一喇叭,用以發出語音辨識結果對應之聲音。然而,在本發明之其他實施例中,輸出元件320可用其他輸出方式,輸出語音辨識結果,並不限於本揭露書。如此一來,語音辨識裝置300不須儲存大量之字典檔,即可提供精確的語音辨識功能。因此,可用處理元件
效能較差或儲存元件容量較小之電子裝置,作為語音辨識裝置300。
此外,在本發明之一些實施例中,使用者可透過語音辨識裝置300之鍵盤、滑鼠、圖形化使用者界面(Graphical User Interface,GUI)或其他類型之輸入界面,回饋語音辨識結果是否正確。在本發明之另一些實施例中,處理元件330更可包含一辨識錯誤判斷模組337。由於一般使用者在發覺辨識錯誤時,會重複其先前說出之字彙或句子,以進行重新辨識。因此,辨識錯誤判斷模組337可先判斷麥克風310所接收之訊號是否與先前之待辨識語音訊號相同。當麥克風310接收與待辨識語音訊號相同之一重複語音訊號時,辨識錯誤判斷模組337會判定語音辨識結果辨識錯誤。如此一來,當使用者在發覺辨識錯誤時,僅需重複發出相同聲音,即可使語音辨識裝置300判定辨識錯誤,重新修正其辨識結果,方便使用者操作。
另外,伺服器100之一更新模組110更可透過資料傳輸界面200,自語音辨識裝置300接收語音辨識結果是否正確之資訊,作為更新個人字典之依據。舉例來說,更新模組110可根據語音辨識結果之正確與否,調整對應詞彙之權重,進而提高辨識之正確率。
在本發明之一些實施例中,伺服器100更可包含一相關字典提供模組120。相關字典提供模組120透過資料傳輸界面200,接收語音辨識結果,並根據語音辨識結果,傳送一相關字典檔至語音辨識裝置300,供搜尋模組335搜
尋。舉例來說,當相關字典提供模組120判斷語音辨識結果相關於天氣,相關字典提供模組120傳送包含天氣相關詞彙之相關字典檔至語音辨識裝置300。如此一來,可提高語音辨識裝置300之辨識正確率。此外,亦可縮短因為辨識錯誤,而需修改辨識結果或重新傳送字典檔之額外時間。
在本發明之另一些實施例中,伺服器100若包含當地伺服器時,當地伺服器可儲存近期常用字典檔。由於同一個當地伺服器服務的使用者多半具有相近的語音內容或習慣用字,因而可減少當地伺服器所需儲存之字典檔的檔案大小。
請參照第2圖,其為依照本發明一實施方式的一種語音辨識方法之流程圖。語音辨識方法可實作為一電腦程式,並儲存於一電腦可讀取記錄媒體中,而使電腦讀取此記錄媒體後執行語音辨識方法。電腦可讀取記錄媒體可為唯讀記憶體、快閃記憶體、軟碟、硬碟、光碟、隨身碟、磁帶、可由網路存取之資料庫或熟悉此技藝者可輕易思及具有相同功能之電腦可讀取記錄媒體。語音辨識方法400包含以下步驟:
在步驟410中,由一語音辨識裝置,接收一使用者之一使用者資訊。在本發明之一些實施例中,使用者可透過鍵盤、滑鼠、圖形化使用者界面或其他類型之輸入界面,輸入其使用者資訊。在本發明之另一些實施例中,可透過語音辨識裝置之麥克風接收一使用者聲音訊號。接下來,可根據使用者聲音訊號,判斷使用者為何,並對應產生使
用者之使用者資訊,供語音辨識裝置接收(步驟410)。其中,可辨識出使用者對應之使用者識別資訊,作為其使用者資訊。此外,亦可根據使用者聲音訊號,辨識出使用者之聲音類別(如語言、腔調或其他類型之聲音類別),作為其使用者資訊。
在步驟420中,由語音辨識裝置傳送使用者資訊至一伺服器,以取得使用者資訊對應之一個人字典檔。舉例來說,語音辨識裝置可取得收錄使用者常用字彙之個人字典檔。又例如說,可根據使用者資訊中之語言、腔調或其他類型之聲音類別,取得相應之個人字典檔。
在步驟430中,透過語音辨識裝置之一麥克風接收使用者之一待辨識語音訊號。
在步驟440中,由語音辨識裝置根據使用者對應之一聲紋檔案,將待辨識語音訊號轉換為一數位特徵檔。
在步驟450中,由語音辨識裝置根據數位特徵檔搜尋個人字典檔,以取得一語音辨識結果,並輸出語音辨識結果。在步驟450之一些實施例中,可透過顯示元件顯示(輸出)語音辨識結果。在步驟450之另一些實施例中,可發出(輸出)語音辨識結果對應之聲音。然而,在步驟450之其他實施例中,可用其他輸出方式,輸出語音辨識結果,並不限於本揭露書。如此一來,語音辨識裝置不須儲存大量之字典檔,即可即時提供精確的語音辨識功能。因此,可用處理元件效能較差或儲存元件容量較小之電子裝置,作為語音辨識裝置。
此外,在本發明之一些實施例中,由伺服器自語音辨識裝置,接收語音辨識結果是否正確之資訊,作為伺服器更新個人字典之依據。其中,語音辨識結果是否正確之資訊可透過鍵盤、滑鼠、圖形化使用者界面或其他類型之輸入界面接收。另外,亦可在語音辨識裝置之麥克風接收與待辨識語音訊號相同之一重複語音訊號時,判定語音辨識結果辨識錯誤。如此一來,使用者在發覺辨識錯誤時,僅需重複發出相同聲音,即可使語音辨識裝置判定辨識錯誤,重新修正其辨識結果,方便使用者操作。
另外,伺服器亦可進一步接收語音辨識結果。於是,可由伺服器根據收到之語音辨識結果,傳送一相關字典檔至語音辨識裝置,作為步驟450執行搜尋之依據。舉例來說,當判斷語音辨識結果相關於天氣,伺服器傳送包含天氣相關詞彙之相關字典檔至語音辨識裝置。如此一來,可提高語音辨識裝置之辨識正確率。此外,亦可縮短因為辨識錯誤,而需修改辨識結果或重新傳送字典檔之額外時間。
在本發明之一些實施例中,語音辨識裝置可儲存一預設字典檔。語音辨識方法400更可包含在語音辨識裝置無法辨識使用者之使用者資訊時,將預設字典檔視為個人字典檔。如此一來,在因使用者第一次登入或其他原因使得其使用者資訊無法被辨識時,仍可藉由預設字典檔提供基本的語音辨識功能。
在本發明之另一些實施例中,可記錄使用者之對話
或其歷史使用資料。於是,可根據使用者之對話內容以及歷史使用資料,產生一當前使用字典檔,以儲存於伺服器。伺服器可將當前使用字典檔設為使用者資訊對應之個人字典檔。
在本發明之另一些實施例中,伺服器可根據於本地端所提供之語音辨識服務,產生並儲存一近期常用字典檔。於是,近期常用字典檔將符合伺服器所服務之本地使用者之使用習慣。接下來,當將當前使用字典檔設為使用者資訊對應之個人字典檔之一辨識正確率小於一門檻值時,使用近期常用字典檔進行語音辨識。如此一來,使用者的使用習慣應與伺服器所服務之當地使用者相近,因此可作為改善語音辨識正確率之依據。
在本發明之另一些實施例中,可將使用者常用之至少一常用字詞儲存於伺服器中之一私人字典檔。於是,可根據使用者之私人字典檔,修改使用者之當前使用字典檔,以更符合使用者的使用習慣。
在本發明之又一些實施例中,伺服器更可儲存對應數個專業分類之數個專業字典檔。其中,專業字典檔可儲存於單一當地伺服器。此外,專業字典檔亦可儲存於至少一雲端伺服器,用以提供給當地伺服器查詢。語音辨識方法400更可包含取得至少一需修正類別。其中,可在特定專業類別的辨識錯誤率較高時,將其設為需修正類別。於是,可根據專業字典檔中需修正類別對應者,修改使用者資訊對應之個人字典檔。如此一來,可依據個人字典檔中
不同字詞所屬之專業類別進行修正,以提高整體辨識正確率。
雖然本發明已以實施方式揭露如上,然其並非用以限定本發明任何熟習此技藝者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100‧‧‧伺服器
110‧‧‧更新模組
120‧‧‧相關字典提供模組
200‧‧‧資料傳輸界面
300‧‧‧語音辨識裝置
310‧‧‧麥克風
320‧‧‧輸出元件
330‧‧‧處理元件
331‧‧‧使用者資訊接收模組
332‧‧‧個人字典取得模組
333‧‧‧語音接收模組
334‧‧‧音訊轉換模組
335‧‧‧搜尋模組
336‧‧‧聲音辨識模組
337‧‧‧辨識錯誤判斷模組
Claims (13)
- 一種語音辨識系統,包含:一伺服器;一資料傳輸界面;以及一語音辨識裝置,透過該資料傳輸界面與該伺服器建立連結,其中該語音辨識裝置包含:一麥克風;一輸出元件;以及一處理元件,電性連接該麥克風以及該輸出元件,其中該處理元件包含:一使用者資訊接收模組,接收一使用者之一使用者資訊;一個人字典取得模組,透過該資料傳輸界面,傳送該使用者資訊至該伺服器,以取得該使用者資訊對應之一個人字典檔;一語音接收模組,透過該麥克風接收該使用者之一待辨識語音訊號;一音訊轉換模組,根據該使用者對應之一聲紋檔案,將該待辨識語音訊號轉換為一數位特徵檔;一搜尋模組,根據該數位特徵檔搜尋該個人字典檔,以取得一語音辨識結果,並透過該輸出元件,輸出該語音辨識結果;以及一辨識錯誤判斷模組,當該麥克風接收與該待辨識語音訊號相同之一重複語音訊號時,判定該語音辨識結果辨識錯誤。
- 如請求項1所述之語音辨識系統,其中該處理元件更包含:一聲音辨識模組,透過該麥克風接收一使用者聲音訊號,根據該使用者聲音訊號,判斷該使用者為何,並對應產生該使用者之該使用者資訊。
- 如請求項1所述之語音辨識系統,其中該伺服器包含:一更新模組,透過該資料傳輸界面,自該語音辨識裝置接收該語音辨識結果是否正確之資訊,作為更新該個人字典之依據。
- 如請求項1所述之語音辨識系統,其中該伺服器包含:一相關字典提供模組,透過該資料傳輸界面,接收該語音辨識結果,並根據該語音辨識結果,傳送一相關字典檔至該語音辨識裝置,供該搜尋模組搜尋。
- 一種語音辨識方法,包含:(a)由一語音辨識裝置,接收一使用者之一使用者資訊;(b)由該語音辨識裝置傳送該使用者資訊至一伺服器,以取得該使用者資訊對應之一個人字典檔;(c)透過該語音辨識裝置之一麥克風接收該使用者之一待辨識語音訊號;(d)由該語音辨識裝置根據該使用者對應之一聲紋檔 案,將該待辨識語音訊號轉換為一數位特徵檔;(e)由該語音辨識裝置根據該數位特徵檔搜尋該個人字典檔,以取得一語音辨識結果,並輸出該語音辨識結果;以及在該語音辨識裝置之該麥克風接收與該待辨識語音訊號相同之一重複語音訊號時,判定該語音辨識結果辨識錯誤。
- 如請求項5所述之語音辨識方法,更包含:透過該語音辨識裝置之該麥克風接收一使用者聲音訊號;以及根據該使用者聲音訊號,判斷該使用者為何,並對應產生該使用者之該使用者資訊。
- 如請求項5所述之語音辨識方法,更包含:由該伺服器自該語音辨識裝置,接收該語音辨識結果是否正確之資訊,作為該伺服器更新該個人字典之依據。
- 如請求項5所述之語音辨識方法,其中更包含:由該伺服器接收該語音辨識結果;以及由該伺服器根據該語音辨識結果,傳送一相關字典檔至該語音辨識裝置。
- 如請求項5所述之語音辨識方法,其中該語音辨識裝置儲存一預設字典檔,該語音辨識方法更包含:在該語音辨識裝置無法辨識該使用者之該使用者資訊 時,將該預設字典檔視為該個人字典檔。
- 如請求項5所述之語音辨識方法,更包含:根據該使用者之一對話內容以及該使用者之一歷史使用資料,產生一當前使用字典檔,以儲存於該伺服器,其中該伺服器將該當前使用字典檔設為該使用者資訊對應之該個人字典檔。
- 如請求項10所述之語音辨識方法,其中該伺服器更儲存一近期常用字典檔,該近期常用字典檔根據該伺服器所提供之語音辨識服務而產生,該語音辨識方法更包含:當將該當前使用字典檔設為該使用者資訊對應之該個人字典檔之一辨識正確率小於一門檻值時,使用該近期常用字典檔進行語音辨識。
- 如請求項10所述之語音辨識方法,其中該伺服器更儲存該使用者之一私人字典檔,該私人字典檔儲存該使用者之至少一常用字詞,該語音辨識方法更包含:根據該使用者之該私人字典檔,修改該當前使用字典檔。
- 如請求項5所述之語音辨識方法,其中該伺服器更儲存對應複數個專業分類之複數個專業字典檔,該語音辨識方法更包含:取得至少一需修正類別;以及根據該些專業字典檔中該需修正類別對應者,修改該使 用者資訊對應之該個人字典檔。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW102125241A TWI508057B (zh) | 2013-07-15 | 2013-07-15 | 語音辨識系統以及方法 |
US14/070,594 US20150019221A1 (en) | 2013-07-15 | 2013-11-04 | Speech recognition system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW102125241A TWI508057B (zh) | 2013-07-15 | 2013-07-15 | 語音辨識系統以及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201503105A TW201503105A (zh) | 2015-01-16 |
TWI508057B true TWI508057B (zh) | 2015-11-11 |
Family
ID=52277805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102125241A TWI508057B (zh) | 2013-07-15 | 2013-07-15 | 語音辨識系統以及方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20150019221A1 (zh) |
TW (1) | TWI508057B (zh) |
Families Citing this family (149)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
CN104969289B (zh) | 2013-02-07 | 2021-05-28 | 苹果公司 | 数字助理的语音触发器 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3937002A1 (en) | 2013-06-09 | 2022-01-12 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
WO2015020942A1 (en) | 2013-08-06 | 2015-02-12 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9767803B1 (en) * | 2013-12-16 | 2017-09-19 | Aftershock Services, Inc. | Dynamically selecting speech functionality on client devices |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) * | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
CN107104994B (zh) | 2016-02-22 | 2021-07-20 | 华硕电脑股份有限公司 | 语音识别方法、电子装置及语音识别*** |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
CN106601254B (zh) * | 2016-12-08 | 2020-11-06 | 阿里巴巴(中国)有限公司 | 信息输入方法和装置及计算设备 |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
KR101883301B1 (ko) * | 2017-01-11 | 2018-07-30 | (주)파워보이스 | 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 |
KR102068182B1 (ko) * | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
JP6883471B2 (ja) * | 2017-05-11 | 2021-06-09 | オリンパス株式会社 | 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置 |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
CN108021554A (zh) * | 2017-11-14 | 2018-05-11 | 无锡小天鹅股份有限公司 | 语音识别方法、装置以及洗衣机 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10944859B2 (en) | 2018-06-03 | 2021-03-09 | Apple Inc. | Accelerated task performance |
US11714955B2 (en) | 2018-08-22 | 2023-08-01 | Microstrategy Incorporated | Dynamic document annotations |
US11500655B2 (en) * | 2018-08-22 | 2022-11-15 | Microstrategy Incorporated | Inline and contextual delivery of database content |
US11238210B2 (en) | 2018-08-22 | 2022-02-01 | Microstrategy Incorporated | Generating and presenting customized information cards |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
CN109582780B (zh) * | 2018-12-20 | 2021-10-01 | 广东小天才科技有限公司 | 一种基于用户情绪的智能问答方法及装置 |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11682390B2 (en) | 2019-02-06 | 2023-06-20 | Microstrategy Incorporated | Interactive interface for analytics |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11227599B2 (en) | 2019-06-01 | 2022-01-18 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
CN110265013A (zh) * | 2019-06-20 | 2019-09-20 | 平安科技(深圳)有限公司 | 语音的识别方法及装置、计算机设备、存储介质 |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11769509B2 (en) | 2019-12-31 | 2023-09-26 | Microstrategy Incorporated | Speech-based contextual delivery of content |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
TWI809335B (zh) * | 2020-12-11 | 2023-07-21 | 中華電信股份有限公司 | 個人化語音辨識方法及語音辨識系統 |
DE102021119682A1 (de) | 2021-07-29 | 2023-02-02 | Audi Aktiengesellschaft | System und Verfahren zur Sprachkommunikation mit einem Kraftfahrzeug |
US11790107B1 (en) | 2022-11-03 | 2023-10-17 | Vignet Incorporated | Data sharing platform for researchers conducting clinical trials |
US12007870B1 (en) | 2022-11-03 | 2024-06-11 | Vignet Incorporated | Monitoring and adjusting data collection from remote participants for health research |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101567189A (zh) * | 2008-04-22 | 2009-10-28 | 株式会社Ntt都科摩 | 声音识别结果修正装置、方法以及*** |
TW201021023A (en) * | 2008-11-18 | 2010-06-01 | Cyberon Corp | Server and method for speech searching via a server |
TW201142822A (en) * | 2010-05-28 | 2011-12-01 | Ind Tech Res Inst | Speech recognition system and method with adjustable memory usage |
TW201142823A (en) * | 2010-05-24 | 2011-12-01 | Microsoft Corp | Voice print identification |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2607457B2 (ja) * | 1984-09-17 | 1997-05-07 | 株式会社東芝 | パターン認識装置 |
US5991720A (en) * | 1996-05-06 | 1999-11-23 | Matsushita Electric Industrial Co., Ltd. | Speech recognition system employing multiple grammar networks |
JP3556425B2 (ja) * | 1997-03-18 | 2004-08-18 | 株式会社東芝 | 共有辞書更新方法および辞書サーバ |
US6173266B1 (en) * | 1997-05-06 | 2001-01-09 | Speechworks International, Inc. | System and method for developing interactive speech applications |
JP3476007B2 (ja) * | 1999-09-10 | 2003-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体 |
JP2001331799A (ja) * | 2000-03-16 | 2001-11-30 | Toshiba Corp | 画像処理装置および画像処理方法 |
US6973427B2 (en) * | 2000-12-26 | 2005-12-06 | Microsoft Corporation | Method for adding phonetic descriptions to a speech recognition lexicon |
EP1233406A1 (en) * | 2001-02-14 | 2002-08-21 | Sony International (Europe) GmbH | Speech recognition adapted for non-native speakers |
JP4177598B2 (ja) * | 2001-05-25 | 2008-11-05 | 株式会社東芝 | 顔画像記録装置、情報管理システム、顔画像記録方法、及び情報管理方法 |
TWI299471B (en) * | 2001-08-24 | 2008-08-01 | Toshiba Kk | Person recognition apparatus |
US7124080B2 (en) * | 2001-11-13 | 2006-10-17 | Microsoft Corporation | Method and apparatus for adapting a class entity dictionary used with language models |
US7548863B2 (en) * | 2002-08-06 | 2009-06-16 | Apple Inc. | Adaptive context sensitive analysis |
US20040044517A1 (en) * | 2002-08-30 | 2004-03-04 | Robert Palmquist | Translation system |
US8577681B2 (en) * | 2003-09-11 | 2013-11-05 | Nuance Communications, Inc. | Pronunciation discovery for spoken words |
JP3944159B2 (ja) * | 2003-12-25 | 2007-07-11 | 株式会社東芝 | 質問応答システムおよびプログラム |
US7660715B1 (en) * | 2004-01-12 | 2010-02-09 | Avaya Inc. | Transparent monitoring and intervention to improve automatic adaptation of speech models |
US8972444B2 (en) * | 2004-06-25 | 2015-03-03 | Google Inc. | Nonstandard locality-based text entry |
US20060020492A1 (en) * | 2004-07-26 | 2006-01-26 | Cousineau Leo E | Ontology based medical system for automatically generating healthcare billing codes from a patient encounter |
US8463611B2 (en) * | 2004-10-13 | 2013-06-11 | Hewlett-Packard Development Company, L.P. | Method and system for improving the fidelity of a dialog system |
JP4267584B2 (ja) * | 2005-02-28 | 2009-05-27 | 株式会社東芝 | 機器制御装置及びその方法 |
US20090066722A1 (en) * | 2005-08-29 | 2009-03-12 | Kriger Joshua F | System, Device, and Method for Conveying Information Using Enhanced Rapid Serial Presentation |
CN101300573A (zh) * | 2005-08-29 | 2008-11-05 | 乔舒亚·F·克雷格 | 使用快速序列呈现技术传送信息的***、设备和方法 |
US20070106685A1 (en) * | 2005-11-09 | 2007-05-10 | Podzinger Corp. | Method and apparatus for updating speech recognition databases and reindexing audio and video content using the same |
US20070124147A1 (en) * | 2005-11-30 | 2007-05-31 | International Business Machines Corporation | Methods and apparatus for use in speech recognition systems for identifying unknown words and for adding previously unknown words to vocabularies and grammars of speech recognition systems |
US8060368B2 (en) * | 2005-12-07 | 2011-11-15 | Mitsubishi Electric Corporation | Speech recognition apparatus |
CN101432801B (zh) * | 2006-02-23 | 2012-04-18 | 日本电气株式会社 | 语音识别词典制作支持***、语音识别词典制作支持方法 |
US7983910B2 (en) * | 2006-03-03 | 2011-07-19 | International Business Machines Corporation | Communicating across voice and text channels with emotion preservation |
US20070276651A1 (en) * | 2006-05-23 | 2007-11-29 | Motorola, Inc. | Grammar adaptation through cooperative client and server based speech recognition |
WO2008007688A1 (fr) * | 2006-07-13 | 2008-01-17 | Nec Corporation | Terminal téléphonique ayant une fonction de reconnaissance vocale, dispositif de support de mise à jour de dictionnaire de reconnaissance vocale, et procédé de support associé |
JP4790024B2 (ja) * | 2006-12-15 | 2011-10-12 | 三菱電機株式会社 | 音声認識装置 |
JP4867654B2 (ja) * | 2006-12-28 | 2012-02-01 | 日産自動車株式会社 | 音声認識装置、および音声認識方法 |
US8135590B2 (en) * | 2007-01-11 | 2012-03-13 | Microsoft Corporation | Position-dependent phonetic models for reliable pronunciation identification |
JP2008197229A (ja) * | 2007-02-09 | 2008-08-28 | Konica Minolta Business Technologies Inc | 音声認識辞書構築装置及びプログラム |
US8949266B2 (en) * | 2007-03-07 | 2015-02-03 | Vlingo Corporation | Multiple web-based content category searching in mobile search application |
US8620658B2 (en) * | 2007-04-16 | 2013-12-31 | Sony Corporation | Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition |
US20090037171A1 (en) * | 2007-08-03 | 2009-02-05 | Mcfarland Tim J | Real-time voice transcription system |
US7983902B2 (en) * | 2007-08-23 | 2011-07-19 | Google Inc. | Domain dictionary creation by detection of new topic words using divergence value comparison |
US7827165B2 (en) * | 2007-09-17 | 2010-11-02 | International Business Machines Corporation | Providing a social network aware input dictionary |
JP2009229529A (ja) * | 2008-03-19 | 2009-10-08 | Toshiba Corp | 音声認識装置及び音声認識方法 |
JP4609527B2 (ja) * | 2008-06-03 | 2011-01-12 | 株式会社デンソー | 自動車用情報提供システム |
US8180641B2 (en) * | 2008-09-29 | 2012-05-15 | Microsoft Corporation | Sequential speech recognition with two unequal ASR systems |
US9183834B2 (en) * | 2009-07-22 | 2015-11-10 | Cisco Technology, Inc. | Speech recognition tuning tool |
US9640175B2 (en) * | 2011-10-07 | 2017-05-02 | Microsoft Technology Licensing, Llc | Pronunciation learning from user correction |
US8909516B2 (en) * | 2011-10-27 | 2014-12-09 | Microsoft Corporation | Functionality for normalizing linguistic items |
US20130110511A1 (en) * | 2011-10-31 | 2013-05-02 | Telcordia Technologies, Inc. | System, Method and Program for Customized Voice Communication |
US8825481B2 (en) * | 2012-01-20 | 2014-09-02 | Microsoft Corporation | Subword-based multi-level pronunciation adaptation for recognizing accented speech |
US9734151B2 (en) * | 2012-10-31 | 2017-08-15 | Tivo Solutions Inc. | Method and system for voice based media search |
-
2013
- 2013-07-15 TW TW102125241A patent/TWI508057B/zh not_active IP Right Cessation
- 2013-11-04 US US14/070,594 patent/US20150019221A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101567189A (zh) * | 2008-04-22 | 2009-10-28 | 株式会社Ntt都科摩 | 声音识别结果修正装置、方法以及*** |
TW201021023A (en) * | 2008-11-18 | 2010-06-01 | Cyberon Corp | Server and method for speech searching via a server |
TW201142823A (en) * | 2010-05-24 | 2011-12-01 | Microsoft Corp | Voice print identification |
TW201142822A (en) * | 2010-05-28 | 2011-12-01 | Ind Tech Res Inst | Speech recognition system and method with adjustable memory usage |
Also Published As
Publication number | Publication date |
---|---|
US20150019221A1 (en) | 2015-01-15 |
TW201503105A (zh) | 2015-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI508057B (zh) | 語音辨識系統以及方法 | |
US10614803B2 (en) | Wake-on-voice method, terminal and storage medium | |
JP6820058B2 (ja) | 音声認識方法、装置、デバイス、及び記憶媒体 | |
US8972260B2 (en) | Speech recognition using multiple language models | |
CN111739514B (zh) | 一种语音识别方法、装置、设备及介质 | |
US11494434B2 (en) | Systems and methods for managing voice queries using pronunciation information | |
US10170122B2 (en) | Speech recognition method, electronic device and speech recognition system | |
US12033639B2 (en) | Caching scheme for voice recognition engines | |
CN106713111B (zh) | 一种添加好友的处理方法、终端及服务器 | |
US11151996B2 (en) | Vocal recognition using generally available speech-to-text systems and user-defined vocal training | |
WO2021051564A1 (zh) | 语音识别方法、装置、计算设备和存储介质 | |
JP2018045001A (ja) | 音声認識システム、情報処理装置、プログラム、音声認識方法 | |
US20210034662A1 (en) | Systems and methods for managing voice queries using pronunciation information | |
CN111126084B (zh) | 数据处理方法、装置、电子设备和存储介质 | |
US11170765B2 (en) | Contextual multi-channel speech to text | |
CN110809796B (zh) | 具有解耦唤醒短语的语音识别***和方法 | |
US20230317078A1 (en) | Systems and methods for local interpretation of voice queries | |
US11410656B2 (en) | Systems and methods for managing voice queries using pronunciation information | |
CN103474063B (zh) | 语音辨识***以及方法 | |
WO2022143349A1 (zh) | 一种确定用户意图的方法及装置 | |
KR102217621B1 (ko) | 사용자 발화의 오류를 교정하는 방법 및 장치 | |
CN113948064A (zh) | 语音合成和语音识别 | |
JP6244731B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20240104092A1 (en) | Voice-based performance query with non-semantic databases | |
KR20210019930A (ko) | 디바이스의 음성 인식을 지원하는 서버 및 그의 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |