TWI590228B - 語音控制系統、電子裝置及語音控制方法 - Google Patents
語音控制系統、電子裝置及語音控制方法 Download PDFInfo
- Publication number
- TWI590228B TWI590228B TW102116040A TW102116040A TWI590228B TW I590228 B TWI590228 B TW I590228B TW 102116040 A TW102116040 A TW 102116040A TW 102116040 A TW102116040 A TW 102116040A TW I590228 B TWI590228 B TW I590228B
- Authority
- TW
- Taiwan
- Prior art keywords
- voice
- user
- sound
- feedback
- emotional state
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 18
- 230000002996 emotional effect Effects 0.000 claims description 23
- 210000001260 vocal cord Anatomy 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本發明涉及語音控制領域,尤其涉及一種語音控制系統、具有該語音控制系統的電子裝置以及語音控制方法。
電視、電腦、手機等終端設備的業務操作,對一些家庭用戶特別是老人或者孩子來說,手動操作方法複雜。通過語音控制終端設備的業務操作可以簡化操作方法,例如,用戶可以在手機上通過語音來發送資訊、查找電話和設定提醒事項等。此外,現有的具有語音控制功能的終端設備還可以根據用戶的語音提供相應的語音回饋,從而與用戶進行互動。然而,現有的終端設備不能根據用戶的不同語音相應改變回饋的方式,故,此類語音回饋方式過於單一,缺乏趣味性。
有鑒於此,有必要提供一種語音控制系統、電子裝置及其語音控制方法,能夠解決以上問題。
本發明提供一種語音控制系統,運行於一電子裝置中,該電子裝置包括一語音輸入單元以及一播放單元,該語音控制系統包括:一獲取模組,用於獲取來自該語音輸入單元的語音信號;
一語義分析模組,用於對該獲取模組獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;一特徵分析模組,用於對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;以及一執行模組,用於控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
本發明還提供一種電子裝置,包括一語音輸入單元、一播放單元以及一處理器,該處理器包括:一獲取模組,用於獲取來自該語音輸入單元的語音信號;一語義分析模組,用於對該獲取模組獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;一特徵分析模組,用於對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;以及一執行模組,用於控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
本發明還提供一種語音控制方法,應用於一電子裝置中,該電子裝置包括一語音輸入單元以及一播放單元,該方法包括:獲取來自該語音輸入單元的語音信號;
對該獲取模組獲取的語音信號進行辨識以及語義分析;根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析;根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;以及控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
相較於現有技術,本發明根據用戶輸入的語音信號對應的物理特徵確定與之匹配的回饋聲音的物理特徵,然後以該回饋聲音的物理特徵播放回復結果,從而根據用戶不同語音相應地提供不同的回饋聲音,有利於提高語音回饋的趣味性。
1‧‧‧電子裝置
10‧‧‧語音輸入單元
20‧‧‧存儲單元
30‧‧‧處理器
40‧‧‧播放單元
100‧‧‧語音控制系統
101‧‧‧獲取模組
102‧‧‧語義分析模組
103‧‧‧特徵分析模組
104‧‧‧執行模組
圖1為本發明一較佳實施方式中的語音控制系統的硬體架構圖。
圖2為本發明一較佳實施方式中的語音控制方法的流程圖。
圖1為本發明一較佳實施例中的語音控制系統100的硬體架構圖,該語音控制系統100運行於一電子裝置1中,該電子裝置1可以是任一具有錄音功能以及語音播放功能的電子產品,如移動電話或平板電腦等。該電子裝置1包括用於錄音的一語音輸入單元10(如麥克風)、一存儲單元20、一處理器30(如中央處理器(Central Processing Unit,CPU)或微處理器(
Microcontroller))、以及一播放單元40。在本實施方式中,該語音控制系統100存儲於該存儲單元20並由該處理器30運行。該處理器30用於執行該語音控制系統100的各個功能模組,從而根據用戶通過該語音輸入單元10輸入的語音信號對應的物理特徵確定與之匹配的回饋聲音的物理特徵,並通過該播放單元40以該回饋聲音的物理特徵播放回復結果。在其他實施方式中,該語音控制系統100的各個模組為固化於處理器30中的硬體單元。
在本實施方式中,該語音控制系統100包括一獲取模組101、一語義分析模組102、一特徵分析模組103以及一執行模組104。
該獲取模組101用於獲取用戶通過該語音輸入單元10向該電子裝置1輸入的語音信號。
該語義分析模組102用於對該獲取模組101獲取的語音信號進行辨識以及語義分析,然後在該存儲單元20中存儲的一對話資料庫中進行查找,以確定與所述分析出來的語義最匹配的回復結果。上述語義分析過程以及根據語義查找回復結果的過程可參考現有的語音回饋技術,例如,可結合上海贏思軟體技術有限公司於2004年8月13日提出的“一種聊天機器人系統”(專利申請號200410053749.9)。
該特徵分析模組103用於對該獲取模組101獲取到的語音信號進行用戶聲音的物理特徵分析,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵。在本實施方式中,所述用戶聲音的物理特徵包括其音高、音強和音長資訊。該特徵分析模組103根據用戶聲音的音高、音強和音長資訊分別確定用戶的性別年齡、情感狀態以及性格特徵,並根據一預設的對應
關係確定與用戶的性別年齡、情感狀態以及性格特徵相匹配的回饋聲音所對應的性別年齡、情感狀態以及性格特徵,從而根據回饋聲音的性別年齡、情感狀態以及性格特徵分別確定該回饋聲音的包括音高、音強和音長資訊的物理特徵。
眾所周知,音高由用戶發聲時聲帶的振動頻率決定,頻率與音高成正比,如婦女和兒童的聲帶比較短且薄,聲音頻率高;男人和老人的聲帶比較長且厚,聲音頻率低,故,男人和老人的聲音較婦女和小孩的聲音來說要低沉;音強對應用戶聲音的強弱,由聲音的振幅決定;音長表現為說話時速度的快慢,決定於用戶發聲時聲帶振動的時間,從而,該特徵分析模組103可根據用戶聲音的振動頻率、振幅以及說話速度分別獲得用戶的性別年齡、情感狀態以及性格特徵。
具體的,在本實施方式中,該預設的對應關係為:回饋聲音的性別年齡為與用戶處於相同年齡段且不同性別、情感狀態為與用戶相同情感狀態、性格特徵為與用戶相同性格。當然,所述對應關係並不局限於以上所示出的,還可以根據實際情況進行變更。
在另一實施方式中,所述用戶聲音的物理特徵還進一步包括其音色,取決於聲波振動的形式,由用戶聲音中分量突出的諧波成分,即共振峰的高度、位置以及數量決定。在這種情況下,該特徵分析模組103在確定了用戶聲音的音色資訊後,該特徵分析模組103還用於確定回饋聲音的音色為與該用戶聲音的音色相同的音色。
該執行模組104用於控制該播放單元40根據所述回饋聲音的物理特徵播放所述回復結果。在本實施方式中,該存儲單元20還用於
預先存儲一標準回饋聲音,該標準回饋聲音具有一標準物理特徵(標準音高、標準音強、標準音長以及標準音色)的回饋聲音。該執行模組104根據特徵分析模組103確定的回饋聲音的物理特徵對該標準回饋聲音作變聲處理,而產生具有所述確定的物理特徵的回饋聲音,然後控制該播放單元40以該經過變聲處理後的標準回饋聲音,即該具有所述確定的物理特徵的回饋聲音播放所述回復結果。例如,對於音強對應用戶聲音的強弱,由聲音的振幅決定;由用戶聲音中分量突出的諧波成分,即共振峰的高度、位置以及數量決定。
圖2為本發明的語音控制方法的流程圖,該方法應用於上述電子裝置1中,包括如下步驟:
步驟S21:該獲取模組101獲取用戶通過該語音輸入單元10向該電子裝置1輸入的語音信號。
步驟S22:該語義分析模組102對該獲取模組101獲取的語音信號進行辨識以及語義分析,然後在該存儲單元20中存儲的一對話資料庫中進行查找,以獲取與所述分析出來的語義最匹配的回復結果。
步驟S23:該特徵分析模組103對該獲取模組101獲取到的語音信號進行用戶聲音的物理特徵的分析。
步驟S24:該特徵分析模組103根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵。
步驟S25:該執行模組104控制該播放單元40根據所述回饋聲音的物理特徵播放所述回復結果。
本技術領域的普通技術人員應當認識到,以上的實施方式僅是用來說明本發明,而並非用作為對本發明的限定,只要在本發明的實質精神範圍之內,對以上實施例所作的適當改變和變化都落在本發明要求保護的範圍之內。
1‧‧‧電子裝置
10‧‧‧語音輸入單元
20‧‧‧存儲單元
30‧‧‧處理器
40‧‧‧播放單元
100‧‧‧語音控制系統
101‧‧‧獲取模組
102‧‧‧語義分析模組
103‧‧‧特徵分析模組
104‧‧‧執行模組
Claims (8)
- 一種語音控制系統,運行於一電子裝置中,該電子裝置包括一語音輸入單元以及一播放單元,其改良在於,該語音控制系統包括:一獲取模組,用於獲取來自該語音輸入單元的語音信號;一語義分析模組,用於對該獲取模組獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;一特徵分析模組,用於對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析,得到用戶聲音的音高、音強和音長資訊,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵,其中,根據用戶聲音的音高、音強和音長資訊分別確定用戶的性別年齡、情感狀態以及性格特徵,並根據一預設的對應關係確定與用戶的性別年齡、情感狀態以及性格特徵相匹配的回饋聲音所對應的性別年齡、情感狀態以及性格特徵,從而根據回饋聲音的性別年齡、情感狀態以及性格特徵分別確定該回饋聲音的包括音高、音強和音長資訊的物理特徵;以及一執行模組,用於控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
- 如申請專利範圍第1項所述的語音控制系統,其中,該預設的對應關係為:回饋聲音的性別年齡為與用戶處於相同年齡段且不同性別、情感狀態為與用戶相同情感狀態、性格特徵為與用戶相同性格。
- 如申請專利範圍第1項所述的語音控制系統,其中,所述特徵分析模組分析得到用戶聲音的物理特徵還進一步包括其音色,該特徵分析模組還用 於在確定用戶聲音的音色資訊後,確定該回饋聲音具有相同音色。
- 如申請專利範圍第1項所述的語音控制系統,其中,所述執行模組還用於根據回饋聲音的物理特徵對一預存的標準回饋聲音作變聲處理而得到具有所述確定的對應物理特徵的回饋聲音,然後控制該播放單元以確定的對應物理特徵的回饋聲音播放所述回復結果。
- 一種電子裝置,包括一語音輸入單元、一播放單元以及一處理器,其改良在於,該處理器包括:一獲取模組,用於獲取來自該語音輸入單元的語音信號;一語義分析模組,用於對該獲取模組獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;一特徵分析模組,用於對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析,得到用戶聲音的音高、音強和音長資訊,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵,其中,根據用戶聲音的音高、音強和音長資訊分別確定用戶的性別年齡、情感狀態以及性格特徵,並根據一預設的對應關係確定與用戶的性別年齡、情感狀態以及性格特徵相匹配的回饋聲音所對應的性別年齡、情感狀態以及性格特徵,從而根據回饋聲音的性別年齡、情感狀態以及性格特徵分別確定該回饋聲音的包括音高、音強和音長資訊的物理特徵;以及一執行模組,用於控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
- 如申請專利範圍第5項所述的電子裝置,其中,該預設的對應關係為:回饋聲音的性別年齡為與用戶處於相同年齡段且不同性別、情感狀態為與用戶相同情感狀態、性格特徵為與用戶相同性格。
- 如申請專利範圍第5項所述的電子裝置,其中,所述執行模組還用於根據回饋聲音的物理特徵對一預存的標準回饋聲音作變聲處理而得到具有所述確定的對應物理特徵的回饋聲音,然後控制該播放單元以確定的對應物理特徵的回饋聲音播放所述回復結果。
- 一種語音控制方法,應用於一電子裝置中,該電子裝置包括一語音輸入單元以及一播放單元,其改良在於,該方法包括:獲取來自該語音輸入單元的語音信號;對獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;對獲取的語音信號進行用戶聲音的物理特徵的分析,得到用戶聲音的音高、音強和音長資訊;根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵,其中,根據用戶聲音的音高、音強和音長資訊分別確定用戶的性別年齡、情感狀態以及性格特徵,並根據一預設的對應關係確定與用戶的性別年齡、情感狀態以及性格特徵相匹配的回饋聲音所對應的性別年齡、情感狀態以及性格特徵,從而根據回饋聲音的性別年齡、情感狀態以及性格特徵分別確定該回饋聲音的包括音高、音強和音長資訊的物理特徵;以及控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310157926.7A CN104123938A (zh) | 2013-04-29 | 2013-04-29 | 语音控制***、电子装置及语音控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201503107A TW201503107A (zh) | 2015-01-16 |
TWI590228B true TWI590228B (zh) | 2017-07-01 |
Family
ID=51769327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102116040A TWI590228B (zh) | 2013-04-29 | 2013-05-06 | 語音控制系統、電子裝置及語音控制方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9437194B2 (zh) |
CN (1) | CN104123938A (zh) |
TW (1) | TWI590228B (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328144A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种基于电话网络的远程语音控制*** |
CN105632490A (zh) * | 2015-12-18 | 2016-06-01 | 合肥寰景信息技术有限公司 | 一种网络社区的语音交流的语境模拟方法 |
TWI622896B (zh) | 2015-12-23 | 2018-05-01 | 絡達科技股份有限公司 | 可回應外部音訊產生動作回饋之電子裝置 |
CN107039050B (zh) * | 2016-02-04 | 2020-12-04 | 阿里巴巴集团控股有限公司 | 对待测试语音识别***的自动测试方法和装置 |
CN105719648B (zh) * | 2016-04-22 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 个性化无人车交互方法及无人车 |
CN106228978A (zh) * | 2016-08-04 | 2016-12-14 | 成都佳荣科技有限公司 | 一种语音识别方法 |
CN106504743B (zh) * | 2016-11-14 | 2020-01-14 | 北京光年无限科技有限公司 | 一种用于智能机器人的语音交互输出方法及机器人 |
CN106648082A (zh) * | 2016-12-09 | 2017-05-10 | 厦门快商通科技股份有限公司 | 一种模拟真人互动的智能服务设备及方法 |
CN106503275A (zh) * | 2016-12-30 | 2017-03-15 | 首都师范大学 | 聊天机器人的音色配置方法及装置 |
CN107169113A (zh) * | 2017-05-19 | 2017-09-15 | 网易(杭州)网络有限公司 | 用于基于用户性格实现人工智能对话的方法及设备 |
CN109002274A (zh) * | 2017-06-07 | 2018-12-14 | 塞舌尔商元鼎音讯股份有限公司 | 可调整输出声音的电子装置及调整输出声音的方法 |
CN107545029A (zh) * | 2017-07-17 | 2018-01-05 | 百度在线网络技术(北京)有限公司 | 智能设备的语音反馈方法、设备及可读介质 |
CN107492381A (zh) * | 2017-08-29 | 2017-12-19 | 郑杰 | 一种聊天机器人的音色配置装置及其方法 |
CN107507620A (zh) * | 2017-09-25 | 2017-12-22 | 广东小天才科技有限公司 | 一种语音播报声音设置方法、装置、移动终端及存储介质 |
CN107767869B (zh) * | 2017-09-26 | 2021-03-12 | 百度在线网络技术(北京)有限公司 | 用于提供语音服务的方法和装置 |
CN107944542A (zh) * | 2017-11-21 | 2018-04-20 | 北京光年无限科技有限公司 | 一种基于虚拟人的多模态交互输出方法及*** |
CN108269570B (zh) * | 2018-01-17 | 2020-09-11 | 深圳聚点互动科技有限公司 | 语音控制背景音乐主机的方法、装置、设备及存储介质 |
CN108469966A (zh) * | 2018-03-21 | 2018-08-31 | 北京金山安全软件有限公司 | 语音播报控制方法、装置、智能设备及介质 |
CN109086448B (zh) * | 2018-08-20 | 2021-04-30 | 广东小天才科技有限公司 | 一种基于性别特征信息的语音搜题方法及家教设备 |
CN111292737A (zh) * | 2018-12-07 | 2020-06-16 | 阿里巴巴集团控股有限公司 | 语音交互及语音唤醒检测方法、装置、设备及存储介质 |
CN111416903A (zh) * | 2019-01-08 | 2020-07-14 | 塞舌尔商元鼎音讯股份有限公司 | 声音播放***及其调整输出声音的方法 |
CN110197659A (zh) * | 2019-04-29 | 2019-09-03 | 华为技术有限公司 | 基于用户画像的反馈方法、装置及*** |
CN110265021A (zh) * | 2019-07-22 | 2019-09-20 | 深圳前海微众银行股份有限公司 | 个性化语音交互方法、机器人终端、装置及可读存储介质 |
CN111477224A (zh) * | 2020-03-23 | 2020-07-31 | 一汽奔腾轿车有限公司 | 一种人车虚拟交互*** |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3838039B2 (ja) * | 2001-03-09 | 2006-10-25 | ヤマハ株式会社 | 音声合成装置 |
US7315821B2 (en) * | 2002-01-31 | 2008-01-01 | Sanyo Electric Co., Ltd. | System and method for health care information processing based on acoustic features |
KR20040058855A (ko) * | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
US7275032B2 (en) * | 2003-04-25 | 2007-09-25 | Bvoice Corporation | Telephone call handling center where operators utilize synthesized voices generated or modified to exhibit or omit prescribed speech characteristics |
US7725316B2 (en) * | 2006-07-05 | 2010-05-25 | General Motors Llc | Applying speech recognition adaptation in an automated speech recognition system of a telematics-equipped vehicle |
DE602007004620D1 (de) * | 2007-10-01 | 2010-03-18 | Harman Becker Automotive Sys | Sprachgesteuerte Einstellung von Fahrzeugteilen |
US8195460B2 (en) * | 2008-06-17 | 2012-06-05 | Voicesense Ltd. | Speaker characterization through speech analysis |
KR101625668B1 (ko) * | 2009-04-20 | 2016-05-30 | 삼성전자 주식회사 | 전자기기 및 전자기기의 음성인식방법 |
US8335689B2 (en) * | 2009-10-14 | 2012-12-18 | Cogi, Inc. | Method and system for efficient management of speech transcribers |
CN102117614B (zh) * | 2010-01-05 | 2013-01-02 | 索尼爱立信移动通讯有限公司 | 个性化文本语音合成和个性化语音特征提取 |
CN102324241A (zh) * | 2011-05-04 | 2012-01-18 | 鸿富锦精密工业(深圳)有限公司 | 具有语音控制功能的电子装置及语音控制方法 |
EP2575064A1 (en) * | 2011-09-30 | 2013-04-03 | General Electric Company | Telecare and/or telehealth communication method and system |
WO2013187610A1 (en) * | 2012-06-15 | 2013-12-19 | Samsung Electronics Co., Ltd. | Terminal apparatus and control method thereof |
CN103024530A (zh) * | 2012-12-18 | 2013-04-03 | 天津三星电子有限公司 | 智能电视语音应答***及方法 |
-
2013
- 2013-04-29 CN CN201310157926.7A patent/CN104123938A/zh active Pending
- 2013-05-06 TW TW102116040A patent/TWI590228B/zh active
- 2013-05-21 US US13/898,481 patent/US9437194B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9437194B2 (en) | 2016-09-06 |
CN104123938A (zh) | 2014-10-29 |
US20140324425A1 (en) | 2014-10-30 |
TW201503107A (zh) | 2015-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI590228B (zh) | 語音控制系統、電子裝置及語音控制方法 | |
US12033632B2 (en) | Context-based device arbitration | |
US11138977B1 (en) | Determining device groups | |
US10068573B1 (en) | Approaches for voice-activated audio commands | |
CN107039050B (zh) | 对待测试语音识别***的自动测试方法和装置 | |
EP3553773A1 (en) | Training and testing utterance-based frameworks | |
US9837068B2 (en) | Sound sample verification for generating sound detection model | |
JP4851447B2 (ja) | ピッチ周波数を検出する音声解析装置、音声解析方法、および音声解析プログラム | |
US10770092B1 (en) | Viseme data generation | |
US11495235B2 (en) | System for creating speaker model based on vocal sounds for a speaker recognition system, computer program product, and controller, using two neural networks | |
JP6812843B2 (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
US10854182B1 (en) | Singing assisting system, singing assisting method, and non-transitory computer-readable medium comprising instructions for executing the same | |
CN104219570B (zh) | 一种音频信号的播放方法及装置 | |
WO2019119279A1 (en) | Method and apparatus for emotion recognition from speech | |
JP2006267465A (ja) | 発話状態評価装置、発話状態評価プログラム、プログラム格納媒体 | |
CN104707331B (zh) | 一种游戏体感产生方法及装置 | |
CN109994106A (zh) | 一种语音处理方法及设备 | |
JP4906776B2 (ja) | 音声制御装置 | |
CN105895079A (zh) | 语音数据的处理方法和装置 | |
CN114446268B (zh) | 一种音频数据处理方法、装置、电子设备、介质和程序产品 | |
JP2020067495A (ja) | 音声を分析する装置、方法およびプログラム | |
CN111182409B (zh) | 一种基于智能音箱的屏幕控制方法及智能音箱、存储介质 | |
JP5949634B2 (ja) | 音声合成システム、及び音声合成方法 | |
Biagetti et al. | Distributed speech and speaker identification system for personalized domotic control | |
JP2004317822A (ja) | 感情分析・表示装置 |