CN107993654A - 一种语音指令识别方法及*** - Google Patents
一种语音指令识别方法及*** Download PDFInfo
- Publication number
- CN107993654A CN107993654A CN201711191117.2A CN201711191117A CN107993654A CN 107993654 A CN107993654 A CN 107993654A CN 201711191117 A CN201711191117 A CN 201711191117A CN 107993654 A CN107993654 A CN 107993654A
- Authority
- CN
- China
- Prior art keywords
- phonetic order
- frequency
- user
- database
- setting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 239000013589 supplement Substances 0.000 claims abstract description 11
- 238000012217 deletion Methods 0.000 claims description 5
- 230000037430 deletion Effects 0.000 claims description 5
- 238000004321 preservation Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种语音指令识别方法,所述方法包括:根据语音指令出现的频次,对语音指令数据库中的语音指令进行删减或补充,删除使用频次比较低的语音指令,补充使用频次比较高的语音指令。本发明的语音指令识别方法可根据用户的语音习惯来识别语音指令。本发明还提供了一种语音指令识别***。
Description
技术领域
本发明涉及人机交互领域,尤其涉及一种语音指令识别方法及***。
背景技术
目前家电产品上的人机交互语音识别技术,都只能简单的根据程序中的数据库信息量对外界信息识别,智能程度还不够高。
当用户的语言使用习惯改变或者用户改变发出的指令并非语音数据库的标准指令时,***就不能识别用户的指令,导致操作体验不佳。
发明内容
本发明的目的是针对上述现有技术存在的缺陷,提供一种可根据用户的语音习惯来识别语音指令的语音指令识别方法和***。
本发明实施例中,提供了一种语音指令识别方法,其包括:
根据语音指令出现的频次,对语音指令数据库中的语音指令进行删减或补充,删除使用频次比较低的语音指令,补充使用频次比较高的语音指令。
本发明实施例中,所述语音指令识别方法的具体步骤包括:
步骤S1:识别用户的语音指令并保存;
步骤S2:统计用户的语音指令的出现频次;
步骤S3:将出现频次超过设定的第一阈值的语音指令添加到语音指令数据库中,将出现频次低于设定的第二阈值的语音指令从语音指令数据库中删除。
本发明实施例中,所述步骤S2中,根据语音指令在一个设定的周期内出现的次数来统计用户的语音指令的出现频次。
本发明实施例中,所述步骤S1进一步包括:
步骤S11:将用户的语音指令与语音数据库中的语音指令进行比较,若一致,则进入步骤S12,若不一致,则进入步骤S13;
步骤S12:执行所述语音指令并保存;
步骤S13:保存所述语音指令,要求用户重新发布语音指令并识别,将识别成功的语音指令等同于上一次没有识别出的语音指令。
本发明实施例中,所述步骤S11中,根据用户的语音指令与语音数据库中的语音指令的相似度是否达到设定的阈值来判断是否一致。
本发明实施例中,还提供一种语音指令识别***,其包括语音识别模块和语音指令数据库和控制模块,
所述语音指令数据库,用于存储用户的语音识别指令;
所述语音识别模块,用于根据所述语音指令数据库中存储的语音识别指令来识别用户的语音指令;
所述控制模块,用于根据语音指令出现的频次,对语音指令数据库中的语音指令进行删减或补充,删除使用频次比较低的语音指令,补充使用频次比较高的语音指令。
本发明实施例中,所述控制模块包括统计单元、添加单元和删除单元,
所述统计单元,用于统计用户的语音指令的出现频次;
所述添加单元,用于将出现频次超过设定的第一阈值的语音指令添加到语音指令数据库中;
所述删除单元,用于将出现频次低于设定的第二阈值的语音指令从语音指令数据库中删除。
本发明实施例中,所述统计单元根据语音指令在一个设定的周期内出现的次数来统计用户的语音指令的出现频次。
本发明实施例中,所述语音识别模块包括比较单元和关联单元,
所述比较单元,用于将用户的语音指令与所述语音数据库中的语音指令进行比较;
所述关联单元,用于将识别成功的语音指令与上一次没有识别出的语音指令进行等同关联。
本发明实施例中,所述比较单元根据用户的语音指令与语音数据库中的语音指令的相似度是否达到设定的阈值来判断是否一致。
与现有技术相比较,本发明的语音指令识别方法和***通过记录语音识别后的语音指令和更新数据库信息,可以根据用户的语言习惯,并结合出现的频次,自动对数据库信息量进行删减或补充,删除一些程序中自带的、使用频次比较低的信息,增加实际用户经常使用的语音信息,实现更高级别的人机交互。
附图说明
图1是本发明实施例提供的语音指令识别方法的流程图;
图2是图1中的步骤S1的流程图;
图3是本发明实施例提供的语音指令识别***的结构示意图。
具体实施方式
本发明实施例中,提供了一种语音指令识别方法,所述方法中,根据语音指令出现的频次,对语音指令数据库中的语音指令进行删减或补充,删除使用频次比较低的语音指令,补充使用频次比较高的语音指令。
具体地,如图1所示,所述语音指令识别方法的步骤包括步骤S1-S3。下面分别进行说明。
步骤S1:识别用户的语音指令并保存。
如图2所示,步骤S1中,识别用户的语音指令的具体流程包括:
步骤S11:将用户的语音指令与语音数据库中的语音指令进行比较,若一致,则进入步骤S12,若不一致,则进入步骤S13;
步骤S12:执行所述语音指令并保存;
步骤S13:保存所述语音指令,要求用户重新发布语音指令并识别,将识别成功的语音指令等同于上一次没有识别出的语音指令。
举例来说,用户发出语音指令“风再大一点”(当前风档为高风档)。语音无法识别,***不执行动作,然后用户采用标准语音“超强风档”,***可以识别,***将风速提升至超强风档,***默认为语音指令‘“风再大一点”等同于风速升高一档。
需要说明的是,所述步骤S11中,根据用户的语音指令与语音数据库中的语音指令的相似度来判断是否一致,当用户的语音指令与语音数据库中的语音指令相似度达到设定的阈值时,则判断两者一致;当用户的语音指令与语音数据库中的语音指令相似度没有达到设定的阈值时,则判断两者不一致。
步骤S2:统计语音指令的出现频次。
所述步骤S2中,根据语音指令在一个设定的周期内出现的次数来统计用户的语音指令的出现频次。所述周期可以设定为一周,也可以设定为一个月。可以每隔一个固定的时间进行统计,也可以实时向前回溯一个周期进行统计。
步骤S3:将出现频次超过设定的第一阈值的语音指令添加到语音指令数据库中,将出现频次低于设定的第二阈值的语音指令从语音指令数据库中删除。
经过在所述语音指令数据库中删除和增加语音指令,从而可以将不经常用的语音指令清除,补充常用的语音指令,实现个性化的语音指令数据库,并且可以进一步提高***在语音识别时的相应速度。
如图3所示,本发明实施例还一种语音指令识别***,其包括语音识别模块10和语音指令数据库20和控制模块30。下面分别进行说明。
所述语音指令数据库10,用于存储用户的语音识别指令。
所述语音识别模块20,用于根据所述语音指令数据库10中存储的语音识别指令来识别用户的语音指令。
进一步地,所述语音识别模块20包括比较单元21和关联单元22。所述比较单元21,用于将用户的语音指令与所述语音数据库中10的语音指令进行比较。所述比较单元21根据用户的语音指令与语音数据库中的语音指令的相似度来判断是否一致,当用户的语音指令与语音数据库中的语音指令相似度达到设定的阈值时,所述比较单元21判断两者一致;当用户的语音指令与语音数据库中的语音指令相似度没有达到设定的阈值时,所述比较单元21判断两者不一致。所述关联单元22用于将识别成功的语音指令与上一次没有识别出的语音指令进行等同关联,也就是将将识别成功的语音指令等同于上一次没有识别出的语音指令。
所述控制模块30,用于根据语音指令出现的频次,对语音指令数据库10中的语音指令进行删减或补充,删除使用频次比较低的语音指令,补充使用频次比较高的语音指令。
所述控制模块30包括统计单元31、添加单元32和删除单元33。所述统计单元31,用于统计用户的语音指令的出现频次。所述统计单元根据语音指令在一个设定的周期内出现的次数来统计用户的语音指令的出现频次。所述添加单元32,用于将出现频次超过设定的第一阈值的语音指令添加到语音指令数据库中。删除单元33,用于将出现频次低于设定的第二阈值的语音指令从语音指令数据库中删除。
综上所述,本发明的语音指令识别方法和***通过记录语音识别后的语音指令和更新数据库信息,可以根据用户的语言习惯,并结合出现的频次,自动对数据库信息量进行删减或补充,删除一些程序中自带的、使用频次比较低的信息,增加实际用户经常使用的语音信息,实现更高级别的人机交互。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种语音指令识别方法,其特征在于,包括:
根据语音指令出现的频次,对语音指令数据库中的语音指令进行删减或补充,删除使用频次比较低的语音指令,补充使用频次比较高的语音指令。
2.如权利要求1所述的语音指令识别方法,其特征在于,具体步骤包括:
步骤S1:识别用户的语音指令并保存;
步骤S2:统计用户的语音指令的出现频次;
步骤S3:将出现频次超过设定的第一阈值的语音指令添加到语音指令数据库中,将出现频次低于设定的第二阈值的语音指令从语音指令数据库中删除。
3.如权利要求2所述的语音指令识别方法,其特征在于,所述步骤S1进一步包括:
步骤S11:将用户的语音指令与语音数据库中的语音指令进行比较,若一致,则进入步骤S12,若不一致,则进入步骤S13;
步骤S12:执行所述语音指令并保存;
步骤S13:保存所述语音指令,要求用户重新发布语音指令并识别,将识别成功的语音指令等同于上一次没有识别出的语音指令。
4.如权利要求3所述的语音指令识别方法,其特征在于,所述步骤S11中,根据用户的语音指令与语音数据库中的语音指令的相似度是否达到设定的阈值来判断是否一致。
5.如权利要求2所述的语音指令识别方法,其特征在于,所述步骤S2中,根据语音指令在一个设定的周期内出现的次数来统计用户的语音指令的出现频次。
6.一种语音指令识别***,其特征在于,包括语音识别模块和语音指令数据库和控制模块,
所述语音指令数据库,用于存储用户的语音识别指令;
所述语音识别模块,用于根据所述语音指令数据库中存储的语音识别指令来识别用户的语音指令;
所述控制模块,用于根据语音指令出现的频次,对语音指令数据库中的语音指令进行删减或补充,删除使用频次比较低的语音指令,补充使用频次比较高的语音指令。
7.如权利要求6所述的语音指令识别***,其特征在于,所述控制模块包括统计单元、添加单元和删除单元,
所述统计单元,用于统计用户的语音指令的出现频次;
所述添加单元,用于将出现频次超过设定的第一阈值的语音指令添加到语音指令数据库中;
所述删除单元,用于将出现频次低于设定的第二阈值的语音指令从语音指令数据库中删除。
8.如权利要求7所述的语音指令识别***,其特征在于,所述统计单元根据语音指令在一个设定的周期内出现的次数来统计用户的语音指令的出现频次。
9.如权利要求6所述的语音指令识别***,其特征在于,所述语音识别模块包括比较单元和关联单元,
所述比较单元,用于将用户的语音指令与所述语音数据库中的语音指令进行比较;
所述关联单元,用于将识别成功的语音指令与上一次没有识别出的语音指令进行等同关联。
10.如权利要求9所述的语音指令识别***,其特征在于,所述比较单元根据用户的语音指令与语音数据库中的语音指令的相似度是否达到设定的阈值来判断是否一致。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711191117.2A CN107993654A (zh) | 2017-11-24 | 2017-11-24 | 一种语音指令识别方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711191117.2A CN107993654A (zh) | 2017-11-24 | 2017-11-24 | 一种语音指令识别方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107993654A true CN107993654A (zh) | 2018-05-04 |
Family
ID=62033080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711191117.2A Pending CN107993654A (zh) | 2017-11-24 | 2017-11-24 | 一种语音指令识别方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107993654A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108766423A (zh) * | 2018-05-25 | 2018-11-06 | 三星电子(中国)研发中心 | 一种基于场景的主动唤醒方法和装置 |
CN109920432A (zh) * | 2019-03-05 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN110246498A (zh) * | 2019-07-15 | 2019-09-17 | 广东美的制冷设备有限公司 | 语音处理方法、装置和家电设备 |
CN110706701A (zh) * | 2019-10-08 | 2020-01-17 | 百度在线网络技术(北京)有限公司 | 语音技能推荐方法、装置、设备及存储介质 |
CN110763237A (zh) * | 2019-11-05 | 2020-02-07 | 上海市浦东新区建设(集团)有限公司 | 一种基于bim的室内导航方法 |
CN110806197A (zh) * | 2019-09-28 | 2020-02-18 | 上海翊视皓瞳信息科技有限公司 | 一种基于智能视觉设备的姿态检测*** |
CN110853173A (zh) * | 2019-09-28 | 2020-02-28 | 上海翊视皓瞳信息科技有限公司 | 一种基于视觉穿戴装置的设备巡检管理*** |
CN111627437A (zh) * | 2020-05-07 | 2020-09-04 | 深圳力维智联技术有限公司 | 基于语音交互的智能设备管理方法与*** |
CN112802474A (zh) * | 2019-10-28 | 2021-05-14 | ***通信有限公司研究院 | 语音识别方法、装置、设备及存储介质 |
CN113848747A (zh) * | 2021-11-03 | 2021-12-28 | 珠海格力电器股份有限公司 | 智能家居设备控制方法及装置 |
WO2022156246A1 (zh) * | 2021-01-21 | 2022-07-28 | 海信视像科技股份有限公司 | 语音指令处理电路、接收装置、服务器、语音指令的累积***和累积方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075434A (zh) * | 2006-05-18 | 2007-11-21 | 富士通株式会社 | 语音识别装置及存储语音识别程序的记录介质 |
US20100017505A1 (en) * | 2006-12-18 | 2010-01-21 | Access Co., Ltd. | Application updating management terminal device, system and program |
CN103632669A (zh) * | 2012-08-20 | 2014-03-12 | 上海闻通信息科技有限公司 | 一种语音控制遥控器的方法以及一种语音遥控器 |
CN106205613A (zh) * | 2016-07-22 | 2016-12-07 | 深圳智眸科技有限公司 | 一种导航语音识别方法及*** |
-
2017
- 2017-11-24 CN CN201711191117.2A patent/CN107993654A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075434A (zh) * | 2006-05-18 | 2007-11-21 | 富士通株式会社 | 语音识别装置及存储语音识别程序的记录介质 |
US20100017505A1 (en) * | 2006-12-18 | 2010-01-21 | Access Co., Ltd. | Application updating management terminal device, system and program |
CN103632669A (zh) * | 2012-08-20 | 2014-03-12 | 上海闻通信息科技有限公司 | 一种语音控制遥控器的方法以及一种语音遥控器 |
CN106205613A (zh) * | 2016-07-22 | 2016-12-07 | 深圳智眸科技有限公司 | 一种导航语音识别方法及*** |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108766423A (zh) * | 2018-05-25 | 2018-11-06 | 三星电子(中国)研发中心 | 一种基于场景的主动唤醒方法和装置 |
CN108766423B (zh) * | 2018-05-25 | 2021-07-09 | 三星电子(中国)研发中心 | 一种基于场景的主动唤醒方法和装置 |
CN109920432A (zh) * | 2019-03-05 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN109920432B (zh) * | 2019-03-05 | 2024-06-18 | 联通在线信息科技有限公司 | 一种语音识别方法、装置、设备及存储介质 |
US11264034B2 (en) | 2019-03-05 | 2022-03-01 | Baidu Online Network Technology (Beijing) Co., Ltd | Voice identification method, device, apparatus, and storage medium |
CN110246498B (zh) * | 2019-07-15 | 2021-04-20 | 广东美的制冷设备有限公司 | 语音处理方法、装置和家电设备 |
CN110246498A (zh) * | 2019-07-15 | 2019-09-17 | 广东美的制冷设备有限公司 | 语音处理方法、装置和家电设备 |
CN110853173A (zh) * | 2019-09-28 | 2020-02-28 | 上海翊视皓瞳信息科技有限公司 | 一种基于视觉穿戴装置的设备巡检管理*** |
CN110806197A (zh) * | 2019-09-28 | 2020-02-18 | 上海翊视皓瞳信息科技有限公司 | 一种基于智能视觉设备的姿态检测*** |
CN110806197B (zh) * | 2019-09-28 | 2022-04-19 | 上海翊视皓瞳信息科技有限公司 | 一种基于智能视觉设备的姿态检测*** |
CN110706701A (zh) * | 2019-10-08 | 2020-01-17 | 百度在线网络技术(北京)有限公司 | 语音技能推荐方法、装置、设备及存储介质 |
CN112802474A (zh) * | 2019-10-28 | 2021-05-14 | ***通信有限公司研究院 | 语音识别方法、装置、设备及存储介质 |
CN110763237A (zh) * | 2019-11-05 | 2020-02-07 | 上海市浦东新区建设(集团)有限公司 | 一种基于bim的室内导航方法 |
CN111627437A (zh) * | 2020-05-07 | 2020-09-04 | 深圳力维智联技术有限公司 | 基于语音交互的智能设备管理方法与*** |
WO2022156246A1 (zh) * | 2021-01-21 | 2022-07-28 | 海信视像科技股份有限公司 | 语音指令处理电路、接收装置、服务器、语音指令的累积***和累积方法 |
CN113848747A (zh) * | 2021-11-03 | 2021-12-28 | 珠海格力电器股份有限公司 | 智能家居设备控制方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107993654A (zh) | 一种语音指令识别方法及*** | |
US11138381B2 (en) | Method, computer device and readable medium for user's intent mining | |
US10637674B2 (en) | System and method for real-time decoding and monitoring for encrypted instant messaging and other information exchange applications | |
CN105446146B (zh) | 基于语义分析的智能终端控制方法、***及智能终端 | |
CN104090652B (zh) | 一种语音输入方法和装置 | |
EP3617946B1 (en) | Context acquisition method and device based on voice interaction | |
WO2015062482A1 (en) | System and method for automatic question answering | |
US20090171901A1 (en) | Real-time annotator | |
KR102081495B1 (ko) | 계정 추가 방법, 단말, 서버, 및 컴퓨터 저장 매체 | |
WO2019001075A1 (zh) | 一种垃圾弹幕的识别方法、装置及计算机设备 | |
WO2019062342A9 (zh) | 后台应用清理方法、装置、存储介质及电子设备 | |
CN107193836B (zh) | 一种识别方法及装置 | |
CN109785846B (zh) | 单声道的语音数据的角色识别方法及装置 | |
WO2022037600A1 (zh) | 摘要记录方法、装置、计算机设备和存储介质 | |
US20190087303A1 (en) | System, method, and apparatus for gathering information | |
CN113436611A (zh) | 车载语音设备的测试方法、装置、电子设备和存储介质 | |
CN109040444A (zh) | 一种通话录音方法、终端及计算机可读存储介质 | |
US20190103110A1 (en) | Information processing device, information processing method, and program | |
CN111739515B (zh) | 语音识别方法、设备、电子设备和服务器、相关*** | |
WO2024055603A1 (zh) | 一种未成年人文本识别方法及装置 | |
CN112669837A (zh) | 智能终端的唤醒方法、装置及电子设备 | |
CN117272977A (zh) | 人物描写语句的识别方法、装置、电子设备及存储介质 | |
EP4254400A1 (en) | Method and device for determining user intent | |
CN109192211A (zh) | 一种语音信号识别的方法、装置及设备 | |
CN110556099B (zh) | 一种命令词控制方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180504 |