CN115035889A - 一种基于声音特征的离线语音控制训练方法及*** - Google Patents

一种基于声音特征的离线语音控制训练方法及*** Download PDF

Info

Publication number
CN115035889A
CN115035889A CN202210592895.7A CN202210592895A CN115035889A CN 115035889 A CN115035889 A CN 115035889A CN 202210592895 A CN202210592895 A CN 202210592895A CN 115035889 A CN115035889 A CN 115035889A
Authority
CN
China
Prior art keywords
voice
preset
sound
instruction
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210592895.7A
Other languages
English (en)
Inventor
冷朝玉
冷朝松
陈蔚
王祖福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Eplan Technology Co ltd
Original Assignee
Shenzhen Eplan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Eplan Technology Co ltd filed Critical Shenzhen Eplan Technology Co ltd
Priority to CN202210592895.7A priority Critical patent/CN115035889A/zh
Publication of CN115035889A publication Critical patent/CN115035889A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种基于声音特征的离线语音控制训练方法及***,运用于语音控制技术领域;获取需要进行控制的语音;判断所述语音是否匹配预设人物的声线;若是,则根据所述预设人物的声线开始录入离线语音指令;获取所述离线语音指令的关键词;判断所述关键词是否具备预设的识别单位;若是,则收录所述离线语音指令为控制指令;本发明通过在智能***中根据已知的人物和提前录制好的人物声音特征,在失去互联网的连接下,依然可以执行智能***所需要执行的任务,例如人物声控智能***进行开灯或关灯操作,无需通过互联网进行命令执行;有效增加了智能***在离线状态后的实用性。

Description

一种基于声音特征的离线语音控制训练方法及***
技术领域
本发明涉及语音控制技术领域,特别涉及为一种基于声音特征的离线语音控制训练方法及***。
背景技术
人工智能是当今前沿高技术研究最活跃的领域之一,它可以完成有益于人类的服务工作,如提供家务、娱乐休闲、教育、安全监控等服务,拥有广泛的潜在客户群体与市场,现有的人工智能广泛采用语音识别技术实现人机交互,让智能***能够听懂人类语音,以执行相应指令,然而,现有的智能***在失去与互联网的连接后,就无法识别说话人的指令,满足不了用户当下的需求,无法实现人机离线自由交流。
鉴于此,本发明提出一种基于声音特征的离线语音控制训练方法及***,以解决上述背景技术中提出的问题。
发明内容
本发明旨在解决智能***在失去与互联网的连接后,就无法识别说话人的指令的问题,提供一种基于声音特征的离线语音控制训练方法及***。
本发明为解决技术问题采用如下技术手段:
本发明提供一种基于声音特征的离线语音控制训练方法,包括以下步骤:
获取需要进行控制的语音;
判断所述语音是否匹配预设人物的声线;
若是,则根据所述预设人物的声线开始录入离线语音指令;
获取所述离线语音指令的关键词;
判断所述关键词是否具备预设的识别单位;
若是,则收录所述离线语音指令为控制指令。
进一步地,则收录所述离线语音指令为控制指令的步骤中,包括:
捕捉需要进行控制的语音指令;
判断所述语音指令是否匹配所述控制指令;
若是,则根据所述语音指令运行相应的内容;其中,所述内容包括预先收录的指令内容。
进一步地,获取需要进行控制的语音的步骤前,包括:
采集当前环境中的分贝强度;
判断所述分贝强度是否处于预设的分贝强度范围内;
若是,则判定所述分贝为非自然音量;所述非自然音量包括人说话的声音或人制造的其他声音;
若否,则判定所述分贝为自然音量;所述自然音量包括但不限于是虫鸣声、风声或水声。
进一步地,判断所述分贝强度是否处于预设的分贝强度范围内的步骤中,包括:
获取当前环境的声音的频率;
判断所述频率是否符合预设的频率范围;
若是,则判定所述当前环境的声音为预设人物发出;若否,则判定所述当前环境的声音为人造的其他声音。
进一步地,则判定所述当前环境的声音为预设人物发出的步骤中,包括:
获取预设人物发出的语音的特征;所述特征包括发音;
判断所述特征是否匹配预设的地方发音;
若是,则根据所述特征对所述预设人物发出的语音进行翻译,并根据翻译后的语音指令运行相应的内容。
进一步地,判断所述关键词是否具备预设的识别单位的步骤中,包括:
获取所述预设的识别单位的对应内容;
判断所述对应内容是否为离线仍然可运行的内容;
若是,则判定所述预设的识别单位的对应内容可以运行。
进一步地,获取所述离线语音指令的关键词的步骤中,包括:
分解所述离线语音指令的字词;
判断所述字词是否匹配预设的关键字眼;
若是,则判定所述离线语音指令可以在离线状态下使用;
若否,则判定所述离线语音指令需要进行录制才可在离线状态下使用。
本发明还提供一种基于声音特征的离线语音控制训练***,包括:
第一获取模块,用于获取需要进行控制的语音;
第一判断模块,用于判断所述语音是否匹配预设人物的声线;
第一执行模块,用于若是,则根据所述预设人物的声线开始录入离线语音指令;
第二获取模块,用于获取所述离线语音指令的关键词;
第二判断模块,用于判断所述关键词是否具备预设的识别单位;
第二执行模块,用于若是,则收录所述离线语音指令为控制指令。
进一步地,第二执行模块还包括:
第一捕捉单元,用于捕捉需要进行控制的语音指令;
第一判断单元,用于判断所述语音指令是否匹配所述控制指令;
第一执行单元,用于根据所述语音指令运行相应的内容;其中,所述内容包括预先收录的指令内容。
进一步地,还包括:
第一采集模块,用于采集当前环境中的分贝强度;
第三判断模块,用于判断所述分贝强度是否处于预设的分贝强度范围内;
第三执行模块,用于判定所述分贝为非自然音量;所述非自然音量包括人说话的声音或人制造的其他声音;
第四执行模块,用于判定所述分贝为自然音量;所述自然音量包括但不限于是虫鸣声、风声或水声。
本发明提供了基于声音特征的离线语音控制训练方法及***,具有以下有益效果:
本发明通过在智能***中根据已知的人物和提前录制好的人物声音特征,在失去互联网的连接下,依然可以执行智能***所需要执行的任务,例如人物声控智能***进行开灯或关灯操作,无需通过互联网进行命令执行;有效增加了智能***在离线状态后的实用性。
附图说明
图1为本发明基于声音特征的离线语音控制训练方法一个实施例的流程示意图;
图2为本发明基于声音特征的离线语音控制训练***一个实施例的结构框图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明,本发明为目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
下面将结合本发明的实施例中的附图,对本发明的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参考附图1,为本发明一实施例中的基于声音特征的离线语音控制训练方法,包括以下步骤:
S1:获取需要进行控制的语音;
S2:判断所述语音是否匹配预设人物的声线;
S3:若是,则根据所述预设人物的声线开始录入离线语音指令;
S4:获取所述离线语音指令的关键词;
S5:判断所述关键词是否具备预设的识别单位;
S6:若是,则收录所述离线语音指令为控制指令。
在本实施例中,智能***获取到需要对***进行控制的语音,并判断该需要对***进行控制的语音是否匹配预设有的人物声线,即***已收录好的人物声线,***可以根据每个人物的不同声线特征,以识别到可以控制***的主人声线的特征,进而让主人对***进行控制,在识别出需要进行控制的语音为主人发出后,***根据主人的需求开始录制当***离线时仍然可以使用的智能语音;如若智能***安装在家中,那么智能***只能获取到家中已收录的器具的相关指令,无法识别家中暂无收录的器具的相关指令,例如开启客厅的一号灯、关闭厨房的二号灯或停止抽风机的运作;如若智能***未安装在车中,那么智能***无法识别到车中的器具的相关指令,例如关闭车内的空调、开启车辆的灯光或停止车辆的运行;智能***在获取到主人需要录制的离线指令后,分辨指令中的关键词,以识别到需要确认为控制指令的离线指令;例如,主人说将一号灯设置为离线指令,即智能***会将一号灯的所有指令记录好,如一号灯的开或关和一号灯的色彩转换;例如,主人说将车辆控制设置为离线指令,即智能***会将关于车辆的所有指令记录好,如车辆灯光的开关或车辆空调的开关;智能***只能对主人确认需要进行离线控制的物品进行离线控制,无法对主人未确认需要进行离线控制的物品进行离线控制;当与主人确认完毕需要收录这些离线指令后,智能***则将这些离线指令收录至***中,即下次即使智能***失去了与互联网的连接,智能***也可以根据预先录制好的离线指令作为控制主人所需控制的快捷手段。
在本实施例中,则收录所述离线语音指令为控制指令的步骤S6中,包括:
S61:捕捉需要进行控制的语音指令;
S62:判断所述语音指令是否匹配所述控制指令;
S63:若是,则根据所述语音指令运行相应的内容;其中,所述内容包括预先收录的指令内容。
在本实施例中,智能***捕捉需要进行控制的语音指令,并判断这些语音指令是否匹配预先收录的控制指令,若是,则根据语音指令运行相应的内容;例如,智能***捕捉到主人说的语音指令为控制客厅的一号灯开启,而智能***之前已经预设好对一号灯的开或关的指令,即智能***可以识别到主人当前需要将一号灯开启,可以在失去互联网的情况下对一号灯进行开启;例如,智能***捕捉到主人说的语音指令为控制客厅的一号灯从冷色灯光转换为暖色灯光,而智能***之前虽然已经预设好对一号灯的开或关的指令,但并未收录有一号灯从冷色灯光转换为暖色灯光的指令,即智能***无法识别到主人当前需要将一号灯从冷色灯光转换为暖色灯光。
在本实施例中,获取需要进行控制的语音的步骤S1前,包括:
S101:采集当前环境中的分贝强度;
S102:判断所述分贝强度是否处于预设的分贝强度范围内;
S103:若是,则判定所述分贝为非自然音量;所述非自然音量包括人说话的声音或人制造的其他声音;
S104:若否,则判定所述分贝为自然音量;所述自然音量包括但不限于是虫鸣声、风声或水声。
在本实施例中,智能***采集当前环境中的分贝强度,并判断这些分贝强度是否处于预设的分贝强度范围内,进而判定当前环境中的分贝是否为非自然音量或自然音量;例如,智能***采集到当前环境中的分贝强度在0-40db内,而智能***预设的分贝强度范围在40-60db,即当前环境下的分贝强度可能为自然音量,如昆虫的虫鸣声、风吹的沙沙声或水流的滴答声,而并未为非自然音量;例如,智能***采集到当前环境中的分贝强度在40-60db内,在已知智能***预设的分贝强度范围在40-60db,即当前环境下的分贝强度可能为非自然音量,即人说话的声音或人制造的其他声音。
在本实施例中,判断所述分贝强度是否处于预设的分贝强度范围内的步骤S102中,包括:
S1021:获取当前环境的声音的频率;
S1022:判断所述频率是否符合预设的频率范围;
S1023:若是,则判定所述当前环境的声音为预设人物发出;若否,则判定所述当前环境的声音为人造的其他声音。
在本实施例中,智能***通过获取当前环境的声音频率,并判断这些声音频率是否处于预设的频率范围内,进而判断这些声音频率为人物发出的声音或是人造的其他声音;例如,智能***获取到声音频率在0-100hz的声音,而智能***预设的声音频率范围为100-300hz,即智能***判定该声音频率为人造的其他声音,而并非是人说话的声音;例如,智能***获取到声音频率在100-300hz的声音,在已知智能***预设的声音频率范围为100-300hz的情况下,即智能***判定该声音频率为人说话的声音,而并非是人造的其他声音。
在本实施例中,则判定所述当前环境的声音为预设人物发出的步骤S1023中,包括:
S10231:获取预设人物发出的声音的特征;所述特征包括发音;
S10232:判断所述特征是否匹配预设的地方发音;
S10233:若是,则根据所述特征对所述预设人物发出的语音进行翻译,并根据翻译后的语音指令运行相应的内容。
在本实施例中,智能***通过获取预设人物已发出的声音的特征,并判断该特征是否匹配预设的地方发音,进而根据声音进行翻译并运行指令相应的内容;例如,智能***获取到预设人物发出的声音特征为川普,而智能***预设的地方发音里包含了川普等其他普通话的发音,则***能够运用预设好的川普发音对人物发出的川普指令进行翻译,并转化为相应的指令,进而运行;例如,智能***获取到预设人物发出的声音特征为俄罗斯语,在已知智能***预设的地方发音里只包含川普等其他普通话的发音的情况下,则***无法识别出人物当前说的俄罗斯语的含义,即智能***无法识别人物说的话和指令。
在本实施例中,判断所述关键词是否具备预设的识别单位的步骤S5中,包括:
S51:获取所述预设的识别单位的对应内容;
S52:判断所述对应内容是否为离线仍然可运行的内容;
S53:若是,则判定所述预设的识别单位的对应内容可以运行。
在本实施例中,智能***通过获取到需要进行识别的指令中预设的识别单位,每个预设的识别单位都有对应的不同指令内容,通过识别这些不同指令内容***有无收录,进而判断***是否可以运行这些内容对应的指令;例如,智能***获取到识别单位为一号灯,一号灯对应的内容为开启一号灯,而智能***收录的一号灯指令为开或关,即智能***能够根据一号灯的对应内容进行指令运行为开启一号灯;例如,智能***获取到识别单位为一号灯,一号灯对应的内容为从冷色灯光转换为暖色灯光,在已知智能***收录的一号灯指令为开或关的情况下,即智能***无法根据一号灯的对应内容进行指令运行为从冷色灯光转换为暖色灯光。
在本实施例中,获取所述离线语音指令的关键词的步骤S4中,包括:
S41:分解所述离线语音指令的字词;
S42:判断所述字词是否匹配预设的关键字眼;
S43:若是,则判定所述离线语音指令可以在离线状态下使用;
S44:若否,则判定所述离线语音指令需要进行录制才可在离线状态下使用。
在本实施例中,智能***通过分解离线语音指令中的字词,以判断离线语音指令中是否存在预设的关键词,进而判定该离线语音指令是否能正常使用;例如,智能***获取到离线语音指令为一号灯的指令,而智能***已经收录有一号灯、二号灯和三号灯的指令,即智能***可以识别出关于一号灯的指令,并根据指令运行相应的内容;例如,智能***获取到离线语音指令为车辆的指令,在已知智能***已经收录有一号灯、二号灯和三号灯的指令,即智能***无法识别出关于车辆的指令,无法根据指令运行相应的内容。
参考附图2,为本发明一实施例中基于声音特征的离线语音控制训练***,包括:
第一获取模块10,用于获取需要进行控制的语音;
第一判断模块20,用于判断所述语音是否匹配预设人物的声线;
第一执行模块30,用于若是,则根据所述预设人物的声线开始录入离线语音指令;
第二获取模块40,用于获取所述离线语音指令的关键词;
第二判断模块50,用于判断所述关键词是否具备预设的识别单位;
第二执行模块60,用于若是,则收录所述离线语音指令为控制指令。
在本实施例中,第一获取模块10获取到需要对***进行控制的语音,第一判断模块20判断该需要对***进行控制的语音是否匹配预设有的人物声线,即***已收录好的人物声线,***可以根据每个人物的不同声线特征,以识别到可以控制***的主人声线的特征,进而让主人对***进行控制,在识别出需要进行控制的语音为主人发出后,第一执行模块30根据主人的需求开始录制当***离线时仍然可以使用的智能语音;如若智能***安装在家中,那么智能***只能获取到家中已收录的器具的相关指令,无法识别家中暂无收录的器具的相关指令,例如开启客厅的一号灯、关闭厨房的二号灯或停止抽风机的运作;如若智能***未安装在车中,那么智能***无法识别到车中的器具的相关指令,例如关闭车内的空调、开启车辆的灯光或停止车辆的运行;智能***在获取到主人需要录制的离线指令后,分辨指令中的关键词,以识别到需要确认为控制指令的离线指令;例如,主人说将一号灯设置为离线指令,即智能***会将一号灯的所有指令记录好,如一号灯的开或关和一号灯的色彩转换;例如,主人说将车辆控制设置为离线指令,即智能***会将关于车辆的所有指令记录好,如车辆灯光的开关或车辆空调的开关;第二获取模块40在获取到离线语音指令的关键词后,第二判断模块50判断关键词中是否具备预设的识别单位,进而通过第二执行模块60确认后,收录离线语音指令为控制指令;智能***只能对主人确认需要进行离线控制的物品进行离线控制,无法对主人未确认需要进行离线控制的物品进行离线控制;当与主人确认完毕需要收录这些离线指令后,智能***则将这些离线指令收录至***中,即下次即使智能***失去了与互联网的连接,智能***也可以根据预先录制好的离线指令作为控制主人所需控制的快捷手段。
在本实施例中,第二执行模块还包括:
第一捕捉单元,用于捕捉需要进行控制的语音指令;
第一判断单元,用于判断所述语音指令是否匹配所述控制指令;
第一执行单元,用于根据所述语音指令运行相应的内容;其中,所述内容包括预先收录的指令内容。
在本实施例中,智能***捕捉需要进行控制的语音指令,并判断这些语音指令是否匹配预先收录的控制指令,若是,则根据语音指令运行相应的内容;例如,智能***捕捉到主人说的语音指令为控制客厅的一号灯开启,而智能***之前已经预设好对一号灯的开或关的指令,即智能***可以识别到主人当前需要将一号灯开启,可以在失去互联网的情况下对一号灯进行开启;例如,智能***捕捉到主人说的语音指令为控制客厅的一号灯从冷色灯光转换为暖色灯光,而智能***之前虽然已经预设好对一号灯的开或关的指令,但并未收录有一号灯从冷色灯光转换为暖色灯光的指令,即智能***无法识别到主人当前需要将一号灯从冷色灯光转换为暖色灯光。
在本实施例中,还包括:
第一采集模块,用于采集当前环境中的分贝强度;
第三判断模块,用于判断所述分贝强度是否处于预设的分贝强度范围内;
第三执行模块,用于判定所述分贝为非自然音量;所述非自然音量包括人说话的声音或人制造的其他声音;
第四执行模块,用于判定所述分贝为自然音量;所述自然音量包括但不限于是虫鸣声、风声或水声。
在本实施例中,智能***采集当前环境中的分贝强度,并判断这些分贝强度是否处于预设的分贝强度范围内,进而判定当前环境中的分贝是否为非自然音量或自然音量;例如,智能***采集到当前环境中的分贝强度在0-40db内,而智能***预设的分贝强度范围在40-60db,即当前环境下的分贝强度可能为自然音量,如昆虫的虫鸣声、风吹的沙沙声或水流的滴答声,而并未为非自然音量;例如,智能***采集到当前环境中的分贝强度在40-60db内,在已知智能***预设的分贝强度范围在40-60db,即当前环境下的分贝强度可能为非自然音量,即人说话的声音或人制造的其他声音。
在本实施例中,第三判断模块还包括:
第一获取单元,用于获取当前环境的声音的频率;
第二判断单元,用于判断所述频率是否符合预设的频率范围;
第二执行单元,用于若是,则判定所述当前环境的声音为预设人物发出;若否,则判定所述当前环境的声音为人造的其他声音。
在本实施例中,智能***通过获取当前环境的声音频率,并判断这些声音频率是否处于预设的频率范围内,进而判断这些声音频率为人物发出的声音或是人造的其他声音;例如,智能***获取到声音频率在0-100hz的声音,而智能***预设的声音频率范围为100-300hz,即智能***判定该声音频率为人造的其他声音,而并非是人说话的声音;例如,智能***获取到声音频率在100-300hz的声音,在已知智能***预设的声音频率范围为100-300hz的情况下,即智能***判定该声音频率为人说话的声音,而并非是人造的其他声音。
在本实施例中,第二执行单元还包括:
第一获取子单元,用于获取预设人物发出的声音的特征;所述特征包括发音;
第一判断子单元,用于判断所述特征是否匹配预设的地方发音;
第一执行子单元,用于若是,则根据所述特征对所述预设人物发出的语音进行翻译,并根据翻译后的语音指令运行相应的内容。
在本实施例中,智能***通过获取预设人物已发出的声音的特征,并判断该特征是否匹配预设的地方发音,进而根据声音进行翻译并运行指令相应的内容;例如,智能***获取到预设人物发出的声音特征为川普,而智能***预设的地方发音里包含了川普等其他普通话的发音,则***能够运用预设好的川普发音对人物发出的川普指令进行翻译,并转化为相应的指令,进而运行;例如,智能***获取到预设人物发出的声音特征为俄罗斯语,在已知智能***预设的地方发音里只包含川普等其他普通话的发音的情况下,则***无法识别出人物当前说的俄罗斯语的含义,即智能***无法识别人物说的话和指令。
在本实施例中,第二判断模块还包括:
第二获取单元,用于获取所述预设的识别单位的对应内容;
第三判断单元,用于判断所述对应内容是否为离线仍然可运行的内容;
第三执行单元,用于若是,则判定所述预设的识别单位的对应内容可以运行。
在本实施例中,智能***通过获取到需要进行识别的指令中预设的识别单位,每个预设的识别单位都有对应的不同指令内容,通过识别这些不同指令内容***有无收录,进而判断***是否可以运行这些内容对应的指令;例如,智能***获取到识别单位为一号灯,一号灯对应的内容为开启一号灯,而智能***收录的一号灯指令为开或关,即智能***能够根据一号灯的对应内容进行指令运行为开启一号灯;例如,智能***获取到识别单位为一号灯,一号灯对应的内容为从冷色灯光转换为暖色灯光,在已知智能***收录的一号灯指令为开或关的情况下,即智能***无法根据一号灯的对应内容进行指令运行为从冷色灯光转换为暖色灯光。
在本实施例中,第二获取模块包括:
第一分解单元,用于分解所述离线语音指令的字词;
第四判断单元,用于判断所述字词是否匹配预设的关键字眼;
第四执行单元,用于若是,则判定所述离线语音指令可以在离线状态下使用;
第五执行单元,用于若否,则判定所述离线语音指令需要进行录制才可在离线状态下使用。
在本实施例中,智能***通过分解离线语音指令中的字词,以判断离线语音指令中是否存在预设的关键词,进而判定该离线语音指令是否能正常使用;例如,智能***获取到离线语音指令为一号灯的指令,而智能***已经收录有一号灯、二号灯和三号灯的指令,即智能***可以识别出关于一号灯的指令,并根据指令运行相应的内容;例如,智能***获取到离线语音指令为车辆的指令,在已知智能***已经收录有一号灯、二号灯和三号灯的指令,即智能***无法识别出关于车辆的指令,无法根据指令运行相应的内容。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于声音特征的离线语音控制训练方法,其特征在于,包括以下步骤:
获取需要进行控制的语音;
判断所述语音是否匹配预设人物的声线;
若是,则根据所述预设人物的声线开始录入离线语音指令;
获取所述离线语音指令的关键词;
判断所述关键词是否具备预设的识别单位;
若是,则收录所述离线语音指令为控制指令。
2.根据权利要求1所述的基于声音特征的离线语音控制训练方法,其特征在于,所述则收录所述离线语音指令为控制指令的步骤中,包括:
捕捉需要进行控制的语音指令;
判断所述语音指令是否匹配所述控制指令;
若是,则根据所述语音指令运行相应的内容;其中,所述内容包括预先收录的指令内容。
3.根据权利要求1所述的基于声音特征的离线语音控制训练方法,其特征在于,所述获取需要进行控制的语音的步骤前,包括:
采集当前环境中的分贝强度;
判断所述分贝强度是否处于预设的分贝强度范围内;
若是,则判定所述分贝为非自然音量;所述非自然音量包括人说话的声音或人制造的其他声音;
若否,则判定所述分贝为自然音量;所述自然音量包括但不限于是虫鸣声、风声或水声。
4.根据权利要求3所述的基于声音特征的离线语音控制训练方法,其特征在于,所述判断所述分贝强度是否处于预设的分贝强度范围内的步骤中,包括:
获取当前环境的声音的频率;
判断所述频率是否符合预设的频率范围;
若是,则判定所述当前环境的声音为预设人物发出;若否,则判定所述当前环境的声音为人造的其他声音。
5.根据权利要求4所述的基于声音特征的离线语音控制训练方法,其特征在于,所述则判定所述当前环境的声音为预设人物发出的步骤中,包括:
获取预设人物发出的语音的特征;所述特征包括发音;
判断所述特征是否匹配预设的地方发音;
若是,则根据所述特征对所述预设人物发出的语音进行翻译,并根据翻译后的语音指令运行相应的内容。
6.根据权利要求1所述的基于声音特征的离线语音控制训练方法,其特征在于,所述判断所述关键词是否具备预设的识别单位的步骤中,包括:
获取所述预设的识别单位的对应内容;
判断所述对应内容是否为离线仍然可运行的内容;
若是,则判定所述预设的识别单位的对应内容可以运行。
7.根据权利要求1所述的基于声音特征的离线语音控制训练方法,其特征在于,所述获取所述离线语音指令的关键词的步骤中,包括:
分解所述离线语音指令的字词;
判断所述字词是否匹配预设的关键字眼;
若是,则判定所述离线语音指令可以在离线状态下使用;
若否,则判定所述离线语音指令需要进行录制才可在离线状态下使用。
8.一种基于声音特征的离线语音控制训练***,其特征在于,包括:
第一获取模块,用于获取需要进行控制的语音;
第一判断模块,用于判断所述语音是否匹配预设人物的声线;
第一执行模块,用于若是,则根据所述预设人物的声线开始录入离线语音指令;
第二获取模块,用于获取所述离线语音指令的关键词;
第二判断模块,用于判断所述关键词是否具备预设的识别单位;
第二执行模块,用于若是,则收录所述离线语音指令为控制指令。
9.根据权利要求8所述的基于声音特征的离线语音控制训练***,其特征在于,所述第二执行模块还包括:
第一捕捉单元,用于捕捉需要进行控制的语音指令;
第一判断单元,用于判断所述语音指令是否匹配所述控制指令;
第一执行单元,用于根据所述语音指令运行相应的内容;其中,所述内容包括预先收录的指令内容。
10.根据权利要求8所述的基于声音特征的离线语音控制训练***,其特征在于,还包括:
第一采集模块,用于采集当前环境中的分贝强度;
第三判断模块,用于判断所述分贝强度是否处于预设的分贝强度范围内;
第三执行模块,用于判定所述分贝为非自然音量;所述非自然音量包括人说话的声音或人制造的其他声音;
第四执行模块,用于判定所述分贝为自然音量;所述自然音量包括但不限于是虫鸣声、风声或水声。
CN202210592895.7A 2022-05-27 2022-05-27 一种基于声音特征的离线语音控制训练方法及*** Pending CN115035889A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210592895.7A CN115035889A (zh) 2022-05-27 2022-05-27 一种基于声音特征的离线语音控制训练方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210592895.7A CN115035889A (zh) 2022-05-27 2022-05-27 一种基于声音特征的离线语音控制训练方法及***

Publications (1)

Publication Number Publication Date
CN115035889A true CN115035889A (zh) 2022-09-09

Family

ID=83121677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210592895.7A Pending CN115035889A (zh) 2022-05-27 2022-05-27 一种基于声音特征的离线语音控制训练方法及***

Country Status (1)

Country Link
CN (1) CN115035889A (zh)

Similar Documents

Publication Publication Date Title
JP6887031B2 (ja) 方法、電子装置、家庭用機器ネットワークおよび記憶媒体
CN110223690A (zh) 基于图像与语音融合的人机交互方法及装置
KR102025566B1 (ko) 인공지능을 이용한 홈어플라이언스 및 음성 인식 서버 시스템과, 이의 제어 방법
KR101092820B1 (ko) 립리딩과 음성 인식 통합 멀티모달 인터페이스 시스템
KR101622111B1 (ko) 대화 시스템 및 그의 대화 방법
US20140149118A1 (en) Apparatus and method for driving electric device using speech recognition
US20050096905A1 (en) Method of operating a speech recognition system
CA2973512A1 (en) Voice recognition system and method of robot system
CN109949808A (zh) 兼容普通话和方言的语音识别家电控制***和方法
JPH07191715A (ja) 位置従属の言語コマンドを実行する方法及びコンピュータ制御システム
US20070150287A1 (en) Method for driving a dialog system
CN111968645B (zh) 一种个性化的语音控制***
CN114582318B (zh) 一种基于语音识别的智能家居控制方法及***
KR20060014369A (ko) 화자 종속 음성 인식 방법 및 음성 인식 시스템
KR102417899B1 (ko) 차량의 음성인식 시스템 및 방법
CN115035889A (zh) 一种基于声音特征的离线语音控制训练方法及***
CN113516975A (zh) 一种智能家居声控开关***及控制方法
CN112053680A (zh) 一种适合盲人使用的语音空调控制装置
JP2008268517A (ja) 音声認識機能付き操作器
CN113707156B (zh) 一种用于车载的语音识别方法及***
JP7505704B2 (ja) 設備制御装置、設備制御システム、及び設備制御方法
JPS6367197B2 (zh)
JP3083915U (ja) 鳴声の音声的特徴分析に基づく犬の感情判別装置
JP2003131695A (ja) 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法
JP2021033929A (ja) 制御システム、及び制御方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination