CN105825853A - 语音识别设备语音切换方法及装置 - Google Patents
语音识别设备语音切换方法及装置 Download PDFInfo
- Publication number
- CN105825853A CN105825853A CN201510008232.6A CN201510008232A CN105825853A CN 105825853 A CN105825853 A CN 105825853A CN 201510008232 A CN201510008232 A CN 201510008232A CN 105825853 A CN105825853 A CN 105825853A
- Authority
- CN
- China
- Prior art keywords
- phonetic order
- languages
- speech recognition
- acoustic features
- recognition apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 239000000284 extract Substances 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 9
- 230000008447 perception Effects 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 241001672694 Citrus reticulata Species 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明公开了一种语音识别设备语音切换方法,包括:接收用户输入的语音指令;提取所述语音指令的声学特征;根据所述语音指令的声学特征确定所述语音指令对应的语种类别;控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。本发明还公开了一种语音识别设备语音切换装置。本发明降低了设置语音播报的语种类别的操作难度。
Description
技术领域
本发明涉及语音识别技术领域,尤其涉及语音识别设备语音切换方法及装置。
背景技术
随着语音识别技术的飞速发展,语音识别开始从实验室走向市场,广泛的应用于工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。以带语音识别功能的手机为例,用户通过语音输入“你叫什么?”,手机进行语音识别后,进行播报答复:“你好,我叫XX”。用户可以设置手机答复时语音播报所采用的语种类别,例如中文普通话、英文、日文和方言等。当需要设置时,用户需要进入到指定的界面进行切换操作,从而使得设置语音播报的语种类别的操作难度较高。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种语音识别设备语音切换方法及装置,旨在降低设置语音播报的语种类别的操作难度。
为实现上述目的,本发明提供的一种语音识别设备语音切换方法包括以下步骤:
接收用户输入的语音指令;
提取所述语音指令的声学特征;
根据所述语音指令的声学特征确定所述语音指令对应的语种类别;
控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。
优选地,所述控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别之后还包括:
判断语音数据库中是否存在对应所述语种类别的语音数据包;
若是,则加载对应所述语种类别的语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复;
若否,则加载默认语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复。
优选地,所述根据所述语音指令的声学特征确定所述语音指令对应的语种类别包括:
判断声学模板库中是否存在与所述语音指令的声学特征匹配的预置声学特征;
若是,则将所述预置声学特征对应的语种类别设置为所述语音指令对应的语种类别;
若否,则将默认语种类别设置为所述语音指令对应的语种类别。
优选地,所述接收用户输入的语音指令之前还包括:
提取不同语种语音样本的声学特征并储存至声学模板库中。
优选地,所述声学特征包括线性预测系数(LPC)、Mel倒谱系数(MFCC)、感知线性预测(PLP)中的至少一者。
此外,为实现上述目的,本发明还提供一种语音识别设备语音切换装置,包括:
接收模块,用于接收用户输入的语音指令;
提取模块,用于提取所述语音指令的声学特征;
确定模块,用于根据所述语音指令的声学特征确定所述语音指令对应的语种类别;
控制模块,用于控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。
优选地,所述语音识别设备语音切换装置还包括:
判断模块,用于判断语音数据库中是否存在对应所述语种类别的语音数据包;
答复模块,用于当语音数据库中存在对应所述语种类别的语音数据包时,加载对应所述语种类别的语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复;当语音数据库中不存在对应所述语种类别的语音数据包时,加载默认语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复。
优选地,所述确定模块包括:
判断单元,用于判断声学模板库中是否存在与所述语音指令的声学特征匹配的预置声学特征;
设置单元,用于当声学模板库中存在与所述语音指令的声学特征匹配的预置声学特征时,将所述预置声学特征对应的语种类别设置为所述语音指令对应的语种类别;当声学模板库中不存在与所述语音指令的声学特征匹配的预置声学特征时,将默认语种类别设置为所述语音指令对应的语种类别。
优选地,所述语音识别设备语音切换装置还包括提取模块,所述提取模块用于提取不同语种语音样本的声学特征并储存至声学模板库中。
优选地,所述声学特征包括线性预测系数(LPC)、Mel倒谱系数(MFCC)、感知线性预测(PLP)中的至少一者。
本发明通过接收用户输入的语音指令;提取所述语音指令的声学特征;根据所述语音指令的声学特征确定所述语音指令对应的语种类别;控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。由于根据用户输入语音指令的语种类别自动切换语音播报的语种类别,无需用户手动设置,从而达到了降低设置语音播报的语种类别的操作难度。
附图说明
图1为本发明语音识别设备语音切换方法第一实施例的流程示意图;
图2为本发明语音识别设备语音切换方法第二实施例的流程示意图;
图3为本发明语音识别设备语音切换方法一实施例中确定语音指令的语种类别的细化流程示意图;
图4为本发明语音识别设备语音切换装置第一实施例的功能模块示意图;
图5为本发明语音识别设备语音切换装置第二实施例的功能模块示意图;
图6为本发明语音识别设备语音切换装置一实施例中确定模块的细化功能模块示意图;
图7为本发明语音识别设备语音切换装置第三实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种语音识别设备语音切换方法,参照图1,在一实施例中,该语音识别设备语音切换方法包括:
步骤S10,接收用户输入的语音指令;
本实施例提供的语音识别设备语音切换方法可以应用于语音识别设备的工作控制中。例如,用户使用四川话输入语音指令,语音识别设备进行语音识别后,语音识别设备同样使用四川话进行语音播报答复。所述语音识别设备可以是手机、平板电脑、电脑、ATM(自动柜员机)、智能机器人等具有语音识别功能的设备。以下实施例以手机为例进行详细说明。
步骤S20,提取所述语音指令的声学特征;
步骤S30,根据所述语音指令的声学特征确定所述语音指令对应的语种类别;
步骤S40,控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。
应当说明的是,从语言的角度,语种的差异性主要体现在各语种之间发音音素的不同,而音素的差异性又是通过声学特征来体现的。因此,通过提取所述语音指令的声学特征,可以确定所述语音指令的语种类别。本实施例中,提取所述语音指令的声学特征;根据所述语音指令的声学特征确定所述语音指令对应的语种类别;控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。所述声学特征包括LPC(线性预测系数)、MFCC(Mel倒谱系数)、PLP(感知线性预测)等。
例如,当用户使用四川话输入语音指令时,手机进行语音识别后,确定所述语音指令的语种类别为中文四川话;控制手机将语音播报的语种类别切换为中文四川话。
本发明实施例通过接收用户输入的语音指令;提取所述语音指令的声学特征;根据所述语音指令的声学特征确定所述语音指令对应的语种类别;控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。由于根据用户输入语音指令的语种类别自动切换语音播报的语种类别,无需用户手动设置,从而达到了降低设置语音播报的语种类别的操作难度。
进一步地,参照图2,基于上述实施例,本实施例中,上述步骤S40之后还包括:
S50,判断语音数据库中是否存在对应所述语种类别的语音数据包;若是,则执行步骤S60,否则执行步骤S70;
S60,加载对应所述语种类别的语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复;
S70,加载默认语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复。
可以理解的是,语音识别设备需要加载相应的语音数据包才能对用户输入的语音指令进行语音播报答复。本实施例中,在进行语音播报答复前,首先判断语音数据库中是否存在对应所述语种类别的语音数据包;若是,则加载对应所述语种类别的语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复;若否,则加载默认语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复。所述语音数据库存储有对应不同语种类别的语音数据包;所述默认语音数据包根据实际情况设置,例如,针对中国的手机用户可以设置所述默认语音数据包为对应中文普通话的语音数据包。当用户使用四川话输入语音指令“你叫啥子?”,手机进行语音识别后,确定所述语音指令的语种类别为中文四川话;若语音数据库中不存在对应中文四川话的语音数据包,则加载默认的对应中文普通话的语音数据包,使用中文普通话并根据预置规则进行语音播报答复。
应当说明的是,所述预置规则用于确定语音识别设备对所述语音指令进行语音播报答复时的答复信息。例如,可以设置预置规则为:当语音识别失败时,控制手机加载默认语音数据包进行语音播报:“识别失败,请重新输入”。
进一步地,参照图3,基于上述实施例,本实施中,上述步骤S30包括:
步骤S301,判断声学模板库中是否存在与所述语音指令的声学特征匹配的预置声学特征;若是,则执行步骤S302,否则执行步骤S303;
步骤S302,将所述预置声学特征对应的语种类别设置为所述语音指令对应的语种类别;
步骤S303,将默认语种类别设置为所述语音指令对应的语种类别。
本实施例中,通过将所述语音指令的声学特征与声学模板库中的预置声学特征一一进行比对,若存在与所述语音指令的声学特征匹配的预置声学特征,则将所述预置声学特征对应的语种类别设置为所述语音指令对应的语种类别;若不存在与所述语音指令的声学特征匹配的预置声学特征,则将默认语种类别设置为所述语音指令对应的语种类别。所述默认语种类别根据实际情况设置,例如,针对中国的手机用户可以设置所述默认语种类别为中文普通话,针对英国的手机用户可以设置所述默认语种类别为英语。
进一步地,基于上述实施例,本实施例中,上述步骤S10之前还包括:
提取不同语种语音样本的声学特征并储存至声学模板库中。
可以理解的是,由于语种的差异性主要体现在各语种之间发音音素的不同,而音素的差异性又是通过声学特征来体现的。本实施例中,在接收用户输入的语音指令之前,提取不同语种语音样本的声学特征并存入声学模板库中。通过将所述语音指令的声学特征与声学模板库中的预置声学特征进行一一比对,即可确定所述语音指令的语种类别。
本发明还提供一种语音识别设备语音切换装置,参照图4,在一实施例中,本发明提供的语音识别设备语音切换装置包括:
接收模块10,用于接收用户输入的语音指令;
本实施例提供的语音识别设备语音切换装置可以应用于语音识别设备的工作控制中。例如,用户使用四川话输入语音指令,语音识别设备进行语音识别后,语音识别设备同样使用四川话进行语音播报答复。所述语音识别设备可以是手机、平板电脑、电脑、ATM(自动柜员机)、智能机器人等具有语音识别功能的设备。以下实施例以手机为例进行详细说明。
提取模块20,用于提取所述语音指令的声学特征;
确定模块30,用于根据所述语音指令的声学特征确定所述语音指令对应的语种类别;
控制模块40,用于控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。
应当说明的是,从语言的角度,语种的差异性主要体现在各语种之间发音音素的不同,而音素的差异性又是通过声学特征来体现的。因此,通过提取所述语音指令的声学特征,可以确定所述语音指令的语种类别。本实施例中,提取所述语音指令的声学特征;根据所述语音指令的声学特征确定所述语音指令对应的语种类别;控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别;所述声学特征包括LPC(线性预测系数)、MFCC(Mel倒谱系数)、PLP(感知线性预测)等。
例如,当用户使用四川话输入语音指令时,手机进行语音识别后,确定所述语音指令的语种类别为中文四川话;控制手机将语音播报的语种类别切换为中文四川话。
本发明实施例通过接收用户输入的语音指令;提取所述语音指令的声学特征;根据所述语音指令的声学特征确定所述语音指令对应的语种类别;控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。由于根据用户输入语音指令的语种类别自动切换语音播报的语种类别,无需用户手动设置,从而达到了降低设置语音播报的语种类别的操作难度。
进一步地,参照图5,基于上述实施例,本实施例中,所述语音识别设备语音切换装置还包括:
判断模块50,用于判断语音数据库中是否存在对应所述语种类别的语音数据包;
答复模块60,用于当语音数据库中存在对应所述语种类别的语音数据包时,加载对应所述语种类别的语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复;当语音数据库中不存在对应所述语种类别的语音数据包时,加载默认语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复。
可以理解的是,语音识别设备需要加载相应的语音数据包才能对用户输入的语音指令进行语音播报答复。本实施例中,在进行语音播报答复前,首先判断语音数据库中是否存在对应所述语种类别的语音数据包;若是,则加载对应所述语种类别的语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复;若否,则加载默认语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复。所述语音数据库存储有对应不同语种类别的语音数据包;所述默认语音数据包根据实际情况设置,例如,针对中国的手机用户可以设置所述默认语音数据包为对应中文普通话的语音数据包。当用户使用四川话输入语音指令“你叫啥子?”,手机进行语音识别后,确定所述语音指令的语种类别为中文四川话;若语音数据库中不存在对应中文四川话的语音数据包,则加载默认的对应中文普通话的语音数据包,使用中文普通话并根据预置规则进行语音播报答复。
应当说明的是,所述预置规则用于确定语音识别设备对所述语音指令进行语音播报答复时的答复信息。例如,可以设置预置规则为:当语音识别失败时,控制手机加载默认语音数据包进行语音播报:“识别失败,请重新输入”。
进一步地,参照图6,基于上述实施例,本实施例中,所述确定模块30包括:
判断单元301,用于判断声学模板库中是否存在与所述语音指令的声学特征匹配的预置声学特征;
设置单元302,用于当声学模板库中存在与所述语音指令的声学特征匹配的预置声学特征时,将所述预置声学特征对应的语种类别设置为所述语音指令对应的语种类别;当声学模板库中不存在与所述语音指令的声学特征匹配的预置声学特征时,将默认语种类别设置为所述语音指令对应的语种类别。
本实施例中,通过将所述语音指令的声学特征与声学模板库中的预置声学特征一一进行比对,若存在与所述语音指令的声学特征匹配的预置声学特征,则将所述预置声学特征对应的语种类别设置为所述语音指令对应的语种类别;若不存在与所述语音指令的声学特征匹配的预置声学特征,则将默认语种类别设置为所述语音指令对应的语种类别。所述默认语种类别根据实际情况设置,例如,针对中国的手机用户可以设置所述默认语种类别为中文普通话,针对英国的手机用户可以设置所述默认语种类别为英语。
进一步地,参照图7,基于上述实施例,本实施例中,所述语音识别设备语音切换装置还包括提取模块70,所述提取模块70用于提取不同语种语音样本的声学特征并储存至声学模板库中。
可以理解的是,由于语种的差异性主要体现在各语种之间发音音素的不同,而音素的差异性又是通过声学特征来体现的。本实施例中,在接收用户输入的语音指令之前,提取不同语种语音样本的声学特征并存入声学模板库中。通过将所述语音指令的声学特征与声学模板库中的预置声学特征进行一一比对,即可确定所述语音指令的语种类别。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种语音识别设备语音切换方法,其特征在于,包括:
接收用户输入的语音指令;
提取所述语音指令的声学特征;
根据所述语音指令的声学特征确定所述语音指令对应的语种类别;
控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。
2.如权利要求1所述的语音识别设备语音切换方法,其特征在于,所述控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别之后还包括:
判断语音数据库中是否存在对应所述语种类别的语音数据包;
若是,则加载对应所述语种类别的语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复;
若否,则加载默认语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复。
3.如权利要求1所述的语音识别设备语音切换方法,其特征在于,所述根据所述语音指令的声学特征确定所述语音指令对应的语种类别包括:
判断声学模板库中是否存在与所述语音指令的声学特征匹配的预置声学特征;
若是,则将所述预置声学特征对应的语种类别设置为所述语音指令对应的语种类别;
若否,则将默认语种类别设置为所述语音指令对应的语种类别。
4.如权利要求3所述的语音识别设备语音切换方法,其特征在于,所述接收用户输入的语音指令之前还包括:
提取不同语种语音样本的声学特征并储存至声学模板库中。
5.如权利要求1至4任一项所述的语音识别设备语音切换方法,其特征在于,所述声学特征包括线性预测系数(LPC)、Mel倒谱系数(MFCC)、感知线性预测(PLP)中的至少一者。
6.一种语音识别设备语音切换装置,其特征在于,包括:
接收模块,用于接收用户输入的语音指令;
提取模块,用于提取所述语音指令的声学特征;
确定模块,用于根据所述语音指令的声学特征确定所述语音指令对应的语种类别;
控制模块,用于控制语音识别设备将语音播报的语种类别切换为所述语音指令对应的语种类别。
7.如权利要求6所述的语音识别设备语音切换装置,其特征在于,所述语音识别设备语音切换装置还包括:
判断模块,用于判断语音数据库中是否存在对应所述语种类别的语音数据包;
答复模块,用于当语音数据库中存在对应所述语种类别的语音数据包时,加载对应所述语种类别的语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复;当语音数据库中不存在对应所述语种类别的语音数据包时,加载默认语音数据包并根据预置规则控制语音识别设备对所述语音指令进行语音播报答复。
8.如权利要求6所述的语音识别设备语音切换装置,其特征在于,所述确定模块包括:
判断单元,用于判断声学模板库中是否存在与所述语音指令的声学特征匹配的预置声学特征;
设置单元,用于当声学模板库中存在与所述语音指令的声学特征匹配的预置声学特征时,将所述预置声学特征对应的语种类别设置为所述语音指令对应的语种类别;当声学模板库中不存在与所述语音指令的声学特征匹配的预置声学特征时,将默认语种类别设置为所述语音指令对应的语种类别。
9.如权利要求8所述的语音识别设备语音切换装置,其特征在于,所述语音识别设备语音切换装置还包括提取模块,所述提取模块用于提取不同语种语音样本的声学特征并储存至声学模板库中。
10.如权利要求6至9任一项所述的语音识别设备语音切换装置,其特征在于,所述声学特征包括线性预测系数(LPC)、Mel倒谱系数(MFCC)、感知线性预测(PLP)中的至少一者。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510008232.6A CN105825853A (zh) | 2015-01-07 | 2015-01-07 | 语音识别设备语音切换方法及装置 |
PCT/CN2015/082945 WO2016110068A1 (zh) | 2015-01-07 | 2015-06-30 | 语音识别设备语音切换方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510008232.6A CN105825853A (zh) | 2015-01-07 | 2015-01-07 | 语音识别设备语音切换方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105825853A true CN105825853A (zh) | 2016-08-03 |
Family
ID=56355465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510008232.6A Withdrawn CN105825853A (zh) | 2015-01-07 | 2015-01-07 | 语音识别设备语音切换方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105825853A (zh) |
WO (1) | WO2016110068A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106782561A (zh) * | 2016-12-09 | 2017-05-31 | 深圳Tcl数字技术有限公司 | 语音识别方法和*** |
CN108132824A (zh) * | 2017-12-26 | 2018-06-08 | 江苏木盟智能科技有限公司 | 一种机器人的语言参数切换方法、切换***和机器人 |
CN108899018A (zh) * | 2018-05-08 | 2018-11-27 | 深圳市沃特沃德股份有限公司 | 自动翻译装置及方法 |
CN109739466A (zh) * | 2018-12-29 | 2019-05-10 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN111128125A (zh) * | 2019-12-30 | 2020-05-08 | 深圳市优必选科技股份有限公司 | 语音服务配置***及其语音服务配置方法和装置 |
CN111312213A (zh) * | 2020-03-31 | 2020-06-19 | 广东美的制冷设备有限公司 | 空调器的语音处理方法、装置、空调器和可读存储介质 |
CN111338720A (zh) * | 2018-12-19 | 2020-06-26 | 上海博泰悦臻电子设备制造有限公司 | 语音播报的语言切换方法及终端 |
CN111508472A (zh) * | 2019-01-11 | 2020-08-07 | 华为技术有限公司 | 一种语种切换方法、装置及存储介质 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106375548A (zh) * | 2016-08-19 | 2017-02-01 | 深圳市金立通信设备有限公司 | 一种对语音信息处理的方法和终端 |
US11605378B2 (en) * | 2019-07-01 | 2023-03-14 | Lg Electronics Inc. | Intelligent gateway device and system including the same |
CN110580908A (zh) * | 2019-09-29 | 2019-12-17 | 出门问问信息科技有限公司 | 一种支持不同语种的命令词检测方法及设备 |
CN111554281B (zh) * | 2020-03-12 | 2023-11-07 | 厦门中云创电子科技有限公司 | 自动识别语种的车载人机交互方法、车载终端及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1197525A (zh) * | 1996-07-11 | 1998-10-28 | 数字语音(以色列)有限公司 | 交互式语言训练设备 |
JP2001043225A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | データ変更型言語処理装置 |
CN1474379A (zh) * | 2002-07-02 | 2004-02-11 | �ձ������ȷ湫˾ | 语音识别/响应***、语音/识别响应程序及其记录介质 |
US7555431B2 (en) * | 1999-11-12 | 2009-06-30 | Phoenix Solutions, Inc. | Method for processing speech using dynamic grammars |
CN103559879A (zh) * | 2013-11-08 | 2014-02-05 | 安徽科大讯飞信息科技股份有限公司 | 语种识别***中声学特征提取方法及装置 |
US20140365218A1 (en) * | 2013-06-07 | 2014-12-11 | Microsoft Corporation | Language model adaptation using result selection |
CN104239459A (zh) * | 2014-09-02 | 2014-12-24 | 百度在线网络技术(北京)有限公司 | 语音搜索方法、装置和*** |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5805771A (en) * | 1994-06-22 | 1998-09-08 | Texas Instruments Incorporated | Automatic language identification method and system |
US7076422B2 (en) * | 2003-03-13 | 2006-07-11 | Microsoft Corporation | Modelling and processing filled pauses and noises in speech recognition |
CN1707612B (zh) * | 2004-06-08 | 2010-11-17 | 深圳市朗科科技有限公司 | 一种视听播放装置及其播放方法 |
CN1959628A (zh) * | 2005-10-31 | 2007-05-09 | 西门子(中国)有限公司 | 一种人机交互导航*** |
CN101727901B (zh) * | 2009-12-10 | 2011-11-09 | 清华大学 | 嵌入式***的汉英双语语音识别方法 |
-
2015
- 2015-01-07 CN CN201510008232.6A patent/CN105825853A/zh not_active Withdrawn
- 2015-06-30 WO PCT/CN2015/082945 patent/WO2016110068A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1197525A (zh) * | 1996-07-11 | 1998-10-28 | 数字语音(以色列)有限公司 | 交互式语言训练设备 |
JP2001043225A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | データ変更型言語処理装置 |
US7555431B2 (en) * | 1999-11-12 | 2009-06-30 | Phoenix Solutions, Inc. | Method for processing speech using dynamic grammars |
CN1474379A (zh) * | 2002-07-02 | 2004-02-11 | �ձ������ȷ湫˾ | 语音识别/响应***、语音/识别响应程序及其记录介质 |
US20140365218A1 (en) * | 2013-06-07 | 2014-12-11 | Microsoft Corporation | Language model adaptation using result selection |
CN103559879A (zh) * | 2013-11-08 | 2014-02-05 | 安徽科大讯飞信息科技股份有限公司 | 语种识别***中声学特征提取方法及装置 |
CN104239459A (zh) * | 2014-09-02 | 2014-12-24 | 百度在线网络技术(北京)有限公司 | 语音搜索方法、装置和*** |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106782561A (zh) * | 2016-12-09 | 2017-05-31 | 深圳Tcl数字技术有限公司 | 语音识别方法和*** |
CN108132824A (zh) * | 2017-12-26 | 2018-06-08 | 江苏木盟智能科技有限公司 | 一种机器人的语言参数切换方法、切换***和机器人 |
CN108899018A (zh) * | 2018-05-08 | 2018-11-27 | 深圳市沃特沃德股份有限公司 | 自动翻译装置及方法 |
CN111338720A (zh) * | 2018-12-19 | 2020-06-26 | 上海博泰悦臻电子设备制造有限公司 | 语音播报的语言切换方法及终端 |
CN109739466A (zh) * | 2018-12-29 | 2019-05-10 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN111508472A (zh) * | 2019-01-11 | 2020-08-07 | 华为技术有限公司 | 一种语种切换方法、装置及存储介质 |
CN111508472B (zh) * | 2019-01-11 | 2023-03-03 | 华为技术有限公司 | 一种语种切换方法、装置及存储介质 |
CN111128125A (zh) * | 2019-12-30 | 2020-05-08 | 深圳市优必选科技股份有限公司 | 语音服务配置***及其语音服务配置方法和装置 |
CN111312213A (zh) * | 2020-03-31 | 2020-06-19 | 广东美的制冷设备有限公司 | 空调器的语音处理方法、装置、空调器和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2016110068A1 (zh) | 2016-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105825853A (zh) | 语音识别设备语音切换方法及装置 | |
US11854570B2 (en) | Electronic device providing response to voice input, and method and computer readable medium thereof | |
EP3039531B1 (en) | Display apparatus and controlling method thereof | |
US9280539B2 (en) | System and method for translating speech, and non-transitory computer readable medium thereof | |
US7840406B2 (en) | Method for providing an electronic dictionary in wireless terminal and wireless terminal implementing the same | |
CN114596861A (zh) | 针对问题和回答的显示装置和方法 | |
US20180211668A1 (en) | Reduced latency speech recognition system using multiple recognizers | |
US10535337B2 (en) | Method for correcting false recognition contained in recognition result of speech of user | |
US20140129223A1 (en) | Method and apparatus for voice recognition | |
CN107544271A (zh) | 终端控制方法、装置及计算机可读存储介质 | |
CN113127609A (zh) | 语音控制方法、装置、服务器、终端设备及存储介质 | |
CN104575499B (zh) | 移动终端的声控方法及移动终端 | |
CN108777808B (zh) | 基于显示终端的文本转语音方法、显示终端及存储介质 | |
US20160080558A1 (en) | Electronic device and method for displaying phone call content | |
KR20110010939A (ko) | 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법 | |
CN111696556A (zh) | 一种分析用户对话情绪方法、***、设备和存储介质 | |
CN103971683A (zh) | 语音控制方法、***及手持设备 | |
CN109741749B (zh) | 一种语音识别的方法和终端设备 | |
CN105323392A (zh) | 一种快速进入ivr菜单的方法及装置 | |
KR20140067687A (ko) | 대화형 음성인식이 가능한 차량 시스템 | |
CN104679737A (zh) | 基于移动终端的文本信息的翻译处理方法和移动终端 | |
KR102460516B1 (ko) | 언어 학습 평가 방법 | |
KR101450188B1 (ko) | 휴대용 단말기의 음성 제어 장치 및 방법 | |
CN111274828B (zh) | 基于留言的语言翻译方法、***、计算机程序和手持终端 | |
KR102666658B1 (ko) | 차량 및 그 제어방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20160803 |
|
WW01 | Invention patent application withdrawn after publication |