CN103440867A - 语音识别方法及*** - Google Patents

语音识别方法及*** Download PDF

Info

Publication number
CN103440867A
CN103440867A CN2013103350500A CN201310335050A CN103440867A CN 103440867 A CN103440867 A CN 103440867A CN 2013103350500 A CN2013103350500 A CN 2013103350500A CN 201310335050 A CN201310335050 A CN 201310335050A CN 103440867 A CN103440867 A CN 103440867A
Authority
CN
China
Prior art keywords
recognition result
clouds
local
identification engine
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013103350500A
Other languages
English (en)
Other versions
CN103440867B (zh
Inventor
朱国正
任严佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201310335050.0A priority Critical patent/CN103440867B/zh
Publication of CN103440867A publication Critical patent/CN103440867A/zh
Application granted granted Critical
Publication of CN103440867B publication Critical patent/CN103440867B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音识别方法及***,该方法包括:获取用户发送的语音信息;将所述语音信息分别发送给云端识别引擎和本地识别引擎,以使所述云端识别引擎和本地识别引擎分别对所述语音信息进行识别;如果先接收到所述云端识别引擎返回的云端识别结果,则输出所述云端识别结果;如果先接收到所述本地识别引擎的本地识别结果,并且所述本地识别结果对应的置信度大于设定的置信度区间上限,则输出所述本地识别结果。利用本发明,可以在网络不好或没有网络的情况下也能够为用户提供可靠的语音识别结果。

Description

语音识别方法及***
技术领域
本发明涉及语音识别技术领域,具体涉及一种语音识别方法及***。
背景技术
随着计算机科学与技术的日益发展,语音识别技术已经逐渐成熟。并被广泛用于手机、电视、车载等领域。以车载为例,由于人在开车时不能方便地用手操作界面,使得语音识别作为一种相对便捷的交互方式,使车载能够提供更多的功能。现有技术中,语音识别的模式通常为:接收用户的语音信息,与云端语音识别服务器建立连接,发送语音信息至服务器,由服务器对该信息进行识别,再返回识别结果至客户端。但移动设备上不一定有稳定的网络连接,在这种情况下云端返回可能经历较大的延迟,降低用户体验,甚至没有网络,导致云端识别根本不可用。
发明内容
本发明提供一种语音识别方法及***,可以在网络不好或没有网络的情况下也能够为用户提供可靠的语音识别结果。
为此,本发明提供如下技术方案:
一种语音识别方法,包括:
获取用户发送的语音信息;
将所述语音信息分别发送给云端识别引擎和本地识别引擎,以使所述云端识别引擎和本地识别引擎分别对所述语音信息进行识别;
如果先接收到所述云端识别引擎返回的云端识别结果,则输出所述云端识别结果;
如果先接收到所述本地识别引擎的本地识别结果,并且所述本地识别结果对应的置信度大于设定的置信度区间上限,则输出所述本地识别结果。
优选地,所述方法还包括:
如果所述置信度在所述置信度区间内,则依次在设定的等待时长内降低所述置信度区间上限;
如果在所述等待时长内接收到所述云端识别引擎返回的云端识别结果,则输出所述云端识别结果;
如果在所述等待时长内未接收到所述云端识别引擎返回的云端识别结果,并且所述本地识别结果对应的置信度大于降低后的置信度区间上限,则输出所述本地识别结果。
优选地,每次的等待时长相同或不同。
优选地,所述方法还包括:
如果降低所述置信度区间上限的次数超过设定的次数阈值后,所述本地识别结果对应的置信度仍然小于降低后的置信度区间下限,并且仍未收到所述云端识别结果,则向用户返回识别失败信息。
优选地,所述方法还包括:
如果先接收到所述本地识别结果,并且所述本地识别结果对应的置信度小于设定的置信度区间下限,则丢弃所述本地识别结果,继续等待所述云端识别引擎返回云端识别结果;
如果等待时间超过设定的阻塞时长,则向用户返回识别失败信息。
优选地,所述方法还包括:
接收到用户发送的语音识别请求后,开启云端识别引擎和本地识别引擎。
一种语音识别***,包括:
语音信息获取单元,用于获取用户发送的语音信息;
发送单元,用于将所述语音信息分别发送给云端识别引擎和本地识别引擎,以使所述云端识别引擎和本地识别引擎分别对所述语音信息进行识别;
接收单元,用于接收所述云端识别引擎返回的云端识别结果以及所述本地识别引擎的本地识别结果;
输出单元,用于在所述接收单元先接收到所述云端识别引擎返回的云端识别结果时,输出所述云端识别结果;在所述接收单元先接收到所述本地识别引擎的本地识别结果,并且所述本地识别结果对应的置信度大于设定的置信度区间上限时,输出所述本地识别结果。
优选地,所述***还包括:
置信度调整单元,用于在所述置信度在所述置信度区间内时,依次在设定的等待时长内降低所述置信度区间上限;
所述输出单元,还用于在所述等待时长内所述接收单元接收到所述云端识别引擎返回的云端识别结果时,输出所述云端识别结果;在所述等待时长内所述接收单元未接收到所述云端识别引擎返回的云端识别结果,并且所述本地识别结果对应的置信度大于降低后的置信度区间上限时,输出所述本地识别结果。
优选地,所述***还包括:
统计单元,用于统计所述置信度调整单元降低所述置信度区间上限的次数;
所述输出单元,还用于在所述次数超过设定的次数阈值后,如果本地识别结果对应的置信度仍然小于降低后的置信度区间下限,并且仍未收到所述云端识别结果,则向用户返回识别失败信息。
优选地,所述接收单元,还用于在先接收到所述本地识别结果,并且所述本地识别结果对应的置信度小于设定的置信度区间下限时,丢弃所述本地识别结果,继续等待所述云端识别引擎返回云端识别结果;并在等待时间超过设定的阻塞时长后,向用户返回识别失败信息。
优选地,所述***还包括:
触发单元,用于在接收到用户发送的语音识别请求后,开启云端识别引擎和本地识别引擎。
本发明实施例提供的语音识别方法及***,将本地识别与云端识别相结合,在接收到用户发送的语音信息后,将所述语音信息分别发送给云端识别引擎和本地识别引擎进行识别。并且在先接收到云端识别引擎返回的云端识别结果时,直接输出云端识别结果。如果先接收到本地识别引擎的本地识别结果,且本地识别结果对应的置信度大于设定的置信度区间上限时,则输出本地识别结果。并且坚持云端识别结果优于本地识别结果,如果云端识别能在本地识别提供一个相对准确的识别结果之前返回结果,则采用云端识别结果。从而可以在没有网络接入时完成利用本地识别引擎来完成无须网络的本地功能,如打电话、发短信、听音乐等等。
进一步地,如果先接收到的本地识别结果的置信度较低,在设置的置信度区间内,则通过不断地降低本地识别的置信度门限,直到有一个合格的输出或识别失败。
由于本发明实施例提供的方案将本地识别与云端识别相结合,可以保证在网络不好或没有网络的情况下尽可能地提供可靠的语音识别结果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本发明实施例语音识别方法的一种流程图;
图2是本发明实施例语音识别方法的另一种流程图;
图3是本发明实施例语音识别***的一种结构示意图;
图4是本发明实施例语音识别***的另一种结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
本发明实施例提供一种语音识别方法及***,结合云端识别和本地识别,可以在没有网络接入时完成利用本地识别引擎来完成无须网络的本地功能,如打电话、发短信、听音乐等等。也可以根据网络连接的延迟时间动态降低对本地引擎结果的要求。
如图1所示,是本发明实施例语音识别方法的一种流程图,包括以下步骤:
步骤101,获取用户发送的语音信息。
步骤102,将所述语音信息分别发送给云端识别引擎和本地识别引擎,以使所述云端识别引擎和本地识别引擎分别对所述语音信息进行识别。
具体地,可以用录音模块记录用户发送的语音信息。记录下来的语音信息可以直接发送给云端识别引擎和本地识别引擎;也可以先用语音检测模块过滤出有效的信息起止点,然后再发送给云端识别引擎和本地识别引擎。
步骤103,如果先接收到所述云端识别引擎返回的云端识别结果,则输出所述云端识别结果。
因为云端的服务器识别引擎性能强大,识别结果有较高的置信度,因此在优先接收到云端识别结果后,可以直接输出该识别结果。
步骤104,如果先接收到所述本地识别引擎的本地识别结果,并且所述本地识别结果对应的置信度大于设定的置信度区间上限,则输出所述本地识别结果。
由于在网络环境不好的情况下,云端的识别结果可能有相当大的延迟。此时,获取此语音信息所对应的本地识别结果和该结果的置信度值,如果该置信度值大于***设置的置信度门限,说明该识别结果是完全可用的,因此输出本地识别结果,无需再等待云端识别结果。
可见,本发明实施例提供的语音识别方法,将本地识别与云端识别相结合,根据云端识别结果和本地识别结果返回的先后、以及优先返回的本地识别结果的置信度来决定选用的识加结果。并始终坚持云端的结果优于本地,如果云端识别能在本地识别提供一个相对准确的识别之前返回结果,就采用云端的结果。
为了进一步解决网络延迟或网络不可用情况下也能够得到具有一定准确率的语音识别结果,本发明语音识别方法另一实施例还可以根据当前的网络状况动态调整本地识别的置信度门限,在最短的延迟时间输出最好的结果。
如图2所示,是本发明实施例语音识别方法的另一种流程图,包括以下步骤:
图2中的步骤201至步骤203与图1中的步骤101至步骤103相同,在此不再赘述。
步骤204,如果先接收到本地识别引擎的本地识别结果,则获取本地识别结果对应的置信度。
另外,在步骤204中,需要根据本地识别结果的置信度确定后续的处理操作,保证在最短的延迟时间内输出最好的结果。具体地,如果置信度小于设定的置信度区间下限,则执行步骤205;如果置信度在设定的置信度区间内,则执行步骤208;如果置信度大于设定的置信度区间上限,则执行步骤213。
步骤205,丢弃本地识别结果,继续等待云端识别引擎返回云端识别结果。
步骤206,判断等待时间是否超过设定的阻塞时长;如果是,则执行步骤207;否则继续等待。
步骤207,向用户返回识别失败信息。
步骤208,依次在设定的等待时长内降低所述置信度区间上限。
步骤209,判断在所述等待时长内是否接收到云端识别结果。如果是,则执行步骤210;否则,执行步骤211。
步骤210,输出云端识别结果。
步骤211,判断本地识别结果对应的置信度是否大于当前降低后的置信度区间上限。如果是,则执行步骤213;否则,执行步骤212。
步骤212,判断降低所述置信度区间上限的次数是否超过设定的次数阈值(比如可以是次数阈值可以为1至3等)。如果是,则执行步骤207;否则,返回步骤208。
步骤213,输出本地识别结果。
需要说明的是,上述步骤208中提到的等待时长是降低置信度区间上限的时间间隔,比如可以是2-5秒等,而且每次降低置信度区间上限的时间间隔可以相同,也可以不同。而上述步骤206中提到的等待时间与上述等待时长是两个不同的概念,所述等待时间是指等待接收到云端识别结果的时间,其起点可以是将所述语音信息分别发送给云端识别引擎和本地识别引擎开始计时,也可以是从丢弃本地识别结果后开始计时,对此本发明实施例不做限定。
另外,在实际应用中,在每次降低所述置信度区间上限后的一定时间内未接收到云端识别结果,而本地识别结果对应的置信度也不能满足要求的情况下,也可以不去判断降低所述置信度区间上限的次数是否超过设定的次数阈值,而是判断等待的时间是否超过限定的等待时间,如果超过,则向用户返回识别失败信息,以防止等待时间过长,影响用户体验。
由于云端具有强大的服务器处理能力和海量的语音数据比对,识别结果置信度高,而本地识别无须网络支持,有很高的识别速度和很广的适用范围,尤其适用一些无稳定网络连接的移动设备上。因此,本发明实施例的语音识别方法将本地识别与云端识别相结合,兼顾两者各自的优点,在获取到用户发送的语音信息后,将其同时发送给云端识别引擎和本地识别引擎进行识别。如果云端识别能在本地识别提供一个相对准确的识别之前返回结果,则采用云端识别结果。否则,不断地降低本地识别的置信度门限,直到有一个合格的输出或识别失败,因此可以保证在网络不好或没有网络的情况下尽可能的提供可靠的语音识别结果。
本发明实施例的语音识别方法,通过简单高效的本地识别引擎来满足网络不通时对本地命令的识别,另外,由于对云端和本地识别结果的取舍策略可以降低识别的延迟时间,可以根据当前的网络状况动态地调整本地识别的置信度门限,从而保证在最短的延迟时间输出最好的结果。
另外,需要说明的是,在实际应用中,可以在接收到用户发送的语音识别请求后,开启云端识别引擎和本地识别引擎。比如,所述语音识别请求可以在用户按下语音识别键时发送,或者向用户提供语音唤醒功能,在后台一直开启录音,在识别到特定关键字时发送。
对于本地识别引擎对特定关键字的识别可以采用一些常规的识别方法,比如,本地识别引擎读取事先定义好的语法文件,该文件定义了语音识别所支持的命令词的集合,而相同作用命令词的集合都存在词典里,本地识别引擎可以高效存取。本地识别引擎通过语法文件生成一个识别网络,本地识别引擎提取输入语音的特征信息并在识别网络上进行路径匹配,最终凡是用户说出这个语法文件定义范围内的任意一句话,均可以被***识别,从而识出所述特定关键字。
当然,对云端识别引擎及本地识别引擎具体采用哪种语音识别技术,本发明实施例不做限定,尤其是对本地识别引擎,可以根据具体应用场景需要来选择,都不会影响本发明所能达到的上述效果。
相应地,本发明实施例还提供一种语音识别***,如图3所示,是该***的一种结构示意图。
在该实施例中,所述***包括:
语音信息获取单元301,用于获取用户发送的语音信息。
发送单元302,用于将所述语音信息分别发送给云端识别引擎和本地识别引擎,以使所述云端识别引擎和本地识别引擎分别对所述语音信息进行识别。
接收单元303,用于接收所述云端识别引擎返回的云端识别结果以及所述本地识别引擎的本地识别结果。
输出单元304,用于在接收单元303先接收到所述云端识别引擎返回的云端识别结果时,输出所述云端识别结果;在接收单元303先接收到所述本地识别引擎的本地识别结果,并且所述本地识别结果对应的置信度大于设定的置信度区间上限时,输出所述本地识别结果。
本发明实施例提供的语音识别***,将本地识别与云端识别相结合,根据云端识别结果和本地识别结果返回的先后、以及优先返回的本地识别结果的置信度来决定选用的识加结果。并始终坚持云端的结果优于本地,如果云端识别能在本地识别提供一个相对准确的识别之前返回结果,就采用云端的结果。
为了进一步解决网络延迟或网络不可用情况下也能够得到具有一定准确率的语音识别结果,本发明语音识别***另一实施例还可以根据当前的网络状况动态调整本地识别的置信度门限,在最短的延迟时间输出最好的结果。
如图4所示,是本发明语音识别***另一实施例的结构示意图。
与图3所示实施例不同的是,在该实施例中,所述***还包括:
置信度调整单元401,用于在所述置信度在所述置信度区间内时,依次在设定的等待时长内降低所述置信度区间上限。
相应地,在该实施例中,所述输出单元304还用于在所述等待时长内接收单元303接收到所述云端识别引擎返回的云端识别结果时,输出所述云端识别结果;在所述等待时长内接收单元303未接收到所述云端识别引擎返回的云端识别结果,并且所述本地识别结果对应的置信度大于降低后的置信度区间上限时,输出所述本地识别结果。
另外,为了防止等待识别结果输出的时间过长,影响用户体验,如图4所示,该***还可进一步包括:统计单元402,用于统计所述置信度调整单元401降低所述置信度区间上限的次数。
相应地,输出单元304还可用于在所述统计单元401统计的次数超过设定的次数阈值后,如果本地识别结果对应的置信度仍然小于降低后的置信度区间下限,并且仍未收到所述云端识别结果,则向用户返回识别失败信息。
为了保证输出的本地识别结果的准确率,在上述图3和图4所示实施例中,所述的接收单元303还可用于在先接收到所述本地识别结果,并且所述本地识别结果对应的置信度小于设定的置信度区间下限时,丢弃所述本地识别结果,继续等待所述云端识别引擎返回云端识别结果;并在等待时间超过设定的阻塞时长后,向用户返回识别失败信息。当然,在实际应用中,也可以由接收单元303将上述情况通知输出单元304,而由输出单元304向用户返回识别失败信息。
另外,云端识别引擎和本地识别引擎的开启可以有不同的方式,比如,在上述各实施例中,所述***还可包括触发单元(未图示),用于在接收到用户发送的语音识别请求后,开启云端识别引擎和本地识别引擎。所述语音识别请求可以在用户按下语音识别键时发送,或者向用户提供语音唤醒功能,在后台一直开启录音,在识别到特定关键字时发送。
对于本地识别引擎对特定关键字的识别可以采用一些常规的识别方法,比如,本地识别引擎读取事先定义好的语法文件,该文件定义了语音识别所支持的命令词的集合,而相同作用命令词的集合都存在词典里,本地识别引擎可以高效存取。本地识别引擎通过语法文件生成一个识别网络,本地识别引擎提取输入语音的特征信息并在识别网络上进行路径匹配,最终凡是用户说出这个语法文件定义范围内的任意一句话,均可以被***识别,从而识出所述特定关键字。
当然,对云端识别引擎及本地识别引擎具体采用哪种语音识别技术,本发明实施例不做限定,尤其是对本地识别引擎,可以根据具体应用场景需要来选择,都不会影响本发明所能达到的上述效果。
通过上述描述可见,本发明实施例的语音识别***,通过简单高效的本地识别引擎来满足网络不通时对本地命令的识别,另外,由于对云端和本地识别结果的取舍策略可以降低识别的延迟时间,可以根据当前的网络状况动态地调整本地识别的置信度门限,从而保证在最短的延迟时间输出最好的结果。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,以上所描述的***实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本发明实施例进行了详细介绍,本文中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及设备;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种语音识别方法,其特征在于,包括:
获取用户发送的语音信息;
将所述语音信息分别发送给云端识别引擎和本地识别引擎,以使所述云端识别引擎和本地识别引擎分别对所述语音信息进行识别;
如果先接收到所述云端识别引擎返回的云端识别结果,则输出所述云端识别结果;
如果先接收到所述本地识别引擎的本地识别结果,并且所述本地识别结果对应的置信度大于设定的置信度区间上限,则输出所述本地识别结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述置信度在所述置信度区间内,则依次在设定的等待时长内降低所述置信度区间上限;
如果在所述等待时长内接收到所述云端识别引擎返回的云端识别结果,则输出所述云端识别结果;
如果在所述等待时长内未接收到所述云端识别引擎返回的云端识别结果,并且所述本地识别结果对应的置信度大于降低后的置信度区间上限,则输出所述本地识别结果。
3.根据权利要求2所述的方法,其特征在于,每次的等待时长相同或不同。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
如果降低所述置信度区间上限的次数超过设定的次数阈值后,所述本地识别结果对应的置信度仍然小于降低后的置信度区间下限,并且仍未收到所述云端识别结果,则向用户返回识别失败信息。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
如果先接收到所述本地识别结果,并且所述本地识别结果对应的置信度小于设定的置信度区间下限,则丢弃所述本地识别结果,继续等待所述云端识别引擎返回云端识别结果;
如果等待时间超过设定的阻塞时长,则向用户返回识别失败信息。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
接收到用户发送的语音识别请求后,开启云端识别引擎和本地识别引擎。
7.一种语音识别***,其特征在于,包括:
语音信息获取单元,用于获取用户发送的语音信息;
发送单元,用于将所述语音信息分别发送给云端识别引擎和本地识别引擎,以使所述云端识别引擎和本地识别引擎分别对所述语音信息进行识别;
接收单元,用于接收所述云端识别引擎返回的云端识别结果以及所述本地识别引擎的本地识别结果;
输出单元,用于在所述接收单元先接收到所述云端识别引擎返回的云端识别结果时,输出所述云端识别结果;在所述接收单元先接收到所述本地识别引擎的本地识别结果,并且所述本地识别结果对应的置信度大于设定的置信度区间上限时,输出所述本地识别结果。
8.根据权利要求7所述的***,其特征在于,所述***还包括:
置信度调整单元,用于在所述置信度在所述置信度区间内时,依次在设定的等待时长内降低所述置信度区间上限;
所述输出单元,还用于在所述等待时长内所述接收单元接收到所述云端识别引擎返回的云端识别结果时,输出所述云端识别结果;在所述等待时长内所述接收单元未接收到所述云端识别引擎返回的云端识别结果,并且所述本地识别结果对应的置信度大于降低后的置信度区间上限时,输出所述本地识别结果。
9.根据权利要求8所述的***,其特征在于,所述***还包括:
统计单元,用于统计所述置信度调整单元降低所述置信度区间上限的次数;
所述输出单元,还用于在所述次数超过设定的次数阈值后,如果本地识别结果对应的置信度仍然小于降低后的置信度区间下限,并且仍未收到所述云端识别结果,则向用户返回识别失败信息。
10.根据权利要求8所述的***,其特征在于,
所述接收单元,还用于在先接收到所述本地识别结果,并且所述本地识别结果对应的置信度小于设定的置信度区间下限时,丢弃所述本地识别结果,继续等待所述云端识别引擎返回云端识别结果;并在等待时间超过设定的阻塞时长后,向用户返回识别失败信息。
11.根据权利要求7至10任一项所述的***,其特征在于,所述***还包括:
触发单元,用于在接收到用户发送的语音识别请求后,开启云端识别引擎和本地识别引擎。
CN201310335050.0A 2013-08-02 2013-08-02 语音识别方法及*** Active CN103440867B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310335050.0A CN103440867B (zh) 2013-08-02 2013-08-02 语音识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310335050.0A CN103440867B (zh) 2013-08-02 2013-08-02 语音识别方法及***

Publications (2)

Publication Number Publication Date
CN103440867A true CN103440867A (zh) 2013-12-11
CN103440867B CN103440867B (zh) 2016-08-10

Family

ID=49694558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310335050.0A Active CN103440867B (zh) 2013-08-02 2013-08-02 语音识别方法及***

Country Status (1)

Country Link
CN (1) CN103440867B (zh)

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103730119A (zh) * 2013-12-18 2014-04-16 惠州市车仆电子科技有限公司 车载人机语音交互***
CN104536978A (zh) * 2014-12-05 2015-04-22 奇瑞汽车股份有限公司 识别语音数据的方法和装置
CN104681026A (zh) * 2013-11-27 2015-06-03 夏普株式会社 语音识别终端及***、服务器及其控制方法、非易失性存储介质
CN105118508A (zh) * 2015-09-14 2015-12-02 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN105551488A (zh) * 2015-12-15 2016-05-04 深圳Tcl数字技术有限公司 语音控制方法及***
CN105551494A (zh) * 2015-12-11 2016-05-04 奇瑞汽车股份有限公司 一种基于手机互联的车载语音识别***及识别方法
CN105824857A (zh) * 2015-01-08 2016-08-03 中兴通讯股份有限公司 一种语音搜索方法、装置及终端
CN105931639A (zh) * 2016-05-31 2016-09-07 杨若冲 一种支持多级命令词的语音交互方法
CN106228975A (zh) * 2016-09-08 2016-12-14 康佳集团股份有限公司 一种移动终端的语音识别***及方法
CN106328148A (zh) * 2016-08-19 2017-01-11 上汽通用汽车有限公司 基于本地和云端混合识别的自然语音识别方法、装置和***
CN106384594A (zh) * 2016-11-04 2017-02-08 湖南海翼电子商务股份有限公司 语音识别的车载终端及其方法
CN106558313A (zh) * 2016-11-16 2017-04-05 北京云知声信息技术有限公司 语音识别方法及装置
CN106782546A (zh) * 2015-11-17 2017-05-31 深圳市北科瑞声科技有限公司 语音识别方法与装置
CN106847291A (zh) * 2017-02-20 2017-06-13 成都启英泰伦科技有限公司 一种本地和云端相结合的语音识别***及方法
CN106910504A (zh) * 2015-12-22 2017-06-30 北京君正集成电路股份有限公司 一种基于语音识别的演讲提示方法及装置
CN107464567A (zh) * 2017-07-24 2017-12-12 深圳云知声信息技术有限公司 语音识别方法及装置
CN107564525A (zh) * 2017-10-23 2018-01-09 深圳北鱼信息科技有限公司 语音识别方法及装置
CN107785019A (zh) * 2017-10-26 2018-03-09 西安Tcl软件开发有限公司 车载设备及其语音识别方法、可读存储介质
CN108323234A (zh) * 2017-12-27 2018-07-24 深圳达闼科技控股有限公司 一种检测方法、检测设备及服务器
CN108401440A (zh) * 2017-08-21 2018-08-14 深圳前海达闼云端智能科技有限公司 一种物质检测方法及其装置、检测终端
CN108573706A (zh) * 2017-03-10 2018-09-25 北京搜狗科技发展有限公司 一种语音识别方法、装置及设备
CN108847219A (zh) * 2018-05-25 2018-11-20 四川斐讯全智信息技术有限公司 一种唤醒词预设置信度阈值调节方法及***
CN109869862A (zh) * 2019-01-23 2019-06-11 四川虹美智能科技有限公司 一种空调、一种空调的控制方法及一种空调***
CN110060668A (zh) * 2018-02-02 2019-07-26 上海华镇电子科技有限公司 一种语音识别控制中减少识别延时的***及方法
CN110148416A (zh) * 2019-04-23 2019-08-20 腾讯科技(深圳)有限公司 语音识别方法、装置、设备和存储介质
CN110223683A (zh) * 2019-05-05 2019-09-10 安徽省科普产品工程研究中心有限责任公司 语音交互方法及***
CN110265018A (zh) * 2019-07-01 2019-09-20 成都启英泰伦科技有限公司 一种连续发出的重复命令词识别方法
CN110299136A (zh) * 2018-03-22 2019-10-01 上海擎感智能科技有限公司 一种用于语音识别的处理方法及其***
CN110706711A (zh) * 2014-01-17 2020-01-17 微软技术许可有限责任公司 外源性大词汇量模型到基于规则的语音识别的合并
CN110970032A (zh) * 2018-09-28 2020-04-07 深圳市冠旭电子股份有限公司 一种音箱语音交互控制的方法及装置
CN111091819A (zh) * 2018-10-08 2020-05-01 蔚来汽车有限公司 语音识别装置和方法、语音交互***和方法
CN111261166A (zh) * 2020-01-15 2020-06-09 云知声智能科技股份有限公司 一种语音识别方法及装置
WO2020135160A1 (zh) * 2018-12-24 2020-07-02 深圳Tcl新技术有限公司 终端、语音服务器的确定方法和计算机可读存储介质
CN111477225A (zh) * 2020-03-26 2020-07-31 北京声智科技有限公司 语音控制方法、装置、电子设备及存储介质
CN112896048A (zh) * 2021-03-15 2021-06-04 中电科创智联(武汉)有限责任公司 一种基于手机互联和语音识别的车载环视显示***及方法
CN112905247A (zh) * 2021-01-25 2021-06-04 斑马网络技术有限公司 自动检测并切换语言的方法及装置、终端设备、存储介质
CN113053369A (zh) * 2019-12-26 2021-06-29 青岛海尔空调器有限总公司 智能家电的语音控制方法及装置、智能家电
CN113380254A (zh) * 2021-06-21 2021-09-10 紫优科技(深圳)有限公司 一种基于云计算和边缘计算的语音识别方法、设备及介质
CN113380253A (zh) * 2021-06-21 2021-09-10 紫优科技(深圳)有限公司 一种基于云计算和边缘计算的语音识别***、设备及介质
CN114446279A (zh) * 2022-02-18 2022-05-06 青岛海尔科技有限公司 语音识别方法、装置、存储介质及电子设备
CN114550719A (zh) * 2022-02-21 2022-05-27 青岛海尔科技有限公司 语音控制指令的识别方法和装置、存储介质
CN115410579A (zh) * 2022-10-28 2022-11-29 广州小鹏汽车科技有限公司 语音交互方法、语音交互装置、车辆和可读存储介质
US11817101B2 (en) 2013-09-19 2023-11-14 Microsoft Technology Licensing, Llc Speech recognition using phoneme matching

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1181684B1 (en) * 1999-03-26 2004-11-03 Scansoft, Inc. Client-server speech recognition
CN102496364A (zh) * 2011-11-30 2012-06-13 苏州奇可思信息科技有限公司 基于云端网络的交互式语音识别方法
CN102708865A (zh) * 2012-04-25 2012-10-03 北京车音网科技有限公司 语音识别方法、装置及***
CN103137129A (zh) * 2011-12-02 2013-06-05 联发科技股份有限公司 语音识别方法及电子装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1181684B1 (en) * 1999-03-26 2004-11-03 Scansoft, Inc. Client-server speech recognition
CN102496364A (zh) * 2011-11-30 2012-06-13 苏州奇可思信息科技有限公司 基于云端网络的交互式语音识别方法
CN103137129A (zh) * 2011-12-02 2013-06-05 联发科技股份有限公司 语音识别方法及电子装置
CN102708865A (zh) * 2012-04-25 2012-10-03 北京车音网科技有限公司 语音识别方法、装置及***

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11817101B2 (en) 2013-09-19 2023-11-14 Microsoft Technology Licensing, Llc Speech recognition using phoneme matching
CN104681026A (zh) * 2013-11-27 2015-06-03 夏普株式会社 语音识别终端及***、服务器及其控制方法、非易失性存储介质
CN103730119A (zh) * 2013-12-18 2014-04-16 惠州市车仆电子科技有限公司 车载人机语音交互***
CN110706711A (zh) * 2014-01-17 2020-01-17 微软技术许可有限责任公司 外源性大词汇量模型到基于规则的语音识别的合并
CN110706711B (zh) * 2014-01-17 2023-11-28 微软技术许可有限责任公司 外源性大词汇量模型到基于规则的语音识别的合并
CN104536978A (zh) * 2014-12-05 2015-04-22 奇瑞汽车股份有限公司 识别语音数据的方法和装置
CN105824857A (zh) * 2015-01-08 2016-08-03 中兴通讯股份有限公司 一种语音搜索方法、装置及终端
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN105118508A (zh) * 2015-09-14 2015-12-02 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN105118508B (zh) * 2015-09-14 2018-10-23 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN106782546A (zh) * 2015-11-17 2017-05-31 深圳市北科瑞声科技有限公司 语音识别方法与装置
CN105551494A (zh) * 2015-12-11 2016-05-04 奇瑞汽车股份有限公司 一种基于手机互联的车载语音识别***及识别方法
CN105551488A (zh) * 2015-12-15 2016-05-04 深圳Tcl数字技术有限公司 语音控制方法及***
CN106910504A (zh) * 2015-12-22 2017-06-30 北京君正集成电路股份有限公司 一种基于语音识别的演讲提示方法及装置
CN105931639B (zh) * 2016-05-31 2019-09-10 杨若冲 一种支持多级命令词的语音交互方法
CN105931639A (zh) * 2016-05-31 2016-09-07 杨若冲 一种支持多级命令词的语音交互方法
CN106328148A (zh) * 2016-08-19 2017-01-11 上汽通用汽车有限公司 基于本地和云端混合识别的自然语音识别方法、装置和***
CN106228975A (zh) * 2016-09-08 2016-12-14 康佳集团股份有限公司 一种移动终端的语音识别***及方法
CN106384594A (zh) * 2016-11-04 2017-02-08 湖南海翼电子商务股份有限公司 语音识别的车载终端及其方法
CN106558313A (zh) * 2016-11-16 2017-04-05 北京云知声信息技术有限公司 语音识别方法及装置
CN106847291A (zh) * 2017-02-20 2017-06-13 成都启英泰伦科技有限公司 一种本地和云端相结合的语音识别***及方法
CN108573706A (zh) * 2017-03-10 2018-09-25 北京搜狗科技发展有限公司 一种语音识别方法、装置及设备
CN107464567A (zh) * 2017-07-24 2017-12-12 深圳云知声信息技术有限公司 语音识别方法及装置
WO2019036849A1 (zh) * 2017-08-21 2019-02-28 深圳前海达闼云端智能科技有限公司 一种物质检测方法及其装置、检测终端
CN108401440A (zh) * 2017-08-21 2018-08-14 深圳前海达闼云端智能科技有限公司 一种物质检测方法及其装置、检测终端
CN107564525A (zh) * 2017-10-23 2018-01-09 深圳北鱼信息科技有限公司 语音识别方法及装置
CN107785019A (zh) * 2017-10-26 2018-03-09 西安Tcl软件开发有限公司 车载设备及其语音识别方法、可读存储介质
CN108323234A (zh) * 2017-12-27 2018-07-24 深圳达闼科技控股有限公司 一种检测方法、检测设备及服务器
CN110060668A (zh) * 2018-02-02 2019-07-26 上海华镇电子科技有限公司 一种语音识别控制中减少识别延时的***及方法
CN110299136A (zh) * 2018-03-22 2019-10-01 上海擎感智能科技有限公司 一种用于语音识别的处理方法及其***
CN108847219A (zh) * 2018-05-25 2018-11-20 四川斐讯全智信息技术有限公司 一种唤醒词预设置信度阈值调节方法及***
CN108847219B (zh) * 2018-05-25 2020-12-25 台州智奥通信设备有限公司 一种唤醒词预设置信度阈值调节方法及***
CN110970032A (zh) * 2018-09-28 2020-04-07 深圳市冠旭电子股份有限公司 一种音箱语音交互控制的方法及装置
CN111091819A (zh) * 2018-10-08 2020-05-01 蔚来汽车有限公司 语音识别装置和方法、语音交互***和方法
WO2020135160A1 (zh) * 2018-12-24 2020-07-02 深圳Tcl新技术有限公司 终端、语音服务器的确定方法和计算机可读存储介质
CN109869862A (zh) * 2019-01-23 2019-06-11 四川虹美智能科技有限公司 一种空调、一种空调的控制方法及一种空调***
CN110148416B (zh) * 2019-04-23 2024-03-15 腾讯科技(深圳)有限公司 语音识别方法、装置、设备和存储介质
CN110148416A (zh) * 2019-04-23 2019-08-20 腾讯科技(深圳)有限公司 语音识别方法、装置、设备和存储介质
CN110223683A (zh) * 2019-05-05 2019-09-10 安徽省科普产品工程研究中心有限责任公司 语音交互方法及***
CN110265018A (zh) * 2019-07-01 2019-09-20 成都启英泰伦科技有限公司 一种连续发出的重复命令词识别方法
CN110265018B (zh) * 2019-07-01 2022-03-04 成都启英泰伦科技有限公司 一种连续发出的重复命令词识别方法
CN113053369A (zh) * 2019-12-26 2021-06-29 青岛海尔空调器有限总公司 智能家电的语音控制方法及装置、智能家电
CN111261166A (zh) * 2020-01-15 2020-06-09 云知声智能科技股份有限公司 一种语音识别方法及装置
CN111477225A (zh) * 2020-03-26 2020-07-31 北京声智科技有限公司 语音控制方法、装置、电子设备及存储介质
CN111477225B (zh) * 2020-03-26 2021-04-30 北京声智科技有限公司 语音控制方法、装置、电子设备及存储介质
CN112905247A (zh) * 2021-01-25 2021-06-04 斑马网络技术有限公司 自动检测并切换语言的方法及装置、终端设备、存储介质
CN112896048A (zh) * 2021-03-15 2021-06-04 中电科创智联(武汉)有限责任公司 一种基于手机互联和语音识别的车载环视显示***及方法
CN113380253A (zh) * 2021-06-21 2021-09-10 紫优科技(深圳)有限公司 一种基于云计算和边缘计算的语音识别***、设备及介质
CN113380254A (zh) * 2021-06-21 2021-09-10 紫优科技(深圳)有限公司 一种基于云计算和边缘计算的语音识别方法、设备及介质
CN113380254B (zh) * 2021-06-21 2024-05-24 枣庄福缘网络科技有限公司 一种基于云计算和边缘计算的语音识别方法、设备及介质
CN114446279A (zh) * 2022-02-18 2022-05-06 青岛海尔科技有限公司 语音识别方法、装置、存储介质及电子设备
CN114550719A (zh) * 2022-02-21 2022-05-27 青岛海尔科技有限公司 语音控制指令的识别方法和装置、存储介质
CN115410579A (zh) * 2022-10-28 2022-11-29 广州小鹏汽车科技有限公司 语音交互方法、语音交互装置、车辆和可读存储介质
WO2024088085A1 (zh) * 2022-10-28 2024-05-02 广州小鹏汽车科技有限公司 语音交互方法、语音交互装置、车辆和可读存储介质

Also Published As

Publication number Publication date
CN103440867B (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
CN103440867A (zh) 语音识别方法及***
AU2019246868B2 (en) Method and system for voice activation
CN112272819B (zh) 被动唤醒用户交互设备的方法和***
CN111566730B (zh) 低功率设备中的语音命令处理
CN110459221B (zh) 多设备协同语音交互的方法和装置
CN107731231B (zh) 一种支持多云端语音服务的方法及一种存储设备
WO2018145130A1 (en) Voice assistant tracking and activation
CN107018228B (zh) 一种语音控制***、语音处理方法及终端设备
CN110709931B (zh) 用于音频模式识别的***和方法
CN104756473A (zh) 处理并发语音
CN104104790A (zh) 语音操控方法与移动终端装置
WO2014176894A1 (zh) 一种语音处理的方法和终端
CN105975063B (zh) 一种控制智能终端的方法和装置
CN105280180A (zh) 一种终端控制方法、装置、语音控制装置及终端
WO2013179555A1 (ja) 近距離無線通信装置
CN104049727A (zh) 一种移动终端与车载终端的相互控制方法
CN111179930A (zh) 实现驾驶过程中的智能语音交互的方法及***
CN108271096A (zh) 一种任务执行方法、装置、智能音箱及存储介质
CN112634872A (zh) 语音设备唤醒方法及装置
CN106713171B (zh) 服务器、基于延时队列的限流保护***及方法
US20220284888A1 (en) Method and apparatus for in-vehicle call, device, medium and product
CN111128166B (zh) 连续唤醒识别功能的优化方法和装置
CN111524512A (zh) 低延时开启one-shot语音对话的方法、***设备及低延时响应的语音交互装置
CN106445456A (zh) 导航功能的tts音频数据的传输方法及装置
CN115174724A (zh) 通话降噪方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666

Applicant after: Iflytek Co., Ltd.

Address before: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666

Applicant before: Anhui USTC iFLYTEK Co., Ltd.

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant