CN103117058B - 基于智能电视平台的多语音引擎切换***及方法 - Google Patents

基于智能电视平台的多语音引擎切换***及方法 Download PDF

Info

Publication number
CN103117058B
CN103117058B CN201210558320.XA CN201210558320A CN103117058B CN 103117058 B CN103117058 B CN 103117058B CN 201210558320 A CN201210558320 A CN 201210558320A CN 103117058 B CN103117058 B CN 103117058B
Authority
CN
China
Prior art keywords
speech
speech engine
module
engine
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210558320.XA
Other languages
English (en)
Other versions
CN103117058A (zh
Inventor
陈冠霖
赵波
刘贤洪
杨金峰
毕端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN201210558320.XA priority Critical patent/CN103117058B/zh
Publication of CN103117058A publication Critical patent/CN103117058A/zh
Application granted granted Critical
Publication of CN103117058B publication Critical patent/CN103117058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及智能电视软件平台,其公开了一种基于智能电视平台的多语音引擎切换方法,实现自动查找当前识别效率最高的语音引擎并进行切换,提升用户的语音交互体验。该方法可以概括为:当用户运行语音应用程序使用语音识别功能时,语音引擎选择模块通过语音应用接口获取采集到的语音数据,然后将语音数据发送给每一个语音引擎模块,记录并比较各个语音引擎模块返回识别结果的响应时间,选择响应时间最短的语音引擎模块进行切换。此外,本发明还公开了相应的切换***,适用于在智能电视中实现快速语音识别功能。

Description

基于智能电视平台的多语音引擎切换***及方法
技术领域
本发明涉及智能电视软件平台,具体的说,是涉及一种基于智能电视平台的多语音引擎切换***及方法。
背景技术
随着电视终端智能化、网络化的发展,智能电视可获取的内容得到了极大的丰富,功能也更加的多元化,电视的操控随之变得更加频繁和复杂。语音识别技术在智能电视上的应用大大简化了用户的操作过程,用户体验得到极大提高。由于语音识别需要占用巨大的***资源,智能电视目前一般都通过网络连接云端服务器来实现语音识别功能;
在服务器中用于实现语音识别功能的语音识别引擎由语音检测模块、特征提取模块和识别搜索模块组成;其中,语音检测模块的功能是进行语音信号的检测和与处理,电视将采集到的原始语音数据送入到该模块,语音信号数据需要在语音检测模块里转换成标准的数据格式(比如:8K,16bit);同时,利用高效的信号检测算法,判断出语音的起始点和终止点;特征提取模块收到检测后的语音数据流,从中提取得到语音信号的特征矢量流。语音特征是利用数字信号处理技术,从语音信号中提取最反应其本质属性的信息。在这个模块中,需要对语音信号进行预加重、分帧、加窗、品与变换、倒谱变换、差分等处理,最终得到数十维左右的特征矢量;识别搜索模块将收到的未知语音信号特征与引擎内的声学模型库、词典/字典和识别语法信息进行匹配,得到最适合未知语音特征的词序列。这个过程可以简单描述如下:通过检索词典/字典,可以将句子由词序列分解成音素的序列。这种音素的序列与声学模型相结合,就得到更反映其本质属性的声学模型单元序列信息。然后,将原始语音的特征矢量与所有可能的句子候选的声学模型单元序列的信息相互匹配,计算得到其匹配概率,从中挑选出具有最大后验概率的声学模型单元序列。通过该单元序列,可以得到与之对应的词序列,这就是引擎输出给电视的文字序列。
而由于服务器中存在多个语音识别引擎,如果单一的使用某一个固定引擎进行语音识别,不利于智能电视语音识别效率的提升,造成用户语音交互体验不好;因此,如何在多个语音识别引擎之间查找当前最有效率的语音识别引擎并进行切换是语音交互应用中一个亟待解决的问题。
发明内容
本发明所要解决的技术问题是:提出一种基于智能电视平台的多语音引擎切换***及方法,实现自动查找当前识别效率最高的语音引擎并进行切换,提升用户的语音交互体验。
本发明解决上述技术问题采用的方案是:基于智能电视平台的多语音引擎切换***,包括:语音引擎选择模块及至少两个语音引擎模块;所有的语音引擎模块由统一的语音引擎接口进行封装,并通过语音引擎接口连接语音引擎选择模块;所述语音引擎选择模块通过语音应用接口与语音应用程序相连。
进一步,所述语音引擎模块用于从语音引擎接口获取语音引擎选择模块传送的语音数据,并对语音数据进行识别,然后向语音引擎选择模块返回识别结果;所述语音引擎选择模块用于在语音应用程序使用语音识别功能时,通过语音应用接口获取采集到的语音数据,将语音数据通过语音引擎接口发送给每一个语音引擎模块,并接收所有语音引擎模块返回的识别结果,记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换,使得语音应用程序可以调用到识别效率最高的语音引擎模块。
进一步,所述选择响应时间最短的语音引擎模块进行切换是指:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。
此外,本发明还提出了一种相应的基于智能电视平台的多语音引擎切换方法,包括:
a.当用户运行语音应用程序使用语音识别功能时,语音引擎选择模块通过语音应用接口获取采集到的语音数据;
b.语音引擎选择模块将语音数据通过语音引擎接口发送给每一个语音引擎模块;
c.各个语音引擎模块对语音数据进行识别,然后向语音引擎选择模块返回识别结果;
d.语音引擎选择模块记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换。
进一步,步骤d中,所述选择响应时间最短的语音引擎模块进行切换是指:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。
本发明的有益效果是:通过对各个语音引擎模块返回识别结果的响应时间(即识别速度)进行对比,选择响应时间最短的语音引擎模块进行切换,使得语音应用程序可以调用到识别效率最高的语音引擎模块进行语音识别,从而提升了语音识别的整体识别效率;并且,由于语音应用程序与语音引擎选择模块之间的连接载体(语音应用接口)保持不变,当语音引擎模块发生切换时,语音应用程序无需关注具体是哪一个语音引擎模块发生切换,从而保证了语音识别的稳定性和延续性。
附图说明
图1为本发明中基于智能电视平台的多语音引擎切换***实现构架图;
图2为本发明中的基于智能电视平台的多语音引擎切换方法的流程图。
具体实施方式
本发明的实现原理是:由于***中各个语音引擎模块的性能差异,这些模块对语音数据的处理就有快有慢,因此,我们可以通过设置一个语音引擎选择模块来对各个语音引擎模块处理语音数据的响应时间进行记录和比较,从而找出处理时间最短、响应最快的语音引擎模块,然后切换至该语音引擎模块的连接即可,而语音引擎选择模块的引入由于其与语音应用程序之间的应用接口始终未发生改变,因此,同时还能解决***的稳定性问题。
参见图1,本发明中基于智能电视平台的多语音引擎切换***包括语音引擎选择模块及多个语音引擎模块;所有的语音引擎模块由统一的语音引擎接口进行封装,并通过语音引擎接口连接语音引擎选择模块;所述语音引擎选择模块通过语音应用接口与语音应用程序相连。
其中,所述语音引擎模块用于从语音引擎接口获取语音引擎选择模块传送的语音数据,并对语音数据进行识别,然后向语音引擎选择模块返回识别结果;所述语音引擎选择模块用于在语音应用程序使用语音识别功能时,通过语音应用接口获取采集到的语音数据,将语音数据通过语音引擎接口发送给每一个语音引擎模块,并接收所有语音引擎模块返回的识别结果,记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换,使得语音应用程序可以调用到识别效率最高的语音引擎模块。
图2给出了切换方法的相应流程,其包括以下实现步骤:
a.当用户运行语音应用程序使用语音识别功能时,语音引擎选择模块通过语音应用接口获取采集到的语音数据;该语音数据来源于智能电视的语音采集设备采集到得音源信号;
b.语音引擎选择模块将语音数据通过语音引擎接口发送给每一个语音引擎模块;由于采用了统一的语音引擎接口进行封装,每一个语音引擎模块都能同时收到同样的语音数据;
c.各个语音引擎模块对语音数据进行识别,然后向语音引擎选择模块返回识别结果;
d.语音引擎选择模块记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。此后,语音应用程序都可以通过调用该响应时间最短的语音引擎模块实现快速的语音识别,提升用户的语音交互体验。

Claims (2)

1.基于智能电视平台的多语音引擎切换***,其特征在于,包括:语音引擎选择模块及至少两个语音引擎模块;所有的语音引擎模块由统一的语音引擎接口进行封装,并通过语音引擎接口连接语音引擎选择模块;所述语音引擎选择模块通过语音应用接口与语音应用程序相连;
所述语音引擎模块用于从语音引擎接口获取语音引擎选择模块传送的语音数据,并对语音数据进行识别,然后向语音引擎选择模块返回识别结果;所述语音引擎选择模块用于在语音应用程序使用语音识别功能时,通过语音应用接口获取采集到的语音数据,将语音数据通过语音引擎接口发送给每一个语音引擎模块,并接收所有语音引擎模块返回的识别结果,记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换,使得语音应用程序可以调用到识别效率最高的语音引擎模块;
所述选择响应时间最短的语音引擎模块进行切换是指:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。
2.基于智能电视平台的多语音引擎切换方法,应用在如权利要求1所述的***中,其特征在于,包括:
a.当用户运行语音应用程序使用语音识别功能时,语音引擎选择模块通过语音应用接口获取采集到的语音数据;
b.语音引擎选择模块将语音数据通过语音引擎接口发送给每一个语音引擎模块;
c.各个语音引擎模块对语音数据进行识别,然后向语音引擎选择模块返回识别结果;
d.语音引擎选择模块记录各个语音引擎模块返回识别结果的响应时间并进行对比,选择响应时间最短的语音引擎模块进行切换;
步骤d中,所述选择响应时间最短的语音引擎模块进行切换是指:语音引擎选择模块通过语音引擎接口连接到响应时间最短的语音引擎模块,同时断开与其它语音引擎模块的连接。
CN201210558320.XA 2012-12-20 2012-12-20 基于智能电视平台的多语音引擎切换***及方法 Active CN103117058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210558320.XA CN103117058B (zh) 2012-12-20 2012-12-20 基于智能电视平台的多语音引擎切换***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210558320.XA CN103117058B (zh) 2012-12-20 2012-12-20 基于智能电视平台的多语音引擎切换***及方法

Publications (2)

Publication Number Publication Date
CN103117058A CN103117058A (zh) 2013-05-22
CN103117058B true CN103117058B (zh) 2015-12-09

Family

ID=48415416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210558320.XA Active CN103117058B (zh) 2012-12-20 2012-12-20 基于智能电视平台的多语音引擎切换***及方法

Country Status (1)

Country Link
CN (1) CN103117058B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336687B (zh) * 2013-06-17 2016-09-14 深圳市金立通信设备有限公司 一种应用界面的切换方法及终端
CN103714814A (zh) * 2013-12-11 2014-04-09 四川长虹电器股份有限公司 一种语音识别引擎语音对接方法
CN104795069B (zh) * 2014-01-21 2020-06-05 腾讯科技(深圳)有限公司 语音识别方法和服务器
CN105609102B (zh) * 2014-11-21 2021-03-16 中兴通讯股份有限公司 一种语音引擎参数配置方法和装置
CN107018228B (zh) * 2016-01-28 2020-03-31 中兴通讯股份有限公司 一种语音控制***、语音处理方法及终端设备
CN107526512B (zh) * 2017-08-31 2020-11-20 联想(北京)有限公司 用于电子设备的切换方法和***
CN107657031A (zh) * 2017-09-28 2018-02-02 四川长虹电器股份有限公司 基于Android***管理智能音箱语音技能的方法
CN109036427B (zh) * 2018-09-25 2021-01-26 苏宁智能终端有限公司 一种动态配置语音识别服务的方法及***
CN111179934A (zh) * 2018-11-12 2020-05-19 奇酷互联网络科技(深圳)有限公司 选择语音引擎的方法、移动终端和计算机可读存储介质
CN109410926A (zh) * 2018-11-27 2019-03-01 恒大法拉第未来智能汽车(广东)有限公司 语音语义识别方法及***
CN109493862B (zh) * 2018-12-24 2021-11-09 深圳Tcl新技术有限公司 终端、语音服务器的确定方法和计算机可读存储介质
CN109949816A (zh) * 2019-02-14 2019-06-28 安徽云之迹信息技术有限公司 机器人语音处理方法及装置、云端服务器
CN109947651B (zh) * 2019-03-21 2022-08-02 上海智臻智能网络科技股份有限公司 人工智能引擎优化方法和装置
CN110708365A (zh) * 2019-09-23 2020-01-17 杭州迪普科技股份有限公司 一种数据接收器的选择方法和装置
CN113450785B (zh) * 2020-03-09 2023-12-19 上海擎感智能科技有限公司 车载语音处理的实现方法、***、介质及云端服务器
CN113593535B (zh) * 2021-06-30 2024-05-24 青岛海尔科技有限公司 语音数据的处理方法及装置、存储介质、电子装置
CN114446279A (zh) * 2022-02-18 2022-05-06 青岛海尔科技有限公司 语音识别方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1323435A (zh) * 1998-10-02 2001-11-21 国际商业机器公司 提供网络协同会话服务的***和方法
CN1429019A (zh) * 2001-12-18 2003-07-09 松下电器产业株式会社 装有声音识别功能的电视机及其控制方法
CN1633679A (zh) * 2001-12-29 2005-06-29 摩托罗拉公司 用于多级分布式语音识别的方法和装置
CN1723487A (zh) * 2002-12-13 2006-01-18 摩托罗拉公司 用于选择性语音识别的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6480819B1 (en) * 1999-02-25 2002-11-12 Matsushita Electric Industrial Co., Ltd. Automatic search of audio channels by matching viewer-spoken words against closed-caption/audio content for interactive television

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1323435A (zh) * 1998-10-02 2001-11-21 国际商业机器公司 提供网络协同会话服务的***和方法
CN1429019A (zh) * 2001-12-18 2003-07-09 松下电器产业株式会社 装有声音识别功能的电视机及其控制方法
CN1633679A (zh) * 2001-12-29 2005-06-29 摩托罗拉公司 用于多级分布式语音识别的方法和装置
CN1723487A (zh) * 2002-12-13 2006-01-18 摩托罗拉公司 用于选择性语音识别的方法和装置

Also Published As

Publication number Publication date
CN103117058A (zh) 2013-05-22

Similar Documents

Publication Publication Date Title
CN103117058B (zh) 基于智能电视平台的多语音引擎切换***及方法
CN103093755B (zh) 基于终端及互联网语音交互的网络家电控制方法及***
US20240028841A1 (en) Speech translation method, device, and storage medium
CN102855872A (zh) 基于终端及互联网语音交互的家电控制方法及***
CN102855874B (zh) 基于互联网语音交互的家电控制方法及***
CN102831892B (zh) 基于互联网语音交互的玩具控制方法及***
CN110473546B (zh) 一种媒体文件推荐方法及装置
US20190355354A1 (en) Method, apparatus and system for speech interaction
WO2020238209A1 (zh) 音频处理的方法、***及相关设备
US11457061B2 (en) Creating a cinematic storytelling experience using network-addressable devices
CN104867492A (zh) 智能交互***及方法
US11244686B2 (en) Method and apparatus for processing speech
CN102196207A (zh) 语音控制电视机的方法、装置和***
CN107018228B (zh) 一种语音控制***、语音处理方法及终端设备
CN103730115A (zh) 一种语音中检测关键词的方法和装置
JP2019091429A (ja) 情報処理方法および装置
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
CN102847325A (zh) 基于移动通讯终端语音交互的玩具控制方法及***
CN113889113A (zh) 分句方法、装置、存储介质及电子设备
KR20190115405A (ko) 검색 방법 및 이 방법을 적용하는 전자 장치
CN103095927A (zh) 基于移动通讯终端及眼镜的显示及语音输出方法及***
CN111833857A (zh) 语音处理方法、装置和分布式***
EP3059731A1 (en) Method and apparatus for automatically sending multimedia file, mobile terminal, and storage medium
CN113936655A (zh) 语音播报处理方法、装置、计算机设备和存储介质
CN110619876A (zh) 一种基于输电移动应用的语音处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant