CN106340297A - 一种基于云计算与置信度计算的语音识别方法与*** - Google Patents
一种基于云计算与置信度计算的语音识别方法与*** Download PDFInfo
- Publication number
- CN106340297A CN106340297A CN201610840519.XA CN201610840519A CN106340297A CN 106340297 A CN106340297 A CN 106340297A CN 201610840519 A CN201610840519 A CN 201610840519A CN 106340297 A CN106340297 A CN 106340297A
- Authority
- CN
- China
- Prior art keywords
- speech recognition
- clouds
- voice
- different
- confidence level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000011156 evaluation Methods 0.000 claims abstract description 11
- 238000011946 reduction process Methods 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 14
- 230000009467 reduction Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 5
- 235000013399 edible fruits Nutrition 0.000 claims description 2
- 238000012549 training Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013178 mathematical model Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于云计算与置信度计算的语音识别方法,涉及语音识别的技术领域,包含以下步骤:S1、本地语音识别***和云端语音识别***分别接收语音信号;S2、本地语音识别***得出本地语音识别结果,云端语音识别***得出云端语音识别结果;S31、对本地语音识别结果进行置信度评测,得出本地语音识别结果的置信度;S32、对云端语音识别结果进行置信度评测,得出云端语音识别结果的置信度;S4、将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,输出置信度较高的语音识别结果。本发明还公开了一种基于云计算与置信度计算的语音识别***。本发明采用云端与本地语音识别相结合的方法,可提高语音识别的质量。
Description
技术领域
本发明涉及语音识别的技术领域,具体涉及一种基于云计算与置信度计算的语音识别方法与***。
背景技术
随着科学的进步和技术的发展,语音识别技术已经日趋成熟,正逐步成为信息技术中人机接口的关键技术。多种语音识别算法使得语音识别无论是识别率还是识别效率上都有较大提升。近年来,语音识别技术也逐渐被普遍使用于各个领域。然而,传统的语音识别技术大多采用本地语音识别软件进行语音识别,这样就导致软件内的语音识别算法是无法改变的。而不同的语音识别算法对于不同的语音输入环境的语音识别效果势必会有差异。例如在复杂噪声环境中,具有各种来源的噪声。这样的噪声环境下,原来运行良好的语音识别***的识别率可能会受到较大影响。若软件采用模板训练的方法,由于训练样本和样本库特征的失配,则软件的识别性能将会急剧下降,现有语音识别***的缺点在于随着环境的改变其语音识别性能也会急剧下降,其适应性和适用性不高,无法满足多种情况下的语音识别需求。因此,如何让语音识别***具有广泛的应用性与适用性就显得尤为重要。
中国专利申请CN201310163915.X公开了一种语音识别设备的更新方法、装置及***,包括:接收语音输入信号;利用本地语音识别设备对语音输入信号进行语音识别,获得本地语音识别结果;从本地语音识别结果和云端语音识别结果中获取最优识别结果作为最终语音识别结果,其中云端语音识别结果是在本地语音设备对语音输入信号进行语音识别的同时,利用云端语音识别设备对语音输入信号进行语音识别获得的;结合获取的用户反馈信息以及最终语音识别结果确定本地语音识别结果的可靠性是否满足要求;当确定本地语音识别结果的可靠性不满足要求时,利用云端语音识别设备对本地语音识别设备进行更新。该专利申请公开的技术方案中应用了云端语音识别设备进行语音识别,然而对语音识别效果的提升不明显,并且需结合用户的反馈信息确定语音识别结果的可靠性,需要用户进行结果选择,使用户的操作步骤更加繁琐,不利于提升使用体验。
发明内容
针对现有技术的不足,本发明的目的旨在提供一种基于云计算与置信度计算的语音识别方法与***,采用云计算方式进行语音识别与本地语音识别相结合的方法,使得语音识别设备或***能够有效地适应多种语音输入环境,提高语音识别的质量。
为实现上述目的,本发明采用如下技术方案:
一种基于云计算与置信度计算的语音识别方法,包含有以下步骤:
S1、本地语音识别***和云端语音识别***分别接收语音信号;
S2、本地语音识别***得出本地语音识别结果,云端语音识别***得出云端语音识别结果;
S31、对本地语音识别结果进行置信度评测,得出本地语音识别结果的置信度;
S32、对云端语音识别结果进行置信度评测,得出云端语音识别结果的置信度;
S4、将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,将置信度较高的语音识别结果进行输出。
进一步地,云端语音识别***中设置有不同的语音识别模型,步骤S2中云端语音识别***基于不同的语音识别模型得出不同的拟云端语音识别结果,步骤S32的内容包含有:
S321、对不同的拟云端语音识别结果进行置信度评测,得出对应于不同拟云端语音识别结果的置信度;
S322、将对应于不同拟云端语音识别结果的置信度进行比较,将置信度最高的拟云端语音识别结果作为云端语音识别结果进行输出。
进一步地,不同的语音识别模型包括基于不同的语音识别算法而建立的语音识别模型、也包括基于不同的语音识别算法组合而建立的语音识别模型,不同的语音识别模型对应于不同的语音输入环境。
进一步地,在进行步骤S2之前、先进行步骤S20:
S20、本地语音识别***和云端语音识别***分别对接收的语音信号进行降噪处理。
进一步地,步骤S20中,云端语音识别***使用不同的语音降噪模型对语音信号进行降噪处理,该不同的语音降噪模型基于不同的语音输入环境建立,该不同的语音降噪模型和不同的语音识别模型一一对应,云端语音识别***将完成降噪处理的语音信号传送至对应于同一语音输入环境的语音识别模型。
一种基于云计算与置信度计算的语音识别***,包含有:
本地语音识别***,用于接收语音信号、并得出本地语音识别结果;
云端语音识别***,用于接收语音信号、并得出云端语音识别结果;
置信度评测模块,使用置信度算法对本地语音识别结果和云端语音识别结果进行置信度评测;
数据处理模块,将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,并输出置信度较高的语音识别结果。
进一步地,云端语音识别***中包含有不同的云端语音识别子模块:
云端语音识别***中,不同的云端语音识别子模块中包含有不同的语音识别模型,云端语音识别子模块用于接收语音信号并得出拟云端语音识别结果;
置信度评测模块,使用置信度算法对本地语音识别结果和拟云端语音识别结果进行置信度评测;
数据处理模块,将不同的云端语音识别子模块输出的拟云端语音识别结果的置信度进行比较,将置信度最高的拟云端语音识别结果作为云端语音识别结果;将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,并输出置信度较高的语音识别结果。
进一步地,不同的语音识别模型包括基于不同的语音识别算法而建立的语音识别模型、也包括基于不同的语音识别算法组合而建立的语音识别模型,不同的语音识别模型对应于不同的语音输入环境。
进一步地,还包括有本地语音降噪模块和云端语音降噪模块,本地语音降噪模块用于对语音信号进行降噪处理、再将完成降噪处理的语音信号传送至本地语音识别***,云端语音降噪模块用于对语音信号进行降噪处理、再将完成降噪处理的语音信号传送至云端语音识别***。
进一步地,云端语音降噪模块中包含有不同的云端语音降噪子模块,不同的云端语音降噪子模块中包含有不同的语音降噪模型,该不同的语音降噪模型基于不同的语音输入环境而建立,该不同的语音降噪模型与不同的语音识别模型一一对应。
本发明的有益效果在于:采用云端语音识别***与本地语音识别***同步识别语音,其中云端语音识别***是包含有多种对应于不同输入环境的语音识别模型,从各种语音识别结果中择优输出,从而使得语音识别设备或***能够有效地适应多种语音输入环境,有效提高语音识别的质量;采用置信度算法对各种语音识别结果进行评价,提高语音识别结果的可靠性;置信度估值中综合了传统语音识别***中未被充分利用的信息,从而减小语音识别***的熵值,更准确地判断识别结果的正误,从而提高语音识别的***性能。
附图说明
图1是本发明中基于云计算与置信度计算的语音识别方法的流程图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述:
实施例1
如图1所示,一种基于云计算与置信度计算的语音识别方法,包含有以下步骤:
S1、本地语音识别***和云端语音识别***分别接收语音信号;
S20、本地语音识别***和云端语音识别***分别对接收的语音信号进行降噪处理,其中云端语音识别***使用不同的语音降噪模型对语音信号进行降噪处理,该不同的语音降噪模型基于不同的语音输入环境建立;
S2、本地语音识别***得出本地语音识别结果,云端语音识别***基于不同的语音识别模型得出不同的云端语音识别结果,该不同的语音识别模型包括基于不同的语音识别算法而建立的语音识别模型、也包括基于不同的语音识别算法组合而建立的语音识别模型,不同的语音识别模型对应于不同的语音输入环境,不同的语音降噪模型和不同的语音识别模型一一对应,不同的语音降噪模型将完成降噪处理的语音信号传送至对应的语音识别模型;
S31、对本地语音识别结果进行置信度评测,得出本地语音识别结果的置信度;
S321、对不同的拟云端语音识别结果进行置信度评测,得出对应于不同拟云端语音识别结果的置信度;
S322、将对应于不同拟云端语音识别结果的置信度进行比较,将置信度最高的拟云端语音识别结果作为云端语音识别结果进行输出;
S4、当本地语音识别结果的置信度低于设定值则直接输出云端语音识别结果;若本地语音识别结果的置信度达到设定值,将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,将置信度较高的语音识别结果进行输出。
实施例2
一种基于云计算与置信度计算的语音识别***,包含有:
本地语音降噪模块,用于对语音信号进行降噪处理、再将完成降噪处理的语音信号传送至本地语音识别***;
云端语音降噪模块,包含有不同的云端语音降噪子模块,不同的云端语音降噪子模块中包含有不同的语音降噪模型,该不同的语音降噪模型基于不同的语音输入环境而建立,该不同的语音降噪模型与不同的语音识别模型一一对应,用于对语音信号进行降噪处理、再将完成降噪处理的语音信号传送至云端语音识别***;
本地语音识别***,用于接收来自本地语音降噪模块的语音信号、并得出本地语音识别结果;
云端语音识别***,包含有不同的云端语音识别子模块,不同的云端语音识别子模块中包含有不同的语音识别模型,该不同的语音识别模型包括基于不同的语音识别算法而建立的语音识别模型、也包括基于不同的语音识别算法组合而建立的语音识别模型,不同的语音识别模型对应于不同的语音输入环境,不同的语音降噪模型和不同的语音识别模型一一对应,不同的语音识别模块接收来自对应语音降噪模型的语音信息并得出拟云端语音识别结果;
置信度评测模块,使用置信度算法对本地语音识别结果和拟云端语音识别结果进行置信度评测;
数据处理模块,将不同的云端语音识别子模块输出的拟云端语音识别结果的置信度进行比较,将置信度最高的拟云端语音识别结果作为云端语音识别结果;将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,并输出置信度较高的语音识别结果。
实施例3
基于实施例1中基于云计算与置信度计算的语音识别方法、或基于实施例2中基于云计算与置信度计算的语音识别***,本实施例中不同的语音识别算法包括模板匹配算法、概率模型算法和人工神经网络算法,其中:
模板匹配算法,在训练阶段中提取出能充分描述语音信号特征的特征矢量并形成特征矢量序列,并进行优化,得出一个特征矢量集合来表述特征矢量序列,以该特征矢量集合作为模板;在应用时,提取出待识别语音的特征矢量,并形成待识别语音的特征矢量序列,将待识别语音的特征矢量序列与模板的特征矢量序列进行对比,并将匹配程度最高的模板对应的语音信号作为基于模板匹配算法的语音识别结果;
概率模型算法,在训练阶段中提取出能充分描述语音信号特征的特征矢量,根据该特征矢量在特征空间中的分布规律形成数学模型;在应用时,提取出待识别语音的特征矢量,将待识别语音特征矢量在特征空间的分布规律与数学模型进行对比,计算出相似度,并将相似度最高对应的数学模型对应的语音信号作为基于概率模型算法的语音识别结果。
实施例4
基于实施例1中基于云计算与置信度计算的语音识别方法、或基于实施例2中基于云计算与置信度计算的语音识别***,本实施例中用于建立置信度估值模型的信息包括:1)Viterbi译码信息和隐含马尔可夫模型(HMM)的迹(trace):状态对准信息,状态驻留时间(段长),似然度;2)对备选假设H1和反词模型的建模;3)竞争候选结果所构成的在线垃圾模型;4)对误识和词表外发音建立的明确垃圾模型或补白模型;5)词格密度。置信度估值模型对语音信息的综合可以分成基于规则的综合和基于统计模型的综合,其中基于规则的综合即在不同的识别阶段应用不同的信息源对置信度进行分别估计,其着重点在于经验的总结、规则的形成和调整;统计模型包括有线性模型和广义线性模型:
定义事件A发生的偶然性为所有信息的集合为X,
q(Ci=1/X)是对真实概率p(Ci=1/X)的估计,则置信度的线性模型为:
其中,xi为X的组成部分,即xi∈X;Ci为置信度标签:Ci=0(识别错误);Ci=1(识别正确)。置信度的广义线性模型为:
另,定义Wj(t)为搜索过程中到达状态j的前t观测量(第t帧)的最佳得分,Γi(Ot)为第t帧状态i的置信度得分:
其中,logVik(k=1,2,3)分别代表似然度、段长和似然比3类信息:
logVi2(Ot)=k2logW(d),
logVi3(Ot)=k3logW(CM),
其中,aij和bj(Ot)分别为语音识别模型的转移概率和输出概率,ki表示对不同特征信息的加权系数,W(CM)为似然比信息,W(CM)的计算方法:
设对数似然比为角标c和a分别代表该语音识别模型和某种相反语音识别模型,则有:
其中,T为正常数,U为常数,W(CM)的值必然在0~1之间。若当前语音识别模型的似然度比相反模型的似然度高时,LLR>0,接近1;反之接近于0。T和U用来控制函数的衰减和位置,其值通过实验进行确定。
通过上面方法可以分别计算出不同层次上(如音素、音节、整字和整词)的置信度估值。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
Claims (10)
1.一种基于云计算与置信度计算的语音识别方法,其特征在于,包含有以下步骤:
S1、本地语音识别***和云端语音识别***分别接收语音信号;
S2、本地语音识别***得出本地语音识别结果,云端语音识别***得出云端语音识别结果;
S31、对本地语音识别结果进行置信度评测,得出本地语音识别结果的置信度;
S32、对云端语音识别结果进行置信度评测,得出云端语音识别结果的置信度;
S4、将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,将置信度较高的语音识别结果进行输出。
2.如权利要求1所述的基于云计算与置信度计算的语音识别方法,其特征在于,云端语音识别***中设置有不同的语音识别模型,步骤S2中云端语音识别***基于不同的语音识别模型得出不同的拟云端语音识别结果,步骤S32的内容包含有:
S321、对不同的拟云端语音识别结果进行置信度评测,得出对应于不同拟云端语音识别结果的置信度;
S322、将对应于不同拟云端语音识别结果的置信度进行比较,将置信度最高的拟云端语音识别结果作为云端语音识别结果进行输出。
3.如权利要求2所述的基于云计算与置信度计算的语音识别方法,其特征在于,不同的语音识别模型包括基于不同的语音识别算法而建立的语音识别模型、也包括基于不同的语音识别算法组合而建立的语音识别模型,不同的语音识别模型对应于不同的语音输入环境。
4.如权利要求3所述的基于云计算与置信度计算的语音识别方法,其特征在于,在进行步骤S2之前、先进行步骤S20:
S20、本地语音识别***和云端语音识别***分别对接收的语音信号进行降噪处理。
5.如权利要求4所述的基于云计算与置信度计算的语音识别方法,其特征在于,步骤S20中,云端语音识别***使用不同的语音降噪模型对语音信号进行降噪处理,该不同的语音降噪模型基于不同的语音输入环境建立,该不同的语音降噪模型和不同的语音识别模型一一对应,云端语音识别***将完成降噪处理的语音信号传送至对应于同一语音输入环境的语音识别模型。
6.一种基于云计算与置信度计算的语音识别***,其特征在于,包含有:
本地语音识别***,用于接收语音信号、并得出本地语音识别结果;
云端语音识别***,用于接收语音信号、并得出云端语音识别结果;
置信度评测模块,使用置信度算法对本地语音识别结果和云端语音识别结果进行置信度评测;
数据处理模块,将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,并输出置信度较高的语音识别结果。
7.如权利要求6所述的基于云计算与置信度计算的语音识别***,其特征在于,云端语音识别***中包含有不同的云端语音识别子模块:
云端语音识别***中,不同的云端语音识别子模块中包含有不同的语音识别模型,云端语音识别子模块用于接收语音信号并得出拟云端语音识别结果;
置信度评测模块,使用置信度算法对本地语音识别结果和拟云端语音识别结果进行置信度评测;
数据处理模块,将不同的云端语音识别子模块输出的拟云端语音识别结果的置信度进行比较,将置信度最高的拟云端语音识别结果作为云端语音识别结果;将本地语音识别结果的置信度与云端语音识别结果的置信度进行比较,并输出置信度较高的语音识别结果。
8.如权利要求7所述的基于云计算与置信度计算的语音识别***,其特征在于,不同的语音识别模型包括基于不同的语音识别算法而建立的语音识别模型、也包括基于不同的语音识别算法组合而建立的语音识别模型,不同的语音识别模型对应于不同的语音输入环境。
9.如权利要求8所述的基于云计算与置信度计算的语音识别***,其特征在于,还包括有本地语音降噪模块和云端语音降噪模块,本地语音降噪模块用于对语音信号进行降噪处理、再将完成降噪处理的语音信号传送至本地语音识别***,云端语音降噪模块用于对语音信号进行降噪处理、再将完成降噪处理的语音信号传送至云端语音识别***。
10.如权利要求9所述的基于云计算与置信度计算的语音识别***,其特征在于,云端语音降噪模块中包含有不同的云端语音降噪子模块,不同的云端语音降噪子模块中包含有不同的语音降噪模型,该不同的语音降噪模型基于不同的语音输入环境而建立,该不同的语音降噪模型与不同的语音识别模型一一对应。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610840519.XA CN106340297A (zh) | 2016-09-21 | 2016-09-21 | 一种基于云计算与置信度计算的语音识别方法与*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610840519.XA CN106340297A (zh) | 2016-09-21 | 2016-09-21 | 一种基于云计算与置信度计算的语音识别方法与*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106340297A true CN106340297A (zh) | 2017-01-18 |
Family
ID=57838636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610840519.XA Pending CN106340297A (zh) | 2016-09-21 | 2016-09-21 | 一种基于云计算与置信度计算的语音识别方法与*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106340297A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316637A (zh) * | 2017-05-31 | 2017-11-03 | 广东欧珀移动通信有限公司 | 语音识别方法及相关产品 |
CN107564525A (zh) * | 2017-10-23 | 2018-01-09 | 深圳北鱼信息科技有限公司 | 语音识别方法及装置 |
CN107733762A (zh) * | 2017-11-20 | 2018-02-23 | 马博 | 一种智能家居的语音控制方法及装置、*** |
CN108022593A (zh) * | 2018-01-16 | 2018-05-11 | 成都福兰特电子技术股份有限公司 | 一种高灵敏度语音识别***及其控制方法 |
CN108806682A (zh) * | 2018-06-12 | 2018-11-13 | 奇瑞汽车股份有限公司 | 获取天气信息的方法和装置 |
CN109979454A (zh) * | 2019-03-29 | 2019-07-05 | 联想(北京)有限公司 | 数据处理方法及装置 |
CN110634481A (zh) * | 2019-08-06 | 2019-12-31 | 惠州市德赛西威汽车电子股份有限公司 | 一种输出最优识别结果的语音整合方法 |
WO2020082724A1 (zh) * | 2018-10-26 | 2020-04-30 | 华为技术有限公司 | 一种对象分类的方法与装置 |
CN111145757A (zh) * | 2020-02-18 | 2020-05-12 | 上海华镇电子科技有限公司 | 车载语音智能蓝牙集成装置和方法 |
CN113380253A (zh) * | 2021-06-21 | 2021-09-10 | 紫优科技(深圳)有限公司 | 一种基于云计算和边缘计算的语音识别***、设备及介质 |
CN113380254A (zh) * | 2021-06-21 | 2021-09-10 | 紫优科技(深圳)有限公司 | 一种基于云计算和边缘计算的语音识别方法、设备及介质 |
CN113450781A (zh) * | 2020-03-25 | 2021-09-28 | 阿里巴巴集团控股有限公司 | 语音处理方法、语音编码器、语音解码器及语音识别*** |
CN115410578A (zh) * | 2022-10-27 | 2022-11-29 | 广州小鹏汽车科技有限公司 | 语音识别的处理方法及其处理***、车辆和可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1633679A (zh) * | 2001-12-29 | 2005-06-29 | 摩托罗拉公司 | 用于多级分布式语音识别的方法和装置 |
CN102439660A (zh) * | 2010-06-29 | 2012-05-02 | 株式会社东芝 | 基于置信度得分的语音标签方法和装置 |
CN102710539A (zh) * | 2012-05-02 | 2012-10-03 | 中兴通讯股份有限公司 | 语音信息传送方法及装置 |
US20140303974A1 (en) * | 2013-04-03 | 2014-10-09 | Kabushiki Kaisha Toshiba | Text generator, text generating method, and computer program product |
-
2016
- 2016-09-21 CN CN201610840519.XA patent/CN106340297A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1633679A (zh) * | 2001-12-29 | 2005-06-29 | 摩托罗拉公司 | 用于多级分布式语音识别的方法和装置 |
CN102439660A (zh) * | 2010-06-29 | 2012-05-02 | 株式会社东芝 | 基于置信度得分的语音标签方法和装置 |
CN102710539A (zh) * | 2012-05-02 | 2012-10-03 | 中兴通讯股份有限公司 | 语音信息传送方法及装置 |
US20140303974A1 (en) * | 2013-04-03 | 2014-10-09 | Kabushiki Kaisha Toshiba | Text generator, text generating method, and computer program product |
Non-Patent Citations (1)
Title |
---|
刘镜,刘加: "置信度的原理及其在语音识别中的应用", 《计算机研究与发展》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316637A (zh) * | 2017-05-31 | 2017-11-03 | 广东欧珀移动通信有限公司 | 语音识别方法及相关产品 |
CN107564525A (zh) * | 2017-10-23 | 2018-01-09 | 深圳北鱼信息科技有限公司 | 语音识别方法及装置 |
CN107733762A (zh) * | 2017-11-20 | 2018-02-23 | 马博 | 一种智能家居的语音控制方法及装置、*** |
CN107733762B (zh) * | 2017-11-20 | 2020-07-24 | 宁波向往智能科技有限公司 | 一种智能家居的语音控制方法及装置、*** |
CN108022593A (zh) * | 2018-01-16 | 2018-05-11 | 成都福兰特电子技术股份有限公司 | 一种高灵敏度语音识别***及其控制方法 |
CN108806682A (zh) * | 2018-06-12 | 2018-11-13 | 奇瑞汽车股份有限公司 | 获取天气信息的方法和装置 |
CN108806682B (zh) * | 2018-06-12 | 2020-12-01 | 奇瑞汽车股份有限公司 | 获取天气信息的方法和装置 |
WO2020082724A1 (zh) * | 2018-10-26 | 2020-04-30 | 华为技术有限公司 | 一种对象分类的方法与装置 |
CN109979454A (zh) * | 2019-03-29 | 2019-07-05 | 联想(北京)有限公司 | 数据处理方法及装置 |
CN110634481B (zh) * | 2019-08-06 | 2021-11-16 | 惠州市德赛西威汽车电子股份有限公司 | 一种输出最优识别结果的语音整合方法 |
CN110634481A (zh) * | 2019-08-06 | 2019-12-31 | 惠州市德赛西威汽车电子股份有限公司 | 一种输出最优识别结果的语音整合方法 |
CN111145757A (zh) * | 2020-02-18 | 2020-05-12 | 上海华镇电子科技有限公司 | 车载语音智能蓝牙集成装置和方法 |
CN113450781A (zh) * | 2020-03-25 | 2021-09-28 | 阿里巴巴集团控股有限公司 | 语音处理方法、语音编码器、语音解码器及语音识别*** |
CN113450781B (zh) * | 2020-03-25 | 2022-08-09 | 阿里巴巴集团控股有限公司 | 语音处理方法、语音编码器、语音解码器及语音识别*** |
CN113380254A (zh) * | 2021-06-21 | 2021-09-10 | 紫优科技(深圳)有限公司 | 一种基于云计算和边缘计算的语音识别方法、设备及介质 |
CN113380253A (zh) * | 2021-06-21 | 2021-09-10 | 紫优科技(深圳)有限公司 | 一种基于云计算和边缘计算的语音识别***、设备及介质 |
CN113380254B (zh) * | 2021-06-21 | 2024-05-24 | 枣庄福缘网络科技有限公司 | 一种基于云计算和边缘计算的语音识别方法、设备及介质 |
CN115410578A (zh) * | 2022-10-27 | 2022-11-29 | 广州小鹏汽车科技有限公司 | 语音识别的处理方法及其处理***、车辆和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106340297A (zh) | 一种基于云计算与置信度计算的语音识别方法与*** | |
CN109326283B (zh) | 非平行文本条件下基于文本编码器的多对多语音转换方法 | |
US11410029B2 (en) | Soft label generation for knowledge distillation | |
WO2021174757A1 (zh) | 语音情绪识别方法、装置、电子设备及计算机可读存储介质 | |
US11062699B2 (en) | Speech recognition with trained GMM-HMM and LSTM models | |
CN106098059B (zh) | 可定制语音唤醒方法及*** | |
CN103400577B (zh) | 多语种语音识别的声学模型建立方法和装置 | |
CN103065620B (zh) | 在手机上或网页上接收用户输入的文字并实时合成为个性化声音的方法 | |
CN106297800B (zh) | 一种自适应的语音识别的方法和设备 | |
CN108281137A (zh) | 一种全音素框架下的通用语音唤醒识别方法及*** | |
CN111653274B (zh) | 唤醒词识别的方法、装置及存储介质 | |
CN111179916A (zh) | 重打分模型训练方法、语音识别方法及相关装置 | |
CN111599339B (zh) | 具有高自然度的语音拼接合成方法、***、设备及介质 | |
KR20160059265A (ko) | 신뢰도 측점 점수를 고려한 음향 모델 학습 방법 및 장치 | |
CN110827799B (zh) | 用于处理语音信号的方法、装置、设备和介质 | |
CN111091809B (zh) | 一种深度特征融合的地域性口音识别方法及装置 | |
CN117115581A (zh) | 一种基于多模态深度学习的智能误操作预警方法及*** | |
CN115312033A (zh) | 基于人工智能的语音情感识别方法、装置、设备及介质 | |
CN107610720B (zh) | 发音偏误检测方法、装置、存储介质及设备 | |
Hammami et al. | Tree distribution classifier for automatic spoken arabic digit recognition | |
CN104199811A (zh) | 短句解析模型建立方法及*** | |
CN108182938B (zh) | 一种基于dnn的蒙古语声学模型的训练方法 | |
CN116189671A (zh) | 一种用于语言教学的数据挖掘方法及*** | |
CN115687934A (zh) | 意图识别方法、装置、计算机设备及存储介质 | |
CN113111855B (zh) | 一种多模态情感识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170118 |