CN113744720A - 基于融合多频带语音信号特征的语音识别鲁棒性增强方法 - Google Patents
基于融合多频带语音信号特征的语音识别鲁棒性增强方法 Download PDFInfo
- Publication number
- CN113744720A CN113744720A CN202111044761.3A CN202111044761A CN113744720A CN 113744720 A CN113744720 A CN 113744720A CN 202111044761 A CN202111044761 A CN 202111044761A CN 113744720 A CN113744720 A CN 113744720A
- Authority
- CN
- China
- Prior art keywords
- voice
- acoustic
- module
- feature
- power grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000002708 enhancing effect Effects 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 19
- 230000001629 suppression Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000002759 z-score normalization Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 6
- 230000000903 blocking effect Effects 0.000 abstract 1
- 230000005856 abnormality Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了基于融合多频带语音信号特征的语音识别鲁棒性增强方法,具体包括以下步骤:S1、由语音输入模块输入信息,通过特征选取模块进行特征选取,然后通过语音信号特征提取单元对不同频带语音信号PNCC进行特征提取,进一步通过语音多频带特征融合单元将每个频带的语音信号PNCC特征乘以一个权重系数后进行语音信号PNCC特征融合,本发明涉及电网技术领域。该基于融合多频带语音信号特征的语音识别鲁棒性增强方法,可使得电网调度控制中心只需耗费调度员较少的时间和精力,在严重电网异常发生时,也不需要多级调度协同配合,在指挥多个单位统一处置异常的场景下,不会发生严重的信息阻塞,电网异常处置过程记录可实现自动记录。
Description
技术领域
本发明涉及电网技术领域,具体为基于融合多频带语音信号特征的语音识别鲁棒性增强方法。
背景技术
随着特高压交直流同步电网的快速发展,新能源大规模的集中投运,电力体制改革的深入推进,电网异常协同处置工作面临着挑战。为进一步提高电网异常应急处置水平,必须采取调控一体化和资源配置全局化的措施予以应对,尤其是在电网异常情况下,必须做到共同预警、协同预控、统筹处置,这都对各级机构的协同工作水平提出非常高的要求。电力***各级电网调控中心是电网运行的组织、指挥、指导和协调机构,调控中心的调度员作为电网运行的直接指挥者,坚守在电网运行工作的第一线。随着全国联网规模的不断扩大和电压等级的不断提高,电网在设备数量、互联模式、耦合特性、复杂程度等方面已全面超越传统超高压交流电网,电网面临来自自然、人为、内在因素影响的问题也更为突出,这就造成调度员调度电网的工作量、复杂度和工作压力日益增大。因此,电力部门利用人工智能技术,调度人员可与机器就调度运行工作进行语言交互,可在调度员监督和指挥下处理有规律可循,重复性强的工作,让机器更多的替代人的工作,提高调度运行的智能化水平,提高工作效率,消除人为差错,确保电网安全稳定运行。
现有的电网调度控制中心需要耗费调度员大量的时间和精力,在严重电网异常发生时,需要多级调度协同配合,指挥多个单位统一处置异常的场景下,如果电话占线会发生严重的信息阻塞,电网异常处置过程记录需要手动记录,因此,本发明提出基于融合多频带语音信号特征的语音识别鲁棒性增强方法,以解决上述提到的问题。
发明内容
针对现有技术的不足,本发明提供了基于融合多频带语音信号特征的语音识别鲁棒性增强方法,解决了现有的电网调度控制中心需要耗费调度员大量的时间和精力,在严重电网异常发生时,需要多级调度协同配合,指挥多个单位统一处置异常的场景下,如果电话占线会发生严重的信息阻塞,电网异常处置过程记录需要手动记录的问题。
为实现以上目的,本发明通过以下技术方案予以实现:基于融合多频带语音信号特征的语音识别鲁棒性增强方法,具体包括以下步骤:
S1、由语音输入模块输入信息,通过特征选取模块进行特征选取,然后通过语音信号特征提取单元对不同频带语音信号PNCC进行特征提取,进一步通过语音多频带特征融合单元将每个频带的语音信号PNCC特征乘以一个权重系数后进行语音信号PNCC特征融合;
S2、由语音多频带特征融合单元进行语音信号PNCC特征融合后,再通过语音识别声学模型训练单元进行模型生成和训练;
S3、通过语音信号z-score标准化单元提高语音识别模型的鲁棒性;
S4、构建向量空间模型(VSM):利用电网故障词典,对电网故障案例分词并统计词频,结合电网故障实体权重表,得出电网故障案例特征向量;
S5、计算每个词项在向量中的权重TF-IDF;
S6、余弦相似度计算;
S7、根据计算得到的值进行相似度计算,值越大表示两个电网故障案例特征向量的信息相似度越高,就越有可能发生重名或者多名现象。
优选的,所述步骤S2中的语音识别声学模型训练单元包括训练样本获取模块、原始声学模型获取模块、声学特征确定模块、状态描述模型生成模块和声学模型生成模块,在通过原始声学模型获取模块获取原始声学模型后,确定每一训练文本对应的原始声学模型中的声学状态。
优选的,然后通过声学特征确定模块中根据每一训练文本对应的声学状态以及声学特征,确定每一声学状态对应的声学特征,再通过状态描述模型生成模块利用每一声学状态对应的声学特征,重新训练获得声学状态的状态描述模型。
优选的,最后通过声学模型生成模块利用重新训练获得的状态模型,更新原始声学模型中的原始状态描述模型,获得更新之后的声学模型
优选的,所述步骤S3中的语音信号z-score标准化单元包括低频信号增强模块、高频信号抑制模块和频带语音信号权重系数调节模块,根据低频信号增强模块来增强低频信号(人声信号)特征,同时通过高频信号抑制模块抑制高频信号(非人声信号)特征的原则,调整不同频带语音信号权重系数,进而提高语音识别模型的鲁棒性。
优选的,所述步骤S4中电网故障案例特征向量由n个权重组成,每个词都有一个权重,不同的词根据自己在文档中的权重来影响文档相关性的重要程度。
优选的,所述步骤S2中TF-IDF表示TF(词频)和IDF(逆文档频率)的乘积:其中:TF-IDF=词频(TF)×逆文档频率(IDF)。
有益效果
本发明提供了基于融合多频带语音信号特征的语音识别鲁棒性增强方法。与现有技术相比具备以下有益效果:
该基于融合多频带语音信号特征的语音识别鲁棒性增强方法,通过在基于融合多频带语音信号特征的语音识别鲁棒性增强方法,具体包括以下步骤:S1、由语音输入模块输入信息,通过特征选取模块进行特征选取,然后通过语音信号特征提取单元对不同频带语音信号PNCC进行特征提取,进一步通过语音多频带特征融合单元将每个频带的语音信号PNCC特征乘以一个权重系数后进行语音信号PNCC特征融合;S2、由语音多频带特征融合单元进行语音信号PNCC特征融合后,再通过语音识别声学模型训练单元进行模型生成和训练;S3、通过语音信号z-score标准化单元提高语音识别模型的鲁棒性;S4、构建向量空间模型(VSM):利用电网故障词典,对电网故障案例分词并统计词频,结合电网故障实体权重表,得出电网故障案例特征向量;S5、计算每个词项在向量中的权重TF-IDF;S6、余弦相似度计算;S7、根据计算得到的值进行相似度计算,值越大表示两个电网故障案例特征向量的信息相似度越高,就越有可能发生重名或者多名现象,可使得电网调度控制中心只需耗费调度员较少的时间和精力,在严重电网异常发生时,也不需要多级调度协同配合,在指挥多个单位统一处置异常的场景下,如果电话占线也不会发生严重的信息阻塞,电网异常处置过程记录可实现自动记录。
附图说明
图1为本发明整体结构的示意图;
图2为本发明音识别声学模型训练单元的示意图;
图3为本发明语音信号z-score标准化单元的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本发明提供一种技术方案:基于融合多频带语音信号特征的语音识别鲁棒性增强方法,具体包括以下步骤:
S1、由语音输入模块输入信息,通过特征选取模块进行特征选取,然后通过语音信号特征提取单元对不同频带语音信号PNCC进行特征提取,进一步通过语音多频带特征融合单元将每个频带的语音信号PNCC特征乘以一个权重系数后进行语音信号PNCC特征融合;
S2、由语音多频带特征融合单元进行语音信号PNCC特征融合后,再通过语音识别声学模型训练单元进行模型生成和训练;
S3、通过语音信号z-score标准化单元提高语音识别模型的鲁棒性;
S4、构建向量空间模型(VSM):利用电网故障词典,对电网故障案例分词并统计词频,结合电网故障实体权重表,得出电网故障案例特征向量;
S5、计算每个词项在向量中的权重TF-IDF;
S6、余弦相似度计算;
S7、根据计算得到的值进行相似度计算,值越大表示两个电网故障案例特征向量的信息相似度越高,就越有可能发生重名或者多名现象。
本发明实施例中,所述步骤S2中的语音识别声学模型训练单元包括训练样本获取模块、原始声学模型获取模块、声学特征确定模块、状态描述模型生成模块和声学模型生成模块,在通过原始声学模型获取模块获取原始声学模型后,确定每一训练文本对应的原始声学模型中的声学状态。
本发明实施例中,然后通过声学特征确定模块中根据每一训练文本对应的声学状态以及声学特征,确定每一声学状态对应的声学特征,再通过状态描述模型生成模块利用每一声学状态对应的声学特征,重新训练获得声学状态的状态描述模型。
本发明实施例中,最后通过声学模型生成模块利用重新训练获得的状态模型,更新原始声学模型中的原始状态描述模型,获得更新之后的声学模型
本发明实施例中,所述步骤S3中的语音信号z-score标准化单元包括低频信号增强模块、高频信号抑制模块和频带语音信号权重系数调节模块,根据低频信号增强模块来增强低频信号(人声信号)特征,同时通过高频信号抑制模块抑制高频信号(非人声信号)特征的原则,调整不同频带语音信号权重系数,进而提高语音识别模型的鲁棒性。
本发明实施例中,所述步骤S4中电网故障案例特征向量由n个权重组成,每个词都有一个权重,不同的词根据自己在文档中的权重来影响文档相关性的重要程度。
本发明实施例中,所述步骤S2中TF-IDF表示TF(词频)和IDF(逆文档频率)的乘积:其中:TF-IDF=词频(TF)×逆文档频率(IDF)。
同时本说明书中未作详细描述的内容均属于本领域技术人员公知的现有技术。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (7)
1.基于融合多频带语音信号特征的语音识别鲁棒性增强方法,其特征在于:具体包括以下步骤:
S1、由语音输入模块输入信息,通过特征选取模块进行特征选取,然后通过语音信号特征提取单元对不同频带语音信号PNCC进行特征提取,进一步通过语音多频带特征融合单元将每个频带的语音信号PNCC特征乘以一个权重系数后进行语音信号PNCC特征融合;
S2、由语音多频带特征融合单元进行语音信号PNCC特征融合后,再通过语音识别声学模型训练单元进行模型生成和训练;
S3、通过语音信号z-score标准化单元提高语音识别模型的鲁棒性;
S4、构建向量空间模型(VSM):利用电网故障词典,对电网故障案例分词并统计词频,结合电网故障实体权重表,得出电网故障案例特征向量;
S5、计算每个词项在向量中的权重TF-IDF;
S6、余弦相似度计算;
S7、根据计算得到的值进行相似度计算,值越大表示两个电网故障案例特征向量的信息相似度越高,就越有可能发生重名或者多名现象。
2.根据权利要求1所述的基于融合多频带语音信号特征的语音识别鲁棒性增强方法,其特征在于:所述步骤S2中的语音识别声学模型训练单元包括训练样本获取模块、原始声学模型获取模块、声学特征确定模块、状态描述模型生成模块和声学模型生成模块,在通过原始声学模型获取模块获取原始声学模型后,确定每一训练文本对应的原始声学模型中的声学状态。
3.根据权利要求2所述的基于融合多频带语音信号特征的语音识别鲁棒性增强方法,其特征在于:然后通过声学特征确定模块中根据每一训练文本对应的声学状态以及声学特征,确定每一声学状态对应的声学特征,再通过状态描述模型生成模块利用每一声学状态对应的声学特征,重新训练获得声学状态的状态描述模型。
4.根据权利要求2所述的基于融合多频带语音信号特征的语音识别鲁棒性增强方法,其特征在于:最后通过声学模型生成模块利用重新训练获得的状态模型,更新原始声学模型中的原始状态描述模型,获得更新之后的声学模型。
5.根据权利要求1所述的基于融合多频带语音信号特征的语音识别鲁棒性增强方法,其特征在于:所述步骤S3中的语音信号z-score标准化单元包括低频信号增强模块、高频信号抑制模块和频带语音信号权重系数调节模块,根据低频信号增强模块来增强低频信号(人声信号)特征,同时通过高频信号抑制模块抑制高频信号(非人声信号)特征的原则,调整不同频带语音信号权重系数,进而提高语音识别模型的鲁棒性。
6.根据权利要求1所述的基于融合多频带语音信号特征的语音识别鲁棒性增强方法,其特征在于:所述步骤S4中电网故障案例特征向量由n个权重组成,每个词都有一个权重,不同的词根据自己在文档中的权重来影响文档相关性的重要程度。
7.根据权利要求1所述的基于融合多频带语音信号特征的语音识别鲁棒性增强方法,其特征在于:所述步骤S2中TF-IDF表示TF(词频)和IDF(逆文档频率)的乘积:其中:TF-IDF=词频(TF)×逆文档频率(IDF)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111044761.3A CN113744720A (zh) | 2021-09-07 | 2021-09-07 | 基于融合多频带语音信号特征的语音识别鲁棒性增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111044761.3A CN113744720A (zh) | 2021-09-07 | 2021-09-07 | 基于融合多频带语音信号特征的语音识别鲁棒性增强方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113744720A true CN113744720A (zh) | 2021-12-03 |
Family
ID=78736631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111044761.3A Pending CN113744720A (zh) | 2021-09-07 | 2021-09-07 | 基于融合多频带语音信号特征的语音识别鲁棒性增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113744720A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140365221A1 (en) * | 2012-07-31 | 2014-12-11 | Novospeech Ltd. | Method and apparatus for speech recognition |
CN107527611A (zh) * | 2017-08-23 | 2017-12-29 | 武汉斗鱼网络科技有限公司 | Mfcc语音识别方法、存储介质、电子设备及*** |
US20190287551A1 (en) * | 2018-03-19 | 2019-09-19 | Academia Sinica | System and methods for suppression by selecting wavelets for feature compression in distributed speech recognition |
CN110689880A (zh) * | 2019-10-21 | 2020-01-14 | 国家电网公司华中分部 | 一种应用于电力调度领域的语音识别方法及装置 |
CN111267587A (zh) * | 2019-11-30 | 2020-06-12 | 的卢技术有限公司 | 一种基于智能识别的车辆玻璃控制方法和*** |
CN112349294A (zh) * | 2020-10-22 | 2021-02-09 | 腾讯科技(深圳)有限公司 | 语音处理方法及装置、计算机可读介质、电子设备 |
CN112466318A (zh) * | 2020-10-27 | 2021-03-09 | 北京百度网讯科技有限公司 | 语音处理方法、装置及语音处理模型的生成方法、装置 |
-
2021
- 2021-09-07 CN CN202111044761.3A patent/CN113744720A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140365221A1 (en) * | 2012-07-31 | 2014-12-11 | Novospeech Ltd. | Method and apparatus for speech recognition |
CN107527611A (zh) * | 2017-08-23 | 2017-12-29 | 武汉斗鱼网络科技有限公司 | Mfcc语音识别方法、存储介质、电子设备及*** |
US20190287551A1 (en) * | 2018-03-19 | 2019-09-19 | Academia Sinica | System and methods for suppression by selecting wavelets for feature compression in distributed speech recognition |
CN110689880A (zh) * | 2019-10-21 | 2020-01-14 | 国家电网公司华中分部 | 一种应用于电力调度领域的语音识别方法及装置 |
CN111267587A (zh) * | 2019-11-30 | 2020-06-12 | 的卢技术有限公司 | 一种基于智能识别的车辆玻璃控制方法和*** |
CN112349294A (zh) * | 2020-10-22 | 2021-02-09 | 腾讯科技(深圳)有限公司 | 语音处理方法及装置、计算机可读介质、电子设备 |
CN112466318A (zh) * | 2020-10-27 | 2021-03-09 | 北京百度网讯科技有限公司 | 语音处理方法、装置及语音处理模型的生成方法、装置 |
Non-Patent Citations (4)
Title |
---|
FERNANDO DE-LA-CALLE-SILOS: "Synchrony-Based Feature Extraction for Robust Automatic Speech Recognition", 《IEEE SIGNAL PROCESSING LETTERS》, 9 June 2017 (2017-06-09) * |
NING WANG: "Robust speaker recognition based on multi-stream features", 《2016 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS - CHINA (ICCE-CHINA)》, 31 December 2016 (2016-12-31) * |
吴佳佳: "基于调度电话语音信息的调度命令智能生成方法", 《铁道运输与经济》, 30 April 2021 (2021-04-30) * |
张子涛: "基于小波和PNCC特征参数的语音识别技术研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, 15 April 2019 (2019-04-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108921355A (zh) | 一种基于时间序列预测模型的告警阈值设定方法及装置 | |
CN108628906A (zh) | 短文本模板挖掘方法、装置、电子设备和可读存储介质 | |
CN109256776B (zh) | 一种电网频率潮流越限联合调整辅助决策方法及装置 | |
CN107895222A (zh) | 基于dbscan算法的变压器不良漏抗参数辨识方法 | |
CN112420025A (zh) | 一种用于电力调度的智能语音识别转化方法及*** | |
CN115566696A (zh) | 一种云边协同的电网频率在线监测分析方法与*** | |
Xue et al. | Adaptive ultra-short-term wind power prediction based on risk assessment | |
CN117833242B (zh) | 基于数字孪生的电力能源智能调度方法及*** | |
CN110543693B (zh) | 一种计及运行风险的鲁棒机组组合方法 | |
CN113627685B (zh) | 一种考虑风电上网负荷限制的风力发电机功率预测方法 | |
CN110783913A (zh) | 基于群的计及预想事故集最佳电网拓扑在线优化方法 | |
CN113744720A (zh) | 基于融合多频带语音信号特征的语音识别鲁棒性增强方法 | |
CN109615117A (zh) | 一种基于arima模型的煤改电电力负荷预测方法 | |
CN111967919A (zh) | 一种基于自回归和自适应提升算法的居民用电行为分析的***及方法 | |
CN112633642A (zh) | 电力***备用需求预测方法、***、装置及存储介质 | |
CN116780648A (zh) | 一种配电网分布式电源技术承载力分析方法、***及设备 | |
CN111080037A (zh) | 一种基于深度神经网络的短期电力负荷预测方法及装置 | |
CN113642766B (zh) | 一种电力***站点停电数的预测方法、装置、设备及介质 | |
Xu et al. | Fault recovery of distribution network containing distributed generation based on heuristic search algorithm and multi-population genetic algorithm | |
CN114792200A (zh) | 一种基于专家知识库的调度事故预案生成和校核方法 | |
CN113687719A (zh) | 一种适用于语音信息的智能交互方法及装置 | |
CN112800625A (zh) | 一种区域电网全清洁供电运行边界确定方法和*** | |
CN111507605A (zh) | 配电网建设效益评价方法、***及计算机设备 | |
CN109241060A (zh) | 换流站远传信号的分层分级方法与装置 | |
Lu | Power quality prediction based on least squares method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |