CN112967717B

CN112967717B - 一种高准确性的英语语音翻译的模糊匹配训练方法

Info

Publication number: CN112967717B
Application number: CN202110223114.2A
Authority: CN
Inventors: 王晓靖; 张敏; 李琦; 丁桂芝; 牛明敏; 张晨曦; 郭晓斌
Original assignee: Zhengzhou Railway Vocational and Technical College
Current assignee: Zhengzhou Railway Vocational and Technical College
Priority date: 2021-03-01
Filing date: 2021-03-01
Publication date: 2023-08-22
Anticipated expiration: 2041-03-01
Also published as: CN112967717A

Abstract

本发明公开了一种高准确性的英语语音翻译的模糊匹配方法，所述模糊匹配方法包括以下步骤：S1、获取语音信息并转换成数字语音信号；S2、将所述数字语音信号采用模糊声像规则进行语音检测，得到对应的匹配参数，根据所述匹配参数采用遗传算法运算得到可编程器件的重配置数据流；S3、采用所述重配置数据流重新配置可编程器件；S4、所述在线语音接收模块可将匹配参数作为导引来检索在线语音数据，并将所述在线语音数据进行粗略排序；将检索到的在线语音数据输入可编程器件进行模糊匹配；S5、找到最为匹配的在线语音数据输出。

Description

一种高准确性的英语语音翻译的模糊匹配训练方法

技术领域

本发明涉及英文翻译领域，具体涉及一种高准确性的英语语音翻译的模糊匹配方法。

背景技术

随着互联网技术的发展，英文翻译的智能化也在不断推进，如计算机辅助翻译***，文本翻译以及语音翻译都逐一实现，特别是掌上设备如手机APP均能实现语音在线翻译。

现有技术中一般采用将语音转换成文本，再将采用算法将文本信息与翻译库中的语句进行相似性匹配，将相似度最高的结果作为输出。如CN201710532235.9公开了一种云翻译记忆库快速增量式模糊匹配的方法，采用信息检索技术对大规模翻译记忆库构建索引，采用粗选和精选策略，即首先从索引库中根据输入的待译句子得到匹配的子集，然后利用句子语义向量相似度和编辑距离线性组合的模糊匹配方法得到最终的翻译输出，最后将人工后编辑后的译文及其源语言句段返回翻译记忆库增量式更新。

这样翻译出的效率并不高，而且文本识别率也跟英文发音是否准确有关，文本匹配后得出翻译结果还需要再次查看文本信息，根据文本信息再理解其中含义，影响交流效率。

发明内容

为背景技术中的问题，本发明提供了如下技术方案：一种高准确性的英语语音翻译的模糊匹配方法，具体的步骤如下：

S1、获取语音信息并转换成数字语音信号；

S2、将所述数字语音信号采用模糊声像规则进行语音检测，得到对应的匹配参数，根据所述匹配参数采用遗传算法运算得到可编程器件的重配置数据流；

S3、采用所述重配置数据流重新配置可编程器件；

S4、所述在线语音接收模块可将匹配参数作为导引来检索在线语音数据，并将所述在线语音数据进行粗略排序；将检索到的在线语音数据输入可编程器件进行模糊匹配；

S5、找到最为匹配的在线语音数据输出。

所述步骤S4中的模糊匹配算法为：将若干个匹配参数作为模糊规则R，数字化语音作为输入量X，当输入量X激活若干条模糊规则R时，输出U则由若干条模糊规则的输出决定。

所述步骤S2中的遗传算法具体如下：

S21、随机生成染色体个体；

S22、计算所述个体的适应度值；

S23、对个体随机实施变异操作，生成子代个体；

S24、执行选择操作，若子代个体的适应度值高于个体的适应度值，则将子代个体复制到下一代，否则以一个较小的概率复制子代个体到下一代，依次类推直至满足终止条件。

所述步骤S2中的所述模糊声像规则包括梅尔倒谱系数分析、短时能量以及短时平均过零率统计方法、基于谱分析得到的共振峰提取方法等方法共同组成的规则实现的“声音画像”特征描述，将上述规则的输出如梅尔倒谱系数、短时能量、短时平均过零率、共振峰等作为匹配参数。

把可编程器件中的可配置逻辑模块（LUT）作为染色体，通过遗传算法，找出最优的染色体，生成重配置数据流配置到可编程器件上，从而对电路重新配置，以实现根据输入语音的变化而变化自身以更有效率的匹配语音数据。

本发明还提供一种英语语音的翻译模糊匹配***，能够更为准确的翻译，其中一个技术方案为：一种英语语音的翻译模糊匹配***，包括处理器、存储器、可编程器件、在线语音接收模块、语音获取模块以及显示播放模块；

所述处理器和可编程器件分别与语音获取模块连接；所述处理器分别和存储器、可编程器件、在线语音接收模块、语音获取模块以及显示播放模块电性连接；

所述在线语音接收模块、存储器与可编程器件连接；

所述语音获取模块获取语音信息并转换成数字语音信号。

所述处理器接收所述数字语音信号，并将所述数字语音信号采用模糊声像规则进行语音检测，得到对应的匹配参数，根据所述匹配参数采用遗传算法运算得到可编程器件的重配置数据流，并将所述重配置数据流存储至存储器，所述处理器控制所述存储器以及可编程器件对可编程器件进行重新配置。

所述匹配参数还用于通过在线语音接收模块检索在线语音数据，所述在线语音接收模块可将匹配参数作为导引来检索在线语音数据，并将所述在线语音数据进行粗略排序；将检索到的在线语音数据输入可编程器件进行模糊匹配。

所述可编程器件被配置成实现模糊匹配算法，将若干个匹配参数作为模糊规则R，数字化语音作为输入量X，当输入量X激活若干条模糊规则R时，输出U则由若干条模糊规则的输出决定。

所述可编程器件以数字语音信号以及在线语音数据作为输入，经过模糊匹配算法的计算，最后找到最为匹配的在线语音数据输出到处理器再进行组合以及文本翻译送至显示播放模块播放与显示。

本发明根据接收到的语音信息特点，得到匹配参数，再运用遗传算法得到最佳的匹配策略生成用于配置可编程器件的重配置数据流，进而便于匹配在线语音数据与输入的数字语音信号，最后采用模糊匹配算法直接进行语音信号的匹配，根据模糊规则得到准确的匹配数据后进行翻译的语音以及文本输出。这样就能够根据语音输入特点得到最为匹配的语音翻译信息，也能够快速实现语音输出。

附图说明

图1为翻译模糊匹配***框图。

图2为翻译模糊匹配***电路示意图。

图3为英语语音的翻译模糊匹配***的步骤图。

图4为遗传算法实现步骤图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

如图3所示，本发明提供了一种具体的实施方式：一种高准确性的英语语音翻译的模糊匹配方法，具体的步骤如下：

S1、获取语音信息并转换成数字语音信号；

S3、采用所述重配置数据流重新配置可编程器件；

S5、找到最为匹配的在线语音数据输出。

所述S4中的模糊匹配算法为：将若干个匹配参数作为模糊规则R，数字化语音作为输入量X，当输入量X激活若干条模糊规则R时，输出U则由若干条模糊规则的输出决定。

所述S2中的遗传算法具体如下：

S21、随机生成染色体个体；

S22、计算所述个体的适应度值；

S23、对个体随机实施变异操作，生成子代个体；

所述S2中的所述模糊声像规则包括梅尔倒谱系数分析、短时能量以及短时平均过零率统计方法、基于谱分析得到的共振峰提取方法等方法共同组成的规则实现的“声音画像”特征描述，将上述规则的输出如梅尔倒谱系数、短时能量、短时平均过零率、共振峰等作为匹配参数。

把可编程器件3中的可配置逻辑模块（LUT）作为染色体，通过遗传算法，找出最优的染色体，生成重配置数据流配置到可编程器件3上，从而对电路重新配置，以实现根据输入语音的变化而变化自身以更有效率的匹配语音数据。

实施例2

如图1所示，本发明提供的一种具体实施方式为一种英语语音的翻译模糊匹配***，包括处理器1、存储器2、可编程器件3、在线语音接收模块4、语音获取模块5以及显示播放模块6。

所述处理器1和可编程器件3分别与语音获取模块5连接；所述处理器1分别和存储器2、可编程器件3、在线语音接收模块4、语音获取模块5以及显示播放模块6电性连接。

所述在线语音接收模块4、存储器2与可编程器件3连接；

所述语音获取模块5获取语音信息并转换成数字语音信号；

所述处理器1接收所述数字语音信号，并将所述数字语音信号采用模糊声像规则进行语音检测，得到对应的匹配参数，根据所述匹配参数采用遗传算法运算得到可编程器件3的重配置数据流，并将所述重配置数据流存储至存储器2，所述处理器1控制所述存储器2以及可编程器件3对可编程器件3进行重新配置。

所述匹配参数还用于通过在线语音接收模块4检索在线语音数据，所述在线语音接收模块4可将匹配参数作为导引来检索在线语音数据，并将所述在线语音数据进行粗略排序；将检索到的在线语音数据输入可编程器件3进行模糊匹配。

所述可编程器件3被配置成实现模糊匹配算法，将若干个匹配参数作为模糊规则R，数字化语音作为输入量X，当输入量X激活若干条模糊规则R时，输出U则由若干条模糊规则的输出决定。

所述可编程器件3以数字语音信号以及在线语音数据作为输入，经过模糊匹配算法的计算，最后找到最为匹配的在线语音数据输出到处理器1再进行组合以及文本翻译送至显示播放模块6播放与显示。

如图2所示，作为一种优选的实施方式，所述可编程器件3可采用FPGA 3’实现，而处理器1在启动程序时即能控制存储在存储器中的配置数据流完成对FPGA 3’芯片的上电后配置；在处理器1运行的过程中也能重新生成重配置数据流以实现对FPGA3’的重配置，以便于对不同的英文语音进行个性化翻译。

作为一种优选的实施方式，所述遗传算法可采用趋向型紧凑遗传算法；

作为一种优选的实施方式，所述模糊声像规则包括梅尔倒谱系数分析、短时能量以及短时平均过零率统计方法、基于谱分析得到的共振峰提取方法等方法共同组成的规则实现的“声音画像”特征描述，将上述规则的输出如梅尔倒谱系数、短时能量、短时平均过零率、共振峰等作为匹配参数。

作为一种优选的实施方式，所述处理器1可采用STM32系列单片机1’或者DSP实现。

作为一种优选的实施方式，所述在线语音接收模块4可远程获取服务器中的在线语音特征库，并根据匹配参数以及将数字语音信号转换文本的方式实现在线语音特征的检索；并将检索结果排序后发送至可编程器件3中进行模糊匹配；可配合处理器1搭建Websocket服务器4’。

上述实施方式根据接收到的语音信息特点，得到匹配参数，再运用遗传算法得到最佳的匹配策略生成用于配置可编程器件3的重配置数据流，进而便于匹配在线语音数据与输入的数字语音信号，最后采用模糊匹配算法直接进行语音信号的匹配，根据模糊规则得到准确的匹配数据后进行翻译的语音以及文本输出。这样就能够根据语音输入特点得到最为匹配的语音翻译信息，也能够快速实现语音输出。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种高准确性的英语语音翻译的模糊匹配方法，其特征在于：该匹配方法采用的匹配***包括处理器、存储器、可编程器件、在线语音接收模块、语音获取模块以及显示播放模块；所述处理器和可编程器件分别与语音获取模块连接；所述处理器分别和存储器、可编程器件、在线语音接收模块、语音获取模块以及显示播放模块电性连接；所述在线语音接收模块、存储器与可编程器件连接；

所述的模糊匹配方法包括如下步骤：

S1、所述语音获取模块获取语音信息并转换成数字语音信号；

S2、将所述数字语音信号采用模糊声像规则进行语音检测，得到对应的匹配参数，根据所述匹配参数采用遗传算法运算得到可编程器件的重配置数据流；根据所述匹配参数采用遗传算法运算得到可编程器件的重配置数据流具体为：把可编程器件中的可配置逻辑模块作为染色体，通过遗传算法，找出最优的染色体，生成重配置数据流配置到可编程器件上，从而对电路重新配置，以实现根据输入语音的变化而变化自身以更有效率的匹配语音数据；模糊声像规则包括梅尔倒谱系数分析、短时能量以及短时平均过零率统计方法、基于谱分析得到的共振峰提取方法共同组成的规则实现的“声音画像”特征描述，将上述规则的输出如梅尔倒谱系数、短时能量、短时平均过零率、共振峰作为匹配参数；

所述遗传算法具体实现步骤如下：

S21、随机生成染色体个体；

S22、计算所述个体的适应度值；

S23、对个体随机实施变异操作，生成子代个体；

S24、执行选择操作，若子代个体的适应度值高于个体的适应度值，则将子代个体复制到下一代，否则以一个较小的概率复制子代个体到下一代，依次类推直至满足终止条件；

S3、采用所述重配置数据流重新配置可编程器件，实现根据输入语音的变化而变化自身以匹配语音数据；

S4、所述在线语音接收模块将匹配参数作为导引来检索在线语音数据，并将所述在线语音数据进行粗略排序；将检索到的在线语音数据输入可编程器件进行模糊匹配；所述可编程器件被配置成实现模糊匹配算法，将若干个匹配参数作为模糊规则R，数字语音信号作为输入量X，当输入量X激活若干条模糊规则R时，输出U则由若干条模糊规则的输出决定；所述可编程器件以数字语音信号以及在线语音数据作为输入，经过模糊匹配算法的计算，最后找到最为匹配的在线语音数据，输出到处理器再进行组合以及文本翻译送至显示播放模块播放与显示；

S5、将最为匹配的在线语音数据输出。