CN108920470A

CN108920470A - 一种自动检测音频的语言并进行翻译的方法

Info

Publication number: CN108920470A
Application number: CN201810602359.4A
Authority: CN
Inventors: 张岩; 林彦; 熊涛
Original assignee: Shenzhen Heyan Mdt Infotech Ltd
Current assignee: Shenzhen Heyan Mdt Infotech Ltd
Priority date: 2018-06-12
Filing date: 2018-06-12
Publication date: 2018-11-30

Abstract

本发明公开了一种自动检测音频的语言并进行翻译的方法，包括设备主体，设备主体的上部设有录音孔，涉笔主体的表面设有显示屏，设备主体的底部设有按钮，设备主体的内部设有录音模块、语音识别模块和处理器，录音模块与按钮电性连接，录音模块电性连接语音识别模块，语音识别模块包括参数控制模块、网络判断模块、语音处理模块和语音识别引擎，语音识别模块电性连接处理器，处理器电性连接翻译模块，翻译模块电性连接通讯模块，翻译模块通过通讯模块信号连接翻译引擎本地端和翻译引擎云端，翻译模块电性连接显示屏和扬声模块，单个按键就可以实现翻译，用户按键录音后，***会识别说话者的语言并进行翻译，结构简单，方便使用。

Description

一种自动检测音频的语言并进行翻译的方法

技术领域

本发明涉及一种翻译电子设备，特别涉及一种自动检测音频的语言并进行翻译的方法，属于翻译设备技术领域。

背景技术

至今翻译器的种类更多，功能也更五花八门，有翻译网络用语的，也有翻译火星文的，如今，翻译器又有人称之为翻译机等。翻译器支持33种语言和方言的翻译，包括英语、中文、西班牙语、德语、俄语、法语等，并能够完成所有这些语言的交互翻译。应用的使用方法也非常简单，你只需选择你要翻译成的语言种类，轻点按钮，然后对着翻译器说话，应用会捕捉你的语音信息，将其翻译成指定语言的文本信息并用目标语言说出来。较之前的版本而言，新版本对用户界面进行了改进，用户对翻译的语音有了更多控制权，包括可以选择男式发音或女士发音，以及可以对语音翻译的速度进行控制等。目前的翻译设备上都配备了两个按键，按某个按键时并录制对应语言的录音，这导致操作比较复杂。

发明内容

本发明提出了一种自动检测音频的语言并进行翻译的方法，解决了现有技术中翻译设备上都配备了两个按键，按某个按键时并录制对应语言的录音，这导致操作比较复杂的问题。

为了解决上述技术问题，本发明提供了如下的技术方案：

本发明一种自动检测音频的语言并进行翻译的方法，包括设备主体，所述设备主体的上部设有录音孔，所述涉笔主体的表面设有显示屏，所述设备主体的底部设有按钮，所述设备主体的内部设有录音模块、语音识别模块和处理器，所述录音模块与按钮电性连接，所述录音模块电性连接语音识别模块，所述语音识别模块包括参数控制模块、网络判断模块、语音处理模块和语音识别引擎，所述语音识别模块电性连接处理器，所述处理器电性连接翻译模块，所述翻译模块电性连接通讯模块，所述翻译模块通过通讯模块信号连接翻译引擎本地端和翻译引擎云端，所述翻译模块电性连接显示屏和扬声模块。

作为本发明的一种优选技术方案，所述设备主体的底端设有扬声窗口。

作为本发明的一种优选技术方案，所述设备主体的内部设有蓄电池。

作为本发明的一种优选技术方案，所述显示屏为触摸显示屏。

作为本发明的一种优选技术方案，所述录音模块电性连接音频信号放大电路。

作为本发明的一种优选技术方案，步骤为：用户使用时会设定语言X1和语言X2之间互译，用户通过按钮开启录音，用户对录音孔说话进行录音后，***会假定录音的语言为X1 或X2；通过语音识别模块对录音文件分别进行语音识别，得到识别结果分别为Y1,Y2，其中 Y1的confidence值为confidence1，Y2的confidence值为confidence2；通过处理器处理confidence1和confidence2的大小，更加精准准确，得出confidence1数值大，然后翻译模块对识别语音进行翻译，并通过显示屏显示和扬声模块播放。

本发明所达到的有益效果是：本发明的一种自动检测音频的语言并进行翻译的方法通过单个按键就可以实现翻译，当用户按键录音后，***会识别说话者的语言并进行翻译，结构简单，方便使用。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明的主观结构示意图；

图2是本发明的原理结构示意图；

图中：1、设备主体；2、录音孔；3、显示屏；4、按钮；5、录音模块；6、语音识别模块；7、处理器；8、通讯模块；9、翻译模块；10、扬声模块；11、翻译引擎云端；12、翻译引擎本地端；13、语音识别引擎；14、语音处理模块；15、网络判断模块；16、参数控制模块。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

实施例1

如图1-2所示，本发明提供一种自动检测音频的语言并进行翻译的方法，包括设备主体 1，所述设备主体1的上部设有录音孔2，所述涉笔主体1的表面设有显示屏3，所述设备主体1的底部设有按钮4，所述设备主体1的内部设有录音模块5、语音识别模块6和处理器7，所述录音模块5与按钮4电性连接，所述录音模块5电性连接语音识别模块6，所述语音识别模块6包括参数控制模块16、网络判断模块15、语音处理模块14和语音识别引擎14，所述语音识别模块6电性连接处理器7，所述处理器7电性连接翻译模块9，所述翻译模块9 电性连接通讯模块8，所述翻译模块9通过通讯模块8信号连接翻译引擎本地端12和翻译引擎云端11，所述翻译模块9电性连接显示屏3和扬声模块10。

所述设备主体1的底端设有扬声窗口，便于声音传递。所述设备主体1的内部设有蓄电池，便于充电使用。所述显示屏3为触摸显示屏，所述录音模块5电性连接音频信号放大电路，便于接收录音音频信号。

步骤为：用户使用时会设定语言X1和语言X2之间互译，用户通过按钮4开启录音，用户对录音孔2说话进行录音后，***会假定录音的语言为X1或X2；通过语音识别模块6对录音文件分别进行语音识别，得到识别结果分别为Y1,Y2，其中Y1的confidence值为confidence1，Y2的confidence值为confidence2；通过处理器7处理confidence1和confidence2的大小，更加精准准确，得出confidence1数值大，然后翻译模块9对识别语音进行翻译，并通过显示屏3显示和扬声模块10播放。

本发明的一种自动检测音频的语言并进行翻译的方法通过单个按键就可以实现翻译，当用户按键录音后，***会识别说话者的语言并进行翻译，结构简单，方便使用。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种自动检测音频的语言并进行翻译的方法，包括设备主体(1)，其特征在于，所述设备主体(1)的上部设有录音孔(2)，所述涉笔主体(1)的表面设有显示屏(3)，所述设备主体(1)的底部设有按钮(4)，所述设备主体(1)的内部设有录音模块(5)、语音识别模块(6)和处理器(7)，所述录音模块(5)与按钮(4)电性连接，所述录音模块(5)电性连接语音识别模块(6)，所述语音识别模块(6)包括参数控制模块(16)、网络判断模块(15)、语音处理模块(14)和语音识别引擎(14)，所述语音识别模块(6)电性连接处理器(7)，所述处理器(7)电性连接翻译模块(9)，所述翻译模块(9)电性连接通讯模块(8)，所述翻译模块(9)通过通讯模块(8)信号连接翻译引擎本地端(12)和翻译引擎云端(11)，所述翻译模块(9)电性连接显示屏(3)和扬声模块(10)。

2.根据权利要求1所述的一种自动检测音频的语言并进行翻译的方法，其特征在于，所述设备主体(1)的底端设有扬声窗口。

3.根据权利要求2所述的一种自动检测音频的语言并进行翻译的方法，其特征在于，所述设备主体(1)的内部设有蓄电池。

4.根据权利要求3所述的一种自动检测音频的语言并进行翻译的方法，其特征在于，所述显示屏(3)为触摸显示屏。

5.根据权利要求4所述的一种自动检测音频的语言并进行翻译的方法，其特征在于，所述录音模块(5)电性连接音频信号放大电路。

6.根据权利要求5所述的一种自动检测音频的语言并进行翻译的方法，其特征在于，步骤为：

步骤一：用户使用时会设定语言X1和语言X2之间互译，用户通过按钮(4)开启录音，用户对录音孔(2)说话进行录音后，***会假定录音的语言为X1或X2；

步骤二：通过语音识别模块(6)对录音文件分别进行语音识别，得到识别结果分别为Y1,Y2，其中Y1的confidence值为confidence1，Y2的confidence值为confidence2；

步骤三：通过处理器(7)处理confidence1和confidence2的大小，更加精准准确，得出confidence1数值大，然后翻译模块(9)对识别语音进行翻译，并通过显示屏(3)显示和扬声模块(10)播放。