CN108920470A - 一种自动检测音频的语言并进行翻译的方法 - Google Patents
一种自动检测音频的语言并进行翻译的方法 Download PDFInfo
- Publication number
- CN108920470A CN108920470A CN201810602359.4A CN201810602359A CN108920470A CN 108920470 A CN108920470 A CN 108920470A CN 201810602359 A CN201810602359 A CN 201810602359A CN 108920470 A CN108920470 A CN 108920470A
- Authority
- CN
- China
- Prior art keywords
- module
- language
- recording
- translation
- electrically connected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000001514 detection method Methods 0.000 title claims description 11
- 238000013519 translation Methods 0.000 claims abstract description 39
- 238000004891 communication Methods 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000010586 diagram Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C7/00—Arrangements for writing information into, or reading information out from, a digital store
- G11C7/16—Storage of analogue signals in digital stores using an arrangement comprising analogue/digital [A/D] converters, digital memories and digital/analogue [D/A] converters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种自动检测音频的语言并进行翻译的方法,包括设备主体,设备主体的上部设有录音孔,涉笔主体的表面设有显示屏,设备主体的底部设有按钮,设备主体的内部设有录音模块、语音识别模块和处理器,录音模块与按钮电性连接,录音模块电性连接语音识别模块,语音识别模块包括参数控制模块、网络判断模块、语音处理模块和语音识别引擎,语音识别模块电性连接处理器,处理器电性连接翻译模块,翻译模块电性连接通讯模块,翻译模块通过通讯模块信号连接翻译引擎本地端和翻译引擎云端,翻译模块电性连接显示屏和扬声模块,单个按键就可以实现翻译,用户按键录音后,***会识别说话者的语言并进行翻译,结构简单,方便使用。
Description
技术领域
本发明涉及一种翻译电子设备,特别涉及一种自动检测音频的语言并进行翻译的方法,属于翻译设备技术领域。
背景技术
至今翻译器的种类更多,功能也更五花八门,有翻译网络用语的,也有翻译火星文的,如今,翻译器又有人称之为翻译机等。翻译器支持33种语言和方言的翻译,包括英语、中文、西班牙语、德语、俄语、法语等,并能够完成所有这些语言的交互翻译。应用的使用方法也非常简单,你只需选择你要翻译成的语言种类,轻点按钮,然后对着翻译器说话,应用会捕捉你的语音信息,将其翻译成指定语言的文本信息并用目标语言说出来。较之前的版本而言,新版本对用户界面进行了改进,用户对翻译的语音有了更多控制权,包括可以选择男式发音或女士发音,以及可以对语音翻译的速度进行控制等。目前的翻译设备上都配备了两个按键,按某个按键时并录制对应语言的录音,这导致操作比较复杂。
发明内容
本发明提出了一种自动检测音频的语言并进行翻译的方法,解决了现有技术中翻译设备上都配备了两个按键,按某个按键时并录制对应语言的录音,这导致操作比较复杂的问题。
为了解决上述技术问题,本发明提供了如下的技术方案:
本发明一种自动检测音频的语言并进行翻译的方法,包括设备主体,所述设备主体的上部设有录音孔,所述涉笔主体的表面设有显示屏,所述设备主体的底部设有按钮,所述设备主体的内部设有录音模块、语音识别模块和处理器,所述录音模块与按钮电性连接,所述录音模块电性连接语音识别模块,所述语音识别模块包括参数控制模块、网络判断模块、语音处理模块和语音识别引擎,所述语音识别模块电性连接处理器,所述处理器电性连接翻译模块,所述翻译模块电性连接通讯模块,所述翻译模块通过通讯模块信号连接翻译引擎本地端和翻译引擎云端,所述翻译模块电性连接显示屏和扬声模块。
作为本发明的一种优选技术方案,所述设备主体的底端设有扬声窗口。
作为本发明的一种优选技术方案,所述设备主体的内部设有蓄电池。
作为本发明的一种优选技术方案,所述显示屏为触摸显示屏。
作为本发明的一种优选技术方案,所述录音模块电性连接音频信号放大电路。
作为本发明的一种优选技术方案,步骤为:用户使用时会设定语言X1和语言X2之间互译,用户通过按钮开启录音,用户对录音孔说话进行录音后,***会假定录音的语言为X1 或X2;通过语音识别模块对录音文件分别进行语音识别,得到识别结果分别为Y1,Y2,其中 Y1的confidence值为confidence1,Y2的confidence值为confidence2;通过处理器处理confidence1和confidence2的大小,更加精准准确,得出confidence1数值大,然后翻译模块对识别语音进行翻译,并通过显示屏显示和扬声模块播放。
本发明所达到的有益效果是:本发明的一种自动检测音频的语言并进行翻译的方法通过单个按键就可以实现翻译,当用户按键录音后,***会识别说话者的语言并进行翻译,结构简单,方便使用。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明的主观结构示意图;
图2是本发明的原理结构示意图;
图中:1、设备主体;2、录音孔;3、显示屏;4、按钮;5、录音模块;6、语音识别模块;7、处理器;8、通讯模块;9、翻译模块;10、扬声模块;11、翻译引擎云端;12、翻译引擎本地端;13、语音识别引擎;14、语音处理模块;15、网络判断模块;16、参数控制模块。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1
如图1-2所示,本发明提供一种自动检测音频的语言并进行翻译的方法,包括设备主体 1,所述设备主体1的上部设有录音孔2,所述涉笔主体1的表面设有显示屏3,所述设备主体1的底部设有按钮4,所述设备主体1的内部设有录音模块5、语音识别模块6和处理器7,所述录音模块5与按钮4电性连接,所述录音模块5电性连接语音识别模块6,所述语音识别模块6包括参数控制模块16、网络判断模块15、语音处理模块14和语音识别引擎14,所述语音识别模块6电性连接处理器7,所述处理器7电性连接翻译模块9,所述翻译模块9 电性连接通讯模块8,所述翻译模块9通过通讯模块8信号连接翻译引擎本地端12和翻译引擎云端11,所述翻译模块9电性连接显示屏3和扬声模块10。
所述设备主体1的底端设有扬声窗口,便于声音传递。所述设备主体1的内部设有蓄电池,便于充电使用。所述显示屏3为触摸显示屏,所述录音模块5电性连接音频信号放大电路,便于接收录音音频信号。
步骤为:用户使用时会设定语言X1和语言X2之间互译,用户通过按钮4开启录音,用户对录音孔2说话进行录音后,***会假定录音的语言为X1或X2;通过语音识别模块6对录音文件分别进行语音识别,得到识别结果分别为Y1,Y2,其中Y1的confidence值为confidence1,Y2的confidence值为confidence2;通过处理器7处理confidence1和confidence2的大小,更加精准准确,得出confidence1数值大,然后翻译模块9对识别语音进行翻译,并通过显示屏3显示和扬声模块10播放。
本发明的一种自动检测音频的语言并进行翻译的方法通过单个按键就可以实现翻译,当用户按键录音后,***会识别说话者的语言并进行翻译,结构简单,方便使用。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种自动检测音频的语言并进行翻译的方法,包括设备主体(1),其特征在于,所述设备主体(1)的上部设有录音孔(2),所述涉笔主体(1)的表面设有显示屏(3),所述设备主体(1)的底部设有按钮(4),所述设备主体(1)的内部设有录音模块(5)、语音识别模块(6)和处理器(7),所述录音模块(5)与按钮(4)电性连接,所述录音模块(5)电性连接语音识别模块(6),所述语音识别模块(6)包括参数控制模块(16)、网络判断模块(15)、语音处理模块(14)和语音识别引擎(14),所述语音识别模块(6)电性连接处理器(7),所述处理器(7)电性连接翻译模块(9),所述翻译模块(9)电性连接通讯模块(8),所述翻译模块(9)通过通讯模块(8)信号连接翻译引擎本地端(12)和翻译引擎云端(11),所述翻译模块(9)电性连接显示屏(3)和扬声模块(10)。
2.根据权利要求1所述的一种自动检测音频的语言并进行翻译的方法,其特征在于,所述设备主体(1)的底端设有扬声窗口。
3.根据权利要求2所述的一种自动检测音频的语言并进行翻译的方法,其特征在于,所述设备主体(1)的内部设有蓄电池。
4.根据权利要求3所述的一种自动检测音频的语言并进行翻译的方法,其特征在于,所述显示屏(3)为触摸显示屏。
5.根据权利要求4所述的一种自动检测音频的语言并进行翻译的方法,其特征在于,所述录音模块(5)电性连接音频信号放大电路。
6.根据权利要求5所述的一种自动检测音频的语言并进行翻译的方法,其特征在于,步骤为:
步骤一:用户使用时会设定语言X1和语言X2之间互译,用户通过按钮(4)开启录音,用户对录音孔(2)说话进行录音后,***会假定录音的语言为X1或X2;
步骤二:通过语音识别模块(6)对录音文件分别进行语音识别,得到识别结果分别为Y1,Y2,其中Y1的confidence值为confidence1,Y2的confidence值为confidence2;
步骤三:通过处理器(7)处理confidence1和confidence2的大小,更加精准准确,得出confidence1数值大,然后翻译模块(9)对识别语音进行翻译,并通过显示屏(3)显示和扬声模块(10)播放。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810602359.4A CN108920470A (zh) | 2018-06-12 | 2018-06-12 | 一种自动检测音频的语言并进行翻译的方法 |
US16/470,978 US20210365641A1 (en) | 2018-06-12 | 2019-04-09 | Speech recognition and translation method and translation apparatus |
JP2019563570A JP2020529032A (ja) | 2018-06-12 | 2019-04-09 | 音声認識翻訳方法及び翻訳装置 |
PCT/CN2019/081886 WO2019237806A1 (zh) | 2018-06-12 | 2019-04-09 | 语音识别及翻译方法以及翻译装置 |
CN201980001333.7A CN110800046B (zh) | 2018-06-12 | 2019-04-09 | 语音识别及翻译方法以及翻译装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810602359.4A CN108920470A (zh) | 2018-06-12 | 2018-06-12 | 一种自动检测音频的语言并进行翻译的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108920470A true CN108920470A (zh) | 2018-11-30 |
Family
ID=64419214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810602359.4A Pending CN108920470A (zh) | 2018-06-12 | 2018-06-12 | 一种自动检测音频的语言并进行翻译的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108920470A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019237806A1 (zh) * | 2018-06-12 | 2019-12-19 | 深圳市合言信息科技有限公司 | 语音识别及翻译方法以及翻译装置 |
CN115131791A (zh) * | 2022-04-28 | 2022-09-30 | 广东小天才科技有限公司 | 翻译方法、装置、可穿戴设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101266600A (zh) * | 2008-05-07 | 2008-09-17 | 陈光火 | 多媒体多语言互动同步翻译方法 |
CN205581861U (zh) * | 2016-01-26 | 2016-09-14 | 北京纽思曼教育科技有限公司 | 一种翻译设备 |
CN106126510A (zh) * | 2016-06-27 | 2016-11-16 | 安徽声讯信息技术有限公司 | 一种具有在线多引擎自动语音识别的快速翻译装置 |
CN207164638U (zh) * | 2017-07-17 | 2018-03-30 | 杜晶 | 一种运用于跨境电商的自动翻译器 |
-
2018
- 2018-06-12 CN CN201810602359.4A patent/CN108920470A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101266600A (zh) * | 2008-05-07 | 2008-09-17 | 陈光火 | 多媒体多语言互动同步翻译方法 |
CN205581861U (zh) * | 2016-01-26 | 2016-09-14 | 北京纽思曼教育科技有限公司 | 一种翻译设备 |
CN106126510A (zh) * | 2016-06-27 | 2016-11-16 | 安徽声讯信息技术有限公司 | 一种具有在线多引擎自动语音识别的快速翻译装置 |
CN207164638U (zh) * | 2017-07-17 | 2018-03-30 | 杜晶 | 一种运用于跨境电商的自动翻译器 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019237806A1 (zh) * | 2018-06-12 | 2019-12-19 | 深圳市合言信息科技有限公司 | 语音识别及翻译方法以及翻译装置 |
CN110800046A (zh) * | 2018-06-12 | 2020-02-14 | 深圳市合言信息科技有限公司 | 语音识别及翻译方法以及翻译装置 |
CN115131791A (zh) * | 2022-04-28 | 2022-09-30 | 广东小天才科技有限公司 | 翻译方法、装置、可穿戴设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104380375B (zh) | 用于从对话中提取信息的设备 | |
US7953590B2 (en) | Using separate recording channels for speech-to-speech translation systems | |
US20200012724A1 (en) | Bidirectional speech translation system, bidirectional speech translation method and program | |
CN108231065A (zh) | 多语者语音识别校正*** | |
CN105426362A (zh) | 语音翻译装置、方法及程序 | |
WO2020024620A1 (zh) | 语音信息的处理方法以及装置、设备和存储介质 | |
WO2014048113A1 (zh) | 一种语音识别方法和设备 | |
CN101154220A (zh) | 机器翻译装置和方法 | |
JP7485858B2 (ja) | 実世界ノイズを使用した音声個性化および連合訓練 | |
CN104796584A (zh) | 具有语音识别功能的提词装置 | |
US20180211650A1 (en) | Automatic language identification for speech | |
US9691389B2 (en) | Spoken word generation method and system for speech recognition and computer readable medium thereof | |
CN106713111B (zh) | 一种添加好友的处理方法、终端及服务器 | |
CN205581861U (zh) | 一种翻译设备 | |
KR101517975B1 (ko) | 동시 통/번역 기능을 가지는 이어폰 장치 | |
KR20160081244A (ko) | 자동 통역 시스템 및 이의 동작 방법 | |
CN108920470A (zh) | 一种自动检测音频的语言并进行翻译的方法 | |
CN104361787A (zh) | 信号转换***和信号转换方法 | |
CN108304391A (zh) | 一种基于gps定位的自适应翻译机 | |
WO2021071271A1 (en) | Electronic apparatus and controlling method thereof | |
CN113077790B (zh) | 多语言配置方法、多语音交互方法、装置及电子设备 | |
CN113345407A (zh) | 一种风格语音合成方法、装置、电子设备及存储介质 | |
WO2017199486A1 (ja) | 情報処理装置 | |
CN108052511A (zh) | 基于方言识别的多语言翻译器 | |
CN208752948U (zh) | 一种智能语音控制装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181130 |