CN112351363A - 蓝牙耳机充电盒、语音处理方法及计算机可读存储介质 - Google Patents

蓝牙耳机充电盒、语音处理方法及计算机可读存储介质 Download PDF

Info

Publication number
CN112351363A
CN112351363A CN202011217276.7A CN202011217276A CN112351363A CN 112351363 A CN112351363 A CN 112351363A CN 202011217276 A CN202011217276 A CN 202011217276A CN 112351363 A CN112351363 A CN 112351363A
Authority
CN
China
Prior art keywords
voice
charging box
bluetooth headset
translation
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011217276.7A
Other languages
English (en)
Inventor
徐银海
刘益帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ansheng Haolang Technology Co ltd
Original Assignee
Beijing Ansheng Haolang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ansheng Haolang Technology Co ltd filed Critical Beijing Ansheng Haolang Technology Co ltd
Priority to CN202011217276.7A priority Critical patent/CN112351363A/zh
Publication of CN112351363A publication Critical patent/CN112351363A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1025Accumulators or arrangements for charging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1091Details not provided for in groups H04R1/1008 - H04R1/1083

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请提供一种蓝牙耳机充电盒、语音处理方法及计算机可读存储介质。本申请在蓝牙耳机充电盒的盒体内设置有处理器、麦克风单元以及相应的存储器。本申请通过存储器中存储的计算机指令,控制处理器获取麦克风单元所采集的第一语音信号,并对其进行语音识别和翻译处理,生成与第一语音信号相对应的翻译文本文件,实现对语音信号的翻译功能。本申请能够显著提升耳机用户的体验,可以取代单一形态的翻译设备。

Description

蓝牙耳机充电盒、语音处理方法及计算机可读存储介质
技术领域
本申请涉及电子设备技术领域,具体而言涉及一种蓝牙耳机充电盒、语音处理方法及计算机可读存储介质。
背景技术
近年来,蓝牙耳机,尤其是TWS(True Wireless Stereo,真无线立体声)耳机发展迅速。耳机充电盒作为蓝牙耳机的充电装置,经常与蓝牙耳机一同进行售卖。然而,现阶段市面上的耳机充电盒通常仅具备为耳机充电和收纳耳机两方面功能,其功能形式单一,用户体验较差。
发明内容
本申请针对现有技术的不足,提供一种蓝牙耳机充电盒、语音处理方法及计算机可读存储介质。本申请利用蓝牙耳机充电盒设置相应的麦克风单元及处理器,通过处理器对语音信号的处理能够实现自动翻译的功能。本申请具体采用如下技术方案。
首先,为实现上述目的,提出一种蓝牙耳机充电盒,其包括:麦克风单元,用于采集第一语音信号;存储器,包括存储在其上的计算机指令;处理器;其中,所述计算机指令在被所述处理器执行时,所述处理器用于:获取所述第一语音信号,对所述第一语音信号进行语音识别和翻译处理,生成与所述第一语音信号相对应的翻译文本文件。
可选的,如上任一所述的蓝牙耳机充电盒,其中,所述处理器对所述第一语音信号进行语音识别和翻译处理,生成与所述第一语音信号相对应的翻译文本文件,包括:所述处理器对所述第一语音信号进行特征提取,根据提取结果进行所述语音识别,生成与所述第一语音信号相对应的转写文本文件,并对所述转写文本文件进行所述翻译处理,生成所述翻译文本文件。
可选的,如上任一所述的蓝牙耳机充电盒,其中,还包括:扬声器单元,包括至少一个扬声器;所述计算机指令在被所述处理器执行时,所述处理器还用于:根据所述翻译文本文件,生成与所述第一语音信号相对应的翻译语音信号,其中所述翻译语音信号对应的语种由所述翻译处理的设置确定;所述至少一个扬声器用于播放所述翻译语音信号。
可选的,如上任一所述的蓝牙耳机充电盒,其中,所述处理器根据所述翻译文本文件,生成与所述第一语音信号相对应的翻译语音信号,包括:所述处理器将所述翻译文本文件转换为音素序列,标注所述音素序列中各音素的起止时刻,并根据所述音素序列和所述各音素的起止时刻生成所述翻译语音信号。
可选的,如上任一所述的蓝牙耳机充电盒,其中,所述麦克风单元包括至少两个麦克风;所述处理器包括:增益单元,用于在对所述第一语音信号进行语音识别之前,根据所述至少两个麦克风采集的至少两个第一语音信号两两之间的互相关函数的峰值,确定每个第一语音信号中的目标声源信号两两之间的时延量,并基于所述时延量对齐所述至少两个第一语音信号,叠加对齐后的至少两个第一语音信号以对其中的目标声源信号进行增强。
可选的,如上任一所述的蓝牙耳机充电盒,其中,还包括:蓝牙收发器,用于与所述蓝牙耳机充电盒的蓝牙配对设备进行无线通信,向所述蓝牙配对设备无线传输所述翻译文本文件。
可选的,如上任一所述的蓝牙耳机充电盒,其中,还包括:有线数据接口,用于与所述蓝牙耳机充电盒的外部电子设备进行有线通信,通过数据线向所述外部电子设备传输所述翻译文本文件。
同时,为实现上述目的,本申请还提供一种语音处理方法,用于蓝牙耳机充电盒,所述语音处理方法的步骤包括:获取所述蓝牙耳机充电盒上的第一麦克风单元采集的第一语音信号;以及对所述第一语音信号进行语音识别和翻译处理,生成与所述第一语音信号相对应的第一翻译文本文件。
可选的,如上任一所述的语音处理方法,其中,还包括以下步骤:获取与所述蓝牙耳机充电盒配对的蓝牙耳机上的第二麦克风单元采集的第二语音信号;及对所述第二语音信号进行所述语音识别和所述翻译处理,生成与所述第二语音信号相对应的第二翻译文本文件。
本申请同时还提供有一种计算机可读存储介质,包括存储在其上的计算机指令,其中,所述计算机指令在被蓝牙耳机充电盒的处理器执行时,使得所述处理器执行如上任一所述的语音处理方法。
有益效果
本申请在蓝牙耳机充电盒的盒体内设置有处理器、麦克风单元以及相应的存储器。本申请通过存储器中存储的计算机指令,控制处理器获取麦克风单元所采集的第一语音信号,并对其进行语音识别和翻译处理,生成与第一语音信号相对应的翻译文本文件,实现对语音信号的翻译功能。本申请能够显著提升耳机用户的体验,可以取代单一形态的翻译设备。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。
附图说明
附图用来提供对本申请的进一步理解,并且构成说明书的一部分,并与本申请的实施例一起,用于解释本申请,并不构成对本申请的限制。在附图中:
图1是本申请的蓝牙耳机充电盒的原理框图。
图2是本申请的蓝牙耳机充电盒所采用的语音处理方法的步骤流程图。
具体实施方式
为使本申请实施例的目的和技术方案更加清楚,下面将结合本申请实施例的附图,对本申请实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于所描述的本申请的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本申请中所述的“和/或”的含义指的是各自单独存在或两者同时存在的情况均包括在内。
本申请中所述的“内、外”的含义指的是相对于充电盒盒体本身而言,指向盒体内部电路***的方向为内,反之为外;而非对本申请的装置机构的特定限定。
本申请中所述的“连接”的含义可以是部件之间的直接连接也可以是部件间通过其它部件的间接连接。
图1为根据本申请的一种蓝牙耳机的充电盒的内部电路***框图。以TWS耳机的充电盒为例,该充电盒的硬件包括:处理器、输入设备、盒体、存储器等。其中:
麦克风单元作为输入设备,其设置在盒体上,用于采集第一语音信号;
处理器,其连接麦克风单元以及存储器,用于根据存储器中存储的计算机指令相应获取麦克风单元所采集得到的第一语音信号,对第一语音信号进行语音识别和翻译处理,生成与第一语音信号相对应的翻译文本文件;
存储器,其具体可由内存(例如指令寄存器)实现,主要用于存储上述计算机指令,用以供处理器执行并实现相应的机器翻译程序。
本申请的蓝牙耳机充电盒通过存储器中存储的计算机指令,控制处理器获取麦克风单元所采集的第一语音信号,并对其进行语音识别和翻译处理,生成与第一语音信号相对应的翻译文本文件,实现机器翻译功能。
在更为具体的实现方式下,处理器对第一语音信号进行语音识别和翻译处理,生成与第一语音信号相对应的翻译文本文件,可进一步包括:(一)处理器对第一语音信号进行特征提取,根据提取结果进行语音识别,生成与第一语音信号相对应的转写文本文件:(二)对转写文本文件进行翻译处理,生成翻译文本文件。
翻译完成后,处理器还可以根据翻译文本文件,将翻译文本文件转换为对应翻译后语种的音素序列,标注音素序列中各音素的起止时刻,并根据音素序列和各音素的起止时刻生成与第一语音信号(A语言)相对应的翻译语音信号(B语言),该翻译语音信号对应的语种B由翻译处理的设置(“A译B”)确定。生成翻译语音信号后,可通过本申请充电盒上的至少一个扬声器对其进行合成语音的播放。
由于现实环境中普遍存在无向的背景噪声,麦克风采集的语音信号通常夹杂着噪声信号,较强噪声干扰将严重影响语音识别的精度,进而导致翻译错误。
有鉴于此,为进一步提升翻译质量,在一些实施例中,充电盒包括至少两个麦克风,且处理器还可包括:增益单元,其用于在处理器对第一语音信号进行语音识别之前,根据至少两个麦克风采集的至少两个第一语音信号两两之间的互相关函数的峰值,确定每个第一语音信号中的目标声源信号两两之间的时延量,并基于时延量对齐至少两个第一语音信号,叠加对齐后的至少两个第一语音信号以对其中的目标声源信号进行增强,从而拾取具有显著提高的信噪比的语音信号。
经过上述处理的语音信号能够更为准确地实现语音识别和机器翻译功能。
机器翻译后生成的翻译文本文件可通过有线传输或无线传输的方式转发给其它电子设备。对于无线传输,可通过本申请充电盒自带的蓝牙收发器,例如蓝牙天线及蓝牙芯片的组合,将文件发送至与本申请充电盒蓝牙配对的设备,例如用户手机,并经手机端解码后显示于屏幕中。相类似地,对于有线传输,可通过本申请充电盒自带的有线数据接口,例如Micro USB接口、USB Type-C接口、Lightning接口等,将文件发送至与本申请充电盒数据线连接的外部电子设备。
图2所示为本申请一实施例提供的语音处理方法的步骤流程图。该方法例如可以应用于本申请上述的蓝牙耳机充电盒,由该充电盒中的处理器执行。如图2所示,该方法包括:
S210:获取蓝牙耳机充电盒上的第一麦克风单元采集的第一语音信号;以及
S220:对第一语音信号进行语音识别和翻译处理,生成与第一语音信号相对应的第一翻译文本文件。
本申请提供的语音处理方法通过获取蓝牙耳机充电盒上麦克风采集的语音信号,并对其进行语音识别和翻译处理,生成翻译文本文件,使充电盒能够实现机器翻译功能。
在一些实施例中,上述方法步骤还可包括:
S230:获取与蓝牙耳机充电盒配对的蓝牙耳机上的第二麦克风单元采集的第二语音信号;以及
S240:对第二语音信号进行语音识别和翻译处理,生成与第二语音信号相对应的第二翻译文本文件。
本申请提供的语音处理方法通过获取蓝牙耳机上麦克风采集的语音信号,并对其进行语音识别和翻译处理,生成翻译文本文件,使充电盒在不开启自身麦克风或者自身麦克风拾音环境恶劣的情况下依然能够实现对耳机用户的讲话进行机器翻译。
本申请的其他实施例还提供一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被蓝牙耳机充电盒的处理器执行时实现如上述任一实施例所述的语音处理方法。可以理解,该计算机存储介质可以为任何有形媒介,例如:软盘、CD-ROM、DVD、硬盘驱动器或网络介质等。
以上仅为本申请的实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些均属于本申请的保护范围。

Claims (10)

1.一种蓝牙耳机充电盒,其特征在于,包括:
麦克风单元,用于采集第一语音信号;
存储器,包括存储在其上的计算机指令;
处理器;
其中,所述计算机指令在被所述处理器执行时,所述处理器用于:获取所述第一语音信号,对所述第一语音信号进行语音识别和翻译处理,生成与所述第一语音信号相对应的翻译文本文件。
2.如权利要求1所述的蓝牙耳机充电盒,其特征在于,所述处理器对所述第一语音信号进行语音识别和翻译处理,生成与所述第一语音信号相对应的翻译文本文件,包括:所述处理器对所述第一语音信号进行特征提取,根据提取结果进行所述语音识别,生成与所述第一语音信号相对应的转写文本文件,并对所述转写文本文件进行所述翻译处理,生成所述翻译文本文件。
3.如权利要求1所述的蓝牙耳机充电盒,其特征在于,还包括:扬声器单元,包括至少一个扬声器;所述计算机指令在被所述处理器执行时,所述处理器还用于:根据所述翻译文本文件,生成与所述第一语音信号相对应的翻译语音信号,其中所述翻译语音信号对应的语种由所述翻译处理的设置确定;所述至少一个扬声器用于播放所述翻译语音信号。
4.如权利要求3所述的蓝牙耳机充电盒,其特征在于,所述处理器根据所述翻译文本文件,生成与所述第一语音信号相对应的翻译语音信号,包括:所述处理器将所述翻译文本文件转换为音素序列,标注所述音素序列中各音素的起止时刻,并根据所述音素序列和所述各音素的起止时刻生成所述翻译语音信号。
5.如权利要求1所述的蓝牙耳机充电盒,其特征在于,所述麦克风单元包括至少两个麦克风;所述处理器包括:增益单元,用于在对所述第一语音信号进行语音识别之前,根据所述至少两个麦克风采集的至少两个第一语音信号两两之间的互相关函数的峰值,确定每个第一语音信号中的目标声源信号两两之间的时延量,并基于所述时延量对齐所述至少两个第一语音信号,叠加对齐后的至少两个第一语音信号以对其中的目标声源信号进行增强。
6.如权利要求1所述的蓝牙耳机充电盒,其特征在于,还包括:蓝牙收发器,用于与所述蓝牙耳机充电盒的蓝牙配对设备进行无线通信,向所述蓝牙配对设备无线传输所述翻译文本文件。
7.如权利要求1所述的蓝牙耳机充电盒,其特征在于,还包括:有线数据接口,用于与所述蓝牙耳机充电盒的外部电子设备进行有线通信,通过数据线向所述外部电子设备传输所述翻译文本文件。
8.一种语音处理方法,其特征在于,用于蓝牙耳机充电盒,所述语音处理方法的步骤包括:
获取所述蓝牙耳机充电盒上的第一麦克风单元采集的第一语音信号;以及
对所述第一语音信号进行语音识别和翻译处理,生成与所述第一语音信号相对应的第一翻译文本文件。
9.如权利要求8所述的语音处理方法,其特征在于,还包括以下步骤:
获取与所述蓝牙耳机充电盒配对的蓝牙耳机上的第二麦克风单元采集的第二语音信号;及
对所述第二语音信号进行所述语音识别和所述翻译处理,生成与所述第二语音信号相对应的第二翻译文本文件。
10.一种计算机可读存储介质,包括存储在其上的计算机指令,其特征在于,所述计算机指令在被蓝牙耳机充电盒的处理器执行时,使得所述处理器执行如权利要求8或9所述的语音处理方法。
CN202011217276.7A 2020-11-04 2020-11-04 蓝牙耳机充电盒、语音处理方法及计算机可读存储介质 Pending CN112351363A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011217276.7A CN112351363A (zh) 2020-11-04 2020-11-04 蓝牙耳机充电盒、语音处理方法及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011217276.7A CN112351363A (zh) 2020-11-04 2020-11-04 蓝牙耳机充电盒、语音处理方法及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112351363A true CN112351363A (zh) 2021-02-09

Family

ID=74429690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011217276.7A Pending CN112351363A (zh) 2020-11-04 2020-11-04 蓝牙耳机充电盒、语音处理方法及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112351363A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9741360B1 (en) * 2016-10-09 2017-08-22 Spectimbre Inc. Speech enhancement for target speakers
JP3225366U (ja) * 2019-10-29 2020-02-27 鋒霖科技股▲ふん▼有限公司Jetvox Acoustic Corp. イヤホン収納ケース装置
CN111836149A (zh) * 2020-03-20 2020-10-27 东莞讯滔电子有限公司 无线耳机装置和无线耳机盒的使用方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9741360B1 (en) * 2016-10-09 2017-08-22 Spectimbre Inc. Speech enhancement for target speakers
JP3225366U (ja) * 2019-10-29 2020-02-27 鋒霖科技股▲ふん▼有限公司Jetvox Acoustic Corp. イヤホン収納ケース装置
CN111836149A (zh) * 2020-03-20 2020-10-27 东莞讯滔电子有限公司 无线耳机装置和无线耳机盒的使用方法

Similar Documents

Publication Publication Date Title
CN105814909B (zh) 用于反馈检测的***和方法
WO2018008885A1 (ko) 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체
CN108509428B (zh) 耳机翻译方法和***
CN112770214B (zh) 耳机的控制方法、装置及耳机
US9818423B2 (en) Method of improving sound quality and headset thereof
WO2018018705A1 (zh) 一种语音通话的方法、装置及终端
US9866947B2 (en) Dual-microphone headset and noise reduction processing method for audio signal in call
US20180293982A1 (en) Voice assistant extension device and working method therefor
CN104335559A (zh) 一种自动调节音量的方法、音量调节装置及电子设备
CN112383855A (zh) 蓝牙耳机充电盒、录音方法及计算机可读存储介质
WO2021170061A1 (zh) 无线扩音***及终端
US20120197635A1 (en) Method for generating an audio signal
CN111492365A (zh) 使用辅助设备盒子进行翻译
CN112289325A (zh) 一种声纹识别方法及装置
KR20180023617A (ko) 외부 기기를 제어하는 휴대 기기 및 이의 오디오 신호 처리 방법
CN111063363A (zh) 一种语音获取方法、音频设备和具有存储功能的装置
WO2022199405A1 (zh) 一种语音控制方法和装置
CN104851423A (zh) 一种声音信息处理方法及装置
US10433081B2 (en) Consumer electronics device adapted for hearing loss compensation
CN108605067B (zh) 播放音频的方法和移动终端
CN112351363A (zh) 蓝牙耳机充电盒、语音处理方法及计算机可读存储介质
CN112599144A (zh) 音频数据处理方法、音频数据处理装置、介质与电子设备
CN113889135A (zh) 一种估计声源波达方向的方法、电子设备及芯片***
CN115835079B (zh) 透传模式的切换方法和切换装置
US20190304457A1 (en) Interaction device and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210209