CN112929633A - 一种同声传译接收设备及方法 - Google Patents

一种同声传译接收设备及方法 Download PDF

Info

Publication number
CN112929633A
CN112929633A CN202110168881.8A CN202110168881A CN112929633A CN 112929633 A CN112929633 A CN 112929633A CN 202110168881 A CN202110168881 A CN 202110168881A CN 112929633 A CN112929633 A CN 112929633A
Authority
CN
China
Prior art keywords
voice
translation
controller
simultaneous interpretation
projection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110168881.8A
Other languages
English (en)
Inventor
刘坚
李秋平
李磊
王明轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youzhuju Network Technology Co Ltd
Original Assignee
Beijing Youzhuju Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youzhuju Network Technology Co Ltd filed Critical Beijing Youzhuju Network Technology Co Ltd
Priority to CN202110168881.8A priority Critical patent/CN112929633A/zh
Publication of CN112929633A publication Critical patent/CN112929633A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/275Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开实施例公开了一种同声传译接收设备及方法,该同声传译接收设备包括:显示装置、语音获取装置、投影装置及控制器;其中,所述语音获取装置,用于实时获取翻译语音,并向所述控制器发送将所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音;所述控制器,用于将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本;根据所述翻译文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像;所述投影装置,用于将所述虚拟翻译影像在所述显示装置中进行投影显示。本公开实施例提供的技术方案,可以将同声传译的翻译文本进行投影显示,方便用户查看,大大提高了用户体验。

Description

一种同声传译接收设备及方法
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种同声传译接收设备及方法。
背景技术
目前,随着我国综合实力的不断曾倩,各种国际会议不断在我国召开,这就需要在会议现场布置同声传译***,由同传译员在会议现场的同传室内完成会议的人工同传,同时,参会嘉宾通过同传耳机来收听同传音频(翻译后的语音),从而能够准确、及时地知道发言者的发言内容。然而,参会嘉宾通过同传耳机只能收听同传音频,无法观看对应为字幕数据,导致用户体验较差。
发明内容
本公开实施例提供一种同声传译接收设备及方法,可以将同声传译的翻译文本进行投影显示,方便用户查看,大大提高了用户体验。
第一方面,本公开实施例提供了一种同声传译接收设备,包括:显示装置、语音获取装置、投影装置及控制器;其中,
所述语音获取装置,用于实时获取翻译语音,并向所述控制器发送所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音;
所述控制器,用于将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本;根据所述翻译文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像;
所述投影装置,用于将所述虚拟翻译影像在所述显示装置中进行投影显示。
第二方面,本公开实施例还提供了一种同声传译接收方法,应用于同声传译接收设备,包括:
通过语音获取装置实时获取翻译语音,并向控制器发送所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音;
通过所述控制器将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本,根据所述翻译文本生成虚拟翻译影像,并向投影装置发送所述虚拟翻译影像;
通过所述投影装置将所述虚拟翻译影像在显示装置中进行投影显示。
本公开实施例提供了一种同声传译接收设备,该同声传译接收设备包括:显示装置、语音获取装置、投影装置及控制器;其中,所述语音获取装置,用于实时获取翻译语音,并向所述控制器发送所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音;所述控制器,用于将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本;根据所述翻译文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像;所述投影装置,用于将所述虚拟翻译影像在显示装置中进行投影显示。本公开实施例提供的技术方案,可以将翻译文本进行投影显示,方便用户查看同声传译的翻译文本,大大提高了用户体验。
附图说明
图1是本公开一实施例中的一种同声传译接收设备的结构示意图;
图2是本公开一实施例中的一种同声传译接收设备的结构示意图;
图3是本公开实施例中的一种同声传译接收设备的显示效果示意图;
图4是本公开一实施例中的一种同声传译接收设备的结构示意图;
图5是本公开实施例中的一种同声传译接收设备的显示效果示意图;
图6是本公开实施例中的一种同声传译接收设备的显示效果示意图;
图7是本公开一实施例中的一种同声传译接收方法的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
在对本公开实施例进行介绍前,先对传统同传模式进行解释说明:传统同传方案主要是将会议同传主机、红外发射主机、译员机、同传室、接收机及耳机等硬件设备连为一体,同传译员在同传会议室进行实时翻译,同传主机接收翻译后的音频信号,通过红外发射主机将信号发射,参会嘉宾通过接收机和耳机收听同传译员的声音。然后,通过上述技术方案无法将同传译员的音频和翻译文本相结合,只能听到纯粹的同传声音。
图1是本公开一实施例中的一种同声传译接收设备100的结构示意图。如图1所示,该同声传译接收设备100,包括:显示装置108、语音获取装置103、投影装置104及控制器105;其中,语音获取装置103,用于实时获取翻译语音,并向控制器105发送将翻译语音;其中,翻译语音为将源语音翻译为目标语种后的语音;控制器105,用于将翻译语音转换为与翻译语音所属语种对应的翻译文本;根据翻译文本生成虚拟翻译影像,并向投影装置104发送虚拟翻译影像;投影装置104,用于将虚拟翻译影像在显示装置108中进行投影显示。
在本公开实施例中,该同声传译接收设备可以为手持式同声传译接收设备,还可以为头戴式同声传译接收设备,如该同声传译接收设备可以为眼镜形态的接收设备,还可以为头盔形态的接收设备,需要说明的是,本公开实施例对同声传译接收设备的具体形态不做限定。
在本公开实施例中,语音获取装置103实时获取翻译语音,并将翻译语音发送至控制器105。其中,翻译语音为将源语音翻译为目标语种后的语音,源语音为会议发言人讲的语音,目标语种为与源语音所属语种不同的另一种语种。翻译语音为人工对源语音翻译后的语音,也可以为机器对源语音翻译后的语音。具体的,翻译语音可以为同声传译***中的同传译员人工翻译后的语音,此时,可通过同声传译***中的控制器105将同传译员人工翻译后的语音转换为光源,然后基于同声传译***中的红外辐射器将光源通过红外线传播出去,并转换为声音供同声传译接收设备100中的语音获取装置103接收。可选的,该翻译语音也可以为同声传译***中的中央控制器105自动翻译后的语音,然后通过网络将机器翻译语音传输至同声传译接收设备100。示例性的,可以当同声传译接收设备100开启时,也即同声传译接收设备100的电源开关被开启时,语音获取装置103实时获取翻译语音;也可以是同声传译接收设备100检测到其被用户穿戴或手持时,开启语音获取装置103获取翻译语音。具体的,同声传译接收设备100中可设置有检测装置,该检测装置可检测出该同声传译接收设备100是否被用户穿戴。例如,检测装置可以为压力传感器,压力传感器可设置在同声传译接收设备100的内表面,当同声传译接收设备100被用户穿戴时,压力传感器可检测到压力值,因此,可通过压力传感器检测到的压力值判断同声传译接收设备100是否被用户穿戴或手持。又如,检测装置还可以为距离传感,距离传感器可设置在同声传译接收设备100的侧表面,当同声传译接收设备100被用户穿戴或手持时,距离传感器可检测到同声传译接收设备100与用户间的距离,因此,可通过距离传感器检测到的距离值判断同声传译接收设备100是否被用户穿戴或手持。
在本公开实施例中,控制器105接收语音获取装置103发送的翻译语音,并基于语音识别技术将翻译语音转换为与所述翻译语音所属语种对应的翻译文本,即翻译语音与翻译文本对应同一语种。控制器105根据翻译文本生成虚拟翻译影像,并将虚拟翻译影像发送至投影装置104。其中,虚拟翻译影像可以理解为包含翻译文本的图像。具体的,可以基于预先训练的虚拟影像生成模型,根据翻译文本生成虚拟翻译影像。例如,将翻译文本输入至虚拟影像生成模型中,将虚拟影像生成模型的输出结果作为虚拟翻译影像。可选的,还可以基于图像生成算法,将虚拟翻译文本生成虚拟翻译影像。需要说明的是,本公开实施例对根据翻译文本生成虚拟翻译影像的具体实现方式不做限定。
投影装置104接收控制器105发送的虚拟翻译影像,并将虚拟翻译影像投影至显示装置108中,以使虚拟翻译影像在显示装置108中进行显示。
本公开实施例提供了一种同声传译接收设备,该同声传译接收设备包括:显示装置、语音获取装置、投影装置及控制器;其中,所述语音获取装置,用于实时获取翻译语音,并向所述控制器发送所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音;所述控制器,用于将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本;根据所述翻译文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像;所述投影装置,用于将所述虚拟翻译影像在显示装置中进行投影显示。本公开实施例提供的技术方案,可以将翻译文本进行投影显示,方便用户查看同声传译的翻译文本,大大提高了用户体验。
在一些实施例中,所述同声传译接收设备还包括:镜架101,其中,所述显示装置108、所述语音获取装置103、所述投影装置104及所述控制器105安装在所述镜架101上。这样设置的好处在于,可以解放用户双手,使用户更方便、直观地观看翻译文本,可进一步提高用户体验。
在一些实施例中,所述显示装置108包括增强现实AR镜片102;所述投影装置107具体用于:将所述虚拟翻译影像在所述AR镜片102中进行投影显示,以将所述虚拟翻译影像与现实场景在所述AR镜片102上进行叠加。可以将翻译文本叠加于现实场景中,既方便用户查看同声传译的翻译文本,又方便用户看到真实的画面信息,大大提高了用户体验。
图2是本公开一实施例中的一种同声传译接收设备100的结构示意图。如图2所示,该同声传译接收设备100,包括:镜架101、以及安装在镜架101上的增强现实AR镜片102、语音获取装置103、投影装置104及控制器105;其中,语音获取装置103,用于实时获取翻译语音,并向控制器105发送翻译语音;其中,翻译语音为将源语音翻译为目标语种后的语音;控制器105,用于将翻译语音转换为与翻译语音所属语种对应的翻译文本;根据翻译文本生成虚拟翻译影像,并向投影装置104发送虚拟翻译影像;投影装置104,用于将虚拟翻译影像在AR镜片102中进行投影显示,以将虚拟翻译影像与现实场景在AR镜片102上进行叠加。
具体的,投影装置104接收控制器105发送的虚拟翻译影像,并将虚拟翻译影像投影至增强现实(Augmented Reality,AR)镜片上,以使虚拟翻译影像在AR镜片102中进行显示。其中,AR镜片102为波导镜片,该波导镜片为半透明镜片,用户可以透过该AR镜片102看到真实世界中的物体、场景等真实画面,当将虚拟翻译影像投影至AR镜片102上时,用户还可以看到虚拟翻译影像中翻译文本。因此,这样佩戴同声传译接收设备100的用户不仅可以看到投影至镜片上的翻译文本,而且还可以透过AR镜片102看到真实的画面,即实现了虚拟翻译影像与现实场景在AR镜片102上进行叠加显示的效果,也即翻译文本的增强现实的显示效果。
示例性的,图3是本公开实施例中的一种同声传译接收设备100的显示效果示意图。如图3所示,翻译文本对应的语种为中文,穿戴有该同声传译接收设备100的用户,通过该同声传译接收设备100可以看到真实的会议场景以及叠加显示于现实场景的翻译文本,既方便用户查看翻译文本,又方便用户看到真实的画面信息,使用户能够领略会场表演、演讲全貌,真实感受现场大会氛围。
下面以同声传译接收设备100为眼镜对如下实施例进行解释说明,需要说明的是,并非将同声传译接收设备局限为眼镜形态。
在一些实施例中,所述控制器105具体用于:向所述投影装置104发送所述虚拟翻译影像以及投影位置控制指令;其中,所述投影位置控制指令用于指示所述虚拟翻译影像的投影位置;所述投影装置104具体用于:基于所述投影控制指令将所述虚拟翻译影像在所述显示装置108中进行投影显示。示例性的,以显示装置108为AR镜片为例进行解释说明。具体的,控制器105将虚拟翻译影像及投影位置控制指令发送至投影装置104,其中,投影位置控制指令中携带有虚拟翻译影像的投影位置。例如,控制器可预先确定虚拟影像的投影位置,并基于投影位置生成投影位置控制指令。其中,控制器105可以随机选择AR镜片102中的某位置区域作为虚拟翻译影像的投影位置,如可在AR镜片102的上半区域、下半区域、左半区域及右半区域中随机选择某位置区域作为虚拟翻译影像的投影位置;也可以将AR镜片102中的某一固定位置区域作为虚拟翻译影像的投影位置,如可以将AR镜片102的下半区域作为虚拟翻译影像的固定的投影位置;还可以根据虚拟翻译影像中所包含的翻译文本的长短,确定虚拟翻译影像的投影位置,如虚拟翻译影像中所包含的翻译文本较长时,可选择AR镜片102的下半区域作为虚拟翻译影像的投影位置,当虚拟翻译影像中所包含的翻译文本较短时,可选择AR镜片102的中间区域作为虚拟翻译影像的投影位置。需要说明的是,本公开实施例对虚拟翻译影像的投影位置的确定方式不做限定。其中,虚拟翻译影像的投影位置可以以在AR镜片102的位置坐标的形式表示。控制器105将虚拟翻译影像及投影位置控制指令共同发送至投影装置104,投影装置104基于投影位置控制指令将虚拟翻译影像投影至AR镜片102对应的位置区域。例如,控制器105可基于投影位置控制指令控制投影装置104旋转,以实现对投影装置104的投影方向和投影角度的微调,从而通过投影装置104将虚拟翻译影像在AR镜片102中的投影位置处进行投影显示。
在一些实施例中,所述投影装置104具体用于:将所述虚拟翻译影像在所述AR镜片102中的预设位置区域进行投影显示。示例性的,可将投影装置104在同声传译接收设备100的镜架101上设置为固定不可调,也即投影装置104104的投影方向和投影角度是固定不变得,使得投影装置104对准AR镜片102的预设位置区域,也即投影装置104可将各个影像投影至AR镜片102的预设位置区域。因此,当控制器105将虚拟翻译影像发送至投影装置104后,投影装置104将虚拟翻译影像在AR镜片102中的预设位置区域进行投影显示。可选的,预设位置区域可以为AR镜片102的下半屏区域。
图4是本公开一实施例中的一种同声传译接收设备100的结构示意图。如图4所示,所述同声传译接收设备100还包括:语音播放装置106;所述控制器105,还用于向所述语音播放装置106发送所述翻译语音;所述语音播放装置106,用于对所述翻译语音进行语音播放。这样设置的好处在于,不仅可以使用户看到翻译文本,还可以使用户收听与翻译文本对应的翻译语音,可大大提高用户体验。具体的,同声传译接收设备还包括语音播放装置106,其中,语音播放装置106可以包括耳机。控制器105将接收到的翻译语音发送至语音播放装置106,语音播放装置106接收到翻译语音后,对翻译语音进行语音播放。
在一些实施例中,所述同声传译接收设备还包括:耳机插孔;所述控制器还用于:当检测到外设耳机***所述耳机插孔时,控制所述外设耳机对所述翻译语音进行语音播放。这样设置的好处在于,不仅可以使用户看到翻译文本,还可以使用户收听与翻译文本对应的翻译语音,可大大提高用户体验。具体的,同声传译接收设备还包括耳机插孔,如该耳机插孔可设置在同声传译接收设备的镜架上。控制器实时监测耳机插孔的插拔状态,当检测到外设耳机***该耳机插孔时,控制外设耳机对翻译语音进行播放。其中,通过外设耳机对翻译语音进行播放时,可以实现语音的同声传译,也即同声传译接收设备通过耳机插孔与外设耳机连接时,可使同声传译接收设备为用户提供同声传译服务。
在一些实施例中,所述语音获取装置103,还用于实时采集所述源语音,并向所述控制器105发送所述源语音;所述控制器105,还用于将所述源语音转换为语所述源语音所属语种对应的源文本;根据所述翻译文本与所述源文本生成虚拟翻译影像,并向所述投影装置104发送所述虚拟翻译影像。具体的,语音获取模块实时采集会议发言人的语音信息,并将会议发言人的语音信息作为源语音,其中,源语音与翻译语音一一对应,且源语音所属的语种与翻译语音所属的语种不同。语音获取模块将源语音发送至控制器105,控制器105接收语音获取模块发送的源语音,并可基于自动语音识别(Automatic SpeechRecognition,ASR)技术对源语音进行语音识别,确定与所述源语音所属语种对应的源文本。控制器105根据翻译文本与源文本生成虚拟翻译影像,并将该虚拟翻译影像发送至投影装置104,以使投影装置104将该虚拟翻译影像投影至显示装置107上,其中,虚拟翻译影像可以理解为包含翻译文本及源文本的图像。这样设置的好处在于,可以将同声传译文本(源文本及翻译文本)同时叠加于现实场景中,方便用户查看同声传译文本,进一步提高了用户体验。
以显示装置为AR镜片为例进行举例说明。示例性的,图5是本公开实施例中的一种同声传译接收设备100的显示效果示意图。如图5所示,穿戴有该同声传译接收设备100的用户对应的语种为中文,会议发言人对应的语种为英文,则用户通过该同声传译接收设备100可以看到真实的会议场景以及叠加显示于现实场景的翻译文本及源文本,这样既方便用户查看翻译文本及源文本,又方便用户看到真实的画面信息。
可选的,在所述虚拟翻译影像中,所述翻译文本与所述源文本呈上下对应关系。示例性的,源文本为与会议发言人的语种对应的文字信息,翻译文本为与用户使用的语种对应的文字信息。因此,可将翻译文本与源文本呈上下对应关系的方式,生成虚拟翻译影像,可以理解的是,在虚拟翻译影像中的翻译文本呈现源文本的上方位置,且翻译文本与源文本一一对应,对照显示。这样设置的好处在于,将与用户语种对应的翻译文本在上,与会议发言人语种对应的源文本在下,并呈对应关系的方式进行显示,重点突出,简单清晰,可进一步提高用户的阅读体验。示例性的,图6是本公开实施例中的一种同声传译接收设备100的显示效果示意图。如图6所示,穿戴有该同声传译接收设备100的用户对应的语种为中文,会议发言人对应的语种为英文,则用户通过该同声传译接收设备100可以看到真实的会议场景以及叠加显示于现实场景的翻译文本及源文本,其中,翻译文本在上,源文本在下,对照显示,这样既方便用户查看翻译文本及源文本,又方便用户看到真实的画面信息。
如图4所示,所述同声传译接收设备100还包括:语种选择装置107;所述语种选择装置107,用于接收用户输入的语种选择指令,并向所述控制器105发送所述语种选择指令;所述控制器105,还用于根据所述语种选择指令确定所述翻译语音的接收频率,并控制所述语音获取装置103基于所述接收频率实时获取翻译语音。具体的,可在同声传译接收设备100中设置至少两个接收频率,每一接收频率对应一种语种,由语种选择装置107控制,用户可根据自己所需语种进行选择。示例性的,语种选择装置107可以为设置在镜架101上的选频开关,在选频开关上设置有至少两档选频数字,每一档选频数字代表一种语种。语种选择装置107接收用户输入的语种选择指令,并将语种选择指令发送至控制器105,控制器105接收语种选择装置107发送的语种选择指令,并根据该语种选择指令确定翻译语音的接收频率,并控制语音获取装置103基于该接收频率实时获取翻译语音。可以理解的是,基于该接收频率可以接收与语种选择指令对应语种的翻译文本。这样设置的好处在于,同声传译接收设备100可支持多语种翻译语音的收听,使用户根据需要自行选择收听或观看的语种。
图7是本公开一实施例中的一种语音翻译方法的流程图,本公开实施例可适用于对同声传译语音进行接收的情况,该方法可以由同声传译接收设备来执行。如图7所示,该方法具体包括如下步骤:
步骤710,通过语音获取装置实时获取翻译语音,并向控制器发送所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音。
步骤720,通过所述控制器将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本,根据所述翻译文本生成虚拟翻译影像,并向投影装置发送所述虚拟翻译影像。
步骤730,通过所述投影装置将所述虚拟翻译影像在显示装置中进行投影显示。
在本公开实施例提供了一种同声传译接收方法,该方法应用于同声传译接收设备,其中,同声传译接收设备包括:显示装置、语音获取装置、投影装置及控制器;通过语音获取装置实时获取翻译语音,并向控制器发送所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音;通过所述控制器将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本,根据所述翻译文本生成虚拟翻译影像,并向投影装置发送所述虚拟翻译影像;通过所述投影装置将所述虚拟翻译影像在显示装置中进行投影显示。本公开实施例提供的技术方案,可以将翻译文本投影显示,方便用户查看同声传译的翻译文本,大大提高了用户体验。
可选的,所述显示装置、所述语音获取装置、所述投影装置及所述控制器安装在镜架上。
可选的,所述显示装置包括增强现实AR镜片;
通过所述投影装置将所述虚拟翻译影像在显示装置中进行投影显示,包括:
通过所述投影装置将所述虚拟翻译影像在所述AR镜片中进行投影显示,以将所述虚拟翻译影像与现实场景在所述AR镜片上进行叠加。
可选的,向投影装置发送所述虚拟翻译影像,包括:
向所述投影装置发送所述虚拟翻译影像以及投影位置控制指令;其中,所述投影位置控制指令用于指示所述虚拟翻译影像的投影位置;
通过所述投影装置将所述虚拟翻译影像在显示装置中进行投影显示,包括:
通过所述投影装置基于所述投影控制指令将所述虚拟翻译影像在所述显示装置中进行投影显示。
可选的,还包括:
通过所述控制器向所述语音播放装置发送所述翻译语音;
通过所述语音播放装置对所述翻译语音进行语音播放。
可选的,所述语音播放装置包括耳机。
可选的,还包括:
当通过所述控制器检测到外设耳机***耳机插孔时,控制所述外设耳机对所述翻译语音进行语音播放。
可选的,还包括:
通过所述语音获取装置实时采集所述源语音,并向所述控制器发送所述源语音;
通过所述控制器将所述源语音转换为与所述源语音所属语种对应的源文本;根据所述翻译文本与所述源文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像。
可选的,在所述虚拟翻译影像中,所述翻译文本与所述源文本呈上下对应关系。
可选的,还包括:
通过语种选择装置接收用户输入的语种选择指令,并向所述控制器发送所述语种选择指令;
通过所述控制器根据所述语种选择指令确定所述翻译语音的接收频率,并控制所述语音获取装置基于所述接收频率实时获取翻译语音
根据本公开实施例的一个或多个实施例,本公开实施例提供了一种同声传译接收设备,包括:显示装置、语音获取装置、投影装置及控制器;其中,
所述语音获取装置,用于实时获取翻译语音,并向所述控制器发送将所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音;
所述控制器,用于将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本;根据所述翻译文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像;
所述投影装置,用于将所述虚拟翻译影像在所述显示装置中进行投影显示。
进一步的,所述同声传译接收设备还包括:镜架,其中,所述显示装置、所述语音获取装置、所述投影装置及所述控制器安装在所述镜架上。
进一步的,所述显示装置包括增强现实AR镜片;
所述投影装置具体用于:将所述虚拟翻译影像在所述AR镜片中进行投影显示,以将所述虚拟翻译影像与现实场景在所述AR镜片上进行叠加。
进一步的,所述控制器具体用于:向所述投影装置发送所述虚拟翻译影像以及投影位置控制指令;其中,所述投影位置控制指令用于指示所述虚拟翻译影像的投影位置;
所述投影装置具体用于:基于所述投影控制指令将所述虚拟翻译影像在所述显示装置中进行投影显示。
进一步的,所述同声传译接收设备还包括:语音播放装置;
所述控制器,还用于向所述语音播放装置发送所述翻译语音;
所述语音播放装置,用于对所述翻译语音进行语音播放。
进一步的,所述语音播放装置包括耳机。
进一步的,所述同声传译接收设备还包括:耳机插孔;
所述控制器还用于:当检测到外设耳机***所述耳机插孔时,控制所述外设耳机对所述翻译语音进行语音播放。
进一步的,所述语音获取装置,还用于实时采集所述源语音,并向所述控制器发送所述源语音;
所述控制器,还用于将所述源语音转换为与所述源语音所属语种对应的源文本;根据所述翻译文本与所述源文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像。
进一步的,在所述虚拟翻译影像中,所述翻译文本与所述源文本呈上下对应关系。
进一步的,所述同声传译接收设备还包括:语种选择装置;
所述语种选择装置,用于接收用户输入的语种选择指令,并向所述控制器发送所述语种选择指令;
所述控制器,还用于根据所述语种选择指令确定所述翻译语音的接收频率,并控制所述语音获取装置基于所述接收频率实时获取翻译语音。
注意,上述仅为本公开的较佳实施例及所运用技术原理。本领域技术人员会理解,本公开不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本公开的保护范围。因此,虽然通过以上实施例对本公开进行了较为详细的说明,但是本公开不仅仅限于以上实施例,在不脱离本公开构思的情况下,还可以包括更多其他等效实施例,而本公开的范围由所附的权利要求范围决定。

Claims (20)

1.一种同声传译接收设备,其特征在于,包括:显示装置、语音获取装置、投影装置及控制器;其中,
所述语音获取装置,用于实时获取翻译语音,并向所述控制器发送将所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音;
所述控制器,用于将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本;根据所述翻译文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像;
所述投影装置,用于将所述虚拟翻译影像在所述显示装置中进行投影显示。
2.根据权利要求1所述的同声传译接收设备,其特征在于,所述同声传译接收设备还包括:镜架,其中,所述显示装置、所述语音获取装置、所述投影装置及所述控制器安装在所述镜架上。
3.根据权利要求2所述的同声传译接收设备,其特征在于,所述显示装置包括增强现实AR镜片;
所述投影装置具体用于:将所述虚拟翻译影像在所述AR镜片中进行投影显示,以将所述虚拟翻译影像与现实场景在所述AR镜片上进行叠加。
4.根据权利要求1-3任一所述的同声传译接收设备,其特征在于,所述控制器具体用于:向所述投影装置发送所述虚拟翻译影像以及投影位置控制指令;其中,所述投影位置控制指令用于指示所述虚拟翻译影像的投影位置;
所述投影装置具体用于:基于所述投影控制指令将所述虚拟翻译影像在所述显示装置中进行投影显示。
5.根据权利要求1-3任一所述的同声传译接收设备,其特征在于,所述同声传译接收设备还包括:语音播放装置;
所述控制器,还用于向所述语音播放装置发送所述翻译语音;
所述语音播放装置,用于对所述翻译语音进行语音播放。
6.根据权利要求5所述的同声传译接收设备,其特征在于,所述语音播放装置包括耳机。
7.根据权利要求1-3任一所述的同声传译接收设备,其特征在于,所述同声传译接收设备还包括:耳机插孔;
所述控制器还用于:当检测到外设耳机***所述耳机插孔时,控制所述外设耳机对所述翻译语音进行语音播放。
8.根据权利要求1-3任一所述的同声传译接收设备,其特征在于,所述语音获取装置,还用于实时采集所述源语音,并向所述控制器发送所述源语音;
所述控制器,还用于将所述源语音转换为与所述源语音所属语种对应的源文本;根据所述翻译文本与所述源文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像。
9.根据权利要求8所述的同声传译接收设备,其特征在于,在所述虚拟翻译影像中,所述翻译文本与所述源文本呈上下对应关系。
10.根据权利要求1-3任一所述的同声传译接收设备,其特征在于,所述同声传译接收设备还包括:语种选择装置;
所述语种选择装置,用于接收用户输入的语种选择指令,并向所述控制器发送所述语种选择指令;
所述控制器,还用于根据所述语种选择指令确定所述翻译语音的接收频率,并控制所述语音获取装置基于所述接收频率实时获取翻译语音。
11.一种同声传译接收方法,其特征在于,应用于同声传译接收设备,包括:
通过语音获取装置实时获取翻译语音,并向控制器发送所述翻译语音;其中,所述翻译语音为将源语音翻译为目标语种后的语音;
通过所述控制器将所述翻译语音转换为与所述翻译语音所属语种对应的翻译文本,根据所述翻译文本生成虚拟翻译影像,并向投影装置发送所述虚拟翻译影像;
通过所述投影装置将所述虚拟翻译影像在显示装置中进行投影显示。
12.根据权利要求11所述的同声传译接收方法,其特征在于,所述显示装置、所述语音获取装置、所述投影装置及所述控制器安装在镜架上。
13.根据权利要求12所述的同声传译接收方法,其特征在于,所述显示装置包括增强现实AR镜片;
通过所述投影装置将所述虚拟翻译影像在显示装置中进行投影显示,包括:
通过所述投影装置将所述虚拟翻译影像在所述AR镜片中进行投影显示,以将所述虚拟翻译影像与现实场景在所述AR镜片上进行叠加。
14.根据权利要求11-13任一所述的同声传译接收方法,其特征在于,
向投影装置发送所述虚拟翻译影像,包括:
向所述投影装置发送所述虚拟翻译影像以及投影位置控制指令;其中,所述投影位置控制指令用于指示所述虚拟翻译影像的投影位置;
通过所述投影装置将所述虚拟翻译影像在显示装置中进行投影显示,包括:
通过所述投影装置基于所述投影控制指令将所述虚拟翻译影像在所述显示装置中进行投影显示。
15.根据权利要求11所述的同声传译接收方法,其特征在于,还包括:
通过所述控制器向所述语音播放装置发送所述翻译语音;
通过所述语音播放装置对所述翻译语音进行语音播放。
16.根据权利要求15所述的同声传译接收方法,其特征在于,所述语音播放装置包括耳机。
17.根据权利要求11-13任一所述的同声传译接收方法,其特征在于,还包括:
当通过所述控制器检测到外设耳机***耳机插孔时,控制所述外设耳机对所述翻译语音进行语音播放。
18.根据权利要求11-13任一所述的同声传译接收方法,其特征在于,还包括:
通过所述语音获取装置实时采集所述源语音,并向所述控制器发送所述源语音;
通过所述控制器将所述源语音转换为与所述源语音所属语种对应的源文本;根据所述翻译文本与所述源文本生成虚拟翻译影像,并向所述投影装置发送所述虚拟翻译影像。
19.根据权利要求18所述的同声传译接收方法,其特征在于,在所述虚拟翻译影像中,所述翻译文本与所述源文本呈上下对应关系。
20.根据权利要求11-13任一所述的同声传译接收方法,其特征在于,还包括:
通过语种选择装置接收用户输入的语种选择指令,并向所述控制器发送所述语种选择指令;
通过所述控制器根据所述语种选择指令确定所述翻译语音的接收频率,并控制所述语音获取装置基于所述接收频率实时获取翻译语音。
CN202110168881.8A 2021-02-07 2021-02-07 一种同声传译接收设备及方法 Pending CN112929633A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110168881.8A CN112929633A (zh) 2021-02-07 2021-02-07 一种同声传译接收设备及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110168881.8A CN112929633A (zh) 2021-02-07 2021-02-07 一种同声传译接收设备及方法

Publications (1)

Publication Number Publication Date
CN112929633A true CN112929633A (zh) 2021-06-08

Family

ID=76171154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110168881.8A Pending CN112929633A (zh) 2021-02-07 2021-02-07 一种同声传译接收设备及方法

Country Status (1)

Country Link
CN (1) CN112929633A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115460371A (zh) * 2021-06-09 2022-12-09 苏州译牛智能科技有限公司 一种视频会议中的同声传译方法、服务器和可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160092438A1 (en) * 2014-09-30 2016-03-31 Kabushiki Kaisha Toshiba Machine translation apparatus, machine translation method and program product for machine translation
CN109033423A (zh) * 2018-08-10 2018-12-18 北京搜狗科技发展有限公司 同传字幕显示方法及装置、智能会议方法、装置及***
CN109696748A (zh) * 2019-02-14 2019-04-30 郑州诚优成电子科技有限公司 一种用于同步翻译的增强现实字幕眼镜
CN111144138A (zh) * 2019-12-17 2020-05-12 Oppo广东移动通信有限公司 一种同声传译方法及装置、存储介质
CN111597828A (zh) * 2020-05-06 2020-08-28 Oppo广东移动通信有限公司 翻译显示方法、装置、头戴显示设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160092438A1 (en) * 2014-09-30 2016-03-31 Kabushiki Kaisha Toshiba Machine translation apparatus, machine translation method and program product for machine translation
CN109033423A (zh) * 2018-08-10 2018-12-18 北京搜狗科技发展有限公司 同传字幕显示方法及装置、智能会议方法、装置及***
CN109696748A (zh) * 2019-02-14 2019-04-30 郑州诚优成电子科技有限公司 一种用于同步翻译的增强现实字幕眼镜
CN111144138A (zh) * 2019-12-17 2020-05-12 Oppo广东移动通信有限公司 一种同声传译方法及装置、存储介质
CN111597828A (zh) * 2020-05-06 2020-08-28 Oppo广东移动通信有限公司 翻译显示方法、装置、头戴显示设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115460371A (zh) * 2021-06-09 2022-12-09 苏州译牛智能科技有限公司 一种视频会议中的同声传译方法、服务器和可读存储介质

Similar Documents

Publication Publication Date Title
CN107103801B (zh) 远程三维场景互动教学***及控制方法
US7221405B2 (en) Universal closed caption portable receiver
CN105912106A (zh) 一种智能投影交互***及其交互方法
US20120077172A1 (en) Presentation system
CN110958537A (zh) 一种智能音箱及智能音箱使用的方法
KR20130045553A (ko) 휴대용 단말기에서 입체 데이터를 생성하기 위한 장치 및 방법
TW201310404A (zh) 手語翻譯系統、手語翻譯裝置及手語翻譯方法
CN112165648B (zh) 一种音频播放的方法、相关装置、设备及存储介质
CN112001189A (zh) 实时外语沟通***
CN112929633A (zh) 一种同声传译接收设备及方法
CN112951236A (zh) 一种语音翻译设备及方法
TWI798686B (zh) 回應於用於控制一裝置提供視訊至播放裝置之遙控信號之偵測而修正替換內容之播放的方法及相關非暫時性電腦可讀媒體與運算系統
CN111163280B (zh) 非对称性视频会议***及其方法
JP2010206265A (ja) 音像制御装置、音像制御方法、ストリームのデータ構造、及びストリーム生成装置
WO2019150996A1 (ja) 言語提示装置、言語提示方法、及び言語提示プログラム
CN110941381A (zh) 会议一体机的显示屏亮度调节方法、***及会议一体机
JP5081207B2 (ja) テレビジョン装置及びその操作方法
JP6212719B2 (ja) 映像受信装置、情報表示方法および映像受信システム
JP2005303683A (ja) 画像送受信装置
CN111128180A (zh) 一种听力障碍者的辅助对话***
JPH1141538A (ja) 音声認識文字表示装置
CN112764549B (zh) 翻译方法、装置、介质和近眼显示设备
JP2002304286A (ja) 音声認識機能を内蔵した映像表示装置
KR102284914B1 (ko) 프리셋 영상이 구현되는 사운드 트랙킹 시스템
WO2011077627A1 (ja) 放送受信装置及び放送受信装置における番組情報音声出力方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination