CN113377276A - 速录转译的***、方法、装置、电子设备以及存储介质 - Google Patents
速录转译的***、方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN113377276A CN113377276A CN202110547675.8A CN202110547675A CN113377276A CN 113377276 A CN113377276 A CN 113377276A CN 202110547675 A CN202110547675 A CN 202110547675A CN 113377276 A CN113377276 A CN 113377276A
- Authority
- CN
- China
- Prior art keywords
- text information
- language
- text
- translation
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000004891 communication Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000009877 rendering Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0489—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using dedicated keyboard keys or combinations thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本申请提供了一种速录转译的***、方法、装置、电子设备以及存储介质,其中,该***包括:操作区域,操作区域内提供有速录机的输入键盘,速录机输入键盘用于输入所在环境的语音信息相匹配的第一文本信息,其中,语音信息是属于第一用户的,第一用户使用第一语种与第二用户进行交互,第一文本信息为属于第一语种的文本信息,第二用户为使用第二语种进行交互的用户;处理器,处理器用于根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。通过本申请,解决了相关技术中存在的语音识别不准确或者语音识别存在歧异的问题。
Description
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种速录转译的***、方法、装置、电子设备以及存储介质。
背景技术
目前,随着中国市场日趋国际化,各国间的贸易往来更为密切,这将促使会议对翻译工作的需求日趋增加,各种国际会议、论坛现场、大型远程会议、国际课程培训活动时也时常需要同声翻译。
为了能够满足企业、事业单位、高校、法庭、大型会议等有多语言实时交流需求的会议,当下通常是利用人工智能语音识别技术完成交流翻译,但是人工智能语音识别对各种不同口音、方言识别的质量不高,容易产生错误,导致语音识别不准确或者语音识别存在歧异,给参会人员带来语言方面的理解错误。
因此,相关技术中存在语音识别不准确或者语音识别存在歧异的问题。
发明内容
本申请提供了一种速录转译的***、方法、装置、电子设备以及存储介质,以至少解决相关技术中存在语音识别不准确或者语音识别存在歧异的问题。
根据本申请实施例的一个方面,提供了一种速录转译的***,该***包括:
操作区域,所述操作区域内提供有速录机的输入键盘,所述速录机输入键盘用于输入所在环境的语音信息相匹配的第一文本信息,其中,所述语音信息是属于第一用户的,所述第一用户使用第一语种与第二用户进行交互,所述第一文本信息为属于所述第一语种的文本信息,所述第二用户为使用第二语种进行交互的用户;
处理器,所述处理器用于根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息,其中,所述目标方案用于指示对所述第一文本信息进行转译。
可选地,该***还包括:
显示区域,所述显示区域用于对所述第一文本信息和所述第二文本信息进行显示。
可选地,操作区域包括操作屏幕,所述操作屏幕用于显示所述第一文本信息。
根据本申请实施例的另一个方面,还提供了一种速录转译的方法,该方法包括:
获取第一文本信息,其中,所述第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,所述速录机输入键盘是***操作区域提供的,所述语音信息是属于第一用户的,所述第一用户使用第一语种与第二用户进行交互,所述第一文本信息为属于所述第一语种的文本信息,所述第二用户为使用第二语种进行交互的用户;
根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息,其中,所述目标方案用于指示对所述第一文本信息进行转译。
可选地,根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息之后,所述方法还包括:
接收所述第二文本信息;
利用可视化软件将所述第一文本信息和所述第二文本信息进行显示。
可选地,根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息包括:
将所述第一文本信息与目标方案中的预设文本信息进行匹配;
在所述第一文本信息中存在与所述预设文本信息匹配的目标文本信息的情况下,利用智能翻译引擎对所述第一文本信息进行转译处理,得到所述第二文本信息。
可选地,该方法还包括:
获取第一文本信息之后,将所述第一文本信息与文本数据库内存储的各个文本信息进行相似度比较,其中,所述文本数据库用于校正所述第一文本信息;
在所述第一文本信息与参考文本信息之间的相似度比较结果小于预设阈值的情况下,确定所述第一文本信息为错误的文本信息,其中,所述参考文本信息为所述各个文本信息中的任意一个文本信息;
利用所述参考文本信息替换所述第一文本信息。
根据本申请实施例的又一个方面,还提供了一种速录转译的装置,该装置包括:
获取单元,用于获取第一文本信息,其中,所述第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,所述速录机输入键盘是***操作区域提供的,所述语音信息是属于第一用户的,所述第一用户使用第一语种与第二用户进行交互,所述第一文本信息为属于所述第一语种的文本信息,所述第二用户为使用第二语种进行交互的用户;
转译单元,用于根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息,其中,所述目标方案用于指示对所述第一文本信息进行转译。
可选地,该装置还包括:
接收单元,用于根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息之后,接收所述第二文本信息;
显示单元,用于利用可视化软件将所述第一文本信息和所述第二文本信息进行显示。
可选地,转译单元包括:
匹配模块,用于将所述第一文本信息与目标方案中的预设文本信息进行匹配;
转译模块,用于在所述第一文本信息中存在与所述预设文本信息匹配的目标文本信息的情况下,利用智能翻译引擎对所述第一文本信息进行转译处理,得到所述第二文本信息。
可选地,该装置还包括:
比较单元,用于获取第一文本信息之后,将所述第一文本信息与文本数据库内存储的各个文本信息进行相似度比较,其中,所述文本数据库用于校正所述第一文本信息;
确定单元,用于在所述第一文本信息与参考文本信息之间的相似度比较结果小于预设阈值的情况下,确定所述第一文本信息为错误的文本信息,其中,所述参考文本信息为所述各个文本信息中的任意一个文本信息;
替换单元,用于利用所述参考文本信息替换所述第一文本信息。
根据本申请实施例的又一个方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;其中,存储器,用于存储计算机程序;处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行上述任一实施例中的速录转译的方法步骤。
根据本申请实施例的又一个方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一实施例中的速录转译的方法步骤。
在本申请实施例中,采用速录机输入语音信息的方式,通过获取第一文本信息,其中,第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,速录机输入键盘是***操作区域提供的,语音信息是属于第一用户的,第一用户使用第一语种与第二用户进行交互,第一文本信息为属于第一语种的文本信息,第二用户为使用第二语种进行交互的用户;根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。由于本申请是采用速录机键盘输入语音信息,从而可以提升目前行业语音识别同传***对不同口音、方言及收音质量不高的效率的问题,达到了降低语音识别错误率的技术效果,进而解决了相关技术中存在的语音识别不准确或者语音识别存在歧异的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例的一种可选的速录转译的***的示意图;
图2是根据本申请实施例的一种可选的速录转译的方法的流程示意图;
图3是根据本申请实施例的一种可选的速录转译的装置的结构框图;
图4是根据本申请实施例的一种可选的电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了能够满足企业、事业单位、高校、法庭、大型会议等有多语言实时交流需求的会议,当下通常是利用人工智能语音识别技术完成交流翻译,但是人工智能语音识别对各种不同口音、方言识别的质量不高,容易产生错误,导致语音识别不准确或者语音识别存在歧异,给参会人员带来语言方面的理解错误。为了解决上述问题,本申请实施例提出一种速录转译的***,该***包括:
操作区域,操作区域内提供有速录机的输入键盘,速录机输入键盘用于输入所在环境的语音信息相匹配的第一文本信息,其中,语音信息是属于第一用户的,第一用户使用第一语种与第二用户进行交互,第一文本信息为属于第一语种的文本信息,第二用户为使用第二语种进行交互的用户;
处理器,处理器用于根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。
可选地,如图1所示,本申请实施例提供的速录转译***是由操作区域1和处理器2组成的,操作区域1与处理器2相连接,其中,操作区域1中提供有速录机的输入键盘,也提供有操控速录机的各种操作***等,速录员在现场环境接听到语音信息后,会利用速录机输入键盘输入与该语音信息相匹配(相一致)的第一文本信息,比如,输入中文信息,也可输入英文信息等,本申请实施例不对第一文本信息的语种做具体限定。
需要说明的是,本申请实施例的速录转译***应用于国际会议、论坛现场、大型远程会议、国际课程培训等场景,所以,这时会存在第一用户使用第一语种与第二用户进行交互,这时,第二用户则是使用第二语种进行交互的用户,比如,在某一国际会议,第一用户(A国人)需要和第二用户(B国人)进行交互时,这时可以利用本申请实施例的速录转译***对第一用户的语音信息进行翻译。其中,第一用户使用的语种得到的语音称为第一文本信息,第二用户使用的语种得到的语音称为第二文本信息。
在本申请实施例的速录转译***中,利用处理器对第一文本信息进行处理,这时需要依据处理器内设置的目标方案执行对第一文本信息的翻译处理,将转译后的文本信息作为第二语种的第二文本信息。
在本申请实施例中,采用速录机输入语音信息的方式,通过操作区域内提供有速录机的输入键盘,速录机输入键盘用于输入所在环境的语音信息相匹配的第一文本信息,处理器根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。由于本申请是采用速录机键盘输入语音信息,从而可以提升目前行业语音识别同传***对不同口音、方言及收音质量不高的效率的问题,达到了降低语音识别错误率的技术效果,进而解决了相关技术中存在的语音识别不准确或者语音识别存在歧异的问题。
作为一种可选实施例,该***还包括:
显示区域,显示区域用于对第一文本信息和第二文本信息进行显示。
可选地,如图1所示,该***还包括显示区域3,该显示区域3与操作区域1和处理器2相连接,该显示区域3用于实时滚动显示第一文本信息和第二文本信息,保证翻译内容和原文的准确性的同时,可以让现场的会议参会人员观看双语滚动直播。另外,会议内容(即第一文本信息和第二文本信息)会实时的保存在速录转译***里面,以便以后进行核对和校验。如图1,该显示区域3可以是给参会人员显示的第二屏。
需要说明的是,本申请实施例采用Vue+Electron前后端结合技术。随着前端技术的不断发展,现今也能使用前端技术开发各个***的客户端软件,本申请实施例的速录转译***就是采用前端技术开发出来的新型跨端的客户端软件。
在本申请实施例中,可以通过显示区域实时展示原文第一文本信息和翻译的第二文本信息,便于参会人员实时观看。
作为一种可选实施例,操作区域包括操作屏幕,操作屏幕用于显示第一文本信息。
可选地,如图1,在操作区域内包括速录员观看操作情况的操作屏幕,该操作屏幕主要便于速录员对自己利用速录机输入的第一文本信息进行查看。如图1,该操作屏幕可以作为速录员操作的第一屏。
根据本申请实施例的一个方面,提供了一种速录转译的方法,该方法运行在速录转译的***服务器上,如图2所示,图2是根据本申请实施例的一种可选的速录转译的方法的流程示意图,该方法的流程可以包括以下步骤:
步骤S201,获取第一文本信息,其中,第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,速录机输入键盘是***操作区域提供的,语音信息是属于第一用户的,第一用户使用第一语种与第二用户进行交互,第一文本信息为属于第一语种的文本信息,第二用户为使用第二语种进行交互的用户。
可选地,***服务器获取到速录员利用速录机输入键盘输入第一文本信息,该第一文本信息是速录员在现场环境接听到第一用户说出的语音信息,然后***服务器基于第一文本信息执行翻译操作。
需要说明的是,本申请实施例的速录转译***应用于国际会议、论坛现场、大型远程会议、国际课程培训等场景,所以,这时会存在第一用户使用第一语种与第二用户进行交互,这时,第二用户则是使用第二语种进行交互的用户,比如,在某一国际会议,第一用户(A国人)需要和第二用户(B国人)进行交互时,这时可以利用本申请实施例的速录转译***对第一用户的语音信息进行翻译。其中,第一用户使用的语种得到的语音称为第一文本信息,第二用户使用的语种得到的语音称为第二文本信息。
步骤S202,根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。
可选地,***服务器接收到第一文本信息后,根据存储的目标方案对第一文本信息进行转译处理,将转译后的文本信息作为第二语种的第二文本信息。
在本申请实施例中,采用速录机输入语音信息的方式,通过获取第一文本信息,其中,第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,速录机输入键盘是***操作区域提供的,语音信息是属于第一用户的,第一用户使用第一语种与第二用户进行交互,第一文本信息为属于第一语种的文本信息,第二用户为使用第二语种进行交互的用户;根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。由于本申请是采用速录机键盘输入语音信息,从而可以提升目前行业语音识别同传***对不同口音、方言及收音质量不高的效率的问题,达到了降低语音识别错误率的技术效果,进而解决了相关技术中存在的语音识别不准确或者语音识别存在歧异的问题。
作为一种可选实施例,根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息之后,方法还包括:
接收第二文本信息;
利用可视化软件将第一文本信息和第二文本信息进行显示。
可选地,本申请实施例为了方便参会人员观看原文和翻译文本,利用可视化软件将第一文本信息和第二文本信息显示在屏幕上。这样,参会人员也可以针对原文和翻译文本进行查看和校正,提高翻译准确度。
作为一种可选实施例,根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息包括:
将第一文本信息与目标方案中的预设文本信息进行匹配;
在第一文本信息中存在与预设文本信息匹配的目标文本信息的情况下,利用智能翻译引擎对第一文本信息进行转译处理,得到第二文本信息。
可选地,在对第一文本信息进行转译之前,通常设置有一转译规则(即目标方案),只有在满足该转译规则时,才执行对第一文本的转译操作。具体地,本申请实施例可以设置处理参数为一些标点符号,比如:句号、分号、感叹号、问号,将这些标点参数作为目标方案中预设的文本信息,然后查看第一文本信息中是否存在与预设文本信息相匹配的目标文本信息,其中,目标文本信息就是句号或分号或感叹号或问号。
如果在第一文本信息中存在与预设文本信息匹配的目标文本信息的情况下,说明当前第一文本信息所在的段落已经结束了,这时可以对整个段落进行转译处理操作,此时,可以利用各个企业自研出的智能翻译引擎对第一文本信息进行转译处理,进而得到翻译后的第二文本信息。
在本申请实施例中,根据第一文本信息与目标方案中的预设文本信息之间的匹配结果,确定是否对第一文本信息进行转译,同时利用自研的智能翻译引擎为第一文本信息进行翻译,这样能够提供有力的补充和保障。
作为一种可选实施例,获取第一文本信息之后,方法还包括:
将第一文本信息与文本数据库内存储的各个文本信息进行相似度比较,其中,文本数据库用于校正第一文本信息;
在第一文本信息与参考文本信息之间的相似度比较结果小于预设阈值的情况下,确定第一文本信息为错误的文本信息,其中,参考文本信息为各个文本信息中的任意一个文本信息;
利用参考文本信息替换第一文本信息。
可选地,本申请实施例提供一种校正原文和校正翻译文本的方式,具体地,在***的文本数据库内存储各种正确的文本信息,将第一文本信息与这些文本信息进行相似度的比较,在第一文本信息与各个文本信息中的任意一个文本信息进行比较后,出现一参考文本信息与第一文本信息之间的相似度比较结果小于预设阈值时,则说明该第一文本信息可能是错误的文本信息,可能是速录员输入错误,在第一文本信息出现错误的情况下,那翻译得到的第二文本信息相应也会出现错误,所以,这时应该将参考文本信息替换掉第一文本信息,然后以参考文本作为待转译的文本信息,进而得到正确的转译文本(即第二文本信息)。
其中,本申请实施例中涉及的预设阈值是一个比较第一文本信息与各个文本信息之间相似的最低值,只有大于或者等于该预设阈值,才说明第一文本信息是正确的文本信息,该预设阈值可以设置为85%等。
之后,可以将正确的第一文本信息和正确的第二文本信息进行存储,以便后续进行查看和校验。
在本申请实施例中,可以在会议过程中及时修改原文内容,进而及时纠正翻译错误的语句段,解决了同传行业内需要人工修改来完成语音识别过程中的错误率,减少会后双语文字内容修改整理工作,快速形成会后查阅双语会议纪要功能。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM(Read-Only Memory,只读存储器)/RAM(Random Access Memory,随机存取存储器)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述速录转译的方法的速录转译的装置。图3是根据本申请实施例的一种可选的速录转译的装置的结构框图,如图3所示,该装置可以包括:
获取单元301,用于获取第一文本信息,其中,第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,速录机输入键盘是***操作区域提供的,语音信息是属于第一用户的,第一用户使用第一语种与第二用户进行交互,第一文本信息为属于第一语种的文本信息,第二用户为使用第二语种进行交互的用户;
转译单元302,与获取单元301相连,用于根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。
需要说明的是,该实施例中的获取单元301可以用于执行上述步骤S201,该实施例中的转译单元302可以用于执行上述步骤S202。
通过上述模块,采用速录机输入语音信息的方式,通过获取第一文本信息,其中,第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,速录机输入键盘是***操作区域提供的,语音信息是属于第一用户的,第一用户使用第一语种与第二用户进行交互,第一文本信息为属于第一语种的文本信息,第二用户为使用第二语种进行交互的用户;根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。由于本申请是采用速录机键盘输入语音信息,从而可以提升目前行业语音识别同传***对不同口音、方言及收音质量不高的效率的问题,达到了降低语音识别错误率的技术效果,进而解决了相关技术中存在的语音识别不准确或者语音识别存在歧异的问题。
作为一种可选的实施例,该装置还包括:
接收单元,用于根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息之后,接收第二文本信息;
显示单元,用于利用可视化软件将第一文本信息和第二文本信息进行显示。
作为一种可选的实施例,转译单元302包括:
匹配模块,用于将第一文本信息与目标方案中的预设文本信息进行匹配;
转译模块,用于在第一文本信息中存在与预设文本信息匹配的目标文本信息的情况下,利用智能翻译引擎对第一文本信息进行转译处理,得到第二文本信息。
作为一种可选的实施例,该装置还包括:
比较单元,用于获取第一文本信息之后,将第一文本信息与文本数据库内存储的各个文本信息进行相似度比较,其中,文本数据库用于校正第一文本信息;
确定单元,用于在第一文本信息与参考文本信息之间的相似度比较结果小于预设阈值的情况下,确定第一文本信息为错误的文本信息,其中,参考文本信息为各个文本信息中的任意一个文本信息;
替换单元,用于利用参考文本信息替换第一文本信息。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。
根据本申请实施例的又一个方面,还提供了一种用于实施上述速录转译的方法的电子设备,该电子设备可以是服务器、终端、或者其组合。
图4是根据本申请实施例的一种可选的电子设备的结构框图,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401、通信接口402和存储器403通过通信总线404完成相互间的通信,其中,
存储器403,用于存储计算机程序;
处理器401,用于执行存储器403上所存放的计算机程序时,实现如下步骤:
S1,获取第一文本信息,其中,第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,速录机输入键盘是***操作区域提供的,语音信息是属于第一用户的,第一用户使用第一语种与第二用户进行交互,第一文本信息为属于第一语种的文本信息,第二用户为使用第二语种进行交互的用户;
S2,根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。
可选地,在本实施例中,上述的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线、或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM,也可以包括非易失性存储器(non-volatile memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
作为一种示例,如图4所示,上述存储器403中可以但不限于包括上述速录转译的装置中的获取单元301、转译单元302。此外,还可以包括但不限于上述速录转译的装置中的其他模块单元,本示例中不再赘述。
上述处理器可以是通用处理器,可以包含但不限于:CPU(Central ProcessingUnit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(DigitalSignal Processing,数字信号处理器)、ASIC(Application Specific IntegratedCircuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
此外,上述电子设备还包括:显示器,用于显示速录转系***转译的结果。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图4所示的结构仅为示意,实施上述速录转译的方法的设备可以是终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图4其并不对上述电子设备的结构造成限定。例如,终端设备还可包括比图4中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图4所示的不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
根据本申请实施例的又一个方面,还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行速录转译的方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,获取第一文本信息,其中,第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,速录机输入键盘是***操作区域提供的,语音信息是属于第一用户的,第一用户使用第一语种与第二用户进行交互,第一文本信息为属于第一语种的文本信息,第二用户为使用第二语种进行交互的用户;
S2,根据目标方案对第一文本信息进行转译处理,得到属于第二语种的第二文本信息,其中,目标方案用于指示对第一文本信息进行转译。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例中对此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
根据本申请实施例的又一个方面,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中;计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一个实施例中的速录转译的方法步骤。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例速录转译的方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例中所提供的方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种速录转译的***,其特征在于,所述***包括:
操作区域,所述操作区域内提供有速录机的输入键盘,所述速录机输入键盘用于输入所在环境的语音信息相匹配的第一文本信息,其中,所述语音信息是属于第一用户的,所述第一用户使用第一语种与第二用户进行交互,所述第一文本信息为属于所述第一语种的文本信息,所述第二用户为使用第二语种进行交互的用户;
处理器,所述处理器用于根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息,其中,所述目标方案用于指示对所述第一文本信息进行转译。
2.根据权利要求1所述的***,其特征在于,所述***还包括:
显示区域,所述显示区域用于对所述第一文本信息和所述第二文本信息进行显示。
3.根据权利要求1所述的***,其特征在于,所述操作区域包括操作屏幕,所述操作屏幕用于显示所述第一文本信息。
4.一种速录转译的方法,其特征在于,所述方法包括:
获取第一文本信息,其中,所述第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,所述速录机输入键盘是***操作区域提供的,所述语音信息是属于第一用户的,所述第一用户使用第一语种与第二用户进行交互,所述第一文本信息为属于所述第一语种的文本信息,所述第二用户为使用第二语种进行交互的用户;
根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息,其中,所述目标方案用于指示对所述第一文本信息进行转译。
5.根据权利要求4所述的方法,其特征在于,所述根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息之后,所述方法还包括:
接收所述第二文本信息;
利用可视化软件将所述第一文本信息和所述第二文本信息进行显示。
6.根据权利要求4所述的方法,其特征在于,所述根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息包括:
将所述第一文本信息与目标方案中的预设文本信息进行匹配;
在所述第一文本信息中存在与所述预设文本信息匹配的目标文本信息的情况下,利用智能翻译引擎对所述第一文本信息进行转译处理,得到所述第二文本信息。
7.根据权利要求4至6中任一项所述方法,其特征在于,所述获取第一文本信息之后,所述方法还包括:
将所述第一文本信息与文本数据库内存储的各个文本信息进行相似度比较,其中,所述文本数据库用于校正所述第一文本信息;
在所述第一文本信息与参考文本信息之间的相似度比较结果小于预设阈值的情况下,确定所述第一文本信息为错误的文本信息,其中,所述参考文本信息为所述各个文本信息中的任意一个文本信息;
利用所述参考文本信息替换所述第一文本信息。
8.一种速录转译的装置,其特征在于,所述装置包括:
获取单元,用于获取第一文本信息,其中,所述第一文本信息是利用速录机输入键盘输入所在环境的语音信息相匹配的信息,所述速录机输入键盘是***操作区域提供的,所述语音信息是属于第一用户的,所述第一用户使用第一语种与第二用户进行交互,所述第一文本信息为属于所述第一语种的文本信息,所述第二用户为使用第二语种进行交互的用户;
转译单元,用于根据目标方案对所述第一文本信息进行转译处理,得到属于所述第二语种的第二文本信息,其中,所述目标方案用于指示对所述第一文本信息进行转译。
9.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,其特征在于,
所述存储器,用于存储计算机程序;
所述处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行权利要求4至7中任一项所述的速录转译的方法步骤。
10.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求4至7中任一项中所述的速录转译的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110547675.8A CN113377276A (zh) | 2021-05-19 | 2021-05-19 | 速录转译的***、方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110547675.8A CN113377276A (zh) | 2021-05-19 | 2021-05-19 | 速录转译的***、方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113377276A true CN113377276A (zh) | 2021-09-10 |
Family
ID=77571352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110547675.8A Pending CN113377276A (zh) | 2021-05-19 | 2021-05-19 | 速录转译的***、方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113377276A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0728821A (ja) * | 1993-07-09 | 1995-01-31 | Fujitsu Ltd | テキスト処理装置 |
CN101206643A (zh) * | 2006-12-21 | 2008-06-25 | 中国科学院计算技术研究所 | 一种融合了句型模板和统计机器翻译技术的翻译方法 |
US20090076792A1 (en) * | 2005-12-16 | 2009-03-19 | Emil Ltd | Text editing apparatus and method |
US7539619B1 (en) * | 2003-09-05 | 2009-05-26 | Spoken Translation Ind. | Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy |
JP2010170303A (ja) * | 2009-01-22 | 2010-08-05 | Toshiba Corp | 機械翻訳装置及びプログラム |
US20140114642A1 (en) * | 2012-10-19 | 2014-04-24 | Laurens van den Oever | Statistical linguistic analysis of source content |
CN107679032A (zh) * | 2017-09-04 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 语音转换纠错方法和装置 |
CN107832308A (zh) * | 2017-12-11 | 2018-03-23 | 中译语通科技股份有限公司 | 一种机器翻译的断句方法及***、计算机程序、计算机 |
US20180101366A1 (en) * | 2016-10-11 | 2018-04-12 | Sap Se | Reducing translation volume and ensuring consistent text strings in software development |
CN109325237A (zh) * | 2018-10-22 | 2019-02-12 | 传神语联网网络科技股份有限公司 | 用于机器翻译的完整句识别方法与*** |
CN109522564A (zh) * | 2018-12-17 | 2019-03-26 | 北京百度网讯科技有限公司 | 语音翻译方法和装置 |
CN111862940A (zh) * | 2020-07-15 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 基于耳机实现的翻译方法、装置、***、设备和存储介质 |
CN112711954A (zh) * | 2020-12-31 | 2021-04-27 | 维沃软件技术有限公司 | 翻译方法、装置、电子设备和存储介质 |
-
2021
- 2021-05-19 CN CN202110547675.8A patent/CN113377276A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0728821A (ja) * | 1993-07-09 | 1995-01-31 | Fujitsu Ltd | テキスト処理装置 |
US7539619B1 (en) * | 2003-09-05 | 2009-05-26 | Spoken Translation Ind. | Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy |
US20090076792A1 (en) * | 2005-12-16 | 2009-03-19 | Emil Ltd | Text editing apparatus and method |
CN101206643A (zh) * | 2006-12-21 | 2008-06-25 | 中国科学院计算技术研究所 | 一种融合了句型模板和统计机器翻译技术的翻译方法 |
JP2010170303A (ja) * | 2009-01-22 | 2010-08-05 | Toshiba Corp | 機械翻訳装置及びプログラム |
US20140114642A1 (en) * | 2012-10-19 | 2014-04-24 | Laurens van den Oever | Statistical linguistic analysis of source content |
US20180101366A1 (en) * | 2016-10-11 | 2018-04-12 | Sap Se | Reducing translation volume and ensuring consistent text strings in software development |
CN107679032A (zh) * | 2017-09-04 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 语音转换纠错方法和装置 |
CN107832308A (zh) * | 2017-12-11 | 2018-03-23 | 中译语通科技股份有限公司 | 一种机器翻译的断句方法及***、计算机程序、计算机 |
CN109325237A (zh) * | 2018-10-22 | 2019-02-12 | 传神语联网网络科技股份有限公司 | 用于机器翻译的完整句识别方法与*** |
CN109522564A (zh) * | 2018-12-17 | 2019-03-26 | 北京百度网讯科技有限公司 | 语音翻译方法和装置 |
CN111862940A (zh) * | 2020-07-15 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 基于耳机实现的翻译方法、装置、***、设备和存储介质 |
CN112711954A (zh) * | 2020-12-31 | 2021-04-27 | 维沃软件技术有限公司 | 翻译方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020186778A1 (zh) | 错词纠正方法、装置、计算机装置及存储介质 | |
US10176366B1 (en) | Video relay service, communication system, and related methods for performing artificial intelligence sign language translation services in a video relay service environment | |
CN108460026B (zh) | 一种翻译方法及装置 | |
US20110066421A1 (en) | User-interactive automatic translation device and method for mobile device | |
CN111310440A (zh) | 文本的纠错方法、装置和*** | |
CN111832449A (zh) | 工程图纸的显示方法及相关装置 | |
JP7199061B2 (ja) | 翻訳装置 | |
CN110728156B (zh) | 翻译方法、装置、电子设备及可读存储介质 | |
KR20150117914A (ko) | 다수 사용자 참여형 언어 학습 시스템 | |
CN112447168A (zh) | 语音识别***、方法、音箱、显示设备和交互平台 | |
CN113889092A (zh) | 语音识别结果的后处理模型的训练方法、处理方法及装置 | |
CN112466286A (zh) | 数据处理方法及装置、终端设备 | |
CN113377276A (zh) | 速录转译的***、方法、装置、电子设备以及存储介质 | |
CN111062221A (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN116303937A (zh) | 回复方法、装置、电子设备及可读存储介质 | |
CN116013307A (zh) | 一种标点预测方法、装置、设备以及计算机存储介质 | |
CN114155841A (zh) | 语音识别方法、装置、设备及存储介质 | |
CN114417834A (zh) | 文本的处理方法、装置、电子设备及可读存储介质 | |
CN114330311A (zh) | 一种翻译方法、装置、电子设备和计算机可读存储介质 | |
CN113254579A (zh) | 语音检索方法、装置及电子设备 | |
CN113221514A (zh) | 文本处理方法、装置、电子设备和存储介质 | |
CN112395863A (zh) | 文本的处理方法和装置 | |
CN112380879A (zh) | 一种智能翻译方法、装置、计算机设备和存储介质 | |
CN111161737A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN111508484B (zh) | 语音数据的处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |