CN111563389B - 一种用户原创内容的翻译方法和装置 - Google Patents
一种用户原创内容的翻译方法和装置 Download PDFInfo
- Publication number
- CN111563389B CN111563389B CN202010313339.2A CN202010313339A CN111563389B CN 111563389 B CN111563389 B CN 111563389B CN 202010313339 A CN202010313339 A CN 202010313339A CN 111563389 B CN111563389 B CN 111563389B
- Authority
- CN
- China
- Prior art keywords
- content
- module
- target
- translation
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013519 translation Methods 0.000 title claims abstract description 233
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012937 correction Methods 0.000 claims abstract description 56
- 230000004044 response Effects 0.000 claims description 8
- 230000000977 initiatory effect Effects 0.000 claims description 6
- 230000014616 translation Effects 0.000 description 195
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3349—Reuse of stored results of previous queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及一种用户原创内容的翻译方法和装置,其中,该方法包括:获取对用户原创内容翻译后的初始翻译内容,其中,用户原创内容包括多个内容模块;从多个内容模块中确定属于目标模块类型一的待处理内容模块;对待处理内容模块进行翻译,得到修正内容;根据修正内容和初始翻译内容,生成与用户原创内容对应的目标翻译内容。本申请解决了现有技术中用户原创内容的翻译准确率较低的技术问题。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种用户原创内容的翻译方法和装置。
背景技术
现有的UGC(User Generated Content,用户原创内容)翻译方案依赖翻译***进行机器翻译。通过调用翻译平台提供的API(Application Programming Interface,应用程序编程接口)将UGC翻译为指定语言。但是对于专业领域的特定名词,可能由于无法正确识别或者没有准确的翻译文本等原因导致翻译***无法正确翻译。例如:对于金融领域中的股票名称,基金名称等等,使用机器翻译的翻译结果往往会出现偏差,导致翻译***无法返回正确的翻译结果,翻译准确率较低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种用户原创内容的翻译方法和装置,以至少解决现有技术中用户原创内容的翻译准确率较低的技术问题。
根据本申请实施例的一个方面,提供了一种用户原创内容的翻译方法,包括:
获取对用户原创内容翻译后的初始翻译内容,其中,所述用户原创内容包括多个内容模块;
从所述多个内容模块中确定属于目标模块类型一的待处理内容模块;
对所述待处理内容模块进行翻译,得到修正内容;
根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容。
可选地,从所述多个内容模块中确定属于所述目标模块类型一的待处理内容模块包括:
遍历所述多个内容模块确定每个内容模块所属于的模块类型;
若所述模块类型为所述目标模块类型一,则在模块信息表中记录具有对应关系的所述待处理内容模块的位置信息和所述待处理内容模块中存储的目标标识。
可选地,遍历所述多个内容模块确定每个内容模块所属于的模块类型包括:
使用目标数据结构匹配所述多个内容模块中的每个内容模块;
将与所述目标数据结构匹配成功的内容模块的模块类型确定为所述目标模块类型一。
可选地,若所述模块类型为所述目标模块类型一,则在模块信息表中记录具有对应关系的所述待处理内容模块的位置信息和所述待处理内容模块中存储的目标标识包括:
若所述模块类型为第一模块类型,则在所述第一模块类型中搜索目标数据信息;若搜索到所述目标数据信息,则将具有对应关系的模块索引、所述目标数据信息所在的目标位置和所述目标数据信息中存储的所述目标标识记录在所述模块信息表中;
若所述模块类型为第二模块类型,则将具有对应关系的模块索引和模块中存储的所述目标标识记录在所述模块信息表中。
可选地,对所述待处理内容模块进行翻译,得到所述修正内容包括:
获取所述待处理内容模块中存储的目标标识;
从目标存储空间中获取所述目标标识所对应的预存译文文本作为所述修正内容,其中,所述目标存储空间中记录了具有对应关系的对象标识和译文文本。
可选地,从目标存储空间中获取所述目标标识所对应的预存译文文本作为所述修正内容包括:
从所述目标存储空间中获取所述目标标识所对应的预存原文文本,其中,所述目标存储空间中还记录了具有对应关系的对象标识和原文文本;
若所述预存原文文本与模块信息表中存储的所述目标标识对应的目标原文文本相同,则从所述目标存储空间中获取所述目标标识所对应的所述预存译文文本。
可选地,在从目标存储空间中获取所述目标标识所对应的预存译文文本作为所述修正内容之前,所述方法还包括:
从所述目标标识中获取初始存储空间中未记录的标识,其中,所述初始存储空间用于记录历史查询的具有对应关系的对象标识和译文文本;
从第一数据库中获取所述未记录的标识对应的未记录的译文文本;
将具有对应关系的所述未记录的标识和所述未记录的译文文本添加到所述初始存储空间中,得到所述目标存储空间。
可选地,根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容包括以下之一:
使用所述修正内容替换所述初始翻译内容中所述待处理内容模块的文本内容,得到所述目标翻译内容;
将所述修正内容与所述初始翻译内容合并,得到所述目标翻译内容。
可选地,使用所述修正内容替换所述初始翻译内容中所述待处理内容模块的文本内容,得到所述目标翻译内容包括以下至少之一:
从模块信息表中获取所述待处理内容模块的位置信息;使用所述位置信息从所述初始翻译内容中查找到所述待处理内容模块;使用所述修正内容替换所述待处理内容模块中存储的所述文本内容;
若所述初始翻译内容中属于第一模块类型的待处理内容模块中所包括的一个或者多个文本内容均替换为所述修正内容得到已处理内容模块一,则生成所述已处理内容模块一的展示信息;若第一模块集合中所包括的属于第二模块类型的待处理内容模块中的所述文本内容均替换为所述修正内容得到包括多个已处理内容模块二的第二模块集合,则生成所述第二模块集合的展示信息;使用所述已处理内容模块一的展示信息,和/或,所述第二模块集合的展示信息刷新所述初始翻译内容的展示信息,得到所述目标翻译内容的展示信息。
可选地,获取对用户原创内容翻译后的初始翻译内容包括:
发起翻译请求,其中,所述翻译请求用于请求对所述用户原创内容进行翻译;
获取响应所述翻译请求返回的所述初始翻译内容。
可选地,在获取响应所述翻译请求返回的所述初始翻译内容之前,所述方法还包括:
根据所述翻译请求的指示从第二数据库中获取所述用户原创内容;
从所述多个内容模块中获取不属于目标模块类型二的模块;
调用预设的翻译接口对所述不属于目标模块类型二的模块进行翻译,得到所述初始翻译内容。
根据本申请实施例的另一方面,还提供了一种用户原创内容的翻译装置,包括:
第一获取模块,用于获取对用户原创内容翻译后的初始翻译内容,其中,所述用户原创内容包括多个内容模块;
确定模块,用于从所述多个内容模块中确定属于目标模块类型一的待处理内容模块;
第一翻译模块,用于对所述待处理内容模块进行翻译,得到修正内容;
生成模块,用于根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。
在本申请实施例中,采用获取对用户原创内容翻译后的初始翻译内容,其中,用户原创内容包括多个内容模块;从多个内容模块中确定属于目标模块类型一的待处理内容模块;对待处理内容模块进行翻译,得到修正内容;根据修正内容和初始翻译内容,生成与用户原创内容对应的目标翻译内容的方式,用户原创内容划分为多个内容模块,以模块的形式对用户原创内容进行存储,从而在获取到对用户原创内容翻译后的初始翻译内容时能够从中定位到需要重新翻译的属于目标模块类型一的待处理内容模块,并对待处理内容模块进行重新翻译,得到修正内容,再使用修正内容和初始翻译内容生成目标翻译内容,使得生成的目标翻译内容比起获取到的初始翻译内容对属于目标模块类型一的待处理内容模块的翻译更加精确,达到了对用户原创内容进行精确翻译的目的,从而实现了提高用户原创内容的翻译准确率的技术效果,进而解决了现有技术中用户原创内容的翻译准确率较低的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的用户原创内容的翻译方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的用户原创内容的翻译方法的流程图;
图3是根据本申请可选的实施方式的模块筛选过程的示意图;
图4是根据本申请可选的实施方式的数据替换过程的示意图;
图5是根据本申请实施例的一种可选的用户原创内容的翻译装置的示意图;
以及
图6是根据本申请实施例的一种终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一方面,提供了一种用户原创内容的翻译的方法实施例。
可选地,在本实施例中,上述用户原创内容的翻译方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如游戏服务、应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于PC、手机、平板电脑等。本申请实施例的用户原创内容的翻译方法可以由服务器103来执行,也可以由终端101来执行,还可以是由服务器103和终端101共同执行。其中,终端101执行本申请实施例的用户原创内容的翻译方法也可以是由安装在其上的客户端来执行。
图2是根据本申请实施例的一种可选的用户原创内容的翻译方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,获取对用户原创内容翻译后的初始翻译内容,其中,所述用户原创内容包括多个内容模块;
步骤S204,从所述多个内容模块中确定属于目标模块类型一的待处理内容模块;
步骤S206,对所述待处理内容模块进行翻译,得到修正内容;
步骤S208,根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容。
通过上述步骤S202至步骤S208,用户原创内容划分为多个内容模块,以模块的形式对用户原创内容进行存储,从而在获取到对用户原创内容翻译后的初始翻译内容时能够从中定位到需要重新翻译的属于目标模块类型一的待处理内容模块,并对待处理内容模块进行重新翻译,得到修正内容,再使用修正内容和初始翻译内容生成目标翻译内容,使得生成的目标翻译内容比起获取到的初始翻译内容对属于目标模块类型一的待处理内容模块的翻译更加精确,达到了对用户原创内容进行精确翻译的目的,从而实现了提高用户原创内容的翻译准确率的技术效果,进而解决了现有技术中用户原创内容的翻译准确率较低的技术问题。
在步骤S202提供的技术方案中,用户原创内容可以由后端服务器进行初始翻译得到初始翻译内容。初始翻译内容可以但不限于是通过ProtoBuf(原型)协议由后端服务器传输给前端应用的,前端应用接收到后端服务器通过ProtoBuf协议传输的数据,通过对接收到的数据进行反序列化处理得到初始翻译内容。
可选地,在本实施例中,用户原创内容可以是用户在前端应用上发布的内容,比如:用户原创内容可以但不限于包括用户发布的状态、评论、文章、日志等,前端应用在接收到用户发布的用户原创内容后可以将其存储在数据库中。
可选地,在本实施例中,用户原创内容可以但不限于是一个或者多个对象(比如:反馈信息FeedInfo对象),每个对象中包括一个正文模块、一个或者多个评论模块,也可以不包括评论模块。每个正文模块中包括一个或者多个正文子模块,每个评论模块中包括一个或者多个评论子模块,每个正文子模块或者评论子模块都可以称为内容模块,用户原创内容可以但不限于包括多个内容模块。
可选地,在本实施例中,用户原创内容中的数据是一种语言的数据(比如第一语言),初始翻译内容中的数据可以是将用户原创内容的一种语言的数据中的部分数据(即不属于目标模块类型一的内容模块中的数据)翻译成另一种语言的数据(比如第二语言)得到的,或者,初始翻译内容中的数据可以是将用户原创内容的一种语言的数据全部翻译成另一种语言的数据(比如第二语言)得到的。也就是说,翻译任务可以是将第一语言翻译为第二语言,第一语言和第二语言可以但不限于为自然语言,比如:英文翻译为中文、中文翻译为英文、韩文翻译为中文、日文翻译为中文、德文翻译为英文、德文翻译为中文等等。第一语言和第二语言也可以但不限于为机器语言,比如:json语言、.Net语言、Java语言之间的相互翻译等等。
在步骤S204提供的技术方案中,属于目标模块类型一的待处理内容模块中的数据可以但不限于为某特定领域的某类专用名词,比如:金融领域的股票名称、基金名称、金融专业术语等等,医学领域的药品名称、器材名称等等,文体领域的运动员、演员、歌手的名字等等。将用户原创内容中出现的这些专业领域的专用名词划分到属于目标模块类型一的内容模块中进行存储,使用这种分治的技术能够在用户原创内容的翻译过程中对这些需要精确翻译的内容进行精准定位,从而节省了内容查找的时间,提高了用户原创内容的翻译效率。
可选地,在本实施例中,在用户原创内容中使用属于目标模块类型一的内容模块来存储需要重新翻译的信息。比如:在ProtoBuf协议中,股票名称可存储在两种模块中:用于存储富文本信息的RichTextItem模块和用于存储股票信息的StockMsgModel模块。
在步骤S206提供的技术方案中,通过对待处理内容模块进行重新的翻译得到了修正内容,使得如果初始翻译内容中存在对待处理内容模块进行翻译得到的内容,那么修正内容是比初始翻译内容中对待处理内容模块进行翻译得到的内容更加精确的翻译内容。如果初始翻译内容中没有对待处理内容模块进行翻译得到的内容,那么修正内容能够对初始翻译内容进行精确的补充。从而提高了翻译准确度。
在步骤S208提供的技术方案中,生成目标翻译内容的方式可以但不限于包括:替换、合并、修改等等。比如:替换方式可以是使用修正内容将初始翻译内容中待处理内容模块对应的部分直接替换掉。合并方式可以是直接将修正内容添加到初始翻译内容中。修改方式可以是将修正内容添加到初始翻译内容中,并标记出修正内容是初始翻译内容中待处理内容模块对应的部分的最终翻译结果。
作为一种可选的实施例,从所述多个内容模块中确定属于所述目标模块类型一的待处理内容模块包括:
S11,遍历所述多个内容模块确定每个内容模块所属于的模块类型;
S12,若所述模块类型为所述目标模块类型一,则在模块信息表中记录具有对应关系的所述待处理内容模块的位置信息和所述待处理内容模块中存储的目标标识。
可选地,在本实施例中,通过遍历多个内容模块来确定各个内容模块的模块类型,从中找出属于目标模块类型一的模块作为待处理内容模块,并在模块信息表中记录待处理内容模块的模块信息。
可选地,在本实施例中,模块信息表中记录的模块信息可以但不限于包括模块待处理内容模块的位置信息和待处理内容模块中存储的目标标识。待处理内容模块的位置信息用于对待翻译的内容进行定位,待处理内容模块中存储的目标标识用于对待翻译的内容的译文进行查找。
可选地,在本实施例中,可以但不限于通过数据结构匹配的方式确定每个内容模块的模块类型。例如:遍历所述多个内容模块确定每个内容模块所属于的模块类型包括:
使用目标数据结构匹配所述多个内容模块中的每个内容模块;
将与所述目标数据结构匹配成功的内容模块的模块类型确定为所述目标模块类型一。
作为一种可选的实施例,若所述模块类型为所述目标模块类型一,则在模块信息表中记录具有对应关系的所述待处理内容模块的位置信息和所述待处理内容模块中存储的目标标识包括:
S21,若所述模块类型为第一模块类型,则在所述第一模块类型中搜索目标数据信息;若搜索到所述目标数据信息,则将具有对应关系的模块索引、所述目标数据信息所在的目标位置和所述目标数据信息中存储的所述目标标识记录在所述模块信息表中;
S22,若所述模块类型为第二模块类型,则将具有对应关系的模块索引和模块中存储的所述目标标识记录在所述模块信息表中。
可选地,在本实施例中,属于第一模块类型的内容模块能够存储多种数据信息,如果匹配到的模块类型属于第一模块类型,则在第一模块类型中搜索目标数据信息,如果搜索到目标数据信息,则将模块索引和搜索到的目标数据信息所在的目标位置作为待处理内容模块的位置信息。如果没有搜索到目标数据信息,则不记录该模块的信息。
可选地,在本实施例中,属于第二模块类型的内容模块只用于存储目标数据信息,如果匹配到模块类型属于第二模块类型,则直接将模块索引作为待处理内容模块的位置信息。
可选地,在本实施例中,第一模块类型可以但不限于为用于存储多种信息的模块,这多种信息中包括某特定种类型的信息,比如:用于存储特定专业领域的专用名词或用于存储其他类型信息的模块。
例如,第一模块类型可以是用于存储富文本信息的模块,富文本信息可以是文字、图片、链接等,这种模块可以通过HTML(Hyper Text Markup Language,超级文本标记语言)代码储存信息,并可以通过HTML解析器被解析为CharSequence字符串用于前端的内容展示。以股票应用为例,第一模块类型可以称为RichTextItem,在UGC所包括的正文模块中的股票名称均可以使用这种模块存储。
可选地,在本实施例中,第二模块类型可以但不限于为只存储某特定种类信息的模块,比如:只用于存储特定专业领域的文本信息的模块。
例如,第二模块类型可以是用于存储专业领域名词的模块。以股票应用为例,第二模块类型可以称为StockMsgModel,该类型的模块在股票应用中是用于存储股票信息的模块,StockMsgModel模块可以存在于UGC列表的正文模块、评论模块,UGC详情的评论模块中。StockMsgModel模块可以只用于存储股票信息,每个StockMsgModel模块中可以存在且只存在一个股票信息。
可选地,在本实施例中,可以但不限于采用如下方式在第一模块类型中搜索目标数据信息:
S31,使用预设的解析模型从第一模块类型中的模块代码中解析出所述目标数据信息的信息结构;
S32,确定所述信息结构在所述模块代码中的起始位置和终点位置作为所述目标数据信息所在的目标位置。
可选地,在本实施例中,预设的解析模型可以但不限于为正则表达式、用于对目标数据信息进行定位的人工智能AI模型等等。
例如,RichTextItem可用于存储超链接、表情、股票信息等多种数据,每个模块中可能存在零个以上股票信息,股票信息的HTML代码具有特定的结构,可以使用特定的正则表达式规则进行匹配找出。从而确定RichTextItem中股票信息所在的位置。
在一个可选的实施方式中,图3是根据本申请可选的实施方式的模块筛选过程的示意图,如图3所示,以对股票应用的UGC进行翻译为例,将接收到的数据按照ProtoBuf协议进行反序列化,得到一个或多个对象,这些对象是对UGC进行初步翻译得到的。遍历这些对象的所有模块,并对每个模块进行类型判断。对于RichTextItem类型的模块,使用预设的正则表达式从模块的HTML代码中解析出所有的股票信息结构,将RichTextItem的索引,股票信息结构代码起始位置、终点位置、股票唯一标识StockId,待翻译的原文文本(即当前展示名称displayName)保存到股票信息列表StockInfoList(即上述模块信息表)中。对于StockMsgModel类型的模块,则将StockMsgModel的索引,StockId,displayName保存到股票信息列表StockInfoList中。
作为一种可选的实施例,对所述待处理内容模块进行翻译,得到所述修正内容包括:
S41,获取所述待处理内容模块中存储的目标标识;
S42,从目标存储空间中获取所述目标标识所对应的预存译文文本作为所述修正内容,其中,所述目标存储空间中记录了具有对应关系的对象标识和译文文本。
可选地,在本实施例中,预先设置的目标存储空间记录了具有对应关系的对象标识和译文文本,该译文文本是每个对象标识对应的精确译文,使用目标标识在目标存储空间中进行查找得到每个目标标识对应的预设译文文本作为修正内容,能够保证对待处理内容模块中待翻译内容的翻译准确性。
作为一种可选的实施例,从目标存储空间中获取所述目标标识所对应的预存译文文本作为所述修正内容包括:
S51,从所述目标存储空间中获取所述目标标识所对应的预存原文文本,其中,所述目标存储空间中还记录了具有对应关系的对象标识和原文文本;
S52,若所述预存原文文本与模块信息表中存储的所述目标标识对应的目标原文文本相同,则从所述目标存储空间中获取所述目标标识所对应的所述预存译文文本。
可选地,在本实施例中,首先确定模块信息表中记录的目标标识对应的目标原文文本与目标存储空间中记录的目标标识所对应的预存原文文本是否相同,如果相同,则确定目标原文文本需要翻译,如果二者不同,则说明这个目标原文文本按要求不需要翻译,则跳过。
可选地,在本实施例中,可以根据需求设定哪些语言的原文文本是需要翻译的,比如在股票名称的翻译过程中可以确定简体中文和英文的股票名称属于需要翻译的股票名称,翻译的目标语言可以是繁体中文。
可选地,在本实施例中,目标存储空间可以但不限于是前端应用中预留的缓存空间,用于对查询过的信息或者需要查询的信息进行缓存,前端应用在下一次查询时能够直接从缓存的目标存储空间中进行查询。通过目标存储空间来存储精确的股票信息,从而避免每次替换时从数据库进行查询,节省了查询时间,提高了查询效率,提高了查询的速度。
可选地,在本实施例中,目标存储空间可以但不限于使用任何存储结构,比如:顺序存储结构,链式存储结构,索引存储结构,散列存储结构(哈希缓存表、键值(key-value)表等等)。
可选地,在本实施例中,为了进一步提高数据的查询速度,可以使用哈希缓存表作为目标存储空间的存储结构。
可选地,在本实施例中,目标存储空间用于记录具有对应关系的对象标识、译文文本和原文文本,对象标识包括目标标识,比如:对象标识可以是指全部的股票标识,目标标识可以是指在用户原创内容中出现的股票标识。
作为一种可选的实施例,在从目标存储空间中获取所述目标标识所对应的预存译文文本作为所述修正内容之前,还包括:
S61,从所述目标标识中获取初始存储空间中未记录的标识,其中,所述初始存储空间用于记录历史查询的具有对应关系的对象标识和译文文本;
S62,从第一数据库中获取所述未记录的标识对应的未记录的译文文本;
S63,将具有对应关系的所述未记录的标识和所述未记录的译文文本添加到所述初始存储空间中,得到所述目标存储空间。
可选地,在本实施例中,可以但不限于通过对初始存储空间进行更新来得到具有完整的目标标识对应的信息的目标存储空间。从而保证了能够在目标存储空间中查询到全部目标标识对应的预存译文文本。在获取修正内容时无需在数据库中进行查询,提高了数据查询的效率。
在一个可选的实施方式中,根据股票信息列表中的目标标识stockId,查询在相应的缓存哈希表中是否均包含这只股票的stockId。如果一个stockId存在于每个缓存哈希表中,则将此stockId从用于记录股票标识的stockIdList中剔除。其中相应的缓存哈希表包含一个用于缓存译文的哈希表(即存储具有对应关系的对象标识和译文文本的缓存哈希表),可能包含一个或多个用于缓存特定语言的哈希表(即存储具有对应关系的对象标识和原文文本的缓存哈希表)。对筛选后的stockIdList(记录了初始缓存哈希表中未记录的标识)批量查询本地数据库(即第二数据库),得到对应的股票完整信息StockBase。根据查询到的股票完整信息StockBase,生成译文(即译文文本)及特定语言的股票名称(即原文文本),并保存到对应的缓存哈希表中。
作为一种可选的实施例,根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容包括以下之一:
S71,使用所述修正内容替换所述初始翻译内容中所述待处理内容模块的文本内容,得到所述目标翻译内容;
S81,将所述修正内容与所述初始翻译内容合并,得到所述目标翻译内容。
可选地,在本实施例中,可以采用替换或者合并的方式生成目标翻译内容。其中,如果在初始翻译内容中已经对待处理内容模块的内容进行了翻译,那么,使用修正内容所替换的是初始翻译内容中对待处理内容模块进行翻译的部分。如果在初始翻译内容中未对待处理内容模块的内容进行翻译的译文内容,那么,使用修正内容所替换的是初始翻译内容中待处理内容模块的原文内容。
作为一种可选的实施例,使用所述修正内容替换所述初始翻译内容中所述待处理内容模块的文本内容,得到所述目标翻译内容包括以下至少之一:
S91,从模块信息表中获取所述待处理内容模块的位置信息;使用所述位置信息从所述初始翻译内容中查找到所述待处理内容模块;使用所述修正内容替换所述待处理内容模块中存储的所述文本内容;
S101,若所述初始翻译内容中属于第一模块类型的待处理内容模块中所包括的一个或者多个文本内容均替换为所述修正内容得到已处理内容模块一,则生成所述已处理内容模块一的展示信息;若第一模块集合中所包括的属于第二模块类型的待处理内容模块中的所述文本内容均替换为所述修正内容得到包括多个已处理内容模块二的第二模块集合,则生成所述第二模块集合的展示信息;使用所述已处理内容模块一的展示信息,和/或,所述第二模块集合的展示信息刷新所述初始翻译内容的展示信息,得到所述目标翻译内容的展示信息。
可选地,在本实施例中,可以使用模块信息表中记录的位置信息对初始翻译内容中的待处理内容模块进行定位,从而找到内容替换的位置完成修正内容的替换。
可选地,在本实施例中,对于属于第一模块类型的待处理内容模块,可以使用模块索引从初始翻译内容中找到待处理内容模块,再使用目标数据信息所在的目标位置从待处理内容模块中找到目标数据信息,使用修正内容替换目标数据信息中存储的文本内容。
例如,对于RichTextItem,模块中不仅存储了股票名称等股票信息,还可能存储了其他信息(比如超链接、图片、表情),可以首先使用模块索引对RichTextItem进行定位,再使用目标位置对股票信息进行定位,从而准确的对股票名称进行替换。
可选地,在本实施例中,对于属于第二模块类型的待处理内容模块,可以使用模块索引从初始翻译内容中找到待处理内容模块,使用修正内容替换待处理内容模块中存储的文本内容。
例如,对于StockMsgModel,模块中可能只存储了股票名称等股票信息,可以使用模块索引对StockMsgModel进行定位,再对StockMsgModel中存储的股票名称进行替换。
可选地,在本实施例中,如果满足以下两个条件中的一个则需要刷新展示信息。
条件一,对RichTextItem(即属于第一模块类型的待处理内容模块)中的所有股票信息均已完成替换,则根据替换后的HTML代码,重新解析出CharSequence字符串用于展示。
条件二,对于UGC列表的某个评论模块中的所有StockMsgModel(即第一模块集合中所包括的属于第二模块类型的待处理内容模块)已完成替换,则重新生成这个评论模块的评论展示信息。
可选地,在本实施例中,生成展示信息后,将处理完成的数据组合成完整的数据传递给上层,在页面上进行展示。
在一个可选的实施方式中,图4是根据本申请可选的实施方式的数据替换过程的示意图,如图4所示,根据股票信息列表中的唯一标识stockId,查询在相应的缓存哈希表中是否均包含这只股票。如果一个stockId存在于每个缓存哈希表中,则将此stockId从stockIdList中剔除。对筛选后的stockIdList批量查询本地股票数据库,得到对应的股票完整信息StockBase。根据查询到的股票完整信息StockBase,生成译文及特定语言的股票名称,并保存到对应的缓存哈希表中。
对StockInfoList中的每个股票信息的StockId查询缓存哈希表,得到这个股票的译文语言及特定语言下的股票名称。将得到的特定语言下的股票名称与StockInfoList中的原文股票名称比较,如果StockInfoList中的原文股票名称不属于特定语言下的股票名称,则说明这个股票名称按要求不需要翻译,跳过翻译的步骤。否则使用对应的译文名称替换原文名称。替换后,判断是否需要刷新展示信息。满足以下两个条件中的一个则需要刷新展示信息。
条件1,对RichTextItem中的所有股票信息均已完成替换,则根据替换后的HTML代码,重新解析出CharSequence字符串用于展示。
条件2,对于UGC列表的某个评论模块中的所有StockMsgModel已完成替换,则重新生成这个评论模块的评论展示信息。
最后将处理完成的数据组合成完整的目标翻译内容,传递给上层进行展示。
作为一种可选的实施例,获取对用户原创内容翻译后的初始翻译内容包括:
S111,发起翻译请求,其中,所述翻译请求用于请求对所述用户原创内容进行翻译;
S112,获取响应所述翻译请求返回的所述初始翻译内容。
可选地,在本实施例中,可以但不限于由前端应用向后端服务器发起翻译请求,由后端服务器进行翻译操作,并将翻译结果返回给前端应用。或者,对用户原创内容进行翻译得到初始翻译内容的操作也可以由前端应用执行。
作为一种可选的实施例,在获取响应所述翻译请求返回的所述初始翻译内容之前,还包括:
S121,根据所述翻译请求的指示从第二数据库中获取所述用户原创内容;
S122,从所述多个内容模块中获取不属于目标模块类型二的模块;
S123,调用预设的翻译接口对所述不属于目标模块类型二的模块进行翻译,得到所述初始翻译内容。
可选地,在本实施例中,目标模块类型一和目标模块类型二可以相同,也可以不同。
可选地,在本实施例中,预设的翻译接口可以但不限于包括OpenCC开源库。
可选地,在本实施例中,上述将用户原创内容翻译为初始翻译内容的过程可以由后端服务器执行,也可以由前端应用执行。
在一个可选的实施方式中,应用后端收到应用前端的请求后,根据协议从数据库中查询并得到UGC原文数据。UGC原文数据包括多个内容模块。应用后端从多个内容模块中找出不属于目标模块类型二的模块。并调用OpenCC开源库查找不属于目标模块类型二的模块对应的译文内容,使用OpenCC开源库对应返回的译文替换不属于目标模块类型二的模块中相应的文本得到初始翻译内容。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述用户原创内容的翻译方法的用户原创内容的翻译装置。图5是根据本申请实施例的一种可选的用户原创内容的翻译装置的示意图,如图5所示,该装置可以包括:
第一获取模块52,用于获取对用户原创内容翻译后的初始翻译内容,其中,所述用户原创内容包括多个内容模块;
确定模块54,用于从所述多个内容模块中确定属于目标模块类型一的待处理内容模块;
第一翻译模块56,用于对所述待处理内容模块进行翻译,得到修正内容;
生成模块58,用于根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容。
需要说明的是,该实施例中的第一获取模块52可以用于执行本申请实施例中的步骤S202,该实施例中的确定模块54可以用于执行本申请实施例中的步骤S204,该实施例中的第一翻译模块56可以用于执行本申请实施例中的步骤S206,该实施例中的生成模块58可以用于执行本申请实施例中的步骤S208。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,用户原创内容划分为多个内容模块,以模块的形式对用户原创内容进行存储,从而在获取到对用户原创内容翻译后的初始翻译内容时能够从中定位到需要重新翻译的属于目标模块类型一的待处理内容模块,并对待处理内容模块进行重新翻译,得到修正内容,再使用修正内容和初始翻译内容生成目标翻译内容,使得生成的目标翻译内容比起获取到的初始翻译内容对属于目标模块类型一的待处理内容模块的翻译更加精确,达到了对用户原创内容进行精确翻译的目的,从而实现了提高用户原创内容的翻译准确率的技术效果,进而解决了现有技术中用户原创内容的翻译准确率较低的技术问题。
可选地,所述确定模块包括:
遍历单元,用于遍历所述多个内容模块确定每个内容模块所属于的模块类型;
记录单元,用于若所述模块类型为所述目标模块类型一,则在模块信息表中记录具有对应关系的所述待处理内容模块的位置信息和所述待处理内容模块中存储的目标标识。
可选地,所述记录单元用于:
若所述模块类型为第一模块类型,则在所述第一模块类型中搜索目标数据信息;若搜索到所述目标数据信息,则将具有对应关系的模块索引、所述目标数据信息所在的目标位置和所述目标数据信息中存储的所述目标标识记录在所述模块信息表中;
若所述模块类型为第二模块类型,则将具有对应关系的模块索引和模块中存储的所述目标标识记录在所述模块信息表中。
可选地,所述第一翻译模块包括:
第一获取单元,用于获取所述待处理内容模块中存储的目标标识;
第二获取单元,用于从目标存储空间中获取所述目标标识所对应的预存译文文本作为所述修正内容,其中,所述目标存储空间中记录了具有对应关系的对象标识和译文文本。
可选地,所述第二获取单元用于:
从所述目标存储空间中获取所述目标标识所对应的预存原文文本,其中,所述目标存储空间中还记录了具有对应关系的对象标识和原文文本;
若所述预存原文文本与模块信息表中存储的所述目标标识对应的目标原文文本相同,则从所述目标存储空间中获取所述目标标识所对应的所述预存译文文本。
可选地,所述生成模块包括以下之一:
替换单元,用于使用所述修正内容替换所述初始翻译内容中所述待处理内容模块的文本内容,得到所述目标翻译内容;
合并单元,用于将所述修正内容与所述初始翻译内容合并,得到所述目标翻译内容。
可选地,所述替换单元用于以下至少之一:
从模块信息表中获取所述待处理内容模块的位置信息;使用所述位置信息从所述初始翻译内容中查找到所述待处理内容模块;使用所述修正内容替换所述待处理内容模块中存储的所述文本内容;
若所述初始翻译内容中属于第一模块类型的待处理内容模块中所包括的一个或者多个文本内容均替换为所述修正内容得到已处理内容模块一,则生成所述已处理内容模块一的展示信息;若第一模块集合中所包括的属于第二模块类型的待处理内容模块中的所述文本内容均替换为所述修正内容得到包括多个已处理内容模块二的第二模块集合,则生成所述第二模块集合的展示信息;使用所述已处理内容模块一的展示信息,和/或,所述第二模块集合的展示信息刷新所述初始翻译内容的展示信息,得到所述目标翻译内容的展示信息。
可选地,所述第一获取模块包括:
发起单元,用于发起翻译请求,其中,所述翻译请求用于请求对所述用户原创内容进行翻译;
第三获取单元,用于获取响应所述翻译请求返回的所述初始翻译内容。
可选地,所述装置还包括:
第二获取模块,用于在获取响应所述翻译请求返回的所述初始翻译内容之前,根据所述翻译请求的指示从第二数据库中获取所述用户原创内容;
第三获取模块,用于从所述多个内容模块中获取不属于目标模块类型二的模块;
第二翻译模块,用于调用预设的翻译接口对所述不属于目标模块类型二的模块进行翻译,得到所述初始翻译内容。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的另一个方面,还提供了一种用于实施上述用户原创内容的翻译方法的服务器或终端。
图6是根据本申请实施例的一种终端的结构框图,如图6所示,该终端可以包括:一个或多个(图中仅示出一个)处理器601、存储器603、以及传输装置605,如图6所示,该终端还可以包括输入输出设备607。
其中,存储器603可用于存储软件程序以及模块,如本申请实施例中的用户原创内容的翻译方法和装置对应的程序指令/模块,处理器601通过运行存储在存储器603内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的用户原创内容的翻译方法。存储器603可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器603可进一步包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置605用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置605包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置605为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器603用于存储应用程序。
处理器601可以通过传输装置605调用存储器603存储的应用程序,以执行下述步骤:
获取对用户原创内容翻译后的初始翻译内容,其中,所述用户原创内容包括多个内容模块;
从所述多个内容模块中确定属于目标模块类型一的待处理内容模块;
对所述待处理内容模块进行翻译,得到修正内容;
根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容。
采用本申请实施例,提供了一种用户原创内容的翻译的方案。用户原创内容划分为多个内容模块,以模块的形式对用户原创内容进行存储,从而在获取到对用户原创内容翻译后的初始翻译内容时能够从中定位到需要重新翻译的属于目标模块类型一的待处理内容模块,并对待处理内容模块进行重新翻译,得到修正内容,再使用修正内容和初始翻译内容生成目标翻译内容,使得生成的目标翻译内容比起获取到的初始翻译内容对属于目标模块类型一的待处理内容模块的翻译更加精确,达到了对用户原创内容进行精确翻译的目的,从而实现了提高用户原创内容的翻译准确率的技术效果,进而解决了现有技术中用户原创内容的翻译准确率较低的技术问题。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图6所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图6其并不对上述电子装置的结构造成限定。例如,终端还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行用户原创内容的翻译方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
获取对用户原创内容翻译后的初始翻译内容,其中,所述用户原创内容包括多个内容模块;
从所述多个内容模块中确定属于目标模块类型一的待处理内容模块;
对所述待处理内容模块进行翻译,得到修正内容;
根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (8)
1.一种用户原创内容的翻译方法,其特征在于,包括:
获取对用户原创内容翻译后的初始翻译内容,其中,所述用户原创内容包括多个内容模块;
从所述多个内容模块中确定属于目标模块类型一的待处理内容模块;从所述多个内容模块中确定属于所述目标模块类型一的待处理内容模块包括:遍历所述多个内容模块确定每个内容模块所属于的模块类型,所述遍历所述多个内容模块确定每个内容模块所属于的模块类型包括:使用目标数据结构匹配所述多个内容模块中的每个内容模块;将与所述目标数据结构匹配成功的内容模块的模块类型确定为所述目标模块类型一;在模块信息表中记录具有对应关系的所述待处理内容模块的位置信息和所述待处理内容模块中存储的目标标识,包括:若所述模块类型为第一模块类型,则在所述第一模块类型中搜索目标数据信息;若搜索到所述目标数据信息,则将具有对应关系的模块索引、所述目标数据信息所在的目标位置和所述目标数据信息中存储的所述目标标识记录在所述模块信息表中,其中,所述第一模块类型为用于存储多种信息的模块,所述多种信息包括富文本信息;若所述模块类型为第二模块类型,则将具有对应关系的模块索引和模块中存储的所述目标标识记录在所述模块信息表中;
对所述待处理内容模块进行翻译,得到修正内容;
根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容。
2.根据权利要求1所述的方法,其特征在于,对所述待处理内容模块进行翻译,得到所述修正内容包括:
获取所述待处理内容模块中存储的目标标识;
从目标存储空间中获取所述目标标识所对应的预存译文文本作为所述修正内容,其中,所述目标存储空间中记录了具有对应关系的对象标识和译文文本。
3.根据权利要求2所述的方法,其特征在于,从目标存储空间中获取所述目标标识所对应的预存译文文本作为所述修正内容包括:
从所述目标存储空间中获取所述目标标识所对应的预存原文文本,其中,所述目标存储空间中还记录了具有对应关系的对象标识和原文文本;
若所述预存原文文本与模块信息表中存储的所述目标标识对应的目标原文文本相同,则从所述目标存储空间中获取所述目标标识所对应的所述预存译文文本。
4.根据权利要求1所述的方法,其特征在于,根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容包括以下之一:
使用所述修正内容替换所述初始翻译内容中所述待处理内容模块的文本内容,得到所述目标翻译内容;
将所述修正内容与所述初始翻译内容合并,得到所述目标翻译内容。
5.根据权利要求4所述的方法,其特征在于,使用所述修正内容替换所述初始翻译内容中所述待处理内容模块的文本内容,得到所述目标翻译内容包括以下至少之一:
从模块信息表中获取所述待处理内容模块的位置信息;使用所述位置信息从所述初始翻译内容中查找到所述待处理内容模块;使用所述修正内容替换所述待处理内容模块中存储的所述文本内容;
若所述初始翻译内容中属于第一模块类型的待处理内容模块中所包括的一个或者多个文本内容均替换为所述修正内容得到已处理内容模块一,则生成所述已处理内容模块一的展示信息;若第一模块集合中所包括的属于第二模块类型的待处理内容模块中的所述文本内容均替换为所述修正内容得到包括多个已处理内容模块二的第二模块集合,则生成所述第二模块集合的展示信息;使用所述已处理内容模块一的展示信息,和/或,所述第二模块集合的展示信息刷新所述初始翻译内容的展示信息,得到所述目标翻译内容的展示信息。
6.根据权利要求1所述的方法,其特征在于,获取对用户原创内容翻译后的初始翻译内容包括:
发起翻译请求,其中,所述翻译请求用于请求对所述用户原创内容进行翻译;
获取响应所述翻译请求返回的所述初始翻译内容。
7.根据权利要求6所述的方法,其特征在于,在获取响应所述翻译请求返回的所述初始翻译内容之前,所述方法还包括:
根据所述翻译请求的指示从第二数据库中获取所述用户原创内容;
从所述多个内容模块中获取不属于目标模块类型二的模块;
调用预设的翻译接口对所述不属于目标模块类型二的模块进行翻译,得到所述初始翻译内容。
8.一种用户原创内容的翻译装置,其特征在于,包括:
第一获取模块,用于获取对用户原创内容翻译后的初始翻译内容,其中,所述用户原创内容包括多个内容模块;
确定模块,用于从所述多个内容模块中确定属于目标模块类型一的待处理内容模块;从所述多个内容模块中确定属于所述目标模块类型一的待处理内容模块包括:遍历所述多个内容模块确定每个内容模块所属于的模块类型,所述遍历所述多个内容模块确定每个内容模块所属于的模块类型包括:使用目标数据结构匹配所述多个内容模块中的每个内容模块;将与所述目标数据结构匹配成功的内容模块的模块类型确定为所述目标模块类型一;在模块信息表中记录具有对应关系的所述待处理内容模块的位置信息和所述待处理内容模块中存储的目标标识,包括:若所述模块类型为第一模块类型,则在所述第一模块类型中搜索目标数据信息;若搜索到所述目标数据信息,则将具有对应关系的模块索引、所述目标数据信息所在的目标位置和所述目标数据信息中存储的所述目标标识记录在所述模块信息表中,其中,所述第一模块类型为用于存储多种信息的模块,所述多种信息包括富文本信息;若所述模块类型为第二模块类型,则将具有对应关系的模块索引和模块中存储的所述目标标识记录在所述模块信息表中;
第一翻译模块,用于对所述待处理内容模块进行翻译,得到修正内容;
生成模块,用于根据所述修正内容和所述初始翻译内容,生成与所述用户原创内容对应的目标翻译内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010313339.2A CN111563389B (zh) | 2020-04-20 | 2020-04-20 | 一种用户原创内容的翻译方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010313339.2A CN111563389B (zh) | 2020-04-20 | 2020-04-20 | 一种用户原创内容的翻译方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111563389A CN111563389A (zh) | 2020-08-21 |
CN111563389B true CN111563389B (zh) | 2023-11-03 |
Family
ID=72070535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010313339.2A Active CN111563389B (zh) | 2020-04-20 | 2020-04-20 | 一种用户原创内容的翻译方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111563389B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103106194A (zh) * | 2013-01-23 | 2013-05-15 | 广东欧珀移动通信有限公司 | 移动终端语言转换方法及其移动终端 |
CN103885942A (zh) * | 2014-03-18 | 2014-06-25 | 成都优译信息技术有限公司 | 一种快速翻译装置及方法 |
CN106250375A (zh) * | 2016-08-09 | 2016-12-21 | 北京百度网讯科技有限公司 | 翻译处理方法及装置 |
CN110134404A (zh) * | 2019-04-12 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 代码翻译方法、装置、计算机设备和存储介质 |
CN110543644A (zh) * | 2019-09-04 | 2019-12-06 | 语联网(武汉)信息技术有限公司 | 包含术语翻译的机器翻译方法、装置与电子设备 |
CN110728156A (zh) * | 2019-12-19 | 2020-01-24 | 北京百度网讯科技有限公司 | 翻译方法、装置、电子设备及可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9304990B2 (en) * | 2012-08-20 | 2016-04-05 | International Business Machines Corporation | Translation of text into multiple languages |
US11030181B2 (en) * | 2015-11-30 | 2021-06-08 | Open Text Sa Ulc | Systems and methods for multi-brand experience in enterprise computing environment |
-
2020
- 2020-04-20 CN CN202010313339.2A patent/CN111563389B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103106194A (zh) * | 2013-01-23 | 2013-05-15 | 广东欧珀移动通信有限公司 | 移动终端语言转换方法及其移动终端 |
CN103885942A (zh) * | 2014-03-18 | 2014-06-25 | 成都优译信息技术有限公司 | 一种快速翻译装置及方法 |
CN106250375A (zh) * | 2016-08-09 | 2016-12-21 | 北京百度网讯科技有限公司 | 翻译处理方法及装置 |
CN110134404A (zh) * | 2019-04-12 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 代码翻译方法、装置、计算机设备和存储介质 |
CN110543644A (zh) * | 2019-09-04 | 2019-12-06 | 语联网(武汉)信息技术有限公司 | 包含术语翻译的机器翻译方法、装置与电子设备 |
CN110728156A (zh) * | 2019-12-19 | 2020-01-24 | 北京百度网讯科技有限公司 | 翻译方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111563389A (zh) | 2020-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111522816B (zh) | 基于数据库引擎的数据处理方法、装置、终端及介质 | |
US8386498B2 (en) | Message descriptions | |
US10002128B2 (en) | System for tokenizing text in languages without inter-word separation | |
CN108090064A (zh) | 一种数据查询方法、装置、数据存储服务器及*** | |
CN109743346B (zh) | 会话流程配置方法、装置及计算机可读存储介质 | |
CN105550206B (zh) | 结构化查询语句的版本控制方法及装置 | |
CN110673839B (zh) | 分布式工具配置化构建生成方法及*** | |
US20150100563A1 (en) | Method for retaining search engine optimization in a transferred website | |
US20170339252A1 (en) | Generating a response to a client device in an internet of things domain | |
US11841897B2 (en) | Identifying content items in response to a text-based request | |
CN112417360A (zh) | 网页渲染方法和装置 | |
CN111984267A (zh) | 多版本资源存储国际化的方法、存储介质 | |
US9529922B1 (en) | Computer implemented systems and methods for dynamic and heuristically-generated search returns of particular relevance | |
CN114153910A (zh) | 数据采集方法、装置及电子装置、计算机程序产品 | |
CN111563389B (zh) | 一种用户原创内容的翻译方法和装置 | |
CN105912573A (zh) | 数据更新方法及装置 | |
US20160085760A1 (en) | Method for in-loop human validation of disambiguated features | |
CN106612336A (zh) | 图片预加载方法和装置 | |
CN112131239B (zh) | 一种数据处理方法、计算机设备以及可读存储介质 | |
CN110515905B (zh) | 一种路由的配置的方法、装置以及服务器 | |
CN114356991A (zh) | 数据查询方法、数据聚合方法、装置、设备及介质 | |
CN111443906B (zh) | 一种应用的访问方法和装置 | |
CN115437906A (zh) | 测试方法和装置 | |
US10061859B2 (en) | Computer implemented systems and methods for dynamic and heuristically-generated search returns of particular relevance | |
CN113190236B (zh) | Hql脚本校验方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |