CN114139560A

CN114139560A - 基于人工智能翻译***

Info

Publication number: CN114139560A
Application number: CN202111465059.4A
Authority: CN
Inventors: 刘建伟
Original assignee: Shandong Shiyu Translation Co ltd
Current assignee: Shandong Shiyu Translation Co ltd
Priority date: 2021-12-03
Filing date: 2021-12-03
Publication date: 2022-03-04
Anticipated expiration: 2041-12-03
Also published as: CN114139560B

Abstract

本发明涉及一种基于人工智能翻译***，包括：神经网络模型、存储模块、第一机器翻译模型、排列模块、第二机器翻译模型、输出模块、用户习惯采集模块、记录模块、缓存模块、更新模块，所述第一机器翻译模型具有接收单元、组合单元及预翻译单元；本申请先通过具有人工智能的神经网络模型得到多个预翻译目标，多个预翻译目标中包含与源语句对应的预翻译目标，还包含了与源语句关联的进行扩展的预翻译目标，预翻译目标按照用户的选择的习惯进行排序，向用户提供多个基于习惯选择的翻译目标；同时对用户的选择习惯进行采集，对用户习惯进行再次的训练，以推出符合用户选择习惯的翻译目标。

Description

基于人工智能翻译***

技术领域

本发明涉及翻译***技术领域，具体为一种基于人工智能翻译***。

背景技术

人工智能研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。在语言翻译领域，人工智能比传统的字典库而言，其可以分析需要翻译源语句的语气、语义，翻译的结果更加的准确。

随着人工智能技术的研究和进步，神经网络机器翻译作为新一代的翻译技术得到普通应用。神经网络机器翻译模型具备自我学习，不断更新的能力，因此在翻译领域，利用人工智能加神经网络机器翻译模型已经成为了研究主流。

在现有的技术中，例如公开号为“CN111738025A”公开了一种基于人工智能的翻译方法，包括：获取待翻译的第一语言文本，所述第一语言文本包括至少一个第一语言分词；通过第一翻译模型，获取所述第一语言文本中所述至少一个第一语言分词对应的词向量，其中，所述第一翻译模型是基于多个伪平行语料对训练得到，所述伪平行语料对包括第二语言语料，以及由第二翻译模型对所述第二语言语料翻译得到的第一语言语料，所述第二翻译模型基于第二平行语料对训练得到，一个第二平行语料对中包括一个目标第二语言语料以及多个参考第一语言语料，所述参考第一语言语料为所述目标第二语言语料的参考译文；通过所述第一翻译模型，基于所述词向量，预测各所述第一语言分词对应的至少两个候选第二语言分词，以及各所述第一语言分词翻译为对应的候选第二语言分词的第一概率；通过所述第一翻译模型，基于所述第一概率，从所述候选第二语言分词中，确定各所述第一语言分词对应的目标第二语言分词；通过所述第一翻译模型，对各个目标第二语言分词进行融合，得到所述第一语言文本翻译后的第二语言文本。

一般而言，语言的翻译是翻译加修订，该路线是比较成熟的路线，上述方法中，则是利用预测各所述第一语言分词对应的至少两个候选第二语言分词，以及各所述第一语言分词翻译为对应的候选第二语言分词的第一概率；然后通过所述第一翻译模型，基于所述第一概率，从所述候选第二语言分词中，确定各所述第一语言分词对应的目标第二语言分词；通过所述第一翻译模型，对各个目标第二语言分词进行融合。由于融合技术需要进行额外的训练，会占用神经网络资源。

发明内容

有鉴于此，本发明的目的在于提供一种基于人工智能翻译***，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

基于人工智能翻译***，包括：

神经网络模型，用于基于用户选择翻译目标的历史习惯要素在神经网络模型中进行训练得到约束条件集；

存储模块，用于将约束条件集进行存储；

第一机器翻译模型，所述第一机器翻译模型具有接收单元、组合单元及预翻译单元；所述接收单元接收待翻译的源语句；

所述组合单元，连接所述接收单元，基于源语句的关键词、语义、语气所形成的组合要素对源语句进行重新组合，以形成多个新组合目标；

所述预翻译单元，连接所述接收单元，将新组合目标及源语句进行翻译得到多个预翻译目标；

排列模块，用于加载约束条件集并将多个预翻译目标按照第一约束条件进行排列组合，并按照排列组合的先后顺序输入至第二机器翻译模型，所述第二机器翻译模型按照排列组合的先后顺序对多个预翻译目标进行修订，得到多个目标语句；

输出模块，用于输出目标语句呈现给用户；

用户习惯采集模块，用于基于用户操作和操作行为对目标语句的选择，用设定标签集对选择的目标语句对应的源语句、多个新组合目标中的一个或者多个进行标注，形成采集数据；

记录模块，用于将采集数据进行追踪并记录，形成追踪日志；将所述追踪日志输入至神经网络模型进行训练，以形成约束条件子单元；

缓存模块，用于约束条件子单元的存储；

更新模块，基于控制模块设置的更新周期，提取缓存模块中的至少一个约束条件子单元与约束条件集进行比对，查看所述约束条件子单元是否是新增的要素，如果是新增要素，则更新在约束条件集中，如果不是，则判定为重复要素；则利用删除模块直接删除。

在上述中，所述神经网络模型中设置有识别单元，

所述识别单元用于获取最佳集合的排列，所述最佳集合的排列通过加载追踪日志，对追踪日志进行扫描，以获取追踪日志所包含的要素集合，按照相同或者相似将要素集合中包含的要素进行统计；

统计后按照是否与约束条件集具有一个相同要素、两个相同要素、……、N相同要素进行逐一比对并排列，比对结果中相同要素最少的集合为最佳集合。

在上述中，所述历史习惯要素包含对翻译目标的类型的选择、可点击关键词或者关键元素的选择、相关词性选择、语义选择、关联造句选择、引用外部关联词库选择、浏览停留时间及点击查看次数中的一个或者多个所形成的组合。

在上述中，所述约束条件集是按照历史习惯要素输入至神经网络模型中按照历史习惯要素出现的频率进行训练形成，每一历史习惯要素按照其出现的频率设定其权重值。

在上述中，所述目标语句与预翻译目标一一对应或者一多对应。

在上述中，所述用户习惯采集模块具有至少一个监视单元，所述监视单元对所述用户习惯采集模块中用户操作及操作行为进行监视，当监测到用户操作及操作行为是对目标语句的选择时，用设定标签集对选择的目标语句对应的源语句、多个新组合目标中的一个或者多个进行标注，形成采集数据。

在上述中，所述排列模块中还具有优先权决定部，所述优先权决定部通过加载约束条件集，按照约束条件集中每一历史习惯要素的权重值的大小，决定预翻译目标排列顺序。

在上述中，所述记录模块中具有至少一个追踪单元，所述追踪单元将监视单元对用户操作及操作行为中的至少一个的监视行为作为目标进行追踪，并将包含对目标语句的选择的监视行为进行抓取，并记录追踪日志中。

在上述中，所述更新模块中具有至少一个比较单元，在比较单元执行约束条件子单元与约束条件集比对时，如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值的出现频率，且该要素在约束条件集中不具有相同或者相似的要素特征并能够引起用户对目标语句的选择出现习惯性的偏移，将此要素设定为新增要素，且给予其赋予设定权重值，并更新在约束条件集中；如果所述约束条件子单元所包含的某个要素在更新周期内具有小于设定阈值一半的出现频率，则直接利用删除模块给予删除；如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值一半且小于等于设定阈值的出现频率时，将其寄存在缓存模块中，在下一周期更新模块启动更新时，将此要素加入至下一更新模块进行更新。

在上述中，所述第二机器翻译模型内至少具有一个修订单元，每一修订单元具有第一修订子单元、第二修订子单元以及对照单元；

所述修订单元与预翻译目标具有一一对应或者一多对应的关系，所述修订单元依据所述预翻译目标，提取所述预翻译目标对应的句段；

第一修订子单元，对所述句段按照设定的标点符号划分成至少一个句段，并将句段对应内容进行逐一修订，逐一修订后进行组装，形成第一修订目标；

第二修订子单元，对所述句段直接进行修订，形成第二修订目标；

对照单元，将第一修订目标和第二修订目标输入至对照单元进行比对，并进行语法比对，若第一修订目标第二修订目标相同，直接输出得到目标语句；

若第一修订目标第二修订目标不相同，语法无错误或者错误最少的输出得到目标语句。

本申请先通过具有人工智能的神经网络模型得到多个预翻译目标，多个预翻译目标中包含与源语句对应的预翻译目标，还包含了与源语句关联的进行扩展的预翻译目标，预翻译目标按照用户的选择的习惯进行排序，向用户提供多个基于习惯选择的翻译目标；同时对用户的选择习惯进行采集，对用户习惯进行再次的训练，以推出符合用户选择习惯的翻译目标。

附图说明

图1本发明的框架原理图；

图2为本发明具体实施时的框架原理图。

具体实施方式

以下结合附图对本发明进行详细的描述，参照图1至图2。

本发明提供了一种智能音箱的通信切换方法，包括如下步骤：

基于人工智能翻译***，包括：

所述历史习惯要素包含对翻译目标的类型的选择、可点击关键词或者关键元素的选择、相关词性选择、语义选择、关联造句选择、引用外部关联词库选择、浏览停留时间及点击查看次数中的一个或者多个所形成的组合；

所述约束条件集是按照历史习惯要素输入至神经网络模型中按照历史习惯要素出现的频率进行训练形成，每一历史习惯要素按照其出现的频率设定其权重值；

存储模块，用于将约束条件集进行存储；

所述预翻译单元，连接所述接收单元，将新组合目标及源语句进行翻译得到多个预翻译目标，所述目标语句与预翻译目标一一对应或者一多对应；

在上述中，所述排列模块中还具有优先权决定部，所述优先权决定部通过加载约束条件集，按照约束条件集中每一历史习惯要素的权重值的大小，决定预翻译目标排列顺序；

输出模块，用于输出目标语句呈现给用户；

所述记录模块中具有至少一个追踪单元，所述追踪单元将监视单元对用户操作及操作行为中的至少一个的监视行为作为目标进行追踪，并将包含对目标语句的选择的监视行为进行抓取，并记录追踪日志中；

缓存模块，用于约束条件子单元的存储；

所述神经网络模型中设置有识别单元，

在本申请中，所述神经网络模型是人工智能的载体，具备自我训练和自我学习的能力，具体的，通过所述监视单元对所述用户习惯采集模块中用户操作及操作行为进行监视，当监测到用户操作及操作行为是对目标语句的选择时，所述追踪单元将监视单元对用户操作及操作行为中的至少一个的监视行为作为目标进行追踪，并将包含对目标语句的选择的监视行为进行抓取，并记录追踪日志中；所述神经网络模型具有识别单元，所述识别单元用于获取最佳集合的排列，所述最佳集合的排列通过加载追踪日志，对追踪日志进行扫描，以获取追踪日志所包含的要素集合，按照相同或者相似将要素集合中包含的要素进行统计；统计后按照是否与约束条件集具有一个相同要素、两个相同要素、……、N相同要素进行逐一比对并排列，比对结果中相同要素最少的集合为最佳集合，然后按照是否是最佳集合进行排列。也就是说，与约束条件集具有更多的相同要素，则证明追踪日志中所记载的用户的习惯与神经网络模型中目前记载的用户习惯相同，若追踪日志中所记载的用户的习惯与神经网络模型中目前记载的用户习惯不相同，则证明用户习惯在某一时间出现了偏移，此时，需要记录该偏移，在用户再次使用时，向用户推荐与更新后的用户习惯一致的翻译目标。

其原理为：当户用输入源语句时，所述接收单元接收待翻译的源语句；

所述排列模块加载约束条件集，并将多个预翻译目标按照第一约束条件进行排列组合，具体的，约束条件集中每一历史习惯要素的权重值的大小，决定预翻译目标排列顺序，并按照排列组合的先后顺序输入至第二机器翻译模型，所述第二机器翻译模型内至少具有一个修订单元，每一修订单元具有第一修订子单元、第二修订子单元以及对照单元；

在本发明中，若源语句是一个词，当户用输入源语句时，所述接收单元接收待翻译的源语句；

所述组合单元，连接所述接收单元，基于源语句的语义，对源语句具有相同或者相似语义的词进行扩展，以形成多个新组合目标；

所述修订单元与预翻译目标具有一一对应或者一多对应的关系，所述修订单元依据所述预翻译目标，提取所述预翻译目标对应的目标词；

第一修订子单元，对所述目标词进行逐一修订，形成第一修订目标并输出。

在本发明中，若源语句是一句完整的句子，当户用输入源句子时，所述接收单元接收待翻译的源句子；

所述组合单元，连接所述接收单元，基于源句子的关键词、语义、语气所形成的组合要素对源句子进行重新组合，以形成多个新组合目标，新组合目标中包含关键词、低频词汇、基于关键词和低频词汇进行扩展的相似词汇以及对应的应用示例。

所述预翻译单元，连接所述接收单元，将新组合目标及源句子进行翻译得到多个预翻译目标，所述目标语句与预翻译目标一一对应或者一多对应；

第一修订子单元，对关键词、低频词汇以及基于关键词和低频词汇进行扩展的相似词汇直接进行修订后直接输出；对于源句子按照设定的标点符号(分号)划分成至少一个子句子，并将子句子对应内容进行逐一修订，逐一修订后进行组装，形成第一修订目标；

第二修订子单元，对所述源句子直接进行修订，形成第二修订目标；

对照单元，将第一修订目标和第二修订目标输入至对照单元进行比对，并进行语法比对，若第一修订目标第二修订目标相同，直接输出得到目标语句；若第一修订目标第二修订目标不相同，语法无错误或者错误最少的输出得到目标语句。

在本发明中，若源语句是一句完整的句段，当户用输入源句段时，所述接收单元接收待翻译的源句段；

所述组合单元，连接所述接收单元，基于源句段的关键词、语义、语气所形成的组合要素对源句子进行重新组合，以形成多个新组合目标，新组合目标中包含关键词、低频词汇、基于关键词和低频词汇进行扩展的相似词汇以及对应的应用示例，以及基于句段对句段按照是否是完整的句子进行拆分形成子句段；

第一修订子单元，对关键词、低频词汇以及基于关键词和低频词汇进行扩展的相似词汇直接进行修订后直接输出；对于源句段按照设定的标点符号(分号或者句号)划分成至少一个子句段，子句段在划分为子句子，并将子句段以及字句段对应的子句子对应内容进行逐一修订，逐一修订后进行组装，形成第一修订目标；

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实例的说明只是用于帮助理解本发明的方法及其核心思想。以上所述仅是本发明的优选实施方式，应当指出，由于文字表达的有限性，而客观上存在无限的具体结构，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进、润饰或变化，也可以将上述技术特征以适当的方式进行组合；这些改进润饰、变化或组合，或未经改进将发明的构思和技术方案直接应用于其它场合的，均应视为本发明的保护范围。

Claims

1.基于人工智能翻译***，其特征在于，包括：

存储模块，用于将约束条件集进行存储；

输出模块，用于输出目标语句呈现给用户；

缓存模块，用于约束条件子单元的存储；

2.根据权利要求1所述的基于人工智能翻译***，其特征在于，所述神经网络模型中设置有识别单元，

3.根据权利要求1或2所述的基于人工智能翻译***，其特征在于，所述历史习惯要素包含对翻译目标的类型的选择、可点击关键词或者关键元素的选择、相关词性选择、语义选择、关联造句选择、引用外部关联词库选择、浏览停留时间及点击查看次数中的一个或者多个所形成的组合。

4.根据权利要求1或2所述的基于人工智能翻译***，其特征在于，所述约束条件集是按照历史习惯要素输入至神经网络模型中按照历史习惯要素出现的频率进行训练形成，每一历史习惯要素按照其出现的频率设定其权重值。

5.根据权利要求1所述的基于人工智能翻译***，其特征在于，所述目标语句与预翻译目标一一对应或者一多对应。

6.根据权利要求1所述的基于人工智能翻译***，其特征在于，所述用户习惯采集模块具有至少一个监视单元，所述监视单元对所述用户习惯采集模块中用户操作及操作行为进行监视，当监测到用户操作及操作行为是对目标语句的选择时，用设定标签集对选择的目标语句对应的源语句、多个新组合目标中的一个或者多个进行标注，形成采集数据。

7.根据权利要求1所述的基于人工智能翻译***，其特征在于，所述排列模块中还具有优先权决定部，所述优先权决定部通过加载约束条件集，按照约束条件集中每一历史习惯要素的权重值的大小，决定预翻译目标排列顺序。

8.根据权利要求1所述的基于人工智能翻译***，其特征在于，所述记录模块中具有至少一个追踪单元，所述追踪单元将监视单元对用户操作及操作行为中的至少一个的监视行为作为目标进行追踪，并将包含对目标语句的选择的监视行为进行抓取，并记录追踪日志中。

9.根据权利要求1所述的基于人工智能翻译***，其特征在于，所述更新模块中具有至少一个比较单元，在比较单元执行约束条件子单元与约束条件集比对时，如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值的出现频率，且该要素在约束条件集中不具有相同或者相似的要素特征并能够引起用户对目标语句的选择出现习惯性的偏移，将此要素设定为新增要素，且给予其赋予设定权重值，并更新在约束条件集中；如果所述约束条件子单元所包含的某个要素在更新周期内具有小于设定阈值一半的出现频率，则直接利用删除模块给予删除；如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值一半且小于等于设定阈值的出现频率时，将其寄存在缓存模块中，在下一周期更新模块启动更新时，将此要素加入至下一更新模块进行更新。

10.根据权利要求1所述的基于人工智能翻译***，其特征在于，所述第二机器翻译模型内至少具有一个修订单元，每一修订单元具有第一修订子单元、第二修订子单元以及对照单元；