CN114139560A - 基于人工智能翻译*** - Google Patents

基于人工智能翻译*** Download PDF

Info

Publication number
CN114139560A
CN114139560A CN202111465059.4A CN202111465059A CN114139560A CN 114139560 A CN114139560 A CN 114139560A CN 202111465059 A CN202111465059 A CN 202111465059A CN 114139560 A CN114139560 A CN 114139560A
Authority
CN
China
Prior art keywords
target
translation
unit
constraint condition
revision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111465059.4A
Other languages
English (en)
Other versions
CN114139560B (zh
Inventor
刘建伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Shiyu Translation Co ltd
Original Assignee
Shandong Shiyu Translation Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Shiyu Translation Co ltd filed Critical Shandong Shiyu Translation Co ltd
Priority to CN202111465059.4A priority Critical patent/CN114139560B/zh
Publication of CN114139560A publication Critical patent/CN114139560A/zh
Application granted granted Critical
Publication of CN114139560B publication Critical patent/CN114139560B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于人工智能翻译***,包括:神经网络模型、存储模块、第一机器翻译模型、排列模块、第二机器翻译模型、输出模块、用户习惯采集模块、记录模块、缓存模块、更新模块,所述第一机器翻译模型具有接收单元、组合单元及预翻译单元;本申请先通过具有人工智能的神经网络模型得到多个预翻译目标,多个预翻译目标中包含与源语句对应的预翻译目标,还包含了与源语句关联的进行扩展的预翻译目标,预翻译目标按照用户的选择的习惯进行排序,向用户提供多个基于习惯选择的翻译目标;同时对用户的选择习惯进行采集,对用户习惯进行再次的训练,以推出符合用户选择习惯的翻译目标。

Description

基于人工智能翻译***
技术领域
本发明涉及翻译***技术领域,具体为一种基于人工智能翻译***。
背景技术
人工智能研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。在语言翻译领域,人工智能比传统的字典库而言,其可以分析需要翻译源语句的语气、语义,翻译的结果更加的准确。
随着人工智能技术的研究和进步,神经网络机器翻译作为新一代的翻译技术得到普通应用。神经网络机器翻译模型具备自我学习,不断更新的能力,因此在翻译领域,利用人工智能加神经网络机器翻译模型已经成为了研究主流。
在现有的技术中,例如公开号为“CN111738025A”公开了一种基于人工智能的翻译方法,包括:获取待翻译的第一语言文本,所述第一语言文本包括至少一个第一语言分词;通过第一翻译模型,获取所述第一语言文本中所述至少一个第一语言分词对应的词向量,其中,所述第一翻译模型是基于多个伪平行语料对训练得到,所述伪平行语料对包括第二语言语料,以及由第二翻译模型对所述第二语言语料翻译得到的第一语言语料,所述第二翻译模型基于第二平行语料对训练得到,一个第二平行语料对中包括一个目标第二语言语料以及多个参考第一语言语料,所述参考第一语言语料为所述目标第二语言语料的参考译文;通过所述第一翻译模型,基于所述词向量,预测各所述第一语言分词对应的至少两个候选第二语言分词,以及各所述第一语言分词翻译为对应的候选第二语言分词的第一概率;通过所述第一翻译模型,基于所述第一概率,从所述候选第二语言分词中,确定各所述第一语言分词对应的目标第二语言分词;通过所述第一翻译模型,对各个目标第二语言分词进行融合,得到所述第一语言文本翻译后的第二语言文本。
一般而言,语言的翻译是翻译加修订,该路线是比较成熟的路线,上述方法中,则是利用预测各所述第一语言分词对应的至少两个候选第二语言分词,以及各所述第一语言分词翻译为对应的候选第二语言分词的第一概率;然后通过所述第一翻译模型,基于所述第一概率,从所述候选第二语言分词中,确定各所述第一语言分词对应的目标第二语言分词;通过所述第一翻译模型,对各个目标第二语言分词进行融合。由于融合技术需要进行额外的训练,会占用神经网络资源。
发明内容
有鉴于此,本发明的目的在于提供一种基于人工智能翻译***,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
基于人工智能翻译***,包括:
神经网络模型,用于基于用户选择翻译目标的历史习惯要素在神经网络模型中进行训练得到约束条件集;
存储模块,用于将约束条件集进行存储;
第一机器翻译模型,所述第一机器翻译模型具有接收单元、组合单元及预翻译单元;所述接收单元接收待翻译的源语句;
所述组合单元,连接所述接收单元,基于源语句的关键词、语义、语气所形成的组合要素对源语句进行重新组合,以形成多个新组合目标;
所述预翻译单元,连接所述接收单元,将新组合目标及源语句进行翻译得到多个预翻译目标;
排列模块,用于加载约束条件集并将多个预翻译目标按照第一约束条件进行排列组合,并按照排列组合的先后顺序输入至第二机器翻译模型,所述第二机器翻译模型按照排列组合的先后顺序对多个预翻译目标进行修订,得到多个目标语句;
输出模块,用于输出目标语句呈现给用户;
用户习惯采集模块,用于基于用户操作和操作行为对目标语句的选择,用设定标签集对选择的目标语句对应的源语句、多个新组合目标中的一个或者多个进行标注,形成采集数据;
记录模块,用于将采集数据进行追踪并记录,形成追踪日志;将所述追踪日志输入至神经网络模型进行训练,以形成约束条件子单元;
缓存模块,用于约束条件子单元的存储;
更新模块,基于控制模块设置的更新周期,提取缓存模块中的至少一个约束条件子单元与约束条件集进行比对,查看所述约束条件子单元是否是新增的要素,如果是新增要素,则更新在约束条件集中,如果不是,则判定为重复要素;则利用删除模块直接删除。
在上述中,所述神经网络模型中设置有识别单元,
所述识别单元用于获取最佳集合的排列,所述最佳集合的排列通过加载追踪日志,对追踪日志进行扫描,以获取追踪日志所包含的要素集合,按照相同或者相似将要素集合中包含的要素进行统计;
统计后按照是否与约束条件集具有一个相同要素、两个相同要素、……、N相同要素进行逐一比对并排列,比对结果中相同要素最少的集合为最佳集合。
在上述中,所述历史习惯要素包含对翻译目标的类型的选择、可点击关键词或者关键元素的选择、相关词性选择、语义选择、关联造句选择、引用外部关联词库选择、浏览停留时间及点击查看次数中的一个或者多个所形成的组合。
在上述中,所述约束条件集是按照历史习惯要素输入至神经网络模型中按照历史习惯要素出现的频率进行训练形成,每一历史习惯要素按照其出现的频率设定其权重值。
在上述中,所述目标语句与预翻译目标一一对应或者一多对应。
在上述中,所述用户习惯采集模块具有至少一个监视单元,所述监视单元对所述用户习惯采集模块中用户操作及操作行为进行监视,当监测到用户操作及操作行为是对目标语句的选择时,用设定标签集对选择的目标语句对应的源语句、多个新组合目标中的一个或者多个进行标注,形成采集数据。
在上述中,所述排列模块中还具有优先权决定部,所述优先权决定部通过加载约束条件集,按照约束条件集中每一历史习惯要素的权重值的大小,决定预翻译目标排列顺序。
在上述中,所述记录模块中具有至少一个追踪单元,所述追踪单元将监视单元对用户操作及操作行为中的至少一个的监视行为作为目标进行追踪,并将包含对目标语句的选择的监视行为进行抓取,并记录追踪日志中。
在上述中,所述更新模块中具有至少一个比较单元,在比较单元执行约束条件子单元与约束条件集比对时,如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值的出现频率,且该要素在约束条件集中不具有相同或者相似的要素特征并能够引起用户对目标语句的选择出现习惯性的偏移,将此要素设定为新增要素,且给予其赋予设定权重值,并更新在约束条件集中;如果所述约束条件子单元所包含的某个要素在更新周期内具有小于设定阈值一半的出现频率,则直接利用删除模块给予删除;如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值一半且小于等于设定阈值的出现频率时,将其寄存在缓存模块中,在下一周期更新模块启动更新时,将此要素加入至下一更新模块进行更新。
在上述中,所述第二机器翻译模型内至少具有一个修订单元,每一修订单元具有第一修订子单元、第二修订子单元以及对照单元;
所述修订单元与预翻译目标具有一一对应或者一多对应的关系,所述修订单元依据所述预翻译目标,提取所述预翻译目标对应的句段;
第一修订子单元,对所述句段按照设定的标点符号划分成至少一个句段,并将句段对应内容进行逐一修订,逐一修订后进行组装,形成第一修订目标;
第二修订子单元,对所述句段直接进行修订,形成第二修订目标;
对照单元,将第一修订目标和第二修订目标输入至对照单元进行比对,并进行语法比对,若第一修订目标第二修订目标相同,直接输出得到目标语句;
若第一修订目标第二修订目标不相同,语法无错误或者错误最少的输出得到目标语句。
本申请先通过具有人工智能的神经网络模型得到多个预翻译目标,多个预翻译目标中包含与源语句对应的预翻译目标,还包含了与源语句关联的进行扩展的预翻译目标,预翻译目标按照用户的选择的习惯进行排序,向用户提供多个基于习惯选择的翻译目标;同时对用户的选择习惯进行采集,对用户习惯进行再次的训练,以推出符合用户选择习惯的翻译目标。
附图说明
图1本发明的框架原理图;
图2为本发明具体实施时的框架原理图。
具体实施方式
以下结合附图对本发明进行详细的描述,参照图1至图2。
本发明提供了一种智能音箱的通信切换方法,包括如下步骤:
基于人工智能翻译***,包括:
神经网络模型,用于基于用户选择翻译目标的历史习惯要素在神经网络模型中进行训练得到约束条件集;
所述历史习惯要素包含对翻译目标的类型的选择、可点击关键词或者关键元素的选择、相关词性选择、语义选择、关联造句选择、引用外部关联词库选择、浏览停留时间及点击查看次数中的一个或者多个所形成的组合;
所述约束条件集是按照历史习惯要素输入至神经网络模型中按照历史习惯要素出现的频率进行训练形成,每一历史习惯要素按照其出现的频率设定其权重值;
存储模块,用于将约束条件集进行存储;
第一机器翻译模型,所述第一机器翻译模型具有接收单元、组合单元及预翻译单元;所述接收单元接收待翻译的源语句;
所述组合单元,连接所述接收单元,基于源语句的关键词、语义、语气所形成的组合要素对源语句进行重新组合,以形成多个新组合目标;
所述预翻译单元,连接所述接收单元,将新组合目标及源语句进行翻译得到多个预翻译目标,所述目标语句与预翻译目标一一对应或者一多对应;
排列模块,用于加载约束条件集并将多个预翻译目标按照第一约束条件进行排列组合,并按照排列组合的先后顺序输入至第二机器翻译模型,所述第二机器翻译模型按照排列组合的先后顺序对多个预翻译目标进行修订,得到多个目标语句;
在上述中,所述排列模块中还具有优先权决定部,所述优先权决定部通过加载约束条件集,按照约束条件集中每一历史习惯要素的权重值的大小,决定预翻译目标排列顺序;
在上述中,所述第二机器翻译模型内至少具有一个修订单元,每一修订单元具有第一修订子单元、第二修订子单元以及对照单元;
所述修订单元与预翻译目标具有一一对应或者一多对应的关系,所述修订单元依据所述预翻译目标,提取所述预翻译目标对应的句段;
第一修订子单元,对所述句段按照设定的标点符号划分成至少一个句段,并将句段对应内容进行逐一修订,逐一修订后进行组装,形成第一修订目标;
第二修订子单元,对所述句段直接进行修订,形成第二修订目标;
对照单元,将第一修订目标和第二修订目标输入至对照单元进行比对,并进行语法比对,若第一修订目标第二修订目标相同,直接输出得到目标语句;
若第一修订目标第二修订目标不相同,语法无错误或者错误最少的输出得到目标语句。
输出模块,用于输出目标语句呈现给用户;
用户习惯采集模块,用于基于用户操作和操作行为对目标语句的选择,用设定标签集对选择的目标语句对应的源语句、多个新组合目标中的一个或者多个进行标注,形成采集数据;
在上述中,所述用户习惯采集模块具有至少一个监视单元,所述监视单元对所述用户习惯采集模块中用户操作及操作行为进行监视,当监测到用户操作及操作行为是对目标语句的选择时,用设定标签集对选择的目标语句对应的源语句、多个新组合目标中的一个或者多个进行标注,形成采集数据。
记录模块,用于将采集数据进行追踪并记录,形成追踪日志;将所述追踪日志输入至神经网络模型进行训练,以形成约束条件子单元;
所述记录模块中具有至少一个追踪单元,所述追踪单元将监视单元对用户操作及操作行为中的至少一个的监视行为作为目标进行追踪,并将包含对目标语句的选择的监视行为进行抓取,并记录追踪日志中;
缓存模块,用于约束条件子单元的存储;
更新模块,基于控制模块设置的更新周期,提取缓存模块中的至少一个约束条件子单元与约束条件集进行比对,查看所述约束条件子单元是否是新增的要素,如果是新增要素,则更新在约束条件集中,如果不是,则判定为重复要素;则利用删除模块直接删除。
所述神经网络模型中设置有识别单元,
所述识别单元用于获取最佳集合的排列,所述最佳集合的排列通过加载追踪日志,对追踪日志进行扫描,以获取追踪日志所包含的要素集合,按照相同或者相似将要素集合中包含的要素进行统计;
统计后按照是否与约束条件集具有一个相同要素、两个相同要素、……、N相同要素进行逐一比对并排列,比对结果中相同要素最少的集合为最佳集合。
在上述中,所述更新模块中具有至少一个比较单元,在比较单元执行约束条件子单元与约束条件集比对时,如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值的出现频率,且该要素在约束条件集中不具有相同或者相似的要素特征并能够引起用户对目标语句的选择出现习惯性的偏移,将此要素设定为新增要素,且给予其赋予设定权重值,并更新在约束条件集中;如果所述约束条件子单元所包含的某个要素在更新周期内具有小于设定阈值一半的出现频率,则直接利用删除模块给予删除;如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值一半且小于等于设定阈值的出现频率时,将其寄存在缓存模块中,在下一周期更新模块启动更新时,将此要素加入至下一更新模块进行更新。
在本申请中,所述神经网络模型是人工智能的载体,具备自我训练和自我学习的能力,具体的,通过所述监视单元对所述用户习惯采集模块中用户操作及操作行为进行监视,当监测到用户操作及操作行为是对目标语句的选择时,所述追踪单元将监视单元对用户操作及操作行为中的至少一个的监视行为作为目标进行追踪,并将包含对目标语句的选择的监视行为进行抓取,并记录追踪日志中;所述神经网络模型具有识别单元,所述识别单元用于获取最佳集合的排列,所述最佳集合的排列通过加载追踪日志,对追踪日志进行扫描,以获取追踪日志所包含的要素集合,按照相同或者相似将要素集合中包含的要素进行统计;统计后按照是否与约束条件集具有一个相同要素、两个相同要素、……、N相同要素进行逐一比对并排列,比对结果中相同要素最少的集合为最佳集合,然后按照是否是最佳集合进行排列。也就是说,与约束条件集具有更多的相同要素,则证明追踪日志中所记载的用户的习惯与神经网络模型中目前记载的用户习惯相同,若追踪日志中所记载的用户的习惯与神经网络模型中目前记载的用户习惯不相同,则证明用户习惯在某一时间出现了偏移,此时,需要记录该偏移,在用户再次使用时,向用户推荐与更新后的用户习惯一致的翻译目标。
其原理为:当户用输入源语句时,所述接收单元接收待翻译的源语句;
所述组合单元,连接所述接收单元,基于源语句的关键词、语义、语气所形成的组合要素对源语句进行重新组合,以形成多个新组合目标;
所述预翻译单元,连接所述接收单元,将新组合目标及源语句进行翻译得到多个预翻译目标,所述目标语句与预翻译目标一一对应或者一多对应;
所述排列模块加载约束条件集,并将多个预翻译目标按照第一约束条件进行排列组合,具体的,约束条件集中每一历史习惯要素的权重值的大小,决定预翻译目标排列顺序,并按照排列组合的先后顺序输入至第二机器翻译模型,所述第二机器翻译模型内至少具有一个修订单元,每一修订单元具有第一修订子单元、第二修订子单元以及对照单元;
所述修订单元与预翻译目标具有一一对应或者一多对应的关系,所述修订单元依据所述预翻译目标,提取所述预翻译目标对应的句段;
第一修订子单元,对所述句段按照设定的标点符号划分成至少一个句段,并将句段对应内容进行逐一修订,逐一修订后进行组装,形成第一修订目标;
第二修订子单元,对所述句段直接进行修订,形成第二修订目标;
对照单元,将第一修订目标和第二修订目标输入至对照单元进行比对,并进行语法比对,若第一修订目标第二修订目标相同,直接输出得到目标语句;
若第一修订目标第二修订目标不相同,语法无错误或者错误最少的输出得到目标语句。
在本发明中,若源语句是一个词,当户用输入源语句时,所述接收单元接收待翻译的源语句;
所述组合单元,连接所述接收单元,基于源语句的语义,对源语句具有相同或者相似语义的词进行扩展,以形成多个新组合目标;
所述预翻译单元,连接所述接收单元,将新组合目标及源语句进行翻译得到多个预翻译目标,所述目标语句与预翻译目标一一对应或者一多对应;
所述排列模块加载约束条件集,并将多个预翻译目标按照第一约束条件进行排列组合,具体的,约束条件集中每一历史习惯要素的权重值的大小,决定预翻译目标排列顺序,并按照排列组合的先后顺序输入至第二机器翻译模型,所述第二机器翻译模型内至少具有一个修订单元,每一修订单元具有第一修订子单元、第二修订子单元以及对照单元;
所述修订单元与预翻译目标具有一一对应或者一多对应的关系,所述修订单元依据所述预翻译目标,提取所述预翻译目标对应的目标词;
第一修订子单元,对所述目标词进行逐一修订,形成第一修订目标并输出。
在本发明中,若源语句是一句完整的句子,当户用输入源句子时,所述接收单元接收待翻译的源句子;
所述组合单元,连接所述接收单元,基于源句子的关键词、语义、语气所形成的组合要素对源句子进行重新组合,以形成多个新组合目标,新组合目标中包含关键词、低频词汇、基于关键词和低频词汇进行扩展的相似词汇以及对应的应用示例。
所述预翻译单元,连接所述接收单元,将新组合目标及源句子进行翻译得到多个预翻译目标,所述目标语句与预翻译目标一一对应或者一多对应;
所述排列模块加载约束条件集,并将多个预翻译目标按照第一约束条件进行排列组合,具体的,约束条件集中每一历史习惯要素的权重值的大小,决定预翻译目标排列顺序,并按照排列组合的先后顺序输入至第二机器翻译模型,所述第二机器翻译模型内至少具有一个修订单元,每一修订单元具有第一修订子单元、第二修订子单元以及对照单元;
所述修订单元与预翻译目标具有一一对应或者一多对应的关系,所述修订单元依据所述预翻译目标,提取所述预翻译目标对应的句段;
第一修订子单元,对关键词、低频词汇以及基于关键词和低频词汇进行扩展的相似词汇直接进行修订后直接输出;对于源句子按照设定的标点符号(分号)划分成至少一个子句子,并将子句子对应内容进行逐一修订,逐一修订后进行组装,形成第一修订目标;
第二修订子单元,对所述源句子直接进行修订,形成第二修订目标;
对照单元,将第一修订目标和第二修订目标输入至对照单元进行比对,并进行语法比对,若第一修订目标第二修订目标相同,直接输出得到目标语句;若第一修订目标第二修订目标不相同,语法无错误或者错误最少的输出得到目标语句。
在本发明中,若源语句是一句完整的句段,当户用输入源句段时,所述接收单元接收待翻译的源句段;
所述组合单元,连接所述接收单元,基于源句段的关键词、语义、语气所形成的组合要素对源句子进行重新组合,以形成多个新组合目标,新组合目标中包含关键词、低频词汇、基于关键词和低频词汇进行扩展的相似词汇以及对应的应用示例,以及基于句段对句段按照是否是完整的句子进行拆分形成子句段;
所述预翻译单元,连接所述接收单元,将新组合目标及源句子进行翻译得到多个预翻译目标,所述目标语句与预翻译目标一一对应或者一多对应;
所述排列模块加载约束条件集,并将多个预翻译目标按照第一约束条件进行排列组合,具体的,约束条件集中每一历史习惯要素的权重值的大小,决定预翻译目标排列顺序,并按照排列组合的先后顺序输入至第二机器翻译模型,所述第二机器翻译模型内至少具有一个修订单元,每一修订单元具有第一修订子单元、第二修订子单元以及对照单元;
所述修订单元与预翻译目标具有一一对应或者一多对应的关系,所述修订单元依据所述预翻译目标,提取所述预翻译目标对应的句段;
第一修订子单元,对关键词、低频词汇以及基于关键词和低频词汇进行扩展的相似词汇直接进行修订后直接输出;对于源句段按照设定的标点符号(分号或者句号)划分成至少一个子句段,子句段在划分为子句子,并将子句段以及字句段对应的子句子对应内容进行逐一修订,逐一修订后进行组装,形成第一修订目标;
第二修订子单元,对所述源句子直接进行修订,形成第二修订目标;
对照单元,将第一修订目标和第二修订目标输入至对照单元进行比对,并进行语法比对,若第一修订目标第二修订目标相同,直接输出得到目标语句;若第一修订目标第二修订目标不相同,语法无错误或者错误最少的输出得到目标语句。
本申请先通过具有人工智能的神经网络模型得到多个预翻译目标,多个预翻译目标中包含与源语句对应的预翻译目标,还包含了与源语句关联的进行扩展的预翻译目标,预翻译目标按照用户的选择的习惯进行排序,向用户提供多个基于习惯选择的翻译目标;同时对用户的选择习惯进行采集,对用户习惯进行再次的训练,以推出符合用户选择习惯的翻译目标。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实例的说明只是用于帮助理解本发明的方法及其核心思想。以上所述仅是本发明的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其它场合的,均应视为本发明的保护范围。

Claims (10)

1.基于人工智能翻译***,其特征在于,包括:
神经网络模型,用于基于用户选择翻译目标的历史习惯要素在神经网络模型中进行训练得到约束条件集;
存储模块,用于将约束条件集进行存储;
第一机器翻译模型,所述第一机器翻译模型具有接收单元、组合单元及预翻译单元;所述接收单元接收待翻译的源语句;
所述组合单元,连接所述接收单元,基于源语句的关键词、语义、语气所形成的组合要素对源语句进行重新组合,以形成多个新组合目标;
所述预翻译单元,连接所述接收单元,将新组合目标及源语句进行翻译得到多个预翻译目标;
排列模块,用于加载约束条件集并将多个预翻译目标按照第一约束条件进行排列组合,并按照排列组合的先后顺序输入至第二机器翻译模型,所述第二机器翻译模型按照排列组合的先后顺序对多个预翻译目标进行修订,得到多个目标语句;
输出模块,用于输出目标语句呈现给用户;
用户习惯采集模块,用于基于用户操作和操作行为对目标语句的选择,用设定标签集对选择的目标语句对应的源语句、多个新组合目标中的一个或者多个进行标注,形成采集数据;
记录模块,用于将采集数据进行追踪并记录,形成追踪日志;将所述追踪日志输入至神经网络模型进行训练,以形成约束条件子单元;
缓存模块,用于约束条件子单元的存储;
更新模块,基于控制模块设置的更新周期,提取缓存模块中的至少一个约束条件子单元与约束条件集进行比对,查看所述约束条件子单元是否是新增的要素,如果是新增要素,则更新在约束条件集中,如果不是,则判定为重复要素;则利用删除模块直接删除。
2.根据权利要求1所述的基于人工智能翻译***,其特征在于,所述神经网络模型中设置有识别单元,
所述识别单元用于获取最佳集合的排列,所述最佳集合的排列通过加载追踪日志,对追踪日志进行扫描,以获取追踪日志所包含的要素集合,按照相同或者相似将要素集合中包含的要素进行统计;
统计后按照是否与约束条件集具有一个相同要素、两个相同要素、……、N相同要素进行逐一比对并排列,比对结果中相同要素最少的集合为最佳集合。
3.根据权利要求1或2所述的基于人工智能翻译***,其特征在于,所述历史习惯要素包含对翻译目标的类型的选择、可点击关键词或者关键元素的选择、相关词性选择、语义选择、关联造句选择、引用外部关联词库选择、浏览停留时间及点击查看次数中的一个或者多个所形成的组合。
4.根据权利要求1或2所述的基于人工智能翻译***,其特征在于,所述约束条件集是按照历史习惯要素输入至神经网络模型中按照历史习惯要素出现的频率进行训练形成,每一历史习惯要素按照其出现的频率设定其权重值。
5.根据权利要求1所述的基于人工智能翻译***,其特征在于,所述目标语句与预翻译目标一一对应或者一多对应。
6.根据权利要求1所述的基于人工智能翻译***,其特征在于,所述用户习惯采集模块具有至少一个监视单元,所述监视单元对所述用户习惯采集模块中用户操作及操作行为进行监视,当监测到用户操作及操作行为是对目标语句的选择时,用设定标签集对选择的目标语句对应的源语句、多个新组合目标中的一个或者多个进行标注,形成采集数据。
7.根据权利要求1所述的基于人工智能翻译***,其特征在于,所述排列模块中还具有优先权决定部,所述优先权决定部通过加载约束条件集,按照约束条件集中每一历史习惯要素的权重值的大小,决定预翻译目标排列顺序。
8.根据权利要求1所述的基于人工智能翻译***,其特征在于,所述记录模块中具有至少一个追踪单元,所述追踪单元将监视单元对用户操作及操作行为中的至少一个的监视行为作为目标进行追踪,并将包含对目标语句的选择的监视行为进行抓取,并记录追踪日志中。
9.根据权利要求1所述的基于人工智能翻译***,其特征在于,所述更新模块中具有至少一个比较单元,在比较单元执行约束条件子单元与约束条件集比对时,如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值的出现频率,且该要素在约束条件集中不具有相同或者相似的要素特征并能够引起用户对目标语句的选择出现习惯性的偏移,将此要素设定为新增要素,且给予其赋予设定权重值,并更新在约束条件集中;如果所述约束条件子单元所包含的某个要素在更新周期内具有小于设定阈值一半的出现频率,则直接利用删除模块给予删除;如果所述约束条件子单元所包含的某个要素在更新周期内具有大于设定阈值一半且小于等于设定阈值的出现频率时,将其寄存在缓存模块中,在下一周期更新模块启动更新时,将此要素加入至下一更新模块进行更新。
10.根据权利要求1所述的基于人工智能翻译***,其特征在于,所述第二机器翻译模型内至少具有一个修订单元,每一修订单元具有第一修订子单元、第二修订子单元以及对照单元;
所述修订单元与预翻译目标具有一一对应或者一多对应的关系,所述修订单元依据所述预翻译目标,提取所述预翻译目标对应的句段;
第一修订子单元,对所述句段按照设定的标点符号划分成至少一个句段,并将句段对应内容进行逐一修订,逐一修订后进行组装,形成第一修订目标;
第二修订子单元,对所述句段直接进行修订,形成第二修订目标;
对照单元,将第一修订目标和第二修订目标输入至对照单元进行比对,并进行语法比对,若第一修订目标第二修订目标相同,直接输出得到目标语句;
若第一修订目标第二修订目标不相同,语法无错误或者错误最少的输出得到目标语句。
CN202111465059.4A 2021-12-03 2021-12-03 基于人工智能翻译*** Active CN114139560B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111465059.4A CN114139560B (zh) 2021-12-03 2021-12-03 基于人工智能翻译***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111465059.4A CN114139560B (zh) 2021-12-03 2021-12-03 基于人工智能翻译***

Publications (2)

Publication Number Publication Date
CN114139560A true CN114139560A (zh) 2022-03-04
CN114139560B CN114139560B (zh) 2022-12-09

Family

ID=80387462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111465059.4A Active CN114139560B (zh) 2021-12-03 2021-12-03 基于人工智能翻译***

Country Status (1)

Country Link
CN (1) CN114139560B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115828940A (zh) * 2022-12-08 2023-03-21 吉林农业科技学院 一种基于语料处理技术的中韩翻译***
CN115965017A (zh) * 2023-01-04 2023-04-14 北京三维天地科技股份有限公司 一种基于开发平台的多语言录入和解析***及方法

Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06348751A (ja) * 1992-11-09 1994-12-22 Ricoh Co Ltd 言語変換装置
KR20080052282A (ko) * 2006-12-05 2008-06-11 한국전자통신연구원 통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법
US20110099000A1 (en) * 2009-10-23 2011-04-28 Samsung Electronics Co., Ltd. Method and device for transliteration
CN102455786A (zh) * 2010-10-25 2012-05-16 三星电子(中国)研发中心 一种对中文句子输入法的优化***及方法
CN102789451A (zh) * 2011-05-16 2012-11-21 北京百度网讯科技有限公司 一种个性化的机器翻译***、方法及训练翻译模型的方法
CN104679735A (zh) * 2013-11-30 2015-06-03 赵会军 语用机器翻译方法
US20170046333A1 (en) * 2015-08-13 2017-02-16 Xerox Corporation Predicting translational preferences
CN106649288A (zh) * 2016-12-12 2017-05-10 北京百度网讯科技有限公司 基于人工智能的翻译方法和装置
US20180075022A1 (en) * 2016-09-13 2018-03-15 Kabushiki Kaisha Toshiba Machine translation method and machine translation apparatus
CN107861954A (zh) * 2017-11-06 2018-03-30 北京百度网讯科技有限公司 基于人工智能的信息输出方法和装置
CN109359308A (zh) * 2018-10-31 2019-02-19 腾讯科技(武汉)有限公司 机器翻译方法、装置及可读存储介质
US20190155877A1 (en) * 2017-11-17 2019-05-23 Adobe Inc. Generating a Targeted Summary of Textual Content Tuned to a Target Audience Vocabulary
CN109840331A (zh) * 2019-01-31 2019-06-04 沈阳雅译网络技术有限公司 一种基于用户词典的神经机器翻译方法
CN110457719A (zh) * 2019-10-08 2019-11-15 北京金山数字娱乐科技有限公司 一种翻译模型结果重排序的方法及装置
CN111126082A (zh) * 2019-12-03 2020-05-08 北京明略软件***有限公司 一种翻译方法及装置
CN111401085A (zh) * 2020-04-24 2020-07-10 南京莱科智能工程研究院有限公司 基于混合策略的移动设备机器翻译***
CN111507113A (zh) * 2020-03-18 2020-08-07 北京捷通华声科技股份有限公司 一种机器辅助人工翻译的方法和装置
US10747962B1 (en) * 2018-03-12 2020-08-18 Amazon Technologies, Inc. Artificial intelligence system using phrase tables to evaluate and improve neural network based machine translation
CN112329482A (zh) * 2020-10-28 2021-02-05 北京嘀嘀无限科技发展有限公司 机器翻译方法、装置、电子设备和可读存储介质
US20210056270A1 (en) * 2019-08-20 2021-02-25 Samsung Electronics Co., Ltd. Electronic device and deep learning-based interactive messenger operation method
US20210224491A1 (en) * 2018-09-19 2021-07-22 Samsung Electronics Co., Ltd. Device and method for providing application translation information
CN113343717A (zh) * 2021-06-15 2021-09-03 沈阳雅译网络技术有限公司 一种基于翻译记忆库的神经机器翻译方法
CN113408308A (zh) * 2021-07-16 2021-09-17 苏州美卡网络科技有限公司 一种基于人工智能的语言翻译***及方法
US20210294987A1 (en) * 2020-03-20 2021-09-23 Google Llc Model localization for data analytics and business intelligence
CN113569585A (zh) * 2021-02-25 2021-10-29 腾讯科技(深圳)有限公司 翻译方法和装置、存储介质及电子设备

Patent Citations (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06348751A (ja) * 1992-11-09 1994-12-22 Ricoh Co Ltd 言語変換装置
KR20080052282A (ko) * 2006-12-05 2008-06-11 한국전자통신연구원 통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법
US20110099000A1 (en) * 2009-10-23 2011-04-28 Samsung Electronics Co., Ltd. Method and device for transliteration
CN102455786A (zh) * 2010-10-25 2012-05-16 三星电子(中国)研发中心 一种对中文句子输入法的优化***及方法
CN102789451A (zh) * 2011-05-16 2012-11-21 北京百度网讯科技有限公司 一种个性化的机器翻译***、方法及训练翻译模型的方法
CN104679735A (zh) * 2013-11-30 2015-06-03 赵会军 语用机器翻译方法
US20170046333A1 (en) * 2015-08-13 2017-02-16 Xerox Corporation Predicting translational preferences
US20180075022A1 (en) * 2016-09-13 2018-03-15 Kabushiki Kaisha Toshiba Machine translation method and machine translation apparatus
CN106649288A (zh) * 2016-12-12 2017-05-10 北京百度网讯科技有限公司 基于人工智能的翻译方法和装置
CN107861954A (zh) * 2017-11-06 2018-03-30 北京百度网讯科技有限公司 基于人工智能的信息输出方法和装置
US20190155877A1 (en) * 2017-11-17 2019-05-23 Adobe Inc. Generating a Targeted Summary of Textual Content Tuned to a Target Audience Vocabulary
US10747962B1 (en) * 2018-03-12 2020-08-18 Amazon Technologies, Inc. Artificial intelligence system using phrase tables to evaluate and improve neural network based machine translation
US20210224491A1 (en) * 2018-09-19 2021-07-22 Samsung Electronics Co., Ltd. Device and method for providing application translation information
CN109359308A (zh) * 2018-10-31 2019-02-19 腾讯科技(武汉)有限公司 机器翻译方法、装置及可读存储介质
CN109840331A (zh) * 2019-01-31 2019-06-04 沈阳雅译网络技术有限公司 一种基于用户词典的神经机器翻译方法
US20210056270A1 (en) * 2019-08-20 2021-02-25 Samsung Electronics Co., Ltd. Electronic device and deep learning-based interactive messenger operation method
US20210103704A1 (en) * 2019-10-08 2021-04-08 Beijing Kingsoft Digital Entertainment Co., Ltd. Method and Apparatus for Reordering Results of a Translation Model
CN110457719A (zh) * 2019-10-08 2019-11-15 北京金山数字娱乐科技有限公司 一种翻译模型结果重排序的方法及装置
CN111126082A (zh) * 2019-12-03 2020-05-08 北京明略软件***有限公司 一种翻译方法及装置
CN111507113A (zh) * 2020-03-18 2020-08-07 北京捷通华声科技股份有限公司 一种机器辅助人工翻译的方法和装置
US20210294987A1 (en) * 2020-03-20 2021-09-23 Google Llc Model localization for data analytics and business intelligence
CN111401085A (zh) * 2020-04-24 2020-07-10 南京莱科智能工程研究院有限公司 基于混合策略的移动设备机器翻译***
CN112329482A (zh) * 2020-10-28 2021-02-05 北京嘀嘀无限科技发展有限公司 机器翻译方法、装置、电子设备和可读存储介质
CN113569585A (zh) * 2021-02-25 2021-10-29 腾讯科技(深圳)有限公司 翻译方法和装置、存储介质及电子设备
CN113343717A (zh) * 2021-06-15 2021-09-03 沈阳雅译网络技术有限公司 一种基于翻译记忆库的神经机器翻译方法
CN113408308A (zh) * 2021-07-16 2021-09-17 苏州美卡网络科技有限公司 一种基于人工智能的语言翻译***及方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115828940A (zh) * 2022-12-08 2023-03-21 吉林农业科技学院 一种基于语料处理技术的中韩翻译***
CN115828940B (zh) * 2022-12-08 2024-06-04 吉林农业科技学院 一种基于语料处理技术的中韩翻译***
CN115965017A (zh) * 2023-01-04 2023-04-14 北京三维天地科技股份有限公司 一种基于开发平台的多语言录入和解析***及方法
CN115965017B (zh) * 2023-01-04 2023-11-10 北京三维天地科技股份有限公司 一种基于开发平台的多语言录入和解析***及方法

Also Published As

Publication number Publication date
CN114139560B (zh) 2022-12-09

Similar Documents

Publication Publication Date Title
KR102577514B1 (ko) 텍스트 창작 방법, 텍스트 창작 장치, 전자 기기 및 저장 매체
CN108287858B (zh) 自然语言的语义提取方法及装置
CN110298033B (zh) 关键词语料标注训练提取***
CN109858041B (zh) 一种半监督学习结合自定义词典的命名实体识别方法
CN114139560B (zh) 基于人工智能翻译***
CN110825845A (zh) 一种基于字符与自注意力机制的层次文本分类方法及中文文本分类方法
CN100483417C (zh) 获取限制词信息的方法、优化输出的方法和输入法***
CN110765759B (zh) 意图识别方法及装置
CN109460459B (zh) 一种基于日志学习的对话***自动优化方法
WO2008107305A2 (en) Search-based word segmentation method and device for language without word boundary tag
CN108538294B (zh) 一种语音交互方法及装置
CN101937430A (zh) 一种汉语句子中事件句式的抽取方法
CN111401058B (zh) 一种基于命名实体识别工具的属性值抽取方法及装置
CN110442880B (zh) 一种机器翻译译文的翻译方法、装置及存储介质
CN101082909A (zh) 一种识别衍生词的中文分词方法及***
CN111709242A (zh) 一种基于命名实体识别的中文标点符号添加方法
CN110717045A (zh) 一种基于信访信件概况的信件要素自动提取方法
US20220414463A1 (en) Automated troubleshooter
CN112131876A (zh) 一种基于相似度确定标准问题的方法及***
CN113157859A (zh) 一种基于上位概念信息的事件检测方法
Watts et al. Unsupervised continuous-valued word features for phrase-break prediction without a part-of-speech tagger.
CN113761903A (zh) 一种针对海量高噪音口语化短文本的文本筛选方法
KR101941924B1 (ko) 자율 인지 신경망 기반 연관 모델 학습을 이용한 나노 의도 분석 서비스 제공 방법
CN112380848B (zh) 文本生成方法、装置、设备及存储介质
CN113779987A (zh) 一种基于自注意力增强语义的事件共指消岐方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 1501, Quanjing Yayuan business building, 33 liuchangshan Road, Shizhong District, Jinan City, Shandong Province

Applicant after: Shandong Shiyu Information Technology Co.,Ltd.

Address before: Room 1501, Quanjing Yayuan business building, 33 liuchangshan Road, Shizhong District, Jinan City, Shandong Province

Applicant before: Shandong Shiyu Translation Co.,Ltd.

GR01 Patent grant
GR01 Patent grant