CN117313754B

CN117313754B - 智能翻译方法、装置以及翻译机

Info

Publication number: CN117313754B
Application number: CN202311577252.6A
Authority: CN
Inventors: 车建波
Original assignee: Shenzhen Bepal Intelligent Technology Co ltd
Current assignee: Shenzhen Bepal Intelligent Technology Co ltd
Priority date: 2023-11-24
Filing date: 2023-11-24
Publication date: 2024-01-30
Anticipated expiration: 2043-11-24
Also published as: CN117313754A

Abstract

本申请公开了一种智能翻译方法、装置以及翻译机，涉及翻译技术领域，包括：输入单元、输出单元、翻译单元；所述输入单元用于采集第一目标文字，所述第一目标文字用于确定第一目标文字的来源书籍；翻译单元用于根据第一目标文字和第一音频信息，在获取到预设文字的情况下，确定与预设文字对应的第二音频信息，并根据第二音频信息前后的第二目标文字，预测第二目标文字中的待识别多义字输出为初始的第三目标文字，以及将第三目标文字根据预测的文本信息与第三音频信息做出比对，将确定后的文字信息输出为第四目标文字；所述输出单元用于输出将第四目标文字输出为音频内容，从而得到对应的翻译结果；能够提高用户的阅读体验，提高可读性和连贯性。

Description

智能翻译方法、装置以及翻译机

技术领域

本发明涉及翻译技术领域，尤其涉及智能翻译方法、装置以及翻译机。

背景技术

课外阅读是学习的一种有效途径，而小孩由于识字量的问题，对于一些没有拼音的课外书籍，经常会存在不认识的字，遇到这种情况小孩只能选择跳过或者寻求家长的帮助，导致阅读体验较差。

但是，在现有技术中，通过翻译机对用户学习进行辅助时，对于上下文的处理会出现一定形式的问题，尤其是很多汉字同音不同译，汉字具备多种释义，导致最终得到的翻译效果较差，不能提高用户对文字的理解效果。

发明内容

本申请实施例通过提供一种智能翻译方法、装置以及翻译机，减小了现有技术中多种释义对翻译效果的影响，交互内容使得翻译能够实时获得用户的反馈和修正，提高了翻译的可读性和连贯性。

本申请实施例提供了一种智能翻译装置，包括：输入单元、输出单元、翻译单元；

所述输入单元用于采集第一目标文字，所述第一目标文字用于确定第一目标文字的来源书籍；

翻译单元用于根据第一目标文字和第一音频信息，在获取到预设文字的情况下，确定与预设文字对应的第二音频信息，并根据第二音频信息前后的第二目标文字，预测第二目标文字中的待识别多义字的输出为初始的第三目标文字，以及将第三目标文字根据预测的文本信息与第三音频信息做出比对，将确定后的文字信息输出为第四目标文字；

所述输出单元用于输出将第四目标文字输出为音频内容，从而得到对应的翻译结果。

智能翻译装置还包括识别单元，所述识别单元用于识别翻译单元的输出的第四目标文字，确定用户的互动信息；根据互动信息，输出第五目标文字。

当确定第二目标文字的长度时，根据第一目标文字中出现的成语数量比例，确定设置的第二目标文字的长度；

当确定第二目标文字时，根据第二目标文字确定第三目标文字，基于第二目标文字，确定第二目标文字与第一目标文字连续信息互相对应，且根据第二目标文字中与常见多义词相同的文字信息为当前的第三目标文字。

当获取第五目标文字时，比较第五目标文字在第二目标文字的出现次数，当第五目标文字的出现次数大于预设次数阈值时，将第五目标文字作为基础，重新构建第三目标文字；

将第五目标文字作为基础，重新构建第三目标文字的过程为：

将第五目标文字与第二目标文字的第一个字进行拼接，当第五目标文字可以与第二目标文字拼接时，将第五目标文字作为重构的第三目标文字。

当第五目标文字出现次数小于预设次数阈值时，比较第四目标文字与第五目标文字中相同的部分，将第四目标文字与第五目标文字相同的文字作为重构的第三目标文字。

将互动信息分为多个感兴趣区域，获取每个感兴趣区域的第一特征；

基于每个第一特征，确定互动信息的权重分布，选择具有最大权重的第一特征作为该感兴趣区域的第一特征；

对互动信息进行评分，根据互动信息中的评分反馈，获取第二特征；

根据第一特征和第二特征，确定输出的第五目标文字。

根据识别单元对互动信息识别，获取一个第五目标文字，在接收到第二个第五目标文字时，根据第二目标文字的长度，调整第五目标文字的长度上限，第五目标文字的长度上限为第二目标文字长度的一半。

根据第五目标文字以对第三目标文字进行调整，包括：所述第五目标文字与第二目标文字连续时，所述第二目标文字之后的文字与第三目标文字预设长度一致的文字为调整后的第三目标文字；

当第五目标文字与第二目标文字不连续时，将所述第五目标文字逐个与第二目标文字拼接，拼接后为固定组合的文字为调整后的第三目标文字。

所述第一音频信息是采集到第一目标文字后，采集到用户对当前文字的阅读的音频信息；所述第二音频信息是当采集到预设文字时，从用户发出的音频信息中和预设文字相关的音频信息；所述第三音频信息为用户在翻译完成后的音频；第二目标文字为第二音频信息对应的书籍内容；第三目标文字为第二目标文字中的待识别多义字；所述第四目标文字表示为将多义字根据上下文调整后的内容释义；所述第五目标文字指的是互动信息中和翻译信息相关或者相同的文字。

本申请实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

通过将获取文字信息通过输入单元、翻译单元、输出单元、识别单元进行共同处理，并获取用户的互动信息，使得在获取互动信息后，及时修改翻译的内容，提高了翻译的效果，提高了翻译的可读性和连贯性。

附图说明

图1为智能翻译装置的实施例一的结构示意图；

图2为智能翻译装置的实施例二的结构示意图；

图3为智能翻译方法的流程示意图。

实施方式

为了便于理解本发明，下面将参照相关附图对本申请进行更全面的描述；附图中给出了本发明的较佳实施方式，但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施方式；相反地，提供这些实施方式的目的是使对本发明的公开内容理解的更加透彻全面。

需要说明的是，本文所使用的术语“垂直”、“水平”、“上”、“下”、“左”、“右”以及类似的表述只是为了说明的目的，并不表示是唯一的实施方式。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同；本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的，不是旨在于限制本发明；本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

实施例一

在用户对文字进行识别时，有很多字体实际上的意思要根据上下文来确定，尤其是对古诗词、文言文等进行翻译时，每个字都有很多种意思，个别的字甚至能达到数十种意思，甚至是通过上下文推测到的意思仍会出现错误，此时就要根据选择翻译的内容进行及时调整，从而对用户的学习起到辅助的作用。

如图1所示，智能翻译装置，包括：输入单元、输出单元、翻译单元；

其中，所述输入单元用于采集第一目标文字，所述第一目标文字用于确定第一目标文字的来源书籍，从而确定第一目标文字是什么书籍、古文中的内容。

根据第一目标文字采集第一音频信息，第一音频信息是采集到第一目标文字后，采集到用户对当前文字的阅读的音频信息。

所述翻译单元用于根据第一目标文字和第一音频信息，在获取到预设文字的情况下，确定与预设文字对应的第二音频信息，并根据第二音频信息前后的第二目标文字，预测第二目标文字中的待识别多义字输出为初始的第三目标文字，以及将第三目标文字根据预测的文本信息与第三音频信息做出比对，将确定后的文字信息输出为第四目标文字。其中，预设文字是根据第一目标文字来源的信息确定的，可以是书籍、古文中的具体语句，用来确定哪些语句可能会出现翻译问题。

优选的，第二音频信息是当采集到预设文字时，从用户发出的音频信息中提取的和预设文字相关的音频信息，并将第二音频信息对应的书籍内容作为第二目标文字。

所述第四目标文字表示为将多义字根据上下文调整后的内容释义。

优选的，所述初始的第三目标文字根据第二目标文字的前后拼接，确定组合的短语样式，第三目标文字的长度与常用的成语组成形式相同，第二目标文字设置的长度根据第一目标文字确定的文章来源进行确定，当采集文言文时，第三目标文字长度为5，当采集古诗文时，根据古诗文的类型，将第三目标文字长度调整成3、5、7。

优选的，当确定好目标文字时，比较第一目标文字中对应的目标特征与预设特征，选择出第一目标文字中比较特殊的文字组合，在根据上下文的配置情况，确定文字组合的表达意思，从而输出得到对应的翻译信息。

当获取到文本信息时，根据前后文和文字组合来确定的目标文字的释义组合，进一步根据采集的音频信息，确定对应文字与上下语境之间的关系，并获取读音来进一步缩小目标文字的范围，并根据前后文字的组合结果，确定最终识别的文字信息内容，进一步，在获取到对应的翻译信息后，根据用户的交互情况，来确定输出的翻译形式，提高翻译的结果。

优选的，获取第三音频信息，所述第三音频信息为用户在翻译完成后的音频。

优选的，第三音频信息满足预设条件，所述预设条件为，当前用户发音连续，且发音文字内容属于目标文字的类型。

优选的，当确定第二目标文字的长度时，根据第一目标文字中出现的成语数量比例，确定设置的第二目标文字的长度。

优选的，当确定第二目标文字时，根据第二目标文字确定第三目标文字，基于第二目标文字，确定第二目标文字与第一目标文字连续信息互相对应，且根据第二目标文字中与常见多义词相同的文字信息为当前的第三目标文字。

此时，根据第二目标文字连续内容中是否存在常见的多义词来确定当前文章中出现的多义词名单，并根据多义词名单得到当前翻译内容中不容易识别翻译的第三目标文字。

优选的，当获取到第三目标文字后，根据第三目标文字的设置情况，确定第三目标文字中与用户需求翻译的文字，从第三目标文字中选择的文字与第一目标文字、第二目标文字进行比对，从而选择合适的释义，并将第三目标文字翻译为第四目标文字。

本实施例中，通过获取多义词，通过对多义词的处理来提高阅读的效果，从而辅助用户理解翻译的文本信息。

实施例二

为了提高翻译的效果，提高用户翻译和互动的效果，如图2所示，本发明还提供了识别单元用于识别翻译后出现的疑问点，通过对用户交互信息的处理来确定翻译时需要进行修改的内容，从而提高翻译时的效果，提高翻译的可读性。

优选的，智能翻译装置还包括，识别单元，所述识别单元用于识别翻译单元的输出的第四目标文字，确定用户的互动信息；根据互动信息，输出第五目标文字。

具体来说，识别单元用于根据翻译单元对应的互动信息，获取第五目标文字，所述第五目标文字指的是互动信息中和翻译信息相关或者相同的文字；根据第五目标文字可以知道在确定好当前翻译的内容后，翻译信息中是否存在不同的地方，从而记录这部分数据，在进行下一步翻译时，调整翻译中的内容。

当获取第五目标文字时，比较第五目标文字在第二目标文字的出现次数，当第五目标文字的出现次数大于预设次数阈值时，将第五目标文字作为基础，重新构建第三目标文字；说明第五目标文字出现次数较多，且出现后对应的文本释义较为复杂，用户反馈的信息中就会多次出现没有说明清楚的部分。

优选的，将第五目标文字作为基础，重新构建第三目标文字的过程为：

优选的，当第五目标文字出现次数小于预设次数阈值时，比较第四目标文字与第五目标文字中相同的部分，将第四目标文字与第五目标文字相同的文字作为重构的第三目标文字。

在本实施例中，通过互动信息的反馈结果，修改第三目标文字，以修改最终翻译时多义词的翻译内容，从而提高翻译的效果，使得翻译装置可以根据用户的需求反馈来调整翻译的内容，实现翻译效果的提升。

实施例三

为了提高对用户互动的处理效果，对于第五目标文字的获取方式进行调整，使得第五目标文字可以表现出用户的反馈需求，优选的，对第五目标文字的获取方式还包括：

其中，第一特征是通过将互动信息分为多个感兴趣区域，每个感兴趣区域中提取得到的，所述感兴趣区域是根据翻译得到的结果与用户在核对翻译结果时对机器界面的点机确定的，每个感兴趣区域的大小一致，每个感兴趣区域均存在至少一个第一特征，第一特征为互动时容易引起用户注意的信息。

优选的，将互动信息分解为一组主题，每个主题分配一组关键词，每个主题的关键词为感兴趣区域的第一特征。

基于每个第一特征，确定互动信息的权重分布，选择具有最大权重的第一特征作为该感兴趣区域的第一特征。

具体的，根据每个第一特征在互动信息中出现的频率和占比来计算比重，出现次数多的第一特征具有较高的权重；

根据第一特征的权重对第一特征的进行评估，从而调整第一特征对应的关键词，使得每个第一特征被直接评估时的效率得到提升。

对互动信息进行评分，根据互动信息中的评分反馈，获取第二特征。

其中，所述第二特征是根据用户的喜好、反馈等级来确定的，通过用户的历史数据和交互行为中提取得到的。

优选的，第二特征的获取方式为：

获取互动信息的历史互动数据，根据历史互动数据，提取用户的点击行为与感兴趣区域的关联信息。

根据用户的点击行为与感兴趣区域的关联信息，获取用户的点击特征与关联特征；所述点击特征为针对点击行为，提取得到的点击次数、点击位置、点击时间等；所述关联特征为提取该感兴趣区域内关联信息的特征。

根据点击特征与关联特征，计算每个特征的特征权重，将特征权重归一化，选择特征权重最大的特征作为第二特征。

对于点击特征与关联特征的计算，通过神经网络进行处理，将每个点击特征与关联特征作为输入，计算每个输出和期望输出之间的差异，并根据差异得到的误差逐个获取特征权重，对于神经网络的具体方式，此处就不在过多描述。

具体来说，通过获取历史互动数据中用户点击的次数、位置等数据，能够了解到用户在翻译后进行的操作形式，从而能够根据用户的点击位置、次数是别别出翻译时出现的文字；例如识别点击位置，可以识别点击位置对应的翻译文本和原文本，将两个文本比较后就能知道翻译多义词时出现的问题，从而调整翻译的方法形式；识别点击次数则可以知道用户对于某些翻译内容的不满，或者是翻译后产生不通顺问题；同时获取感兴趣区域关联特征，可以知道每次出现问题时，问题关联的区域，调整每个区域最终翻译的结果，从而提高最终识别的信息效果。

根据第一特征和第二特征，确定输出的第五目标文字。

在本步骤中，通过将第一特征和第二特征来确定最终输出的第五目标文字，得到的第五目标文字可以更加明确得到的目标特征；

优选的，识别单元还用于确定第五目标文字是否符合预设条件，在所述第五目标文字获得时，根据识别单元对互动信息识别，获取一个第五目标文字，在接收到第二个第五目标文字时，根据第二目标文字的长度，调整第五目标文字的长度上限，第五目标文字的长度上限为第二目标文字长度的一半。

此时，对第五目标文字长度进行限制，因为每次读取翻译的文字有限，第二目标文字又是在获取到第二音频消息时识别的文字，第五目标文字的长度设置为第二目标文字长度一半，能够得到足够多的文字从而辅助识别更多的文字内容。

优选的，识别单元还用于确定段落标记，当所述识别单元获取到不同段落的互动信息时，将不同段落的互动信息设置段落标记，当段落标记更新信息时重新获取第五目标文字，并将已经存储的第五目标文字传输至翻译单元，根据第五目标文字以对第三目标文字进行调整。

其中，所述第五目标文字与第二目标文字连续时，所述第二目标文字之后的文字与第三目标文字预设长度一致的文字为调整后的第三目标文字；

此时是说明每个段落都具备相应的第五目标文字，在每个段落中当第五目标文字能和识别时的第二目标文字连续，则说明第五目标文字是当前难以正确翻译的内容；当不连续时，第五目标文字本身就是被反馈容易出现问题的字，此时如果第二目标文字能与第五目标文字组合，就说明存在一些难以翻译的语句。

优选的，如图3所示，本发明提供一种智能翻译方法，包括：

步骤S1，采集用户的第一目标文字，根据第一目标文字获取第一音频信息；

步骤S2，根据第一目标文字和第一音频信息，在获取到预设文字的情况下，确定与预设文字对应的第二音频信息，并根据第二音频信息前后的第二目标文字，预测第二目标文字中的待识别多义字输出为初始的第三目标文字；

步骤S3，将第三目标文字根据预测的文本信息与第三音频信息做出比对，将确定后的文字信息输出为第四目标文字；

步骤S4，根据第四目标文字，确定用户的互动信息；根据互动信息，输出第五目标文字；

步骤S5，第五目标文字作为基础，重新构建第三目标文字。

在本步骤中，将重新构建的第三目标文字再次输出，从而起到对翻译内容的调节效果，使得翻译更加精准，可以减少翻译中出现的多义词对翻译造成的影响。

优选的，本发明提供一种智能翻译机包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有能够被所述至少一个处理器执行的指令，执行如实施例一、二、三任一所述的装置。

以上所述仅为本发明的优选实施方式，并不用于限制本发明，对于本领域技术人员来说，本发明可以有各种更改和变化。凡在本发明精神和原则内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种智能翻译装置，其特征在于，包括：输入单元、输出单元、翻译单元；

翻译单元用于根据第一目标文字和第一音频信息，在获取到预设文字的情况下，确定与预设文字对应的第二音频信息，并根据第二音频信息前后的第二目标文字，预测第二目标文字中的待识别多义字输出为初始的第三目标文字，以及将第三目标文字根据预测的文本信息与第三音频信息做出比对，将确定后的文字信息输出为第四目标文字；

所述输出单元用于输出将第四目标文字输出为音频内容，从而得到对应的翻译结果；

识别单元用于识别翻译单元的输出的第四目标文字，确定用户的互动信息；根据互动信息，输出第五目标文字；

将第五目标文字与第二目标文字的第一个字进行拼接，当第五目标文字可以与第二目标文字拼接时，将第五目标文字作为重构的第三目标文字；

当第五目标文字出现次数小于预设次数阈值时，比较第四目标文字与第五目标文字中相同的部分，将第四目标文字与第五目标文字相同的文字作为重构的第三目标文字；

当第五目标文字与第二目标文字不连续时，将所述第五目标文字逐个与第二目标文字拼接，拼接后为固定组合的文字为调整后的第三目标文字；

2.如权利要求1所述的智能翻译装置，其特征在于，当确定第二目标文字的长度时，根据第一目标文字中出现的成语数量比例，确定设置的第二目标文字的长度；

3.如权利要求1所述的智能翻译装置，其特征在于，将互动信息分为多个感兴趣区域，获取每个感兴趣区域的第一特征；

根据第一特征和第二特征，确定输出的第五目标文字。

4.如权利要求1所述的智能翻译装置，其特征在于，根据识别单元对互动信息识别，获取一个第五目标文字，在接收到第二个第五目标文字时，根据第二目标文字的长度，调整第五目标文字的长度上限，第五目标文字的长度上限为第二目标文字长度的一半。