CN111508522A

CN111508522A - 一种语句分析处理方法及***

Info

Publication number: CN111508522A
Application number: CN201910094372.8A
Authority: CN
Inventors: 夏海荣; 张少飞; 于佳玉; 刘悦
Original assignee: Hujiang Education Technology Shanghai Co ltd
Current assignee: Hujiang Education Technology Shanghai Co ltd
Priority date: 2019-01-30
Filing date: 2019-01-30
Publication date: 2020-08-07

Abstract

本发明公开了一种语句分析处理的方法及***，所述方法包括：对进行练习语句进行韵律层级分析，确定各个语句中各个韵律组块的组块时间边界，对练习语句设置语调标记；对练习语句设置重读标记；将确定的组块时间边界、语调标记以及重读标记的练习语句作为标准韵律层级语句。通过本发明所提供的方法，对输入的语句的文本进行韵律层级分析，从而将一个整句的线性单词序列转换成一个韵律层级结构，从而使用户学习和掌握对文本进行韵律结构分析的方法以及在发音中使用。通过该方法还可以使用户在语句朗读时，掌握语调以及重读的使用。

Description

一种语句分析处理方法及***

技术领域

本申请涉及数据分析技术领域，尤其涉及一种语句分析处理方法及***。

背景技术

朗读是语言学习中的一个重要的学习方法：朗读可以提升学习者的发音的准确性和流利度，也能提高学习者对句子乃至篇章的理解能力，从而加强对重读、语调等韵律特征的正确使用。

在朗读中，学习者可能会出现下面的错误或不当：单词的发音错误或不适当(包括元音、辅音、音节边界、重读、连读、省读等)，词内及词间的不流利(包括不合适的时长和停顿)，缺乏音高能力等韵律变化(重读的遗漏或者误用)、缺乏正确地进行语法语义相关的语调变化(例如句末的声调或者降调)、不能正确地理解语句并通过短语(Phrasing)来控制语音输出的节奏。

目前，较为传统的方案通过如下两种方式来练习朗读：

方式一：有声字典

独立电子辞典设备、或者桌面软件、运行于移动设备中的软件(包括微信小程序、网页等)。在用户查询单词后，有声字典提供该词的传统释义，同时提供该词的可以播放的发音音频(真人录音或者计算机合成语言)。学习者通过播放该音频，了解该单词的发音，并可能进行口头模仿。有声字典也可能提供若干与单词相关的例句，这些例句也同样可能带有可以播放的音频。

方式二：有声读物

可以是独立发行的音频文件(mp3等)、图书的配套光盘、早期的录音磁带，也可以是某个内容平台上的节目形式：例如PodCast、喜马拉雅FM、微信公众号等等。学习者使用有声读物的方式通常为“听”。学习者当然也可以自行进行模仿。

方式三：发音评测软件

包括运行于桌面***的软件、运行于移动设备中的软件(移动应用、微信小程序、网页程序等)、其他运行了操作***的智能设备(智能电视、智能音箱等)。此类软件通常提供示范音频，将学习者朗读语音与示范语音进行比对，产生一个整体打分，一般也提供包括发音准确度、完整度以及流利度在内的细分维度的打分。

虽然，上述的方案可以引导用户进行朗读训练，但是方式一以及方式二不能对用户的朗读水平进行评价，学习者不能得到即时的反馈；

方式三虽然能够对朗读者的训练进行评分，但是往往只能提供整句级别的朗读评分，***无法实现学习者在结构片段上进行针对训练；并且该方式仅仅提供录音示范音频，无法提供教学功能，从而降低了用户对朗读技巧的掌握。

发明内容

本发明提供了一种语句分析处理方法及***，用以解决现有技术中对用户朗读数据进行整句分析评测，导致用户无法针对性进行训练的问题。

其具体的技术方案如下：

一种语句分析处理的方法，所述方法包括：

对进行练习语句进行韵律层级分析，确定各个语句中各个韵律组块的组块时间边界，其中，所述韵律组块包含至少一个单词，所述时间边界表征了语句的停顿位置；

根据确定出的所述组块时间边界，对所述练习语句设置语调标记；

根据确定出的所述组块时间边界，对所述练习语句设置重读标记；

将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句。

可选的，对进行练习语句进行韵律层级分析，确定各个语句中各个韵律组块的组块时间边界，包括：

对进行练习语句进行韵律层级分析，确定所述练习语句中各个单词对应的单词时间边界；

根据各个单词的所述单词时间边界，确定各个韵律组块的所述组块时间边界。

可选的，根据各个单词的所述单词时间边界，确定各个韵律组块的所述组块时间边界，包括：

根据各个单词的单词时间边界，在练习语句中确定出句子层；

在所述句子层中确定出语调短语层；

在所述语调短语层中确定出韵律短语层；

根据所述句子层、所述语调短语层以及所述韵律短语层，确定各个韵律组块的所述组块时间边界。

可选的，根据确定出的所述组块时间边界，对所述练习语句设置语调标记，包括：

获取所述练习语句中的数据以及获取语调标注集，其中，所述数据包含每行文本以及每行文本对应的语音，所述标注集中包含了各个语调；

基于所述练习语句中的数据以及标注集，以及根据确定出所述单词时间边界，对各个单词设置语调标记。

可选的，根据确定出的所述组块时间边界，对所述练习语句设置重读标记，包括：

获取所述练习语句中的数据以及获取重读标注集；

基于所述练习语句中的数据以及获取的重读标注集，以及根据确定出所述单词时间边界，对各个单词进行重读标记。

可选的，在将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句之后，所述方法还包括：

获取用户基于所述标准韵律层级语句的练习语句；

基于韵律层级，在所述练习语句中确定出存在错误的韵律组块；

输出用于提示用户进行重复练习的韵律组块的提示信息。

可选的，在输出用于提示用于进行重复练习的韵律组块的提示信息之后，所述方法还包括：

检测用户当前训练的韵律组块是否评测通过；

若否，则提示用户继续训练当前韵律组块；

若是，则从当前的韵律组块切换至下一个存在错误的韵律组块，以使用户练习下一个韵律组块。

一种语句分析处理的***，所述***包括：

分析模块，用于对进行练习语句进行韵律层级分析，确定各个语句中各个韵律组块的组块时间边界，根据确定出的所述组块时间边界，对所述练习语句设置语调标记；根据确定出的所述组块时间边界，对所述练习语句设置重读标记，其中，所述韵律组块包含至少一个单词，所述时间边界表征了语句的停顿位置；

处理模块，用于将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句。

可选的，所述分析模块，具体用于对进行练习语句进行韵律层级分析，确定所述练习语句中各个单词对应的单词时间边界；根据各个单词的所述单词时间边界，确定各个韵律组块的所述组块时间边界。

可选的，所述分析模块，具体用于根据各个单词的单词时间边界，在练习语句中确定出句子层；在所述句子层中确定出语调短语层；在所述语调短语层中确定出韵律短语层；根据所述句子层、所述语调短语层以及所述韵律短语层，确定各个韵律组块的所述组块时间边界。

可选的，所述分析模块，具体用于获取所述练习语句中的数据以及获取语调标注集，其中，所述数据包含每行文本以及每行文本对应的语音，所述标注集中包含了各个语调；基于所述练习语句中的数据以及标注集，以及根据确定出所述单词时间边界，对各个单词设置语调标记。

可选的，所述分析模块，具体用于获取所述练习语句中的数据以及获取重读标注集；基于所述练习语句中的数据以及获取的重读标注集，以及根据确定出所述单词时间边界，对各个单词进行重读标记。

可选的，所述处理模块，还用于获取用户基于所述标准韵律层级语句的练习语句；基于韵律层级，在所述练习语句中确定出存在错误的韵律组块；输出用于提示用户进行重复练习的韵律组块的提示信息。

可选的，所述处理模块，还用于检测用户当前训练的韵律组块是否评测通过；若否，则提示用户继续训练当前韵律组块；若是，则从当前的韵律组块切换至下一个存在错误的韵律组块，以使用户练习下一个韵律组块。

通过本发明所提供的方法，对输入的语句的文本进行韵律层级分析，从而将一个整句的线性单词序列转换成一个韵律层级结构，从而使用户学习和掌握对文本进行韵律结构分析的方法以及在发音中使用。通过该方法还可以使用户在语句朗读时，掌握语调以及重读的使用。

另外，可以对用户的语句进行韵律组块的分解分析，确定用户在语句中各个韵律组块中存在的错误，从而使用户可以针对各个韵律组块，甚至针对单个单词进行部分的练习，进而提升了朗读学习的针对性以及学习效率。

附图说明

图1为本发明实施例中一种语句分析处理方法的流程图；

图2为本发明实施例中韵律层级结构示意图；

图3为本发明实施例中一种语句分析处理***的结构示意图。

具体实施方式

下面通过附图以及具体实施例对本发明技术方案做详细的说明，应当理解，本发明实施例以及实施例中的具体技术特征只是对本发明技术方案的说明，而不是限定，在不冲突的情况下，本发明实施例以及实施例中的具体技术特征可以相互组合。

首先，对本发明所涉及到的名词进行解释：

句子：根据语法规则和语义需要组织的单词和标点符号的序列，表达特定的含义，通常以标点符号结束。

语音：人类发声器官(声带、声道、舌、口腔、唇、齿)在大脑的协调下，将特定的句子以音素序列的方式自然地转变为声音。

韵律：人类自然语言中为了表达的需要，赋予特定音素/音节以不同的韵律参数：时长(Duration)、音高(Pitch)、能量(Energy)，以及停顿(Pause)，以产生“抑扬顿挫、轻重缓急”的效果。人类可以感知韵律参数是否与文本匹配。

语调：指的是一个句子或者句子的片段的发音的音高轨迹的趋势。一般情况下，陈述句和特殊疑问句使用降调，而一般疑问句使用升调。

语义重读：区别于英语单词内的重读符号(stress)，话者往往根据句子的语义和表达的需要，使某些单词的韵律表现于周边单词更加突出，例如音调的升高、能量(音量)的加大、时长的增长、使用额外的停顿等等。

语法结构：按照语言学的准则，例如主、谓、宾、定、状、补，将自然语言文字描述的句子解析为描述前述成份的语法树的过程。该语法树通常被表示为一种嵌套结构，例如S＝NP+VP，表示的是一个句子S由一个名字短语(作主语)加上一个动词短语(作谓语)构成。

韵律结构：韵律结构是话者在说话的过程中，按照交流的需要，将文字序列重新组织成“互相连接的块状结构”的过程。正确合适的韵律结构，会降低话者和听者的交流成本。韵律结构影响了文本朗读出来后的韵律特征。这个块状结构也具有嵌套(层级)结

构，但是层级比语法结构要浅的多，一般只有2～3层。例如：S＝IP1+IP2，IP1＝PP1+PP2表示一个句子S由两个语调短语IP1和IP2构成，其中IP1由韵律短语PP1和韵律短语PP2构成。

如图1所示为本发明实施例中一种语句分析处理方法，该方法包括：

S1，对进行练习语句进行韵律层级分析，确定各个语句中各个韵律组块的组块时间边界；

首先，需要对韵律层级进行分析，在本发明实施例中该韵律层级可以分为3层：句子层(S)、语调短语层(IP)、韵律短语层(PP)。其中一个S可以由一个到多个IP构成，一个IP也可以由一个到多个PP构成，各个组块之间的标记为组块时间边界。

具体来讲，S＝[w₀,w₁,w₂,,,w_i,,,w_n]，分析出的层级结果为：S＝[[w₀,w₁,w₂][[w₃,w₄],[w_i,,,w_n]]，其中，句子S包括两个IP：IP1＝[w₀,w₁,w₂]，IP2＝[w₃,,,w_i,,,w_n]，其中，IP2包含两个PP，即：PP1＝[w₃,w₄]，PP2＝[w_i,,,w_i,,,w_n]。

在将练习语句进行韵律层级分析之前，首先需要确定语句中各个单词的单词时间边界。在本发明实施例中，单词时间边界为：IP_Boundary、PP_Boundary、None-Boundary。

举例来讲，语句为：This is a serious issue and something we will discusswith Moscow。则对应每个单词的单词时间边界如表1所示：

表1

根据单词的时间边界就可以确定语句中各个韵律组块的时间边界。举例来讲，该语句为：This is a serious issue and something we will discuss with Moscow。学习者在朗读这句包括12个单词、17个音节的句子的时候，需要避免一口气念完，而应该符合句子自身的特性，做出合适的韵律结构的分析和规划。

因此通过韵律层级分析之后，得到的韵律分析结果如图2所示，在图2中将完整的练习语句划分成对应层级。

这里需要说明是，在本发明实施例中，该韵律层级的分析可以通过条件随机场算法、隐马尔科夫模型、循环神经网络等机器学习的算法模型来进行计算求解。

通过上述的韵律层级分析，可以标记处语音中的韵律层级，可以用于对用户的语音练习进行评估，作为后续语音练习的评分依据。

S2，根据确定出的组块时间边界，对练习语句设置语调标记；

首先，在本发明实施例中，语调类型、适用情况以语调趋势如表2所示：

表2

基于表2中内容，该语调的标注集为：I＝{None,L ow,High,L ow_L ow,L ow_High,High_L ow,High_High}；

训练数据集为D＝{D₀,D₁,,,D_i,,,,D_k}，其中D_i＝S_i,T_i，S_i＝[w₀,w₁,,,w_i,,,w_n]，T_i＝[t_i0,t_i1,,,t_ij,,,t_in|t_ij]。

进一步，在本发明实施例中，基于无监督聚类算法对语调进行标注，具体步骤为：

1、指定标准的标准文档以确定记录格式、判决依据以及仲裁方案等；

2、准备待标注的数据，包括每行文本以及对应语音；

3、运行韵律层级标注流程，确定韵律层级边界；

4、使用强制对齐算法，计算语音中每个单词的单词时间边界；

5、提取句子中的声学特征，产生Ai＝[ai0,ai1,,,aij,,,ain]数据；

6、对所有Ai中ij的集合，执行类似于K-Means的无监督聚类：

6-1)对于None-Boundary，跳过；

6-2)对于PP_Boundary，聚类的目标为2类；

6-3)对于IP_Boundary，聚类的目标为4类；

基于上述的方法，建立模型训练，建立机器学习模型的步骤如下：

1、对大规模数据集，按照上述的标注方法进行处理；

2、提取文本特征，并构建文本特征表示与音调类型之间的对；

3、利用学习算法训练文本特征表示与音调类型之间关系的模型。

利用上述的模型进行语调的判别的步骤如下：

a、初始化分类计算，并加载上述的学习模型；

b、提取文本特征表示；

c、将文本特征表示输入分类算法，并产生输出目标音调类型。

如表3所示为语调输出结果：

表3

S3，根据确定出的组块时间边界，对练习语句设置重读标记；

S4，将确定的组块时间边界、语调标记以及重读标记的练习语句作为标准韵律层级语句。

在完成对练习语句的语调分析之后，还需要对练习语句进行重读分析，也就是标记出语音中每个单词片段的重读标记，其中，重读类型如表4所示：

重读类型	适用	重读情况
			None	常见于虚词，或被弱化的实词	弱读
Normal	常见于实词	正常
			Emphasized	实词为突出语义所需要	重读

表4

基于表2中内容，该重读的标注集为：E＝{None,Nor mal,Emphasized}；对于训练数据中的每一个词，需要予以标注集E中的一个标记，训练数据集D＝{D₀,D₁,,,D_i,,,,D_k}，其中：D_i＝S_i,A_i,T_i，表示训练集中的一个文档(句子)；

S_i＝[w_i0,w_i1,,,w_ij,,,w_in]，表示该文档(句子)的单词(Token)序列，长度为；A_i＝[a_i0,a_i1,,,a_ij,,,ai_n]，表示对应于每个单词(Token)的声学特征(Acoustics Feature)序列；T_i＝[t_i0,t_i1,,,t_ij,,,t_in|t_ij]其中，E表示对应于每个单词(Token)的标记序列。

进一步，利用无监督聚类进行重读标注，该标注方法如下：

2、准备待标注的数据，包括每行文本以及对应语音；

3、运行韵律层级标注流程，确定韵律层级边界；

5、提取句子中的声学特征，产生Ai＝[ai0,ai1,,,aij,,,ain]数据；

6、对所有Ai中ij的集合，执行类似于K-Means的无监督聚类，聚类的目标为3类。

1、对大规模数据集，按照上述的标注方法进行处理；

利用上述的模型进行语调的判别的步骤如下：

a、初始化分类计算，并加载上述的学习模型；

b、提取文本特征表示；

如表4所示为语调输出结果：

表4

在完成上述的韵律层级分析之后，获取用户基于标准韵律层级语句的练习语句，基于韵律层级，在练习语句中确定出存在错误的韵律组块，输出用于提示用户进行练习的韵律组块的提示信息。简单来讲，一个语句中，会存在不同的韵律组块，***将对每个韵律组块进行分析，从而确定用户的练习语句中是否存在错误，若是存在错误则给出用户提示，并提示错误的位置。

在存在错误时，***将进入到错误韵律组块的重复练习阶段，检测用户当前练习的韵律组块是否评测通过，这里的评测为基于上述方法的评测，若是评测未通过，则提示用户继续当前韵律组块的练习，若是评测通过，则从当前的韵律组块切换至下一个存在错误的韵律组块进行练习。

对应本发明实施例所提供的方法，本发明实施例中还提供了一种语句分析处理***，如图3所示为本发明实施例中一种语句分析处理***的结构示意图，该***包括：

分析模块301，用于对进行练习语句进行韵律层级分析，确定各个语句中各个韵律组块的组块时间边界，根据确定出的所述组块时间边界，对所述练习语句设置语调标记；根据确定出的所述组块时间边界，对所述练习语句设置重读标记，其中，所述韵律组块包含至少一个单词，所述时间边界表征了语句的停顿位置；

处理模块302，用于将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句。

进一步，在本发明实施例中，所述分析模块301，具体用于对进行练习语句进行韵律层级分析，确定所述练习语句中各个单词对应的单词时间边界；根据各个单词的所述单词时间边界，确定各个韵律组块的所述组块时间边界。

进一步，在本发明实施例中，所述分析模块301，具体用于根据各个单词的单词时间边界，在练习语句中确定出句子层；在所述句子层中确定出语调短语层；在所述语调短语层中确定出韵律短语层；根据所述句子层、所述语调短语层以及所述韵律短语层，确定各个韵律组块的所述组块时间边界。

进一步，在本发明实施例中，所述分析模块301，具体用于获取所述练习语句中的数据以及获取语调标注集，其中，所述数据包含每行文本以及每行文本对应的语音，所述标注集中包含了各个语调；基于所述练习语句中的数据以及标注集，以及根据确定出所述单词时间边界，对各个单词设置语调标记。

进一步，在本发明实施例中，所述分析模块301，具体用于获取所述练习语句中的数据以及获取重读标注集；基于所述练习语句中的数据以及获取的重读标注集，以及根据确定出所述单词时间边界，对各个单词进行重读标记。

进一步，在本发明实施例中，所述处理模块302，还用于获取用户基于所述标准韵律层级语句的练习语句；基于韵律层级，在所述练习语句中确定出存在错误的韵律组块；输出用于提示用户进行重复练习的韵律组块的提示信息。

进一步，在本发明实施例中，所述处理模块302，还用于检测用户当前训练的韵律组块是否评测通过；若否，则提示用户继续训练当前韵律组块；若是，则从当前的韵律组块切换至下一个存在错误的韵律组块，以使用户练习下一个韵律组块。

尽管已描述了本申请的优选实施例，但本领域内的普通技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改，包括采用特定符号、标记确定顶点等变更方式。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种语句分析处理的方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，对进行练习语句进行韵律层级分析，确定各个语句中各个韵律组块的组块时间边界，包括：

3.如权利要求2所述的方法，其特征在于，根据各个单词的所述单词时间边界，确定各个韵律组块的所述组块时间边界，包括：

在所述句子层中确定出语调短语层；

在所述语调短语层中确定出韵律短语层；

4.如权利要求2所述的方法，其特征在于，根据确定出的所述组块时间边界，对所述练习语句设置语调标记，包括：

5.如权利要求2所述的方法，其特征在于，根据确定出的所述组块时间边界，对所述练习语句设置重读标记，包括：

获取所述练习语句中的数据以及获取重读标注集；

6.如权利要求1所述的方法，其特征在于，在将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句之后，所述方法还包括：

获取用户基于所述标准韵律层级语句的练习语句；

输出用于提示用户进行重复练习的韵律组块的提示信息。

7.如权利要求6所述的方法，其特征在于，在输出用于提示用于进行重复练习的韵律组块的提示信息之后，所述方法还包括：

检测用户当前训练的韵律组块是否评测通过；

若否，则提示用户继续训练当前韵律组块；

8.一种语句分析处理的***，其特征在于，所述***包括：

9.如权利要求8所述的***，其特征在于，所述分析模块，具体用于对进行练习语句进行韵律层级分析，确定所述练习语句中各个单词对应的单词时间边界；根据各个单词的所述单词时间边界，确定各个韵律组块的所述组块时间边界。

10.如权利要求9所述的***，其特征在于，所述分析模块，具体用于根据各个单词的单词时间边界，在练习语句中确定出句子层；在所述句子层中确定出语调短语层；在所述语调短语层中确定出韵律短语层；根据所述句子层、所述语调短语层以及所述韵律短语层，确定各个韵律组块的所述组块时间边界。

11.如权利要求9所述的***，其特征在于，所述分析模块，具体用于获取所述练习语句中的数据以及获取语调标注集，其中，所述数据包含每行文本以及每行文本对应的语音，所述标注集中包含了各个语调；基于所述练习语句中的数据以及标注集，以及根据确定出所述单词时间边界，对各个单词设置语调标记。

12.如权利要求9所述的***，其特征在于，所述分析模块，具体用于获取所述练习语句中的数据以及获取重读标注集；基于所述练习语句中的数据以及获取的重读标注集，以及根据确定出所述单词时间边界，对各个单词进行重读标记。

13.如权利要求8所述的***，其特征在于，所述处理模块，还用于获取用户基于所述标准韵律层级语句的练习语句；基于韵律层级，在所述练习语句中确定出存在错误的韵律组块；输出用于提示用户进行重复练习的韵律组块的提示信息。

14.如权利要求13所述的***，其特征在于，所述处理模块，还用于检测用户当前训练的韵律组块是否评测通过；若否，则提示用户继续训练当前韵律组块；若是，则从当前的韵律组块切换至下一个存在错误的韵律组块，以使用户练习下一个韵律组块。