CN107767862B

CN107767862B - 语音数据处理方法、***及存储介质

Info

Publication number: CN107767862B
Application number: CN201711080078.9A
Authority: CN
Inventors: 余涛
Original assignee: Shenzhen Chipsguide Technology Co ltd
Current assignee: Shenzhen Chipsguide Technology Co ltd
Priority date: 2017-11-06
Filing date: 2017-11-06
Publication date: 2024-05-21
Anticipated expiration: 2037-11-06
Also published as: CN107767862A

Abstract

本发明涉及一种语音数据处理方法、***及存储介质，其中，方法包括：朗读设备采集用户朗读的原始语音数据，对采集的所述原始语音数据进行处理得到数字音频数据；所述朗读设备将所述数字音频数据发送至移动终端；所述移动终端接收所述数字音频数据，对接收的所述数字音频数据进行识别以获取原始朗读特征；所述移动终端根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果。本发明可提高朗读训练的效率。

Description

语音数据处理方法、***及存储介质

技术领域

本发明涉及数据处理技术领域，特别是涉及一种语音数据处理方法、***及存储介质。

背景技术

由于工作学习的需要，越来越多的人渴望通过电子设备来学习不同国家的语言，实现随时随地开展语言朗读训练，从而提升个人在工作学习中的竞争力。

传统技术中，用户在训练朗读时，电子设备往往只能采集用户朗读时的语音，然后播放出来，但是用户无法判断自己朗读的语音的好坏，不知道自己的语音朗读时是否需要加强和改进，导致朗读训练时的效率低下。

发明内容

基于此，有必要针对上述技术问题，提供一种语音数据处理方法、***及存储介质，以提高朗读训练的效率。

一种语音数据处理方法，所述方法包括：

朗读设备采集用户朗读的原始语音数据，对采集的所述原始语音数据进行处理得到数字音频数据；

所述朗读设备将所述数字音频数据发送至移动终端；

所述移动终端接收所述数字音频数据，对接收的所述数字音频数据进行识别以获取原始朗读特征；

所述移动终端根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果。

在其中一个实施例中，所述方法还包括：

所述朗读设备对所述数字音频数据进行处理，得到模拟音频数据；

所述朗读设备对所述模拟音频数据进行播放。

在其中一个实施例中，所述方法还包括：

所述移动终端显示所述朗读标准度评估结果并将所述朗读标准度评估结果发送至所述朗读设备；

所述朗读设备接收并播放所述移动终端发送的所述朗读标准度评估结果。

在其中一个实施例中，所述方法还包括：

所述移动终端分享所述朗读标准度评估结果并接收其他用户的朗读标准度评估结果；

所述移动终端接收作用于所述其他用户的朗读标准度评估结果的交互响应操作。

在其中一个实施例中，所述移动终端根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果的步骤，包括：

所述移动终端获取所述原始语音数据对应的文本，从标准语音库中获取匹配所述文本的标准语音数据；

所述移动终端从获取的所述标准语音数据中提取与所述原始朗读特征对应的标准朗读特征；

所述移动终端将所述原始朗读特征与所述标准朗读特征进行比对，得到所述原始语音数据的朗读标准度评估结果。

一种语音数据处理***，所述***包括：

朗读设备，用于采集用户朗读的原始语音数据，对采集的所述原始语音数据进行处理得到数字音频数据，将所述数字音频数据发送至移动终端；

移动终端，用于接收所述数字音频数据，对接收的所述数字音频数据进行识别以获取原始朗读特征，根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果。

在其中一个实施例中，所述朗读设备还用于对所述数字音频数据进行处理，得到模拟音频数据；以及

用于对所述模拟音频数据进行播放。

在其中一个实施例中，所述移动终端还用于显示所述朗读标准度评估结果并将所述朗读标准度评估结果发送至所述朗读设备；

所述朗读设备还用于接收并播放所述移动终端发送的所述朗读标准度评估结果。

在其中一个实施例中，所述移动终端还用于分享所述朗读标准度评估结果并接收其他用户的朗读标准度评估结果；以及

用于接收作用于所述其他用户的朗读标准度评估结果的交互响应操作。

一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述语音数据处理方法所述的步骤。

上述语音数据处理方法、***及存储介质，朗读设备采集用户朗读的原始语音数据，对采集的所述原始语音数据进行处理得到数字音频数据并将所述数字音频数据发送至移动终端；所述移动终端接收所述数字音频数据，对接收的所述数字音频数据进行识别以获取原始朗读特征并根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果，实现了在用户训练朗读的同时对用户发音标准度进行实时评估，使得用户对自己朗读的语音好坏有一个清晰的认识和了解，从而提高了朗读训练的效率。

附图说明

图1为一个实施例中语音数据处理方法的应用环境图；

图2为一个实施例中语音数据处理方法的流程图；

图3为另一个实施例中语音数据处理方法的流程图；

图4为又一个实施例中语音数据处理方法的流程图；

图5为再一个实施例中语音数据处理方法的流程图；

图6为一个实施例中移动终端根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估得到朗读标准度评估结果的步骤流程图；

图7为一个实施例中语音数据处理方法的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似改进，因此本发明不受下面公开的具体实施的限制。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在限制本发明。

图1为一个实施例中提供的语音数据处理的应用环境图，如图1所示，在该应用环境图中，包括朗读设备102和移动终端104，朗读设备102和移动终端104可以通过WIFI、蓝牙等无线通信方式连接，其中，移动终端104可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。

在一个实施例中，如图2所示，提供一种语音数据处理方法，该方法包括：

步骤S210，朗读设备采集用户朗读的原始语音数据，对采集的原始语音数据进行处理得到数字音频数据。

具体地，朗读设备通过内置的麦克风采集用户朗读时的声音得到原始语音数据，然后对原始语音数据进行降噪、预加重等预处理操作，得到预处理语音数据，然后通过内置的模数转换器对预处理语音数据进行模数转换得到数字音频数据。

步骤S220，朗读设备将数字音频数据发送至移动终端。

具体地，朗读设备内置无线通信模块，通过该无线通信模块将数字音频数据发送至移动终端。

在一个实施例中，无线通信模块为蓝牙模块，朗读设备通过蓝牙传输的方式将数字音频数据发送至移动终端。

在另一个实施例中，无线通信模块为WIFI模块，朗读设备通过WIFI传输的方式将数字音频数据发送至移动终端。

步骤S230，移动终端接收数字音频数据，对接收的数字音频数据进行识别以获取原始朗读特征。

具体地，原始朗读特征指的是原始语音数据对应的语音特征。在本实施例中，移动终端接收到数字音频数据后，对接收的数字音频数据进行识别，从数字音频数据中提取原始语音数据的清晰度、语气、语调、语速中的至少一种朗读特征作为原始朗读特征。

步骤S240，移动终端根据获取的原始朗读特征对原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果。

具体地，朗读标准度指的是原始语音数据和其对应的标准语音数据之间的匹配度。移动终端获取到原始朗读特征后，将各个原始朗读特征逐一与标准语音数据对应的标准朗读特征进行比对，并根据原始朗读特征与标准朗读特征的匹配度得到朗读标准度评估结果，其中，朗读标准度评估结果可以为百分制的分数。当只有一个原始朗读特征进行比对时，该原始朗读特征的比对结果即为朗读标准度评估结果，如用清晰度进行比对时，得到清晰度与标准清晰度的匹配结果为85％，则相应的朗读标准度评估结果可以为85分；当有多个原始朗读特征进行比对时，将各个原始朗读特征的比对结果按照一定权值相加得到整体匹配度，并根据该整体匹配度得到朗读标准度评估结果。

进一步，移动终端可以对该朗读标准度评估结果进行显示或者进行语音播报。

上述语音数据处理方法，朗读设备采集用户朗读的原始语音数据，对采集的原始语音数据进行处理得到数字音频数据并将数字音频数据发送至移动终端；移动终端接收数字音频数据，对接收的数字音频数据进行识别以获取原始朗读特征并根据获取的原始朗读特征对原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果，实现在用户训练朗读的同时对用户发音标准度进行实时评估，使得用户对自己朗读的语音好坏有一个清晰的认识和了解，从而提高了朗读训练的效率。

在一个实施例中，如图3所示，上述方法还包括：

步骤S310，朗读设备对数字音频数据进行处理，得到模拟音频数据。

步骤S320，朗读设备对模拟音频数据进行播放。

具体地，朗读设备通过内置的数模转换器将数字音频数据进行数模转换得到模拟音频数据，并对模拟音频数据进行放大处理，然后通过内置的喇叭对模拟音频数据进行播放，使得用户能够从朗读设备中清晰的听到自己所朗读的语音。

在一个实施例中，如图4所示，上述方法还包括：

步骤S410，移动终端显示朗读标准度评估结果并将朗读标准度评估结果发送至朗读设备。

具体地，移动终端对朗读标准度评估结果进行显示，显示的方式可以是动态的，如以动画的形式显示，也可以是静态显示，如在屏幕显示朗读标准度评估结果对应的分数值。进一步，移动终端将朗读标准度评估结果发送至朗读设备，其中，移动终端可以通过蓝牙将朗读标准度评估结果发送至朗读设备，也可以通过WIFI将朗读标准度评估结果发送至朗读设备，具体怎样发明，本发明在此不做限制。

步骤S420，朗读设备接收并播放移动终端发送的朗读标准度评估结果。

具体地，朗读设备接收到移动终端发送的朗读标准度评估结果后，可以对该朗读标准评估结果进行显示，同时还可以以语音的形式对该朗读标准度评估结果进行播放，如当用户的朗读标准度评估结果得分为80分，播放语音“您的朗读标准度评估结果为八十分”。

在一个实施例中，朗读设备对朗读标准度评估结果进行判断，当朗读标准度评估结果对应的分数大于预设阈值时，在通过语音播放分数时，可以同时播放激励、称赞等语气相关的音频，如当朗读标准度评估结果对应的分数大于90时，播放“您的朗读标准度评估结果为九十分！太棒了！”，通过播放这些激励、称赞等语气相关的音频可以在一定程度上提高用户的学习兴趣。

在本实施例中，朗读设备可以对朗读标准度评估结果进行播放，可以使得用户在不方便查看移动终端的时候，也可以及时对自己所朗读的语音的好坏有一个清晰的认识和了解，从而提高朗读训练时的学习效率。

在一个实施例中，如图5所示，上述方法还包括：

步骤S510，移动终端分享朗读标准度评估结果并接收其他用户的朗读标准度评估结果。

具体地，移动终端下载有与朗读设备对应的APP(Application，应用)，当移动终端检测到用户使用该APP触发分享的相关操作如点击屏幕上的“分享”按钮时，将朗读标准度评估结果进行分享，使得其他用户在登录该APP时，能够接收到该朗读标准度评估结果。

此外，移动终端还可以在接收用户的选择操作后，将朗读标准度评估结果分享到QQ、微信、微博等任意一个社交平台。

进一步，移动终端也可以接收其他用户分享的朗读标准度评估结果。

步骤S520，移动终端接收作用于其他用户的朗读标准度评估结果的交互响应操作。

具体地，移动终端接收到其他用户的朗读标准度评估结果后，可以对接收到的朗读标准度评估结果进行显示，同时还可以接收作用于其他用户的朗读标准度评估结果的交互操作，该交互操作包括但不限于点赞、评论等。

在本实施例中，移动终端可以将朗读标准度评估结果进行分享，并可以接收其他用户的朗读标准度评估结果以及用户作用于该其他用户的朗读标准度评估结果的交互响应操作，使得各个不同的用户之间可以产生互动，从而提高用户通过朗读训练提高语言能力的兴趣。

在一个实施例中，如图6所示，移动终端根据获取的原始朗读特征对原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果的步骤，包括：

步骤S240A，移动终端获取原始语音数据对应的文本，从标准语音库中获取匹配文本的标准语音数据。

具体地，移动终端接收到朗读设备发送的数字音频数据后，进行语音识别得到对应的文本，然后根据该文本，从标准语音库中查找与该文本匹配的标准语音，其中，标准语音库指的是事先录制的针对所有朗读训练文本的标准读音集合，可以存储在移动终端，也可以存储在服务器。

步骤S240B，移动终端从获取的标准语音数据中提取与原始朗读特征对应的标准朗读特征。

具体地，标准朗读特征指的是标准语音数据对应的语音特征，包括清晰度、语气、语调、语速等，在本实施例中，移动终端根据获取到的原始朗读特征从标准语音数据中提取对应的标准语音特征，如，当原始朗读特征为清晰度、语气、语调时，则分别从标准语音数据中提取清晰度、语气、语调这三个标准朗读特征。

步骤S240C，移动终端将原始朗读特征与标准朗读特征进行比对，得到原始语音数据的朗读标准度评估结果。

具体地，移动终端将各个原始朗读特征逐一与标准语音数据对应的标准朗读特征进行比对，并根据原始朗读特征与标准朗读特征的匹配度得到朗读标准度评估结果，其中，朗读标准度评估结果可以为百分制的分数。

在本实施例中，通过将原始朗读特征与标准朗读特征进行比对得到朗读标准度评估结果，可以得到比较准确的朗读标准度评估结果，从而更好地提高朗读训练的效率。

在一个实施例中，提供一种语音数据处理***900，该***包括：

朗读设备902，用于采集用户朗读的原始语音数据，对采集的原始语音数据进行处理得到数字音频数据，将数字音频数据发送至移动终端；

移动终端904，用于接收数字音频数据，对接收的数字音频数据进行识别以获取原始朗读特征，根据获取的原始朗读特征对原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果。

上述语音数据处理***，实现了在用户训练朗读的同时对用户发音标准度进行实时评估，使得用户对自己朗读的语音好坏有一个清晰的认识和了解，从而提高了朗读训练的效率。

在其中一个实施例中，朗读设备还用于对数字音频数据进行处理，得到模拟音频数据，对模拟音频数据进行播放。

在其中一个实施例中，移动终端还用于显示朗读标准度评估结果并将朗读标准度评估结果发送至朗读设备；

朗读设备还用于接收并播放移动终端发送的朗读标准度评估结果。

在其中一个实施例中，移动终端还用于分享朗读标准度评估结果并接收其他用户的朗读标准度评估结果，以及接收作用于其他用户的朗读标准度评估结果的交互响应操作。

在其中一个实施例中，移动终端还用于获取原始语音数据对应的文本，从标准语音库中获取匹配文本的标准语音数据，从获取的标准语音数据中提取与原始朗读特征对应的标准朗读特征，将原始朗读特征与标准朗读特征进行比对，得到原始语音数据的朗读标准度评估结果。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：朗读设备采集用户朗读的原始语音数据，对采集的原始语音数据进行处理得到数字音频数据；朗读设备将数字音频数据发送至移动终端；移动终端接收数字音频数据，对接收的数字音频数据进行识别以获取原始朗读特征；移动终端根据获取的原始朗读特征对原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果。

上述计算机可读存储介质，实现了在用户训练朗读的同时对用户发音标准度进行实时评估，使得用户对自己朗读的语音好坏有一个清晰的认识和了解，从而提高了朗读训练的效率。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：朗读设备对数字音频数据进行处理，得到模拟音频数据；朗读设备对模拟音频数据进行播放。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：移动终端显示朗读标准度评估结果并将朗读标准度评估结果发送至朗读设备；朗读设备接收并播放移动终端发送的朗读标准度评估结果。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：移动终端分享朗读标准度评估结果并接收其他用户的朗读标准度评估结果；移动终端接收作用于其他用户的朗读标准度评估结果的交互响应操作。

在一个实施例中，移动终端根据获取的原始朗读特征对原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果，包括：移动终端获取原始语音数据对应的文本，从标准语音库中获取匹配文本的标准语音数据；移动终端从获取的标准语音数据中提取与原始朗读特征对应的标准朗读特征；移动终端将原始朗读特征与标准朗读特征进行比对，得到原始语音数据的朗读标准度评估结果。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种语音数据处理方法，所述方法包括：

所述朗读设备将所述数字音频数据发送至移动终端；

所述移动终端接收所述数字音频数据，对接收的所述数字音频数据进行识别以获取原始朗读特征，所述原始朗读特征包括所述原始语音数据的清晰度、语气、语调和语速中的至少一种；

所述移动终端根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果；

其中，所述移动终端根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果的步骤，包括：

所述移动终端接收到所述朗读设备发送的所述数字音频数据后，进行语音识别得到所述原始语音数据对应的文本，根据所述文本从标准语音库中查找与所述文本匹配的标准语音数据，其中，标准语音库是指事先录制的针对所有朗读训练文本的标准读音集合；

所述移动终端将所述原始朗读特征与所述标准朗读特征进行比对，得到所述原始语音数据的朗读标准度评估结果；

其中，所述朗读设备通过内置的麦克风采集用户朗读时的声音得到所述原始语音数据，并对所述原始语音数据进行降噪和预加重预处理操作，得到预处理语音数据，通过内置的模数转换器对所述预处理语音数据进行模数转换得到所述数字音频数据；所述朗读设备还通过所述内置的数模转换器将所述数字音频数据进行数模转换得到模拟音频数据，并对所述模拟音频数据进行放大处理，再通过内置的喇叭对所述模拟音频数据进行播放；

其中，所述移动终端显示所述朗读标准度评估结果并将所述朗读标准度评估结果发送至所述朗读设备；

所述朗读设备接收到所述移动终端发送的所述朗读标准度评估结果后，对所述朗读标准度评估结果进行显示，并对所述朗读标准度评估结果进行判断，当所述朗读标准度评估结果对应的分数大于预设阈值时，通过语音播放分数并同时播放激励和称赞语气相关的音频；

其中，所述方法还包括：

所述移动终端下载有与所述朗读设备对应的应用，当所述移动终端检测到用户使用所述应用触发分享按钮时，将所述朗读标准度评估结果进行分享，以使其他用户在登录所述应用时，能够接收到所述朗读标准度评估结果；

所述移动终端接收所述其他用户的朗读标准度评估结果；

2.根据权利要求1所述的方法，其特征在于，所述移动终端将所述原始朗读特征与所述标准朗读特征进行比对，得到所述原始语音数据的朗读标准度评估结果，包括：

所述移动终端将各个原始朗读特征逐一与标准语音数据对应的标准朗读特征进行对比，并根据原始朗读特征与标准朗读特征的匹配度得到朗读标准度评估结果，其中，朗读标准度评估结果为百分制的分数。

3.一种语音数据处理***，其特征在于，所述***包括：

移动终端，用于接收所述数字音频数据，对接收的所述数字音频数据进行识别以获取原始朗读特征，根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果；

其中，所述移动终端在执行根据获取的所述原始朗读特征对所述原始语音数据的朗读标准度进行评估，得到朗读标准度评估结果时，被配置为：

接收到所述朗读设备发送的所述数字音频数据后，进行语音识别得到所述原始语音数据对应的文本，根据所述文本从标准语音库中查找与所述文本匹配的标准语音数据；

从获取的所述标准语音数据中提取与所述原始朗读特征对应的标准朗读特征；

将所述原始朗读特征与所述标准朗读特征进行比对，得到所述原始语音数据的朗读标准度评估结果；

其中，所述朗读设备还用于通过内置的数模转换器将所述数字音频数据进行数模转换得到模拟音频数据，并对所述模拟音频数据进行放大处理，再通过内置的喇叭对所述模拟音频数据进行播放；

其中，所述移动终端还用于显示所述朗读标准度评估结果并将所述朗读标准度评估结果发送至所述朗读设备；

所述朗读设备还用于接收到所述移动终端发送的所述朗读标准度评估结果后，对所述朗读标准度评估结果进行显示，并对所述朗读标准度评估结果进行判断，当所述朗读标准度评估结果对应的分数大于预设阈值时，通过语音播放分数并同时播放激励和称赞语气相关的音频；

其中，所述移动终端下载有与所述朗读设备对应的应用，当所述移动终端检测到用户使用所述应用触发分享按钮时，所述移动终端用于将所述朗读标准度评估结果进行分享，以使其他用户在登录所述应用时，能够接收到所述朗读标准度评估结果，接收所述其他用户的朗读标准度评估结果，并接收作用于所述其他用户的朗读标准度评估结果的交互响应操作。

4.一种计算机存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-2任意一项所述的语音数据处理方法的步骤。