CN111462754A

CN111462754A - 一种电力***调度控制语音识别模型建立方法

Info

Publication number: CN111462754A
Application number: CN202010299229.5A
Authority: CN
Inventors: 郭川玉; 王瀛川
Original assignee: Shenzhen Aerospace Technology & Innovation Industrial Co ltd
Current assignee: Shenzhen Aerospace Technology & Innovation Industrial Co ltd
Priority date: 2020-04-16
Filing date: 2020-04-16
Publication date: 2020-07-28
Anticipated expiration: 2040-04-16
Also published as: CN111462754B

Abstract

本发明涉及一种电力***调度控制语音识别模型建立方法，获取各具有电力调度权限的人员的音频信号，获取对应的声纹，建立电力调度身份验证数据库；获取各电力调度控制指令对应的语音数据，对语音数据进行处理，得到特征数据以及文本数据，将文本数据与预设的电力调度控制指令专用词典进行比对，得到目标文本数据，建立各特征数据与对应的目标文本数据之间的对应关系，电力调度身份验证数据库与上述的对应关系构成电力***调度控制语音识别模型。电力***调度控制语音识别模型用于电力***调度，根据该语音识别模型能够提升电力***调度领域的语音识别准确性和可靠性，能够满足智能化要求越来越高的电力***调度的需要。

Description

一种电力***调度控制语音识别模型建立方法

技术领域

本发明涉及一种电力***调度控制语音识别模型建立方法。

背景技术

语音识别是将语音转换为文本的技术，是人工智能自然语言处理的一个分支。目前，电力***调度主要还是采用人工调度的方式，难以满足智能化要求越来越高的电力***调度的需要。

发明内容

本发明的目的在于提供一种电力***调度控制语音识别模型建立方法，用于解决现有的电力***调度主要还是采用人工调度的方式，难以满足智能化要求越来越高的电力***调度的需要的问题。

为了解决上述问题，本发明采用以下技术方案：

一种电力***调度控制语音识别模型建立方法，包括：

获取各具有电力调度权限的人员的音频信号；

根据所述音频信号，获取所述音频信号对应的人员的声纹；

根据各具有电力调度权限的人员的声纹，建立电力调度身份验证数据库；

获取各电力调度控制指令对应的语音数据；

对所述语音数据进行特征提取，得到对应的特征数据；

对所述语音数据进行识别，得到对应的文本数据；

将所述文本数据与预设的电力调度控制指令专用词典进行比对，若所述文本数据属于所述电力调度控制指令专用词典中的词句，则保留所述文本数据，得到目标文本数据；若所述文本数据不属于所述电力调度控制指令专用词典中的词句，则根据所述文本数据的拼音，查找所述电力调度控制指令专用词典中与所述文本数据的拼音相同的词句，将查找到的词句替换所述文本数据，得到目标文本数据；

建立各特征数据与对应的目标文本数据之间的对应关系；

所述电力调度身份验证数据库与所述对应关系构成所述电力***调度控制语音识别模型。

可选地，所述获取所述音频信号对应的人员的声纹之后，所述电力***调度控制语音识别模型建立方法，还包括：

获取各具有电力调度权限的人员的脸部图像，并建立不同声纹与对应的脸部图像的对应关系；

相应的，所述根据各具有电力调度权限的人员的声纹，建立电力调度身份验证数据库，包括：

根据各具有电力调度权限的人员的声纹以及对应的脸部图像，建立电力调度身份验证数据库，所述电力调度身份验证数据库包括各具有电力调度权限的人员的声纹，以及对应的脸部图像。

可选地，所述电力调度控制指令专用词典包括各电力调度控制指令的词句以及所述各电力调度控制指令的词句的拼音；

所述根据所述文本数据的拼音，查找所述电力调度控制指令专用词典中与所述文本数据的拼音相同的词句，将查找到的词句替换所述文本数据，得到目标文本数据，包括：

获取所述文本数据的拼音；

将获取得到的所述文本数据的拼音输入到所述电力调度控制指令专用词典中，得到所述电力调度控制指令专用词典中与所述文本数据的拼音相同的拼音，并根据得到的拼音得到所述电力调度控制指令专用词典中对应的词句；

将得到的词句替换所述文本数据，得到目标文本数据。

本发明的有益效果为：建立得到的电力***调度控制语音识别模型中包括电力调度身份验证数据库，电力调度身份验证数据库包括各个具有电力调度权限的人员的声纹，那么，在进行输入电力调度控制指令对应的语音之前，需要进行身份验证，只有身份是具有电力调度权限的人员才能够进行后续的语音控制操作，防止无关人员对电力***调度进行控制，提升控制可靠性和安全性，而且，由于声纹与指纹类似，具有唯一性，不同的人具有不同的声纹，因此，采用声纹进行身份验证能够提升身份验证的安全性；对各电力调度控制指令对应的语音数据进行识别，得到对应的文本数据，并进行特征提取，得到对应的特征数据，将文本数据与预设的电力调度控制指令专用词典进行比对，若文本数据属于电力调度控制指令专用词典中的词句，表示文本识别正确，保留文本数据，该文本数据就是目标文本数据，若文本数据不属于电力调度控制指令专用词典中的词句，表示文本识别错误，那么，从电力调度控制指令专用词典中查找到与识别得到的文本数据的拼音相同的词句，将该词句替换文本数据，该词语就是目标文本数据，最后建立特征数据与对应的目标文本数据之间的对应关系，电力调度身份验证数据库与该对应关系构成电力***调度控制语音识别模型。由于采用电力调度控制指令专用词典进行语音识别和比对，最终根据语音识别就可以得到对应的电力调度控制指令，通过上述过程得到的语音识别模型专用于电力***调度，实现语音识别模型在电力***调度中的应用，而且能够提升电力***调度领域的语音识别准确性和可靠性，能够满足智能化要求越来越高的电力***调度的需要。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍：

图1是电力***调度控制语音识别模型建立方法的流程示意图。

具体实施方式

如图1所示，本实施例提供一种电力***调度控制语音识别模型建立方法，该电力***调度控制语音识别模型建立方法可以用于电力***调度控制指令的语音识别，实现电力调度控制。该电力***调度控制语音识别模型建立方法的执行主体可以为计算机、服务器、智能移动终端等。

该电力***调度控制语音识别模型建立方法包括三部分，分别是身份验证部分的建立过程、语音识别部分的建立过程以及电力***调度控制语音识别模型的建立过程。其中，身份验证部分的建立过程和语音识别部分的建立过程之间没有严格的先后顺序，可以先进行身份验证部分的建立过程，然后进行语音识别部分的建立过程，也可以先进行语音识别部分的建立过程，然后进行身份验证部分的建立过程，还可以同时进行身份验证部分的建立过程和语音识别部分的建立过程。

身份验证部分的建立过程，包括：

获取各具有电力调度权限的人员的音频信号：

通过音频采集设备采集音频信号，其中，音频采集设备有很多种，而且，在实际应用中，有很多名称，比如：麦克、话筒、MIC(Microphone，麦克风)、拾音器、咪头、送话器等等。

获取的音频信号的对象是具有电力调度权限的人员，比如：专门负责电力调度的工作人员，以及高层管理人员。具有电力调度权限的人员的个数由实际需要进行设置。因此，通过相关的音频采集设备获取各具有电力调度权限的人员的音频信号。

根据所述音频信号，获取所述音频信号对应的人员的声纹：

当接收到任意一个具有电力调度权限的人员的音频信号后，提取该音频信号的声纹。声纹(Voiceprint)是携带有言语信息的声波频谱。声纹同指纹一样，具有唯一性，具有身份识别(认定个人)的作用。每一个人具有特定的声纹，不同人的声纹不同。无论一个人怎样故意模仿他人的声音和语气，即使模仿得惟妙惟肖，声纹仍旧不同。

为了提升识别精度，在获取每一个具有电力调度权限的人员的音频信号时，让每一个具有电力调度权限的人员读相同的一段文字或者一个词语，使得获取到的每一个具有电力调度权限的人员的音频信号相同，并且，在后续识别过程中，让每一个被识别对象也读取与上述音频信号相同的文字。而且，音频信号可以是一些比较有代表性的语句或者词语，比如：“身份识别”、“请进行身份验证”等等，或者，是一些特定的暗号。

那么，对每一个具有电力调度权限的人员的音频信号进行处理，就可以得到该人员的声纹。由于根据音频信号进行声纹提取属于常规技术，不再赘述。

根据各具有电力调度权限的人员的声纹，建立电力调度身份验证数据库：

建立一个电力调度身份验证数据库，该电力调度身份验证数据库包括上述得到的所有的具有电力调度权限的人员的声纹。那么，在后续控制过程(即利用该电力***调度控制语音识别模型建立方法得到的电力***调度控制语音识别模型进行电力调度控制)中，采集被识别对象的音频信号，并提取到声纹，然后将得到的声纹与该电力调度身份验证数据库进行比对，若该声纹与该电力调度身份验证数据库中的某一个声纹的匹配度大于或等于预设值，则表示这两个声纹为相同的声纹，该声纹属于该电力调度身份验证数据库中的某一个声纹，该被识别对象的身份符合要求；若该声纹与该电力调度身份验证数据库中的各个声纹的匹配度均小于预设值，则表示该声纹与该电力调度身份验证数据库中的所有声纹均不匹配，该声纹不属于该电力调度身份验证数据库中的任意一个声纹，该被识别对象的身份不符合要求。

进一步地，上述中的“获取所述音频信号对应的人员的声纹”步骤之后，该身份验证部分的建立过程还包括：获取各具有电力调度权限的人员的脸部图像，并建立不同声纹与对应的脸部图像的对应关系。其中，通过摄像头采取各个具有电力调度权限的人员的脸部图像，然后建立各个具有电力调度权限的人员的声纹与对应的脸部图像的对应关系。

相应的，“根据各具有电力调度权限的人员的声纹，建立电力调度身份验证数据库”，包括：根据各具有电力调度权限的人员的声纹以及对应的脸部图像，建立电力调度身份验证数据库，该电力调度身份验证数据库包括各具有电力调度权限的人员的声纹，以及对应的脸部图像。

在声纹的基础上，加入脸部图像，在后续控制过程中，需要采集被识别对象的音频信号和脸部图像，根据音频信号提取声纹，然后将得到的声纹与该电力调度身份验证数据库进行比对，当比对符合要求时，判定识别对象的身份初步符合要求，然后，比对该被识别对象的脸部图像与电力调度身份验证数据库中该识别对象的声纹对应的脸部图像，当脸部图像对比通过之后，才最终确定身份符合要求。通过这种身份识别方式能够提升识别精度。

语音识别部分的建立过程，包括：

获取各电力调度控制指令对应的语音数据：

在该语音识别部分的建立过程中，电力调度控制指令的个数由实际需要进行确定，比如：若本实施例提供的电力***调度控制语音识别模型建立方法所使用的电力***规模比较小，则所需的电力调度控制指令比较少；相应地，若本实施例提供的电力***调度控制语音识别模型建立方法所使用的电力***规模比较大，则所需的电力调度控制指令比较多。作为一个具体实施方式，电力调度控制指令可以有：合上开关、断开开关、开关全相跳闸、开关单相跳闸等等。

获取各电力调度控制指令对应的语音数据，各语音数据与各电力调度控制指令相对应。若电力调度控制指令包括：合上开关、断开开关、开关全相跳闸，则对应的语音数据为：“合上开关”、“断开开关”、“开关全相跳闸”。应当理解，为了提升后续的文本识别精度，可以由比较熟练普通话的相关人员读各电力调度控制指令，以获取到对应的语音数据。

对所述语音数据进行特征提取，得到对应的特征数据：

在对各电力调度控制指令对应的语音数据进行特征提取之前，可以对语音数据进行去噪处理，去除语音数据中的噪音等干扰信号，提升特征提取的精度。

不同的语音数据具有一定的特征，特征是指表示语音数据特定性的数据信息，不同的语音数据具有不同的特征数据。那么，对各语音数据进行特征提取，就可以得到对应的特征数据。对语音数据进行特征提取，得到对应的特征数据的实现过程属于常规技术手段，不再赘述。

特征数据用于进行后续的控制(即利用该电力***调度控制语音识别模型建立方法得到的电力***调度控制语音识别模型进行电力调度控制)，在得到被识别对象的语音数据之后，需要提取该语音数据的特征数据，然后根据该特征数据以及建立得到的电力***调度控制语音识别模型，识别得到对应的电力调度控制指令。

对所述语音数据进行识别，得到对应的文本数据：

对各电力调度控制指令对应的语音数据进行识别，得到各电力调度控制指令对应的语音数据的文本数据。即将语音数据识别为文本数据。比如将语音数据“合上开关”识别为文本数据“合上开关”。当然，在对语音数据进行识别，得到对应的文本数据之前，也可以对语音数据进行去噪处理，然后进行文本识别，得到文本数据。由于对语音数据进行文本识别，得到对应的文本数据属于常规技术手段，不再赘述。

将所述文本数据与预设的电力调度控制指令专用词典进行比对，若所述文本数据属于所述电力调度控制指令专用词典中的词句，则保留所述文本数据，得到目标文本数据；若所述文本数据不属于所述电力调度控制指令专用词典中的词句，则根据所述文本数据的拼音，查找所述电力调度控制指令专用词典中与所述文本数据的拼音相同的词句，将查找到的词句替换所述文本数据，得到目标文本数据：

在语音数据识别为文本数据时，可能出现识别错误的情况，识别错误是指识别为相同拼音(即相同读音)的不同文本，该得到的文本不是电力调度控制领域的专有名词，即不是电力调度控制指令。比如将语音数据“合上开关”中的“合上”识别为文本数据“和尚”，将语音数据“合上开关”中的“开关”识别为文本数据“开馆”，那么，语音数据“合上开关”就被识别为文本数据“和尚开馆”。很明显，“和尚开馆”不是电力调度控制指令。

那么，为了避免出现识别错误的情况，预设有一个电力调度控制指令专用词典，该电力调度控制指令专用词典中存储有各个电力调取控制指令对应的词句，即各个电力调取控制指令对应的文本数据。应当理解，该电力调度控制指令专用词典中所包含的电力调取控制指令对应的文本数据的多少由实际需要进行设置，正如上文所述，若本实施例提供的电力***调度控制语音识别模型建立方法所使用的电力***规模比较小，则该电力调度控制指令专用词典中所包含的电力调取控制指令对应的文本数据可以比较少；相应地，若本实施例提供的电力***调度控制语音识别模型建立方法所使用的电力***规模比较大，则该电力调度控制指令专用词典中所包含的电力调取控制指令对应的文本数据可以设置较多一些。

那么，将得到的各个文本数据与预设的电力调度控制指令专用词典进行比对，以下以其中一个文本数据为例进行说明：将该文本数据与电力调度控制指令专用词典进行比对，具体是与该电力调度控制指令专用词典中的各个词句进行逐一比对，比对方式可以为自动比对方式，根据计算机程序自动将该文本数据与电力调度控制指令专用词典中的各个词句进行逐一比对，对比方式也可以是人工比对方式，即将该电力调度控制指令专用词典中的各个词句置于一个文档中，采用关键字搜索的方式搜索该文档中是否存在该文本数据。

若该文本数据属于电力调度控制指令专用词典中的词句，则保留该文本数据，将该文本数据作为目标文本数据。

若该文本数据不属于电力调度控制指令专用词典中的词句，那么，根据该文本数据的拼音，从电力调度控制指令专用词典中查找到与该文本数据的拼音相同的词句，将查找到的词句替换该文本数据，该查找到的词句为目标文本数据。为了实现上述替换过程，电力调度控制指令专用词典包括各电力调度控制指令的词句以及各电力调度控制指令的词句的拼音(由于不能绝对保证语音音调拼读准确，因此，该拼音可以不包含音调)，即除了包括各个词句之外，还包括各个词句的拼音。相应地，以下给出一种具体实现过程：

首先，获取该文本数据的拼音；

然后，将获取得到的文本数据的拼音输入到电力调度控制指令专用词典中，得到电力调度控制指令专用词典中与该文本数据的拼音相同的拼音，具体地，将该文本数据的拼音与电力调度控制指令专用词典中的各个词句的拼音进行逐一比对，找到电力调度控制指令专用词典中与该文本数据的拼音相同的拼音，然后，根据得到的拼音得到电力调度控制指令专用词典中对应的词句，该词句就是所需的词句；

最后，将查找到的词句替换该文本数据，该查找到的词句为目标文本数据。比如：若文本数据为“和尚开馆”，不是电力调度控制指令专用词典中的词句，那么，获取到文本数据“和尚开馆”的拼音——he shang kai guan，将该拼音与电力调度控制指令专用词典中的各个词句的拼音进行逐一比对，找到电力调度控制指令专用词典中的相同的拼音“heshang kai guan”，得到该拼音“he shang kai guan”对应的词句“合上开关”，将文本数据“合上开关”替换文本数据“和尚开馆”，该文本数据“合上开关”就是目标文本数据。

通过上述过程能够得到各个语音数据对应的目标文本数据。

建立各特征数据与对应的目标文本数据之间的对应关系：

由于上述得到各个语音数据的特征数据，以及各个语音数据的目标文本数据，那么，建立各特征数据与对应的目标文本数据之间的对应关系。

身份验证部分的建立过程得到电力调度身份验证数据库，语音识别部分的建立过程得到各特征数据与对应的目标文本数据之间的对应关系，那么，电力调度身份验证数据库与各特征数据与对应的目标文本数据之间的对应关系构成电力***调度控制语音识别模型。

利用该电力***调度控制语音识别模型进行电力调度控制时，采集被识别对象的音频信号，并提取到声纹，然后将得到的声纹与该电力***调度控制语音识别模型中的电力调度身份验证数据库进行比对，若该声纹与该电力调度身份验证数据库中的某一个声纹的匹配度大于或等于预设值，则表示这两个声纹为相同的声纹，该声纹属于该电力调度身份验证数据库中的某一个声纹，该被识别对象的身份符合要求；若该声纹与该电力调度身份验证数据库中的各个声纹的匹配度均小于预设值，则表示该声纹与该电力调度身份验证数据库中的所有声纹均不匹配，该声纹不属于该电力调度身份验证数据库中的任意一个声纹，该被识别对象的身份不符合要求。

若被识别对象的身份符合要求，则获取被识别对象的语音数据，然后对该语音数据进行特征提取，得到对应的特征数据，根据电力***调度控制语音识别模型中的各特征数据与对应的目标文本数据之间的对应关系确定得到该特征数据对应的目标文本数据，进而得到对应的电力调度控制指令。

上述实施例仅以一种具体的实施方式说明本发明的技术方案，任何对本发明进行的等同替换及不脱离本发明精神和范围的修改或局部替换，其均应涵盖在本发明权利要求保护的范围之内。

Claims

1.一种电力***调度控制语音识别模型建立方法，其特征在于，包括：