CN111462754A - 一种电力***调度控制语音识别模型建立方法 - Google Patents
一种电力***调度控制语音识别模型建立方法 Download PDFInfo
- Publication number
- CN111462754A CN111462754A CN202010299229.5A CN202010299229A CN111462754A CN 111462754 A CN111462754 A CN 111462754A CN 202010299229 A CN202010299229 A CN 202010299229A CN 111462754 A CN111462754 A CN 111462754A
- Authority
- CN
- China
- Prior art keywords
- text data
- power
- dispatching
- power dispatching
- control instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012795 verification Methods 0.000 claims abstract description 42
- 230000005236 sound signal Effects 0.000 claims abstract description 28
- 238000000605 extraction Methods 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种电力***调度控制语音识别模型建立方法,获取各具有电力调度权限的人员的音频信号,获取对应的声纹,建立电力调度身份验证数据库;获取各电力调度控制指令对应的语音数据,对语音数据进行处理,得到特征数据以及文本数据,将文本数据与预设的电力调度控制指令专用词典进行比对,得到目标文本数据,建立各特征数据与对应的目标文本数据之间的对应关系,电力调度身份验证数据库与上述的对应关系构成电力***调度控制语音识别模型。电力***调度控制语音识别模型用于电力***调度,根据该语音识别模型能够提升电力***调度领域的语音识别准确性和可靠性,能够满足智能化要求越来越高的电力***调度的需要。
Description
技术领域
本发明涉及一种电力***调度控制语音识别模型建立方法。
背景技术
语音识别是将语音转换为文本的技术,是人工智能自然语言处理的一个分支。目前,电力***调度主要还是采用人工调度的方式,难以满足智能化要求越来越高的电力***调度的需要。
发明内容
本发明的目的在于提供一种电力***调度控制语音识别模型建立方法,用于解决现有的电力***调度主要还是采用人工调度的方式,难以满足智能化要求越来越高的电力***调度的需要的问题。
为了解决上述问题,本发明采用以下技术方案:
一种电力***调度控制语音识别模型建立方法,包括:
获取各具有电力调度权限的人员的音频信号;
根据所述音频信号,获取所述音频信号对应的人员的声纹;
根据各具有电力调度权限的人员的声纹,建立电力调度身份验证数据库;
获取各电力调度控制指令对应的语音数据;
对所述语音数据进行特征提取,得到对应的特征数据;
对所述语音数据进行识别,得到对应的文本数据;
将所述文本数据与预设的电力调度控制指令专用词典进行比对,若所述文本数据属于所述电力调度控制指令专用词典中的词句,则保留所述文本数据,得到目标文本数据;若所述文本数据不属于所述电力调度控制指令专用词典中的词句,则根据所述文本数据的拼音,查找所述电力调度控制指令专用词典中与所述文本数据的拼音相同的词句,将查找到的词句替换所述文本数据,得到目标文本数据;
建立各特征数据与对应的目标文本数据之间的对应关系;
所述电力调度身份验证数据库与所述对应关系构成所述电力***调度控制语音识别模型。
可选地,所述获取所述音频信号对应的人员的声纹之后,所述电力***调度控制语音识别模型建立方法,还包括:
获取各具有电力调度权限的人员的脸部图像,并建立不同声纹与对应的脸部图像的对应关系;
相应的,所述根据各具有电力调度权限的人员的声纹,建立电力调度身份验证数据库,包括:
根据各具有电力调度权限的人员的声纹以及对应的脸部图像,建立电力调度身份验证数据库,所述电力调度身份验证数据库包括各具有电力调度权限的人员的声纹,以及对应的脸部图像。
可选地,所述电力调度控制指令专用词典包括各电力调度控制指令的词句以及所述各电力调度控制指令的词句的拼音;
所述根据所述文本数据的拼音,查找所述电力调度控制指令专用词典中与所述文本数据的拼音相同的词句,将查找到的词句替换所述文本数据,得到目标文本数据,包括:
获取所述文本数据的拼音;
将获取得到的所述文本数据的拼音输入到所述电力调度控制指令专用词典中,得到所述电力调度控制指令专用词典中与所述文本数据的拼音相同的拼音,并根据得到的拼音得到所述电力调度控制指令专用词典中对应的词句;
将得到的词句替换所述文本数据,得到目标文本数据。
本发明的有益效果为:建立得到的电力***调度控制语音识别模型中包括电力调度身份验证数据库,电力调度身份验证数据库包括各个具有电力调度权限的人员的声纹,那么,在进行输入电力调度控制指令对应的语音之前,需要进行身份验证,只有身份是具有电力调度权限的人员才能够进行后续的语音控制操作,防止无关人员对电力***调度进行控制,提升控制可靠性和安全性,而且,由于声纹与指纹类似,具有唯一性,不同的人具有不同的声纹,因此,采用声纹进行身份验证能够提升身份验证的安全性;对各电力调度控制指令对应的语音数据进行识别,得到对应的文本数据,并进行特征提取,得到对应的特征数据,将文本数据与预设的电力调度控制指令专用词典进行比对,若文本数据属于电力调度控制指令专用词典中的词句,表示文本识别正确,保留文本数据,该文本数据就是目标文本数据,若文本数据不属于电力调度控制指令专用词典中的词句,表示文本识别错误,那么,从电力调度控制指令专用词典中查找到与识别得到的文本数据的拼音相同的词句,将该词句替换文本数据,该词语就是目标文本数据,最后建立特征数据与对应的目标文本数据之间的对应关系,电力调度身份验证数据库与该对应关系构成电力***调度控制语音识别模型。由于采用电力调度控制指令专用词典进行语音识别和比对,最终根据语音识别就可以得到对应的电力调度控制指令,通过上述过程得到的语音识别模型专用于电力***调度,实现语音识别模型在电力***调度中的应用,而且能够提升电力***调度领域的语音识别准确性和可靠性,能够满足智能化要求越来越高的电力***调度的需要。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍:
图1是电力***调度控制语音识别模型建立方法的流程示意图。
具体实施方式
如图1所示,本实施例提供一种电力***调度控制语音识别模型建立方法,该电力***调度控制语音识别模型建立方法可以用于电力***调度控制指令的语音识别,实现电力调度控制。该电力***调度控制语音识别模型建立方法的执行主体可以为计算机、服务器、智能移动终端等。
该电力***调度控制语音识别模型建立方法包括三部分,分别是身份验证部分的建立过程、语音识别部分的建立过程以及电力***调度控制语音识别模型的建立过程。其中,身份验证部分的建立过程和语音识别部分的建立过程之间没有严格的先后顺序,可以先进行身份验证部分的建立过程,然后进行语音识别部分的建立过程,也可以先进行语音识别部分的建立过程,然后进行身份验证部分的建立过程,还可以同时进行身份验证部分的建立过程和语音识别部分的建立过程。
身份验证部分的建立过程,包括:
获取各具有电力调度权限的人员的音频信号:
通过音频采集设备采集音频信号,其中,音频采集设备有很多种,而且,在实际应用中,有很多名称,比如:麦克、话筒、MIC(Microphone,麦克风)、拾音器、咪头、送话器等等。
获取的音频信号的对象是具有电力调度权限的人员,比如:专门负责电力调度的工作人员,以及高层管理人员。具有电力调度权限的人员的个数由实际需要进行设置。因此,通过相关的音频采集设备获取各具有电力调度权限的人员的音频信号。
根据所述音频信号,获取所述音频信号对应的人员的声纹:
当接收到任意一个具有电力调度权限的人员的音频信号后,提取该音频信号的声纹。声纹(Voiceprint)是携带有言语信息的声波频谱。声纹同指纹一样,具有唯一性,具有身份识别(认定个人)的作用。每一个人具有特定的声纹,不同人的声纹不同。无论一个人怎样故意模仿他人的声音和语气,即使模仿得惟妙惟肖,声纹仍旧不同。
为了提升识别精度,在获取每一个具有电力调度权限的人员的音频信号时,让每一个具有电力调度权限的人员读相同的一段文字或者一个词语,使得获取到的每一个具有电力调度权限的人员的音频信号相同,并且,在后续识别过程中,让每一个被识别对象也读取与上述音频信号相同的文字。而且,音频信号可以是一些比较有代表性的语句或者词语,比如:“身份识别”、“请进行身份验证”等等,或者,是一些特定的暗号。
那么,对每一个具有电力调度权限的人员的音频信号进行处理,就可以得到该人员的声纹。由于根据音频信号进行声纹提取属于常规技术,不再赘述。
根据各具有电力调度权限的人员的声纹,建立电力调度身份验证数据库:
建立一个电力调度身份验证数据库,该电力调度身份验证数据库包括上述得到的所有的具有电力调度权限的人员的声纹。那么,在后续控制过程(即利用该电力***调度控制语音识别模型建立方法得到的电力***调度控制语音识别模型进行电力调度控制)中,采集被识别对象的音频信号,并提取到声纹,然后将得到的声纹与该电力调度身份验证数据库进行比对,若该声纹与该电力调度身份验证数据库中的某一个声纹的匹配度大于或等于预设值,则表示这两个声纹为相同的声纹,该声纹属于该电力调度身份验证数据库中的某一个声纹,该被识别对象的身份符合要求;若该声纹与该电力调度身份验证数据库中的各个声纹的匹配度均小于预设值,则表示该声纹与该电力调度身份验证数据库中的所有声纹均不匹配,该声纹不属于该电力调度身份验证数据库中的任意一个声纹,该被识别对象的身份不符合要求。
进一步地,上述中的“获取所述音频信号对应的人员的声纹”步骤之后,该身份验证部分的建立过程还包括:获取各具有电力调度权限的人员的脸部图像,并建立不同声纹与对应的脸部图像的对应关系。其中,通过摄像头采取各个具有电力调度权限的人员的脸部图像,然后建立各个具有电力调度权限的人员的声纹与对应的脸部图像的对应关系。
相应的,“根据各具有电力调度权限的人员的声纹,建立电力调度身份验证数据库”,包括:根据各具有电力调度权限的人员的声纹以及对应的脸部图像,建立电力调度身份验证数据库,该电力调度身份验证数据库包括各具有电力调度权限的人员的声纹,以及对应的脸部图像。
在声纹的基础上,加入脸部图像,在后续控制过程中,需要采集被识别对象的音频信号和脸部图像,根据音频信号提取声纹,然后将得到的声纹与该电力调度身份验证数据库进行比对,当比对符合要求时,判定识别对象的身份初步符合要求,然后,比对该被识别对象的脸部图像与电力调度身份验证数据库中该识别对象的声纹对应的脸部图像,当脸部图像对比通过之后,才最终确定身份符合要求。通过这种身份识别方式能够提升识别精度。
语音识别部分的建立过程,包括:
获取各电力调度控制指令对应的语音数据:
在该语音识别部分的建立过程中,电力调度控制指令的个数由实际需要进行确定,比如:若本实施例提供的电力***调度控制语音识别模型建立方法所使用的电力***规模比较小,则所需的电力调度控制指令比较少;相应地,若本实施例提供的电力***调度控制语音识别模型建立方法所使用的电力***规模比较大,则所需的电力调度控制指令比较多。作为一个具体实施方式,电力调度控制指令可以有:合上开关、断开开关、开关全相跳闸、开关单相跳闸等等。
获取各电力调度控制指令对应的语音数据,各语音数据与各电力调度控制指令相对应。若电力调度控制指令包括:合上开关、断开开关、开关全相跳闸,则对应的语音数据为:“合上开关”、“断开开关”、“开关全相跳闸”。应当理解,为了提升后续的文本识别精度,可以由比较熟练普通话的相关人员读各电力调度控制指令,以获取到对应的语音数据。
对所述语音数据进行特征提取,得到对应的特征数据:
在对各电力调度控制指令对应的语音数据进行特征提取之前,可以对语音数据进行去噪处理,去除语音数据中的噪音等干扰信号,提升特征提取的精度。
不同的语音数据具有一定的特征,特征是指表示语音数据特定性的数据信息,不同的语音数据具有不同的特征数据。那么,对各语音数据进行特征提取,就可以得到对应的特征数据。对语音数据进行特征提取,得到对应的特征数据的实现过程属于常规技术手段,不再赘述。
特征数据用于进行后续的控制(即利用该电力***调度控制语音识别模型建立方法得到的电力***调度控制语音识别模型进行电力调度控制),在得到被识别对象的语音数据之后,需要提取该语音数据的特征数据,然后根据该特征数据以及建立得到的电力***调度控制语音识别模型,识别得到对应的电力调度控制指令。
对所述语音数据进行识别,得到对应的文本数据:
对各电力调度控制指令对应的语音数据进行识别,得到各电力调度控制指令对应的语音数据的文本数据。即将语音数据识别为文本数据。比如将语音数据“合上开关”识别为文本数据“合上开关”。当然,在对语音数据进行识别,得到对应的文本数据之前,也可以对语音数据进行去噪处理,然后进行文本识别,得到文本数据。由于对语音数据进行文本识别,得到对应的文本数据属于常规技术手段,不再赘述。
将所述文本数据与预设的电力调度控制指令专用词典进行比对,若所述文本数据属于所述电力调度控制指令专用词典中的词句,则保留所述文本数据,得到目标文本数据;若所述文本数据不属于所述电力调度控制指令专用词典中的词句,则根据所述文本数据的拼音,查找所述电力调度控制指令专用词典中与所述文本数据的拼音相同的词句,将查找到的词句替换所述文本数据,得到目标文本数据:
在语音数据识别为文本数据时,可能出现识别错误的情况,识别错误是指识别为相同拼音(即相同读音)的不同文本,该得到的文本不是电力调度控制领域的专有名词,即不是电力调度控制指令。比如将语音数据“合上开关”中的“合上”识别为文本数据“和尚”,将语音数据“合上开关”中的“开关”识别为文本数据“开馆”,那么,语音数据“合上开关”就被识别为文本数据“和尚开馆”。很明显,“和尚开馆”不是电力调度控制指令。
那么,为了避免出现识别错误的情况,预设有一个电力调度控制指令专用词典,该电力调度控制指令专用词典中存储有各个电力调取控制指令对应的词句,即各个电力调取控制指令对应的文本数据。应当理解,该电力调度控制指令专用词典中所包含的电力调取控制指令对应的文本数据的多少由实际需要进行设置,正如上文所述,若本实施例提供的电力***调度控制语音识别模型建立方法所使用的电力***规模比较小,则该电力调度控制指令专用词典中所包含的电力调取控制指令对应的文本数据可以比较少;相应地,若本实施例提供的电力***调度控制语音识别模型建立方法所使用的电力***规模比较大,则该电力调度控制指令专用词典中所包含的电力调取控制指令对应的文本数据可以设置较多一些。
那么,将得到的各个文本数据与预设的电力调度控制指令专用词典进行比对,以下以其中一个文本数据为例进行说明:将该文本数据与电力调度控制指令专用词典进行比对,具体是与该电力调度控制指令专用词典中的各个词句进行逐一比对,比对方式可以为自动比对方式,根据计算机程序自动将该文本数据与电力调度控制指令专用词典中的各个词句进行逐一比对,对比方式也可以是人工比对方式,即将该电力调度控制指令专用词典中的各个词句置于一个文档中,采用关键字搜索的方式搜索该文档中是否存在该文本数据。
若该文本数据属于电力调度控制指令专用词典中的词句,则保留该文本数据,将该文本数据作为目标文本数据。
若该文本数据不属于电力调度控制指令专用词典中的词句,那么,根据该文本数据的拼音,从电力调度控制指令专用词典中查找到与该文本数据的拼音相同的词句,将查找到的词句替换该文本数据,该查找到的词句为目标文本数据。为了实现上述替换过程,电力调度控制指令专用词典包括各电力调度控制指令的词句以及各电力调度控制指令的词句的拼音(由于不能绝对保证语音音调拼读准确,因此,该拼音可以不包含音调),即除了包括各个词句之外,还包括各个词句的拼音。相应地,以下给出一种具体实现过程:
首先,获取该文本数据的拼音;
然后,将获取得到的文本数据的拼音输入到电力调度控制指令专用词典中,得到电力调度控制指令专用词典中与该文本数据的拼音相同的拼音,具体地,将该文本数据的拼音与电力调度控制指令专用词典中的各个词句的拼音进行逐一比对,找到电力调度控制指令专用词典中与该文本数据的拼音相同的拼音,然后,根据得到的拼音得到电力调度控制指令专用词典中对应的词句,该词句就是所需的词句;
最后,将查找到的词句替换该文本数据,该查找到的词句为目标文本数据。比如:若文本数据为“和尚开馆”,不是电力调度控制指令专用词典中的词句,那么,获取到文本数据“和尚开馆”的拼音——he shang kai guan,将该拼音与电力调度控制指令专用词典中的各个词句的拼音进行逐一比对,找到电力调度控制指令专用词典中的相同的拼音“heshang kai guan”,得到该拼音“he shang kai guan”对应的词句“合上开关”,将文本数据“合上开关”替换文本数据“和尚开馆”,该文本数据“合上开关”就是目标文本数据。
通过上述过程能够得到各个语音数据对应的目标文本数据。
建立各特征数据与对应的目标文本数据之间的对应关系:
由于上述得到各个语音数据的特征数据,以及各个语音数据的目标文本数据,那么,建立各特征数据与对应的目标文本数据之间的对应关系。
身份验证部分的建立过程得到电力调度身份验证数据库,语音识别部分的建立过程得到各特征数据与对应的目标文本数据之间的对应关系,那么,电力调度身份验证数据库与各特征数据与对应的目标文本数据之间的对应关系构成电力***调度控制语音识别模型。
利用该电力***调度控制语音识别模型进行电力调度控制时,采集被识别对象的音频信号,并提取到声纹,然后将得到的声纹与该电力***调度控制语音识别模型中的电力调度身份验证数据库进行比对,若该声纹与该电力调度身份验证数据库中的某一个声纹的匹配度大于或等于预设值,则表示这两个声纹为相同的声纹,该声纹属于该电力调度身份验证数据库中的某一个声纹,该被识别对象的身份符合要求;若该声纹与该电力调度身份验证数据库中的各个声纹的匹配度均小于预设值,则表示该声纹与该电力调度身份验证数据库中的所有声纹均不匹配,该声纹不属于该电力调度身份验证数据库中的任意一个声纹,该被识别对象的身份不符合要求。
若被识别对象的身份符合要求,则获取被识别对象的语音数据,然后对该语音数据进行特征提取,得到对应的特征数据,根据电力***调度控制语音识别模型中的各特征数据与对应的目标文本数据之间的对应关系确定得到该特征数据对应的目标文本数据,进而得到对应的电力调度控制指令。
上述实施例仅以一种具体的实施方式说明本发明的技术方案,任何对本发明进行的等同替换及不脱离本发明精神和范围的修改或局部替换,其均应涵盖在本发明权利要求保护的范围之内。
Claims (3)
1.一种电力***调度控制语音识别模型建立方法,其特征在于,包括:
获取各具有电力调度权限的人员的音频信号;
根据所述音频信号,获取所述音频信号对应的人员的声纹;
根据各具有电力调度权限的人员的声纹,建立电力调度身份验证数据库;
获取各电力调度控制指令对应的语音数据;
对所述语音数据进行特征提取,得到对应的特征数据;
对所述语音数据进行识别,得到对应的文本数据;
将所述文本数据与预设的电力调度控制指令专用词典进行比对,若所述文本数据属于所述电力调度控制指令专用词典中的词句,则保留所述文本数据,得到目标文本数据;若所述文本数据不属于所述电力调度控制指令专用词典中的词句,则根据所述文本数据的拼音,查找所述电力调度控制指令专用词典中与所述文本数据的拼音相同的词句,将查找到的词句替换所述文本数据,得到目标文本数据;
建立各特征数据与对应的目标文本数据之间的对应关系;
所述电力调度身份验证数据库与所述对应关系构成所述电力***调度控制语音识别模型。
2.根据权利要求1所述的电力***调度控制语音识别模型建立方法,其特征在于,所述获取所述音频信号对应的人员的声纹之后,所述电力***调度控制语音识别模型建立方法,还包括:
获取各具有电力调度权限的人员的脸部图像,并建立不同声纹与对应的脸部图像的对应关系;
相应的,所述根据各具有电力调度权限的人员的声纹,建立电力调度身份验证数据库,包括:
根据各具有电力调度权限的人员的声纹以及对应的脸部图像,建立电力调度身份验证数据库,所述电力调度身份验证数据库包括各具有电力调度权限的人员的声纹,以及对应的脸部图像。
3.根据权利要求1所述的电力***调度控制语音识别模型建立方法,其特征在于,所述电力调度控制指令专用词典包括各电力调度控制指令的词句以及所述各电力调度控制指令的词句的拼音;
所述根据所述文本数据的拼音,查找所述电力调度控制指令专用词典中与所述文本数据的拼音相同的词句,将查找到的词句替换所述文本数据,得到目标文本数据,包括:
获取所述文本数据的拼音;
将获取得到的所述文本数据的拼音输入到所述电力调度控制指令专用词典中,得到所述电力调度控制指令专用词典中与所述文本数据的拼音相同的拼音,并根据得到的拼音得到所述电力调度控制指令专用词典中对应的词句;
将得到的词句替换所述文本数据,得到目标文本数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010299229.5A CN111462754B (zh) | 2020-04-16 | 2020-04-16 | 一种电力***调度控制语音识别模型建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010299229.5A CN111462754B (zh) | 2020-04-16 | 2020-04-16 | 一种电力***调度控制语音识别模型建立方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111462754A true CN111462754A (zh) | 2020-07-28 |
CN111462754B CN111462754B (zh) | 2022-08-09 |
Family
ID=71681246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010299229.5A Active CN111462754B (zh) | 2020-04-16 | 2020-04-16 | 一种电力***调度控制语音识别模型建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111462754B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112651854A (zh) * | 2020-12-23 | 2021-04-13 | 讯飞智元信息科技有限公司 | 语音调度方法、装置、电子设备和存储介质 |
CN113283695A (zh) * | 2021-04-19 | 2021-08-20 | 贵州电网有限责任公司 | 一种基于人工智能的电力调度智慧坐席实现方法及*** |
CN116013291A (zh) * | 2022-12-12 | 2023-04-25 | 广西电网有限责任公司 | 一种基于电力领域本体知识的语音识别*** |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102780706A (zh) * | 2012-08-14 | 2012-11-14 | 俞琳 | 基于电力***业务的用户认证方法 |
CN105810200A (zh) * | 2016-02-04 | 2016-07-27 | 深圳前海勇艺达机器人有限公司 | 基于声纹识别的人机对话装置及其方法 |
CN108121528A (zh) * | 2017-12-06 | 2018-06-05 | 深圳市欧瑞博科技有限公司 | 语音控制方法、装置、服务器和计算机可读存储介质 |
CN108199480A (zh) * | 2017-12-27 | 2018-06-22 | 国电南瑞南京控制***有限公司 | 一种基于人工智能的电力调度***及其方法 |
CN109559737A (zh) * | 2018-12-13 | 2019-04-02 | 朱明增 | 电力***调度语音模型建立方法 |
CN110473566A (zh) * | 2019-07-25 | 2019-11-19 | 深圳壹账通智能科技有限公司 | 音频分离方法、装置、电子设备及计算机可读存储介质 |
CN110728973A (zh) * | 2019-10-23 | 2020-01-24 | 青岛聚看云科技有限公司 | 视频资源的输出方法和服务器 |
-
2020
- 2020-04-16 CN CN202010299229.5A patent/CN111462754B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102780706A (zh) * | 2012-08-14 | 2012-11-14 | 俞琳 | 基于电力***业务的用户认证方法 |
CN105810200A (zh) * | 2016-02-04 | 2016-07-27 | 深圳前海勇艺达机器人有限公司 | 基于声纹识别的人机对话装置及其方法 |
CN108121528A (zh) * | 2017-12-06 | 2018-06-05 | 深圳市欧瑞博科技有限公司 | 语音控制方法、装置、服务器和计算机可读存储介质 |
CN108199480A (zh) * | 2017-12-27 | 2018-06-22 | 国电南瑞南京控制***有限公司 | 一种基于人工智能的电力调度***及其方法 |
CN109559737A (zh) * | 2018-12-13 | 2019-04-02 | 朱明增 | 电力***调度语音模型建立方法 |
CN110473566A (zh) * | 2019-07-25 | 2019-11-19 | 深圳壹账通智能科技有限公司 | 音频分离方法、装置、电子设备及计算机可读存储介质 |
CN110728973A (zh) * | 2019-10-23 | 2020-01-24 | 青岛聚看云科技有限公司 | 视频资源的输出方法和服务器 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112651854A (zh) * | 2020-12-23 | 2021-04-13 | 讯飞智元信息科技有限公司 | 语音调度方法、装置、电子设备和存储介质 |
CN113283695A (zh) * | 2021-04-19 | 2021-08-20 | 贵州电网有限责任公司 | 一种基于人工智能的电力调度智慧坐席实现方法及*** |
CN116013291A (zh) * | 2022-12-12 | 2023-04-25 | 广西电网有限责任公司 | 一种基于电力领域本体知识的语音识别*** |
CN116013291B (zh) * | 2022-12-12 | 2024-05-14 | 广西电网有限责任公司 | 一种基于电力领域本体知识的语音识别*** |
Also Published As
Publication number | Publication date |
---|---|
CN111462754B (zh) | 2022-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111462754B (zh) | 一种电力***调度控制语音识别模型建立方法 | |
CN108304372B (zh) | 实体提取方法和装置、计算机设备和存储介质 | |
US10476872B2 (en) | Joint speaker authentication and key phrase identification | |
CN101076851B (zh) | 口语识别***以及用于训练和操作该***的方法 | |
CN109192194A (zh) | 语音数据标注方法、装置、计算机设备及存储介质 | |
CN111324708A (zh) | 一种基于人机交互的自然语言处理*** | |
WO2021118072A1 (ko) | 음성 및 영상 정보를 활용한 의미있는 구간을 검출하기 위한 방법 및 이를 위한 장치 | |
CN111402892A (zh) | 一种基于语音识别的会议记录模板生成方法 | |
CN106782503A (zh) | 基于发音过程中生理信息的自动语音识别方法 | |
CN110853669B (zh) | 音频识别方法、装置及设备 | |
CN113535925B (zh) | 语音播报方法、装置、设备及存储介质 | |
CN113051384A (zh) | 基于对话的用户画像抽取方法及相关装置 | |
CN112863485A (zh) | 口音语音识别方法、装置、设备及存储介质 | |
KR20110065916A (ko) | 통역오류 정정 및 오류 자동추출 절차를 수행하는 통역시스템 | |
CN110838290A (zh) | 跨语言交流的语音机器人交互方法及装置 | |
CN113436617B (zh) | 语音断句方法、装置、计算机设备及存储介质 | |
CN115547345A (zh) | 声纹识别模型训练及相关识别方法、电子设备和存储介质 | |
CN114974310A (zh) | 基于人工智能的情感识别方法、装置、计算机设备及介质 | |
CN111276146A (zh) | 基于语音识别的教学实训*** | |
CN114203160A (zh) | 应样本数据集生成方法、装置及设备 | |
WO2020096073A1 (ko) | 빅 데이터를 이용한 최적의 언어 모델 생성 방법 및 이를 위한 장치 | |
JP2010197709A (ja) | 音声認識応答方法、音声認識応答システム、及びそのプログラム | |
CN101304457A (zh) | 一种基于语音电话实现自动口语训练的方法与装置 | |
CN111916083B (zh) | 一种通过大数据采集的智能设备语音指令识别算法 | |
CN113409763B (zh) | 语音纠正方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |