CN117133294B - 基于lstm模型的语音特征单元提取的改进型智慧工单*** - Google Patents

基于lstm模型的语音特征单元提取的改进型智慧工单*** Download PDF

Info

Publication number
CN117133294B
CN117133294B CN202311395210.0A CN202311395210A CN117133294B CN 117133294 B CN117133294 B CN 117133294B CN 202311395210 A CN202311395210 A CN 202311395210A CN 117133294 B CN117133294 B CN 117133294B
Authority
CN
China
Prior art keywords
data
module
model
unit
work order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311395210.0A
Other languages
English (en)
Other versions
CN117133294A (zh
Inventor
刘振邦
余振
胡伟
张静雯
张贻辉
刘道学
戚小东
潘成浩
程维国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Shuzhi Construction Research Institute Co ltd
China Tiesiju Civil Engineering Group Co Ltd CTCE Group
Original Assignee
Anhui Shuzhi Construction Research Institute Co ltd
China Tiesiju Civil Engineering Group Co Ltd CTCE Group
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Shuzhi Construction Research Institute Co ltd, China Tiesiju Civil Engineering Group Co Ltd CTCE Group filed Critical Anhui Shuzhi Construction Research Institute Co ltd
Priority to CN202311395210.0A priority Critical patent/CN117133294B/zh
Publication of CN117133294A publication Critical patent/CN117133294A/zh
Application granted granted Critical
Publication of CN117133294B publication Critical patent/CN117133294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及工单组合技术领域,具体地说,涉及基于LSTM模型的语音特征单元提取的改进型智慧工单***。其包括音频处理单元、特征提取单元、模型运行单元和工单输出单元。本发明中通过音频处理单元将音频数据转化为文本数据,并通过模型运行单元对音频处理单元获取并处理,获取文本数据中的特征,再通过工单输出单元根据提取的特征数据进行工单的制作,如此来使多个子***中的音频数据整合在一起,做到特征的准确提取,如此来方便后续工作人员对每个子***数据的整合,加快工作人员整合每个***的速度。

Description

基于LSTM模型的语音特征单元提取的改进型智慧工单***
技术领域
本发明涉及工单组合技术领域,具体地说,涉及基于LSTM模型的语音特征单元提取的改进型智慧工单***。
背景技术
在运维领域中,存在着一系列困难和挑战,包括历史遗留问题、复杂的***架构、不断的业务需、人员的不足以及安全方面的难点,运维人员需要不断学***的技术能力和专业素养,同时需要具备灵活性和创新能力。
运维工单***在使用的过程中存在以下问题:运维工单***存在多个子***,多个子***中存在的数据样式不同,如文本数据、音频数据等,文本数据便于处理,但音频数据在处理的时,无法和文本数据进行整合,进而导致信息和数据传递困难,造成沟通和处理问题的困扰,而为了使多个子***的之间的信息整合在一起,需要工作人员对每个子***中的数据进行提取,然后再将多个子***的数据整合起来,如此来回增加工作人员的工作量,同时也会延长每个子***之间数据沟通的时间,故需要一种***来将多个子***中的数据进行整合,降低工作人员的工作量。
发明内容
本发明的目的在于提供基于LSTM模型的语音特征单元提取的改进型智慧工单***,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供基于LSTM模型的语音特征单元提取的改进型智慧工单***,包括音频处理单元、特征提取单元、模型运行单元和工单输出单元;
所述音频处理单元接收音频数据,并根据音频数据的内容进行文本内容识别;
所述模型运行单元接收音频处理单元识别出的文本数据,并根据建立的模型对本文数据进行处理,并在数据处理后,将数据传输到特征提取单元中;
所述特征提取单元分别接收音频处理单元传输的文本数据以及模型运行单元传输的数据,并分别对音频处理单元和模型运行单元传输来的数据进行特征的提取,并将提取的数据传输到模型运行单元中进行存储;
所述工单输出单元接收模型运行单元中存储的数据,并对特征提取单元对音频处理单元、模型运行单元提取的数据进行数据对比,并在对比完成后,向模型运行单元中进行模型修改反馈,并在工单输出单元的对比一致后,进行工单的输出。
作为本技术方案的进一步改进,所述音频处理单元包括音频采集模块、音频语音识别模块和文本对比纠错模块;
所述音频采集模块对不同端的音频数据进行采集,获取音频数据内容;
所述音频语音识别模块对音频采集模块采集到的音频数据中的内容进行识别,获取音频数据对应的文本信息数据;
所述文本对比纠错模块接收音频语音识别模块中获取的文本信息数据以及音频采集模块中获取的音频数据,并将音频数据和文本信息数据进行对比,并在对比出现错误时,对文本信息数据进行修改。
作为本技术方案的进一步改进,所述模型运行单元包括模型建立模块和模型处理模块;
所述模型建立模块通过LSTM算法建立特征提取模型,并将建立的特征提取模型传输到模型处理模块中;
所述模型处理模块接收文本对比纠错模块核对后的文本信息数据,并通过特征提取模型对文本数据中的特征进行提取,获取文本信息数据中的特征数据。
作为本技术方案的进一步改进,所述特征提取模型对文本数据中的特征进行提取的步骤为:
①、首先进行第一次对文本信息数据进行特征提取,提取的信息标记为第一次数据;
②、将第一次数据进行选择性的遗忘,并在将第一次的数据遗忘后,进行第二次对文本信息数据的特征提取,并在提取时将对本次的信息提取中没有意义的数据进行剔除,获取第二次数据;
③、将第一次数据与第二次数据的信息进行叠加,并将叠加后的数据中的特征数据整合在一起,即第一次数据与第二次数据中相同的特征数据进行合并,不同的特征数据进行整合,整合在一起的数据定义为第二次完整数据;
④、对③叠加后的数据进行选择性的遗忘,并在遗忘后,对文本信息数据的特征进行第三次提取,并将第三次提取的数据和第二次完整数据进行叠加,获取第三次完整数据;
⑤、重复③、④的步骤,将前面获取的数据和新形成的数据进行叠加,直到新形成的数据中的特征数据都在前面叠加的数据中,此时停止对特征进行提取,并将叠加后的数据进行输出。
作为本技术方案的进一步改进,所述模型运行单元还包括数据集存储模块;
所述数据集存储模块存储往期的工单数据,并同时接收模型处理模块处理后的数据,并对模型处理模块处理数据的步骤进行记录,并接收特征提取单元传输来的数据,并将特征提取单元传输来的数据信息存储。
作为本技术方案的进一步改进,所述特征提取单元包括特征识别模块和特征对比模块;
所述特征识别模块接收文本对比纠错模块传输出来的文本数据,并对文本数据中的关键词汇进行识别,获取最大范围的特征数据;
所述特征对比模块接收模型处理模块和特征识别模块中的数据,并将模型处理模块、特征识别模块中的数据和数据集存储模块中存储的数据进行对比,确定数据集存储模块中是否存储有相同或相似的数据,并当存在相同或相似的数据时,对特征识别模块和模型处理模块中与数据集存储模块中相同或相似的数据进行标记,并在数据标记后,特征对比模块将模型处理模块和特征识别模块传输的数据传输到数据集存储模块中进行存储。
作为本技术方案的进一步改进,所述工单输出单元包括数据合并处理模块、数据比对模块和工单输出模块;
所述数据合并处理模块接收数据集存储模块传输的数据,并将数据集存储模块传输来的数据中特征识别模块和模型处理模块传输的数据中相同的特征进行合并,并在合并后将合并的数据传输到工单输出模块中,同时将未合并的数据传输到数据比对模块中;
所述数据比对模块接收数据合并处理模块传输来的未进行合并的数据,并将未进行合并的数据进行相互的对比,并在对比的过程中,确定未合并的数据之间的差异;
所述工单输出模块接收数据合并处理模块中合并的数据以及数据比对模块中差异较小的数据,并根据接收的数据进行工单的制作,并将制作的工单数据进行传输。
作为本技术方案的进一步改进,所述模型运行单元包括模型修改模块,所述工单输出单元包括模型数据反馈模块;
所述模型数据反馈模块接收数据比对模块中差异较大的特征数据,并将差异较大的数据进行识别,确定差异较大的特征数据对应文本数据中的内容数据,并将该部分内容数据传输到模型修改模块中;
所述模型修改模块接收模型数据反馈模块传输来的数据,并根据模型数据反馈模块中的传输内容,从本文信息数据中提取出此段内容,并将此段内容传输到模型建立模块中,使模型建立模块根据此段内容以及差异较大的特征数据进行模型的修改。
与现有技术相比,本发明的有益效果:
1、该基于LSTM模型的语音特征单元提取的改进型智慧工单***中,通过音频处理单元将音频数据转化为文本数据,并通过模型运行单元对音频处理单元获取并处理,获取文本数据中的特征,再通过工单输出单元根据提取的特征数据进行工单的制作,如此来使多个子***中的音频数据整合在一起,做到特征的准确提取,如此来方便后续工作人员对每个子***数据的整合,加快工作人员整合每个***的速度。
2、该基于LSTM模型的语音特征单元提取的改进型智慧工单***中,通过特征提取单元接收音频处理单元中的文本数据,并根据文本数据进行特征提取,同时接收模型处理模块处理的数据,将模型处理模块处理的数据以及特征提取单元提取出的特征数据存储到数据集存储模块中,并通过工单输出单元进行判断,将差异较大的数据通过模型数据反馈模块进行反馈,使模型修改模块根据反馈的内容控制模型建立模块对模型进行调整,如此来提高模型对文本数据中的特征数据提取的准确性,做到模型的不断优化,如此来帮助工作人员对子***中的数据的处理,也便于后续工作人员对每个子***中的数据进行整合。
附图说明
图1为本发明实施例1的整体框图;
图2为本发明实施例1的音频处理单元框图;
图3为本发明实施例1的特征提取单元框图;
图4为本发明实施例1的模型运行单元框图;
图5为本发明实施例1的工单输出单元框图;
图6为本发明实施例1的整体组合框图。
图中各个标号意义为:
1、音频处理单元;11、音频采集模块;12、音频语音识别模块;13、文本对比纠错模块;
2、特征提取单元;21、特征识别模块;22、特征对比模块;
3、模型运行单元;31、模型建立模块;32、模型处理模块;33、数据集存储模块;34、模型修改模块;
4、工单输出单元;41、数据合并处理模块;42、数据比对模块;43、工单输出模块;44、模型数据反馈模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
运维工单***在使用的过程中存在以下问题:运维工单***存在多个子***,多个子***中存在的数据样式不同,如文本数据、音频数据等,文本数据便于处理,但音频数据在处理的时,无法和文本数据进行整合,进而导致信息和数据传递困难,造成沟通和处理问题的困扰,而为了使多个子***的之间的信息整合在一起,需要工作人员对每个子***中的数据进行提取,然后再将多个子***的数据整合起来,如此来回增加工作人员的工作量,同时也会延长每个子***之间数据沟通的时间,故需要一种***来将多个子***中的数据进行整合,降低工作人员的工作量。
本发明提供基于LSTM模型的语音特征单元提取的改进型智慧工单***,请参阅图1-图6所示,包括音频处理单元1、特征提取单元2、模型运行单元3和工单输出单元4;
音频处理单元1接收音频数据,并根据音频数据的内容进行文本内容识别,通过将音频数据内的内容进行识别并转换为文本的形式,以便于根据文本数据进行特征数据的提取,使工单输出单元4便于进行工单数据的整合处理,同时将音频数据转化为文本的形式,使多个子***之间的数据便于相互传输和识别,加快每个子***之间的数据传输;
音频处理单元1包括音频采集模块11、音频语音识别模块12和文本对比纠错模块13;
音频采集模块11对不同端的音频数据进行采集,获取音频数据内容,同时在音频采集模块11采集音频数据的过程中,对获取的音频数据进行去噪和降噪操作,去除音频数据中影响文本识别的内容,以提高后续处理的准确性;
音频语音识别模块12对音频采集模块11采集到的音频数据中的内容进行识别,获取音频数据对应的文本信息数据;
文本对比纠错模块13接收音频语音识别模块12中获取的文本信息数据以及音频采集模块11中获取的音频数据,并将音频数据和文本信息数据进行对比,提高音频语音识别模块12获取的音频数据对应的文本信息数据的准确性,并在对比出现错误时,对文本信息数据进行修改,如此来提高音频数据转换文本信息数据的准确性,以便于后续对音频语音识别模块12获取的文本信息数据进行处理。
模型运行单元3接收音频处理单元1识别出的文本数据,并根据建立的模型对本文数据进行处理,并在数据处理后,将数据传输到特征提取单元2中;
模型运行单元3包括模型建立模块31和模型处理模块32;
模型建立模块31通过LSTM算法建立特征提取模型,并将建立的特征提取模型传输到模型处理模块32中,模型建立模块31建立的模型为不固定的模型,在对数据处理的过程中,当模型处理的数据出现问题时,以便于对模型进行修改;
模型处理模块32接收文本对比纠错模块13核对后的文本信息数据,并通过特征提取模型对文本数据中的特征进行提取,获取文本信息数据中的特征数据;
特征提取模型对文本数据中的特征进行提取的步骤为:
①、首先进行第一次对文本信息数据进行特征提取,提取的信息标记为第一次数据;
②、将第一次数据进行选择性的遗忘,并在将第一次的数据遗忘后,进行第二次对文本信息数据的特征提取,并在提取时将对本次的信息提取中没有意义的数据进行剔除,获取第二次数据;
③、将第一次数据与第二次数据的信息进行叠加,并将叠加后的数据中的特征数据整合在一起,即第一次数据与第二次数据中相同的特征数据进行合并,不同的特征数据进行整合,整合在一起的数据定义为第二次完整数据;
④、对③叠加后的数据进行选择性的遗忘,并在遗忘后,对文本信息数据的特征进行第三次提取,并将第三次提取的数据和第二次完整数据进行叠加,获取第三次完整数据;
⑤、重复③、④的步骤,将前面获取的数据和新形成的数据进行叠加,直到新形成的数据中的特征数据都在前面叠加的数据中,此时停止对特征进行提取,并将叠加后的数据进行输出。
通过采用LSTM算法建立的特征提取模型能够处理用户的多次输入后的特征提取,将提取出来的特征进行组合,同时也可以对一组数据进行多次的特征提取,并在输出的过程中逐步修正结果,提高对数据特征提取的准确度。
模型运行单元3还包括数据集存储模块33;
数据集存储模块33存储往期的工单数据,并同时接收模型处理模块32处理后的数据,并对模型处理模块32处理数据的步骤进行记录,并接收特征提取单元2传输来的数据,并将特征提取单元2传输来的数据信息存储,通过记录每次模型处理模块32处理数据的步骤,来判断模型建立模块31建立的模型对文本数据进行特征提取的情况,当模型处理模块32处理数据的步骤少,则代表模型建立模块31建立的模型提取文本数据中的特征效果好,反之,则建立的模型提取特征的效果不好。
特征提取单元2分别接收音频处理单元1传输的文本数据以及模型运行单元3传输的数据,并分别对音频处理单元1和模型运行单元3传输来的数据进行特征的提取,并将提取的数据传输到模型运行单元3中进行存储;
特征提取单元2包括特征识别模块21和特征对比模块22;
特征识别模块21接收文本对比纠错模块13传输出来的文本数据,并对文本数据中的关键词汇进行识别,获取最大范围的特征数据;
特征对比模块22接收模型处理模块32和特征识别模块21中的数据,并将模型处理模块32、特征识别模块21中的数据和数据集存储模块33中存储的数据进行对比,确定数据集存储模块33中是否存储有相同或相似的数据,并当存在相同或相似的数据时,对特征识别模块21和模型处理模块32中与数据集存储模块33中相同或相似的数据进行标记,并在数据标记后,特征对比模块22将模型处理模块32和特征识别模块21传输的数据传输到数据集存储模块33中进行存储。
工单输出单元4接收模型运行单元3中存储的数据,并对特征提取单元2对音频处理单元1、模型运行单元3提取的数据进行数据对比,并在对比完成后,向模型运行单元3中进行模型修改反馈,并在工单输出单元4的对比一致后,进行工单的输出;
工单输出单元4包括数据合并处理模块41、数据比对模块42和工单输出模块43;
数据合并处理模块41接收数据集存储模块33传输的数据,并将数据集存储模块33传输来的数据中特征识别模块21和模型处理模块32传输的数据中相同的特征进行合并,并在合并后将合并的数据传输到工单输出模块43中,同时将未合并的数据传输到数据比对模块42中;
数据比对模块42接收数据合并处理模块41传输来的未进行合并的数据,并将未进行合并的数据进行相互的对比,并在对比的过程中,确定未合并的数据之间的差异,当数据之间的差异较小,如仅属于不同词汇描述相同的名词时,则将该类数据进行整合并传输到工单输出模块43中;
工单输出模块43接收数据合并处理模块41中合并的数据以及数据比对模块42中差异较小的数据,并根据接收的数据进行工单的制作,并将制作的工单数据进行传输;
通过数据比对模块42对比数据后,将特征提取单元2处理的数据和模型运行单元3处理的数据的相同内容进行工单的制作,以确保制作出来的工单内容的准确性,以便于工作人员对多个子***的工单内容进行处理,方便工作人员对数据的整合。
通过音频处理单元1将音频数据转化为文本数据,并通过模型运行单元3对音频处理单元1获取并处理,获取文本数据中的特征,再通过工单输出单元4根据提取的特征数据进行工单的制作,如此来使多个子***中的音频数据整合在一起,做到特征的准确提取,如此来方便后续工作人员对每个子***数据的整合,加快工作人员整合每个***的速度。
模型运行单元3包括模型修改模块34,工单输出单元4包括模型数据反馈模块44;
模型数据反馈模块44接收数据比对模块42中差异较大的特征数据,并将差异较大的数据进行识别,确定差异较大的特征数据对应文本数据中的内容数据,并将该部分内容数据传输到模型修改模块34中;
模型修改模块34接收模型数据反馈模块44传输来的数据,并根据模型数据反馈模块44中的传输内容,从本文信息数据中提取出此段内容,并将此段内容传输到模型建立模块31中,使模型建立模块31根据此段内容以及差异较大的特征数据进行模型的修改。
通过特征提取单元2接收音频处理单元1中的文本数据,并根据文本数据进行特征提取,同时接收模型处理模块32处理的数据,将模型处理模块32处理的数据以及特征提取单元2提取出的特征数据存储到数据集存储模块33中,并通过工单输出单元4进行判断,将差异较大的数据通过模型数据反馈模块44进行反馈,使模型修改模块34根据反馈的内容控制模型建立模块31对模型进行调整,如此来提高模型对文本数据中的特征数据提取的准确性,做到模型的不断优化,如此来帮助工作人员对子***中的数据的处理,也便于后续工作人员对每个子***中的数据进行整合。
通过特征提取单元2对音频处理单元1以及模型运行单元3中的数据分别进行特征的提取,再由工单输出单元4对分别提取的数据进行对比,如此来判断模型运行单元3建立的模型是否正确,并在模型出现错误时对模型进行修复,使模型得到更新,以便于模型的后续使用,同时在工单输出单元4对比后,将不同工单中的数据组合在一起,使音频处理单元1采集的不同位置的数据整合起来,做到数据的统一处理,如此来方便运维人员对数据的处理,提高运维人员的工作效率和工作质量。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.基于LSTM模型的语音特征单元提取的改进型智慧工单***,其特征在于:包括音频处理单元(1)、特征提取单元(2)、模型运行单元(3)和工单输出单元(4);
所述音频处理单元(1)接收音频数据,并根据音频数据的内容进行文本内容识别;
所述模型运行单元(3)接收音频处理单元(1)识别出的文本数据,并根据建立的模型对文本数据进行处理,并在数据处理后,将数据传输到特征提取单元(2)中;
所述特征提取单元(2)分别接收音频处理单元(1)传输的文本数据以及模型运行单元(3)传输的数据,并分别对音频处理单元(1)和模型运行单元(3)传输来的数据进行特征的提取,并将提取的数据传输到模型运行单元(3)中进行存储;
所述模型运行单元(3)包括模型建立模块(31)和模型处理模块(32);
所述模型建立模块(31)通过LSTM算法建立特征提取模型,并将建立的特征提取模型传输到模型处理模块(32)中;
所述工单输出单元(4)接收模型运行单元(3)中存储的数据,并对特征提取单元(2)对音频处理单元(1)、模型运行单元(3)提取的数据进行数据对比,并在对比完成后,向模型运行单元(3)中进行模型修改反馈,并在工单输出单元(4)的对比一致后,进行工单的输出。
2.根据权利要求1所述的基于LSTM模型的语音特征单元提取的改进型智慧工单***,其特征在于:所述音频处理单元(1)包括音频采集模块(11)、音频语音识别模块(12)和文本对比纠错模块(13);
所述音频采集模块(11)对不同端的音频数据进行采集,获取音频数据内容;
所述音频语音识别模块(12)对音频采集模块(11)采集到的音频数据中的内容进行识别,获取音频数据对应的文本信息数据;
所述文本对比纠错模块(13)接收音频语音识别模块(12)中获取的文本信息数据以及音频采集模块(11)中获取的音频数据,并将音频数据和文本信息数据进行对比,并在对比出现错误时,对文本信息数据进行修改。
3.根据权利要求2所述的基于LSTM模型的语音特征单元提取的改进型智慧工单***,其特征在于:
所述模型处理模块(32)接收文本对比纠错模块(13)核对后的文本信息数据,并通过特征提取模型对文本数据中的特征进行提取,获取文本信息数据中的特征数据。
4.根据权利要求1所述的基于LSTM模型的语音特征单元提取的改进型智慧工单***,其特征在于:所述特征提取模型对文本数据中的特征进行提取的步骤为:
①、首先进行第一次对文本信息数据进行特征提取,提取的信息标记为第一次数据;
②、将第一次数据进行选择性的遗忘,并在将第一次的数据遗忘后,进行第二次对文本信息数据的特征提取,并在提取时将对本次的信息提取中没有意义的数据进行剔除,获取第二次数据;
③、将第一次数据与第二次数据的信息进行叠加,并将叠加后的数据中的特征数据整合在一起,即第一次数据与第二次数据中相同的特征数据进行合并,不同的特征数据进行整合,整合在一起的数据定义为第二次完整数据;
④、对③叠加后的数据进行选择性的遗忘,并在遗忘后,对文本信息数据的特征进行第三次提取,并将第三次提取的数据和第二次完整数据进行叠加,获取第三次完整数据;
⑤、重复③、④的步骤,将前面获取的数据和新形成的数据进行叠加,直到新形成的数据中的特征数据都在前面叠加的数据中,此时停止对特征进行提取,并将叠加后的数据进行输出。
5.根据权利要求3所述的基于LSTM模型的语音特征单元提取的改进型智慧工单***,其特征在于:所述模型运行单元(3)还包括数据集存储模块(33);
所述数据集存储模块(33)存储往期的工单数据,并同时接收模型处理模块(32)处理后的数据,并对模型处理模块(32)处理数据的步骤进行记录,并接收特征提取单元(2)传输来的数据,并将特征提取单元(2)传输来的数据信息存储。
6.根据权利要求5所述的基于LSTM模型的语音特征单元提取的改进型智慧工单***,其特征在于:所述特征提取单元(2)包括特征识别模块(21)和特征对比模块(22);
所述特征识别模块(21)接收文本对比纠错模块(13)传输出来的文本数据,并对文本数据中的关键词汇进行识别,获取最大范围的特征数据;
所述特征对比模块(22)接收模型处理模块(32)和特征识别模块(21)中的数据,并将模型处理模块(32)、特征识别模块(21)中的数据和数据集存储模块(33)中存储的数据进行对比,确定数据集存储模块(33)中是否存储有相同或相似的数据,并当存在相同或相似的数据时,对特征识别模块(21)和模型处理模块(32)中与数据集存储模块(33)中相同或相似的数据进行标记,并在数据标记后,特征对比模块(22)将模型处理模块(32)和特征识别模块(21)传输的数据传输到数据集存储模块(33)中进行存储。
7.根据权利要求6所述的基于LSTM模型的语音特征单元提取的改进型智慧工单***,其特征在于:所述工单输出单元(4)包括数据合并处理模块(41)、数据比对模块(42)和工单输出模块(43);
所述数据合并处理模块(41)接收数据集存储模块(33)传输的数据,并将数据集存储模块(33)传输来的数据中特征识别模块(21)和模型处理模块(32)传输的数据中相同的特征进行合并,并在合并后将合并的数据传输到工单输出模块(43)中,同时将未合并的数据传输到数据比对模块(42)中;
所述数据比对模块(42)接收数据合并处理模块(41)传输来的未进行合并的数据,并将未进行合并的数据进行相互的对比,并在对比的过程中,确定未合并的数据之间的差异;
所述工单输出模块(43)接收数据合并处理模块(41)中合并的数据以及数据比对模块(42)中差异较小的数据,并根据接收的数据进行工单的制作,并将制作的工单数据进行传输。
8.根据权利要求7所述的基于LSTM模型的语音特征单元提取的改进型智慧工单***,其特征在于:所述模型运行单元(3)包括模型修改模块(34),所述工单输出单元(4)包括模型数据反馈模块(44);
所述模型数据反馈模块(44)接收数据比对模块(42)中差异较大的特征数据,并将差异较大的数据进行识别,确定差异较大的特征数据对应文本数据中的内容数据,并将该部分内容数据传输到模型修改模块(34)中;
所述模型修改模块(34)接收模型数据反馈模块(44)传输来的数据,并根据模型数据反馈模块(44)中的传输内容,从本文信息数据中提取出此段内容,并将此段内容传输到模型建立模块(31)中,使模型建立模块(31)根据此段内容以及差异较大的特征数据进行模型的修改。
CN202311395210.0A 2023-10-26 2023-10-26 基于lstm模型的语音特征单元提取的改进型智慧工单*** Active CN117133294B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311395210.0A CN117133294B (zh) 2023-10-26 2023-10-26 基于lstm模型的语音特征单元提取的改进型智慧工单***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311395210.0A CN117133294B (zh) 2023-10-26 2023-10-26 基于lstm模型的语音特征单元提取的改进型智慧工单***

Publications (2)

Publication Number Publication Date
CN117133294A CN117133294A (zh) 2023-11-28
CN117133294B true CN117133294B (zh) 2024-01-05

Family

ID=88854895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311395210.0A Active CN117133294B (zh) 2023-10-26 2023-10-26 基于lstm模型的语音特征单元提取的改进型智慧工单***

Country Status (1)

Country Link
CN (1) CN117133294B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050101695A (ko) * 2004-04-19 2005-10-25 대한민국(전남대학교총장) 인식 결과를 이용한 통계적인 음성 인식 시스템 및 그 방법
CN112567459A (zh) * 2018-08-24 2021-03-26 三菱电机株式会社 声音分离装置、声音分离方法、声音分离程序以及声音分离***
CN113010680A (zh) * 2021-03-19 2021-06-22 国网河北省电力有限公司营销服务中心 电力工单文本分类方法、装置及终端设备
US11355122B1 (en) * 2021-02-24 2022-06-07 Conversenowai Using machine learning to correct the output of an automatic speech recognition system
CN116226372A (zh) * 2022-12-28 2023-06-06 天津科技大学 基于Bi-LSTM-CNN的多模态语音情感识别方法
CN116562270A (zh) * 2023-07-07 2023-08-08 天津亿科科技有限公司 一种支持多模态输入的自然语言处理***及其方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7895041B2 (en) * 2007-04-27 2011-02-22 Dickson Craig B Text to speech interactive voice response system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050101695A (ko) * 2004-04-19 2005-10-25 대한민국(전남대학교총장) 인식 결과를 이용한 통계적인 음성 인식 시스템 및 그 방법
CN112567459A (zh) * 2018-08-24 2021-03-26 三菱电机株式会社 声音分离装置、声音分离方法、声音分离程序以及声音分离***
US11355122B1 (en) * 2021-02-24 2022-06-07 Conversenowai Using machine learning to correct the output of an automatic speech recognition system
CN113010680A (zh) * 2021-03-19 2021-06-22 国网河北省电力有限公司营销服务中心 电力工单文本分类方法、装置及终端设备
CN116226372A (zh) * 2022-12-28 2023-06-06 天津科技大学 基于Bi-LSTM-CNN的多模态语音情感识别方法
CN116562270A (zh) * 2023-07-07 2023-08-08 天津亿科科技有限公司 一种支持多模态输入的自然语言处理***及其方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于Bi-LSTM和TFIDF的工单事件提取;范华 等;电脑知识与技术;第16卷(第04期);第291-293页 *
基于ResNet-BiLS...模型的电力客服工单分类研究;黄秀彬 等;电子设计工程;第30卷(第22期);第179-183页 *

Also Published As

Publication number Publication date
CN117133294A (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
WO2020206957A1 (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN107562918A (zh) 一种数学题知识点发现与批量标签获取方法
CN109388700A (zh) 一种意图识别方法及***
CN110890088B (zh) 语音信息反馈方法、装置、计算机设备和存储介质
CN107862005A (zh) 用户意图识别方法及装置
CN105261356A (zh) 一种语音识别***及方法
CN111324708A (zh) 一种基于人机交互的自然语言处理***
CN105654025A (zh) 一种指纹识别方法、装置及电子设备
CN111048095A (zh) 一种语音转写方法、设备及计算机可读存储介质
CN109740457A (zh) 一种人脸识别算法评测方法
CN113129898A (zh) 一种机器辅助的会议记录***及方法
CN113841156B (zh) 基于图像识别的控制方法与装置
CN110196897B (zh) 一种基于问答模板的案例识别方法
CN116562270A (zh) 一种支持多模态输入的自然语言处理***及其方法
CN117133294B (zh) 基于lstm模型的语音特征单元提取的改进型智慧工单***
CN107766256A (zh) 一种软件单元测试用例的转化方法及***
CN110705217A (zh) 一种错别字检测方法、装置及计算机存储介质、电子设备
CN111081218A (zh) 一种语音识别方法及语音控制***
CN111341324B (zh) 一种基于fasttext模型的识别纠错及训练方法
CN113326367A (zh) 基于端到端文本生成的任务型对话方法和***
CN111261166B (zh) 一种语音识别方法及装置
CN115798485A (zh) 一种调度交接班方法、***、设备、存储介质
CN111078674A (zh) 一种配网设备的数据识别与纠错方法
CN111950875A (zh) 一种合同智能评审方法
CN111914777B (zh) 一种跨模态识别机器人指令的方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant