CN112651313A - 一种设备铭牌双重智能化识别方法、存储介质及终端 - Google Patents
一种设备铭牌双重智能化识别方法、存储介质及终端 Download PDFInfo
- Publication number
- CN112651313A CN112651313A CN202011493676.0A CN202011493676A CN112651313A CN 112651313 A CN112651313 A CN 112651313A CN 202011493676 A CN202011493676 A CN 202011493676A CN 112651313 A CN112651313 A CN 112651313A
- Authority
- CN
- China
- Prior art keywords
- nameplate
- equipment
- recognition
- image
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012015 optical character recognition Methods 0.000 claims description 20
- 238000013527 convolutional neural network Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 230000009977 dual effect Effects 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000825 ultraviolet detection Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种设备铭牌双重智能化识别方法、存储介质及终端,方法包括以下步骤:S1:获取设备铭牌图像;S2:判断设备铭牌图像的清晰度是否可以进行文字识别,若是,对设备铭牌图像中的文字进行识别,得到设备铭牌内容,结束,若否,执行步骤S3;S3:获取设备铭牌语音数据;S4:对设备铭牌语音数据进行语音识别,得到设备铭牌内容,结束。与现有技术相比,实现复杂电力环境下电力设备铭牌快速、精确的识别。
Description
技术领域
本发明涉及人工智能技术应用领域,尤其是涉及一种设备铭牌双重智能化识别方法、存储介质及终端。
背景技术
近年来,随着人工智技术的快速发展和广泛应用,人工智能技术广泛应用在安防、金融、医学等领域,大大提高了生产效率。电力设备带电检测(包括红外检测、紫外检测、局放检测等)对发现掌握电力设备状态和发现隐患有重大意义。电力设备带电检测中需要抄写电力设备铭牌并在***中录入,以对应其带电检测结果。电力设备铭牌比较复杂,且包含中英文字符和数字,受限于变电站的狭小空间和光线,电力设备铭牌有时无法进行清晰拍摄。因此,使用单一文字识别技术进行电力铭牌识别,往往无法满足复杂电力场景下设备铭牌识别的要求。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种设备铭牌双重智能化识别方法、存储介质及终端。
本发明的目的可以通过以下技术方案来实现:
一种设备铭牌双重智能化识别方法,该方法包括以下步骤:
S1:获取设备铭牌图像;
S2:判断设备铭牌图像的清晰度是否可以进行文字识别,若是,对设备铭牌图像中的文字进行识别,得到设备铭牌内容,结束,若否,执行步骤S3;
S3:获取设备铭牌语音数据;
S4:对设备铭牌语音数据进行语音识别,得到设备铭牌内容,结束。
S1中,所述的设备铭牌图像通过CCD相机获取。
S3中,所述的设备铭牌语音数据通过麦克风采集。
S2中,对设备铭牌图像中的文字通过OCR光学字符识别进行识别。
所述OCR光学字符识别的过程包括:
S21:对设备铭牌图像进行角度校正和去噪;
S22:行分割获得设备铭牌图像的文字行;
S23:将文字行进行列分割,得到字符;
S24:将字符输入OCR识别模型得到设备铭牌内容。
S24中,将字符输入OCR识别模型得到初步设备铭牌内容,初步设备铭牌内容通过卷积神经网络进行二次校正,得到设备铭牌内容。
S4中,通过深度全序列卷积神经网络对设备铭牌语音数据进行语音识别。
通过深度全序列卷积神经网络对设备铭牌语音数据进行语音识别的过程包括:
S41:对设备铭牌语音数据进行傅里叶变换;
S42:将时间和频率作为两个维度,通过卷积层和池化层的组合进行语音识别,得到设备铭牌内容。
一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序被处理器加载执行时,实现所述的设备铭牌双重智能化识别方法。
一种终端,包括:处理器及存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述终端执行所述的设备铭牌双重智能化识别方法。
与现有技术相比,本发明具有以下优点:
(1)通过对设备铭牌图像中的文字进行识别和对设备铭牌语音数据进行语音识别的双重识别,克服了变电站的狭小空间和光线的局限性,满足复杂电力场景下设备铭牌识别的要求,实现复杂电力环境下电力设备铭牌快速、精确的识别。
(2)采用OCR光学字符识别,并通过卷积神经网络进行二次校正,使图像识别结果更加准确。
(3)使用深度全序列卷积神经网络,使语音识别结果更加准确。
附图说明
图1为本发明的流程图;
图2为本发明通过卷积神经网络进行二次校正的过程;
图3为本发明深度全序列卷积神经网络进行语音识别的过程。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
本实施例提供一种设备铭牌双重智能化识别方法,该方法包括以下步骤:
S1:获取设备铭牌图像;
S2:判断设备铭牌图像的清晰度是否可以进行文字识别,若是,对设备铭牌图像中的文字进行识别,得到设备铭牌内容,结束,若否,执行步骤S3;
S3:获取设备铭牌语音数据;
S4:对设备铭牌语音数据进行语音识别,得到设备铭牌内容,结束。
具体而言:
S1中,设备铭牌图像通过CCD相机获取;S2中,对设备铭牌图像中的文字通过OCR光学字符识别进行识别;S3中,设备铭牌语音数据通过麦克风采集,设备铭牌语音数据由工作人员读入;S4中,通过深度全序列卷积神经网络对设备铭牌语音数据进行语音识别。
OCR光学字符识别的过程包括:
S21:对设备铭牌图像进行角度校正和去噪;
S22:行分割获得设备铭牌图像的文字行;
S23:将文字行进行列分割,得到字符;
S24:将字符输入OCR识别模型得到设备铭牌内容,其中,将字符输入OCR识别模型得到初步设备铭牌内容,初步设备铭牌内容通过卷积神经网络进行二次校正,得到设备铭牌内容;本实施例利用Tesseract库进行识别。
通过深度全序列卷积神经网络对设备铭牌语音数据进行语音识别的过程包括:
S41:对设备铭牌语音数据进行傅里叶变换;
S42:将时间和频率作为两个维度,通过卷积层和池化层的组合进行语音识别,得到设备铭牌内容。
本实施例提供一种计算机可读存储介质,其中存储有计算机程序,计算机程序被处理器加载执行时,实现上述的设备铭牌双重智能化识别方法。
本实施例还提供一种终端,包括:处理器及存储器;其中,存储器用于存储计算机程序;处理器用于加载执行计算机程序,以使终端执行上述的设备铭牌双重智能化识别方法。
Claims (10)
1.一种设备铭牌双重智能化识别方法,其特征在于,该方法包括以下步骤:
S1:获取设备铭牌图像;
S2:判断设备铭牌图像的清晰度是否可以进行文字识别,若是,对设备铭牌图像中的文字进行识别,得到设备铭牌内容,结束,若否,执行步骤S3;
S3:获取设备铭牌语音数据;
S4:对设备铭牌语音数据进行语音识别,得到设备铭牌内容,结束。
2.根据权利要求1所述的一种设备铭牌双重智能化识别方法,其特征在于,S1中,所述的设备铭牌图像通过CCD相机获取。
3.根据权利要求1所述的一种设备铭牌双重智能化识别方法,其特征在于,S3中,所述的设备铭牌语音数据通过麦克风采集。
4.根据权利要求1所述的一种设备铭牌双重智能化识别方法,其特征在于,S2中,对设备铭牌图像中的文字通过OCR光学字符识别进行识别。
5.根据权利要求4所述的一种设备铭牌双重智能化识别方法,其特征在于,所述OCR光学字符识别的过程包括:
S21:对设备铭牌图像进行角度校正和去噪;
S22:行分割获得设备铭牌图像的文字行;
S23:将文字行进行列分割,得到字符;
S24:将字符输入OCR识别模型得到设备铭牌内容。
6.根据权利要求5所述的一种设备铭牌双重智能化识别方法,其特征在于,S24中,将字符输入OCR识别模型得到初步设备铭牌内容,初步设备铭牌内容通过卷积神经网络进行二次校正,得到设备铭牌内容。
7.根据权利要求1所述的一种设备铭牌双重智能化识别方法,其特征在于,S4中,通过深度全序列卷积神经网络对设备铭牌语音数据进行语音识别。
8.根据权利要求7所述的一种设备铭牌双重智能化识别方法,其特征在于,通过深度全序列卷积神经网络对设备铭牌语音数据进行语音识别的过程包括:
S41:对设备铭牌语音数据进行傅里叶变换;
S42:将时间和频率作为两个维度,通过卷积层和池化层的组合进行语音识别,得到设备铭牌内容。
9.一种计算机可读存储介质,其中存储有计算机程序,其特征在于,所述计算机程序被处理器加载执行时,实现如权利要求1-8中任一所述的设备铭牌双重智能化识别方法。
10.一种终端,其特征在于,包括:处理器及存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述终端执行如权利要求1-8中任一所述的设备铭牌双重智能化识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011493676.0A CN112651313A (zh) | 2020-12-17 | 2020-12-17 | 一种设备铭牌双重智能化识别方法、存储介质及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011493676.0A CN112651313A (zh) | 2020-12-17 | 2020-12-17 | 一种设备铭牌双重智能化识别方法、存储介质及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112651313A true CN112651313A (zh) | 2021-04-13 |
Family
ID=75354586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011493676.0A Pending CN112651313A (zh) | 2020-12-17 | 2020-12-17 | 一种设备铭牌双重智能化识别方法、存储介质及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651313A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101354748A (zh) * | 2007-07-23 | 2009-01-28 | 英华达(上海)电子有限公司 | 一种文字识别装置和方法、及移动终端 |
CN105553113A (zh) * | 2016-03-03 | 2016-05-04 | 云南电网有限责任公司电力科学研究院 | 一种基于智能识别的机器人防误操作***及操作方法 |
CN106898350A (zh) * | 2017-01-16 | 2017-06-27 | 华南理工大学 | 一种基于深度学习的智能工业机器人语音交互与控制方法 |
CN108537471A (zh) * | 2018-06-14 | 2018-09-14 | 宁夏京能宁东发电有限责任公司 | 一种工作票的流程管控***及其数据处理方法 |
CN109002820A (zh) * | 2018-06-27 | 2018-12-14 | 迪蒙智慧交通(深圳)有限公司 | 一种车牌识别方法、装置及相关设备 |
CN109766891A (zh) * | 2018-12-14 | 2019-05-17 | 北京上格云技术有限公司 | 获取设备设施信息的方法及计算机可读存储介质 |
CN109767759A (zh) * | 2019-02-14 | 2019-05-17 | 重庆邮电大学 | 基于改进型cldnn结构的端到端语音识别方法 |
WO2019141741A1 (en) * | 2018-01-19 | 2019-07-25 | Arcus Holding A/S | License plate reader using optical character recognition on plural detected regions |
CN110110726A (zh) * | 2019-05-15 | 2019-08-09 | 深圳供电局有限公司 | 电力设备铭牌识别方法、装置、计算机设备和存储介质 |
CN110956171A (zh) * | 2019-11-06 | 2020-04-03 | 广州供电局有限公司 | 铭牌自动识别方法、装置、计算机设备和存储介质 |
CN111061886A (zh) * | 2019-12-20 | 2020-04-24 | 长安大学 | 一种基于nlp的多媒体作业在线管理***及方法 |
-
2020
- 2020-12-17 CN CN202011493676.0A patent/CN112651313A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101354748A (zh) * | 2007-07-23 | 2009-01-28 | 英华达(上海)电子有限公司 | 一种文字识别装置和方法、及移动终端 |
CN105553113A (zh) * | 2016-03-03 | 2016-05-04 | 云南电网有限责任公司电力科学研究院 | 一种基于智能识别的机器人防误操作***及操作方法 |
CN106898350A (zh) * | 2017-01-16 | 2017-06-27 | 华南理工大学 | 一种基于深度学习的智能工业机器人语音交互与控制方法 |
WO2019141741A1 (en) * | 2018-01-19 | 2019-07-25 | Arcus Holding A/S | License plate reader using optical character recognition on plural detected regions |
CN108537471A (zh) * | 2018-06-14 | 2018-09-14 | 宁夏京能宁东发电有限责任公司 | 一种工作票的流程管控***及其数据处理方法 |
CN109002820A (zh) * | 2018-06-27 | 2018-12-14 | 迪蒙智慧交通(深圳)有限公司 | 一种车牌识别方法、装置及相关设备 |
CN109766891A (zh) * | 2018-12-14 | 2019-05-17 | 北京上格云技术有限公司 | 获取设备设施信息的方法及计算机可读存储介质 |
CN109767759A (zh) * | 2019-02-14 | 2019-05-17 | 重庆邮电大学 | 基于改进型cldnn结构的端到端语音识别方法 |
CN110110726A (zh) * | 2019-05-15 | 2019-08-09 | 深圳供电局有限公司 | 电力设备铭牌识别方法、装置、计算机设备和存储介质 |
CN110956171A (zh) * | 2019-11-06 | 2020-04-03 | 广州供电局有限公司 | 铭牌自动识别方法、装置、计算机设备和存储介质 |
CN111061886A (zh) * | 2019-12-20 | 2020-04-24 | 长安大学 | 一种基于nlp的多媒体作业在线管理***及方法 |
Non-Patent Citations (1)
Title |
---|
石煌雄等: "基于深度学习的电气铭牌可变区域识别方法的研究", 《云南民族大学学报(自然科学版)》, pages 350 - 355 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019232853A1 (zh) | 中文模型训练、中文图像识别方法、装置、设备及介质 | |
CN108664996B (zh) | 一种基于深度学习的古文字识别方法及*** | |
CN111160533B (zh) | 一种基于跨分辨率知识蒸馏的神经网络加速方法 | |
Goodfellow et al. | Multi-digit number recognition from street view imagery using deep convolutional neural networks | |
CN107832700A (zh) | 一种人脸识别方法与*** | |
WO2016138838A1 (zh) | 基于投影极速学习机的唇语识别方法和装置 | |
US11348364B2 (en) | Method and system for neural fingerprint enhancement for fingerprint recognition | |
JP5591934B2 (ja) | オクルージョン耐性のある顔認識のための方法およびシステム | |
CN111723870B (zh) | 基于人工智能的数据集获取方法、装置、设备和介质 | |
CN113221890A (zh) | 一种基于ocr的云手机文字内容监管方法和***和*** | |
JP2022110132A (ja) | 陳列シーン認識方法、モデルトレーニング方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
WO2023284608A1 (zh) | 字符识别模型生成方法、装置、计算机设备和存储介质 | |
CN114333062B (zh) | 基于异构双网络和特征一致性的行人重识别模型训练方法 | |
CN107403618B (zh) | 基于堆叠基稀疏表示的音频事件分类方法及计算机设备 | |
CN113688955B (zh) | 文本识别方法、装置、设备及介质 | |
CN109168006A (zh) | 一种图形和图像共存的视频编解码方法 | |
CN113449676B (zh) | 一种基于双路互促进解纠缠学习的行人重识别方法 | |
Zheng et al. | Learning from the web: Webly supervised meta-learning for masked face recognition | |
CN105335755A (zh) | 一种涉及媒体片段的说话检测方法及*** | |
CN112651313A (zh) | 一种设备铭牌双重智能化识别方法、存储介质及终端 | |
CN116501942A (zh) | 一种基于中台架构的图书馆智能管理*** | |
CN112395448A (zh) | 一种人脸检索方法及装置 | |
Polat et al. | Unsupervised term discovery for continuous sign language | |
CN111898618A (zh) | 一种识别古代图形文字的方法、装置和程序储存介质 | |
Singh et al. | Facial Recognition Automation System Using Machine Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |