CN111985484A - 基于cnn-lstm的温度仪表数字识别的方法及装置 - Google Patents

基于cnn-lstm的温度仪表数字识别的方法及装置 Download PDF

Info

Publication number
CN111985484A
CN111985484A CN202010802979.XA CN202010802979A CN111985484A CN 111985484 A CN111985484 A CN 111985484A CN 202010802979 A CN202010802979 A CN 202010802979A CN 111985484 A CN111985484 A CN 111985484A
Authority
CN
China
Prior art keywords
picture
lstm
cnn
temperature
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010802979.XA
Other languages
English (en)
Inventor
唐标
李婷
于辉
朱梦梦
黄绪勇
李博
秦雄鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Yunnan Power Grid Co Ltd filed Critical Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority to CN202010802979.XA priority Critical patent/CN111985484A/zh
Publication of CN111985484A publication Critical patent/CN111985484A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

本申请提供一种基于CNN‑LSTM的温度仪表数字识别的方法及装置,所述方法采用卷积神经网络结合循环神经网络中的长短期记忆网络进行建模,使得对输入模型中的图片数据不用进行过多切割等繁琐的预处理过程,直接将示数图片作为整体输入模型即可进行预测,大大简化了读数识别的预处理过程。其中,长短期记忆网络部分采用双向长短期记忆网络,同时考虑过去和未来的信息,使得预测结果表现相对更好。采用连接时序分类器,对输出序列进行解码,解决了输入与输出难以对应的问题,简化许多步骤,提高了预测效率。

Description

基于CNN-LSTM的温度仪表数字识别的方法及装置
技术领域
本申请涉及神经网络技术领域,尤其涉及一种基于CNN-LSTM的温度仪表数字识别的方法及装置。
背景技术
随着温度类仪器仪表在变电站的大量使用,电网热工专业的工作量越来越饱和。受限于温度类标准设备控温速度慢的影响,在现场和实验室的工作中,温度专业人员存在效率低下、精力不易集中以及温度设备失控造成火灾等风险。为节省电力工业上在温度仪表读数时的人力与时间,许多相关自动读数的技术不断出现,这些技术的出现使得在生产上的效率以及正确率有较大提高。
现有相近技术提出,对原始仪表图片进行一定图形学预处理,将其转换为相对固定大小与角度的二值化图片;对当前二值化图片切割为单个数字图片后,使用支持向量机(Support Vector Machine,SVM)等机器学习相关技术进行数字识别以及小数点位置识别。使用SVM建模进行单独数字识别后再进行组合输出,这样使得整体预测过程处理繁琐且效率低下。
发明内容
为了解决上述问题,本申请提供一种基于CNN-LSTM的温度仪表数字识别的方法及装置,以解决现有技术中预测过程处理繁琐导致效率低下的问题。
为了实现上述目的,本申请通过以下技术方案实现:
一方面,一种基于CNN-LSTM的温度仪表数字识别的方法,所述方法包括:
获取温度仪表示数图片;
对所述温度仪表示数图片进行图形学预处理,得到示数二值化图片;
根据卷积神经网络,确定所述示数二值化图片的图片特征;
根据循环神经网络中的长短期记忆网络,对所述图片特征进行数字识别,得到概率数据;
将所述概率数据输入到Softmax激活函数,得到输出序列;根据连接时序分类器,对所述输出序列进行解码,确定温度读数数字字符串。
可选的,所述对所述温度仪表示数图片进行图形学预处理,得到示数二值化图片的步骤包括:
根据霍夫变换,将所述温度仪表示数图片进行旋转,对旋转后的图片进行切割,得到示数图片;
对所述示数图片进行二值化处理后,进行开运算,得到示数二值化图片。
可选的,卷积神经网络的结构包括卷积层和最大池化层。
可选的,所述根据循环神经网络中的长短期记忆网络,对所述图片特征进行数字识别,得到概率数据的步骤包括:
双向长短期记忆网络结构将图片特征进行正向计算与反向计算,输出中间信息,得到概率数据。
可选的,所述连接时序分类器采用的搜索方法为集束搜索。
另一方面,一种基于CNN-LSTM的温度仪表数字识别的装置,所述装置包括:
获取单元,用于获取温度仪表示数图片;
处理单元,用于对所述温度仪表示数图片进行图形学预处理,得到示数二值化图片;
确定单元,根据卷积神经网络,用于确定所述示数二值化图片的图片特征;
识别单元,根据循环神经网络中的长短期记忆网络,用于对所述图片特征进行数字识别,得到概率数据;
输出单元,用于将所述概率数据输入到Softmax激活函数,得到输出序列;解码单元,根据连接时序分类器,用于对所述输出序列进行解码,确定温度读数数字字符串。
由以上技术方案可知,本申请提供一种基于CNN-LSTM的温度仪表数字识别的方法及装置,所述方法采用卷积神经网络结合循环神经网络中的长短期记忆网络进行建模,使得对输入模型中的图片数据不用进行过多切割等繁琐的预处理过程,直接将示数图片作为整体输入模型即可进行预测,大大简化了读数识别的预处理过程。其中,长短期记忆网络部分采用双向长短期记忆网络,同时考虑过去和未来的信息,使得预测结果表现相对更好。采用连接时序分类器,对输出序列进行解码,解决了输入与输出难以对应的问题,简化许多步骤,提高了预测效率。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中一种基于CNN-LSTM的温度仪表数字识别的方法的图片旋转角度说明示意图;
图2为本申请实施例中一种基于CNN-LSTM的温度仪表数字识别的方法的网络结构示意图;
图3为本申请实施例中一种基于CNN-LSTM的温度仪表数字识别的方法的卷积层的计算示意图;
图4为本申请实施例中一种基于CNN-LSTM的温度仪表数字识别的方法的最大池化层的输出示意图;
图5为本申请实施例中长短期记忆网络的一个基本单元的结构示意图;
图6为本申请实施例中一种基于CNN-LSTM的温度仪表数字识别的方法的映射计算过程示意图。
具体实施方式
为使本申请实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本申请。
一方面,一种基于CNN-LSTM的温度仪表数字识别的方法,所述方法包括:
首先,获取温度仪表示数图片;拍摄一定数量的工业现场的温度仪表的示数图片,整理为温度示数图片库。本实施例中共收集了2000张未经处理的温度仪表示数图片及温度仪表示数图片的示数标签。
对所述温度仪表示数图片进行图形学预处理,得到示数二值化图片;对温度示数图片库中的温度仪表示数图片进行图形学预处理,使温度仪表示数图片最终转换为固定角度与大小的,只含读数部分的二值化图片,即黑白图片,经过预处理后的图片在AI模型中更易被提取特征以及训练。然后将所有示数二值化图片按照一定的比例分割为训练集和测试集,比例可以设置成8:2,本实施例不做具体的限定。
在一些实施例中,所述对所述温度仪表示数图片进行图形学预处理,得到示数二值化图片的步骤包括:
使用霍夫(Hough)变换检测出与竖直方向θ夹角小于阈值的直线,阈值可以设置成30°,本实施例不做限定,计算出该族直线的所有θ的均值
Figure BDA0002628074320000032
并将图片旋转
Figure BDA0002628074320000033
得到校正后的图片。如图1所示,其中横坐标x表示被处理的图片的长度,纵坐标y表示被处理的图片的宽度,r为图片中任一定点到所述直线的距离。
根据霍夫(Hough)变换,将所述温度仪表示数图片进行旋转,对旋转后的图片进行切割,得到示数图片;所述示数图片是保证显示数字完整且面积最小的图片。
对所述示数图片进行二值化处理后,进行开运算,得到示数二值化图片。其中,二值化处理包括:假定一个阈值p,图中每个像素的灰度值为ui,则转换关系如下:
Figure BDA0002628074320000031
图像的开运算即为先进行腐蚀运算,去除图像中的边界噪点,使外界向内部收缩;再进行膨胀运算,将数字内部的间隔合并,使模型更易进行识别。
其次,根据卷积神经网络(Convolutional Neural Networks,CNN),确定所述示数二值化图片的图片特征;卷积神经网络(CNN)可以对输入的图片进行一定的特征自动提取,以便后续输入长短期记忆网络(Long-Short Term Memory,LSTM)中进行数字识别。
在一些实施例中,如图2所示,卷积神经网络的结构包括卷积层和最大池化层。卷积层(Convolutional layer,Conv)是使用卷积核来提取特征的隐藏层。如图3所示,其中卷积核为一个方形矩阵,假设卷积核为3*3,从左上角开始,卷积核对应着数据的3*3的矩阵范围,然后相乘再相加得出一个值。按照这种顺序,每隔一个像素就操作一次,得出9个值。这九个值形成的矩阵被称作激活映射。
最大池化层(Max Pooling)是用来降低卷积层参数的隐藏层。如图4所示,使用一定大小的方形矩阵从池化层输出的矩阵左上角以一定步长开始滑动,选取窗口内矩阵的最大值作为输出。CNN模块中的具体参数设置详见下表:
Figure BDA0002628074320000041
然后,根据循环神经网络中的长短期记忆网络(LSTM),对所述图片特征进行数字识别,得到概率数据。
在一些实施例中,如图2所示,所述根据循环神经网络中的长短期记忆网络,对所述图片特征进行数字识别,得到概率数据的步骤包括:双向长短期记忆网络结构将图片特征进行正向计算与反向计算,输出中间信息,得到概率数据。
长短期记忆网络(LSTM)为循环神经网络(Recurrent Neural Network,RNN)中的一种特殊结构,相比循环神经网络(RNN),长短期记忆网络(LSTM)的实现不仅依赖于前一时间步和当前输入,而考虑到了更多前面的信息。如图5所示,其中,Ct-1代表t-1时刻的细胞记忆状态,Ct代表t时刻的细胞记忆状态,ht-1代表t-1时刻的输出信息,ht代表t时刻的输出信息,xt代表t时刻的输入信息,σ表示sigmoid函数,tanh表示tanh函数。
双向长短期记忆网络(LSTM)结构的隐藏层要保存两个值,将同一序列分别从前往后和从后往前进行推算,对于每个时刻t,输出由这两个单向的长短期记忆网络(LSTM)共同决定。双向长短期记忆网络(LSTM)模块的具体参数设置详见下表:
Figure BDA0002628074320000051
最后,将所述概率数据输入到Softmax激活函数,得到输出序列;根据连接时序分类器(Connectionist Temporal Classifier,CTC),对所述输出序列进行解码,确定温度读数数字字符串。
将训练集数据输入模型中进行训练,损失函数是用于度量预测值与实际值的偏差的函数,损失函数计算出预测值与实际值的偏差,根据该偏差值对神经网络中的参数进行更新,以不断优化神经网络模型。如图2所示,其中损失函数设置为CTC Loss,优化器选择Adam,初始学习率设置为0.001;使用损失函数对神经网络进行训练,训练200个epochs(轮)后,模型的损失函数趋于收敛。将测试集数据输入模型中进行预测,将Softmax层得到的输出值使用CTC解码为预测的标签值。
CTC输出每个可能输出以及每个可能输出的条件概率。CTC可以用来解决输入序列与输出序列难以一一对应的问题。给定输入x,CTC输出每个可能输出以及每个可能输出的条件概率。例如,循环神经网络(RNN)的每一个输出要对应到字符图像中的每一个位置,要手工做这样的标记工作量太大,而且图像中的字符数量不同,字体样式不同,大小不同,导致输出不一定能和每个字符一一对应。
CTC可以将问题转化为求解输出序列的条件概率最大的优化问题,求解公式为:
Figure BDA0002628074320000052
Figure BDA0002628074320000053
其中,l为真实的输出字符串序列,π为模型的输出字符串序列,下标πt表示的是模型的输出字符串序列在t时间步选取的元素对应的索引,B为将π转换为真实输出的映射,T为总时间,x为输入,y为输出。
在一些实施例中,所述根据连接时序分类器(CTC)采用的搜索方法为集束搜索(Beam Search)。如图6所示,假设指定映射B=3,在第一个时间步选取概率最大的三个字符,然后在第二个时间步也选取概率最大的三个字符,两两组合即概率相乘,可以组合成9个序列,这些序列在B转换之后会得到一些相同输出,把具有相同输出的序列进行合并,比如有3个序列都可以转换成a,把它们合并即概率加在一起,计算出概率最大的三个序列,然后继续和下一个时间步的字符进行同样的合并。
另一方面,一种基于CNN-LSTM的温度仪表数字识别的装置,所述装置包括:
获取单元,用于获取温度仪表示数图片;
处理单元,用于对所述温度仪表示数图片进行图形学预处理,得到示数二值化图片;
确定单元,根据卷积神经网络,用于确定所述示数二值化图片的图片特征;
识别单元,根据循环神经网络中的长短期记忆网络,用于对所述图片特征进行数字识别,得到概率数据;
输出单元,用于将所述概率数据输入到Softmax激活函数,得到输出序列;解码单元,根据连接时序分类器,用于对所述输出序列进行解码,确定温度读数数字字符串。
由以上技术方案可知,本申请提供一种基于CNN-LSTM的温度仪表数字识别的方法及装置,所述方法采用卷积神经网络(CNN)结合循环神经网络(RNN)中的长短期记忆网络(LSTM)进行建模,使得对输入模型中的图片数据不用进行过多切割等繁琐的预处理过程,直接将示数图片作为整体输入模型即可进行预测,大大简化了读数识别的预处理过程。其中,长短期记忆网络(LSTM)部分采用双向长短期记忆网络,同时考虑过去和未来的信息,使得预测结果表现相对更好。采用连接时序分类器(CTC),对输出序列进行解码,解决了输入与输出难以对应的问题,简化许多步骤,提高了预测效率。
以上对本申请的实施例进行了详细说明,但所述内容仅为本申请的较佳实施例,不能被认为用于限定本申请的实施范围。凡依本申请范围所作的均等变化与改进等,均应仍属于本申请的专利涵盖范围之内。

Claims (6)

1.一种基于CNN-LSTM的温度仪表数字识别的方法,其特征在于,所述方法包括:
获取温度仪表示数图片;
对所述温度仪表示数图片进行图形学预处理,得到示数二值化图片;
根据卷积神经网络,确定所述示数二值化图片的图片特征;
根据循环神经网络中的长短期记忆网络,对所述图片特征进行数字识别,得到概率数据;
将所述概率数据输入到Softmax激活函数,得到输出序列;根据连接时序分类器,对所述输出序列进行解码,确定温度读数数字字符串。
2.根据权利要求1所述的一种基于CNN-LSTM的温度仪表数字识别的方法,其特征在于,所述对所述温度仪表示数图片进行图形学预处理,得到示数二值化图片的步骤包括:
根据霍夫变换,将所述温度仪表示数图片进行旋转,对旋转后的图片进行切割,得到示数图片;
对所述示数图片进行二值化处理后,进行开运算,得到示数二值化图片。
3.根据权利要求1所述的一种基于CNN-LSTM的温度仪表数字识别的方法,其特征在于,卷积神经网络的结构包括卷积层和最大池化层。
4.根据权利要求1所述的一种基于CNN-LSTM的温度仪表数字识别的方法,其特征在于,所述根据循环神经网络中的长短期记忆网络,对所述图片特征进行数字识别,得到概率数据的步骤包括:
双向长短期记忆网络结构将图片特征进行正向计算与反向计算,输出中间信息,得到概率数据。
5.根据权利要求1所述的一种基于CNN-LSTM的温度仪表数字识别的方法,其特征在于,所述连接时序分类器采用的搜索方法为集束搜索。
6.一种基于CNN-LSTM的温度仪表数字识别的装置,其特征在于,所述装置包括:
获取单元,用于获取温度仪表示数图片;
处理单元,用于对所述温度仪表示数图片进行图形学预处理,得到示数二值化图片;
确定单元,用于根据卷积神经网络,确定所述示数二值化图片的图片特征;
识别单元,用于根据循环神经网络中的长短期记忆网络,对所述图片特征进行数字识别,得到概率数据;
输出单元,用于将所述概率数据输入到Softmax激活函数,得到输出序列;解码单元,根据连接时序分类器,用于对所述输出序列进行解码,确定温度读数数字字符串。
CN202010802979.XA 2020-08-11 2020-08-11 基于cnn-lstm的温度仪表数字识别的方法及装置 Pending CN111985484A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010802979.XA CN111985484A (zh) 2020-08-11 2020-08-11 基于cnn-lstm的温度仪表数字识别的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010802979.XA CN111985484A (zh) 2020-08-11 2020-08-11 基于cnn-lstm的温度仪表数字识别的方法及装置

Publications (1)

Publication Number Publication Date
CN111985484A true CN111985484A (zh) 2020-11-24

Family

ID=73434919

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010802979.XA Pending CN111985484A (zh) 2020-08-11 2020-08-11 基于cnn-lstm的温度仪表数字识别的方法及装置

Country Status (1)

Country Link
CN (1) CN111985484A (zh)

Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016197381A1 (en) * 2015-06-12 2016-12-15 Sensetime Group Limited Methods and apparatus for recognizing text in an image
CN106650786A (zh) * 2016-11-14 2017-05-10 沈阳工业大学 基于多列卷积神经网络模糊评判的图像识别方法
CN106909941A (zh) * 2017-02-27 2017-06-30 广东工业大学 基于机器视觉的多表字符识别***及方法
CN108984532A (zh) * 2018-07-27 2018-12-11 福州大学 基于层次嵌入的方面抽取方法
CN109389091A (zh) * 2018-10-22 2019-02-26 重庆邮电大学 基于神经网络和注意力机制结合的文字识别***及方法
CN109597891A (zh) * 2018-11-26 2019-04-09 重庆邮电大学 基于双向长短时记忆神经网络的文本情感分析方法
CN109710763A (zh) * 2018-12-27 2019-05-03 郑州云海信息技术有限公司 一种文本数据的分类方法、装置以及***
CN109740657A (zh) * 2018-12-27 2019-05-10 郑州云海信息技术有限公司 一种用于图像数据分类的神经网络模型的训练方法与设备
CN109977908A (zh) * 2019-04-04 2019-07-05 重庆交通大学 一种基于深度学习的车辆行车车道检测方法
CN110059694A (zh) * 2019-04-19 2019-07-26 山东大学 电力行业复杂场景下的文字数据的智能识别方法
CN110179453A (zh) * 2018-06-01 2019-08-30 山东省计算中心(国家超级计算济南中心) 基于卷积神经网络和长短期记忆网络的心电图分类方法
CN110399798A (zh) * 2019-06-25 2019-11-01 朱跃飞 一种基于深度学习的离散图片文件信息提取***及方法
CN110414506A (zh) * 2019-07-04 2019-11-05 南京理工大学 基于数据增广和卷积神经网络的银行卡***自动识别方法
CN110619326A (zh) * 2019-07-02 2019-12-27 安徽七天教育科技有限公司 一种基于扫描的英语试卷作文检测识别***及方法
CN110674777A (zh) * 2019-09-30 2020-01-10 电子科技大学 一种专利文本场景下的光学字符识别方法
CN110826549A (zh) * 2019-11-04 2020-02-21 山东欧玛嘉宝电气科技有限公司 基于计算机视觉的巡检机器人仪表图像识别方法及***
CN110866530A (zh) * 2019-11-13 2020-03-06 云南大学 一种字符图像识别方法、装置及电子设备
CN110930357A (zh) * 2019-10-17 2020-03-27 中国矿业大学 一种基于深度学习的在役钢丝绳表面缺陷检测方法与***
CN110958244A (zh) * 2019-11-29 2020-04-03 北京邮电大学 一种基于深度学习的仿冒域名检测方法及装置
CN110956111A (zh) * 2019-11-22 2020-04-03 苏州闪驰数控***集成有限公司 人工智能cnn、lstm神经网络步态识别***
CN110956058A (zh) * 2018-09-26 2020-04-03 北京嘀嘀无限科技发展有限公司 图像识别方法、装置及电子设备
CN111008689A (zh) * 2018-09-27 2020-04-14 谷歌有限责任公司 使用softmax近似来减少神经网络推理时间
CN111339902A (zh) * 2020-02-21 2020-06-26 北方工业大学 一种数显仪表的液晶屏示数识别方法及装置
US20200210773A1 (en) * 2019-01-02 2020-07-02 Boe Technology Group Co., Ltd. Neural network for image multi-label identification, related method, medium and device
CN111460122A (zh) * 2020-04-03 2020-07-28 成都晓多科技有限公司 基于深度学习的尺码识别方法与***

Patent Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016197381A1 (en) * 2015-06-12 2016-12-15 Sensetime Group Limited Methods and apparatus for recognizing text in an image
CN106650786A (zh) * 2016-11-14 2017-05-10 沈阳工业大学 基于多列卷积神经网络模糊评判的图像识别方法
CN106909941A (zh) * 2017-02-27 2017-06-30 广东工业大学 基于机器视觉的多表字符识别***及方法
CN110179453A (zh) * 2018-06-01 2019-08-30 山东省计算中心(国家超级计算济南中心) 基于卷积神经网络和长短期记忆网络的心电图分类方法
CN108984532A (zh) * 2018-07-27 2018-12-11 福州大学 基于层次嵌入的方面抽取方法
CN110956058A (zh) * 2018-09-26 2020-04-03 北京嘀嘀无限科技发展有限公司 图像识别方法、装置及电子设备
CN111008689A (zh) * 2018-09-27 2020-04-14 谷歌有限责任公司 使用softmax近似来减少神经网络推理时间
CN109389091A (zh) * 2018-10-22 2019-02-26 重庆邮电大学 基于神经网络和注意力机制结合的文字识别***及方法
CN109597891A (zh) * 2018-11-26 2019-04-09 重庆邮电大学 基于双向长短时记忆神经网络的文本情感分析方法
CN109740657A (zh) * 2018-12-27 2019-05-10 郑州云海信息技术有限公司 一种用于图像数据分类的神经网络模型的训练方法与设备
CN109710763A (zh) * 2018-12-27 2019-05-03 郑州云海信息技术有限公司 一种文本数据的分类方法、装置以及***
US20200210773A1 (en) * 2019-01-02 2020-07-02 Boe Technology Group Co., Ltd. Neural network for image multi-label identification, related method, medium and device
CN109977908A (zh) * 2019-04-04 2019-07-05 重庆交通大学 一种基于深度学习的车辆行车车道检测方法
CN110059694A (zh) * 2019-04-19 2019-07-26 山东大学 电力行业复杂场景下的文字数据的智能识别方法
CN110399798A (zh) * 2019-06-25 2019-11-01 朱跃飞 一种基于深度学习的离散图片文件信息提取***及方法
CN110619326A (zh) * 2019-07-02 2019-12-27 安徽七天教育科技有限公司 一种基于扫描的英语试卷作文检测识别***及方法
CN110414506A (zh) * 2019-07-04 2019-11-05 南京理工大学 基于数据增广和卷积神经网络的银行卡***自动识别方法
CN110674777A (zh) * 2019-09-30 2020-01-10 电子科技大学 一种专利文本场景下的光学字符识别方法
CN110930357A (zh) * 2019-10-17 2020-03-27 中国矿业大学 一种基于深度学习的在役钢丝绳表面缺陷检测方法与***
CN110826549A (zh) * 2019-11-04 2020-02-21 山东欧玛嘉宝电气科技有限公司 基于计算机视觉的巡检机器人仪表图像识别方法及***
CN110866530A (zh) * 2019-11-13 2020-03-06 云南大学 一种字符图像识别方法、装置及电子设备
CN110956111A (zh) * 2019-11-22 2020-04-03 苏州闪驰数控***集成有限公司 人工智能cnn、lstm神经网络步态识别***
CN110958244A (zh) * 2019-11-29 2020-04-03 北京邮电大学 一种基于深度学习的仿冒域名检测方法及装置
CN111339902A (zh) * 2020-02-21 2020-06-26 北方工业大学 一种数显仪表的液晶屏示数识别方法及装置
CN111460122A (zh) * 2020-04-03 2020-07-28 成都晓多科技有限公司 基于深度学习的尺码识别方法与***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FAUSTO MILLETARIA, 1, ∗, SEYED-AHMAD AHMADIB, 1, CHRISTINE KROLLA, ANNIKA PLATEB, VERENA ROZANSKIB, JULIANA MAIOSTREB, JOHANNES LE: "Hough-CNN: Deep Learning for Segmentation of DeepBrain Regions in MRI and Ultrasound", 《ARXIV.ORG》, 31 December 2016 (2016-12-31) *
ZHANZHAN CHENG; FAN BAI; YUNLU XU; GANG ZHENG; SHILIANG PU; SHUIGENG ZHOU: "Focusing Attention: Towards Accurate Text Recognition in Natural Images", 《2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV)》, 25 December 2017 (2017-12-25) *
蒋锐鹏;姑丽加玛丽・麦麦提艾力;安丽娜;: "基于长短期记忆神经网络的手写数字识别", 《计算机技术与发展》, 29 February 2020 (2020-02-29) *
贺嘉琪: "基于深度学习的指针式仪表示数自动识别的研究与应用", 《信息科技》, 16 July 2019 (2019-07-16) *

Similar Documents

Publication Publication Date Title
CN110059694B (zh) 电力行业复杂场景下的文字数据的智能识别方法
CN112199532B (zh) 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置
CN113313166B (zh) 基于特征一致性学习的船舶目标自动标注方法
CN111369535B (zh) 一种细胞检测方法
AU2021100391A4 (en) Natural Scene Text Recognition Method Based on Sequence Transformation Correction and Attention Mechanism
CN111210446A (zh) 一种视频目标分割方法、装置和设备
Li et al. Deep spatio-temporal wind power forecasting
CN116861202B (zh) 基于长短期记忆神经网络的船舶运动包络预报方法及***
CN113627093A (zh) 一种基于改进Unet网络的水下机构跨尺度流场特征预测方法
CN115457591A (zh) 一种电网厂站主接线图拓扑关系的识别方法
CN111027456A (zh) 基于图像识别的机械水表读数识别方法
CN112686261A (zh) 一种基于改进U-Net的葡萄根系图像分割方法
CN113962433A (zh) 一种融合因果卷积与可分离时间卷积的风电预测方法及***
CN114550153A (zh) 一种端子排图像检测识别方法
Zhong et al. Least-squares method and deep learning in the identification and analysis of name-plates of power equipment
CN117596191A (zh) 一种电力物联网异常检测方法、装置及存储介质
CN112529003A (zh) 一种基于Faster-RCNN的仪表盘数字识别方法
CN111985484A (zh) 基于cnn-lstm的温度仪表数字识别的方法及装置
CN116541689A (zh) 多模态数据采集与标注方法、装置、计算机设备
CN114550197A (zh) 一种端子排图像检测信息匹配方法
CN113962432A (zh) 一种融合三维卷积与轻量卷积门限单元的风电预测方法及***
Zhao et al. Effective recognition of word-wheel water meter readings for smart urban infrastructure
CN111178630A (zh) 一种负荷预测方法及装置
CN117058437B (zh) 一种基于知识蒸馏的花卉分类方法、***、设备及介质
CN114049648B (zh) 工程图文本检测识别方法、装置及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination