CN111985470A - 一种自然场景下的船牌矫正识别方法 - Google Patents

一种自然场景下的船牌矫正识别方法 Download PDF

Info

Publication number
CN111985470A
CN111985470A CN202010656239.XA CN202010656239A CN111985470A CN 111985470 A CN111985470 A CN 111985470A CN 202010656239 A CN202010656239 A CN 202010656239A CN 111985470 A CN111985470 A CN 111985470A
Authority
CN
China
Prior art keywords
ship
image
plate
correction
ship plate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010656239.XA
Other languages
English (en)
Other versions
CN111985470B (zh
Inventor
宣琦
张鑫辉
孙翊杰
赵佳康
翔云
钱丽萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010656239.XA priority Critical patent/CN111985470B/zh
Publication of CN111985470A publication Critical patent/CN111985470A/zh
Application granted granted Critical
Publication of CN111985470B publication Critical patent/CN111985470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

一种自然场景下的船牌矫正识别方法,包括以下步骤:1)数据获取:通过摄像头采集港口进出船舶的图片;2)数据处理:对图片进行标注并将船牌图像裁剪;3)模型训练:用标注的船牌图片训练船牌矫正识别模型;4)模型检测:用训练好的救生衣检测模型对船牌图像进行识别,得到矫正后的船牌图像和船牌名;本发明选取深度学习模型,在无需添加额外的标注情况下,提高对船牌的识别速度和准确率,具有较高的实际应用价值。

Description

一种自然场景下的船牌矫正识别方法
技术领域
本发明涉及计算机应用技术领域及文本矫正领域,特别是涉及一种自然场景下的船牌矫正方法。
背景技术
近年来,随着科技和陆路交通的发展,车牌自动识别***越来越成熟,然而我国水路交通并未得到很好发展,在旅游业和渔业日益发展的今天,船舶的船牌自动识别技术也越来与重要,它可以广泛的应用到水路的交通管控、交通管理、航道网建设等场景。
然而,自然环境下的船牌识别面临许多困难和挑战,摄像头拍摄的船牌是一个矩形图片,大部分船舶船牌印刷在弯曲的船侧,本身存在一定弯曲,还有船舶经过摄像头监控点时,其位置的不确定性和摄像头也会产生不可避免的角度变化,这导致最终的船牌图像存在不同程度上的扭曲和倾斜,这种不同程度的图像变形会对识别***带来不利影响,容易造成字符误分割,从而导致了识别率的下降。当前,研究者们针对特定牌照图像的矫正研究也提出很多方法,大部分都是基于传统方法,通过检测边缘直线,确定图像倾斜角,用几何变换达到矫正效果,但这种算法受到内存及运算速度的限制,无法达到实时处理的效果,而且在处理船牌这种本身存在一定扭曲的图像上效果也不是很好。
因此,需要一种有效的船牌矫正识别方法,能快速的将扭曲和倾斜的船牌矫正成正常的船牌并识别,这对实现海洋和河道航道智能交通***功能具有重大的理论意义和实现价值。
发明内容
为了克服现有技术的不足,本发明提供一种自然场景下的船牌矫正识别方法。该方法使用文字校正模型,能够解决不规则排列文字的文字识别问题,可以有效矫正船牌,提高船牌矫正的速度和船牌识别率。
本发明解决其技术问题所采用的技术方案如下:
一种自然场景下的船牌矫正识别方法,包括以下步骤:
S1:数据获取:通过摄像头采集港口进出船舶的图片;
S2:数据处理:对原图裁剪获取船牌图片;
S3:模型训练:用文字矫正模型训练船牌矫正,过程如下:
S3-1:将船牌图像I传入,将图像转换成小图Id,然后传入定位网络,回归出一系列坐标点,通过激活函数归一化为[-1,1],确定出20个确定文字区域的基准点C;
S3-2:将船牌图片I与S3-1中生成的20个基准点的坐标输入网格生成网络,通过TPS变换输出另一组基准点C′,并生成输出坐标;
S3-3:通过采样器进行双线性插值并将超出图的部分直接删掉,得到修正后的输出图像I′;
S3-4:将矫正后的船牌图像I′输入识别网络,识别网络主要分为编码层和解码层,图像输入后先通过编码层提取文字特征,再通过解码层得到正向船牌识别结果和反向船牌识别结果;
S4:模型检测:用训练好的船牌矫正模型对船牌进行矫正并得到船牌名;
优选地,所述步骤S1中,利用港口摄像头拍摄来往船舶视频,每隔0.5秒取帧并保存为JPEG格式。
进一步,所述步骤S2中,将包含船牌的JPEG图片通过人工用软件Labelimg手动标定船牌边框,标签类别标成船牌名,然后生成xml文件。将船牌从原图中切割,将船牌转换成64*200大小并保存,然后制作船牌编码表文件,最后以8:2的比例分别在train.txt文件和eval.txt文件中保存对应文件名和船牌名。
再进一步,所述步骤S3-1中,定位网络包括8层卷积层、7个最大池化层、2个全连接层。
所述步骤S3-2中,TPS变换:
Figure BDA0002576851640000021
Figure BDA0002576851640000022
Figure BDA0002576851640000023
Figure BDA0002576851640000024
其中di,k表示p′i和C′k的欧氏距离,
Figure BDA0002576851640000025
为常量,K=20。
P={pi},i=1,2,…,N表示输入图像,P′={p′i},i=1,2,…,N表示网格生成网络中对应原图生成的网格坐标信息,其中pi跟p′i表示每一个像素点的坐标,N为图像的像素点个数。
所述步骤S3-4中,编码层由卷积层和双向LSTM模块构成,解码层由注意力机制模块和LSTM模块构成,图片通过卷积层提取文字特征,再经过双向LSTM模块编码得到特征序列图,然后通过注意力机制模块提取到具体每个船牌文字所在位置信息,并通过双向LSTM模块进行解码分别得到正向船牌识别结果和反向船牌识别结果。
所述步骤S4中,将船牌图片转换成64*200大小,传入训练好的船牌矫正识别模型,得到矫正后的船牌图像和船牌名对应的编码,经过正反向船牌识别置信度判断,选取置信度较高的识别结果,通过编码表文件进行解码,得到最后的船牌名。
本发明的有益效果为:由于自然场景下船牌扭曲、倾斜程度不同,用传统方法很难对所有船牌图像进行很好的矫正。本发明选取深度学习模型对船牌矫正并识别,节省成本与空间,相比于传统手动提取图像特征与简单利用神经网络的方法,本发明选取不同类型、不同大小等各种不同特征的船牌图像训练船牌矫正识别模型,节省了矫正时间并且提高了船牌识别准确率。
附图说明
图1为本发明实施例的自然场景下的船牌矫正识别方法的流程图;
图2为本发明实施例的船牌矫正模型流程图;
图3为本发明实施例的矫正结果示例图。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细的描述。
参照图1~图3,一种自然场景下的船牌矫正识别方法,包括以下步骤:
S1:数据获取:通过摄像头采集港口进出船舶的图片;
S2:数据处理:对原图裁剪获取船牌图片;
S3:模型训练:用文字矫正模型训练船牌矫正识别;
S4:模型检测:用训练好的船牌矫正模型对船牌进行矫正识别并得到船牌名;
优选地,所述步骤S1中,利用港口摄像头拍摄来往船舶视频,每隔0.5秒取帧并保存为JPEG格式。
所述步骤S2包括以下步骤:
S2-1:去除不含船牌的图片,将包含船牌的JPEG图片通过人工用软件Labelimg手动标定船牌边框,4个顶点的坐标记为(x1,y1),(x2,y2),(x3,y3),(x4,y4),标签类别标成船牌名,生成xml文件;
S2-2:编写图像切割程序,通过图像和xml文件将船牌从原图中切出,并转换成64*200大小并保存;
S2-3:将船牌图片中出现的所有文字进行编码,得到编码表文件dict.json,每个文字对应一个数字(只有编码后的中文才能传入模型训练);
S2-4:编写程序将全部船牌顺序打乱,将80%的船牌作为训练集,20%的作为验证集,然后将对应文件名和船牌名分别保存在train.txt文件和eval.txt文件中。
所述步骤S3对应图2包括以下步骤:
S3-1:将船牌图像I传入,将图像转换成小图Id(减少网络参数,降低计算量),然后传入定位网络,回归出一系列坐标点,通过激活函数tanh归一化为[-1,1],确定出20个确定文字区域的基准点C,定位网络包括8层卷积层、7个最大池化层、2个全连接层;
S3-2:将船牌图片I与S3-1中生成的20个基准点的坐标输入网格生成网络,通过TPS变换输出另一组基准点C′,并生成输出坐标;
TPS变换:
Figure BDA0002576851640000041
Figure BDA0002576851640000042
Figure BDA0002576851640000043
Figure BDA0002576851640000044
其中di,k表示p′i和C′k的欧氏距离,
Figure BDA0002576851640000045
为常量,K=20;
P={pi},i=1,2,…,N表示输入图像,P′={p′i},i=1,2,…,N表示网格生成网络中对应原图生成的网格坐标信息,其中pi跟p′i表示每一个像素点的坐标,N为图像的像素点个数;
S3-3:通过采样器进行双线性插值并将超出图的部分直接删掉,得到修正后的输出图像I′,I′=V(P,I);
S3-4:将矫正后的船牌图像I′输入识别网络,识别网络主要分为编码层和解码层,编码层由卷积层和双向LSTM模块构成,解码层由注意力机制模块和LSTM模块构成,图像输入后先通过卷积层提取文字特征,再经过双向LSTM模块编码得到特征序列图,然后通过注意力机制模块提取到具体每个船牌文字所在位置信息,并通过双向LSTM模块进行解码分别得到正向船牌识别结果和反向船牌识别结果;
所述步骤S4中,将船牌图片转换成64*200大小,传入训练好的船牌矫正识别模型,得到矫正后的船牌图像和船牌名对应的编码,经过正反向船牌识别置信度判断,选取置信度较高的识别结果,通过编码表文件dict.json进行解码,得到最后的船牌名。
如上所述为本发明自然场景下的船牌矫正识别方法的实施例介绍,本发明通过标注不同程度扭曲和倾斜的船牌图片制作训练数据,训练得到船牌矫正识别模型,并使用模型矫正扭曲和倾斜的船牌,并识别出具体船牌名。本发明相比于传统手动提取特征的方法和简单的神经网络方法,具有检测速度快和准确率高的优势。
以上所述,仅为本发明专利较佳的实施例,对本发明而言仅仅是说明性,而非限制性,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。

Claims (6)

1.一种自然场景下的船牌矫正识别方法,其特征在于,所述方法包括以下步骤:
S1:数据获取:通过摄像头采集港口进出船舶的图片;
S2:数据处理:对原图裁剪获取船牌图片;
S3:模型训练:用文字矫正模型训练船牌矫正识别,过程如下:
S3-1:将船牌图像I传入,将图像转换成小图Id,然后传入定位网络,回归出一系列坐标点,通过激活函数归一化为[-1,1],确定出20个确定文字区域的基准点C;
S3-2:将船牌图片I与S3-1中生成的20个基准点的坐标输入网格生成网络,通过TPS变换输出另一组基准点C′,并生成输出坐标;
S3-3:通过采样器进行双线性插值并将超出图的部分直接删掉,得到修正后的输出图像I′;
S3-4:将矫正后的船牌图像I′输入识别网络,识别网络主要分为编码层和解码层,图像输入后先通过编码层提取文字特征,再通过解码层得到正向船牌识别结果和反向船牌识别结果;
S4:模型检测:用训练好的船牌矫正模型对船牌进行矫正识别并得到船牌名;
2.如权利要求1所述的一种自然场景下的船牌矫正识别方法,其特征在于,所述步骤S2包括以下步骤:
S2-1:去除不含船牌的图片,对包含船牌的图片中的船牌边框四个顶点进行标定,四个顶点的坐标记为(x1,y1),(x2,y2),(x3,y3),(x4,y4),标签类别标成船牌名,生成xml文件;
S2-2:编写图像切割程序,通过图像和xml文件将船牌切割,并转换成64*200大小并保存;
S2-3:将船牌图片中出现的所有文字进行编码,得到编码文件;
S2-4:编写程序将全部船牌顺序打乱,将一部分的船牌作为训练集,余下的的作为验证集,然后将对应文件名和船牌名分别保存在train.txt文件和eval.txt文件中。
3.如权利要求1或2所述的一种自然场景下的船牌矫正识别方法,其特征在于,所述步骤S3-1中,定位网络包括8层卷积层、7个最大池化层、2个全连接层。
4.如权利要求1或2所述的一种自然场景下的船牌矫正识别方法,其特征在于,所述步骤S3-2中,TPS变换:
Figure FDA0002576851630000021
Figure FDA0002576851630000022
Figure FDA0002576851630000023
Figure FDA0002576851630000024
其中di,k表示p′i和C′k的欧氏距离,
Figure FDA0002576851630000025
为常量,K=20。
P={pi},i=1,2,…,N表示输入图像,P′={p′i},i=1,2,…,N表示网格生成网络中对应原图生成的网格坐标信息,其中pi跟p′i表示每一个像素点的坐标,N为图像的像素点个数。
5.如权利要求1或2所述的一种自然场景下的船牌矫正识别方法,其特征在于,所述步骤S3-4中,编码层由卷积层和双向LSTM模块构成,解码层由注意力机制模块和LSTM模块构成,图片通过卷积层提取文字特征,再经过双向LSTM模块编码得到特征序列图,然后通过注意力机制模块提取到具体每个船牌文字所在位置信息,并通过双向LSTM模块进行解码分别得到正向船牌识别结果和反向船牌识别结果。
6.如权利要求1或2所述的一种自然场景下的船牌矫正识别方法,其特征在于,所述步骤S4中,将船牌图片转换成64*200大小,传入训练好的船牌矫正识别模型,得到矫正后的船牌图像和船牌名对应的编码,经过正反向船牌识别置信度判断,选取置信度较高的识别结果,通过编码表文件进行解码,得到最后的船牌名。
CN202010656239.XA 2020-07-09 2020-07-09 一种自然场景下的船牌矫正识别方法 Active CN111985470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010656239.XA CN111985470B (zh) 2020-07-09 2020-07-09 一种自然场景下的船牌矫正识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010656239.XA CN111985470B (zh) 2020-07-09 2020-07-09 一种自然场景下的船牌矫正识别方法

Publications (2)

Publication Number Publication Date
CN111985470A true CN111985470A (zh) 2020-11-24
CN111985470B CN111985470B (zh) 2024-06-21

Family

ID=73438577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010656239.XA Active CN111985470B (zh) 2020-07-09 2020-07-09 一种自然场景下的船牌矫正识别方法

Country Status (1)

Country Link
CN (1) CN111985470B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633277A (zh) * 2020-12-30 2021-04-09 杭州电子科技大学 基于深度学习的航道船牌检测、定位及识别方法
CN113546398A (zh) * 2021-07-30 2021-10-26 重庆五诶科技有限公司 基于人工智能算法的棋牌游戏方法及***
CN114049627A (zh) * 2022-01-11 2022-02-15 浙江华是科技股份有限公司 可智能选择缩放尺度的船牌检测方法、装置及***
CN114283431A (zh) * 2022-03-04 2022-04-05 南京安元科技有限公司 一种基于可微分二值化的文本检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145200A (zh) * 2007-10-26 2008-03-19 浙江工业大学 多视觉传感器信息融合的内河船舶自动识别***
CN107491752A (zh) * 2017-08-14 2017-12-19 中国石油大学(华东) 一种基于深度学习的自然场景中船牌文字识别方法、装置
CN110245613A (zh) * 2019-06-17 2019-09-17 珠海华园信息技术有限公司 基于深度学习特征对比的船牌识别方法
CN110598693A (zh) * 2019-08-12 2019-12-20 浙江工业大学 一种基于Faster-RCNN的船牌识别方法
US20200167601A1 (en) * 2017-12-11 2020-05-28 Zhuhai Da Hengqin Technology Development Co., Ltd. Ship detection method and system based on multidimensional scene features
CN111291684A (zh) * 2020-02-10 2020-06-16 浙江工业大学 一种自然场景下的船牌检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145200A (zh) * 2007-10-26 2008-03-19 浙江工业大学 多视觉传感器信息融合的内河船舶自动识别***
CN107491752A (zh) * 2017-08-14 2017-12-19 中国石油大学(华东) 一种基于深度学习的自然场景中船牌文字识别方法、装置
US20200167601A1 (en) * 2017-12-11 2020-05-28 Zhuhai Da Hengqin Technology Development Co., Ltd. Ship detection method and system based on multidimensional scene features
CN110245613A (zh) * 2019-06-17 2019-09-17 珠海华园信息技术有限公司 基于深度学习特征对比的船牌识别方法
CN110598693A (zh) * 2019-08-12 2019-12-20 浙江工业大学 一种基于Faster-RCNN的船牌识别方法
CN111291684A (zh) * 2020-02-10 2020-06-16 浙江工业大学 一种自然场景下的船牌检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
古辉;王益义;: "船牌识别***中的变形校正方法研究", 现代电子技术, no. 10, 15 May 2009 (2009-05-15) *
吴书楷;刘宝龙;徐舒畅;李毅;吴双卿;张三元;叶修梓;: "结合深度特征迁移与融合的两阶段船牌定位算法", 计算机辅助设计与图形学学报, no. 04, 17 February 2020 (2020-02-17) *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633277A (zh) * 2020-12-30 2021-04-09 杭州电子科技大学 基于深度学习的航道船牌检测、定位及识别方法
CN112633277B (zh) * 2020-12-30 2024-04-05 杭州电子科技大学 基于深度学习的航道船牌检测、定位及识别方法
CN113546398A (zh) * 2021-07-30 2021-10-26 重庆五诶科技有限公司 基于人工智能算法的棋牌游戏方法及***
CN114049627A (zh) * 2022-01-11 2022-02-15 浙江华是科技股份有限公司 可智能选择缩放尺度的船牌检测方法、装置及***
CN114049627B (zh) * 2022-01-11 2022-04-08 浙江华是科技股份有限公司 可智能选择缩放尺度的船牌检测方法、装置及***
CN114283431A (zh) * 2022-03-04 2022-04-05 南京安元科技有限公司 一种基于可微分二值化的文本检测方法

Also Published As

Publication number Publication date
CN111985470B (zh) 2024-06-21

Similar Documents

Publication Publication Date Title
CN111985470B (zh) 一种自然场景下的船牌矫正识别方法
CN111160352B (zh) 一种基于图像分割的工件金属表面文字识别方法及***
CN111160343B (zh) 一种基于Self-Attention的离线数学公式符号识别方法
CN110689012A (zh) 一种端到端的自然场景文本识别方法及***
CN112633277A (zh) 基于深度学习的航道船牌检测、定位及识别方法
CN110516554A (zh) 一种多场景多字体中文文字检测识别方法
CN114155527A (zh) 一种场景文本识别方法和装置
CN113221874A (zh) 基于Gabor卷积和线性稀疏注意力的文字识别***
CN112381057A (zh) 手写文字识别方法及装置、存储介质、终端
CN112036292A (zh) 基于神经网络的文字识别方法、装置及可读存储介质
CN111008979A (zh) 一种鲁棒的夜晚图像语义分割方法
CN113435436A (zh) 一种基于线性约束矫正网络的场景文字识别方法
CN111736731A (zh) 一种手写笔迹获取方法及***
CN114581905A (zh) 一种基于语义增强机制的场景文本识别方法及***
He Research on text detection and recognition based on OCR recognition technology
CN113505808B (zh) 基于深度学习用于配电类设施开关检测识别算法
CN113535999B (zh) 一种基于深度学习的多样化图像描述语句生成技术
CN112116074B (zh) 一种基于二维空间编码的图像描述方法
CN112036290B (zh) 一种基于类标编码表示的复杂场景文字识别方法及***
CN114694133B (zh) 一种基于图像处理与深度学习相结合的文本识别方法
CN116704518A (zh) 一种文本识别方法及装置、电子设备、存储介质
CN106648171B (zh) 一种基于书写笔的交互***及方法
CN115909378A (zh) 单据文本检测模型的训练方法及单据文本检测方法
CN110956174A (zh) 一种器件编号的识别方法
CN116259050B (zh) 灌装桶标签文字定位识别方法、装置、设备及检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant