CN108399405B - 营业执照识别方法和装置 - Google Patents
营业执照识别方法和装置 Download PDFInfo
- Publication number
- CN108399405B CN108399405B CN201710067058.1A CN201710067058A CN108399405B CN 108399405 B CN108399405 B CN 108399405B CN 201710067058 A CN201710067058 A CN 201710067058A CN 108399405 B CN108399405 B CN 108399405B
- Authority
- CN
- China
- Prior art keywords
- text
- text line
- business license
- recognition
- key information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本发明涉及一种营业执照识别方法和装置。所述方法包括:获取包含营业执照完整信息的图片;从所述图片中提取所述营业执照的文本候选区域;从所述文本候选区域筛选得到文本关键信息区域;对所述文本关键信息区域进行光学字符识别得到识别结果;对所述识别结果进行语义修复得到修正后的识别结果。上述营业执照识别方法和装置,通过获取包含营业执照完整信息的图片,从图片中提取文本候选区域,再从文本候选区域中筛选出文本关键信息区域,对文本关键信息区域进行光学字符识别得到识别结果,对识别结果进行修复得到修正后的识别结果,只需获取营业执照完整图片,不需要多次操作,简化了操作,节省了时间,且识别结果更加准确。
Description
技术领域
本发明涉及数据处理领域,特别是涉及一种营业执照识别方法和装置。
背景技术
营业执照是工商行政管理机关发给工商企业、个体经营者的准许从事某项生产经营活动的凭证。在某些场景下需要对营业执照里面的关键信息进行识别,例如统一社会信用代码、公司名称和二维码等。
传统的识别营业执照的方法是通过移动终端中的拍摄框分别扫描营业执照中的统一社会信用代码区域、公司名称区域、二维码区域等识别里面的信息,需要多次扫描不同的区域,操作繁琐,耗时长。
发明内容
基于此,有必要针对传统的营业执照识别操作繁琐,耗时长的问题,提供一种营业执照识别方法和装置,能简化操作,节省时间。
一种营业执照识别方法,包括:
获取包含营业执照完整信息的图片;
从所述图片中提取所述营业执照的文本候选区域;
从所述文本候选区域筛选得到文本关键信息区域;
对所述文本关键信息区域进行光学字符识别得到识别结果;
对所述识别结果进行语义修复得到修正后的识别结果。
一种营业执照识别装置,包括:
图片获取模块,用于获取包含营业执照完整信息的图片;
文本提取模块,用于从所述图片中提取所述营业执照的文本候选区域;
关键信息区域获取模块,用于从所述文本候选区域筛选得到文本关键信息区域;
文本识别模块,用于对所述文本关键信息区域进行光学字符识别得到识别结果;
修正模块,用于对所述识别结果进行语义修复得到修正后的识别结果。
上述营业执照识别方法和装置,通过获取包含营业执照完整信息的图片,从图片中提取文本候选区域,再从文本候选区域中筛选出文本关键信息区域,对文本关键信息区域进行光学字符识别得到识别结果,对识别结果进行修复得到修正后的识别结果,只需获取营业执照完整图片,不需要多次操作,即可实现对营业执照进行识别,简化了操作,节省了时间,且识别结果更加准确。
附图说明
图1为一个实施例中营业执照识别方法的应用环境示意图;
图2为一个实施例中服务器的内部结构示意图;
图3为一个实施例中营业执照识别方法的流程图;
图4为一个实施例中营业执照图片识别出的文本区域示意图;
图5为一个实施例中营业执照图片识别出的文本候选区域示意图;
图6为图5的文本候区域筛选得到的文本关键信息区域示意图;
图7为一个实施例中对所述文本关键信息区域进行光学字符识别得到识别结果的具体流程图;
图8为一个实施例中过切分的示意图;
图9为一个实施例中识别“中”字符的示意图;
图10为一个实施例中营业执照识别装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中营业执照识别方法的应用环境示意图。如图1所示,该应用环境包括终端110和服务器120。终端110与服务器120通过网络进行数据通信。终端110获取营业执照图片,将营业执照图片上传到服务器120。服务器120对营业执照图片提取文本候选区域,并筛选得到文本关键信息区域,对关键信息区域进行光学字符识别得到识别结果,对识别结果进行语义修复得到修正后的识别结果。终端110可为智能手机、个人计算机、平板电脑等。终端110可自带图像采集装置采集营业执照图片,也可接收其他设备传输的营业执照图片。
图2为一个实施例中服务器(或云端等)的内部结构示意图。如图2所示,该服务器包括通过***总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中,该服务器的非易失性存储介质存储有操作***、数据库和营业执照识别装置,数据库中存储有营业执照模版、光学字符识别模型等,该营业执照识别装置用于实现适用于服务器的一种营业执照识别方法。该服务器的处理器用于提供计算和控制能力,支撑整个服务器的运行。该服务器的内存储器为非易失性存储介质中的营业执照识别装置的运行提供环境,该内存储器中可储存有计算机可读指令,该计算机可读指令被所述处理器执行时,可使得所述处理器执行一种营业执照识别方法。该服务器的网络接口用于据以与外部的终端通过网络连接通信,比如接收终端发送的营业执照识别请求以及向终端返回识别结果等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
图3为一个实施例中营业执照识别方法的流程图。如图3所示,一种营业执照识别方法,运行于图1和图2中的服务器上,包括:
步骤302,获取包含营业执照完整信息的图片。
具体地,可通过摄像头等设备拍摄营业执照,获取营业执照图片,图片格式可为BMP(Bitmap,位图)、JPG(Joint Photographic Experts GROUP)、TIFF(Tag Image FileFormat,标签图像文件格式)、GIF(Graphics Interchange Format,图像交换格式)、PCX(PCPaintbrush Exchange,图像软件格式)、TGA(Tagged Graphics,图像显卡文件格式)、EXIF(Exchangeable Image File,可交换图像文件)等。服务器获取终端上传的包含营业执照完整信息的图片。
步骤304,从所述图片中提取所述营业执照的文本候选区域。
本实施例中,可对图片进行梯度、二值化、图形学操作处理得到营业执照的文本候选区域。对图片进行梯度处理是将图片看成二维离散函数,图片梯度是对这个二维离散函数求导。图片梯度计算公式可采用如下公式:
G(x,y)=dx(i,j)+dy(i,j)
dx(i,j)=I(i+1,j)-I(i,j)
dy(i,j)=I(i,j+1)-I(i,j)
其中,I是图片像素的值,(i,j)为像素的坐标。
对图片进行二值化处理是指将图片上的像素点的灰度值设置为0或255。
对图片进行图形学操作是指使用数学算法将二维或三维图形转化为计算机显示器的栅格形式。
可采用开源库opencv对图片进行梯度、二值化、图形学操作处理得到营业执照的文本候选区域。文本候选区域是指包含营业执照中包含文本信息的各个区域。
图4为一个实施例中营业执照图片识别出的文本区域示意图。如图4所示,对营业执照图片进行梯度、二值化、图形学操作处理得到营业执照的文本候选区域,图中白色部分。
步骤306,从所述文本候选区域筛选得到文本关键信息区域。
本实施例中,对文本候选区域可采用文本行的特性进行筛选或通过预设营业执照模版进行匹配得到文本关键信息区域。文本关键信息区域是指营业执照的统一社会信用代码区域、公司名称区域、二维码区域、有效期区域、经济范围区域、住所区域等。
图5为一个实施例中营业执照图片识别出的文本候选区域示意图。如图5所示,从营业执照图片中识别出的文本候选区域可包括营业执照文本行、副本、统一社会信用代码、11110105797556850G、名称、abc有限公司北京分公司、类型、分公司、住所、北京市朝阳区XXX大厦XXX层、法定代表人、XXX、注册资本、成立日期、2006年12月30日、营业期限、2006年12月30日、至2035年09月01日、经营范围、从事鞋类、服装、运动配饰、运动设备等运动产品及相关产、品的零售业务、批发业务、进出口业务及其他相关配套业务、登记机关、2016年01月14日、企业信用信息公示***网址、http://abc.gov.cn、公司二维码图像等。
图6为图5的文本候区域筛选得到的文本关键信息区域示意图。如图6所示,文本关键信息区域可包括91110105797556857G、耐克体育(中国)有限公司北京分公司、北京市朝阳区XXX大厦XXX层、2006年12月30日、2006年12月30日、至2035年09月01日、经营范围、从事鞋类、服装、运动配饰、运动设备等运动产品及相关产、品的零售业务、批发业务、进出口业务及其他相关配套业务、2016年01月14日、公司二维码图像等。
步骤308,对所述文本关键信息区域进行光学字符识别得到识别结果。
本实施例中,对文本关键信息区域进行OCR(Optical Character Recognition,光学字符识别)识别得到识别结果。
步骤310,对所述识别结果进行语义修复得到修正后的识别结果。
本实施例中,识别结果可能存在数字识别错误或文字识别错误,对识别结果进行号码和/或文字的修复得到修正后的识别结果,提高了识别的准确性。
本实施例中营业执照识别方法,通过获取包含营业执照完整信息的图片,从图片中提取文本候选区域,再从文本候选区域中筛选出文本关键信息区域,对文本关键信息区域进行光学字符识别得到识别结果,对识别结果进行修复得到修正后的识别结果,只需获取营业执照完整图片,不需要多次操作,即可实现对营业执照进行识别,简化了操作,节省了时间,且识别结果更加准确。
在一个实施例中,从所述文本候选区域筛选得到文本关键信息区域,包括:获取基准文本行的位置,采用文本行的特性和所述基准文本行的位置从所述文本候选区域得到文本关键信息区域,所述文本行的特性包括长度、宽度和位置。
具体地,基准文本行是指营业执照中的位置固定的文本行。基准文本行可包括“名称”、“类型”、“住所”、“法定代表人”、“注册资本”、“成立日期”、“营业期限”、“经营范围”、“统一社会信用代码”等。
根据文本行的特性和基准文本行从文本候选区域得到文本关键信息区域可包括:通过文本行的长度和宽度比判定包含的字符个数,根据字符个数结合基准文本行的位置得到文本关键信息区域。
具体地,公司名称至少2个字,住所至少7个字,统一社会信用代码为15位或18位。基准文本行位置的临近位置的文本行即为文本关键信息区域。
在一个实施例中,所述从所述文本候选区域筛选得到文本关键信息区域,包括:将所述文本候选区域与预设的营业执照模版进行匹配,得到文本关键信息区域。
本实施例中,预先配置营业执照模版,营业执照模版中包括营业执照各个文本区域及文本行所在的位置等。将文本候选区域与预设的营业执照模版中文本区域进行逐一匹配,利用营业执照中各个文本行所在的位置可以得到文本关键信息区域。
在一个实施例中,在步骤306之后,上述营业执照识别方法还包括:对所所述文本关键信息区域进行预处理得到预处理后的文本关键信息区域。预处理可包括旋转矫正、去纹理、去光照等操作。
具体地,旋转矫正是指在定位出文本行后计算出文本行与水平的夹角,通过夹角调整文本行的旋转角度。旋转矫正过程包括:读取文本行的灰度图像,将灰度图像进行尺寸变换,进行频域中心移动,检测出图像中直线的倾斜角即可对旋转文本进行矫正。可采用霍夫变换线检测方法进行直线倾斜角的计算,首先将傅里叶变换后的频谱图进行固定二值化处理,这里阈值的选择和场景有很大关系,要根据实际应用场景进行合理调整,然后根据霍夫变换检测直线的步骤来完成图像中的直线检测。
去纹理可去掉需要消除的图案。去光照是指去除图像中光照的影响。
旋转矫正、去纹理和去光照可采用opencv库进行操作。Opencv去光照是指对文本行进行光照归一化处理,调节整体的灰度值。opencv库去纹理可采用opencv提取文本行图像中的纹理特征进行去除处理。
在一个实施例中,如图7所示,所述对所述文本关键信息区域进行光学字符识别得到识别结果,包括:
步骤702,对所述文本关键信息区域的文本行进行过切分,得到所述文本行中各个单字符。
本实施例中,可利用灰度投影对文本行进行过切分,得到文本行中各个单字符。灰度投影是指将一幅图片从二维压到一维,将每个水平位置上所有的像素的灰度值相加形成一条表示每个水平位置上字的高度的向量,向量表示的灰度值大于灰度阈值则为一个单字符。灰度阈值可根据需要设定,例如可采用灰度投影后每个水平位置上的像素的灰度值的平均值。
如图8所示,耐克体育(中国)有限公司北京分公司被划分为单个字符,如|耐|克|体|育||(|中|国|)||有|限|公|司|北|京|分|公|司。
步骤704,将所述文本行中各个单字符进行光学字符识别得到所述单字符的识别结果及对应的置信度。
本实施例中,将文本行中各个单字符输入到光学字符识别模型中可以识别并输出前10个识别结果及对应的置信度。对于清晰完整的字置信度较高,切分不完整的则置信度低。
一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度。
每个单字符的识别结果是一个概率值的向量,向量中每一个数表示分到对应类别的概率。置信度可以采用概率次大的类与概率最大的类的概率的比值进行计算,计算公式如下:
置信度=1-P2/P1,其中,P1为概率最大的类的概率,P2该概率次大的类的概率。
图9为一个实施例中识别“中”字符的示意图。如图9所示,中识别得到“中”的概率为0.971,“申”的概率为0.025,“串”的概率为0.002……。
步骤706,将各个单字符的识别结果按照在所述文本行中所处的位置组成字符串,得到所述文本行的初始识别结果,以及获取所述文本行中单字符的识别结果对应的最小置信度,将所述最小置信度作为所述文本行的置信度。
本实施例中,文本行中每个字符对应有置信度,筛选得到最小置信度,将最小置信度作为文本行的置信度。
步骤708,若所述文本行的置信度大于置信度阈值,则所述文本行的初始识别结果作为所述文本行的识别结果。
本实施例汇总,当文本行的置信度小于置信度阈值,则表示文本行的识别结果有错误,需要人工校验。
本实施例中通过对文本行进行切分得到每个单字符,对单字符进行光学字符识别,实现自动识别,识别效率高。
在一个实施例中,所述对所述文本关键信息区域进行光学字符识别得到识别结果,包括:采用时间递归神经网络模型对所述文本关键信息区域中文本行进行不切分的光学字符识别得到所述文本行的识别结果。
本实施例中,时间递归神经网络模型(Long Short-Term Memory,LSTM)是RNN(Recurrent Neural Networks,循环神经网络)特殊的类型,可以学习长期依赖信息。LSTM的一个Cell由三个Gate(input、forget、output)和一个cell单元组成。Gate使用一个sigmoid激活函数,input和cell state通常会使用tanh来转换。采用LSTM对文本行进行光学字符识别得到一个文本行的识别结果。
在一个实施例中,所述对所述识别结果进行语义修复得到修正后的识别结果,包括:对所述识别结果中的号码进行校验,以及对所述识别结果中的文字进行纠正,得到修正后的识别结果。
本实施例中,对识别结果中的号码进行校验,可判断识别结果中的号码是否符合预设的规则,若符合,则保留,若不符合,则从候选识别结果中筛选。预设的规则可为将号码中的数字和字母进行计算,判断计算结果是否与最后一位数相同,若是,则校验通过,若否,则校验失败。号码可包括统一社会信用代码或营业执照的执照编号等。
对识别结果中的文字进行纠正可采用统计规律与字符间的相似度等对名词和短语进行矫正。
统计规律是指在收集的公司名称库里对各个短语进行出现概率统计,将小于一个阈值的非常低概率的词替换为最相似的高概率的词。文字短语的相似度首先需要字数相同,再按照字符相似度取平均值计算。字符相似度可采用预设的相似度表得到。相似度表中记载了各个字符间相似度值。
图10为一个实施例中营业执照识别装置的结构框图。如图10所示,一种营业执照识别装置,包括图片获取模块1002、文本提取模块1004、关键信息区域获取模块1006、文本识别模块1008和修正模块1010。其中:
图片获取模块1002用于获取包含营业执照完整信息的图片。
文本提取模块1004用于从所述图片中提取所述营业执照的文本候选区域。
本实施例中,可对图片进行梯度、二值化、图形学操作处理得到营业执照的文本候选区域。可采用开源库opencv对图片进行梯度、二值化、图形学操作处理得到营业执照的文本候选区域。文本候选区域是指包含营业执照中包含文本信息的各个区域。
关键信息区域获取模块1006用于从所述文本候选区域筛选得到文本关键信息区域。
本实施例中,对文本候选区域可采用文本行的特性进行筛选或通过预设营业执照模版进行匹配得到文本关键信息区域。文本关键信息区域是指营业执照的统一社会信用代码区域、公司名称区域、二维码区域、有效期区域、经济范围区域、住所区域等。
文本识别模块1008用于对所述文本关键信息区域进行光学字符识别得到识别结果。
本实施例中,对文本关键信息区域进行OCR识别得到识别结果。
修正模块1010用于对所述识别结果进行语义修复得到修正后的识别结果。
本实施例中,识别结果可能存在数字识别错误或文字识别错误,对识别结果进行号码和/或文字的修复得到修正后的识别结果,提高了识别的准确性。
本实施例中营业执照识别装置,通过获取包含营业执照完整信息的图片,从图片中提取文本候选区域,再从文本候选区域中筛选出文本关键信息区域,对文本关键信息区域进行光学字符识别得到识别结果,对识别结果进行修复得到修正后的识别结果,只需获取营业执照完整图片,不需要多次操作,即可实现对营业执照进行识别,简化了操作,节省了时间,且识别结果更加准确。
在一个实施例中,文本提取模块1004还用于对所述图片进行梯度、二值化和图形学操作处理得到所述营业执照的文本候选区域。
在一个实施例中,关键信息区域获取模块1006还用于获取基准文本行,采用文本行的特性和所述基准文本行从所述文本候选区域得到文本关键信息区域,所述文本行的特性包括长度、宽度和位置。
具体地,基准文本行是指营业执照中的位置固定的文本行。基准文本行可包括“名称”、“类型”、“住所”、“法定代表人”、“注册资本”、“成立日期”、“营业期限”、“经营范围”、“统一社会信用代码”等。
通过文本行的长度和宽度比判定包含的字符个数,根据字符个数结合基准文本行的位置得到文本关键信息区域。
在一个实施例中,关键信息区域获取模块1006还用于将所述文本候选区域与预设的营业执照模版进行匹配,得到文本关键信息区域。
本实施例中,预先配置营业执照模版,营业执照模版中包括营业执照各个文本区域及文本行所在的位置等。将文本候选区域与预设的营业执照模版中文本区域进行逐一匹配,利用营业执照中各个文本行所在的位置可以得到文本关键信息区域。
在一个实施例中,文本识别模块1008还用于对所述文本关键信息区域的文本行进行过切分,得到所述文本行中各个单字符;将所述文本行中各个单字符进行光学字符识别得到所述单字符的识别结果及对应的置信度;将各个单字符的识别结果按照在所述文本行中所处的位置组成字符串,得到所述文本行的初始识别结果,以及获取所述文本行中单字符的识别结果对应的最小置信度,将所述最小置信度作为所述文本行的置信度;若所述文本行的置信度大于置信度阈值,则所述文本行的初始识别结果作为所述文本行的识别结果。
本实施例中,可利用灰度投影对文本行进行过切分,得到文本行中各个单字符。灰度投影是指将一幅图片从二维压到一维,将每个水平位置上所有的像素的灰度值相加形成一条表示每个水平位置上字的高度的向量,向量表示的灰度值大于灰度阈值则为一个单字符。灰度阈值可根据需要设定,例如可采用灰度投影后每个水平位置上的像素的灰度值的平均值。每个单字符的识别结果是一个概率值的向量,向量中每一个数表示分到对应类别的概率。置信度可以采用概率次大的类与概率最大的类的概率的比值进行计算。
在一个实施例中,文本识别模块1008还用于采用时间递归神经网络模型对所述文本关键信息区域中文本行进行不切分的光学字符识别得到所述文本行的识别结果。
在一个实施例中,所述修正模块1010还用于对所述识别结果中的统一社会信用代码进行校验,以及对所述识别结果中的文字进行纠正,得到修正后的识别结果。
本实施例中,对识别结果中的号码进行校验,可判断识别结果中的号码是否符合预设的规则,若符合,则保留,若不符合,则从候选识别结果中筛选。预设的规则可为将号码中的数字和字母进行计算,判断计算结果是否与最后一位数相同,若是,则校验通过,若否,则校验失败。号码可包括统一社会信用代码或营业执照的执照编号等。
对识别结果中的文字进行纠正可采用统计规律与字符间的相似度等对名词和短语进行矫正。
在一个实施例中,上述营业执照识别装置还包括预处理模块。预处理模块用于对所所述文本关键信息区域进行预处理得到预处理后的文本关键信息区域。预处理可包括旋转矫正、去纹理、去光照等操作。
具体地,旋转矫正是指在定位出文本行后计算出文本行与水平的夹角,通过夹角调整文本行的旋转角度。去纹理可去掉需要消除的图案。去光照是指去除图像中光照的影响。旋转矫正、去纹理和去光照可采用opencv库进行操作。Opencv去光照是指对文本行进行光照归一化处理,调节整体的灰度值。opencv库去纹理可采用opencv提取文本行图像中的纹理特征进行去除处理。
文本识别模块1008还用于对预处理后的文本关键信息区域进行光学字符识别得到识别结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种营业执照识别方法,包括:
获取包含营业执照完整信息的图片;
从所述图片中提取所述营业执照的文本候选区域,所述文本候选区域是指所述营业执照中包含文本信息的各个区域;
获取基准文本行,所述基准文本行为所述营业执照中的位置固定的文本行;
通过所述基准文本行的长度和宽度比判定所述基准文本行中包含的字符个数,并根据所述字符个数结合所述基准文本行的位置从所述文本候选区域中筛选得到文本关键信息区域;
对所述文本关键信息区域进行光学字符识别得到识别结果;
对所述识别结果进行语义修复得到修正后的识别结果,所述修正后的识别结果包括所述营业执照中的关键信息。
2.根据权利要求1所述的方法,其特征在于,所述从所述图片中提取所述营业执照的文本候选区域,包括:
对所述图片进行梯度、二值化和图形学操作处理得到所述营业执照的文本候选区域。
3.根据权利要求1所述的方法,其特征在于,所述对所述文本关键信息区域进行光学字符识别得到识别结果,包括:
对所述文本关键信息区域的文本行进行过切分,得到所述文本行中各个单字符;
将所述文本行中各个单字符进行光学字符识别得到所述单字符的识别结果及对应的置信度;
将各个单字符的识别结果按照在所述文本行中所处的位置组成字符串,得到所述文本行的初始识别结果,以及获取所述文本行中单字符的识别结果对应的最小置信度,将所述最小置信度作为所述文本行的置信度;
若所述文本行的置信度大于置信度阈值,则所述文本行的初始识别结果作为所述文本行的识别结果。
4.根据权利要求1所述的方法,其特征在于,所述对所述文本关键信息区域进行光学字符识别得到识别结果,包括:
采用时间递归神经网络模型对所述文本关键信息区域中文本行进行不切分的光学字符识别得到所述文本行的识别结果。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述对所述识别结果进行语义修复得到修正后的识别结果,包括:
对所述识别结果中的号码进行校验,以及对所述识别结果中的文字进行纠正,得到修正后的识别结果,所述修正后的识别结果包括所述营业执照中的关键信息。
6.一种营业执照识别装置,其特征在于,包括:
图片获取模块,用于获取包含营业执照完整信息的图片;
文本提取模块,用于从所述图片中提取所述营业执照的文本候选区域,所述文本候选区域是指所述营业执照中包含文本信息的各个区域;
关键信息区域获取模块,用于获取基准文本行,所述基准文本行为所述营业执照中的位置固定的文本行;通过所述基准文本行的长度和宽度比判定所述基准文本行中包含的字符个数,并根据所述字符个数结合所述基准文本行的位置从所述文本候选区域中筛选得到文本关键信息区域;
文本识别模块,用于对所述文本关键信息区域进行光学字符识别得到识别结果;
修正模块,用于对所述识别结果进行语义修复得到修正后的识别结果,所述修正后的识别结果包括所述营业执照中的关键信息。
7.根据权利要求6所述的装置,其特征在于,所述文本提取模块还用于对所述图片进行梯度、二值化和图形学操作处理得到所述营业执照的文本候选区域。
8.根据权利要求6所述的装置,其特征在于,所述文本识别模块还用于对所述文本关键信息区域的文本行进行过切分,得到所述文本行中各个单字符;将所述文本行中各个单字符进行光学字符识别得到所述单字符的识别结果及对应的置信度;将各个单字符的识别结果按照在所述文本行中所处的位置组成字符串,得到所述文本行的初始识别结果,以及获取所述文本行中单字符的识别结果对应的最小置信度,将所述最小置信度作为所述文本行的置信度;若所述文本行的置信度大于置信度阈值,则所述文本行的初始识别结果作为所述文本行的识别结果。
9.根据权利要求6所述的装置,其特征在于,所述文本识别模块还用于采用时间递归神经网络模型对所述文本关键信息区域中文本行进行不切分的光学字符识别得到所述文本行的识别结果。
10.根据权利要求6至9中任一项所述的装置,其特征在于,所述修正模块还用于对所述识别结果中的号码进行校验,以及对所述识别结果中的文字进行纠正,得到修正后的识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710067058.1A CN108399405B (zh) | 2017-02-07 | 2017-02-07 | 营业执照识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710067058.1A CN108399405B (zh) | 2017-02-07 | 2017-02-07 | 营业执照识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108399405A CN108399405A (zh) | 2018-08-14 |
CN108399405B true CN108399405B (zh) | 2023-06-27 |
Family
ID=63094422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710067058.1A Active CN108399405B (zh) | 2017-02-07 | 2017-02-07 | 营业执照识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108399405B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165647A (zh) * | 2018-08-22 | 2019-01-08 | 北京慕华信息科技有限公司 | 一种图像中文本信息量的计算方法及装置 |
CN109190623B (zh) * | 2018-09-15 | 2020-12-29 | 闽江学院 | 一种识别投影仪品牌和型号的方法 |
CN109460769A (zh) * | 2018-11-16 | 2019-03-12 | 湖南大学 | 一种基于表格字符检测与识别的移动端***与方法 |
CN109815946A (zh) * | 2018-12-03 | 2019-05-28 | 东南大学 | 基于密集连接网络的多线程营业执照定位识别方法 |
CN111274858A (zh) * | 2018-12-04 | 2020-06-12 | 厦门美亚商鼎信息科技有限公司 | 网络交易监管中营业执照识别方法 |
CN109739233B (zh) * | 2018-12-29 | 2022-06-14 | 歌尔光学科技有限公司 | Agv小车定位方法、装置及*** |
CN109784445A (zh) * | 2019-01-15 | 2019-05-21 | 上海通方信息***有限公司 | 一种32位喷码智能识别*** |
CN109961416B (zh) * | 2019-04-02 | 2020-11-10 | 西南交通大学 | 一种基于形态学梯度多尺度融合的营业执照信息提取方法 |
CN110070045A (zh) * | 2019-04-23 | 2019-07-30 | 杭州智趣智能信息技术有限公司 | 一种营业执照的文本识别方法、***及相关组件 |
CN109902768B (zh) * | 2019-04-26 | 2021-06-29 | 上海肇观电子科技有限公司 | 光学字符识别技术的输出结果的处理 |
CN110135431A (zh) * | 2019-05-16 | 2019-08-16 | 深圳市信联征信有限公司 | 营业执照的自动识别方法及*** |
CN110210470B (zh) * | 2019-06-05 | 2023-06-23 | 复旦大学 | 商品信息图像识别*** |
CN110852713A (zh) * | 2019-11-06 | 2020-02-28 | 兰州领新网络信息科技有限公司 | 一种统一信用代码证识别***和算法 |
CN112101346A (zh) * | 2020-08-27 | 2020-12-18 | 南方医科大学南方医院 | 一种基于目标检测的验证码识别方法及装置 |
CN115984859A (zh) * | 2022-12-14 | 2023-04-18 | 广州市保伦电子有限公司 | 一种图像文字识别的方法、装置及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799879A (zh) * | 2012-07-12 | 2012-11-28 | 中国科学技术大学 | 从自然场景图像中识别多言语、多字体文字的方法 |
CN103020621A (zh) * | 2012-12-25 | 2013-04-03 | 深圳深讯和科技有限公司 | 中英文混排文字图像的切割方法及装置 |
WO2014129018A1 (ja) * | 2013-02-25 | 2014-08-28 | 三菱重工業株式会社 | 文字認識装置、文字認識方法及び記録媒体 |
US9098888B1 (en) * | 2013-12-12 | 2015-08-04 | A9.Com, Inc. | Collaborative text detection and recognition |
CN105046254A (zh) * | 2015-07-17 | 2015-11-11 | 腾讯科技(深圳)有限公司 | 字符识别方法及装置 |
CN106326888A (zh) * | 2016-08-16 | 2017-01-11 | 北京旷视科技有限公司 | 图像识别方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577818B (zh) * | 2012-08-07 | 2018-09-04 | 北京百度网讯科技有限公司 | 一种图像文字识别的方法和装置 |
CN103839058A (zh) * | 2012-11-21 | 2014-06-04 | 方正国际软件(北京)有限公司 | 一种基于标准模版的文档图像的信息定位方法 |
US9405985B1 (en) * | 2015-03-17 | 2016-08-02 | Xerox Corporation | Leveraging character-by-character image classifiers to improve license plate state identification |
JP6599672B2 (ja) * | 2015-07-17 | 2019-10-30 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
-
2017
- 2017-02-07 CN CN201710067058.1A patent/CN108399405B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799879A (zh) * | 2012-07-12 | 2012-11-28 | 中国科学技术大学 | 从自然场景图像中识别多言语、多字体文字的方法 |
CN103020621A (zh) * | 2012-12-25 | 2013-04-03 | 深圳深讯和科技有限公司 | 中英文混排文字图像的切割方法及装置 |
WO2014129018A1 (ja) * | 2013-02-25 | 2014-08-28 | 三菱重工業株式会社 | 文字認識装置、文字認識方法及び記録媒体 |
US9098888B1 (en) * | 2013-12-12 | 2015-08-04 | A9.Com, Inc. | Collaborative text detection and recognition |
CN105046254A (zh) * | 2015-07-17 | 2015-11-11 | 腾讯科技(深圳)有限公司 | 字符识别方法及装置 |
CN106326888A (zh) * | 2016-08-16 | 2017-01-11 | 北京旷视科技有限公司 | 图像识别方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108399405A (zh) | 2018-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108399405B (zh) | 营业执照识别方法和装置 | |
CN109492643B (zh) | 基于ocr的证件识别方法、装置、计算机设备及存储介质 | |
CN111325203B (zh) | 一种基于图像校正的美式车牌识别方法及*** | |
Tian et al. | Multiscale building extraction with refined attention pyramid networks | |
US20160188938A1 (en) | Image identification marker and method | |
CN111639648B (zh) | 证件识别方法、装置、计算设备和存储介质 | |
CN111783757A (zh) | 一种基于ocr技术的复杂场景下身份证识别方法 | |
CN112699775A (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
CN108681735A (zh) | 基于卷积神经网络深度学习模型的光学字符识别方法 | |
CN106203454A (zh) | 证件版式分析的方法及装置 | |
CN112396047B (zh) | 训练样本生成方法、装置、计算机设备和存储介质 | |
CN111611988A (zh) | 图片验证码识别方法及装置、电子设备和计算机可读介质 | |
CN114881698A (zh) | 广告合规审核方法、装置、电子设备及存储介质 | |
CN110942067A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN112668575A (zh) | 关键信息提取方法、装置、电子设备及存储介质 | |
CN115497010A (zh) | 一种基于深度学习的地理信息的识别方法及*** | |
CN110991434A (zh) | 自助终端证件识别方法及装置 | |
CN113657377B (zh) | 一种机打票据图像结构化识别方法 | |
CN116246161A (zh) | 领域知识引导下的遥感图像目标精细类型识别方法及装置 | |
CN115731550A (zh) | 一种基于深度学习的药品说明书自动识别方法、***及存储介质 | |
CN114299509A (zh) | 一种获取信息的方法、装置、设备及介质 | |
Kotwal et al. | Android app for meter reading | |
CN113127863A (zh) | 恶意代码的检测方法、装置、计算机设备和存储介质 | |
CN111414889A (zh) | 基于文字识别的财务报表识别方法及装置 | |
JP2004094427A (ja) | 帳票画像処理装置及び該装置を実現するためのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |