JP6599672B2 - 文字切り出し装置、文字認識装置、および文字切り出し方法 - Google Patents
文字切り出し装置、文字認識装置、および文字切り出し方法Info
- Publication number
- JP6599672B2 JP6599672B2 JP2015142909A JP2015142909A JP6599672B2 JP 6599672 B2 JP6599672 B2 JP 6599672B2 JP 2015142909 A JP2015142909 A JP 2015142909A JP 2015142909 A JP2015142909 A JP 2015142909A JP 6599672 B2 JP6599672 B2 JP 6599672B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- projection
- pixel
- binarization threshold
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/01—Solutions for problems related to non-uniform document background
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
Description
そこで、多値画像を二値化するための二値化しきい値を決定する手法として、たとえば、判別分析法を用いた文字認識装置が提案・発表されている(たとえば、特許文献1参照)。
また、特に、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。
このように、移動平均を二値化しきい値に用いることにより、注目画素近傍の画素の分布(輝度分布)に対する追従性が高められ、その結果、良好な二値化画像を得ることが可能となる。
このように、画像二値化処理は、認識対象とする文字列を含む設定領域について、最小画素曲線を移動平均処理して得られる平均画素曲線を二値化しきい値として用いるようにしたことにより、二値化しきい値の適正化を図れ、注目画素近傍の画素の分布(輝度分布)に対する追従性が高められ、その結果、良好な二値化画像を得ることが可能となる。
これにより、選択した行において、その行の文字が文字並び方向に直交する方向に占める位置を規定することが可能となる。
また、特に、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。その結果、文字認識性能の向上を図ることが可能となる。
また、特に、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。
また、特に、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。
文字認識装置10は、認識対象(切り出し対象)となる2文字以上の複数文字を囲む暫定切り出し領域、たとえば矩形領域を設定し、その矩形領域(設定領域)において文字が並んでいる文字並び方向の画素値に関する第1射影およびこの文字並び方向に直交する方向の画素値に関する第2射影を生成(形成)する。
第2射影PYは、選択した行において、その行の文字が文字並び方向に直交する方向に占める位置を規定するために形成される。
本実施形態においては、第2射影PYは、基本的に、画像二値化のための二値化しきい値を取得するためには用いられない。なお、第1射影PXおよび第2射影PYのそれぞれについて画像とみなして判別分析法を適用し、二値化しきい値を求めることも可能である。
より具体的には、文字認識装置10は、第1射影PXの最小画素値(本実施形態では最小輝度値)を求めて最小画素曲線(最小輝度曲線)を生成し、この最小画素曲線(最小輝度曲線)の移動平均を求めて平滑化して平均画素曲線(平均輝度曲線)を求め、この平均画素曲線(平均輝度曲線)を矩形領域(設定領域)における文字並び方向の画素位置に対応するしきい値とする。
そして、文字認識装置10は、求めた二値化しきい値に基づき文字区切り位置を求める。
二値化しきい値の取得の具体的な処理等については、後で詳述する。
また、データ処理部13は、文字列切り出し部としての行切り出し部131、文字区切り位置検出部を含む文字切り出し部132、特徴抽出部133、特徴比較部134、特徴辞書格納部135、および類似文字認識部136を有している。
なお、これらの各部は、記録媒体20上の文字列、たとえばOCR文字列を認識する文字認識装置の一例として機能する。
なお、図1において、記録媒体20の搬送方向をX軸方向としている。このX軸方向に直交する方向をY軸方向とする。また、本実施形態では、説明を簡単にするために、図1に示すように、OCR文字記録領域21に形成されているOCR文字列の方向、すなわち、文字が並んでいる方向をX軸方向としている。そして、X軸方向に直交する方向をY軸方向としている。具体的には、文字が並んでいる方向と直交する方向はY軸方向である。
本実施形態では、各画素値は、たとえば8ビットで表現すると0〜255の間のいずれかの値をとり、画素値は黒に近いほど小さく、白に近いほど大きな値をとる。
なお、この画像メモリ12は、RAM,SDRAM,DDRSDRAM,RDRAMなど、画像データを記憶しうるものであれば如何なるものであってもよい。
その後、データ処理部13が、画像メモリ12から画像データを読み出して、上述した各部において様々な処理を施し、最終的に、記録媒体20上のOCR文字列から各文字を切り出して認識するように構成されている。
撮像素子11は、たとえばCCDやCMOSセンサにより形成される。
次に、データ処理部13の各部の基本的な構成および機能について説明する。
データ処理部13は、画像メモリ12から多値化された画像データ(多階調の濃淡画像、たとえば、256階調)を読み出す。
より具体的には、文字切り出し部132は、認識対象(切り出し対象)となる2文字以上の複数文字を囲む暫定切り出し領域、たとえば矩形領域(m行n列、m<M、n<N)を設定し、その矩形領域(設定領域)において文字が並んでいる方向(X軸方向)の画素値に関する第1射影PXを生成する。さらに、この文字並び方向に直交する方向(Y軸方向)の画素値に関する第2射影PYを生成(形成)する。
最小画素値とは、その1列に配置された画素に関する画素値のうちの最小の画素値である。換言すれば、各画素の画素情報としての多階調の(たとえば8ビット等で表せる値を持つ)輝度値の中で最小の輝度値を求め、その1列上での最小画素値とする。そして、設定した矩形領域(m行n列、m<M、n<N)(設定領域)において、文字が並んでいる方向(X軸方向)のn列について列ごとに、最小画素値に関する第1射影PXを生成する。
最小画素値とは、その1行に配置された画素に関する画素値のうちの最小の画素値である。換言すれば、各画素の画素情報としての多階調の(たとえば8ビット等で表せる値を持つ)輝度値の中で最小の輝度値を求め、その1行上での最小画素値とする。そして、設定した矩形領域(m行n列、m<M、n<N)(設定領域)において、文字が並んでいる方向に直交する方向(Y軸方向)のm行について行ごとに、最小画素値に関する第2射影PYを生成する。
より具体的には、文字切り出し部132は、第1射影PXの最小画素値(本実施形態では最小輝度値)を求めて最小画素曲線(最小輝度曲線)を生成し、この最小画素曲線(最小輝度曲線)の移動平均を求めて平滑化して平均画素曲線(平均輝度曲線)を求め、この平均画素曲線(平均輝度曲線)を矩形領域(設定領域)における文字切り出し用二値化しきい値として取得する。
次に、本実施形態に係る文字認識装置10における特徴的な機能を有する文字切り出し部132の文字区切り位置検出部おける文字切り出し用二値化しきい値の取得および文字の区切り位置の検出処理(文字切り出し処理)について説明する。
図2は、本実施形態に係る文字切り出し部における文字区切り位置検出部の構成例を示すブロック図である。
本実施形態に係る文字切り出し部132における文字区切り位置検出部1320は、図2に示すように、領域設定部1321、射影生成部1322、二値化しきい値取得部1323、および位置検出部1324を含んで構成されている。
なお、前述したように、本実施形態において、第2射影PYは、選択した行において、その行の文字が文字並び方向に直交する方向に占める位置を規定するために形成され、基本的に、二値化しきい値取得部1323において、画像二値化のための二値化しきい値を取得するためには用いられない。
より具体的には、二値化しきい値取得部1323は、射影生成部1322で生成された第1射影PXの最小画素値(本実施形態では最小輝度値)を求めて最小画素曲線(最小輝度曲線)を生成し、この最小画素曲線(最小輝度曲線)の移動平均を求めて平滑化して平均画素曲線(平均輝度曲線)を求め、この平均画素曲線(平均輝度曲線)を矩形領域(設定領域)RCTAにおける文字切り出し用二値化しきい値として取得する。
位置検出部1324は、二値化しきい値と射影プロファイルのレベル値との比較の結果、射影プロファイルにおいて二値化しきい値を超えている区間を文字と文字との間として文字区切り位置を求める。
位置検出部1324は、射影プロファイルにおいて二値化しきい値を超えている区間を文字と文字との間のスペースとして判定し、たとえばスペースの中点を境界位置とする。
その後、本実施形態に係る文字切り出し部のより具体的な処理例について説明する。
そして、本実施形態においては、図2に示すような構成が採用されている。
図2の文字区切り位置検出部1320では、まず、図3に示すように、ステップST11において、領域設定部1321により、認識処理対象のうち隣接する2文字以上の複数文字を囲む矩形の暫定切り出し領域(矩形領域)RCTAが設定される。
次に、ステップST12において、射影生成部1322により、領域設定部1321により設定される矩形領域RCTA内において、X軸方向に配列された画素に関する最小画素値の第1射影PXおよびY軸方向に配列された画素に関する最小画素値の第2射影PYが生成される。各画素に格納された256階調の濃淡画像データの中で、最小画素値が選択される。
位置検出部1324においては、二値化しきい値と射影プロファイルのレベル値との比較の結果、射影プロファイルにおいて二値化しきい値を超えている区間を文字と文字との間として文字区切り位置が求められる。
位置検出部1324においては、射影プロファイルにおいて二値化しきい値を超えている区間を文字と文字との間のスペースとして判定し、たとえばスペースの中点が境界位置として求められる。
次に、このような特徴を有する文字切り出し部132における文字区切り位置検出部1320の文字切り出し処理例について、図4から図8に関連付けてより具体的に説明する。
図6は、本実施形態に係る二値化しきい値取得部における第1射影PXの最小画素値の最小画素曲線の移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)のしきい値とする処理を説明するための図である。
図7は、本発明を適用して取得した二値化しきい値を用いて得られた二値化画像を示す図である。
この場合、画素に関する画素値としては、Y軸方向およびX軸方向の列内の最小画素値を用いることが文字切り出し部132にあらかじめ指示される。文字切り出し部132は、射影を取得する処理系も指示された画素値の最小値を用いて処理するように構成される。
図5に示されている画像は、文字列と背景の間の明瞭性が全体的にまたは部分的に著しく損なわれている例である。
図4に示されている画像は、背景が一様な基本的な画像の一例である。
この文字列は、一例として、記録媒体20のOCR文字記録領域21に印刷された文字を撮像したときの画像データに相当している。なお、図4の数字の配列は、たとえば記録媒体等の有効期限(05月10日2016年)等の数字のみを選択的に読み出した一例を示す。このような数字配列の他例としては、自動車運転免許の更新期限等をあげることができる。
すなわち、領域設定部1321が、認識対象とする複数文字の全体を含むように矩形領域RCTAを設定する。
この場合、図5に示すように、数字列(文字列)「05−10−2016」を囲むように矩形領域RCTAが設定される。ただし、図5の画像は、図4の画像と比較すると、文字列と背景の間の明瞭性が全体的にまたは部分的に著しく損なわれている。
文字列の位置がわからない場合には、適切な方法によって文字列のY軸方向の位置を決定し、その情報に基づいて矩形領域RCTAの上辺と下辺の位置を決めればよい。
文字が並んでいる方向の位置が一定でない場合は、適切な方法によって文字列のX軸方向の位置を決定し、その情報に基づいて矩形領域の左辺と右辺の位置を決めればよい。
文字位置の誤差を考慮して、実際の文字の縁位置から適当な余白を設けるようにすることが望ましい。
射影は文字の画像をX軸およびY軸に投影したものである。
図5の数字列(文字列)「05−10−2016」の部分に対して最小画素値の第1および第2射影を求めた結果の射影PX、PYの特性曲線(プロファイル)が、図5(B)、(C)に示されている。
すなわち、ステップST12において、射影生成部1322により、領域設定部1321により設定される矩形領域RCTA内において、X軸方向に配列された画素に関する最小画素値のX軸への第1射影PXおよびY軸方向に配列された画素に関する最小画素値のY軸への第2射影PYが生成される。
二値化しきい値取得部1323は、第1射影PXの最小画素値、本実施形態では最小輝度値に基づき移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)のしきい値とする。
いま、第1射影PXのn番目の点をPX(n)とし、図6に示すように、平均区間幅を(2W+1)とすると、点nにおける移動平均PXA(n)は次式で与えられる。
図7に示す画像は、二値化対象の画像が文字列と背景の間の明瞭性が全体的にまたは部分的に著しく損なわれている場合であっても、ノイズが少なく、良好な結果であることがわかる。
これは、移動平均を二値化しきい値の取得に用いると、注目画素近傍の画素の輝度分布に対する追従性に優れるからである。
次に、本実施形態に係る文字認識装置10の全体的な動作について図8に関連付けて説明する。
図8は、本実施形態に係る文字認識装置10の全体の動作を説明するためのフローチャートである。
カードなどの記録媒体20のOCR文字記録領域21に印刷されたOCR文字列は、媒体搬送機構111の搬送ガイドに沿って記録媒体を動かすと1次元撮像素子11によってその文字パターンが読み取られて光電変換される(ステップST101)。
光電変換で得られた信号は、増幅器で増幅され、A/D変換器でデジタル信号に変換されて画像メモリ12に取り込まれる(ステップST102)。
次いで、行切り出し部131において、行切り出しが行われる(ステップST103)。
より具体的には、行切り出し部131において、画像メモリ12から画像データを読み出して、文字列がX軸方向に射影されて、文字列の上下エッジが検出される。
そして、行切り出し部131においては、上下エッジの中心位置が、文字列の中心ラインと識別され行切り出しが行われる。
次いで、文字区切り位置検出部1320を含む文字切り出し部132において、文字切り出しが行われる(ステップST104)。
より具体的には、文字切り出し部132の文字区切り位置検出部1320において、認識対象となる複数文字を囲む暫定切り出し矩形領域RCTAが領域設定部1321により設定される。そして、射影生成部1322においてその矩形領域において射影が生成される。
より具体的には、二値化しきい値取得部1323において、射影生成部1322で生成された第1射影PXの最小輝度値を求めて最小輝度曲線が生成される。
そして、二値化しきい値取得部1323において、求めた最小輝度曲線の移動平均が求められて平滑化して平均輝度曲線が求められ、この平均輝度曲線が矩形領域(設定領域)における文字切り出し用二値化しきい値として用いられる。
以降の処理は、この白黒二値化画像を用いて行われる。
次いで、特徴抽出部133において特徴抽出が行われる(ステップST105)。
より具体的には、特徴抽出部133においては、上述した外接矩形領域が任意のサブ領域に分割(たとえば1個の外接矩形領域を5×5の領域に分割され、そのうち1個の領域がサブ領域とされる)され、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合が求められ、それらを要素とする特徴ベクトルが生成される。
次いで、特徴比較部134において、特徴比較が行われる(ステップST106)。
より具体的には、特徴比較部134においては、ステップST105で求めた特徴ベクトルが、あらかじめこの記録媒体で使用される全文字について求められてあらかじめ特徴辞書格納部135に格納されている基準特徴ベクトルと比較されて、類似度(たとえば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定される。
最後に、文字認識が行われる(ステップST107)。
より具体的には、ステップST106の特徴比較によって設定された候補文字が、記録媒体に用いられた文字として認識される。
文字認識装置10は、第1射影PXの最小画素値、本実施形態では最小輝度値に基づき移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)の二値化しきい値とする。
より具体的には、文字認識装置10は、第1射影PXの最小画素値(本実施形態では最小輝度値)を求めて最小画素曲線(最小輝度曲線)を生成し、この最小画素曲線(最小輝度曲線)を移動平均を求めて平滑化して平均画素曲線(平均輝度曲線)を求め、この平均画素曲線(平均輝度曲線)を矩形領域(設定領域)における文字切り出し用二値化しきい値として取得する。
そして、文字認識装置10は、求めた二値化しきい値に基づき文字区切り位置を求める。
したがって、本実施形態によれば、以下の効果を得ることができる。
本実施形態においては、画像二値化処理を行うに際し、文字認識対象とする文字列を含む矩形領域(設定領域)RCTAについて、文字並び方向(X軸方向)に配列された画素に関する画素値のX軸への第1射影PX(または射影PY)を求め、第1射影PXの最小画素値、本実施形態では最小輝度値に基づき移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)の二値化しきい値とする。
その結果、本実施形態によれば、二値化しきい値が背景側に偏ることを抑制することが可能となる。その結果、二値化画像において文字線画が必要以上に太くなることを抑制することが可能となる。また、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。その結果として文字認識性能の向上を図ることが可能となる。
本実施形態によれば、移動平均をしきい値に用いることにより、注目画素近傍の画素の分布(輝度分布)に対する追従性が高められ、その結果、良好な二値化画像を得ることが可能となる。
本実施形態によれば、画像二値化処理は、認識対象とする文字列を含む矩形領域について、最小画素曲線を最適に二等分して得られる画素値をしきい値として用いるのではなく、最小画素曲線を移動平均処理して得られる平均画素曲線PXAをしきい値として用いるようにしたことにより、二値化しきい値の適正化を図れ、注目画素近傍の画素の分布(輝度分布)に対する追従性が高められ、その結果、良好な二値化画像を得ることが可能となる。
これにより、選択した行において、その行の文字が文字並び方向に直交する方向に占める位置を規定することが可能となる。
本実施形態の文字認識装置10は、認識対象としては活字文字だけでなく手書き文字にも適用可能である。また、文字認識に留まらず、1次元や2次元のバーコードの復号などにも、適正なバー幅の白黒比率の確保を狙いとした応用が可能である。
また、本実施形態の文字認識装置10は、カードのみならず、パスポート、運転免許証など、あらゆる記録媒体への適用が可能である。
また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
Claims (12)
- 記録媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し装置であって、
前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出部を有し、
前記文字区切り位置検出部は、
前記文字の区切り位置を検出する領域を設定する領域設定部と、
少なくとも前記領域設定部により設定される設定領域内において、文字が並んでいる文字並び方向に配列された画素に関する、文字並び方向に直交する方向への画素値の射影を生成する射影生成部と、
前記射影の前記文字並び方向に直交する方向に配置された各画素に関する画素値のうち最小の画素値である最小画素値から生成された前記文字並び方向に対する最小画素曲線に基づき移動平均を求め、当該移動平均を設定領域の二値化しきい値とする二値化しきい値取得部と、
前記二値化しきい値取得部で求めた前記二値化しきい値に基づき文字区切り位置を求める位置検出部と、を含む
ことを特徴とする文字切り出し装置。 - 前記二値化しきい値取得部は、
前記射影の最小画素値に応じた最小画素曲線を移動平均処理して得られた平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
ことを特徴とする請求項1に記載の文字切り出し装置。 - 前記二値化しきい値取得部は、
前記射影の最小画素値を求めて最小画素曲線を生成し、当該最小画素曲線の移動平均を求めて平滑化して平均画素曲線を求め、当該平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
ことを特徴とする請求項1または2に記載の文字切り出し装置。 - 前記射影生成部は、
前記文字並び方向に直交する方向に配列された画素に関する画素値の射影を生成する
ことを特徴とする請求項1から3のいずれか一に記載の文字切り出し装置。 - 画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置であって、
記録媒体上の文字列を撮像して画像データとして読み取る画像読取部と、
前記画像読取部による読み取り画像を格納する画像メモリと、
前記画像メモリに格納された前記画像データから文字列を切り出し、当該文字列から文字を切り出して文字認識を行うデータ処理部と、を有し、
前記データ処理部は、
切り出された前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出部を備えた文字切り出し部を含み、
前記文字区切り位置検出部は、
前記文字の区切り位置を検出する領域を設定する領域設定部と、
少なくとも前記領域設定部により設定される設定領域内において、文字が並んでいる文字並び方向に配列された画素に関する、文字並び方向に直交する方向への画素値の射影を生成する射影生成部と、
前記射影の前記文字並び方向に直交する方向に配置された各画素に関する画素値のうち最小の画素値である最小画素値から生成された前記文字並び方向に対する最小画素曲線に基づき移動平均を求め、当該移動平均を設定領域の二値化しきい値とする二値化しきい値取得部と、
前記二値化しきい値取得部で求めた前記二値化しきい値に基づき文字区切り位置を求める位置検出部と、を含む
ことを特徴とする文字認識装置。 - 前記二値化しきい値取得部は、
前記射影の最小画素値に応じた最小画素曲線を移動平均処理して得られた平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
ことを特徴とする請求項5に記載の文字認識装置。 - 前記二値化しきい値取得部は、
前記射影の最小画素値を求めて最小画素曲線を生成し、当該最小画素曲線の移動平均を求めて平滑化して平均画素曲線を求め、当該平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
ことを特徴とする請求項5または6に記載の文字認識装置。 - 前記射影生成部は、
前記文字並び方向に直交する方向に配列された画素に関する画素値の射影を生成する
ことを特徴とする請求項5から7のいずれか一に記載の文字認識装置。 - 記録媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し方法であって、
前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出ステップを有し、
前記文字区切り位置検出ステップは、
前記文字の区切り位置を検出する領域を設定する領域設定ステップと、
少なくとも前記領域設定ステップにより設定される設定領域内において、文字が並んでいる文字並び方向に配列された画素に関する、文字並び方向に直交する方向への画素値の射影を生成する射影生成ステップと、
前記射影の前記文字並び方向に直交する方向に配置された各画素に関する画素値のうち最小の画素値である最小画素値から生成された前記文字並び方向に対する最小画素曲線に基づき移動平均を求め、当該移動平均を設定領域の二値化しきい値とする二値化しきい値取得ステップと、
前記二値化しきい値取得ステップで求めた前記二値化しきい値に基づき文字区切り位置を求める位置検出ステップと、を含む
ことを特徴とする文字切り出し方法。 - 前記二値化しきい値取得ステップでは、
前記射影の最小画素値に応じた最小画素曲線を移動平均処理して得られた平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
ことを特徴とする請求項9に記載の文字切り出し方法。 - 前記二値化しきい値取得ステップでは、
前記射影の最小画素値を求めて最小画素曲線を生成し、当該最小画素曲線の移動平均を求めて平滑化して平均画素曲線を求め、当該平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
ことを特徴とする請求項9または10に記載の文字切り出し方法。 - 前記射影生成ステップでは、
前記文字並び方向に直交する方向に配列された画素に関する画素値の射影を生成する
ことを特徴とする請求項9から11のいずれか一に記載の文字切り出し方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015142909A JP6599672B2 (ja) | 2015-07-17 | 2015-07-17 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
US15/208,922 US9858477B2 (en) | 2015-07-17 | 2016-07-13 | Character segmenting apparatus, character recognition apparatus, and character segmenting method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015142909A JP6599672B2 (ja) | 2015-07-17 | 2015-07-17 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017027201A JP2017027201A (ja) | 2017-02-02 |
JP6599672B2 true JP6599672B2 (ja) | 2019-10-30 |
Family
ID=57775101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015142909A Active JP6599672B2 (ja) | 2015-07-17 | 2015-07-17 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9858477B2 (ja) |
JP (1) | JP6599672B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108399405B (zh) * | 2017-02-07 | 2023-06-27 | 腾讯科技(上海)有限公司 | 营业执照识别方法和装置 |
SG11202008145YA (en) | 2018-02-26 | 2020-09-29 | Videonetics Tech Private Limited | A system for real-time automated segmentation and recognition of vehicle's license plates characters from vehicle's image and a method thereof. |
CN111340029A (zh) * | 2018-12-19 | 2020-06-26 | 富士通株式会社 | 用于识别收件人地址中的至少部分地址的装置和方法 |
JP2021009539A (ja) * | 2019-07-01 | 2021-01-28 | パナソニックIpマネジメント株式会社 | 文字領域決定方法 |
EP4071665A4 (en) * | 2019-12-05 | 2023-11-22 | Canaan Bright Sight Co., Ltd. | CHARACTER SEGMENTATION METHOD AND APPARATUS, AND COMPUTER-READABLE STORAGE MEDIUM |
CN112464928B (zh) * | 2020-11-27 | 2024-03-15 | 广东电网有限责任公司 | 数字式表计读数识别方法、装置、设备及存储介质 |
CN114612892B (zh) * | 2022-03-17 | 2024-04-09 | 佛山市南海区广工大数控装备协同创新研究院 | 一种pcb元器件表面3d字符分割方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02196565A (ja) * | 1989-01-25 | 1990-08-03 | Eastman Kodatsuku Japan Kk | 画像二値化方式 |
US5200841A (en) * | 1990-05-25 | 1993-04-06 | Nikon Corporation | Apparatus for binarizing images |
JP3472094B2 (ja) * | 1997-08-21 | 2003-12-02 | シャープ株式会社 | 領域判定装置 |
JP4018310B2 (ja) * | 1999-04-21 | 2007-12-05 | 株式会社リコー | 画像二値化装置、画像撮像装置、画像二値化方法、画像撮像方法およびその方法の各工程としてコンピュータを機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体 |
AU2002251559B9 (en) * | 2001-04-26 | 2006-06-29 | Teijin Limited | Three-dimensional joint structure measuring method |
KR100703284B1 (ko) * | 2003-01-30 | 2007-04-03 | 삼성전자주식회사 | 영상신호의 이진화 장치 및 방법 |
KR100977713B1 (ko) * | 2003-03-15 | 2010-08-24 | 삼성전자주식회사 | 영상신호의 글자 인식을 위한 전처리 장치 및 방법 |
JP2007299210A (ja) * | 2006-04-28 | 2007-11-15 | Sharp Corp | 画像処理装置、画像形成装置、画像読取装置及び画像処理方法 |
RU2395787C2 (ru) * | 2008-05-19 | 2010-07-27 | Государственный Научный Центр России "Государственное Научное Учреждение "Центральный Научно-Исследовательский И Опытно-Конструкторский Институт Робототехники И Технической Кибернетики"(Цнии Ртк) | Способ обнаружения объектов |
JP5334042B2 (ja) * | 2008-11-23 | 2013-11-06 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
JP6171167B2 (ja) | 2012-12-28 | 2017-08-02 | 日本電産サンキョー株式会社 | 文字認識装置、文字認識方法、及び文字認識プログラム |
JP6487255B2 (ja) * | 2015-03-31 | 2019-03-20 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
CN105005997B (zh) * | 2015-08-05 | 2017-11-14 | 哈尔滨工业大学 | 一种基于行列直线聚类的多类型bga芯片视觉识别方法 |
-
2015
- 2015-07-17 JP JP2015142909A patent/JP6599672B2/ja active Active
-
2016
- 2016-07-13 US US15/208,922 patent/US9858477B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2017027201A (ja) | 2017-02-02 |
US20170017836A1 (en) | 2017-01-19 |
US9858477B2 (en) | 2018-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6599672B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
JP6487255B2 (ja) | 文字切り出し装置、文字認識装置、および文字切り出し方法 | |
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
JP4232800B2 (ja) | ラインノイズ除去装置、ラインノイズ除去方法、ラインノイズ除去プログラム | |
JP5334042B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP6171167B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラム | |
JP4658848B2 (ja) | 文字列認識方法及び文字列認識装置 | |
US20080298648A1 (en) | Method and system for slap print segmentation | |
JP6039413B2 (ja) | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム | |
JP2010170539A5 (ja) | ||
JP4238902B2 (ja) | 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム | |
US11532148B2 (en) | Image processing system | |
WO2017108222A1 (en) | Image processing system | |
JP5011508B2 (ja) | 文字列認識方法及び文字列認識装置 | |
JP2008250754A (ja) | 文字列認識方法及び文字列認識装置 | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
WO2018061997A1 (ja) | 媒体認識装置および媒体認識方法 | |
JPH08305795A (ja) | 文字認識方法 | |
Chanda et al. | Font identification—In context of an Indic script | |
JP6138038B2 (ja) | 帳票識別装置および帳票識別方法 | |
JP4978460B2 (ja) | バーコード認識装置及びプログラム | |
EP2380110A2 (en) | A method for evaluating quality of image representing a fingerprint pattern | |
JP2580976B2 (ja) | 文字切出し装置 | |
JP4377283B2 (ja) | 特徴抽出装置、特徴抽出方法、および、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20171121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6599672 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |