JP6599672B2 - 文字切り出し装置、文字認識装置、および文字切り出し方法 - Google Patents

文字切り出し装置、文字認識装置、および文字切り出し方法

Info

Publication number
JP6599672B2
JP6599672B2 JP2015142909A JP2015142909A JP6599672B2 JP 6599672 B2 JP6599672 B2 JP 6599672B2 JP 2015142909 A JP2015142909 A JP 2015142909A JP 2015142909 A JP2015142909 A JP 2015142909A JP 6599672 B2 JP6599672 B2 JP 6599672B2
Authority
JP
Japan
Prior art keywords
character
projection
pixel
binarization threshold
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015142909A
Other languages
English (en)
Other versions
JP2017027201A (ja
Inventor
宏 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nidec Sankyo Corp
Original Assignee
Nidec Sankyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nidec Sankyo Corp filed Critical Nidec Sankyo Corp
Priority to JP2015142909A priority Critical patent/JP6599672B2/ja
Priority to US15/208,922 priority patent/US9858477B2/en
Publication of JP2017027201A publication Critical patent/JP2017027201A/ja
Application granted granted Critical
Publication of JP6599672B2 publication Critical patent/JP6599672B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/467Encoded features or binary features, e.g. local binary patterns [LBP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Character Input (AREA)

Description

本発明は、紙やプラスチック等の媒体上の文字列を撮像して得られた多値のデジタル画像データを処理することによって文字列から各文字を切り出す文字認識技術に係り、特に、撮像された画像内の文字列の文字間の区切り位置を検索して文字を認識する文字切り出し装置、文字認識装置、および文字切り出し方法に関するものである。
多値のデジタル画像を用いて文字認識を行う様々な方法・装置が提案されているが、一般に、文字認識装置は二値画像を認識対象としており、多値画像の場合には、これを二値化して入力させる必要がある。文字認識装置の認識性能は、認識対象である文字と非認識対象である背景とを正確に分離することに左右される。
そこで、多値画像を二値化するための二値化しきい値を決定する手法として、たとえば、判別分析法を用いた文字認識装置が提案・発表されている(たとえば、特許文献1参照)。
特開2014−130415号公報
しかしながら、判別分析法は、画像全体の画素値をデータとするヒストグラムから最も分離性の高い値をしきい値に用いて2値化を行う手法である。このため、認識対象となる文字などの線画像の画素数に比べて背景の画素数が圧倒的に多い場合には、文字と背景とを区分けし(判別し)文字を切り出すための文字切り出し用二値化しきい値が背景側に偏る結果、二値化しきい値決定の精度が充分でなく、多値のデジタル画像によっては品質の悪い二値化画像しか得られないという問題がある。
本発明の目的は、二値化しきい値が背景側に偏ることを抑制し、ひいては文字認識性能の向上を図ることが可能な文字切り出し装置、文字認識装置、および文字切り出し方法を提供することにある。
本発明の文字切り出し装置は、記録媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し装置であって、前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出部を有し、前記文字区切り位置検出部は、前記文字の区切り位置を検出する領域を設定する領域設定部と、少なくとも前記領域設定部により設定される設定領域内において、文字が並んでいる文字並び方向に配列された画素に関する、文字並び方向に直交する方向への画素値の射影を生成する射影生成部と、前記射影の前記文字並び方向に直交する方向に配置された各画素に関する画素値のうち最小の画素値である最小画素値から生成された前記文字並び方向に対する最小画素曲線に基づき移動平均を求め、当該移動平均を設定領域の二値化しきい値とする二値化しきい値取得部と、前記二値化しきい値取得部で求めた前記二値化しきい値に基づき文字区切り位置を求める位置検出部と、を含む。
本発明において、画像二値化処理を行うに際し、文字認識対象とする文字列を含む設定領域について、文字並び方向に配列された画素に関する画素値の射影を求め、射影の最小画素値に基づき移動平均を求め、この移動平均を設定領域の二値化しきい値とすることから、二値化しきい値が背景側に偏ることを抑制することが可能となる。
また、特に、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。
好適には、前記二値化しきい値取得部は、前記射影の最小画素値に応じた最小画素曲線を移動平均処理して得られた平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする。
このように、移動平均を二値化しきい値に用いることにより、注目画素近傍の画素の分布(輝度分布)に対する追従性が高められ、その結果、良好な二値化画像を得ることが可能となる。
好適には、前記二値化しきい値取得部は、前記射影の最小画素値を求めて最小画素曲線を生成し、当該最小画素曲線の移動平均を求めて平滑化して平均画素曲線を求め、当該平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする。
このように、画像二値化処理は、認識対象とする文字列を含む設定領域について、最小画素曲線を移動平均処理して得られる平均画素曲線を二値化しきい値として用いるようにしたことにより、二値化しきい値の適正化を図れ、注目画素近傍の画素の分布(輝度分布)に対する追従性が高められ、その結果、良好な二値化画像を得ることが可能となる。
前記射影生成部は、前記文字並び方向に直交する方向に配列された画素に関する画素値の射影を生成する。
これにより、選択した行において、その行の文字が文字並び方向に直交する方向に占める位置を規定することが可能となる。
本発明の文字認識装置は、画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置であって、記録媒体上の文字列を撮像して画像データとして読み取る画像読取部と、前記画像読取部による読み取り画像を格納する画像メモリと、前記画像メモリに格納された前記画像データから文字列を切り出し、当該文字列から文字を切り出して文字認識を行うデータ処理部と、を有し、前記データ処理部は、切り出された前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出部を備えた文字切り出し部と、を含み、前記文字区切り位置検出部は、前記文字の区切り位置を検出する領域を設定する領域設定部と、少なくとも前記領域設定部により設定される設定領域内において、文字が並んでいる文字並び方向に配列された画素に関する、文字並び方向に直交する方向への画素値の射影を生成する射影生成部と、前記射影の前記文字並び方向に直交する方向に配置された各画素に関する画素値のうち最小の画素値である最小画素値から生成された前記文字並び方向に対する最小画素曲線に基づき移動平均を求め、当該移動平均を設定領域の二値化しきい値とする二値化しきい値取得部と、前記二値化しきい値取得部で求めた前記二値化しきい値に基づき文字区切り位置を求める位置検出部と、を含む。
本発明において、二値化しきい値が背景側に偏ることを抑制することが可能となる。
また、特に、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。その結果、文字認識性能の向上を図ることが可能となる。
また、本発明の文字切り出し方法は、記録媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し方法であって、前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出ステップを有し、前記文字区切り位置検出ステップは、前記文字の区切り位置を検出する領域を設定する領域設定ステップと、少なくとも前記領域設定部により設定される設定領域内において、文字が並んでいる文字並び方向に配列された画素に関する、文字並び方向に直交する方向への画素値の射影を生成する射影生成ステップと、前記射影の前記文字並び方向に直交する方向に配置された各画素に関する画素値のうち最小の画素値である最小画素値から生成された前記文字並び方向に対する最小画素曲線に基づき移動平均を求め、当該移動平均を設定領域の二値化しきい値とする二値化しきい値取得ステップと、前記二値化しきい値取得ステップで求めた前記二値化しきい値に基づき文字区切り位置を求める位置検出ステップと、を含む。


本発明において、画像二値化処理を行うに際し、文字認識対象とする文字列を含む設定領域について、文字並び方向に配列された画素に関する画素値の射影を求め、射影の最小画素値に基づき移動平均を求め、この移動平均を設定領域のしきい値とすることから、二値化しきい値が背景側に偏ることを抑制することが可能となる。
また、特に、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。
本発明によれば、二値化しきい値が背景側に偏ることを抑制することが可能となり、ひいては文字認識性能の向上を図ることが可能となる。
また、特に、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。
本発明の実施形態に係る文字認識装置の構成例を示す図である。 本実施形態に係る文字切り出し部における文字区切り位置検出部の構成例を示すブロック図である。 本実施形態に係る文字切り出し部における文字区切り位置検出部の処理フローを示すフローチャートである。 本実施形態に係る文字認識対象の画像の一例および領域設定部により画像の一部に設定される矩形領域の一例を示す図である。 本実施形態に係る射影生成部による射影プロファイルを矩形領域に対応付けて示す図である。 本実施形態に係る二値化しきい値取得部における第1射影の最小画素値の最小画素曲線の移動平均を求め、この移動平均を矩形領域(設定領域)のしきい値とする処理を説明するための図である。 本発明を適用して取得した二値化しきい値を用いて得られた二値化画像を示す図である。 本実施形態に係る文字認識装置の動作を説明するためのフローチャートである。
以下、本発明の実施形態を図面に関連付けて説明する。
図1は、本発明の実施形態に係る文字認識装置の構成例を示す図である。
本実施形態に係る文字認識装置10は、紙やプラスチック等の記録媒体上の文字列を撮像して得られたデジタル画像データを処理することによって、画像データから切り出した文字列から各文字を切り出して認識する機能を有する。
文字認識装置10は、画像認識技術に基づいて、撮像画像内の文字列における文字間の区切り位置を検出(検索)する際に、次のような特徴的な処理を行う。
文字認識装置10は、認識対象(切り出し対象)となる2文字以上の複数文字を囲む暫定切り出し領域、たとえば矩形領域を設定し、その矩形領域(設定領域)において文字が並んでいる文字並び方向の画素値に関する第1射影およびこの文字並び方向に直交する方向の画素値に関する第2射影を生成(形成)する。
文字認識装置10は、一例として、矩形領域(設定領域)内において、文字が並んでいる文字並び方向(X軸方向とする)に配列された画素に関する画素値の第1射影PXおよび文字並び方向に直交する方向(Y軸方向とする)に配列された画素に関する画素値の第2射影PYを生成する。
文字認識装置10において、第1射影PXは画像二値化のための二値化しきい値を取得するために形成される。
第2射影PYは、選択した行において、その行の文字が文字並び方向に直交する方向に占める位置を規定するために形成される。
本実施形態においては、第2射影PYは、基本的に、画像二値化のための二値化しきい値を取得するためには用いられない。なお、第1射影PXおよび第2射影PYのそれぞれについて画像とみなして判別分析法を適用し、二値化しきい値を求めることも可能である。
本実施形態において、文字認識装置10は、第1射影PXの最小画素値、たとえば最小輝度値に基づき移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)のしきい値とする。
より具体的には、文字認識装置10は、第1射影PXの最小画素値(本実施形態では最小輝度値)を求めて最小画素曲線(最小輝度曲線)を生成し、この最小画素曲線(最小輝度曲線)の移動平均を求めて平滑化して平均画素曲線(平均輝度曲線)を求め、この平均画素曲線(平均輝度曲線)を矩形領域(設定領域)における文字並び方向の画素位置に対応するしきい値とする。
そして、文字認識装置10は、求めた二値化しきい値に基づき文字区切り位置を求める。
二値化しきい値の取得の具体的な処理等については、後で詳述する。
なお、本実施形態において移動平均とは、第1射影PXから求めた最小画素値に関する最小画素曲線の直近の連続するn個のデータの重み付けのないまたは重み付けした平均をいい、その移動平均に応じた曲線が平均画素曲線であり、本実施形態では、この平均画素曲線が画像二値化処理のしきい値として用いられる。
以下に、本文字認識装置10の具体的な構成および撮像画像の文字認識処理機能について説明する。
文字認識装置10は、図1に示すように、データ入力部としての密着型の(たとえば1次元)撮像素子(画像読取部)11、画像メモリ12、およびデータ処理部13を有している。
また、データ処理部13は、文字列切り出し部としての行切り出し部131、文字区切り位置検出部を含む文字切り出し部132、特徴抽出部133、特徴比較部134、特徴辞書格納部135、および類似文字認識部136を有している。
なお、これらの各部は、記録媒体20上の文字列、たとえばOCR文字列を認識する文字認識装置の一例として機能する。
なお、図1において、記録媒体20の搬送方向をX軸方向としている。このX軸方向に直交する方向をY軸方向とする。また、本実施形態では、説明を簡単にするために、図1に示すように、OCR文字記録領域21に形成されているOCR文字列の方向、すなわち、文字が並んでいる方向をX軸方向としている。そして、X軸方向に直交する方向をY軸方向としている。具体的には、文字が並んでいる方向と直交する方向はY軸方向である。
画像読取部としての撮像素子11は、記録媒体20上のOCR文字記録領域21のOCR文字列を撮像し、そのOCR文字列の光電変換を行う。
画像メモリ12は、撮像素子11で撮像されたOCR文字列等のデジタル化された画像データを記憶(格納)する。画像メモリ12に格納される原画像は、複数の画素がマトリクス状に配列されて形成され、具体的には、図示していないが、X軸方向にM行、Y軸方向にN列の画素が配置されている。各画素はそれぞれ画素値(輝度値)を有する。
本実施形態では、各画素値は、たとえば8ビットで表現すると0〜255の間のいずれかの値をとり、画素値は黒に近いほど小さく、白に近いほど大きな値をとる。
なお、この画像メモリ12は、RAM,SDRAM,DDRSDRAM,RDRAMなど、画像データを記憶しうるものであれば如何なるものであってもよい。
データ入力部においては、カードなどの記録媒体20のOCR文字記録領域21に印刷されたOCR文字列は、媒体搬送機構111の搬送ガイドに沿って記録媒体20を動かすと撮像素子11によってその文字パターンが撮像されて光電変換され、その画像データが画像メモリ12に取り込まれる。
その後、データ処理部13が、画像メモリ12から画像データを読み出して、上述した各部において様々な処理を施し、最終的に、記録媒体20上のOCR文字列から各文字を切り出して認識するように構成されている。
ここでは、撮像素子11として密着型1次元撮像素子を採用して装置の小型化等を図っているが、撮像素子11としては、読み取り対象の記録媒体20の文字列を読み取り対象とする2次元のエリアセンサ等を採用することも可能である。
撮像素子11は、たとえばCCDやCMOSセンサにより形成される。
記録媒体20は、JISに準拠している一般的なカードであってもよく、たとえば、幅86mm,高さ54mm,厚み0.76mmというサイズのプラスチックカードでもよく、IDカードやパスポートブック、あるいは運転免許証などでもよい。
[データ処理部13の各部の構成および機能]
次に、データ処理部13の各部の基本的な構成および機能について説明する。
データ処理部13は、画像メモリ12から多値化された画像データ(多階調の濃淡画像、たとえば、256階調)を読み出す。
文字列切り出し部としての行切り出し部131は、画像メモリ12から読み出した256階調の濃淡画像データに対する2値化処理を行う。適当な方法によってしきい値を求め、元の多値の濃淡画像を白黒2値の画像に変換する。つぎに、行切り出し部131は、上下エッジの中心位置を、文字列の中心ラインと識別して行切り出しを行う。具体的には、2値化された画像データは、OCR文字記録領域21に形成されている文字列に対し、文字が並んでいる方向、すなわち、X軸方向に射影して、文字列の上下エッジを検出する。
文字切り出し部132は、行切り出し部131で切り出された行の文字列から文字列の文字が並んでいる方向(X軸方向)の文字間の区切り位置を検出して、文字の切り出し処理を行う。
より具体的には、文字切り出し部132は、認識対象(切り出し対象)となる2文字以上の複数文字を囲む暫定切り出し領域、たとえば矩形領域(m行n列、m<M、n<N)を設定し、その矩形領域(設定領域)において文字が並んでいる方向(X軸方向)の画素値に関する第1射影PXを生成する。さらに、この文字並び方向に直交する方向(Y軸方向)の画素値に関する第2射影PYを生成(形成)する。
本実施形態では、X軸への第1射影PXは、文字列の画像のY軸方向に1列に配置された画素について、この1列に配置された画素に関する画素値として最小画素値を求めたものである。
最小画素値とは、その1列に配置された画素に関する画素値のうちの最小の画素値である。換言すれば、各画素の画素情報としての多階調の(たとえば8ビット等で表せる値を持つ)輝度値の中で最小の輝度値を求め、その1列上での最小画素値とする。そして、設定した矩形領域(m行n列、m<M、n<N)(設定領域)において、文字が並んでいる方向(X軸方向)のn列について列ごとに、最小画素値に関する第1射影PXを生成する。
文字切り出し部132は、次に同様に、この矩形領域について、Y軸への第2射影PYを得る。Y軸の第2射影PYは、文字列の画像のX軸方向に1行に配置された画素について、この1行に配置された画素に関する画素値として最小画素値を求めたものである。
最小画素値とは、その1行に配置された画素に関する画素値のうちの最小の画素値である。換言すれば、各画素の画素情報としての多階調の(たとえば8ビット等で表せる値を持つ)輝度値の中で最小の輝度値を求め、その1行上での最小画素値とする。そして、設定した矩形領域(m行n列、m<M、n<N)(設定領域)において、文字が並んでいる方向に直交する方向(Y軸方向)のm行について行ごとに、最小画素値に関する第2射影PYを生成する。
なお、本実施形態において、第2射影PYは、選択した行において、その行の文字が文字並び方向に直交する方向に占める位置を規定するために形成され、基本的に、画像二値化のための二値化しきい値を取得するためには用いられない。
文字切り出し部132は、次に、第1射影PXの最小画素値、本実施形態では最小輝度値に基づき移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)のしきい値とする。
より具体的には、文字切り出し部132は、第1射影PXの最小画素値(本実施形態では最小輝度値)を求めて最小画素曲線(最小輝度曲線)を生成し、この最小画素曲線(最小輝度曲線)の移動平均を求めて平滑化して平均画素曲線(平均輝度曲線)を求め、この平均画素曲線(平均輝度曲線)を矩形領域(設定領域)における文字切り出し用二値化しきい値として取得する。
そして、文字切り出し部132は、求めた二値化しきい値に基づき文字区切り位置を求める。
なお、この文字切り出し部132における文字切り出し処理については、後でさらに詳述する。
データ処理部13において、文字切り出し部132の文字切り出し処理が終了すると、認識対象となっている文字の外接矩形領域(上下左右の座標値)が求められる。
特徴抽出部133は、上述した外接矩形領域を任意のサブ領域に分割、たとえば1個の外接矩形領域を5×5の領域に分割し、そのうち1個の領域をサブ領域とし、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合を求め、それらを要素とする特徴ベクトルを生成する。
特徴比較部134は、特徴抽出部133で求められた特徴ベクトルを、あらかじめこの記録媒体で使用される全文字について求めておいた基準特徴ベクトルと比較して、類似度(たとえば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定する。
なお、基準特徴ベクトルは、あらかじめ特徴辞書格納部135に格納されているものであって、特徴比較が行われる際に、特徴辞書格納部135から類似度が高い文字のデータが読み出され、特徴比較部134において特徴比較が行われる。
類似文字認識部136は、基本的に、特徴比較部134の特徴比較によって設定された候補文字を、記録媒体に用いられた文字として認識する。
[文字区切り位置検出部おける文字切り出し用二値化しきい値の取得等]
次に、本実施形態に係る文字認識装置10における特徴的な機能を有する文字切り出し部132の文字区切り位置検出部おける文字切り出し用二値化しきい値の取得および文字の区切り位置の検出処理(文字切り出し処理)について説明する。
[文字切り出し部132のブロック構成]
図2は、本実施形態に係る文字切り出し部における文字区切り位置検出部の構成例を示すブロック図である。
本実施形態に係る文字切り出し部132における文字区切り位置検出部1320は、図2に示すように、領域設定部1321、射影生成部1322、二値化しきい値取得部1323、および位置検出部1324を含んで構成されている。
領域設定部1321は、行切り出し部131で切り出された行の文字列について、認識処理対象のうち隣接するあるいは連続して隣接する2文字以上の複数文字を囲む矩形の暫定切り出し領域(矩形領域)RCTAを設ける。
射影生成部1322は、領域設定部1321で設定される矩形領域RCTA内において射影を生成する。具体的には、射影生成部1322は、領域設定部1321により設定される矩形領域RCTA内において、文字が並んでいるX軸方向に配列された画素に関する画素値のX軸への第1射影PXおよびY軸方向に配列された画素に関する画素値のY軸への第2射影PYを生成する。なお、ここで、各画素の画素値(輝度値)は、画像メモリ12に格納されている濃淡画像の多値の画像データとして処理される。
より具体的には、射影生成部1322は、領域設定部1321により設定される矩形領域RCTA内において、X軸方向に配列された画素に関する最小画素値のX軸への第1射影PXおよびY軸方向に配列された画素に関する最小画素値のY軸への第2射影PYを生成する。
なお、前述したように、本実施形態において、第2射影PYは、選択した行において、その行の文字が文字並び方向に直交する方向に占める位置を規定するために形成され、基本的に、二値化しきい値取得部1323において、画像二値化のための二値化しきい値を取得するためには用いられない。
二値化しきい値取得部1323は、射影生成部1322で生成された第1射影PXの最小画素値、本実施形態では最小輝度値に基づき移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)RCTAのしきい値とする。
より具体的には、二値化しきい値取得部1323は、射影生成部1322で生成された第1射影PXの最小画素値(本実施形態では最小輝度値)を求めて最小画素曲線(最小輝度曲線)を生成し、この最小画素曲線(最小輝度曲線)の移動平均を求めて平滑化して平均画素曲線(平均輝度曲線)を求め、この平均画素曲線(平均輝度曲線)を矩形領域(設定領域)RCTAにおける文字切り出し用二値化しきい値として取得する。
位置検出部1324は、二値化しきい値取得部1323で求めた二値化しきい値に基づき文字区切り位置を求める。
位置検出部1324は、二値化しきい値と射影プロファイルのレベル値との比較の結果、射影プロファイルにおいて二値化しきい値を超えている区間を文字と文字との間として文字区切り位置を求める。
位置検出部1324は、射影プロファイルにおいて二値化しきい値を超えている区間を文字と文字との間のスペースとして判定し、たとえばスペースの中点を境界位置とする。
なお、本実施形態において、射影生成部1322は、領域設定部1321で設定される矩形領域RCTA内において射影を生成するように構成されている。
以下に、本実施形態に係る文字切り出し部の処理を説明しつつ、本実施形態の文字切り出し部の構成を採用した理由等について説明する。
その後、本実施形態に係る文字切り出し部のより具体的な処理例について説明する。
図3は、本実施形態に係る文字切り出し部における文字区切り位置検出部の処理フローを示すフローチャートである。
上述したように、基本的に、文字切り出し部132は、文字列ラインごとに水平方向の文字の区切り位置を検出(検索)する。
そして、本実施形態においては、図2に示すような構成が採用されている。
[本実施形態の文字の区切り位置の検出]
図2の文字区切り位置検出部1320では、まず、図3に示すように、ステップST11において、領域設定部1321により、認識処理対象のうち隣接する2文字以上の複数文字を囲む矩形の暫定切り出し領域(矩形領域)RCTAが設定される。
次に、ステップST12において、射影生成部1322により、領域設定部1321により設定される矩形領域RCTA内において、X軸方向に配列された画素に関する最小画素値の第1射影PXおよびY軸方向に配列された画素に関する最小画素値の第2射影PYが生成される。各画素に格納された256階調の濃淡画像データの中で、最小画素値が選択される。
次に、ステップST13において、二値化しきい値取得部1323により、射影生成部1322で生成された第1射影PXの最小画素値を求めて最小画素曲線が生成され、この最小画素曲線の移動平均を求めて平滑化して平均画素曲線が求められ、この平均画素曲線が矩形領域(設定領域)RCTAにおける文字切り出し用二値化しきい値として取得される。
そして、ステップST14において、位置検出部1324により、二値化しきい値取得部1323で求めた二値化しきい値に基づき文字区切り位置が求められる。
位置検出部1324においては、二値化しきい値と射影プロファイルのレベル値との比較の結果、射影プロファイルにおいて二値化しきい値を超えている区間を文字と文字との間として文字区切り位置が求められる。
位置検出部1324においては、射影プロファイルにおいて二値化しきい値を超えている区間を文字と文字との間のスペースとして判定し、たとえばスペースの中点が境界位置として求められる。
[本実施形態の文字切り出し処理の具体的な例]
次に、このような特徴を有する文字切り出し部132における文字区切り位置検出部1320の文字切り出し処理例について、図4から図8に関連付けてより具体的に説明する。
図4は、本実施形態に係る文字認識対象の画像の一例および領域設定部により画像の一部に設定される矩形領域の一例を示す図である。
図5は、本実施形態に係る射影生成部による射影プロファイルを矩形領域に対応付けて示す図である。図5(A)が矩形領域RCTAと文字列を示し、図5(B)はX軸への第1射影PXのプロファイルを示し、図5(C)はY軸への第2射影PYのプロファイルを示している。
図6は、本実施形態に係る二値化しきい値取得部における第1射影PXの最小画素値の最小画素曲線の移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)のしきい値とする処理を説明するための図である。
図7は、本発明を適用して取得した二値化しきい値を用いて得られた二値化画像を示す図である。
なお、前述したように、画素に関する画素値としては、図5の例のように、垂直および水平ライン内の最小画素値を用いることができる。
この場合、画素に関する画素値としては、Y軸方向およびX軸方向の列内の最小画素値を用いることが文字切り出し部132にあらかじめ指示される。文字切り出し部132は、射影を取得する処理系も指示された画素値の最小値を用いて処理するように構成される。
いま、文字認識を行おうとする画像IMGが図5のように与えられているとする。
図5に示されている画像は、文字列と背景の間の明瞭性が全体的にまたは部分的に著しく損なわれている例である。
図4に示されている画像は、背景が一様な基本的な画像の一例である。
図4の例では、文字「0」、「5」、「−」、「1」,「0」,「−」、「2」、「0」、「1」、「6」を含む文字列の画像が示されている。図5の画像は、図4の画像において文字列と背景の間の明瞭性が全体的にまたは部分的に著しく損なわれている例である。
この文字列は、一例として、記録媒体20のOCR文字記録領域21に印刷された文字を撮像したときの画像データに相当している。なお、図4の数字の配列は、たとえば記録媒体等の有効期限(05月10日2016年)等の数字のみを選択的に読み出した一例を示す。このような数字配列の他例としては、自動車運転免許の更新期限等をあげることができる。
この図4および図5の例では、文字並び方向(X軸方向)において、文字「0」と「5」が隣接し、文字「5」と「−」が隣接し、文字「−」と「1」が隣接し、文字「1」と「0」が隣接し、文字「0」と「−」が隣接し、文字「−」と「2」が隣接し、文字「2」と「0」が隣接し、文字「0」と「1」が隣接し、文字「1」と「6」が隣接している。
また、図4および図5の例では、各文字間、すなわち、文字「0」と「5」間、文字「−」と「1」間、文字「1」と「0」間、文字「0」と「−」間、文字「−」と「2」間、文字「2」と「0」間、文字「0」と「1」間、文字「1」と「6」間は余白(スペース)が広く、2文字の境界が明確となっている。これに対して、文字「5」と「−」の間は余白(スペース)が狭く、文字「5」と「−」の境界は上記した他の文字間に比べて明確ではない。
文字認識装置10の文字切り出し部132の文字区切り位置検出部1320は、行切り出し後の文字列に対して、はじめに領域設定部1321が領域設定を行う(図3のステップST11)。
すなわち、領域設定部1321が、認識対象とする複数文字の全体を含むように矩形領域RCTAを設定する。
この場合、図5に示すように、数字列(文字列)「05−10−2016」を囲むように矩形領域RCTAが設定される。ただし、図5の画像は、図4の画像と比較すると、文字列と背景の間の明瞭性が全体的にまたは部分的に著しく損なわれている。
領域設定部1321において、矩形領域RCTAの高さH(Y軸方向)は、この文字列の位置がわかっている場合には、その情報に基づいて決める。
文字列の位置がわからない場合には、適切な方法によって文字列のY軸方向の位置を決定し、その情報に基づいて矩形領域RCTAの上辺と下辺の位置を決めればよい。
矩形領域RCTAの幅Nは、その文字列の位置が一定の場合は、その標準的な位置情報に基づいて決める。
文字が並んでいる方向の位置が一定でない場合は、適切な方法によって文字列のX軸方向の位置を決定し、その情報に基づいて矩形領域の左辺と右辺の位置を決めればよい。
文字位置の誤差を考慮して、実際の文字の縁位置から適当な余白を設けるようにすることが望ましい。
次に、射影生成部1322が射影生成を行う(図3のステップST12)。
射影は文字の画像をX軸およびY軸に投影したものである。
図5の数字列(文字列)「05−10−2016」の部分に対して最小画素値の第1および第2射影を求めた結果の射影PX、PYの特性曲線(プロファイル)が、図5(B)、(C)に示されている。
すなわち、ステップST12において、射影生成部1322により、領域設定部1321により設定される矩形領域RCTA内において、X軸方向に配列された画素に関する最小画素値のX軸への第1射影PXおよびY軸方向に配列された画素に関する最小画素値のY軸への第2射影PYが生成される。
次に、二値化しきい値取得部1323が二値化しきい値を取得する(図3のステップST13)。
二値化しきい値取得部1323は、第1射影PXの最小画素値、本実施形態では最小輝度値に基づき移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)のしきい値とする。
次に、位置検出部1324がこの最終の二値化しきい値に基づき文字区切り位置を求める(図3のステップST14)。
ここで、二値化しきい値取得部の具体的な方法について説明する。
いま、第1射影をPX(i)とし、移動平均をPXAとすると、移動平均PXAは図5(B)に示すような曲線となる。
いま、第1射影PXのn番目の点をPX(n)とし、図6に示すように、平均区間幅を(2W+1)とすると、点nにおける移動平均PXA(n)は次式で与えられる。
Figure 0006599672
実際には、n+1番目の移動平均PXA(n+1)は、n番目の移動平均PXA(n)の計算結果を用いて次式で求められる。このような操作をn=1・・・Nについて漸化的に実行することでしきい値曲線(移動平均PXA)を効率よく求めることができる。
Figure 0006599672
以上の処理は、二値化しきい値取得部1323が、射影生成部1322で生成された第1射影PXの最小画素値(最小輝度値)を求めて最小画素曲線(最小輝度曲線)を生成し、この最小画素曲線(最小輝度曲線)の移動平均を求めて平滑化して平均画素曲線(平均輝度曲線)PXAを求める、処理に相当する。
そして、求めた移動平均PXAを二値化しきい値として、図5(A)に示すような画像に対する二値化処理を行うと、図7に示すような二値化画像が得られる。
図7に示す画像は、二値化対象の画像が文字列と背景の間の明瞭性が全体的にまたは部分的に著しく損なわれている場合であっても、ノイズが少なく、良好な結果であることがわかる。
これは、移動平均を二値化しきい値の取得に用いると、注目画素近傍の画素の輝度分布に対する追従性に優れるからである。
[文字認識装置の全体の動作]
次に、本実施形態に係る文字認識装置10の全体的な動作について図8に関連付けて説明する。
図8は、本実施形態に係る文字認識装置10の全体の動作を説明するためのフローチャートである。
ステップST101:
カードなどの記録媒体20のOCR文字記録領域21に印刷されたOCR文字列は、媒体搬送機構111の搬送ガイドに沿って記録媒体を動かすと1次元撮像素子11によってその文字パターンが読み取られて光電変換される(ステップST101)。
ステップST102:
光電変換で得られた信号は、増幅器で増幅され、A/D変換器でデジタル信号に変換されて画像メモリ12に取り込まれる(ステップST102)。
ステップST103:文字列切り出し部
次いで、行切り出し部131において、行切り出しが行われる(ステップST103)。
より具体的には、行切り出し部131において、画像メモリ12から画像データを読み出して、文字列がX軸方向に射影されて、文字列の上下エッジが検出される。
そして、行切り出し部131においては、上下エッジの中心位置が、文字列の中心ラインと識別され行切り出しが行われる。
ステップST104:
次いで、文字区切り位置検出部1320を含む文字切り出し部132において、文字切り出しが行われる(ステップST104)。
より具体的には、文字切り出し部132の文字区切り位置検出部1320において、認識対象となる複数文字を囲む暫定切り出し矩形領域RCTAが領域設定部1321により設定される。そして、射影生成部1322においてその矩形領域において射影が生成される。
たとえば、射影生成部1322において、領域設定部1321により設定される矩形領域RCTA内において、X軸方向に配列された画素に関する最小画素値のX軸への第1射影PXおよびY軸方向に配列された画素に関する最小画素値のY軸への第2射影PYが生成される。
次に、二値化しきい値取得部1323において、射影生成部1322で生成された第1射影PXの最小画素値(本例では最小輝度値)に基づき移動平均PXAが求められ、この移動平均PXAが矩形領域(設定領域)の二値化しきい値として用いられる。
より具体的には、二値化しきい値取得部1323において、射影生成部1322で生成された第1射影PXの最小輝度値を求めて最小輝度曲線が生成される。
そして、二値化しきい値取得部1323において、求めた最小輝度曲線の移動平均が求められて平滑化して平均輝度曲線が求められ、この平均輝度曲線が矩形領域(設定領域)における文字切り出し用二値化しきい値として用いられる。
次に、位置検出部1324において、取得されたしきい値を用いて文字の境界位置が検出され、これに基づき文字が切り出された二値化画像が得られる。
以降の処理は、この白黒二値化画像を用いて行われる。
ステップST104の処理が終了すると、認識対象となっている文字の外接矩形領域(上下左右の座標値)が求められる。
ステップST105:
次いで、特徴抽出部133において特徴抽出が行われる(ステップST105)。
より具体的には、特徴抽出部133においては、上述した外接矩形領域が任意のサブ領域に分割(たとえば1個の外接矩形領域を5×5の領域に分割され、そのうち1個の領域がサブ領域とされる)され、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合が求められ、それらを要素とする特徴ベクトルが生成される。
ステップST106:
次いで、特徴比較部134において、特徴比較が行われる(ステップST106)。
より具体的には、特徴比較部134においては、ステップST105で求めた特徴ベクトルが、あらかじめこの記録媒体で使用される全文字について求められてあらかじめ特徴辞書格納部135に格納されている基準特徴ベクトルと比較されて、類似度(たとえば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定される。
ステップST107:
最後に、文字認識が行われる(ステップST107)。
より具体的には、ステップST106の特徴比較によって設定された候補文字が、記録媒体に用いられた文字として認識される。
以上のように、本実施形態によれば、文字認識装置10は、認識対象となる複数文字を囲む暫定切り出し矩形領域RCTAを設定し、その矩形領域RCTAにおいて射影を生成する。文字認識装置10は、射影生成に際し、矩形領域(設定領域)RCTA内において、文字が並んでいる文字並び方向に配列された画素に関する画素値のX軸への第1射影PX(および文字並び方向に直交する方向に配列された画素に関する画素値のY軸への第2射影PY)を生成する。
文字認識装置10は、第1射影PXの最小画素値、本実施形態では最小輝度値に基づき移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)の二値化しきい値とする。
より具体的には、文字認識装置10は、第1射影PXの最小画素値(本実施形態では最小輝度値)を求めて最小画素曲線(最小輝度曲線)を生成し、この最小画素曲線(最小輝度曲線)を移動平均を求めて平滑化して平均画素曲線(平均輝度曲線)を求め、この平均画素曲線(平均輝度曲線)を矩形領域(設定領域)における文字切り出し用二値化しきい値として取得する。
そして、文字認識装置10は、求めた二値化しきい値に基づき文字区切り位置を求める。
(本実施形態の主な効果)
したがって、本実施形態によれば、以下の効果を得ることができる。
本実施形態においては、画像二値化処理を行うに際し、文字認識対象とする文字列を含む矩形領域(設定領域)RCTAについて、文字並び方向(X軸方向)に配列された画素に関する画素値のX軸への第1射影PX(または射影PY)を求め、第1射影PXの最小画素値、本実施形態では最小輝度値に基づき移動平均PXAを求め、この移動平均PXAを矩形領域(設定領域)の二値化しきい値とする。
その結果、本実施形態によれば、二値化しきい値が背景側に偏ることを抑制することが可能となる。その結果、二値化画像において文字線画が必要以上に太くなることを抑制することが可能となる。また、文字と背景との間の明瞭性が変動するような画像条件下においても精度の高い二値化処理結果を得ることが可能となり、結果として良好な二値化画像を得ることが可能となる。その結果として文字認識性能の向上を図ることが可能となる。
また、本実施形態において、二値化しきい値取得部1323は、射影の最小画素値に応じた最小画素曲線を移動平均処理して得られた平均画素曲線を文字並び方向の画素位置に対応するしきい値とする。
本実施形態によれば、移動平均をしきい値に用いることにより、注目画素近傍の画素の分布(輝度分布)に対する追従性が高められ、その結果、良好な二値化画像を得ることが可能となる。
また、本実施形態において、二値化しきい値取得部1323は、射影の最小画素値を求めて最小画素曲線を生成し、この最小画素曲線の移動平均を求めて平滑化して平均画素曲線を求め、この平均画素曲線を文字並び方向の画素位置に対応するしきい値とする。
本実施形態によれば、画像二値化処理は、認識対象とする文字列を含む矩形領域について、最小画素曲線を最適に二等分して得られる画素値をしきい値として用いるのではなく、最小画素曲線を移動平均処理して得られる平均画素曲線PXAをしきい値として用いるようにしたことにより、二値化しきい値の適正化を図れ、注目画素近傍の画素の分布(輝度分布)に対する追従性が高められ、その結果、良好な二値化画像を得ることが可能となる。
また、本実施形態において、射影生成部1322は、文字並び方向に直交する方向に配列された画素に関する画素値の第2射影PYを生成する。
これにより、選択した行において、その行の文字が文字並び方向に直交する方向に占める位置を規定することが可能となる。
(他の実施形態)
本実施形態の文字認識装置10は、認識対象としては活字文字だけでなく手書き文字にも適用可能である。また、文字認識に留まらず、1次元や2次元のバーコードの復号などにも、適正なバー幅の白黒比率の確保を狙いとした応用が可能である。
また、本実施形態の文字認識装置10は、カードのみならず、パスポート、運転免許証など、あらゆる記録媒体への適用が可能である。
また、本実施形態によれば、文字の境界が明確なケースに本方式を適用しても同様の結果を得ることができる。
なお、以上詳細に説明した方法は、上記手順に応じたプログラムとして形成し、CPU等のコンピュータで実行するように構成することも可能である。
また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
10・・・文字認識装置、11・・・撮像素子(画像読取部)、12・・・画像メモリ、13・・・データ処理部、131・・・行切り出し部(文字列切り出し部)、132・・・文字切り出し部、1320・・・文字区切り位置検出部、1321・・・領域設定部、1322・・・射影生成部、1323・・・二値化しきい値取得部、1324・・・位置検出部、133・・・特徴抽出部、134・・・特徴比較部、135・・・特徴辞書格納部、136・・・類似文字認識部、RCTA・・・矩形領域。

Claims (12)

  1. 記録媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し装置であって、
    前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出部を有し、
    前記文字区切り位置検出部は、
    前記文字の区切り位置を検出する領域を設定する領域設定部と、
    少なくとも前記領域設定部により設定される設定領域内において、文字が並んでいる文字並び方向に配列された画素に関する、文字並び方向に直交する方向への画素値の射影を生成する射影生成部と、
    前記射影の前記文字並び方向に直交する方向に配置された各画素に関する画素値のうち最小の画素値である最小画素値から生成された前記文字並び方向に対する最小画素曲線に基づき移動平均を求め、当該移動平均を設定領域の二値化しきい値とする二値化しきい値取得部と、
    前記二値化しきい値取得部で求めた前記二値化しきい値に基づき文字区切り位置を求める位置検出部と、を含む
    ことを特徴とする文字切り出し装置。
  2. 前記二値化しきい値取得部は、
    前記射影の最小画素値に応じた最小画素曲線を移動平均処理して得られた平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
    ことを特徴とする請求項1に記載の文字切り出し装置。
  3. 前記二値化しきい値取得部は、
    前記射影の最小画素値を求めて最小画素曲線を生成し、当該最小画素曲線の移動平均を求めて平滑化して平均画素曲線を求め、当該平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
    ことを特徴とする請求項1または2に記載の文字切り出し装置。
  4. 前記射影生成部は、
    前記文字並び方向に直交する方向に配列された画素に関する画素値の射影を生成する
    ことを特徴とする請求項1から3のいずれか一に記載の文字切り出し装置。
  5. 画像データから切り出された文字列から各文字を切り出して文字を認識する文字認識装置であって、
    記録媒体上の文字列を撮像して画像データとして読み取る画像読取部と、
    前記画像読取部による読み取り画像を格納する画像メモリと、
    前記画像メモリに格納された前記画像データから文字列を切り出し、当該文字列から文字を切り出して文字認識を行うデータ処理部と、を有し、
    前記データ処理部は、
    切り出された前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出部を備えた文字切り出し部を含み、
    前記文字区切り位置検出部は、
    前記文字の区切り位置を検出する領域を設定する領域設定部と、
    少なくとも前記領域設定部により設定される設定領域内において、文字が並んでいる文字並び方向に配列された画素に関する、文字並び方向に直交する方向への画素値の射影を生成する射影生成部と、
    前記射影の前記文字並び方向に直交する方向に配置された各画素に関する画素値のうち最小の画素値である最小画素値から生成された前記文字並び方向に対する最小画素曲線に基づき移動平均を求め、当該移動平均を設定領域の二値化しきい値とする二値化しきい値取得部と、
    前記二値化しきい値取得部で求めた前記二値化しきい値に基づき文字区切り位置を求める位置検出部と、を含む
    とを特徴とする文字認識装置。
  6. 前記二値化しきい値取得部は、
    前記射影の最小画素値に応じた最小画素曲線を移動平均処理して得られた平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
    ことを特徴とする請求項5に記載の文字認識装置。
  7. 前記二値化しきい値取得部は、
    前記射影の最小画素値を求めて最小画素曲線を生成し、当該最小画素曲線の移動平均を求めて平滑化して平均画素曲線を求め、当該平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
    ことを特徴とする請求項5または6に記載の文字認識装置。
  8. 前記射影生成部は、
    前記文字並び方向に直交する方向に配列された画素に関する画素値の射影を生成する
    ことを特徴とする請求項5から7のいずれか一に記載の文字認識装置。
  9. 記録媒体上の文字列を撮像して得られた画像データを処理することによって、前記文字列から各文字を切り出す文字切り出し方法であって、
    前記文字列を形成する文字の区切り位置を検出する文字区切り位置検出ステップを有し、
    前記文字区切り位置検出ステップは、
    前記文字の区切り位置を検出する領域を設定する領域設定ステップと、
    少なくとも前記領域設定ステップにより設定される設定領域内において、文字が並んでいる文字並び方向に配列された画素に関する、文字並び方向に直交する方向への画素値の射影を生成する射影生成ステップと、
    前記射影の前記文字並び方向に直交する方向に配置された各画素に関する画素値のうち最小の画素値である最小画素値から生成された前記文字並び方向に対する最小画素曲線に基づき移動平均を求め、当該移動平均を設定領域の二値化しきい値とする二値化しきい値取得ステップと、
    前記二値化しきい値取得ステップで求めた前記二値化しきい値に基づき文字区切り位置を求める位置検出ステップと、を含む
    ことを特徴とする文字切り出し方法。
  10. 前記二値化しきい値取得ステップでは、
    前記射影の最小画素値に応じた最小画素曲線を移動平均処理して得られた平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
    ことを特徴とする請求項9に記載の文字切り出し方法。
  11. 前記二値化しきい値取得ステップでは、
    前記射影の最小画素値を求めて最小画素曲線を生成し、当該最小画素曲線の移動平均を求めて平滑化して平均画素曲線を求め、当該平均画素曲線を文字並び方向の画素位置に対応する二値化しきい値とする
    ことを特徴とする請求項9または10に記載の文字切り出し方法。
  12. 前記射影生成ステップでは、
    前記文字並び方向に直交する方向に配列された画素に関する画素値の射影を生成する
    ことを特徴とする請求項9から11のいずれか一に記載の文字切り出し方法。
JP2015142909A 2015-07-17 2015-07-17 文字切り出し装置、文字認識装置、および文字切り出し方法 Active JP6599672B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015142909A JP6599672B2 (ja) 2015-07-17 2015-07-17 文字切り出し装置、文字認識装置、および文字切り出し方法
US15/208,922 US9858477B2 (en) 2015-07-17 2016-07-13 Character segmenting apparatus, character recognition apparatus, and character segmenting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015142909A JP6599672B2 (ja) 2015-07-17 2015-07-17 文字切り出し装置、文字認識装置、および文字切り出し方法

Publications (2)

Publication Number Publication Date
JP2017027201A JP2017027201A (ja) 2017-02-02
JP6599672B2 true JP6599672B2 (ja) 2019-10-30

Family

ID=57775101

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015142909A Active JP6599672B2 (ja) 2015-07-17 2015-07-17 文字切り出し装置、文字認識装置、および文字切り出し方法

Country Status (2)

Country Link
US (1) US9858477B2 (ja)
JP (1) JP6599672B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399405B (zh) * 2017-02-07 2023-06-27 腾讯科技(上海)有限公司 营业执照识别方法和装置
SG11202008145YA (en) 2018-02-26 2020-09-29 Videonetics Tech Private Limited A system for real-time automated segmentation and recognition of vehicle's license plates characters from vehicle's image and a method thereof.
CN111340029A (zh) * 2018-12-19 2020-06-26 富士通株式会社 用于识别收件人地址中的至少部分地址的装置和方法
JP2021009539A (ja) * 2019-07-01 2021-01-28 パナソニックIpマネジメント株式会社 文字領域決定方法
EP4071665A4 (en) * 2019-12-05 2023-11-22 Canaan Bright Sight Co., Ltd. CHARACTER SEGMENTATION METHOD AND APPARATUS, AND COMPUTER-READABLE STORAGE MEDIUM
CN112464928B (zh) * 2020-11-27 2024-03-15 广东电网有限责任公司 数字式表计读数识别方法、装置、设备及存储介质
CN114612892B (zh) * 2022-03-17 2024-04-09 佛山市南海区广工大数控装备协同创新研究院 一种pcb元器件表面3d字符分割方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02196565A (ja) * 1989-01-25 1990-08-03 Eastman Kodatsuku Japan Kk 画像二値化方式
US5200841A (en) * 1990-05-25 1993-04-06 Nikon Corporation Apparatus for binarizing images
JP3472094B2 (ja) * 1997-08-21 2003-12-02 シャープ株式会社 領域判定装置
JP4018310B2 (ja) * 1999-04-21 2007-12-05 株式会社リコー 画像二値化装置、画像撮像装置、画像二値化方法、画像撮像方法およびその方法の各工程としてコンピュータを機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体
AU2002251559B9 (en) * 2001-04-26 2006-06-29 Teijin Limited Three-dimensional joint structure measuring method
KR100703284B1 (ko) * 2003-01-30 2007-04-03 삼성전자주식회사 영상신호의 이진화 장치 및 방법
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
JP2007299210A (ja) * 2006-04-28 2007-11-15 Sharp Corp 画像処理装置、画像形成装置、画像読取装置及び画像処理方法
RU2395787C2 (ru) * 2008-05-19 2010-07-27 Государственный Научный Центр России "Государственное Научное Учреждение "Центральный Научно-Исследовательский И Опытно-Конструкторский Институт Робототехники И Технической Кибернетики"(Цнии Ртк) Способ обнаружения объектов
JP5334042B2 (ja) * 2008-11-23 2013-11-06 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
JP6171167B2 (ja) 2012-12-28 2017-08-02 日本電産サンキョー株式会社 文字認識装置、文字認識方法、及び文字認識プログラム
JP6487255B2 (ja) * 2015-03-31 2019-03-20 日本電産サンキョー株式会社 文字切り出し装置、文字認識装置、および文字切り出し方法
CN105005997B (zh) * 2015-08-05 2017-11-14 哈尔滨工业大学 一种基于行列直线聚类的多类型bga芯片视觉识别方法

Also Published As

Publication number Publication date
JP2017027201A (ja) 2017-02-02
US20170017836A1 (en) 2017-01-19
US9858477B2 (en) 2018-01-02

Similar Documents

Publication Publication Date Title
JP6599672B2 (ja) 文字切り出し装置、文字認識装置、および文字切り出し方法
JP6487255B2 (ja) 文字切り出し装置、文字認識装置、および文字切り出し方法
JP6268023B2 (ja) 文字認識装置およびその文字切り出し方法
JP4232800B2 (ja) ラインノイズ除去装置、ラインノイズ除去方法、ラインノイズ除去プログラム
JP5334042B2 (ja) 文字列認識方法及び文字列認識装置
JP6171167B2 (ja) 文字認識装置、文字認識方法、及び文字認識プログラム
JP4658848B2 (ja) 文字列認識方法及び文字列認識装置
US20080298648A1 (en) Method and system for slap print segmentation
JP6039413B2 (ja) 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム
JP2010170539A5 (ja)
JP4238902B2 (ja) 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
US11532148B2 (en) Image processing system
WO2017108222A1 (en) Image processing system
JP5011508B2 (ja) 文字列認識方法及び文字列認識装置
JP2008250754A (ja) 文字列認識方法及び文字列認識装置
JP5630689B2 (ja) 文字認識方法及び文字認識装置
WO2018061997A1 (ja) 媒体認識装置および媒体認識方法
JPH08305795A (ja) 文字認識方法
Chanda et al. Font identification—In context of an Indic script
JP6138038B2 (ja) 帳票識別装置および帳票識別方法
JP4978460B2 (ja) バーコード認識装置及びプログラム
EP2380110A2 (en) A method for evaluating quality of image representing a fingerprint pattern
JP2580976B2 (ja) 文字切出し装置
JP4377283B2 (ja) 特徴抽出装置、特徴抽出方法、および、プログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20171121

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180611

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191003

R150 Certificate of patent or registration of utility model

Ref document number: 6599672

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150