JP6624120B2 - 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 - Google Patents

文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 Download PDF

Info

Publication number
JP6624120B2
JP6624120B2 JP2017034606A JP2017034606A JP6624120B2 JP 6624120 B2 JP6624120 B2 JP 6624120B2 JP 2017034606 A JP2017034606 A JP 2017034606A JP 2017034606 A JP2017034606 A JP 2017034606A JP 6624120 B2 JP6624120 B2 JP 6624120B2
Authority
JP
Japan
Prior art keywords
italic
character
font
determination
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2017034606A
Other languages
English (en)
Other versions
JP2018142066A (ja
Inventor
嶺雪 津田
嶺雪 津田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2017034606A priority Critical patent/JP6624120B2/ja
Priority to US15/901,951 priority patent/US10706337B2/en
Publication of JP2018142066A publication Critical patent/JP2018142066A/ja
Application granted granted Critical
Publication of JP6624120B2 publication Critical patent/JP6624120B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18067Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

本発明は、光学文字認識により画像内の文字を認識して文字コードを取得する文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体に関する。
近年、原稿をスキャン等して生成した画像データに、OCR(Optical Character Recognition)による文字認識を行って、文字の検索や編集が可能な電子データに変換することが行われている。このとき、原稿と同じ形式で電子データを作成するためには、原稿で使用されている文字のフォント(書体)を特定する必要がある。フォントにおいては、非斜体と斜体があり、非斜体文字の形状が他のフォントにおける斜体文字の形状と類似することがある。そのため、画像データ内の文字のフォントが斜体か否かを判定する技術が提案されている(例えば、特許文献1、2を参照)。
特許文献1の技術では、画像データ内の文字の輪郭画素の分布状態や重心位置、隣接文字が斜体か否か等の複数の条件に基づいて、斜体か否かを判定している。また、特許文献2の技術では、画像データ内の文字列の周辺分布(ヒストグラム)を作成し、文字間隔の明瞭となる周辺分布が文字列に対して垂直方向の場合に非斜体と判定し、文字列に対して斜め方向の場合に斜体と判定している。
特開昭58−80781号公報 特開平3−71380号公報
しかしながら、特許文献1の技術では、複数の情報に基づいて斜体判定しているため、処理に時間が掛かるという問題があった。また、特許文献2の技術では、文字列が短くなるほど情報量が減るため、誤識別につながりやすく、また、フォントによって斜体の傾きが違うため、斜体判定に用いる閾値を設定しにくいという問題があった。
本発明は上記課題に鑑みてなされたものであり、画像データ内の文字のフォントを斜体か否かにより簡易な処理で精度良く特定することができる技術を提供することを目的とする。
本発明の文字認識装置は、光学文字認識により画像データ内の文字を認識して文字コードを取得する文字認識装置であって、各文字コードの斜体フォントと非斜体フォントを含んで構成されるフォント辞書データと、文字の斜体判定に用いる複数の斜体判定手法の中から、前記光学文字認識により取得された前記文字コードに関連付けられた前記斜体判定手法を選択する判定手法選択部と、前記判定手法選択部により選択された前記斜体判定手法を用いて、前記画像データ内の文字が斜体か否かを判定する斜体判定部と、前記斜体判定部により斜体と判定された前記文字を前記フォント辞書データに含まれる前記斜体フォントのみと照合し、非斜体と判定された前記文字を前記フォント辞書データに含まれる前記非斜体フォントのみと照合することで、前記文字のフォントを特定するフォント特定部とを備えたことを特徴とする。
また、前記複数の斜体判定手法は、Hough変換による直線検出、重心比較及び最小二乗法による直線検出であってもよい。
また、前記斜体判定部は、前記Hough変換により前記文字の直線検出を行い、前記文字の縦方向の直線を検出した場合に非斜体と判定し、前記文字の縦方向以外の直線を検出した場合に斜体と判定してもよい。
また、前記斜体判定部は、前記文字の上端部側重心位置と下端部側重心位置とをそれぞれ算出し、前記文字の横方向に対する前記上端部側重心位置と前記下端部側重心位置との距離が特定距離内である場合を非斜体と判定し、特定距離外である場合を斜体と判定してもよい。
また、前記斜体判定部は、前記文字の縦方向の距離を最小とする直線を前記最小二乗法により検出し、前記文字の横方向の直線を検出した場合に非斜体と判定し、前記文字の横方向以外の直線を検出した場合に斜体と判定してもよい。
また、前記Hough変換による直線検出には、1、4、B、DからFまで、HからNまで、P、R、T、Y、b、d、f、hからnまで、pからrまで、t及びuを示す文字コードがそれぞれ関連付けられていてもよい。
また、前記重心比較には、0、2、3、7、8、A、C、G、O、S、UからXまで、Z、a、c、e、g、o、s及びvからzまでを示す文字コードがそれぞれ関連付けられていてもよい。
また、前記最小二乗法による直線検出には、5、6、9及びQを示す文字コードがそれぞれ関連付けられていてもよい。
また、前記判定手法選択部は、特定の前記文字コードについて、複数の前記斜体判定手法を選択し、前記斜体判定部は、前記判定手法選択部によって選択された前記複数の前記斜体判定手法のそれぞれを用いて、前記画像データ内の文字が斜体か否かを判定し、前記フォント特定部は、前記斜体判定部による前記複数の前記斜体判定手法を用いたそれぞれの判定結果が同一とならなかった場合に、例外的に前記斜体フォント及び前記非斜体フォントを含む前記フォント辞書データと照合して、前記文字のフォントを特定してもよい。
また、前記判定手法選択部は、前記フォント特定部によって特定されたフォントが特定種類のフォントである場合に限って、複数の前記斜体判定手法を選択してもよい。
本発明の文字認識方法は、光学文字認識により画像データ内の文字を認識して文字コードを取得する文字認識装置の文字認識方法であって、前記文字認識装置が、各文字コードの斜体フォントと非斜体フォントを含んで構成されるフォント辞書データと、文字の斜体判定に用いる複数の斜体判定手法の中から、前記光学文字認識により取得された前記文字コードに関連付けられた前記斜体判定手法を選択する判定手法選択ステップと、前記判定手法選択ステップにより選択された前記斜体判定手法を用いて、前記画像データ内の文字が斜体か否かを判定する斜体判定ステップと、前記斜体判定ステップにより斜体と判定された前記文字を前記フォント辞書データに含まれる前記斜体フォントのみと照合し、非斜体と判定された前記文字を前記フォント辞書データに含まれる前記非斜体フォントのみと照合することで、前記文字のフォントを特定するフォント特定ステップとを備えたことを特徴とする。
本発明の文字認識プログラムは、上記に記載の文字認識方法を、コンピューターに実行させるための文字認識プログラムであることを特徴とする。
本発明のコンピューター読み取り可能な記録媒体は、上記に記載の文字認識プログラムを記録したコンピューター読み取り可能な記録媒体であることを特徴とする。
本発明によれば、画像データ内の文字のフォントを斜体か否かにより簡易な処理で精度良く特定することができる。
本発明に係る実施形態の画像形成装置の概略構成を示す機能ブロック図である。 図1に示す判定表の登録例である。 Hough変換による直線検出を用いた斜体判定のイメージ図である。 重心比較による斜体判定のイメージ図である。 最小二乗法による直線検出を用いた斜体判定のイメージ図である。 図1に示す画像形成装置の文字認識処理の流れを示すフローチャートである。
以下、図を参照して本発明の実施形態を詳細に説明する。なお、以下の実施形態において、同様の機能を示す構成には、同一の符号を付してある。
以下の実施の形態では、文字認識装置として、図1に示すように、複写機や複合機等の画像形成装置1を例に説明する。画像形成装置1は、操作部11と、原稿読取部12と、記憶部13と、画像処理部14と、印刷部15と、通信部16と、制御部17とを備えている。
操作部11は、タッチパネルや、テンキー、リセットキー、ストップキー、スタートキー等の各種操作キーを備えたユーザーインターフェースである。
原稿読取部12は、図示しない原稿給紙装置により給紙されてきた原稿や、プラテンガラスに載置された原稿に対して光を照射し、その反射光等を受光して原稿画像を読み取るスキャナーである。
記憶部13は、半導体メモリーやHDD(Hard Disk Drive)等の記憶手段であり、原稿読取部12によって読み取られた画像データ、通信部16によって受信された画像データが蓄積される。また、記憶部13には、OCR辞書データ131、判定表132、フォント辞書データ133が記憶されている。
画像処理部14は、画像データに対して所定の画像処理を行う手段であり、例えば、拡大縮小処理や、濃度調整、階調調整等の画像改善処理が行われる。
印刷部15は、原稿読取部12によって読み取られた画像データ、記憶部13に記憶されている画像データ、通信部16によって受信された画像データに基づき画像を印刷する印刷手段である。
通信部16は、LAN(Local Area Network)やインターネット等のネットワークを介して、スマートフォンやパーソナルコンピューター等の外部端末との間で各種データを送受信する機能を有する。
制御部17は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を備えたマイクロコンピューター等の情報処理部である。ROMには画像形成装置1の動作制御を行うための制御プログラムが記憶されている。制御部17のCPUは、ROMに記憶されている制御プログラムを読み出し、制御プログラムをRAMに展開させて実行することで、操作部11から入力された所定の指示情報に応じて装置全体の制御を行う。また、制御部17は、文字認識部171、判定手法選択部172、斜体判定部173、フォント特定部174、電子データ出力部175として機能する。なお、制御部17が実行する制御プログラム(文字認識プログラム)は、コンピューター読み取り可能な記録媒体に記録されても良い。
文字認識部171は、OCR辞書データ131に基づいて、文字認識の対象とする画像データに光学文字認識を行って、画像データ内の文字を認識して文字コードを取得する機能を有する。これにより、画像データからフォントが未特定の状態の文字を示す文字コードが取得される。OCR辞書データ131は、光学文字認識用の識別パターンデータ等を含んで構成されている。
判定手法選択部172は、画像データ内の文字の斜体判定に用いる複数の斜体判定手法の中から、文字認識部171によって取得された文字コードに関連付けられた斜体判定手法を選択する機能を有する。具体的には、判定手法選択部172は、図2に示す判定表132に基づいて斜体判定手法を選択する。
判定表132に登録された斜体判定手法は、3つであり、(1)「Hough変換による直線検出」、(2)「重心比較」、(3)「最小二乗法による直線検出」である。判定表132では、0〜9、A〜Z、a〜zの1バイト文字を示す文字コードがそれぞれ(1)「Hough変換による直線検出」、(2)「重心比較」、(3)「最小二乗法による直線検出」のいずれかに関連付けられている。なお、図2に示す判定表132では、分かりやすく示すため、文字コードに対応する文字を記載している。
例えば、(1)「Hough変換による直線検出」には、「1」、「4」、「B」、「D」〜「F」、「H」〜「N」、「P」、「R」、「T」、「Y」、「b」、「d」、「f」、「h」〜「n」、「p」〜「r」、「t」、「u」が関連付けられている。(2)「重心比較」には、「0」、「2」、「3」、「7」、「8」、「A」、「C」、「G」、「O」、「S」、「U」〜「X」、「Z」、「a」、「c」、「e」、「g」、「o」、「s」、「v」〜「z」が関連付けられている。(3)「最小二乗法による直線検出」には、「5」、「6」、「9」、「Q」が関連付けられている。出願人による実験では、図2に示す判定表132の割り振りにより画像データ内の文字の斜体判定を高精度に行うことができた。
斜体判定部173は、判定手法選択部172により選択された斜体判定手法を用いて、画像データ内の文字が斜体か否かを判定する機能を有する。具体的には、斜体判定部173は、画像データから1文字ずつ文字を内包する矩形の文字画像領域(図3を参照)20を切り出し、切り出した文字画像領域20内の文字が斜体か否かを判定する。判定を行うと、斜体判定部173は、画像データ内の各文字に斜体又は非斜体を示す斜体情報を付与する。
(1)「Hough変換による直線検出」を用いた斜体判定手法では、斜体判定部173は、公知の直線検出アルゴリズムであるHough変換によって文字画像領域20内の文字の直線検出を行う。Hough変換による直線検出では、文字画像領域20内の特徴点(文字を構成する画素)を通る多数の仮想線の中から最も多くの特徴点を通る直線(文字の画素分布を代表する直線)30が検出される。判定表132において、「Hough変換による直線検出」に関連付けられた文字コードを示す文字である「1」、「4」、「B」、「D」〜「F」、「H」〜「N」、「P」、「R」、「T」、「Y」、「b」、「d」、「f」、「h」〜「n」、「p」〜「r」、「t」、「u」には、いずれも文字の構成要素として文字の縦方向の直線が含まれている。斜体判定部173は、図3(a)に示すように、文字画像領域20のy軸方向、すなわち文字の縦方向の直線30を検出した場合に、文字を非斜体と判定する。一方、斜体判定部173は、図3(b)に示すように、文字画像領域20のy軸方向以外、すなわち文字の縦方向以外の直線30を検出した場合に、文字を斜体と判定する。
(2)「重心比較」を用いた斜体判定手法では、斜体判定部173は、図4に示すように、文字画像領域20に対して、上端部側領域41aの特徴点に基づく上端部側重心位置42a(上端部側領域41a内の文字画素集合の中心位置)と、下端部側領域41bの特徴点に基づく下端部側重心位置42b(下端部側領域41b内の文字画素集合の中心位置)とをそれぞれ算出する。上端部側領域41aは、文字画像領域20内の文字の上端部をx軸方向(文字の横方向)に沿って特定範囲含む領域であり、下端部側領域41bは、文字画像領域20内の文字の下端部をx軸方向に沿って特定範囲含む領域である。
斜体判定部173は、文字画像領域20のx軸方向(文字の横方向)に対する上端部側重心位置42aと下端部側重心位置42bとの間の距離が特定距離内である場合に、文字を非斜体と判定する。一方、図4(b)に示すように、斜体判定部173は、文字画像領域20のx軸方向(文字の横方向)に対する上端部側重心位置42aと下端部側重心位置42bとの間の距離が特定距離外である場合に、文字を斜体と判定する。言い換えれば、上端部側重心位置42aと下端部側重心位置42bとのx座標が略同一の場合、非斜体と判定され、上端部側重心位置42aと下端部側重心位置42bとのx座標が略同一でない場合に斜体と判定される。
(3)「最小二乗法による直線検出」を用いた斜体判定手法では、斜体判定部173は、文字画像領域20の画素集合から公知の直線検出アルゴリズムである最小二乗法を用いて直線検出を行う。例えば、図5に示すように、斜体判定部173は、文字画像領域20の画素集合に対してy軸方向(文字の縦方向)の距離を最小とする直線50を最小二乗法により検出する。斜体判定部173は、図5(a)に示すように、文字画像領域20のx軸方向(文字の横方向)の直線50を検出した場合に、文字を非斜体と判定する。一方、図5(b)に示すように、斜体判定部173は、文字画像領域20のx軸方向以外(文字の横方向以外)の直線50を検出した場合に、文字を斜体と判定する。
フォント特定部174は、斜体判定部173により斜体と判定された文字をフォント辞書データ133に含まれる斜体フォント133aのみと照合し、斜体判定部173により非斜体と判定された文字をフォント辞書データ133に含まれる非斜体フォント133bのみと照合することで、文字のフォントを特定する。
電子データ出力部175は、画像データ内の文字をフォント特定部174によって特定されたフォントに置き換えて、例えばWord形式等の特定の文書作成ソフトで文字の編集が可能な電子データを作成して出力する機能を有する。
次に、図6を参照して、画像形成装置1の文字認識処理の流れを説明する。
原稿読取部12が文字認識の対象とする原稿をスキャンして原稿の画像データを取得すると(ステップs11)、文字認識部171は、OCR辞書データ131に基づいて画像データに対する光学文字認識を行って、画像データ内の文字を認識して文字コードを取得する(ステップs12)。なお、文字認識部171は、原稿読取部12により取得された画像データに限らず、通信部16を介して外部端末から受信する画像データや、記憶部13に記憶された画像データに対して光学文字認識を行っても良い。
つづいて、判定手法選択部172は、判定表132を参照し、文字の斜体判定に用いる複数の斜体判定手法の中から文字認識部171によって取得された文字コードに関連付けられた斜体判定手法を選択する(ステップs13)。これにより、文字コード毎に(1)「Hough変換による直線検出」、(2)「重心比較」、(3)「最小二乗法による直線検出」のいずれかが選択される。つづいて、斜体判定部173は、判定手法選択部172によって選択された斜体判定手法を用いて、画像データ内の各文字の斜体判定を行って(ステップs14)、画像データ内の各文字に斜体又は非斜体を示す斜体情報を付与する(ステップs15)。
つづいて、フォント特定部174は、画像データ内の文字の内、先頭から順にフォント未特定の文字を1つ選択し(ステップs16)、斜体情報に基づいて斜体文字か否かを判定する(ステップs17)。
斜体文字である場合(ステップs17でYes)、フォント特定部174は、この文字をフォント辞書データ133に含まれる斜体フォント133aのみと照合することで、フォントを特定する(ステップs18)。他方、斜体文字でない場合(ステップs17でNo)、フォント特定部174は、この文字をフォント辞書データ133に含まれる非斜体フォント133bのみと照合することで、フォントを特定する(ステップs19)。このように、フォント特定部174がフォントの特定対象とする文字には、予め斜体判定部173によって斜体又は非斜体を示す斜体情報が付与されている(斜体判定が行われている)。そのためフォント特定部174は、画像データ内の文字を非斜体フォント133bのみ又は斜体フォント133aのみとパターンマッチングすればよく、マッチングに掛かる時間を短縮することができる。
つづいて、フォント特定部174は、画像データ内の全文字のフォントが特定済となったか否かを判定し(ステップs20)、全文字のフォントを特定済でない場合(ステップs20でNo)、フォント未特定の文字を選択するステップs16に処理を戻す。
全文字のフォントが特定済となると(ステップs20でYes)、電子データ出力部175は、画像データ内の文字をフォント特定部174によって特定されたフォントに置換した電子データを作成し(ステップs21)、本処理を終了する。なお、電子データ出力部175は、画像データ内の各文字について、文字毎にフォント特定部174によって特定されたフォントに置換してもよいし、単語毎にフォント特定部174によって最も多く特定されたフォントに置換してもよいし、画像データ内でフォント特定部174によって最も多く特定されたフォントに置換してもよい。
このように、本実施形態の画像形成装置1は、光学文字認識により画像データ内の文字を認識して文字コードを取得する文字認識装置であって、各文字コードの斜体フォント133aと非斜体フォント133bを含んで構成されるフォント辞書データ133と、文字の斜体判定に用いる複数の斜体判定手法の中から、光学文字認識により取得された文字コードに関連付けられた斜体判定手法を選択する判定手法選択部172と、判定手法選択部172により選択された斜体判定手法を用いて、画像データ内の文字が斜体か否かを判定する斜体判定部173と、斜体判定部173により斜体と判定された文字をフォント辞書データ133に含まれる斜体フォント133aのみと照合し、非斜体と判定された文字をフォント辞書データ133に含まれる非斜体フォント133bのみと照合することで、文字のフォントを特定するフォント特定部174とを備えたことを特徴とする。これにより、画像形成装置1は、文字認識された文字コードに予め関連付けられた斜体判定手法を用いて画像データ内に文字が斜体か否かを判定し、判定結果に基づいて画像データ内の文字とフォントデータとのマッチング処理を行うことができる。したがって、画像形成装置1は、画像データ内の文字のフォントを斜体か否かにより簡易な処理で精度良く特定することができる。
なお、フォントの種類によっては斜体判定を誤判定しやすい文字コードがある。そこで、予め、斜体判定を誤判定しやすい文字コードについて、図2に示す判定表132の斜体判定手法とは異なる斜体判定手法を関連付けた補助判定表を記憶部13に記憶しておいても良い。例えば、「g」を示す文字コードに対して、判定表132では(2)「重心比較」が関連付けられているが、補助判定表では(3)「最小二乗法による直線検出」が関連付けられてもよい。
この場合、判定手法選択部172は、文字認識部171により取得された文字コードについて、判定表132と補助判定表とでそれぞれ異なる斜体判定手法が関連付けられている場合に、判定表132に登録された斜体判定手法と補助判定表に登録された斜体判定手法をそれぞれ選択しても良い。斜体判定部173は、判定手法選択部172によって複数の斜体判定手法が選択された場合、それぞれの斜体判定手法を用いて画像データ内の文字の斜体判定を行って、判定結果が同一となるか否かを確認してもよい。判定結果が同一とならなかった場合には、フォント特定部174は、例外的に斜体フォント133a及び非斜体フォント133bを含むフォント辞書データ133と照合して、文字のフォントを特定してもよい。一方、判定結果が同一の場合には、フォント特定部174は、判定結果に基づいて、斜体フォント133a又は非斜体フォント133bのいずれかと照合して、フォントを特定すればよい。
なお、判定手法選択部172は、フォント特定部174によって特定されたフォントが斜体判定を誤判定しやすい特定種類のフォントである場合に限って、補助判定表を参照し、文字コードに関連付けられた斜体判定手法として、判定表132から選択した斜体判定手法と異なる斜体判定手法を選択するようにしてもよい。つまり、特定されたフォントが誤判定しやすい特定種類のフォントである場合に、2個目の斜体判定手法が選択されてもよい。この場合、斜体判定部173は、補助判定表から選択された斜体判定手法を用いて再び画像データ内の文字が斜体か否かを判定し直せばよい。そして、斜体判定部173による判定結果が、判定表132に登録された斜体判定手法を用いた場合と異なる場合、フォント特定部174は、斜体判定部173による判定結果に基づいて、文字のフォントを特定し直してもよい。
本発明は上述した実施の形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々様々に変更が可能であることは言うまでもない。
1 画像形成装置
11 操作部
12 原稿読取部
13 記憶部
14 画像処理部
15 印刷部
16 通信部
17 制御部
20 文字画像領域
30 直線
41a 上端部側領域
41b 下端部側領域
42a 上端部側重心位置
42b 下端部側重心位置
50 直線
131 OCR辞書データ
132 判定表
133 フォント辞書データ
133a 斜体フォント
133b 非斜体フォント
171 文字認識部
172 判定手法選択部
173 斜体判定部
174 フォント特定部
175 電子データ出力部

Claims (13)

  1. 光学文字認識により画像データ内の文字を認識して文字コードを取得する文字認識装置であって、
    各文字コードの斜体フォントと非斜体フォントを含んで構成されるフォント辞書データと、
    文字の斜体判定に用いる複数の斜体判定手法の中から、前記光学文字認識により取得された前記文字コードに関連付けられた前記斜体判定手法を選択する判定手法選択部と、
    前記判定手法選択部により選択された前記斜体判定手法を用いて、前記画像データ内の文字が斜体か否かを判定する斜体判定部と、
    前記斜体判定部により斜体と判定された前記文字を前記フォント辞書データに含まれる前記斜体フォントのみと照合し、非斜体と判定された前記文字を前記フォント辞書データに含まれる前記非斜体フォントのみと照合することで、前記文字のフォントを特定するフォント特定部と
    を備えたことを特徴とする文字認識装置。
  2. 前記複数の斜体判定手法は、Hough変換による直線検出、重心比較及び最小二乗法による直線検出である
    ことを特徴とする請求項1に記載の文字認識装置。
  3. 前記斜体判定部は、
    前記Hough変換により前記文字の直線検出を行い、前記文字の縦方向の直線を検出した場合に非斜体と判定し、前記文字の縦方向以外の直線を検出した場合に斜体と判定する
    ことを特徴とする請求項2に記載の文字認識装置。
  4. 前記斜体判定部は、
    前記文字の上端部側重心位置と下端部側重心位置とをそれぞれ算出し、前記文字の横方向に対する前記上端部側重心位置と前記下端部側重心位置との距離が特定距離内である場合を非斜体と判定し、特定距離外である場合を斜体と判定する
    ことを特徴とする請求項2又は3に記載の文字認識装置。
  5. 前記斜体判定部は、
    前記文字の縦方向の距離を最小とする直線を前記最小二乗法により検出し、前記文字の横方向の直線を検出した場合に非斜体と判定し、前記文字の横方向以外の直線を検出した場合に斜体と判定する
    ことを特徴とする請求項2から3までのいずれか1項に記載の文字認識装置。
  6. 前記Hough変換による直線検出には、1、4、B、DからFまで、HからNまで、P、R、T、Y、b、d、f、hからnまで、pからrまで、t及びuを示す文字コードがそれぞれ関連付けられている
    ことを特徴とする請求項2から5までのいずれか1項に記載の文字認識装置。
  7. 前記重心比較には、0、2、3、7、8、A、C、G、O、S、UからXまで、Z、a、c、e、g、o、s及びvからzまでを示す文字コードがそれぞれ関連付けられている
    ことを特徴とする請求項2から6までのいずれか1項に記載の文字認識装置。
  8. 前記最小二乗法による直線検出には、5、6、9及びQを示す文字コードがそれぞれ関連付けられている
    ことを特徴とする請求項2から7までのいずれか1項に記載の文字認識装置。
  9. 前記判定手法選択部は、
    特定の前記文字コードについて、複数の前記斜体判定手法を選択し、
    前記斜体判定部は、
    前記判定手法選択部によって選択された前記複数の前記斜体判定手法のそれぞれを用いて、前記画像データ内の文字が斜体か否かを判定し、
    前記フォント特定部は、
    前記斜体判定部による前記複数の前記斜体判定手法を用いたそれぞれの判定結果が同一とならなかった場合に、例外的に前記斜体フォント及び前記非斜体フォントを含む前記フォント辞書データと照合して、前記文字のフォントを特定する
    ことを特徴とする請求項1から8までのいずれか1項に記載の文字認識装置。
  10. 前記判定手法選択部は、
    前記フォント特定部によって特定されたフォントが特定種類のフォントである場合に限って、複数の前記斜体判定手法を選択する
    ことを特徴とする請求項9に記載の文字認識装置。
  11. 光学文字認識により画像データ内の文字を認識して文字コードを取得する文字認識装置の文字認識方法であって、
    前記文字認識装置が、
    各文字コードの斜体フォントと非斜体フォントを含んで構成されるフォント辞書データと、
    文字の斜体判定に用いる複数の斜体判定手法の中から、前記光学文字認識により取得された前記文字コードに関連付けられた前記斜体判定手法を選択する判定手法選択ステップと、
    前記判定手法選択ステップにより選択された前記斜体判定手法を用いて、前記画像データ内の文字が斜体か否かを判定する斜体判定ステップと、
    前記斜体判定ステップにより斜体と判定された前記文字を前記フォント辞書データに含まれる前記斜体フォントのみと照合し、非斜体と判定された前記文字を前記フォント辞書データに含まれる前記非斜体フォントのみと照合することで、前記文字のフォントを特定するフォント特定ステップと
    を備えたことを特徴とする文字認識方法。
  12. 請求項11に記載の文字認識方法を、コンピューターに実行させるための文字認識プログラム。
  13. 請求項12に記載の文字認識プログラムを記録したコンピューター読み取り可能な記録媒体。
JP2017034606A 2017-02-27 2017-02-27 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 Expired - Fee Related JP6624120B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017034606A JP6624120B2 (ja) 2017-02-27 2017-02-27 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体
US15/901,951 US10706337B2 (en) 2017-02-27 2018-02-22 Character recognition device, character recognition method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017034606A JP6624120B2 (ja) 2017-02-27 2017-02-27 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2018142066A JP2018142066A (ja) 2018-09-13
JP6624120B2 true JP6624120B2 (ja) 2019-12-25

Family

ID=63246819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017034606A Expired - Fee Related JP6624120B2 (ja) 2017-02-27 2017-02-27 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体

Country Status (2)

Country Link
US (1) US10706337B2 (ja)
JP (1) JP6624120B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6963728B2 (ja) * 2018-02-26 2021-11-10 京セラドキュメントソリューションズ株式会社 画像処理装置
CN109308478B (zh) * 2018-09-26 2021-02-05 新华三信息安全技术有限公司 一种字符识别方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5880781A (ja) 1981-11-09 1983-05-14 Ricoh Co Ltd フオント識別方法
JPH0371380A (ja) 1989-08-11 1991-03-27 Seiko Epson Corp 文字認識装置
JPH03278290A (ja) * 1990-03-28 1991-12-09 Seiko Epson Corp 文字認識装置
US6496600B1 (en) * 1996-06-17 2002-12-17 Canon Kabushiki Kaisha Font type identification
JP2001134026A (ja) * 1999-11-02 2001-05-18 Canon Inc 画像処理装置及び方法、並びにコンピュータにより読み取り可能な記憶媒体
US20020181779A1 (en) * 2001-06-04 2002-12-05 Hansen Von L. Character and style recognition of scanned text
US7095894B2 (en) * 2002-09-04 2006-08-22 Lockheed Martin Corporation Method and computer program product for recognizing italicized text
JP5239419B2 (ja) * 2008-03-14 2013-07-17 オムロン株式会社 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造
CN103377371A (zh) * 2012-04-25 2013-10-30 佳能株式会社 用于改善识别特征的方法和***和光学字符识别***
JP6269256B2 (ja) * 2014-03-31 2018-01-31 京セラドキュメントソリューションズ株式会社 情報処理装置、画像形成装置、情報処理方法、及び情報処理プログラム

Also Published As

Publication number Publication date
JP2018142066A (ja) 2018-09-13
US10706337B2 (en) 2020-07-07
US20180247166A1 (en) 2018-08-30

Similar Documents

Publication Publication Date Title
US7567730B2 (en) Detecting an orientation of characters in a document image
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
KR102208683B1 (ko) 문자 인식 방법 및 그 장치
EP1374148B1 (en) Method and device for recognition of a handwritten pattern
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6000992B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
CN106649420B (zh) 图像处理设备和图像处理方法
US10503993B2 (en) Image processing apparatus
JP2021043775A (ja) 情報処理装置及びプログラム
JP6624120B2 (ja) 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体
JP5630689B2 (ja) 文字認識方法及び文字認識装置
JP6432179B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
EP3940628A1 (en) Image processing device, image reading device, image processing method, and program
JP6635057B2 (ja) 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
JP2020047138A (ja) 情報処理装置
JP2020087320A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
US11722615B2 (en) Image processing including adjusting image orientation
US20230063374A1 (en) Image processing apparatus, non-transitory storage medium, and image processing method
JP4697387B2 (ja) 原稿画像判定装置、原稿画像判定方法及びそのプログラム
JP6852359B2 (ja) 画像処理装置及びプログラム
JP2023046687A (ja) 情報処理装置、情報処理方法、およびプログラム
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JP2021149531A (ja) 情報処理装置、修正候補表示方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191111

R150 Certificate of patent or registration of utility model

Ref document number: 6624120

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees