JP2014146091A - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP2014146091A JP2014146091A JP2013012910A JP2013012910A JP2014146091A JP 2014146091 A JP2014146091 A JP 2014146091A JP 2013012910 A JP2013012910 A JP 2013012910A JP 2013012910 A JP2013012910 A JP 2013012910A JP 2014146091 A JP2014146091 A JP 2014146091A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- character
- target area
- module
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】画像処理装置の設定手段は、画像内の認識対象領域を設定し、認識手段は、前記設定手段によって設定された認識対象領域を文字認識し、表示手段は、前記認識結果を表示し、前記設定手段は、前記表示手段による表示が行われた後に、1回目に設定された認識対象領域よりも小さい領域が、操作者の操作に応じて設定されるように制御する。
【選択図】図1
Description
請求項1の発明は、画像内の認識対象領域を設定する設定手段と、前記設定手段によって設定された認識対象領域を文字認識する認識手段と、前記認識手段による認識結果を表示する表示手段を具備し、前記設定手段は、前記表示手段による表示が行われた後に、1回目に設定された認識対象領域よりも小さい領域が、操作者の操作に応じて設定されるように制御することを特徴とする画像処理装置である。
ことを特徴とする請求項2又は3に記載の画像処理装置である。
<<第1の実施の形態>>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
第1の実施の形態である画像処理装置は、図1の例に示すように、文書画像データ105中の文字認識対象領域を設定する認識対象領域設定モジュール110と、文字画像データを認識して認識結果125を出力する文字認識モジュール120と、文字認識モジュール120における認識結果125を格納する認識結果格納モジュール150と、文字認識モジュール120における認識結果125を表示する認識結果表示モジュール160で構成される。またさらに文字認識モジュール120は、設定された対象領域中の文字画像データから切出し可能な単文字候補領域を順次切出す文字切出しモジュール130と、切出された各単文字候補領域中の文字画像を認識して、各単文字候補領域に対する認識結果を出力する単文字認識モジュール140とで構成される。
そして、2回目以降の設定処理は、ユーザーによる操作に基づいて認識対象領域を設定する。2回目以降の設定処理は、前回の文字認識結果に間違いがあるとユーザーによって判断されて、再度文字認識を行うために行うものである。そして、認識対象領域設定モジュール110は、認識結果表示モジュール160による表示が行われた後に、1回目に設定された認識対象領域よりも小さい領域が、ユーザーの操作に応じて設定されるように制御する。ここで、「1回目に設定された認識対象領域よりも小さい領域」とは、設定される領域が、1回目に設定された認識対象領域内に含まれている状態であることをいう。例えば、ユーザーの操作によって、1回目に設定された認識対象領域をはみ出して設定された場合(設定されようとした場合)は、警告を発するようにしてもよいし、強制的にはみ出した部分を1回目に設定された認識対象領域よりも小さい領域になるように設定してもよい。
文字切出しモジュール130は、認識対象領域設定モジュール110によって設定された認識対象領域内から1文字に相当する単文字候補領域を切出す。また、文字切出しモジュール130は、認識対象領域設定モジュール110によって設定された認識対象領域内から切出し可能な複数の単文字候補領域を切出すようにしてもよい。つまり、単文字候補領域として複数の可能性がある場合は、その複数の単文字候補領域を切り出す。
単文字認識モジュール140は、文字切出しモジュール130によって切出された単文字候補領域に対して文字認識を行う。文字認識処理は、従来の公知の技術を用いればよい。また、単文字認識モジュール140は、単文字候補領域に対して複数の認識結果を出力するようにしてもよい。つまり、複数の認識結果がある場合は、その複数の認識結果を出力する。
認識結果表示モジュール160は、文字認識モジュール120と接続されている。認識結果表示モジュール160は、文字認識モジュール120による認識結果125を表示する。例えば、液晶ディスプレイ等に表示する。また、認識結果表示モジュール160は、位置情報に基づいて、認識対象領域内に単文字候補領域を判別できるように表示するようにしてもよい。例えば、位置情報から生成される単文字候補領域の矩形の枠線を表示するようにしてもよいし、その矩形内を淡い色等で表示するようにしてもよい。
図2のステップS202において、認識対象領域設定モジュール110は文字画像データ105中から認識対象となる文字画像を含む領域を設定する。設定する領域は、例えば図3に示すような認識対象領域300のように、1行(縦書きの場合は1列)又はその一部分と見做される画像領域を設定する。
さらにこの対象領域のユーザーの操作に基づく設定は、GUI(Graphical User Interface)を用いた設定が好ましい。例えば図4に示すように、本画像処理装置をPCアプリケーションとして構成し、画面表示とマウス操作を用いて対象領域を設定する。PCアプリケーションは、アプリケーション表示領域400の画像表示領域410内に文字画像データ105を表示し、ユーザーのマウス430に対する操作を受け付けて、カーソル420を用いて認識対象領域300を設定する。また、例えば図5に示すように、タッチパネルを備えたスマートファン又はタブレットデバイスといったタッチパネル情報処理装置500のアプリケーションとして本画像処理装置を構成し、タッチパネル情報処理装置500への画面表示とタッチ操作を用いて認識対象領域300を設定してもよい。
ステップS206において、単文字認識モジュール140は、切出した各文字候補領域に対して文字認識を行う。
ステップS208において、認識結果格納モジュール150は、文字認識モジュール120における認識結果(文字切出し位置及び認識文字コード)を格納する。また認識領域再設定時において、文字切出し位置が重なる認識結果に関しては、新しい認識結果で上書きして格納するようにする。
なお、認識結果格納モジュール150に格納される認識結果の詳細と、認識結果格納モジュール150における上書き格納の詳細は後述する。
また、これら表示方法は図5に示したようなタッチパネルを備えたスマートファン又はタブレットデバイスといったタッチパネル情報処理装置500における表示でも同様である。
ステップS202において、認識対象領域設定モジュール110による認識対象領域の再設定では、図7の例に示すように、文字切出しモジュール130における文字切出しがより正確に行われるように、つまりは単文字認識モジュール140における認識がより精度よく行われるように認識対象領域をより小さく設定されるように制御する。図7に示す具体例では、最小文字候補領域である「プ」1文字を再設定した認識対象領域700としている。もちろん図7の例に示すように1文字である必要はなく、認識可能である領域(1回目の認識対象領域300よりも小さい領域)を再設定すればよい。またステップS202における認識対象領域の再設定に関しても、図5に示したようなタッチパネルを備えたスマートファン又はタブレットデバイスといったタッチパネル情報処理装置500でも同様に、表示画面を確認しながらタッチ操作で再設定する。
ステップS204、ステップS206において、再設定した対象領域に対して文字切出しモジュール130、単文字認識モジュール140において、それぞれ文字切出し処理、文字認識処理を行う。
図8、図9において、認識結果格納モジュール150における上書き格納処理の具体例を示す。
図8(a)は、図6の例に示す認識対象領域再設定前の文字画像領域の一部分「プ」の認識結果に関して、文字切出しモジュール130における文字切出し位置の例(「プ」の画像を文字切出領域810と文字切出領域820の2つの単文字候補領域として切り出した例)を表した図であり、図8(b)は、先に認識結果格納モジュール150に格納された文字画像領域の一部分「プ」の画像に関する認識結果830の具体例である。図8(b)の認識結果830の具体例において、unicode欄840は認識した文字コードであり、top欄832、bottom欄834、left欄836、right欄838は、それぞれ図10の例に示すように、文字切出しモジュール130における文字候補領域を表す矩形の4つの座標値情報である。具体的には、文字画像データ105の左上を原点として、文字切出領域1010の左上角のy座標をtop1032、x座標をleft1036、右上角のy座標をtop1032、x座標をright1038、右下角のy座標をbottom1034、x座標をright1038、左下角のy座標をbottom1034、x座標をleft1036としたものである。
認識結果格納モジュール150では、認識対象領域の再設定処理で出力された結果(本具体例では図9(b)の結果)が、先に格納されている領域再設定前の認識結果(本具体例では図8(b)の結果)の文字候補領域を表す矩形情報に重複する場合は、重複する部分の認識結果を新しい認識結果で上書きする。つまり図8(b)の情報を図9(b)の情報で上書きする。ここでの重複は、文字切出領域810、文字切出領域820が、再設定された認識対象領域内の文字切出領域910に含まれている関係である。このような格納方法により、ユーザーが認識結果125を認識結果表示モジュール160で確認し、認識対象領域の再設定が必要であれば再設定を行うことで、再設定領域に相当する認識結果格納モジュール150に格納された情報が更新される。
ここで、図8、図9では、再設定前と再設定後で文字候補領域が統合される場合の具体例を示したが、図11、図12の例に示すように、再設定前と再設定後で文字候補領域が分割される場合でも同様である。
図11(a)は、図8(a)と同様に、ある文字画像領域の一部分「かっ」の認識結果に関する文字切出し位置(文字切出領域1110)を示した例であり、図11(b)は、図8(b)と同様に、その認識結果1130の具体例である。
図12(a)は、図9(a)と同様に、再設定領域として「か」ならびに「っ」をそれぞれ設定して得られた文字切出し位置(文字切出領域1210、文字切出領域1220)を示した図であり、図12(b)は、図9(b)と同様に、その認識結果1230の具体例である。
認識結果格納モジュール150では、図11、図12に示した、再設定前と再設定後で文字候補領域が分割される場合でも、図8、図9と同様に、認識対象領域の再設定処理で出力された結果が、先に格納されている領域再設定前の認識結果の文字候補領域を表す矩形情報に重複する場合は、重複する部分の認識結果を新しい認識結果で上書きする。ここでの重複は、再設定された認識対象領域内の文字切出領域1210が、文字切出領域1110に含まれている関係である。
(top, bottom, left, right, unicode)=(130, 235, 360, 460, 0×304b) ・・・(1)
を得る。この新しい認識情報と先に格納されている図11(b)に示す認識情報の矩形領域は重複するので、上記図12(b)−(1)の認識情報で図11(b)の認識情報を上書きする。
次にユーザーは文字画像領域「か」の認識結果が正しいことを認識結果表示モジュール160による表示で確認して、次の認識対象領域「っ」を設定して、認識結果(文字切出領域1220の位置及び文字認識コード)として図12(b)−(2)に示すように、
(top, bottom, left, right, unicode)=(210, 240, 461, 506, 0×3064) ・・・(2)
を得る。この新しい認識情報と先に格納されている図12(b)−(1)に示す認識情報の矩形情報は重複しないので、上記図12(b)−(2)の認識情報はそのまま認識結果格納モジュール150に格納される。
図2のステップS216において、認識結果格納モジュール150は、文字画像データ105の処理が完了した時点で、格納された認識結果(文字矩形情報及び認識文字コード)を出力する。
なお、本実施の形態以外の技術では、基本的にユーザーが誤認識部分を検出し、誤認識文字を修正する。しかしながら、複雑なレイアウトで表現された原稿や手書き文書などの文字認識処理で誤認識される文字が増加した場合には、ユーザーが誤認識部分を検出し、修正する負担が格段に増大し、修正作業に時間がかかる。またさらにユーザー自身の入力ミスにより正解文字データが得られない場合もあり得る。
図15は、第2の実施の形態の構成例についての概念的なモジュール構成図を示している。第2の実施の形態における画像処理装置は、ユーザーが文書画像データ105中の文字認識対象領域を設定する認識対象領域設定モジュール110と、文字画像データ105を認識して認識結果を複数出力する文字認識モジュール120と、文字認識モジュール120における認識結果を格納する認識結果格納モジュール150と、文字認識モジュール120における複数の認識結果1525を表示する認識結果表示モジュール160と、複数の認識結果1525のうち正しく認識したものを選択する認識結果選択モジュール1570とで構成される。
またさらに文字認識モジュール120は、設定された対象領域中の文字画像データから切出し可能な複数の単文字候補領域を順次切出す文字切出しモジュール130と、切出された各単文字候補領域中の文字画像を認識して、各単文字候補領域に対する認識結果を出力する単文字認識モジュール140とで構成される。なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
認識結果表示モジュール160は、文字認識モジュール120、認識結果選択モジュール1570と接続されている。認識結果表示モジュール160は、複数の認識結果1525を表示する。もちろんのことながら、文字切出しモジュール130又は単文字認識モジュール140が、それぞれ複数の文字切出し結果、複数の文字認識結果を出力する。
認識結果選択モジュール1570は、認識結果格納モジュール150、認識結果表示モジュール160と接続されている。認識結果選択モジュール1570は、認識結果表示モジュール160で表示された複数の認識結果から、ユーザーの操作に応じて認識結果を選択する。
図16のステップS1602において、認識対象領域設定モジュール110は文字画像データ105中から認識対象となる文字画像を含む領域を設定する。設定する領域は、第1の実施の形態で説明したように、例えば図3の例に示すような1行(あるいは1列)もしくはその一部分と見做される画像領域を設定する。
さらにこの対象領域の設定操作は、第1の実施の形態で説明したようにGUIを用いた設定が好ましい。
ステップS1606において、単文字認識モジュール140は、複数の切出し位置候補に基づく文字候補領域に対して文字認識を行い、複数の認識結果1525を出力する。
ステップS1608において、認識結果表示モジュール160は、文字認識モジュール120における複数の認識結果(文字切出し位置及び認識文字列(認識文字コード))1525を表示する。第2の実施の形態における認識結果表示モジュール160の複数の認識結果1525の表示方法は、具体的には、例えば図17に示すように各認識結果表示(文字矩形情報表示、認識文字情報表示)のペアである(認識対象領域1710、認識結果表示領域1712)、(認識対象領域1720、認識結果表示領域1722)、(認識対象領域1730、認識結果表示領域1732)を順次表示する。順次表示させる操作としては、GUIを用いたPCアプリケーションの場合には、例えばスペースキー押下で(認識対象領域1710、認識結果表示領域1712)→(認識対象領域1720、認識結果表示領域1722)→(認識対象領域1730、認識結果表示領域1732)・・・と順次表示するようにすればよい。またスマートフォンやタブレット場合にはタッチパネルのタップ操作で順次表示させるようにしてもよい。
ステップS1612において、ユーザーは認識対象領域中の文字画像データを正しく認識した認識結果を選択確定し、確定した認識結果を文字認識モジュール120は認識結果格納モジュール150に出力する。第2の実施の形態における認識結果の確定方法は、具体的には全て正しく認識した認識結果が表示されているときに(図17の例における(認識対象領域1720、認識結果表示領域1722)の結果表示)、例えばEnterキーを押下するようにすればよい。またスマートフォンやタブレットの場合には「OK」ボタンなど設け、タッチパネルによる「OK」ボタンのタップ操作で確定できるようにすればよい。
また前述したステップS1610において、複数の認識結果1525を認識結果表示モジュール160に順次表示させる場合について詳述したが、設定された認識対象領域が1文字に相当するような場合には、図18の例に示すように、一覧性を考慮して複数の認識結果1525を認識結果表示領域1802のようにリスト表示するようにしてもよい。認識結果表示領域1802内の認識文字コードは、ユーザーによって再設定された認識対象領域1800内の文字切出領域1810に対する複数の文字認識結果である。
以上、これまで述べたように、第2の実施の形態においては、ユーザーが認識対象領域を順次設定し、複数の認識結果1525からユーザーが正しい認識結果を選択する操作だけで正解認識データを取得できることが可能となる。またこれまで説明してきたように、例えばPC、スマートフォン、タブレットなどGUIを備えたデバイスなら同様に処理可能である。
図19は、第3の実施の形態の構成例についての概念的なモジュール構成図を示している。第3の実施例における画像処理装置は、ユーザーが文書画像データ105中の文字認識対象領域を設定する認識対象領域設定モジュール110と、文字画像データ105を認識して認識結果125を出力する文字認識モジュール120と、文字認識モジュール120における認識結果を格納する認識結果格納モジュール150と、文字認識モジュール120における認識結果125を表示する認識結果表示モジュール160と、ユーザーが認識結果として文字情報を追記する認識結果追記モジュール1970とで構成される。
またさらに文字認識モジュール120は、設定された対象領域中の文字画像データから切出し可能な単文字候補領域を順次切出す文字切出しモジュール130と、切出された各単文字候補領域中の文字画像を認識して、各単文字候補領域に対する認識結果を出力する単文字認識モジュール140とで構成される。
ここで、第3の実施の形態における認識結果追記モジュール1970について説明する。なお、第3の実施の形態における認識結果追記モジュール1970以外のモジュールは、第1の実施の形態におけるモジュールと同様であり、説明を省略する。
認識結果表示モジュール160は、文字認識モジュール120、認識結果追記モジュール1970と接続されている。
認識結果追記モジュール1970は、認識結果格納モジュール150、認識結果表示モジュール160と接続されている。認識結果追記モジュール1970は、認識対象領域内の文字認識の正解情報として文字情報を入力する。ユーザーの操作に応じて入力された文字情報を正解情報とする。具体的には、一文字の認識対象領域を設定した場合においても正しい認識結果が得られない場合に、ユーザーが認識対象領域の正解文字情報を追記して与えるものである。
例えば図20の認識結果表示領域2002の場合のように、ユーザーが設定した一文字の認識対象領域2000内の文字切出領域2010「プ」の複数の認識結果にどれも正しく認識したものが存在しない場合、ユーザーが認識対象領域2000「プ」に対する正解文字情報を追記する。認識結果追記モジュール1970における追記方法は、例えば図20の正解文字入力欄2020のように、GUIによるアプリケーション表示領域400中にユーザーが追記情報を入力可能なサブウインド(正解文字入力欄2020)を用意し、ユーザーが正解文字情報を入力して、Enterキーを押下することで、一文字認識対象領域「プ」の認識結果を、認識結果追記モジュール1970は認識結果格納モジュール150に出力するようにする。またスマートフォンやタブレットの場合には、例えば、同様に追記情報を入力可能な領域と「OK」ボタンなどを設け、タッチパネルによる「OK」ボタンのタップ操作で確定できるようにすればよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…認識対象領域設定モジュール
115…対象領域画像データ
120…文字認識モジュール
125…認識結果
130…文字切出しモジュール
140…単文字認識モジュール
150…認識結果格納モジュール
155…正解データ
160…認識結果表示モジュール
1570…認識結果選択モジュール
1970…認識結果追記モジュール
Claims (7)
- 画像内の認識対象領域を設定する設定手段と、
前記設定手段によって設定された認識対象領域を文字認識する認識手段と、
前記認識手段による認識結果を表示する表示手段
を具備し、
前記設定手段は、前記表示手段による表示が行われた後に、1回目に設定された認識対象領域よりも小さい領域が、操作者の操作に応じて設定されるように制御する
ことを特徴とする画像処理装置。 - 前記認識手段における認識結果を格納する格納手段
をさらに具備し、
前記認識手段は、
前記設定手段によって設定された認識対象領域内から1文字に相当する単文字候補領域を切出す文字切出し手段と、
前記文字切出し手段によって切出された単文字候補領域に対して文字認識を行う単文字認識手段
を有し、
前記格納手段は、認識結果として、前記単文字認識手段による文字認識結果である文字情報と前記文字切出し手段による切出し処理結果である単文字候補領域の位置情報を格納し、新しい認識結果と既に格納された認識結果の位置情報により示される単文字候補領域が重複する場合に上書きして格納する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記文字切出し手段は、前記設定手段によって設定された認識対象領域内から切出し可能な複数の単文字候補領域を切出し、
前記単文字認識手段は、前記単文字候補領域に対して複数の認識結果を出力する
ことを特徴とする請求項2に記載の画像処理装置。 - 前記表示手段は、前記位置情報に基づいて、前記認識対象領域内に単文字候補領域を判別できるように表示する
ことを特徴とする請求項2又は3に記載の画像処理装置。 - 前記表示手段は、複数の認識結果を表示し、
前記表示手段で表示された複数の認識結果から、操作者の操作に応じて認識結果を選択する選択手段
をさらに具備することを特徴とする請求項1から4のいずれか1項に記載の画像処理装置。 - 前記認識対象領域内の文字認識の正解情報として文字情報を入力する文字情報入力手段
をさらに具備することを特徴とする請求項1から5のいずれか1項に記載の画像処理装置。 - コンピュータを、
画像内の認識対象領域を設定する設定手段と、
前記設定手段によって設定された認識対象領域を文字認識する認識手段と、
前記認識手段による認識結果を表示する表示手段
として機能させ、
前記設定手段は、前記表示手段による表示が行われた後に、1回目に設定された認識対象領域よりも小さい領域が、操作者の操作に応じて設定されるように制御する
ことを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013012910A JP6003677B2 (ja) | 2013-01-28 | 2013-01-28 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013012910A JP6003677B2 (ja) | 2013-01-28 | 2013-01-28 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014146091A true JP2014146091A (ja) | 2014-08-14 |
JP6003677B2 JP6003677B2 (ja) | 2016-10-05 |
Family
ID=51426331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013012910A Active JP6003677B2 (ja) | 2013-01-28 | 2013-01-28 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6003677B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0562008A (ja) * | 1991-09-03 | 1993-03-12 | Hitachi Ltd | 文字認識方法 |
JPH05303619A (ja) * | 1992-04-24 | 1993-11-16 | Seiko Epson Corp | 電子スクラップブック |
JPH06274680A (ja) * | 1993-03-17 | 1994-09-30 | Hitachi Ltd | 文書認識方法およびシステム |
JP2001243422A (ja) * | 2000-02-28 | 2001-09-07 | Mitsubishi Electric Corp | 文字認識装置及び文字認識方法 |
JP2002230480A (ja) * | 2001-01-30 | 2002-08-16 | Toshiba Corp | 文字認識装置および文字認識結果修正方法 |
-
2013
- 2013-01-28 JP JP2013012910A patent/JP6003677B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0562008A (ja) * | 1991-09-03 | 1993-03-12 | Hitachi Ltd | 文字認識方法 |
JPH05303619A (ja) * | 1992-04-24 | 1993-11-16 | Seiko Epson Corp | 電子スクラップブック |
JPH06274680A (ja) * | 1993-03-17 | 1994-09-30 | Hitachi Ltd | 文書認識方法およびシステム |
JP2001243422A (ja) * | 2000-02-28 | 2001-09-07 | Mitsubishi Electric Corp | 文字認識装置及び文字認識方法 |
JP2002230480A (ja) * | 2001-01-30 | 2002-08-16 | Toshiba Corp | 文字認識装置および文字認識結果修正方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6003677B2 (ja) | 2016-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6119952B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6575132B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP7206729B2 (ja) | 情報処理装置及びプログラム | |
US11670067B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009223477A (ja) | 情報処理装置及び情報処理プログラム | |
JP4780184B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6003677B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5720182B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101790544B1 (ko) | 정보 처리 장치, 정보 처리 방법, 및 기억 매체 | |
JP2021152696A (ja) | 情報処理装置及びプログラム | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2008108153A (ja) | 情報処理システムおよび情報処理プログラム | |
JP6303531B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6260181B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5928714B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6421568B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6187307B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6323009B2 (ja) | 画像処理装置及び画像処理プログラム | |
EP3113031B1 (en) | Image processing device, image processing method, and program | |
JP6107490B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2016133888A (ja) | 情報処理装置及び情報処理プログラム | |
JP6497012B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2023057446A (ja) | 文書認識装置および文書認識方法 | |
JP2021099688A (ja) | 画像処理装置、画像処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6003677 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |