JP2011228792A - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP2011228792A
JP2011228792A JP2010094200A JP2010094200A JP2011228792A JP 2011228792 A JP2011228792 A JP 2011228792A JP 2010094200 A JP2010094200 A JP 2010094200A JP 2010094200 A JP2010094200 A JP 2010094200A JP 2011228792 A JP2011228792 A JP 2011228792A
Authority
JP
Japan
Prior art keywords
character
area
overlapping
column
marking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010094200A
Other languages
English (en)
Inventor
大 ▲高▼田
Dai Takada
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Machinery Ltd
Original Assignee
Murata Machinery Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Machinery Ltd filed Critical Murata Machinery Ltd
Priority to JP2010094200A priority Critical patent/JP2011228792A/ja
Publication of JP2011228792A publication Critical patent/JP2011228792A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Control Or Security For Electrophotography (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】ユーザがラフにマーキングした場合であっても、ユーザが指定したい文字を特定することが可能な画像処理装置を提供する。
【解決手段】画像処理装置が搭載されたネットワーク複合機は、原稿の画像データを取得するスキャナと、マーキング領域を抽出するマーキング抽出部31と、文字列に含まれる文字毎に該文字が記載された文字記載領域を抽出する文字記載領域抽出部331と、文字記載領域とマーキング領域とが重なる重複文字領域を抽出する重複文字領域抽出部322と、重複文字領域と、該重複文字領域に対応する文字記載領域とについて、文字列方向の長さをそれぞれ算出する文字算出部333と、文字記載領域の文字列方向の長さに対する重複文字領域の文字列方向の長さに基づいて、文字が原稿上においてマーキングによって指定された文字か否かを判定する文字判定部334とを備える。
【選択図】図2

Description

本発明は、画像処理装置に関する。
マーカーペンで文字がマーキングされた原稿をスキャナで読み取って画像データを生成し、マーキングされた文字に対して削除、色変更、強調等の画像処理を施す画像処理装置が、下記特許文献1に開示されている。下記特許文献1に開示された画像処理装置は、画像処理の対象となる領域を特定するために、まず、マーカーペンによって塗り潰されたマーキング箇所と、文字が記載された矩形領域を求める。そして、この画像処理装置は、マーキング箇所を領域内に含む矩形領域を特定し、これを画像処理の対象とする。
特開2001−230919号公報
ところで、ユーザが原稿の文字をマーカーペン等でマーキングする際に、指定したい文字の隣の文字にマーキングが掛かってしまう場合がある。この場合、上記特許文献1に記載された画像処理装置では、指定したい文字の隣の文字が記載された矩形領域内に、マーキング箇所が位置するので、指定したくない文字まで画像処理対象として特定されてしまう。
このため、上記画像処理装置を用いる場合、ユーザは、指定したい文字だけをマーキングし、指定外の文字にはマーキングがかからないように、精緻にマーキングを行う必要がある。しかしながら、一般的に、文字が記載された領域を塗りつぶし易いように、マーキングには太いペンが使用されるので、指定したい文字の周囲の文字にマーキングがかからないようにするには、神経を使いながらマーキングする必要がある。
本発明は、上記問題点を解消する為になされたものであり、ユーザがラフにマーキングした場合であっても、ユーザが指定したい文字を特定することが可能な画像処理装置を提供することを目的とする。
本発明に係る画像処理装置は、原稿の画像データを取得する取得手段と、取得手段によって取得された画像データから、原稿上において着色されたマーキング領域を抽出するマーキング抽出手段と、原稿に並んで記載された複数の文字に含まれる文字毎に該文字が記載された文字記載領域を画像データから抽出する文字記載領域抽出手段と、文字記載領域抽出手段によって抽出された文字記載領域と、マーキング抽出手段によって抽出されたマーキング領域とが重なる重複文字領域を抽出する重複文字領域抽出手段と、重複文字領域抽出手段によって抽出された重複文字領域と、該重複文字領域に対応する文字記載領域とについて、複数の文字が並んだ方向の長さをそれぞれ算出する文字算出手段と、文字算出手段によって算出された文字記載領域の上記長さに対する重複文字領域の上記長さに基づいて、文字が原稿上においてマーキングによって指定された文字か否かを判定する文字判定手段とを備えることを特徴とする。
本発明に係る画像処理装置によれば、原稿上において着色されたマーキング領域が、画像データから抽出される。また、原稿に記載された複数の文字に含まれる文字毎に、該文字が記載された文字記載領域が、画像データから抽出される。そして、文字記載領域とマーキング領域とが重なる重複文字領域が抽出される。続いて、重複文字領域とこの重複文字領域に対応する文字記載領域とについて、上記複数の文字が並んだ方向の長さがそれぞれ算出される。そして、文字記載領域の上記長さに対する重複文字領域の上記長さに基づいて、マーキングによって指定された文字か否かが判定される。このため、ユーザがラフに文字をマーキングして、例えば、指定したい文字の隣の文字にまでマーキングがかかってしまった場合、又は、指定したい文字を完全に塗り潰していない場合であっても、マーキングされた度合いに基づいて、ユーザがマーキングによって指定したい文字か否かを判定できる。従って、ユーザがラフにマーキングした場合であっても、ユーザが指定したい文字を特定することが可能となる。
本発明に係る画像処理装置では、原稿に配列して記載された複数の文字列に含まれる文字列毎に該文字列が記載された列記載領域を画像データから抽出する列記載領域抽出手段と、列記載領域抽出手段によって抽出された列記載領域と、マーキング抽出手段によって抽出されたマーキング領域とが重なる重複列領域を抽出する重複列領域抽出手段と、重複列領域抽出手段によって抽出された重複列領域と、該重複列領域に対応する列記載領域とについて、文字列に含まれる複数の文字が並んだ方向と直交する直交方向の長さをそれぞれ算出する列算出手段と、列算出手段によって算出された列記載領域の直交方向の長さに対する重複列領域の直交方向の長さに基づいて、文字列が原稿上においてマーキングによって指定された文字を含むか否かを判定する列判定手段とを備えることが好ましい。
この好ましい構成によれば、原稿に記載された複数の文字列に含まれる文字列毎に、該文字列が記載された列記載領域が、画像データから抽出される。そして、列記載領域とマーキング領域とが重なる重複列領域が抽出される。続いて、重複列領域とこの重複列領域に対応する列記載領域とについて、文字列に含まれる複数の文字が並んだ方向と直交する直交方向の長さがそれぞれ算出される。そして、列記載領域の直交方向の長さに対する重複列領域の直交方向の長さに基づいて、文字列がマーキングによって指定された文字を含むか否かが判定される。このため、ユーザがラフに文字をマーキングして、例えば、指定したい文字列の隣の文字列にまでマーキングがかかってしまった場合、又は、指定したい文字列を完全に塗り潰していない場合でも、マーキングされた度合いに基づいて、ユーザがマーキングによって指定したい文字を含む文字列か否かを判定できる。従って、ユーザがラフにマーキングした場合であっても、ユーザの指定したい文字を含む文字列を特定することが可能となる。
本発明に係る画像処理装置では、文字判定手段は、列判定手段によって原稿上においてマーキングされた文字を含むと判定された文字列に含まれる複数の文字について、原稿上においてマーキングによって指定された文字か否かを判定することが好ましい。
この好ましい構成によれば、文字列単位で判定対象となる文字が抽出され、その後、抽出された文字列に含まれる文字がマーキングによって指定された文字か否かが判定される。従って、全ての文字について一つ一つ判定する場合と比較して、マーキングによって指定された文字を効率良く特定することができる。
本発明に係る画像処理装置では、重複列領域抽出手段によって抽出された重複列領域が、単数か複数かを判断する判断手段を備えることが好ましく、文字判定手段が、判断手段によって重複列領域が単数と判断された場合に、該重複列領域に対応する文字列に含まれる複数の文字について、原稿上においてマーキングによって指定された文字か否かを判定することが好ましい。
この好ましい構成によれば、重複列領域が単数か複数かについて判断されるので、複数の文字列に渡ってマーキングされているか否かを判断することができる。そして、重複列領域が単数の場合に、その重複列領域に対応する文字列に含まれる複数の文字について、原稿上においてマーキングによって指定された文字か否かが判定される。このため、マーキングされている文字列が1列の場合に、重複列領域の上記長さにかかわらず、その文字列に含まれる複数の文字を、判定対象の文字とすることができる。
本発明によれば、ユーザがラフにマーキングした場合であっても、ユーザの指定したい文字を特定することが可能となる。
実施形態に係る画像処理装置が搭載されたネットワーク複合機の構成を示すブロック図である。 ネットワーク複合機が有する制御部の構成を示すブロック図である。 制御部が有する列抽出部が、マーキングされた文字列の一例に対して行う列抽出処理を説明するための図である。 制御部が有する文字抽出部が、マーキングされた文字の一例に対して行う文字抽出処理を説明するための図である。 制御部が有する文字抽出部が、マーキングされた文字の別の例に対して行う文字抽出処理を説明するための図である。 ネットワーク複合機が行う指定文字の抽出処理の処理手順を示すフローチャート(前半部分)である。 ネットワーク複合機が行う指定文字の抽出処理の処理手順を示すフローチャート(後半部分)である。
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。まず、図1及び図2を用いて、実施形態に係る画像処理装置が搭載されたネットワーク複合機1の構成について説明する。図1は、ネットワーク複合機1の構成を示すブロック図である。図2は、ネットワーク複合機1が有する制御部30の構成を示すブロック図である。
ネットワーク複合機1は、LAN(Local Area Network)90に接続されたパーソナルコンピュータ5等の機器との間で情報の送受信が可能に構成され、プリント機能、スキャン機能、及びFAX機能を含む複合機能を備えた機器である。このネットワーク複合機1は、ユーザによって文字がマーキングされた原稿を読み取って画像データを生成し、マーキングによって指定された指定文字を特定する機能を有する。特定された指定文字に対しては、例えば、OCR(文字認識)処理、又は削除、色変換、強調等の編集処理が行われる。
上記機能を発揮するため、ネットワーク複合機1は、操作パネル10、ディスプレイ11、スキャナ12、プリンタ13、NCU(Network Control Unit)14、モデム15、LAN I/F(LANインターフェース)19、及び制御部30を備えている。なお、NCU14は、モデム15と公衆交換電話網(PSTN)91との接続を制御し、FAXの送受信機能を司るものである。
スキャナ12は、原稿を読み取って画像データを取得する。このスキャナ12は、特許請求の範囲に記載の取得手段として機能する。原稿には、複数の文字列が配列して記載され、一部の文字がマーキングされている。ここで、マーキングとは、原稿上の領域を原稿の背景色すなわち地の色とは異なる色で着色することである。ユーザは、例えば、カラーマーカー等で文字にラインを引くことで、文字をマーキングすることができる。また、文字が記載された領域を塗ることにより、文字をマーキングすることができる。このようにして文字をマーキングすることにより、ユーザは編集したい文字を指定する。
スキャナ12は、カラーで原稿を読み取って、RGB各色のデータを含む画像データを生成する。このため例えば、スキャナ12は、赤(R)、緑(G)、青(B)のカラーフィルタが貼り付けられた単板CCDを有し、RGB各色のデータを取得する。また、例えば、CCDに入射する光を分光プリズム内のダイクロック膜の反射によってRGBの3原色に分光する3CCD方式を用いてもよい。スキャナ12によって生成された画像データは、制御部30へ出力される。
制御部30は、CPU16、ROM17、及びRAM18等によって構成され、入力された画像データから、マーキングによって指定された指定文字を特定する。図2に示すように、制御部30は、機能的な構成要素として、マーキング抽出部31、列抽出部32、及び文字抽出部33を備える。
マーキング抽出部31は、スキャナ12から入力された画像データからマーキング領域を抽出する。マーキング領域は、原稿上の着色された領域である。例えば、マーキング抽出部31は、画像データをRGB色空間からHLS色空間に変換し、画像データに含まれる各画素のHLS色空間中の位置に基づいて、各画素がマーキング領域内の画素か否かを特定する。ここで、HLS色空間は、色相(Hue)、彩度(Saturation)、輝度(Lightness/Luminance)の3つの成分からなる色空間である。
マーキング抽出部31は、着色された画素の一固まりの領域をマーキング領域とし、位置座標データ等でマーキング領域を特定する。例えば、マーキング領域が矩形状であれば、4隅の位置座標データによってマーキング領域を特定することができる。マーキング抽出部31は、マーキング領域を特定する位置座標データを列抽出部32及び文字抽出部33へ出力する。なお、マーキング抽出部31は、特許請求の範囲に記載のマーキング抽出手段として機能する。
列抽出部32は、原稿に記載された複数の文字列のうち、指定文字を含む文字列を抽出する。列抽出部32は、上記処理を行うために、列記載領域抽出部321、重複列領域抽出部322、列算出部323、列判定部324、及び判断部325を有する。
列記載領域抽出部321は、文字列毎に文字列が記載された列記載領域を画像データから抽出する。列記載領域は、文字列が記載された領域を囲んだ矩形状の領域である。列記載領域抽出部321は、列記載領域の4隅の位置座標を特定することで、列記載領域を抽出できる。
例えば、一般的に、OCR処理を行う際に、文字列が記載された矩形状の領域の4隅を特定する位置座標データが生成される。列記載領域抽出部321は、OCR処理によって生成された位置座標データを利用して、文字列が記載された矩形状の領域の4隅の位置座標データを特定する。なお、列記載領域抽出部321は、特許請求の範囲に記載の列記載領域抽出手段として機能する。
重複列領域抽出部322は、マーキング領域と列記載領域とが重なった重複列領域を抽出する。この、重複列領域抽出部322は、特許請求の範囲に記載の重複列領域抽出手段として機能する。列算出部323は、重複列領域と列記載領域との、文字列方向に直交する直交方向の長さをそれぞれ算出する。文字列方向は、文字列に含まれる複数の文字が並んだ方向である。文字列方向は、例えば、文字列記載領域の長手方向に特定される。なお、列算出部323は、特許請求の範囲に記載の列算出手段として機能する。
列判定部323は、重複列領域の上記直交方向の長さが、列記載領域の上記直交方向の長さに対する所定の割合以上である場合に、判定対象の文字列が指定文字を含むと判定する。そして、重複列領域の上記長さが、列記載領域の上記長さに対する所定の割合より小さい場合に、文字列が指定文字を含まないと判定する。所定の割合は、例えば、2分の1に設定することができる。なお、列判定部324は、特許請求の範囲に記載の列判定手段として機能する。
判断部325は、重複列領域抽出部322によって抽出された重複列領域が、単数か複数かを判断する。これにより、マーキング領域と重なる文字列が複数ラインあるか否か、すなわち、複数の文字列に渡ってマーキングされているか否かを判断することができる。この判断部325は、特許請求の範囲に記載の判断手段として機能する。判断部325が、重複列領域が複数であると判断した場合、列算出部323及び列判定部324によって、文字列が指定文字を含むか否かが判断される。
図3を参照して、列抽出部32が文字列を抽出する列抽出方法について具体例を用いて説明する。図3に示すように、原稿には、一例として、複数(3列)の文字列41〜43が各文字列方向44と直交する直交方向45に並んで配列されている。図3において、グレーの矩形状の領域が、マーキング領域46である。この図3の例では、マーキング領域46が、複数の文字列41,42に渡っている。なお、図3では、マーキング領域46をグレーで示しているが、ピンクや黄色の蛍光ペン、その他の任意の色が着いていてもよい。このマーキング領域46は、上記のマーキング抽出部31によって抽出される。
列記載領域抽出部321は、上段の文字列41、中断の文字列42、及び下段の文字列43がそれぞれ記載された列記載領域411,421,431を抽出する。重複列領域抽出部322は、マーキング領域46と上段の文字列41の列記載領域411とが重なる重複列領域412を抽出する。また、重複列領域抽出部322は、マーキング領域46と中段の文字列42の列記載領域421とが重なる重複列領域422を抽出する。
この場合、判断部325は、重複列領域412,422が複数と判断する。重複列領域が複数と判断されたので、重複列領域412に対応する上段の文字列41と、重複列領域422に対応する中段の文字列42が、判定対象の文字列となる。
上段の文字列41について、列算出部323は、重複列領域412の直交方向45の長さ413と、列記載領域411の直交方向45の長さ414とを算出する。長さは、例えば、文字列方向44に沿った複数箇所について直交方向45の長さを算出し、算出した長さの平均値を用いることができる。そして、列判定部324は、算出した列記載領域411の長さ414に対する重複列領域412の長さ413に基づいて、文字列41が指定文字を含むか否かを判定する。
図3に示す例では、重複列領域412の長さ413が、列記載領域411の長さ414の半分以上でないので、文字列41は、指定文字を含まないと判断される。また、この方法によれば、中段の文字列42は、列判定部324によって指定文字を含むと判断される。下段の文字列43は、重複列領域がなく、全くマーキングされていないので、指定文字を含まないと判断される。これにより、ユーザが、ラフにマーキングし、マーキングしたい文字列が中段の文字列42のみであるにもかかわらず、その上段の文字列41にまでマーキングが掛かってしまった場合でも、ユーザのマーキングした文字列42のみを正確に抽出することができる。
なお、図3は、マーキング領域46と重なる文字列が複数ある場合について説明したが、マーキング領域46と重なる文字列が単数である場合は、判断部325によって重複列領域が単数と判断される。この場合、列判定部325は、重複列領域に対応する文字列が、指定文字を含むと判定する。列抽出部32は、列判定部324によって指定文字を含むと判定された文字列を抽出し、文字抽出部33へ出力する。
図2に示す文字抽出部33は、列抽出部32によって抽出された文字列に含まれる複数の文字から指定文字を抽出する。文字抽出部33は、指定文字を抽出するために、文字記載領域抽出部331、重複文字領域抽出部332、文字算出部333、及び文字判定部334を有する。
文字記載領域抽出部331は、判定対象となる文字列に含まれる文字毎に文字が記載された文字記載領域を画像データから抽出する。例えば、OCR処理を行う際に、各文字が記載された矩形状の領域の4隅を特定する位置座標データが生成される。文字記載領域抽出部331は、この4隅の位置座標データによって文字記載領域を特定し、抽出することができる。なお、文字記載領域抽出部331は、特許請求の範囲に記載の文字記載領域抽出手段として機能する。
重複文字領域抽出部332は、マーキング領域と文字記載領域とが重なった重複文字領域を抽出する。この、重複文字領域抽出部332は、特許請求の範囲に記載の重複文字領域抽出手段として機能する。文字算出部333は、重複文字領域と文字記載領域との、文字列方向44の長さをそれぞれ算出する。なお、文字算出部333は、特許請求の範囲に記載の文字算出手段として機能する。
文字判定部334は、重複文字領域の文字列方向44の長さが、文字記載領域の文字列方向44の長さに対する所定の割合以上である場合に、判定対象の文字が指定文字であると判定する。そして、重複文字領域の上記長さが、文字記載領域の上記長さに対する所定の割合より小さい場合に、判定対象の文字が指定文字でないと判定する。所定の割合は、例えば、2分の1に設定することができる。なお、文字抽出部33は、文字判定部334によって指定文字であると判定された文字を抽出する。
図4を参照して、文字抽出部33が文字を抽出する文字抽出処理について、具体例を用いて説明する。まず、図4に示す文字列「列文字列文」に含まれる複数の文字のうち、右から1番目の文字「文」51が判定対象である場合ついて説明する。
文字記載領域抽出部331は、文字「文」51が記載された文字記載領域511を抽出する。重複文字領域抽出部332は、マーキング抽出部31によって抽出されたマーキング領域46と、文字記載領域抽出部331によって抽出された文字記載領域511との重複文字領域512を抽出する。重複文字領域512は、位置座標データによって特定することができる。
文字算出部333は、重複文字領域512の文字列方向44の長さ513と、文字記載領域511の文字列方向44の長さ514とを算出する。長さは、例えば、直交方向45に沿った複数位置について文字列方向44の長さをそれぞれ算出し、算出した長さの平均値を用いることができる。そして、文字判定部334は、算出された重複文字領域512と文字記載領域511との長さに基づいて、文字「文」51が指定文字か否かを判定する。
図4に示す例では、重複文字領域512の長さ513が、文字記載領域511の長さ514の半分以上でないので、文字51「文」は、指定文字でないと判定される。上記方法によれば、右から2番目の文字「列」52及び右から3番目の文字「字」53は、重複文字領域と文字記載領域とが一致し、重複文字領域の文字列方向44の長さが、文字記載領域の文字列方向44の長さの半分以上である。従って、文字「列」52及び文字「字」53は、指定文字であると判定される。
また、右から4番目の文字「文」54は、一部しかマーキングされていないが、重複文字領域542の文字列方向44の長さ543が、文字記載領域541の文字列方向44の長さ544の半分以上である。従って、文字「文」54は、指定文字であると判定される。右から5番目の文字「列」55は、全くマーキングされていないので、重複文字領域がなく、指定文字でないと判定さされる。この場合、文字抽出部33は、文字「文」54、文字「字」53、文字「列」52のみを指定文字であるとして抽出する。
図4に示すように、ユーザがラフにマーキングし、マーキングしたい文字「文」54、文字「字」53、及び文字「列」52の右側の文字「文」51にまでマーキングが掛かり、左側の文字「文」54は、文字の左側の部分がマーキングされていない。この場合でも、左側の文字「文」54は指定文字に含まれ、右側の文字「文」51は指定文字に含まれないと判別し、ユーザのマーキングしたい文字「文」54、文字「字」53、文字「列」52のみを正確に抽出することができる。
引き続いて図5を参照して、文字抽出部33が文字を抽出する文字抽出処理について、別の具体例を用いて説明する。図5に示す例は、図4に示す例よりマーキング領域46の幅が狭くライン状である。
右から1番目の文字「文」61は、重複文字領域612の文字列方向44の長さ613が、文字記載領域611の文字列方向44の長さ614の半分より小さい。従って、文字「文」61は、指定文字でないと判定される。右から2番目の文字「列」62及び右から3番目の文字「字」63は、重複文字領域の文字列方向44の長さが、文字記載領域の文字列方向44の長さの半分以上である。従って、文字「列」62及び文字「字」63は、指定文字であると判定される。
また、右から4番目の文字「文」64は、一部しかマーキングされていないが、重複文字領域642の文字列方向44の長さ643が、文字記載領域641の文字列方向44の長さ644の半分以上である。従って、文字「文」64は、指定文字であると判定される。右から5番目の文字「列」65は、全くマーキングされていないので、重複文字領域がなく、指定文字でないと判定される。この場合、文字抽出部33は、文字「文」64、文字「字」63、文字「列」62のみを指定文字であるとして抽出する。
この場合もユーザが、ラフにマーキングし、マーキングしたい文字列の右側の文字「文」61にマーキングが掛かり、左側の文字「文」64は、文字の左側の部分がマーキングされていない。この場合でも、左側の文字「文」64は指定文字に含まれ、右側の文字「文」61は指定文字に含まれないことを判別し、ユーザのマーキングしたい文字「文」64、文字「字」63、文字「列」62のみを正解に抽出することができる。
図5の例では、ライン状のマーキング領域46が、文字列の直交方向45における中央部に位置しているが、文字列の下側又は上側に位置している場合であっても、同様の処理を適用することができる。この場合も、ユーザのマーキングしたい文字「文」64、文字「字」63、文字「列」62のみを正解に抽出することができる。
引き続いて、図6及び図7を参照してネットワーク複合機1の動作について説明する。図6と図7は、ネットワーク複合機1が行う指定文字の抽出処理の処理手順を示すフローチャートの前半部分と後半部分である。
まず、ユーザが、マーキングされた原稿を読み取るように、操作パネル10を用いて操作を行うと、ステップS101では、ネットワーク複合機1にセットされた原稿がスキャナ12によって読み取られ、原稿の画像データが取得される。ステップS102では、マーキング領域46が画像データから抽出される。ステップS103では、画像データに対してOCR処理を行うことにより、文字列が記載された列記載領域が抽出される。
続いて、ステップS104では、ステップS102において抽出されたマーキング領域46と、ステップS103において抽出された列記載領域とが重なった重複列領域が抽出される。なお、ステップS102で行われるマーキング領域46の抽出処理、ステップS103で行われる列記載領域の抽出処理、及びステップS104で行われる重複列領域の抽出処理は、上述した方法で行うことができるので、ここでは説明を省略する。
ステップS105では、マーキング領域46と重なる文字列があるか否かが判断される。すなわち、ステップS104で重複列領域が抽出されたか否かが判断される。重複列領域が抽出されなかった場合は、マーキングされた文字がないので、処理が終了する。重複列領域が抽出された場合は、処理がステップS106へ進む。
ステップS106では、マーキング領域46と重なる文字列が単ラインか否かが判断される。すなわち、ステップS104で抽出された重複列領域が、単数か複数かが判断される。重複列領域が単数である場合は、ステップS108へ処理が進む。重複列領域が複数ある場合は、ステップS107へ処理が進む。
ステップS107では、判定対象の文字列について、列記載領域と重複列領域との直交方向45の長さが算出され、重複列領域の長さが、列記載領域の長さの半分以上か否かが判断される。重複列領域の長さが、列記載領域の長さの半分以上でないと判断された場合は、ステップS109へ処理が進む。ステップS109では、判定対象の文字列が、指定文字を含む文字列ではないと判定され、ステップS116へ処理が進む。
ステップS107で、重複列領域の長さが、列記載領域の長さの半分以上であると判断された場合は、ステップS108へ処理が進む。ステップS108では、判定対象の文字列が指定文字を含む文字列であると判定される。続いて、ステップS110では、ステップS108で指定文字を含むと判定された文字列のうち、判定対象となる文字の文字記載領域が抽出される。ステップS111では、ステップS110で抽出された文字記載領域とマーキング領域46とが重なる重複文字領域が抽出される。
ステップS112では、判定対象の文字について、文字記載領域と重複文字領域との文字列方向44の長さが算出され、重複文字領域の長さが、文字記載領域の長さの半分以上か否かが判断される。重複文字領域の長さが、文字記載領域の長さの半分以上でないと判断された場合は、ステップS114へ処理が進む。ステップS114では、判定対象の文字が、指定文字ではないと判定され、ステップS115へ処理が進む。
ステップS112で、重複文字領域の長さが、文字記載領域の長さの半分以上であると判断された場合は、ステップS113へ処理が進む。ステップS113では、判定対象の文字が指定文字であると判定される。ステップS115では、ステップS108で指定文字を含むと判定された文字列について、次の判定対象の文字があるか否かが判断される。次の判定対象の文字がある場合には、ステップS110へ戻って、再び判定対象の文字が指定文字か否かの判定処理を行う。
文字列に含まれる全ての文字について判定が終了した場合は、ステップS116へ処理が進む。ステップS116では、次の判定対象の文字列があるか否かが判断される。次の判定対象の文字列がある場合は、ステップS107へ戻って、再び判定対象の文字列が、指定文字を含むか否かの判定処理が行われる。マーキング領域46と重なる全ての文字列について、判定処理が終了した場合は、一連の抽出処理が終了する。以上の処理により、マーキングにより指定された指定文字が特定される。特定された指定文字は、ディスプレイ11等に表示される。また、特定された指定文字をOCR処理してもよいし、各種の編集を行っても良い。
以上説明した本実施形態に係るネットワーク複合機1によれば、重複文字領域と文字記載領域との文字列方向44の長さが算出される。そして、文字記載領域の文字列方向44の長さに対する重複文字領域の文字列方向44の長さの割合が所定値以上の場合、判定対象の文字が指定文字であると判定される。このため、ユーザがラフに文字をマーキングして、例えば、指定したい文字の隣の文字にまでマーキングが掛かってしまった場合、又は、指定したい文字を完全に塗り潰していない場合でも、マーキングされた度合いに基づいて、指定文字か否かを判定できる。従って、ユーザがラフにマーキングした場合であっても、ユーザの指定したい文字を特定することが可能となる。
また、ネットワーク複合機1によれば、重複文字列領域と列記載領域との直交方向45の長さが算出される。そして、列記載領域の直交方向45の長さに対する重複列領域の直交方向45の長さの割合が所定値以上の場合、判定対象の文字列が指定文字を含むと判定される。このため、ユーザがラフに文字をマーキングして、例えば、指定したい文字列の隣の文字列にまでマーキングが掛かってしまった場合、又は、指定したい文字列を完全に塗り潰していない場合でも、マーキングされた度合いに基づいて、指定文字を含む文字列か否かを判定できる。従って、ユーザがラフにマーキングした場合であっても、ユーザの指定したい文字を含む文字列を特定することが可能となる。
また、ネットワーク複合機1によれば、指定文字を含む文字列が抽出された後、その抽出された文字列に含まれる複数の文字から指定文字が抽出される。すなわち、文字列単位で判定対象となる文字が抽出され、その後、抽出された文字列に含まれる文字がマーキングによって指定された文字か否かが判定される。従って、全ての文字について一つ一つ判定する場合と比較して、マーキングによって指定された文字を効率良く特定することができる。
更に、ネットワーク複合機1によれば、重複列領域が単数か複数かについて判断されるので、複数の文字列に渡ってマーキングがなされているか否かを判断することができる。そして、重複列領域が単数の場合に、その重複列領域に対応する文字列に含まれる複数の文字について、指定文字か否かが判断される。このため、マーキングされている文字列が1列の場合に、重複列領域の上記長さにかかわらず、その文字列に含まれる複数の文字を、判定対象の文字とすることができる。すなわち、図5に示すように、マーキングがライン状になされ、列記載領域の直交方向45の長さに対する重複列領域の直交方向45の長さの割合が所定値より小さい場合であっても、その文字列に含まれる複数の文字を、判定対象の文字とすることができる。
以上、本発明の実施の形態について説明したが、本発明は、上記実施形態に限定されるものではなく種々の変形が可能である。例えば、上記実施形態では、重複文字領域又は重複列領域の長さが、文字記載領域又は列記載領域の半分以上か否かに基づいて、判定を行ったが、これに限られない。重複文字領域又は重複列領域の長さが、文字記載領域又は列記載領域の3分の1以上等、判定基準は任意に設定することができる。
また、上記実施形態では、列抽出部32を備えることとしたが、列抽出部32を備えていなくてもよい。この場合、文字抽出部33が、マーキング領域46と少なくとも一部が重なる文字についてそれぞれ指定文字か否かを判定する。また、上記実施形態では、スキャナ12を備えることとしたが、スキャナ12を備えていなくてもよい。この場合、原稿の画像データを外部装置から取得し、取得した画像データに対して画像処置を施すことにより、マーキングされた文字を抽出する。更に、上記実施形態では、文字が横書きの場合について具体的に説明したが、縦書きであっても本発明を適用することができる。この場合、文字列方向は縦方向となる。
1 ネットワーク複合機
12 スキャナ
30 制御部
31 マーキング抽出部
321 列記載領域抽出部
322 重複列領域抽出部
323 列算出部
324 列判定部
325 判断部
331 文字記載領域抽出部
332 重複文字領域抽出部
333 文字算出部
334 文字判定部

Claims (4)

  1. 原稿の画像データを取得する取得手段と、
    前記取得手段によって取得された画像データから、前記原稿上において着色されたマーキング領域を抽出するマーキング抽出手段と、
    前記原稿に並んで記載された複数の文字に含まれる文字毎に該文字が記載された文字記載領域を前記画像データから抽出する文字記載領域抽出手段と、
    前記文字記載領域抽出手段によって抽出された文字記載領域と、前記マーキング抽出手段によって抽出されたマーキング領域とが重なる重複文字領域を抽出する重複文字領域抽出手段と、
    前記重複文字領域抽出手段によって抽出された重複文字領域と、該重複文字領域に対応する前記文字記載領域とについて、前記複数の文字が並んだ方向の長さをそれぞれ算出する文字算出手段と、
    前記文字算出手段によって算出された前記文字記載領域の前記長さに対する前記重複文字領域の前記長さに基づいて、前記文字が前記原稿上においてマーキングによって指定された文字か否かを判定する文字判定手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記原稿に配列して記載された複数の文字列に含まれる文字列毎に該文字列が記載された列記載領域を前記画像データから抽出する列記載領域抽出手段と、
    前記列記載領域抽出手段によって抽出された列記載領域と、前記マーキング抽出手段によって抽出されたマーキング領域とが重なる重複列領域を抽出する重複列領域抽出手段と、
    前記重複列領域抽出手段によって抽出された重複列領域と、該重複列領域に対応する前記列記載領域とについて、前記文字列に含まれる複数の文字が並んだ方向と直交する直交方向の長さをそれぞれ算出する列算出手段と、
    前記列算出手段によって算出された前記列記載領域の前記直交方向の長さに対する前記重複列領域の前記直交方向の長さに基づいて、前記文字列が前記原稿上においてマーキングによって指定された文字を含むか否かを判定する列判定手段と、
    を備えることを特徴とする請求項1に記載の画像処理装置。
  3. 前記文字判定手段は、前記列判定手段によって前記原稿上においてマーキングされた文字を含むと判定された文字列に含まれる前記複数の文字について、前記原稿上においてマーキングによって指定された文字か否かを判定することを特徴とする請求項2に記載の画像処理装置。
  4. 前記重複列領域抽出手段によって抽出された重複列領域が、単数か複数かを判断する判断手段を備え、
    前記文字判定手段は、前記判断手段によって前記重複列領域が単数と判断された場合に、該重複列領域に対応する文字列に含まれる前記複数の文字について、前記原稿上においてマーキングによって指定された文字か否かを判定することを特徴とする請求項3に記載の画像処理装置。
JP2010094200A 2010-04-15 2010-04-15 画像処理装置 Pending JP2011228792A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010094200A JP2011228792A (ja) 2010-04-15 2010-04-15 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010094200A JP2011228792A (ja) 2010-04-15 2010-04-15 画像処理装置

Publications (1)

Publication Number Publication Date
JP2011228792A true JP2011228792A (ja) 2011-11-10

Family

ID=45043676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010094200A Pending JP2011228792A (ja) 2010-04-15 2010-04-15 画像処理装置

Country Status (1)

Country Link
JP (1) JP2011228792A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017157995A (ja) * 2016-03-01 2017-09-07 京セラドキュメントソリューションズ株式会社 情報処理装置及びプログラム
JP2017157996A (ja) * 2016-03-01 2017-09-07 京セラドキュメントソリューションズ株式会社 情報処理装置及びプログラム
JP2018025885A (ja) * 2016-08-08 2018-02-15 京セラドキュメントソリューションズ株式会社 画像処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017157995A (ja) * 2016-03-01 2017-09-07 京セラドキュメントソリューションズ株式会社 情報処理装置及びプログラム
JP2017157996A (ja) * 2016-03-01 2017-09-07 京セラドキュメントソリューションズ株式会社 情報処理装置及びプログラム
JP2018025885A (ja) * 2016-08-08 2018-02-15 京セラドキュメントソリューションズ株式会社 画像処理装置

Similar Documents

Publication Publication Date Title
US9088745B2 (en) Apparatus, system, and method of inspecting image, and recording medium storing image inspection control program
US9654670B2 (en) Color conversion table creation device and method, program, and recording medium
JP6317839B2 (ja) 色変換テーブル作成装置及び方法、並びにプログラム
WO2018110189A1 (ja) 色変換テーブル作成装置及び方法、色変換装置、並びにプログラム
JP6150779B2 (ja) 色変換テーブル作成装置及び方法、並びにプログラム
US9843694B2 (en) Image reading device and method, reading area display device and method, and program
US10373030B2 (en) Image processing apparatus that executes halftone process on target image data including edge pixel
WO2014045788A1 (ja) 画像処理装置、画像形成装置、および記録媒体
US9253368B2 (en) Image processing device setting binary value without using dither matrix when prescribed condition is satisfied
JP2022184133A (ja) 電子透かし解析装置および電子透かし解析方法
JP4957668B2 (ja) 画像処理装置
JP5880056B2 (ja) 画像データ生成装置、画像処理装置、画像処理システム、画像データ生成方法、画像処理方法、画像データ生成プログラムおよび画像処理プログラム
JP2011228792A (ja) 画像処理装置
US9967407B2 (en) Image reading device and method, reading area display device and method, and program
WO2015072542A1 (ja) 色変換テーブル作成装置及び方法、プログラム、並びに記録媒体
JP2016048900A (ja) 色変換テーブル作成装置及び方法、並びにプログラム
JP2016139867A (ja) 色変換テーブル作成装置、色変換テーブル作成方法、及び色変換テーブル作成プログラム
JPH10210312A (ja) 色変換装置及び色変換方法並びに色変換プログラムを記録した媒体
US9813592B2 (en) Image forming apparatus, storage medium, and color conversion method
US9191536B2 (en) Processing apparatus
JP2016225701A (ja) 画像処理装置及び画像処理方法
JP2007249774A (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2009278258A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP6781398B2 (ja) 画像処理装置、および、コンピュータプログラム
JP2016091341A (ja) 画像処理装置