JP4768451B2 - 画像処理装置、画像形成装置、プログラムおよび画像処理方法 - Google Patents
画像処理装置、画像形成装置、プログラムおよび画像処理方法 Download PDFInfo
- Publication number
- JP4768451B2 JP4768451B2 JP2006010368A JP2006010368A JP4768451B2 JP 4768451 B2 JP4768451 B2 JP 4768451B2 JP 2006010368 A JP2006010368 A JP 2006010368A JP 2006010368 A JP2006010368 A JP 2006010368A JP 4768451 B2 JP4768451 B2 JP 4768451B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature
- pixel
- characters
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/186—Extraction of features or characteristics of the image by deriving mathematical or geometrical properties from the whole image
- G06V30/187—Frequency domain transformation; Autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Mathematical Optimization (AREA)
- Algebra (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
Description
(1)言語に依存しない(多くの言語でも白地が区切りとして使われる)。また、行方向(横書き/縦書き)についての知識を必要としない。
(2)大局的な処理なので、局所的な判断間違いが累積する可能性が少ない。
(3)複雑なレイアウトにも、柔軟に対応できる。
などが挙げられる。
ボトムアップ型では、どのようなレイアウトに対しても、ある程度の性能を発揮する。「文字→文字列→文字行→文字ブロック」という積み上げ型の処理であるので、レイアウト構造に関するモデルを必要としない。
トップダウン型では、レイアウト構造に関するモデルに依存した情報を使うことができるときに、強みを発揮する。大局的な情報を使えるので、局所的な間違いが累積することがない。また、トップダウン型では、言語に依存しない解析ができる。
ボトムアップ型では、局所的判断の間違いが累積する。文字、文字列、それに、文字行の構成については言語依存性が避けられない。
トップダウン型では、仮定しているモデルが当てはまらない場合にうまく作用しない。
ボトムアップ型は、文字が少ないものが得意である。局所的な間違いが起こりにくく、文字が少なければ、統合に要する計算量も少なくて済む。
トップダウン型は、文字が主体で、コラムの配置が構造化されているような文書(新聞、雑誌の記事、ビジネス文書)が得意である
ボトムアップ型は、レイアウトが密集しているもの(新聞など)が苦手である。局所的な間違いが発生しやすいからである。
トップダウン型は、絵が主体のもの(スポーツ新聞、宣伝広告)や、コラムの配置が構造化されていないものが苦手である。
また、請求項7にかかる発明は、請求項1記載の画像処理装置において、前記第1のレイアウト解析は、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型であり、前記第2のレイアウト解析は、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型である。
また、請求項14にかかる発明は、請求項8記載の画像形成装置において、前記第1のレイアウト解析は、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型であり、前記第2のレイアウト解析は、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型である。
また、請求項21にかかる発明は、請求項15記載のプログラムにおいて、前記第1のレイアウト解析は、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型であり、前記第2のレイアウト解析は、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型である。
また、請求項28にかかる発明は、請求項22記載の画像処理方法において、前記第1のレイアウト解析は、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型であり、前記第2のレイアウト解析は、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型である。
また、請求項7にかかる発明によれば、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型のレイアウト解析における領域抽出方法か、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型のレイアウト解析における領域抽出方法かを選択することができるので、文書領域抽出の性能を向上させることができるという効果を奏する。
また、請求項14にかかる発明によれば、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型のレイアウト解析における領域抽出方法か、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型のレイアウト解析における領域抽出方法かを選択することができるので、文書領域抽出の性能を向上させることができるという効果を奏する。
また、請求項21にかかる発明によれば、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型のレイアウト解析における領域抽出方法か、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型のレイアウト解析における領域抽出方法かを選択することができるので、文書領域抽出の性能を向上させることができるという効果を奏する。
また、請求項28にかかる発明によれば、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型のレイアウト解析における領域抽出方法か、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型のレイアウト解析における領域抽出方法かを選択することができるので、文書領域抽出の性能を向上させることができるという効果を奏する。
本発明の第1の実施の形態を図1ないし図11に基づいて説明する。
入力画像を同じサイズのブロック、たとえば、1cm×1cm(解像度が200dpiであれば80画素×80画素、解像度が300dpiであれば120画素×高さ120画素)の矩形に分割する。
各ブロックを、“絵”“文字”“他”の3種類のいずれかに分類する。この処理のフローを図5に示し、以下において詳述する。
x=a0・p0 +a0・p1 =FTa+e
とする。ここで、eは誤差ベクトル、F=[p0,p1]T、a=(a0,a1)Tである。最小二乗法により、最適な結合係数ベクトルaは、
a=(FFT)-1・Fx
で与えられる。各ブロックについて、「非文字らしさ」を表すパラメータa1について閾値処理することにより、そのブロックを「絵」、「絵でない」、「未定」に分類する。各ブロックについて、「未定」または「絵でない」に分類されていて、文字らしさを表すパラメータa0が閾値以上であれば「文字」に、そうでなければ「その他」に分類する。図8にブロック分類の例を示す。図8の例においては、黒部分は「文字」、グレイ部分は「絵」、白部分は「他」を表わしている。
ブロックの分類結果をもとにして、画像のタイプ分けのための画像特徴量を計算する。特に、
・文字、絵の割合
・密集率:レイアウトの混み方(狭いところに詰め込まれている度合い)
・文字、絵の散乱度:文字や写真が紙面全体に散らばって分布している度合い
を計算する。具体的には、次の5つの画像特徴量を計算する。
・文字の割合Rt∈[0,1]:全ブロックの中で「文字」に分類されたブロックの割合
・非文字の割合Rp∈[0,1]:全ブロックの中で「絵」に分類されたブロックの割合
・レイアウト密度D∈[0,1]:「文字」と「絵」のブロック数の面積の和を、描画領域の面積で割ったもの
・文字散乱度St(>0):文字ブロックのx,y方向の空間的分布について、分散・共分散行列の行列式を、画像の面積で正規化したもの
・非文字散乱度Sp(>0):絵ブロックのx,y方向の空間的分布について、分散・共分散行列の行列式を、画像の面積で正規化したもの
表1は、図8の例についての画像特徴量の計算結果を示すものである。
・絵が主体で、文字が少ないレイアウトタイプ:すなわち、Rpについて単調増加し、Rtについて単調減少するような判別関数
Rp−a0・Rt−a1>0 (a0>1)
を満たすレイアウトタイプである。より具体的には、大きな写真や絵が張り付いているもの、あるいは、小さい写真が多数張り付いているものがこのタイプに分類される。
・レイアウト密度が祖(単純な構造)なレイアウトタイプ:D とRtについて単調減少するような判別関数
−D−b0・Rt+b1>0 (b0,b1>0)
を満たすレイアウトタイプである。より具体的には、込み入っていない、単純な構造を持つものがこのタイプに判別される。大きな絵や写真が張り付いているようなものは、レイアウト密度が高くなるので、このタイプには多くは現れない。
・文字が少なく、ページ全体に散らばっているようなレイアウトタイプ(非構造化文書):Rtについて単調減少し、Stについて単調増加するような判別関数
St−c0・Rt−c1>0 (c0>0)
を満たすレイアウトタイプである。より具体的には、写真や絵が占める割合がそれほど多くなくても、文字が写真の絵の説明に添えられているようなものがこのタイプに分類される。
表2は、図8の例についてのタイプ識別例を示すものである。
次に、本発明の第2の実施の形態を図12に基づいて説明する。なお、前述した第1の実施の形態と同じ部分は同じ符号で示し説明も省略する。
1.スキャナ部51におけるスキャン時に、画像タイプ識別部23における画像タイプ識別処理まで実行し、画像データのヘッダに画像タイプ情報として記録する。
2.スキャナ部51におけるスキャン時には特に何もせず、データ配信時またはデータ蓄積時に、領域抽出部25による領域抽出処理まで行う。
3.スキャナ部51におけるスキャン時に、領域抽出部25による領域抽出処理まで行う。
次に、本発明の第3の実施の形態を図13に基づいて説明する。なお、前述した第1の実施の形態と同じ部分は同じ符号で示し説明も省略する。
1.ネットワークスキャナNSを用いたサーバコンピュータS(画像処理装置1)によるスキャン時に、画像タイプ識別部23における画像タイプ識別処理まで実行し、画像データのヘッダに画像タイプ情報として記録する。
2.ネットワークスキャナNSを用いたサーバコンピュータS(画像処理装置1)によるスキャン時には特に何もせず、データ配信時またはデータ蓄積時に、領域抽出部25による領域抽出処理まで行う。
3.ネットワークスキャナNSを用いたサーバコンピュータS(画像処理装置1)によるスキャン時に、領域抽出部25による領域抽出処理まで行う。
22 画像特徴量計算手段
23 画像タイプ識別手段
24 選択手段
25 領域抽出手段
26 記憶手段
50 画像形成装置
51 画像読取手段
Claims (28)
- 文書画像のレイアウト解析処理を行う画像処理装置において、
文書画像データの画像特徴量として、文字の割合および写真または絵である非文字の割合や、文字の散乱度および非文字の散乱度や、描画領域に対する文字および非文字の密集率を、文字や非文字についての空間的分布であるレイアウトの概略に基づいて計算する画像特徴量計算手段と、
この画像特徴量計算手段により計算された前記画像特徴量を用い、近隣の構成要素の位置関係を参照して構成要素を統合していく第1のレイアウト解析が得意とする前記文書画像データの画像タイプ、あるいは、ページを大きな構成要素から小さな構成要素に分離していく第2のレイアウト解析が苦手とする前記文書画像データの画像タイプと、これら以外の前記文書画像データの画像タイプと、に前記文書画像データの画像タイプを分類識別する画像タイプ識別手段と、
前記画像タイプ識別手段による画像タイプの分類結果に基づいて、前記第1のレイアウト解析と前記第2のレイアウト解析とのいずれかをレイアウト解析における領域抽出の方法として選択する選択手段と、
この選択手段で選択された領域抽出の方法に基づいて、前記文書画像データを領域に分割する領域抽出手段と、
を備えることを特徴とする画像処理装置。 - 前記画像特徴量計算手段は、
前記文書画像データを矩形ブロックに排他的に分割するブロック分割手段と、
分割された前記各ブロックを、当該文書画像データを構成する所定の構成要素に分類するブロック分類手段と、
前記ブロックの分類結果に基づいて前記文書画像データの画像特徴量を計算する計算手段と、
を備えることを特徴とする請求項1記載の画像処理装置。 - 前記ブロック分類手段は、
前記ブロックから複数の異なる解像度の画像を生成する画像生成手段と、
前記各解像度の画像から特徴量ベクトルを計算する特徴量ベクトル計算手段と、
前記特徴量ベクトルに基づいて前記各ブロックを所定の構成要素に分類する分類手段と、
を備えることを特徴とする請求項2記載の画像処理装置。 - 前記特徴量ベクトル計算手段は、
前記各解像度の画像を2値化する2値化手段と、
2値画像の各々の画素について当該画素及びその近傍画素で構成する局所パターンの対応する画素の値を使って特徴を計算する画素特徴計算手段と、
前記各画素について計算された特徴を画像全体にわたって加算する加算手段と、
を備えることを特徴とする請求項3記載の画像処理装置。 - 前記特徴量ベクトル計算手段は、
前記各解像度の画像の各々の画素について当該画素及びその近傍画素で構成する局所パターンの対応する画素の値を使って特徴を計算する画素特徴計算手段と、
前記各画素について計算された特徴を画像全体にわたって加算する加算手段と、
を備えることを特徴とする請求項3記載の画像処理装置。 - 前記分類手段は、前記特徴量ベクトル計算手段により計算された前記特徴量ベクトルを、予め計算されている文字画素の特徴量ベクトル及び非文字画素の特徴量ベクトルの線形結合に分解して、前記各ブロックを所定の構成要素に分類する、
ことを特徴とする請求項3記載の画像処理装置。 - 前記第1のレイアウト解析は、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型であり、
前記第2のレイアウト解析は、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型である、
ことを特徴とする請求項1記載の画像処理装置。 - 画像を用紙上に印刷する画像形成装置において、
文書原稿を読み取る画像読取手段と、
この画像読取手段により読み取られた文書画像データの画像特徴量として、文字の割合および写真または絵である非文字の割合や、文字の散乱度および非文字の散乱度や、描画領域に対する文字および非文字の密集率を、文字や非文字についての空間的分布であるレイアウトの概略に基づいて計算する画像特徴量計算手段と、
この画像特徴量計算手段により計算された前記画像特徴量を用い、近隣の構成要素の位置関係を参照して構成要素を統合していく第1のレイアウト解析が得意とする前記文書画像データの画像タイプ、あるいは、ページを大きな構成要素から小さな構成要素に分離していく第2のレイアウト解析が苦手とする前記文書画像データの画像タイプと、これら以外の前記文書画像データの画像タイプと、に前記文書画像データの画像タイプを分類識別する画像タイプ識別手段と、
前記画像タイプ識別手段による画像タイプの分類結果に基づいて、前記第1のレイアウト解析と前記第2のレイアウト解析とのいずれかをレイアウト解析における領域抽出の方法として選択する選択手段と、
この選択手段で選択された領域抽出の方法に基づいて、前記文書画像データを領域に分割する領域抽出手段と、
を備えることを特徴とする画像形成装置。 - 前記画像特徴量計算手段は、
前記文書画像データを矩形ブロックに排他的に分割するブロック分割手段と、
分割された前記各ブロックを、当該文書画像データを構成する所定の構成要素に分類するブロック分類手段と、
前記ブロックの分類結果に基づいて前記文書画像データの画像特徴量を計算する計算手段と、
を備えることを特徴とする請求項8記載の画像形成装置。 - 前記ブロック分類手段は、
前記ブロックから複数の異なる解像度の画像を生成する画像生成手段と、
前記各解像度の画像から特徴量ベクトルを計算する特徴量ベクトル計算手段と、
前記特徴量ベクトルに基づいて前記各ブロックを所定の構成要素に分類する分類手段と、
を備えることを特徴とする請求項9記載の画像形成装置。 - 前記特徴量ベクトル計算手段は、
前記各解像度の画像を2値化する2値化手段と、
2値画像の各々の画素について当該画素及びその近傍画素で構成する局所パターンの対応する画素の値を使って特徴を計算する画素特徴計算手段と、
前記各画素について計算された特徴を画像全体にわたって加算する加算手段と、
を備えることを特徴とする請求項10記載の画像形成装置。 - 前記特徴量ベクトル計算手段は、
前記各解像度の画像の各々の画素について当該画素及びその近傍画素で構成する局所パターンの対応する画素の値を使って特徴を計算する画素特徴計算手段と、
前記各画素について計算された特徴を画像全体にわたって加算する加算手段と、
を備えることを特徴とする請求項10記載の画像形成装置。 - 前記分類手段は、前記特徴量ベクトル計算手段により計算された前記特徴量ベクトルを、予め計算されている文字画素の特徴量ベクトル及び非文字画素の特徴量ベクトルの線形結合に分解して、前記各ブロックを所定の構成要素に分類する、
ことを特徴とする請求項10記載の画像形成装置。 - 前記第1のレイアウト解析は、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型であり、
前記第2のレイアウト解析は、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型である、
ことを特徴とする請求項8記載の画像形成装置。 - 文書画像のレイアウト解析処理をコンピュータに実行させるプログラムであって、前記コンピュータに、
文書画像データの画像特徴量として、文字の割合および写真または絵である非文字の割合や、文字の散乱度および非文字の散乱度や、描画領域に対する文字および非文字の密集率を、文字や非文字についての空間的分布であるレイアウトの概略に基づいて計算する画像特徴量計算機能と、
この画像特徴量計算機能により計算された前記画像特徴量を用い、近隣の構成要素の位置関係を参照して構成要素を統合していく第1のレイアウト解析が得意とする前記文書画像データの画像タイプ、あるいは、ページを大きな構成要素から小さな構成要素に分離していく第2のレイアウト解析が苦手とする前記文書画像データの画像タイプと、これら以外の前記文書画像データの画像タイプと、に前記文書画像データの画像タイプを分類識別する画像タイプ識別機能と、
前記画像タイプ識別機能による画像タイプの分類結果に基づいて、前記第1のレイアウト解析と前記第2のレイアウト解析とのいずれかをレイアウト解析における領域抽出の方法として選択する選択機能と、
この選択機能で選択された領域抽出の方法に基づいて、前記文書画像データを領域に分割する領域抽出機能と、
を実行させることを特徴とするプログラム。 - 前記画像特徴量計算機能は、
前記文書画像データを矩形ブロックに排他的に分割するブロック分割機能と、
分割された前記各ブロックを、当該文書画像データを構成する所定の構成要素に分類するブロック分類機能と、
前記ブロックの分類結果に基づいて前記文書画像データの画像特徴量を計算する計算機能と、
を前記コンピュータに実行させることを特徴とする請求項15記載のプログラム。 - 前記ブロック分類機能は、
前記ブロックから複数の異なる解像度の画像を生成する画像生成機能と、
前記各解像度の画像から特徴量ベクトルを計算する特徴量ベクトル計算機能と、
前記特徴量ベクトルに基づいて前記各ブロックを所定の構成要素に分類する分類機能と、
を前記コンピュータに実行させることを特徴とする請求項16記載のプログラム。 - 前記特徴量ベクトル計算機能は、
前記各解像度の画像を2値化する2値化機能と、
2値画像の各々の画素について当該画素及びその近傍画素で構成する局所パターンの対応する画素の値を使って特徴を計算する画素特徴計算機能と、
前記各画素について計算された特徴を画像全体にわたって加算する加算機能と、
を前記コンピュータに実行させることを特徴とする請求項17記載のプログラム。 - 前記特徴量ベクトル計算機能は、
前記各解像度の画像の各々の画素について当該画素及びその近傍画素で構成する局所パターンの対応する画素の値を使って特徴を計算する画素特徴計算機能と、
前記各画素について計算された特徴を画像全体にわたって加算する加算機能と、
を前記コンピュータに実行させることを特徴とする請求項17記載のプログラム。 - 前記分類機能は、前記特徴量ベクトル計算機能により計算された前記特徴量ベクトルを、予め計算されている文字画素の特徴量ベクトル及び非文字画素の特徴量ベクトルの線形結合に分解して、前記各ブロックを所定の構成要素に分類する、
ことを特徴とする請求項17記載のプログラム。 - 前記第1のレイアウト解析は、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型であり、
前記第2のレイアウト解析は、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型である、
ことを特徴とする請求項15記載のプログラム。 - 文書画像のレイアウト解析処理を実行するコンピュータにおける画像処理方法であって、
文書画像データの画像特徴量として、文字の割合および写真または絵である非文字の割合や、文字の散乱度および非文字の散乱度や、描画領域に対する文字および非文字の密集率を、文字や非文字についての空間的分布であるレイアウトの概略に基づいて計算する画像特徴量計算工程と、
この画像特徴量計算工程により計算された前記画像特徴量を用い、近隣の構成要素の位置関係を参照して構成要素を統合していく第1のレイアウト解析が得意とする前記文書画像データの画像タイプ、あるいは、ページを大きな構成要素から小さな構成要素に分離していく第2のレイアウト解析が苦手とする前記文書画像データの画像タイプと、これら以外の前記文書画像データの画像タイプと、に前記文書画像データの画像タイプを分類識別する画像タイプ識別工程と、
前記画像タイプ識別工程による画像タイプの分類結果に基づいて、前記第1のレイアウト解析と前記第2のレイアウト解析とのいずれかをレイアウト解析における領域抽出の方法として選択する選択工程と、
この選択工程で選択された領域抽出の方法に基づいて、前記文書画像データを領域に分割する領域抽出工程と、
を含むことを特徴とする画像処理方法。 - 前記画像特徴量計算工程は、
前記文書画像データを矩形ブロックに排他的に分割するブロック分割工程と、
分割された前記各ブロックを、当該文書画像データを構成する所定の構成要素に分類するブロック分類工程と、
前記ブロックの分類結果に基づいて前記文書画像データの画像特徴量を計算する計算工程と、
を含むことを特徴とする請求項22記載の画像処理方法。 - 前記ブロック分類工程は、
前記ブロックから複数の異なる解像度の画像を生成する画像生成工程と、
前記各解像度の画像から特徴量ベクトルを計算する特徴量ベクトル計算工程と、
前記特徴量ベクトルに基づいて前記各ブロックを所定の構成要素に分類する分類工程と、
を含むことを特徴とする請求項23記載の画像処理方法。 - 前記特徴量ベクトル計算工程は、
前記各解像度の画像を2値化する2値化工程と、
2値画像の各々の画素について当該画素及びその近傍画素で構成する局所パターンの対応する画素の値を使って特徴を計算する画素特徴計算工程と、
前記各画素について計算された特徴を画像全体にわたって加算する加算工程と、
を含むことを特徴とする請求項24記載の画像処理方法。 - 前記特徴量ベクトル計算工程は、
前記各解像度の画像の各々の画素について当該画素及びその近傍画素で構成する局所パターンの対応する画素の値を使って特徴を計算する画素特徴計算工程と、
前記各画素について計算された特徴を画像全体にわたって加算する加算工程と、
を含むことを特徴とする請求項24記載の画像処理方法。 - 前記分類工程は、前記特徴量ベクトル計算工程により計算された前記特徴量ベクトルを、予め計算されている文字画素の特徴量ベクトル及び非文字画素の特徴量ベクトルの線形結合に分解して、前記各ブロックを所定の構成要素に分類する、
ことを特徴とする請求項24記載の画像処理方法。 - 前記第1のレイアウト解析は、近隣の構成要素の位置関係を参照して構成要素を統合していくボトムアップ型であり、
前記第2のレイアウト解析は、ページを大きな構成要素から小さな構成要素に分離していくトップダウン型である、
ことを特徴とする請求項22記載の画像処理方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006010368A JP4768451B2 (ja) | 2006-01-18 | 2006-01-18 | 画像処理装置、画像形成装置、プログラムおよび画像処理方法 |
US11/639,215 US20070165950A1 (en) | 2006-01-18 | 2006-12-15 | Image processing apparatus, image processing method, and computer program product |
CNB200710001946XA CN100559387C (zh) | 2006-01-18 | 2007-01-17 | 图像处理装置和方法,图像形成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006010368A JP4768451B2 (ja) | 2006-01-18 | 2006-01-18 | 画像処理装置、画像形成装置、プログラムおよび画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007193528A JP2007193528A (ja) | 2007-08-02 |
JP4768451B2 true JP4768451B2 (ja) | 2011-09-07 |
Family
ID=38263233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006010368A Expired - Fee Related JP4768451B2 (ja) | 2006-01-18 | 2006-01-18 | 画像処理装置、画像形成装置、プログラムおよび画像処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20070165950A1 (ja) |
JP (1) | JP4768451B2 (ja) |
CN (1) | CN100559387C (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5113653B2 (ja) * | 2007-09-19 | 2013-01-09 | 株式会社リコー | データ処理装置、プログラムおよびデータ処理方法 |
JP5085370B2 (ja) * | 2008-02-19 | 2012-11-28 | オリンパス株式会社 | 画像処理装置および画像処理プログラム |
JP5006263B2 (ja) * | 2008-06-03 | 2012-08-22 | 株式会社リコー | 画像処理装置、プログラムおよび画像処理方法 |
KR101214772B1 (ko) * | 2010-02-26 | 2012-12-21 | 삼성전자주식회사 | 문자의 방향성을 기반으로 한 문자 인식 장치 및 방법 |
US9070011B2 (en) * | 2010-06-18 | 2015-06-30 | Csr Imaging Us, Lp | Automated segmentation tuner |
US8989499B2 (en) | 2010-10-20 | 2015-03-24 | Comcast Cable Communications, Llc | Detection of transitions between text and non-text frames in a video stream |
JP5668932B2 (ja) * | 2011-05-23 | 2015-02-12 | 株式会社モルフォ | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP5401695B2 (ja) * | 2011-05-23 | 2014-01-29 | 株式会社モルフォ | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
CN102509284B (zh) * | 2011-09-30 | 2013-12-25 | 北京航空航天大学 | 一种肖像光照艺术性的自动评测方法 |
US9307107B2 (en) * | 2013-06-03 | 2016-04-05 | Kodak Alaris Inc. | Classification of scanned hardcopy media |
US10372981B1 (en) * | 2015-09-23 | 2019-08-06 | Evernote Corporation | Fast identification of text intensive pages from photographs |
CN105512100B (zh) * | 2015-12-01 | 2018-08-07 | 北京大学 | 一种版面分析方法及装置 |
CN107688788B (zh) * | 2017-08-31 | 2021-01-08 | 平安科技(深圳)有限公司 | 文档图表抽取方法、电子设备及计算机可读存储介质 |
KR102103518B1 (ko) * | 2018-09-18 | 2020-04-22 | 이승일 | 인공지능을 이용한 텍스트 및 그림 데이터를 동영상 데이터로 생성하는 시스템 |
KR102509343B1 (ko) * | 2020-11-17 | 2023-03-13 | 아주대학교산학협력단 | 이미지의 레이아웃 분석 방법 및 시스템 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0461817A3 (en) * | 1990-06-15 | 1993-11-18 | American Telephone & Telegraph | Image segmenting apparatus and methods |
JP3091278B2 (ja) * | 1991-09-30 | 2000-09-25 | 株式会社リコー | 文書認識方式 |
JP2550867B2 (ja) * | 1993-06-04 | 1996-11-06 | 日本電気株式会社 | 図形混在文書画像の構造解析方法 |
JPH08194780A (ja) * | 1994-11-18 | 1996-07-30 | Ricoh Co Ltd | 特徴抽出方法 |
JP3776500B2 (ja) * | 1996-03-26 | 2006-05-17 | オリンパス株式会社 | 多重化光学系及びそれを用いた特徴ベクトル変換装置、特徴ベクトル検出伝送装置、及び、それらを用いた認識分類装置 |
US6539115B2 (en) * | 1997-02-12 | 2003-03-25 | Fujitsu Limited | Pattern recognition device for performing classification using a candidate table and method thereof |
JP3472094B2 (ja) * | 1997-08-21 | 2003-12-02 | シャープ株式会社 | 領域判定装置 |
US6628819B1 (en) * | 1998-10-09 | 2003-09-30 | Ricoh Company, Ltd. | Estimation of 3-dimensional shape from image sequence |
US7426054B1 (en) * | 1999-05-13 | 2008-09-16 | Canon Kabushiki Kaisha | Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction |
JP3747737B2 (ja) * | 2000-05-10 | 2006-02-22 | 日本電気株式会社 | 広域精細画像生成方法及びシステム並びにコンピュータ可読記録媒体 |
US6735335B1 (en) * | 2000-05-30 | 2004-05-11 | Microsoft Corporation | Method and apparatus for discriminating between documents in batch scanned document files |
JP3615162B2 (ja) * | 2001-07-10 | 2005-01-26 | 日本電気株式会社 | 画像符号化方法及び画像符号化装置 |
JP2004171375A (ja) * | 2002-11-21 | 2004-06-17 | Canon Inc | 画像処理方法 |
JP4259949B2 (ja) * | 2003-08-08 | 2009-04-30 | 株式会社リコー | 画像作成装置、画像作成プログラムおよび記録媒体 |
JP4441300B2 (ja) * | 2004-03-25 | 2010-03-31 | 株式会社リコー | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 |
JP4165435B2 (ja) * | 2004-04-13 | 2008-10-15 | 富士ゼロックス株式会社 | 画像形成装置およびプログラム |
JP2006085665A (ja) * | 2004-08-18 | 2006-03-30 | Ricoh Co Ltd | 画像処理装置、画像処理プログラム、記憶媒体、画像処理方法および画像形成装置 |
JP2006074331A (ja) * | 2004-09-01 | 2006-03-16 | Ricoh Co Ltd | 画像処理装置、画像処理プログラム、記憶媒体、画像処理装置の画像処理制御方法および画像形成装置 |
-
2006
- 2006-01-18 JP JP2006010368A patent/JP4768451B2/ja not_active Expired - Fee Related
- 2006-12-15 US US11/639,215 patent/US20070165950A1/en not_active Abandoned
-
2007
- 2007-01-17 CN CNB200710001946XA patent/CN100559387C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN100559387C (zh) | 2009-11-11 |
JP2007193528A (ja) | 2007-08-02 |
US20070165950A1 (en) | 2007-07-19 |
CN101004792A (zh) | 2007-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4768451B2 (ja) | 画像処理装置、画像形成装置、プログラムおよび画像処理方法 | |
US6442555B1 (en) | Automatic categorization of documents using document signatures | |
JP4859025B2 (ja) | 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体 | |
JP3345350B2 (ja) | 文書画像認識装置、その方法、及び記録媒体 | |
US8041113B2 (en) | Image processing device, image processing method, and computer program product | |
US7460710B2 (en) | Converting digital images containing text to token-based files for rendering | |
JP4615462B2 (ja) | 画像処理装置、画像形成装置、プログラムおよび画像処理方法 | |
US7616813B2 (en) | Background area extraction in document layout analysis | |
US9319556B2 (en) | Method and apparatus for authenticating printed documents that contains both dark and halftone text | |
US8139865B2 (en) | Computer-implemented system and method for recognizing patterns in a digital image through document image decomposition | |
US8254669B2 (en) | Data processing apparatus, computer program product, and data processing method for predicting an optimum function based on a case database and image feature values calculated by a feature-value calculating unit | |
JP7244223B2 (ja) | 電子文書における強調テキストの識別 | |
US6532302B2 (en) | Multiple size reductions for image segmentation | |
JP2008176521A (ja) | パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法 | |
JP3913985B2 (ja) | 文書画像中の基本成分に基づく文字列抽出装置および方法 | |
JP4391704B2 (ja) | 多値画像から二値画像を生成する画像処理装置および方法 | |
CN115545009B (zh) | 一种获取目标文本的数据处理*** | |
US7149352B2 (en) | Image processing device, program product and system | |
JP5049922B2 (ja) | 画像処理装置及び画像処理方法 | |
JP5113653B2 (ja) | データ処理装置、プログラムおよびデータ処理方法 | |
JP5020698B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラム | |
JP2006253842A (ja) | 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法 | |
JP5022979B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JPH11272798A (ja) | ボ―ルド体文字を区別する方法及び装置 | |
JP4587167B2 (ja) | 画像処理装置及び画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110614 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110616 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140624 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |