JP2009169675A - 文書処理装置、文書処理方法および文書処理プログラム - Google Patents

文書処理装置、文書処理方法および文書処理プログラム Download PDF

Info

Publication number
JP2009169675A
JP2009169675A JP2008007075A JP2008007075A JP2009169675A JP 2009169675 A JP2009169675 A JP 2009169675A JP 2008007075 A JP2008007075 A JP 2008007075A JP 2008007075 A JP2008007075 A JP 2008007075A JP 2009169675 A JP2009169675 A JP 2009169675A
Authority
JP
Japan
Prior art keywords
document
page
unit
style
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008007075A
Other languages
English (en)
Inventor
Yoshio Komaki
由夫 小巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2008007075A priority Critical patent/JP2009169675A/ja
Publication of JP2009169675A publication Critical patent/JP2009169675A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】多様な種類の文書が混在した原稿から、ユーザの手間無しに自動的に文書の区切りを設定することのできる画像処理装置、文書処理方法および文書処理プログラムを提供すること。
【解決手段】画像バッファ部13に記憶された文書画像から行領域を抽出するための行領域抽出部21と、行領域ごとに、所定の複数の属性種別それぞれに基づく複数の行属性を検出し、行属性の組合せのパターンを表わすスタイル特徴を検出するためのスタイル特徴検出部22と、検出された複数のスタイル特徴のうち、文書画像の主要なスタイル特徴を判定するための主要判定部23と、ページ間での主要なスタイル特徴の変化量に基づいて、文書画像の区切り位置を設定するための区切り位置設定部24とを備える。
【選択図】図5

Description

本発明は、文書処理装置、文書処理方法および文書処理プログラムに関し、特に、原稿の読取り機能を有する文書処理装置、文書処理方法および文書処理プログラムに関する。
省資源や省スペースの観点から、紙原稿などに記載された文書を電子文書に変換して管理する文書管理システムが実用化されている。このような文書管理システムでは、スキャナ装置などを用いて原稿を読取ることで文書画像を生成し、これらの文書画像から電子文書を生成する。
従来より、様々な文書を連続して入力する場合に、文書の区切りを自動的に設定するための提案がなされている。
たとえば、特許文献1には、電子ファイリング装置が、画像の文字認識を行ない、その文字認識結果が予め設定した文字列と一致した場合に、文書の区切りを設定することが開示されている。
また、特許文献2には、画像処理装置が、各ページのレイアウトと各ページに隣接するページのレイアウトとの相違度に基づいて、文書の区切りを設定することが開示されている。
また、特許文献3には、電子ファイル装置が、画像の向き(縦横)を検出し、検出した画像の向きが直前の原稿と異なる場合に文書の区切りを設定することが開示されている。
特開平9−231309号公報 特開2006−72484号公報 特開平7−192109号公報
特許文献1では、文書の区切りを設定するためには、文書の最初または終わりなどに特定の文字列を含むことが必要とされる。しかしながら、特定の文字列を含む同種の文書は限定される。
特許文献2では、文書の最初と最後とでレイアウトの変化が必要とされる。単一の種類の文書では、文書の区切りでレイアウトの規則的な変化が生じる場合もあるが、複数の文書が混在した場合にはレイアウトの変化に規則性を生じない場合も少なくない。また、レイアウトが変化しない種類の文書、あるいは、レイアウトが多様な文書も存在する。
さらに、特許文献3では、複数の文書をスキャナにかける前に、ユーザが、区切りを設定したい箇所に各文書の向きを直前の文書の向きと変える等の手間が必要となる。
本発明は、上記のような問題を解決するためになされたものであって、その目的は、多様な種類の文書が混在した原稿から、ユーザの手間無しに自動的に文書の区切りを設定することのできる画像処理装置、文書処理方法および文書処理プログラムを提供することである。
この発明のある局面に従う画像処理装置は、文書画像を記憶するための第1の記憶手段と、前記第1の記憶手段に記憶された文書画像から、所定の種類の文書領域を抽出するための抽出手段と、前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するための検出手段と、検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての1以上の主要なスタイル特徴を判定するための判定手段と、ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するための設定手段とを備える。
好ましくは、前記判定手段は、前記スタイル特徴ごとに、当該スタイル特徴が出現したページ数を前記出現頻度として算出するための頻度算出手段と、算出されたページ数が、所定値以上であるスタイル特徴を、前記主要なスタイル特徴として判定する手段とを含む。
好ましくは、前記設定手段は、各ページに存在する前記主要なスタイル特徴を、当該ページのページ特徴として判定するための手段と、ページごとに、当該ページのページ特徴が、前ページのページ特徴から変化した量を前記変化量として算出するための量算出手段と、算出された前記変化量が一定値以上の場合に、当該ページ間に区切り位置を設定する手段とを含む。
好ましくは、前記設定手段は、連続する第1、第2および第3のページのうち、前記第2のページ以外の前記第1および第3のページで同一のページ特徴が検出された場合には、前記第2のページにも前記同一のページ特徴が検出されたものとして補正するための補正手段をさらに含む。
好ましくは、前記設定手段により設定された区切り位置に基づいて、前記文書画像を分割して出力するための出力手段をさらに備える。
好ましくは、前記文書画像が前記区切り位置に基づいて区切られた場合に、区切られた複数の分割文書画像における最初のページのインデックス画像を表示するための信号を生成する表示制御手段と、前記表示制御手段からの信号に応じた出力を行なう表示手段とをさらに備える。
好ましくは、ユーザから、前記設定手段による前記文書画像の区切り数に関する指示を受付けるための指示受付手段をさらに備える。
好ましくは、受付けられた前記指示に応じて、前記設定手段による区切り位置の設定のための所定のパラメータを変更する変更手段と、前記変更手段による変更後に、再度、前記設定手段による処理の実行を指示するための実行指示手段とをさらに備える。
好ましくは、レイアウトあるいは所定の文字列に基づいて、前記文書画像の区切り位置を設定するための第2の設定手段をさらに備える。
好ましくは、前記所定の複数の属性種別は、上位領域での位置,大きさ,色、部分領域の個数,位置,高さ,色,隣接する部分領域との距離、文字の大きさ,文字修飾、文字色、背景色、フォントの種別のうち、少なくとも2つを含む。
好ましくは、前記所定の種類の文書領域は、段、行、文字列および文字のうちのいずれかに対応する。
この発明のさらに他の局面に従う文書処理方法は、文書画像を記憶するための記憶部と演算処理部とを備えた文書処理装置において実行される文書処理方法であって、前記演算処理部が、前記記憶部に記憶された前記文書画像から、所定の種類の文書領域を抽出するステップと、前記演算処理部が、前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するステップと、検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての1以上の主要なスタイル特徴を判定するステップと、ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するステップとを備える。
この発明のさらに他の局面に従う画像処理プログラムは、上記記載の文書処理方法をコンピュータに実行させる。
本発明によると、多様な種類の文書が混在した原稿からでも、ユーザの手間無しに区切り位置を設定することができる。また、主要なスタイル特徴が判定されるため、最適な位置で、文書画像を分割することができる。
本発明の実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰返さない。
<構成について>
(全体システム構成)
図1は、この発明の実施の形態に従う文書処理装置を含むシステムの概略構成図である。本実施の形態においては、代表的に、本発明に係る文書処理装置を搭載するMFP(Multi Function Peripheral)について説明する。なお、本発明に係る文書処理装置は、
MFPに限らず、複写機、ファクシミリ装置、スキャナ装置などにも適用可能である。
図1を参照して、本実施の形態に従うMFP1は、原稿300を読取るための画像読取部104と、紙媒体などへの印刷処理を行なうためのプリント部106とを含んで構成される。本実施の形態に従うMFP1は、画像読取部104で原稿300を読取ることで文書画像を取得し、この文書画像を含む電子文書を生成する。また、MFP1は、読取った文書画像をプリント部106に出力する。
特に、MFP1は、複数ページを有する文書画像のスタイル特徴に基づいて、該文書画像の区切り位置を設定することができる。区切り位置は、ページ単位で設定される。
MFP1は、設定された区切り位置により文書画像を分割し、分割された複数の文書画像それぞれに対応した複数の電子文書を生成する。これらの電子文書400には、代表的に、PDF(Portable Document Format)などのフォーマットが採用できる。
MFP1は、生成した電子文書400を自身の記憶部(図1において不図示)に格納する。また、記憶された電子文書400を、ネットワークを介してパーソナルコンピュータPC1,PC2,PC3(以下、「パーソナルコンピュータPC」とも総称する)に送信したりする。代表的な使用形態として、MFP1が設置されている同一のオフィス内に敷設されたネットワークであるLAN(Local Area Network)に接続されているパーソナルコンピュータPC1,PC2に対しては、MFP1から電子文書400が直接的に送信される。一方、LANとWAN(Wide Area Network)との接続点には、サーバ装置SRVが設けてあり、MFP1とは離れたオフィスにあるパーソナルコンピュータPC3などに対しては、MFP1からサーバ装置SRVを介して電子文書400が送信される。ここで、サーバ装置SRVは代表的に、メールサーバ、FTP(File Transfer Protocol)サーバ、Webサーバ、SMBサーバなどからなる。
画像読取部104は、原稿をセットするための戴荷台と、原稿台ガラスと、戴荷台にセットされた原稿を原稿台ガラスに自動的に一枚ずつ搬送する搬送部と、読取られた原稿を排出するための排出台とを含む(いずれも図示しない)。これにより、複数枚の原稿を連続的に読取って、一つまたは複数の電子文書を生成することができる。
プリント部106は、ソート機能を備えている。MFP1は、設定された区切り位置により文書画像を分割し、分割された複数の文書画像それぞれを、ソート方法を変えてプリント部106に出力する。これにより、一度に読み取られた原稿を、仕分けして出力することができる。
(MFP1の概略構成)
図2は、本発明の実施の形態に従うMFP1における概略のハードウェア構成を示すブロック図である。
図2を参照して、MFP1の機能構成としては、制御部100と、メモリ部102と、画像読取部104と、プリント部106と、通信インターフェイス部108と、操作パネル部110と、記憶部112とを含む。
制御部100は、代表的にCPU(Central Processing Unit)などの演算装置から構成され、プログラムを実行することで本実施の形態に従う文書処理を実現する。メモリ部102は、代表的にDRAM(Dynamic Random Access Memory)などの揮発性の記憶装置であり、制御部100で実行されるプログラムやプログラムの実行に必要なデータなどを保持する。通信インターフェイス部108は、代表的に、ネットワーク(たとえば、図1に示すLAN)を介してパーソナルコンピュータPC(図1)との間でデータを送受信するための部位であり、たとえば、LANアダプタおよびそれを制御するドライバソフトなどを含む。プリント部106は、プリント処理を行なうための部位であり、プリント処理に係るハードウェア構成に加えて、各部の作動を制御するための制御装置をも含む。
記憶部112は、代表的にハードディスク装置やフラッシュメモリなどの不揮発性の記憶装置であり、制御部100の動作のためのプログラムや制御部100で生成された電子文書400などを格納する。
なお、本実施の形態において、設定された区切り位置に基づいて分割された文書画像は、通信インターフェイス部108、記憶部112およびプリント部106のうちのいずれかに出力されるものとする。
操作パネル部110の外観例を図3に示す。図3は、本発明の実施の形態に従うMFP1の操作パネル部の外観の一例を示す図である。
図3を参照して、操作パネル部110は、液晶表示装置やタッチパネルなどから構成される表示パネル110aと、ストップボタン110bと、スタートボタン110cと、英数キーなどを含む操作ボタン110dとを備えている。
なお、MFP1は、表示機能と指示の入力機能とを兼ね備えた操作パネル部110を備えることとしたが、これに代えて、表示部とハードウェアボタンを含む入力部との両方を備えることとしてもよい。
(パーソナルコンピュータの構成)
図4は、本発明の実施の形態に従うパーソナルコンピュータPCの概略のハードウェア構成を示す模式図である。
図4を参照して、パーソナルコンピュータPCは、オペレーティングシステム(OS:Operating System)を含む各種プログラムを実行するCPU(Central Processing Unit)201と、CPU201でのプログラムの実行に必要なデータを一時的に記憶するメモリ部213と、CPU201で実行されるプログラムを不揮発的に記憶するハードディスク部(HDD:Hard Disk Drive)211とを含む。また、ハードディスク部211には、MFP1で生成された電子文書400を表示するための閲覧アプリケーションが記憶されており、このようなプログラムは、FDDドライブ217またはCD−ROMドライブ215によって、それぞれフレキシブルディスク217aまたはCD−ROM(Compact Disk-Read Only Memory)215aなどから読取られる。
CPU201は、キーボードやマウスなどからなる入力部209を介してユーザからの指示を受取るとともに、プログラムの実行によって生成される画面出力をディスプレイ部205へ出力する。また、CPU201は、LANカードなどからなる通信インターフェイス部207を介して、LANやWANに接続されたMFP1やサーバ装置SRV(図1)から電子文書400を取得し、ハードディスク部211などに格納する。また、上述の各部は、内部バス203を介して相互にデータを授受する。
(MFPの機能構成)
図5は、本発明の実施の形態に従うMFP1が電子文書を生成する場合の機能構成を示す機能ブロック図である。
図5を参照して、MFP1の制御部100は、画像バッファ部13と、電子文書生成部15と、画像解析部16と、送信処理部17と、表示制御部25と、指示受付部26と、パラメータ変更部27とを含む。
上述の画像読取部104は、原稿300を読取って文書画像を取得する。より具体的には、紙状の原稿300を光学的に読取り、デジタルデータに変換することでRGBデジタル画像データを取得する。画像読取部104は、取得した文書画像(デジタル画像データ)を画像バッファ部13へ出力する。
なお、本実施の形態では、画像読取部104によって読取られた文書画像が、画像バッファ部13に出力されることとして説明するが、受信部12として機能する通信インターフェイス部108が受信した画像データ310が、画像バッファ部13に出力されてもよい。受信部12は、LANなどのネットワークを介して画像データ310を受信してもよいし、たとえば携帯型小型メモリ(図示せず)に記憶された画像データ310を受付けてもよい。受信部12は、データ形式の整合をとった上で、画像データ310を出力する。
画像バッファ部13は、文書画像のデータを一時的に格納する部位であり、画像解析部16および電子文書生成部15から出力の要求があるまで画像データを保持する。画像解析部16および電子文書生成部15から出力の要求があれば、対応する画像データを出力する。本実施の形態において、画像バッファ部13は、各画像データの管理情報も保持する。管理情報には、後述するように、文書IDが含まれる。
画像解析部16は、行領域抽出部21と、スタイル特徴検出部22と、主要判定部23と、区切り位置設定部24とを含む。
行領域抽出部21は、画像バッファ部13から出力される文書画像から、所定の種類の文書領域として行領域を抽出する。本実施の形態において、「所定の種類の文書領域」は、テキスト領域に含まれる領域であればよく、行領域に限定されるものではない。たとえば、一定以上の余白によって分割される文字領域、文字列および段など、他の部分領域であってもよい。あるいは、ページ,カラムなどの上位領域であってもよい。
スタイル特徴検出部22は、行領域抽出部21で抽出された行領域ごとに、所定の複数の属性種別に基づいて、スタイル特徴を検出する。より具体的には、行領域ごとに、所定の複数の属性種別それぞれに基づく複数の行属性を検出し、その行属性の組合せのパターンを、スタイル特徴として検出する。「所定の複数の属性種別」とは、文書画像に含まれる複数のページの特徴を特定するために用いられる情報であり、上位領域での位置,大きさ,色、部分領域の個数,位置,高さ,色,隣接する部分領域との距離、文字の大きさ,文字修飾、文字色、背景色、フォントの種別のうち、少なくとも2つを含む。その他にも、頻度が上位の文字領域の高さ、などを含んでもよい。本実施の形態では、所定の複数の属性種別は、行(部分領域)の高さ、近接行との行間(位置)、文字色、背景色および文字修飾を含むものとする。本実施の形態において、「行属性」とは、行領域ごとの、5つの属性種別それぞれに対応した5種類の属性をいう。
検出された行領域ごとのスタイル特徴は、主要判定部23に出力される。
主要判定部23は、検出された複数のスタイル特徴のうち、読取られた文書画像の主要なスタイル特徴を判定する。具体的には、複数のスタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、文書画像についての1以上の主要なスタイル特徴を判定する。つまり、主要判定部23は、スタイル特徴ごとに、そのスタイル特徴が出現したページ数を出現頻度として算出(カウント)し、算出されたページ数が、所定値以上であるスタイル特徴を、主要なスタイル特徴(有効)として判定する。言い換えると、ページ数が所定値未満のスタイル特徴は、局所的なスタイル特徴であり、文書を特徴付ける主要なスタイル特徴ではない(無効)と判断する。判定された主要なスタイル特徴は、区切り位置設定部24に出力される。
区切り位置設定部24は、判定された複数の主要なスタイル特徴に基づいて、読取られた文書画像の区切り位置をページ単位で設定する。具体的には、ページごとに、複数の主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での主要なスタイル特徴の変化量に基づいて、文書画像の区切り位置を設定する。つまり、ページに存在する主要なスタイル特徴を、当該ページのページ特徴として判定する。そして、ページごとに、当該ページのページ特徴が前ページのページ特徴から変化した量を変化量として算出する。区切り位置設定部24は、算出された変化量が一定値以上の場合に、そのページ間に区切り位置を設定する。箇所を、区切り位置として設定する。また、区切り位置設定部24は、設定した区切り位置に基づいて、各ページに対応する画像データに文書IDを付与する。付与した文書IDの情報は、画像バッファ部13に出力される。
このように、文書画像における主要なスタイル特徴に基づいて、自動的に区切り位置が設定される。そのため、多様な種類の文書が混在した原稿からでもユーザの手間を必要とせずに最適な位置に区切りを設定することができる。
なお、区切り位置設定部24は、ページ特徴を判定した後に、補正処理も行なうことが好ましい。すなわち、連続する第1、第2および第3のページのうち、第2のページ以外の第1および第3のページで同一のページ特徴が検出された場合には、第2のページにも同一のページ特徴が検出されたものとして補正する。このような補正は、全ページに同一のページ特徴が検出されない場合にのみ、実行されることが好ましい。前後のページに同じページ特徴がある場合には、その間のページも同じページ特徴であることが一般的である。たとえば、その間のページが表や写真であった場合などが想定される。このような場合にも、主要なスタイル特徴の出現位置から各ページのページ特徴を適切に判定するために、上記のような補正処理を行なう。これにより、区切りとして最適でない位置で区切りが設定されてしまうことを防止することができる。
電子文書生成部15は、画像バッファ部13から文書画像および管理情報を入力する。電子文書生成部15は、画像データの圧縮処理を行ない、圧縮された画像データをPDF形式に変換する(電子文書を生成する)。その際に、電子文書生成部15は、管理情報に含まれる文書IDに基づいて(すなわち、設定された区切り位置に基づいて)、複数の電子文書を生成する。より具体的には、付与された文書IDごとに、電子文書を生成する。そして、生成した電子文書の情報を表示制御部25に出力する。また、指示受付部26が所定の指示を受付けた場合に、生成された電子文書を、ユーザによる設定などに応じて、記憶部112へ格納されたり、送信処理部17へ出力されたりする。なお、圧縮度合いは、生成される電子文書の大きさや、要求される文書画像の解像度などに応じて変化させてもよい。
表示制御部25は、生成された各電子文書を特定するためのインデックス画像、たとえば最初のページのプレビュー画像を表示するための信号を生成する。表示制御部25は、生成した信号を操作パネル部110に出力する。これにより、操作パネル部110に、複数のプレビュー画像が表示される。なお、インデックス画像は、文書画像の区切り位置が特定可能であればよく、最初のページのプレビュー画像に限定されない。また、文書画像の区切り位置が特定できれば、画像でなくてもよい。
指示受付部26は、操作パネル部110を介して、生成された電子文書の数に関する指示を受付ける。具体的には、ユーザから、文書数を増やす指示(以下「増指示」という)、文書数を減らす指示(以下「減指示」という)およびOK指示(現状の文書数で出力する旨の指示)のいずれかが受付けられる。指示受付部26は、増指示または減指示を受付けた場合に、その指示内容をパラメータ変更部27に出力する。OK指示を受付けた場合には、その旨を電子文書生成部15に出力する。
パラメータ変更部27は、受付けた修正の指示内容に基づいて、区切り位置設定のための所定のパラメータを変更する。パラメータが変更されると、再度、区切り位置設定部24による処理の実行が指示される。これにより、区切り位置設定部24は、変更されたパラメータに基づいて、再度、区切り位置設定処理を実行する。
このように、本実施の形態では、区切り位置が自動的に設定された後に、ユーザにその区切り度合い(分割数)を確認させる。そのため、ユーザは、希望の数になるように何度でも区切り位置設定処理の実行を指示することができる。
送信処理部17は、電子文書400を、各種の通信プロトコルに従って、ユーザにより指定された送り先に送信するための処理を行なう。プロトコルとしては、たとえばSMB(Server Message Block),FTP(File Transfer Protocol),HTTP(Hyper Text Transfer Protocol),SMTP(Simple Mail Transfer Protocol)などが選択可能である。本実施の形態において、送信処理部17は、文書IDが異なる複数の電子文書400が生成された場合には、各電子文書400に異なるファイル名を付与する。ファイル名として、たとえば、「“Doc”+“文書ID”+“.pdf”」が付与される。また、送信処理部17は、ユーザからの指示に基づいて、電子文書400の送り先を設定する。なお、これらの具体的な処理の例については後述する。送信処理部17は、電子文書400、電子文書400ごとのファイル名および送り先を送信部18に出力する。
送信部18は、通信インターフェイス部108によって実現され、LANなどのネットワークを介してパーソナルコンピュータPC(図1)などへ、電子文書生成部15で生成された複数の電子文書400を送信する。なお、送信部18は、たとえば携帯型小型メモリ(図示せず)を装着可能であり、電子文書400は、そのような着脱可能なメモリに出力されてもよい。
なお、制御部100に含まれる各ブロックの動作は、たとえば記憶部112中に格納されたソフトウェアを実行することで実現されてもよいし、これらのブロックのうち少なくとも1つについては、ハードウェアで実現されてもよい。
<動作について>
(電子文書生成処理)
以下に、本発明の実施の形態のMFP1が実行する電子文書生成処理について、図6〜8のフローチャートおよび図9〜22を参照して具体的に説明する。
図6は、本発明の実施の形態における電子文書生成処理を示すフローチャートである。図6のフローチャートに示す処理は、予めプログラムとして記憶部112に格納されており、制御部100がこのプログラムを読み出して実行することにより、電子文書生成処理の機能が実現される。なお、このフローチャートにおいては、電子文書をインターネット経由でPC等に送信することがユーザにより設定されたものとして説明する。
図6を参照して、はじめに、行領域抽出部21は、画像バッファ部13に記憶された文書画像から、行領域を抽出する(ステップS2)。具体的には、次の手順で行領域が抽出される。図9は、本実施の形態における行領域抽出処理を説明するための図である。図9(a)には、元の文書画像の任意のページが示されている。
行領域抽出部21は、各ページのRGB画像データを2値化する。たとえば、RGB画像の輝度値に変換し、各ページの輝度値の平均値と比較する。これにより、明るい場合は「0」、暗い場合は「1」がたとえばメモリ部102に一時記録される。次に、2値画像の値が“1”の画素を8連結で走査する。連結がある場合には、画素に同一のラベル値を与えることで黒連結領域を生成し、その外接矩形を求める。図9(b)は、外接矩形が求められた結果を示す図である。
次に、各外接矩形について左右方向に一定距離以下に近接する領域を検出し、検出された領域を1つの領域に統合する。図9(c)は、図9(b)の外接矩形が統合された領域を示す図である。行領域抽出部21は、統合された領域を行領域として出力する。複数ページを含む文書に対して抽出された行領域の例を図10に示す。なお、行領域を抽出するための処理は、上述のような処理に限定されるものではない。
ステップS2の処理が終わると、スタイル特徴検出部22は、所定の複数の属性種別に基づいて、抽出された行領域ごとのスタイル特徴を検出する(ステップS4)。具体的には、複数の属性種別として、行の高さ、近接行との行間、文字色、背景色および文字修飾が用いられる。したがって、スタイル特徴検出部22は、行領域ごとに、これらの属性種別に基づいたスタイル特徴を検出する。
「行の高さ」は、行領域の高さを算出することで得られる。「近接行との行間」は、上下に隣接する行領域を検出して、隣接する各行領域との距離を算出する。そして、距離が小さい方の値を、「近接行との行間」として得る。「文字色」および「背景色」は、各行領域のカラーヒストグラムを生成する。そして、最頻度の色を「背景色」、次頻度の色を「文字色」として得る。「文字修飾」は、行領域のランレングスヒストグラムを生成する。すなわち、行領域の縦方向および横方向の黒画素の連続長のヒストグラムを生成する。そして、生成されたランレングスヒストグラムに基づいて、「太い文字」、「斜体」などの文字修飾を判定し、最頻度の文字修飾を「文字修飾」として得る。なお、各々の行属性の検出方法は、上述のような方法に限定されるものではない。
スタイル特徴検出部22は、検出した各々の行属性を、行領域リストに記録する。
図11は、文書画像に含まれる行領域のリストの一例を示す図である。図11を参照して、行領域のリストには、主に4つの項目すなわちページ、ページID、行IDおよび属性種別を有しており、これらの項目が互いに対応付けられている。ページの項目には、文書画像のページ順に、1ページ目、2ページ目、…、6ページ目が記録される。ページIDの項目には、各ページを一意に特定するための識別情報(ID)が記録される。行IDの項目には、各ページ内の各行を一意に特定するための識別情報(ID)が記録される。属性種別の項目には、行IDごとに、上記5つの属性種別に基づくスタイル特徴が記録される。「スタイル特徴」とは、本実施の形態において、5つの行属性の組合せに基づく特徴を示す。つまり、たとえば、1ページ目における行ID1の行では、行の高さ「4」、近接行との行間「20」、文字色「黒」、背景色「白」および文字修飾「太い文字」のそれぞれが、この行の行属性である。また、これらの行属性の組合せが、この行のスタイル特徴となる。
ステップS4の処理が終わると、スタイル特徴検出部22は、行領域ごとに検出されたスタイル特徴に基づいて、スタイル特徴リストを生成する(ステップS6)。スタイル特徴リストは、ユニークなスタイル特徴のリストである。
図12は、スタイル特徴リストの一例を示す図である。
図12を参照して、スタイル特徴リストは、6つの項目すなわち、スタイルID、行の高さ、近接行との行間、文字色、背景色および文字修飾の項目を有し、各項目は互いに対応付けられている。スタイルIDは、ユニークなスタイル特徴を一意に特定するための識別情報(ID)である。
ステップS6の処理が終わると、主要判定部23は、スタイル特徴ごとの頻度を算出する(ステップS8)。具体的には、スタイル特徴リストのスタイルIDごとに、出現する行数およびページ数を算出する。これにより、各スタイルIDで特定されるスタイル特徴ごとに、文書画像における出現頻度(存在割合)が算出される。なお、ページごとのスタイル特徴を抽出する必要があるので、ページ数のみが算出されることとしてもよい。
図13は、スタイル特徴ごとの頻度算出結果を示すテーブル(以下「算出結果テーブル」という)の一例を示す図である。図13を参照して、算出結果テーブルの列には、7つのスタイルIDそれぞれに対応する7つの項目が設けられ、該テーブルの行には、6つのページIDそれぞれに対応する6つの項目と、行数を示す項目と、ページ数を示す項目とが設けられる。なお、算出結果テーブルの行に含まれる有効性を示すの項目は、後の判定処理の結果が記録される。
算出結果テーブルには、ページIDの欄には、各スタイルIDで特定されるスタイル特徴が出現する行数が記録される。そして、主要判定部23は、記録した行数の情報に基づいて、スタイルIDごとに、行数およびページ数を算出する。
ステップS8の処理が終わると、主要判定部23は、主要なスタイル特徴を判定する(ステップS10)。具体的には、たとえば、ページ数が所定数以上のスタイル特徴を、主要なスタイル特徴として判定する。なお、ここでの「所定数」とは、文書画像が有するページ数に基づいて、予め算出された値であることが望ましい。たとえば、ページ数に一定割合(たとえば、1/3)を乗じた値である。したがって、図10に示した文書画像の例では、ページ数が2以上のスタイル特徴が、主要なスタイル特徴であると判定される。
主要判定部23は、算出結果テーブルの有効性の欄のうち、ページ数が2以上のスタイル特徴に対応するスタイルIDの欄に有効を示す「有」を記録し、ページ数が2未満のスタイル特徴に対応するスタイルIDの欄に無効を示す「無」を記録する。つまり、主要なスタイル特徴であれば「有」が記録されることになる。図13では、スタイルIDが2,3,5,6のスタイル特徴が主要なスタイル特徴であることが示される。
なお、ここでは、ページ数のみに基づいて、主要なスタイル特徴を判定したが、行数を加味した判定を行なってもよい。たとえば、ページ数が2以上であり、かつ、行数が所定数以上であるものを、主要なスタイル特徴と判定してもよい。この場合の「所定数」は、全行数に基づいて、予め算出された値であってもよいし、ページ数に基づいて、予め算出された値であってもよい。このように、行数も加味した判定をすることで、ページ内での出現割合が低いスタイル特徴が、主要なスタイル特徴と判定されることを防止することができる。または、各スタイル特徴のページ内での占有面積を算出し、その割合が、一定値以上の場合にのみ、ページ数をカウントするようにしてもよい。
ステップS10の処理が終わると、主要判定部23は、主要なスタイル特徴と判定されたスタイル特徴についてのテーブル(以下「主要領域特徴テーブル」)を生成する(ステップS12)。図14は、主要領域特徴テーブルの一例を示す図である。
図14を参照して、主要領域特徴テーブルは、図13に示した算出結果テーブルのうち、有効性の欄に「有」が記録されたスタイルIDに対応する項目のみを含む。つまり、主要領域特徴テーブルには、主要なスタイル特徴と判定されたスタイル特徴についての、ページごとの出現行数、トータルの行数、出現ページ数(および有効性)が含まれる。
ステップS12の処理が終わると、区切り位置設定部24は、区切り位置設定処理を実行する(ステップS14)。区切り位置設定処理については、図7のサブルーチンのフローチャートを用いて詳細に説明する。
図7は、本発明の実施の形態における区切り位置設定処理を示すフローチャートである。
区切り位置設定部24は、各ページのページ特徴を判定する(ステップS102)。図14の主要領域特徴テーブルに基づくと、ページ1のページ特徴は、スタイルIDが2,3のスタイル特徴であり、ページ2のページ特徴は、スタイルIDが3のスタイル特徴である。また、ページ3のページ特徴は、スタイルIDが2,3のスタイル特徴であり、ページ4,5のページ特徴は、各々、スタイルIDが5,6のスタイル特徴である。ページ6のページ特徴は、スタイルIDが6のスタイル特徴である。
次に、区切り位置設定部24は、補正処理を実行する(ステップS104)。具体的には、連続する3つのページのうち、間のページのみに存在しないスタイルIDがある場合に、そのページにも該スタイルIDが存在するものとして補正する。図14の例では、囲み線51で示されるように、スタイルID“2”で特定されるスタイル特徴(ページ特徴)は、ページ1および3に存在するが、ページ2には存在しない。したがって、区切り位置設定部24は、スタイルID“2”に対応するページ2の欄を、“0”から“1”に書き換える。補正した結果を図15に示す。図15は、本発明の実施の形態における補正処理が行なわれた後の主要領域特徴テーブルを示す図である。図15に示されるように、上記書き換えに伴ない、スタイルIDが“2”の行の行数およびページ数を1だけインクリメントする。このような補正処理の結果、主要領域特徴テーブルの列にページ特徴判定結果の項目61が追加される。項目61の行を参照すると、ページ1〜3のページ特徴がスタイルID2,3、ページ4,5のページ特徴がスタイルID5,6、ページ6のページ特徴がスタイルID6であることが示される。
なお、ここでの補正処理は、前後のページ(第1および第3のページ)に、1つでも同一のスタイル特徴の行が存在すれば実行される。しかしながら、たとえば、全ページ数に応じて予め定められた行数が存在する場合にのみ、補正処理が実行されてもよい。
また、補正処理は、補正処理をするか否かを特定するための「変数i」が1である場合にのみ実行されるものとし、はじめ、変数iは1にセットされているものとする。
なお、このような補正処理は、必ずしも実行されなくてもよい。
ステップS104の処理が終わると、区切り位置設定部24は、ページ間でのページ特徴変化量を算出する(ステップS106)。区切り位置設定部24は、図15に示した主要領域特徴テーブルの列に、さらに、ページ特徴変化量の項目62を追加する。項目62の行を参照すると、ページ1〜3のページ特徴は同一であるため、ページ1からページ2への変化量、および、ページ2からページ3への変化量は、ともに“0”であることが記録される。ページ4には、ページ3におけるページ特徴であるスタイルID2,3のいずれも存在しないため、ページ3からページ4への変化量は、“2”と記録される。ページ4とページ5とは、ページ特徴が同一であるため、ページ4からページ5への変化量は、“0”となる。ページ6には、ページ5におけるページ特徴であるスタイルID5が存在しないため、ページ5からページ6への変化量は、“1”となる。
ステップS106の処理が終わると、区切り位置設定部24は、区切り位置を設定する(ステップS108)。具体的には、区切り位置設定部24は、変化量が「変数j」以上であるページ間に、区切り位置を設定する。「変数j」は、区切り位置を設定する際の基準となる値(変化量)であり、はじめ、変数jは、1に設定されているものとする。つまり、項目62の欄に1以上の数値が記録されたページの直前で、区切り位置が設定される。したがって、この例では、ページ3とページ4との間、ページ5とページ6との間に区切り位置が設定される。
再び図6を参照して、区切り位置設定部24は、区切り位置に基づいて、文書IDを付与する(ステップS16)。すなわち、区切り位置設定部24は、区切り位置と判定された箇所で、文書IDを更新する。具体的には、区切り位置設定部24は、図15に示した主要領域特徴テーブルの列に、さらに、文書IDの項目63を追加する。項目63の行を参照して、ページ1〜3の欄には、文書IDとして“1”が記録され、ページ4,5の欄には、文書IDとして“2”が記録される。また、ページ6の欄には、文書IDとして“3”が記録される。このように、最初のページに文書IDとして“1”を付与し、区切り位置で文書IDを1だけインクリメントする。
区切り位置設定部24は、文書IDの情報を、画像バッファ部13に出力する。これにより、画像バッファ部13に、文書画像とともに、文書IDを含む管理情報が記憶される。図16に、文書IDを含む管理情報のデータ構造の一例を示す。管理情報には、ページIDと、文書IDと、各画像データ(ページ)へのポインタとが対応付けられて記憶されている。画像バッファ部13は、文書画像のデータと管理情報とを、電子文書生成部15に出力する。
電子文書生成部15は、管理情報に含まれる文書IDの情報に基づき、複数の電子文書を生成する(ステップS18)。つまり、電子文書生成部15は、文書IDの数分、電子文書を生成する。図10の文書画像について、3つの文書が生成された例を、図17に示す。図17を参照して、第1の電子文書となるPDFデータ1は、文書ID1に対応しており、当該電子文書には、ページ1〜ページ3の文書画像が含まれる。第2の電子文書となるPDFデータ2は、文書ID2に対応しており、当該電子文書には、ページ4,5の文書画像が含まれる。第3の電子文書となるPDFデータ3は、文書ID3に対応しており、当該電子文書には、ページ6の文書画像が含まれる。
次に、表示制御部25は、操作パネル部110の表示パネル110aに文書確認画面を表示する(ステップS20)。図18は、文書確認画面の一例を示す図であり、図18(a)は、図6のステップS20にて表示される画面の一例を示す。図18(a)を参照して、文書確認画面には、各電子文書の先頭ページのプレビュー画像が表示され、「3つの文書を読み込みました。送付してよろしいですか?」とのメッセージが表示される。また、同画面には、ユーザからの指示を受付けるための4つのボタン(OKボタン,修正(増)ボタン,修正(減)ボタン,キャンセルボタン)が表示される。
指示受付部26は、操作パネル部110を介してOK指示が入力されたか否かを判断する(ステップS22)。修正ボタンが選択された場合(ステップS24でNO)、パラメータ変更部27は、パラメータ変更処理を実行する(ステップS26)。なお、キャンセルボタンが選択された場合には、全ての処理を中断して、元の状態(区切り位置が設定されていない状態)へ戻されものとする。
パラメータ変更処理については、図8に示すサブルーチンのフローチャートを用いて説明する。
図8は、本発明の実施の形態におけるパラメータ変更処理を示すフローチャートである。図8を参照して、パラメータ変更部27は、ユーザから、増指示が入力されたか否かを判断する(ステップS202)。増指示が入力されたと判断された場合、すなわち、修正(増)ボタンが選択された場合に(ステップS202においてYES)、パラメータ変更部27は、上述の変数iを0にする(ステップS204)。つまり、上述の補正処理(ステップS104)を実行しないように設定する。
また、増指示でないと判断された場合、すなわち、修正(減)ボタンが選択された場合には(ステップS202においてNO)、パラメータ変更部27は、上述の変数j(区切り位置を設定する際の基準)をたとえば1だけインクリメントする(ステップS206)。
パラメータ変更処理が終わると、処理は、ステップS14に戻され、変更後のパラメータに基づいて、再度、区切り位置設定処理が実行される。
上記の例では、はじめ、変数iは1(補正処理をする)であり、変数jも1(基準値が1)であった。増指示が入力された場合に、変数iは0(補正処理をしない)とされる。図19は、増指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。図19を参照して、補正処理が実行されないので、スタイルID2で特定されるスタイル特徴は、ページ2には存在しないこととなる。したがって、この状態でのページ特徴判定結果の項目61Aの行を参照すると、ページ1,3のページ特徴がスタイルID2,3、ページ2のページ特徴がスタイルID3、ページ4,5のページ特徴がスタイルID5,6、ページ6のページ特徴がスタイルID6であることが示される。そうすると、ページ特徴変化量の項目62Aを参照すると、ページ1からページ2への変化量、および、ページ2からページ3への変化量は、ともに“1”であることが記録される。ページ3〜6の変化量の欄は、図15と同様である。したがって、文書IDの項目63Aの行を参照すると、変化量が1以上の箇所で文書IDが更新されるため、ページ1の欄には、文書IDとして“1”が記録され、ページ2の欄には、文書IDとして“2”が記録される。また、ページ3の欄には、文書IDとして“3”が記録され、ページ4,5の欄には、文書IDとして“4”が記録される。また、ページ6の欄には、文書IDとして“5”が記録される。このように、増指示が入力された場合、分割数が3つから5つに増加される。
図18(b)には、図18(a)に示した文書確認画面において、修正(増)ボタンが選択された場合に、2回目のステップS20において表示される文書画面確認画面の一例が示される。
他方、減指示が入力された場合に、変数j(変化量基準値)は2とされる。図20は、減指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。図20を参照して、ページ特徴判定結果は、1回目の区切り位置設定処理の場合と同じであるため、項目61,62の行は図15と同様である。文書IDの項目63Bの行を参照すると、変化量が2以上の箇所で文書IDが更新されるため、ページ1〜3の欄には、文書IDとして“1”が記録され、ページ4,5の欄には、文書IDとして“2”が記録される。ページ5からページ6への変化量は、基準値(2)未満であるため、ページ6の欄にも、文書IDとして“2”が記録される。このように、減指示が入力された場合、分割数が3つから2つに減少される。
図18(c)には、図18(a)に示した文書確認画面において、修正(減)ボタンが選択された場合に、2回目のステップS20において表示される文書確認画面の一例が示される。
なお、図18(b)および(c)に示した画面において、さらに、修正ボタンが選択されると、その度に、パラメータ(変数i,j)を変更して区切り位置設定処理が繰り返される。
ステップS22において、OK指示が入力された場合、すなわち、OKボタンが選択された場合(ステップS22においてYES)、送信処理部17は、文書画像ごとにファイル名を生成して、操作パネル部110に送付先設定画面を表示する(ステップS24)。
図21は、送付先設定画面の一例を示す図である。図21を参照して、送付先設定画面には、各電子文書の名前および送付先が表示され、「以下に送付します」というメッセージが表示される。同画面には、ユーザからの指示の入力を受付けるためのボタン(OKボタン,キャンセル,変更ボタン)が表示される。変更ボタンは、各電子文書の名前および送付先を変更する指示を受付けるためのボタンであり、電子文書ごとに設けられる。なお、図21は、ユーザにより送付先が設定された後の画面の一例が表示されている。送付先は、電子文書ごとに、たとえば、ユーザがメールアドレスをマニュアルで入力することにより設定されてもよい。そのような入力も、操作パネル部110が受付けてよい。
送付先設定画面において、OKボタンが選択されると、送信処理部17は、電子文書ごとに設定された送付先に対して、送信部18を介して電子文書を送信する(ステップS28)。以上で文書画像生成処理は終了される。
なお、生成された電子文書を送信部18に出力する場合について説明したが、生成された電子文書を記憶部112に出力する場合も上記と同様の処理が実行されるものとする。その場合、ステップS24,S28の処理に代えて、記憶部112に、複数の電子文書を格納する処理が実行されればよい。
このように、多様な種類の文書が混在した原稿を一括して読み込んだとしても、自動的に生成された複数の電子文書それぞれを、ユーザが設定した送り先に送信することができる。また、取得した文書画像のスタイル特徴に基づいて、区切り位置を設定するため、最適な位置で電子文書を分離することができる。つまり、本実施の形態によると、まず、行領域ごとに、スタイル特徴を検出し、文書画像を特徴付けるスタイルのパターンを表わす主要なスタイル特徴を判定する。その上で、ページごとに、該ページに存在する主要なスタイル特徴をページ特徴として検出し、ページ間でのページ特徴の変化量に基づいて、文書画像の区切り位置を設定する。このように、一旦、文書画像全体における主要なスタイル特徴を判定してから、ページごとのページ特徴を検出する。したがって、単純に、行領域ごとのスタイル特徴のみに基づいて区切り位置を設定するよりも、最適な位置で区切り位置を設定することが可能となる。
なお、上述のように、パラメータを変更するために、増指示または減指示の入力を受付けることとしたが、ユーザから、分割数に関する指示が受付けられればこのような形態に限定されない。たとえば、ユーザから、直接、分割数の入力を受付けてもよい。または、区切り位置設定処理が実行される前の段階で、ユーザから、分割数の入力を受付けておいてもよい。この場合、受付けた分割数(あるいはその数に近い値)になるまでパラメータを変更して区切り位置設定処理を実行する。そうすることで、ユーザは、所望の数の電子文書を効率良く得ることができる。
また、上述の区切り位置設定処理が実行された後、さらに、従来から存在する手法を用いて、第2の区切り位置設定処理を実行してもよい。本実施の形態における区切り位置設定処理では、行領域のスタイル特徴に基づいて区切り位置が設定される。したがって、ページ特徴の変化量が0の状態が複数ページ続いた場合、それらのページの間では区切り位置が設定されないことになる。そのような場合、多数のページが1つの文書として扱われることになるので、不都合が生じる場合もある。そのため、画像解析部16は、たとえば、文書IDが同一のページが所定数続いた場合に、第2の区切り位置設定処理を実行してもよい。あるいは、文書IDを付与する前に、所定のページ数連続して、ページ特徴の変化量が0である場合に、第2の区切り位置設定処理を実行することとしてもよい。第2の区切り位置設定処理としては、たとえば、レイアウトや特定文字列(たとえば、ページ番号を表わす文字列)に基づく処理が採用可能である。
また、各電子文書400のファイル名は、固定の文字列と文書IDとを組み合わせたものとしたが、各文書の内容からファイル名を決定してもよい。たとえば、分割された文書それぞれのタイトルに相当する文字列をファイル名としてもよい。その場合、画像解析部16は、区切り位置が設定された各文書画像の中で、高さが最大の文字列領域を抽出する。そして、その領域に対して文字認識処理を行ない、その認識処理の結果をファイル名として決定する。決定したファイル名を上述の管理情報に含めることで、上記と同様に、送信処理部17が各電子文書400のファイル名を付与することができる。このような処理をすることで、より有用なファイル名の付与が可能となる。
また、上記フローチャートでは、一旦、電子文書が生成されてから、ユーザからの増減の指示を受付けたが、そのような手順に限定されない。たとえば、表示制御部25が、先に、文書IDに基づいて表示処理を実行し、指示受付部26によりOK指示が入力された場合に、電子文書生成部15が電子文書を生成することとしてもよい。
また、MFP1は、設定された区切り位置に基づいて、複数の電子文書を生成することとしたが、区切り位置に特定のページ(たとえば白紙ページ)を挿入して1つの電子文書を生成することとしてもよい。
各電子文書400のデータ構造例を図22に示す。図22を参照して、各電子文書400は、ヘッダ部402と、文書画像部404と、フッタ部408とを含む。ヘッダ部402およびフッタ部408には、電子文書400の属性についての情報、たとえば作成日時・作成者・著作権情報などが格納される。文書画像部406には、各ページに対応する文書画像が格納される。なお、この文書画像は、上述したように圧縮された状態で格納されてもよい。
(印刷処理)
以上、文書画像から電子文書を生成する処理において、区切り位置が設定される手順について説明したが、文書画像についての印刷処理を実行する処理においても上記と同様に区切り位置が設定される。
図23は、本発明の実施の形態に従うMFP1が印刷処理を実行する場合の機能構成を示す機能ブロック図である。図23においては、MFP1が印刷処理を実行する場合の機能が示されている。図5と同じ機能については、同じ符号を付してある。したがって、それらの説明は繰返さない。
図23を参照して、図5の電子文書生成部15,送信処理部17に代えて、画像処理部19が、MFP1の機能構成に加えられる。また、送信部18,記憶部112に代えて、プリント部106がMFP1の機能構成に加えられる。画像処理部19は、ユーザ操作に応じて、画像バッファ部13から出力される文書画像をプリント部106でのプリント動作に適した画像に変換する。代表的に、RGB表示系で規定された文書画像をカラープリントに適したCMYK表示系の画像データなどに変換する。このとき、プリント部106の特性に応じた色調整を行なってもよい。プリント部106は、画像処理部19からのCMYK画像からプリント画像を形成して、紙媒体などへの印刷処理を行なう。
MFP1が印刷処理を実行する場合、図6のフローチャートのうち、電子文書生成処理(ステップS18)が削除される。また、送付先設定画面表示(ステップS24)および送信処理(ステップS28)に代えて、画像処理が実行される。画像処理において、画像処理部19は、上述のような変換処理を行なうとともに、文書IDごとにソート方法を変えて、プリント部106に画像データを出力する。これにより、プリント部106より仕分けされた紙媒体が出力される。
なお、プリント部106は、必ずしもソート機能を備えていなくてもよい。この場合、画像処理部19は、たとえば、文書IDの変わり目に、白紙ページなどの特定のページを挿入することとしてもよい。
<変形例>
上述の実施の形態においては、本発明に係る処理がMFP1で実行される場合について説明したが、原稿300を読取るための画像読取機能を備えたコンピュータにおいて上記処理が実行されてもよい。この場合には、コンピュータを文書処理装置として機能させるための図5または図23に示された処理機能を実行させるプログラムを提供することもできる。このようなプログラムは、CD−ROM(Compact Disk-Read Only Memory)などの光学媒体や、メモリカードなどのコンピュータ読取り可能な記録媒体にて記憶させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記憶媒体にて記憶させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
また、プログラムを記録しているたとえば光学媒体等をMFP1の駆動装置(図示せず)で読み出して、記憶部112のプログラムをアップデートすることもできる。
また、画像読取機能を他の装置またはコンピュータで実現した上で、生成された文書画像を受取って、上記のような処理に従って区切り位置を設定してもよい。
なお、本発明にかかるプログラムは、コンピュータのオペレーティングシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。
また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記憶された記憶媒体とを含む。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の実施の形態に従う文書処理装置を含むシステムの概略構成図である。 本発明の実施の形態に従うMFPにおける概略のハードウェア構成を示すブロック図である。 本発明の実施の形態に従うMFPの操作パネル部の外観の一例を示す図である。 本発明の実施の形態に従うパーソナルコンピュータの概略のハードウェア構成を示す模式図である。 本発明の実施の形態に従うMFPが電子文書を生成する場合のMFPの機能構成を示す機能ブロック図である。 本発明の実施の形態における電子文書生成処理を示すフローチャートである。 本発明の実施の形態における区切り位置設定処理を示すフローチャートである。 本発明の実施の形態におけるパラメータ変更処理を示すフローチャートである。 (a)〜(c)は、本実施の形態における行領域抽出処理を説明するための図である。 複数ページを含む文書に対して抽出された行領域の例を示す図である。 文書画像に含まれる行領域のリストの一例を示す図である。 スタイル特徴リストの一例を示す図である。 スタイル特徴ごとの算出結果テーブルの一例を示す図である。 主要領域特徴テーブルの一例を示す図である。 本発明の実施の形態における補正処理が行なわれた後の主要領域特徴テーブルを示す図である。 画像バッファ部に記憶される管理情報のデータ構造の一例を示す図である。 図10の文書画像について、3つの文書が生成された例を示す図である。 (a)〜(c)は、文書確認画面の一例を示す図である。 増指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。 減指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。 送付先設定画面の一例を示す図である。 各電子文書のデータ構造例を示す図である。 本発明の実施の形態に従うMFPが印刷処理を実行する場合のMFPの機能構成を示す機能ブロック図である。
符号の説明
1 MFP、PC1,PC2,PC3 パーソナルコンピュータ、SRV サーバ装置、12 受信部、13 画像バッファ部、15 電子文書生成部、16 画像解析部、17 送信処理部、18 送信部、19 画像処理部、21 行領域抽出部、22 スタイル特徴検出部、23 主要判定部、24 位置設定部、25 表示制御部、26 指示受付部、27 パラメータ変更部、100 制御部、102 メモリ部、104 画像読取部、106 プリント部、108 通信インターフェイス部、110 操作パネル部、112 記憶部、201 CPU、203 内部バス、205 ディスプレイ部、207 通信インターフェイス部、209 入力部、211 ハードディスク部、213 メモリ部、215 CD−ROMドライブ、215a CD−ROM、217 FDDドライブ、217a フレキシブルディスク、300 原稿、310 画像データ、400 電子文書。

Claims (13)

  1. 文書画像を記憶するための第1の記憶手段と、
    前記第1の記憶手段に記憶された文書画像から、所定の種類の文書領域を抽出するための抽出手段と、
    前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するための検出手段と、
    検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての1以上の主要なスタイル特徴を判定するための判定手段と、
    ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するための設定手段とを備える、文書処理装置。
  2. 前記判定手段は、
    前記スタイル特徴ごとに、当該スタイル特徴が出現したページ数を前記出現頻度として算出するための頻度算出手段と、
    算出されたページ数が、所定値以上であるスタイル特徴を、前記主要なスタイル特徴として判定する手段とを含む、請求項1に記載の文書処理装置。
  3. 前記設定手段は、
    各ページに存在する前記主要なスタイル特徴を、当該ページのページ特徴として判定するための手段と、
    ページごとに、当該ページのページ特徴が、前ページのページ特徴から変化した量を前記変化量として算出するための量算出手段と、
    算出された前記変化量が一定値以上の場合に、当該ページ間に区切り位置を設定する手段とを含む、請求項2に記載の文書処理装置。
  4. 前記設定手段は、
    連続する第1、第2および第3のページのうち、前記第2のページ以外の前記第1および第3のページで同一のページ特徴が検出された場合には、前記第2のページにも前記同一のページ特徴が検出されたものとして補正するための補正手段をさらに含む、請求項3に記載の文書処理装置。
  5. 前記設定手段により設定された区切り位置に基づいて、前記文書画像を分割して出力するための出力手段をさらに備える、請求項1〜4のいずれか1項に記載の文書処理装置。
  6. 前記文書画像が前記区切り位置に基づいて区切られた場合に、区切られた複数の分割文書画像における最初のページのインデックス画像を表示するための信号を生成する表示制御手段と、
    前記表示制御手段からの信号に応じた出力を行なう表示手段とをさらに備える、請求項1〜5のいずれか1項に記載の文書処理装置。
  7. ユーザから、前記設定手段による前記文書画像の区切り数に関する指示を受付けるための指示受付手段をさらに備える、請求項1〜6のいずれか1項に記載の文書処理装置。
  8. 受付けられた前記指示に応じて、前記設定手段による区切り位置の設定のための所定のパラメータを変更する変更手段と、
    前記変更手段による変更後に、再度、前記設定手段による処理の実行を指示するための実行指示手段とをさらに備える、請求項7に記載の文書処理装置。
  9. レイアウトあるいは所定の文字列に基づいて、前記文書画像の区切り位置を設定するための第2の設定手段をさらに備える、請求項1〜8のいずれか1項に記載の文書処理装置。
  10. 前記所定の複数の属性種別は、上位領域での位置,大きさ,色、部分領域の個数,位置,高さ,色,隣接する部分領域との距離、文字の大きさ,文字修飾、文字色、背景色、フォントの種別のうち、少なくとも2つを含む、請求項1〜9のいずれか1項に記載の文書処理装置。
  11. 前記所定の種類の文書領域は、段、行、文字列および文字のうちのいずれかに対応する、請求項1〜10のいずれか1項に記載の文書処理装置。
  12. 文書画像を記憶するための記憶部と演算処理部とを備えた文書処理装置において実行される文書処理方法であって、
    前記演算処理部が、前記記憶部に記憶された前記文書画像から、所定の種類の文書領域を抽出するステップと、
    前記演算処理部が、前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するステップと、
    検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての1以上の主要なスタイル特徴を判定するステップと、
    ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するステップとを備える、文書処理方法。
  13. 請求項12に記載の文書処理方法をコンピュータに実行させる、文書処理プログラム。
JP2008007075A 2008-01-16 2008-01-16 文書処理装置、文書処理方法および文書処理プログラム Withdrawn JP2009169675A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008007075A JP2009169675A (ja) 2008-01-16 2008-01-16 文書処理装置、文書処理方法および文書処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008007075A JP2009169675A (ja) 2008-01-16 2008-01-16 文書処理装置、文書処理方法および文書処理プログラム

Publications (1)

Publication Number Publication Date
JP2009169675A true JP2009169675A (ja) 2009-07-30

Family

ID=40970768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008007075A Withdrawn JP2009169675A (ja) 2008-01-16 2008-01-16 文書処理装置、文書処理方法および文書処理プログラム

Country Status (1)

Country Link
JP (1) JP2009169675A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011239217A (ja) * 2010-05-11 2011-11-24 Sharp Corp 画像表示装置及びこれを備えた画像形成装置
WO2013061674A1 (ja) * 2011-10-26 2013-05-02 シャープ株式会社 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム
JP5327492B1 (ja) * 2012-08-22 2013-10-30 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
JP2015213207A (ja) * 2014-05-01 2015-11-26 コニカミノルタ株式会社 電子文書生成システム、画像形成装置およびプログラム
JP2019003660A (ja) * 2018-07-12 2019-01-10 キヤノンマーケティングジャパン株式会社 情報処理装置、その制御方法、及びプログラム、並びに、情報処理システム、その制御方法、及びプログラム
CN109241750A (zh) * 2018-07-20 2019-01-18 海南大学 个性化英文字母展示风格变换方法
US11635940B2 (en) 2020-01-08 2023-04-25 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011239217A (ja) * 2010-05-11 2011-11-24 Sharp Corp 画像表示装置及びこれを備えた画像形成装置
US8902157B2 (en) 2010-05-11 2014-12-02 Sharp Kabushiki Kaisha Image display unit and image forming apparatus including the same
USRE48003E1 (en) 2010-05-11 2020-05-19 Sharp Kabushiki Kaisha Image display unit and image forming apparatus including the same
US9473652B2 (en) 2010-05-11 2016-10-18 Sharp Kabushiki Kaisha Image display unit and image forming apparatus including the same
US9858513B2 (en) 2011-10-26 2018-01-02 Sharp Kabushiki Kaisha Document file output apparatus, document file output method, and computer readable medium
WO2013061674A1 (ja) * 2011-10-26 2013-05-02 シャープ株式会社 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム
JP2013093777A (ja) * 2011-10-26 2013-05-16 Sharp Corp 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム
JP5327492B1 (ja) * 2012-08-22 2013-10-30 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
JP2015213207A (ja) * 2014-05-01 2015-11-26 コニカミノルタ株式会社 電子文書生成システム、画像形成装置およびプログラム
JP2019003660A (ja) * 2018-07-12 2019-01-10 キヤノンマーケティングジャパン株式会社 情報処理装置、その制御方法、及びプログラム、並びに、情報処理システム、その制御方法、及びプログラム
CN109241750A (zh) * 2018-07-20 2019-01-18 海南大学 个性化英文字母展示风格变换方法
CN109241750B (zh) * 2018-07-20 2023-04-07 海南大学 个性化英文字母展示风格变换方法
US11635940B2 (en) 2020-01-08 2023-04-25 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
JP4371965B2 (ja) 画像処理装置、画像処理方法
US11386046B2 (en) Apparatus for setting file name for scan image, method of controlling same, and storage medium
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
US8726178B2 (en) Device, method, and computer program product for information retrieval
US7339695B2 (en) Data processing device, data processing method, and data processing program for recognizing characters in a URL
US8542953B2 (en) Image processing apparatus and image processing method
JP2019041150A (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP2009169675A (ja) 文書処理装置、文書処理方法および文書処理プログラム
US10574839B2 (en) Image processing apparatus, method and storage medium for acquiring character information from scanned image
JP2007049388A (ja) 画像処理装置及びその制御方法、プログラム
JP2009193356A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US9614984B2 (en) Electronic document generation system and recording medium
JP5176416B2 (ja) 文書処理装置、文書処理方法、および文書処理プログラム
JP4956319B2 (ja) 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体
JP5412903B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
US20090279793A1 (en) Image processing apparatus and method for controlling the same
JP5412916B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP2019153919A (ja) 画像処理装置、その制御方法、及びプログラム
JP5098614B2 (ja) 文章処理装置の制御方法および文章処理装置
JP4541770B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2009266009A (ja) 文書処理装置、文書サマリ作成方法および文書サマリ作成プログラム
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
US8380685B2 (en) Information processing apparatus, control method thereof, computer program, and storage medium
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110405