JP2009169675A

JP2009169675A - 文書処理装置、文書処理方法および文書処理プログラム

Info

Publication number: JP2009169675A
Application number: JP2008007075A
Authority: JP
Inventors: Yoshio Komaki; 由夫小巻
Original assignee: Konica Minolta Business Technologies Inc
Current assignee: Konica Minolta Business Technologies Inc
Priority date: 2008-01-16
Filing date: 2008-01-16
Publication date: 2009-07-30

Abstract

【課題】多様な種類の文書が混在した原稿から、ユーザの手間無しに自動的に文書の区切りを設定することのできる画像処理装置、文書処理方法および文書処理プログラムを提供すること。
【解決手段】画像バッファ部１３に記憶された文書画像から行領域を抽出するための行領域抽出部２１と、行領域ごとに、所定の複数の属性種別それぞれに基づく複数の行属性を検出し、行属性の組合せのパターンを表わすスタイル特徴を検出するためのスタイル特徴検出部２２と、検出された複数のスタイル特徴のうち、文書画像の主要なスタイル特徴を判定するための主要判定部２３と、ページ間での主要なスタイル特徴の変化量に基づいて、文書画像の区切り位置を設定するための区切り位置設定部２４とを備える。
【選択図】図５

Description

本発明は、文書処理装置、文書処理方法および文書処理プログラムに関し、特に、原稿の読取り機能を有する文書処理装置、文書処理方法および文書処理プログラムに関する。

省資源や省スペースの観点から、紙原稿などに記載された文書を電子文書に変換して管理する文書管理システムが実用化されている。このような文書管理システムでは、スキャナ装置などを用いて原稿を読取ることで文書画像を生成し、これらの文書画像から電子文書を生成する。

従来より、様々な文書を連続して入力する場合に、文書の区切りを自動的に設定するための提案がなされている。

たとえば、特許文献１には、電子ファイリング装置が、画像の文字認識を行ない、その文字認識結果が予め設定した文字列と一致した場合に、文書の区切りを設定することが開示されている。

また、特許文献２には、画像処理装置が、各ページのレイアウトと各ページに隣接するページのレイアウトとの相違度に基づいて、文書の区切りを設定することが開示されている。

また、特許文献３には、電子ファイル装置が、画像の向き（縦横）を検出し、検出した画像の向きが直前の原稿と異なる場合に文書の区切りを設定することが開示されている。
特開平９−２３１３０９号公報特開２００６−７２４８４号公報特開平７−１９２１０９号公報

特許文献１では、文書の区切りを設定するためには、文書の最初または終わりなどに特定の文字列を含むことが必要とされる。しかしながら、特定の文字列を含む同種の文書は限定される。

特許文献２では、文書の最初と最後とでレイアウトの変化が必要とされる。単一の種類の文書では、文書の区切りでレイアウトの規則的な変化が生じる場合もあるが、複数の文書が混在した場合にはレイアウトの変化に規則性を生じない場合も少なくない。また、レイアウトが変化しない種類の文書、あるいは、レイアウトが多様な文書も存在する。

さらに、特許文献３では、複数の文書をスキャナにかける前に、ユーザが、区切りを設定したい箇所に各文書の向きを直前の文書の向きと変える等の手間が必要となる。

本発明は、上記のような問題を解決するためになされたものであって、その目的は、多様な種類の文書が混在した原稿から、ユーザの手間無しに自動的に文書の区切りを設定することのできる画像処理装置、文書処理方法および文書処理プログラムを提供することである。

この発明のある局面に従う画像処理装置は、文書画像を記憶するための第１の記憶手段と、前記第１の記憶手段に記憶された文書画像から、所定の種類の文書領域を抽出するための抽出手段と、前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するための検出手段と、検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての１以上の主要なスタイル特徴を判定するための判定手段と、ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するための設定手段とを備える。

好ましくは、前記判定手段は、前記スタイル特徴ごとに、当該スタイル特徴が出現したページ数を前記出現頻度として算出するための頻度算出手段と、算出されたページ数が、所定値以上であるスタイル特徴を、前記主要なスタイル特徴として判定する手段とを含む。

好ましくは、前記設定手段は、各ページに存在する前記主要なスタイル特徴を、当該ページのページ特徴として判定するための手段と、ページごとに、当該ページのページ特徴が、前ページのページ特徴から変化した量を前記変化量として算出するための量算出手段と、算出された前記変化量が一定値以上の場合に、当該ページ間に区切り位置を設定する手段とを含む。

好ましくは、前記設定手段は、連続する第１、第２および第３のページのうち、前記第２のページ以外の前記第１および第３のページで同一のページ特徴が検出された場合には、前記第２のページにも前記同一のページ特徴が検出されたものとして補正するための補正手段をさらに含む。

好ましくは、前記設定手段により設定された区切り位置に基づいて、前記文書画像を分割して出力するための出力手段をさらに備える。

好ましくは、前記文書画像が前記区切り位置に基づいて区切られた場合に、区切られた複数の分割文書画像における最初のページのインデックス画像を表示するための信号を生成する表示制御手段と、前記表示制御手段からの信号に応じた出力を行なう表示手段とをさらに備える。

好ましくは、ユーザから、前記設定手段による前記文書画像の区切り数に関する指示を受付けるための指示受付手段をさらに備える。

好ましくは、受付けられた前記指示に応じて、前記設定手段による区切り位置の設定のための所定のパラメータを変更する変更手段と、前記変更手段による変更後に、再度、前記設定手段による処理の実行を指示するための実行指示手段とをさらに備える。

好ましくは、レイアウトあるいは所定の文字列に基づいて、前記文書画像の区切り位置を設定するための第２の設定手段をさらに備える。

好ましくは、前記所定の複数の属性種別は、上位領域での位置，大きさ，色、部分領域の個数，位置，高さ，色，隣接する部分領域との距離、文字の大きさ，文字修飾、文字色、背景色、フォントの種別のうち、少なくとも２つを含む。

好ましくは、前記所定の種類の文書領域は、段、行、文字列および文字のうちのいずれかに対応する。

この発明のさらに他の局面に従う文書処理方法は、文書画像を記憶するための記憶部と演算処理部とを備えた文書処理装置において実行される文書処理方法であって、前記演算処理部が、前記記憶部に記憶された前記文書画像から、所定の種類の文書領域を抽出するステップと、前記演算処理部が、前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するステップと、検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての１以上の主要なスタイル特徴を判定するステップと、ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するステップとを備える。

この発明のさらに他の局面に従う画像処理プログラムは、上記記載の文書処理方法をコンピュータに実行させる。

本発明によると、多様な種類の文書が混在した原稿からでも、ユーザの手間無しに区切り位置を設定することができる。また、主要なスタイル特徴が判定されるため、最適な位置で、文書画像を分割することができる。

本発明の実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰返さない。

＜構成について＞
（全体システム構成）
図１は、この発明の実施の形態に従う文書処理装置を含むシステムの概略構成図である。本実施の形態においては、代表的に、本発明に係る文書処理装置を搭載するＭＦＰ（Multi Function Peripheral）について説明する。なお、本発明に係る文書処理装置は、
ＭＦＰに限らず、複写機、ファクシミリ装置、スキャナ装置などにも適用可能である。

図１を参照して、本実施の形態に従うＭＦＰ１は、原稿３００を読取るための画像読取部１０４と、紙媒体などへの印刷処理を行なうためのプリント部１０６とを含んで構成される。本実施の形態に従うＭＦＰ１は、画像読取部１０４で原稿３００を読取ることで文書画像を取得し、この文書画像を含む電子文書を生成する。また、ＭＦＰ１は、読取った文書画像をプリント部１０６に出力する。

特に、ＭＦＰ１は、複数ページを有する文書画像のスタイル特徴に基づいて、該文書画像の区切り位置を設定することができる。区切り位置は、ページ単位で設定される。

ＭＦＰ１は、設定された区切り位置により文書画像を分割し、分割された複数の文書画像それぞれに対応した複数の電子文書を生成する。これらの電子文書４００には、代表的に、ＰＤＦ（Portable Document Format）などのフォーマットが採用できる。

ＭＦＰ１は、生成した電子文書４００を自身の記憶部（図１において不図示）に格納する。また、記憶された電子文書４００を、ネットワークを介してパーソナルコンピュータＰＣ１，ＰＣ２，ＰＣ３（以下、「パーソナルコンピュータＰＣ」とも総称する）に送信したりする。代表的な使用形態として、ＭＦＰ１が設置されている同一のオフィス内に敷設されたネットワークであるＬＡＮ（Local Area Network）に接続されているパーソナルコンピュータＰＣ１，ＰＣ２に対しては、ＭＦＰ１から電子文書４００が直接的に送信される。一方、ＬＡＮとＷＡＮ（Wide Area Network）との接続点には、サーバ装置ＳＲＶが設けてあり、ＭＦＰ１とは離れたオフィスにあるパーソナルコンピュータＰＣ３などに対しては、ＭＦＰ１からサーバ装置ＳＲＶを介して電子文書４００が送信される。ここで、サーバ装置ＳＲＶは代表的に、メールサーバ、ＦＴＰ（File Transfer Protocol）サーバ、Ｗｅｂサーバ、ＳＭＢサーバなどからなる。

画像読取部１０４は、原稿をセットするための戴荷台と、原稿台ガラスと、戴荷台にセットされた原稿を原稿台ガラスに自動的に一枚ずつ搬送する搬送部と、読取られた原稿を排出するための排出台とを含む（いずれも図示しない）。これにより、複数枚の原稿を連続的に読取って、一つまたは複数の電子文書を生成することができる。

プリント部１０６は、ソート機能を備えている。ＭＦＰ１は、設定された区切り位置により文書画像を分割し、分割された複数の文書画像それぞれを、ソート方法を変えてプリント部１０６に出力する。これにより、一度に読み取られた原稿を、仕分けして出力することができる。

（ＭＦＰ１の概略構成）
図２は、本発明の実施の形態に従うＭＦＰ１における概略のハードウェア構成を示すブロック図である。

図２を参照して、ＭＦＰ１の機能構成としては、制御部１００と、メモリ部１０２と、画像読取部１０４と、プリント部１０６と、通信インターフェイス部１０８と、操作パネル部１１０と、記憶部１１２とを含む。

制御部１００は、代表的にＣＰＵ（Central Processing Unit）などの演算装置から構成され、プログラムを実行することで本実施の形態に従う文書処理を実現する。メモリ部１０２は、代表的にＤＲＡＭ（Dynamic Random Access Memory）などの揮発性の記憶装置であり、制御部１００で実行されるプログラムやプログラムの実行に必要なデータなどを保持する。通信インターフェイス部１０８は、代表的に、ネットワーク（たとえば、図１に示すＬＡＮ）を介してパーソナルコンピュータＰＣ（図１）との間でデータを送受信するための部位であり、たとえば、ＬＡＮアダプタおよびそれを制御するドライバソフトなどを含む。プリント部１０６は、プリント処理を行なうための部位であり、プリント処理に係るハードウェア構成に加えて、各部の作動を制御するための制御装置をも含む。

記憶部１１２は、代表的にハードディスク装置やフラッシュメモリなどの不揮発性の記憶装置であり、制御部１００の動作のためのプログラムや制御部１００で生成された電子文書４００などを格納する。

なお、本実施の形態において、設定された区切り位置に基づいて分割された文書画像は、通信インターフェイス部１０８、記憶部１１２およびプリント部１０６のうちのいずれかに出力されるものとする。

操作パネル部１１０の外観例を図３に示す。図３は、本発明の実施の形態に従うＭＦＰ１の操作パネル部の外観の一例を示す図である。

図３を参照して、操作パネル部１１０は、液晶表示装置やタッチパネルなどから構成される表示パネル１１０ａと、ストップボタン１１０ｂと、スタートボタン１１０ｃと、英数キーなどを含む操作ボタン１１０ｄとを備えている。

なお、ＭＦＰ１は、表示機能と指示の入力機能とを兼ね備えた操作パネル部１１０を備えることとしたが、これに代えて、表示部とハードウェアボタンを含む入力部との両方を備えることとしてもよい。

（パーソナルコンピュータの構成）
図４は、本発明の実施の形態に従うパーソナルコンピュータＰＣの概略のハードウェア構成を示す模式図である。

図４を参照して、パーソナルコンピュータＰＣは、オペレーティングシステム（ＯＳ：Operating System）を含む各種プログラムを実行するＣＰＵ（Central Processing Unit）２０１と、ＣＰＵ２０１でのプログラムの実行に必要なデータを一時的に記憶するメモリ部２１３と、ＣＰＵ２０１で実行されるプログラムを不揮発的に記憶するハードディスク部（ＨＤＤ：Hard Disk Drive）２１１とを含む。また、ハードディスク部２１１には、ＭＦＰ１で生成された電子文書４００を表示するための閲覧アプリケーションが記憶されており、このようなプログラムは、ＦＤＤドライブ２１７またはＣＤ−ＲＯＭドライブ２１５によって、それぞれフレキシブルディスク２１７ａまたはＣＤ−ＲＯＭ（Compact Disk-Read Only Memory）２１５ａなどから読取られる。

ＣＰＵ２０１は、キーボードやマウスなどからなる入力部２０９を介してユーザからの指示を受取るとともに、プログラムの実行によって生成される画面出力をディスプレイ部２０５へ出力する。また、ＣＰＵ２０１は、ＬＡＮカードなどからなる通信インターフェイス部２０７を介して、ＬＡＮやＷＡＮに接続されたＭＦＰ１やサーバ装置ＳＲＶ（図１）から電子文書４００を取得し、ハードディスク部２１１などに格納する。また、上述の各部は、内部バス２０３を介して相互にデータを授受する。

（ＭＦＰの機能構成）
図５は、本発明の実施の形態に従うＭＦＰ１が電子文書を生成する場合の機能構成を示す機能ブロック図である。

図５を参照して、ＭＦＰ１の制御部１００は、画像バッファ部１３と、電子文書生成部１５と、画像解析部１６と、送信処理部１７と、表示制御部２５と、指示受付部２６と、パラメータ変更部２７とを含む。

上述の画像読取部１０４は、原稿３００を読取って文書画像を取得する。より具体的には、紙状の原稿３００を光学的に読取り、デジタルデータに変換することでＲＧＢデジタル画像データを取得する。画像読取部１０４は、取得した文書画像（デジタル画像データ）を画像バッファ部１３へ出力する。

なお、本実施の形態では、画像読取部１０４によって読取られた文書画像が、画像バッファ部１３に出力されることとして説明するが、受信部１２として機能する通信インターフェイス部１０８が受信した画像データ３１０が、画像バッファ部１３に出力されてもよい。受信部１２は、ＬＡＮなどのネットワークを介して画像データ３１０を受信してもよいし、たとえば携帯型小型メモリ（図示せず）に記憶された画像データ３１０を受付けてもよい。受信部１２は、データ形式の整合をとった上で、画像データ３１０を出力する。

画像バッファ部１３は、文書画像のデータを一時的に格納する部位であり、画像解析部１６および電子文書生成部１５から出力の要求があるまで画像データを保持する。画像解析部１６および電子文書生成部１５から出力の要求があれば、対応する画像データを出力する。本実施の形態において、画像バッファ部１３は、各画像データの管理情報も保持する。管理情報には、後述するように、文書ＩＤが含まれる。

画像解析部１６は、行領域抽出部２１と、スタイル特徴検出部２２と、主要判定部２３と、区切り位置設定部２４とを含む。

行領域抽出部２１は、画像バッファ部１３から出力される文書画像から、所定の種類の文書領域として行領域を抽出する。本実施の形態において、「所定の種類の文書領域」は、テキスト領域に含まれる領域であればよく、行領域に限定されるものではない。たとえば、一定以上の余白によって分割される文字領域、文字列および段など、他の部分領域であってもよい。あるいは、ページ，カラムなどの上位領域であってもよい。

スタイル特徴検出部２２は、行領域抽出部２１で抽出された行領域ごとに、所定の複数の属性種別に基づいて、スタイル特徴を検出する。より具体的には、行領域ごとに、所定の複数の属性種別それぞれに基づく複数の行属性を検出し、その行属性の組合せのパターンを、スタイル特徴として検出する。「所定の複数の属性種別」とは、文書画像に含まれる複数のページの特徴を特定するために用いられる情報であり、上位領域での位置，大きさ，色、部分領域の個数，位置，高さ，色，隣接する部分領域との距離、文字の大きさ，文字修飾、文字色、背景色、フォントの種別のうち、少なくとも２つを含む。その他にも、頻度が上位の文字領域の高さ、などを含んでもよい。本実施の形態では、所定の複数の属性種別は、行（部分領域）の高さ、近接行との行間（位置）、文字色、背景色および文字修飾を含むものとする。本実施の形態において、「行属性」とは、行領域ごとの、５つの属性種別それぞれに対応した５種類の属性をいう。

検出された行領域ごとのスタイル特徴は、主要判定部２３に出力される。
主要判定部２３は、検出された複数のスタイル特徴のうち、読取られた文書画像の主要なスタイル特徴を判定する。具体的には、複数のスタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、文書画像についての１以上の主要なスタイル特徴を判定する。つまり、主要判定部２３は、スタイル特徴ごとに、そのスタイル特徴が出現したページ数を出現頻度として算出（カウント）し、算出されたページ数が、所定値以上であるスタイル特徴を、主要なスタイル特徴（有効）として判定する。言い換えると、ページ数が所定値未満のスタイル特徴は、局所的なスタイル特徴であり、文書を特徴付ける主要なスタイル特徴ではない（無効）と判断する。判定された主要なスタイル特徴は、区切り位置設定部２４に出力される。

区切り位置設定部２４は、判定された複数の主要なスタイル特徴に基づいて、読取られた文書画像の区切り位置をページ単位で設定する。具体的には、ページごとに、複数の主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での主要なスタイル特徴の変化量に基づいて、文書画像の区切り位置を設定する。つまり、ページに存在する主要なスタイル特徴を、当該ページのページ特徴として判定する。そして、ページごとに、当該ページのページ特徴が前ページのページ特徴から変化した量を変化量として算出する。区切り位置設定部２４は、算出された変化量が一定値以上の場合に、そのページ間に区切り位置を設定する。箇所を、区切り位置として設定する。また、区切り位置設定部２４は、設定した区切り位置に基づいて、各ページに対応する画像データに文書ＩＤを付与する。付与した文書ＩＤの情報は、画像バッファ部１３に出力される。

このように、文書画像における主要なスタイル特徴に基づいて、自動的に区切り位置が設定される。そのため、多様な種類の文書が混在した原稿からでもユーザの手間を必要とせずに最適な位置に区切りを設定することができる。

なお、区切り位置設定部２４は、ページ特徴を判定した後に、補正処理も行なうことが好ましい。すなわち、連続する第１、第２および第３のページのうち、第２のページ以外の第１および第３のページで同一のページ特徴が検出された場合には、第２のページにも同一のページ特徴が検出されたものとして補正する。このような補正は、全ページに同一のページ特徴が検出されない場合にのみ、実行されることが好ましい。前後のページに同じページ特徴がある場合には、その間のページも同じページ特徴であることが一般的である。たとえば、その間のページが表や写真であった場合などが想定される。このような場合にも、主要なスタイル特徴の出現位置から各ページのページ特徴を適切に判定するために、上記のような補正処理を行なう。これにより、区切りとして最適でない位置で区切りが設定されてしまうことを防止することができる。

電子文書生成部１５は、画像バッファ部１３から文書画像および管理情報を入力する。電子文書生成部１５は、画像データの圧縮処理を行ない、圧縮された画像データをＰＤＦ形式に変換する（電子文書を生成する）。その際に、電子文書生成部１５は、管理情報に含まれる文書ＩＤに基づいて（すなわち、設定された区切り位置に基づいて）、複数の電子文書を生成する。より具体的には、付与された文書ＩＤごとに、電子文書を生成する。そして、生成した電子文書の情報を表示制御部２５に出力する。また、指示受付部２６が所定の指示を受付けた場合に、生成された電子文書を、ユーザによる設定などに応じて、記憶部１１２へ格納されたり、送信処理部１７へ出力されたりする。なお、圧縮度合いは、生成される電子文書の大きさや、要求される文書画像の解像度などに応じて変化させてもよい。

表示制御部２５は、生成された各電子文書を特定するためのインデックス画像、たとえば最初のページのプレビュー画像を表示するための信号を生成する。表示制御部２５は、生成した信号を操作パネル部１１０に出力する。これにより、操作パネル部１１０に、複数のプレビュー画像が表示される。なお、インデックス画像は、文書画像の区切り位置が特定可能であればよく、最初のページのプレビュー画像に限定されない。また、文書画像の区切り位置が特定できれば、画像でなくてもよい。

指示受付部２６は、操作パネル部１１０を介して、生成された電子文書の数に関する指示を受付ける。具体的には、ユーザから、文書数を増やす指示（以下「増指示」という）、文書数を減らす指示（以下「減指示」という）およびＯＫ指示（現状の文書数で出力する旨の指示）のいずれかが受付けられる。指示受付部２６は、増指示または減指示を受付けた場合に、その指示内容をパラメータ変更部２７に出力する。ＯＫ指示を受付けた場合には、その旨を電子文書生成部１５に出力する。

パラメータ変更部２７は、受付けた修正の指示内容に基づいて、区切り位置設定のための所定のパラメータを変更する。パラメータが変更されると、再度、区切り位置設定部２４による処理の実行が指示される。これにより、区切り位置設定部２４は、変更されたパラメータに基づいて、再度、区切り位置設定処理を実行する。

このように、本実施の形態では、区切り位置が自動的に設定された後に、ユーザにその区切り度合い（分割数）を確認させる。そのため、ユーザは、希望の数になるように何度でも区切り位置設定処理の実行を指示することができる。

送信処理部１７は、電子文書４００を、各種の通信プロトコルに従って、ユーザにより指定された送り先に送信するための処理を行なう。プロトコルとしては、たとえばＳＭＢ（Server Message Block），ＦＴＰ（File Transfer Protocol），ＨＴＴＰ（Hyper Text Transfer Protocol），ＳＭＴＰ（Simple Mail Transfer Protocol）などが選択可能である。本実施の形態において、送信処理部１７は、文書ＩＤが異なる複数の電子文書４００が生成された場合には、各電子文書４００に異なるファイル名を付与する。ファイル名として、たとえば、「“Doc”＋“文書ＩＤ”＋“.pdf”」が付与される。また、送信処理部１７は、ユーザからの指示に基づいて、電子文書４００の送り先を設定する。なお、これらの具体的な処理の例については後述する。送信処理部１７は、電子文書４００、電子文書４００ごとのファイル名および送り先を送信部１８に出力する。

送信部１８は、通信インターフェイス部１０８によって実現され、ＬＡＮなどのネットワークを介してパーソナルコンピュータＰＣ（図１）などへ、電子文書生成部１５で生成された複数の電子文書４００を送信する。なお、送信部１８は、たとえば携帯型小型メモリ（図示せず）を装着可能であり、電子文書４００は、そのような着脱可能なメモリに出力されてもよい。

なお、制御部１００に含まれる各ブロックの動作は、たとえば記憶部１１２中に格納されたソフトウェアを実行することで実現されてもよいし、これらのブロックのうち少なくとも１つについては、ハードウェアで実現されてもよい。

＜動作について＞
（電子文書生成処理）
以下に、本発明の実施の形態のＭＦＰ１が実行する電子文書生成処理について、図６〜８のフローチャートおよび図９〜２２を参照して具体的に説明する。

図６は、本発明の実施の形態における電子文書生成処理を示すフローチャートである。図６のフローチャートに示す処理は、予めプログラムとして記憶部１１２に格納されており、制御部１００がこのプログラムを読み出して実行することにより、電子文書生成処理の機能が実現される。なお、このフローチャートにおいては、電子文書をインターネット経由でＰＣ等に送信することがユーザにより設定されたものとして説明する。

図６を参照して、はじめに、行領域抽出部２１は、画像バッファ部１３に記憶された文書画像から、行領域を抽出する（ステップＳ２）。具体的には、次の手順で行領域が抽出される。図９は、本実施の形態における行領域抽出処理を説明するための図である。図９（ａ）には、元の文書画像の任意のページが示されている。

行領域抽出部２１は、各ページのＲＧＢ画像データを２値化する。たとえば、ＲＧＢ画像の輝度値に変換し、各ページの輝度値の平均値と比較する。これにより、明るい場合は「０」、暗い場合は「１」がたとえばメモリ部１０２に一時記録される。次に、２値画像の値が“１”の画素を８連結で走査する。連結がある場合には、画素に同一のラベル値を与えることで黒連結領域を生成し、その外接矩形を求める。図９（ｂ）は、外接矩形が求められた結果を示す図である。

次に、各外接矩形について左右方向に一定距離以下に近接する領域を検出し、検出された領域を１つの領域に統合する。図９（ｃ）は、図９（ｂ）の外接矩形が統合された領域を示す図である。行領域抽出部２１は、統合された領域を行領域として出力する。複数ページを含む文書に対して抽出された行領域の例を図１０に示す。なお、行領域を抽出するための処理は、上述のような処理に限定されるものではない。

ステップＳ２の処理が終わると、スタイル特徴検出部２２は、所定の複数の属性種別に基づいて、抽出された行領域ごとのスタイル特徴を検出する（ステップＳ４）。具体的には、複数の属性種別として、行の高さ、近接行との行間、文字色、背景色および文字修飾が用いられる。したがって、スタイル特徴検出部２２は、行領域ごとに、これらの属性種別に基づいたスタイル特徴を検出する。

「行の高さ」は、行領域の高さを算出することで得られる。「近接行との行間」は、上下に隣接する行領域を検出して、隣接する各行領域との距離を算出する。そして、距離が小さい方の値を、「近接行との行間」として得る。「文字色」および「背景色」は、各行領域のカラーヒストグラムを生成する。そして、最頻度の色を「背景色」、次頻度の色を「文字色」として得る。「文字修飾」は、行領域のランレングスヒストグラムを生成する。すなわち、行領域の縦方向および横方向の黒画素の連続長のヒストグラムを生成する。そして、生成されたランレングスヒストグラムに基づいて、「太い文字」、「斜体」などの文字修飾を判定し、最頻度の文字修飾を「文字修飾」として得る。なお、各々の行属性の検出方法は、上述のような方法に限定されるものではない。

スタイル特徴検出部２２は、検出した各々の行属性を、行領域リストに記録する。
図１１は、文書画像に含まれる行領域のリストの一例を示す図である。図１１を参照して、行領域のリストには、主に４つの項目すなわちページ、ページＩＤ、行ＩＤおよび属性種別を有しており、これらの項目が互いに対応付けられている。ページの項目には、文書画像のページ順に、１ページ目、２ページ目、…、６ページ目が記録される。ページＩＤの項目には、各ページを一意に特定するための識別情報（ＩＤ）が記録される。行ＩＤの項目には、各ページ内の各行を一意に特定するための識別情報（ＩＤ）が記録される。属性種別の項目には、行ＩＤごとに、上記５つの属性種別に基づくスタイル特徴が記録される。「スタイル特徴」とは、本実施の形態において、５つの行属性の組合せに基づく特徴を示す。つまり、たとえば、１ページ目における行ＩＤ１の行では、行の高さ「４」、近接行との行間「２０」、文字色「黒」、背景色「白」および文字修飾「太い文字」のそれぞれが、この行の行属性である。また、これらの行属性の組合せが、この行のスタイル特徴となる。

ステップＳ４の処理が終わると、スタイル特徴検出部２２は、行領域ごとに検出されたスタイル特徴に基づいて、スタイル特徴リストを生成する（ステップＳ６）。スタイル特徴リストは、ユニークなスタイル特徴のリストである。

図１２は、スタイル特徴リストの一例を示す図である。
図１２を参照して、スタイル特徴リストは、６つの項目すなわち、スタイルＩＤ、行の高さ、近接行との行間、文字色、背景色および文字修飾の項目を有し、各項目は互いに対応付けられている。スタイルＩＤは、ユニークなスタイル特徴を一意に特定するための識別情報（ＩＤ）である。

ステップＳ６の処理が終わると、主要判定部２３は、スタイル特徴ごとの頻度を算出する（ステップＳ８）。具体的には、スタイル特徴リストのスタイルＩＤごとに、出現する行数およびページ数を算出する。これにより、各スタイルＩＤで特定されるスタイル特徴ごとに、文書画像における出現頻度（存在割合）が算出される。なお、ページごとのスタイル特徴を抽出する必要があるので、ページ数のみが算出されることとしてもよい。

図１３は、スタイル特徴ごとの頻度算出結果を示すテーブル（以下「算出結果テーブル」という）の一例を示す図である。図１３を参照して、算出結果テーブルの列には、７つのスタイルＩＤそれぞれに対応する７つの項目が設けられ、該テーブルの行には、６つのページＩＤそれぞれに対応する６つの項目と、行数を示す項目と、ページ数を示す項目とが設けられる。なお、算出結果テーブルの行に含まれる有効性を示すの項目は、後の判定処理の結果が記録される。

算出結果テーブルには、ページＩＤの欄には、各スタイルＩＤで特定されるスタイル特徴が出現する行数が記録される。そして、主要判定部２３は、記録した行数の情報に基づいて、スタイルＩＤごとに、行数およびページ数を算出する。

ステップＳ８の処理が終わると、主要判定部２３は、主要なスタイル特徴を判定する（ステップＳ１０）。具体的には、たとえば、ページ数が所定数以上のスタイル特徴を、主要なスタイル特徴として判定する。なお、ここでの「所定数」とは、文書画像が有するページ数に基づいて、予め算出された値であることが望ましい。たとえば、ページ数に一定割合（たとえば、１／３）を乗じた値である。したがって、図１０に示した文書画像の例では、ページ数が２以上のスタイル特徴が、主要なスタイル特徴であると判定される。

主要判定部２３は、算出結果テーブルの有効性の欄のうち、ページ数が２以上のスタイル特徴に対応するスタイルＩＤの欄に有効を示す「有」を記録し、ページ数が２未満のスタイル特徴に対応するスタイルＩＤの欄に無効を示す「無」を記録する。つまり、主要なスタイル特徴であれば「有」が記録されることになる。図１３では、スタイルＩＤが２，３，５，６のスタイル特徴が主要なスタイル特徴であることが示される。

なお、ここでは、ページ数のみに基づいて、主要なスタイル特徴を判定したが、行数を加味した判定を行なってもよい。たとえば、ページ数が２以上であり、かつ、行数が所定数以上であるものを、主要なスタイル特徴と判定してもよい。この場合の「所定数」は、全行数に基づいて、予め算出された値であってもよいし、ページ数に基づいて、予め算出された値であってもよい。このように、行数も加味した判定をすることで、ページ内での出現割合が低いスタイル特徴が、主要なスタイル特徴と判定されることを防止することができる。または、各スタイル特徴のページ内での占有面積を算出し、その割合が、一定値以上の場合にのみ、ページ数をカウントするようにしてもよい。

ステップＳ１０の処理が終わると、主要判定部２３は、主要なスタイル特徴と判定されたスタイル特徴についてのテーブル（以下「主要領域特徴テーブル」）を生成する（ステップＳ１２）。図１４は、主要領域特徴テーブルの一例を示す図である。

図１４を参照して、主要領域特徴テーブルは、図１３に示した算出結果テーブルのうち、有効性の欄に「有」が記録されたスタイルＩＤに対応する項目のみを含む。つまり、主要領域特徴テーブルには、主要なスタイル特徴と判定されたスタイル特徴についての、ページごとの出現行数、トータルの行数、出現ページ数（および有効性）が含まれる。

ステップＳ１２の処理が終わると、区切り位置設定部２４は、区切り位置設定処理を実行する（ステップＳ１４）。区切り位置設定処理については、図７のサブルーチンのフローチャートを用いて詳細に説明する。

図７は、本発明の実施の形態における区切り位置設定処理を示すフローチャートである。

区切り位置設定部２４は、各ページのページ特徴を判定する（ステップＳ１０２）。図１４の主要領域特徴テーブルに基づくと、ページ１のページ特徴は、スタイルＩＤが２，３のスタイル特徴であり、ページ２のページ特徴は、スタイルＩＤが３のスタイル特徴である。また、ページ３のページ特徴は、スタイルＩＤが２，３のスタイル特徴であり、ページ４，５のページ特徴は、各々、スタイルＩＤが５，６のスタイル特徴である。ページ６のページ特徴は、スタイルＩＤが６のスタイル特徴である。

次に、区切り位置設定部２４は、補正処理を実行する（ステップＳ１０４）。具体的には、連続する３つのページのうち、間のページのみに存在しないスタイルＩＤがある場合に、そのページにも該スタイルＩＤが存在するものとして補正する。図１４の例では、囲み線５１で示されるように、スタイルＩＤ“２”で特定されるスタイル特徴（ページ特徴）は、ページ１および３に存在するが、ページ２には存在しない。したがって、区切り位置設定部２４は、スタイルＩＤ“２”に対応するページ２の欄を、“０”から“１”に書き換える。補正した結果を図１５に示す。図１５は、本発明の実施の形態における補正処理が行なわれた後の主要領域特徴テーブルを示す図である。図１５に示されるように、上記書き換えに伴ない、スタイルＩＤが“２”の行の行数およびページ数を１だけインクリメントする。このような補正処理の結果、主要領域特徴テーブルの列にページ特徴判定結果の項目６１が追加される。項目６１の行を参照すると、ページ１〜３のページ特徴がスタイルＩＤ２，３、ページ４，５のページ特徴がスタイルＩＤ５，６、ページ６のページ特徴がスタイルＩＤ６であることが示される。

なお、ここでの補正処理は、前後のページ（第１および第３のページ）に、１つでも同一のスタイル特徴の行が存在すれば実行される。しかしながら、たとえば、全ページ数に応じて予め定められた行数が存在する場合にのみ、補正処理が実行されてもよい。

また、補正処理は、補正処理をするか否かを特定するための「変数ｉ」が１である場合にのみ実行されるものとし、はじめ、変数ｉは１にセットされているものとする。

なお、このような補正処理は、必ずしも実行されなくてもよい。
ステップＳ１０４の処理が終わると、区切り位置設定部２４は、ページ間でのページ特徴変化量を算出する（ステップＳ１０６）。区切り位置設定部２４は、図１５に示した主要領域特徴テーブルの列に、さらに、ページ特徴変化量の項目６２を追加する。項目６２の行を参照すると、ページ１〜３のページ特徴は同一であるため、ページ１からページ２への変化量、および、ページ２からページ３への変化量は、ともに“０”であることが記録される。ページ４には、ページ３におけるページ特徴であるスタイルＩＤ２，３のいずれも存在しないため、ページ３からページ４への変化量は、“２”と記録される。ページ４とページ５とは、ページ特徴が同一であるため、ページ４からページ５への変化量は、“０”となる。ページ６には、ページ５におけるページ特徴であるスタイルＩＤ５が存在しないため、ページ５からページ６への変化量は、“１”となる。

ステップＳ１０６の処理が終わると、区切り位置設定部２４は、区切り位置を設定する（ステップＳ１０８）。具体的には、区切り位置設定部２４は、変化量が「変数ｊ」以上であるページ間に、区切り位置を設定する。「変数ｊ」は、区切り位置を設定する際の基準となる値（変化量）であり、はじめ、変数ｊは、１に設定されているものとする。つまり、項目６２の欄に１以上の数値が記録されたページの直前で、区切り位置が設定される。したがって、この例では、ページ３とページ４との間、ページ５とページ６との間に区切り位置が設定される。

再び図６を参照して、区切り位置設定部２４は、区切り位置に基づいて、文書ＩＤを付与する（ステップＳ１６）。すなわち、区切り位置設定部２４は、区切り位置と判定された箇所で、文書ＩＤを更新する。具体的には、区切り位置設定部２４は、図１５に示した主要領域特徴テーブルの列に、さらに、文書ＩＤの項目６３を追加する。項目６３の行を参照して、ページ１〜３の欄には、文書ＩＤとして“１”が記録され、ページ４，５の欄には、文書ＩＤとして“２”が記録される。また、ページ６の欄には、文書ＩＤとして“３”が記録される。このように、最初のページに文書ＩＤとして“１”を付与し、区切り位置で文書ＩＤを１だけインクリメントする。

区切り位置設定部２４は、文書ＩＤの情報を、画像バッファ部１３に出力する。これにより、画像バッファ部１３に、文書画像とともに、文書ＩＤを含む管理情報が記憶される。図１６に、文書ＩＤを含む管理情報のデータ構造の一例を示す。管理情報には、ページＩＤと、文書ＩＤと、各画像データ（ページ）へのポインタとが対応付けられて記憶されている。画像バッファ部１３は、文書画像のデータと管理情報とを、電子文書生成部１５に出力する。

電子文書生成部１５は、管理情報に含まれる文書ＩＤの情報に基づき、複数の電子文書を生成する（ステップＳ１８）。つまり、電子文書生成部１５は、文書ＩＤの数分、電子文書を生成する。図１０の文書画像について、３つの文書が生成された例を、図１７に示す。図１７を参照して、第１の電子文書となるＰＤＦデータ１は、文書ＩＤ１に対応しており、当該電子文書には、ページ１〜ページ３の文書画像が含まれる。第２の電子文書となるＰＤＦデータ２は、文書ＩＤ２に対応しており、当該電子文書には、ページ４，５の文書画像が含まれる。第３の電子文書となるＰＤＦデータ３は、文書ＩＤ３に対応しており、当該電子文書には、ページ６の文書画像が含まれる。

次に、表示制御部２５は、操作パネル部１１０の表示パネル１１０ａに文書確認画面を表示する（ステップＳ２０）。図１８は、文書確認画面の一例を示す図であり、図１８（ａ）は、図６のステップＳ２０にて表示される画面の一例を示す。図１８（ａ）を参照して、文書確認画面には、各電子文書の先頭ページのプレビュー画像が表示され、「３つの文書を読み込みました。送付してよろしいですか？」とのメッセージが表示される。また、同画面には、ユーザからの指示を受付けるための４つのボタン（ＯＫボタン，修正（増）ボタン，修正（減）ボタン，キャンセルボタン）が表示される。

指示受付部２６は、操作パネル部１１０を介してＯＫ指示が入力されたか否かを判断する（ステップＳ２２）。修正ボタンが選択された場合（ステップＳ２４でＮＯ）、パラメータ変更部２７は、パラメータ変更処理を実行する（ステップＳ２６）。なお、キャンセルボタンが選択された場合には、全ての処理を中断して、元の状態（区切り位置が設定されていない状態）へ戻されものとする。

パラメータ変更処理については、図８に示すサブルーチンのフローチャートを用いて説明する。

図８は、本発明の実施の形態におけるパラメータ変更処理を示すフローチャートである。図８を参照して、パラメータ変更部２７は、ユーザから、増指示が入力されたか否かを判断する（ステップＳ２０２）。増指示が入力されたと判断された場合、すなわち、修正（増）ボタンが選択された場合に（ステップＳ２０２においてＹＥＳ）、パラメータ変更部２７は、上述の変数ｉを０にする（ステップＳ２０４）。つまり、上述の補正処理（ステップＳ１０４）を実行しないように設定する。

また、増指示でないと判断された場合、すなわち、修正（減）ボタンが選択された場合には（ステップＳ２０２においてＮＯ）、パラメータ変更部２７は、上述の変数ｊ（区切り位置を設定する際の基準）をたとえば１だけインクリメントする（ステップＳ２０６）。

パラメータ変更処理が終わると、処理は、ステップＳ１４に戻され、変更後のパラメータに基づいて、再度、区切り位置設定処理が実行される。

上記の例では、はじめ、変数ｉは１（補正処理をする）であり、変数ｊも１（基準値が１）であった。増指示が入力された場合に、変数ｉは０（補正処理をしない）とされる。図１９は、増指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。図１９を参照して、補正処理が実行されないので、スタイルＩＤ２で特定されるスタイル特徴は、ページ２には存在しないこととなる。したがって、この状態でのページ特徴判定結果の項目６１Ａの行を参照すると、ページ１，３のページ特徴がスタイルＩＤ２，３、ページ２のページ特徴がスタイルＩＤ３、ページ４，５のページ特徴がスタイルＩＤ５，６、ページ６のページ特徴がスタイルＩＤ６であることが示される。そうすると、ページ特徴変化量の項目６２Ａを参照すると、ページ１からページ２への変化量、および、ページ２からページ３への変化量は、ともに“１”であることが記録される。ページ３〜６の変化量の欄は、図１５と同様である。したがって、文書ＩＤの項目６３Ａの行を参照すると、変化量が１以上の箇所で文書ＩＤが更新されるため、ページ１の欄には、文書ＩＤとして“１”が記録され、ページ２の欄には、文書ＩＤとして“２”が記録される。また、ページ３の欄には、文書ＩＤとして“３”が記録され、ページ４，５の欄には、文書ＩＤとして“４”が記録される。また、ページ６の欄には、文書ＩＤとして“５”が記録される。このように、増指示が入力された場合、分割数が３つから５つに増加される。

図１８（ｂ）には、図１８（ａ）に示した文書確認画面において、修正（増）ボタンが選択された場合に、２回目のステップＳ２０において表示される文書画面確認画面の一例が示される。

他方、減指示が入力された場合に、変数ｊ（変化量基準値）は２とされる。図２０は、減指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。図２０を参照して、ページ特徴判定結果は、１回目の区切り位置設定処理の場合と同じであるため、項目６１，６２の行は図１５と同様である。文書ＩＤの項目６３Ｂの行を参照すると、変化量が２以上の箇所で文書ＩＤが更新されるため、ページ１〜３の欄には、文書ＩＤとして“１”が記録され、ページ４，５の欄には、文書ＩＤとして“２”が記録される。ページ５からページ６への変化量は、基準値（２）未満であるため、ページ６の欄にも、文書ＩＤとして“２”が記録される。このように、減指示が入力された場合、分割数が３つから２つに減少される。

図１８（ｃ）には、図１８（ａ）に示した文書確認画面において、修正（減）ボタンが選択された場合に、２回目のステップＳ２０において表示される文書確認画面の一例が示される。

なお、図１８（ｂ）および（ｃ）に示した画面において、さらに、修正ボタンが選択されると、その度に、パラメータ（変数ｉ，ｊ）を変更して区切り位置設定処理が繰り返される。

ステップＳ２２において、ＯＫ指示が入力された場合、すなわち、ＯＫボタンが選択された場合（ステップＳ２２においてＹＥＳ）、送信処理部１７は、文書画像ごとにファイル名を生成して、操作パネル部１１０に送付先設定画面を表示する（ステップＳ２４）。

図２１は、送付先設定画面の一例を示す図である。図２１を参照して、送付先設定画面には、各電子文書の名前および送付先が表示され、「以下に送付します」というメッセージが表示される。同画面には、ユーザからの指示の入力を受付けるためのボタン（ＯＫボタン，キャンセル，変更ボタン）が表示される。変更ボタンは、各電子文書の名前および送付先を変更する指示を受付けるためのボタンであり、電子文書ごとに設けられる。なお、図２１は、ユーザにより送付先が設定された後の画面の一例が表示されている。送付先は、電子文書ごとに、たとえば、ユーザがメールアドレスをマニュアルで入力することにより設定されてもよい。そのような入力も、操作パネル部１１０が受付けてよい。

送付先設定画面において、ＯＫボタンが選択されると、送信処理部１７は、電子文書ごとに設定された送付先に対して、送信部１８を介して電子文書を送信する（ステップＳ２８）。以上で文書画像生成処理は終了される。

なお、生成された電子文書を送信部１８に出力する場合について説明したが、生成された電子文書を記憶部１１２に出力する場合も上記と同様の処理が実行されるものとする。その場合、ステップＳ２４，Ｓ２８の処理に代えて、記憶部１１２に、複数の電子文書を格納する処理が実行されればよい。

このように、多様な種類の文書が混在した原稿を一括して読み込んだとしても、自動的に生成された複数の電子文書それぞれを、ユーザが設定した送り先に送信することができる。また、取得した文書画像のスタイル特徴に基づいて、区切り位置を設定するため、最適な位置で電子文書を分離することができる。つまり、本実施の形態によると、まず、行領域ごとに、スタイル特徴を検出し、文書画像を特徴付けるスタイルのパターンを表わす主要なスタイル特徴を判定する。その上で、ページごとに、該ページに存在する主要なスタイル特徴をページ特徴として検出し、ページ間でのページ特徴の変化量に基づいて、文書画像の区切り位置を設定する。このように、一旦、文書画像全体における主要なスタイル特徴を判定してから、ページごとのページ特徴を検出する。したがって、単純に、行領域ごとのスタイル特徴のみに基づいて区切り位置を設定するよりも、最適な位置で区切り位置を設定することが可能となる。

なお、上述のように、パラメータを変更するために、増指示または減指示の入力を受付けることとしたが、ユーザから、分割数に関する指示が受付けられればこのような形態に限定されない。たとえば、ユーザから、直接、分割数の入力を受付けてもよい。または、区切り位置設定処理が実行される前の段階で、ユーザから、分割数の入力を受付けておいてもよい。この場合、受付けた分割数（あるいはその数に近い値）になるまでパラメータを変更して区切り位置設定処理を実行する。そうすることで、ユーザは、所望の数の電子文書を効率良く得ることができる。

また、上述の区切り位置設定処理が実行された後、さらに、従来から存在する手法を用いて、第２の区切り位置設定処理を実行してもよい。本実施の形態における区切り位置設定処理では、行領域のスタイル特徴に基づいて区切り位置が設定される。したがって、ページ特徴の変化量が０の状態が複数ページ続いた場合、それらのページの間では区切り位置が設定されないことになる。そのような場合、多数のページが１つの文書として扱われることになるので、不都合が生じる場合もある。そのため、画像解析部１６は、たとえば、文書ＩＤが同一のページが所定数続いた場合に、第２の区切り位置設定処理を実行してもよい。あるいは、文書ＩＤを付与する前に、所定のページ数連続して、ページ特徴の変化量が０である場合に、第２の区切り位置設定処理を実行することとしてもよい。第２の区切り位置設定処理としては、たとえば、レイアウトや特定文字列（たとえば、ページ番号を表わす文字列）に基づく処理が採用可能である。

また、各電子文書４００のファイル名は、固定の文字列と文書ＩＤとを組み合わせたものとしたが、各文書の内容からファイル名を決定してもよい。たとえば、分割された文書それぞれのタイトルに相当する文字列をファイル名としてもよい。その場合、画像解析部１６は、区切り位置が設定された各文書画像の中で、高さが最大の文字列領域を抽出する。そして、その領域に対して文字認識処理を行ない、その認識処理の結果をファイル名として決定する。決定したファイル名を上述の管理情報に含めることで、上記と同様に、送信処理部１７が各電子文書４００のファイル名を付与することができる。このような処理をすることで、より有用なファイル名の付与が可能となる。

また、上記フローチャートでは、一旦、電子文書が生成されてから、ユーザからの増減の指示を受付けたが、そのような手順に限定されない。たとえば、表示制御部２５が、先に、文書ＩＤに基づいて表示処理を実行し、指示受付部２６によりＯＫ指示が入力された場合に、電子文書生成部１５が電子文書を生成することとしてもよい。

また、ＭＦＰ１は、設定された区切り位置に基づいて、複数の電子文書を生成することとしたが、区切り位置に特定のページ（たとえば白紙ページ）を挿入して１つの電子文書を生成することとしてもよい。

各電子文書４００のデータ構造例を図２２に示す。図２２を参照して、各電子文書４００は、ヘッダ部４０２と、文書画像部４０４と、フッタ部４０８とを含む。ヘッダ部４０２およびフッタ部４０８には、電子文書４００の属性についての情報、たとえば作成日時・作成者・著作権情報などが格納される。文書画像部４０６には、各ページに対応する文書画像が格納される。なお、この文書画像は、上述したように圧縮された状態で格納されてもよい。

（印刷処理）
以上、文書画像から電子文書を生成する処理において、区切り位置が設定される手順について説明したが、文書画像についての印刷処理を実行する処理においても上記と同様に区切り位置が設定される。

図２３は、本発明の実施の形態に従うＭＦＰ１が印刷処理を実行する場合の機能構成を示す機能ブロック図である。図２３においては、ＭＦＰ１が印刷処理を実行する場合の機能が示されている。図５と同じ機能については、同じ符号を付してある。したがって、それらの説明は繰返さない。

図２３を参照して、図５の電子文書生成部１５，送信処理部１７に代えて、画像処理部１９が、ＭＦＰ１の機能構成に加えられる。また、送信部１８，記憶部１１２に代えて、プリント部１０６がＭＦＰ１の機能構成に加えられる。画像処理部１９は、ユーザ操作に応じて、画像バッファ部１３から出力される文書画像をプリント部１０６でのプリント動作に適した画像に変換する。代表的に、ＲＧＢ表示系で規定された文書画像をカラープリントに適したＣＭＹＫ表示系の画像データなどに変換する。このとき、プリント部１０６の特性に応じた色調整を行なってもよい。プリント部１０６は、画像処理部１９からのＣＭＹＫ画像からプリント画像を形成して、紙媒体などへの印刷処理を行なう。

ＭＦＰ１が印刷処理を実行する場合、図６のフローチャートのうち、電子文書生成処理（ステップＳ１８）が削除される。また、送付先設定画面表示（ステップＳ２４）および送信処理（ステップＳ２８）に代えて、画像処理が実行される。画像処理において、画像処理部１９は、上述のような変換処理を行なうとともに、文書ＩＤごとにソート方法を変えて、プリント部１０６に画像データを出力する。これにより、プリント部１０６より仕分けされた紙媒体が出力される。

なお、プリント部１０６は、必ずしもソート機能を備えていなくてもよい。この場合、画像処理部１９は、たとえば、文書ＩＤの変わり目に、白紙ページなどの特定のページを挿入することとしてもよい。

＜変形例＞
上述の実施の形態においては、本発明に係る処理がＭＦＰ１で実行される場合について説明したが、原稿３００を読取るための画像読取機能を備えたコンピュータにおいて上記処理が実行されてもよい。この場合には、コンピュータを文書処理装置として機能させるための図５または図２３に示された処理機能を実行させるプログラムを提供することもできる。このようなプログラムは、ＣＤ−ＲＯＭ（Compact Disk-Read Only Memory）などの光学媒体や、メモリカードなどのコンピュータ読取り可能な記録媒体にて記憶させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記憶媒体にて記憶させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。

また、プログラムを記録しているたとえば光学媒体等をＭＦＰ１の駆動装置（図示せず）で読み出して、記憶部１１２のプログラムをアップデートすることもできる。

また、画像読取機能を他の装置またはコンピュータで実現した上で、生成された文書画像を受取って、上記のような処理に従って区切り位置を設定してもよい。

なお、本発明にかかるプログラムは、コンピュータのオペレーティングシステム（ＯＳ）の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずＯＳと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。

また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。

提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記憶された記憶媒体とを含む。

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

本発明の実施の形態に従う文書処理装置を含むシステムの概略構成図である。本発明の実施の形態に従うＭＦＰにおける概略のハードウェア構成を示すブロック図である。本発明の実施の形態に従うＭＦＰの操作パネル部の外観の一例を示す図である。本発明の実施の形態に従うパーソナルコンピュータの概略のハードウェア構成を示す模式図である。本発明の実施の形態に従うＭＦＰが電子文書を生成する場合のＭＦＰの機能構成を示す機能ブロック図である。本発明の実施の形態における電子文書生成処理を示すフローチャートである。本発明の実施の形態における区切り位置設定処理を示すフローチャートである。本発明の実施の形態におけるパラメータ変更処理を示すフローチャートである。（ａ）〜（ｃ）は、本実施の形態における行領域抽出処理を説明するための図である。複数ページを含む文書に対して抽出された行領域の例を示す図である。文書画像に含まれる行領域のリストの一例を示す図である。スタイル特徴リストの一例を示す図である。スタイル特徴ごとの算出結果テーブルの一例を示す図である。主要領域特徴テーブルの一例を示す図である。本発明の実施の形態における補正処理が行なわれた後の主要領域特徴テーブルを示す図である。画像バッファ部に記憶される管理情報のデータ構造の一例を示す図である。図１０の文書画像について、３つの文書が生成された例を示す図である。（ａ）〜（ｃ）は、文書確認画面の一例を示す図である。増指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。減指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。送付先設定画面の一例を示す図である。各電子文書のデータ構造例を示す図である。本発明の実施の形態に従うＭＦＰが印刷処理を実行する場合のＭＦＰの機能構成を示す機能ブロック図である。

符号の説明

１ＭＦＰ、ＰＣ１，ＰＣ２，ＰＣ３パーソナルコンピュータ、ＳＲＶサーバ装置、１２受信部、１３画像バッファ部、１５電子文書生成部、１６画像解析部、１７送信処理部、１８送信部、１９画像処理部、２１行領域抽出部、２２スタイル特徴検出部、２３主要判定部、２４位置設定部、２５表示制御部、２６指示受付部、２７パラメータ変更部、１００制御部、１０２メモリ部、１０４画像読取部、１０６プリント部、１０８通信インターフェイス部、１１０操作パネル部、１１２記憶部、２０１ＣＰＵ、２０３内部バス、２０５ディスプレイ部、２０７通信インターフェイス部、２０９入力部、２１１ハードディスク部、２１３メモリ部、２１５ＣＤ−ＲＯＭドライブ、２１５ａＣＤ−ＲＯＭ、２１７ＦＤＤドライブ、２１７ａフレキシブルディスク、３００原稿、３１０画像データ、４００電子文書。

Claims

文書画像を記憶するための第１の記憶手段と、
前記第１の記憶手段に記憶された文書画像から、所定の種類の文書領域を抽出するための抽出手段と、
前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するための検出手段と、
検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての１以上の主要なスタイル特徴を判定するための判定手段と、
ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するための設定手段とを備える、文書処理装置。
前記判定手段は、
前記スタイル特徴ごとに、当該スタイル特徴が出現したページ数を前記出現頻度として算出するための頻度算出手段と、
算出されたページ数が、所定値以上であるスタイル特徴を、前記主要なスタイル特徴として判定する手段とを含む、請求項１に記載の文書処理装置。
前記設定手段は、
各ページに存在する前記主要なスタイル特徴を、当該ページのページ特徴として判定するための手段と、
ページごとに、当該ページのページ特徴が、前ページのページ特徴から変化した量を前記変化量として算出するための量算出手段と、
算出された前記変化量が一定値以上の場合に、当該ページ間に区切り位置を設定する手段とを含む、請求項２に記載の文書処理装置。
前記設定手段は、
連続する第１、第２および第３のページのうち、前記第２のページ以外の前記第１および第３のページで同一のページ特徴が検出された場合には、前記第２のページにも前記同一のページ特徴が検出されたものとして補正するための補正手段をさらに含む、請求項３に記載の文書処理装置。
前記設定手段により設定された区切り位置に基づいて、前記文書画像を分割して出力するための出力手段をさらに備える、請求項１〜４のいずれか１項に記載の文書処理装置。
前記文書画像が前記区切り位置に基づいて区切られた場合に、区切られた複数の分割文書画像における最初のページのインデックス画像を表示するための信号を生成する表示制御手段と、
前記表示制御手段からの信号に応じた出力を行なう表示手段とをさらに備える、請求項１〜５のいずれか１項に記載の文書処理装置。
ユーザから、前記設定手段による前記文書画像の区切り数に関する指示を受付けるための指示受付手段をさらに備える、請求項１〜６のいずれか１項に記載の文書処理装置。
受付けられた前記指示に応じて、前記設定手段による区切り位置の設定のための所定のパラメータを変更する変更手段と、
前記変更手段による変更後に、再度、前記設定手段による処理の実行を指示するための実行指示手段とをさらに備える、請求項７に記載の文書処理装置。
レイアウトあるいは所定の文字列に基づいて、前記文書画像の区切り位置を設定するための第２の設定手段をさらに備える、請求項１〜８のいずれか１項に記載の文書処理装置。
前記所定の複数の属性種別は、上位領域での位置，大きさ，色、部分領域の個数，位置，高さ，色，隣接する部分領域との距離、文字の大きさ，文字修飾、文字色、背景色、フォントの種別のうち、少なくとも２つを含む、請求項１〜９のいずれか１項に記載の文書処理装置。
前記所定の種類の文書領域は、段、行、文字列および文字のうちのいずれかに対応する、請求項１〜１０のいずれか１項に記載の文書処理装置。
文書画像を記憶するための記憶部と演算処理部とを備えた文書処理装置において実行される文書処理方法であって、
前記演算処理部が、前記記憶部に記憶された前記文書画像から、所定の種類の文書領域を抽出するステップと、
前記演算処理部が、前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するステップと、
検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての１以上の主要なスタイル特徴を判定するステップと、
ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するステップとを備える、文書処理方法。
請求項１２に記載の文書処理方法をコンピュータに実行させる、文書処理プログラム。