JP3685563B2 - Page editing method and document image processing system - Google Patents
Page editing method and document image processing system Download PDFInfo
- Publication number
- JP3685563B2 JP3685563B2 JP23144096A JP23144096A JP3685563B2 JP 3685563 B2 JP3685563 B2 JP 3685563B2 JP 23144096 A JP23144096 A JP 23144096A JP 23144096 A JP23144096 A JP 23144096A JP 3685563 B2 JP3685563 B2 JP 3685563B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- page
- document image
- reading
- pages
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Facsimiles In General (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、スキャナ等の読込手段で読込んだ文書画像に対してページ編集処理を行なうページ編集方法および文書画像処理システムに関する。
【0002】
【従来の技術】
例えば、会議録原稿等の文書をスキャナによって文書画像として読込む場合、文書の形式によっては、スキャナからの読込み順とページ順とが整合していないことがある。例えば、図12に示すように、スキャナによって読込まれるべき文書の形式が「A4」見開き両面原稿(「A3」1枚で4ページ分)であり、この原稿の4ページ分(「A3」1枚)を片面スキャナを使用してA3サイズで読込む場合(「A3」原稿の表面を先ず読込み、次いで、「A3」原稿を裏返し、その裏面を読込む場合)、読込み順は、1ページ目→4ページ目→3ページ目→2ページ目の順となる。また、例えば、図13に示すように、スキャナによって読込まれるべき文書の形式が「A4」両面原稿(「A4」1枚で2ページ分)であり、この原稿の4ページ分(「A4」2枚)を片面ADFスキャナを使用してA4サイズで読込む場合(2枚の「A4」原稿の表面を続けて読込み、次いで、2枚の「A4」原稿を表裏逆にし、2枚の「A4」原稿の裏面を続けて読込む場合)、読込み順は、1ページ目→3ページ目→4ページ目→2ページ目の順となる。
【0003】
従来では、上記のような、スキャナ(例えばADFスキャナ)などからの読込み順とページ順とが整合しない文書画像についての処理を行なうような場合、スキャナ(ADFスキャナ)などからの読込み順とページ順との整合処理を、作業者による手作業によって運用していた。すなわち、読込んだ文書画像を手作業によって(例えばキーボード操作によって)ページ順に並べ換えたりしていた。
【0004】
【発明が解決しようとする課題】
しかしながら、スキャナ(ADFスキャナ)などからの読込み順とページ順との整合処理などを、作業者の手作業により運用する場合、その作業が煩雑になるという問題があった。
【0005】
また、読込時にスキャナによる文書(原稿)の重送やページ抜けなどのスキャニングミスが発生した場合、作業者は、重複しているページや抜けているページを手作業で探し出して、手作業で正しいページ順に並び換えなければならず、作業に相当の時間がかかるという問題があった。
【0006】
このように、従来では、スキャナ(ADFスキャナ)などの読込手段で読込んだ文書画像の読込み順とページ順とが整合しない場合、ページ編集処理を効率良くかつ正確に行なうことができないという欠点があった。
【0007】
本発明は、スキャナ(例えばADFスキャナ)等の読込手段で読込んだ文書画像のページ編集処理を効率良くかつ正確に行なうことの可能なページ編集方法および文書画像処理システムを提供することを目的としている。
【0008】
【課題を解決するための手段】
上記目的を達成するために、請求項1記載の発明は、文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定手段と、文書を文書画像として読込む読込手段と、読込まれた文書画像をページ単位に管理して記憶する文書画像記憶手段と、ページ単位に管理して記憶された文書画像に対してページ編集処理を施す読込制御手段と、ページ編集結果を記憶する結果情報記憶手段とを有し、前記読込制御手段は、前記文書情報設定手段によって設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うことにより、正しいページ番号を割り当てることを特徴としている。
【0013】
また、請求項2記載の発明は、請求項1記載の文書画像処理システムにおいて、読込手段における文書の読込みは、該文書が複数枚のものである場合、複数枚の文書の表面を順次に読込み、次いで、複数枚の文書の裏面を順次に読込むという仕方で行なわせることを特徴としている。
【0014】
また、請求項3記載の発明は、請求項1記載の文書画像処理システムにおいて、文書画像のページ単位の管理は、文書が見開きのものである場合、該文書の文書画像を複数ページに分割することによってなされることを特徴としている。
【0018】
また、請求項4記載の発明は、請求項1記載の文書画像処理システムにおいて、読込制御手段は、ページ編集処理結果を所定の表示手段に表示させ、利用者に確認させる機能を有していることを特徴としている。
【0019】
また、請求項5記載の発明は、文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定ステップと、文書を文書画像として読込む読込ステップと、読込まれた文書画像をページ単位に記憶する文書画像記憶ステップと、ページ単位に記憶された文書画像に対してページ編集処理を施す読込制御ステップと、ページ編集結果を記憶する結果情報記憶ステップとを有し、前記読取制御ステップでは、前記文書情報設定ステップで設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うように制御し、結果情報記憶ステップでは、前記読取制御ステップで生成されたページ番号を記憶することを特徴としている。
【0020】
請求項1乃至請求項5記載の発明は、文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定手段と、文書を文書画像として読込む読込手段と、読込まれた文書画像をページ単位に管理して記憶する文書画像記憶手段と、ページ単位に管理して記憶された文書画像に対してページ編集処理を施す読込制御手段と、ページ編集結果を記憶する結果情報記憶手段とを有し、前記読込制御手段は、前記文書情報設定手段によって設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うことにより、正しいページ番号を割り当てるので、読込まれる文書がどのような形式,種類のものであっても、読込んだ文書画像のページ編集処理を効率良くかつ正確に行なうことができる。
【0021】
すなわち、本発明は、ページ順に並べ換える作業者の作業が不要となり、また、正しいページ順の確認が容易にでき、また、ページ抜けを防止することができ、文書(原稿)の形式,種類などにこだわらずに、正しいページ順にソートすることができる。
【0022】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。図1は本発明に係る文書画像処理システムの構成例を示す図である。図1を参照すると、この文書画像処理システムは、会議録原稿などの文書を文書画像として読込むスキャナ(例えばADFスキャナ)などの読込部1と、読込部1の制御や、読込部1で読込まれた文書画像に対するページ編集等の制御を行なう読込制御部2と、読込部1で読み込まれるべき文書の形式や種類に関する情報(例えば、原稿サイズや原稿種別(両面原稿/片面原稿)などの文書の形式に関する情報)の設定や、読込部1で読込まれるべき文書(原稿)の総枚数,あるいは文書(原稿)の総ページ数などの設定を行なう文書情報設定部3と、読込部1で読込まれた文書画像が記憶される文書画像記憶部4と、文書画像に対してページ編集を行なった結果の情報が記憶される結果情報記憶部5と、文書画像を表示する表示部6とを備えている。
【0023】
ここで、読込制御部2は、読込部1で読込まれた文書画像に対するページ編集処理を行なう場合、文書情報設定部3で設定されている文書の形式や種類に関する情報に基づいて、読込部1で順次に読込まれた文書画像をページ単位に管理する処理(例えば、ページ単位に分割する処理)を行ない、ページ単位の文書画像を文書画像記憶部4に記憶し、また、少なくとも、文書情報設定部3で設定されている文書の形式や種類に関する情報と文書の総枚数あるいは総ページ数とに基づいて、文書画像記憶部4に記憶されたページ単位の文書画像に対して、正しいページ情報(例えばページ番号)を割り出すようになっている。
【0024】
そして、読込制御部2は、正しいページ情報(例えばページ番号)を割り出すとき、第1の出力形式として、文書画像記憶部4に記憶されているページ単位の文書画像に対応させた形で、上記ページ情報(ページ番号)を結果情報記憶部5に記憶するようになっている。
【0025】
あるいは、読込制御部2は、正しいページ情報(例えばページ番号)を割り出すとき、第2の出力形式として、文書画像記憶部4に記憶されているページ単位の文書画像を、前記ページ情報に基づき、正しいページ順に並び換えて、これを結果情報記憶部5に記憶するようになっている。
【0026】
このように、読込制御部2は、上記第1,第2の出力形式のいずれのものであっても、作業者による手作業を必要とせずに、読込んだ文書画像をページ単位の文書画像として管理し、また、ページ単位の文書画像に対して正しいページ情報を自動的に割り出す機能(ページ単位の文書画像を正しいページ順に自動的に並べ換える機能)を有している。
【0027】
さらに、読込制御部2は、ページ順に並び換えられたページ毎の文書画像を、例えば表示部6に例えば順次に表示可能な機能を有している。例えば、第1の出力形式が用いられる場合、読込制御部2は、結果情報記憶部5に記憶されたページ情報(ページ番号)に従って、例えばページ番号の小さい方から順に、該ページ番号に対応した文書画像情報を文書画像記憶部4から読み出して、表示部6に表示することができる。また、第2の出力形式が用いられる場合、読込制御部2は、結果情報記憶部5にページ順に並べ換えられて記憶された文書画像情報を順次に読み出して、表示部6に表示することができる。
【0028】
このように、ページ順に並び換えられたページ毎の文書画像を、例えば表示部6に例えば順次に表示可能な機能を有していることにより、利用者は、表示部6に表示された文書画像をページ毎に順次に調べることで、文書画像が正しいページ順に並び換えられているか否か、さらには、ページの重複あるいはページ抜けがないか否かを容易に確認することができる。
【0029】
図2は図1の文書画像処理システムのハードウェア構成例を示す図である。図2を参照すると、この文書画像処理システムは、例えばパーソナルコンピュータ等で実現され、全体を制御するCPU11と、CPU11の制御プログラム等が記憶されているROM12と、CPU11のワークエリア等として使用されるRAM13と、原稿等の文書を文書画像として読込むスキャナ(例えば、ADFスキャナ)14と、スキャナ14で読込まれた文書画像が例えばページ単位で(ページ毎の画像情報として)記憶される文書画像ファイル15と、文書画像に対しページ編集を行なった結果の情報が記憶される結果情報ファイル16と、スキャナ14で読込まれるべき文書に関する情報の入力設定を行なったり、並び換えられた結果の文書画像の画像情報等を表示したり、並び換えられた結果の文書画像の画像情報等に対して確認,修正などの作業を行なったりするためのディスプレイ18および入力装置19とを有している。
【0030】
ここで、スキャナ14,文書画像ファイル15,結果情報ファイル16,ディスプレイ18および入力装置19は、図1の読込部1,文書画像記憶部4,結果情報記憶部5,表示部6および文書情報設定部3にそれぞれ対応している。また、CPU11は、図1の読込制御部2の機能を有している。
【0031】
なお、CPU11におけるこのような読込制御部等としての機能は、例えばソフトウェアパッケージ(具体的には、CD−ROM等の情報記録媒体)の形で提供することができ、このため、図2の例では、情報記録媒体20がセットさせるとき、これを駆動する媒体駆動装置21が設けられている。
【0032】
また、入力装置19には、例えばキーボード,マウス等を用いることができ、この場合、例えば、ディスプレイ18の画面に表示されているアイコン等をマウスによってポイントすることで、読込部1に読込処理の開始指示などを行なったり、また、キーボードなどにより、文書に関する情報の入力を行なったり、また、キーボードやマウスにより、ディスプレイ上で、ページ編集処理がなされる前の文書画像,あるいはページ編集がなされた後の文書画像のページを進めたり、戻したりすることができる。
【0033】
換言すれば、本発明の文書画像処理システムは、イメージスキャナ(例えば、ADFスキャナ),ディスプレイ等を備えた汎用の計算機システムにCD−ROM等の情報記録媒体に記録されたプログラムコードを読み込ませて、この汎用計算機システムのマイクロプロセッサにページ編集処理を実行させる装置構成においても実施することが可能である。この場合、本発明のページ編集処理プログラムなどを格納する情報記憶媒体としては、CD−ROMに限られるものではなく、ROM,RAM,FD等が用いられても良い。
【0034】
次に、このような構成の文書画像処理システムの処理動作例を図3のフローチャートを用いて説明する。本発明の文書画像処理システムがソフトウェアパッケージ(情報記録媒体)20の形で提供される場合、利用者は、この情報記録媒体20を媒体駆動装置21にセットし、文書画像処理システムソフトを例えばRAM13にロードする。この段階で、CPU11は、例えばRAM13にロードされた文書画像処理システムソフトに従って、処理を実行することができる。
【0035】
すなわち、利用者は、この段階で、この文書画像処理システムを用いて、文書の読込み、ページ編集等を行なうことができる。
【0036】
図3を参照すると、この文書画像処理システムでは、例えば、会議録原稿などの文書を文書画像として読込む際に、読込まれるべき文書の形式や種類(例えば、文書サイズや文書種別(両面/片面など))、読込まれるべき文書の総枚数あるいは総ページ数などの文書に関する情報を文書情報設定部3によって(例えばキーボードから入力して)設定する(ステップS1)。
【0037】
このようにして、文書に関する情報の入力設定がなされた後、読込制御部2は、読込対象となる会議録原稿などの文書を読込部1により順次に読込ませ(具体的に、スキャナ14が例えばADFである場合、スキャナ14に例えば複数枚の原稿をセットして、スキャナ14により複数枚の原稿を順次に読らせ)、読込まれた文書画像に対し、ページ管理(ページ分割)を行なったページ単位の文書画像を文書画像記憶部4(文書画像ファイル15)に記憶する(ステップS2)。
【0038】
次いで、読込制御部2は、ページ単位に管理された文書画像に対しページ編集を行ない、編集結果を結果情報記憶部5(結果情報ファイル16)に記憶する(ステップS3)。この場合、前述の第1の出力形式で、結果情報記憶部5(結果情報ファイル16)に記憶する場合には、結果情報ファイル16は、各文書画像を、ページ番号に対応付けるインデックスファイルとして機能する。
【0039】
図4乃至図8は原稿の種類例並びに各種原稿の読み込みの仕方を説明するための図である。すなわち、図4は片面単票原稿の場合、図5は両面単票原稿の場合、図6は片面見開き原稿の場合、図7は両面見開き原稿の場合、図8は両面見開き原稿と両面単票原稿が混在している場合を示す図であり、図4乃至図8において、符号▲1▼,▲2▼,▲3▼,…は読込順を表わしている。
【0040】
図3のステップS1の設定処理において、例えば、図4のように、片面単票のA4原稿を4枚(4ページ分)、読込むときには、文書に関する情報として、文書サイズ「A4」,文書種別「片面単票」,読込まれる文書の総ページ数「4」を、設定する。
【0041】
また、例えば、図5のように、両面単票のA4原稿を4枚(8ページ分)、読込むときには、文書に関する情報として、文書サイズ「A4」,文書種別「両面単票」,読込まれる文書の総ページ数「8」を、設定する。
【0042】
また、例えば、図6のように、片面見開きのA3原稿を3枚(6ページ分)、読込むときには、文書に関する情報として、文書サイズ「A3」,文書種別「片面見開き」,読込まれる文書の総ページ数「6」を、設定する。
【0043】
また、例えば、図7のように、両面見開きのA3原稿を3枚(12ページ分)、読込むときには、文書に関する情報として、文書サイズ「A3」,文書種別「両面見開き」,読込まれる文書の総ページ数「12」を、設定する。
【0044】
また、例えば、図8のように、両面見開きのA3原稿を2枚(8ページ分)と両面単票のA4原稿を1枚(2ページ分)とを、読込むときには、後述のように、両面単票のA4原稿の表面,裏面をコピーして1枚の片面見開きのA3原稿にし、両面単票のA4原稿のかわりに、片面見開きのA3原稿の表面のみを読取ることを前提として、これらの混在文書の表面について、これらの文書に関する情報として、文書サイズ「A4」,文書種別「片面単票」,読込まれる文書の総ページ数「6」を設定し、また、裏面について、文書サイズ「A3」,文書種別「片面見開き」,総ページ数「4」を設定する。
【0045】
また、図3のステップS2において、原稿の読込み方法として、片面原稿の場合、各原稿の表面を順次に読込む。また、両面原稿の場合には、基本的には、最初に、原稿の表面のみをまとめて読込み、各原稿の表面の読込みがすべて終了したら、各原稿をそのままの状態で(積み重ねられたままの状態で)裏返して、各原稿の裏面をすべて読込む。
【0046】
なお、この場合、左右見開き原稿は、例えば図9(a)のように、見開きの左ページをスキャナ14側にセットする。また、上下見開き原稿は図9(b)のように、見開きの上ページをスキャナ14側にセットする。
【0047】
具体的に、図4のような片面単票原稿の読込みでは、1枚目〜4枚目の原稿の表面を順次に読込む。また、図6のような片面見開き原稿の読み込みでは、原稿を図9(a)のようにセットして、1枚目〜3枚目の原稿の表面を順次に読込む。
【0048】
また、図5のような両面単票原稿の読込みでは、1枚目〜4枚目の原稿の表面を順次に読込み、次いで、1枚目〜4枚目の原稿の表面を例えばADFスキャナで読込んだ結果、1枚目〜4枚目の原稿が積み重ねられた状態にある場合には、積み重ねられた状態の各原稿をそのままの状態で裏返して、各原稿の裏面を順次に読込む。また、図7のような両面見開き原稿の読込みでは、原稿を図9(a)のようにセットして、1枚目〜4枚目の原稿の表面を順次に読込み、次いで、1枚目〜4枚目の原稿の表面を例えばADFスキャナで読込んだ結果、1枚目〜4枚目の原稿が積み重ねられた状態にある場合には、積み重ねられた状態の各原稿をそのままの状態で裏返して、各原稿の裏面を順次に読込む。
【0049】
また、図8のような両面見開き原稿で、真ん中に両面単票原稿が存在する場合は、以下のような手順により読込みを行なう。すなわち、先ず、真ん中の両面単票原稿を片面見開き原稿となるようにコピーする。コピーされた結果の片面見開き原稿は、その裏面が白紙である。次いで、この片面見開き原稿が両面見開き原稿の最後となるように積み重み、積み重ねた両面見開き原稿と片面見開き原稿の表面を順次に読込む。そのままの状態で原稿を裏返し、そのときに一番上にある片面見開き原稿を取り除いて、両面見開き原稿の裏面を順次に読込む。
【0050】
このように、ステップS2の処理において、原稿をセットして原稿を読込んだとき、読込制御部2は、読込んだ原稿のイメージを1ページ単位で管理する。すなわち、1ページ単位の文書画像にして、文書画像記憶部4に記憶する。具体的に、例えば図6,図7のような見開き原稿は2ページ分を一度にスキャンして読込まれるので、この原稿のイメージは、2ページ分となり、従って、この場合、読込制御部2は、1つの原稿イメージを2ページにページ分割して管理する。
【0051】
このように、読込んだ文書画像がページ単位に文書画像記憶部4(文書画像ファイル15)に記憶される場合、図4のような片面単票原稿,図6のような片面見開き原稿の文書画像は、読込順とページ順(ページ番号)とが一致しているので、文書画像は、1ページ,2ページ,3ページ,…の順に文書画像記憶部4に記憶される。
【0052】
これに対し、図5,図7,図8のような両面原稿では、その文書画像は、読込順とページ順(ページ番号)とが一致しない。例えば、図5の両面単票原稿の場合、読込順▲1▼,▲2▼,▲3▼,▲4▼,▲5▼,…に対して、ページ番号は1ページ,3ページ,5ページ,7ページ,8ページ,…の順になる。文書画像記憶部4には、文書画像が読込順に記憶されるので、上記のような両面原稿が存在する場合、読込順に記憶された文書画像とページ番号との対応をとる必要がある。
【0053】
図3のステップS3のページ編集処理では、このような文書画像とページ番号との対応付けを行なうようになっている。すなわち、読込制御部2は、文書情報設定部3で設定されている文書の形式や種類に関する情報を参照し、いま読込まれた文書が片面単票原稿や片面見開き原稿である場合、文書画像記憶部4には、上述のように、読込順とページ番号とが一致した文書画像が記憶されていると判断し、ページ単位に管理されている1番目,2番目,3番目,…の文書画像には、それぞれ1ページ,2ページ,3ページを割り振るというように、ページ単位に管理されている文書画像の順番に合わせて、ページ番号(ページ情報)を生成し、例えば第1の出力形式を用いる場合には、ページ管理されている文書画像の順番に合わせて生成したページ番号(1ページ,2ページ,3ページ,…)を結果情報記憶部5に記憶する。図10には、このようにして結果情報記憶部5に記憶されたページ情報の例が示されている。なお、図10の例では、第1の出力形式で記憶がなされるものとし、従って、ページ情報としては、ページ管理されている文書画像の読込順(「一」,「二」,「三」,…)に対応させて、ページ番号(「1」,「2」,「3」,…)が記憶される。
【0054】
また、読込制御部2は、文書情報設定部3で設定されている文書の形式や種類に関する情報を参照し、いま読込まれた文書が両面単票原稿や両面見開き原稿などである場合、あるいは、これらに片面原稿などが混在する場合、文書画像記憶部4には、読込順とページ番号とが一致していない文書画像が記憶されていると判断し、ページの並び換えを行なう。
【0055】
具体的に、読込制御部2は、文書情報設定部3で設定されている文書の形式や種類に関する情報を参照し、いま読込まれた文書が両面単票原稿である場合、読込制御部3は、その読込順とページ番号とが図5に示すようなものであると判断し、ページ単位に管理されている第1番目,第2番目,第3番目,第4番目,第5番目,…の文書画像には、それぞれ、1ページ,3ページ,5ページ,7ページ,8ページ,…を割り振るというように、ページ番号(ページ情報)を生成する。そして、例えば第1の出力形式を用いる場合には、ページ管理されている文書画像の順番に対応させて、生成したページ番号(1ページ,3ページ,5ページ,7ページ,8ページ,…)を結果情報記憶部5に記憶する。図11には、このようにして結果情報記憶部5に記憶されたページ情報の例が示されている。なお、図11の例では、第1の出力形式で記憶がなされるものとし、従って、ページ情報としては、ページ管理されている文書画像の読込順(「一」,「二」,「三」,「四」,「五」,…)に対応させて、ページ番号(「1」,「3」,「5」,「7」,「8」,…)が記憶される。
【0056】
このようにしてページ編集処理を行なって、ページ情報を結果情報記憶部5に記憶させた後、利用者は、このページ編集結果を確認することができる。すなわち、ページ編集結果に基づいて、ページ単位の文書画像をページ順に表示部6に順次に表示させ、ページ番号が正しく割り当てられているか、あるいは、ページ抜けやページ重複がないか否かを容易に確認することができる。
【0057】
このように、本発明によれば、ページ順に並べ換える作業者の作業が不要となり、また、正しいページ順の確認が容易にでき、また、ページ抜けを防止することができ、文書(原稿)の形式,種類などにこだわらずに、正しいページ順にソートすることができる。
【0058】
また、利用者は、ページ編集のなされた文書画像に対して、さらには、上述のようなページ確認処理のなされた文書画像に対して、任意のアプリケーション(例えば文字認識処理など)を行なうことができる。例えば、文書画像ファイル15に記憶されている文書画像に対し、ページ単位にページ順に文字認識処理を行ない、ページ毎の認識結果をページ順に得ることができる。
【0059】
【発明の効果】
以上に説明したように、請求項1乃至請求項5記載の発明によれば、文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定手段と、文書を文書画像として読込む読込手段と、読込まれた文書画像をページ単位に管理して記憶する文書画像記憶手段と、ページ単位に管理して記憶された文書画像に対してページ編集処理を施す読込制御手段と、ページ編集結果を記憶する結果情報記憶手段とを有し、前記読込制御手段は、前記文書情報設定手段によって設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うことにより、正しいページ番号を割り当てるので、読込まれる文書がどのような形式,種類のものであっても、読込んだ文書画像のページ編集処理を効率良くかつ正確に行なうことができる。
【0060】
すなわち、本発明によれば、ページ順に並べ換える作業者の作業が不要となり、また、正しいページ順の確認が容易にでき、また、ページ抜けを防止することができ、文書(原稿)の形式,種類などにこだわらずに、正しいページ順にソートすることができる。
【図面の簡単な説明】
【図1】本発明に係る文書画像処理システムの構成例を示す図である。
【図2】図1の文書画像処理システムのハードウェア構成例を示す図である。
【図3】本発明に係る文書画像処理システムの処理動作例を示すフローチャートである。
【図4】文書が片面単票原稿である場合の読込み例を示す図である。
【図5】文書が両面単票原稿である場合の読込み例を示す図である。
【図6】文書が片面見開き原稿である場合の読込み例を示す図である。
【図7】文書が両面見開き原稿である場合の読込み例を示す図である。
【図8】文書が両面見開き原稿と両面単票原稿が混在している場合の読込み例を示す図である。
【図9】見開き原稿のスキャナへのセットの仕方を説明するための図である。
【図10】結果情報記憶部に記憶されたページ情報の例を示す図である。
【図11】結果情報記憶部に記憶されたページ情報の例を示す図である。
【図12】会議録原稿等の文書をスキャナによって文書画像として読込む場合の例を示す図である。
【図13】会議録原稿等の文書をスキャナによって文書画像として読込む場合の例を示す図である。
【符号の説明】
1 読込部
2 読込制御部
3 文書情報設定部
4 文書画像記憶部
5 結果情報記憶部
6 表示部
11 CPU
12 ROM
13 RAM
14 スキャナ
15 文書画像ファイル
16 結果情報ファイル
18 ディスプレイ
19 入力装置
20 情報記録媒体
21 媒体駆動装置[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a page editing method and a document image processing system for performing page editing processing on a document image read by reading means such as a scanner. To Related.
[0002]
[Prior art]
For example, when a document such as a meeting minutes manuscript is read as a document image by a scanner, the reading order from the scanner may not match the page order depending on the document format. For example, as shown in FIG. 12, the format of the document to be read by the scanner is “A4” double-sided original (“A3” is 4 pages), and 4 pages (“A3” 1 of this original). Sheet) in the A3 size using a single-sided scanner (when reading the front side of the “A3” document first, then turning the “A3” document upside down and scanning the back side), the reading order is the first page → 4th page → 3rd page → 2nd page. Also, for example, as shown in FIG. 13, the document format to be read by the scanner is “A4” double-sided original (“A4” for two pages), and four pages of this original (“A4”). (2 sheets) is read in A4 size using a single-sided ADF scanner (the two “A4” originals are read continuously, then the two “A4” originals are turned upside down, and the two “ In the case of continuously reading the back side of the A4 document, the reading order is the order of the first page → the third page → the fourth page → the second page.
[0003]
Conventionally, when processing is performed on a document image in which the reading order from a scanner (for example, an ADF scanner) and the page order do not match as described above, the reading order from the scanner (ADF scanner) and the page order. The matching process was manually operated by the operator. In other words, the read document images are rearranged in page order manually (for example, by keyboard operation).
[0004]
[Problems to be solved by the invention]
However, there is a problem that when the alignment processing between the reading order from the scanner (ADF scanner) and the page order is operated manually by the operator, the work becomes complicated.
[0005]
Also, when a scanning mistake such as double feeding of documents (originals) or missing pages occurs during scanning, the operator manually searches for duplicate or missing pages and corrects them manually. There was a problem that it took a considerable amount of time for the work because the pages had to be rearranged.
[0006]
As described above, conventionally, when the reading order of the document images read by reading means such as a scanner (ADF scanner) and the page order do not match, the page editing process cannot be performed efficiently and accurately. there were.
[0007]
The present invention relates to a page editing method and a document image processing system capable of efficiently and accurately performing page editing processing of a document image read by reading means such as a scanner (for example, an ADF scanner). The It is intended to provide.
[0008]
[Means for Solving the Problems]
In order to achieve the above object, the invention according to claim 1 Document information setting means for setting the document format and type information and the total number of pages or the total number of pages as document information, reading means for reading a document as a document image, and managing the read document image in units of pages. Document image storage means for storing the page, read control means for performing page editing processing on the document image managed and stored in units of pages, and result information storage means for storing the page edit result, The control means refers to the document information set by the document information setting means, and when the document is a single-sided original, the reading order of the document images stored in units of pages and the page number match. If the document is a double-sided manuscript or a single-sided manuscript is mixed in a double-sided manuscript, page numbers are generated according to the reading order and page numbers are not generated. It generates a page number and reading order and page number of the document image is made to correspond to the determination by reading the order and do not match by performing a sort of the page, assign the correct page number It is characterized by that.
[0013]
Also,
[0014]
Also,
[0018]
Also,
[0019]
Also,
[0020]
[0021]
That is, the present invention eliminates the need for the operator to rearrange the pages, makes it easy to check the correct page order, prevents page loss, and the format and type of the document (original). You can sort in the correct page order.
[0022]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing a configuration example of a document image processing system according to the present invention. Referring to FIG. 1, the document image processing system includes a
[0023]
Here, when the page control process is performed on the document image read by the
[0024]
Then, the
[0025]
Alternatively, when the
[0026]
As described above, the
[0027]
Further, the
[0028]
As described above, the document image displayed on the
[0029]
FIG. 2 is a diagram illustrating a hardware configuration example of the document image processing system of FIG. Referring to FIG. 2, this document image processing system is realized by, for example, a personal computer, and is used as a
[0030]
Here, the
[0031]
The function of the
[0032]
In addition, for example, a keyboard, a mouse, or the like can be used as the input device 19. In this case, for example, by pointing an icon displayed on the screen of the
[0033]
In other words, the document image processing system according to the present invention causes a general-purpose computer system including an image scanner (for example, an ADF scanner), a display, and the like to read a program code recorded on an information recording medium such as a CD-ROM. The present invention can also be implemented in an apparatus configuration that causes the microprocessor of this general-purpose computer system to execute page editing processing. In this case, the information storage medium for storing the page editing processing program of the present invention is not limited to the CD-ROM, and ROM, RAM, FD, etc. may be used.
[0034]
Next, an example of processing operation of the document image processing system having such a configuration will be described with reference to the flowchart of FIG. When the document image processing system of the present invention is provided in the form of a software package (information recording medium) 20, the user sets the
[0035]
That is, at this stage, the user can read a document, edit a page, etc. using the document image processing system.
[0036]
Referring to FIG. 3, in the document image processing system, for example, when a document such as a conference minutes manuscript is read as a document image, the format and type of the document to be read (for example, document size and document type (both sides / Information on the document such as the total number of documents to be read or the total number of pages is set by the document information setting unit 3 (for example, input from a keyboard) (step S1).
[0037]
In this way, after the input setting of the information regarding the document is made, the
[0038]
Next, the
[0039]
4 to 8 are diagrams for explaining examples of document types and how to read various documents. That is, FIG. 4 is for a single-sided original, FIG. 5 is for a double-sided original, FIG. 6 is for a single-sided original, FIG. 7 is for a double-sided original, and FIG. FIG. 9 is a diagram illustrating a case where originals are mixed, and in FIGS. 4 to 8, reference numerals (1), (2), (3),...
[0040]
In the setting process in step S1 of FIG. 3, for example, when reading four single-sided single-sheet A4 originals (for four pages) as shown in FIG. 4, as document information, the document size “A4”, the document type “Single-sided single sheet” and the total number of pages of the document to be read “4” are set.
[0041]
For example, as shown in FIG. 5, when reading A4 originals (8 pages) of double-sided single-cut sheets, as document information, the document size “A4”, the document type “double-sided single-cut”, and read The total page number “8” of the document to be set is set.
[0042]
Also, for example, as shown in FIG. 6, when reading three single-sided spread A3 originals (for six pages), as document information, the document size “A3”, the document type “single-sided spread”, and the read document The total number of pages “6” is set.
[0043]
For example, as shown in FIG. 7, when reading three double-sided spread A3 originals (12 pages), as document information, the document size “A3”, the document type “double-side spread”, and the document to be read The total number of pages “12” is set.
[0044]
For example, as shown in FIG. 8, when reading two double-sided spread A3 originals (for eight pages) and one double-sided single-sheet A4 original (for two pages), as described later, Assuming that the front and back sides of a double-sided single-sheet A4 document are copied into a single-sided A3 original, and only the front side of the single-sided A3 original is read instead of the double-sided single-sheet A4 original. As for information on the front side of the mixed document, the document size “A4”, the document type “single sided cut sheet”, the total number of pages of the read document “6” are set as information on these documents. “A3”, document type “single-sided spread”, and total number of pages “4” are set.
[0045]
In step S2 in FIG. 3, as a method for reading a document, in the case of a single-sided document, the front surface of each document is sequentially read. In the case of double-sided originals, basically, only the front side of the originals is read in a batch, and after all the originals have been read, the originals are left as they are (they remain stacked). Turn it over and scan the entire back side of each document.
[0046]
In this case, the left and right spread original is set to the
[0047]
Specifically, in reading a single-sided single-sheet original as shown in FIG. 4, the surfaces of the first to fourth originals are sequentially read. Further, in reading a single-sided spread original as shown in FIG. 6, the original is set as shown in FIG. 9A, and the surfaces of the first to third originals are sequentially read.
[0048]
Further, in reading a double-sided single-cut document as shown in FIG. 5, the surface of the first to fourth documents is sequentially read, and then the surface of the first to fourth documents is read with, for example, an ADF scanner. As a result, when the first to fourth originals are stacked, the originals in the stacked state are turned over as they are, and the back surfaces of the originals are sequentially read. Also, in reading a double-sided spread original as shown in FIG. 7, the original is set as shown in FIG. 9A, the surfaces of the first to fourth originals are sequentially read, and then the first When the surface of the fourth document is read by an ADF scanner, for example, and the first to fourth documents are stacked, the stacked documents are turned over as they are. Scan the back side of each document sequentially.
[0049]
Further, when a double-sided spread original as shown in FIG. 8 has a double-sided single-sheet original in the middle, reading is performed according to the following procedure. That is, first, a double-sided single-sheet original in the middle is copied so as to become a single-sided original. The resulting single-sided spread document has a blank on the back. Next, the weights are stacked so that the single-sided spread original is the last of the double-sided spread original, and the stacked double-sided spread original and the surface of the single-sided spread original are sequentially read. The original is turned upside down, and the single-sided spread original at the top is removed at that time, and the reverse side of the double-sided spread original is sequentially read.
[0050]
Thus, in the process of step S2, when the original is set and the original is read, the
[0051]
As described above, when the read document image is stored in the document image storage unit 4 (document image file 15) in units of pages, a single-sided single-sheet original as shown in FIG. 4 or a single-sided original as shown in FIG. Since the reading order and the page order (page number) of the images match, the document images are stored in the document
[0052]
On the other hand, in the double-sided originals as shown in FIGS. 5, 7, and 8, the document image does not match the reading order and the page order (page number). For example, in the case of the double-sided single-sheet original shown in FIG. 5, the page numbers are 1 page, 3 pages, and 5 pages for the reading order (1), (2), (3), (4), (5),. , 7 pages, 8 pages,... Since the document images are stored in the document
[0053]
In the page editing process in step S3 in FIG. 3, the document image and the page number are associated with each other. In other words, the
[0054]
Further, the
[0055]
Specifically, the
[0056]
After the page editing process is performed as described above and the page information is stored in the result
[0057]
As described above, according to the present invention, the operator's work of rearranging pages is not necessary, the correct page order can be easily confirmed, and page omission can be prevented. You can sort in the correct page order regardless of format or type.
[0058]
In addition, the user can perform an arbitrary application (for example, character recognition processing) on the document image that has undergone page editing, and further on the document image that has undergone page confirmation processing as described above. it can. For example, it is possible to perform character recognition processing in page order for each document image stored in the
[0059]
【The invention's effect】
As explained above, claims 1 to Claim 5 According to the described invention, Document information setting means for setting the document format and type information and the total number of pages or the total number of pages as document information, reading means for reading a document as a document image, and managing the read document image in units of pages. Document image storage means for storing the page, read control means for performing page editing processing on the document image managed and stored in units of pages, and result information storage means for storing the page edit result, The control means refers to the document information set by the document information setting means, and when the document is a single-sided original, the reading order of the document images stored in units of pages and the page number match. If the document is a double-sided manuscript or a single-sided manuscript is mixed in a double-sided manuscript, page numbers are generated according to the reading order and page numbers are not generated. It generates a page number and reading order and page number of the document image is made to correspond to the determination by reading the order and do not match by performing a sort of the page, assign the correct page number Therefore, regardless of the format and type of the document to be read, page editing processing of the read document image can be performed efficiently and accurately.
[0060]
That is, according to the present invention, the operator's work of rearranging in the page order is not necessary, the correct page order can be easily confirmed, and page omission can be prevented. Sorts in the correct page order regardless of type.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration example of a document image processing system according to the present invention.
2 is a diagram illustrating a hardware configuration example of the document image processing system in FIG. 1; FIG.
FIG. 3 is a flowchart showing an example of processing operation of the document image processing system according to the present invention.
FIG. 4 is a diagram illustrating an example of reading when a document is a single-sided single-cut document.
FIG. 5 is a diagram illustrating an example of reading when a document is a double-sided cut document.
FIG. 6 is a diagram illustrating an example of reading when a document is a single-sided spread original.
FIG. 7 illustrates an example of reading when a document is a double-sided spread original.
FIG. 8 is a diagram illustrating an example of reading when a document includes a double-sided spread original and a double-sided cut original.
FIG. 9 is a diagram for explaining how to set a spread document on a scanner.
FIG. 10 is a diagram illustrating an example of page information stored in a result information storage unit.
FIG. 11 is a diagram illustrating an example of page information stored in a result information storage unit;
FIG. 12 is a diagram illustrating an example of a case where a document such as a conference record manuscript is read as a document image by a scanner.
FIG. 13 is a diagram illustrating an example of a case where a document such as a conference record manuscript is read as a document image by a scanner.
[Explanation of symbols]
1 Reading part
2 Reading control part
3 Document information setting section
4 Document image storage
5 result information storage
6 Display section
11 CPU
12 ROM
13 RAM
14 Scanner
15 Document image file
16 Result information file
18 display
19 Input device
20 Information recording media
21 Medium drive device
Claims (5)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23144096A JP3685563B2 (en) | 1996-08-13 | 1996-08-13 | Page editing method and document image processing system |
CN 97116187 CN1122940C (en) | 1996-08-13 | 1997-08-13 | Page editing method and document image processing system and data recording media |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23144096A JP3685563B2 (en) | 1996-08-13 | 1996-08-13 | Page editing method and document image processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1063868A JPH1063868A (en) | 1998-03-06 |
JP3685563B2 true JP3685563B2 (en) | 2005-08-17 |
Family
ID=16923582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23144096A Expired - Fee Related JP3685563B2 (en) | 1996-08-13 | 1996-08-13 | Page editing method and document image processing system |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP3685563B2 (en) |
CN (1) | CN1122940C (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4111462B2 (en) | 2004-01-28 | 2008-07-02 | 株式会社リコー | Image forming apparatus |
JP5366657B2 (en) * | 2009-05-26 | 2013-12-11 | キヤノン株式会社 | System, method and program |
CN107562802B (en) * | 2017-08-07 | 2019-05-24 | 腾讯科技(深圳)有限公司 | Text data display methods and device and storage medium and electronic device |
JP7005225B2 (en) * | 2017-08-22 | 2022-01-21 | 株式会社東芝 | Decolorizer and image processing system |
-
1996
- 1996-08-13 JP JP23144096A patent/JP3685563B2/en not_active Expired - Fee Related
-
1997
- 1997-08-13 CN CN 97116187 patent/CN1122940C/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1063868A (en) | 1998-03-06 |
CN1178354A (en) | 1998-04-08 |
CN1122940C (en) | 2003-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5301262A (en) | Image processor | |
JPH04261260A (en) | Method of operating electronic copier for preparing proof print | |
US7679777B2 (en) | Job supplement for electronic printing machines | |
JPH02121060A (en) | Picture retrieving device | |
US20020149794A1 (en) | Image forming apparatus for collective printing and collective printing method | |
JP3685563B2 (en) | Page editing method and document image processing system | |
JPH0846802A (en) | Digital image forming device | |
US5097341A (en) | Document copier with job queing | |
KR100670564B1 (en) | Printing system with set of print commands | |
JPH08101850A (en) | Composite image input/output device | |
JP3458001B2 (en) | Image file device | |
US6542257B2 (en) | Image formation apparatus which forms images of four pages on both faces of sheet in such a manner as images of two pages are formed on each face | |
JP2571362B2 (en) | Image processing device | |
JP2971472B2 (en) | Electronic file device | |
JPS5890658A (en) | Image forming device | |
JPH08204945A (en) | Image information processor | |
JP2904829B2 (en) | Synthetic image forming device | |
JP2003094774A (en) | Imaging apparatus | |
JPH02140877A (en) | Electronic file device | |
JP2009284312A (en) | Image management system and image reading apparatus | |
JPH07273969A (en) | Image information processor | |
JPH08328426A (en) | Additional information printing method and compound copying machine provided with additional information printing function | |
JPH05225304A (en) | Digital picture processor | |
JP2000047522A (en) | Image forming device | |
JPH0511550A (en) | Color copying deivce |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050531 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050531 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080610 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090610 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090610 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100610 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110610 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110610 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120610 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130610 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |