JP2023047133A - 情報処理装置、情報処理システム、及びプログラム - Google Patents
情報処理装置、情報処理システム、及びプログラム Download PDFInfo
- Publication number
- JP2023047133A JP2023047133A JP2021156076A JP2021156076A JP2023047133A JP 2023047133 A JP2023047133 A JP 2023047133A JP 2021156076 A JP2021156076 A JP 2021156076A JP 2021156076 A JP2021156076 A JP 2021156076A JP 2023047133 A JP2023047133 A JP 2023047133A
- Authority
- JP
- Japan
- Prior art keywords
- electronic document
- information
- document
- generated
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 73
- 238000012015 optical character recognition Methods 0.000 claims abstract description 56
- 238000000034 method Methods 0.000 claims description 30
- 230000006870 function Effects 0.000 description 19
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32154—Transform domain methods
- H04N1/32187—Transform domain methods with selective or adaptive application of the additional information, e.g. in selected frequency coefficients
- H04N1/32192—Transform domain methods with selective or adaptive application of the additional information, e.g. in selected frequency coefficients according to calculated or estimated visibility of the additional information in the image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/3232—Robust embedding or watermarking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3261—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
- H04N2201/3266—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of text or character information, e.g. text accompanying an image
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】光学文字認識処理が必要な電子文書か、光学文字認識処理が不要な電子文書であるかを決定することができる情報処理装置及びプログラムを提供する。
【解決手段】プロセッサを備え、前記プロセッサは、アプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書又は文書読取装置により画像を読み込むことで生成された電子文書を受け付け、受け付けた前記電子文書のうち、テキストを表す部分を含む電子文書について、前記アプリケーションプログラムにより生成されたか又は前記文書読取装置により生成されたかの種別判定を実行し、前記種別判定の結果に基づいて、前記電子文書に対して光学文字認識処理を実行するか否かを決定する。
【選択図】図5
【解決手段】プロセッサを備え、前記プロセッサは、アプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書又は文書読取装置により画像を読み込むことで生成された電子文書を受け付け、受け付けた前記電子文書のうち、テキストを表す部分を含む電子文書について、前記アプリケーションプログラムにより生成されたか又は前記文書読取装置により生成されたかの種別判定を実行し、前記種別判定の結果に基づいて、前記電子文書に対して光学文字認識処理を実行するか否かを決定する。
【選択図】図5
Description
本発明は、情報処理装置、情報処理システム、及びプログラムに関する。
特許文献1には、一般のアプリケーションソフトで作成された文書情報に対して文字情報を解析する文字情報解析手段と、文書情報を読み取る読み取り手段と、該読み取った文書情報の文書構造を解析する解析手段と、該解析手段により文字部であると解析された文書情報については、文字情報を作成する作成手段と、該作成された文字情報を含む文書情報と前記解析された文字情報とを記憶する記憶手段と、前記記憶された文字情報を検索する検索手段と、を有することを特徴とする電子ファイリング装置が開示されている。
電子文書には、アプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書と、文書読取装置により画像を読み込むことで生成される電子文書とが存在する。
かかる電子文書を管理する際に、アプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書については、光学文字認識処理を実行する必要はない。しかし、文書読取装置により画像を読み込むことで生成された電子文書については、電子文書のテキスト検索を可能とするためには、光学文字認識処理が必要である。
本発明は、光学文字認識処理が必要な電子文書か、光学文字認識処理が不要な電子文書であるかを決定することができる情報処理装置及びプログラムを提供することを目的とする。
第1態様に係る情報処理装置は、プロセッサを備え、前記プロセッサは、アプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書又は文書読取装置により画像を読み込むことで生成された電子文書を受け付け、受け付けた前記電子文書のうち、テキストを表す部分を含む電子文書について、前記アプリケーションプログラムにより生成されたか又は前記文書読取装置により生成されたかの種別判定を実行し、前記種別判定の結果に基づいて、前記電子文書に対して光学文字認識処理を実行するか否かを決定する。
第2態様に係る情報処理装置は、前記プロセッサは、前記電子文書のうち、前記文書読取装置により生成されたと判定された電子文書について前記光学文字認識処理を実行して当該電子文書のテキストデータを生成し、当該電子文書に当該テキストデータを埋め込んで記憶させる。
第3態様に係る情報処理装置は、前記プロセッサは、前記テキストデータから予め定められた属性データを抽出し、前記電子文書に埋め込んで当該電子文書の属性情報として記憶させる。
第4態様に係る情報処理装置は、前記プロセッサは、前記電子文書の頁全面に画像が存在し、かつ、テキスト情報は透明文字で描画されているか否かにより前記種別判定を実行する。
第5態様に係る情報処理装置は、前記電子文書には、当該電子文書を生成した生成元に関する生成元情報が記憶されており、前記プロセッサは、前記電子文書内の前記生成元情報により前記種別判定を実行する。
第6態様に係る情報処理装置は、前記プロセッサは、前記文書読取装置の機種情報について予め定められた生成元情報に、一致する機種情報が含まれているか否かにより前記種別判定を実行する。
第7態様に係る情報処理装置は、前記文書読取装置により画像を読み込むことで生成された電子文書に含まれるテキスト情報は、当該文書読取装置による画像の読み込みの際に行われる光学文字認識処理により当該電子文書に埋め込まれた情報である。
第8態様に係る情報処理プログラムは、コンピュータに、アプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書又は文書読取装置により画像を読み込むことで生成された電子文書を受け付け、受け付けた前記電子文書のうち、テキストを表す部分を含む電子文書について、前記アプリケーションプログラムにより生成されたか又は前記文書読取装置により生成されたかの種別判定を実行し、前記種別判定の結果に基づいて、前記電子文書に対して光学文字認識処理を実行するか否かを決定する処理を実行させる。
第1態様によれば、光学文字認識処理が必要な電子文書か、光学文字認識処理が不要な電子文書であるかを決定することができる、という効果を有する。
第2態様によれば、光学文字認識処理をしない場合に比べ、電子文書のテキスト検索を可能とすることができる。という効果を有する。
第3態様によれば、電子文書の属性情報をテキスト検索で見つけることができる、という効果を有する。
第4態様によれば、アプリケーションプログラムにより生成された電子文書と、文書読取装置により生成された電子文書との相違点から種別判定を実行することができる、という効果を有する。
第5態様によれば、アプリケーションプログラムにより生成された電子文書と、文書読取装置により生成された電子文書とを、電子文書の生成元情報から種別判定することができる、という効果を有する。
第6態様によれば、予め定められた機種情報で、アプリケーションプログラムにより生成された電子文書と文書読取装置により生成された電子文書との種別判定をすることができる、という効果を有する。
第7態様によれば、文書読取装置により生成された電子文書についての2回の光学文字認識処理により、文字認識の精度を向上させることができる、という効果を有する。
第8態様によれば、光学文字認識処理が必要な電子文書か、光学文字認識処理が不要な電子文書であるかを決定することができる、プログラムを提供することができる。
(実施形態)
以下、本開示の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素および部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
以下、本開示の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素および部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
図1を用いて、本実施形態に係る情報処理システム10の一例を説明する。
図1は、本実施形態に係る情報処理システム10の概略構成の一例を示す図である。
図1に示すように、本実施形態に係る情報処理システム10は、PC(Personal Computer)20、画像形成装置40と、情報処理装置60とを含んで構成されている。ここで、画像形成装置40は文書読取装置の一例である。
図1は、本実施形態に係る情報処理システム10の概略構成の一例を示す図である。
図1に示すように、本実施形態に係る情報処理システム10は、PC(Personal Computer)20、画像形成装置40と、情報処理装置60とを含んで構成されている。ここで、画像形成装置40は文書読取装置の一例である。
PC20、画像形成装置40及び情報処理装置60は、ネットワークNを介して接続されている。このネットワークNには、例えば、インターネット、LAN(=Local Area Network)、WAN(=Wide Area Network)等が適用される。
本実施形態におけるPC20は、情報処理システム10において、電子文書を情報処理装置60へ記憶させる。
本実施形態における画像形成装置40は、印刷機能や、コピー機能、ファクシミリ機能、スキャナ機能などの各種の機能を有するものである。画像形成装置40は、情報処理システム10において、電子文書を情報処理装置60へ記憶させる。
本実施形態における情報処理装置60は、PC20及び画像形成装置40から送信された電子文書を記憶する。
本実施形態における情報処理システム10は、PC20や画像形成装置40から送信された電子文書を記憶すると共に、光学文字認識(OCR:Optical Character Recognition)処理により抽出された属性情報や電子文書に埋め込まれたテキストデータについてユーザーからのテキスト検索などを可能にする電子ファイリングシステムである。ここで、電子文書は、PC20で作成されたPDF(Portable Document Format)(いわゆるボーンデジタルPDF)や、画像形成装置40のスキャナ機能で読み取られたPDFを含む。
画像形成装置40のハードウェア構成について説明する。
図2は、本実施形態に係る画像形成装置40のハードウェア構成を示すブロック図である。
図2に示すように、画像形成装置40は、プロセッサの一例であるCPU41(Central Processing Unit)、ROM42(Read Only Memory)、RAM(Random Access Memory)43、ストレージ44、入力部45、表示部46、文書読取部47、画像形成部48、通信I/F49を有する。各構成は、バスを介して相互に通信可能に接続されている。
図2に示すように、画像形成装置40は、プロセッサの一例であるCPU41(Central Processing Unit)、ROM42(Read Only Memory)、RAM(Random Access Memory)43、ストレージ44、入力部45、表示部46、文書読取部47、画像形成部48、通信I/F49を有する。各構成は、バスを介して相互に通信可能に接続されている。
CPU41は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、CPU41は、ROM42又はストレージ44からプログラムを読み出し、RAM43を作業領域としてプログラムを実行する。CPU41は、ROM42又はストレージ44に記録されているプログラムにしたがって、上記各構成の制御および各種の演算処理を行う。本実施形態では、ROM42又はストレージ44には、プログラムが格納されている。
ROM42は、各種プログラムおよび各種データを格納する。RAM43は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ44は、HDD(Hard Disk Drive)、又はSSD(Solid State Drive)などにより構成され、オペレーティングシステムを含む各種プログラム、および各種データを格納する。
また、本実施形態では、ストレージ44には、文書読取部47により読み取られた電子文書などが記憶される。
入力部45は、マウス等のポインティングデバイス、およびキーボードを含み、各種の入力を行うために使用される。入力部45では、後述するプラテンガラスなどの台に置かれた文書を光学的に読み取らせる処理を開始させる指示などに使用される。また、本実施形態では、タッチパネル方式の表示部46が入力部45として機能している。
表示部46は、例えば、液晶ディスプレイである。表示部46は、CPU41の制御に基づき各種の情報を表示する。また、表示部46は、タッチパネル方式を採用して、入力部45としても機能する。
文書読取部47は、印刷機能や、コピー機能、ファクシミリ機能、スキャナ機能などを実現するために、画像形成装置40の上部に設けられた図示しない自動送り装置の給紙台に置かれた文書や、プラテンガラスなどの台に置かれた文書を1枚ずつ取り込み、取り込んだ文書を読み取った画像を光学的に読み取って電子文書を生成する。
また、文書読取部47で文書を取り込む際に、画像形成装置40のスキャナ機能を用いて取り込むことをユーザーが選択した場合は、CPU41は、OCR処理を実行する。かかるOCR処理は、後述する情報処理装置60が行うOCR処理と比べて、あらかじめ登録してある単語辞書の数が少ないなどの簡易的な処理である。そして、本実施形態では、OCR処理がされた電子文書は、生成されたテキストデータが埋め込まれると共に、PDF形式の電子文書として保存される。なお、スキャナ機能を用いて文書を読み取り込む際に、OCR処理をしないで文書を読み取ってもよい。
また、画像形成装置40のスキャナ機能を用いて読み取ったPDF形式の電子文書には、当該電子文書を生成した生成元に関する生成元情報、本例では画像形成装置40の機種名や型番などの機種情報が記憶される。また、かかるPDF形式の電子文書は、後述する通信I/F49を介して情報処理装置60へ送信される。
画像形成部48は、文書読取部47による読み取りによって得られた画像を、紙などの記録媒体に形成、すなわち、印刷するものである。
通信I/F49は、PC20及び情報処理装置60との間で通信を行う機能を有している。通信I/F49は、PC20及び情報処理装置60との間で各種データの送受信を行う通信インタフェースとして機能する。本実施形態では、文書読取部47により生成した電子文書を情報処理装置60に送信する。なお、画像形成装置40から情報処理装置60への電子文書の送信は、予め定められたタイミング、例えば、予め定められた日時や予め定められた数の電子文書が生成される毎などに実行するが、これに限定されず、電子文書を生成する毎に実行してもよい。また、通信I/F49は、画像形成装置40を公衆回線に接続し、FAX機能を有する他の画像形成装置と文書読取部47による読み取りによって得られた画像情報を送受信する機能を有している。
つぎに、PC20及び情報処理装置60のハードウェア構成について説明する。
図3は、本実施形態に係るPC20及び情報処理装置60のハードウェア構成を示すブロック図である。PC20及び情報処理装置60は、基本的には一般的なコンピュータ構成であるため、情報処理装置60を代表して説明する。
図3に示すように、PC60は、プロセッサの一例であるCPU61、ROM62、RAM63、ストレージ64、入力部65、表示部66、通信I/F67を有する。各構成は、バスを介して相互に通信可能に接続されている。
CPU61は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、CPU61は、ROM62又はストレージ64からプログラムを読み出し、RAM63を作業領域としてプログラムを実行する。CPU61は、ROM62又はストレージ64に記録されているプログラムにしたがって、上記各構成の制御および各種の演算処理を行う。本実施形態では、ROM62又はストレージ64には、プログラムが格納されている。
ROM62は、各種プログラムおよび各種データを格納する。RAM63は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ64は、SSD、フラッシュメモリなどにより構成され、オペレーティングシステムを含む各種プログラム、および各種データを格納する。
また、本実施形態では、ストレージ64には、PC20又は画像形成装置40から送信された電子文書が記憶される。電子文書には、アプリケーションプログラム(例えば、WordやExcel(登録商標)など)によりテキスト情報を保持したまま生成された電子文書と、画像形成装置40の文書読取部47により画像を読み込むことで生成された電子文書とが含まれる。また、ストレージ64に記憶されている電子文書のうち、文書読取部47により生成された電子文書は、CPU61によりOCR処理が実行される。そして、OCR処理により生成されたテキストデータは、当該電子文書に埋め込まれてストレージ64に記憶される。なお、PC20のストレージ24には、情報処理装置60に送信される前の当該PC20のアプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書が記憶される。ここで、本実施形態では、電子文書について、PDF形式の電子文書を例に取り説明する。また、PDF形式の電子文書には、当該電子文書を生成した生成元に関する生成元情報、本例では、画像形成装置40により生成された場合は当該画像形成装置40の機種情報、PC20により生成された場合は、使用されたアプリケーションプログラム名が記憶される。
また、本実施形態では、ストレージ64には、後述するが、OCR処理により生成されたテキストデータからの属性データの抽出の規則が記憶されている。属性データの抽出の規則は、情報処理システム10の管理者などにより管理及びメンテナンスがされており、必要に応じて更新が行われる。
また、ストレージ64には、生成者情報データベースが記憶されている。生成者情報データベースは、PDF変換の画像形成装置40の機種名や型番などの機種情報を予め記憶しているデータベースである。生成者情報データベースは、後述するように、PDF形式の電子文書が、PC20でアプリケーションプログラムにより生成されたか又は画像形成装置40で文書読取部47により生成されたかの種別判定で用いられる。生成者情報データベースは、情報処理システム10の管理者などにより管理及びメンテナンスがされており、画像形成装置40の新機種が出ると当該新機種名が登録されるなどの更新が行われる。
入力部65は、マウス等のポインティングデバイス、およびキーボードを含み、各種の入力を行うために使用される。
表示部66は、例えば、液晶ディスプレイである。表示部66は、CPU61の制御に基づき各種の情報を表示する。
通信I/F67は、PC20及び画像形成装置40との間で通信を行う機能を有している。通信I/F67は、PC20及び画像形成装置40との間で各種データの送受信を行う通信インタフェースとして機能する。
つぎに、本実施形態の情報処理装置60の作用の一例について説明する。
図4は、情報処理装置60が行うOCR処理の動作の一例を示すフローチャートである。
図4は、情報処理装置60が行うOCR処理の動作の一例を示すフローチャートである。
図4に示すステップS100において、情報処理装置60のCPU61は、OCR処理を行う必要のある複数の電子文書のすべてにOCR処理を実施済みか判定する。OCR処理を実施済みであると判定した場合は、処理を終了する。OCR処理を実施済みであると判定しない場合、すなわち、OCR処理を実行する電子文書がある場合は、次のステップS110に進む。なお、本実施形態におけるOCR処理は、複数のPDF形式の電子文書をまとめて処理する場合に限定されず、情報処理装置60がPDF形式の電子文書を受信する毎に行うようにしてもよい。
ステップS110において、情報処理装置60のCPU61は、種別判定処理1を実行する。ステップS110における種別判定処理1については、図5を用いて説明する。種別判定は、電子文書についてアプリケーションプログラムにより生成されたか又は文書読取部47により生成されたかの判定である。
まず、ステップS111において、情報処理装置60のCPU61は、PDF形式の電子文書からテキストデータと画像とを抽出する。そして、次のステップS112に進む。
ステップS112において、情報処理装置60のCPU61は、電子文書にテキスト情報が存在するか判定する。そして、次のステップS113に進む。
ステップS113において、上述したステップS112でテキスト情報が存在すると判定した場合は、次のステップS114に進む。
ステップS114において、情報処理装置60のCPU61は、電子文書の頁全面に画像が存在し、かつ、テキスト情報が透明文字で描画されているか判定する。そして、次のステップS115に進む。
ここで、電子文書の頁全面に画像が存在し、かつ、テキスト情報が透明文字で描画されているかの判定について、図7及び図8を用いて説明する。
図7は、電子文書の頁全面に画像が存在し、かつ、テキスト情報が透明文字で描画されている状態を示す図面である。具体的には、図7の例では、電子文書の頁(例えばA4用紙サイズ)と同じサイズの画像とがあり、かつ、透明文字が存在している。かかる透明文字は、文書読取部47で読み取られる際に実行されるOCR処理により生成されるテキストデータである。透明文字であることを文書読取部47で生成されたかの種別判定の要件としたのは、アプリケーションプログラムで作成する場合は、透明文字でテキストデータを作成することは考えにくく、又、OCR処理により生成されるテキストデータは、画像の視認を妨げないように透明文字で生成されることが多いためである。
また、図8は、電子文書から抽出したテキスト情報と画像との一覧を示す図面である。図8(A)は、例えばA4サイズ(210mm×297mm)の電子文書から、画像1つと、テキスト情報2つが抽出された場合である。抽出されたNo.「1」の画像の座標(X、Y)、幅(W)、高さ(H)は、座標(30,50)、幅10mm,高さ20mmである。No.「2」のテキスト情報の色は「黒」であり、座標(X、Y)、幅(W)、高さ(H)は、座標(2,50)、幅30mm,高さ20mmである。No.「3」のテキスト情報の色は「青」であり、座標(X、Y)、幅(W)、高さ(H)は、座標(2,30)、幅30mm,高さ20mmである。図8(A)に示す例では、A4サイズの頁よりも画像のサイズの方が小さいため、頁の全面に画像が存在せず、又、テキスト情報も透明文字ではない。そのため、図8(A)に示す例は、アプリケーションプログラムにより生成されたPDF形式の電子文書であると判定される。
また、図8(B)は、例えばA4サイズ(210mm×297mm)の電子文書から、画像1つと、テキスト情報2つが抽出された場合である。抽出されたNo.「1」の画像の座標(X、Y)、幅(W)、高さ(H)は、座標(0,0)、幅210mm,高さ297mmである。No.「2」のテキスト情報の色は「透明」であり、座標(X、Y)、幅(W)、高さ(H)は、座標(2,50)、幅30mm,高さ20mmである。No.「3」のテキスト情報の色は「透明」であり、座標(X、Y)、幅(W)、高さ(H)は、座標(2,30)、幅30mm,高さ20mmである。図8(B)に示す例では、A4サイズの頁と画像のサイズとが同じサイズであるため、頁の全面に画像が存在し、又、テキスト情報も透明文字である。そのため、図8(B)に示す例は、文書読取部47により生成されたPDF形式の電子文書であると判定される。
ステップS115において、上述したステップS114で、頁全面に画像が存在し、かつ、テキスト情報が透明文字であると判定されない場合は、次のステップS116に進む。
ステップS116において、情報処理装置60のCPU61は、スキャナ生成=Falseを返す。すなわち、文書読取部47で読み取られた電子文書ではなく、アプリケーションプログラムにより生成された電子文書であると判定した記録をする。そして、図5に示す処理を終了し、図4のステップS120に進む。
一方、上述したステップS113において、テキスト情報が存在しないと判定した場合は、ステップS117に進み、スキャナ生成=Trueを返す。すなわち、文書読取部47で読み取られた電子文書であり、アプリケーションプログラムにより生成された電子文書ではないと判定した記録をする。そして、図5に示す処理を終了し、図4のステップS120に進む。
また、上述したステップS115において、頁全面に画像が存在し、かつ、テキスト情報が透明文字であると判定された場合は、ステップS117に進み、そして、図5に示す処理を終了し、図4のステップS120に進む。
ステップS120において、情報処理装置60のCPU61は、種別判定処理2を実行する。ステップS120における種別判定処理2については、図6を用いて説明する。
まず、ステップS121において、情報処理装置60のCPU61は、PDF形式の電子文書から生成者情報を取得する。そして、次のステップS122に進む。
ステップS122において、情報処理装置60のCPU61は、生成者情報がストレージ44に記憶されている生成者情報データベースに含まれているか否かを判定する。生成者情報が生成者情報データベースに含まれていないと判定した場合は、次のステップS123に進む。
ステップS123において、スキャナ生成=Falseを返す。すなわち、文書読取部47で読み取られた電子文書ではなく、アプリケーションプログラムにより生成された電子文書であると判定した記録をする。そして、図6に示す処理を終了し、図4のステップS130に進む。
一方、上述したステップS122において、生成者情報がストレージ44に記憶されている生成者情報データベースに含まれていると判定した場合は、ステップS124に進み、スキャナ生成=Trueを返す。すなわち、文書読取部47で読み取られた電子文書であり、アプリケーションプログラムにより生成された電子文書ではないと判定した記録をする。そして、図6に示す処理を終了し、図4のステップS130に進む。
なお、生成者情報が生成者情報データベースに含まれていると判定した場合であっても、予め定められた生成者情報と一致した場合は、スキャナ生成=Trueを返さず、スキャナ生成=Falseを返すようにしてもよい。例えば、画像形成装置の機種によっては、文書読取部で読み取られる際に行われるOCR処理の機能が情報処理装置60により行われるOCR処理よりも簡易的な処理ではない場合もあり、再度、情報処理装置60によりOCR処理をする必要がないことも考えられるためである。
また、予め定められた生成者情報と一致した場合は、予め定められた条件を満たす場合、例えば、特定の言語などの場合のみ、スキャナ生成=Trueを返すことで、再度、情報処理装置60によるOCR処理をするようにしてもよい。言語によってはOCR処理の文字認識精度が低くなる可能性があり、情報処理装置60により再度OCR処理をすることで、文字認識の精度を向上することができるようにするためである。
ステップS130において、情報処理装置60のCPU61は、スキャナ生成=Trueの記録があるか否か、すなわち、文書読取部47で読み取られた電子文書であるか否かを判定する。スキャナ生成=Trueの記録がないと判定した場合は、上述したステップS100に戻る。一方、スキャナ生成=Trueの記録があると判定した場合は、次のステップS140に進む。
ステップS140において、情報処理装置60のCPU61は、文書読取部47で読み取られた電子文書に対して、OCR処理と、当該OCR処理により生成したテキストデータを当該電子文書に埋め込んで記憶する。そして、上述したステップS100に戻る。ここで、OCR処理により生成したテキストデータの電子文書への埋め込みは、文書読取部47で読み取られる際に行われたOCR処理により埋め込まれたテキストデータに替えて電子文書に埋め込まれることが望ましい。これは、上述したように、文書読取部47で読み取られる際に行われたOCR処理は、情報処理装置60によりステップS140において行われるOCR処理よりも簡易的な処理であり、OCR処理の文字認識精度が低いなどの不完全なものである可能性があり、情報処理装置60により行われるOCR処理により生成されるテキストデータに替えて電子文書を保存する方が、後で当該PDF形式の電子文書を検索する際などに情報抽出性能を向上させることができる。
また、情報処理装置60のCPU61は、OCR処理により生成されたテキストデータから予め定められた属性データを抽出し、電子文書に埋め込んで当該電子文書の属性情報として記憶させる。属性データは、例えば、電子文書に記載された日付や、宛名、タイトル、項目、ファイル名などである。また、OCR処理により生成されたテキストデータからの属性データの抽出は、予め定められた規則に応じて実行される。例えば、頁の右上の予め定められた範囲の座標にある予め定められた桁数の数値は日付データとして抽出する規則や、頁の左上の予め定められた範囲の座標にあるキーワード「殿」や「様」などの左側にあるテキストデータを宛名データとして抽出する規則がある。なお、かかる規則は、情報処理システム10の管理者などにより設定されるが、これに限定されず、例えば、複数の電子文書を用意し、当該電子文書を教師データとして学習された学習済みモデルに対してOCR処理により生成されたテキストデータを埋め込んだ電子文書を入力して、属性データを抽出するようにしてもよい。
なお、スキャナ生成=Trueの記録がないPDF形式の電子文書、すなわち、PC20のアプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書である場合は、情報処理装置60によるOCR処理はされず、属性データの抽出を行う。そして、抽出された属性データを電子文書に埋め込んで電子文書の属性情報として記憶する。アプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書の場合は、文字認識の精度に問題はないためOCR処理をする必要はなく、そのまま属性データの抽出をする必要性がないためである。
本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
なお、上記実施形態では、プログラムがROM又はストレージに予め記憶(インストール)されている態様を説明したが、これに限定されない。プログラムは、CD-ROM(Compact Disk Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
また、上述した実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit、等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
また、上述した実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上述した各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
10 情報処理システム
20 PC
40 画像形成装置
60 情報処理装置
N ネットワーク
20 PC
40 画像形成装置
60 情報処理装置
N ネットワーク
Claims (8)
- プロセッサを備え、
前記プロセッサは、
アプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書又は文書読取装置により画像を読み込むことで生成された電子文書を受け付け、
受け付けた前記電子文書のうち、テキストを表す部分を含む電子文書について、前記アプリケーションプログラムにより生成されたか又は前記文書読取装置により生成されたかの種別判定を実行し、
前記種別判定の結果に基づいて、前記電子文書に対して光学文字認識処理を実行するか否かを決定する情報処理装置。 - 前記プロセッサは、
前記電子文書のうち、前記文書読取装置により生成されたと判定された電子文書について前記光学文字認識処理を実行して当該電子文書のテキストデータを生成し、当該電子文書に当該テキストデータを埋め込んで記憶させる請求項1に記載の情報処理装置。 - 前記プロセッサは、
前記テキストデータから予め定められた属性データを抽出し、前記電子文書に埋め込んで当該電子文書の属性情報として記憶させる請求項2に記載の情報処理装置。 - 前記プロセッサは、
前記電子文書の頁全面に画像が存在し、かつ、テキスト情報は透明文字で描画されているか否かにより前記種別判定を実行する請求項1~3のいずれか1項に記載の情報処理装置。 - 前記電子文書には、当該電子文書を生成した生成元に関する生成元情報が記憶されており、
前記プロセッサは、
前記電子文書内の前記生成元情報により前記種別判定を実行する請求項1~4のいずれか1項に記載の情報処理装置。 - 前記プロセッサは、
前記文書読取装置の機種情報について予め定められた生成元情報に、一致する機種情報が含まれているか否かにより前記種別判定を実行する請求項5に記載の情報処理装置。 - 前記文書読取装置により画像を読み込むことで生成された電子文書に含まれるテキスト情報は、当該文書読取装置による画像の読み込みの際に行われる光学文字認識処理により当該電子文書に埋め込まれた情報である請求項1~6のいずれか1項に記載の情報処理装置。
- コンピュータに、
アプリケーションプログラムによりテキスト情報を保持したまま生成された電子文書又は文書読取装置により画像を読み込むことで生成された電子文書を受け付け、
受け付けた前記電子文書のうち、テキストを表す部分を含む電子文書について、前記アプリケーションプログラムにより生成されたか又は前記文書読取装置により生成されたかの種別判定を実行し、
前記種別判定の結果に基づいて、前記電子文書に対して光学文字認識処理を実行するか否かを決定する処理を実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021156076A JP2023047133A (ja) | 2021-09-24 | 2021-09-24 | 情報処理装置、情報処理システム、及びプログラム |
US17/700,523 US20230102476A1 (en) | 2021-09-24 | 2022-03-22 | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021156076A JP2023047133A (ja) | 2021-09-24 | 2021-09-24 | 情報処理装置、情報処理システム、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023047133A true JP2023047133A (ja) | 2023-04-05 |
Family
ID=85721810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021156076A Pending JP2023047133A (ja) | 2021-09-24 | 2021-09-24 | 情報処理装置、情報処理システム、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230102476A1 (ja) |
JP (1) | JP2023047133A (ja) |
-
2021
- 2021-09-24 JP JP2021156076A patent/JP2023047133A/ja active Pending
-
2022
- 2022-03-22 US US17/700,523 patent/US20230102476A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230102476A1 (en) | 2023-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4181892B2 (ja) | 画像処理方法 | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
US8045198B2 (en) | System and method for processing a change history of a PDF file | |
US20080115080A1 (en) | Device, method, and computer program product for information retrieval | |
JP2009295164A (ja) | オブジェクト取得装置、オブジェクト管理システム、オブジェクト管理方法 | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
US20070127085A1 (en) | Printing system, printing method and program thereof | |
JP4921335B2 (ja) | ドキュメント処理装置及び検索方法 | |
AU2009212993B2 (en) | Document processing system, search apparatus, information searching method, document processing method and program | |
JP2006221569A (ja) | 文書処理システム、文書処理方法、プログラムおよび記憶媒体 | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
JP2006093917A (ja) | 画像読取装置および画像処理装置、画像形成装置 | |
JP2007041709A (ja) | 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2021056722A (ja) | 情報処理装置及びプログラム | |
JP2021047792A (ja) | 情報処理装置及びプログラム | |
JP2002073598A (ja) | 文書処理装置および方法 | |
JP2004334341A (ja) | 文書検索装置、文書検索方法及び記録媒体 | |
JP2023047133A (ja) | 情報処理装置、情報処理システム、及びプログラム | |
JP6780380B2 (ja) | 画像処理装置及びプログラム | |
JP2004348467A (ja) | 画像検索装置及びその制御方法、プログラム | |
JP2001256256A (ja) | 電子文書検索装置および電子文書検索方法 | |
JP2007048061A (ja) | 文字処理装置、文字処理方法及び記録媒体 | |
JP2007018158A (ja) | 文字処理装置、文字処理方法及び記録媒体 | |
US9286531B2 (en) | Log-image extracting apparatus for high security | |
JP5569367B2 (ja) | 画像処理装置、画像処理方法及びプログラム |