JP6214581B2 - 文書解析システム、文書解析装置、文書解析方法、及びプログラム - Google Patents

文書解析システム、文書解析装置、文書解析方法、及びプログラム Download PDF

Info

Publication number
JP6214581B2
JP6214581B2 JP2015017891A JP2015017891A JP6214581B2 JP 6214581 B2 JP6214581 B2 JP 6214581B2 JP 2015017891 A JP2015017891 A JP 2015017891A JP 2015017891 A JP2015017891 A JP 2015017891A JP 6214581 B2 JP6214581 B2 JP 6214581B2
Authority
JP
Japan
Prior art keywords
analysis
storage destination
document
image data
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015017891A
Other languages
English (en)
Other versions
JP2016144001A (ja
Inventor
大澤 隆治
隆治 大澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015017891A priority Critical patent/JP6214581B2/ja
Priority to US15/008,572 priority patent/US9886627B2/en
Publication of JP2016144001A publication Critical patent/JP2016144001A/ja
Application granted granted Critical
Publication of JP6214581B2 publication Critical patent/JP6214581B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Facsimiles In General (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)

Description

本発明は、文書を解析して該文書の格納先候補を提示する文書解析システム、文書解析装置、文書解析方法およびプログラムに関する。
近年、法律事務所などの大量の紙文書を扱う分野において、スキャナやスキャン機能を有する複合機を利用して紙文書をスキャンして得た電子化文書を、関連する格納先に分類して格納することが行われている。スキャンして得た紙文書の電子データの格納先は、ユーザが手動で指定したり、過去に格納した格納先の履歴やあらかじめ登録しておいたブックマークなどを利用したりして、操作者が選択するという手法が考えられていた。
また、特許文献1では、スキャン対象の紙文書に、保存先を特定する情報を、バーコードなどを利用して予め印刷しておき、スキャン時に該情報を読み取り、当該特定された保存先にスキャン画像を保存する方法が開示されている。
特許文献2では、文書に含まれるテキストを解析し、該文書の保存先として適したフォルダを検索し、検索された保存先の候補の中からユーザにより選択されたフォルダに該文書を保存することが開示されている。具体的には、文書に含まれるテキストの特徴とフォルダに格納済みの文書の特徴の平均とを比較することで、保存先として適した保存先候補を列挙するものである。
特開2014−011698号公報 特開平09−311805号公報
一方、画像処理装置(またはスキャナ)がスキャンした文書の電子データを解析サーバーに送信し、解析サーバーが当該受信した文書の電子データを解析して格納先候補を検索するようなシステムの場合、以下のような課題がある。すなわち、スキャンした文書のページ数が多いと、画像処理装置から解析サーバーに電子データを送信するのに多くの時間がかかってしまう。さらに、文書の電子データのページ数が多いと、電子データの解析処理にも時間がかかるので、該文書に適した格納先候補をユーザに提示するまでの時間も多く必要となってしまう。
上記課題を解決するために、本発明の文書解析システムは、画像処理装置と、解析サーバーとを含む文書解析システムであって、前記画像処理装置は、複数ページの文書をスキャンして得た画像データをページ毎に分割して前記解析サーバーに送信する第1の送信手段と、前記解析サーバーから前記画像データの格納先候補を受信する受信手段と、前記受信手段で受信した格納先候補を提示して、ユーザに格納先を選択させる選択手段と、前記複数ページの文書をスキャンして得た画像データを1つのファイルとして、前記選択手段で選択された格納先に格納するように送信する第2の送信手段と、を有し、前記解析サーバーは、ファイルサーバーの各格納先に格納されているファイルを解析することにより、各格納先に格納済みのファイルの特徴情報を保存する保存手段と、前記第1の送信手段から送信された画像データをページ毎に順次解析して、当該解析結果と前記保存手段に保存しておいた特徴情報とを比較することにより、格納先候補を特定する解析手段と、前記解析手段でページ毎に順次解析し、前記画像データの格納先候補が定まったと判定した時点で、当該定まった前記画像データの格納先候補を前記画像処理装置に返信する返信手段と、を有することを特徴とする。
本発明によれば、複数ページで構成される文書を解析して格納先候補をユーザに提示するまでの時間を短縮することができる。
本発明の文書解析システムの構成例 画像処理装置101のハードウェア構成例 解析サーバー102およびファイルサーバー103のハードウェア構成例 解析サーバー102のソフトウェア構成例 ファイルサーバー103のソフトウェア構成例 アプリケーション600のソフトウェア構成例 操作表示部212により表示されるメインメニュー画面例 操作表示部212により表示されるアプリケーション画面の例 本発明の文書解析システムにおけるシーケンス図 格納先候補の中から格納先をユーザに選択させるための画面例 解析サーバー102における解析処理を示したフローチャート
<実施例1>
図1は、文書解析システムの構成例である。文書解析システムは、ネットワーク100を介して接続される、画像処理装置(スキャナ、またはスキャナ部を有する複合機)101と、解析サーバー(文書解析装置)102と、ファイルサーバー103とから構成される。ネットワーク100は、各装置間で通信を行うための基盤であって、イントラネット、インターネットもしくはその他のネットワークシステムであっても構わない。
解析サーバー102は、ファイルサーバー103内の複数のフォルダ(複数の格納先)に格納されているファイルを取得し、当該ファイルからテキストを抽出してDB(データベース)に保存する機能を有する。すなわち、解析サーバーは、複数の格納先それぞれに格納されているファイルのテキスト情報を、各格納先の特徴情報として抽出して保存しておく。そして、解析サーバーは画像処理装置から分類対象のデータを受信すると、該受信データを解析してテキストを抽出し、DBに保存されている各格納先の特徴情報と比較し、該受信データに類似したファイルが格納されている格納先を、格納先候補として応答する。
画像処理装置101は、文書をスキャンして得た画像データを解析サーバー102に送信して、該解析サーバーから格納先候補の情報を取得する。そして、当該格納先候補の中からユーザの指示に基づいて選択された格納先に、該画像データを格納する。ファイルサーバー103は、画像処理装置から送信されてきた画像データなどのファイルを、画像処理装置により指定された格納先のフォルダに保存する機能を有する。
図2は画像処理装置101のハードウェア構成を示すブロック図である。図2において、制御部218は、CPU220、ROM221、及びRAM222を含み、画像処理装置101の全体の動作を制御する。CPU220は、ROM221に記憶された制御プログラムを読み出し実行することにより、読取制御や送信制御などの各種制御処理を行う。RAM222は、CPU220の主メモリ、ワークエリア等の一時記憶領域として用いられる。また、制御部218は、機能部211と接続され、操作表示部212、スキャナ部213、プリンタ部214、および送信部215の動作を制御する。
操作表示部212には、タッチパネル機能を有する液晶等のディスプレイやキーボード等が配置されている。操作表示部212は、操作画面をディスプレイに表示する。スキャナ部213は、文書(紙原稿)を読み取って画像データを生成し、制御部218に出力する。スキャナ部213は、ADF(Auto Document Feeder)を備え、複数枚(複数ページ)の原稿がADFに置かれた状態でスキャン指示が為されると、自動的に原稿を1枚ずつ順にスキャンして画像データを生成する。プリンタ部214は、制御部218から出力された画像データをシートに印刷する。送信部215は、スキャナ部213で読み取り保存された画像データを、指定された送信先に送信する。
インターフェース部216は、ネットワーク100に接続して外部の情報処理装置(不図示)から印刷用の画像データを受信したり、操作表示部212で表示する画面データを受信したりする。HDD(ハードディスクドライブ)219は、画像データや各種プログラムを記憶する記憶装置である。本実施例における各種プログラムも、HDD219に格納される。なお、外部の情報処理装置から受信した印刷用の画像データは、画像メモリ217に一時的に格納され、制御部218を介してプリンタ部214により印刷される。
図3は、本実施例の解析サーバー102およびファイルサーバー103のハードウェア構成図の一例である。各サーバーは、CPU301、CPU301のワークエリアを提供するRAM302、各サーバーとして機能させるためのコンピュータプログラムや設定を記憶する記憶装置303、他機器とネットワーク100を介して通信するためのネットワーク装置304、メインバス300などにより構成されている。
図4は、解析サーバー102のソフトウェア構成を説明するための図である。解析サーバー102のCPUが、コンピュータプログラムを実行することにより、図4に示す各機能部401〜407として機能する。
解析サーバー102は、通信部401、解析リクエスト受付処理部402、解析リクエスト処理部403、クローラー部404、クローラー結果処理部405、テキスト抽出部406、ファイル情報DB部407を有する。
クローラー部404は、通信部401を介して、ファイルサーバー103に格納されているファイル(格納済みの電子データ)の情報と、その格納先(フォルダ)の情報とを収集する。なお、クローラー部404は、ファイルサーバー103に格納された新規ファイルもしくはアップデートがあるファイルについて収集を行い、過去に情報収集済みのファイルについては収集しないようにするのが好適である。クローラー部404は、収集したファイルと格納先情報をクローラー結果処理部405に渡す。
クローラー結果処理部405は、クローラー部から受け取ったファイルを、テキスト抽出部406に渡し、レスポンスとして、ファイルから抽出したテキストの情報(テキスト抽出結果)を受け取る。そして、クローラー結果処理部405は、テキスト抽出部406から受け取ったテキスト抽出結果と対応する格納先情報を、ファイル情報DB部407にファイル情報(格納先の特徴情報)として保存しておく。
一方、解析リクエスト受付処理部402は、通信部401を介して、画像処理装置101から、スキャン画像の解析リクエストを受け付けると、画像処理装置101から解析対象の画像データ(文書をスキャンして得た画像データ)を受け取る。また、解析リクエスト受付処理部402は、後述する解析リクエスト処理部403で画像データを解析した結果(解析結果)を、画像処理装置101にレスポンスとして送信する処理も行う。
解析リクエスト処理部403は、解析リクエスト受付処理部402で受信した解析対象の画像データを、テキスト抽出部406に渡し、レスポンスとして、画像データにOCR処理を行って抽出したテキスト(文字認識結果のデータ)を受け取る。さらに、解析リクエスト処理部403は、ファイル情報DB部407に格納されているファイル情報を取得し、テキスト抽出部から受け取ったテキストデータ(文字認識結果のデータ)と比較する比較処理を行う。解析リクエスト処理部403は、当該比較処理の結果、当該受信した解析対象の画像データと類似するファイルが格納されている1乃至複数の格納先を特定し、当該特定した格納先を、格納先候補として解析リクエスト受付処理部402に渡す。
テキスト抽出部406は、画像処理装置101から受信したスキャン画像データに対してOCR処理等を行ってテキスト情報を抽出したり、ファイルサーバーから取得したファイルからテキスト情報を抽出したりする。また、テキスト抽出部406は、抽出したテキスト情報を、適切な文節で区切ったり、キーワードの出現回数などを集計したりする処理も行う。
図5は、本実施例におけるファイルサーバー103のソフトウェア構成を説明するための図である。ファイルサーバー103のCPUが、コンピュータプログラムを実行することにより、図5に示す各機能部(通信部501、ファイル処理部502、ファイル保存部503)として機能する。
ファイル処理部502は、通信部501を介して、画像処理装置101や解析サーバー102からリクエストを受け付ける。受け付けるリクエストの種類は、ファイル保存部503へのファイル格納要求であったり、ファイル保存部503に保存されているファイルの取得要求であったりする。ファイル処理部502は、受け付けたリクエストに従い、ファイル保存部503へファイルを保存したり、ファイルを取得したりする。ファイル保存部503は、ファイル処理部の指示に従い、ファイルの実体を記憶装置に保存する役割を果たす。
図6は、画像処理装置101により実行されるアプリケーション600のソフトウェア構成を説明するための図である。アプリケーション600は、ROM221に格納され、画像処理装置の制御部218内のCPU220によって実行されることにより、各機能部(通信部601、処理部602、画面表示部603)として機能する。
処理部602は、通信部601を介して、解析サーバー102およびファイルサーバー103と通信を行う。処理部602の主な処理としては、まず、画像処理装置101の制御部218を介して、スキャナ部213に対してスキャン実行指示を行う。さらに、解析サーバー102に対して、スキャナ部213でスキャンして得た画像データを送信し、そのレスポンスとして解析結果を受け取る。また、ファイルサーバー103に対して、スキャナ部213でスキャンして得た画像データファイルと格納先とを送信し、ファイルの格納を指示する。なお、処理部602を中心とした一連の処理シーケンスに関しては、図9を用いて後述する。
画面表示部603は、操作表示部212を介して、ユーザに対して画面を表示するための処理を行う。具体的には、操作画面を表示し、ユーザの操作に応じた処理依頼を処理部602に行う。
図7は、画像処理装置101の操作表示部212によりディスプレイに表示される画面の例である。このメインメニュー画面700では、画像処理装置501上で利用可能な各機能(各アプリケーション)へアクセス可能なボタンが表示されている。ユーザが各ボタンを押下することによって、当該押下されたボタンに対応するアプリケーションが起動する仕組みである。701は、「スキャンして送信」するアプリケーションを起動するためのボタンである。なお、このメインメニュー画面は、画像処理装置501が有するメインメニューキー(不図示)を押下したときに表示される。
図8は、本実施例における画像処理装置101の操作表示部212の例であり、ユーザが「スキャンして送信」ボタン701を押下するのに応じて起動されるアプリケーション600により表示される画面800である。ユーザが、スキャナ部に原稿をセットしたうえで、この画面800内のスタートキー801を押下すると、画像処理装置は、当該セットされた原稿のスキャンを実行し、スキャン画像を解析サーバー102およびファイルサーバー103に送信する。
図9は、ユーザが図8に示したアプリケーション600の操作画面を利用して、原稿をスキャンし、ファイルサーバー103に画像データを格納するまでのシーケンス図である。
S9001で、画像処理装置501は、メインメニューキー(不図示)がユーザによって押下されたことを検知すると、操作表示部212は、図7に示したメインメニュー画面700をディスプレイに表示する。メインメニュー画面700上で、アプリケーション600を起動するためのボタン701がユーザにより押下されたことを検知すると、S9002において、操作表示部212は、アプリケーション600に対して選択されたことを通知して起動する。アプリケーション600は該通知を受けると、S9003において、アプリケーション600の初期画面情報を操作表示部212に送信して表示指示を行う。S9004において、操作表示部212は、受信した画面800を表示する。
画面800上では、ユーザの指示に基づき、スキャン条件の設定(カラー/白黒、片面読み取り/両面読み取り、などの読み取り設定)を行うこともできる。そして、スキャナ部のADFに複数枚の原稿が置かれている状態で、アプリケーション600のスタートキー801がユーザにより押下されると、S9005において操作表示部212はアプリケーション600に対してスタートキーが押下されたことを通知する。
アプリケーション600はスタートボタン押下通知を受け、S9006において、スキャナ部213にスキャン実行指示を行う。S9007では、スキャナ部213は複数枚の文書原稿を順次スキャンして、複数ページの画像データで構成される電子データを作成する。複数枚の原稿全てのスキャンが完了すると、S9008においてスキャンが完了したことをアプリケーション600に通知する。アプリケーション600は、スキャン完了通知を受けると、S9009において、スキャン部213で作成された電子データ(画像データ)をページ毎に分割して送信することを、送信部215に指示する。指示を受けた送信部215は、スキャン部213で作成された電子データをページ毎に分割し、当該ページ毎に分割した電子データを解析サーバー102に順次送信する。
解析サーバー102は、ページ毎に分割された電子データの最初のページを受信すると、S9011において、受信順に電子データの解析処理を開始する。解析サーバー102におけるデータの解析処理の詳細については、図11を用いて後述する。解析サーバー102は、ページを順次解析していったときに格納先の候補が確定したと判定した時点で、S9012において解析結果として得られた格納先候補の情報を含むレスポンスを返す。
S9013では、解析サーバー102からのレスポンスを受けた送信部215が、アプリケーション600に解析結果(格納先候補の情報)と共にレスポンスを返す。S9014では、アプリケーション600は、送信部215に対してページ分割送信の中止を指示する。これは、解析サーバー102における解析結果をレスポンスとして受信したので、以降のデータの送信は不要であるためである。S9015では、送信部215が送信ジョブをキャンセルした結果をレスポンスとして返す。
さらに、S9016において、アプリケーション600は、S9013で取得した解析結果に基づいて、格納先候補を提示して電子データの格納先をユーザに選択させるための画面情報を生成する。S9017において、アプリケーション600は、当該作成した画面情報を表示するように、操作表示部212に対して画面表示指示を行う。S9018において、操作表示部212は、格納先を選択させるための画面情報をディスプレイに表示させる。解析結果(格納先候補の情報)を含む画面情報の例については、図10を用いて説明する。
図10は、解析サーバー102によって解析された結果、該スキャン画像データの格納先として適していると判断された格納先候補の情報を、ユーザに選択させるための画面例1000である。格納先候補表示部1001に表示される格納先候補の中から所望の格納先をユーザに選択させ、送信ボタン1002が押下されると、アプリケーション600は、ファイルサーバー103の当該選択された格納先に対してスキャンデータを送信する。
図9に戻ってシーケンスの説明を続ける。ユーザ操作によって格納先が選択され、送信ボタンが押下されると、S9019において操作表示部212はアプリケーション600に対して、当該選択された格納先と送信ボタンが押下されたことを通知する。通知を受けたアプリケーション600は、S9020において、送信部215に対して、ファイルの送信指示を行う。この際、ファイルの分割はせずに送信する指示を行う。指示を受けた送信部215は、S9021において、スキャナ部213で作成された電子データをページ分割することなく1つのファイルとしてファイルサーバー103に送信する。
S9022において、ファイルを受信したファイルサーバーは、指定された格納先のフォルダにデータを格納し、S9023にて、ファイルの格納処理完了を示すレスポンスを返す。さらに、送信部215は、S9024にて、アプリケーション600に対して格納処理完了のレスポンスを返す。アプリケーション600は、S9025において、送信完了画面の表示指示を操作表示部212に指示し、S9026において、操作表示部212は、完了画面を表示して処理を終了する。
図11は、図9のS9011において、解析サーバー102が送信部215から受信した電子データの解析を行う処理を示したフローチャートである。
解析サーバー102は、ページ毎に分割された電子データの受信を開始すると、S1101において内部変数Nを1に初期化する。S1102において、Nページ目までのデータを解析して、Nページ目までのデータに基づく格納先候補を求める。N=1、つまり、最初のページの場合は、その最初のページを解析する。なお、解析処理は、前述したように、当該受信したページに文字認識処理を実行してテキストデータを抽出し、予めファイル情報DB部407に保存しておいたファイル情報(ファイルサーバーの各格納先に保存されているファイルを解析して得た特徴情報)と当該抽出したテキストデータとを比較することにより、格納先候補を判定する処理である。
S1103で、次のページデータを受信したか確認する。次のページを受信したと判断した場合は、S1104に進み、当該次のページ(N+1ページ目)のデータを更に解析し、それまでに解析済みのデータ(1ページ目からN+1ページ目までのデータ)に基づく格納先候補を求める。そして、S1105では、Nページ目までの解析結果(格納先候補)と、S1104で新たに解析したN+1ページ目までの解析結果(格納先候補)とを比較する。S1106では、S1105での比較結果により、2つの解析結果の類似度が所定の閾値以上であるかどうか判断する。所定の閾値以上である場合は、類似度が高い(格納先候補が定まった)と判断してS1107に進み、N+1ページ目までの解析結果(すなわち格納先候補の情報)を画像形成装置に返信する。解析サーバー102は、S1107にて解析結果を返した後、S1108において、当該受信した電子データを消去して処理を終了する。なお、S1106で、2つの解析結果の類似度が所定の閾値より低い場合には、類似度が低い(格納先候補がまだ変動する可能性がある)と判断して、S1103に戻る。
このように、解析サーバーは、スキャンデータを受信開始すると、1ページ目から順に解析を開始し、格納先候補が定まったと判定した時点で、当該格納先候補を返信する。すなわち、解析サーバーは、原稿のページ毎に解析を行っていくので、スキャンデータのページ全てを受信するよりも前に、格納先候補が定まった(格納先候補が変動しなくなった)と判断した時点でレスポンス(返信)を返すことができる。したがって、その文書原稿に適した格納先候補をユーザに提示するまでの時間を短くすることができる。
<実施例2>
実施例1では、アプリケーション600が送信するスキャンデータを1ページ目から順に送信し、Nページ目までの解析結果と、N+1ページ目までの解析結果を比較して、類似度が所定の閾値を越えた場合に解析結果を返す実施例となっている。しかしながら、原稿の各ページの構成によっては、例えばその原稿の特徴を表す中心的なページが、10ページ目から15ページ目に集中するような場合も考えられる。このような場合、アプリケーション600が操作表示部212に表示する操作画面において、何ページ目から何ページ目が特徴的なページであるかをユーザに指定させ、当該指定されたページを優先して送信するように構成してもよい。
<実施例3>
また、実施例1では、1ページ解析するごとに、格納先候補が定まったかどうか判定していたがこれに限るものではなく、所定のページ数(例えば2ページ)を解析するごとに格納先候補を判定するようにしてもよい。
<その他の実施例>
また、本発明は、以下の処理を実行することによっても実現される。その処理は、上述した実施例の機能を実現させるソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (5)

  1. 画像処理装置と、解析サーバーとを含む文書解析システムであって、
    前記画像処理装置は、
    複数ページの文書をスキャンして得た画像データをページ毎に分割して前記解析サーバーに送信する第1の送信手段と、
    前記解析サーバーから前記画像データの格納先候補を受信する受信手段と、
    前記受信手段で受信した格納先候補を提示して、ユーザに格納先を選択させる選択手段と、
    前記複数ページの文書をスキャンして得た画像データを1つのファイルとして、前記選択手段で選択された格納先に格納するように送信する第2の送信手段と、
    を有し、
    前記解析サーバーは、
    ファイルサーバーの各格納先に格納されているファイルを解析することにより、各格納先に格納済みのファイルの特徴情報を保存する保存手段と、
    前記第1の送信手段から送信された画像データをページ毎に順次解析して、当該解析結果と前記保存手段に保存しておいた特徴情報とを比較することにより、格納先候補を特定する解析手段と、
    前記解析手段でページ毎に順次解析し、前記画像データの格納先候補が定まったと判定した時点で、当該定まった前記画像データの格納先候補を前記画像処理装置に返信する返信手段と、
    を有することを特徴とする文書解析システム。
  2. 前記第1の送信手段は、ユーザにより指定されたページを優先して送信することを特徴とする請求項1に記載の文書解析システム。
  3. 画像処理装置とネットワークを介して接続された文書解析装置であって、
    ファイルサーバーの各格納先に格納されているファイルを解析することにより、各格納先に格納済みのファイルの特徴情報を保存する保存手段と、
    前記画像処理装置から、複数ページの文書をスキャンして得た画像データをページ毎に分割して受信する受信手段と、
    前記受信手段で受信した画像データをページ毎に順次解析して、当該解析結果と前記保存手段に保存しておいた特徴情報とを比較することにより、格納先候補を特定する解析手段と、
    前記解析手段でページ毎に順次解析し、前記画像データの格納先候補が定まったと判定した時点で、当該定まった前記画像データの格納先候補を前記画像処理装置に返信する返信手段と、
    を有することを特徴とする文書解析装置。
  4. コンピュータを、請求項に記載の文書解析装置の各手段として機能させるためのプログラム。
  5. 画像処理装置とネットワークを介して接続された文書解析装置が実行する文書解析方法であって、
    前記文書解析装置の保存手段が、ファイルサーバーの各格納先に格納されているファイルを解析することにより、各格納先に格納済みのファイルの特徴情報を保存する保存ステップと、
    前記文書解析装置の受信手段が、前記画像処理装置から、複数ページの文書をスキャンして得た画像データをページ毎に分割して受信する受信ステップと、
    前記文書解析装置の解析手段が、前記受信ステップで受信した画像データをページ毎に順次解析して、当該解析結果と前記保存手段に保存しておいた特徴情報とを比較することにより、格納先候補を特定する解析ステップと、
    前記文書解析装置の返信手段が、前記解析ステップでページ毎に順次解析し、前記画像データの格納先候補が定まったと判定した時点で、当該定まった前記画像データの格納先候補を前記画像処理装置に返信する返信ステップと、
    を有することを特徴とする文書解析方法。
JP2015017891A 2015-01-30 2015-01-30 文書解析システム、文書解析装置、文書解析方法、及びプログラム Active JP6214581B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015017891A JP6214581B2 (ja) 2015-01-30 2015-01-30 文書解析システム、文書解析装置、文書解析方法、及びプログラム
US15/008,572 US9886627B2 (en) 2015-01-30 2016-01-28 Document analysis server for recommending a storage destination of image data to an image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015017891A JP6214581B2 (ja) 2015-01-30 2015-01-30 文書解析システム、文書解析装置、文書解析方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016144001A JP2016144001A (ja) 2016-08-08
JP6214581B2 true JP6214581B2 (ja) 2017-10-18

Family

ID=56555002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015017891A Active JP6214581B2 (ja) 2015-01-30 2015-01-30 文書解析システム、文書解析装置、文書解析方法、及びプログラム

Country Status (2)

Country Link
US (1) US9886627B2 (ja)
JP (1) JP6214581B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6446995B2 (ja) * 2013-10-29 2019-01-09 株式会社リコー 情報処理システム及び情報処理方法
JP6928876B2 (ja) * 2017-12-15 2021-09-01 京セラドキュメントソリューションズ株式会社 フォーム種別学習システムおよび画像処理装置
JP7351194B2 (ja) * 2019-11-21 2023-09-27 株式会社リコー 画像形成装置、及び情報処理プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030061221A1 (en) 1996-05-24 2003-03-27 Fumiaki Ito Document processing method system and storage medium for document processing programs
US6876759B2 (en) * 2001-02-01 2005-04-05 Fuji Photo Film Co., Ltd. Image transmitting system, image transmitting method and storage medium
US20040105599A1 (en) * 2002-12-03 2004-06-03 Xerox Corporation Automatic identification of destination information in a facsimile transmission device
JP2006229305A (ja) * 2005-02-15 2006-08-31 Canon Inc ネットワーク文書管理システム
US7533155B2 (en) * 2005-03-30 2009-05-12 Ricoh Company, Ltd. System and method for managing documents with multiple network applications
US8739020B2 (en) * 2005-08-03 2014-05-27 Aol Inc. Enhanced favorites service for web browsers and web applications
US8306326B2 (en) * 2006-08-30 2012-11-06 Amazon Technologies, Inc. Method and system for automatically classifying page images
JP4378413B2 (ja) * 2007-05-01 2009-12-09 シャープ株式会社 画像処理装置、画像形成装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP4623152B2 (ja) * 2008-07-03 2011-02-02 ブラザー工業株式会社 画像処理装置
US8195540B2 (en) * 2008-07-25 2012-06-05 Mongonet Sponsored facsimile to e-mail transmission methods and apparatus
US8473454B2 (en) * 2009-03-10 2013-06-25 Xerox Corporation System and method of on-demand document processing
JP5371524B2 (ja) * 2009-04-14 2013-12-18 キヤノン株式会社 文書管理システム
JP5482363B2 (ja) * 2009-07-31 2014-05-07 株式会社リコー 画像処理システム、画像処理装置及び画像処理方法
JP5304817B2 (ja) * 2011-03-09 2013-10-02 コニカミノルタ株式会社 画像形成装置、画像形成システム、画像形成装置の制御方法、及び画像形成装置の制御プログラム
WO2013100945A1 (en) * 2011-12-28 2013-07-04 Intel Corporation Automated document archive for a document processing unit
JP5983099B2 (ja) 2012-07-01 2016-08-31 ブラザー工業株式会社 画像処理装置、および、プログラム
US9544473B2 (en) * 2014-10-20 2017-01-10 Ricoh Company, Ltd. Information processing system and information processing method
JP2016212568A (ja) * 2015-05-01 2016-12-15 キヤノン株式会社 文書管理システム、文書管理方法、およびプログラム
US20160366299A1 (en) * 2015-06-12 2016-12-15 Ricoh Company, Ltd. System and method for analyzing and routing documents

Also Published As

Publication number Publication date
JP2016144001A (ja) 2016-08-08
US20160227069A1 (en) 2016-08-04
US9886627B2 (en) 2018-02-06

Similar Documents

Publication Publication Date Title
JP6849387B2 (ja) 画像処理装置、画像処理システム、画像処理装置の制御方法、及びプログラム
US7948646B2 (en) Information processing apparatus easy for users to operate
US9473669B2 (en) Electronic document generation system, electronic document generation apparatus, and recording medium
CN109426817A (zh) 用于进行预定处理的设备及其控制方法和存储介质
US10057449B2 (en) Document analysis system, image forming apparatus, and analysis server
US8970918B2 (en) Document management system and method thereof
US20120105888A1 (en) Image Forming Apparatus, Non-Transitory Computer-Readable Recording Medium for Storing Image Forming Program, and Image Forming Method
US10306085B2 (en) Information processing apparatus, control method of information processing apparatus, and recording medium
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
US20200174637A1 (en) Device, method, and storage medium
CN102694940A (zh) 信息处理装置及其控制方法
JP6214581B2 (ja) 文書解析システム、文書解析装置、文書解析方法、及びプログラム
JP5742979B1 (ja) 画像処理装置、画像読取装置及びプログラム
JP2010262584A (ja) 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP2020024303A (ja) 画像処理装置及びその制御方法、並びにプログラム
US20120026525A1 (en) Image processing system, image processing apparatus, method for controlling display of function setting screen, and recording medium
US8867091B2 (en) Image processing system, image processing apparatus, image scanning apparatus, and control method and program for image processing system
US20150086122A1 (en) Image processing system, image processing method, and medium
US11223731B2 (en) Image processing apparatus, method for controlling the same and storage medium
US20230206672A1 (en) Image processing apparatus, control method of image processing apparatus, and storage medium
US8004723B2 (en) Information processing apparatus and image processing apparatus executing script stored in association with storage region
US8463804B2 (en) File processing apparatus operating a file based on previous execution history of the file
JP2008236168A (ja) 画像処理装置、処理条件設定方法および処理条件設定プログラム
US11831824B1 (en) Image processing apparatus, information processing apparatus, image processing system, image processing method, information processing method, and storage medium
JP5942649B2 (ja) 画像形成装置及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170919

R151 Written notification of patent or utility model registration

Ref document number: 6214581

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151