JP2010020642A - 文書管理装置、文書管理方法、及びコンピュータプログラム - Google Patents

文書管理装置、文書管理方法、及びコンピュータプログラム Download PDF

Info

Publication number
JP2010020642A
JP2010020642A JP2008182036A JP2008182036A JP2010020642A JP 2010020642 A JP2010020642 A JP 2010020642A JP 2008182036 A JP2008182036 A JP 2008182036A JP 2008182036 A JP2008182036 A JP 2008182036A JP 2010020642 A JP2010020642 A JP 2010020642A
Authority
JP
Japan
Prior art keywords
group
objects
distance
object group
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008182036A
Other languages
English (en)
Other versions
JP5100543B2 (ja
JP2010020642A5 (ja
Inventor
Hirosuke Fukazawa
裕輔 深澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008182036A priority Critical patent/JP5100543B2/ja
Priority to US12/992,779 priority patent/US8650473B2/en
Priority to PCT/JP2009/062561 priority patent/WO2010005063A1/en
Priority to CN200980127100.8A priority patent/CN102089785B/zh
Publication of JP2010020642A publication Critical patent/JP2010020642A/ja
Publication of JP2010020642A5 publication Critical patent/JP2010020642A5/ja
Application granted granted Critical
Publication of JP5100543B2 publication Critical patent/JP5100543B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】文書画像の領域を従来よりも高速に且つ正確にブロック化できるようにする。
【解決手段】構造化文書に含まれる各オブジェクトの情報をリスト形式で纏めたオブジェクトリストLOを生成する。文書の垂直方向の距離が閾値以内であるオブジェクトを1つのオブジェクトグループGに含め、そのオブジェクトグループG内にあるオブジェクトを1つのグループとしてグループ化する。その後、オブジェクトグループG内に含まれる2つ以上のオブジェクトの外接矩形の水平方向の長さが垂直方向の長さ以上であり、且つ、それら2つ以上のオブジェクトの少なくとも1つの水平方向の長さが閾値以上でない場合に、再ブロック化処理を行う。再ブロック化処理では、オブジェクトグループGに含まれるオブジェクトのうち、水平方向の距離が閾値以内であるオブジェクトを、1つのオブジェクトグループGCとしてグループ化する。
【選択図】図11

Description

本発明は、文書管理装置、文書管理方法、及びコンピュータプログラムに関し、特に、文書における、図形、文字列、画像等の描画オブジェクトをブロック化するために用いて好適なものである。
従来から、文書画像の領域をブロック化(画定)するブロック化技術があった。このブロック化技術として、文書の画像データに対して、像域分離(ブロックセレクション)を適用する方法があった。この方法は、ヒストグラムやグラフ分割法等の技術を利用して文書画像の領域を抽出するものである。この方法を用いた技術として特許文献1に記載の技術がある。特許文献1では、まず、画像データを横方向及び縦方向に走査し、最長白ラン幅のヒストグラムを作成する。そして、作成したヒストグラムを用いて、領域抽出処理を行い、抽出した領域を、フィールドセパレータ領域、写真領域、図表領域、及びその他の文字領域のうちの何れかの属性に分類する。
特開平5-40849号公報
しかしながら、前述した従来の技術では、ブロック化を行う対象となるデータが画像であることが前提である。このため、前述した従来の技術を例えば構造化文書に適応する場合、構造化文書内の描画データを一旦ラスタライズし、更にヒストグラムやグラフ分割等の技法を用いて像域分離を行う必要がある。したがって、ブロック化(領域の抽出)が完了するまでに非常に時間を要する課題があった。
本発明は、このような問題点に鑑みてなされたものであり、文書画像の領域を従来よりも高速にブロック化できるようにすることを目的とする。
本発明の文書管理装置は、文書におけるオブジェクト間の距離であって、前記文書の第1の方向の距離である第1の距離が閾値以内であるオブジェクトを第1のオブジェクトグループに追加してグループ化する第1のグループ化手段と、前記第1のオブジェクトグループ内の複数のオブジェクト間の距離であって、前記第1の距離とは異なる方向の距離である第2の距離が閾値以内に収まらない場合、当該複数のオブジェクトが別のオブジェクトグループに属するようにグループを分ける第2のグループ化手段とを有することを特徴とする。
本発明によれば、文書の第1の方向の距離が閾値以内であるオブジェクトを第1のオブジェクトグループとしてグループ化する。その後、第1のオブジェクトグループ内のオブジェクトのうち、文書の第2の方向の距離が閾値以内に収まらない複数のオブジェクトを別のオブジェクトグループに属するようにする。したがって、ヒストグラムやグラフ分割等の技法を用いなくても、オブジェクトのグループ化が可能になる。よって、文書画像の領域を従来よりも高速にブロック化できるようになる。
以下に、図面を参照しながら、本発明の一実施形態について説明する。本実施形態では、構造化文書に含まれる描画オブジェクト(以下の説明では、必要に応じてオブジェクトと略称する)を自動的にブロック化する場合を例に挙げて説明する。ここで、構造化文書とは、マークアップ言語により作成された文書をいい、計算機での管理や処理のために文書中に文書の構造を示すタグを入れることで、論理構造を定義している文書である。このため、テキストデータでありながら、複雑な文書構造を持ちつつ、OSやソフトウェアの制約を受けることなく利用することができ、汎用度が高い文書データとなる。
図1は、ページレイアウト(ブロック化処理)を実行する文書管理装置のシステム構成の一例を示す図である。
図1において、コンピュータモジュール101には、入力/出力インタフェイス(I/Oインタフェイス)143を介して、キーボード132やマウス133のようなポインティングデバイス等の入力装置が接続される。また、コンピュータモジュール101には、ディスプレイ装置144や、状況に応じてはローカルプリンタ145を含む出力装置が接続される。入力/出力インタフェイス(I/Oインタフェイス)138は、コンピュータモジュール101をネットワーク107に接続し、コンピュータモジュール101を、外部の他のコンピュータ装置と通信可能に接続する。ネットワーク107としては、例えば、ローカルエリアネットワーク(LAN)やワイドエリアネットワーク(WAN)やインターネットが挙げられる。
コンピュータモジュール101は、少なくとも1つのプロセッサユニット(CPU)135を有している。また、コンピュータモジュール101は、例えば半導体のランダムアクセスメモリ(RAM)やリードオンリーメモリ(ROM)を備えて構成されるメモリユニット136を有している。また、コンピュータモジュール101は、ビデオインタフェイス137を含む入力/出力(I/O)インタフェイスと、キーボード132やマウス133とコンピュータモジュール101とを相互に接続するための前述したI/Oインタフェイス143と有している。
更に、コンピュータモジュール101は、例えばハードディスクドライブ(HDD)140やフレキシブルディスクドライブ(FDD)141を含む記憶装置139を有している。図1には示していないが、磁気テープドライブ等が記憶装置139に含まれることもある。CD−ROMドライブ142は、不揮発性のデータソースとして提供される。
コンピュータモジュール101は、LINUX(登録商標)やWINDOWS(登録商標)のようなオペレーションシステムや、相互接続バス134を介して通信を行うコンピュータモジュール101のコンポーネント135〜143を利用して処理を実行する。
以下に示すフローチャートで示された手順を実現するソフトウェアは、例えば記憶装置139を含む"コンピュータモジュール101の可読媒体"に格納される。ソフトウェアは、コンピュータモジュール101の可読媒体からメモリユニット136にロードされ、プロセッサユニット(CPU)135によって実行される。コンピュータモジュール101でコンピュータプログラム製品を使用することにより、文書管理装置を、ドキュメントのレイアウト編集に有利な装置として作動することができる。
図2は、オブジェクトリストの一例を示す図である。
図2に示すオブジェクトリスト200は、例えばHDD140に格納される。本実施形態では、コンピュータモジュール101は、図2に示すようなオブジェクトリスト200を用いることにより、構造化文書内のオブジェクトの情報を管理する。図2に示すように、各オブジェクトの情報がリスト構造になってオブジェクトリスト200に格納されている。また、各オブジェクトの情報には、オブジェクトID201と、オブジェクト種類202、左上座標203と、右下座標204と、オブジェクト固有情報205とが含まれている。ここで、左上座標203及び右下座標204は、オブジェクトの位置を示す情報である。
図3は、オブジェクトリスト200に格納されるオブジェクトの情報と、実際のオブジェクトとの関係の一例を示す図である。
図3に示すように、左上座標203aが(20,34)、右下座標204aが(81,65)の位置にある長方形のオブジェクト301の情報は、図3の右図に示す内容でオブジェクトリスト200に格納(登録)される。
図4は、PDFフォーマットの構造化文書から、図3に示したような長方形のオブジェクト301が読み出され、そのオブジェクトの情報が取り出されることの一例を概念的に示す図である。
尚、図4では、構造化文書としてPDFフォーマットの構造化文書401を例に挙げて示しているが、構造化文書は、このようなものに限定されない。例えば、XPS(XML Paper Specification)、SVG(Scalable Vector Graphics)等の構造化文書でも、PDFフォーマットの構造化文書と同様に処理できる。また、OOXML(Office Open XML)、ODF(Open Document Format)等の構造化文書でも、PDFフォーマットの構造化文書と同様に処理できる。
図5は、構造化文書のオブジェクトをブロック化する際の文書管理装置のレイアウト処理部の処理の一例を説明するフローチャートである。尚、本実施形態では、レイアウト処理部は、プロセッサユニット(CPU)135、メモリユニット136、及びHDD140等を用いることにより実現できる。尚、フローチャートで示す手順は、メモリユニット(RAM又はROM)136、及びHDD140の何れかに記憶されており、その手順がプロセッサユニット(CPU)135により実行される。
まず、レイアウト処理部は、オブジェクトリストLOから、オブジェクトを1つ取得する。(ステップS501)。オブジェクトリストLOは、例えば図2に示したオブジェクトリスト200である。
次に、レイアウト処理部は、新しいオブジェクトグループGを生成する(ステップS502)。ここで、オブジェクトグループGは、オブジェクトリストLOと同等の形式を有し、且つ、レイアウト処理部が1つのオブジェクトとして操作することができるデータ形式を有する。
次に、レイアウト処理部は、生成したオブジェクトグループGに、ステップS501で取得したオブジェクトを追加する(ステップS503)。
次に、レイアウト処理部は、オブジェクトグループGに追加したオブジェクトを、オブジェクトリストLOから削除する(ステップS504)。
次に、レイアウト処理部は、オブジェクトリストLOに、オブジェクトがまだ残っているか否かを判定する(ステップS505)。この判定の結果、オブジェクトリストLOに、オブジェクトが残っていない場合、レイアウト処理部は、オブジェクトグループGをオブジェクトリストLOに追加する(ステップS510)。そして、図5のフローチャートによる処理を終了する。
一方、オブジェクトリストLOに、オブジェクトが残っている場合、レイアウト処理部は、オブジェクトリストLOから、次のオブジェクトPOを取得する(ステップS511)。
次に、レイアウト処理部は、オブジェクトグループGの中から、オブジェクトGOを1つ取得する(ステップS512)。
次に、レイアウト処理部は、オブジェクトグループGの中から、オブジェクトGOを取得できたか否かを判定する(ステップS513)。この判定の結果、オブジェクトグループGの中から、オブジェクトGOを取得できない場合には、前述したステップS502に戻る。
一方、オブジェクトグループGの中から、オブジェクトGOを取得できた場合、レイアウト処理部は、ステップS511で取得したオブジェクトPOと、ステップS512で取得したオブジェクトGとの間の垂直方向の距離を計算する(ステップS514)。
図6は、2つのオブジェクトの間の垂直方向の距離の一例を説明する図である。
図6に示すように、本実施形態では、オブジェクト間の距離とは、オブジェクト601、602を包む外接矩形の間の最短距離のことをいう。図6に示す例では、オブジェクト601は長方形であるのに対し、オブジェクト602は楕円である。したがって、レイアウト処理部は、楕円のオブジェクト602の外接矩形603を作成し、この外接矩形603と長方形のオブジェクト601との垂直方向の最短距離604を、2つのオブジェクト601、602の間の垂直方向の距離として計算する。
図5の説明に戻り、レイアウト処理部は、ステップS514で計算した距離が閾値以内か否かを判定する(ステップS515)。この判定の結果、ステップS514で計算した距離が閾値以内でなければ、前述したステップS512に戻る。一方、ステップS514で計算した距離が閾値以内であれば、前述したステップ503に戻る。
ここで閾値とは、システムで定められる一定の大きさの距離のことであり、本実施形態では、この距離の閾値でブロック化するオブジェクト同士を垂直方向で分離している。
以上のように本実施形態では、例えば、文書の垂直方向が第1の方向の一例となり、ステップS514で計算した距離が第1の距離の一例となり、オブジェクトグループGが第1のオブジェクトグループの一例となる。また、例えば、ステップS503の処理を行うことにより第1のグループ化手段の一例が実現される。
図7は、文書と、その文書のオブジェクトを図5のフローチャートによってブロック化した結果の一例を示す図である。
図7に示すように、ページ701上で、オブジェクト711とオブジェクト712とがブロック化され、1つのブロック721にブロック化されている。同様に、オブジェクト713とオブジェクト714とが1つのブロック722に、オブジェクト715とオブジェクト716とが1つのブロック723に夫々ブロック化されている。尚、オブジェクト711とオブジェクト712は隣り合っているため、両者の垂直方向の差異は0とみなされる。その結果、両者の垂直方向の差異が閾値値以内に収まるため、両者がブロック化されている。
図7に示すように、本実施形態では、ページレイアウトを変更するに際し、最も小さい区分けによるオブジェクトの距離を全て考慮するのではなく、ある程度のまとまったオブジェクト群からなる「ブロックの距離」を考慮するようにしている。
図8は、図5に示したフローチャート処理で生成したオブジェクトグループG内のオブジェクトを再ブロック化するか否かを判定する際の文書管理装置のレイアウト処理部の処理の一例を説明するフローチャートである。
まず、レイアウト処理部は、オブジェクトリストLOから、図5のステップS510で追加されたオブジェクトグループGを1つ取得する(ステップS801)。
次に、レイアウト処理部は、ステップS801で取得したオブジェクトグループGの中のオブジェクトが1つのみであるか否かを判定する(ステップS802)。
この判定の結果、ステップS801で取得したオブジェクトグループGの中のオブジェクトが1つのみの場合、レイアウト処理部は、オブジェクトリストLOの中に、未参照のオブジェクトグループGが残っているか否かを判定する(ステップS806)。この判定の結果、未参照のオブジェクトグループGが残っていない場合には、図8のフローチャートによる処理を終了する。
一方、未参照のオブジェクトグループGが残っている場合には、前述したステップS801に戻る。
ステップS802において、テップS801で取得したオブジェクトグループGの中のオブジェクトが1つのみでない(2つ以上ある)場合、レイアウト処理部は、次の処理を行う。すなわち、レイアウト処理部は、ステップS801で取得したオブジェクトグループGの外接矩形の領域の縦(垂直方向)の長さが横(水平方向)の長さよりも長いか否か(縦横比(縦の長さ/横の長さ)>1であるか否か)を判定する(ステップS803)。
この判定の結果、ステップS801で取得したオブジェクトグループGの外接矩形の領域の縦の長さが横の長さよりも長い場合には、前述したステップS806に進む。
一方、ステップS801で取得したオブジェクトグループGの外接矩形の領域の縦の長さが横の長さよりも長くない場合、レイアウト処理部は、次の処理を行う。すなわち、レイアウト処理部は、ステップS801で取得したオブジェクトグループG内に、オブジェクトの幅(水平方向の長さ)が閾値以上であるオブジェクトが存在するか否かを判定する(ステップS804)。
この判定の結果、ステップS801で取得したオブジェクトグループG内に、オブジェクトの幅が閾値以上であるオブジェクトが存在する場合には、前述したステップS806に進む。
一方、ステップS801で取得したオブジェクトグループG内の全てのオブジェクトの幅が閾値未満である場合、レイアウト処理部は、図9のフローチャートに従って再ブロック化処理を実行する(ステップS805)。そして、前述したステップS806に進む。
以上のように本実施形態では、例えば、ステップS802の処理を行うことにより第1の判定手段の一例が実現される。また、ステップS803の処理を行うことにより第2の判定手段の一例が実現される。また、ステップS804の処理を行うことにより第3の判定手段の一例が実現される。
図9は、図8のステップS805における再ブロック化処理の一例を詳細に説明するフローチャートである。
まず、レイアウト処理部は、図8のステップS801で取得したオブジェクトグループGからオブジェクトを1つ取得する(ステップS901)。ステップS901にて取得されるオブジェクトグループの一例は、図7のグループ721である。
次に、レイアウト処理部は、新しいオブジェクトグループGCを生成する(ステップS902)。ここで、オブジェクトグループGCは、オブジェクトリストLOと同等の形式を有し、且つ、レイアウト処理部が1つのオブジェクトとして操作することができるデータ形式を有する。
また、このオブジェクトグループGCは、オブジェクトグループGと親子関係を持つ。よって、オブジェクトグループGのオブジェクトID201が「0001」の場合、レイアウト処理部は、オブジェクトグループGCのオブジェクトIDとして「0001-1」等を付与する。尚、ここでは、オブジェクトグループGCのオブジェクトIDに、オブジェクトグループG、GCが親子関係であることを示すようにした。しかしながら、必ずしもこのようにする必要はなく、オブジェクトグループG、GCのオブジェクトIDの少なくとも何れかに、オブジェクトグループG、GCが親子関係であることを示すようにしていればよい。
以上のように本実施形態では、例えば、オブジェクトグループGのオブジェクトIDが第1のグループ識別情報の一例となり、オブジェクトグループGCのオブジェクトIDが第2のグループ識別情報の一例となる。また、例えば、レイアウト処理部がオブジェクトグループGにオブジェクトIDを付与することにより第1の付与手段の一例が実現される。また、レイアウト処理部がオブジェクトグループGCにオブジェクトIDを付与することにより第2の付与手段の一例が実現される。
次に、レイアウト処理部は、生成したオブジェクトグループGCに、ステップS901で取得したオブジェクトを追加する(ステップS903)。ステップS903において追加されるオブジェクトの一例は、オブジェクトグループ721内の左のオブジェクトである。
次に、レイアウト処理部は、オブジェクトグループGに、オブジェクトがまだ残っているか否かを判定する(ステップS904)。この判定の結果、オブジェクトグループGにオブジェクトが残っていない場合、レイアウト処理部は、オブジェクトグループGCをオブジェクトリストLOに追加する(ステップS905)。そして、図9のフローチャートによる処理を終了する。
一方、オブジェクトグループGに、オブジェクトが残っている場合、レイアウト処理部は、オブジェクトグループGから、次のオブジェクトPOを取得する(ステップS906)。ステップS906にて取得されるオブジェクトPOの一例は、オブジェクトグループ721内の右のオブジェクトである。
次に、レイアウト処理部は、オブジェクトグループGCの中から、オブジェクトGOを1つ取得する(ステップS907)。ステップS907において取得されるオブジェクトの一例は、オブジェクトグループ721内の左のオブジェクトである。
次に、レイアウト処理部は、オブジェクトグループGCの中から、オブジェクトGOを取得できたか否かを判定する(ステップS908)。この判定の結果、オブジェクトグループGCの中から、オブジェクトGOを取得できない場合には、前述したステップS902に戻る。
一方、オブジェクトグループGCの中から、オブジェクトGOを取得できた場合、レイアウト処理部は、ステップS906で取得したオブジェクトPOと、ステップS907で取得したオブジェクトGOとの間の水平方向の距離を計算する(ステップS909)。
前述したように、図5のステップS514では、オブジェクトを包む外接矩形同士の垂直方向における最短距離をオブジェクト間の距離とした。これに対し、図9のステップS609では、オブジェクトを包む外接矩形同士の水平方向における最短距離をオブジェクト間の距離とする。
図10は、2つのオブジェクトの間の水平方向の距離の一例を説明する図である。
図10に示す例では、オブジェクト1001は長方形であるのに対し、オブジェクト1002は楕円である。したがって、レイアウト処理部は、楕円のオブジェクト1002の外接矩形1003を作成し、この外接矩形1003と長方形のオブジェクト1001との垂直方向の最短距離1004を、2つのオブジェクト1001、1002の間の水平方向の距離として計算する。
図9の説明に戻り、レイアウト処理部は、ステップS909で計算した距離が閾値以内か否かを判定する(ステップS910)。この判定の結果、ステップS909で計算した距離が閾値以内でなければ、前述したステップS907に戻る。例えば、図7のグループ721内のオブジェクト間の距離が閾値以内でない場合、S805の再ブロック化が実行された後、図11のようにグループ721内の2つ(複数)のオブジェクトが別のオブジェクトグループに属するようにグループが分けられる。
一方、ステップS909で計算した距離が閾値以内であれば、前述したステップ903に戻る。例えば、図7のグループ721内の2つのオブジェクト間の距離が閾値以内である場合、グループ721のオブジェクトは最ブロック化が実行された後も同一グループ内に属することになる。
ここで閾値とは、システムで定められる一定の大きさの距離のことであり、本実施形態では、この距離の閾値でブロック化するオブジェクト同士を水平方向で分離している。
以上のように本実施形態では、例えば、文書の水平方向が第2の方向の一例となり、ステップS909で計算した距離が第2の距離の一例となり、オブジェクトグループGCが第2のオブジェクトグループの一例となる。また、例えば、ステップS903の処理を行うことにより第2のグループ化手段の一例が実現される。
図11は、文書のオブジェクトを図5のフローチャートに基づきブロック化した結果と、その文書のオブジェクトを、更に図8、図9のフローチャートに基づきブロック化した結果の一例を示す図である。
図11に示すように、ページ1101上で、ブロック1111は、2つのブロック1121、1122に再ブロック化される。同様に、オブジェクト1114は、2つのブロック1125、1126に再ブロック化される。一方、ブロック1112については、図8のステップS803の判定結果により再ブロック化が行われない。また、ブロック1113については、図8のステップS804の判定結果により再ブロック化が行われない。
そして、レイアウト処理部は、ユーザによるキーボード132やマウス133等の操作に基づいて、文書に設定されているブロックの状態の表示が指示されると、その文書に対して設定されているオブジェクトグループG、GCを抽出する。そして、レイアウト処理部は、抽出したオブジェクトグループG、GCのグループIDを参照し、参照した結果に基づいて、ユーザが指定した文書におけるブロックの状態をディスプレイ装置144に表示することができる。例えば、図7の右図に示したような画像、図11の右図に示したような画像、及び図11の左図と右図との双方の画像の何れかを、ユーザの操作に基づいてディスプレイ装置144に表示することができる。また、それらの表示を、ユーザの操作に基づいて切り替え表示することもできる。更に、表示したグループをユーザに選択させて編集させることもできる。この他、図5の処理のみを行うブロック化処理と、図5、図8、図9の処理を行うブロック化処理との何れかを実行するのかを、ユーザに選択させるようにすることもできる。
以上のように本実施形態では、例えば、レイアウト処理部が、オブジェクトグループG、GCのグループIDを参照してユーザが指定した文書におけるブロックの状態を表示装置に表示することにより表示手段の一例が実現される。
以上のように本実施形態では、構造化文書に含まれる各オブジェクトの情報をリスト形式で纏めたオブジェクトリストLOを生成する。文書の垂直方向の距離が閾値以内であるオブジェクトを1つのオブジェクトグループGに含め、そのオブジェクトグループG内にあるオブジェクトを1つのグループとしてグループ化する。その後、オブジェクトグループG内に含まれる2つ以上のオブジェクトの外接矩形の水平方向の長さが垂直方向の長さ以上であり、且つ、それら2つ以上のオブジェクトの少なくとも1つの水平方向の長さが閾値以上でない場合に、再ブロック化処理を行う。再ブロック化処理では、オブジェクトグループGに含まれるオブジェクトのうち、水平方向の距離が閾値以内であるオブジェクトを、1つのオブジェクトグループGCとしてグループ化する。
したがって、構造化文書内の描画データをラスタライズし、更にヒストグラムやグラフ分割等の技法を用いて像域分離を行う必要がなくなる。したがって、ブロック化(領域の抽出)が完了するまでの時間を従来よりも短縮することができる。
ところで、文書における複数のオブジェクトのブロック化を簡便に且つ高速に行うために、図5の処理だけを行うことが考えられる。すなわち、文書のオブジェクトを上から垂直方向に探索し、探索したオブジェクトを順次参照し、上下のオブジェクトの距離が閾値以内であれば、それらをブロック化し、順次ブロック化する領域を広げる。一方、ブロック化した領域とその直下のオブジェクトとの距離が閾値以内でない場合には、それらを別々のブロックとみなす。
しかしながら、このようにした場合、文書の垂直方向の距離のみでブロック化領域を作成する。このため、例えば文字列の段組のように、水平方向の距離が離れたオブジェクトであっても、垂直方向の距離が近ければ同一のブロックとなってしまう課題がある。
また、図8のステップS802〜S804の少なくとも何れか1つを行わないようにすることも考えられる。例えば、ステップS803、S804を行わない場合には、垂直方向及び水平方向の両方の距離が閾値以内であるオブジェクトをブロック化し、そうでないオブジェクトを別々のブロックにすることになる。ただし、このようにして単純にブロック化処理を行うと、各ブロック自体が非常に細分化されてしまうため、ユーザの利便性を損ない、また、ブロック化自体の処理に非常に時間を要してしまう課題がある。
これに対し、本実施形態では、構造化文書に対して、垂直方向及び水平方向の両方から、オブジェクト間の距離を参照すると共に、ブロック化の条件(オブジェクト数、外接矩形領域の縦横比、オブジェクト幅)を満たす場合にのみブロック化を行うようにした。したがって、不必要なブロック化処理を可及的に省略することができ、従来よりも簡便、高速、且つ正確に自動ブロック化を実現することが可能になり、より好ましい形態となる。
また、本実施形態では、文書の垂直方向の距離に基づいて生成したオブジェクトグループG(親)と、文書の水平方向の距離に基づいて生成したオブジェクトグループGO(子)との親子関係をグループIDで判別できるようにした。したがって、ユーザの用途に応じて、ブロックの状態を表示したり、選択の切り替えを行ったりすることが可能となる。
尚、本実施形態では、文書の垂直方向の距離に基づいてオブジェクトグループGを生成してから、文書の水平方向の距離に基づいて、オブジェクトグループGを更に細分化したオブジェクトグループGOを作成する場合を例に挙げて説明した。しかしながら、文書の水平方向の距離に基づいてオブジェクトグループを生成してから、文書の垂直方向の距離に基づいて、当該オブジェクトグループを更に細分化したオブジェクトグループを作成してもよい。このようにした場合、例えば、図8のステップS803において、オブジェクトグループGの外接矩形の領域の横の長さが縦の長さよりも長いか否かを判定するようにしてもよい。また、ステップS804において、オブジェクトグループG内に、オブジェクトの高さ(縦の長さ)が閾値以上であるオブジェクトが存在するか否かを判定するようにしてもよい。
また、本実施形態では、オブジェクトグループGの属性が所定の条件を満たすか否かを判定するための判定基準として、ステップS802〜S804の3つの判定基準を用いた場合を例に挙げて説明したが、必ずしもこのようにする必要はない。例えば、ステップS802〜S804の3つの判定基準のうち、少なくとも1つ(ステップS802のみ、ステップS802とステップS803、又はステップS802とステップS804等)を採用することができる。
(本発明の他の実施形態)
前述した本発明の実施形態における文書管理装置を構成する各手段、並びに文書管理方法の各ステップは、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記録したコンピュータ読み取り可能な記録媒体は本発明に含まれる。
また、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図5、図8、図9に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接、あるいは遠隔から供給するものを含む。そして、そのシステムあるいは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
尚、前述した各実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
本発明の実施形態を示し、ページレイアウト(ブロック化処理)を実行する文書管理装置のシステム構成の一例を示す図である。 本発明の実施形態を示し、オブジェクトリストの一例を示す図である。 本発明の実施形態を示し、オブジェクトリストに格納されるオブジェクトの情報と、実際のオブジェクトとの関係の一例を示す図である。 本発明の実施形態を示し、PDFフォーマットの構造化文書から、長方形のオブジェクトが読み出され、そのオブジェクトの情報が取り出されることの一例を概念的に示す図である。 本発明の実施形態を示し、構造化文書のオブジェクトをブロック化する際の文書管理装置のレイアウト処理部の処理の一例を説明するフローチャートである。 本発明の実施形態を示し、2つのオブジェクトの間の垂直方向の距離の一例を説明する図である。 本発明の実施形態を示し、文書と、その文書のオブジェクトを図5のフローチャートによってブロック化した結果の一例を示す図である。 本発明の実施形態を示し、図5に示したフローチャート処理で生成したオブジェクトグループ内のオブジェクトを再ブロック化するか否かを判定する際の文書管理装置のレイアウト処理部の処理の一例を説明するフローチャートである。 本発明の実施形態を示し、図8のステップS805における再ブロック化処理の一例を詳細に説明するフローチャートである。 本発明の実施形態を示し、2つのオブジェクトの間の水平方向の距離の一例を説明する図である。 本発明の実施形態を示し、文書のオブジェクトを図5のフローチャートに基づきブロック化した結果と、その文書のオブジェクトを、更に図8、図9のフローチャートに基づきよってブロック化した結果の一例を示す図である。
符号の説明
101 コンピュータモジュール
200 オブジェクトリスト
201 オブジェクトID
202 オブジェクト種類
203 左上座標
204 右下座標
711〜716 オブジェクト
721〜723、1111〜1114、1121〜1126 ブロック

Claims (9)

  1. 文書におけるオブジェクト間の距離であって、前記文書の第1の方向の距離である第1の距離が閾値以内であるオブジェクトを第1のオブジェクトグループに追加してグループ化する第1のグループ化手段と、
    前記第1のオブジェクトグループ内の複数のオブジェクト間の距離であって、前記第1の距離とは異なる方向の距離である第2の距離が閾値以内に収まらない場合、当該複数のオブジェクトが別のオブジェクトグループに属するようにグループを分ける第2のグループ化手段とを有することを特徴とする文書管理装置。
  2. 前記第1のオブジェクトグループの属性が、所定の条件を満たすか否かを判定する判定手段を有し、
    前記第2のグループ化手段は、前記第1のオブジェクトグループの属性が、所定の条件を満たしていると、前記第1のオブジェクトグループ内の複数のオブジェクト間の距離が閾値以内に収まるか否かを判定することを特徴とする請求項1に記載の文書管理装置。
  3. 前記所定の条件は、前記第1のオブジェクトグループ内のオブジェクトが2つ以上であることと、前記第1のオブジェクトグループ内のオブジェクトの外接矩形の領域の前記第2の方向の長さが前記第1の方向の長さよりも大きいことと、前記第1のオブジェクトグループ内のオブジェクトの前記第2の方向の長さが閾値未満であることとの少なくとも何れか1つを含むことを特徴とする請求項2に記載の文書管理装置。
  4. 前記判定手段は、前記第1のオブジェクトグループ内のオブジェクトが1つであるか否かを判定する第1の判定手段と、
    前記第1の判定手段により、前記第1のオブジェクトグループ内のオブジェクトが2つ以上あると判定されると、前記第1のオブジェクトグループ内のオブジェクトの外接矩形の領域の前記第1の方向の長さが前記第2の方向の長さよりも大きいか否かを判定する第2の判定手段と、
    前記第2の判定手段により、前記第1のオブジェクトグループ内のオブジェクトの外接矩形の領域の前記第1の方向の長さが前記第2の方向の長さよりも大きくないと判定されると、前記第1のオブジェクトグループ内に、前記第2の距離の方向の長さが閾値以上であるオブジェクトがあるか否かを判定する第3の判定手段とを有し、
    前記第2のグループ化手段は、前記第3の判定手段により、前記第1のオブジェクトグループ内に、前記第2の距離の方向の長さが閾値以上であるオブジェクトがないと判定されると、前記第2の距離が閾値以内であるオブジェクトを第2のオブジェクトグループに追加して更にグループ化することを特徴とする請求項3に記載の文書管理装置。
  5. 前記第1のオブジェクトグループを識別する第1のグループ識別情報を、前記第1のオブジェクトグループに付与する第1の付与手段と、
    前記第2のオブジェクトグループを識別する第2のグループ識別情報を、前記第1のオブジェクトグループに付与する第2の付与手段とを有し、
    前記第1のグループ識別情報により識別される第1のオブジェクトグループと、その第1のオブジェクトグループ内のオブジェクトが追加された第2のオブジェクトグループとが親子関係にあることを、前記第1のグループ識別情報と前記第2のグループ識別情報との少なくとも何れかに示すようにしたことを特徴とする請求項1〜4の何れか1項に記載の文書管理装置。
  6. 前記第1の付与手段により付与された第1のグループ識別情報と、前記第2の付与手段により付与された第2のグループ識別情報とに基づいて、前記オブジェクトのグループに関する情報を表示装置に表示する表示手段を有することを特徴とする請求項5に記載の文書管理装置。
  7. 前記第1の方向は、前記文書の垂直方向であり、前記第2の方向は、前記文書の水平方向であることを特徴とする請求項1〜6の何れか1項に記載の文書管理装置。
  8. 文書におけるオブジェクト間の距離であって、前記文書の第1の方向の距離である第1の距離が閾値以内であるオブジェクトを第1のオブジェクトグループに追加してグループ化する第1のグループ化ステップと、
    前記第1のオブジェクトグループ内の複数のオブジェクト間の距離であって、前記第1の距離とは異なる方向の距離である第2の距離が閾値以内に収まらない場合、当該複数のオブジェクトが別のオブジェクトグループに属するようにグループを分ける第2のグループ化ステップとを有することを特徴とする文書管理方法。
  9. 文書におけるオブジェクト間の距離であって、前記文書の第1の方向の距離である第1の距離が閾値以内であるオブジェクトを第1のオブジェクトグループに追加してグループ化する第1のグループ化ステップと、
    前記第1のオブジェクトグループ内の複数のオブジェクト間の距離であって、前記第1の距離とは異なる方向の距離である第2の距離が閾値以内に収まらない場合、当該複数のオブジェクトが別のオブジェクトグループに属するようにグループを分ける第2のグループ化ステップとをコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2008182036A 2008-07-11 2008-07-11 文書管理装置、文書管理方法、及びコンピュータプログラム Expired - Fee Related JP5100543B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2008182036A JP5100543B2 (ja) 2008-07-11 2008-07-11 文書管理装置、文書管理方法、及びコンピュータプログラム
US12/992,779 US8650473B2 (en) 2008-07-11 2009-07-03 Document managing apparatus, document managing method, and storage medium
PCT/JP2009/062561 WO2010005063A1 (en) 2008-07-11 2009-07-03 Document managing apparatus, document managing method, and storage medium
CN200980127100.8A CN102089785B (zh) 2008-07-11 2009-07-03 文档管理设备和文档管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008182036A JP5100543B2 (ja) 2008-07-11 2008-07-11 文書管理装置、文書管理方法、及びコンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2010020642A true JP2010020642A (ja) 2010-01-28
JP2010020642A5 JP2010020642A5 (ja) 2011-08-25
JP5100543B2 JP5100543B2 (ja) 2012-12-19

Family

ID=41507173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008182036A Expired - Fee Related JP5100543B2 (ja) 2008-07-11 2008-07-11 文書管理装置、文書管理方法、及びコンピュータプログラム

Country Status (4)

Country Link
US (1) US8650473B2 (ja)
JP (1) JP5100543B2 (ja)
CN (1) CN102089785B (ja)
WO (1) WO2010005063A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021056871A (ja) * 2019-09-30 2021-04-08 大日本印刷株式会社 情報処理装置、コンピュータプログラム及び情報処理方法
JP7512798B2 (ja) 2020-09-28 2024-07-09 大日本印刷株式会社 情報処理装置及びコンピュータプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041650B2 (en) * 2005-03-11 2011-10-18 Howard Marcus Method and system for directed documentation of construction projects
US9323440B2 (en) * 2011-12-16 2016-04-26 International Business Machines Corporation Scroll focus
US9535888B2 (en) * 2012-03-30 2017-01-03 Bmenu As System, method, software arrangement and computer-accessible medium for a generator that automatically identifies regions of interest in electronic documents for transcoding
US10445615B2 (en) * 2017-05-24 2019-10-15 Wipro Limited Method and device for extracting images from portable document format (PDF) documents
CN112785659A (zh) * 2021-01-28 2021-05-11 特赞(上海)信息科技有限公司 企业案例素材图片检测方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09120443A (ja) * 1995-10-26 1997-05-06 Canon Inc 画像処理方法とその装置
JPH10162003A (ja) * 1996-11-18 1998-06-19 Canon Inf Syst Inc Htmlファイル生成方法及びその装置及びレイアウトデータ生成方法及びその装置及びコンピュータ実行可能な処理プログラム
JP2006243942A (ja) * 2005-03-01 2006-09-14 Canon Inc 画像処理装置およびその方法
JP2007072528A (ja) * 2005-09-02 2007-03-22 Internatl Business Mach Corp <Ibm> 文書構造解析方法、プログラム、装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1655584A (en) * 1928-01-10 Receptacle filling machine
US1816097A (en) * 1930-01-27 1931-07-28 Thomas B Sumner Sawmill hog
JPH0540849A (ja) 1991-08-05 1993-02-19 Oki Electric Ind Co Ltd 文書画像の領域抽出方法
US6614432B1 (en) * 1999-04-16 2003-09-02 Adobe Systems Incorporated Image rendering technique
JP4391624B2 (ja) * 1999-06-16 2009-12-24 本田技研工業株式会社 物体認識装置
JP4118452B2 (ja) * 1999-06-16 2008-07-16 本田技研工業株式会社 物体認識装置
JP3599621B2 (ja) * 1999-11-19 2004-12-08 キヤノン株式会社 画像処理装置、画像処理方法及び記憶媒体
US7136082B2 (en) * 2002-01-25 2006-11-14 Xerox Corporation Method and apparatus to convert digital ink images for use in a structured text/graphics editor
US7164797B2 (en) 2002-04-25 2007-01-16 Microsoft Corporation Clustering
US7428700B2 (en) 2003-07-28 2008-09-23 Microsoft Corporation Vision-based document segmentation
US7343046B2 (en) 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
JP4386281B2 (ja) * 2005-01-31 2009-12-16 キヤノン株式会社 画像処理方法及び画像処理装置並びにプログラム
US20070127056A1 (en) * 2005-12-06 2007-06-07 Canon Kabushiki Kaisha Image processing apparatus, image processing method and program, and storage medium therefor
CN100428268C (zh) * 2007-04-13 2008-10-22 中国传媒大学 基于汉字特征的文档图像分割方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09120443A (ja) * 1995-10-26 1997-05-06 Canon Inc 画像処理方法とその装置
JPH10162003A (ja) * 1996-11-18 1998-06-19 Canon Inf Syst Inc Htmlファイル生成方法及びその装置及びレイアウトデータ生成方法及びその装置及びコンピュータ実行可能な処理プログラム
JP2006243942A (ja) * 2005-03-01 2006-09-14 Canon Inc 画像処理装置およびその方法
JP2007072528A (ja) * 2005-09-02 2007-03-22 Internatl Business Mach Corp <Ibm> 文書構造解析方法、プログラム、装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021056871A (ja) * 2019-09-30 2021-04-08 大日本印刷株式会社 情報処理装置、コンピュータプログラム及び情報処理方法
JP7395915B2 (ja) 2019-09-30 2023-12-12 大日本印刷株式会社 情報処理装置、コンピュータプログラム及び情報処理方法
JP7512798B2 (ja) 2020-09-28 2024-07-09 大日本印刷株式会社 情報処理装置及びコンピュータプログラム

Also Published As

Publication number Publication date
CN102089785B (zh) 2014-01-08
CN102089785A (zh) 2011-06-08
US20110072019A1 (en) 2011-03-24
JP5100543B2 (ja) 2012-12-19
US8650473B2 (en) 2014-02-11
WO2010005063A1 (en) 2010-01-14

Similar Documents

Publication Publication Date Title
JP5100543B2 (ja) 文書管理装置、文書管理方法、及びコンピュータプログラム
KR100840863B1 (ko) 문서 처리 장치 및 문서 처리 방법
KR101540556B1 (ko) 아웃스페이스 사용자 인터페이스에서의 문서 상태 정보를 통한 비제작 기능의 표시
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
JP5469244B2 (ja) 選択的なコンテンツ抽出
JP4945813B2 (ja) 印刷構造化文書
JP2007279828A (ja) 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
KR101547496B1 (ko) 웹 페이지 재구성 방법 및 장치
US20210200397A1 (en) Method for automatically indexing an electronic document
JP2008282222A (ja) 未来技術動向予測支援装置、方法、プログラム及び未来技術動向予測支援サービスを提供する方法
US10839146B2 (en) Information processing system, information processing apparatus, control method, and storage medium
JP5653494B2 (ja) クラウドにより支援されるレンダリング
US9189469B2 (en) Apparatus and method for supporting creation of an electronic document
JP2002182914A (ja) 画面遷移表示装置、画面遷移表示方法および記憶媒体
JP2007109179A (ja) 画像処理装置及びその制御方法、プログラム
KR102603985B1 (ko) 인공지능에 기반한 세미나 맞춤형 광고물 제작 시스템
JP5255483B2 (ja) オブジェクトの選択を容易にするための方法、装置およびプログラム
JP6015546B2 (ja) 情報処理装置、情報処理方法、プログラム
JP5045042B2 (ja) 業務フロー編集プログラム、業務フロー編集装置および業務フロー編集方法
CN102346771B (zh) 信息展现方法及装置
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
JP4549379B2 (ja) 文書処理装置及び文書処理方法及びプログラム
KR100907709B1 (ko) 블록 그룹핑을 이용한 정보 추출 장치 및 그 방법
JP2011034504A (ja) 文書処理装置、文書処理方法、プログラム及び記憶媒体
KR102558101B1 (ko) 딥러닝 기반 참조 도면 정보 탐색을 통한 bim 모델의 자동 2차원 도면생성 방법 및 시스템

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110708

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120501

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120828

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120925

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees