JPH05101039A - 文書整形装置 - Google Patents

文書整形装置

Info

Publication number
JPH05101039A
JPH05101039A JP3258800A JP25880091A JPH05101039A JP H05101039 A JPH05101039 A JP H05101039A JP 3258800 A JP3258800 A JP 3258800A JP 25880091 A JP25880091 A JP 25880091A JP H05101039 A JPH05101039 A JP H05101039A
Authority
JP
Japan
Prior art keywords
document
element data
data
referred
shaping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3258800A
Other languages
English (en)
Other versions
JP3352709B2 (ja
Inventor
Miyoshi Fukui
美佳 福井
Koji Yamaguchi
浩司 山口
Miwako Doi
美和子 土井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP25880091A priority Critical patent/JP3352709B2/ja
Publication of JPH05101039A publication Critical patent/JPH05101039A/ja
Application granted granted Critical
Publication of JP3352709B2 publication Critical patent/JP3352709B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 本発明は文書要素データをユーザに対し見や
すく整形することを目的とする。 【構成】 文書要素データの論理構造及び参照構造を抽
出し、文書要素データを整形する際、参照される要素デ
ータを参照する要素データの近傍に割り付け可能か否か
を判定しながら文書要素データの整形を行うものであ
る。 【効果】 ユーザによる文書の整形・編集が軽減され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の文書要素データ
間の関係を抽出し、その関係に基づいて文書を見やすい
形に整形する文書整形装置に関する。
【0002】
【従来の技術】ユーザに情報を提供するシステムにおい
て、情報を理解しやすくするためには、複数の情報をど
う配置・整形するかが大きなポイントとなってくる。
【0003】例えば、文書の整形を行うシステムでは、
ページに文章や図表・イメージデータなどを割り付ける
際、文書の分かりやすさを考慮して行う必要がある。特
に、図表やイメージは関連する文章の近くに割り付ける
必要があるため、文章内容の編集および別体裁の書式へ
の変更のたびに、ユーザが図表の最適な配置を考えて指
定しなければならなかった。
【0004】こういった作業の煩雑さを解決するものと
して、ユーザが文章と参照されている図表の関係をあら
かじめ定義しておくと、文章の流し込まれる位置によっ
て半自動的に図表の配置を決定する機能を持つシステム
が存在する。このようなシステムでは、例えば、ユーザ
は碇(アンカ)付き枠と呼ばれる図表領域を設定し、文
章中の参照箇所に碇でしめておき、図表領域は必ず参照
箇所の下にするといったように、位置を指定しておく。
何らかの編集作業や書式の変更によって、文章が別のペ
ージに移動した場合、碇付き枠は文章について自動的に
移動する。ただし、同じ図表を複数の箇所から参照して
いるような文書では、ひとつの図表に対する碇を文章中
の複数の箇所に置けないため、碇のある文を削除した場
合に、別の参照箇所に碇をつなぎ替えるといった作業が
必要になってしまう。
【0005】これに対して、文章中の図表を参照してい
る「第**図」「表**」などの語句によって、図表の
参照関係を自動的に抽出し、同一ページに割り付けるシ
ステム(特開昭61−21570号公報参照)も提案さ
れている。このシステムでは、同一図表を参照している
箇所が複数ある場合、その参照箇所間に兄弟関係を持た
せ、整形時には、そのうち最初に印字された参照箇所の
近くに図表を自動的に配置する。よって、最初の参照箇
所を含む文が削除されても、次の参照箇所が残っていれ
ば、その近くに図表を自動的に割り付けることができ
る。ただし、この方式では、参照箇所間の優先順位がな
いため、目次に図表のリストが入っている文章を整形す
る場合、目次に図表がすべて割り付けられてしまい、本
文中の参照箇所に図表を割り付けられないといった問題
が生じる。
【0006】
【発明が解決しようとする課題】このように、従来のシ
ステムでは、図表などのデータを参照するデータ(参照
箇所)間の関係づけがなされていないため、複数の参照
箇所にまたがって処理を行うことが困難であった。ま
た、参照箇所間に何らかの関係付けを持たせている場合
も、ただ文章の流れに従った順番を持つのみで、参照の
強さや意味を考えた優先順位づけがされておらず、図表
のページ内の割り付けを自動的に行うことが、十分に行
えなかった。
【0007】そこで、本発明は、参照するデータ間の論
理構造に基づき、複数のデータから参照される図表の最
適な配置を自動的に決定し、ユーザの負担を軽減させる
文書処理装置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明は、文書の構成要
素となる文書要素データを入力し、入力された各文書要
素データ間の論理構造と参照構造からなる文書構造を抽
出し、抽出された文書構造に基づいて文書要素データを
割り付け、文書の形態に整形し、整形された文書を出力
する文書整形装置であって、参照する要素データ間の論
理構造をもとに、参照される要素データを参照する要素
データの近傍に割り付けるかどうか決定する割り付け可
否決定部を有することを特徴とする文書整形装置であ
る。
【0009】
【作用】本発明によれば、複数の参照箇所から参照され
るデータの配置を決定する際、参照する文書要素データ
間の論理構造に基づき、参照されるデータの最適な配置
を自動的に決定することができ、また、システムの決定
した優先順位に従って、要素データの配置をユーザに提
示し選択させることにより、ユーザの意図に合わせて容
易に配置を変更することができるため、文書編集・整形
におけるユーザの負担を軽減することができる。
【0010】
【実施例】以下、図面に従って、本発明の一実施例を説
明する。図1は、本発明の一実施例を示すブロック図で
ある。
【0011】文書を構成する要素データである文字デー
タ・図表データ・イメージデータ等は、たとえば、キー
ボード・マウス・イメージスキャナ、その他の記憶装置
・通信装置等からなる入力部10から入力され、文書構
造抽出部20におくられる。文書構造抽出部20は、論
理構造抽出部21及び参照構造抽出部22からなり、ま
ず、論理構造抽出部21で要素データ間の論理構造を抽
出する。次に、参照構造抽出部22で、要素データ間の
参照関係(参照構造)を抽出する。
【0012】文書整形部30は、抽出された文書構造を
用いて、入力された文書要素データを整形する。割り付
け位置生成部31では、前段で抽出された参照構造を基
に、参照される要素データを参照する要素データの近辺
に割り付ける。この際、複数の参照箇所から参照される
要素データに関しては、優先順位決定部32で、参照す
る要素データ間の論理構造に基づき、各参照箇所ごとの
割り付け位置間の優先順位を決定する。割り付けられた
要素データは出力部40である。たとえばディスプレイ
・プリンタ等から整形された文書を出力する。以下に図
2の例に沿って本発明の動作を示す。
【0013】入力部10からは文章データAと図表デー
タBとから構成される文書要素データが入力される。例
えばキーボードからは文章データA、スキャナからは図
表データBが各々入力される。文書構造抽出部20で
は、各文書要素データ間の関係から、論理構造と参照構
造が抽出される。
【0014】論理構造は、文章データAの場合、たとえ
ば、標題、著者、所属、章、節など、文間の階層的な関
係であらわされるものである。論理構造抽出部21は、
ユーザが前もって付加した構造情報が入力データに含ま
れる場合は、その構造情報を読み込む。あるいは、構造
情報が付加されていない場合は論理構造解析規則を持ち
自動抽出してもよい。この論理構造の自動解析技術は特
開昭61−190653号公報に詳しく記載されてい
る。論理構造抽出部21で抽出された入力文章データの
論理構造は、たとえば、図3に示すような階層構造にな
っている。
【0015】参照構造は、各要素データ間の参照関係、
たとえば、文章中から各図表・他の章・参考文献等の参
照を表すものである。参照構造に関しても論理構造同
様、入力データから読み込むか、あるいは、例えば以下
のような手順により自動抽出する。技術文書の場合は、
文章中から各図表に対して、参照語句などを用いて参照
関係を指定している。図2の例では、第15文からの図
面の説明を表す各文、第36文の「図1に示す」、第4
0文の「この図」、第50文の「機能比較表」、第55
文の「次表」などが図表の参照を表している。参照構造
抽出部22では、たとえば、図4に示すような参照語句
辞書と参照記述抽出規則を持ち、文章中から図表を参照
する表現を抽出する。次に、参照される図表データの解
析を行い、各参照表現に対応する図表を特定する。
【0016】ここで、「第1図」は、第16文と第36
文、第40文の三箇所から参照されている。また、「第
1表」は第21文と第50文から、「第2表」は第22
文と第55文のそれぞれから参照されている。第16
文、第21文のような参照表現と図表との対応は、たと
えば、「図」「表」のような語句と図表番号の組み合わ
せが一致することにより特定する規則を持つことにより
参照関係を求める。また、第40文、第50文、第55
文のような図表番号を指定していない参照箇所に関して
は、たとえば、文脈解析による代名詞の照応関係、ある
いは図表の内容の記述の相関関係から、該当する図表を
特定する機構を持つ。さらに、すでに文章中に割り付け
られている図表に関しては、図表との距離や、「下図」
「左図」といった位置を指定する記述を解析することも
可能である。これらの解析により、たとえば、図5に示
すような参照構造が抽出される。ここでは、優先順位は
まだ未定であるため空欄のままである。
【0017】整形部30では、抽出された論理構造と参
照構造を用いて、たとえば図6に示すような書式データ
(領域)に従って、文書要素データを割り付ける。ここ
で、点線枠は、それぞれ文章を流し込む文章枠をあらわ
す。書式データ中には、各ページのサイズ、ページに含
まれる文章枠のサイズ、文章枠に流し込まれる論理属
性、流し込まれる順番などがあらかじめ指定されてい
る。この整形部30では、抽出された論理構造に従っ
て、各文章枠に指定された論理属性を持つ文を順に流し
込んでいく。ここで、書式データ中に、たとえば論理属
性(標題、著者名、……、章見出し、章段落)ごとのフ
ォントサイズ、インデント等の書式が記述してあれば、
各文はその論理属性の書式に従って整形することも可能
である。
【0018】このとき、流し込む文から図表を参照して
いる場合は、その文の近くに図表を割り付ける。ただ
し、図2の例のような、複数の文から同じ図表を参照し
ている場合は、図7に示すようなフローチャートに従っ
て検出し、優先順位決定部32に処理を渡す。つまり、
まず一文を入力し(ステップ1)、他に参照する図表が
あるかどうかを判定し(ステップ2)、無い場合は次の
一文を入力し、ある場合はすでに優先順位が決定したも
のかどうかを判定する(ステップ3)。無い場合は次に
複数の箇所から参照されているかどうかを判定し(ステ
ップ4)、参照されていれば優先順位を決定するための
処理を行い(ステップ5)、参照されていなければ優先
順位を1にして(ステップ6)各々ステップ2にもど
る。以上のようにして優先順位を決定する。
【0019】優先順位決定部32では、抽出された参照
構造と論理構造により、たとえば、図8に示すような、
同じ図表を参照している文番号と各文の論理構造中の属
性名とあわせたテーブルを作成する。なお、すでに決定
した優先順位は図5の参照構造中の優先順位の欄に随時
書き込んでいき、次の図表の優先順位の決定処理の際に
その情報も活用する。たとえば、図9に示すような優先
順位決定規則を持ち優先順位を決定する。
【0020】図8(a)では、「第1図」の参照箇所が
リストされている。優先順位決定規則1−1より、図8
(b)に示すように、第16文の優先順位は3位に落ち
る。また、規則2−1あるいは2−7により、図8
(c)に示すように優先順位が決定される。同様に「第
1表」の優先順位は規則1−1により、「第2表」は規
則1−1あるいは2−2、2−5などによって決定され
る。このように決定され、参照構造に囲まれた優先順位
をもとに、割り付け位置生成部31では、優先順位第1
位の文の近くに図表を割り付ける。
【0021】なお、この例では、優先順位をすべて決定
したのち、最適と思われる位置に割り付けたが、割り付
け時に、優先順位を決定することも可能である。その場
合は具体的な座標値を持った割り付け位置の候補を各参
照箇所ごとに複数生成し、割り付けの実際の状態を比較
して優先順位を決定することも可能になる。また、どち
らの場合も、ユーザの判断を入力するために、優先順位
に従って自動的に割り付けたのちに、ユーザに確認をと
るようなインタフェースをもつことも可能である。この
場合、たとえば図10に示すようなメニューやコマンド
などにより、ユーザが「他の参照位置へ」を選択した場
合、優先順位第2位の参照箇所へ図表を再割り付けす
る。また、「次の参照位置へ」といった名称のメニュー
項目により、優先順位とは無関係に文章の流れに沿った
次の参照箇所に図表を割り付け直す。 また、「参照一
覧」のようなメニュー項目を選択することにより、たと
えば、図11に示すような、参照構造の一覧をみてユー
ザが優先順位の変更を行う画面を用意することもでき
る。たとえば、ユーサはマウスなどで任意の参照関係を
表す線を選択し、線の太さを変更する指示を出すことに
より、参照関係の優先順位などを簡単に変更することが
できる。図11の例では、図表は縮小イメージアイコン
で表しているが、図表見出しなどの文字列で表してもよ
い。
【0022】また、優先順位決定部32で、「技術文書
の場合は目次部には図表を割り付けない」などの割り付
け可否判定規則を記述することにより、割り付けの可否
を判定すれば、優先順位が1位でも図表を割り付けない
等の機能を実現することができる。
【0023】また、同一図表の参照箇所間の関係が抽出
されているので、図2の例のように目次部に図表説明が
ある文書の場合に、図表の実際に割り付けられたページ
番号を、目次の図表説明文に追加することも可能であ
る。
【0024】
【発明の効果】以上詳細に説明したように、本発明によ
れば、複数の参照箇所から参照されるデータの配置を決
定する際、自動的に最適な参照箇所の近くに割り付ける
ことが可能になる。これにより、文書の表示、整形、編
集の際のめんどうな割り付け作業を軽減することができ
る。複雑な参照構造を持つ文書ほど、参照構造にあった
割り付けの生成および管理が困難になるため、本発明の
効果は大きくなるものである。
【図面の簡単な説明】
【図1】 本発明の一実施例のブロック図。
【図2】 入力文書データの一例を示す図。
【図3】 論理構造抽出部で抽出される論理構造の一例
を示す図。
【図4】 参照構造抽出部で使われる参照語句辞書と参
照記述抽出規則の一例を示す図。
【図5】 参照構造抽出部で抽出される参照構造の一例
を示す図。
【図6】 整形部で使われる書式データの一例を示す
図。
【図7】 複数の文から同じ図表を参照するケースの検
出アルゴリズムを示す図。
【図8】 優先順位決定部で使われる優先順位決定テー
ブルを示す図。
【図9】 優先順位決定部で使われる優先順位決定規則
の一例を示す図。
【図10】 ユーザの指示を入力するメニューの一例を
示す図。
【図11】 参照構造変更のための画面の一例を示す
図。
【符号の説明】
10…入力部 20…文書構造抽出部 30…整形部
40…出力部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文書の構成要素となる複数の文書要素デ
    ータを入力する入力手段と、この入力手段から入力され
    た各文書要素データ間の論理構造と参照構造を抽出する
    文書構造抽出手段と、この文書構造抽出手段によって抽
    出された論理構造及び参照構造に基づいて前記文書要素
    データを所定領域に割り付け整形する文書整形手段と、
    この文書整形手段で整形された文書を出力する文書出力
    手段を具備する文書整形装置であって、前記文書整形手
    段は、参照される要素データを参照する要素データの近
    傍に割り付け得るか否かを参照する要素データ間の論理
    構造をもとに判定することを特徴とする文書整形装置。
  2. 【請求項2】 文書整形手段は、同一要素データを参照
    する要素データが複数存在する場合、参照する要素デー
    タ間の論理構造をもとに参照される要素データの割り付
    け位置の優先順位を決定する割り付け位置優先順位決定
    手段を有することを特徴とする請求項1記載の文書整形
    装置。
  3. 【請求項3】 割り付け位置優先順位決定手段は、参照
    するデータの記述の比較により、参照される要素データ
    の割り付け位置の優先順位を決定することを特徴とする
    請求項2記載の文書整形装置。
  4. 【請求項4】 文書整形手段は、前記割り付け位置優先
    順位決定手段で決定された優先順位に従って割り付け位
    置を提示する割り付け位置提示手段と、この割り付け位
    置提示手段によって提示された複数の割り付け位置の中
    からユーザが任意のものを選択指示するための指示入力
    手段を有することを特徴とする請求項2記載の文書整形
    装置。
JP25880091A 1991-10-07 1991-10-07 文書整形装置および文書整形装置の処理方法 Expired - Fee Related JP3352709B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25880091A JP3352709B2 (ja) 1991-10-07 1991-10-07 文書整形装置および文書整形装置の処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25880091A JP3352709B2 (ja) 1991-10-07 1991-10-07 文書整形装置および文書整形装置の処理方法

Publications (2)

Publication Number Publication Date
JPH05101039A true JPH05101039A (ja) 1993-04-23
JP3352709B2 JP3352709B2 (ja) 2002-12-03

Family

ID=17325238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25880091A Expired - Fee Related JP3352709B2 (ja) 1991-10-07 1991-10-07 文書整形装置および文書整形装置の処理方法

Country Status (1)

Country Link
JP (1) JP3352709B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7623716B2 (en) 2005-03-23 2009-11-24 Fuji Xerox Co., Ltd. Language translation device, image processing apparatus, image forming apparatus, language translation method and storage medium
JP2015072545A (ja) * 2013-10-02 2015-04-16 富士ゼロックス株式会社 文書データ処理システム、文書データ処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7623716B2 (en) 2005-03-23 2009-11-24 Fuji Xerox Co., Ltd. Language translation device, image processing apparatus, image forming apparatus, language translation method and storage medium
JP2015072545A (ja) * 2013-10-02 2015-04-16 富士ゼロックス株式会社 文書データ処理システム、文書データ処理プログラム

Also Published As

Publication number Publication date
JP3352709B2 (ja) 2002-12-03

Similar Documents

Publication Publication Date Title
US5349368A (en) Machine translation method and apparatus
US6522999B2 (en) Apparatus and method for controlling the display of a translation or dictionary searching process
US7085999B2 (en) Information processing system, proxy server, web page display method, storage medium, and program transmission apparatus
JP2695844B2 (ja) 文書整形装置
JPH0352098B2 (ja)
US5373441A (en) Automatic translating apparatus and a method thereof
JPH077408B2 (ja) 強調特性変更方法及びシステム
JP2009176068A (ja) 文書処理装置、文書処理方法、及びプログラム
EP0480755B1 (en) Document processing method and apparatus
EP0265280B1 (en) Machine translation system and method
JP3352709B2 (ja) 文書整形装置および文書整形装置の処理方法
JP3471854B2 (ja) 文字処理装置及びその方法
JP4013539B2 (ja) ディジタルコンテンツ作成システム、及びディジタルコンテンツ作成プログラム、並びにディジタルコンテンツ作成方法
JP3029822B2 (ja) 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05342265A (ja) マルチメディア管理装置およびそのメディア提示方法
JPH06119327A (ja) 文書処理装置
JPH08202859A (ja) 電子ファイリング装置及びその方法
JP2879940B2 (ja) 楽譜編集システム
JPS61195455A (ja) 文書作成装置
JPS61229161A (ja) 文書作成編集装置
JP2002297574A (ja) ルビ付与システムおよびプログラム
JPH0793326A (ja) マルチメディア処理装置及びマルチメディア処理方法
JPH06301675A (ja) 文書作成支援装置
JPH11232270A (ja) 可変文書作成システム、可変文書出力装置及び可変原稿作成装置
JPH103371A (ja) 頁レイアウト比較装置と頁レイアウト表示装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070920

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080920

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080920

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090920

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees