JPH05151254A - 文書処理方法およびシステム - Google Patents

文書処理方法およびシステム

Info

Publication number
JPH05151254A
JPH05151254A JP3312222A JP31222291A JPH05151254A JP H05151254 A JPH05151254 A JP H05151254A JP 3312222 A JP3312222 A JP 3312222A JP 31222291 A JP31222291 A JP 31222291A JP H05151254 A JPH05151254 A JP H05151254A
Authority
JP
Japan
Prior art keywords
text
chart
sentence
graphic
display area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3312222A
Other languages
English (en)
Inventor
Hiroyuki Kaji
博行 梶
Hiroyuki Nakagawa
浩之 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Microcomputer System Ltd
Hitachi Ltd
Original Assignee
Hitachi Microcomputer System Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Microcomputer System Ltd, Hitachi Ltd filed Critical Hitachi Microcomputer System Ltd
Priority to JP3312222A priority Critical patent/JPH05151254A/ja
Priority to EP92120087A priority patent/EP0544255A2/en
Publication of JPH05151254A publication Critical patent/JPH05151254A/ja
Priority to US08/405,926 priority patent/US5813018A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】図表翻訳の前処理である図表からの原文抽出と
後処理である目標文(訳文)と図形の結合を自動化す
る。 【構成】原図表解析処理プログラム12は、領域認識1
21,原文抽出122,図形条件抽出123の各ステッ
プにより、図形が作る領域と対応づけて原文を抽出する
とともに、図形の位相・形状的性質を抽出する。目標図
表生成処理プログラム14は、目標文局所配置決定14
1,図形決定142,目標テキスト編成143の各ステ
ップにより、翻訳による文の長さの変化に対応して拡大
・縮小した文表示領域を含み、前記抽出された性質を保
持した図形を生成する。 【効果】表,フローチャートなどを含む文書の機械翻訳
コストを大幅に低減する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書処理方法およびシ
ステムに関する。特に、図形の中にテキストが混在した
図表の翻訳,作成,修正に係る方法およびシステムに関
する。
【0002】
【従来の技術】従来の機械翻訳システムの入出力データ
は、文字のみからなるテキストデータである。したがっ
て、図表のように図形データとテキストデータが混在し
た文書の翻訳に機械翻訳システムを利用するためには、
文書データから翻訳対象であるテキストを抽出する前処
理と、テキストの翻訳結果と図形データとを結合する後
処理が必要である。この前処理,後処理は、人間がワー
ドプロセッサを操作しながら行なうことが必要である。
これが、表,フローチャート,ブロック図など、テキス
トを含む図表の翻訳コストを著しく増加させていた。
【0003】これに関して、特開平2−219175 号公報
に、図形に含まれる文字列データを図形から分離抽出
し、分離抽出した文字列データを翻訳し、翻訳結果の文
字列データを図形と結合する機械翻訳装置が開示されて
いる。
【0004】
【発明が解決しようとする課題】しかし、上記従来技術
には、文字列データを翻訳の単位となる文に分割して抽
出する技術は述べられていない。一般に、機械的に分離
した文字列データでは、文として論理的につながる文字
が一続きであるという保証はない。そのままでは、機械
翻訳への入力にはならないのである。また、翻訳結果の
文字列データと図形データとを結合する場合、翻訳によ
る文字列の長さの変化に対応して図形の大きさを、場合
によって形状も、調整することが必要になるが、上記従
来技術には、それについても何ら言及されていない。特
開平2−219175 号の方法によれば、図形中のある領域に
入るべきテキストがその領域からはみ出したり、逆に領
域の内部に余分な空白ができたりする。
【0005】同様の問題は、図表の翻訳ではなく、ワー
ドプロセッサにより図表を作成する場合にも発生する。
テキストの長さや、全体としての形状にぴったり合った
図形データを入力するには、文書の所定の領域の中に配
置すべきテキストの長さを正確に定めて、図形を構成す
る線分の座標を机上で計算した上で入力することが必要
である。これは、非常に時間のかかることである。机上
での前準備をせずに入力しようとすると、一旦入力した
線分データの取消し,再入力が頻繁に発生する。また、
作成済みの図表の中のテキストに修正が発生した場合に
も同様の問題が発生する。テキストの修正に伴う図形デ
ータの修正のため新規作成の場合に匹敵する量のワープ
ロ操作が必要になることも多い。
【0006】上記問題に対応するものとして、罫線で囲
まれるブロック(矩形)を定義し、ブロック単位でテキ
ストを入力したり、修正できるようにしたブロック編集
機能をもつワードプロセッサがある。高機能のもので
は、テキストの文字数がブロックの文字数をオーバーし
たり、逆にブロックに余白が生じた場合、そのブロック
の行や列を追加あるいは削除することができる。しか
し、それはユーザの判断に基づくユーザの編集操作によ
って実行されるものであって、自動的には行なわれな
い。また、行あるいは列の追加や削除は、所望のブロッ
クだけでなく、その左右あるいは上下のブロックにも及
ぶことになる。したがって、表の場合にはよくても、フ
ローチャートなどではユーザの思いどおりの変更ができ
ないという問題がある。
【0007】さらに、進歩しつつある文字認識および図
形認識技術の応用として、手書き図表を読み取って活字
化した印刷図表に変換するシステムが考えられるが、そ
こでは次のような問題が発生する。手書き図表は文字の
大きさや間隔の自由度が大きく、一般に入力図表では文
字の大きさや間隔が不揃いになる。一方、活字化した場
合、文字の大きさや間隔の自由度が低いので、文表示領
域の大きさを手書き図表のままにしておくと、文が入り
切れなかったり、逆に余白が生じたりする。このため、
文の一部が欠落した図表になったり、文と図形のバラン
スの悪い図表になりがちである。
【0008】本発明の目的は、図表の翻訳に必要な前処
理および後処理を自動的に行なう図表翻訳方法およびシ
ステムを提供することにある。
【0009】本発明の他の目的は、図表中に配置するテ
キストの長さをユーザに意識させずに、図形データを入
力できる図表作成方法およびシステムを提供することに
ある。すなわち、テキストの長さに応じて図形を調整
し、その中にテキストを自動的に配置する図表作成方法
およびシステムを提供することにある。
【0010】本発明のさらに他の目的は、図表中のテキ
ストがユーザによって修正されると、その修正に対応し
て図形を自動的に調整できる図表作成方法およびシステ
ムを提供することにある。
【0011】本発明のさらに他の目的は、手書き図表を
読み取り、それを活字化した印刷図表に変換する図表作
成システムおよびその方法において、活字化に伴って必
要になる図形の調整を自動的に行なうようにすることに
ある。
【0012】技術課題を、図表翻訳システムの場合に即
して、より具体的に述べると、次の2点に要約できる。
【0013】第1の課題は、図表のテキストデータから
文、場合によって名詞句としてのまとまりを認識する機
能の実現である。図表に含まれるテキストデータでは、
文として論理的につながる文字が一続きであるという保
証はない。他の文を構成する文字や図表中の文字の配置
を制御するコードが一続きの文の間に入っていることが
ある。また、一連の文が図表中のある図形の中に複数行
に渡っている場合も有る。これらのような場合にも、文
としての論理的なまとまりを認識することが必要であ
る。
【0014】第2の課題は、図形の作る領域内に文を配
置するため、図形の位相や形状的性質を保持したまま、
図形を調整する機能の実現である。翻訳文は原文とは長
さが異なるのが普通である。したがって、翻訳文を図表
中に配置するため、図形の作る各領域をそれぞれに適当
な倍率でスケーリング(拡大または縮小)しなければな
らない。その際、図形の位相的性質を変えないことはも
ちろんであるが、視覚的な印象もできるだけ原図表に近
いものにする必要がある。
【0015】図表の作成の場合は、領域に配置する文の
長さを考慮せずに入力された図形の各領域に文を配置す
るのであるから、上記第2の課題を解決することが必須
となる。
【0016】図表中の文の修正の場合は、修正前の文,
修正後の文を翻訳の場合の原文,翻訳文にそれぞれ対応
づけることができる。このように対応付けると、図表翻
訳の場合と同様に上記二つの課題を解決することが必要
である。
【0017】手書き図表を印刷図表に変換する形の図表
作成システムの場合は、手書き文字による文,印刷文字
による文を翻訳の場合の原文,翻訳文にそれぞれ対応づ
けることができ、やはり上記二つの課題を解決すること
が必要である。
【0018】
【課題を解決するための手段】上記目的を達成するた
め、本発明の望ましい実施態様では次のように構成され
る。図形と第1の言語のテキストからなる第1の図表を
図形と第2の言語のテキストからなる第2の図表に翻訳
する図表翻訳方法およびシステムにおいて、図形が作る
領域と対応づけて第1の図表のテキストを抽出し、第1
の図表の図形の性質を調べて第2の図表の図形が満たす
べき条件を抽出し、抽出したテキストを第2の言語に翻
訳した結果と抽出した図形が満たすべき条件に基づい
て、第2の図表の図形とその中でのテキストの配置を決
定する。
【0019】本発明の望ましい他の実施態様では次のよ
うに構成される。図形とテキストからなる図表を修正す
る図表修正方法およびシステムにおいて、図形が作る領
域と対応づけて図表のテキストを抽出し、図形が保持す
べき条件を抽出し、図表のテキストの修正に対応して、
その結果と抽出した図形が保持すべき条件に基づいて、
図形を修正されたテキストに整合させ、その図形とその
中でのテキストの配置を決定する。
【0020】本発明の望ましいさらに他の実施態様では
次のように構成される。図形とテキストからなる図表を
作成する図表作成方法およびシステムにおいて、図形デ
ータは位相・形状的性質を入力し、テキストデータを図
形が作る領域に対応させて入力し、領域と対応づけて入
力されたテキストと図形が保持すべき条件に基づいて、
図形が作る領域を認識するとともに、図形が保持すべき
条件を抽出し、テキストに整合する図形とその中でのテ
キストの配置を決定する。
【0021】本発明の望ましいさらに他の実施態様では
次のように構成される。手書き図表を印刷図表に変換す
る形の図表作成方法およびシステムにおいては、手書き
図表を2値画像データとして読み取り、2値画像データ
から図形と文字とを認識し、認識した図形からそれが作
る領域を認識し、認識した領域を参照して、認識した文
字の連なりから文を抽出し、認識した図形から該図形の
位相および形状的性質を抽出し、抽出した文の表示領域
の大きさと表示領域内の文の配置を決定し、抽出した図
形の位相および形状的性質と表示領域の大きさとに基づ
いて、図形を構成する線分及び文の表示領域の位置を決
定し、文の表示領域の位置と文の表示領域内の文の配置
に基づいて、図表の文字の配置を決定する。
【0022】
【作用】上記本発明の望ましい実施態様によれば、テキ
スト入り図表を翻訳する際、翻訳に伴ってテキストの長
さが変わるのに応じて図形の修正が必要になるが、それ
を自動的に行なうシステムを実現することができる。修
正された図形は、もとの図形の位相的性質や視覚特性
(見やすさ,コンパクトさ)も保存したものである。こ
のシステムを利用することによって、マニュアルなど、
図表を多く含む文書の翻訳コストを大幅に低減すること
ができる。
【0023】また、テキスト入り図表の作成システムの
実施態様によれば、図形の中に配置するテキストの文字
数を意識せずに図形データを入力することができ、テキ
スト配置のために必要な図形のスケーリング(拡大・縮
小)を自動的に行なう機能が実現できる。さらに、図表
中のテキスト部分を修正すると、それに伴って必要にな
る図形の修正を自動的に行なう機能も実現できる。この
ような図表作成システムにより、図表の作成・修正の能
率が大きく向上する。
【0024】さらに、手書き図表を読み取り、活字と整
形された図形による印刷図表に変換する手書き入力図表
作成システムの実施態様によれば、手書き文字の大きさ
や間隔が不揃いであってもよい。活字化に伴って手書き
図表とは違う大きさのテキスト表示領域が必要になる場
合には、図形を自動的に調整し、バランスのとれた図表
を出力する。従って、手書き入力の特徴を生かした使い
勝手のよい図表作成システムを実現することができる。
【0025】なお上記実施態様では、図表から抽出した
文の翻訳に機械翻訳を利用するものとしたが、原文を人
間が修正するいわゆる前編集のステップを設けてもよ
い。また、機械翻訳の結果を人間が修正するいわゆる後
編集のステップを設けてもよい。さらに、機械翻訳を人
間による翻訳に置き換えてもよい。すなわち、人間が翻
訳して訳文をキーボードなどから入力する方法でもよ
い。
【0026】以上のようにしてテキストと図形のバラン
スがとれた図表が生成される。
【0027】
【実施例】
〈実施例1〉第1の実施例である図表翻訳システムを以
下に説明する。
【0028】図表翻訳システムは、図1に示すように中
央処理装置1,主記憶装置2,外部記憶装置3,入力装
置4および出力装置5から構成される。中央処理装置1
は、原図表解析処理プログラム12,目標図表生成処理
プログラム14を実行する外,図表入力プログラム1
1,テキスト翻訳プログラム13,図表出力プログラム
15を実行する。主記憶装置2は、これらのプログラム
の記憶エリアと作業エリア,プログラム間のインターフ
ェース情報の格納エリアとして用いられる。外部記憶装
置3には原図表データ31及び目標図表データ32が格
納される。入力装置4は原図表の入力のために用いられ
る。出力装置5は目標図表の出力のために用いられる。
【0029】図表翻訳システムで図表を翻訳する際のプ
ログラムステップを図2に示す。まず、図表入力プログ
ラム11を実行し、原図表を入力装置1から入力する。
図表入力プログラム11はいわゆるワードプロセッサの
入力機能である。原図表データは図形データとテキスト
データとからなり、外部記憶装置3に格納される。次
に、原図表解析処理プログラム12を実行する。原図表
解析処理プログラム12は、領域認識ステップ121,
原文抽出ステップ122,図形条件抽出ステップ123
の三つのステップからなる。原図表解析処理プログラム
12は外部記憶装置3上の原図表データ31を処理し、
原文データと図形条件データを主記憶装置2に出力す
る。原文データはテキスト翻訳プログラム13へのイン
タフェース情報であり、図形条件データは目標図表生成
処理プログラム14へのインタフェース情報である。次
に、テキスト翻訳プログラム13を実行し、原文データ
を翻訳する。その結果、主記憶装置2に目標文データが
出力される。次に、目標図表生成処理プログラム14を
実行する。目標図表生成処理プログラム14は、目標文
局所配置決定ステップ141,図形決定ステップ14
2,目標テキスト編成ステップ143の三つのステップ
からなる。目標図表生成処理プログラム14は、目標文
データと図形条件データから図形データとテキストデー
タとを作成し、目標図表データ32として外部記憶装置
3に出力する。最後に、図表出力プログラム15を実行
し、外部記憶装置3から目標図表データ32を読み出し
て、出力装置5に出力する。図表出力プログラム15は
いわゆるワードプロセッサの出力・印刷機能である。な
お、外部記憶装置3の媒体を着脱することにより、他の
装置で作成した図表を翻訳したり、翻訳した図表を他の
装置に出力することも可能である。その場合、図表入力
プログラム11及び/又は図表出力プログラム15は不
要である。
【0030】図表入力プログラム11,図表出力プログ
ラム15は周知のワードプロセッサ技術で、またテキス
ト翻訳プログラム13は周知の機械翻訳技術で実現され
る。以下、本実施例で実現される原図表解析処理プログ
ラム12,目標図表生成処理プログラム14について詳
細に説明する。
【0031】まず、原図表解析処理プログラム12の入
力となる原図表データ31のデータ形式と、目標図表生
成処理プログラム14の出力となる目標図表データ32
のデータ形式とを説明する。
【0032】図3は原図表データ31の例である。原図
表データ31は図形データとテキストデータからなる。
本実施例では、図形は線分からなるものとし、図形デー
タは始点,終点の座標が指定された線分の集合として表
現される。図3(a)が図形データの例である。座標系
は、2次元平面の左上を原点とし、水平方向にx軸を,
垂直方向にy軸をとる。ここで、y軸方向は、行間隔が
長さ2であるとする。これは、行間に線を引くことがで
きるとしているためである。一方、x軸方向について
は、文字間隔が長さ1であるとする。つまり、垂直方向
の線は1文字分を占有するものとしている。また、原図
表データ31のテキストデータは文字コード及びタブ,
改行復帰などの制御コードの1次元の列である。図3
(b)がテキストデータの例である。この例に示すよう
に、本実施例では、原図表のテキストは日本語である。
テキストデータ中の「→」はタブを、「↓」は改行復帰
を意味する制御コードである。テキストデータは、タブ
設定位置を示す行形式データと図表中に実際に配置すべ
きテキストを表す実テキストデータからなる。図3(a)
の図形データと図3(b)のテキストデータが表す原図
表の表示イメージを図3(c)に示す。
【0033】目標図表データ32のデータ形式は、図4
に例示するように原図表データ31のそれと同様であ
る。図4(a),図4(b)は目標図表データ32の図
形データ,テキストデータの例である。なお、このテキ
ストデータの例は行形式データを含んでいない。図4
(a)の図形データと図4(b)のテキストデータが表
す目標図表の表示イメージを図4(c)に示す。
【0034】次に、原図表解析処理プログラム12と目
標図表生成処理プログラム14の処理の概要を説明す
る。原図表解析処理プログラム12の処理ステップ間の
データの流れは図5に示すとおりである。領域認識ステ
ップ121は、原図表データ31の図形データ311を読
み込み、領域配列と呼ぶ2次元配列上に線分を展開す
る。続いて、領域配列の要素に対して領域ラベルづけの
処理を行なう。すなわち、線分で囲まれた領域の各々に
ついてそれを構成する要素に同一ラベルを付与する。こ
の結果を領域配列データ21として出力する。原文抽出
ステップ122は、原図表データ31の原テキストデー
タ312を読み込み、テキスト配列と呼ぶ2次元配列上
に文字を配置する。このテキスト配列データと領域配列
データ21とを対応づけながら、各領域に配置された文
字をつなぐことにより、翻訳単位となる原文データ22
を編成する。また、原文表示領域データ23、すなわち
各原文が占有する長方形領域の大きさと位置を表すデー
タを作り出す。図形条件抽出ステップ123は、図形を
構成する線分の始点,終点及び原文表示領域の座標を変
数で表現した上で、目標図表でも保存されるべき図形の
性質を変数の間の関係式として表現する。これが図形条
件データ24である。図形の性質としては、ある線分と
ある線分が接続していること、ある線分が水平/垂直で
あること、特定の四つの線分が菱形を作ること、ある領
域にある文表示領域が含まれていることなどである。こ
れらの性質は座標変数の間の関係式として表現できるの
で、原図表データ311と原文抽出ステップで得た原文
表示領域データ23が示す原図表における座標値を代入
してみることによって、原図表がその性質を持っている
かどうかチェックできる。原図表について関係式が成立
すれば、当該関係式を図形条件データ24として出力す
る。
【0035】目標図表生成処理プログラム14の処理ス
テップ間のデータの流れは図6に示すとおりである。目
標文局所配置決定ステップ141は、原文データ22を
テキスト翻訳プログラム13が翻訳して出力した目標文
データ25を読み込み、原文表示領域データ23を参考
にして目標図表中での目標文表示領域の大きさ(x方
向,y方向の長さ)を決定し、目標文表示領域データ2
6として出力する。併せて、目標文を構成する文字の目
標文表示領域内での配置を決定し、目標文局所配置デー
タ27として出力する。図形決定ステップ142は、図
形条件データ24の関係式に、文表示領域に関する座標
変数と目標文表示領域データ26との関係式を追加し、
これらの関係式を満たす座標値を求める。座標値のうち
線分の始点,終点の座標が目標図表データ32の図形デ
ータ321になる。残りは目標文表示領域座標データ2
8になる。目標テキスト編成ステップ143は、目標文
表示領域座標データ28と目標文局所配置データ27に
基づいて、図表全体を表す2次元配列に各目標文の文字
を配置し、全体を1次元のテキストデータとして表現す
る。これを目標図表データ32の文字データ322とし
て出力する。
【0036】以下、各ステップの詳細な処理フローを説
明する。
【0037】(1)領域認識ステップ121 図表中の線分で囲まれた領域を認識する処理のために2
次元の配列を用意する。これを領域配列と呼ぶ。領域認
識ステップ121の処理は、図形データ311が表す線
分を領域配列上に展開する線分展開処理と、線分に囲ま
れた領域ごとにそれを構成する配列要素にラベルをつけ
る領域ラベルづけ処理からなる。
【0038】線分展開処理の概要は次のとおりである。
まず、領域配列の全要素を空白にする。そのあと、図形
データ311の線分を線分番号「1」のものから順に読
みだし、線分の始点,終点の座標から当該線分が占める
領域配列の要素を決定し、当該要素に線分番号を書き込
む。複数の線分が接続する点に対応する配列要素には
「0」を書き込む。
【0039】線分展開処理の詳細を図7のフローチャー
トに沿って説明する。まず、領域配列Aの全要素A
(x,y)(1≦x≦XM,1≦y≦YM)を空白にす
る(12101)。処理する線分を指す線分番号iに初
期値1をセットする(12102)。次に、図形データ
311から第i線分の座標を読みだす。図形データ31
1に第i線分がなければ(12103)、12121の
終了処理に進む。第i線分があれば、始点,終点の座標
をそれぞれ(a,b),(a′,b′)にセットする(12
104)。
【0040】(a,b),(a′,b′)に始点,終点
の座標をセットした線分について、x軸への射影とy軸
への射影の大小を比較する(12105)。x軸への射
影のほうが大きい場合は、x座標を1ずつずらして線分
上の点のy座標を求め、領域配列A上にプロットする。
そのため、まず線分の始点,終点のx座標の小さい方の
値をxに、大きい方の値をxeにそれぞれセットする
(12106)。次に、線分上でx座標の値がxである
点のy座標の値を計算する(12107)。ここで、y
座標の値を整数にするため四捨五入するものとする。こ
のようにして得られた座標(x,y)に対応する領域配
列Aの要素の値が空白かどうか調べる(12108)。
空白であれば、第i線分の要素であることを示すため、
当該要素の値としてiをセットする(12109)。空
白でなければ、複数の線分が接続する点であることを示
すため、当該要素の値を0にする(12110)。その
あと、xとxeを比較することによって、線分の端点ま
で処理が済んだかどうかを調べる(12111)。端点
まで処理が済んでいなければ、xに1を加えて(121
12)、12107に戻る。端点まで処理が済んでいれ
ば、iに1を加えて(12120)、12103に戻
る。
【0041】12105におけるx軸への射影とy軸へ
の射影の大小比較で、y軸への射影のほうが大きい場合
は、y座標を1ずつずらして線分上の点のx座標を求
め、領域配列A上にプロットする。そのため、まず線分
の始点,終点のy座標の小さい方の値をyに、大きい方
の値をyeにそれぞれセットする(12113)。次
に、線分上でy座標の値がyである点のx座標の値を計
算する(12114)。ここで、x座標の値を整数にす
るため四捨五入するものとする。このようにして得られ
た座標(x,y)に対応する領域配列Aの要素の値が空
白かどうか調べる(12115)。空白であれば、第i
線分の要素であることを示すため、当該要素の値として
iをセットする(12116)。空白でなければ、複数
の線分が接続する点であることを示すため、当該要素の
値を0にする(12117)。そのあと、yとyeを比
較することによって、線分の端点まで処理が済んだかど
うかを調べる(12118)。端点まで処理が済んでい
なければ、yに1を加えて(12119)、12114
に戻る。端点まで処理が済んでいれば、iに1を加えて
(12120)、12103に戻る。
【0042】12103で読み込むべき第i線分がなけ
れば、その時点でのiの値をISにセットして(121
21)終了する。ISの値は、線分番号の最大値に1を
加えたものであり、後続の領域ラベルづけ処理において
領域番号の最小値として用いられる。
【0043】図3(a)の図形データに対して線分展開
処理を行って得られる領域配列を図9(a)に示す。図
中、1から9の値をもつ要素が、線分番号1から9の線
分にそれぞれ対応している。また、値が0の要素は複数
の線分が接続する点である。線分展開処理に続いて実行
される領域ラベルづけ処理の概要は次のとおりである。
まず、値が空白である領域配列要素を一つ選び、それに
一つの領域番号をラベルとして与える。次に、そのラベ
ルが付けられた要素に隣接し、かつ値が空白である要素
があれば、当該要素にも同じ領域番号をラベルとして与
える処理をできなくなるまで繰り返す。そのあと、空白
要素が残っていれば、一つの空白要素を選んで新しい領
域番号を与え、同様の処理を行う。これを空白要素がな
くなるまで繰り返す。
【0044】領域ラベルづけ処理の詳細を図8のフロー
チャートに沿って説明する。領域番号iへの初期値IS
のセット(12151)に続く12152から1215
6は、配列要素で値が空白のものを探して、第i領域の
初期要素とする処理である。まず、配列要素を指すイン
デクス変数(x,y)に初期値(1,1)をセットする
(12152)。次に、配列要素A(x,y)が空白で
あるかどうか調べる(12153)。空白であれば、当
該要素に領域番号iをセットして(12154)、12
157に進む。空白でなければ、(x,y)を右隣の要
素を指すように更新して(12155)、12153に
戻る。ただし、xの値が領域配列の右端に達している場
合は、(x,y)を次の行の左端の要素を指すように更
新して(12156)、12153に戻る。また、(x,
y)が領域配列の右下隅の要素を指している場合は、領
域配列に空白要素がなくなっていることを意味するの
で、その時点でのiの値から1を減じた値をIEにセッ
トして(12170)終了する。IEは領域番号の最大値を表
すことになる。
【0045】12157から12169は、領域番号i
でラベルづけされた要素と隣接する空白要素に次々と領
域番号iのラベルをつける処理である。まず、配列を左
上隅から右下隅までスキャンする間に新たにラベルづけ
される要素の有無を示すフラグFをオフにする(121
57)。配列要素を指すインデクス変数(x,y)に初
期値(1,1)をセットする(12158)。このあ
と、配列要素A(x,y)が空白かどうか調べる(121
59)。空白であれば、さらにA(x,y)の左,上,
右、または下にラベルiを付された要素があるかどうか
調べる(12160から12163)。ラベルiを付さ
れた要素が隣接している場合のみ、A(x,y)に領域番
号iを書き込み(12164)、フラグFをオンにする
(12165)。次に、(x,y)を右隣の要素を指すよ
うに更新して(12166)、12159に戻る。ただ
し、xの値が領域配列の右端に達している場合は、
(x,y)を次の行の左端の要素を指すように更新して
(12167)、12159へ戻る。また、(x,y)
が領域配列の右下隅の要素を指している場合は、フラグ
Fがオンかどうか調べる(12168)。フラグFがオ
ンであれば、12157に戻り、領域番号iのラベルを
つける処理をさらに1サイクル繰り返す。フラグFがオ
フであれば、領域番号iに1を加え(12169)、1
2152に戻って次の領域の認識を試みる。
【0046】図9(a)の領域配列に対して領域ラベル
づけ処理を実行した結果を、図9(b)に示す。図中、
領域番号10,11及び12の三つの領域が認識されて
いる。
【0047】(2)原文抽出ステップ122 領域認識ステップ121で認識した各領域内の文を抽出
するため、領域配列と同じ大きさの2次元配列を用意す
る。これをテキスト配列と呼ぶ。原文抽出ステップ12
2の処理は、原テキストデータ312をテキスト配列上
に配置するテキスト配置処理と、テキスト配列と領域配
列を対応づけることによって、原文データ22を編成し
原文表示領域データ23を生成する原文データ編成処理
とからなる。
【0048】テキスト配置処理の概要は次のとおりであ
る。まず、原テキストデータ312の行形式データを実
テキストの処理に利用しやすい内部形式に変換する。そ
のあと、原テキストデータ312の実テキストデータを
構成する文字をテキスト配列に書き込む。各文字の座標
は、実テキストデータの文字・制御コードの並びと前記
内部形式に変換された行形式データとから決定する。な
お、文字が存在しない位置のテキスト配列要素は空白に
する。
【0049】テキスト配置処理の詳細を図10のフロー
チャートに沿って説明する。ここで、1次元配列L
(x)(1≦x≦XM)は行形式データを格納する配列
でる。また、1次元配列T(i)(1≦i≦N)は実テ
キストデータを読み込む配列である。さらに、2次元配
列B(x,y)(1≦x≦XM,1≦y≦YM)はテキ
スト配列である。
【0050】図10のフローチャートの12201から
12207は行形式データを内部形式に変換する処理で
ある。まず、原テキストデータ312の行形式データを
L(x)(1≦x≦XM)に読み込む(12201)。配
列Lの要素を指すインデクスxに初期値XMをセット
し、またタブによるシフト位置を示す変数x2に0をセ
ットする(12202)。このあと、L(x)がタブで
あるかどうか調べる(12203)。L(x)がタブであ
ればx2にxの値をセットする(12204)。次に、L
(x)にxとx2の最大値を書き込む(12205)。
12203から12205の処理は、xが1になるまで
(12206)xを1ずつ減じて(12207)繰り返
す。以上の処理の結果、L(x)の値は、第x列におい
てタブが出現した場合にシフトすべき列を示している。
【0051】図3(b)の原テキストデータ312の行
形式データを上記処理によって内部形式に変換した結果
を図12(a)に示す。
【0052】図10のフローチャートの12209から
12218は実テキストデータを構成する文字をテキス
ト配列に配置する処理である。まず、テキスト配列B
(x,y)の全要素を空白にする(12208)。原テ
キストデータ312の実テキストデータをT(i)(1
≦i≦N)に読み込む(12209)。ここで、T
(i)には第1要素から順にデータがセットされ、実テ
キストデータの長さを越える部分については、データが
ないことを示す特別のコードがセットされるとする。配
列Tのインデクスiに初期値0を、配列Bのインデクス
(x,y)に初期値(1,2)をセットする(1221
0)。このあと、iに1を加えながら(12211)、T
(i)にデータがある限り(12212)、12213
から12218の処理を繰り返す。12213ではT
(i)の値を調べる。T(i)が改行復帰記号であれ
ば、(x,y)を次の行の左端を指すように更新する
(12214)。
【0053】T(i)がタブであれば、xにL(x)の値
をセットする(12215)。T(i)が改行復帰あるい
はタブ以外の場合は、T(i)をB(x,y)に書き込
み(12216)、(x,y)を右隣の要素を指すよう
に更新する(12218)。ただし、xの値がテキスト
配列の右端を指している場合は(12217)、(x,
y)を次の行の左端を指すように更新する(1221
4)。
【0054】図3(b)のテキストデータ312の実テ
キストデータを上記処理によってテキスト配列に配置し
た結果を図12(b)に示す。
【0055】原文データ編成処理の概要は次のとおりで
ある。領域配列とテキスト配列を上の行から下の行に、
また各行内は左から右にスキャンして、一つの領域に属
する文字を次々と取り出す。文字を取り出した順につな
ぐことによって、原文データ22を得る。また、取り出
した文字のうちで最も左に位置していた文字のx座標x
s,最も右に位置していた文字のx座標xe,最も上に
位置していた文字のy座標ys、最も下に位置していた
文字のy座標yeを求めて、(xs−1,ys−1)と
(xe+1,ye+1)を原文表示領域データ23とす
る。
【0056】原文データ編成処理の詳細を図11のフロ
ーチャートに沿って説明する。ここで、A(x,y)が
領域配列、B(x,y)がテキスト配列である(1≦x≦
XM,1≦y≦YM)。ISとIEは領域認識ステップ
121で認識された領域の領域番号の最小値と最大値で
ある。また、1次元配列S(n)は編成途中の原文デー
タを格納する配列である。まず、文番号iに初期値IS
をセットする(12251)。次に、原文データ配列Sのイン
デクスnに初期値0をセットし、また原文データのx方
向下限座標xs,x方向上限座標xe,y方向下限座標
ys,y方向上限座標yeに、それぞれ初期値XM,
1,YM,1をセットする(12252)。領域配列及
びテキスト配列のインデクス(x,y)に初期値(1,
2)をセットする(12253)。
【0057】次に、領域配列Aとテキスト配列Bの
(x,y)要素の値を調べる(12254)。領域配列要素
A(x,y)がiであり、かつテキスト配列要素B
(x,y)が空白以外の文字であれば、当該文字が第i
原文を構成する文字である。そこで、nに1を加えたあ
と(12255)当該文字を原文データ配列の第n要素
S(n)に書き込む(12256)。さらに、当該文字が
xsが示す列より左に位置していたのであれば(122
57)、当該文字のx座標の値でxsを更新する(1225
8)。同様に、当該文字がxeが示す列より右に位置して
いたのであれば(12259)、当該文字のx座標の値でxe
を更新する(12260)。当該文字がysが示す行よ
り上に位置していたのであれば(12261)、当該文
字のy座標の値でysを更新する(12262)。当該
文字がyeが示す行より下に位置していたのであれば
(12263)、当該文字のy座標の値でyeを更新する
(12264)。
【0058】次に、(x,y)を領域配列及びテキスト
配列上で右隣の要素を指すように更新し(1226
5)、12254に戻る。ただし、xが領域配列及びテ
キスト配列の右端に達している場合は、(x,y)を次
の行の左端要素を指すように更新して(12266)、
12254に戻る。さらに、(x,y)が最終行の右端
を指している場合は12267に進む。12267で
は、nの値によって第i原文があったかどうかを判定す
る。nが0でなければ、S(1),…,S(n)を第i原
文データとして出力し(12268)、(xs−1,ys
−1)と(xe+1,ye+1)を第i原文表示領域デ
ータとして出力する(12269)。そのあと、i<I
Eであれば(12270)、iに1を加えて(1227
1)、12252に戻る。i=IEであれば(1227
0)終了する。
【0059】図9(b)の領域配列と図12(b)のテ
キスト配列から上記処理によって得られる原文データと
原文表示領域データをそれぞれ図12(c),図12
(d)に示す。なお、図12(d)の原文表示領域デー
タ中の「座標配列へのインデクス」フィールドは、この
段階では値がセットされず、次の図形条件抽出ステップ
123の中で値がセットされる。
【0060】(3)図形条件抽出ステップ123 図形条件抽出ステップは、目標図表の図形でも保存され
るべき性質を原図表データから抽出し、それを座標変数
に関する条件式として表現する。処理は、前処理である
座標配列設定処理のあと、線分接続関係に関する条件式
生成処理,線分の傾き及び長さの下限に関する条件式生
成処理,線分の配置順序に関する条件式生成処理,線分
の分岐に関する条件式生成処理,要素図形の形に関する
条件式生成処理の順に進む。
【0061】座標配列設定処理は、原図表の図形データ
311と原文抽出ステップ122で得られた原文表示領
域データ23を読み込み、図形を構成する線分の始点,
終点及び原文表示領域の長方形の頂点の座標を配列にセ
ットする。x座標を格納するためx座標配列C(j)
が、y座標を格納するためy座標配列D(j)が用意さ
れている。以下、処理の詳細を図13のフローチャート
に沿って説明する。
【0062】まず、線分番号iに初期値1を、座標配列
のインデクスjに初期値1をセットする(1230
1)。次に、図形データ311から第i線分の始点,終
点の座標を読み込み、座標配列にセットする。ここで、
以降の処理を簡単にするため、始点と終点のうちx座標
が小さいものを先にセットする。すなわち、始点のx座
標が終点のx座標以下であるなら(12302)、始点
のx座標をC(j)に、始点のy座標をD(j)に、終
点のx座標をC(j+1)に、終点のy座標をD(j+
1)に書き込む(12303)。始点のx座標が終点の
x座標より大きいなら(12302)、終点のx座標を
C(j)に、終点のy座標をD(j)に、始点のx座標
をC(j+1)に、始点のy座標をD(j+1)に書き
込む(12304)。このあと、iに1を加え、jに2
を加える(12305)。iが文番号の最小値ISより
小さければ(12306)、12302に戻って図形デ
ータ311の次の線分の座標を設定する。iが文番号の
最小値ISと一致すれば(12306)、12307に
進んで原文表示領域の座標設定を行なう。
【0063】12307では、第i原文表示領域データ
が存在するかどうかチェックする。第i原文表示領域デ
ータが存在すれば、その左上の点の座標,右下の点の座
標をそれぞれ(xs,ys),(xe,ye)にセット
する(12308)。このあと、(xs,ys)を(C
(j),D(j))に、(xe,ys)を(C(j+
1),D(j+1))に、(xe,ys)を(C(j+
2),D(j+2))に、(xe,ye)を(C(j+
3),D(j+3))に、(xs,ye)を(C(j+
4),D(j+4))に、(xe,ye)を(C(j+
5),D(j+5))に、(xs,ys)を(C(j+
6),D(j+6))に、(xs,ye)を(C(j+
7),D(j+7))にそれぞれ書き込む(1230
9)。さらに、第i原文表示領域データ中の「座標配列
へのインデクス」フィールドにjをセットする(123
10)。jに8を加える(12311)。iに1を加え
(12312)、iが文番号の最大値IE以下であれば(12
313)、12307に戻って次の原文表示領域の座標
を設定する。iが文番号の最大値IEを越えれば(1231
3)、jから1を減じた値をJにセットして(1231
4)終了する。Jは座標配列にセットされた座標の総数
を表す。
【0064】図3(a)の図形データと図12(d)の
原文表示領域データから上記処理により設定される座標
配列データを図14に示す。
【0065】座標配列設定処理のあとは種々の条件式生
成処理である。ここで、原図表用にx座標配列C
(j),y座標配列D(j)を設けたのと同様に、目標
図表用にx座標配列X(j),y座標配列Y(j)を用
意する。(X(j),Y(j))と(C(j),D
(j))は、目標図表と原図表の間で対応する点の座標
である。条件式生成処理は、C(j),D(j)(1≦
j≦J)の値を調べることにより、X(j),Y(j)
(1≦j≦J)が満たすべき条件式を生成する。
【0066】線分の接続関係に関する条件式を生成する
処理の概要は次のとおりである。原図表の任意の二つの
点についてその座標が一致するかどうかチェックし、一
致すれば、目標図表の対応する二つの点の座標が一致す
るという条件を生成する。処理の詳細を図15に沿って
説明する。まず、比較する点の一方を指す座標配列イン
デクスjに初期値2をセットする(12316)。次
に、他方の点を指す座標配列インデクスiに初期値1を
セットする(12317)。i<jであれば(1231
8)、(C(j),D(j))と(C(i),D
(i))が一致するかどうかチェックする(1231
9)。一致する場合は、条件式X(j)=X(i),Y
(j)=Y(i)を生成する(12320)。iに1を
加えて(12321)、12318に戻る。iとjが等し
くなれば(12318)、jと座標総数Jを比較する
(12322)。jがJより小さければ(1232
2)、jに1を加えて(12323)、12317に戻
る。jがJと等しければ(12322)終了する。
【0067】図14の座標配列データから上記処理によ
って生成される条件式の一部を図20(a)に例示す
る。
【0068】線分の傾き及び長さの下限に関する条件式
を生成する処理の概要は次のとおりである。原図表の任
意の線分について、水平か,垂直か,右上がりか,右下
がりかチェックする。原図表の線分が水平であれば、目
標図表の対応する線分が水平であるという条件を生成す
る。原図表の線分が垂直であれば、目標図表の対応する
線分が垂直であるという条件を生成する。原図表の線分
が右上がりであれば、目標図表の対応する線分が右上が
りであるという条件を生成する。原図表の線分が右下が
りであれば、目標図表の対応する線分が右下がりである
という条件を生成する。さらに、目標図表の線分のx軸
及びy軸への射影は対応する原図表の線分のx軸及びy
軸への射影にある定数をかけた値以上であるという条件
を生成する。本実施例では、この定数をx軸への射影に
ついて1、またy軸への射影について1/2とする。x
軸とy軸とで異なる値にしたのは、日本語と英語の文字
の幅の違いを考慮したためである。以下、線分の傾き及
び長さの下限に関する条件式生成処理の詳細を図16に
沿って説明する。
【0069】まず、チェックする線分を指す座標配列イ
ンデクスiに初期値1をセットする(12326)。そ
のあと、C(i)とC(i+1)が等しいかどうかチェ
ックする(12327)。C(i)=C(i+1)であ
れば、垂直線分であるための条件式X(i)=X(i+
1)を生成する(12328)。C(i)<C(i+1)
であれば、x軸への射影に関する条件式X(i+1)−
X(i)≧C(i+1)−C(i)を生成する(123
29)。なおC(i)>C(i+1)という場合はな
い。同様に、D(i)とD(i+1)の大小関係を比較
する(12330)。D(i)>D(i+1)であれ
ば、y軸への射影に関する条件式Y(i)−Y(i+
1)≧(D(i)−D(i+1))/2を生成する(1
2331)。
【0070】D(i)=D(i+1)であれば、水平線分
であるための条件式Y(i)=Y(i+1)を生成する
(12332)。D(i)<D(i+1)であれば、y
軸への射影に関する条件式Y(i+1)−Y(i)≧
(D(i+1)−D(i))/2を生成する(1233
3)。このあと、iに2を加え(12334)、iが座
標総数Jを越えなければ(12335)、12327に
戻る。iが座標総数Jを越えれば(12335)終了す
る。
【0071】図14の座標配列データから上記処理によ
って生成される条件式の一部を図20(b)に例示す
る。
【0072】線分の配置順序に関する条件式を生成する
処理は、原図表と目標図表の間で、x軸への射影がオー
バラップする線分のy軸方向の順序、及びy軸への射影
がオーバラップする線分のx軸方向の順序を保存し、ま
た線分が接近しすぎないようにするものである。処理の
詳細を図16に沿って説明する。まず、第1の線分を指
す座標配列インデクスiに初期値1をセットする(12
336)。第2の線分の端点(始点または終点)を指す
座標配列インデクスjに初期値1をセットする(123
37)。j≠iかつj≠i+1であるか、すなわち第1
線分と第2線分が異なるかチェックする(1233
8)。同じ線分であれば、12353に進みjを更新す
る。
【0073】第1線分と第2線分が異なる線分であれ
ば、D(i)=D(i+1)かどうか、すなわち第1線
分が水平かどうかチェックする(12339)。水平で
あれば、C(i)≦C(j)≦C(i+1)であるか、
すなわち第1線分のx軸への射影が第2線分端点のx軸
への射影を含むかチェックする(12340)。C(i)
≦C(j)≦C(i+1)であれば、D(i)とD
(j)の大小を比較して(12341)、D(i)≦D
(j)であれば条件式Y(j)−Y(i)≧(D(j)−D
(i))/2を生成し(12342)、D(i)>D
(j)であれば条件式Y(i)−Y(j)≧(D(i)
−D(j))/2を生成する(12343)。C(i)
≦C(j)≦C(i+1)でなければ(12340)、
12353に進む。
【0074】第1線分が水平でなければ(1233
9)、次にC(i)=C(i+1)かどうか、すなわち
第1線分が垂直かどうかチェックする(12344)。
垂直であれば、min(D(i),D(i+1))≦D
(j)≦max(D(i),D(i+1))であるか、
すなわち第1線分のy軸への射影が第2線分端点のy軸
への射影を含むかチェックする(12345)。min
(D(i),D(i+1))≦D(j)≦max(D
(i),D(i+1))であれば、C(i)とC(j)
の大小を比較して(12346)、C(i)≦C(j)
であれば条件式X(j)−X(i)≧C(j)−C
(i)を生成し(12347)、C(i)>C(j)で
あれば条件式X(i)−X(j)≧C(i)−C(j)
を生成する(12348)。min(D(i),D(i+
1))≦D(j)≦max(D(i),D(i+1))
でなければ(12345)、12353に進む。
【0075】D(i)≠D(i+1)かつC(i)≠C
(i+1)、すなわち第1線分が水平でも垂直でもなけ
れば、C(i)≦C(j)≦C(i+1)であるか、す
なわち第1線分のx軸への射影が第2線分端点のx軸へ
の射影を含むかチェックする(12349)。C(i)
≦C(j)≦C(i+1)でない場合は、min(D
(i),D(i+1))≦D(j)≦max(D
(i),D(i+1))であるか、すなわち第1線分の
y軸への射影が第2線分端点のy軸への射影を含むかチ
ェックする(12350)。C(i)≦C(j)≦C
(i+1)またはmin(D(i),D(i+1))≦
D(j)≦max(D(i),D(i+1))であれば、
(C(i)−C(i+1))(D(j)−D(i))≠
(D(i)−D(i+1))(C(j)−C(i))で
あるか、すなわち第2線分端点が第1線分上にないかチ
ェックする(12351)。第2線分端点が第1線分上
にない場合、第1線分に対する第2線分の相対位置が目
標図表でも保存されるように条件式((C(i)−C
(i+1))(D(j)−D(i))−(D(i)−D
(i+1))(C(j)−C(i))((X(i)−X
(i+1))(Y(j)−Y(i))−(Y(i)−Y
(i+1))(X(j)−X(i)))>0を生成する
(12352)。
【0076】そのあと、jに1を加え(12353)、
jが座標総数J以下であれば(12354)、12338に戻
る。jがJを越えれば、iに2を加える(1235
5)。iが座標総数J以下であれば(12356)、1
2337に戻る。iがJを越えれば(12356)終了
する。
【0077】図14の座標配列データから上記処理によ
って生成される条件式の一部を図20(c)に例示す
る。
【0078】線分の分岐に関する条件式を生成する処理
は、原図表で第1の線分の途中から第2の線分が分岐す
る場合、目標図表でもそのようにし、さらに分岐点によ
る第1線分の分割比を保存させるものである。処理の詳
細を図18に沿って説明する。まず、第1の線分を指す
座標配列インデクスiに初期値1をセットする(1236
1)。第2の線分の端点(始点または終点)を指す座標
配列インデクスjに初期値1をセットする(1236
2)。j≠iかつj≠i+1であるか、すなわち第1線
分と第2線分が異なるかチェックする(12363)。
同じ線分であれば、12374に進みjを更新する。
【0079】第1線分と第2線分が異なる線分であれ
ば、D(i)=D(i+1)かどうか、すなわち第1線
分が水平かどうかチェックする(12364)。水平で
あれば、D(i)=D(j)かつC(i)≦C(j)≦
C(i+1)であるか、すなわち第2線分端点が第1線
分上にあるかチェックする(12365)。第2線分端
点が第1線分上にある場合、そのことを示す条件式Y
(i)=Y(j)を生成し(12366)、さらに分割
比を保存する条件式(C(j)−C(i))(X(i+
1)−X(j))=(C(i+1)−C(j))(X
(j)−X(i))を生成する(12367)。
【0080】第1線分が水平でなければ(1236
4)、C(i)=C(i+1)かどうか、すなわち第1
線分が垂直かどうかチェックする(12368)。垂直
であれば、C(i)=C(j)かつmin(D(i),
D(i+1))≦D(j)≦max(D(i),D(i
+1))であるか、すなわち第2線分端点が第1線分上
にあるかチェックする(12369)。第2線分端点が
第1線分上にある場合、そのことを示す条件式X(i)
=X(j)を生成し(123670)、さらに分割比を
保存する条件式(D(j)−D(i))(Y(i+1)
−Y(j))=(D(i+1)−D(j))(Y(j)
−Y(i))を生成する(12371)。D(i)≠D
(i+1)かつC(i)≠C(i+1)、すなわち第1
線分が水平でも垂直でもなければ、C(i)≦C(j)
≦C(i+1)かつ(C(i+1)−C(j))(D
(j)−D(i))=(D(i+1)−D(j))(C
(j)−C(i))であるか、すなわち第2線分端点が
第1線分上にあるかチェックする(12372)。第2
線分端点が第1線分上にある場合、そのことと分割比保
存の条件式として、X(i)≦X(j)≦X(i+
1),(C(j)−C(i))(X(i+1)−X
(j))=(C(i+1)−C(j))(X(j)−X
(i),(D(j)−D(i))(Y(i+1)−Y
(j))=(D(i+1)−D(j))(Y(j)−Y
(i))を生成する(12373)。そのあと、jに1
を加え(12374)、jが座標総数J以下であれば(1
2375)、12363に戻る。jがJを越えれば、iに2
を加える(12376)。iが座標総数J以下であれば
(12377)、12362に戻る。iがJを越えれば
(12377)終了する。
【0081】図14の座標配列データから上記処理によ
って生成される条件式の一部を図20(d)に例示す
る。
【0082】要素図形の形を保存する条件式の生成の例
として、対角線が垂直・水平方向の菱形に関する条件式
を生成する処理を図19に沿って説明する。まず、第4
の線分を指す座標配列インデクスlに初期値1をセット
する(123101)。第3の線分を指す座標配列イン
デクスkに初期値1をセットする(123102)。第2
の線分を指す座標配列インデクスjに初期値1をセット
する(123103)。第1の線分を指す座標配列インデ
クスiに初期値1をセットする(123104)。次にD
(i)>D(i+1)であるか、すなわち第1の線分が
右上がりの線分であるかチェックする(12310
5)。右上がりでなければ123117に進み線分イン
デクスを更新する。第1線分が右上がりであれば、さら
に(C(i+1),D(i+1))=(C(j),D
(j))であるか、すなわち第1線分の終点と第2線分
の始点が同一点であるかチェックする(12310
6)。同一点でなければ123117に進み線分インデ
クスを更新する。(C(j+1),D(j+1))=
(C(k+1),D(k+1))であるか、すなわち第
2線分の終点と第3線分の始点が同一点であるかチェッ
クする(123107)。同一点でなければ12311
7に進み線分インデクスを更新する。(C(k),D
(k))=(C(l+1),D(l+1))であるか、
すなわち第3線分の終点と第4線分の始点が同一点であ
るかチェックする(123108)。同一点でなければ
123117に進み線分インデクスを更新する。(C
(l),D(l))=(C(i),D(i))であるか、
すなわち第4線分の終点と第1線分の始点が同一点であ
るかチェックする(123109)。同一点でなければ1
23117に進み線分インデクスを更新する。C(j)
=C(k)=(C(i)+C(j+1))/2である
か、すなわち左右対称であるかチェックする(1231
10)。左右対称でなければ123117に進み線分イ
ンデクスを更新する。D(i)=D(j+1)=(D
(j)+D(k))/2であるか、すなわち上下対称で
あるかチェックする(123111)。左右対称でなけ
れば123117に進み線分インデクスを更新する。
【0083】123105から123111がすべて成
立するときは対角線が垂直・水平の菱形であるので、条
件式X(j)=X(k)=(X(i)+X(j+1))
/2及びY(i)=Y(j+1)=(Y(j)+Y
(k))/2を生成する(123112)。さらに、菱形内部中
央の点に対応する領域配列要素A(C(i+1),D
(i))の値をpにセットする(123113)。pは菱
形領域の領域番号である。第p原文表示領域データの有
無をチェックし(123114)、存在すればその座標
配列へのインデクスをqにセットする(12311
5)。そして、条件式X(j+1)−X(i)+1=2
(X(q+1)−X(q)+1)及びY(k)−Y
(j)+1=2(Y(q+3)−Y(q+2)+1)を生
成する(123116)。この条件式は、菱形内部に文が
含まれるときは、菱形の各辺の中点を結ぶ長方形を目標
文表示領域とすることを意味する。
【0084】条件式を生成したあと、iに2を加え(1
23117)、iが線分の始終点座標の総数2(IS−
1)以下であれば(123118)、123105に戻
る。iが2(IS−1)を越えれば(123118)、
jに2を加え(123119)、jが2(IS−1)以下
であれば(123120)、123104に戻る。jが
2(IS−1)を越えれば(123120)、kに2を
加え(123121)、kが2(IS−1)以下であれば
(123122)、123103に戻る。kが2(IS
−1)を越えれば(123122)、lに2を加え(1
23123)、lが2(IS−1)以下であれば(12
3124)、123102に戻る。lが2(IS−1)
を越えれば(123124)終了する。
【0085】上記の菱形に関する条件式生成は、要素図
形の形を保存するための処理の一例である。この他に、
正方形は長方形でなく正方形に保つ条件,表などでの等
間隔の線分のならびを等間隔に保つ条件,同じ形・同じ
大きさの図形要素を同じ形・同じ大きさに保つ条件など
も座標変数間の条件式として記述できるが、ここでは省
略する。
【0086】(4)目標文局所配置決定ステップ141 原文抽出ステップ122で抽出された原文データ22の
各文をテキスト翻訳プログラム13で翻訳することによ
って目標文データ25が得られる。図12(c)の原文デ
ータから得られる目標文データを図22(a)に示す。
【0087】目標文局所配置決定ステップ141は、目
標図表中で各目標文に与える長方形の表示領域のx方
向,y方向の長さを決定するとともに、表示領域内の目
標文の配置を決定する。通常、目標文の文字数は原文の
文字数とは異なり、日本語から英語への翻訳の場合、一
般に文字数は増加する。一方、英語の文字は日本語の文
字より横幅が小さい。従って、目標文表示領域のx方向
の長さ(文字数)は、原文表示領域のx方向の長さより
大きくする。また、文の読みやすさという観点から改行
がむやみに増えるのはよくないので、原則としてy方向
の長さは原文表示領域より大きくせず、x方向の長さを
大きくすることを優先する。x方向の長さの原文表示領
域に対する倍率は予め決めておいたいくつかの値から選
択する。最大の倍率を適用してもy方向の長さが増加す
るときは、やむを得ずy方向の長さも増加させる。
【0088】目標文局所配置決定ステップ141の処理
の詳細を図21のフローチャートに沿って説明する。こ
こで、x方向の長さについて予め設定した原文表示領域
に対する倍率をR(1),…,R(K)(ただしR
(k)<R(k+1))とする。具体的な値を例示する
と、R(1)=1.5,R(2)=2.0,R(3)=2.
5,R(4)=3.0,R(5)=3.5,R(6)=
4.0である。まず、文番号iに初期値1をセットする
(14101)。第i目標文があれば(14202)、
それを読み込み、目標文配列Uに書き込む(1410
3)。目標文の長さがNであったとして、U(1),
…,U(N)に文字が書き込まれる。目標文の末尾U
(N+1)に空白を追加する(14104)。次に、第
i原文表示領域データを読み込み、その左上の点の座
標,右下の点の座標をそれぞれ(xs,ys),(x
e,ye)にセットする(14105)。原文表示領域
のx方向,y方向の長さ(文字数)xe−xs−1,y
e−ys−1を計算し、それぞれp1,q1にセットす
る(14106)。以上で第i目標文の処理の準備が終
わる。第i目標文がなければ(14102)、1413
2に進んでiを更新する。
【0089】第i目標文の処理の準備が終わると、x方
向の倍率Rのインデクスkに初期値1をセットする(1
4107)。目標文表示領域のx方向の長さの最大値p
mにp1×R(k)をセットする(14108)。目標文
配列Uのインデクスnと改行記号付き目標文配列U2の
インデクスn2に初期値1をセットする(14109)。
目標文表示領域のx方向の長さp2に初期値0を、y方
向の長さq2に初期値−1をそれぞれセットする(14
110)。
【0090】14111から14117は、U(n),
…,U(n+pm−1)のできるだけ後方で改行可能な
位置を探す処理である。まず、目標文配列Uの第2のイ
ンデクスnwにmin(n+pm,N+1)を初期値と
してセットする(14111)。U(nw)が空白かどう
かチェックする(14112)。空白であれば、そこで
改行可能であるので14118に進む。空白でなけれ
ば、nwを1減じて(14113)、14112に戻
る。ただし、nwがnより小さくなれば(14114)、現在
の倍率R(k)では1行に収まらない単語があることが
分かるので、x方向の倍率を大きくしてみる。すなわ
ち、kに1を加え(14116)、14108に戻る。ただ
し、既にk=Kになっていれば(14115)、目標文
表示領域のx方向の長さをこれ以上大きくできないの
で、U(n),…,U(n+pm−1)を1行に表示して
改行するため、nwにn+pmをセットし(1411
7)、14118に進む。
【0091】14118から14127は、改行記号付
き目標文配列U2に1行分のデータをセットすると共
に、目標文表示領域のx方向,y方向の長さp2,q2
を更新する処理である。まず、(nw−n)がp2より
大きいかどうかチェックし(14118)、大きけれ
ば、p2を(nw−n)で更新する(14119)。次
に、q2に2を加える(14120)。このあと、目標
文配列Uから改行記号付き目標文配列U2に文字をコピ
ーする。すなわち、U2(n2)にU(n)を書き込み
(14121)、nとn2に1を加え(14122)、
n<nwであれば(14123)、14121に戻る。
n=nwになると(14123)、U(n2)に改行記
号を書き込み(14124)、n2に1を加える(141
25)。次に、U(nw)が空白であれば(14126)
nに1を加える(14127)。
【0092】改行記号付き目標文配列U2に1行分のデ
ータをセットし終えると、n≦Nであるかチェックする
(14128)。n≦Nであれば、14111に戻って
次の改行位置を探す。n>Nであれば、q2をq1と比
較する(14129)。
【0093】14129でq2≦q1、すなわち目標文
表示領域のy方向の長さが原文表示領域のy方向の長さ
以下であれば、p2,q2を第i目標文表示領域データ
として出力し(14130)、改行記号付き目標文U2
(1),…,U2(n2−1)を第i目標文局所配置デ
ータとして出力する(14131)。そのあと、iに1
を加え(14132)、14102に戻って次の目標文
を処理する。ただし、iが文番号の最大値IEより大き
くなれば(14133)終了する。14129でq2>
q1、すなわち目標文表示領域のy方向の長さが原文表
示領域のy方向の長さより大きければ、x方向の倍率を
大きくしてみる。すなわち、k<Kであるかチェックし
た上で(14134)、14116に飛ぶ。k<Kでな
ければ(14134)、x方向の倍率はこれ以上大きく
できないので、14130に進んで第i目標文表示領域
データ,第i目標文局所配置データを出力する。
【0094】図22(a)の目標文データに対し、図1
2(d)の原文表示領域データを参考にして上記処理に
よって決められた目標文表示領域データ26と目標文局
所配置データ27をそれぞれ図22(b),図22
(c)に示す。また、目標文局所配置の表示イメージを
図22(d)に示す。
【0095】(5)図形決定ステップ142 目標図表中における目標文表示領域の頂点は、図形条件
抽出ステップ123において座標変数で表現されてい
る。一方、目標文局所配置決定ステップ141におい
て、各目標文表示領域のx方向,y方向の長さ(の下限
値)が得られている。そこで、これを座標変数間の条件
式で表現する。この条件式を図形条件抽出ステップ12
3で生成された条件式に追加し、条件式を満たす座標変
数の値を決定する。決定された座標のうち、目標文表示
領域の頂点の座標を除いたものが、目標図表の図形デー
タ321になる。
【0096】目標文表示領域に関する条件式生成処理を
図23のフローチャートに沿って説明する。まず、文番
号i及び座標配列X,Yのインデクスjに初期値ISを
セットする(14201)。第i目標文表示領域データ
がなければ(14202)、14206に進みiを更新
する。第i目標文表示領域データがあれば(14202)、そ
れを読み込み、そのx方向長さ,y方向長さをそれぞれ
p,qにセットする(14203)。次に、条件式X
(j+1)−X(j)>p,Y(j+3)−Y(j+
2)>qを生成する(14204)。これは、第i目標
文が4つの点(X(j),Y(j)),(X(j+
2),Y(j+2)),(X(j+4),Y(j+
4)),(X(j+6),Y(j+6))を結ぶ長方形
内に入るという条件である。jに8を加え(1420
5)、iに1を加える(14206)。iが文番号の最
大値IE以下であれば(14207)、14202に戻
る。iがIEより大きければ(14207)終了する。
【0097】図22(b)の目標文表示領域データから
上記処理によって生成される条件式の集合を図24に示
す。
【0098】条件式を満たす座標の値を決定する処理
は、基本的には、一つの点を出発点にして線分のつなが
りをたどり、順次、座標を決めていく方法である。ここ
で、処理の中にでてくる調整変数について説明してお
く。調整変数は不等式の条件式に関して導入する。不等
式の条件式を満たす変数の値は、通常、一意には決まら
ない。しかし、不等式はできるだけ等号に近い値で成立
させるのが、コンパクトな図形につながる。従って、非
負の調整変数を追加して不等式は等式として扱い、変数
値の最終調整段階において調整定数を可能な限り小さい
値に決定する。
【0099】条件式を満たす座標変数の値を決定する処
理を図25〜図28のフローチャートに沿って説明す
る。まず、解集合の初期値を{X(1)=1,Y(1)=
1}とし(14241)、各条件式にX(1)=1,Y
(1)=1を代入する(14242)。そのあと、X
(i)=c(i)(c(i)は定数、または定数と調整
変数からなる式)なる形の条件式が条件式の集合の中に
あるかどうかチェックする(14243)。なければ1
4247に進むが、もしあれば、条件式X(i)=c
(i)を条件式の集合から削除し(14244)、X
(i)=c(i)を各条件式に代入する(1424
5)。さらに、X(i)=c(i)を解集合に追加し
(14246)、14243に戻る。
【0100】14247では、X(i)≧c(i)なる
形の条件式が条件式集合の中に含まれるかどうかチェッ
クする。なければ14250に進む。もしあれば、調整
変数a(i)を導入して、X(i)=c(i)+a
(i)を各条件式に代入する(14248)。さらに、
X(i)=c(i)+a(i)を解集合に追加し(14
249)、14243に戻る。
【0101】14250では、X(i)≦c(i)なる
形の条件式が条件式集合の中に含まれるかどうかチェッ
クする。なければ14253に進む。もしあれば、調整
変数a(i)を導入して、X(i)=c(i)−a
(i)を各条件式に代入する(14251)。さらに、
X(i)=c(i)−a(i)を解集合に追加し(14
252)、14243に戻る。
【0102】14253では、X(i)>c(i)なる
形の条件式が条件式集合の中に含まれるかどうかチェッ
クする。なければ14257に進む。もしあれば、調整
変数a(i)を導入して、条件式X(i)>c(i)を
a(i)≧0に置き換える(14254)。さらに、X
(i)=c(i)+1+a(i)を各条件式に代入し(1
4255)、X(i)=c(i)+1+a(i)を解集合
に追加し(14256)、14243に戻る。
【0103】14257では、X(i)<c(i)なる
形の条件式が条件式集合の中に含まれるかどうかチェッ
クする。なければ14261に進む。もしあれば、調整
変数a(i)を導入して、条件式X(i)<c(i)を
a(i)≧0に置き換える(14258)。さらに、X
(i)=c(i)−1−a(i)を各条件式に代入し
(14259)、X(i)=c(i)−1−a(i)を
解集合に追加する(14260)。
【0104】14261から14278までは1424
3から14260までと全く同様である。14243か
ら14260までが変数X(i)に関する条件式につい
ての処理であるのに対し、14261から14278ま
では変数Y(i)に関する条件式についての処理であ
る。
【0105】14279では、a(i)=e(i)(e
(i)は定数、または定数とa(i)以外の調整定数から
なる式)なる形の条件式が条件式集合の中に含まれるか
どうかチェックする。なければ14282に進む。もし
あれば、a(i)=e(i)を条件式の集合から削除す
る(14280)。さらに、a(i)=e(i)を各条
件式に代入し(14281)、14243に戻る。
【0106】14282では、b(i)=f(i)(f
(i)は定数、または定数とb(i)以外の調整定数から
なる式)なる形の条件式が条件式集合の中に含まれるか
どうかチェックする。なければ14285に進む。もし
あれば、b(i)=f(i)を条件式の集合から削除す
る(14283)。さらに、b(i)=f(i)を各条
件式に代入し(14284)、14243に戻る。
【0107】14285から14290で調整変数の値
を決定する。まず、ある調整変数a(i)に関する条件
式がa(i)≧g(i,1),…,a(i)≧g(i,
n)(g(i,j)は定数)であるかどうかチェックす
る(14285)。そのような調整変数a(i)があれ
ば、a(i)≧g(i,1),…,a(i)≧g(i,
n)を条件式の集合から削除する(14286)。さら
に、a(i)=max{g(i,j)}を解集合の各式
及び各条件式に代入し(14287)、14285に戻る。
【0108】同様に、ある調整変数b(i)に関する条
件式がb(i)≧h(i,1),…,b(i)≧h
(i,n)(h(i,j)は定数)であるかどうかチェ
ックする(14288)。そのような調整変数b(i)
があれば、b(i)≧h(i,1),…,b(i)≧h
(i,n)を条件式の集合から削除する(1428
9)。さらに、b(i)=max{h(i,j)}を解
集合の各式及び各条件式に代入し(14290)、14
288に戻る。
【0109】最後に、14291と14292で座標変
数X(i),Y(i)のそれぞれの最小値が1になるよ
うに、図形をシフトする。すなわち、X(j)の最小値
から1を引いた値をLに、Y(j)の最小値から1を引
いた値をMにそれぞれセットする(14291)。そし
て、全てのX(j)からLを減じ、全てのY(j)から
Mを減ずる(14292)。
【0110】図3の原図表データに対して上記処理によ
り決定される座標配列データを図29に示す。これに対
応する図形データが図4(a)である。
【0111】(6)目標テキスト編成ステップ143 図形決定ステップ142で目標文表示領域の図表中での
絶対位置が決定される。そこで、まず目標文を2次元の
テキスト配列E(x,y)上に配置する。そのあと、テ
キスト配列E全体の文字の配置を1次元の文字列表現に
変換する。これが目標図表データ32の目標テキストデ
ータ322となる。
【0112】目標文のテキスト配列への配置処理の詳細
を図30のフローチャートに沿って説明する。まず、テ
キスト配列の全要素E(x,y)(1≦x≦XM2,1
≦y≦YM2)を空白にする(14301)。文番号i
に初期値ISを、座標配列X,Yのインデクスjに初期
値2・IS−1をセットする(14302)。第i目標
文局所配置データがあれば(14303)、これを読み
込み配列Uにセットする(14304)。第i目標文局
所配置データがなければ(14303)、14314に
進む。読み込んだ目標文局所配置データ、すなわち改行
記号付き目標文の長さがNであったとして、U(1),
…,U(N)に文字が書き込まれる。座標配列データか
らX(j),Y(j)を読み込み、X(j)+1,Y
(j)+1をそれぞれxs,ysにセットする(143
05)。配列Uのインデクスnに初期値1を、またテキ
スト配列Eのインデクス(x,y)に初期値として(x
s,ys)をセットする(14306)。U(n)が改
行記号でなければ(14307)、U(n)をE(x,
y)に書き込み(14308)、xに1を加える(143
09)。U(n)が改行記号であれば(14307)、
(x,y)を目標文表示領域の次の行の先頭を指すよう
に更新する。すなわち、yに2を加え、xにはxsをセ
ットする(14310)。次に、nに1を加え(143
11)、n≦Nであれば(14312)、14307に
戻る。n>Nであれば(14312)、jに8を加える
(14313)。そのあと、iに1を加え(1431
4)、iが文番号の最大値IE以下であれば(1431
5)、14303に戻って次の目標文を処理する。iが
IEを越えれば(14315)終了する。
【0113】図22(c)の目標文局所配置データと図
29の座標配列データに基づいて目標文をテキスト配列
に配置した結果を図32に示す。
【0114】テキスト配列から目標テキストを編成する
最も簡易な方法は、テキスト配列の上の行から下の行
へ、行内は左から右に文字を並べればよい。ここでは、
この方法を基本にし、目標テキストデータの長さを短く
するために、行の右方に空白が並んでいる場合、その空
白の並びを一つの改行復帰記号に置き換える処理を追加
している。
【0115】以下、テキスト配列からの目標テキスト編
成処理の詳細を図31のフローチャートに沿って説明す
る。ここで、E(x,y)(1≦x≦XM2,1≦y≦Y
M2)がテキスト配列であり、V(n)が目標テキスト
データを格納する1次元の配列である。
【0116】まず、テキスト配列Eのインデクス(x,
y)に初期値(1,1)を、目標テキストデータ配列V
のインデクスnに初期値1をセットする(1432
1)。
【0117】14322から14325は、行の右方の
空白の並びを認識する処理である。テキスト配列の列を
指す変数x2に初期値XM2をセットする(1432
2)。
【0118】E(x2,y)が空白かどうかチェックす
る(14323)。E(x2,y)が空白でなければ
(14323)、14326に進む。E(x2,y)が
空白であれば、x2から1を減じる(14324)。x
2>0であれば(14325)、14323に戻り、x
2=0であれば(14325)、14326に進む。
【0119】14326から14330では第y行のデ
ータをVにセットする。すなわち、x≦x2かどうかチ
ェックし(14326)、x≦x2であればE(x,
y)をV(n)に書き込んだあと(14327)、xと
nにそれぞれ1を加えて(14328)、14326に
戻る。x>x2になれば、V(n)に改行復帰記号を書
き込み(14329)、nに1を加える(1433
0)。
【0120】第y行のデータをVにセットしたあと、y
<YM2−1であれば(14331)、(x,y)を次の
行の左端を指すように更新して(14332)、143
22に戻る。y≧YM2−1であれば(14331)、
目標テキストデータ322としてV(1),…,V(n
−1)を出力して(14333)終了する。
【0121】図32(a)のテキスト配列から上記処理
により得られる目標テキストデータを図32(b)に示
す。これと同じテキストデータは図4(b)にも示され
ている。
【0122】〈実施例2〉第2の実施例である図表作成
システムを説明する。図表作成システムは、図33に示
すように中央処理装置1b,主記憶装置2b,外部記憶
装置3b,入力装置4b,表示装置5b,ポインティン
グデバイス51bから構成される。外部記憶装置3bに
は、原図表データ31bと目標図表データ32bが格納
される。図34の処理を中央処理装置1bが実行するこ
とによって、図表作成システムの機能が実現される。
【0123】図34に示すように、図表作成システムの
処理メニューとして「新規」と「修正」がある。「新
規」が選択された場合は、まず図形入力ステップ101
で、ユーザが入力装置4bから入力する図形データを読
み取り、外部記憶装置3bの原図表データ31bとして
格納する。図形入力ステップ101はいわゆるワードプ
ロセッサの図形入力機能であり、公知の技術で実現され
る。本実施例の図表作成システムでは、ユーザは図形の
形だけを入力するものであり、内部に配置する文の文字
数を考えて領域の大きさを計算した上で描く必要はな
い。ただし、本実施例では、各文の表示領域は水平の辺
をもつ長方形に限定している。菱形などの内部に文を配
置したい場合は、その内部に補助の長方形を含めて入力
するものとする。このような補助長方形は通常の線分と
は異なる線種で入力するものとする。図形が入力される
と、領域認識ステップ102,文表示領域認識ステップ
103,図形条件抽出ステップ104がこの順序で実行され
る。領域認識ステップ102は第1の実施例の図表翻訳
システムの領域認識ステップ121と全く同じである。
すなわち、図形データを領域配列上に展開したあと、そ
の上で図形が作る領域ごとにそれを構成する要素にラベ
ルをつける。文表示領域認識ステップ103は、図表翻
訳システムの原文抽出ステップ122に代わるものであ
る。図表翻訳システムの場合と異なり原図表の文字デー
タが存在しないので、図形データが作る水平の辺をもつ
長方形領域を抽出して、それを原文表示領域とみなす。
原文データは空のままとする。文表示領域認識ステップ
103の詳細はあとで説明する。図形条件抽出ステップ
104は図表翻訳システムの図形条件抽出ステップ12
3と全く同じである。すなわち、テキストを内部に配置
するために領域を拡大・縮小する際にも保持すべき性質
を図形データから抽出して、座標変数の関係式として表
現する。
【0124】図形条件抽出ステップ104の次は文入力
ステップ105である。これは、いわゆるワードプロセ
ッサの文字入力機能であり、公知の技術で実現できる。
本実施例の特徴は、文を領域と対応づけて入力する点に
ある。表示装置5bには図形表示領域と文表示入力領域
が設けてある。文入力ステップの間、図形入力ステップ
101で入力された図形を表示装置5bの図形表示領域
に表示しておく。ユーザがポインティングデバイス51
bを用いて領域内の点を指定すると、指定された点の座
標から領域配列を参照することによって、指定された領
域の領域番号を決定する。領域番号は文番号でもあるの
で、当該文番号の原文データを検索し、表示装置5bの
文表示入力領域に表示する。原文データは実際には空白
であるので、文表示入力領域は空白になる。そこにユー
ザが文を入力する。入力された文で原文データを更新す
る。上記処理の繰り返しにより、図表中に配置すべき文
が次々と入力される。文の入力が終わると、原文データ
をそのまま目標文データにコピーする。
【0125】文入力ステップ105のあとは、文局所配
置決定ステップ106,図形決定ステップ107,テキ
スト編成ステップ108をその順序で実行する。文局所
配置決定ステップ106は、目標文表示領域の大きさと
目標文表示領域内の目標文局所配置データを作成するも
ので、図表翻訳システムの目標文局所配置決定ステップ
141と基本的に同じ処理である。ただし、図表翻訳シ
ステムでは目標文が英語であったのに対し、本実施例の
図表作成システムは目標文が日本語であるので詳細は異
なる。文局所配置決定ステップ106の詳細については
あとで説明する。図形決定ステップ107は図表翻訳シ
ステムの図形決定ステップ142と全く同じである。す
なわち、図形条件抽出ステップ104で得られた条件式
に、文局所配置決定ステップ106で決定された目標文
表示領域の大きさに関する条件式を追加し、これらの条
件式を満たす座標値を決定する。座標値のうち図形に関
するものを目標図表32bの図形データとして外部記憶
装置3bに出力する。なお、図形入力ステップ101で
通常と異なる線種で入力された補助長方形の線分に関す
る座標データは出力対象から除外する。テキスト編成ス
テップ108は図表翻訳システムの目標テキスト編成ス
テップ143と全く同じである。すなわち、図形決定ス
テップ107で決定された文表示領域の座標と文局所配
置決定ステップ106で得られた目標文局所配置データ
に基づいて、全ての目標文の文字を2次元配列に配置し
たあと、配列全体の文字配置を1次元文字列表現に変換
する。この文字列データを目標図表32bのテキストデ
ータとして外部記憶装置3bに出力する。
【0126】最後に図表出力ステップ109を実行す
る。すなわち、作成された目標図表データ32bから表
示イメージを作成して表示装置5bに出力する。図表出
力ステップ109はいわゆるワードプロセッサの出力機
能であり、公知の技術で実現される。
【0127】図表作成システムの処理メニューから「修
正」を選択する場合には、修正対象図表を併せて指定す
るものとする。指定された図表の図表データが原図表デ
ータ31bとなる。「修正」が選択された場合、まず領
域認識ステップ201,原文抽出ステップ202,図形
条件抽出ステップ203をこの順序で実行する。領域認
識ステップ201は「新規」の場合の領域認識ステップ
102と全く同じである。原文抽出ステップ202は図
表翻訳システムの原文抽出ステップ122と全く同じで
ある。すなわち、原図表データ31のテキストデータを
テキスト配列に配置したあと、テキスト配列と領域配列
を対応づけながら各領域の文字データをまとめて、原文
データを編成する。併せて、各原文の原文表示領域デー
タを作成する。図形条件抽出ステップ203は「新規」
の場合の図形条件抽出ステップ104と全く同じであ
る。
【0128】図形条件抽出ステップ203の次は文修正
ステップ204である。文修正ステップ204は「新
規」の場合の文入力ステップ105と全く同じである。
ただし、「修正」の場合は原文データが既に存在するの
で、ユーザがポインティングデバイス51bを用いて領
域内の点を指定すると、表示装置5bの文表示入力領域
には原文が表示される。ユーザは表示された原文を修正
する。修正された文に原文データを更新する。
【0129】文修正ステップ204のあとは目標文局所
配置決定ステップ205,図形決定ステップ206,目
標テキスト編成ステップ207,図表出力ステップ20
8をその順序で実行する。目標文局所配置決定ステップ
205は「新規」の場合の文局所配置決定ステップ10
6と、図形決定ステップ206は「新規」の場合の図形
決定ステップ107と、目標テキスト編成ステップ20
7は「新規」の場合のテキスト編成ステップ108と、
図表出力ステップ208は「新規」の場合の図表出力ス
テップ109とそれぞれ全く同じである。
【0130】文表示領域認識ステップ103の詳細を図
35に沿って説明する。まず、領域番号iに初期値IS
をセットする(10301)。領域配列Aのインデクス
(x,y)に初期値(1,1)をセットする(1030
2)。また、文表示領域の左上の点,右下の点を表す座
標変数(xs,ys),(xe,ye)のうちys,y
eにそれぞれ初期値YM,1をセットする(1030
3)。領域配列の要素A(x,y)の値がiであるかど
うかチェックする(10304)。A(x,y)がiでな
ければ、xに1を加えて(10306)、10304に
戻る。ただし、xがXMより小さくなければ(1030
5)、10316に進む。A(x,y)がiであれば
(10304)、文表示領域の左端点,右端点のx座標
を表す変数xs2,xe2に初期値としてxを代入する
(10307)。そのあと、xがXMより小さければ
(10308)、xに1を加えて(10309)、A
(x,y)がiかどうかチェックする(10310)。
A(x,y)がiであれば、xe2をxの値で更新した
あと(10311)、10308に戻る。10310で
A(x,y)がiと異なる場合、あるいは10308で
xがXMより小さくない場合は、10312に進む。
【0131】10312に進んだ段階では、xs2,x
e2の値が、第i文表示領域に含まれる第y行の要素の
範囲を示している。そこで、ys,yeがそれぞれ初期
値YM,1のままであれば(10312)、xs,xe
にそれぞれxs2,xe2の値をセットし、またys,
yeにはyの値をセットする(10313)。ys,y
eの少なくとも一方が初期値と異なる場合(1031
2)、xs,xeの値がそれぞれxs2,xe2と一致
するかどうかチェックする(10314)。
【0132】xs,xeの値がそれぞれxs2,xe2
と一致すれば(10314)、第i文表示領域に含まれ
る第y行の要素の範囲が前の行のそれと同じであること
が分かるので、yeをyの値で更新する(1031
5)。このあと、yがYMを越えなければ(1031
6)、(x,y)を次の行の左端を指すように更新し(1
0317)、10304に戻る。yがYMに達したら(10
316)、(xs−1,ys−1),(xe+1,ye
+1)を第i文表示領域データとして出力して(1031
8)、10319に進む。10314において、xsがx
s2と一致しないか、あるいはxeがxe2と一致しな
ければ、第i領域は水平の辺をもつ長方形でないことが
分かるので、10319に進む。10319では、iが
領域番号の最大値IEより小さいかどうかチェックす
る。iがIEより小さければ、iに1を加えて(103
20)、10302に戻り次の領域について処理する。
iがIEより小さくなければ(10319)終了する。
【0133】文局所配置決定ステップ106の詳細を図
36に沿って説明する。ここに出てくるx方向の倍率R
(k)は図表翻訳システムの目標文局所配置決定ステッ
プ141におけるものと同様である。ただし、本実施例
の図表作成システムは原文,目標文がともに日本語であ
るので、R(k)には図表翻訳システムの場合とは異な
る値を設定しておく。例えば、R(1)=0.5,R
(2)=0.75,R(3)=1.0,R(4)=1.25,
R(5)=1.5,R(6)=2.0である。
【0134】まず、文番号iに初期値1をセットする
(10601)。次に第i目標文を読み込む。第i目標
文があれば(10602)、それを目標文配列Uにセッ
トする(10603)。目標文の長さがNであるとし、
U(1)からU(N)に文字が書き込まれる。そのあ
と、第i原文表示領域データを読み込み、原文表示領域
の左上の点の座標,右下の点の座標をそれぞれ(xs,
ys),(xe,ye)にセットする(10604)。原
文表示領域のx方向の長さxe−xs−1,y方向の長
さye−ys−1を計算して、それぞれp1,q1にセ
ットし(10605)、10606に進む。第i目標文が
なければ(10602)、10622に進みiを更新す
る。
【0135】10606から10619では、目標文を
改行記号付き目標文に変換する。まず、x方向の倍率R
のインデクスkに初期値1をセットする(1060
6)。次に、原文表示領域のx方向の長さp1に倍率R
(k)をかけた値を目標文表示領域のx方向の長さp2
にセットし、目標文表示領域のy方向の長さq2には初
期値−1をセットする(10607)。目標文配列Uの
インデクスnと改行記号付き目標文配列U2のインデク
スn2に初期値1をセットする(10608)。n+p
2とN+1の最小値を改行位置nwにセットする(10
609)。そして、U(nw−1)とU(nw)の境目
で改行するものとして、目標文配列Uから改行記号付き
目標文配列U2に文字データをコピーする。すなわちU
(n)をU2(n2)にコピーする処理(10610)
を、nとn2に1を加えながら(10611)、nがn
wになるまで(10612)繰り返す。そのあと、U2
(n2)に改行記号を書き込み(10613)、n2に
1を加える(10614)。さらに、q2に2を加える
(10615)。次にnとNを比較する(10616)。n
<Nであれば10609に戻る。n=Nであれば、目標
文表示領域のx方向の長さq2を原文表示領域のx方向
の長さq1と比較する(10617)。q2≦q1であ
れば、10620に進み、目標文表示領域データと目標
文局所配置データを出力する。q2>q1であれば、x
方向の倍率を大きくしてみるためkに1を加えて(10
619)、10607に戻る。ただし、kがx方向倍率
Rのインデクスの最大値Kと等しければ(1061
8)、10620に進み、目標文表示領域データと目標
文局所配置データを出力する。
【0136】10620では、p2,q2を第i目標文
表示領域データとして出力する。さらにU2(1),
…,U2(n2−1)を第i目標文局所配置データとし
て出力する(10621)。そのあと、iに1を加えて
(10622)、10602に戻り、次の目標文を処理
する。ただし、iが文番号の最大値IEを越えれば(1
0623)処理を終了する。
【0137】図37〜図38は本実施例の図表作成シス
テムによる図表の新規作成の例である。図37(a)は
入力した図形の表示イメージであり、図37(b)はそ
の内部表現である図形データである。また図37(c)
は入力した文データである。図37(b),(c)の入
力データに基づいて図表作成システムが生成した目標図
表の図形データとテキストデータがそれぞれ図38
(a),図38(b)である。図38(c)は図38
(a),(b)が表す図表の表示イメージである。
【0138】〈実施例3〉第3の実施例は手書き入力の
図表作成システムである。すなわち、手書き図表を読み
取り、活字と整形された図形による印刷図表を出力する
ものである。手書き入力図表作成システムは図39に示
すように中央処理装置1c,主記憶装置2c,外部記憶
装置3c,イメージスキャナ4c,出力装置5cから構
成される。外部記憶装置3cには原図表データ31cと
目標図表データ32cが記憶される。中央処理装置1c
が図40に示す各ステップを実行することによって、手
書き図表作成システムの機能が実現される。各ステップ
の処理は以下のとおりである。
【0139】図表読み取りステップ301は、イメージ
スキャナから図表を読み取り、2値画像データとして主
記憶装置2c上に出力する。
【0140】図形認識ステップ302は主記憶装置2c
上の2値画像データを解析して、図形を認識する。手書
きであるために生じた線分の軽微なブレや傾きを吸収す
る処理を含む。認識した線分を始点,終点の座標で表現
し、原図表データ31cの図形データとして外部記憶装
置3cに出力する。
【0141】文字認識ステップ303は、主記憶装置2
c上の2値画像データを解析して、文字を認識する。認
識した文字は文字コードで表現し、その位置を示す座標
とともに主記憶装置2c上に出力する。
【0142】領域認識ステップ304は第2の実施例の
図表作成システムの領域認識ステップ102と全く同じ
である。
【0143】文抽出ステップ305は、文字認識ステッ
プ303で認識した文字とその座標、及び領域認識ステ
ップ304で認識した領域から文データを編成する。文
字の座標から文字が属する領域を判定した上で、領域ご
とに左から右、さらに上から下へと文字をつないで文と
する。
【0144】図形条件抽出ステップ306は第2の実施
例の図表作成システムの図形条件抽出ステップ104と
全く同じである。
【0145】文局所配置決定ステップ307は、文抽出
ステップ305で抽出した文の各々のついて、表示領域
の縦横の長さと表示領域内の文の配置を決定する。文字
の並べ方は文字認識ステップ303で認識した結果に従
うが、各文字が占める領域を活字の大きさに正規化す
る。
【0146】図形決定ステップ308,テキスト編成ス
テップ309,図表出力ステップ310は第2の実施例
の図表作成システムの図形決定ステップ107,テキス
ト編成ステップ108,図表出力ステップ109とそれ
ぞれ全く同じである。
【0147】
【発明の効果】本発明によれば、テキスト入り図表を翻
訳する際、翻訳に伴ってテキストの長さが変わるのに応
じて図形の修正が必要になるが、それを自動的に行なう
システムを実現することができる。修正された図形は、
元の図形の位相的性質や視覚特性(見やすさ,コンパク
トさ)を保存したものである。このシステムを利用する
ことによって、マニュアルなど、図表を多く含む文書の
翻訳コストを大幅に低減することができる。
【0148】また、テキスト入り図表の作成システムに
おいて、図形の中に配置するテキストの文字数を意識せ
ずに図形データを入力することができ、テキスト配置の
ために必要な図形のスケーリング(拡大・縮小)を自動
的に行なう機能が実現できる。さらに、図表中のテキス
ト部分を修正すると、それに伴って必要になる図形の修
正を自動的に行なう機能も実現できる。このような図表
作成システムにより、図表の作成・修正の能率が大きく
向上する。
【0149】さらに、手書き図表を読み取り、活字と整
形された図形による印刷図表に変換する手書き入力図表
作成システムにおいて、手書き文字の大きさや間隔が不
揃いであってもよい。活字化に伴って手書き図表とは違
う大きさのテキスト表示領域が必要になる場合には、図
形を自動的に調整し、バランスのとれた図表を出力す
る。従って、手書き入力の特徴を生かした使い勝手のよ
い図表作成システムを実現することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例の図表翻訳システムの構
成図である。
【図2】図表翻訳システムのプログラムステップを示す
図である。
【図3】原図表データの例である。
【図4】目標図表データの例である。
【図5】原図表解析処理プログラムの処理ステップ間の
データの流れを示す図である。
【図6】目標図表生成処理プログラムの処理ステップ間
のデータの流れを示す図である。
【図7】線分展開処理のフローチャートである。
【図8】領域ラベルづけ処理のフローチャートである。
【図9】領域配列の例である。
【図10】テキスト配置処理のフローチャートである。
【図11】原文データ編成処理のフローチャートであ
る。
【図12】原文抽出の例である。
【図13】座標配列設定処理のフローチャートである。
【図14】原図表の座標配列データの例である。
【図15】線分接続関係に関する条件式生成処理のフロ
ーチャートである。
【図16】線分の傾き及び長さの下限に関する条件式生
成処理のフローチャートである。
【図17】線分の配置順序に関する条件式生成処理のフ
ローチャートである。
【図18】線分の分岐に関する条件式生成処理のフロー
チャートである。
【図19】水平菱形に関する条件式生成処理のフローチ
ャートである。
【図20】図形の条件式の例である。
【図21】目標文局所配置決定処理のフローチャートで
ある。
【図22】目標文局所配置決定の例である。
【図23】目標文表示領域に関する条件式生成処理のフ
ローチャートである。
【図24】目標文表示領域に関する条件式の例である。
【図25】座標変数の値決定処理のフローチャートの一
部である。
【図26】座標変数の値決定処理のフローチャートの一
部である。
【図27】座標変数の値決定処理のフローチャートの一
部である。
【図28】座標変数の値決定処理のフローチャートの一
部である。
【図29】目標図表の座標配列データの例である。
【図30】目標文のテキスト配列への配置処理のフロー
チャートである。
【図31】テキスト配列からの目標テキスト編成処理の
フローチャートである。
【図32】目標テキスト編成の例である。
【図33】本発明の第2の実施例の図表作成システムの
構成図である。
【図34】図表作成システムの処理ステップを示す図で
ある。
【図35】文表示領域認識処理のフローチャートであ
る。
【図36】文局所配置決定処理のフローチャートであ
る。
【図37】図表作成システムによる図表の新規作成の例
である。
【図38】図表作成システムによる図表の新規作成の例
である。
【図39】本発明の第3の実施例の手書き入力図表作成
システムの構成図である。
【図40】手書き図表作成システムの処理ステップを示
す図である。
【符号の説明】
1…中央処理装置、2…主記憶装置、3…外部記憶装
置、4…入力装置、5…出力装置、11…図表入力プロ
グラム、12…原図表解析処理プログラム、121…領域
認識ステップ、122…原文抽出ステップ、123…図
形条件抽出ステップ、13…テキスト翻訳プログラム、
14…目標図表生成処理プログラム、141…目標文局所
配置決定ステップ、142…図形決定ステップ、143
…目標テキスト編成ステップ、15…図表出力プログラ
ム、21…領域配列データ、22…原文データ、23…
原文表示領域データ、24…図形条件データ、25…目
標文データ、26…目標文表示領域データ、27…目標
文局所配置データ、28…目標文表示領域座標データ、
31…原図表データ、311…線図形データ、312…
原テキストデータ、32…目標図表データ、321…線
図形データ、322…目標テキストデータ、1b…中央
処理装置、2b…主記憶装置、3b…外部記憶装置、4
b…入力装置、5b…表示装置、51b…ポインティン
グデバイス、31b…原図表データ、32b…目標図表
データ、101…線図形入力ステップ、102…領域認
識ステップ、103…文表示領域認識ステップ、104
…図形条件抽出ステップ、105…文入力ステップ、1
06…文局所配置決定ステップ、107…図形決定ステ
ップ、108…テキスト編成ステップ、109…図表出
力ステップ、201…領域認識ステップ、202…原文
抽出ステップ、203…図形条件抽出ステップ、204
…文修正ステップ、205…目標文局所配置決定ステッ
プ、206…図形決定ステップ、207…目標テキスト
編成ステップ、208…図表出力ステップ、1c…中央
処理装置、2c…主記憶装置、3c…外部記憶装置、4
c…イメージスキャナ、5c…出力装置、31c…原図
表データ、32c…目標図表データ、301…図表読み
取りステップ、302…線図形認識ステップ、303…
文字認識ステップ、304…領域認識ステップ、305
…文抽出ステップ、306…図形条件抽出ステップ、3
07…文局所配置決定ステップ、308…図形決定ステ
ップ、309…テキスト編成ステップ、310…図表出
力ステップ。

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】第1の図形と第1の言語のテキストからな
    る第1の図表を第2の図形と第2の言語のテキストから
    なる第2の図表に翻訳するテキスト入り図表の翻訳方法
    であって、前記第1の言語のテキストから前記第2の言
    語のテキストへの翻訳に対応して、前記第1の図形から
    前記第2の図形へ変換することを特徴とするテキスト入
    り図表の翻訳方法。
  2. 【請求項2】第1の図形と第1の言語のテキストからな
    る第1の図表を第2の図形と第2の言語のテキストから
    なる第2の図表に翻訳するテキスト入り図表の翻訳方法
    であって、前記第1の図形が作る領域と対応づけて前記
    第1の図表のテキストを抽出し、前記第1の図表の図形
    の性質から前記第2の図形が満たすべき条件を抽出し、
    前記抽出したテキストを前記第2の言語に翻訳した結果
    と前記抽出した条件に基づいて、前記第2の図形と前記
    第2の言語のテキストとの配置を決定することを特徴と
    するテキスト入り図表の翻訳方法。
  3. 【請求項3】請求項2のテキスト入り図表の翻訳方法に
    おいて、前記条件の抽出は、前記第1の図形が作る領域
    を認識し、前記認識した領域についてそこに含まれる前
    記第1のテキスト中の文字を連結することによって原文
    を抽出し、前記第2の図表の図形が満たすべき条件とし
    て、前記第1の図形の位相および形状的性質、並びに前
    記認識した領域と該領域に関連する前記第1のテキスト
    中の文との関係を抽出することからなり、前記配置の決
    定は、前記原文を翻訳して得られる目標文に関して、該
    目標文の表示領域の大きさと該表示領域内の前記目標文
    の配置を決定し、前記第2の図表の図形が満たすべき条
    件と前記目標文表示領域の大きさとに基づいて、前記第
    2の図表の図形を構成する線分及び前記目標文表示領域
    の位置を決定し、前記目標文表示領域の位置と前記目標
    文表示領域内の前記目標文の配置とに基づいて、前記第
    2の図形と前記第2の言語のテキストとの配置を決定す
    ることを特徴とするテキスト入り図表の翻訳方法。
  4. 【請求項4】第1の図形と第1の言語のテキストからな
    る第1の図表を第2の図形と第2の言語のテキストから
    なる第2の図表に翻訳するテキスト入り図表の翻訳方法
    であって、前記第1の図形が作る領域と対応づけて前記
    第1の図表のテキストを抽出し、前記抽出したテキスト
    を前記第2の言語に翻訳した前記第2のテキストを、前
    記第1の図形に対応する前記第2の図形の領域の中に配
    置することを特徴とするテキスト入り図表の翻訳方法。
  5. 【請求項5】図形とテキストからなる図表を修正するテ
    キスト入り図表の修正方法であって、前記図形が作る領
    域と対応づけて前記テキストを抽出し、前記図形が保持
    すべき条件を抽出し、前記テキストの修正に応じて、前
    記抽出した図形が保持すべき条件に基づいて、修正され
    たテキストに前記図形を整合させ、該整合させた図形と
    前記修正されたテキストの配置を決定することを特徴と
    するテキスト入り図表の修正方法。
  6. 【請求項6】請求項5のテキスト入り図表の修正方法に
    おいて、前記テキストの抽出および前記図形が保持すべ
    き条件を抽出は、前記図形が作る領域を認識し、前記認
    識した領域についてそこに含まれる文字を連結すること
    によって原文を抽出し、前記図形が保持すべき条件とし
    て、前記図形の位相および形状的性質、並びに前記認識
    した領域と該領域に対応する前記テキスト中の文との関
    係を抽出することからなり、前記配置の決定は、前記原
    文を修正して得られた目標文について、該目標文の表示
    領域の大きさと該表示領域内の前記目標文の配置を決定
    し、前記図形が保持すべき条件と前記目標文表示領域の
    大きさに基づいて、前記図形を構成する線分及び前記目
    標文の表示領域の位置を決定し、前記目標文の表示領域
    の位置と前記目標文表示領域内の前記目標文の配置に基
    づいて、前記図表の文字の配置を決定することからなる
    ことを特徴とするテキスト入り図表の修正方法。
  7. 【請求項7】図形とテキストからなる図表を修正するテ
    キスト入り図表の修正方法であって、前記図形が作る領
    域と対応づけて前記図表のテキストを抽出し、前記図表
    のテキストの修正に応じて、前記修正されたテキストを
    前記図形の中に配置することを特徴とするテキスト入り
    図表の修正方法。
  8. 【請求項8】図形とテキストからなる図表を作成するテ
    キスト入り図表の作成方法であって、前記図形の位相お
    よび形状的性質を入力し、前記図形に対応して前記テキ
    ストを入力し、前記テキストと前記入力した前記図形の
    位相および形状的性質に基づいて、前記図形が作る領域
    を認識すると共に、前記テキストに整合する図形を決定
    し、前記決定した図形の中での前記テキストの配置を決
    定することを特徴とするテキスト入り図表の作成方法。
  9. 【請求項9】請求項8のテキスト入り図表の作成方法で
    あって、前記配置の決定は、前記テキストの表示領域の
    大きさと該表示領域内の前記テキストの配置を決定し、
    前記入力した前記図形の位相および形状的と性質前記文
    表示領域の大きさとに基づいて、前記図形を構成する線
    分及び前記文表示領域の位置を決定し、前記決定した文
    表示領域の位置と前記文表示領域内の前記テキストの配
    置に基づいて、前記図表の配置を決定することを特徴と
    するテキスト入り図表の作成方法。
  10. 【請求項10】手書き図表を読み取り、活字化した印刷
    図表を出力するテキスト入り図表の作成方法であって、
    前記手書き図表を2値画像データとして読み取り、前記
    2値画像データから図形と文字とを認識し、前記認識し
    た図形から該図形が作る領域を認識し、該認識した領域
    を参照して、前記認識した文字の連なりから文を抽出
    し、前記認識した図形から該図形の位相および形状的性
    質を抽出し、前記抽出した文の表示領域の大きさと表示
    領域内の文の配置を決定し、前記抽出した前記図形の位
    相および形状的性質と前記表示領域の大きさとに基づい
    て、前記図形を構成する線分及び前記文の表示領域の位
    置を決定し、前記文の表示領域の位置と前記文の表示領
    域内の前記文の配置に基づいて、前記図表の文字の配置
    を決定することを特徴とするテキスト入り図表の作成方
    法。
  11. 【請求項11】第1の図形と第1の言語のテキストから
    なる第1の図表を第2の図形と第2の言語のテキストか
    らなる第2の図表に翻訳するテキスト入り図表の翻訳シ
    ステムにおいて、前記第1の言語のテキストから前記第
    2の言語のテキストへの翻訳に対応して、前記第1の図
    形から前記第2の図形へ変換する手段を有することを特
    徴とするテキスト入り図表の翻訳システム。
  12. 【請求項12】第1の図形と第1の言語のテキストから
    なる第1の図表を第2の図形と第2の言語のテキストか
    らなる第2の図表に翻訳するテキスト入り図表の翻訳シ
    ステムであって、前記第1の図形が作る領域と対応づけ
    て前記第1の図表のテキストを抽出する手段と、前記第
    1の図表の図形の性質から前記第2の図形が満たすべき
    条件を抽出する手段と、前記抽出したテキストを前記第
    2の言語に翻訳した結果と前記抽出した条件に基づい
    て、前記第2の図形と前記第2の言語のテキストとの配
    置を決定する手段とを有することを特徴とするテキスト
    入り図表の翻訳システム。
  13. 【請求項13】請求項12のテキスト入り図表の翻訳シ
    ステムにおいて、前記条件を抽出する手段は、前記第1
    の図形が作る領域を認識する手段と、前記認識した領域
    についてそこに含まれる前記第1のテキスト中の文字を
    連結することによって原文を抽出する手段と、前記第2
    の図表の図形が満たすべき条件として、前記第1の図形
    の位相および形状的性質、並びに前記認識した領域と該
    領域に関連する前記第1のテキスト中の文との関係を抽
    出する手段とを含み、前記配置を決定する手段は、前記
    原文を翻訳して得られる目標文に関して、該目標文の表
    示領域の大きさと該表示領域内の前記目標文の配置を決
    定する手段と、前記第2の図表の図形が満たすべき条件
    と前記目標文表示領域の大きさとに基づいて、前記第2
    の図表の図形を構成する線分及び前記目標文表示領域の
    位置を決定する手段と、前記目標文表示領域の位置と前
    記目標文表示領域内の前記目標文の配置とに基づいて、
    前記第2の図形と前記第2の言語のテキストとの配置を
    決定する手段とを含むことを特徴とするテキスト入り図
    表の翻訳システム。
  14. 【請求項14】第1の図形と第1の言語のテキストから
    なる第1の図表を第2の図形と第2の言語のテキストか
    らなる第2の図表に翻訳するテキスト入り図表の翻訳シ
    ステムであって、前記第1の図形が作る領域と対応づけ
    て前記第1の図表のテキストを抽出する手段と、前記抽
    出したテキストを前記第2の言語に翻訳した前記第2の
    テキストを、前記第1の図形に対応する前記第2の図形
    の領域の中に配置する手段とを有することを特徴とする
    テキスト入り図表の翻訳システム。
  15. 【請求項15】図形とテキストからなる図表を修正する
    テキスト入り図表の修正システムであって、前記図形が
    作る領域と対応づけて前記テキストを抽出する手段と、
    前記図形が保持すべき条件を抽出する手段と、前記テキ
    ストの修正に応じて、前記抽出した図形が保持すべき条
    件に基づいて、修正されたテキストに前記図形を整合さ
    せる手段と、該整合させた図形と前記修正されたテキス
    トの配置を決定する手段とを有することを特徴とするテ
    キスト入り図表の修正システム。
  16. 【請求項16】請求項15のテキスト入り図表の修正シ
    ステムにおいて、前記テキストを抽出する手段は、前記
    図形が作る領域を認識する手段と、前記認識した領域に
    ついてそこに含まれる文字を連結することによって原文
    を抽出する手段とを含み、前記図形が保持すべき条件を
    抽出する手段は、前記図形が保持すべき条件として、前
    記図形の位相および形状的性質、並びに前記認識した領
    域と該領域に対応する前記テキスト中の文との関係を抽
    出する手段を含み、前記配置を決定する手段は、前記原
    文を修正して得られた目標文について、該目標文の表示
    領域の大きさと該表示領域内の前記目標文の配置を決定
    する手段と、前記図形が保持すべき条件と前記目標文表
    示領域の大きさに基づいて、前記図形を構成する線分及
    び前記目標文の表示領域の位置を決定する手段と、前記
    目標文の表示領域の位置と前記目標文表示領域内の前記
    目標文の配置に基づいて、前記図表の文字の配置を決定
    する手段とを含むことを特徴とするテキスト入り図表の
    修正システム。
  17. 【請求項17】図形とテキストからなる図表を修正する
    テキスト入り図表の修正システムであって、前記図形が
    作る領域と対応づけて前記図表のテキストを抽出する手
    段と、前記図表のテキストの修正に応じて、前記修正さ
    れたテキストを前記図形の中に配置する手段とを有する
    ことを特徴とするテキスト入り図表の修正システム。
  18. 【請求項18】図形とテキストからなる図表を作成する
    テキスト入り図表の作成システムであって、前記図形の
    位相および形状的性質と前記図形に対応して前記テキス
    トを入力する手段と、前記テキストと前記入力した前記
    図形の位相および形状的性質に基づいて、前記図形が作
    る領域を認識し、前記テキストに整合する図形を決定す
    る手段と、前記決定した図形の中での前記テキストの配
    置を決定する手段とを有することを特徴とするテキスト
    入り図表の作成システム。
  19. 【請求項19】請求項18のテキスト入り図表の作成シ
    ステムであって、前記配置を決定する手段は、前記テキ
    ストの表示領域の大きさと該表示領域内の前記テキスト
    の配置を決定する手段と、前記入力した前記図形の位相
    および形状的と性質前記文表示領域の大きさとに基づい
    て、前記図形を構成する線分及び前記文表示領域の位置
    を決定する手段と、前記決定した文表示領域の位置と前
    記文表示領域内の前記テキストの配置に基づいて、前記
    図表の配置を決定する手段とを含むことを特徴とするテ
    キスト入り図表の作成システム。
  20. 【請求項20】手書き図表を読み取り、活字化した印刷
    図表を出力するテキスト入り図表の作成システムであっ
    て、前記手書き図表を2値画像データとして読み取る入
    力手段と、前記2値画像データから図形と文字とを認識
    する手段と、前記認識した図形から該図形が作る領域を
    認識する手段と、該認識した領域を参照して、前記認識
    した文字の連なりから文を抽出する手段と、前記認識し
    た図形から該図形の位相および形状的性質を抽出する手
    段と、前記抽出した文の表示領域の大きさと表示領域内
    の文の配置を決定する手段と、前記抽出した前記図形の
    位相および形状的性質と前記表示領域の大きさとに基づ
    いて、前記図形を構成する線分及び前記文の表示領域の
    位置を決定する手段と、前記文の表示領域の位置と前記
    文の表示領域内の前記文の配置に基づいて、前記図表の
    文字の配置を決定する手段とを有することを特徴とする
    テキスト入り図表の作成システム。
JP3312222A 1991-11-27 1991-11-27 文書処理方法およびシステム Withdrawn JPH05151254A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP3312222A JPH05151254A (ja) 1991-11-27 1991-11-27 文書処理方法およびシステム
EP92120087A EP0544255A2 (en) 1991-11-27 1992-11-25 Document processing method and system
US08/405,926 US5813018A (en) 1991-11-27 1995-03-16 Automated text extraction from source drawing and composition into target drawing with translated text placement according to source image analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3312222A JPH05151254A (ja) 1991-11-27 1991-11-27 文書処理方法およびシステム

Publications (1)

Publication Number Publication Date
JPH05151254A true JPH05151254A (ja) 1993-06-18

Family

ID=18026658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3312222A Withdrawn JPH05151254A (ja) 1991-11-27 1991-11-27 文書処理方法およびシステム

Country Status (3)

Country Link
US (1) US5813018A (ja)
EP (1) EP0544255A2 (ja)
JP (1) JPH05151254A (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0961945A (ja) * 1995-08-24 1997-03-07 Noritsu Koki Co Ltd 写真焼付装置
CN1100300C (zh) * 1996-10-16 2003-01-29 夏普公司 字符输入装置
JP4943573B2 (ja) * 1999-12-09 2012-05-30 アドリア リミテッド ライアビリティ カンパニー 情報処理方法及び装置、媒体
US6522889B1 (en) * 1999-12-23 2003-02-18 Nokia Corporation Method and apparatus for providing precise location information through a communications network
US6993708B1 (en) * 2000-07-27 2006-01-31 Robert B Gillig System for automated generation and assembly of specifications documents in CADD environments
US7149677B2 (en) * 2000-10-30 2006-12-12 Translation Technologies, Inc. Geometric model comparator and method
JP2002157202A (ja) * 2000-11-17 2002-05-31 Square Co Ltd 情報処理装置、メッセージ通信方法、記録媒体およびコンピュータ・プログラム
US20020188435A1 (en) * 2001-06-07 2002-12-12 Microsoft Corporation Interface for submitting richly-formatted documents for remote processing
EP1300979A1 (fr) * 2001-10-04 2003-04-09 Technosphere Sarl Procédé de dépôt d'un document numérique et de restitution d'au moins une copie conforme de ce document
US6978046B2 (en) * 2002-03-29 2005-12-20 Xerox Corporation Systems and methods for automated template creation using scanned input
US7698016B2 (en) 2003-02-18 2010-04-13 Tti Acquisition Corporation Feature-based translation system and method
US8723964B2 (en) * 2003-09-12 2014-05-13 Sony Corporation Method and device for communication using an optical sensor
JP4626356B2 (ja) * 2005-03-25 2011-02-09 富士ゼロックス株式会社 付加情報を含む電子文書を編集する方法、装置およびプログラム
JP2008041003A (ja) * 2006-08-10 2008-02-21 Fuji Xerox Co Ltd 文書表示処理装置および文書表示処理プログラム
US20090150435A1 (en) * 2007-12-08 2009-06-11 International Business Machines Corporation Dynamic updating of personal web page
ATE538442T1 (de) * 2008-04-24 2012-01-15 Siemens Ag Verfahren und system zur erkennung von gruppierungseigenschaften
US9087337B2 (en) * 2008-10-03 2015-07-21 Google Inc. Displaying vertical content on small display devices
JP2012510202A (ja) * 2008-11-25 2012-04-26 トムソン ライセンシング ビデオ符号化および復号のためのスパース性に基づくアーティファクト除去フィルタリングを行う方法および装置
US9330437B2 (en) 2012-09-13 2016-05-03 Blackberry Limited Method for automatically generating presentation slides containing picture elements
KR102054772B1 (ko) * 2014-04-22 2019-12-13 한국전자통신연구원 문장 은닉 및 표시 시스템 및 방법
JP6259804B2 (ja) 2014-11-26 2018-01-10 ネイバー コーポレーションNAVER Corporation コンテンツ参加翻訳装置、及びそれを利用したコンテンツ参加翻訳方法
GB201608259D0 (en) * 2016-05-11 2016-06-22 Magic Pony Technology Ltd Feature transfer
US9858476B1 (en) 2016-06-30 2018-01-02 Konica Minolta Laboratory U.S.A., Inc. Method for recognizing table, flowchart and text in document images
RU172882U1 (ru) * 2016-07-20 2017-07-28 Общество с ограниченной ответственностью "Технологии управления переводом" Устройство для автоматического перевода текста

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4204193A (en) * 1978-11-03 1980-05-20 International Business Machines Corporation Adaptive alignment for pattern recognition system
DE3107655A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum auffinden und abgrenzen von textbereichen auf einer vorlage, die text-, graphik- und/oder bildbereiche enthalten kann
JPS6089275A (ja) * 1983-10-21 1985-05-20 Hitachi Ltd 翻訳方式
US5220623A (en) * 1983-11-02 1993-06-15 Canon Kabushiki Kaisha Image processing apparatus which can shift reproduction position of image areas, character train, etc.
JPH07107694B2 (ja) * 1984-08-31 1995-11-15 株式会社日立製作所 文書処理装置
US5351189A (en) * 1985-03-29 1994-09-27 Kabushiki Kaisha Toshiba Machine translation system including separated side-by-side display of original and corresponding translated sentences
US4974194A (en) * 1986-04-04 1990-11-27 International Business Machines Corporation Method for modifying intermingled text object and graphic object within an object set individually or correspondingly
JPH0738681B2 (ja) * 1987-03-20 1995-04-26 富士ゼロックス株式会社 領域認識装置
JPS63245556A (ja) * 1987-03-31 1988-10-12 Toshiba Corp 図表データ割付け方法
US5268999A (en) * 1987-05-30 1993-12-07 Ricoh Company, Ltd. Modeling method and system using solid data having functional structure and normal projection drawing dimensional format
US5005127A (en) * 1987-10-26 1991-04-02 Sharp Kabushiki Kaisha System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JP2695844B2 (ja) * 1988-06-16 1998-01-14 株式会社東芝 文書整形装置
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
CA2003418A1 (en) * 1988-12-29 1990-06-29 Louis A. Winans Computer message & screen communications in a multi-lingual network
JP2993673B2 (ja) * 1989-01-27 1999-12-20 株式会社日立製作所 電子ファイル装置
JPH0344764A (ja) * 1989-07-12 1991-02-26 Sharp Corp 機械翻訳装置
JPH03161873A (ja) * 1989-11-20 1991-07-11 Ricoh Co Ltd データベース構築機能を有する電子フアイリング装置
US5181261A (en) * 1989-12-20 1993-01-19 Fuji Xerox Co., Ltd. An image processing apparatus for detecting the boundary of an object displayed in digital image
US5167016A (en) * 1989-12-29 1992-11-24 Xerox Corporation Changing characters in an image
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置
US5050222A (en) * 1990-05-21 1991-09-17 Eastman Kodak Company Polygon-based technique for the automatic classification of text and graphics components from digitized paper-based forms
US5233685A (en) * 1990-06-12 1993-08-03 Wordperfect Corporation Method and apparatus for integrated graphical and textual character printing
JPH0594436A (ja) * 1990-10-10 1993-04-16 Fuji Xerox Co Ltd 文書処理装置
US5313394A (en) * 1990-12-11 1994-05-17 Barbara Clapp Document assembly customization system for modifying a source instrument including text and decisional commands
US5307422A (en) * 1991-06-25 1994-04-26 Industrial Technology Research Institute Method and system for identifying lines of text in a document
US5455901A (en) * 1991-11-12 1995-10-03 Compaq Computer Corporation Input device with deferred translation
US5201011A (en) * 1991-11-19 1993-04-06 Xerox Corporation Method and apparatus for image hand markup detection using morphological techniques

Also Published As

Publication number Publication date
EP0544255A3 (ja) 1994-01-05
US5813018A (en) 1998-09-22
EP0544255A2 (en) 1993-06-02

Similar Documents

Publication Publication Date Title
JPH05151254A (ja) 文書処理方法およびシステム
JP4071328B2 (ja) 文書画像処理装置および方法
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
EP0439951B1 (en) Data processing
US5553217A (en) Document layout using tiling
EP0690415B1 (en) Editing scanned document images using simple interpretations
JPH06176188A (ja) 認識文字の情報作成方法及び装置
US6810147B2 (en) Document image processing apparatus for processing line portions manually input to document image, method therefor, and computer readable recording medium recorded with document image processing program therefor
JPH0554073A (ja) デジタル翻訳装置
JP2002203207A (ja) 文字認識方法,プログラム及び記録媒体
JP2006227824A (ja) 図面認識方法および装置
JP4633773B2 (ja) 文書画像処理装置および方法
JPH0991371A (ja) 文字表示装置
JP4589370B2 (ja) 文書画像処理装置および方法
JP2000123116A (ja) 文字認識結果修正方法
JP7003457B2 (ja) 文書再構成装置
JP2682873B2 (ja) 表形式文書の認識装置
JP2874815B2 (ja) 日本語文字読取装置
JPH01292587A (ja) 画像処理方法
JPH0850650A (ja) 図形清書化装置
JPH01262149A (ja) ドツト文字フオント生成機能をもつ文書出力装置
JP3424942B2 (ja) 対訳画像形成装置
JPH01292586A (ja) 文字認識支援装置
JPS61198376A (ja) 光学的文字読取装置
JPH08202859A (ja) 電子ファイリング装置及びその方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990204