JP2695784B2 - 文章を検索・表示する方法 - Google Patents

文章を検索・表示する方法

Info

Publication number
JP2695784B2
JP2695784B2 JP62128139A JP12813987A JP2695784B2 JP 2695784 B2 JP2695784 B2 JP 2695784B2 JP 62128139 A JP62128139 A JP 62128139A JP 12813987 A JP12813987 A JP 12813987A JP 2695784 B2 JP2695784 B2 JP 2695784B2
Authority
JP
Japan
Prior art keywords
data
sentence
extracted
word
displaying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62128139A
Other languages
English (en)
Other versions
JPS63293674A (ja
Inventor
誠治 柏岡
純一 東野
繁 薮内
康明 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP62128139A priority Critical patent/JP2695784B2/ja
Publication of JPS63293674A publication Critical patent/JPS63293674A/ja
Application granted granted Critical
Publication of JP2695784B2 publication Critical patent/JP2695784B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は電子化された文献情報読取り端末に係り、特
に図表をもとにそれに関連した説明文を本文の中から検
索し、並置表示するシステムに関する。〔従来の技術〕 CRTデイスプレイなど情報を表示する装置と表示され
た項目の中から1つを選択するためのカーソル,マウ
ス,キイーボード,タブレツトのような装置とを用い
て、操作者の関心に応じて表示された項目の1つを選択
するとその項目についてさらに詳しい説明を引き出した
りするシステムが既にキヤプテンシステムなどで実用化
されている。しかし、これらのシステムにおいては、予
め選択項目に対応して表示すべき情報はプラグラムされ
ており従つて、操作者は予めシステム側が準備した情報
を、画面の中で選択が許された項目についてのみ順次た
どることによつて見ることができる。このためには、シ
ステムの提供者が、全ての選択のトリーに対応して表示
すべき情報を準備し、選択に対応する情報の所在とを関
係づけるデータを作成してシステムに登録しておくこと
が必要となる。 一方、電子化されたデータベースに蓄積された、文献
情報について、キイーワードによる文献の検索は行なわ
れているが、1編の文献の中で、相互に関連する部分を
検索表示することは、まだ行なわれていない。 〔発明が解決しようとする問題点〕 上記従来技術においては画面に表示された対象の中か
ら選択に応じて、その関連部分を表示するにはあらかじ
め上記の関係づけるデータの作成と登録が必要であり、
文献の量が多いときに、このような準備を行なつておく
ことは、莫大な作業となつてしまう。 本発明の目的は、従来莫大な作業を必要とするために
実現されていなかつた文献内の関連部分の検索と表示の
機能を実現する方法を提供することにある。とくに図表
中の項目の表示位置の指示に基づいて、本文文章中から
関連記述部分を表示する方法を提供することにある。 〔問題点を解決するための手段〕 上記目的を達成するために、本発明は次の要素ステツ
プをもつて構成している。 (1)操作者に表示画面中の位置指示を行なわせ、指示
された対象の指示語を特定するステツプ。ここで指示語
とは図表の番号,図表のブロツク単位要素などの番号,
名称を意味する。 (2)上記指示語を本文文章中から検索するステツプ。 (3)見出した箇所から前後の適切な部分を切出し,整
形し,表示するステツプ。 〔作用〕 第5図に本発明を実施したときの端末の表示CRT6の画
面を例示している。最初図面が51の枠内に表示されてい
る。ここで操作者が、画面中の位置を指示することによ
つて、例えばある図中の要素の指示語52を指示し、シス
テムは、その位置と表示の元になつたデータから指示語
を認識し、特定する。これが第1のステツプである。 次に特定された指示語と一致する語を本文文章中から
探索する。これが第2ステツプである。一致した箇所か
ら、その前後の適当かつ画面に表示できる範囲の文章を
切出して同じCRT6の画面の中に配置し図の53の枠のよう
に表示する。これが第3ステツプである。その内にはも
ちろん指示語の表示54を含む。これを強調表示すること
もできる。 以上述べたステツプにはそれぞれ課題があるので以下
にその実施例を挙げて説明する。 〔実施例〕 以下、本発明の一実施例を第2図のフローチヤートに
より説明する。図中の順に従つて説明する。 101のステツプは図表あるいは図表を含む文書のある
頁あるいはそらにその頁の部分を表示するものである。
これは操作者の指示に基づいて表示する。 102のステツプは、操作者が表示内容を見て、ある図
表の全体あるいは、その中に要素の説明を求るため概当
部分を指示する、あるいは別の言い方ではポインテイン
グするのを検知するものである。このためには種々のツ
ールを用いることができる。たとえば、カーソルの移動
と所定のキイーの押下げ、マウスの移動とボタンの押下
げ、表示に重畳した透明のタブレツトあるいは別置きの
タブレツトを用いての直接指示がある。 103のステツプは、102のステツプを指示された画面中
の位置の入力値をもとに、操作者が指示しようとした対
象を特定し、さらにその対象の指示語を求めるものであ
る。これは例えば図表全体の番号であることもあり、ま
た特許の図面における要素に対してつけられた引用のた
めの番号であることもあり、さらにその場所に書かれた
名称であることもある。 104のステツプでは、103で求めた指示語を、本文文章
を走査してマツチングを行ない、一致する場所を探索す
る。 105のステツプでは、104のステツプで求めた本文中の
場所から、その前後を含む文を抜出し、配置整形し、表
示に出す。 この後は、再び102のステツプに移り、次の操作を待
つ。 以上に説明した第2図の方法は、事前に準備処理が不
要であり、データベースから取出した文書について直ち
に適用することができる。また別途の記憶領域も必要と
しない。しかし、104の探索のステツプは一般にかなり
の処理時間を必要とし、操作者への応答を遅くすること
になりやすい。 この応答時間を短縮するための別の実施例を示したフ
ローチヤートが第3図である。 110のステツプは、ある文書を選択したときまず最初
に準備段階として処理しておくステツプで、文章あるい
は図表を走査して、指示語として選ばれる可能性のある
全ての部分を求め、その位置とい合わせて、指示語位置
関係表に記録していく。必要に応じて、指示語のソーテ
イングを行なつておく。 101〜103および105のステツプは第2図の処理と同じ
であり説明は省略する。 114のステツプは第2図の104に書き代るものであり、
110で作成しておいた指示語−位置関係表を用いて、操
作者が指定した指示語に対応する本文中の位置を表から
引出すことによつて得ることができる。従つて処理時間
はごく短かい。 この第3図に示した実施例は第2図に比べ応答時間の
短かいのが特徴である。 ここでさらに103のステツプの具体的実施方法につい
て述べる。マウスやタブレツトなどの指示器からの入力
情報を表示のための画素を単位とする座標系に変換する
ことは簡単な演算により容易に行なえる。表示の方法に
応じて2通りの割出し方法に分かれる。すなわち表示画
像が、文字・線などのコードデータから発生されている
第1の場合と、元々画像として入力したデータをもとに
それを再現する第2の場合とである。 第1の場合は、CAD(計算機支援設計システム)など
でポインテイングした要素を割出すために行なわれてい
る方法が採用できる。第1図の中にその一例を示す。 第1図は本発明の一実施例のシステム構成を示すもの
である。文献データベース1から読出されたある文献の
図表のコードデータ2と文章のコードデータ3があり、
いま少なくともある1つの図表のコードデータが描画処
理部4に送られ、コードデータに基づいて、フレームメ
モリ5に書込まれる。フレームメモリ5の内容はただち
にCRT6に表示されている。6の表示面に重ねて透明のタ
ブレツト7がセツトしてある。操作者がタツチにより表
示されている図表のある要素を指示すると、タブレツト
入力回路8により、その画面座標81が求まり、さらに制
御部9にタツチ動作が報らされる。 ここで制御部9は指示された図表中の要素を捜すた
め、再度図表の描画処理を行なわせ、フレームメモリへ
の書込みアドレスあるいは画面座標41を発生させる。近
接サーチ部10はこの書込み画面座標41が指示画面座標81
の一定の距離以内に入ることを検出する。そのことが検
出されると、制御部9に知らされ、描画処理部で描画中
であつた要素とし、指示された要素が求まる。 この外にランダム走査形のCRTを用い、フレームメモ
リ5がなく、繰返り描画処理が行なわれるシステムの場
合には、ライトペンで描画ビームを検知した瞬間の描画
中の要素として、指示した要素を求める方法がある。 また、全要素を描画するのではなく、指示画面座標81
から、対象要素を限定して近接サーチを行なうようにし
てサーチ時間を短縮する方法などを提唱されている。 以上のようにして求まつた要素が文字列であるときに
はそれが、図形要素であるときは、それに対応して記憶
されている名称として指示語が求まる。 さて第2の場合として、図表がもともと画像データで
あり、それが表示されているときに、操作者が指示した
対象の指示語を得る方法は次のようなものである。 第4図の中にその1例を示す。第4図は本発明の一実
施例のシステム構成を示すものである。文献データベー
ス1′から読出されたある文献の図表の画像データ2′
と文章の画像データ3′があり、いま少なくともある1
つの図表が書込み部4′を経てフレームメモリ5に書込
まれ、ただちにCRT6に表示されている。透明タブレツト
が図表のある対象を指示すると、座標入力部8によつ
て、画像座標が制御部20に送り込まれる。 制御部20は以下の一連の処理を起動する。まず画像座
標で指示される点の近傍領域を抜出し部21によつて抜出
し、その中から文字と考えられるセグメントを抽出す
る。また指定された点に最も近いセグメントだけでな
く、それにさらに一定の距離以内に近接しているセグメ
ントを順次抽出し、これらを次の文字認識部22に送る。
文字認識ではこれらのセグメントの各々を文字候補とし
て認識を行ない、引用番号・記号や単語として指示を求
める。 以上、103のステツプの具体的実施方法についてシス
テムの構成例とともに示した。 次に104のステツプ、すなわち文章中から、103ステツ
プで求めた指示語を探索するための具体的方法について
述べる。このときにも、文章がコードデータとして記憶
されている第1の場合と、画像としてのみ記憶されてい
る第2の場合とがある。 第1の場合には、指示語と同じ文字列を文章のコード
ストリング中から探索すればよく、この部分はストリン
グサーチとしてよく行なわれている処理である。第1図
の一致サーチ部11がこれを行なうものである。コードで
記憶されている文章データ3を走査して、制御部9から
指定された指示語のコード列と一致する部分を探索す
る。 第2の場合には、画像処理が必要となる。第4図の一
部がその実施の一例である。まず文字発生部23で、文章
データ3′に使われている文字のフオントと大きさに合
わせて、指示語の文字に対応する画像パターンを生成す
る。このパターンは、パターンサーチ部24に渡される。
パターンサーチ部は、文章データ3′の画像を走査し
て、順次局部パターンを抜き出し、これと指定された画
像パターンとを比較してほぼ一致する局部を探索する。
文字読取り装置との相異は、文字読取り装置では画像中
の各文字候補を数千の文字カテゴリーの中から認識して
いく必要があるのに対して、この装置では指定したパタ
ーンと一致する局部パターンを探索するだけでよいとい
うことである。そのため処理量はずつと軽減されてい
る。 この探索の処理量をさらに減少させるためには、指定
語が複数の文字からなるときに、1文字ずつに分離し、
まずその中の1文字だけを探索し、一致が検出される
と、次の文字が隣接する局部にないかどうかを調べるよ
うにするとよい。こうすることによつて指示部が行の末
尾と次の行の先頭とに分離して存在する場合にも対応で
きる。また枠なし文字読取り装置で行なわれているよう
に、まず行位置の抽出と、文字ピツチの抽出を行ない、
1文字毎の切出しを行なつた後、照合する方法が採用で
きる。また一方高速に照合する専用の回路を用いるなら
最初から全面を探索する方法も可能となる。 さらに探索時間短縮のために、対象文書に固有の知識
を用いる方法がある。例えば、特許公報の場合、図中の
要素は数字の指示語がつけられているので、操作者が指
示するものも数字となると考えられる。一方文章中では
この数字による指示語はほぼ数値の小さい方から順に出
現する。数度出現する場合も始めて出現する箇所は順序
通りであり、その所に、その要素が何か説明されている
と考えられる。従つて、何度かこの探索を行なう間に指
示語の番号と、その文章中での位置との対応表が作成で
きる。新らたにある番号の指示語を探索する際には、こ
の対応表を参考して、どの部分を探索すれば検出できる
かが推定でき、全文を探索するより短時間に検出できる
ことが期待できる。特許公報の例に限らず、一般に図・
表の番号については同じことが言える。 103のステツプのための2つの場合と、104のステツプ
のための2つの場合との選択は、供給されるデータの形
式によつて定まる。第1図の実施例は両者ともコードの
形式である場合、第4図の実施例は両者とも画像の形で
ある場合にそれぞれ対応するが、その他に図表は画像,
文章はコードで記憶されている場合があり、この場合に
は組合せで構成することができる。 第3図に示した予め指示語位置関係表を作成する110
のステツプでは、特許文献のときには図表番号及び、番
号による指示語について作成しておけばよい。また一般
文書についても、図表番号のみでも作成しておけば、操
作者が指示した要素を含む図表の番号から、その要素の
文章中での推測される出現位置の範囲を絞ることができ
る。 105のステツプの文章の表示については次のように実
施すればよい。指示語の出現位置が求まると、その前後
数行を切出し、表示に出す。あるいはその位置を含むパ
ラグラフを検出して出すことも考えられるが、長くなる
こともあるので、そのときには前後数行に限るとしても
よい。いずれにしても表示範囲をスクロールの指示によ
つてずらすことができるようにしておけばよい。 また、表示の配置については、操作者の指示した図表
の全体あるいは指示した近傍を除いた画面に文章表示の
位置を設定すればよい。画面が小さいときには、元の図
表を覆ってしまうことになるが簡単に再び図表の表示に
戻れるようにすればよい。 〔発明の効果〕 本発明によれば、図表中の要素を指示するのみで、対
応する文章を自動的に探索し並置表示することができ、
操作者が文章中を探索する必要がなく、文献理解のため
の効率が向上する。この機能は従来の紙で綴じた文書を
見る方法では不可能であつた新しい機能である。
【図面の簡単な説明】 第1図は本発明の一実施例の構成図、第2図は本発明に
よる操作のフローチヤートを示す図、第3図は本発明に
よる操作の他のフローチヤートを示す図、第4図は本発
明の他の実施例の構成図である。第5図は本発明による
表示例を示す図である。 2……図表データ、3……文章データ、4……描画処理
部、8……座標入力部、11……一致サーチ部、24……パ
ターンサーチ部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中野 康明 国分寺市東恋ヶ窪1丁目280番地 株式 会社日立製作所中央研究所内 (56)参考文献 特開 昭63−62033(JP,A)

Claims (1)

  1. (57)【特許請求の範囲】 1.システムに記憶された文章データ及び図表データを
    含む文書データから、操作者の要求に応じて必要な文章
    データを順次あるいは並置して表示可能な文章を検索・
    表示する方法において、 上記図表データのうち表示された図表データから、上記
    操作者が指示した画面位置に応じて上記表示された図表
    データまたはその要素を特定する指示語を抽出し、 抽出された指示語が画像として記憶されている場合に
    は、抽出された指示語を上記文章データで使用されてい
    る文字のフォント及びサイズの文字画像データに変換
    し、 変換された文字画像データを用いて、上記文章データの
    中から上記指示語を検索し、 検索された指示語に該当する文章データの所在位置を求
    め、 求められた所在位置に基づいて該当する文書データを表
    示することを特徴とする文章を検索・表示する方法。 2.特許請求の範囲第1項に記載の文章を検索・表示す
    る方法において、 上記操作者が画面位置から所定の距離に含まれる近傍領
    域を抜き出し、抜き出された近傍領域から文字と考えら
    れる第1のセグメントを抽出し、抽出された第1のセグ
    メントから所定の距離に含まれる第2のセグメントを抽
    出し、抽出された第2のセグメントの各々を文字候補と
    して認識し、文字として認識されたものを上記指示語と
    して抽出することを特徴とする文章を検索・表示する方
    法。 3.特許請求の範囲第2項に記載の文章を検索・表示す
    る方法において、 予め、図形要素と上記図形要素の名前を対応づけて記憶
    しておき、上記第1および第2のセグメントが図形要素
    である場合は、記憶された名前を指示語として抽出する
    ことを特徴とする文章を検索・表示する方法。 4.特許請求の範囲第1項乃至第3のいずれかに記載の
    文章を検索・表示する方法において、 上記文章データおよび上記図表データのうち少なくとも
    一方を走査して、上記指示語および上記指示語の出現位
    置を求め、求められた指示語および出現位置の関係を指
    示語データ位置関係表として記憶しておき、 上記指示語データ位置関係表を用いて、検索された指示
    語に該当する文章データの所在位置を求めることを特徴
    とする文章を検索・表示する方法。 5.システムに記憶された文章データ及び図表データを
    含む文書データから、操作者の要求に応じて必要な文章
    データを順次あるいは並置して表示可能な文章を検索・
    表示する方法において、 上記図表データのうち表示された図表データから、上記
    操作者が指示した画面位置に応じて、上記表示された図
    表データまたはその要素を特定し少なくともその1部に
    数字を含む指示語を抽出し、 上記文章データの中から上記指示語を検索し、 検索された指示語に該当する文章データの所在位置を求
    め、 求められた所在位置と上記指示語の対応関係を示す対応
    表を作成し、 次回の検索を行う際は、上記対応表を用いて上記文章デ
    ータのうち所定領域を検索することを特徴とする文章を
    検索・表示する方法。
JP62128139A 1987-05-27 1987-05-27 文章を検索・表示する方法 Expired - Lifetime JP2695784B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62128139A JP2695784B2 (ja) 1987-05-27 1987-05-27 文章を検索・表示する方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62128139A JP2695784B2 (ja) 1987-05-27 1987-05-27 文章を検索・表示する方法

Publications (2)

Publication Number Publication Date
JPS63293674A JPS63293674A (ja) 1988-11-30
JP2695784B2 true JP2695784B2 (ja) 1998-01-14

Family

ID=14977365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62128139A Expired - Lifetime JP2695784B2 (ja) 1987-05-27 1987-05-27 文章を検索・表示する方法

Country Status (1)

Country Link
JP (1) JP2695784B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528193A (ja) * 1991-07-24 1993-02-05 Dainippon Printing Co Ltd 学術論文データベースシステム
AU2003227416A1 (en) * 2002-12-29 2004-07-29 Yuugenkaisha Homeposition Electronic document editing program
JP4865526B2 (ja) * 2006-12-18 2012-02-01 株式会社日立製作所 データマイニングシステム、データマイニング方法及びデータ検索システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6362033A (ja) * 1986-09-02 1988-03-18 Nec Corp 関連情報表示装置
JPH0314106Y2 (ja) * 1986-10-14 1991-03-29

Also Published As

Publication number Publication date
JPS63293674A (ja) 1988-11-30

Similar Documents

Publication Publication Date Title
JP3471919B2 (ja) 機械作動方法及びプロセッサ制御機械を作動するために使用する方法
JP3471920B2 (ja) 計算処理上重要な対応を決定するための方法及びプロセッサ制御システムを作動する方法
JP2993673B2 (ja) 電子ファイル装置
US5832474A (en) Document search and retrieval system with partial match searching of user-drawn annotations
US5734882A (en) Pictographic bitmap naming of files in pen-based computer systems
US5754712A (en) Image processing apparatus
US6687876B1 (en) Method and system for maintaining freeform ink annotations on changing views
JP5665125B2 (ja) 画像処理方法、及び、画像処理システム
JPH1196166A (ja) 文書情報管理システム
JPH0128980B2 (ja)
US20170132484A1 (en) Two Step Mathematical Expression Search
US6421461B1 (en) Pattern recognition apparatus which compares input pattern feature and size data to registered feature and size pattern data, an apparatus for registering feature and size data, and corresponding methods and memory media therefor
JP2005182460A (ja) 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体
JP2695784B2 (ja) 文章を検索・表示する方法
JPH07110845A (ja) 手書き入力情報処理管理システム
JPH01159759A (ja) 文書を検索・表示する方法
JP3422157B2 (ja) 手書き文字入力装置および手書き文字入力方法
JP2550068B2 (ja) 情報の検索・表示方法
JPH0128981B2 (ja)
JPH0689330A (ja) 画像ファイリングシステム
JPH08202859A (ja) 電子ファイリング装置及びその方法
JP2993881B2 (ja) キーワード生成方法
JP3878174B2 (ja) レコード抽出方法、レコード抽出装置、及びレコード抽出プログラム
JPH04123262A (ja) 表形式データ処理装置
JPH0214367A (ja) 文書検索・表示方法および装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070912

Year of fee payment: 10