JP3143345B2 - 文字列検索装置 - Google Patents

文字列検索装置

Info

Publication number
JP3143345B2
JP3143345B2 JP06299427A JP29942794A JP3143345B2 JP 3143345 B2 JP3143345 B2 JP 3143345B2 JP 06299427 A JP06299427 A JP 06299427A JP 29942794 A JP29942794 A JP 29942794A JP 3143345 B2 JP3143345 B2 JP 3143345B2
Authority
JP
Japan
Prior art keywords
character string
document
search
structural unit
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06299427A
Other languages
English (en)
Other versions
JPH08161349A (ja
Inventor
真樹 作田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP06299427A priority Critical patent/JP3143345B2/ja
Priority to US08/509,013 priority patent/US5940842A/en
Publication of JPH08161349A publication Critical patent/JPH08161349A/ja
Application granted granted Critical
Publication of JP3143345B2 publication Critical patent/JP3143345B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字列検索装置に関し、
特に構造化された文書に対して全文検索(フルテキスト
サーチ)を行ったときにヒットされた文字列が文書のど
の構造単位にあるかを対話的に表示させるような処理を
行う文字列検索装置に関する。
【0002】近年、パーソナルコンピュータ又はワード
プロセッサによって大量の文書が電子化されるようにな
ってきた。電子化された文書は、異なる機種で作成した
文書の交換や文書の再利用がしにくいといった問題があ
るが、文書交換に関する国際規約であるSGML(Stan
dard Generalized Markup Language)の採用によりこれ
らの問題は解決されている。
【0003】SGMLによって書かれた文書(SGML
文書)は、SGML宣言、文書型定義(DTD:Docume
nt Type Definition)及び文書インスタンスの三つの部
分から構成されている。SGML宣言は、環境や言語の
異なるシステム間の交換を保証するためのもので、文字
体系、宣言や定義に使用する記号及びタグ名に使用する
文字の宣言を行う。DTDは文書の要素による論理構造
とその属性とを定義する。要素は、たとえば、章・節・
段落などであり、DTDは、その要素の構造とタグの名
称(要素名)、タグの出現回数、タグの出現順番、置換
語句、タグの省略可否などを定義する。文書インスタン
スは、DTDに従ってタグ付けされた実際の文書であ
る。
【0004】
【従来の技術】SGML文書のように構造化された文書
に対して全文検索を行った場合、構造化されていない文
書と同様に、一般的には検索結果は次のような方法で表
示される。すなわち、(1)検索利用者に対して、検索
対象の文字列が文書中に存在していることを該当件数、
又はヒットされたファイル名で通知する、(2)検索対
象の文字列が文書中に存在していることを通知するとと
もに文書中における出現位置を表示する、及び(3)検
索対象の文字列が文書中に存在していることを通知する
とともに文書中における出現位置の前後を特定の文字数
だけ表示する、などの方法がある。
【0005】
【発明が解決しようとする課題】検索された文字列が本
当に利用者の求める文字列であるかどうかを判断するた
めには、文字列の前後関係等から判断する必要がある。
しかしながら、従来の技術では、検索された文字列の前
後が全く表示されなかったり、仮に表示されても特定の
範囲だけしか表示されなかったりするため、利用者が判
断のために必要とする十分な情報が得られないという問
題があった。
【0006】本発明はこのような点に鑑みてなされたも
のであり、検索された文字列の前後の表示範囲を利用者
の指示に基づいて会話的に拡大していくこと、特に構造
化された文書に対しては構造単位で拡大していくこと
で、検索文字列が本当に利用者の求める文字列であった
かどうかの判断を容易に行うことができる文字列検索装
置を提供することを目的としている。
【0007】
【課題を解決するための手段】図1は上記目的を達成す
る本発明の原理図である。構造化された文書に対して全
文検索を行うため、外部記憶手段10には構造化された
文書が収められた文書ファイル11が格納されている。
この外部記憶手段10には文書ファイル11を読み出す
文書ファイル読み込み手段12が接続されている。文書
ファイル読み込み手段12の出力にはメモリ手段13が
接続されていて、その一部の文書領域13aには、文書
ファイル読み込み手段12によって読み込まれた文書フ
ァイル11の文書内容が展開される。メモリ手段13に
は、文書領域13aに展開された文書内容を全文検索し
てメモリ手段13に検索対象文字列の出現位置の情報を
保存する該当位置テーブル13bを生成する文字列検索
手段14が接続されている。メモリ手段13には、ま
た、文書領域13aに展開された文書内容の構造を解析
してメモリ手段13に検索対象文字列を含む構造単位の
位置情報を保存する構造単位位置テーブル13cを生成
する構造解析手段15が接続されている。メモリ手段1
3には、さらに、メモリ手段13に格納された文書領域
13a、該当位置テーブル13b及び構造単位位置テー
ブル13cから表示対象とする構造単位の文書内容を取
り出す文書内容取り出し手段16が接続されている。文
書内容取り出し手段16には、取り出す構造単位を文書
内容取り出し手段16に対して指示する拡大指示手段1
7が接続され、文書内容取り出し手段16によって取り
出された構造単位の文書内容を表示する表示手段18が
接続されている。
【0008】
【作用】上述の手段によれば、文書ファイル読み込み手
段12によってメモリ手段13の文書領域13aに展開
された構造化文書は、文字列検索手段14によって検索
対象文字列の検索が行われ、これによってヒットした文
書領域13a内での検索対象文字列の位置情報が該当位
置テーブル13bに格納される。一方、構造解析手段1
5は文書領域13aに展開された文書の構造を解析して
文書領域13a内での構造単位の位置情報を構造単位位
置テーブル13cに格納する。
【0009】文書内容取り出し手段16は、文書領域1
3a、該当位置テーブル13b及び構造単位位置テーブ
ル13cの内容から、まず、検索対象文字列を含む最小
構造単位の文書内容を取り出し、表示手段18に表示す
る。拡大指示手段17の指示に応じて、文書内容取り出
し手段16は順次1段階大きな構造単位の文書内容を取
り出していき、表示手段18に表示する。
【0010】
【実施例】以下、本発明の一実施例を図面に基づいて説
明する。図1は本発明の文字列検索装置の構成を示す図
である。図1の構成によれば、文字列検索装置は、外部
記憶手段10を備え、この外部記憶手段10には1つ又
は複数の文書ファイル11が格納されている。文書ファ
イル11はたとえばSGMLによって構造化された文書
が収められている。外部記憶手段10には文書ファイル
11を読み出す文書ファイル読み込み手段12が接続さ
れている。この文書ファイル読み込み手段12の出力は
メモリ手段13に接続されている。
【0011】このメモリ手段13は、文書ファイル読み
込み手段12によって読み込まれた文書ファイル11の
文書内容が展開される文書領域13aと、この文書領域
13a内の検索対象文字列及び構造単位の出現位置の情
報を保存する該当位置テーブル13b及び構造単位位置
テーブル13cとを格納している。メモリ手段13は、
また、文書領域13aに展開された文書内容を全文検索
してメモリ手段13の該当位置テーブル13bに保存す
る文字列検索手段14と、文書領域13aに展開された
文書内容の構造を解析してメモリ手段13の構造単位位
置テーブル13cに保存する構造解析手段15とが接続
されている。メモリ手段13は、さらに、メモリ手段1
3に格納された文書領域13a、該当位置テーブル13
b及び構造単位位置テーブル13cの内容を受けて、表
示対象の構造単位の文書内容を取り出す文書内容取り出
し手段16が接続されている。この文書内容取り出し手
段16には、これに対して取り出す文書内容の構造単位
を指示する拡大指示手段17が接続され、また、文書内
容取り出し手段16によって取り出された構造単位の文
書内容を表示する表示手段18が接続されている。
【0012】外部記憶手段10から文書ファイル読み込
み手段12によって文書ファイル11が読み込まれる
と、その文書内容はメモリ手段13の文書領域13aに
展開される。ここで、文字列検索手段14が、文書領域
13aに展開された文書内容に対して検索対象文字列の
検索を行う。全文検索の結果、該当する文字列がヒット
されると、文書領域13a内での検索対象文字列のヒッ
ト位置の情報、すなわち、その検索対象文字列の開始位
置及び終了位置の情報がメモリ手段13の該当位置テー
ブル13bに格納される。また、構造解析手段15で
は、メモリ手段13の文書領域13aに展開された文書
の構造の解析が行われる。この文書の構造の解析は、構
造化された文書がSGML文書であれば、文書の論理構
造を定義しているDTDを調べることによって行われ
る。分析によって得られた文書領域13a内での文書構
造単位の位置情報、すなわち、各構造単位の開始位置及
び終了位置の情報はメモリ手段13の構造単位位置テー
ブル13cに格納される。この構造解析手段15による
解析操作は、文字列検索手段14の検索操作と並行し
て、又は検索操作の前又は後に行われる。
【0013】文書内容取り出し手段16は、文書ファイ
ル読み込み手段12による読み込み、文字列検索手段1
4による検索、及び構造解析手段15による構造解析が
終わって、メモリ手段13に文書領域13a、該当位置
テーブル13b及び構造単位位置テーブル13cが揃っ
た後に起動される。文書内容取り出し手段16は、最
初、文書領域13aからの文書内容の取り出しを最小構
造単位に設定されている。たとえば、文書の構成要素が
章であり、章の構成要素が節であり、節の構成要素が項
であり、項の構成要素が段落であり、段落の構成要素が
文である、というように階層的に構造化された文書であ
るとすれば、検索対象文字列を含む文が取り出されて、
表示手段18に表示される。
【0014】ここで、拡大指示手段17によって拡大指
示が指示されると、文書内容取り出し手段16は、1段
階大きな構造単位、すなわち、上記の例であれば、先に
取り出された文を含む段落が取り出されて、表示手段1
8に表示される。同様に、拡大指示手段17による拡大
指示が行われると、次は、その段落を含む項が取り出さ
れ、次の指示では、その項を含む節が取り出され、次の
指示で、その節を含む章が取り出され、そして、次の指
示で、その章を含む文書が取り出されて、表示手段18
に表示される。このように指示することで、検索対象文
字列を、これが含まれる最小の構造単位から順次、意味
のある階層構造に従って表示することができる。
【0015】図2は全文検索時の作用を示すフローチャ
ートである。このフローチャートによれば、全文検索時
は、まず、文書領域13aに展開された文書内容に対し
て文字列検索手段14が文字列の検索を行う(ステップ
S1)。次に、検索条件に合致しているかどうかが判断
される(ステップS2)。ここで、検索条件としては、
検索対象文字列の完全一致の他、パターンマッチングに
よる曖昧な検索条件も含む。ステップS2において、検
索条件に合致していなければ、そのまま終了し、検索条
件に合致していれば、検索対象文字列の文書領域13a
内の位置の情報を該当位置テーブル13bに書き込む
(ステップS3)。
【0016】図3は文書内容取り出し時の作用を示すフ
ローチャートである。このフローチャートによれば、文
書の構造の解析及び文書の全文検索が終了すると、条件
に合致する箇所を含む最小構造単位の文書内容を取り出
す(ステップS11)。そして、取り出した構造単位の
文書内容を表示する(ステップS12)。ここで、表示
された構造単位の文書内容で良いかどうかが判断される
(ステップS13)。もし、この表示された文書内容で
良ければ、そのまま終了し、さらに上の階層の構造単位
を参照したければ、下に進む。ここで表示対象の構造単
位の拡大指示があるかどうかが判断される(ステップS
14)。このステップS14の判断において、構造単位
の拡大指示がなければ、表示されている構造単位の表示
を続け、構造単位の拡大指示があれば、いま、表示して
いる構造単位は階層構造の終わりの最大構造単位かどう
かが判断される(ステップS15)。もし、表示してい
る構造単位が最大構造単位であれば、それ以上の拡大表
示はできないので、必要に応じて、最大構造単位である
ことを検索利用者に通知して表示されている構造単位の
表示を続ける。表示している構造単位が最大構造単位で
なければ、条件に合致する箇所を含む1段階大きな構造
単位の文書内容の取り出しを行い(ステップS16)、
ステップS12に戻って、取り出した構造単位の文書内
容の表示を行う。
【0017】図4は文書の構造の一例を示す図である。
この例に示した文書の構造によれば、全体が文書20で
ある。この文書20の構成要素は段落21、22であ
り、各段落21、22の構成要素は文23及び24、2
5及び26であるとする。そして、検索対象文字列「a
bcd」は文26の中にあるとする。このような文書に
対して文字列「abcd」の検索を実行して、文26の
中の文字列「abcd」がヒットされたとすると、検索
結果の表示は次のようになる。
【0018】図5は検索直後の検索結果の表示例を示す
図である。検索実行後、最初に表示されるのは、検索対
象文字列「abcd」を含む最小構造単位の文書内容で
ある文26である。この文26は、たとえば画面の適当
な場所にウィンドウを開いて、そのウィンドウの中に表
示される。このとき、文字列「abcd」は検索対象文
字列であること示すため、強調表示される。図示の例で
は、検索対象文字列にアンダーラインを付してあるが、
文字又はその背景の色を変えたり、網かけするなど、同
一構造単位の文書内容の他の文字列と区別することがで
きる形であれば、どのような強調表示でもよい。
【0019】図6は表示対象単位の拡大指示後の検索結
果の表示例を示す図である。検索対象文字列「abc
d」を含む文26を表示しているときに、表示対象単位
の拡大指示を行うと、この文26を含む1段階上の階層
の段落22が表示される。この段落22には、2つの文
25、26を含んでいるので、これらが一緒に表示され
ることになる。
【0020】ここで、さらに表示対象単位の拡大指示を
行うと、この段落22を含むさらに1段階上の階層の構
造単位の文書内容が表示される。ここでは、段落22の
上の構造単位の文書内容は文書20であるので、図4に
示した文書20がそのまま表示されることになる。この
ように、表示対象単位の拡大指示を行う度に、表示対象
を構造単位で拡大して表示する。
【0021】図7は複数文書の検索結果一覧を示す図で
ある。複数の文書を検索対象とした場合には、検索結果
一覧の画面30が表示手段の表示画面に表示される。検
索結果一覧の画面30は、検索対象文字列がヒットされ
た順番を表示する「番号」の欄と、検索対象文字列が含
まれる文書の名称を表示する「文書名」の欄と、検索対
象文字列が含まれる最小構造単位の文書内容を表示する
「該当部分」の欄とを有している。検索対象文字列のヒ
ット件数が多くて、検索結果一覧の画面30に表示しき
れない場合には、スクロールすることによってヒットさ
れた全件を表示させることができる。
【0022】ここで、一覧表示されている複数文書の中
から1文書を指定して、表示対象単位の拡大指示を行う
とする。拡大指示の方法としては、拡大指示したい文書
をたとえばマウスカーソルにより指示することで選択
し、次いで、マウスカーソルをその選択した文書の位置
に置いた状態でたとえばダブルクリックすることによ
り、あるいはたとえば選択後に表示されるプルダウンメ
ニュー又はポップアップメニューから拡大指示コマンド
を選択することにより、拡大指示が実行される。
【0023】図8は検索結果一覧からの表示対象単位の
拡大指示後の表示例を示す図である。この例では、たと
えば文書名「BUN001」に対して表示対象単位の拡
大指示を行った場合であり、かつ、この文書は図4に示
した文書構造と同じ構造を有しているものとする。
【0024】文書名「BUN001」に対して表示対象
単位の拡大指示を行うと、拡大表示画面40がウィンド
ウ表示され、その中に、検索結果一覧の画面30の該当
部分に表示されていた検索対象文字列を含む最小構造単
位はもちろん、その構造単位が含まれる1段階上の階層
の構造単位の文書内容が表示される。すなわち、最小構
造単位の文26を含む1段階上の階層の段落22が表示
される。この段落22には、文26の他に最小構造単位
の文25を含んでいるので、拡大表示画面40にはその
文25も一緒に表示されることになる。
【0025】ここで、表示されている段落22の構造単
位に対して、さらに表示対象単位の拡大指示を行うとす
ると、拡大表示画面40は、以下のように表示されるよ
うになる。
【0026】図9は拡大表示からの表示対象単位の拡大
指示後の表示例を示す図である。図8に示した表示状態
で、表示対象単位の拡大指示を行うと、この段落22を
含むさらに1段階上の階層の構造単位の文書構造が表示
される。ここでは、段落22の上の構造単位は文書20
であるので、図4に示した文書20がそのまま表示され
ることになる。
【0027】このように表示対象単位の拡大指示を行う
度に、検索対象文字列を中心としてその検索対象文字列
を取り巻く情報が順次広がっていき、この広がった情報
から検索文字列が目的の位置にある文字列かどうかを判
断することが容易になる。
【0028】図10は本発明を実施するコンピュータシ
ステムのハードウエア構成の一例を示す図である。図に
おいて、コンピュータシステムは、プロセッサ51と、
読み取り専用メモリ(ROM)52と、メインメモリ
(RAM)53と、グラフィック制御回路54及び表示
装置55と、マウス56と、キーボード57と、ハード
ディスク装置(HDD)58と、フロッピーディスク装
置(FDD)59と、プリンタ60とで構成されてお
り、これらの構成要素はバス61によって相互に結合さ
れている。
【0029】プロセッサ51はコンピュータシステム全
体を統括的に制御する。読み取り専用メモリ52にはた
とえば立ち上げ時に必要なプログラムが格納されてい
る。メインメモリ53にはシステムプログラム、文字列
検索・構造解析・検索結果表示用のアプリケーションプ
ログラムなどが展開されている他に、構造化された文書
から読み込んだ文書内容のデータ、該当位置テーブル、
構造単位位置テーブルなどのデータが格納される。
【0030】グラフィック制御回路54はビデオメモリ
などを有し、検索結果の表示画面、検索結果の一覧の画
面、拡大表示画面などを表示信号に変換し、表示装置5
5に送る。表示装置55は、受けた表示信号を基に検索
結果の表示画面などを表示する。
【0031】マウス56は表示装置55の画面上に表示
されているマウスカーソルを移動させ、ボタンをクリッ
クすることによって検索結果の一覧の画面から表示対象
単位の拡大を指示したり、各種メニューなどに列記され
ているコマンドを選択・指示するポインティングデバイ
スである。キーボード57は検索対象文字列などの入力
に使用される。
【0032】ハードディスク装置58は、システムプロ
グラム、全文検索・構造解析・検索結果表示用のアプリ
ケーションプログラム、文書ファイルなどが格納されて
いる。フロッピーディスク装置59はフロッピーディス
ク59aに納められている構造化文書の文書ファイルを
ハードディスク装置58に取り込むための外部記憶装置
である。
【0033】また、検索結果の一覧などのデータをプリ
ンタ60に渡して、紙に印刷することができる。
【0034】
【発明の効果】以上説明したように本発明では、構造化
された文書に対して文字又は文字列の全文検索をするこ
とで、検索対象文字列を含む最小構造単位の文書内容を
表示し、必要に応じて、最小構造単位から始まってその
構造単位を含む1段階上の階層の構造単位の文書内容を
順次表示できるように構成した。このため、検索対象文
字列を含む最小構造単位を中心にその最小構造単位を取
り巻く文字情報を構造単位で段階的に広げて表示するこ
とが可能になり、周囲の情報も一目することができるの
で、目的とする検索文字列かどうかの判断が容易にな
り、全文検索時の操作性を向上させることができる。
【図面の簡単な説明】
【図1】本発明の文字列検索装置の構成を示す図であ
る。
【図2】全文検索時の作用を示すフローチャートであ
る。
【図3】文書内容取り出し時の作用を示すフローチャー
トである。
【図4】文書の構造の一例を示す図である。
【図5】検索直後の検索結果の表示例を示す図である。
【図6】表示対象単位の拡大指示後の検索結果の表示例
を示す図である。
【図7】複数文書の検索結果一覧を示す図である。
【図8】検索結果一覧からの表示対象単位の拡大指示後
の表示例を示す図である。
【図9】拡大表示からの表示対象単位の拡大指示後の表
示例を示す図である。
【図10】本発明を実施するコンピュータシステムのハ
ードウエア構成の一例を示す図である。
【符号の説明】
10 外部記憶手段 11 文書ファイル 12 文書ファイル読み込み手段 13 メモリ手段 13a 文書領域 13b 該当位置テーブル 13c 構造単位位置テーブル 14 文字列検索手段 15 構造解析手段 16 文書内容取り出し手段 17 拡大指示手段 18 表示手段 20 文書 21、22 段落 23、24、25、26 文 30 検索結果一覧の画面 40 拡大表示画面
フロントページの続き (56)参考文献 特開 平5−28190(JP,A) 特開 平4−281559(JP,A) 特開 平4−169971(JP,A) 特開 平2−15374(JP,A) 特開 昭62−83787(JP,A) 米国特許5940842(US,A) 原正一郎,高須淳宏ほか,「文書構造 に基づく全文データベース検索用利用者 インタフェースの試作」,1993年電子情 報通信学会秋季大会講演論文集6,p56 (平成5年8月15日) 芝野耕司,「SGMLと全文データベ ース」,情報処理学会研究報告vol. 89,no.66(89−FI−14)(平成元 年7月27日),pp.1−8 今村泰介,栗田雅芳,岡本和浩,「次 世代文書処理と新検索技術」,東芝レビ ューVol.49,No.10(平成6年10 月1日),pp.733−735 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 370 G06F 17/30 170

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 構造化された文書に対して文字列検索を
    行った結果を表示する文字列検索装置において、 構造化された文書に対して文字列検索を行う文字列検索
    手段と、 前記文書の構造を解析する構造解析手段と、 前記文字列検索手段が行った検索結果及び前記構造解析
    手段が行った解析結果を記憶しておくメモリ手段と、 前記メモリ手段に記憶された前記検索結果及び解析結果
    から検索によってヒットされた文字列を含む文を、構造
    単位で表示範囲を変更して表示させる表示範囲変更手段
    と、 を備えていることを特徴とする文字列検索装置。
  2. 【請求項2】 前記メモリ手段は、構造化された文書の
    内容を展開する文書領域と、前記文書領域中の検索対象
    文字列の位置情報を前記検索結果として格納する該当位
    置テーブルと、前記文書領域中の検索対象文字列を含む
    構造単位の位置情報を前記解析結果として格納する構造
    単位位置テーブルとを有することを特徴とする請求項1
    記載の文字列検索装置。
  3. 【請求項3】 前記表示範囲変更手段は、前記該当位置
    テーブルに格納された検索対象文字列の位置情報から構
    造単位位置テーブルに格納された前記検索対象文字列を
    含む構造単位の位置情報を得て前記文書領域の該当する
    構造単位の文書内容を取り出す文書内容取り出し手段
    と、前記文書内容取り出し手段に対して前記検索対象文
    字列を含む構造単位とは別の構造単位を指示して表示範
    囲を変更させる指示手段とを有することを特徴とする請
    求項1記載の文字列検索装置。
  4. 【請求項4】 前記指示手段は、階層的に構造化された
    最小の構造単位から順次1段階上の階層の構造単位を指
    示していくことを特徴とする請求項3記載の文字列検索
    装置。
  5. 【請求項5】 前記構造化された文書は、SGML文書
    であることを特徴とする請求項1記載の文字列検索装
    置。
  6. 【請求項6】 前記構造解析手段は、SGML文書の文
    書型定義にて定義された論理構造を解析することを特徴
    とする請求項5記載の文字列検索装置。
  7. 【請求項7】 前記文書内容取り出し手段は、複数の構
    造化された文書に対して全文検索を行ったときは、検索
    対象文字列を含む構造単位の文書内容とともに検索対象
    文字列を含む文書名を一覧で表示させることを特徴とす
    る請求項3記載の文字列検索装置。
  8. 【請求項8】 前記指示手段は、検索対象文字列を含む
    構造単位の文書内容の一覧から表示されている構造単位
    の1つを選択することにより1段階上の階層の構造単位
    を指示することを特徴とする請求項7記載の文字列検索
    装置。
JP06299427A 1994-12-02 1994-12-02 文字列検索装置 Expired - Fee Related JP3143345B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP06299427A JP3143345B2 (ja) 1994-12-02 1994-12-02 文字列検索装置
US08/509,013 US5940842A (en) 1994-12-02 1995-07-31 Character string retrieval system having a variable display range

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06299427A JP3143345B2 (ja) 1994-12-02 1994-12-02 文字列検索装置

Publications (2)

Publication Number Publication Date
JPH08161349A JPH08161349A (ja) 1996-06-21
JP3143345B2 true JP3143345B2 (ja) 2001-03-07

Family

ID=17872435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06299427A Expired - Fee Related JP3143345B2 (ja) 1994-12-02 1994-12-02 文字列検索装置

Country Status (2)

Country Link
US (1) US5940842A (ja)
JP (1) JP3143345B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263332B1 (en) 1998-08-14 2001-07-17 Vignette Corporation System and method for query processing of structured documents
JP2000315206A (ja) * 1999-04-30 2000-11-14 Fujitsu Ltd 検索条件の組み合わせに基づく検索システムおよび方法
US6615209B1 (en) * 2000-02-22 2003-09-02 Google, Inc. Detecting query-specific duplicate documents
US6778983B1 (en) 2000-04-28 2004-08-17 International Business Machines Corporation Apparatus and method for accessing HTML files using an SQL query
JP3857078B2 (ja) * 2001-06-29 2006-12-13 富士通株式会社 情報提供方法及び情報提供装置
US7028024B1 (en) 2001-07-20 2006-04-11 Vignette Corporation Information retrieval from a collection of information objects tagged with hierarchical keywords
US6765595B2 (en) 2001-08-16 2004-07-20 International Business Machines Corporation Dual mode data field
GB2385686A (en) * 2002-02-25 2003-08-27 Oracle Corp Mark-up language conversion
US7603371B1 (en) * 2002-12-17 2009-10-13 Vignette Corporation Object based system and method for managing information
JP4538284B2 (ja) * 2004-09-09 2010-09-08 株式会社リコー 情報検索システム、情報検索端末、並びに、プログラムおよび記録媒体
JP4997966B2 (ja) * 2006-12-28 2012-08-15 富士通株式会社 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法
US10540426B2 (en) 2011-07-11 2020-01-21 Paper Software LLC System and method for processing document
WO2013009889A1 (en) * 2011-07-11 2013-01-17 Paper Software LLC System and method for searching a document
WO2013009904A1 (en) 2011-07-11 2013-01-17 Paper Software LLC System and method for processing document
AU2012281160B2 (en) 2011-07-11 2017-09-21 Paper Software LLC System and method for processing document
JP2015182087A (ja) * 2014-03-20 2015-10-22 住友重機械工業株式会社 射出成形機、および射出成形機の操作画面

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6283787A (ja) * 1985-10-09 1987-04-17 株式会社日立製作所 表示画面の出力制御方式
US5185698A (en) * 1989-02-24 1993-02-09 International Business Machines Corporation Technique for contracting element marks in a structured document
US5113341A (en) * 1989-02-24 1992-05-12 International Business Machines Corporation Technique for creating and expanding element marks in a structured document
US5220625A (en) * 1989-06-14 1993-06-15 Hitachi, Ltd. Information search terminal and system
CA2048039A1 (en) * 1991-07-19 1993-01-20 Steven Derose Data processing system and method for generating a representation for and random access rendering of electronic documents
JP3303926B2 (ja) * 1991-09-27 2002-07-22 富士ゼロックス株式会社 構造化文書分類装置及び方法
JPH05324645A (ja) * 1992-05-19 1993-12-07 Just Syst Corp 文書処理方法及び装置
US5523945A (en) * 1993-09-17 1996-06-04 Nec Corporation Related information presentation method in document processing system
JPH07319918A (ja) * 1994-05-24 1995-12-08 Fuji Xerox Co Ltd 文書検索対象指示装置
US5745745A (en) * 1994-06-29 1998-04-28 Hitachi, Ltd. Text search method and apparatus for structured documents

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
今村泰介,栗田雅芳,岡本和浩,「次世代文書処理と新検索技術」,東芝レビューVol.49,No.10(平成6年10月1日),pp.733−735
原正一郎,高須淳宏ほか,「文書構造に基づく全文データベース検索用利用者インタフェースの試作」,1993年電子情報通信学会秋季大会講演論文集6,p56(平成5年8月15日)
芝野耕司,「SGMLと全文データベース」,情報処理学会研究報告vol.89,no.66(89−FI−14)(平成元年7月27日),pp.1−8

Also Published As

Publication number Publication date
JPH08161349A (ja) 1996-06-21
US5940842A (en) 1999-08-17

Similar Documents

Publication Publication Date Title
JP3143345B2 (ja) 文字列検索装置
US5963205A (en) Automatic index creation for a word processor
US7596766B1 (en) Preview window including a storage context view of one or more computer resources
US5708825A (en) Automatic summary page creation and hyperlink generation
US5982365A (en) System and methods for interactively generating and testing help systems
CA2496341A1 (en) Method and apparatus for visually emphasizing numerical data contained within an electronic document
JP2000029906A (ja) 文書情報管理システム
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
JPH1125098A (ja) 情報処理装置、リンク先ファイルの取得方法および記憶媒体
JP2000089882A (ja) 言語の翻訳・学習支援システム及びプログラム記憶媒体
JP3383049B2 (ja) 文書検索装置
US8381183B2 (en) Navigation in computer software applications developed in a procedural language
JPH08287088A (ja) 情報検索方法及びその装置
JP2947686B2 (ja) 翻訳支援システムにおける検索結果表示方式
JP3714723B2 (ja) 文書表示システム
JP3537260B2 (ja) リンク付文書検索表示システム
JP2001005445A (ja) 文書の表示方法
JP3056810B2 (ja) 文書検索方法および装置
JP2001043220A (ja) 文書処理方法及び装置並びに記録媒体
JPH08297659A (ja) 文字列変換処理方式
JP3193249B2 (ja) キーワード検索方法
JP3313483B2 (ja) キーワード作成装置
JPH1145253A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0981581A (ja) データベースの作成方法
Tools A Corpus/Annotation Toolbox

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081222

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees