JPH06301721A - Whole sentence data base retrieving method - Google Patents

Whole sentence data base retrieving method

Info

Publication number
JPH06301721A
JPH06301721A JP5091080A JP9108093A JPH06301721A JP H06301721 A JPH06301721 A JP H06301721A JP 5091080 A JP5091080 A JP 5091080A JP 9108093 A JP9108093 A JP 9108093A JP H06301721 A JPH06301721 A JP H06301721A
Authority
JP
Japan
Prior art keywords
search
document
data base
sgml
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5091080A
Other languages
Japanese (ja)
Other versions
JP3573471B2 (en
Inventor
Hiroshi Ota
浩史 太田
Yasutsugu Nomura
泰嗣 野村
Tetsuya Kurebayashi
徹也 紅林
Kiyoshi Yamada
清志 山田
Masamitsu Negishi
正光 根岸
Keizo Oyama
敬三 大山
Akira Miyazawa
彰 宮澤
Koji Shibano
耕司 芝野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP09108093A priority Critical patent/JP3573471B2/en
Publication of JPH06301721A publication Critical patent/JPH06301721A/en
Application granted granted Critical
Publication of JP3573471B2 publication Critical patent/JP3573471B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To provide the whole sentence data base retrieving system by which the designation of a retrieval request sentence containing the logical structure information of a document and the display of a result of retrieval can be executed, in the processing for retrieving the whole sentence of the document having a logical structure. CONSTITUTION:An original document described by an inputted SGML is decomposed, based on its structure information, a data base of structure information 7, tag information 8 and text information 9 is generated by a data base generating part 3 of an SGML server, the generated data base is stored in a data base control system, a retrieval request 16 inputted by the SGML is converted to an SQL being data base retrieval language and a retrieval processing is executed by a relational data base control system, and a result of retrieval 15 is organized to an SGML 17, and displayed on a work station.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、予め人手によるキーワ
ードの作成を必要とせずに文章に含まれる全ての単語を
検索対象とすることが可能である全文データベース検索
方法、特に論理的構造をもった文書データをデ−タベ−
スとして格納し検索するデータベース検索方法に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention has a full-text database search method capable of searching all the words included in a sentence without the need to manually create keywords in advance, and in particular has a logical structure. The document data
The present invention relates to a database search method for storing and searching as a database.

【0002】[0002]

【従来の技術】従来の文書検索方式では、キーワード作
成に必要とする工数およびキーワードの付け方が悪かっ
たことによるヒット漏れの問題を解決する方法として、
文献全文を検索対象とする全文デーベース検索方式が用
いられている。しかし、この全文データベース検索方式
では全文書が検索範囲となり、無駄なヒットが生じる。
この問題を解決する手段として、文書の論理構造を指定
して検索要求を行ない、検索効率を上げる方法が用いら
れている。このような検索を行う検索方式として、文書
を何らかの方法で分解し蓄積して、検索処理を行うもの
がある。このような検索方式の公知例として、例えば、
特開平01−189721号公報、特開平01−189
722号公報では、文書を予め設定された複数の軸によ
り整理して文書を格納し、検索時にはそれらの軸により
検索を指定する方式がある。しかし、この手法では文書
構造を指定した検索処理は行えない。また、特開平03
−62169号公報では、文書を画像、図形、テキスト
の情報に分離し各メディアごとにデ−タの構造を自動的
に抽出し分解し、マルチメディアファイルとして格納し
検索を行う。
2. Description of the Related Art In the conventional document retrieval method, as a method of solving the problem of hit omission due to bad man-hours required for keyword creation and bad keyword attachment,
A full-text database search method is used in which full texts of documents are searched. However, in this full-text database search method, all documents are included in the search range, resulting in useless hits.
As a means for solving this problem, a method of making a search request by designating a logical structure of a document and improving search efficiency is used. As a search method for performing such a search, there is a search method in which a document is decomposed and stored by some method and then the search process is performed. As a known example of such a search method, for example,
Japanese Patent Laid-Open Nos. 01-189721 and 01-189
In Japanese Patent Laid-Open No. 722, there is a method of organizing a document by a plurality of preset axes to store the document and designating the search by these axes at the time of retrieval. However, this method cannot perform a search process that specifies the document structure. In addition, Japanese Patent Laid-Open No.
In Japanese Patent Laid-Open No. 62169, a document is separated into image, graphic, and text information, and the structure of data is automatically extracted and decomposed for each medium, stored as a multimedia file, and searched.

【0003】[0003]

【発明が解決しようとする課題】上記従来技術では、文
書の分解を画像、図形、テキストなどのメディアごと
に、行い、マルチメディア情報としてデ−タベ−スに格
納するために、画像、図形に対する検索要求を実行する
ことが可能である反面、専用のマルチメディアデ−タベ
−ス管理システムを開発する必要がある。
In the above prior art, the documents are decomposed for each medium such as images, figures and texts, and the images and figures are stored in order to be stored in the database as multimedia information. While it is possible to execute search requests, it is necessary to develop a dedicated multimedia database management system.

【0004】本発明の目的は、論理的構造をもった文書
をその構成要素単位に分解し、汎用のリレーショナルデ
ータベースに格納することにより、デ−タベ−ス利用者
が認識している文書構造と検索システムが認識している
デ−タ構造を一致させ、その文書構造情報を含む検索要
求をリレーショナルデータベース検索用の記述言語で記
載することにより、文書の構造情報を含む検索要求文の
指定による検索結果の表示を可能とする全文デ−タベ−
ス検索方法を提供することにある。
An object of the present invention is to decompose a document having a logical structure into its constituent elements and store it in a general-purpose relational database so that the document structure is recognized by a database user. Retrieval by designating a retrieval request sentence containing document structure information by matching the data structure recognized by the retrieval system and describing the retrieval request containing the document structure information in a description language for relational database retrieval. Full-text database that enables display of results
To provide a search method.

【0005】[0005]

【課題を解決するための手段】本発明は、文書の構成要
素単位で文書を分解して、文書の論理的構造を示す構造
情報と、この構成要素を識別するための構成要素識別子
例えばタグと、この構成要素識別子に続くテキスト情報
とを含むデ−タベ−スを作成するデ−タベ−ス作成ステ
ップと、入力された構成要素識別子を含む検索要求文を
デ−タベ−ス検索用の言語記述に変換する検索要求文生
成ステップと、検索要求文生成ステップにより生成され
る検索要求文に基づいてデータベースを検索するステッ
プと、得られた検索結果を構成要素識別子とこれに続く
テキスト情報の形式に変換する検索結果編成ステップ
と、この検索結果を表示する表示ステップとを設ける。
According to the present invention, a document is decomposed in units of constituent elements of the document, structural information indicating a logical structure of the document, and constituent element identifiers such as tags for identifying the constituent elements are provided. , A database creating step for creating a database including text information following the component identifier, and a search request sentence containing the input component identifier for a database search language A search request statement generation step for converting into a description, a step for searching a database based on the search request statement generated by the search request statement generation step, the obtained search result as a component identifier and the format of text information following it There is provided a search result organization step of converting the search result to a display step of displaying the search result.

【0006】[0006]

【作用】論理的構造をもった文章の全文データベース検
索処理において、デ−タベ−ス作成ステップでは入力さ
れる原文書を分割し、文書の構造情報と、その構成要素
を識別するための構成要素識別子と、構成要素識別子に
続くテキストとを含むデ−タベ−スを作成し、検索要求
文生成ステップでは検索処理の際に指定される検索要求
文を文書の論理的構造とデ−タベ−ス構造の対応関係を
もとにデ−タベ−ス検索用の言語記述に変換し、検索結
果編成ステップでは検索処理の結果得られる文書デ−タ
をそのID、順序番号をもとにソ−トして結合すること
により文書の構造情報を含む言語記述に変換し、表示ス
テップでは表示装置に検索結果を表示することにより、
文書の構造情報を含む検索要求文の指定と、検索結果の
表示を可能とする。
In the full-text database search processing of a sentence having a logical structure, the input original document is divided in the database creating step, and the structural information of the document and the constituent elements for identifying the constituent elements are divided. A database including an identifier and a text following the constituent element identifier is created, and in the search request sentence generation step, the search request sentence specified in the search process is processed into the logical structure of the document and the database. Based on the structural correspondence, it is converted into a language description for database search, and in the search result organization step, the document data obtained as a result of the search process is sorted based on its ID and sequence number. Then, by combining and converting into a language description including the structural information of the document, and displaying the search result on the display device in the display step,
It is possible to specify the search request sentence including the document structure information and display the search result.

【0007】[0007]

【実施例】以下、本発明の一実施例について図面を用い
て説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.

【0008】図1は本発明の一実施例のシステム構成図
である。本実施例では、原文書はSGMLで記載され、
デ−タベ−ス管理システムとのインタ−フェ−スにはS
QLを用いるものとする。SGML(Standard
GeneralizedMarkup Langua
ge)とは、ISO(国際標準機構)で定められた規格
で、文書を構造化することを可能とする汎用組版指示言
語である。SQL(Structured Query
Language)はリレ−ショナルデ−タベ−スの
標準処理言語である。SGMLを用いた文書の構造の表
現にはタグが用いられる。タグには開始タグと終了タグ
とがあり、文書構造情報の構成要素を開始タグと終了タ
グで囲むことにより、文書中の文章の区切りと、その文
章が文書構造上どの構成要素に属するのかを明確にす
る。ここで開始タグは要素名称を記号「<」と「>」で
閉じたものであり、終了タグは要素名称を「</」と
「>」で閉じたものである。タグに続く構成要素の内容
がテキストである。検索対象である構造情報を含む文書
は、タグとテキストからなる。
FIG. 1 is a system configuration diagram of an embodiment of the present invention. In this embodiment, the original document is written in SGML,
S for the interface with the database management system
QL shall be used. SGML (Standard)
Generalized Markup Langua
ge) is a standard defined by ISO (International Organization for Standardization), and is a general-purpose typesetting language that enables structured documents. SQL (Structured Query)
Language) is a standard processing language for relational databases. Tags are used to represent the structure of a document using SGML. There are start tags and end tags in the tag. By enclosing the constituent elements of the document structure information with the start tag and the end tag, the delimiter of the sentence in the document and the constituent element to which the sentence belongs in the document structure can be determined. To clarify. Here, the start tag is the element name closed by the symbols "<" and ">", and the end tag is the element name closed by "</" and ">". The content of the component following the tag is text. The document containing the structural information to be searched consists of tags and text.

【0009】図1に基づいて本発明を実現するシステム
構成を説明する。本発明は、SGMLサーバ1および汎
用のリレーショナルデータベース管理システム2により
構成され、さらにSGMLサーバ1はデータベース作成
部3、SQL生成部4、SGML再作成部5により構成
される。データベース作成部3は文書構造情報を内部に
持つ言語の1つであるSGML11で記載された原文書
を入力し、入力されたSGMLに基づいてリレーショナ
ルデータベース管理システム2にデ−タベ−スのテ−ブ
ル定義を行うための言語であるDDL(Data De
finition Language)12を発行する
ことにより、SGMLによる構造情報7、タグ情報8、
テキスト情報9のテーブルを作成し、SGMLを用いた
原文書デ−タのデータ13を格納する。SQL生成部4
ではワークステーション10より文書構造を指定可能な
検索言語DQL(Document Query La
nguage)で作成される検索要求16を入力し、S
QL14を用いた検索要求文を作成し、リレーショナル
データベース管理システム2に対して検索要求を発行す
る。SGML再作成部5では、リレ−ショナルデ−タベ
−ス管理システム2でSQL生成部4により生成され、
SQL14を用いた検索要求文により検索された検索結
果15について構造情報7を用いてタグを含むSGML
17を編成し、ワークステーション10に表示する。
A system configuration for implementing the present invention will be described with reference to FIG. The present invention is composed of an SGML server 1 and a general-purpose relational database management system 2, and the SGML server 1 is composed of a database creating unit 3, an SQL creating unit 4, and an SGML recreating unit 5. The database creation unit 3 inputs an original document described in SGML11, which is one of the languages having document structure information therein, and based on the input SGML, a database-based database for the relational database management system 2. DDL (Data De), which is a language for defining
by issuing the definition language) 12, the structure information 7 by the SGML, the tag information 8,
A table of text information 9 is created and data 13 of original document data using SGML is stored. SQL generator 4
Then, a search language DQL (Document Query La) capable of designating a document structure from the workstation 10
Enter the search request 16 created by
A search request statement using QL14 is created and a search request is issued to the relational database management system 2. In the SGML recreating unit 5, the relational database management system 2 generates the SQL generating unit 4 in the relational database management system 2.
SGML including a tag using the structure information 7 for the search result 15 searched by the search request statement using the SQL 14.
17 are organized and displayed on the workstation 10.

【0010】図2(a)は、図1のSGML11で表現
される文書の論理構造のモデルであり、一般誌101が
表紙102より段落109までの8つの構成要素により
構成されている。図2(b)は、SGMLで表現される
文書の構成要素の性質を示す図の一例である。
FIG. 2A is a model of the logical structure of the document represented by SGML 11 of FIG. 1, and the general magazine 101 is composed of eight constituent elements from the cover 102 to the paragraph 109. FIG. 2B is an example of a diagram showing the nature of the constituent elements of a document expressed in SGML.

【0011】図3は論理構造を持つSGMLで表現され
る文書の一例であり、タグ201より208を用いてテ
キスト211より214の論理構造が表現されている例
である。
FIG. 3 shows an example of a document expressed in SGML having a logical structure, in which the logical structure of texts 211 to 214 is expressed by using tags 201 to 208.

【0012】図4から図6は、図2、図3のSGMLで
表現される文書をリレーショナルデータベースに格納す
る場合の各テ−ブルデ−タフォ−マットの一例である。
図4の構造情報テーブルのデ−タフォ−マットは図2
(a)、(b)のモデルをテーブル化したもので、上下
の構造を各要素のタグ302にタグID301を付加す
るとともにその上位タグID303と関係付け、同一階
層にある構成要素間の定義される順序は順序番号304
として、その定義の順序に従って表し、タグが出現する
か否かは連結タイプ305として表わす。
FIGS. 4 to 6 show an example of each table data format for storing the SGML documents shown in FIGS. 2 and 3 in a relational database.
The data format of the structure information table of FIG. 4 is shown in FIG.
A model of (a) and (b) is made into a table, and the upper and lower structures are defined by adding a tag ID 301 to a tag 302 of each element and associating it with a higher-order tag ID 303 of the element, and defining the elements in the same hierarchy. Order is 304
Are represented in the order of their definition, and whether or not a tag appears is represented as a concatenation type 305.

【0013】図5のタグ情報テーブルのデ−タフォ−マ
ットは図4のタグの階層毎に作成するものであり、図3
のSGMLのタグごとにIDを付加し、その上位レベル
で出現したタグのタグIDとともに格納される。同一文
書で同一種のタグに対して複数回出現する可能性のある
タグに対しては著者タグテーブル504の著者NO.4
23のようにNO.を付加する。
The data format of the tag information table shown in FIG. 5 is created for each layer of tags shown in FIG.
An ID is added to each SGML tag and stored together with the tag ID of the tag that appears in the higher level. For the tag that may appear multiple times for the same type of tag in the same document, the author No. of the author tag table 504 is set. Four
No. 23 like NO. Is added.

【0014】図6のテキスト情報テーブルのデ−タフォ
−マットはSGMLで記載された原文書から分解された
テキストをその要素別にそのタグID及び文書中での一
連の通し番号であるテキストNO.を付加して格納する
ものである。
In the data format of the text information table of FIG. 6, the text decomposed from the original document described in SGML is a tag ID for each element and a text serial number which is a series of serial numbers in the document. Is added and stored.

【0015】図4から図6のIDの付け方は一例であ
り、キーとしてユニークなものであれば良い。
The method of assigning an ID in FIGS. 4 to 6 is an example, and any unique key may be used.

【0016】図7は本発明によるデ−タベ−ス検索処理
の流れで、図8は本発明によるデ−タベ−ス検索処理の
実行例である。ワ−クステ−ション10からDQLに従
って入力された検索要求は、SQL生成部4で処理され
る。例えば、「章に「印刷」を含む一般誌の表紙」とい
う検索要求が、DQL701としてワ−クステ−ション
10より入力される。DQL701のFROM句712
より図2の文書構造情報を呼出し(601)、DQL7
01のWHERE句713の「章」は構成要素として章
106、表題107、節108、段落109を持ち、テ
キストを持つ要素は表題107、節108、段落109
であることが分かる。、テキストを持つ図6の表題テキ
スト513、節テキスト514、段落テキスト515の
それぞれのテ−ブルに対してWHERE句713の「L
IKE’%印刷%」を展開し(602)、表題ID41
7、節ID418、段落ID419を求め、さらにそれ
ぞれのIDが図5の表題タグ507、節タグ508、段
落タグ509の其れ其れのテ−ブルで一致する上位構造
の要素である章IDを求めるというようにWHERE句
713で指定した構成要素の章IDが得られるまで図5
のテ−ブルに検索を行い、さらにそれら全てを組み合わ
せるSQLを用いた検索要求文を作成する。図2の文書
構造情報から、SELECT句711とWHERE句7
13で指定される「表紙」と「章」の要素間の階層の上
下関係がないと判定し(603)、図2の文書構造情報
から表紙102と章106の最も下位レベルで共通の上
位要素として存在する一般誌101が最終的に求める要
素IDと決定され(605)、図5の章タグ506のテ
−ブルで章IDが一致する本文ID415を得るという
ように、一般誌IDが得られるまで図5のテ−ブルに検
索を行うように繰返し展開し(607)、最終結果を一
時テ−ブルに格納する。指定された検索要求をSQLで
記載された検索要求文に変換し、SQLで記載された検
索要求文702を完成させ検索を実行する。SELEC
T句711で指定されている要素「表紙」は、図2の文
章構造情報から表紙102−題名103、表紙102−
著者104という2通りの経路でテキストを持つ構造に
たどりつくことが分かり、処理607で求められた一時
テ−ブルの一般誌ID101の下位に存在する全要素の
IDとテキストの順序番号と内容を得られるようなSQ
L731とSQL732をそれぞれの経路で作成して実
行し、検索結果741と検索結果742を得る(60
8)。検索結果741と検索結果742の表紙IDが一
致していることと順序番号から、同一の表紙に属し、題
名「よくわかるDQL」、著者「日立太郎」の順で並ん
でいることを解析する(609)。処理610で処理6
09で解析されたテキストにタグを付加し、SGMLに
従った検索結果文705を編成する(610)。
FIG. 7 shows the flow of the data base search processing according to the present invention, and FIG. 8 shows an example of execution of the data base search processing according to the present invention. A search request input according to DQL from the workstation 10 is processed by the SQL generation unit 4. For example, a search request "cover of a general magazine including" print "in a chapter" is input from the workstation 10 as the DQL 701. FROM clause 712 of DQL 701
2 calls the document structure information of FIG. 2 (601), and DQL7
The “chapter” of the WHERE clause 713 of 01 has a chapter 106, a title 107, a section 108, and a paragraph 109 as constituent elements, and an element having text has a title 107, a section 108, and a paragraph 109.
It turns out that , The title text 513, the section text 514, and the paragraph text 515 of FIG.
Expand "IKE '% Print%" (602), and title ID 41
7, the section ID 418, and the paragraph ID 419 are obtained, and the chapter IDs, which are the elements of the upper structure, in which the respective IDs match in the respective tables of the title tag 507, section tag 508, and paragraph tag 509 in FIG. Until the chapter ID of the component designated by the WHERE clause 713 is obtained as shown in FIG.
, And a search request sentence using SQL that combines all of them is created. From the document structure information of FIG. 2, the SELECT clause 711 and the WHERE clause 7
It is determined that there is no hierarchical relationship between the elements of the “cover” and the “chapter” specified by 13 (603), and the upper-level element common to the lowest level of the cover 102 and the chapter 106 is determined from the document structure information of FIG. The general magazine 101 existing as is finally determined as the element ID to be obtained (605), and the general magazine ID is obtained such that the text ID 415 in which the chapter ID matches with the table of the chapter tag 506 in FIG. 5 is obtained. The table shown in FIG. 5 is repeatedly expanded so as to be searched (607), and the final result is stored in the temporary table. The designated search request is converted into a search request statement written in SQL, the search request statement 702 written in SQL is completed, and the search is executed. SELECT
The element "cover" specified in the T clause 711 is the cover 102-title 103, cover 102-
It was found that the author 104 could reach the structure having the text through the two paths, and the IDs of all the elements existing under the general magazine ID 101 of the temporary table obtained in the process 607, the sequence number of the text, and the contents were obtained. SQ like
L731 and SQL732 are created and executed in the respective paths to obtain a search result 741 and a search result 742 (60
8). Based on the fact that the cover IDs of the search result 741 and the search result 742 are the same and the sequence numbers, it is analyzed that they belong to the same cover and are arranged in the order of the title “DQL that is easy to understand” and the author “Hitachi Taro” ( 609). Process 6 in process 610
A tag is added to the text analyzed in 09 to organize the search result sentence 705 according to SGML (610).

【0017】[0017]

【発明の効果】本発明によれば以下のような効果が得ら
れる。
According to the present invention, the following effects can be obtained.

【0018】論理的構造をもった文書を検索する処理に
おいて、文書をその構成要素単位に分解し、デ−タベ−
スに格納し、それを検索し、検索結果を構成要素識別子
とテキスト情報の形式に変換し表示することにより、特
定の言語を用いる論理的構造情報を含む検索要求文の指
定と、構造情報を含む検索結果の表示が可能となる。
In the process of retrieving a document having a logical structure, the document is decomposed into its constituent elements and the database is used.
Stored in a database, search it, convert the search result to the form of element identifier and text information, and display it to specify the search request sentence including the logical structure information using a specific language and to display the structure information. It is possible to display the search results including.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例のシステム構成を示す図であ
る。
FIG. 1 is a diagram showing a system configuration of an embodiment of the present invention.

【図2】論理的文書構造のモデルを示す図及び論理的構
造情報である文書の種類の一例を示す図である。
FIG. 2 is a diagram showing a model of a logical document structure and an example of a document type that is logical structure information.

【図3】SGML文書の一例を示す図である。FIG. 3 is a diagram showing an example of an SGML document.

【図4】リレ−ショナルデ−タベ−ス管理システムに格
納する構造情報テ−ブルの一例である。
FIG. 4 is an example of a structural information table stored in a relational database management system.

【図5】リレ−ショナルデ−タベ−ス管理システムに格
納する構造情報記号テ−ブルの一例を示す図である。
FIG. 5 is a diagram showing an example of a structure information symbol table stored in a relational database management system.

【図6】リレ−ショナルデ−タベ−ス管理システムに格
納するテキスト情報テ−ブルの一例を示す図である。
FIG. 6 is a diagram showing an example of a text information table stored in a relational database management system.

【図7】本発明における検索処理の流れの一例を示す図
である。
FIG. 7 is a diagram showing an example of the flow of a search process in the present invention.

【図8】本発明における検索処理実行の一例を示す図で
ある。
FIG. 8 is a diagram showing an example of execution of search processing according to the present invention.

【符号の説明】[Explanation of symbols]

1 SGMLサーバ 2 リレーショナルデータベース管理システム 3 データベース作成部 4 検索要求文生成部 5 検索結果編成部 6 原文書 7 構造情報のデ−タベ−ス 8 タグ情報のデ−タベ−ス 9 テキスト情報のデ−タベ−ス 10 検索用ワークステーション 1 SGML server 2 Relational database management system 3 Database creation unit 4 Search request sentence generation unit 5 Search result organization unit 6 Original document 7 Database of structure information 8 Database of tag information 9 Database of text information Workstation 10 Search workstation

───────────────────────────────────────────────────── フロントページの続き (72)発明者 山田 清志 東京都江東区新砂一丁目6番27号 株式会 社日立製作所公共情報事業部内 (72)発明者 根岸 正光 千葉県船橋市前原東6丁目15番23号 (72)発明者 大山 敬三 千葉県浦安市日の出6番地 ベイシティ浦 安A−1104 (72)発明者 宮澤 彰 神奈川県横浜市港南区日野南3丁目7番14 号の202 (72)発明者 芝野 耕司 神奈川県川崎市麻生区高石4丁目12番4号 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Kiyoshi Yamada, Inventor Kiyoshi Yamada, 6-27 Shinsuna, Koto-ku, Tokyo, Ltd. Public Information Business Department, Hitachi, Ltd. (72) Masamitsu Negishi, 6-15 Maebaru, Funabashi, Chiba Prefecture No. 23 (72) Inventor Keizo Oyama 6 Hinode, Urayasu City, Urayasu City, Chiba Prefecture A-1104 (72) Inventor Akira Miyazawa 202-72 invention, 3-7-14 Hinominami, Konan-ku, Yokohama City, Kanagawa Prefecture Koji Shibano 4-12-4 Takaishi, Aso-ku, Kawasaki City, Kanagawa Prefecture

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】論理的構造をもった文書の全文を検索する
方法において、前記文書の構成要素単位で文書を分解し
て、文書の論理的構造を示す構造情報と、前記構成要素
を識別するための構成要素識別子と、前記構成要素識別
子に続くテキスト情報とを含むデ−タベ−スを作成する
デ−タベ−ス作成ステップと、入力された前記構成要素
識別子を含む検索要求文をデ−タベ−ス検索用の言語記
述に変換する検索要求文生成ステップと、前記検索要求
文生成ステップにより生成される検索要求文に基づいて
前記データベースを検索するステップと、前記検索ステ
ップにより得られた検索結果を前記構成要素識別子とこ
れに続くテキスト情報の形式に変換する検索結果編成ス
テップと、前記検索結果編成ステップにより編成された
検索結果を表示する表示ステップとを設けることを特徴
とする全文データベース検索方法。
1. A method for retrieving the full text of a document having a logical structure, wherein the document is decomposed in units of the constituent elements of the document, and structural information indicating the logical structure of the document and the constituent elements are identified. A component identifier for creating a database and a data base creating step including a text information following the component identifier; and a search request sentence containing the input component identifier. A search request statement generation step of converting into a language description for a tabular search, a step of searching the database based on the search request statement generated by the search request statement generation step, and a search obtained by the search step A search result organization step for converting the result into the format of the component identifier and the following text information, and the search result organized by the search result organization step are displayed. Full text database search method characterized by providing a display step.
JP09108093A 1993-04-19 1993-04-19 Full-text database search method Expired - Lifetime JP3573471B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09108093A JP3573471B2 (en) 1993-04-19 1993-04-19 Full-text database search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09108093A JP3573471B2 (en) 1993-04-19 1993-04-19 Full-text database search method

Publications (2)

Publication Number Publication Date
JPH06301721A true JPH06301721A (en) 1994-10-28
JP3573471B2 JP3573471B2 (en) 2004-10-06

Family

ID=14016541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09108093A Expired - Lifetime JP3573471B2 (en) 1993-04-19 1993-04-19 Full-text database search method

Country Status (1)

Country Link
JP (1) JP3573471B2 (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06282577A (en) * 1993-03-26 1994-10-07 Toppan Printing Co Ltd Data extraction system
JPH08147311A (en) * 1994-11-17 1996-06-07 Hitachi Ltd Method for retrieving structured document and device therefor
JPH08255155A (en) * 1995-03-16 1996-10-01 Fuji Xerox Co Ltd Device and method for full-text registered word retrieval
JPH096803A (en) * 1995-06-22 1997-01-10 Fuji Xerox Co Ltd Document data base management device
JPH0954777A (en) * 1995-06-09 1997-02-25 Matsushita Electric Ind Co Ltd Information retrieving device
JP2000010988A (en) * 1998-06-19 2000-01-14 Nec Corp Structured document retrieval system/method and recording medium recording structured document retrieval program
JP2002073614A (en) * 2000-08-24 2002-03-12 Nec Nexsolutions Ltd System for providing reservation relating information
JP2002183182A (en) * 2000-12-19 2002-06-28 Toshiba Corp Document diversion method, decision-making support system and document management system
JP2003500747A (en) * 1999-05-20 2003-01-07 イヴリサーチ リミテッド Information management, search and display system and related methods
US7054854B1 (en) 1999-11-19 2006-05-30 Kabushiki Kaisha Toshiba Structured document search method, structured document search apparatus and structured document search system

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06282577A (en) * 1993-03-26 1994-10-07 Toppan Printing Co Ltd Data extraction system
JPH08147311A (en) * 1994-11-17 1996-06-07 Hitachi Ltd Method for retrieving structured document and device therefor
JPH08255155A (en) * 1995-03-16 1996-10-01 Fuji Xerox Co Ltd Device and method for full-text registered word retrieval
JPH0954777A (en) * 1995-06-09 1997-02-25 Matsushita Electric Ind Co Ltd Information retrieving device
JPH096803A (en) * 1995-06-22 1997-01-10 Fuji Xerox Co Ltd Document data base management device
JP2000010988A (en) * 1998-06-19 2000-01-14 Nec Corp Structured document retrieval system/method and recording medium recording structured document retrieval program
JP2003500747A (en) * 1999-05-20 2003-01-07 イヴリサーチ リミテッド Information management, search and display system and related methods
USRE42167E1 (en) 1999-05-20 2011-02-22 Evresearch Ltd. Information management, retrieval and display systems and associated methods
US7054854B1 (en) 1999-11-19 2006-05-30 Kabushiki Kaisha Toshiba Structured document search method, structured document search apparatus and structured document search system
JP2002073614A (en) * 2000-08-24 2002-03-12 Nec Nexsolutions Ltd System for providing reservation relating information
JP2002183182A (en) * 2000-12-19 2002-06-28 Toshiba Corp Document diversion method, decision-making support system and document management system

Also Published As

Publication number Publication date
JP3573471B2 (en) 2004-10-06

Similar Documents

Publication Publication Date Title
USRE42167E1 (en) Information management, retrieval and display systems and associated methods
JP2001167087A (en) Device and method for retrieving structured document, program recording medium for structured document retrieval and index preparing method for structured document retrieval
WO2007143899A1 (en) System and method for intelligent retrieval and treating of information
JPH11110413A (en) Method and device for generating data base retrieved result
Loeffen Text databases: A survey of text models and systems
Wang et al. Semantic search on internet tabular information extraction for answering queries
JPH06301721A (en) Whole sentence data base retrieving method
CN110659310A (en) Intelligent search method for vehicle information
Liu et al. Document processing and retrieval: texpros
JPH07319918A (en) Device for specifying retrieving object in document
JPH0628403A (en) Document retrieving device
US6282509B1 (en) Thesaurus retrieval and synthesis system
JP2007535009A (en) A data structure and management system for a superset of relational databases.
JP2001236352A (en) Method and device for semistructured document retrieval and storage medium stored with semistructured document retrieval program
KR20030027349A (en) Document storage/rehabilitation apparatus and method for using relational database
JPH10187680A (en) Document repository device managed by word, sentence and grain degree of part
JP2003288332A (en) Method and system for supporting structured document creation
US20070220033A1 (en) System and method for providing simple and compound indexes for XML files
Calabretto et al. The philological workstation bambi (better access to manuscripts and browsing of images)
B'ez et al. Indexing structured documents with suffix arrays
Kowarski et al. The document concept in a data base
Jellouli et al. Towards automatic semantic annotation of data rich Web pages
JPH05135054A (en) Document processing method
Meghini et al. Conceptual document modelling and retrieval
JP2001134596A (en) Managing device and retrieving method for structured document

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040629

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070709

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090709

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090709

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100709

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100709

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110709

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110709

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120709

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 9

EXPY Cancellation because of completion of term