JPS5856071A - 日本語による検索システム - Google Patents

日本語による検索システム

Info

Publication number
JPS5856071A
JPS5856071A JP56154502A JP15450281A JPS5856071A JP S5856071 A JPS5856071 A JP S5856071A JP 56154502 A JP56154502 A JP 56154502A JP 15450281 A JP15450281 A JP 15450281A JP S5856071 A JPS5856071 A JP S5856071A
Authority
JP
Japan
Prior art keywords
information
search
words
word
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56154502A
Other languages
English (en)
Other versions
JPH0215904B2 (ja
Inventor
Yuji Uchida
裕士 内田
Kenji Sugiyama
健司 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56154502A priority Critical patent/JPS5856071A/ja
Publication of JPS5856071A publication Critical patent/JPS5856071A/ja
Publication of JPH0215904B2 publication Critical patent/JPH0215904B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は1日本語による検索システム、特に例えば複数
のプログラム・モジニーk(”/7トt:iエア部品と
考える)を格納している部品データ・ベースを、日本語
入力によって検索すべく、入力された日本語の問い合わ
せ情報を、自立語相互間の係り受は関係を明確にするよ
う処理し、問い合わせ情報における表現上の差異を吸収
するようにした日本NKよる検索システムに関するもの
である。
例えば「ルンゲ・フッタ法による積分」と名付けられた
プログラム・そりニール、「オイラ法ニよる積分」と名
付けられたプログラム・モジュール、「ポイン法による
積分」と名付けられたプログラム・モジュールなどが格
納されているデータeペースをアクセスして、所望のプ
ログラム・モジュールを抽出する如き検索システムを想
定したとする。この場合にお叶る検索システムは、第1
図図示の如きものとなろう。第1図において、1は問い
合わせ情報バッファ、2は検索装置、3はデータ・ベー
ス、4はシソーラス格納バッファを表わしている。
fl’lJlす/ステムにおいては、シソーラス格納バ
ッファ4が存在2せず、問い合わせ情報バッファlの内
容そのものと全く一致する名称をもつプログラム・モジ
ュールaを検索すべく検索装置2が動作する。ま九更に
進んだシステムにおいては、シソーラス役納バッファ4
をもうけて、例えば「簡易ルンy−クック法に′よる積
分」と「ポイン法による積分」とは実質上同じである旨
を関連づけておき、「簡易ルンゲ・フッタ法による積分
」なる2がシソーラス格納バッファ4を調べてデータ・
ベース3中の「ポイン法による積分」を抽出するように
される。
しかし、日本語をもって問い合わせる検索システムにお
いては、問い合わせ情報の表現上の差異、例えば「ルン
ゲ・フッタ法による積分」と「ルンゲ・フッタ法によっ
て積分する」となどの表現上の差異を吸収することが望
まれる。
本発明は上記の点を解決することを目的としており、本
発明の日本語による検索システムは、複数の名詞ま念は
名詞句相互間の係シ受は関係を附加された形で名称が与
えられている複数個の検索対象物を格納してなる検索対
象物データ・ベースをそなえると共に、該検索対象物デ
ータ9ベースをアクセスする検索装置をそなえ、該検索
装置に対して上記検索対象物の名称を指示して検索を行
なう検索システムにおいて、日本#にて与えられ九問い
合わせ情報にもとづいて当該問い合わせ情報を日本語辞
書を索引して単語単位に分割すると共に単語接続検定を
行なう単語分割装置、該単語分割装置によって分割され
た単語中の自立語を選択し当該自立語に対して附属語を
附加した文節を認定する文節認定装置、該文節認定装置
によって得られた各文節相互に対して少なくとも文法的
接続検定装置を用いて係シ受は関係を解析して係シ受は
先文節情報を附与する係り受は解析装置、および該係り
受は解析装置によって得られた文節相互間の係夛受は情
報を参照しつつ文節中の自立語に対応する意味記号を文
節にま九がって関係づける意味記号抽出装置をそなえ、
上記与えられた問い合わせ情報を、自立語相互間の係シ
受は関係を明確にした検索対象物の名称に変換した上で
、検索を行なうようにした仁とを特徴としている。以下
図面を参照しつつ説明する。
第2図は本発明による検索システムの概念説明図、第3
図は本発明の一実施例構成、第4図社第3図図示の場合
と異なった形の問い合わせ情報が与えられたときの説明
図を示している。
第2図において、l−1,1−2は夫々問い合わせ情報
、2は検索装置、5は検索名作成装置、6Fi検索名情
報(又はバッファ)を表わしている。
本発明の場合、第2図図示の問い合わせ情報1−1が入
力された場合にも問い合わせ情報1−2が入力された場
合にも、検索名作成装置5が、問い合わせ情報中の自立
語に注目しかつ自立語相互間の係〕受は関4kK注目し
て、同じ検索名情報6をつくり出すようにする。そして
、該検索名情報6をもって検索装置2に通知するように
する。
第3図は本発明の一実施例構成を示す。図中の符号1,
2,3,5.6は第1図または第2図に対応している@
またフは単語分割装置であって、日本語辞書8や単語間
接続検定装置9を用いて、問い合わせ情報バッファ1の
内容を単語に分割し、単語バッファIOK格納する。な
お単語バッファ10には、問い合わせ情報を分割しt、
単語の単語コードと当該単語の意味記号と当該単語の文
法情報と当該単語の意味情報などが一語として格納され
る。
11は文節認定装置であって、単語パッファ10上の各
単語の自立語とその発生順序とに注目し、1つの自立語
に附属#1!(助動詞や助詞)を附加した文節を抽出し
、各文節に=Dナンバを附与するようにするものである
。その結果は図示文節バッファ12に格納される。図示
の場合、「ルンゲ・クツター法−によって」なるIDナ
ンバ「1」の文節と、「積分−す−る」なるiQナンバ
「2」の文節とが抽出されている・13は係シ受は解析
装置であって、上記文節バッファ12の内容にもとづい
て、図示文法的接続検定装置14や意味的接続検定装置
15を利用し、文節(jl)ナンバ「1」)と文節(j
l)ナンバ「2」)との間の係シ受は関係を解析する。
そしてその結果は文節係シ受は表バッファ16にセット
され、係り受は先文節情報iIyが附与される。
17は意味記号抽出装置であって、文節係り受は表バッ
ファ16にセットされた各文節について、当該文節内の
単語であって意味情報をもつものを抽出すると共に、上
記係り受は先文節情報iD′を利用して、検索名情報6
を抽出する。
以下各装置について更に具体的に説明してゆく。
単語分割装置フは、問い合わせ情報バッファ1の内容を
例えば「読み」に分解する。即ち漢字コードが含まれて
いても、日本語辞書8を漢字コードにて索引した上で仮
名コードに分解する。そして、日本語辞書8にもとづい
て最尤度評価法を用いて単語にまとめ、問い合わせ情報
を単語単位に分割する・また得られた単語間の接続検定
を、単語間接続検定装置9を用いて検定する。
なお、上記日本語辞書8やその索引態様に関しては、本
出願人が先に出願した特願昭54−172472号「読
みおよび書きによる単語検索方式」や、特願昭54−1
72474号「漢字仮名変換装置」に開示されるものを
利用できる。まえ上記最尤度評価法に関しては、特願昭
54−922’F1号「カナ漢字変換装置」に開示され
たものを利用でき、更に単語間接続検定に関しては、特
願昭54−92270号「単語間接続検定装置」に開示
されるものを利用できる。
上述の如くして、単語分割装置7は、単語バッファ10
上に、問い合わせ情報を分割した単語をセットする。な
お、当該率IFKついての文法情報や意味情報は、日本
語辞書8内に単語と一緒に格納されていると考えてよく
、文法情報は図示の文法的接続検定装置14において利
用し、意味情報は図示の意味的接続検定装置15におい
て利用する。更に言えば図示r法」Kついては単独でM
ETHODを意味する「法」と例えば「ルンゲ・フッタ
法」としての用法の如く他の名詞と一体となって意味を
もつ「法」とが存在するが、上記意味情報はこれらの間
を区別するものと考えてよい。
文節認定装置11は、上述の如く自立語を含む文節にま
とめかつIDナンバを附与するものであ)、単語バッフ
ァlO上の単語と単語の発生順とにもとづいて、文法情
報を利用して文節にまとめ上げる。
係り受は解析装置13は、文節バッファ12内の各単語
について、文法的接続検定装置14と意味的接続検定装
置15とを利用する。文法的接続検定装置14は文法的
な接続関係の可否を表わすテーブルをそなえている。例
えば図示の如く名詞は格助詞によって後続されることが
許され、す変名詞はす変語尾によって後続されることが
許され、格助詞はす変名詞によって後続することが許さ
れるなどがテーブル上に記述されている。このことから
、IDナンバ、r l Jの文節の末尾「によって」(
格助詞)は、IDナンバ「2」の文節の先頭「積分」(
す変名詞)によって後続することが許されていることが
判る。また意味的接続検定装置15は、上述の「ルンゲ
ークッタ」と「法」との接続関係を検定するものである
。文法的接続検定装置14と同様に意味的接続の可否を
示すテーブルをそなえている・図示の場合、「ルンy−
クッタ」(意味情報rloOJ)は、METHODの意
味をもつ「法」(意味情報「300J)によって後続さ
れることが禁止されており、上記r法」は意味、情報r
200Jをもつ「法」であって、「ルンゲ・フッタ法」
としてまとまることをチェックする。
なお、意味的接続検定に関しては、本出願人が先に出願
した特願昭36−1oza364!r意味関係格納方式
」に開示されるものを利用でき、また係り受は解析装置
に関しては特願昭56−102634号「日本語解析シ
ステム」K開示されるものを利用できる。
係り受は解析装置13は、上記の如くして、文節相互間
の係り受けを調べ、文節係〕受は表バッファ16に係り
受は関係をセットする。次いで意味記号抽出装置1γは
、バッファ16内のBDナンバ「1」をもつ文節中の単
語であって意味情報をもつものについての意味情報 RUNGE KUTTA <BY  MEANS  OF> と、iDナンバ「2」をもつ文節中のそれr 1NTI
GRALJ とを抽出し、日本語の配列関係を予め定めた形の配列関
係に変換して、検索名憤報6を得る・以上の如く処理さ
れるので、第2図図示の問い合わせ情報1−2が入力さ
れたとしても、検索名情報60段階においては、全く同
じものとなる。
第4図は、問い合わせ情報として例えば「昇順にリスト
をソートする」の如き情報が入力された場合の態様を説
明する説明図を示している。
図中の符号1,2,3,6,16.lフは第3図に対応
しており、鎖線で囲った範囲のものは第3図図示の符号
フないし16の部分に対応している。
上記問い合わせ情報1−3の場合には、自立語が3個存
在する。そして、iDナンバ「1」と「2」とをもつ文
節は夫々情報I D /として示す如(il)ナンバ「
3」をもつ文節に係ることが判る・意味記号抽出装置1
フは、これにもとづいて、r 5ORTiN[l+ <
 BY > 1NcuBi< 0RDERJと rsORTiNG <0BTECT>Li5TJとの2
つの情報を抽出し、両者をアンドで結合した形で検索装
置2に通知する。
じ 以上説明した如く、本発明によれば、問い合わせ情報に
おける表現上の差異は吸収されてしまい、検索装置に対
して、所望の検索者情報を供給することが可能となる。
【図面の簡単な説明】
第1図は検索システムの一般的な態様を説明する説明図
、第2図は本発明による検索システムの概念説明図、第
3図は本発明の一実施例構成、第4図は第3図図示の場
合と異なった形の問い合わせ情報が与えられたときの説
明図を示している。 図中、1は問い合わせ情報、2は検索装置、3はデータ
ーペース、5は検索者作成装置、6は検□索名情報、)
は単語分割装置、8は日本語辞書、9は単語間接続検定
装置、lOは単語ノ(ツファ、11は文節認定装置、1
2は文節)(ツファ、13は係り受は解析、装置、14
は文法的接続検定装置、15は意味的接続検定装置、1
6は文節係シ受は表バッファ、l)は意味記号抽出装置
を表わす。 特許出願人 富士通株式会社

Claims (1)

    【特許請求の範囲】
  1. 複数の名詞または名詞句相互間の係)受は関係を附加さ
    れた形で名称が与えられている複数個の検索対象物を格
    納してなる検索対象物データ・ベースをそなえると共に
    1該検索対象物データ・ベースをアクセスする検索装置
    をそなえ、該検索装置に対して上記検索対象物の名称を
    指示して検索を行なう検索システムにおいて、日本語に
    て与えられた問い合わせ情報にもとづいて当該間り合わ
    せ情報を日本語辞書を索引して単語単位に分割すると共
    に単語接続検定を行なう単語分割装置、該単語分割装置
    によって分割された単語中の自立語を選択し当該自立M
    K対して附属語を附加し九文節を認定する文節認定装置
    、該文節認定装置によって得られた各文節相互に対して
    少なくとも文法的接続検定装置を用いて係〕受は関係を
    解析して係夛受は先文節情報を附与する係夛受は解析装
    置、および該係〕受は解析装置によって得られ九文節相
    互間の係プ受は情報を参照しつつ文節中の自立語に対応
    する意味記号を文節にまたがって関係づける意味記号抽
    出装置をそなえ、上記与えられた問い合わせ情報を、自
    立語相互間の係シ受は関係を明確にした検索対象物の名
    称に変換した上で、検索を行なうようにしたことを特徴
    とする日本語による検索システム。
JP56154502A 1981-09-29 1981-09-29 日本語による検索システム Granted JPS5856071A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56154502A JPS5856071A (ja) 1981-09-29 1981-09-29 日本語による検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56154502A JPS5856071A (ja) 1981-09-29 1981-09-29 日本語による検索システム

Publications (2)

Publication Number Publication Date
JPS5856071A true JPS5856071A (ja) 1983-04-02
JPH0215904B2 JPH0215904B2 (ja) 1990-04-13

Family

ID=15585638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56154502A Granted JPS5856071A (ja) 1981-09-29 1981-09-29 日本語による検索システム

Country Status (1)

Country Link
JP (1) JPS5856071A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59223853A (ja) * 1983-06-03 1984-12-15 Hitachi Ltd コマンド情報抽出装置
JPS60181923A (ja) * 1984-02-29 1985-09-17 Fujitsu Ltd デ−タベ−ス検索方式
JPS60247756A (ja) * 1984-05-23 1985-12-07 Matsushita Electric Ind Co Ltd デ−タベ−ス装置
JPH01180046A (ja) * 1988-01-11 1989-07-18 Hitachi Ltd 知識ベースシステムおよび自然言語理解方式
JPH02291076A (ja) * 1989-03-06 1990-11-30 Internatl Business Mach Corp <Ibm> 自然言語解析装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3464518B2 (ja) * 1994-03-04 2003-11-10 富士通株式会社 文書索引作成システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59223853A (ja) * 1983-06-03 1984-12-15 Hitachi Ltd コマンド情報抽出装置
JPH0437460B2 (ja) * 1983-06-03 1992-06-19 Hitachi Ltd
JPS60181923A (ja) * 1984-02-29 1985-09-17 Fujitsu Ltd デ−タベ−ス検索方式
JPS60247756A (ja) * 1984-05-23 1985-12-07 Matsushita Electric Ind Co Ltd デ−タベ−ス装置
JPH01180046A (ja) * 1988-01-11 1989-07-18 Hitachi Ltd 知識ベースシステムおよび自然言語理解方式
JPH02291076A (ja) * 1989-03-06 1990-11-30 Internatl Business Mach Corp <Ibm> 自然言語解析装置

Also Published As

Publication number Publication date
JPH0215904B2 (ja) 1990-04-13

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US6952691B2 (en) Method and system for searching a multi-lingual database
JP3266246B2 (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
KR100835706B1 (ko) 자동 색인을 위한 한국어 형태소 분석 시스템 및 그 방법
KR20160060253A (ko) 자연어 질의 응답 시스템 및 방법
JPH10334118A (ja) 辞書索引作成装置と文書検索装置
US7676358B2 (en) System and method for the recognition of organic chemical names in text documents
JP3173411B2 (ja) 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体
US20040128292A1 (en) Search data management
JPS6175957A (ja) 機械翻訳処理装置
JPS5856071A (ja) 日本語による検索システム
Gey et al. Cross-language retrieval for the CLEF collections—comparing multiple methods of retrieval
KR100659370B1 (ko) 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법
JP3253657B2 (ja) 文書検索方法
JPH03132872A (ja) 索引情報生成装置
KR102338949B1 (ko) 기술문서 번역 지원 시스템
JP3376996B2 (ja) フルテキストサーチ方法
Vydiswaran et al. Finding related entities by retrieving relations: UIUC at TREC 2009 entity track
Xu et al. PolyUCOMP in TAC 2011 entity linking and slot filling
JP2009181524A (ja) 文書検索システム及び文書検索方法
JPH0827803B2 (ja) テキストベース検索方法
Babamir Fast Language-Independent Correction of Interconnected Typos to Finding Longest Terms
JPH03161865A (ja) 文章の検索方法
JPH0262659A (ja) 日本文訂正候補文字抽出装置