JPH05189475A - 自然言語処理システム用辞書方式 - Google Patents

自然言語処理システム用辞書方式

Info

Publication number
JPH05189475A
JPH05189475A JP4024604A JP2460492A JPH05189475A JP H05189475 A JPH05189475 A JP H05189475A JP 4024604 A JP4024604 A JP 4024604A JP 2460492 A JP2460492 A JP 2460492A JP H05189475 A JPH05189475 A JP H05189475A
Authority
JP
Japan
Prior art keywords
dictionary
area
meaning
target area
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4024604A
Other languages
English (en)
Inventor
Tomoharu Yamaguchi
智治 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4024604A priority Critical patent/JPH05189475A/ja
Publication of JPH05189475A publication Critical patent/JPH05189475A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 別個に作成された領域辞書を複数結合し、対
象領域を拡大する際に、曖昧性が増加するのを回避す
る。 【構成】 領域辞書手段100の辞書項目群101に、
その各々の対象とする領域を示す領域情報を辞書結合処
理手段103で対応付けて付加して結合辞書を作成し結
合辞書作成手段104に格納する。入力表現の意味決定
は主対象領域意味決定手段105で結合辞書手段104
の主対象領域に属する項目106を参照して行なう。主
対象領域に属する項目106の参照では決定できなかっ
た表現は、副対象領域意味決定手段107で副対象領域
に属する項目108を参照して意味の決定を行ないさら
に、副対象領域意味評価手段109で正当性を評価し、
その結果を領域情報更新処理手段110で主対象領域に
加え結合辞書を更新する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された言語表現か
ら出力する言語表現を生成する言語処理システムに関
し、特に辞書の作成・利用・更新に用いられる自然言語
処理システム用辞書方式に関する。
【0002】
【従来の技術】従来の方式では、辞書の拡大にともなう
入力表現と出力表現の間の関係の曖昧性増加を回避する
ために、曖昧性の混入しない範囲を対象領域として限定
した領域個別の辞書を用いていた。これにより、辞書を
利用するシステムが同一であっても、対象領域毎に異な
る辞書を用いねばならない。
【0003】また、複数の領域で用いられる語がそれら
の領域を対象とする辞書に共通に登録されているという
ことが保証し難い。これにより、同じシステムを利用し
ていても入力可能な表現が領域毎に異なってしまい、シ
ステムのユーザに不必要に対象領域を意識させてストレ
スを与えてしまう。
【0004】複数の領域で用いられる表現の共通部分を
領域辞書から分離する方法もあるが、対象とする複数の
領域それぞれの範囲によって、それら領域の共通部分は
一定ではなく、あらかじめ共通部分を定義することは困
難である。
【0005】また、領域の境界と思われる付近では、期
待される関係が見い出されないなどの不都合があった。
さらに、領域の境界が明確でない場合や、状況によって
変化する場合には、静的に定義された領域を対象とする
辞書では対応しきれなかった。
【0006】
【発明が解決しようとする課題】以上に述べたように、
曖昧性の増加を避けて自然言語処理システムの対象領域
を拡大させる辞書の作成は容易ではなかった。
【0007】本発明の目的は、制限された領域を対象と
して別個に作成された領域辞書の結合によって対象領域
の拡大を行なう際に、辞書の拡大にともない曖昧性がの
増加するのを回避できるようにする辞書作成、利用、更
新方式を提供することにある。
【0008】
【課題を解決するための手段】本発明の自然言語処理シ
ステム用辞書方式は、制限された領域を対象として領域
毎に個別に作成された複数の領域辞書を格納する領域辞
書手段と、個々の領域辞書の辞書項目に領域情報を付加
して領域辞書の結合をおこなう辞書結合処理手段と、結
合された領域辞書を格納する結合辞書手段とを有し、ま
たは、自然言語入力表現に対して、前記結合辞書手段中
の主対象領域に属する辞書項目を参照して意味を決定す
る主対象領域意味決定手段と、前記結合辞書手段中の副
対象領域に属する辞書項目を参照して意味を決定する副
対象領域意味決定手段とを有し、さらにまたは、前記副
対象領域意味決定手段により決定された意味を評価する
副対象領域意味評価手段と、評価結果に基づき前記結合
辞書手段中の領域情報を更新する領域情報更新手段とを
有していることを特徴とする。
【0009】
【実施例】次に図1から図8を参照して本発明の実施例
について説明する。図1は本発明の一実施例における領
域辞書結合から辞書更新までの機能を示すブロック図で
ある。図2は辞書結合操作例の概略フロー図であり、辞
書項目の登録を領域辞書毎に行なう例を示す。図3は2
つの領域辞書の結合の一例を示す概念図、図4は領域辞
書の結合によって作成される辞書が領域毎の索引を持つ
例を示す図、図5は主対象領域と副対象領域による入力
表現の意味決定の概略フロー図、図6は主対象領域と副
対象領域による入力表現の意味決定の例を示す概念図、
図7は主対象領域と副対象領域による入力表現の意味決
定に基づく辞書更新の概略フロー図、図8は主対象領域
と副対象領域による入力表現の意味決定による辞書更新
の例を示す概念図である。
【0010】これら図において、100は結合しようと
する領域辞書を格納する領域辞書手段、101は領域辞
書手段100に含まれる項目群、102は領域辞書手段
100の個々が対象としていた領域の識別子、103は
領域辞書結合処理手段、104は領域辞書の結合によっ
て作成される結合辞書手段、105は主対象領域を参照
する主対象領域意味決定手段、106は主対象領域に属
する辞書項目情報、107は副対象領域を参照する副対
象領域意味決定手段、108は副対象領域に属する辞書
項目情報、109は副対象領域を参照して決定された意
味を評価する副対象領域意味決定手段、110は領域情
報更新処理手段、111は領域情報更新処理を表わす。
1および2はそれぞれ領域a領域bを対象とする領域辞
書の一例、3は1および2の領域辞書を結合して作成さ
れる、領域aと領域bの両方を対象とする辞書の一例、
4および5はそれぞれ領域a領域bによる領域毎の索引
で、領域aと領域bの両方を対象とする辞書における項
目に対応する項目番号を持っている例、6は領域毎の索
引により参照される項目番号を付加した、領域aと領域
bの両方を対象とする辞書、7は領域a領域bにおいて
曖昧性をもつ語を含んだ入力文例、8は入力文例7の処
理に用いる辞書の部分の例、9は入力文例7を辞書例8
を用いて決定した語と意味の対応付けの例を示す表、1
0は副対象領域による意味決定を含む入力文例、11は
入力文例10の処理に用いる辞書の部分の例、12は入
力文例7を辞書例8を用いて決定した語と意味の対応付
けの例を示す表、13は副対象領域による意味決定を主
対象領域に反映して更新された辞書の例をそれぞれ表わ
す。
【0011】領域辞書手段100のもつ辞書項目群10
1に、その各々が含まれる領域辞書の対象とする領域を
示す領域情報を、辞書結合処理手段103で対応付けて
付加した項目群を辞書項目とする結合辞書を作成し結合
辞書手段104に格納する。
【0012】入力表現の意味決定は、まず主対象領域意
味決定手段105で結合辞書手段104の主対象領域に
属する項目106を参照して行なう。主対象領域に属す
る項目106の参照では決定できなかった表現について
は、副対象領域意味決定手段107で副対象領域に属す
る項目108を参照して意味の決定を行なう。
【0013】副対象領域に属する項目108を参照して
意味の決定を行なわれた表現については、副対象領域意
味評価手段109で正当性を評価し、その結果を領域情
報更新処理手段110で、正しい意味決定に寄与した副
対象領域に属する項目を主対象領域にも加えるなどの処
理を行ない結合辞書手段104の結合辞書を更新する。
【0014】領域aを対象領域とするシステムの使用す
る領域辞書である辞書a 1と、別の領域bを対象領域
とするシステムの使用する領域辞書である辞書b 2が
あり、これらのもつ見出しと内容の組を含む行で表され
る項目に、その項目が登録されていた辞書の対象領域を
示す情報を付加して、辞書A3の項目として登録するこ
とにより、領域aと領域bの両方を対象領域とするシス
テムの使用する辞書A3を作成する。辞書A3の例では
各項目は見出しと内容および領域というフィールドをも
つ。
【0015】また、辞書A 3は領域情報から項目への
アクセス効率をあげるために、領域毎の索引を4、5の
ように作成しておいても良い。領域毎の索引をもつ場合
は、辞書A 3にある領域のフィールドは6のように省
略することも可能である。
【0016】このようにして作成した領域情報をもつ辞
書を自然言語文に現われる語の曖昧性の解消に用いた例
を図6に示す。入力文例7中の語「機械学習」と「プラ
ンニング」は辞書8において曖昧性なく意味を特定で
き、共に領域bに含まれる対象である。しかし、入力文
例7中の語「AI」は辞書8において「AI」という見
出しに対して2通りの内容が存在する。すなわち、語
「AI」は2通りの意味をとりうる曖昧性をもつ。ここ
で語「機械学習」、語「プランニング」の意味を特定さ
せる領域bを主対象領域とすると、辞書8のもつ領域情
報を利用して、語「AI」の意味も領域bにおけるArti
ficial_Intelligence に特定でき、領域aと領域bの辞
書を結合したために発生する曖昧性の増加を回避する。
【0017】図8に示す入力文例10の処理に領域bの
みを対象とする領域辞書2を用いた場合は、語「範疇
化」は未知語となる。入力文例10の処理に、領域bを
対象とする領域辞書と領域cを対象とする領域辞書を結
合した辞書11を用いた場合は、入力例文11中の語
「AI」と語「機械学習」は共に意味を特定可能で領域
bにおける対象であるが、語「範疇化」について領域b
においては見出し「範疇化」は辞書11中に内容をもた
ないが、副対象領域としてcをとれば、語「範疇化」の
領域cにおける意味が利用され、表12に示す語と意味
の対応が得られる。
【0018】語「範疇化」の意味が副対象領域の意味か
ら特定され、主対象領域でもその意味で正しいと決定さ
れた場合は、見出し「範疇化」とその内容を含む項目が
領域bの対象でもあるとして、領域情報に主対象領域で
あるbを加えて、辞書を更新し辞書13を得る。
【0019】
【発明の効果】本発明においては、制限された領域を対
象として別個に作成された領域辞書の複数を結合する際
に、それら領域辞書が対象としていた領域と辞書項目を
相互参照可能にする情報を、領域辞書の結合によって作
成される辞書にも記すことによって、辞書の拡大による
曖昧性の増加を回避可能にし、結合によって作成された
辞書を用い、入力表現に応じて主対象領域と副対象領域
から検索を行なうことによって自然言語処理システムの
対象領域の拡大が可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例における領域辞書結合から辞
書更新までの機能を示すブロック図。
【図2】辞書結合操作例の概略フロー図。
【図3】2つの領域辞書の結合の一例を示す概念図。
【図4】領域辞書の結合によって作成される辞書が領域
毎の索引を持つ例を示す図。
【図5】主対象領域と副対象領域による入力表現の意味
決定の概略フロー図。
【図6】主対象領域と副対象領域による入力表現の意味
決定の例を示す概念図。
【図7】主対象領域と副対象領域による入力表現の意味
決定に基づく辞書更新の概略フロー図。
【図8】主対象領域と副対象領域による入力表現の意味
決定による辞書更新の例を示す概念図。
【符号の説明】
1 領域1を対象とする領域辞書の一例 2 領域2を対象とする領域辞書の一例 3 1および2の領域辞書を結合して作成される領域
1と領域2の両方を対象とする辞書の一例 4 領域1による領域毎の索引で、領域1と領域2の
両方を対象とする辞書における項目に対応する項目番号
を持っている例 5 領域2による領域毎の索引で、領域1と領域2の
両方を対象とする辞書における項目に対応する項目番号
を持っている例 6 領域毎の索引により参照される項目番号を付加し
た、領域1と領域2の両方を対象とする辞書 7 領域1領域2において曖昧性をもつ語を含んだ入
力文例 8 入力文例7の処理に用いる辞書の部分の例 9 示す表 10 副対象領域による意味決定を含む入力文例 11 入力文例10の処理に用いる辞書の部分の 12 入力文例7を辞書例8を用いて決定した語と意
味の対応付けの例を示す表 13 副対象領域による意味決定を主対象領域に反映
して更新された辞書の例 100 領域辞書手段 101 領域辞書項目群 102 領域識別子 103 領域辞書結合処理手段 104 領域辞書の結合によって作成される辞書を格
納する結合辞書手段 105 主対象領域意味決定手段 106 主対象領域に属する辞書項目情報 107 副対象領域意味決定手段 108 副対象領域に属する辞書項目情報 109 副対象領域意味評価手段 110 領域情報更新処理手段 111 領域情報更新処理

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 自然言語処理システムで利用する、入力
    された自然言語表現と出力する意味表現の関係を記す辞
    書の作成において、制限された領域を対象として別個に
    作成された領域辞書の複数を結合する際に、それら領域
    辞書が対象としていた領域と辞書項目を相互参照を可能
    にする情報を結合によって作成される辞書に記すことを
    特徴とする辞書作成方式。
  2. 【請求項2】 請求項1に記載の辞書作成方式によって
    作成された、複数の領域を対象として領域と辞書項目の
    相互参照を可能にする情報をもつ辞書を用いて、主対象
    領域と副対象領域から入力表現の意味を決定することを
    特徴とする辞書利用方式。
  3. 【請求項3】 請求項2に記載の辞書利用方式によっ
    て、主対象領域と副対象領域から入力表現の意味を決定
    した検索結果に基づいて辞書の更新を行なうことを特徴
    とする辞書更新方式。
JP4024604A 1992-01-14 1992-01-14 自然言語処理システム用辞書方式 Pending JPH05189475A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4024604A JPH05189475A (ja) 1992-01-14 1992-01-14 自然言語処理システム用辞書方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4024604A JPH05189475A (ja) 1992-01-14 1992-01-14 自然言語処理システム用辞書方式

Publications (1)

Publication Number Publication Date
JPH05189475A true JPH05189475A (ja) 1993-07-30

Family

ID=12142756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4024604A Pending JPH05189475A (ja) 1992-01-14 1992-01-14 自然言語処理システム用辞書方式

Country Status (1)

Country Link
JP (1) JPH05189475A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015524105A (ja) * 2012-05-24 2015-08-20 サウンドハウンド,インコーポレイテッド 自然言語処理を可能にするシステム及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015524105A (ja) * 2012-05-24 2015-08-20 サウンドハウンド,インコーポレイテッド 自然言語処理を可能にするシステム及び方法

Similar Documents

Publication Publication Date Title
US7831608B2 (en) Service identification in legacy source code using structured and unstructured analyses
US6009422A (en) System and method for query translation/semantic translation using generalized query language
JPH0630066B2 (ja) テーブル型言語翻訳方法
JPH0527149B2 (ja)
JPH06215029A (ja) テキスト検索方法
JP2005250699A (ja) 階層型データベース装置および階層型データベース装置における製品選定方法およびプログラム
CN108681603B (zh) 数据库中快速搜索树形结构数据的方法、存储介质
US7162478B2 (en) System and method for correlated fragmentations in databases
US5557788A (en) Relational access system for network type data bases which uses a unique declarative statement
EP1341101A2 (en) System and method for document retrieval
JP3612769B2 (ja) 情報検索装置および情報検索方法
CN106547877B (zh) 基于6w业务逻辑模型的数据元智能标识解析方法
JPH05189475A (ja) 自然言語処理システム用辞書方式
US20060259885A1 (en) System and method for analyzing a circuit
CN112905627B (zh) 数据处理方法、装置、计算机设备和存储介质
JP2000148756A (ja) 対訳文誤り検出装置
Campbell A compiler definition facility based on the syntactic macro
JPH0773187A (ja) 検索システム
JP3430273B2 (ja) データベース検索装置及びデータベース検索方法
CN111079036A (zh) 一种字段式搜索方法
JPH08194611A (ja) プログラム修正による影響範囲を解析する装置
JP2004240769A (ja) 情報検索装置
JP2001325293A (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
JPH05120342A (ja) キーワード付与・検索方式
JPH06110933A (ja) 検索処理手順管理方法およびデータベース処理システム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19981110