JP2002215661A - 自然言語インターフェイス知識応答システム - Google Patents

自然言語インターフェイス知識応答システム

Info

Publication number
JP2002215661A
JP2002215661A JP2001005765A JP2001005765A JP2002215661A JP 2002215661 A JP2002215661 A JP 2002215661A JP 2001005765 A JP2001005765 A JP 2001005765A JP 2001005765 A JP2001005765 A JP 2001005765A JP 2002215661 A JP2002215661 A JP 2002215661A
Authority
JP
Japan
Prior art keywords
sentence
knowledge
answer
analysis
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001005765A
Other languages
English (en)
Inventor
Sakae Takeuchi
栄 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2001005765A priority Critical patent/JP2002215661A/ja
Publication of JP2002215661A publication Critical patent/JP2002215661A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 自然言語で入力された文に対して、すでに知
識として蓄えられたデータ(知識データ)から何らかの
回答を引き出して回答する、自然言語によるマン・マシ
ンインターフェイスシステムを実現する。 【解決手段】 自然言語で文を入力して、その入力文に
対してコンピュータが言語解析を行い、何らかの回答、
データ蓄積、実行を行う知識応答システムにおいて、
(1)自然言語形態で入力された文に対して、形態素解
析、構文解析、意味解析を行う手段、(2)前記入力文が
知識(平叙文)に関する情報データの場合には、知識文
として意味モデルデータベース(知識モデルデータベー
ス)に蓄積する手段、(3)前記入力文が質問(質問文)
の場合には、質問文として意味モデルデータベースに一
時記憶し、意味の検証を行い、何らかの回答文を出力す
る手段、(4)前記入力文が命令(命令文)の場合には、
命令文として意味モデルデータベースに一時記憶し、意
味の検証を行い、実行を行う手段、を有することを特徴
とする自然言語インターフェイス知識応答システム。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然言語で入力さ
れた文に対してコンピュータが文を認識することによ
り、自然言語によるマン・マシンインターフェイスを可
能とする知識応答システムに関する。
【0002】
【従来の技術】人間と機械(コンピュータ)との間での
会話は、限られた数の命令語によって行われている。た
とえば、“PRINT FILE-A”と入力すれば、コンピュータ
はファイルLIST-Aの内容を印刷する。PRINTという人間
が理解できる単語を用いているが、そのあとに続く用語
は形式化されている。コンピュータを利用するために
は、人間はコンピュータの理解できる命令を覚える必要
がある。そのことが、人間とコンピュータの垣根を高い
ものとしている。この垣根を低くするために、メニュー
方式や対話形式によるマン・マシンインターフェイスが
考案され、様々な分野で利用されている。しかしこれら
の方式も、操作手順を覚えなければならないことや、シ
ステム開発に多くの時間を要するなど、多くの問題を抱
えている。
【0003】人間が日常話している言葉をコンピュータ
が理解できれば、上記のような人間とコンピュータの間
に存在する垣根は取り払われる。このようなことから、
近年、コンピュータに自然言語(人間が日常使用してい
る言葉・言語)を理解させようとする努力がなされてい
る。
【0004】自然言語をコンピュータに理解させるた
め、音韻解析、形態素解析、構文解析、意味解析などの
解析法が研究されている。音韻解析は音声入力時の音声
認識解析であり、形態素、構文、意味解析は音声入力、
文字入力に関わらず言葉を解析するときに利用されてい
る。
【0005】形態素解析の単語分割法には、最長一致
法、字種切り法、文節数最小法、CYK法がある。最長
一致法は、与えられた文字列を入力順(英語や日本語の
ように右から左にかくも文書は右から順)に走査し、辞
書に登録されている単語のうち最も長く一致するものを
選択していく方法で、単語の一致率(ヒット率)がよい
ことから、日本語ワープロで一般によく利用されてい
る。たとえば、「ここではきものをぬぐ」は、 ここでは/きものを/ぬぐ と文節に区切られ、「ここでは着物を脱ぐ」と変換され
る。ところが、この変換も完全ではなく、 ここで/はきものを/ぬぐ とも区切れる。この場合には、「ここで履き物を脱ぐ」
と変換される。現在の日本語ワープロでは、この文節に
対しても学習機能が働き、ユーザーが区切った文節で次
回からの変換が行われる。最長一致法と文節学習機能と
を組み合わせることによって、より高いヒット率を上げ
ている。
【0006】構文解析は、形態素解析結果から語と語の
間の関係を認識し、対応する木構造を生成する解析法で
ある。この解析では文法が重要な働きをし、言語によっ
てその解析も異なる。現在の構文解析は、基本的に句構
造規則という形で書かれた文法規則にそって行われてい
る。
【0007】構文解析だけでは、曖昧さが大きい。英語
の場合には素性構造単一化による構文解析が用いられ、
効果を上げているが、日本語の場合に意味の曖昧さが大
きいために必ずしも効果的な分析法となっていない。た
とえば、「黒い瞳の大きな女の子」という名詞句では、
10通り以上の解釈ができると言われている。一般に
「女の子」と言葉で言えば「少女」と受け取れるが、文
書の中では「女(通常、女は母親)が所有する(養って
いる)子供」とも解釈できる。このような曖昧さは構文
解析だけで判断することは難しく、意味解析が必要とな
る。
【0008】意味解析では、個々の単語の意味と構文解
析結果を使って文の意味を組み立ててる。出来上がる意
味は通常、述語論理式で記述される。これにより、構文
解析の曖昧さを解消する。たとえば、「読む」は「本を
読む」と「手を読む」では意味が違う。前者は「読む」
本来の使い方であるが、後者は「推察する」の意味にな
る。このような意味の曖昧さは共起する単語によって意
味が決まる。前記の例では、共起する単語は「本」、
「手」である。このような共起する単語とそれに関連す
る単語の関係を登録したものが共起辞書である。
【0009】自然言語をコンピュータが理解できれば、
人間とコンピュータの距離がぐっと近づく。このような
ことから、様々な分野で自然言語によるマン・マシンイ
ンターフェイスが研究されている。この分野に関する特
許も数多く提出される。
【0010】構文解析としては、『構文解析システム』
(特開平10-91628)がある。ここでは、共起関係データ
の中から係り受け関係の最も頻度の高い共起関係データ
の文節を係り先文節と認識することにより、より正しい
係り先を得る方法が提唱されている。
【0011】意味解析としては、『意味解析方法及び装
置及び意味解析プログラムを記録した媒体』(特開2000
-148755)がある。ここでは、あとのキーワード抽出に
必要な深層格を指定し、それ以外の不要な深層格内部の
意味解析を実行することなく、必要最小の範囲の意味構
造を生成することによって、処理速度のアップを図る方
法を提唱している。共起辞書を使用したものとしては、
『共起辞書構築・更新方法と共起・意味解析方法』(特
開平5-197712)がある。ここでは、共起辞書の構築方法
と、共起辞書を用いて意味解析のための個々の共起の度
合から解釈の妥当性を数値化する方法を提唱している。
【0012】一方、数量表現を扱ったものとしては、
『数量/時間表現処理方式』(特開平7-200583)があ
る。ここでは、入力文(自然言語記述文)の数量/時間
表現に対して、基準や範囲に関する情報を抽出し、数量
/時間に関する情報を補完したり、意味補完内容を一定
の基準で評価して誤りの可能性を判断して、内容をユー
ザーに問い合わせる方法を提唱している。
【0013】構文解析、意味解析を行っても、曖昧さを
完全に解消することは不可能である。とくに日本語の曖
昧さは、言語を使う人間側(とくに政治的に発言をする
場合)にも原因があるが、構造上の問題として存在す
る。修飾語が多くなればなるほど、曖昧さは増すのも、
日本語の特徴でもある。この曖昧さを評価する方法とし
て、『曖昧検索用インデックス情報作成装置及び曖昧検
索用インデックス情報作成方法』(特開平8-129559)が
ある。ここでは、時系列データを時間的に区切って期間
ごとに評価し、期間ごとの評価を平均化し、平均化され
た評価結果を曖昧検索用インデックス情報に反映して、
最新の評価を行う方法が提唱されている。
【0014】
【発明が解決しようとする課題】従来技術でみてきたよ
うに、自然言語によるコンピュータ処理は様々な分野
で、様々な角度から研究されている。しかし現在、完全
な形で完成したものはない。ある米国の研究所では10
0万語以上の単語を辞書に登録しているところがあるそ
うだが、それでも人間と機械との自然会話はできないと
いう。それほど、人の言葉をコンピュータに理解させる
ことは難しい。
【0015】一方、ワードプロセッサや翻訳の分野で
は、完全ではないにしても、かなりの範囲で自然言語の
応用が成功している。音声入力による文書作成も、限ら
れた範囲ではあるが、実用化に向かっている。また逆
に、入力文書を音声出力することもできるようになって
きている。これらも、自然言語処理の研究成果のひとつ
である。
【0016】現在、インターネットなどで行われている
文書・文献検索では、キーワード(単語)による検索が
主流である。ここで使われる論理関係式はANDとOR
であり、これによって検索の範囲を狭めたり、広めたり
することができる。自然言語での検索が行えれば、より
きめ細かなデータ検索が行えるが、現在のところ成功し
た例はない。
【0017】人間が機械と会話するには、自然言語によ
るインターフェイスが必要となる。文による質問に対し
て文で回答を行うには、文を理解し、文を作成して回答
する必要がある。しかし、回答文が常に用意されている
わけではない。このような障害をどのように乗り越える
かが、今後の課題として残されている。
【0018】このような課題に対して、本発明が解決し
ようとする課題は、自然言語で入力された文に対して、
すでに知識として蓄えられたデータ(知識データ)から
何らかの回答を引き出して回答する、自然言語によるマ
ン・マシンインターフェイスシステムを実現することで
ある。
【0019】
【課題を解決するための手段】上記課題を解決するため
に請求項1に記載された発明は、自然言語で文を入力し
て、その入力文に対してコンピュータが言語解析を行
い、何らかの回答、データ蓄積、実行を行う知識応答シ
ステムにおいて、(1)自然言語形態で入力された文に対
して、形態素解析、構文解析、意味解析を行う手段、
(2)前記入力文が知識(平叙文)に関する情報データの
場合には、知識文として意味モデルデータベース(知識
モデルデータベース)に蓄積する手段、(3)前記入力文
が質問(質問文)の場合には、質問文として意味モデル
データベースに一時記憶し、意味の検証を行い、何らか
の回答文を出力する手段、(4)前記入力文が命令(命令
文)の場合には、命令文として意味モデルデータベース
に一時記憶し、意味の検証を行い、実行を行う手段、を
有する自然言語インターフェイス知識応答システムとす
る。
【0020】請求項2に記載された発明は、請求項1の
意味解析手段において、構文解析結果をもとに、同義
語、派生語、敬語などを登録した辞書を用いて、入力文
の意味が変わらない程度に入力文を抽象化する意味抽象
化手段(意味抽象化ルール)、および抽象化した文に対
して知識モデルデータベースよりデータ検索を行い、検
索結果を回答文として出力する手段、を備えた自然言語
インターフェイス知識応答システムとする。
【0021】請求項3に記載された発明は、請求項1の
意味解析手段において、構文解析結果をもとに、入力文
に数値、数量あるいは論理的関係を含む単語が含まれて
いるか、あるいは前記の関係式が使用できることが判明
した場合、知識モデルデータベースに含まれる前記項目
に関連する数値あるいは論理関係より、入力文を別の角
度から、意味の変わらない程度に入力文を抽象化する記
号処理手段(記号処理ルール)、および抽象化文を回答
文に仕立てて出力する手段、を備えた自然言語インター
フェイス知識応答システムとする。
【0022】請求項4に記載された発明は、請求項1
の、質問に対する回答を引き出す手段において、形態素
解析、構文解析、意味解析後、知識モデルデータベース
より質問文に対応する知識データが検索された場合には
その知識データを回答として、そうでない場合には、請
求項2、3の抽象化された知識データを順次質問文と照
らし合わせて、最もふさわしい回答文を導き、それを出
力とする手段、を備えた自然言語インターフェイス知識
応答システムとする。
【0023】請求項5に記載された発明は、請求項1
の、質問に対して回答を引き出す手段において、形態素
解析、構文解析、意味解析後、知識モデルデータベース
より質問文に対応する知識データを検索し、適当な回答
が得られない場合に、ユーザーに対して回答に必要な知
識データを要求する手段(コンサルテーション手段)、
を備えた自然言語インターフェイス知識応答システムと
する。
【0024】請求項6に記載された発明は、上記の質問
に対する回答を導き出す手段を、インターネットにおけ
る検索エンジンやロボットへの自然言語による命令とし
て応用する手段、を備えた自然言語インターフェイス知
識応答システムとする。
【0025】本発明は上記の課題を解決するために、自
然言語で入力された文に対して形態素解析、構文解析、
意味解析を行い、意味検証(応答モデル)を経て出力文
を生成し、回答を出力する。質問文に対しては、知識と
して蓄えられた知識データと質問文とを照合して回答を
引き出す。しかし多くの場合、質問に対応する回答が存
在しないことが多い。このような場合、質問文を抽象化
して検索の範囲を拡大し、入力文の意味が失われない範
囲で知識データの検索と回答文の作成を行う。なお、入
力文が平叙文(知識データ)の場合には、その文をその
まま、あるいは記号化して知識データとして知識モデル
データベースに蓄え、のちに質問の回答を引き出す際
の、知識データとして利用する。具体的には、以下の方
法で上記の検索と回答を可能としている。
【0026】自然言語を入力として、その入力文に対し
て知識応答システムが言語解析を行い、何らかの回答を
行う知識応答システムにおいて、自然言語で入力された
文について形態素解析、構文解析、意味解析を行う。次
に、前記入力文が知識(平叙文)に関する情報データの
場合には、知識文として知識モデルデータベースに蓄積
する。前記入力文が質問(質問文)の場合には、質問文
として知識モデルデータベースに一時記憶し、意味の検
証を行い、何らかの回答文を出力する。前記入力文が命
令(命令文)の場合には、システムは指示された命令を
実行する。
【0027】本発明の目的は、自然言語によるマン・マ
シンインターフェイスを実現するだけでなく、何らかの
形で質問に対する応答を行うことである。たとえば、自
然言語で入力された質問文に対して、質問に対応する知
識データが知識モデルデータベースにあればよいが、も
しない場合でも、「該当する答がありません」という回
答ではなく、質問の回答そのものの答でなくても、それ
に代わる、質問の主旨を失わない範囲で答を見つけ出し
て返答するか、再質問要請(質問の意味が理解できない
とき)やのちに説明するコンサルテーションを行う。そ
のために、知識モデルデータベースに適当な回答がない
ときには、入力文を構文解析したあと、同義語、派生
語、敬語などを登録した辞書を用いて、入力文を元の文
の意味が変わらない範囲で抽象化する。この抽象化され
た文に対応する答を知識モデルデータベースから検索
し、回答文にして出力する。
【0028】知識モデルデータベースに登録されている
データは、文の形態のものもあれば、数値や項目だけの
ものもある。このうち、数値あるいは論理関係に関する
知識を必要とするものに対しては、以下のように回答文
を作成する。すなわち、構文解析結果をもとに、入力文
に数値、数量あるいは論理的関係を含む単語が含まれて
いることが判明した場合、知識モデルデータベースに含
まれる前記項目に関連する数値あるいは論理関係より、
入力文を別の角度から、意味の変わらない程度に記号処
理ルールに則り、入力文を抽象化する。
【0029】質問に対する回答の検索、作成、出力処理
は、次の処理となる。すなわち、質問に対応する知識デ
ータが知識モデルデータベースにある場合には、そのま
ま出力するが、ない場合には、上記の抽象化処理によっ
て質問を抽象化し、抽象化した文に対して、知識データ
を順次抽象化された文と照らし合わせて、意味検証を行
い、最もふさわしい回答文を導き、それを出力する。回
答文は単に知識モデルデータベースに登録されている知
識データ(文、単語、数値、論理関係等の形態をしたデ
ータ)そのものを出力するだけでなく、場合によっては
加工されることもある。
【0030】上記の努力を行っても、適当な回答が探索
できなかったり、質問の意味が理解できない場合には、
再質問を行ったり、コンサルテーションを行う。コンサ
ルテーションとは、回答に必要な知識データの要求のこ
とである。コンサルテーションによってユーザーから得
られた知識データは、知識モデルデータベースに登録さ
れる。
【0031】上記の手段を有する本発明の自然言語イン
ターフェイス知識応答システムは、インターネットにお
ける検索エンジンやロボットへの自然言語による命令等
の、マン・マシンインターフェイスとして応用すること
ができる。
【0032】
【発明の実施の形態】本発明の実施の形態を図を用いて
説明する。図1は、本発明の自然言語インターフェイス
知識応答システムの処理概念図である。本発明で扱う入
力文は知識入力と質問文入力である。入力文が知識
データに属するか、質問データに属するか、命令データ
に属するかは、形態素解析、構文解析、意味解析
を行うことによって判明する。入力文は意味モデルデー
タベースに登録されるが、入力データが知識データの場
合には、意味モデルデータベース(知識用、これを「知
識モデルデータベース」とよぶ)に登録して将来の知識
データとして使用される。入力文が質問文の場合には、
意味モデルデータベース(質問用)に一時記憶され、意
味検証の動機づけとなる。
【0033】なお、入力文が知識文、質問文以外の命
令、依頼、要請文の場合には、何らかの実行が伴う。た
とえば、「ファイルAを印刷してください」という入力
文に対しては、ファイルAのプリントアウトが行われ
る。この場合も、一時的に意味モデルデータベースに登
録され、質問文と同様な処理の対象となる。
【0034】形態素解析では、単語辞書を使って入力
文を解析し、単語に分割する。形態素解析により分割さ
れた単語は文法的にどのような構成をなしているかを、
構文解析で行う。構文解析により、入力文が平叙文か
質問文かが判明する。たとえば、「赤い花が好きです」
なら平叙文、「赤い花が好きですか」なら質問文とな
る。構文解析の結果は構解析木で出力する。形態素解
析、構文解析の結果の出力例は実施例で示す。
【0035】意味解析では、構文解析の結果をもと
に、シソーラス辞書、意味辞書を使って意味の抽象化を
行う。シソーラス辞書には、同義語、類義語が登録され
ている。たとえば、「誕生日」は、「生年月日」などの
言い方もされる。意味解析における意味抽象化ルールに
は、名詞抽象化ルール、動詞抽象化ルール、構文抽象化
ルールがある。具体的には、 ○名詞抽象化ルール ・接頭語(丁寧語) ・同義語 ○動詞抽象化ルール ・活用(過去形、現在形、未来形) ・丁寧語 ・同義語 ○構文抽象化ルール ・語順 ・複文 ・倒置文 ・接続 などのルールである。
【0036】たとえば、 言い回し(丁寧語等):お名前→名前、行きます→行く 語順(倒置語文) :彼は公園に息子を連れて行きま
した→息子を彼は連れて行きました 同義語 :あなた、おまえ、君、貴様 などが例として挙げられる(より具体的な例は実施例で
挙げる)。単語の置き換えはシソーラス辞書に登録され
ているが、その変化や言い回しのルールは意味辞書に登
録されている。
【0037】意味辞書の記号処理ルールでは、数値ある
いは論理的関係が成り立つものに対して応用される。た
とえば、四則演算を用いた例として次のようなものが挙
げられる。 ○年齢ルール 質問した日の日付が誕生日前なら、 年齢=本年−生年−1 そうでない(誕生日後)なら 年齢=本年−生年 と計算できる。上記の例は、生年(生年月日)が知識モ
デルデータベースに登録されている場合で、問い合わせ
が年齢の場合である。一方、論理的な関係としてはPr
olog言語の記述が可能で次のような例が挙げられ
る。 ○親子ルール 論理関係として、 親子(A,B):−夫婦(A,C),親子(C,B). 知識文:AとCは夫婦です。CとBは親子です。 となる。知識モデルデータベースに前者の形態(論理関
係式)で登録して、後者の知識文と併用することができ
る。
【0038】意味解析によって、平叙文と判明した文は
知識モデルデータベースに登録される。その場合、数値
や論理関係に関するものは、入力文そのものでなく、上
記の例にあるような単純化した記号にしておくと、記憶
容量の節約になる。逆に記号処理ルールにより、入力文
に記号を用いることも可能である。
【0039】意味検証では、意味解析された知識また
は質問の意味モデルに対して比較・検討され、回答また
はコンサルテーションを出力する。回答文は質問文に対
する回答であり、コンサルテーションは質問文に対する
回答が得られなかった場合に、回答に結びつくような質
問を出したり、再質問を要請するものである。なお、平
叙文でも命令文、依頼文、要請文は、別の見方をするな
ら質問文としても受け取れる。たとえば、 きょうのA社の株価を教えてください。 きょうのA社の株価を教えろ。 きょうのA社の株価はいくらですか? のように、それぞれの文は依頼、命令、質問となってい
るが、内容的には同等のものとして扱える。したがっ
て、抽象化の段階で多くの場合、これらの文も質問文と
して扱うことになる。ただし、先に挙げた例のように
「ファイルAを印刷しろ」というような場合には、シス
テム上の実行が伴う。
【0040】以上、意味解析、意味検証、出力文生
成の具体的な例を見てきたが、意味検証では以下のこ
とを行う。 ○意味検証 a.質問の回答を得ることを目的として、意味モデルを
比較検討し、質問の内容の補足または矛盾を指摘する。 b.意味モデル(質問)の不確定値を意味モデル(知
識)から検索し、回答する。 c.bにおいて回答が得られなかった場合は、質問内容
の正当性を評価し、質問内容に問題があるときには、ユ
ーザーに対してコンサルテーションや再質問文要求を出
す。
【0041】回答文作成において、「はい」、「いい
え」の答を出せる質問の場合にも、単に「はい」、「い
いえ」の回答だけでなく、質問文の回答に近い意味の知
識モデルがあると仮定して、質問内容を変化させること
により得られる回答に補足説明を付けて回答するように
する。以下の例で見てみよう。 例1:「彼は足を骨折しました」という知識に対して 「彼は手を骨折しましたか?」と質問すると、 →「彼は手を骨折しました」という知識を探す→否定 →「?は手を骨折しました」という知識を探す →否定(手を骨折した者はいない) →「彼は?を骨折しました」という知識を探す →肯定(足を骨折していることが見つかる) 以上により、回答は、「いいえ、手ではなく足です」となる。
【0042】
【実施例】図2は、本発明の自然言語インターフェイス
知識応答システムの仕組みを示した図である。基本的に
仕組みは図1と同じであるが、形態素解析、構文解析、
意味解析、応答モデル(意味検証)、意味表現、構文生
成、文生成はそれぞれモジュールとしてシステムに組み
込む。このうち、本発明の基本を成している意味解析、
応答モデル、意味表現以外は、将来的にコンピュータの
OSの一部としてシステムに組み込む。
【0043】図2の例では、知識や質問の入力は音声、
キーボードのどちらでも可能としている。音声入力の場
合には、音声認識を音素認識モジュールが行い、音声入
力された言葉を文字列に変換する。たとえば、「かい
た」という発話音声からは“kaita”という5文字の文
字列を生成する。キー入力の場合には、入力された文字
列がそのまま言語解析の対象となる。
【0044】入力文は、形態素解析で単語に分解し、構
文解析で構解析木という形で構造を表現する。図3、4
は「私は、話題の本を夢中で読んでいます」という文を
形態素解析、構文解析した結果の出力例である。膠着語
である日本語の動詞は、接尾語が変化する。たとえば前
記の入力文中の「読ん」は、[動詞,自立],五段,マ
行,連用ダ接続,読ん,読むのように解析される。すな
わち、「読ん」は「読む」の連用形であると解析されて
いる。形態素解析結果を文法に基づいて構文解析するこ
とによって、図4のような構解析木が作れる。
【0045】構文解析の結果をもとに、意味解析を行
う。入力文が知識データの場合にはそのまま知識モデル
データベース(意味モデルデータベースの知識用)に登
録するといっても、同じ知識データやそれと同等の意味
の知識データがすでに登録されている場合には、重複し
て同じデータを登録することになるので、そのような不
都合をなくすためにも、意味解析における意味の抽象化
は重要である。意味抽象化には、以下に示す単語レベル
の抽象化と文レベルの抽象化がある。
【0046】○単語の抽象化 同意語 同じ意味を持つ言葉 広義語 広い意味として同じ言葉 狭義語 狭く限って解釈した場合に同じ言葉 派生語 接頭語や接尾語が付いてできた言葉 仮名 送り仮名違い、別の漢字、平仮名、カタカ
ナで表記した同じ読みの言葉 外来語 外来語や英語の日本語読みを、カタカナで
表現する言葉 敬語 敬語、謙譲語、丁寧語等の敬意を表す同じ
意味の言葉 以上の例を表1に載せておく。なお、表中の〜は上
記の〜に対応する。
【0047】
【表1】
【0048】○文の抽象化 成分の位置 主部と修飾部、修飾部と修飾部の位置
が入れ替わった文
【0049】成分の倒置 文の終わりにくるはずで
ある述部が前にきている文
【0050】成分の省略 話の続き具合で意味がわ
かる場合、ある成分を省略する文
【0051】複文 文のある成分に節が含ま
れている文 例:私は、 そんなことは 無理だ と 考えている。 −− −−−−−− −−− −−−−− 主語 述語 主語 述語 ↓ そんなことは 無理だ 、と 私は 考えている。 −−−−−− −−− −− −−−−− 主語 述語 主語 述語
【0052】意味の抽象化のうち、記号処理の例として
は以下のものがある。 ○四則演算処理 例:年齢ルールによる知識探索 誕生日前なら、年齢=本年−生年−1です。 誕生日後なら、年齢=本年−生年です。 「年齢はいくつですか?」という質問があったとする。
これに対して、回答探索は以下のように行う。 (1)「年齢は?です。」の?を知識より探す→失敗 (2)「年齢ルール」の適用により、「年月日」をシステ
ムから持ってくる (3)「年齢ルール」の適用により、「生年月日」を知識
から探す→失敗 (4)「生年月日」をユーザに問い合わせる 回答文: 対象の「生年月日」を教えてください。質問
をキャンセルする場合は、「リターン・キー」を入力し
てください
【0053】○Prolog言語の記述処理 例:親子ルールによる知識探索 親子(A,B):-夫婦(A,C),親子(C,B). AとCは夫婦です。CとBは親子です。 「AとBは親子ですか?」という質問があったとする。
これに対して、回答探索は以下のように行う。 (1)「AとBは親子です。」を直接知識モデルデータベ
ースより探す→失敗 (2)AとBの直接的な関係はデータベースに登録されて
いなくても、Aに関する家族関係の知識(上記の例は、
夫婦(A,C).と親子(C,B).)が登録されてい
れば、その関係から回答を類推する。すなわち、AとC
が夫婦で、CとBは親子であることから、Aの子はCの
子でもあると関係づけられる。このことは、次の関係式
により、導かれる。 親子(A,B):−夫婦(A,C),親子(C,B). (3)回答文は「その通りです。」となる。
【0054】○フレームによる知識処理 フレームは、「知識を表現するための枠組み」である。
これにより、階層的なまとまりをもった知識をより効率
的に、自然な形で表現できる。
【0055】 例:生物のフレーム −−−−−−− 概念名 ::生物 上位概念名 ::自然物 繁殖 ::する 水分 ::ある 呼吸 ::する
【0056】 動物のフレーム −−−−−−− 概念名 ::動物 上位概念名 ::生物 葉緑素 ::ない 栄養 ::有機物 運動機関 ::持つ
【0057】 植物のフレーム −−−−−−− 概念名 ::植物 上位概念名 ::生物 葉緑素 ::あり 根と葉 ::あり 葉の色 :デフォルト:緑
【0058】以上のフレームから、生物には動物と植物
があることがわかる。逆に動物、植物の上位概念をみる
ことにより、ともに生物であることが推論できる。
【0059】以上の例のように、知識モデルデータベー
スには文章形式だけでなく、Prologやフレームの形で知
識データが保有されている。意味解析された文が知識デ
ータの場合には、文章、Prolog、フレームなどの形式で
データベースに登録される。逆に質問文に対しては、質
問文と知識モデルデータベースの知識データとが比較・
検討される。この処理は応答モデルで行う。
【0060】図5は応答モデルの位置づけと内容を示し
たもので、外部データベースとあるのは応答先に関する
情報データベースである。その具体的な内容として顧客
ファイルや企業情報ファイルなどが含まれる。どのよう
な種類のファイルが含まれるかは、応用分野によって異
なる。言語理解エンジンが自然言語に対して対応する
実行パターンは ・平叙文→記憶 ・質問文→回答 ・命令文→実行 の3通りである。 応答制御プログラム、基本知識データ、Web設
定ファイル、画像ファイルを設定することにより、イ
ンターネット上での応用システムが容易に構築できる。
【0061】図6は通信環境をインターネット、開発言
語をProlog言語で構築したシステム例を示す。基
本(推論)エンジンは、質問に対する回答探索推論エン
ジン、省略文処理、文脈理解(意味検証)などの働きを
するモジュールである。インターネット上で使用する場
合には、セッションが途切れる毎に大容量の辞書データ
を再ロードしないためにプログラムの実行を制御するセ
ッション管理プログラムを導入しなければならない。
【0062】
【発明の効果】本発明の最大の特徴は、自然言語による
マン・マシンインターフェイスを可能にしていることで
ある。これまでのマン・マシンインターフェイスでは、
特殊な文法を持つ命令文やメニュー形式のインターフェ
イスが使われてきた。前者の場合にはユーザーは命令文
を覚えるの大変であった。後者の方法はマシンに対して
明確な指示が可能ではあるが、ユーザーの意図が伝わり
にくいシステムとなっていた。これに対して、本発明は
自然言語を用いるために、ユーザーは日常語でマシンと
会話ができ、しかも特殊な扱いを必要としないなどの利
点がある。
【0063】本発明では、回答を意味の抽象化によって
広範囲の推論を行っているために、質問文に対する回答
文を具体的に用意しておく必要がない。たとえば、質問
に対応する知識データが知識モデルデータベースにない
場合には、質問の回答に必要な知識をユーザーに要求す
ること(コンサルテーション)により、新たな知識を自
然に増やしていける。また、質問に対する直接的な回答
だけでなく、質問に近い意味やそれに関連する回答を見
つけて応答することもできるために、従来のように知識
として登録されていない情報に対しても何らかの回答が
行えたり、補足的な説明を加えて回答することができ
る。
【0064】前記の内容にも絡むが、本発明では知識デ
ータのメンテナンスが容易なことである。その理由とし
て、 知識データはテキスト文書によって作成でき、データ
作成のためにプログラムの使い方を習得する必要がない
こと、 複雑な構造を持つ知識データに関しては文書中で記号
が使えるために、明確な知識表現が可能なこと、 コンサルテーションによる知識データの増殖が可能な
こと、などが挙げられる。
【図面の簡単な説明】
【図1】本発明の自然言語インターフェイス知識応答シ
ステムの処理の流れを概念的に示した説明図である。
【図2】本発明の自然言語インターフェイス知識応答シ
ステムの仕組みを説明するための図である。
【図3】本発明の自然言語インターフェイス知識応答シ
ステムにおける形態素解析の出力結果例を示す図であ
る。
【図4】本発明の自然言語インターフェイス知識応答シ
ステムにおける構文解析の出力結果例を示す構解析木図
である。
【図5】本発明の自然言語インターフェイス知識応答シ
ステムにおける応答モデルの位置づけと内容を示す図で
ある。
【図6】本発明の自然言語インターフェイス知識応答シ
ステムの構成を説明するためのシステム構成図である。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】自然言語で文を入力して、その入力文に対
    してコンピュータが言語解析を行い、何らかの回答、デ
    ータ蓄積、実行を行う知識応答システムにおいて、(1)
    自然言語形態で入力された文に対して、形態素解析、構
    文解析、意味解析を行う手段、(2)前記入力文が知識
    (平叙文)に関する情報データの場合には、知識文とし
    て意味モデルデータベース(知識モデルデータベース)
    に蓄積する手段、(3)前記入力文が質問(質問文)の場
    合には、質問文として意味モデルデータベースに一時記
    憶し、意味の検証を行い、何らかの回答文を出力する手
    段、(4)前記入力文が命令(命令文)の場合には、命令
    文として意味モデルデータベースに一時記憶し、意味の
    検証を行い、実行を行う手段、を有することを特徴とす
    る自然言語インターフェイス知識応答システム。
  2. 【請求項2】請求項1の意味解析手段において、構文解
    析結果をもとに、同義語、派生語、敬語などを登録した
    辞書を用いて、入力文の意味が変わらない程度に入力文
    を抽象化する意味抽象化手段(意味抽象化ルール)、お
    よび抽象化した文に対して知識モデルデータベースより
    データ検索を行い、検索結果を回答文として出力する手
    段、を備えたことを特徴とする自然言語インターフェイ
    ス知識応答システム。
  3. 【請求項3】請求項1の意味解析手段において、構文解
    析結果をもとに、入力文に数値、数量あるいは論理的関
    係を含む単語が含まれているか、あるいは前記の関係式
    が使用できることが判明した場合、知識モデルデータベ
    ースに含まれる前記項目に関連する数値あるいは論理関
    係より、入力文を別の角度から、意味の変わらない程度
    に入力文を抽象化する記号処理手段(記号処理ルー
    ル)、および抽象化文を回答文に仕立てて出力する手
    段、を備えたことを特徴とする自然言語インターフェイ
    ス知識応答システム。
  4. 【請求項4】請求項1の、質問に対する回答を引き出す
    手段において、形態素解析、構文解析、意味解析後、知
    識モデルデータベースより質問文に対応する知識データ
    が検索された場合にはその知識データを回答として、そ
    うでない場合には、請求項2、3の抽象化された知識デ
    ータを順次質問文と照らし合わせて、最もふさわしい回
    答文を導き、それを出力とする手段、を備えたことを特
    徴とする自然言語インターフェイス知識応答システム。
  5. 【請求項5】請求項1の、質問に対して回答を引き出す
    手段において、形態素解析、構文解析、意味解析後、知
    識モデルデータベースより質問文に対応する知識データ
    を検索し、適当な回答が得られない場合に、ユーザーに
    対して回答に必要な知識データを要求する手段(コンサ
    ルテーション手段)、を備えたことを特徴とする自然言
    語インターフェイス知識応答システム。
  6. 【請求項6】上記の質問に対する回答を導き出す手段
    を、インターネットにおける検索エンジンやロボットへ
    の自然言語による命令として応用する手段、を備えたこ
    とを特徴とする自然言語インターフェイス知識応答シス
    テム。
JP2001005765A 2001-01-12 2001-01-12 自然言語インターフェイス知識応答システム Pending JP2002215661A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001005765A JP2002215661A (ja) 2001-01-12 2001-01-12 自然言語インターフェイス知識応答システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001005765A JP2002215661A (ja) 2001-01-12 2001-01-12 自然言語インターフェイス知識応答システム

Publications (1)

Publication Number Publication Date
JP2002215661A true JP2002215661A (ja) 2002-08-02

Family

ID=18873762

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001005765A Pending JP2002215661A (ja) 2001-01-12 2001-01-12 自然言語インターフェイス知識応答システム

Country Status (1)

Country Link
JP (1) JP2002215661A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004303049A (ja) * 2003-03-31 2004-10-28 Fujitsu Ltd 発問返答管理方法
JP2006244102A (ja) * 2005-03-03 2006-09-14 Univ Of Tsukuba 質問応答システム
JP2013190985A (ja) * 2012-03-13 2013-09-26 Sakae Takeuchi 知識応答システム、方法およびコンピュータプログラム
CN103440252A (zh) * 2013-07-25 2013-12-11 北京师范大学 一种中文句子中并列信息提取方法及装置
CN113255374A (zh) * 2021-06-02 2021-08-13 竹间智能科技(上海)有限公司 问答管理方法及***
JP2022027416A (ja) * 2020-07-31 2022-02-10 エムエックス・テクノロジーズ・インコーポレーテッド データ保護問合せインターフェース
JP2022046759A (ja) * 2021-06-30 2022-03-23 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 検索方法、装置、電子機器及び記憶媒体

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004303049A (ja) * 2003-03-31 2004-10-28 Fujitsu Ltd 発問返答管理方法
JP2006244102A (ja) * 2005-03-03 2006-09-14 Univ Of Tsukuba 質問応答システム
JP4512826B2 (ja) * 2005-03-03 2010-07-28 国立大学法人 筑波大学 質問応答システム
JP2013190985A (ja) * 2012-03-13 2013-09-26 Sakae Takeuchi 知識応答システム、方法およびコンピュータプログラム
CN103440252A (zh) * 2013-07-25 2013-12-11 北京师范大学 一种中文句子中并列信息提取方法及装置
CN103440252B (zh) * 2013-07-25 2016-11-16 北京师范大学 一种中文句子中并列信息提取方法及装置
JP2022027416A (ja) * 2020-07-31 2022-02-10 エムエックス・テクノロジーズ・インコーポレーテッド データ保護問合せインターフェース
JP7204790B2 (ja) 2020-07-31 2023-01-16 エムエックス・テクノロジーズ・インコーポレーテッド データ保護問合せインターフェース
CN113255374A (zh) * 2021-06-02 2021-08-13 竹间智能科技(上海)有限公司 问答管理方法及***
CN113255374B (zh) * 2021-06-02 2024-06-07 竹间智能科技(上海)有限公司 问答管理方法及***
JP2022046759A (ja) * 2021-06-30 2022-03-23 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 検索方法、装置、電子機器及び記憶媒体

Similar Documents

Publication Publication Date Title
Kumar Natural language processing
KR100515641B1 (ko) 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법
US20200243076A1 (en) Multi-Dimensional Parsing Method and System for Natural Language Processing
US5369575A (en) Constrained natural language interface for a computer system
CA2467369C (en) Method and apparatus for textual exploration discovery
Tiedemann Recycling translations: Extraction of lexical data from parallel corpora and their application in natural language processing
KR101099177B1 (ko) 기계 번역기를 훈련하기 위한 방법 및 시스템
EP1544746A2 (en) Creation of normalized summaries using common domain models for input text analysis and output text generation
JP2005535007A (ja) 文書検索システム用の知識抽出のための自己学習システムの合成方法
KR20090069275A (ko) 자연언어로 된 텍스트로부터 존재론을 전개하기 위한, 컴퓨터들에 의해 사용되는 방법
JP2002215661A (ja) 自然言語インターフェイス知識応答システム
Nirenburg Progress in machine translation
Felshin The Athena Language Learning Project NLP System: a multilingual system for conversation-based language learning
CN112487801A (zh) 一种面向安全关键软件的术语推荐方法及***
Wu et al. How different are expletive and referential pronouns? A parsing perspective
JP4033011B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Vasconcellos et al. Terminology and machine translation
KR950013128B1 (ko) 기계번역장치 및 방법
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Terdalkar et al. Semantic Annotation and Querying Framework based on Semi-structured Ayurvedic Text
Singh Interfaces to query relational databases in natural language
Cowan PLUTO: A preprocessor for multilingual spoken language generation
Lonsdale et al. An NLP system for extracting and representing knowledge from abbreviated text
Baud et al. Let's Meet the Users with Natural Language Understanding
Monte-Serrat et al. NEW UNIVERSAL LABELING STRATEGY FOR MEANING REPRESENTATION IN NLP.