JP2960936B2 - 係り受け解析装置 - Google Patents

係り受け解析装置

Info

Publication number
JP2960936B2
JP2960936B2 JP62173011A JP17301187A JP2960936B2 JP 2960936 B2 JP2960936 B2 JP 2960936B2 JP 62173011 A JP62173011 A JP 62173011A JP 17301187 A JP17301187 A JP 17301187A JP 2960936 B2 JP2960936 B2 JP 2960936B2
Authority
JP
Japan
Prior art keywords
dependency
word
candidate
relationship
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62173011A
Other languages
English (en)
Other versions
JPS6417152A (en
Inventor
博人 稲垣
明宏 清水
史彦 小橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP62173011A priority Critical patent/JP2960936B2/ja
Publication of JPS6417152A publication Critical patent/JPS6417152A/ja
Application granted granted Critical
Publication of JP2960936B2 publication Critical patent/JP2960936B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、機械翻訳,自然言語理解,自動索引抽出
などの自然言語処理における文章の係り受け解析方法を
実施するための係り受け解析装置に関するものである。 〔従来の技術〕 文章の係り受け解析は、自然言語処理の前処理であ
り、係り受けの精度が処理全体の性能に大きく影響す
る。そのため、精度の高い係り受け解析方法が強く望ま
れている。 一般に、日本語文の係り受けには、できるだけ受け語
を係り語の近くに配置するという規則がある。しかし、
係り受け関係の全てが上記規則に当てはまらないため、
係り受け関係にあいまい性が生じる。そこで、係り受け
関係を正確に決定するために、種々の方法が従来から提
案されている。 意味情報を付与した動詞の格関係の文型表を用いる方
法を絹川ら(絹川,木村:日本語文構造解析による自動
インデクシング方式、情報処理学会論文誌、vo1.21,no.
3,1980)は提案している。 第6図は上記の係り受け解析方法で用いられている動
詞の格関係の文型表の例である。文中の動詞に着目し、
その動詞に接続する名詞と格助詞およびその名詞句の意
味分類を規定し、その関係を用いて係り受け解析を行っ
ている。しかし、この方法は、全ての動詞について、動
詞と名詞の格関係を記述する困難な作用を必要とする。
さらに、名詞句から名詞句への係り受けや用言の連体修
飾による名詞句への係り受けなどの場合、係り受けの決
定が難しいという問題点がある。 高松,西田ら(高松,日下,西田:技術抄録文からの
関係情報の自動抽出、情報処理学会論文誌vo1.25,no.2,
1984)は、絹川らの文型表による係り受け解析方法の問
題点を専門的知識を用いることにより補っている。この
方法は、特許請求の範囲文などの技術抄録文に対し、動
詞の格構造パターンと個別に記述された専門の分野の知
識を組み合せて、格構造関係だけでは解析できなかった
あいまいな係り受け解析の決定を可能としている。具体
例を用いてその方法を説明する。 まず、入力文の格構造を解析してから、第7図の知識
表へのアクセス表を参照する。次に、そのアクセス表を
基に、文の格構造に対応する格ラベルの組を知識表から
検索する。そして、知識表に書かれている格関係事例を
最尤係り受け候補とし、係り受けを判定する。 第8図は半導体装置に関する知識表の例である。第9
図の文例で上記方法の係り受け解析例を示す。この例で
は“含む”動詞が“シリコン基板上の”に係るか“絶縁
層”に係るかの(a),(b)2通りの解釈が成り立
つ。“含む”型動詞の格としてはOBJとPARTICを取り、
その間には“COMPOSITION"の概念関係があることが第7
図(a)のアクセス表より判断される。 次に、第8図の半導体装置における“COMPOSITION"の
知識表を検索し、OBJとPARTICの格関係の事例を調べ
る。実際には、“チャンネル領域”(PARTIC)と“シリ
コン基板”(OBJ)の格関係事例が知識表より抽出さ
れ、チャンネル領域はシリコン基板に含まれるが、絶縁
層はシリコン基板に含まれないという知識が抽出でき、
この例では(a)の係り受けが正しいと判断される。 〔発明が解決しようとする問題点〕 この方法により連体修飾に関する係り受け解析を正確
に行うことができるが、構成素など各種の知識表や各専
門分野ごとに綿密な知識表を作成しなければならないと
いう問題点がある。 この発明の目的は、特許請求の範囲文などのように繰
り返し表現の多い文章の構文解析に際し、詳細な格関係
や専門的知識を用いずに、文章内の情報により係り受け
のあいまい性を解消する係り受け解析方法を提供するこ
とにある。 [問題点を解決するための手段] 本発明にかかる係り受け解析装置は、係り語と受け語
との対からなる接続関係を記録する接続テーブルと、係
り語の意味カテゴリ番号と受け語の意味カテゴリ番号と
の対からなる意味カテゴリ番号の連結関係を記録する意
味カテゴリ番号の連結関係リストとからなり、前記接続
関係と前記意味カテゴリ番号の連結関係との対を係り受
け関係として記録した係り受け関係テーブルからなる係
り受け候補保存部を有する。 また、入力文を文節に分割する文節単位分割部と、前
記入力文の先頭から順次分割された文節を抽出する文節
抽出部と、前記抽出された文節を係り語とし残りの文節
を受け語とする対からなる文節間係り受け候補を抽出す
る係り受け候補抽出部と、前記抽出された文節の自立語
が2個以上の単語からなる複合語であるとき前記複合語
を単語に分割して接頭語と接尾語を取り除く複合語分割
部と、前記複合語の単語間係り受け関係を係り語と直後
の単語に係る受け語の対を接続関係とし、前記係り語の
意味カテゴリと受け語の意味カテゴリの対を意味カテゴ
リ番号の連結関係とする複合語係り受け解析部と、前記
単語間係り受け関係を前記係り受け候補保存部に登録
し、前記文節間係り受け候補が1つである場合その候補
を前記係り受け候補保存部に新規に登録する係り受け関
係登録部を有する。 前記文節間係り受け候補が2つ以上の場合、前記候補
の接続関係と一致するものが前記接続テーブルの中から
検索できたとき、そのうち係り語と受け語の距離が最も
近い候補を正解と判定し、正解が判定できなかった場
合、前記候補の連結関係と一致するものが前記意味カテ
ゴリ連結関係リストの中から検索できたとき、そのうち
係り語と受け語の距離が最も近い候補を正解と判定する
係り受け候補検索部と、前記係り受け候補検索部におい
て正解が判定できなかった場合に前記候補の中の係り語
とする意味カテゴリ番号と受け語の意味カテゴリ番号が
等しい候補が存在するか否かを判定し、存在する場合に
その候補を正解とし、存在しない場合に文節間係り受け
の判定を保留する係り受け判定部を有する。 すべての文節の係り受け解析が終了した時点で正解を
決定できなかった文節間係り受け候補について、係り語
と受け語の距離が最も短い文節間係り受け候補を正確と
する、係り受け関係決定部とを有する。 なお、前記係り受け候補検索部は、前記係り受けの判
定を保留した候補の接続関係が前記に登録された接続関
係と一致する候補を正解と判定し、正解が判定されなか
った場合に前記判定を保留した候補の連結関係が前記新
規に登録された連結関係と一致する候補を正解と判定す
ることを特徴とするものである。 [作用] 本発明にかかる係り受け解析装置では、係り受け候補
保存部は係り受け関係テーブルとして係り語と受け語と
の対からなる接続関係を記録する接続テーブルと、係り
語の意味カテゴリ番号と受け語の意味カテゴリ番号との
対からなる意味カテゴリ番号の連結関係を記録する意味
カテゴリ番号の連結関係リストとからなり、接続関係と
意味カテゴリ番号の連結関係との対を係り受け関係とし
て記録する。 文を入力すると入力文は文節単位分割部によって文節
に分割される。文節抽出部は、入力文の先頭から順次分
割された文節を抽出し、係り受け候補抽出部は抽出され
た文節を係り語とし残りの文節を受け語とする対からな
る文節間係り受け候補を抽出する。 複合語分割部は、抽出された文節の自立語が2個以上
の単語からなる複合語であるとき、複合語を単語に分割
して接頭語と接尾語を取り除く。複合語係り受け解析部
は単語間係り受け関係として、係り語と直後の単語に係
る受け語の対を接続関係とし、係り語の意味カテゴリと
受け語の意味カテゴリの対を意味カテゴリ番号の連結関
係とする。 係り受け関係登録部は単語間係り受け関係を係り受け
候補保存部に新規に登録し、文節間係り受け候補が1つ
である場合、該候補を係り受け候補保存部に新規に登録
する。 係り受け候補検索部は、文節間係り受け候補が2つ以
上の場合、該候補の接続関係と一致するものが接続テー
ブルの中から検索できたとき、そのうち係り語と受け語
の距離が最も近い候補を正解と判定し、正解が判定でき
なかった場合、該候補の連結関係と一致するものが意味
カテゴリ連結関係リストの中から検索できたとき、その
うち係り語と受け語の距離が最も近い候補を正解と判定
する。 係り受け判定部は、係り受け候補検索部において正解
が判定できなかった場合に該候補の中の係り語の意味カ
テゴリ番号と受け語の意味カテゴリ番号が等しい候補が
存在するか否かを判定し、存在する場合に該候補を正解
とし、存在しない場合に文節間係り受けの判定を保留す
る。 係り受け関係決定部は、すべての文節の係り受け解析
が終了した時点で正解を決定できなかった文節間係り受
け候補のうち係り語と受け語の距離が最も短い文節間係
り受け候補を正解とする。 なお、係り受け候補検索部は、係り受けの判定を保留
した候補の接続関係が新規に登録された接続関係と一致
する候補を正解と判定し、正解が判定できなかった場
合、係り受けの判定を保留した候補の連結関係が新規に
登録された連結関係と一致する候補を正解と判定する。 よって、本発明の係り受け解析装置は入力文を分割し
て得られた文節間の係り受け関係を1通りに定めること
ができる。ここで係り受け解析の際には複合語を構成す
る単語間係り受け関係や1つに定められた文節間係り受
け候補が係り受け候補保存部に登録され、その後の係り
受け解析に用いられる。 〔実施例〕 以下、この発明の実施例について説明する。 この発明の実施例においては、係り受け関係の係り語
と受け語はともに文節を単位とする。また、係り受け関
係としては、係り語と受け語の意味カテゴリの連結関係
および係り語と受け語の接続関係を用いる。ここで、意
味カテゴリとは、単語の持つ共通的な意味概念を表して
おり、各単語には、その概念に対応した意味カテゴリ番
号等が割り当てられる。この実施例で使用している意味
カテゴリ番号は、国立国語研究所発行の分類語彙表(国
立国語研究所資料集6 分類語彙表、秀英出版、1964)
に記載されているものを用いる。 第1図はこの発明の係り受け解析装置に用いる係り受
け解析の処理の流れ図、第2図はこの発明に係る係り受
け解析装置の一実施例を示すブロック図である。まず、
第2図に示される構成について述べ、次に第1図により
その動作を説明する。 第2図において、1は文節単位分割部で、入力文を文
節に分割する。2は文節抽出部で、入力文の先頭から順
次分割された文節を抽出する。3は係り受け候補抽出部
で、抽出された文節を係り語とし残りの文節を受け語と
する対について文節間係り受け候補を抽出する。4は複
合語分割部で、抽出された文節の自立語が2個以上の単
語からなる複合語であるときに自立語を単語に分割す
る。5は複合語係り受け解析部で、単語間の係り受け関
係を解析する。6は係り受け候補保存部で、係り語と受
け語との対からなる接続関係を記録する接続テーブル
と、係り語の意味カテゴリ番号と受け語の意味カテゴリ
番号との対からなる意味カテゴリ番号の連結関係を記録
する意味カテゴリ番号の連結関係リストとからなり、接
続関係と意味カテゴリ番号の連結関係との対を係り受け
関係として記録する係り受け関係テーブルからなる。7
は係り受け関係登録部で、単語間係り受け候補を係り受
け候補保存部6に新規に登録し、文節間係り受け候補が
1通りのとき、該候補を係り受け候補保存部6に新規に
登録する。8は係り受け候補検索部で、文節間係り受け
候補が2通り以上の場合、該候補の接続関係と一致する
ものを接続テーブルの中から検索し、そのうち係り語と
受け語との距離が最も近い候補を正解と判定する。正解
が判定できなかった場合、該候補の関連関係と一致する
ものが前記意味カテゴリ連結関係リストの中から検索
し、そのうち係り語と受け語の距離が最も近い候補を正
解と判定する。 9は係り受け判定部で、係り受け候補検索部8におい
て正解が判定できなかった場合、該候補の中の係り語の
意味カテゴリ番号と受け語の意味カテゴリ番号が等しい
候補が存在するか否かを判定する。存在する場合には該
候補を正解とし、存在しない場合には文節間係り受け関
係の判定を保留する。係り受け関係の判定が保留された
候補については、係り受け候補検索部8がその接続関係
が新規に登録された接続関係と一致する候補を正解と判
定し、正解が判定できなかった場合、その連結関係が新
規に登録された連結関係と一致する候補を正解と判定す
る。 係り受け関係決定部10はすべての文節の係り受け解析
が終了した時点で、正解を決定できなかった文節間係り
受け候補のうち係り語と受け語の距離が最も短くなる文
節間係り受け候補を正解する。 なお、第2図の(1)〜(16)なる番号は各構成要素
で実行される係り受け解析のステップを示し、第1図中
のステップ(1)〜(16)と各々対応する。各ステップ
は次の手順で実行される。まず、ステップ(1)として
文節単位分割部1は入力文を文節に分割する。ステップ
(2)で文節抽出部2は入力文の先頭から順次分割され
た文節を抽出する。ステップ(3)では係り受け候補抽
出部3で、抽出された文節を係り語として対象文節中の
自立語の品詞、活用形およびとする付属語の種類により
受け語となりえる全ての文節候補、即ち文節間係り受け
候補を抽出する。ステップ(4)では複合語分割部4で
係り語を構成する自立語が2個以上の単語からなる複合
語であるか否かを判断し、自立語が2個以上の単語から
なる複合語であるときにステップ(5)に進み、そうで
ないときにはステップ(8)に進む。 ステップ(5)で複合語を単語に分割し、接頭語、接
尾語を取り除く。ステップ(6)では複合語係り受け解
析部5で、係り語と直後の単語に係る受け語の対からな
る接続関係と係り語の意味カテゴリ番号と受け語の意味
カテゴリ番号との対からなる意味カテゴリ番号の連結関
係、即ち単語間係り受け関係を解析する。ステップ
(7)では単語間係り受け関係を係り受け関係登録部7
が係り受け候補保存部6に記録する。ステップ(8)で
は、文節間係り受け候補が1つの場合ステップ(9)を
実行する。ステップ(9)では係り受け関係登録部7に
より該候補を係り受け候補保存部6に新規に記録する。
これらの処理により文節間係り受け解析において、文節
間係り受け情報のみならず単語間係り受け情報も利用で
きるようになる。 文節間係り受け候補が2つ以上の場合ステップ(12)
を実行する。ステップ(12)は係り受け候補検索部8
で、該候補の接続関係と一致するものを接続テーブルの
中から検索し、その中で係り語と受け語の距離が最も短
い候補を正解と判定し、正解が判定できなかった場合、
該候補の連結関係と一致するものを意味カテゴリ連結関
係リストの中から検索し、その中で係り語と受け語の距
離が最も短い候補を正解と判定する。ステップ(13)は
係り受け候補検索部8で正解が判定できた場合ステップ
(17)に進み、正解が判定できなかった場合ステップ
(14)に進む。ステップ(14)で、係り受け判定部9は
該候補の中の係り語の意味カテゴリ番号と受け語の意味
カテゴリ番号が等しい候補が存在するか否かを判定す
る。ステップ(15)では存在する場合に該候補を正解と
判定し、ステップ(17)に進む。存在しない場合にはス
テップ(16)に進み、係り受け判定を保留してステップ
(17)に進む。ステップ(17)では係り語の対象を次文
節に進める。 係り受け判定が保留された係り受け候補について、ス
テップ(10)では係り受け候補検索部8において接続関
係がステップ(7)及びステップ(9)において新規に
登録された接続関係と一致する候補を正解として文節間
係り受け関係を判定する。正解が判定されなかったとき
連結関係が新規に登録された連結関係と一致する候補を
正解として文節間係り受け関係を決定する。 なお、ステップ(11)ですべての文節の係り受け解析
が終了した時点で、係り受け関係決定部10は正解を決定
できなかった係り受け候補について、係り語と受け語の
距離が最も短い候補を正解として決定する。 以下に、特許請求範囲文の解析を例にとって、この発
明の係り受け解析装置で用いられる係り受け解析につい
て説明する。第3図は特許請求範囲文の文例を示す。こ
の文を係り受け解析すると、1通りに決定できない係り
受け候補が存在する。例えば例文中[1]の例では、
「作成中の」という文節を係り語とすると、次の「文章
中に」、「変換結果の」、「同音語を」、「手段と」を
各々受け語とする4通りの係り受け関係が可能にある。
第4図の係り受け関係テーブルには「作成中の」を係り
語として受け語との対からなる接続関係が認められない
ので、接続関係を用いて係り受け関係の候補を絞ること
はできない。そのため、係り語の意味カテゴリ番号と受
け語の意味カテゴリ番号との対からなる意味カテゴリ番
号の連結関係を用いて係り受け関係を決定する。 第4図は「作成中の」の文節まで係り受け解析を実行
して得られた係り受け関係テーブルの例を示す。ここ
で、12は係り語と係り語の意味カテゴリ番号を、13は受
け語と受け語の意味カテゴリ番号を、14は係り語の意味
カテゴリ番号と受け語の意味カテゴリ番号との対からな
る連結関係を記録した意味カテゴリ番号の連結関係リス
トを示す。特に、12と13とは係り語と受け語を対にした
係り語と受け語の接続関係を示すので、12と13とを総括
して接続テーブルと見なすことができる。また、係り受
け関係テーブルがこのような配置で構成されることによ
って、係り受け関係つまり接続関係と連結関係とが対応
付けられて記録されている。ここで、最初の2組の「カ
ナ」−「漢字」と「漢字」−「変換」の関係は第5図に
示される複合語「カナ漢字変換」から抽出された係り受
け関係であり、3番目の「カナ漢字変換」−「変換結
果」の関係は係り語「カナ漢字変換時の」と受け語「変
換結果の」を係り受け解析して得られた係り受け関係で
ある。複合語としての意味カテゴリ番号として、通常、
複合語の意味カテゴリ番号よりも複合語を構成する単語
群の中で複合語の意味を明確に示す単語の意味カテゴリ
番号が用いられる。特許請求範囲文において用いられる
複合語は、最後の単語(接尾語を除く)によってその意
味が表現される場合が多い。第4図の例では一番最後の
単語の意味カテゴリ番号を複合語の意味カテゴリ番号と
して用いている。第4図における最後の3つのリストは
「作成中の文中に表示する手段と」(第3図1行目)と
いう文から抽出した係り受け関係である。この時点まで
に作成された係り受け関係を用いて[1]に示される文
に対する係り受け解析について例を示す。 [1]の係り受け候補(c),(d),(e),
(f)の連結関係はそれぞれ(1.386,1.3154),(1.38
6,1.1112),(1.386,1.3112),(1.386,1.1113)とな
る。この中で第4図の意味カテゴリ番号の連結関係リス
トに記録されている連結関係と一致する(c)の(1.38
6,1.3154)が検索される。つまり、意味カテゴリ番号1.
386が示す生成関係の単語を係り語とし、意味カテゴリ
番号1.3154が示す文章関係の単語を受け語とする係り受
け関係が候補として選ばれる。そのため、生成関連の単
語である「作成」が係り語と文章関連の単語である「文
章」が受け語の候補となる係り受け関係があることがわ
かり、「作成中の」は「文章中に」に係るのが正解であ
るということが判明する。 この例で示されるように、(1.386,1.3154)となる連
結関係から「作成する」という動詞(意味カテゴリ番号
1.386)は意味カテゴリ番号1.3154の単語(文章、論
文、文,……)を格として持つ可能性を表している。そ
のため、必ずしも同じ単語が係り受けに用いられていな
くとも、意味カテゴリ番号の同じ単語同志で、同様な係
り受け関係をとると判定することができる。 例えば「文を作るとき…」という文について「文を」
という文節と「作る」という文節との間に係り受け関係
の判定にも用いることができる。また、連結関係で係り
と受けを区別せずに、意味カテゴリ番号の連結関係リス
トを用いて「作成された文章の…」という係り語と受け
語とが逆になった係り受け関係も判定できる。 第3図の[3]の例で、一致する接続関係と連結関係
が係り受け関係テーブルに記録されていない係り受け候
補についての処理例を示す。ここで、文節「選択され
る」は連体修飾形であるため、名詞(句)つまり「同音
語表示選択手段を」と「同音語出力方式」のどちらにも
係る可能性があったとする。ここでは係り受け候補の接
続関係も連結関係も係り受けテーブルに一致するものが
認められなかったことを仮定する。このときステップ
(14)を実行することになる。そこで、意味カテゴリ番
号が単語「選択」と等しい1.3063となる係り語と、意味
カテゴリ番号が単語「選択」と等しい1.3063となる単語
から構成される受け語、からなるものを係り受け全候補
から絞り込む。この場合、複合語「同音語表示選択手
段」の「選択」の意味カテゴリ番号が1.3063であるた
め、「選択させる」を係り語としたとき「同音語表示選
択手段」が受け語となる係り受け関係が特定される。 それでも係り語の意味カテゴリ番号と受け語の意味カ
テゴリ番号が一致しない係り受け候補が、第3図[2]
の例のように2種類以上存在することがありうる。ここ
では、「変換結果の」という文節を係り語とするとき
「同音語を」(g)と「手段と」(h)を各々受け語と
する。そのため文節「変換結果」を係り語とする係り受
け候補をすべて保存して係り受けの判定を保留し、次文
節の係り受け解析を実行する。他の文節の係り受け解析
を実行した結果、文節「変換結果」を係り語とする係り
受け関係は第3図2行目の波線箇所11で示される範囲に
おける係り受け関係の解析結果を用いて決定することが
できる。つまり、波線箇所11における係り語「変換結果
の」からは受け語「同音語を」が1通りに決定される。
これらの接続関係が接続テーブルに記録され、単語「変
換結果」の意味カテゴリ番号1.1112と単語「同音語」の
意味カテゴリ番号1.3112との対からなる連結関係が意味
カテゴリの連結関係リストに記録される。そのため、文
節「変換結果の」が文節「同音語を」に係る係り受け関
係を、新たに記録された接続関係または連結関係とから
決定できる。つまり、第3図の[2]の例では後の文節
を係り受け解析することにより、先の文節を係り語とす
る(g)の係り受け関係が正解であると判断される。 なお、第3図の[4]の例では、文節「同音語」を係
り語としたとき図に示すように(k)「表示して」,
(l)「選択させる」,(m)「備えたことを」,
(n)「特徴とする」とをそれぞれ受け語とする4種類
の係り受け候補がある。これらの係り受け関係に対応す
る意味カテゴリ番号の連結関係と一致する意味カテゴリ
番号の連結関係は、図4の意味カテゴリ番号の連結関係
リストには認められない。しかし、複合語「同音表示選
択手段」を単語に分割してから、「同音語」を係り語
「表示」を受け語とする係り受け関係等、その単語間の
係り語と受け語との連結関係を決定することにより、文
節「同音語を」は文節(k)「表示して」に係ると決定
することができる。 〔発明の効果〕 この発明の係り受け解析装置は、係り受けが一義に決
定できる係り受け関係を係り受け候補保存部に順次保存
し、係り受けが一義に決定できない係り受け関係の判定
に際し、係り受け候補保存部を参照して、この係り受け
候補保存部に存在する係り受け関係をこの係り受け候補
保存部に存在しない係り受け関係に優先して採用するも
のであるから、特別な専門的知識を用いずに、各文章内
にある情報を抽出し利用することにより、精度の高い係
り受け解析を実現することができる。そして、係り受け
関係を意味カテゴリの連結としてえられた場合、動詞の
格関係に基づく係り受けや、名詞句による修飾を一元的
に扱うことができ、かつ言い替えを含む文章に対しても
係り受け関係を一義的に決定できる。この発明を用いれ
ば、専門的知識を分野毎に作成するために必要となるコ
ストを節減することができる。また、この方法をハード
ウエア、ソフトウエアいずれで実現する場合において
も、専門的知識を常駐させておく領域を必要としないた
め、非常に小規模のシステムとすることができる。 したがって、この発明の係り受け解析装置は、特許文
や法律文のような同じ表現を繰り返し用いている文章の
解析に有効である。さらに、本解析装置は文章の自動分
類、自動索引抽出、自動要約などの自動文書処理に応用
することができる。また、日本語の文章に限らず英文に
対しても適用することが可能である等の優れた利点があ
る。
【図面の簡単な説明】 第1図はこの発明の係り受け解析装置の処理手順の流れ
図、第2図はこの発明の係り受け解析装置の一実施例を
示すブロック図、第3図はこの発明の一実施例の説明に
用いた特許請求範囲文の文例を示す図、第4図は前記実
施例で作成した係り受け関係テーブル、第5図は前記実
施例における複合語解析の例を示す図、第6図は従来の
係り受け解析方法で用いられた格関係表の例を示す図、
第7図,第8図は従来の係り受け解析方法で用いられた
知識表へのアクセス表と知識表の例を示す図、第9図は
従来の係り受け解析の実行例の説明に用いた特許文の文
例を示す図である。 図中、1は文節単位分割部、2は文節抽出部、3は係り
受け候補抽出部、4は複合語分割部、5は複合語係り受
け解析部、6は係り受け候補保存部、7は係り受け関係
登録部、8は係り受け候補検索部、9は係り受け判定
部、10は係り受け関係決定部である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小橋 史彦 神奈川県横須賀市武1丁目2356番地 日 本電信電話株式会社複合通信研究所内 (56)参考文献 特開 昭61−260366(JP,A) 特開 昭62−197076(JP,A)

Claims (1)

  1. (57)【特許請求の範囲】 1.係り語と受け語との対からなる接続関係を記録する
    接続テーブルと、係り語の意味カテゴリ番号と受け語の
    意味カテゴリ番号との対からなる意味カテゴリ番号の連
    結関係を記録する意味カテゴリ番号の連結関係リストと
    からなり、前記接続関係と前記意味カテゴリ番号の連結
    関係との対を係り受け関係として記録した係り受け関係
    テーブルからなる係り受け候補保存部と、 入力文を文節に分割する文節単位分割部と、 前記入力文の先頭から順次分割された文節を抽出する文
    節抽出部と、 前記抽出された文節を係り語とし残りの文節を受け語と
    する対からなる文節間係り受け候補を抽出する係り受け
    候補抽出部と、 前記抽出された文節の自立語が2個以上の単語からなる
    複合語であるとき、前記複合語を単語に分割して接頭語
    と接尾語を取り除く複合語分割部と、 前記複合語の単語間係り受け関係を、係り語と直後の単
    語に係る受け語の対を接続関係とし、前記係り語の意味
    カテゴリと受け語の意味カテゴリの対を意味カテゴリ番
    号の連結関係とする複合語係り受け解析部と、 前記単語間係り受け関係を前記係り受け候補保存部に新
    規に登録し、 前記文節間係り受け候補が1つである場合、その候補を
    前記係り受け候補保存部に新規に登録する係り受け関係
    登録部と、 前記文節間係り受け候補が2つ以上の場合、 前記候補の接続関係と一致するものが前記接続テーブル
    の中から検索できたとき、 そのうち係り語と受け語の距離が最も近い候補を正解と
    判定し、 正解が判定できなかった場合、前記候補の連結関係と一
    致するものが前記意味カテゴリ連結関係リストの中から
    検索できたとき、そのうち係り語と受け語の距離が最も
    近い候補を正解と判定する係り受け候補検索部と、 前記係り受け候補検索部において正解が判定できなかっ
    た場合、前記候補の中の係り語の意味カテゴリ番号と受
    け語の意味カテゴリ番号が等しい候補が存在するか否か
    を判定し、存在する場合、その候補を正解とし、 存在しない場合、文節間係り受けの判定を保留する、係
    り受け判定部と、 すべての文節の係り受け解析が終了した時点で、正解を
    決定できなかった文節間係り受け候補について、係り語
    と受け語の距離が最も短い文節間係り受け候補を正解と
    する、係る受け関係決定部とを有し、 前記係り受け候補検索部は、前記係り受けの判定を保留
    した候補の接続関係が前記新規に登録された接続関係と
    一致する候補を正解と判定し、 正解が判定できなかった場合、前記係り受けの判定を保
    留した候補の連結関係が前記新規に登録された連結関係
    と一致する候補を正解と判定することを特徴とする、 係り受け解析装置。
JP62173011A 1987-07-13 1987-07-13 係り受け解析装置 Expired - Lifetime JP2960936B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62173011A JP2960936B2 (ja) 1987-07-13 1987-07-13 係り受け解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62173011A JP2960936B2 (ja) 1987-07-13 1987-07-13 係り受け解析装置

Publications (2)

Publication Number Publication Date
JPS6417152A JPS6417152A (en) 1989-01-20
JP2960936B2 true JP2960936B2 (ja) 1999-10-12

Family

ID=15952542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62173011A Expired - Lifetime JP2960936B2 (ja) 1987-07-13 1987-07-13 係り受け解析装置

Country Status (1)

Country Link
JP (1) JP2960936B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0628057B2 (ja) * 1989-12-07 1994-04-13 キヤノン株式会社 文字処理装置
JP3293619B2 (ja) * 1990-08-20 2002-06-17 株式会社シーエスケイ 日本語構文解析システム
JP2666549B2 (ja) * 1990-09-27 1997-10-22 日本電気株式会社 半導体記憶装置及びその製造方法
JP2855409B2 (ja) * 1994-11-17 1999-02-10 日本アイ・ビー・エム株式会社 自然言語処理方法及びシステム
JP2002354941A (ja) * 2001-06-01 2002-12-10 Toray Ind Inc 糖度アップ用シート
CA2616853C (en) * 2005-07-29 2011-02-15 Fiberweb, Inc. Bicomponent sheet material having liquid barrier properties
JP2008017729A (ja) * 2006-07-11 2008-01-31 Mkv Platech Co Ltd 飛来農薬付着防止用被覆材
JP7082333B2 (ja) * 2017-11-30 2022-06-08 学校法人酪農学園 設問自動生成プログラム及び設問自動生成装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61260366A (ja) * 1985-05-14 1986-11-18 Sharp Corp 学習機能付機械翻訳システム
JPS62139076A (ja) * 1985-12-13 1987-06-22 Agency Of Ind Science & Technol 言語解析方式

Also Published As

Publication number Publication date
JPS6417152A (en) 1989-01-20

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US8027966B2 (en) Method and system for searching a multi-lingual database
JP3906356B2 (ja) 構文解析方法及び装置
US6169999B1 (en) Dictionary and index creating system and document retrieval system
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
US20060047691A1 (en) Creating a document index from a flex- and Yacc-generated named entity recognizer
US20060047690A1 (en) Integration of Flex and Yacc into a linguistic services platform for named entity recognition
JP2960936B2 (ja) 係り受け解析装置
Khoo et al. Using statistical and contextual information to identify two‐and three‐character words in Chinese text
KR100617319B1 (ko) 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법
KR20050064574A (ko) 영한 자동번역에서 의미 벡터와 한국어 국소 문맥 정보를사용한 대역어 선택시스템 및 방법
JP2003303194A (ja) 慣用句辞書作成装置、検索用インデックス作成装置、文書検索装置、それらの方法、プログラム及び記録媒体
Gillard et al. The LIA at QA@ CLEF-2006.
Kumar et al. TelStem: An unsupervised telugu stemmer with heuristic improvements and normalized signatures
JPH01243116A (ja) 日本文処理方法
CN109710844A (zh) 基于搜索引擎的快速准确定位文件的方法和设备
JPS63228326A (ja) キ−ワ−ド自動抽出方式
Takahasi et al. Keyboard logs as natural annotations for word segmentation
Rosset et al. The LIMSI Qast systems: comparison between human and automatic rules generation for question-answering on speech transcriptions
KR20020054244A (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
JP2655711B2 (ja) 同形語読み分け方式
JPH0244462A (ja) 自然言語処理装置
JP3139624B2 (ja) 形態素解析装置
JP2002342325A (ja) 対訳確率付与装置、対訳確率付与方法並びにそのプログラム
JPH03229367A (ja) テキストベース検索方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term