JPS63221475A - 構文解析方法 - Google Patents

構文解析方法

Info

Publication number
JPS63221475A
JPS63221475A JP62055624A JP5562487A JPS63221475A JP S63221475 A JPS63221475 A JP S63221475A JP 62055624 A JP62055624 A JP 62055624A JP 5562487 A JP5562487 A JP 5562487A JP S63221475 A JPS63221475 A JP S63221475A
Authority
JP
Japan
Prior art keywords
syntax
morpheme
syntactic
information
input sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62055624A
Other languages
English (en)
Inventor
Yuji Sugano
祐司 菅野
Kenji Nagao
健司 長尾
Osamu Iwasaki
修 岩崎
Kenichi Ueda
謙一 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62055624A priority Critical patent/JPS63221475A/ja
Publication of JPS63221475A publication Critical patent/JPS63221475A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、入力された文の文構造や意味に従って動作す
る機器の構文解析方法に関するものである。
従来の技術 以下文として日本語文を対象にした場合について説明す
る。機械翻訳システムや文書校正システム等、日本語文
章の文構造や意味を理解して動作する計算機応用システ
ムでは、日本語文の構文構造を解析する必要がある。
計算言語学の分野では、そのような文解析の手法が研究
されており、例えば、「講座現代の言語第7巻・言語の
機械処理」(長尾真編、三省堂刊)や、「日本語情報処
理」(長尾真監修、電子通信学会発行)等の成書には、
これまでに開発された文解析手法のうちの代表的なもの
が紹介されている。その中で、文脈自由文法に基づく構
文解析手法は、構文規則が宣言的で明確であり、個々の
規則が独立しているので、文法の開発、保守が容易であ
る。また、言語理論の一つである変形生成文法の研究成
果がすなおに記述できる特徴を持つ。
さら(二、形式言語理論、計算論の分野で、文脈自由文
法に基づいて、文を解析する効率のよい解析手法が知ら
れており、これらの手段を援用した解析システムがいく
つか作られており、「自然言語処理のためのプログラミ
ングシステム・拡張LINGOLについて」(田中穂積
他、電気通信学会論文誌、1977年、12号、160
1〜16o8頁)等はその一例である。しかしながら、
このような解析システムでは、一般的で、制限のない文
脈自由文法の形で書かれた構文規則が扱える解析手法を
用いているため、その代償として、空間的、時間的なオ
ーバールラドが生じ、例えば、アーリー(Earley
)の解析手法の場合には、入力文の長さをnとすると、
n2のオーダーの記憶容量と、n5のオーダーの計算時
間が必要になる。これに対し、構文規則が、文脈自由文
法の一部分に限定される場合ニは、FORTRAN等プ
ログラミング言語の翻訳プログラム(コンパイラ−)で
用いられているような、より高速な手法が使える。例え
ば、構文規則がLL(k)文法と呼ばれる。文脈自由文
法の一部分に属する場合には、再帰下降法と呼ぶ手法を
用いて、より効率のよい解析を行なう事ができる。その
詳細は、ディセントコンバイリング。
ニー・ジェー・ティー ディピー他著 エリスハークソ
ド社刊行1981年(Descent Compili
ng。
A、 J、 T、 Davie他 Ellis Hor
wood社刊。
1981年)に述べられている。しかしながら、多くの
自然言語の文法はあいまいなもので、このような制限付
きの文脈自由文法の枠がら出てしまい、そのままの形で
は、自然言語の解析を完全に行なうことはできない。
発明が解決しようとする問題点 しかし、以上のような方法では、入力文の構文構造を、
構文木の形で完全に求めようとする限り、構文規則とし
て記述できる最も複雑なものにも対処できるような解析
手法を用いねばならず、空間的、時間的にかなりのオー
バーヘッドが生ずるという問題があった。また、一般的
な解析手法の適用の前に、その解析手法で用いる構文規
則とは別の、制限された構文規則を用いて解析する手法
では、構文規則が2群に分離するため、構文規則体系全
体としての整合性を保つのが困難で、個々の入力文に存
在する特殊性も生かせないという問題があった。
本発明は、以上のような問題点を解決するもので、一般
の構文規則に従って解析を行なう構文解析手段で入力文
を解析する前に、個々の入力文の持つ特殊性と、与えら
れた構文規則群の特徴とを考慮して、前記構文解析手段
に比べて解析能力は劣るが高速・効率的な第2の構文解
析手段で、可能な限りの解析を行なうことで、取り扱い
やすい単一の構文規則群の下で、最悪の場合の効率を落
とさずに、平均的な処理効率を向上させた構文解析方法
を提供するものである。
問題点を解決するための手段 本発明は、構文規則(二従って入力文の構文構造を解析
する構文解析手段と、前記入力文が前記構文解析手段へ
入力される前に、前記入力文の構文構造の一部分を求め
る不完全構文解析手段とにより、上記目的を達成するも
のである。
作    用 上記構成において、人力文中に含まれる形態、構文、意
味等の諸情報が、不完全構文解析手段へ入力され、全構
文規則中で、適用できると、前記不完全構文解析手段に
よって判断された規則だけが、前記入力文に適用され、
高速だが、部分的で不完全な構文解析が行なわれる。そ
の結果が、全ての構文規則を取り扱うことの可能な、一
般の構文解析手段へ入力され、ここで、完全に構文解析
が行なわれる。
実施例 以下、本発明によって、ベタ書きされた漢字がな混じり
表記の日本語文を、文脈自由文法に基づいて解析し、構
文木な出力する構文解析方法を例にとって、図面と共に
説明する。図は、本発明による構文解析方法を実施する
ための全体構成を示すブロック図である。図において、
1は解析すべき入力文、2は形態素と、その品詞とを納
めた品詞辞書、3は品詞辞書2を参照して、入力文1を
相互(二隣接可能な、品詞情報の付加された形態素列4
へと変換する形態素解析手段、5は文脈自由文法式で記
述された構文規則、例えば、「 単位文 −格要素・単
位文 」 「 単位文 −連部      」 「 格要素 −名詞句・格助詞 」 のような規則が納められた構文規則群、6は形態素列4
の品詞の情報と構文規則群5とから、入力文1を部分的
に構文解析する、LR(1)手法に基づいた高速な不完
全構文解析手段、7は不完全構文解析手段6が出力する
部分ホ列、8は、部分ホ列7をアーリー(Earley
)の手法(:基づいて解析し、構文ホ9を求める構文解
析手段である。
入力文1は、文頭の文字から順に形態素解析手段3へ読
み込まれて処理される。形態素解析手段3(二よって、
品詞辞書2が検索されて、形態素となり得る文字列が認
定され、その品詞が、直前(二認定された形態素と接続
可能ならば、その文字列は形態素として認定される。こ
の動作を繰り返すことで、最終的に、品詞情報の付加さ
れた形態情報、意味情報等の形態素列4が得られる。形
態素列4は、文頭の形態素から1つずつ不完全構文解析
手段6へ読み込まれて処理される。不完全構文解析手段
6は、解析の途中結果及び最終結果を納めるバッファ領
域と、構文規則群5から作られた有限状態オートマトン
とから成り、バッファ領域の内容と読み込んだ形態素、
及び有限状態オートマトンの現在の状態により、行なう
べき動作を決定する。ただし、行なうべき動作が複数何
者えられ、−意には定まらない場合、すなわち、LR(
1)文法の範囲を超えるような動作が必要となる場合に
は、構文規則を適用することはせず、単にシフト動作(
読み込んだ形態素を単にバッファ領域に付は加える)を
行なう。このようにして、不完全構文解析手段6は形態
素列4を解析してゆき、最終的にバッファ領域内に部分
ホ列7が得られるが、この部分ホ列7は、構文規則群5
が同一であっても、入力文1の内容によって、形態素列
4と同一のもの(全熱解析が行なわれない)から、完全
な構文ホ(全ての解析が行なわれる)まで、様々な場合
があり得るが、一般には、いくつかの形態素がボトム・
アップにまとめ上げられて出来た部分ホ(最終的(=得
られる構文木の一部分)の列であり、その列の要素数は
1以上かつ形態素列4の形態素数以下である。また、こ
の不完全構文解析の段階で、後の構文・意味解析に役立
つ各種の情報を抽出することも可能である。このよう(
ニして出来た部分ホ列7は、構文解析手段8により、1
部分水ごとに読み込まれ、解析表の形式で、全ての可能
な構文木が求まる。
上記の実施例においては、LR(1)手法の計算量が時
間的にも空間的にも、形態素列4の形態素数nとしたと
き、nlのオーダーであり、先に述べたアーリー(Ea
rley )の解析手法の計算量よりも少なくて済む。
しかも、最悪の場合でも、計算量は、不完全構文解析手
段6がない場合と同等である。また、不完全構文解析手
段6は、構文解析手段8のための補助的な情報抽出を行
なって、構文解析手段8へ渡すことも可能であり、その
場合には、構文解析手段8の処理効率そのものを向上さ
せることができる。
なお、以上の説明では文として日本語文を使用した場合
について説明したが、英語、ドイツ語等、その他の各種
言語の文に対しても適用できる。
発明の効果 以上の説明のように、本発明によれば、従来の構文解析
方法に比べ、構文規則群を単一にしたままで、効率よく
適用することが可能な構文規則を、個々の入力文(二応
じて自動的に判断、適用することが可能であり、最悪の
場合の効率を落とすことなしに、平均的な処理効率を向
上させることができ、その効果は大きい。
【図面の簡単な説明】
図は本発明(二よる構文解析方法の一実施例の全体構成
を示すブロック図である。 1・・・入力文、2・・・品詞辞書、3・・・形態素解
析手段、4・・・形態素列、5・・・構文規則群、6・
・・不完全構文解析手段、7・・・部分ホ列、8・・・
構文解析手段、9・・・構文木。

Claims (3)

    【特許請求の範囲】
  1. (1)個々の入力文の構文構造を言語の構文構造を定め
    た構文規則群に従って解析する際、前記入力文中の形態
    情報、意味情報と、前記構文規則群中の情報とを用いて
    、前記入力文の構文構造の一部分を求めた後、構文解析
    することを特徴とする構文解析方法。
  2. (2)構文規則文が、文脈自由文法あるいは拡張文脈自
    由文法のいずれかの形式で記述されている特許請求の範
    囲第1項記載の構文解析方法。
  3. (3)入力文が形態情報、意味情報等の付加された、日
    本語の形態素の列である特許請求の範囲第1項記載の構
    文解析方法。
JP62055624A 1987-03-11 1987-03-11 構文解析方法 Pending JPS63221475A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62055624A JPS63221475A (ja) 1987-03-11 1987-03-11 構文解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62055624A JPS63221475A (ja) 1987-03-11 1987-03-11 構文解析方法

Publications (1)

Publication Number Publication Date
JPS63221475A true JPS63221475A (ja) 1988-09-14

Family

ID=13003935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62055624A Pending JPS63221475A (ja) 1987-03-11 1987-03-11 構文解析方法

Country Status (1)

Country Link
JP (1) JPS63221475A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
JP2013025699A (ja) * 2011-07-25 2013-02-04 Nec Corp 構文解析情報作成装置、翻訳装置、翻訳システム、構文解析情報作成方法およびコンピュータプログラム
US8838440B2 (en) 2010-09-14 2014-09-16 International Business Machines Corporation Generating parser combination by combining language processing parsers

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
US8838440B2 (en) 2010-09-14 2014-09-16 International Business Machines Corporation Generating parser combination by combining language processing parsers
JP2013025699A (ja) * 2011-07-25 2013-02-04 Nec Corp 構文解析情報作成装置、翻訳装置、翻訳システム、構文解析情報作成方法およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
JPH02165378A (ja) 機械翻訳システム
KR20040101678A (ko) 복합 형태소 분석 장치 및 방법
JPS6318458A (ja) 感情情報抽出装置
JPS63221475A (ja) 構文解析方法
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Zhang et al. Chinese-Mongolian Machine Translation Combining Sentence Structure Information
JPS62139076A (ja) 言語解析方式
JPS63228326A (ja) キ−ワ−ド自動抽出方式
Isahara et al. Context analysis system for Japanese text
JPS6126172A (ja) カナ漢字変換方式
KR100400222B1 (ko) 선택 제한을 위한 동적 의미 분류 방법 및 장치
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH02140869A (ja) 文章の構造解析方法
Ahmed et al. Multilingual Extension of Dependency Parsing and Annotation
Aref et al. English to Arabic machine translation: a critical review and suggestions for development
JPH0320866A (ja) テキストベース検索方式
JPS6389975A (ja) 言語解析装置
JPS61221875A (ja) 日本語文章の単文化処理方式
JPH0827798B2 (ja) 構文解析装置
Kurohashi et al. Construction of Japanese nominal semantic dictionary using “A NO B” phrases in corpora
JPH04372047A (ja) 仮名漢字変換装置
JPS62264367A (ja) 日本語生成装置
JPS63168775A (ja) 自然言語慣用表現解析変換装置
JPS63138465A (ja) 構文解析装置
JPS61115172A (ja) 機械翻訳システム