JP2954592B2 - 言語解析装置 - Google Patents

言語解析装置

Info

Publication number
JP2954592B2
JP2954592B2 JP63272725A JP27272588A JP2954592B2 JP 2954592 B2 JP2954592 B2 JP 2954592B2 JP 63272725 A JP63272725 A JP 63272725A JP 27272588 A JP27272588 A JP 27272588A JP 2954592 B2 JP2954592 B2 JP 2954592B2
Authority
JP
Japan
Prior art keywords
unit
noun
numeral
dictionary
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63272725A
Other languages
English (en)
Other versions
JPH02118879A (ja
Inventor
雅子 望主
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63272725A priority Critical patent/JP2954592B2/ja
Publication of JPH02118879A publication Critical patent/JPH02118879A/ja
Application granted granted Critical
Publication of JP2954592B2 publication Critical patent/JP2954592B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、日英機械翻訳システム等に用いられる日本
語構文解析についての言語解析装置に関する。
従来の技術 この種の言語解析装置において、構文解析を行う場
合、数詞表現部分は一般に名詞として扱われる。これ
は、普通の名詞と同様に格を占めることができるためで
ある。しかし、単位や共起する述語や名詞句によつて文
中での構文的機能は異なつてくる。
例えば、第一のケースとして、「英語を一時間勉強し
た」中の「一時感」は名詞であるが、構文的には述部を
修飾する副詞的性質を持つている。構文解析の際に、こ
れに副詞と同様の性質を持たせないと構文解析が正しく
行われず、時や数量を表す名詞が副詞的に使用されるこ
とがある。このようなことは、例えば電子技術総合研究
所研究報告 第783号中の「日本語基本文法単文篇」
(西村、水谷等 1979年)や、岩波国語辞典第三版「品
詞概説」(第1193頁)において指摘されている。
また、第二のケースとして、例えば「本を三冊読ん
だ」では「三冊」は上記の例と同様に述語「読んだ」を
連用修飾するが、むしろ「本の」中の「本」の数量を表
すものと捉えることが、機械翻訳などを考えた場合、特
に必要になる。しかし、直接「三冊」が「本を」を修飾
するとすると、受け文節は必ず係り文節の後方にあると
いう係り受けの原則を破ることになり、扱いが難しい。
さらに、第三のケースとして、例えば「3m右にボール
を反らした」の「3m右に」のように単位の直後に方向を
示す接尾辞が付いた場合、「3m」は距離や範囲を表す
が、この場合、「3m」は接尾辞「右」を修飾し、全体と
しては方向性のある地点や場所という意味を表すように
なる。
発明が解決しようとする課題 ところが、第一のケースにつき、従来は、これを名詞
として扱つて解析を失敗してしまうことがある。また、
「一時間」という単語を副詞として辞書登録するといつ
た方法もあるが、数と単位による組合せは無限に近く、
全ての表現を登録することは現実には不可能であり、か
つ、仮に可能であつてもはなはだ非効率的である。
また、第二のケースについては、例えば、情報処理学
会第30回全国大会(昭和60年)における「日英機械翻訳
のための日本語文の依存構造解析」において同様の現象
が指摘されているが、具体的な処理方法までは指示され
ていない。よつて、従来は名詞として解析を失敗した
り、入力辞に前編集として「三冊の本」という別表現に
書きなおさせるなどしており、扱いが面倒である。
第三のケースについては、単なる名詞複合語として扱
われるため、解析に失敗することがある。
結局、従来方式によると、数詞表現がどの文節を修飾
しているかの解析が不十分なものである。
課題を解決するための手段 日本語入力文を形態素解析処理により単語と文節に分
割した後、構文解析する言語解析装置において、単位の
表記とその単位の表す意味及びその単位と接尾辞との結
合の際に有する意味とを格納した単位意味辞書と、名詞
の表記とその名詞に対する単位を格納した名詞単位辞書
と、形態素解析処理により分割された数詞を含む文節に
対して、該数詞の単位と接尾辞を用いて前記名詞単位辞
書又は前記単位意味辞書を引き、数詞を含む文節の修飾
先と修飾関係とを決定する数詞表現解析手段とを備え、
前記形態素解析の結果及び前記数詞表現解析手段の結果
とにより構文解析するようにした。
そして、数詞表現解析手段は、数詞を含む文節の数詞
の単位で名詞単位辞書を検索し、同じ単位を持つ名詞句
を含む他の文節を連帯修飾先とするものである。
また、数詞表現解析手段は、数詞を含む文節の数詞の
単位と接尾辞とで単位意味辞書を検索し、数詞を含む文
節の修飾先を該述部とし、検索して得たその意味を修飾
関係とするようにも作用する。
作用 数詞表現部分の修飾先及び修飾関係の決定に際して、
単位及び助数詞の表す意味と、単位と接尾辞との結合の
際に有する意味とを格納した単位意味辞書と、名詞表記
とその名詞に対応する助数詞及び単位を格納した名詞単
位辞書とを用いることにより、何れかの辞書により数詞
部分の意味が判定され、よつて、従来のように無限に近
い数詞表現を辞書に登録しておくことなく、正しく決定
できる。
実施例 本発明の一実施例を図面に基づいて説明する。まず、
第1図は言語解析装置1の基本構成図を示すもので、日
本語文字列を入力として形態素解析部2により形態素解
析した後の単語列に対して構文解析部3で構文解析し、
解析中間表現として後段処理部に出力するものである。
しかして、本実施例では、構文解析部3による構文解
析処理に際して、入力単語列中の数詞表現部分について
処理を施すため、単位意味辞書4と名詞単位辞書5とを
用い、数詞表現解析手段としての数詞表現解析部6で処
理するように構成したものである。
ここに、単位意味辞書4は、例えば第2図に示すよう
に構成されている。即ち、単位の表記とその単位の表す
意味と、単位と方向を表す接尾辞とが連なつた時の意味
の二種類の意味とを、二次元の形式で格納したものであ
る。これにより、数詞表現中の単位とその直後に付く方
向を表す接尾辞との組合せで、数詞表現の表す意味を決
定する。
また、名詞単位辞書5は、例えば第3図に示すよう
に、名詞とこの名詞を数える時の助数詞、単位を記述し
たものである。
このような構成において、第4図のフローチヤートを
参照して数詞表現の解析処理を説明する。これは、形態
素解析した単語列中の数詞表現を含む文節に対して、そ
の修飾先を決定する処理であり、単位の表す意味に合せ
て修飾関係を決定する。
まず、文節中に数詞表現がある場合、数詞表現解析部
6による処理に進み、この数詞表現部分の文節末に格助
詞があるかチエツクする。格助詞がなければ名詞単位辞
書5中を検索し、他の文節中の名詞句に同じ単位を含む
文節があるかどうかチエツクし、一致するものがあれ
ば、一致した文節を数詞の修飾先とし、単位意味辞書を
単位で検索し、得た意味を修飾関係とする。一致するも
のがなければ、単位の直後に方向を表す接尾辞である方
向接尾辞があるか否かチエツクする。方向接尾辞があれ
ば、単位意味辞書4中で方向接尾辞と単位とで表を引い
て意味を調べ、数詞部分をこの意味で述部を修飾するよ
うに変換する。単位の直後に方向接尾辞がなければ、単
位意味辞書4中で単位の意味を検索し、数詞部分をこの
意味で述部を修飾するように変換する。
一方、数詞表現部分の文節末に格助詞があれば、数詞
表現+格助詞と述部の格パターンとを調べる。数詞表現
+格助詞が述部の格パターンに一致すれば、数詞表現を
含む文節が述部の格であると判断し、数詞表現部分を格
を占める名詞句と認定して終了する。述部の格パターン
に一致しなれければ。単位の直後に方向接尾辞があるか
どうかを調べ、あれば単位意味辞書4を方向と単位で検
索し、意味を取り出す。単位の直後に方向接尾辞がなけ
れば、単位意味辞書4で単位を検索し、意味を取り出
す。
このようにして意味が取り出されたら、数詞の修飾先
を述部とし、取り出された意味を修飾関係とする。
このような処理の具体例を例示する。なお、下記の具
体例中、「^」は単語の区切り、「/」は文節の区切り
を表すものとする。
具体例1 入力文 本を三冊読んだ。
構文解析入力時 本^を/三^冊/読んだ/。
まず、「三冊」は数+単位と品詞認定されるので、数
詞表現であり、第4図の処理に入る。この場合、この文
節の末には格助詞がないので、名詞単位辞書5でこの文
節以外の文節中の各名詞句と単位「冊」とで一致するも
のがあるかどうか調べる。名詞「本」の助数詞は「冊」
であるので一致する。文節「三冊」を「本」を連体修飾
するように変換し、数詞部分についての処理を終了す
る。このような、数詞表現解析部6の処理後には、 となる。このように、「本を三冊読んだ」という文中の
「三冊」のような副詞的表現を解析しにくいからといつ
て「三冊の本」と前編集する手間をかける、ようなこと
なく修飾先を決定できる。
具体例2 入力文 死者が三千人にのぼる。
構文解析入力時 死者^が/三千^人^に/のぼる/。
まず、「三千人に」は数+単位+格助詞と品詞認定さ
れるので、数詞表現であり、第4図の処理に入る。この
文節の末に格助詞「に」があるので、述部の格と一致す
るかどうか調べる。この場合、「三千人」は「のぼる」
の「に」格を埋める名詞句とし、終了する。このような
数詞表現解析部6による処理後には、 となる。
具体例3 入力文 ボールを3m右に反らした。
構文解析入力時 ボール^を/3^m^右^に/反らし^た/。
まず、「3m右に」は数+単位+方向接尾辞+格助詞と
品詞認定されるので、数詞表現であり、第4図の処理に
入る。この文節末に格助詞「に」があるので、述部「反
らす」の格と一致するかどうか調べる。この場合、「反
らす」は「に」格をとらないので、処理を次に進め、単
位の直後に方向接尾辞があるかどうか調べる。この場
合、単位「m」の直後に方向接尾辞「右」があるので、
単位意味辞書4で単位「m」と方向接尾辞「右」とで表
を検索することにより、意味が位置であることが判る。
この結果、「3m右に」という文節は、述部「反らした」
に対して位置という意味で修飾していることが判り、修
飾先を述部とする。このような数詞表現解析部6での処
理後には、 となる。このように、数詞表現に方向を表す接尾辞が付
いた「3m右に」といつた表現も、その修飾先を正しく決
め、修飾関係を明らかにできる。
このようにして、無限に近い各種の数詞表現を、個々
に辞書に登録しておくようなことなく、その正しい修飾
先を決定できる。
発明の効果 本発明は、上述したように単位及び助数詞の表す意味
と、単位と接尾辞との結合の際に有する意味とを格納し
た単位意味辞書と、名詞表記とその名詞に対応する助数
詞及び単位を格納した名詞単位辞書とを設け、数詞表現
に対しこれらの単位意味辞書及び名詞単位辞書を用いて
数詞表現部分の修飾先及び修飾関係を決定する数詞表現
解析手段を設けたので、数詞表現部分の修飾先及び修飾
関係の決定に際して、無限に近い数詞表現を辞書に登録
しておくようなことなく、正しく決定することができ
る。
【図面の簡単な説明】
図面は本発明の一実施例を示すもので、第1図はブロツ
ク図、第2図は単位意味辞書の構成図、第3図は名詞単
位辞書の構成図、第4図は数詞表現処理を示すフローチ
ヤートである。 4……単位意味辞書、5……名詞単位辞書、6……数詞
表現解析手段
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 17/20 - 17/28 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】日本語入力文を形態素解析処理により単語
    と文節に分割した後、構文解析する言語解析装置におい
    て、単位の表記とその単位の表す意味及びその単位と接
    尾辞との結合の際に有する意味とを格納した単位意味辞
    書と、名詞の表記とその名詞に対する単位を格納した名
    詞単位辞書と、形態素解析処理により分割された数詞を
    含む文節に対して、該数詞の単位と接尾辞を用いて前記
    名詞単位辞書又は前記単位意味辞書を引き、数詞を含む
    文節の修飾先と修飾関係とを決定する数詞表現解析手段
    とを備え、前記形態素解析の結果及び前記数詞表現解析
    手段の結果とにより構文解析するようにしたことを特徴
    とする言語解析装置。
  2. 【請求項2】数詞表現解析手段は、数詞を含む文節の数
    詞の単位で名詞単位辞書を検索し、同じ単位を持つ名詞
    句を含む他の文節を連体修飾先とするものであることを
    特徴とする請求項1記載の言語解析装置。
  3. 【請求項3】数詞表現解析手段は、数詞を含む文節の数
    詞の単位と接尾辞とで単位意味辞書を検索し、数詞を含
    む文節の修飾先を該述部とし、検索して得たその意味を
    修飾関係とするものであることを特徴とする請求項1記
    載の言語解析装置。
JP63272725A 1988-10-28 1988-10-28 言語解析装置 Expired - Fee Related JP2954592B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63272725A JP2954592B2 (ja) 1988-10-28 1988-10-28 言語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63272725A JP2954592B2 (ja) 1988-10-28 1988-10-28 言語解析装置

Publications (2)

Publication Number Publication Date
JPH02118879A JPH02118879A (ja) 1990-05-07
JP2954592B2 true JP2954592B2 (ja) 1999-09-27

Family

ID=17517909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63272725A Expired - Fee Related JP2954592B2 (ja) 1988-10-28 1988-10-28 言語解析装置

Country Status (1)

Country Link
JP (1) JP2954592B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5343539B2 (ja) * 2008-12-05 2013-11-13 富士ゼロックス株式会社 言語処理装置、言語処理システム及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
池田 尚志,「日本語文の構文・意味解析システムに関する研究」、電子技術総合研究所研究報告 第871号 p.67−70(1986)

Also Published As

Publication number Publication date
JPH02118879A (ja) 1990-05-07

Similar Documents

Publication Publication Date Title
Gaizauskas et al. University of Sheffield: Description of the LaSIE system as used for MUC-6
Ge et al. A statistical semantic parser that integrates syntax and semantics
Denis et al. Coupling an annotated corpus and a morphosyntactic lexicon for state-of-the-art POS tagging with less human effort
EP1217533A2 (en) Method and computer system for part-of-speech tagging of incomplete sentences
US20050171757A1 (en) Machine translation
JPH0242572A (ja) 共起関係辞書生成保守方法
JPH077419B2 (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
Motlani et al. A finite-state morphological analyser for Sindhi
Hansen et al. Multi-layer analysis of translation corpora: methodological issues and practical implications
Foufi et al. Multilingual parsing and MWE detection
JP2954592B2 (ja) 言語解析装置
Wang et al. Evaluation of spoken language grammar learning in the ATIS domain
Shaalan et al. Towards an Arabic parser for modern scientific text
KR19990042430A (ko) 문장의 구조정보를 이용한 명사구 추출장치 및 그 방법
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Moghadam et al. A Survey of Part of Speech Tagging of Latin and non-Latin Script Languages: A more vivid view on Persian
Rimon The recognition capacity of local syntactic constraints
JPH0320866A (ja) テキストベース検索方式
JP3810809B2 (ja) 構文解析装置
Pozharytska et al. Digital technologies for grammatical error correction: deep learning methods & syntactic n-grams
JP2838849B2 (ja) 言語処理装置
Yerimbetova et al. Estimation of the degree of similarity of sentences in a natural language based on using the Link Grammar Parser program system
JPS62262178A (ja) 言語解析装置
JP2752025B2 (ja) 機械翻訳装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees