JP4033088B2 - 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム - Google Patents

自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP4033088B2
JP4033088B2 JP2003320327A JP2003320327A JP4033088B2 JP 4033088 B2 JP4033088 B2 JP 4033088B2 JP 2003320327 A JP2003320327 A JP 2003320327A JP 2003320327 A JP2003320327 A JP 2003320327A JP 4033088 B2 JP4033088 B2 JP 4033088B2
Authority
JP
Japan
Prior art keywords
semantic
analysis
morpheme
natural language
language processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003320327A
Other languages
English (en)
Other versions
JP2005092254A (ja
Inventor
博 増市
智子 大熊
宏樹 吉村
大悟 杉原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2003320327A priority Critical patent/JP4033088B2/ja
Publication of JP2005092254A publication Critical patent/JP2005092254A/ja
Application granted granted Critical
Publication of JP4033088B2 publication Critical patent/JP4033088B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、人間が日常的なコミュニケーションに使用する自然言語を数学的に取り扱うための自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、自然言語文の構文・意味解析を行なう自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
さらに詳しくは、本発明は、所定の文法規則に基づいて自然言語文についての構文・意味解析結果を出力する自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、文法規則に基づく自然言語処理手順において、意味情報を付与するための膨大な規則を適用することに伴う解析に要するコストを削減する自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
日本語や英語など、人間が日常的なコミュニケーションに使用する言葉のことを「自然言語」と呼ぶ。多くの自然言語は、自然発生的な起源を持ち、人類、民族、社会の歴史とともに進化してきた。勿論、人は身振りや手振りなどによっても意思疎通を行なうことが可能であるが、自然言語により最も自然で且つ高度なコミュニケーションを実現することができる。
他方、情報技術の発展に伴い、コンピュータが人間社会に定着し、各種産業や日常生活の中に深く浸透している。いまやコンピュータ・データだけでなく、画像や音響などほとんどすべての情報コンテンツがコンピュータ上で取り扱われ、情報の編集・加工、蓄積、管理、伝達、共有など高度な処理を行なうことが可能となっている。
例えば、日本語や英語を始めとする各種の言語で記述される自然言語は、本来抽象的で曖昧性が高い性質を持つが、文章を数学的に取り扱うことにより、コンピュータ処理を行なうことができる。この結果、機械翻訳や対話システム、検索システム、質問応答システムなど、自動化処理により自然言語に関するさまざまなアプリケーション/サービスが実現される。
かかる自然言語処理は一般に、形態素解析、構文解析、意味解析、文脈解析という各処理フェーズに区分される。
形態素解析では、文を意味的最小単位である形態素(morpheme)に分節して品詞の認定処理を行なう。構文解析では、文法規則などを基に句構造などの文の構造を解析する。構文解析結果は一般に個々の形態素が係り受け関係などを基にして接合された木構造となる。意味解析では、文中の語の語義(概念)や、語と語の間の意味関係などに基づいて、文が伝える意味を表現する意味構造を求めて、意味構造を合成する。また、文脈解析では、文の系列である文章(談話)を解析の基本単位とみなして、文間の意味的なまとまりを得て談話構造を構成する。
とりわけ、構文解析及び意味解析は、自然言語処理の分野において、対話システム、機械翻訳、文書校正支援、文書要約などのアプリケーションを実現する上で必要不可欠の技術であるとされている。
意味解析処理では、構文解析結果の構造に基づいて、主語や目的語といった格の決定や、種々の意味情報の付与を行なう。例えば、日本語文を形態素解析、構文解析、意味解析の順序で解析する際に、句複合における構文解析に曖昧性をなくし無駄な構文木生成をなくす日本語処理システムについて提案がなされている(例えば、特許文献1を参照のこと)。
ここで、以下に示す例文についての言語解析処理について考察してみる。
(1)彼が来るから私は行かない。
(2)彼が来てから私が行く。
図4並びに図5には、上記の各例文を解析対象文とした場合の形態素解析結果例を示している。各図に示すように、形態素解析結果として、入力文の各形態素を見出し語とし、これら見出し語が文中の出現順に配列されてなるテーブルが得られる。各見出し語エントリには、見出し語となる単語とその読み、原形、その品詞カテゴリ、活用形の種別などが記述されている。
また、図6並びに図7には、これらの形態素解析結果に基づく構文解析結果例をそれぞれ示している。図示の通り、構文解析結果として、句構造を表した解析木が出力される。
構文解析を実施するためには、一般に、文脈文法と呼ばれる文法形式に則った文法規則が必要である。図6並びに図7に示したような構文解析結果を得るために必要な文脈自由文法規則の例を以下に示している。
S→{SS|NP VP}
NP→{N PP}
VP→V{AUX|PP}*

N→名詞
V→動詞
PP→助詞
AUX→助動詞
また、図8並び図9には、図6並びに図7にそれぞれ示した構文解析結果(構文解析木)に対して意味属性情報を付与するための規則を適用することによって得られる、意味解析結果(意味属性情報付与結果)の一例を示している。
意味解析時には、例えば以下に示すような意味解析ルールが適用される。
(規則1)VにPP「から」が後続すれば、PP「から」の属性を理由にする。
(規則2)VにPP「て」及びPP「から」が後続すれば、PP「から」の属性を理由にする。
(規則3)Sの子として2つのSが存在し、且つ、前方のSの子に理由の属性を持つものがあれば、前方のSの属性を理由にし、後方のSの属性を結果とする。
(規則4)Sの子として2つのSが存在し、且つ、前方のSの子に時間的前の属性を持つものがあれば、前方のSの属性を時間的前とし、後方のSの属性を時間的後とする。
ところが、このような文法規則に基づく自然言語処理手順においては、意味情報を付与するための規則が膨大な規模になり、解析結果を計算するために必要な時間コストも膨大になる、という問題がある。例えば、構文解析結果として多数の候補が生成される場合には、すべての解析結果候補について規則を当て嵌めなければならないため、かかるコストの問題はより一層深刻となる。
特開平9−73452号公報
本発明の目的は、所定の文法規則に基づいて自然言語文についての構文・意味解析結果を好適に出力することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、文法規則に基づく自然言語処理手順において、意味情報を付与するための膨大な規則を適用することに伴う解析に要するコストを削減することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、自然言語文を解析する自然言語処理システムであって、
入力された自然言語文について形態素毎の品詞の認定を含んだ形態素解析を行なう手段と、
前記形態素解析手段による形態素解析結果に基づいて、該入力された自然言語文の句構造などの構造解析を行なう構文解析手段と、
前記構文解析手段による構文解析結果に基づいて、文中のそれぞれの語の語義や語と語の間の意味関係に基づいて文が伝える意味を表現する意味構造を求める意味解析手段と、
を備え、
前記形態素解析手段は、形態素解析結果に基づいて該入力された自然言語文中の少なくとも一部の形態素に対して意味属性を付与する、
ことを特徴とする自然言語処理システムである。
ここで、前記形態素解析手段は、例えば、近隣の活用語の活用形及び/又は近隣の語の品詞との関係に基づいて形態素の意味属性を判定する意味属性付与規則を適用することによって、該当する形態素に対して意味属性を付与する。
意味解析ルールの中には、構文解析木を参照する必要があるものと、参照する必要のないものの2通りがある。後者の場合、意味解析を待つことなく、形態素解析結果に意味解析ルールを直接適用して意味属性を付与することができる。
そこで、本発明に係る自然言語処理システムでは、形態素解析によって得られる形態素情報の並びから判定可能な意味属性情報をあらかじめ特定しておき、得られた意味属性情報を構文解析処理に影響を与えない形式で形態素解析結果に付与した上で、構文解析に渡すという操作を行なう。
このように、形態素解析時に少なくとも一部の形態素に意味を割り振っておき、構文解析時には、形態素の意味内容を無視し、意味解析時には形態素に割り振られた意味内容を使用する。この結果、構文解析結果候補が多数ある場合であっても、すべての候補に意味解析ルールを適用する必要がなくなるので、意味解析結果を計算するためのコストを削減することができる。
例えば、形態素解析時に意味属性を付与するための規則を適用することにより、意味解析時には一部の規則の適用を省略することが可能となる。したがって、構文解析結果候補が多数ある場合であっても、すべての候補に意味解析ルールを適用する必要がなくなるので、意味解析結果を計算するためのコストを削減することができる。
一般に構文解析から得られる構文解析結果候補は多数存在する。長い文の場合、その数が数千万から数億通り得られることも稀ではない。意味解析では、これらのすべてに対して繰り返し同じ意味情報付与規則を適用する必要がある。これに対し、本発明に係る自然言語処理システムよれば、形態素解析時にただ一度、対応する規則を適用するだけで済むので、規則適用に要する時間的コストを大幅に軽減することが可能である。
また、本発明の第2の側面は、自然言語文を解析するための処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
入力された自然言語文について形態素毎の品詞の認定を含んだ形態素解析を行なうステップと、
前記形態素解析ステップにおける形態素解析結果に基づいて、該入力された自然言語文の句構造などの構造解析を行なう構文解析ステップと、
前記構文解析ステップにおける構文解析結果に基づいて、文中のそれぞれの語の語義や語と語の間の意味関係に基づいて文が伝える意味を表現する意味構造を求める意味解析ステップと、
を備え、
前記形態素解析ステップでは、形態素解析結果に基づいて該入力された自然言語文中の少なくとも一部の形態素に対して意味属性を付与する、
ことを特徴とするコンピュータ・プログラムである。
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第1の側面に係る自然言語処理システムと同様の作用効果を得ることができる。
本発明によれば、所定の文法規則に基づいて自然言語文についての構文・意味解析結果を好適に出力することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
また、本発明によれば、文法規則に基づく自然言語処理手順において、意味情報を付与するための膨大な規則を適用することに伴う解析に要するコストを削減することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
以下、図面を参照しながら本発明の実施形態について詳解する。
本発明に係る自然言語処理システムは、文法規則に基づく自然言語処理手順において、意味情報を付与するための膨大な規則を適用することに伴う解析にようするコストを削減するものである。
本発明者らは、意味解析ルールの中には、構文解析木を参照する必要があるものと、参照する必要のないものの2通りがあることを先見的に導き出した。後者の場合、意味解析を待つことなく、形態素解析結果に直接意味解析ルールを適用して意味属性を付与することができる。すなわち、形態素解析によって得られる形態素情報の並びから判定可能な意味属性情報をあらかじめ特定しておき、得られた意味属性情報を構文解析処理に影響を与えない形式で形態素解析結果に付与した上で、構文解析に渡すという操作を行なう。
このように、形態素解析時に少なくとも一部の形態素に意味を割り振っておき、構文解析時には、形態素の意味内容を無視し、意味解析時には形態素に割り振られた意味内容を使用する。この結果、構文解析結果候補が多数ある場合であっても、すべての候補に意味解析ルールを適用する必要がなくなるので、意味解析結果を計算するためのコストを削減することができる。
本発明の一実施形態に係る自然言語処理システムの機能並びに素の動作について、以下に説明する。本発明は、例えばLexical Functional Grammar(LFG)文法理論に基づく統語・意味解析処理に組み込んで実装することができる。LFGは、構文・意味解析を行なうための文法理論の代表例であり、ネイティブ・スピーカの言語知識すなわち文法を、コンピュータ処理や、コンピュータの処理動作に影響を及ぼすその他の非文法的な処理パラメータとは切り離したコンポーネントとして構成している。
図1には、LFGに基づく自然言語処理システム1の構成を模式的に示している。図示の自然言語処理システム1は、例えばパーソナル・コンピュータ(PC)などの一般的な計算機システム上で所定の自然言語処理アプリケーションを実行するという形態で実現される。
形態素解析部2は、日本語など特定の言語に関する形態素ルール2Aと形態素辞書2Bを持ち、入力文を意味的最小単位である形態素に分節して品詞の認定処理を行なう。例えば、「私の娘は英語を話します。」という文が入力された場合、形態素解析結果として、「私{Noun}の{up}娘{Noun}は{up}英語{Noun}を{up}話す{Verb1}{tr}ます{jp}。{pt}」が出力される。
本実施形態では、形態素解析部2は、形態素解析によって得られる形態素情報の並びから判定可能な意味属性情報をあらかじめ特定し、意味属性情報を構文解析処理に影響を与えない形式で形態素解析結果に付与した上で、構文解析に渡すという操作を行なう。
一般的な形態素解析結果として、入力文の各形態素を見出し語とし、これら見出し語が文中の出現順に配列されてなるテーブルが得られる。各見出し語エントリには、見出し語となる単語とその読み、原形、その品詞カテゴリ、活用形の種別などが記述されている。本実施形態では、これらに加え、一部の見出し語エントリには、意味属性が割り振られる。すなわち、形態素解析によって得られる形態素情報の並びから判定可能な意味属性情報が特定される。
図2並びに図3には、以下の各例文を解析対象文とした場合の形態素解析結果例を示している。
(1)彼が来るから私は行かない。
(2)彼が来てから私が行く。
本実施形態に係る形態素解析結果では、図4並びに図5に示した従来例とは相違し、助詞「から」に係る見出し語エントリに対して、それぞれ意味属性「理由」並びに「時間的前」が割り振られる。
形態素解析部2におけるこれらの形態素に対する意味属性の割り振りは、以下に示すように意味属性付与規則2Cを適用することによって行なわれる。
(規則I)活用語の基本形に助詞「から」が後続すれば、「から」に意味属性「理由」を付与する。
(規則II)活用語の連用形に助詞「て」及び助詞「から」が後続すれば、助詞「から」に意味属性「時間的前」を付与する。
(規則III)活用語の基本形に助詞「まで」が後続すれば、「まで」に意味属性「時間的制限」を付与する。
(規則IV)活用語の連用形に助詞「て」及び助詞「まで」が後続すれば、助詞「まで」に意味属性「強調」を付与する。
形態素解析部2は、得られた意味属性情報を構文解析処理に影響を与えない形式で形態素解析結果に付与した上で、構文解析に渡す。本実施形態では、形態素に割り振られた意味属性は、該当する見出し語エントリの活用形の欄に書き込まれる。
このような形態素解析結果は、次いで、構文解析部3に入力される。構文解析部3は、文法ルール3Aや結合価辞書3Bなどの辞書を持ち、文法ルールなどに基づく句構造の解析を行なう。ここで、結合価辞書3Bは動詞と主語などの文中の他の構成要素との関係を記述したものであり、述部とそれに係る語の意味関係を抽出することができる。本実施形態では、構文解析部3は、形態素解析結果に付与されている意味属性情報を無視する。そして、構文解析した結果として、単語や形態素などからなる文章の句構造を木構造として表した“c−structure(constituent structure)”と、主語、目的語などの格構造に基づいて入力文を疑問文、過去形、丁寧文など意味的・機能的に解析した結果として“f−structure(functional structure)”を出力する。
c−structureは、文中の単語や句の構造を木構造形式で表したものであり、構文カテゴリによって定義される。例えば音素列を生成するための音韻学的な解釈を、c−structureを基に行なうことができる。一方、f−structureは、文法的な機能を明確に表現したものであり、文法的な機能名、意味的形式、並びに特徴シンボルにより構成される。f−structureを参照することにより、主語(subject)、目的語(object)、補語(complement)、修飾語(adjunct)といった意味理解を得ることができる。f−structureは、c−structureの各節点に付随する素性の集合であり、属性−属性値のマトリックスの形で表現される。
次いで、意味解析部4は、意味解析ルール4Aを適用して、文中の語の語義や語と語の間の意味関係などに基づいて文が伝える意味を表現する意味構造の解析を行なう。本実施形態では、意味解析部4は、構文解析部3では無視されていた形態素解析時の意味属性を利用する。
例えば、形態素解析時に意味属性を付与するための規則I及び規則IIを適用することにより、意味解析時には規則1及び規則2を省略することが可能となる。したがって、構文解析結果候補が多数ある場合であっても、すべての候補に意味解析ルール4Aを適用する必要がなくなるので、意味解析結果を計算するためのコストを削減することができる。
一般に構文解析から得られる構文解析結果候補は多数存在する。長い文の場合、その数が数千万から数億通り得られることも稀ではない。意味解析では、これらのすべてに対して繰り返し同じ意味情報付与規則を適用する必要がある。これに対し、本発明に係る自然言語処理システムよれば、形態素解析時にただ一度、対応する規則を適用するだけで済むので、規則適用に要する時間的コストを大幅に軽減することが可能である。
なお、LFGの詳細に関しては、例えばR.M.Kaplan及びJ.Bresnan共著の論文“Lexical−Functional Grammar: A Formal System for Grammatical Representation”(The MIT Press,Cambridge (1982). Reprinted in Formal Issues in Lexical−Functional Grammar,pp.29−130.CSLI publications,Stanford University(1995).)などに記述されている。
[追補]
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。
本実施形態ではLFG文法理論に基づいて説明したが、勿論、他の文法ルールを備えた解析システムにおいても本発明を同様に適用することができる。
要するに、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
図1は、LFGに基づく自然言語処理システム1の構成を模式的に示した図である。 図2は、例文(1)を本発明に係る自然言語処理システムにより形態素解析した結果を示した図である。 図3は、例文(2)を本発明に係る自然言語処理システムにより形態素解析した結果を示した図である。 図4は、例文(1)を解析対象文とした場合の形態素解析結果例(従来例)を示した図である。 図5は、例文(2)を解析対象文とした場合の形態素解析結果例(従来例)を示した図である。 図6は、図4に示した形態素解析結果に基づく構文解析結果例(従来例)を示した図である。 図7は、図5に示した形態素解析結果に基づく構文解析結果例(従来例)を示した図である。 図8は、図6に示した構文解析結果に対して意味属性情報を付与するための規則を適用することによって得られる意味属性情報付与結果の一例(従来例)を示した図である。 図9は、図7に示した構文解析結果に対して意味属性情報を付与するための規則を適用することによって得られる意味属性情報付与結果の一例(従来例)を示した図である。
符号の説明
1…自然言語処理システム
2…形態素解析部
2A…形態素ルール,2B…形態素辞書
3…構文解析部
3A…文法ルール,3B…結合価辞書
4…意味解析部
4A…意味解析ルール

Claims (13)

  1. 自然言語文を解析する自然言語処理システムであって、
    入力された自然言語文に含まれる各形態素の品詞の認定を含んだ形態素解析を行ない、該入力された自然言語文に含まれる各形態素を見出し語とし、見出し語となる単語、原形、その品詞カテゴリ、活用形の種別を含む形態素情報を記述した各見出し語エントリを該入力された自然言語文中の出現順に配列したテーブルからなる形態素解析結果を出力するとともに、構文解析木を参照する必要なしに形態素情報の並びから判定可能な意味属性を付与する第1の意味解析規則を形態素解析結果に適用して、少なくとも一部の形態素に対して意味属性を付与する形態素解析手段と、
    所定の文脈文法規則に基づいて前記形態素解析手段による形態素解析結果に構文解析を実施することによって、該入力された自然言語文に含まれる各形態素間の句構造の構造解析を行ない、該句構造を表現した構文解析木を出力する構文解析手段と、
    前記構文解析木を参照することによって判定する意味属性情報を付与する前記第1の意味解析規則とは異なった第2の意味解析規則に基づいて、前記構文解析手段による構文解析結果から、文中のそれぞれの語の語義や語と語の間の意味関係に基づいて文が伝える意味を表現する意味構造を求める意味解析手段と、
    を具備することを特徴とする自然言語処理システム。
  2. 前記形態素解析手段は、近隣の活用語の活用形又は近隣の語の品詞との関係に基づいて形態素の意味属性を判定する意味属性付与規則を適用して形態素に対して意味属性を付与する、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  3. 前記形態素解析手段は、前記第1の意味解析規則を適用して得られた意味属性を該当する形態素の見出し語エントリの活用形の欄に書き込む
    ことを特徴とする請求項1に記載の自然言語処理システム。
  4. 前記構文解析手段は、前記形態素解析手段により形態素に割り振られた意味属性を無視し、
    前記意味解析手段は、前記形態素解析手段により形態素に割り振られた意味属性を利用する、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  5. 前記意味解析手段は、前記構文解析手段による構文解析結果に対して所定の意味解析ルールを適用して意味解析を行なう、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  6. 前記意味解析手段は、形態素解析結果に意味属性を付与することによって不要となった意味解析ルールの適用を省略する、
    ことを特徴とする請求項5に記載の自然言語処理システム。

    前記意味解析手段は、前記第1の意味解析規則を含まない前記第2の意味解析規則を前記構文解析手段が出力する構文解析木に適用する、
    ことを特徴とする請求項5に記載の自然言語処理システム。
  7. コンピュータを用いて構築される自然言語処理システム上で、自然言語文を解析する自然言語処理方法であって、
    前記コンピュータが備える形態素解析手段が、入力された自然言語文に含まれる各形態素の品詞の認定を含んだ形態素解析を行ない、該入力された自然言語文に含まれる各形態素を見出し語とし、見出し語となる単語、原形、その品詞カテゴリ、活用形の種別を含む形態素情報を記述した各見出し語エントリを該入力された自然言語文中の出現順に配列したテーブルからなる形態素解析結果を出力するとともに、構文解析木を参照する必要なしに形態素情報の並びから判定可能な意味属性を付与する第1の意味解析規則を形態素解析結果に適用して、少なくとも一部の形態素に対して意味属性を付与する形態素解析ステップと、
    前記コンピュータが備える構文解析手段が、所定の文脈文法規則に基づいて前記形態素解析ステップにおける形態素解析結果に構文解析を実施することによって、該入力された自然言語文に含まれる各形態素間の句構造の構造解析を行ない、該句構造を表現した構文解析木を出力する構文解析ステップと、
    前記コンピュータが備える意味解析手段が、構文解析木を参照することによって判定する意味属性情報を付与するための前記第1の意味解析規則とは異なった第2の意味解析規則に基づいて、前記構文解析ステップにおける構文解析結果から、文中のそれぞれの語の語義や語と語の間の意味関係に基づいて文が伝える意味を表現する意味構造を求める意味解析ステップと、
    を具備することを特徴とする自然言語処理方法。
  8. 前記形態素解析ステップでは、近隣の活用語の活用形及び/又は近隣の語の品詞との関係に基づいて形態素の意味属性を判定する意味属性付与規則を適用して形態素に対して意味属性を付与する、
    ことを特徴とする請求項7に記載の自然言語処理方法。
  9. 前記形態素解析ステップでは、前記第1の意味解析規則を適用して得られた意味属性を該当する形態素の見出し語エントリの活用形の欄に書き込む
    ことを特徴とする請求項7に記載の自然言語処理方法。
  10. 前記構文解析ステップでは、前記形態素解析ステップにおいて形態素に割り振られた意味属性を無視し、
    前記意味解析ステップでは、前記形態素解析ステップにおいて形態素に割り振られた意味属性を利用する、
    ことを特徴とする請求項7に記載の自然言語処理方法。
  11. 前記意味解析ステップでは、前記構文解析ステップにおける構文解析結果に対して所定の意味解析ルールを適用して意味解析を行なう、
    ことを特徴とする請求項7に記載の自然言語処理方法。
  12. 前記意味解析ステップでは、形態素解析結果に意味属性を付与することによって不要となった意味解析ルールの適用を省略する、
    ことを特徴とする請求項11に記載の自然言語処理方法。
  13. 自然言語文を解析するための処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータを、
    入力された自然言語文に含まれる各形態素の品詞の認定を含んだ形態素解析を行ない、該入力された自然言語文に含まれる各形態素を見出し語とし、見出し語となる単語、原形、その品詞カテゴリ、活用形の種別を含む形態素情報を記述した各見出し語エントリを該入力された自然言語文中の出現順に配列したテーブルからなる形態素解析結果を出力するとともに、構文解析木を参照する必要なしに形態素情報の並びから判定可能な意味属性を付与する第1の意味解析規則を形態素解析結果に適用して、少なくとも一部の形態素に対して意味属性を付与する形態素解析手段と、
    所定の文脈文法規則に基づいて前記形態素解析手段による形態素解析結果に構文解析を実施することによって、該入力された自然言語文に含まれる各形態素間の句構造の構造解析を行ない、該句構造を表現した構文解析木を出力する構文解析手段と、
    構文解析木を参照することによって判定する意味属性情報を付与するための前記第1の意味解析規則とは異なった第2の意味解析規則に基づいて、前記構文解析手段による構文解析結果から、文中のそれぞれの語の語義や語と語の間の意味関係に基づいて文が伝える意味を表現する意味構造を求める意味解析手段と、
    として機能させるためのコンピュータ・プログラム。
JP2003320327A 2003-09-11 2003-09-11 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Expired - Fee Related JP4033088B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003320327A JP4033088B2 (ja) 2003-09-11 2003-09-11 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003320327A JP4033088B2 (ja) 2003-09-11 2003-09-11 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2005092254A JP2005092254A (ja) 2005-04-07
JP4033088B2 true JP4033088B2 (ja) 2008-01-16

Family

ID=34452355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003320327A Expired - Fee Related JP4033088B2 (ja) 2003-09-11 2003-09-11 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP4033088B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108885617B (zh) 2016-03-23 2022-05-31 株式会社野村综合研究所 语句解析***以及程序

Also Published As

Publication number Publication date
JP2005092254A (ja) 2005-04-07

Similar Documents

Publication Publication Date Title
WO1999063456A1 (fr) Dispositif de preparation de regles de conversion du langage, dispositif de conversion du langage et support d'enregistrement de programme
Ouersighni A major offshoot of the DIINAR-MBC project: AraParse, a morphosyntactic analyzer for unvowelled Arabic texts
Sinhal et al. Machine translation approaches and design aspects
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Papageorgiou et al. Multi-level XML-based Corpus Annotation.
JP4033011B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005284723A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Maranduc A Multiform Balanced Dependency Treebank for Romanian
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2000305930A (ja) 言語変換規則作成装置、言語変換装置及びプログラム記録媒体
JP4039282B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
WO1997048058A1 (en) Automated translation of annotated text
WO1997048058A9 (en) Automated translation of annotated text
JP3903820B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972699B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005092616A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Ryu et al. Incremental Japanese spoken language generation in simultaneous machine interpretation
Sheremetyeva et al. Meaning-Text Theory for textual input analysis and proofing in a generation system
JP3972698B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3892227B2 (ja) 機械翻訳システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070710

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071015

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111102

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111102

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121102

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121102

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131102

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees