JP3906356B2 - 構文解析方法及び装置 - Google Patents

構文解析方法及び装置 Download PDF

Info

Publication number
JP3906356B2
JP3906356B2 JP2001395617A JP2001395617A JP3906356B2 JP 3906356 B2 JP3906356 B2 JP 3906356B2 JP 2001395617 A JP2001395617 A JP 2001395617A JP 2001395617 A JP2001395617 A JP 2001395617A JP 3906356 B2 JP3906356 B2 JP 3906356B2
Authority
JP
Japan
Prior art keywords
parsing
text
target text
dependency
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001395617A
Other languages
English (en)
Other versions
JP2003196274A (ja
Inventor
清貴 内元
均 井佐原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2001395617A priority Critical patent/JP3906356B2/ja
Priority to EP02788853A priority patent/EP1471439A4/en
Priority to PCT/JP2002/013186 priority patent/WO2003056450A1/ja
Priority to US10/499,975 priority patent/US20050086047A1/en
Publication of JP2003196274A publication Critical patent/JP2003196274A/ja
Application granted granted Critical
Publication of JP3906356B2 publication Critical patent/JP3906356B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は言語処理における構文解析の精度を向上させる技術に関するものであり、より詳しくは、複数の言語を入力して構文解析の精度向上を図る技術に関わる。
【0002】
【従来の技術】
近年、コンピュータによって言語のテキストを解析する技術、或いは生成する技術の開発が進み、特にそれらの技術を用いた機械翻訳や、要約システムの提供が図られている。
その中で、文章の係り受け関係などを解析する構文解析技術は正確な文脈の把握に極めて重要であり、従来から高精度な構文解析技術の研究が進められている。
【0003】
特に、日本語のように、係り受け関係が曖昧であり、省略される語句も多い言語を解析する際には、解析時に複数の解析可能性が存在し、解析結果が不確定になる場合が少なくない。また、単語には複数の語義があることが多いが、1つの言語を解析しただけでは、いずれの語義で用いられているのかが不明な場合も多い。
従来の構文解析技術では、当該解析対象の言語についてより多くの文法情報を与え、それによって解析精度の向上を図るものが多い。しかし、このような手法では、確率的により最適なものが選択できるようになるだけで、必ずしも正しい解析結果を得ることができなかった。
【0004】
【発明が解決しようとする課題】
本発明は、上記従来技術の有する問題点に鑑みて創出されたものであり、その目的は、精度の高い構文解析方法を提供することによって、より正確な言語処理技術に寄与することである。
【0005】
【課題を解決するための手段】
本発明は、上記の課題を解決するために、次のような構文解析方法を創出する。
すなわち、本発明では構文解析方法に、従来では解析対象であった1言語のテキストだけでなく、該対象のテキストとは異なる言語による対訳テキストを入力することによって、より高精度な構文解析を実現する。
具体的には次の手法による。
まず、対象テキスト入力手段により構文解析を行う対象テキストと、対訳テキスト入力手段により該対象テキストと少なくともその一部が対訳関係にある1つ以上の対訳テキストとを入力する。
そして、構文解析手段が、2つの語あるいは文節の間の依存関係を学習する機械学習モデルを用いて一文に含まれる各々の語あるいは文節が依存関係にある確率の積が一文全体で最も高くなるときの依存関係を求める構文解析を、該対象テキスト及び対訳テキストについて行う。
このとき、必ずしもすべての文章について構文解析を行う必要はなく、対象テキストの構文解析を行いながら、必要に応じて対訳テキストの構文解析を行ってもよい。
【0006】
さらに、該対象テキストについて、少なくとも2通り以上の構文解析情報が得られる場合、つまり対象テキストの構文解析の結果、複数の解析情報が得られていずれが最も適当な解析情報であるかの判別が困難な場合には、上記対訳テキストの構文解析結果を用いる。
最適結果特定手段により対訳テキストに対する該構文解析の結果を参照し、その中で上記の確率の積が最も大きい対訳テキストの依存関係を対象テキストにおける語あるいは文節の最も適切な依存関係として構文解析情報を特定する。
構文解析結果出力手段により特定された結果を対象テキストの適当な構文解析結果として出力することによって、従来の1言語のみによる解析では困難な構文解析も、高精度な解析結果を得ることができるようになる。
【0007】
さらに、本発明における前記構文解析方法は、複数の言語を入力して新たな第3の言語を生成する過程に導入することもできる。従来ある言語から第3の言語を生成するとき、単一の言語を入力するよりも、複数の言語を用いて生成するとより精密な生成が可能であることが分かっている。
すなわち、この方法ではすでに複数の対訳テキストが入力として用いられることから、本発明の実施には極めて好適であり、構文解析方法の高精度化により、第3言語生成にも有効である。
【0008】
また、本発明では言語処理における構文解析装置を提供することもできる。
本装置には、まず構文解析を行う対象テキストを入力する対象テキスト入力手段と、該対象テキストと、少なくともその一部が対訳関係にある対訳テキストを、対訳関係を関連づけながら入力する対訳テキスト入力手段を備える。
入力された対象テキスト及び対訳テキストは、形態素解析手段によって形態素解析を行う。
該形態素解析の結果に対しては、構文解析手段が、2つの語あるいは文節の間の依存関係を学習する機械学習モデルを用いて一文に含まれる各々の語あるいは文節が依存関係にある確率の積が一文全体で最も高くなるときの依存関係を求める構文解析を行う。
該対象テキストの構文解析結果において、複数の構文解析結果が得られた場合、又は複数の構文解析結果のうち1つの構文解析結果における上記の確率の積の値が所定の閾値を超えない場合に、対訳テキストの構文解析結果を参照し、その中で上記の確率の積が最も大きい対訳テキストの依存関係を対象テキストにおける語あるいは文節の最も適切な依存関係として構文解析情報を特定する最適結果特定手段を有する。
本装置は、構文解析結果出力手段を用いて最適な結果を出力する。
【0009】
【発明の実施の形態】
以下、本発明の実施方法を図面に示した実施例に基づいて説明する。なお、本発明の実施形態は以下に限定されず、適宜変更可能である。
本発明は、従来の構文解析技術では困難であった的確な構文解析を実現する技術であり、人手により作成された高精度の複数の対訳文書、例えば日英2つの言語を用いて、極めて高精度な構文解析技術を提供するものである。
【0010】
以下、本発明の利用形態の1つとして、構文解析を行う対象言語文書と共に、その対訳関係にある言語の文書を入力し、最終的に目標言語を生成して出力する翻訳システムに実装した場合を例として説明する。
図1に従来から行われている単言語文書を目標言語に変換、生成するフローチャートを、図2に本発明に係る日米対訳文書から目標言語に変換、生成するフローチャートを示す。
【0011】
従来の方法において、単言語文書(10)を目標言語文書(14)に翻訳するプロセスは、大きく分類して、構文解析装置(11)、変換装置(12)、生成装置(13)を経て行うのが一般的であった。それら各装置(11)(12)(13)の開発に当たっては、人手による規則の作成(15)が不可欠であって、高精度なシステム開発には大規模な文書の解析作業が必要であった。たとえば、学習に用いる大規模なテキストコーパスは莫大なコストと、研究が必要であり、現状では主要言語のみにようやく整備されつつあるものの、非主要言語において用意される望みは極めて薄い。
【0012】
そこで、図2に示すように、主要言語等のコーパスが整備された単言語文書(20a)と共に、該単言語文書と対訳関係にある対訳文書(20b)を用い、目標言語の的確な翻訳を実現する翻訳システムが提供される。
本システムでは、2つ以上の対訳テキストを入力する入力手段(図示しない)によって文書の入力を行い、各対訳テキストにつき、各言語毎に、又は各言語を任意に2つ以上組み合わせて、言語情報の解析を行う解析手段として本発明による構文解析装置(21)に至る。
【0013】
さらに、構文解析装置(21)における解析結果に基づき、第3言語への言語変換を行う変換手段として変換装置(22)、該変換ステップにおける変換結果に基づき第3言語によるテキストを生成する生成手段として生成装置(23)を備える。変換装置(22)、生成装置(23)にはそれぞれ変換・生成に必要な情報が変換知識(25)、生成知識(26)として備えられている。
最終的には、別に配設する出力手段(図示しない)によって目標言語文書(24)が出力可能である。
【0014】
入力する言語は、例えば日本語と英語の対訳関係にある文書である。この際、その全部が完全な対訳関係にある場合だけでなく、一部が対訳関係にある文書でもよい。また、入力する言語は2つ以上であればよく、例えば3言語によってより高精度な構文解析を実現することもできる。
【0015】
従って、本発明における対訳文書の言語の組み合わせとしては、日本語と英語や、日本語と中国語、或いはその3言語を用いるなど、言語体系が異なる言語を用いると特に好適である。逆に、英語とフランス語のみ等では本発明による効果は必ずしも大きくないが、英語・フランス語・日本語のように組み合わせると、英語・日本語のみの場合よりも高精度な解析が行える可能性が高く、そのような構成でもよい。
【0016】
次に、本発明に係る構文解析装置(21)につき詳述する。
本システムは、日英二言語の対訳文書(20a)(20b)の入力を前提に、語と語(あるいは日本語の文節のようにもう少し大きい単位)の間の依存関係(係り受け関係)を解析する。依存関係はすでに本件出願人らが提案している日本語の係り受けモデル(内元清貴、村田真樹、関根聡、井佐原均、「後方文脈を考慮した係り受けモデル」、自然言語処理,Vol.7, No.5, pp.3-17 (2000)、に記載)を他言語にも適用することによって決定する。
【0017】
このモデルは、二つの語 ( あるいは文節 ) が依存関係にあるかないかを学習するもので、機械学習モデルを用いて実現される。依存関係は学習されたモデルによって計算される確率の積が一文全体で最も高くなるように決定する。
さらに、この依存関係構造から格解析 ( 意味解析 ) を行う。依存関係の処理においては、二言語対訳入力の有効性は、依存構造における係り受けの正解率の向上で計量可能である。
【0018】
図3に本発明による構文解析装置の構成図を示す。本装置(21)は、CPU部(30)、読み取り部(31)、外部記憶部(32)、ROM・RAM部(33)から構成され、CPU部(30)における以下の処理を、ROM・RAM部(33)が適宜記録しながら行う。
構文解析の結果は、外部記憶部(33)に出力されて蓄積し、変換装置(22)における処理に向かう。
【0019】
CPU部(30)においては、まず形態素解析ステップ(34)において入力される単言語文書(ここでは日本語文書)(20a)と、対訳文書(ここでは英語文書)(20b)の形態素解析を行う。
そして、形態素解析の結果に基づいて日本語文書(20a)における語と語の依存関係を解析する。(依存関係解析ステップ(35))この依存関係の解析は、上記のように機械学習モデルにより一文全体の確率の積を求める処理である。
依存関係解析ステップ(35)における解析結果が、1個の解析結果を生じる場合、又はその解析結果において上記機械学習モデルによって求められた確率の積が所定の閾値を超えている場合には、格解析ステップ(36)において格解析を行い、その結果を外部記憶部(32)に蓄積する。
逆に複数の解析結果を生じる場合の他、確率の積が所定の閾値を超えていない場合は、一個の解析結果であっても不確かな解析結果と言えるので、次に述べる対訳検索ステップ(37)の処理を行う。
【0020】
しかし、一般に単言語文書の入力だけで、確実な依存関係を決定することは難しい。依存関係解析ステップ(35)において、特に重要な情報となるのが語順であり、例えば「私は少女と犬を見た。」という日本語を入力する場合には、「私」が「少女と犬を見た」とも解釈できるし、「私」が「少女」と共に「犬を見た」とも解釈できる。
そこで、本発明では英語文書中の該当対訳部分を解析し、いずれの解釈が適当であるかを決定する。
【0021】
上記依存関係解析ステップ(35)で、複数の解析結果が生じ、いずれの解析が適当であるかが判別出来ない場合、日本語文書(20a)の当該文章に該当する個所を英語文書(20b)から検索する対訳検索ステップ(37)に進む。
そして、対訳文章が検索された場合、該文章についての依存関係を解析する。(対訳文書依存関係解析ステップ(38))
【0022】
上記例文の場合、対訳として検索された文章「 I saw a girl and adog. 」によれば、「私」が「少女と犬を見た」という前者の解釈が妥当であることが極めて容易に判明する。それは、後者の「私」が「少女」と共に見た場合には、対訳の文章が「 Iand a girl saw a dog 」という語順でなければならず、検索された文章では取りえない解釈だからである。
このように対訳文書における依存関係の情報を、依存関係解析ステップ(35)にフィードバックすることで、従来では困難であった依存関係の正確な解析が可能となる。
【0023】
日本語文と英語文は語順がかなり異なる上、英語では語順に対する文法的な制約が厳しいため、日本語文側では曖昧な係り先が英語文側では明らかに決まる場合やその逆の場合が多くある。
上記の例の通り、対訳文が「I saw a girl and a dog./私は少女と犬を見た。」の場合、英語文では「and a dog」の係り先は明らかに「saw」であるが、日本語文では「少女と」が「見た」に係るのか、並列句として「犬を」に係るのかが曖昧である。
【0024】
また、対訳文が「Isaw a girl with a telescope./私は望遠鏡で少女を見た。」の場合、逆に、英語文では「with a telescope」の係り先が「saw」なのか「agirl」なのかが曖昧であるが、日本語文では「望遠鏡で」が「見た」に係るということは容易に解析できる。
後者の例では、単言語文書として英語を入力した場合に、日本語の対訳文書の入力が有効に作用することを示している。
【0025】
さらに、語順以外にも文法的な情報、例えば、英語では冠詞や単複形、動名詞や不定詞など動詞の活用形の情報、日本語では助詞の情報も有効に用いることができる。
例えば、日本語文で「彼は本を書き、出版している人を尊敬している。」では、「本を書」いているのが「彼」なのか「出版している人」なのか曖昧である。
しかし、対訳文「Herespects people who write books and publish them.」を入力することによって、文法的にwho以降の動詞はいずれもpeopleに係る(三単現のsがないため)ことが分かり、「本を書」いているのは「出版している人」であることが正確に解析できる。
【0026】
さらに、省略の有無の情報を用いることもできる。日本語文では主語が省略されることが多い(ゼロ代名詞がよく使われる)が、英語文では主語が必須の場合が多いため、省略のため曖昧になっている部分を英語側の情報で補うことも可能になる。
これは特に格解析で主語を特定する必要がある場合に有効に用いることができる。
【0027】
例えば、日本語文「友達とレストランに行きました。有名人に会えてラッキーでした。」の場合、ラッキーだったのは話者の私なのか、友達なのか、両方なのか、また、有名人は一人だったのか複数いたのか曖昧である。この日本語文の対訳が「I went to the restaurant with my friend. We were lucky because we
met a celebrity.」であれば、二人ともラッキーで、会えたのは一人の有名人ということが分かる。
【0028】
語義の曖昧性が相手側の言語で解消されて、構文的な係り受けの曖昧性の解消につながる場合も考えられる。例えば、英語文を対象言語とし、日本語を対訳で入力する場合を考える。
「He saw agirl laughing at the second story.」という英語文の場合、彼女が二番目の話を聞いて笑っているのか、彼が二階で見たのか、二階で笑っている少女を見たのか、つまり、「atthe book store」が「laughing」に係るのか「saw」に係るのか、曖昧である。
ここで対訳が「彼は二番目の話を聞いて笑っている少女を見た。」であれば、「story」は「階」を意味するのではなく、「話」を意味することから、「laughing」に係っていることが正確に解析できる。
【0029】
上記例とも関連するが、対訳の情報は構文解析だけでなく、語義の曖昧性解消にも寄与する。単純な例として、英語の「bank」の曖昧性に着目する。
英語の「bank」の語義には「銀行」と「土手」という意味の曖昧性がある一方、日本語の「銀行」と「土手」という単語は同じ意味として使われることはない。そこで、「bank」が対訳の日本語文側にどちらの単語として現れているかを調べれば容易に曖昧性を解消することができる。
そして、語義の曖昧性が相手側の言語によって解消されることによって係り先が容易に決まることによって、正確な構文解析に寄与することもできる。
【0030】
本発明では、以上に示したように従来の単言語文書を構文解析する手法に、対訳文書の入力を行うことで、極めて高精度な構文解析が行えることを編み出し、新しい構文解析装置の創出を行った。
特に、語順の制約が緩やかな言語と厳しい言語では、厳しい言語による語順を解析することによって、緩やかな言語で複数の解析結果が得られた場合に、該解析結果中、制約の厳しい言語で認められ得る解析結果を採用すればよく、簡便に、かつ高精度に構文解析を行うことができる。
【0031】
【発明の効果】
本発明は、以上の構成を備えるので、次の効果を奏する。
請求項1又は2に記載の構文解析方法では、従来複数の解析結果が得られた場合に困難であった最適な構文解析結果の特定が可能となり、高精度な構文解析方法に寄与する。
特に、日本語などで語順の制約の緩さから、複数の解釈が可能な文章について、従来の手法では膨大な知識を備えて、より確からしい解釈を行うほかなかったが、本発明によると語順の制約が厳しい言語を対訳文書として入力することにより、適当な解釈の採用が可能となる。
【0032】
さらに、本発明では語順以外にも文法的な情報も有効に用いることができるので、例えば日本語文では主語が曖昧な場合にも、英語の単複形から的確な特定が可能となるなど、解析精度の向上に寄与することができる。
他に、省略の有無の情報を用いることもできる。日本語文では主語が省略され格解析で主語を特定する必要がある場合に、従来の単言語のみの解析ではその予測が困難であったが、本発明によれば、主語を英語文を参照することによって正確に特定できるため、解析精度が向上する。
単言語のみの入力では、1つの単語に複数の語義がある場合は少なくなく、従来の構文解析方法では、しばしば誤った語義の認識から、誤った解析が行われる例が見られた。この点についても、本発明では対訳から的確な語義の特定が可能となり、構文解析精度の向上を図ることができる。
【0033】
以上の方法は、実際にしばしば存在する対訳文書を用いるだけで正確な構文解析が可能となるので、構文解析中に人手を介在させて最適な解析結果を選択するよりも極めて簡便であり、構文解析ひいては言語処理の自動化の要請にも応えるものである。
【0034】
請求項3又は4に記載の構文解析装置によると、対訳関係にある2つ以上の文書を入力することで、形態素解析、依存関係解析や格解析等の構文解析を自動的に行い、例えば依存関係で不明な場合には対訳関係の文書を解析し、その結果から適切な依存関係を決定することができるので、従来の構文解析装置を置換可能な高精度な構文解析装置を提供することが出来る。
本発明は、すでに提供されている複数の対訳言語を入力することで第3言語を生成する翻訳システムに導入することで、特に効果的である。
【図面の簡単な説明】
【図1】 従来の技術における、単言語文書を目標言語に変換、生成するフローチャートである。
【図2】 本発明の構文解析装置を導入するのに好適な翻訳システムのフローチャートである。
【図3】 本発明における構文解析装置の構成図である。
【符号の説明】
20a 単言語文書
20b 対訳文書
21 本発明に係る構文解析装置
30 CPU部
31 読み取り部
32 外部記憶部
33 ROM・RAM
34 形態素解析ステップ
35 依存関係解析ステップ
36 格解析ステップ
37 対訳検索ステップ
38 対訳文書依存関係解析ステップ

Claims (4)

  1. 言語処理におけるコンピュータによる構文解析方法であって、
    対象テキスト入力手段により構文解析を行う対象テキストと、対訳テキスト入力手段により該対象テキストと少なくともその一部が対訳関係にある1つ以上の対訳テキストとを入力し、
    構文解析手段が、2つの語あるいは文節の間の依存関係を学習する機械学習モデルを用いて一文に含まれる各々の語あるいは文節が依存関係にある確率の積が一文全体で最も高くなるときの依存関係を求める構文解析を、該対象テキスト及び対訳テキストについて行い、
    該対象テキストについて、少なくとも2通り以上の構文解析情報が得られる場合に、
    最適結果特定手段により対訳テキストに対する該構文解析の結果を参照し、その中で上記の確率の積が最も大きい対訳テキストの依存関係を対象テキストにおける語あるいは文節の最も適切な依存関係として構文解析情報を特定し、
    構文解析結果出力手段により該対象テキストの構文解析結果として出力する
    ことを特徴とする構文解析方法。
  2. 前記構文解析方法が、
    構文解析手段により前記対象テキストの少なくとも語順に係る情報から複数の係り受け関係が求められる場合に、
    最適結果特定手段により前記対訳テキストの少なくとも語順に係る情報を参照して最も適当な前記対象テキストの係り受け関係を決定する
    ことを特徴とする請求項1に記載の構文解析方法。
  3. 言語処理における構文解析を行う装置であって、
    構文解析を行う対象テキストを入力する対象テキスト入力手段、
    該対象テキストと、少なくともその一部が対訳関係にある対訳テキストを、対訳関係を関連づけながら入力する対訳テキスト入力手段、
    該入力された対象テキスト及び対訳テキストに係る形態素解析を行う形態素解析手段、
    該形態素解析の結果に対して、2つの語あるいは文節の間の依存関係を学習する機械学習モデルを用いて一文に含まれる各々の語あるいは文節が依存関係にある確率の積が一文全体で最も高くなるときの依存関係を求める構文解析を行う構文解析手段、
    該対象テキストの構文解析結果において、複数の構文解析結果が得られた場合、又は複数の構文解析結果のうち1つの構文解析結果における上記の確率の積の値が所定の閾値を超えない場合に、対訳テキストの構文解析結果を参照し、
    その中で上記の確率の積が最も大きい対訳テキストの依存関係を対象テキストにおける語あるいは文節の最も適切な依存関係として構文解析情報を特定する最適結果特定手段、
    該最適な結果を出力する構文解析結果出力手段
    を備えることを特徴とする構文解析装置。
  4. 前記構文解析装置の構文解析手段において、
    前記対象テキストの少なくとも語順に係る情報から複数の係り受け関係が求められる場合に、
    前記最適結果特定手段が、
    前記対訳テキストの少なくとも語順に係る情報を参照して最も適当な前記対象テキストの係り受け関係を決定する
    ことを特徴とする請求項に記載の構文解析装置。
JP2001395617A 2001-12-27 2001-12-27 構文解析方法及び装置 Expired - Lifetime JP3906356B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2001395617A JP3906356B2 (ja) 2001-12-27 2001-12-27 構文解析方法及び装置
EP02788853A EP1471439A4 (en) 2001-12-27 2002-12-17 SYNTAX ANALYSIS METHOD AND APPARATUS
PCT/JP2002/013186 WO2003056450A1 (fr) 2001-12-27 2002-12-17 Procede et appareil d'analyse syntaxique
US10/499,975 US20050086047A1 (en) 2001-12-27 2002-12-17 Syntax analysis method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001395617A JP3906356B2 (ja) 2001-12-27 2001-12-27 構文解析方法及び装置

Publications (2)

Publication Number Publication Date
JP2003196274A JP2003196274A (ja) 2003-07-11
JP3906356B2 true JP3906356B2 (ja) 2007-04-18

Family

ID=19189011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001395617A Expired - Lifetime JP3906356B2 (ja) 2001-12-27 2001-12-27 構文解析方法及び装置

Country Status (4)

Country Link
US (1) US20050086047A1 (ja)
EP (1) EP1471439A4 (ja)
JP (1) JP3906356B2 (ja)
WO (1) WO2003056450A1 (ja)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8539063B1 (en) 2003-08-29 2013-09-17 Mcafee, Inc. Method and system for containment of networked application client software by explicit human input
JP4476609B2 (ja) * 2003-12-10 2010-06-09 株式会社東芝 中国語解析装置、中国語解析方法および中国語解析プログラム
US7840968B1 (en) 2003-12-17 2010-11-23 Mcafee, Inc. Method and system for containment of usage of language interfaces
US7873955B1 (en) * 2004-09-07 2011-01-18 Mcafee, Inc. Solidifying the executable software set of a computer
US7856661B1 (en) 2005-07-14 2010-12-21 Mcafee, Inc. Classification of software on networked systems
US7757269B1 (en) 2006-02-02 2010-07-13 Mcafee, Inc. Enforcing alignment of approved changes and deployed changes in the software change life-cycle
US7895573B1 (en) 2006-03-27 2011-02-22 Mcafee, Inc. Execution environment file inventory
US8352930B1 (en) * 2006-04-24 2013-01-08 Mcafee, Inc. Software modification by group to minimize breakage
US8555404B1 (en) 2006-05-18 2013-10-08 Mcafee, Inc. Connectivity-based authorization
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US8548795B2 (en) 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US8195447B2 (en) 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
JP4256891B2 (ja) * 2006-10-27 2009-04-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳の精度を向上させる技術
US8332929B1 (en) 2007-01-10 2012-12-11 Mcafee, Inc. Method and apparatus for process enforced configuration management
US9424154B2 (en) 2007-01-10 2016-08-23 Mcafee, Inc. Method of and system for computer system state checks
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
US8701189B2 (en) 2008-01-31 2014-04-15 Mcafee, Inc. Method of and system for computer system denial-of-service protection
US8615502B2 (en) 2008-04-18 2013-12-24 Mcafee, Inc. Method of and system for reverse mapping vnode pointers
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
TWI376656B (en) * 2008-09-11 2012-11-11 Shing Lung Chen Foreign-language learning method utilizing an original language to review corresponding foreign languages and foreign-language learning database system thereof
US8544003B1 (en) 2008-12-11 2013-09-24 Mcafee, Inc. System and method for managing virtual machine configurations
US8381284B2 (en) 2009-08-21 2013-02-19 Mcafee, Inc. System and method for enforcing security policies in a virtual environment
US9552497B2 (en) * 2009-11-10 2017-01-24 Mcafee, Inc. System and method for preventing data loss using virtual machine wrapped applications
US8938800B2 (en) 2010-07-28 2015-01-20 Mcafee, Inc. System and method for network level protection against malicious software
US8925101B2 (en) 2010-07-28 2014-12-30 Mcafee, Inc. System and method for local protection against malicious software
US8549003B1 (en) 2010-09-12 2013-10-01 Mcafee, Inc. System and method for clustering host inventories
US9075993B2 (en) 2011-01-24 2015-07-07 Mcafee, Inc. System and method for selectively grouping and managing program files
US9112830B2 (en) 2011-02-23 2015-08-18 Mcafee, Inc. System and method for interlocking a host and a gateway
KR20130014106A (ko) * 2011-07-29 2013-02-07 한국전자통신연구원 다중 번역 엔진을 사용한 번역 장치 및 방법
US9594881B2 (en) 2011-09-09 2017-03-14 Mcafee, Inc. System and method for passive threat detection using virtual memory inspection
US8694738B2 (en) 2011-10-11 2014-04-08 Mcafee, Inc. System and method for critical address space protection in a hypervisor environment
US8973144B2 (en) 2011-10-13 2015-03-03 Mcafee, Inc. System and method for kernel rootkit protection in a hypervisor environment
US9069586B2 (en) 2011-10-13 2015-06-30 Mcafee, Inc. System and method for kernel rootkit protection in a hypervisor environment
US8800024B2 (en) 2011-10-17 2014-08-05 Mcafee, Inc. System and method for host-initiated firewall discovery in a network environment
US8713668B2 (en) 2011-10-17 2014-04-29 Mcafee, Inc. System and method for redirected firewall discovery in a network environment
US8935151B1 (en) * 2011-12-07 2015-01-13 Google Inc. Multi-source transfer of delexicalized dependency parsers
US8739272B1 (en) 2012-04-02 2014-05-27 Mcafee, Inc. System and method for interlocking a host and a gateway
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US8973146B2 (en) 2012-12-27 2015-03-03 Mcafee, Inc. Herd based scan avoidance system in a network environment
CN105580023B (zh) 2013-10-24 2019-08-16 迈克菲股份有限公司 网络环境中的代理辅助的恶意应用阻止
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
JPH10116286A (ja) * 1996-10-09 1998-05-06 Nippon Telegr & Teleph Corp <Ntt> 自然言語翻訳方法及び装置
JP3508904B2 (ja) * 1997-03-25 2004-03-22 日本電信電話株式会社 自然言語解析装置
US6370498B1 (en) * 1998-06-15 2002-04-09 Maria Ruth Angelica Flores Apparatus and methods for multi-lingual user access
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
CN1302030B (zh) * 1999-12-24 2010-04-21 纽昂斯通讯公司 词义消歧的机器翻译方法和***
US7016829B2 (en) * 2001-05-04 2006-03-21 Microsoft Corporation Method and apparatus for unsupervised training of natural language processing units
AU2002316581A1 (en) * 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model

Also Published As

Publication number Publication date
WO2003056450A1 (fr) 2003-07-10
EP1471439A1 (en) 2004-10-27
US20050086047A1 (en) 2005-04-21
JP2003196274A (ja) 2003-07-11
EP1471439A4 (en) 2010-03-31

Similar Documents

Publication Publication Date Title
JP3906356B2 (ja) 構文解析方法及び装置
Pettersson et al. A multilingual evaluation of three spelling normalisation methods for historical text
King Practical Natural Language Processing for Low-Resource Languages.
JP2011118689A (ja) 検索方法及びシステム
Zeroual et al. Adapting a decision tree based tagger for Arabic
Khairova et al. The Aligned Kazakh-Russian Parallel Corpus Focused on the Criminal Theme.
Aasha et al. Machine translation from English to Malayalam using transfer approach
Kapočiūtė-Dzikienė et al. A comparison of Lithuanian morphological analyzers
Bajwa et al. A rule based system for speech language context understanding
Amri et al. Amazigh POS tagging using TreeTagger: a language independant model
Salam et al. Developing the bangladeshi national corpus-a balanced and representative bangla corpus
Khemakhem et al. Arabic morpho-syntactic feature disambiguation in a translation context
Sankaravelayuthan et al. English to tamil machine translation system using parallel corpus
Khoufi et al. Chunking Arabic texts using conditional random fields
Ariaratnam et al. A shallow parser for Tamil
Shquier et al. Fully automated Arabic to English machine translation system: transfer-based approach of AE-TBMT
JP2010152420A (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
May et al. Surprise! What's in a Cebuano or Hindi Name?
Safeena et al. Quranic computation: A review of research and application
Tohma et al. Challenges Encountered in Turkish Natural Language Processing Studies
Eineborg et al. ILP in part-of-speech tagging—an overview
Samir et al. Training and evaluation of TreeTagger on Amazigh corpus
Uddin et al. Bangla to english text conversion using opennlp tools
Khemakhem et al. The MIRACL Arabic-English statistical machine translation system for IWSLT 2010
Khedkar et al. A survey of machine translation and parts of speech tagging for indian languages

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030826

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060919

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061117

R150 Certificate of patent or registration of utility model

Ref document number: 3906356

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term