JP2008276561A - 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 - Google Patents

形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 Download PDF

Info

Publication number
JP2008276561A
JP2008276561A JP2007119982A JP2007119982A JP2008276561A JP 2008276561 A JP2008276561 A JP 2008276561A JP 2007119982 A JP2007119982 A JP 2007119982A JP 2007119982 A JP2007119982 A JP 2007119982A JP 2008276561 A JP2008276561 A JP 2008276561A
Authority
JP
Japan
Prior art keywords
word
document vector
undefined
document
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007119982A
Other languages
English (en)
Other versions
JP4953440B2 (ja
JP2008276561A5 (ja
Inventor
Takeshi Masuyama
毅司 増山
Shigeo Makinoda
成男 牧野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2007119982A priority Critical patent/JP4953440B2/ja
Publication of JP2008276561A publication Critical patent/JP2008276561A/ja
Publication of JP2008276561A5 publication Critical patent/JP2008276561A5/ja
Application granted granted Critical
Publication of JP4953440B2 publication Critical patent/JP4953440B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】未定義語が存在する場合であっても、適切な形態素解析結果を得ることができる形態素解析装置等を提供すること。
【解決手段】文字列の中に、単語辞書記憶手段140に記憶されていない語である未定義語が存在する場合には、未定義語を検索条件として内部または外部の検索装置50に検索結果を要求する検索結果要求手段と、検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出手段と、未定義語の文書ベクトルと、既知語の文書ベクトルの類似度を算出する類似度算出手段と、類似度が高い文書ベクトルに対応する既知語である類似語を特定する類似語特定手段と、類似語の品詞及びコストを未定義語に関連付ける属性付与手段と、を有し、分割手段は、未定義語属性付与手段によって未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する構成となっている。
【選択図】図3

Description

この発明は、日本語文章を自動的に単語に分割する形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記憶媒体に関する。
例えば、日本語ワープロに文字列を入力すると、その文字列が適切な言語単位に分割され、さらに、必要に応じてその言語単位に漢字が当てはめられる。文字列を適切な言語単位に分割するために、形態素解析が実施される。形態素解析においては、入力された文字列が意味を持つ最小の言語単位である形態素(Morpheme)に分割される場合もあるが、後述の単語辞書に複数の形態素から構成される複合語が存在する場合には、複合語に分割される場合もある。このため、本明細書において、「形態素解析」とは、文字列を単語辞書の項目(単語)に分割することである、と定義する。
このような形態素解析は、機械翻訳や自然言語インターフェース等においても、その第1段階の処理として重要な役割を有する。以下、「単語」のことを適宜、「語」とも呼ぶ。
形態素解析においては、単語辞書と連接可能性辞書が使用される。単語辞書は、各語の品詞、読み、活用型等を指定するものである。連接可能性辞書は、連接可能な2語の「タイプ」を指定するものである。連接可能性辞書における語の「タイプ」は、具体的な語であっても、品詞であっても、活用形であってもよい。文頭にあり得る語、文末にあり得る語は、「文頭」、「文末」という特別な「タイプ」と連接可能であるとする。
形態素解析結果は、入力された文字列を構成する語をノード(矩形)として、位置的かつ文法的に連接可能な単語間をエッジ(辺)としてグラフで表現される。単語分割の多義と、同形語の多義によって、文頭のノードから文末のノードまでのパス(経路)は膨大である。このため、単語に付与されたコスト(以下、「単語コスト」と呼ぶ)と、隣接する2つの単語間に付与されたコスト(以下、「連接コスト」と呼ぶ)を使用して、従来、例えば、文頭から文末までの総コストが低いパスを優先条件として、n個のパスを抽出している。ここで、「単語分割の多義」とは、見出しの分割方法が異なることによる多義である。例えば、「その日本人」という文字列に対して、(a)「その」+「日」+「本人」と、(b)「その」+「日本人」という単語分割があり得る。「同形語」の多義とは、見出しが同じである場合に、その読みや品詞が異なる単語が存在することによる多義である。例えば、「工夫」という見出しに対して、「クフウ」と「コウフ」という読みがあり得る。「単語コスト」とは、その単語がどれくらい出現し易いかを示す指標である。「連接コスト」とは、隣接する2つの単語の隣接が、どれくらい出現し易いかを示す指標である。「単語コスト」及び「連接コスト」は、統計的手法によって設定される。
形態素解析においては、文頭から文末までのパスを選択して、単語列として展開された解を生成するため、単語分割の多義や同系語の多義を把握しにくい。これに対して、同系語をグループ化することにより、単語分割の多義と同系語の多義を分離した形態素解析結果を生成する技術が提案されている(例えば、特許文献1)。
そして、単語辞書に記載されていない語(以下、「未定義語」と呼ぶ)は、その多くが人名、地名、会社名等の固有名詞である。このため、一般的には、連続する漢字列、カタカナ列、記号列等が名詞であると仮定して、一律のコストと品詞を付与して処理する等、便宜的な処理で対処するようになっている。
特開2004−30289
しかし、未定義語に対して、ある仮定に基づいて一律のコストと品詞を付与して処理する場合には、例えば、未定義語が名詞ではない場合等、適切な形態素解析結果を得ることができない場合があるという問題がある。
そこで、本発明は、未定義語が存在する場合であっても、適切な形態素解析結果を得ることができる形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記憶媒体を提供することを目的とする。
(1) 日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶している単語辞書記憶手段と、隣接する前記単語間が文法的に接続することができる条件を記憶している連接可能性辞書記憶手段と、入力された文字列を前記単語辞書記憶手段及び前記連接可能性辞書記憶手段を参照して、前記文字列を所定の単位に分割する分割手段と、を有する形態素解析装置であって、さらに、前記単語辞書記憶手段に記憶されている前記単語である既知語を検索条件として内部または外部の検索装置に検索結果を要求する既知語検索結果要求手段と、各前記既知語についての検索結果の全部または一部を1文書として文書ベクトルを算出する既知語文書ベクトル算出手段と、前記既知語について生成した文書ベクトルを前記既知語に関連付ける既知語文書ベクトル関連付け手段と、前記文字列の中に、前記単語辞書記憶手段に記憶されていない語である未定義語が存在する場合には、前記未定義語を検索条件として内部または外部の検索装置に検索結果を要求する検索結果要求手段と、前記検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出手段と、前記未定義語の文書ベクトルと、前記既知語の文書ベクトルの類似度を算出する類似度算出手段と、前記類似度が高い文書ベクトルに対応する前記既知語である類似語を特定する類似語特定手段と、前記類似語の品詞及びコストを前記未定義語に関連付ける属性付与手段と、を有し、前記分割手段は、前記属性付与手段によって前記未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する構成となっていることを特徴とする形態素解析装置。
(1)の発明によれば、形態素解析装置は、未定義語について、類似語の品詞及びコストを付与することができる。
(2) 前記属性付与手段は、前記未定義語に対して、予め規定した前記類似度の範囲に属する少なくとも1つの前記類似語の品詞及びコストを関連付ける構成となっていることを特徴とする(1)に記載の形態素解析装置。
(2)の構成によれば、未定義語に複数種類の品詞及びコストを関連付けることができる。このため、入力された文字列の文頭から文末までについて、例えば、総コストの低い順に形態素解析結果を出力する場合において、未定義語の多義も考慮に入れて、より適切に複数のパス(経路)を出力することができる。
(3) さらに、前記既知語を所定のグループに分類し、各前記既知語の文書ベクトルに基づいて、前記グループの文書ベクトルを生成するグループ文書ベクトル生成手段と、前記グループと、前記グループに対応する文書ベクトルを関連付けて記憶するグループ文書ベクトル記憶手段と、を有し、前記属性付与手段は、前記未定義語の文書ベクトルと類似度が高い文書ベクトルに対応する前記グループの品詞及びコストを前記未定義語に関連付ける構成となっていることを特徴とする(1)または(2)のいずれかに記載の形態素解析装置。
(3)の構成によれば、1つの語の品詞及びコストではなくて、グループの品詞及びコストを未定義語に関連付けるから、未定義語対して、妥当な品詞及びコストを関連付けることができる。
(4)日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶している単語辞書記憶手段と、隣接する前記単語間が文法的に接続することができる条件を記憶している連接可能性辞書記憶手段と、入力された文字列を前記単語辞書記憶手段及び前記連接可能性辞書記憶手段を参照して、前記文字列を所定の単位に分割する分割手段と、を有する形態素解析装置が、前記単語辞書記憶手段に記憶されている前記単語である既知語を検索条件として内部または外部の検索装置に検索結果を要求する既知語検索結果要求ステップと、各前記既知語についての検索結果の全部または一部を1文書として文書ベクトルを算出する既知語文書ベクトル算出ステップと、前記既知語について生成した文書ベクトルを前記既知語に関連付ける既知語文書ベクトル関連付けステップと、前記文字列の中に、前記単語辞書記憶手段に記憶されていない語である未定義語が存在する場合には、前記未定義語を検索条件として内部または外部の検索装置に検索結果を要求する検索結果要求ステップと、前記検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出ステップと、前記未定義語の文書ベクトルと、前記既知語の文書ベクトルの類似度を算出する類似度算出ステップと、前記類似度が高い文書ベクトルに対応する前記既知語である類似語を特定する類似語特定ステップと、前記類似語の品詞及びコストを前記未定義語に関連付ける属性付与ステップと、前記属性付与ステップにおいて前記未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する分割ステップと、を有することを特徴とする形態素解析方法。
(4)の発明によれば、(1)の発明と同様に、未定義語について、類似語の品詞及びコストを付与することができる。
(5)コンピュータに、日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶している単語辞書記憶手段と、隣接する前記単語間が文法的に接続することができる条件を記憶している連接可能性辞書記憶手段と、入力された文字列を前記単語辞書記憶手段及び前記連接可能性辞書記憶手段を参照して、前記文字列を所定の単位に分割する分割手段と、を有する形態素解析装置が、前記単語辞書記憶手段に記憶されている前記単語である既知語を検索条件として内部または外部の検索装置に検索結果を要求する既知語検索結果要求ステップと、各前記既知語についての検索結果の全部または一部を1文書として文書ベクトルを算出する既知語文書ベクトル算出ステップと、前記既知語について生成した文書ベクトルを前記既知語に関連付ける既知語文書ベクトル関連付けステップと、前記文字列の中に、前記単語辞書記憶手段に記憶されていない語である未定義語が存在する場合には、前記未定義語を検索条件として内部または外部の検索装置に検索結果を要求する検索結果要求ステップと、前記検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出ステップと、前記未定義語の文書ベクトルと、前記既知語の文書ベクトルの類似度を算出する類似度算出ステップと、前記類似度が高い文書ベクトルに対応する前記既知語である類似語を特定する類似語特定ステップと、前記類似語の品詞及びコストを前記未定義語に関連付ける属性付与ステップと、前記属性付与ステップにおいて前記未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する分割ステップと、を実行させることを特徴とする形態素解析プログラム。
本発明によれば、未定義語が存在する場合であっても、適切な形態素解析結果を得ることができる。
本発明に係る好適な実施形態の一例について、図面に基づいて以下に説明する。
[第1実施形態]
(システムの概要)
図1は、本発明の第1実施形態の形態素解析システム10(以下、「システム10」と呼ぶ)を示す概略図である。
図1に示すように、システム10は、形態素解析サーバ20(以下、「サーバ20」と呼ぶ)及び検索サーバ50を有する。サーバ20と検索サーバ50は、例えば、インターネットである通信回線60を解して通信可能になっている。サーバ20は、入力された文字列を形態素解析するための装置であり、形態素解析装置の一例である。サーバ20はまた、外部のパーソナルコンピュータ(PC)から通信回線60を介して文字列(文字列を示すデータ)を示すデータを受信し、翻訳等の処理を行い、処理後のデータをそのPC等へ返送するようになっている。
検索サーバ50は、通信回線60を介して、検索条件(「検索語」または「クエリ」とも呼ぶ)を受信し、その検索条件を使用して格納しているウェブ(Web)サイトの情報を検索し、検索条件に関連するウェブ(Web)サイトのURL、そのウェブサイトのタイトル及びスニペット(説明文)を検索結果として出力するための装置であり、検索装置の一例である。検索サーバ50は、サーバ20や外部のPCから検索条件を受信する。
なお、本実施形態においては、検索サーバ50はサーバ20の外部の装置として構成しているが、検索サーバ50とサーバ20を一体として、検索サーバ50をサーバ20の内部の検索装置としてもよい。
(サーバ20の主なハードウェア構成)
図2は、サーバ20の主なハードウェア構成を示す概略図である。サーバ20は、コンピュータであり、バス22を有する。バス22には、CPU(Central Processing Unit)24、RAM(Random Access Memory)26、ROM(Read Only Memory)28、HDD(Hard Disk Drive)30、電源装置32、入力装置34、通信装置36及び表示装置38が接続されている。CPU24は、ROM28に記憶された各種プログラムを適宜読み出して実行することにより、上述のハードウェアとその各種プログラムを協働させ、本実施形態に係る各種機能を実現している。RAM26は、プログラムの実行に使用するローカルメモリである。入力装置34は、各種データの入力の受付を行うものであり、キーボード、ポインティング・デバイス等を含んでよい。表示装置38は、ユーザにデータの入力を受け付ける画面を表示したり、当該コンピュータによる演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
(サーバ20の主なソフトウェア構成)
図3は、サーバ20の主なソフトウェア構成を示す概略図である。図3に示すように、
サーバ20は、既知語文書ベクトル生成部100、文字列受付部110、単語分割部112、ベストパス探索部114、アプリケーション部116及び単語クラスタリング部120を有する。サーバ20は、また、単語辞書DB140及び連接可能性辞書DB142を有する。上述の各部は、CPU24とROM28に格納された各種プログラムによって実現される。
既知語文書ベクトル生成部100は、単語辞書DB140に格納される単語について、後述のように、文書ベクトルを生成するための構成である。文字列受付部110は、通信装置36によって外部から受信した文字列を受け付けるための構成である。単語分割部112は、文字列受付部110によって受け付けた文字列を形態素解析して解析結果を生成するための構成である。単語分割部112は、分割手段の一例である。単語クラスタリング部120は、未定義語について、品詞とコストを関連付けるための構成である。ベストパス探索部114は、形態素解析された文字列について、所定の条件に基づいて、少なくとも1つの経路(パス)を特定するための構成である。単語辞書DB140は、日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶しており、単語辞書記憶手段の一例である。連接可能性辞書DB142は、隣接する単語間が文法的に接続することができる条件を記憶しており、連接可能性辞書記憶手段の一例である。
図4は、単語辞書DB140の一例を示す図である。
図4に示すように、単語辞書DB140は、単語辞書を格納している。
単語辞書は、表記(見出し)、読み、品詞、コスト及び文書ベクトルが関連付けられて構成されている。単語辞書は、実際には、トライ(Trie)構造等の高速検索可能な形式に変換されている。
図5は、連接可能性辞書の一例を示す図である。図6は、連接可能性辞書DB142の一例を示す図である。
まず、連接可能性辞書DB142の構成を説明する前提として、図5を使用して、連接可能性辞書について説明する。連接可能性辞書には、隣接する2語(例えば、左側の語と右側の語)が、文法的に接続可能であるか否かについての情報が記載されている。連接可能性辞書には、例えば、現在の日本語において、横書の場合、左から右に向かって記載するのが通常であるから、先行する左側の語に対して、後続する右側の語がどのようなタイプ(品詞、または、具体的な単語)であるかが示されている。
連接可能性辞書DB142には、サーバ20による高速処理が可能なように、連接可能性辞書が、図6に示すように、連接可能性行列に変換されて格納されている。連接可能性行例においては、行が左側にあらわれる語のタイプを示し、列が右側にあらわれる語のタイプが示されている。左側の語のタイプと右側の語のタイプが連接可能であれば、行列の値が1に設定され、連接不可能であれば行列の値が0に設定される。
上述の単語辞書DB140に格納される単語(以下、「既知語」とも呼ぶ)には、既知語文書ベクトル生成部100によって、文書ベクトルが関連付けられる。「文書ベクトル」は、出現単語に基づいて文書(または、文章)を1つのベクトルで表現したものである。言い換えると、「文書ベクトル」とは、1つの文書に対する出現単語の重要度(頻度等)を成分とするベクトルのことであり、本明細書においては、自然言語処理の分野における通常の意味で使用する。図3に示すように、既知語文書ベクトル生成部100は、既知語検索結果要求部102、既知語文書ベクトル算出部104及び既知語文書ベクトル関連付け部106を有する。既知語検索結果要求部102は、各既知語を検索条件(「検索語」、「クエリ」とも呼ぶ)として、検索サーバ50に対して検索結果を要求するための構成であり、既知語検索結果要求手段の一例である。既知語文書ベクトル算出部104は、検索サーバ50から受信した検索結果のうち予め規定したK(Kは、自然数)ページを1文書として文書ベクトルを算出するための構成であり、既知語文書ベクトル算出手段の一例である。なお、文書ベクトルの算出については、検索結果におけるタイトルとスニペットの1組を1ページとする。スニペットとは、検索結果のタイトルに続いて表示されるテキストである。既知語文書ベクトル関連付け部106は、各既知語に対して、その文書ベクトルを関連付けるための構成であり、既知語文書ベクトル関連付け手段の一例である。
図7は、既知語文書ベクトル生成部100の説明図である。
既知語検索結果要求部102は、既知語である「トラックバック」、「車」等の既知語を検索条件として、検索サーバ50に対して検索結果を要求する。既知語検索結果要求部102は、図7(a)に示すように、検索サーバ50から検索結果を受信する。
既知語文書ベクトル算出部104は、検索結果から、上位Kページの検索結果を特定する。そして、図7(b)に示すように、上位Kページの検索結果のタイトルとスニペットから、クエリ以外の語を抽出し、1文書を生成する。そして、式1を使用して、文書ベクトルを算出する。
Figure 2008276561
式1においては、TF・IDF法によって、図7(c)に示すように、各語の重み付けが行われる。TF・IDF法によって、ある文書における出現頻度が高く、すべての文書のうち特定の文書に偏在する単語が、その文書の特徴を表す単語であると看做されて、重み付けが重くなる。具体的には、例えば、サーバ20内の図示しない文書記憶DBに記憶した複数の文書データを参照し、各単語の当該文書内における出現回数及び出願文書数を算出し、重要度が算出される。
そして、既知語文書ベクトル関連付け部106は、各既知語に対して、その文書ベクトルを関連付ける。
図8、図9及び図10は、単語分割部112の説明図である。
例えば、図8(a)に示すように、「このひとことで元気になった」という文字列が単語分割部112に入力されたとする。
単語分割部112は、図8(b)に示すように、文字列の位置(文字と文字の間、文頭では文字の左側、文末では文字の右側)を示すポインターを設定する。初期状態として、ポインターを位置0(先頭の文字「こ」の左側)に設定する。また、「文頭」という仮想的なノードを設定する。
続いて、単語分割部112は、ポインター位置(以下、「始点」と呼ぶ)から始まる語を単語辞書DB140を参照して検索する。図8(b)の始点0からは、「この(連体詞」と「こ(接尾辞:個)」が検索される。単語分割部112は、始点を後方(右側)に1文字づつずらしながら、単語辞書DB140を参照して網羅的に単語辞書DB140から単語を抽出する。始点nから始まる語を単語辞書DB140から抽出する処理を、「始点n(nは、0及び自然数)についての単語抽出処理」と呼ぶ。
単語分割部112は、始点で終わっている語(位置0の場合は「文頭」、以下「先行語」と呼ぶ)と始点から始まる語(位置0の場合は「この」及び「こ」、以下「後続語」と呼ぶ)の各ペアについて、連接可能性辞書DB142を参照し、図8(c)に示すように、連接可能なものがあればその間にリンクをはる。後続語の中で、いずれの先行語とも連接可能ではない語は排除する。図8(c)の例では、「こ」は排除される。
ポインターが文末位置(図8(b)の例では位置13)に来ると、「文末」という仮想的なノードを設定し、文末位置で終わっている語(図8(b)の例では「た」)と「文末」との連接可能性を調べ、連接可能なものだけを「文末」ノードにリンクして処理を終了する。
最終的に、「文頭」ノードから「文末」ノードまでの経路(パス)が、入力された文字列に対する形態素解析結果となる。
上述の単語分割部112は、各ノードとリンクに適当なコストを付与する。各ノードのコストは単語辞書DB140に記憶されており、リンクのコストは連接可能性辞書DB142に記憶されている(図示せず)。
先行語と後続語が連接可能な場合に、文頭から先行語までの部分最小コストと、先行語と後続語との間の連接コストと、後続語の単語コストの和が最小であるような先行語と後続語の間に、図9に示すように、特別のマークをつける。例えば、図9においては、その特別のマークは、太線として示されている。
ベストパス探索部114は、コストが小さいことを優先条件として、予め規定された所定数のパスを特定する。ベストパス探索部114は、例えば、コスト最小法を用いる。なお、本実施形態とは異なり、ベストパスの特定方法としては、最長一致法、2文節最長一致法、形態素数最小法、文節数最小法(「岩波講座 ソフトウェア科学15 自然言語処理 長尾 真編 岩波書店」等参照)等を使用してもよい。
アプリケーション部116は、形態素解析結果(パス)の入力を受け、例えば、必要に応じて漢字に変換するワープロ部である。なお、アプリケーション部116は、一般的なワープロソフトや翻訳ソフトを含んで構成されるから、説明を省略する。
単語分割部112が受け付けた文字列に、未定義語が存在しない場合には、上述の処理で形態素解析を完了することができる。これに対して、文字列に未定義語が存在する場合には、単語クラスタリング部120が起動する。
図10(a)に示すように、単語分割部112に入力される文字列が、例えば、「面白いと思った記事をどんどんトラバしていく」であるとする。「トラバ」は未定義語である。単語分割部112は、図10(c)に示すように、各始点から開始する語を単語辞書DB140から抽出していく。なお、説明の便宜のため、図10(c)においては、パスを1つだけ記載し、かつ、すべてのノードをリンクしている。
図10(b)の始点14から開始する語を単語辞書DB140から抽出することができない。そして、始点14についての単語抽出に続いて、始点15、始点16についての単語抽出処理を行っても単語辞書DB140から語を抽出することはできない。さらに、始点17についての単語抽出処理を行うと、単語辞書DB140から単語「して」を抽出することができる。この場合、単語抽出ができなかった始点14から、単語抽出ができた始点17までの間の文字列「トラバ」が未定義語である。単語分割部112は、未定義語を単語クラスタリング部120へ送信する。単語クラスタリング部120は未定義語を受信することによって起動する。
図3に示すように、単語クラスタリング部120は、検索結果要求部122、文書ベクトル生成部124、類似度算出部126、類似語特定部128及び属性付与部130を有する。検索結果要求部122は、未定義語を検索条件として、検索サーバ50に対して検索結果を要求するための構成であり、検索結果要求手段の一例である。文書ベクトル生成部124は、検索サーバ50から受信した検索結果のうち予め規定したKページを1文書として文書ベクトルを算出するための構成であり、文書ベクトル算出手段の一例である。類似度算出部126は、未定義語の文書ベクトルと、既知語の文書ベクトルの類似度を評価するための構成であり、類似度算出手段の一例である。類似語特定部128は、類似度が最も高い文書ベクトルに対応する既知語である類似語を特定するための構成であり、類似語特定手段の一例である。属性付与部130は、類似語の品詞及びコストを未定義語に関連付けるための構成であり、属性付与手段の一例である。
図11及び図12は、単語クラスタリング部120の説明図である。
検索結果要求部122は、未定義語である「トラバ」を検索条件として、検索サーバ50に対して検索結果を要求する。検索結果要求部122は、検索サーバ50から、例えば、図11(a)に示す検索結果を受信する。
文書ベクトル生成部124は、検索結果から、上位Kページの検索結果を特定する。そして、図11(b)に示すように、上位Kページの検索結果のタイトルとスニペットから、クエリ以外の語を抽出し、1文書を生成する。そして、この1文書について、上述の式1を使用して、文書ベクトルを算出する。
類似度算出部126は、式2を使用して、「トラバ」の文書ベクトルと、既知語の文書ベクトルの類似度を算出する。
Figure 2008276561
例えば、図12(a)に示すように、未定義語である「トラバ」の文書ベクトルと既知語である「トラックバック」の文書ベクトルの類似度は0.126であり、未定義語である「トラバ」の文書ベクトルと既知語である「車」の文書ベクトルの類似度は0.011である。
類似語特定部128は、すべての既知後の中で、既知語である「トラックバック」の文書ベクトルと「トラバ」の文書ベクトルの類似度が最も高い場合には、「トラックバック」を「トラバ」の類似語として特定する。
属性付与部130は、類似語である「トラックバック」の品詞及びコストを未定義語である「トラバ」に付与する。
単語クラスタリング部120は、このようにして、未定義語に品詞及びコストを付与すると、その未定義語と品詞及びコストを単語分割部112に送信する。単語分割部112は、受信した未定義語と品詞及びコストを使用して、未定義語の末尾と次の文字の間の位置を始点として、形態素解析処理を継続する。
以上が、サーバ20の構成である。以下、主に図13、図14及び図15を使用して、サーバ20の動作例を説明する。主に図13、図14、図15及び図16は、サーバ20の動作例を示す概略フローチャートである。
(サーバの動作例)
まず、サーバ20が、文字列の入力を受け付ける(図13のステップS1)。続いて、サーバ20が、単語辞書DB140及び連接可能性辞書DB142を参照し、文字列の形態素解析を行う(ステップS2)。ステップS2は、分割ステップの一例である。続いて、サーバ20は、総コストが小さいことを優先条件として、予め規定された数のパスを出力する(ステップS3)。
サーバ20は、また、例えば、24時間毎等、定期的に既知語についての文書ベクトルの生成及び更新を行っている。具体的には、サーバ20は、既知語をクエリとして検索サーバ50に検索結果を要求し、検索結果を取得する(図14のステップS11)。ステップS11は、既知語検索結果要求ステップの一例である。続いて、サーバ20は、上位Kページについて、タイトルとスニペットからクエリ以外のターム(語)を抽出し(ステップS12)、各タームに重み付けを行い、文書ベクトルを生成する(ステップS13)。ステップS12及びステップS13は、既知語文書ベクトル算出ステップの一例である。続いて、サーバ20は、既知語と、その文書ベクトルを関連付けて、単語辞書DB140に記憶する(ステップS14)。ステップS14は、既知語文書ベクトル関連付けステップの一例である。
ここで、上述のステップS2について図15及び図16を使用して説明する。
まず、サーバ20は、始点から始まる語(後続語)を単語辞書DB140から検索する(図15のステップS101)。続いて、始点が文末に来たか否かを判断し(ステップS102)、始点が文末に来ていないと判断した場合には、ステップS101及びステップS102を繰り返す。これに対して、ステップS102において、始点が文末に来たと判断した場合には、各始点から始まる語が単語辞書DB140から検索されたか否かを判断する(ステップS103)。ステップS103において、語が検索されたと判断した場合には、後続語に既知語の品詞とコストを関連付ける(ステップS104)。これに対して、ステップS103において、語が検索されないと判断した場合には、未定義語処理をする(ステップS104A)。
未定義後処理(ステップS104A)の詳細を、図16を使用して説明する。
まず、サーバ20は、未定義語をクエリとして検索サーバ50に検索結果を要求し、検索結果を取得する(図16のステップS201)。ステップS201は、検索結果要求ステップの一例である。続いて、検索結果の上位Kページについて、タイトルとスニペットからクエリ以外の語を抽出し(ステップS202)、各語に重み付けを行い、上位Kページを1文書として文書ベクトルを生成する(ステップS203)。ステップS202及び
ステップS203は、文書ベクトル算出ステップの一例である。続いて、クエリとして未定義語の文書ベクトルと、単語辞書DB140に記憶されたすべての既知語の文書ベクトルとの類似度を算出する(ステップS204)。ステップS204は、類似度算出ステップの一例である。続いて、クエリとした未定義語に対して、その未定義語についての文書ベクトルと類似度が最も高い既知語を類似語として特定する(ステップS205)。ステップS205は、類似語特定ステップの一例である。続いて、サーバ20は、クエリとした未定義語に対して、その類似語の品詞とコストを関連付ける(ステップS206)。ステップS206は、属性付与ステップの一例である。
ステップS104またはステップS104Aに続いて、始点で終わる語(先行語)と後続語が連接可能かを判断する(ステップS105)。なお、文末位置で終わっている語については、文末との連接が可能か否かを判断する。ステップS105において、連接可能であると判断した場合には、先行語と後続語との間にリンクを張る(ステップS106)。ステップS105において、連接可能であると判断しなかった場合には、その後続語は排除する(ステップS106A)。
上述のように、サーバ20は、未定義語については、類似語の品詞及びコストを付与することができる。このため、未定義語が存在する場合であっても、適切な形態素解析結果を得ることができる。
[変形例]
次に、上述の第1実施例の変形例を説明する。
図17は、第1実施例の変形例の説明図である。
変形例においては、サーバ20の類似語特定部128(図3参照)において、類似語を特定するための類似度の閾値tが設定されている。例えば、図17に示すように、「スタンばる」という語について、文書ベクトル生成部124(図3参照)が、文書ベクトルaを生成するとする。類似度算出部126は、未定義語の「スタンばる」と既知語の「スタンバイ」、「待機する」、「待つ」等の語との類似度を算出する。類似語特定部128は、類似度が、閾値tよりも大きい語を、類似語として特定する。例えば、「スタンバイ」の類似度x1、「待機する」の類似度x2及び「待つ」の類似度x3が、閾値tよりも大きい場合には、これら3語を類似語として特定するようになっている。
これにより、未定義語に複数種類の品詞及びコストを関連付けることができる。このため、入力された文字列の文頭から文末までについて、例えば、総コストの低い順に形態素解析結果を出力する場合において、未定義語の多義も考慮に入れて、より適切に複数のパス(経路)を出力することができる。
[第2実施例]
次に、第1実施例との相違を中心に、第2実施例を説明する。
図18は、第2実施例の説明図である。
図18(a)に示すように、第2実施例においては、サーバ20の単語辞書DB140には、単語の文書ベクトルに加えて、「グループ」の文書ベクトルが記憶されている。「グループ」とは、例えば、「スタンバイ」、「待機する」、「待つ」という互いに類似する概念を有する語の集合を意味し、「クラスタ」とも呼ぶ。既知語文書ベクトル算出部104は、各既知語の文書ベクトルに加えて、各既知語の類似度が所定範囲である語によるグループを構成し、各グループ(クラスタ)の文書ベクトルを算出する。グループの文書ベクトルは、グループを構成する各語の文書ベクトルの和として算出される。具体的には、既知語文書ベクトル算出部104はグループの文書ベクトルを式3を使用して算出する。
Figure 2008276561
既知語文書ベクトル算出部104は、グループ文書ベクトル生成手段でもある。そして、グループ及びグループの文書ベクトルは、単語辞書DB140に記憶される。単語辞書DB140は、グループ文書ベクトル記憶手段の一例でもある。
文書ベクトル生成部124(図3参照)が、図18(b)に示すように、未定義語「スタンばる」についての文書ベクトルaを生成するとする。類似度算出部126は、式4を使用して、未定義語の「スタンばる」と既知語のグループの文書ベクトルとの類似度を算出する。
Figure 2008276561
類似語特定部128は、類似度が最も高いグループを、類似語として特定するようになっている。
以上のように、第2実施例のサーバ20は、1つの語の品詞及びコストではなくて、グループの品詞及びコストを未定義語に関連付けるから、未定義語対して、一層妥当な品詞及びコストを関連付けることができる。
(プログラム及びコンピュータ読み取り可能な記録媒体等について)
コンピュータに上述の動作例の既知語検索結果要求ステップと、既知語文書ベクトル算出ステップと、既知語文書ベクトル関連付けステップと、検索結果要求ステップと、文書ベクトル算出ステップと、類似度算出ステップと、類似語特定ステップと、属性付与ステップと、分割ステップ等を実行させるためのサーバの制御プログラムとすることができる。
これらサーバの制御プログラム等をコンピュータにインストールし、コンピュータによって実行可能な状態とするために用いられるプログラム格納媒体は、例えばフロッピー(登録商標)のようなフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory)、CD−R(Compact Disc−Recordable)、CD−RW(Compact Disc−Rewriterble)、DVD(Digital Versatile Disc)等のパッケージメディアのみならず、プログラムが一時的若しくは永続的に格納される半導体メモリ、磁気ディスクあるいは光磁気ディスク等で実現することができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
第1実施形態の一例に係る形態素解析システムを示す概略図である。 サーバの主なハードウェア構成を示す概略図である。 サーバの主なソフトウェア構成を示す概略図である。 単語辞書DBの一例を示す図である。 連接可能性辞書の一例を示す図である。 連接可能性辞書DBの一例を示す図である。 既知語文書ベクトル生成部の説明図である。 単語分割部の説明図である。 単語分割部の説明図である。 単語分割部の説明図である。 単語クラスタリング部の説明図である。 単語クラスタリング部の説明図である。 サーバの動作例を示す概略フローチャートである。 サーバの動作例を示す概略フローチャートである。 サーバの動作例を示す概略フローチャートである。 サーバの動作例を示す概略フローチャートである。 第1実施例の変形例の説明図である。 第2実施例の説明図である。
符号の説明
10 形態素解析システム
20 形態素解析サーバ
50 検索サーバ
100 既知語文書ベクトル生成部
102 既知語検索結果要求部
104 既知語文書ベクトル算出部
106 既知語文書ベクトル関連付け部
110 文字列受付部
112 単語分割部
114 ベストパス探索部
116 アプリケーション部
120 単語クラスタリング部
122 検索結果要求部
124 文書ベクトル生成部
126 類似度算出部
128 類似語特定部
130 属性付与部
140 単語辞書DB
142 連接可能性辞書DB

Claims (5)

  1. 日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶している単語辞書記憶手段と、
    隣接する前記単語間が文法的に接続することができる条件を記憶している連接可能性辞書記憶手段と、
    入力された文字列を前記単語辞書記憶手段及び前記連接可能性辞書記憶手段を参照して、前記文字列を所定の単位に分割する分割手段と、
    を有する形態素解析装置であって、
    さらに、
    前記単語辞書記憶手段に記憶されている前記単語である既知語を検索条件として内部または外部の検索装置に検索結果を要求する既知語検索結果要求手段と、
    各前記既知語についての検索結果の全部または一部を1文書として文書ベクトルを算出する既知語文書ベクトル算出手段と、
    前記既知語について生成した文書ベクトルを前記既知語に関連付ける既知語文書ベクトル関連付け手段と、
    前記文字列の中に、前記単語辞書記憶手段に記憶されていない語である未定義語が存在する場合には、前記未定義語を検索条件として内部または外部の検索装置に検索結果を要求する検索結果要求手段と、
    前記検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出手段と、
    前記未定義語の文書ベクトルと、前記既知語の文書ベクトルの類似度を算出する類似度算出手段と、
    前記類似度が高い文書ベクトルに対応する前記既知語である類似語を特定する類似語特定手段と、
    前記類似語の品詞及びコストを前記未定義語に関連付ける属性付与手段と、
    を有し、
    前記分割手段は、前記属性付与手段によって前記未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する構成となっていることを特徴とする形態素解析装置。
  2. 前記属性付与手段は、前記未定義語に対して、予め規定した前記類似度の範囲に属する少なくとも1つの前記類似語の品詞及びコストを関連付ける構成となっていることを特徴とする請求項1に記載の形態素解析装置。
  3. 前記形態素解析装置は、
    さらに、前記既知語を所定のグループに分類し、各前記既知語の文書ベクトルに基づいて、前記グループの文書ベクトルを生成するグループ文書ベクトル生成手段と、
    前記グループと、前記グループに対応する文書ベクトルを関連付けて記憶するグループ文書ベクトル記憶手段と、
    を有し、
    前記属性付与手段は、前記未定義語の文書ベクトルと類似度が高い文書ベクトルに対応する前記グループの品詞及びコストを前記未定義語に関連付ける構成となっていることを特徴とする請求項1または請求項2のいずれかに記載の形態素解析装置。
  4. 日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶している単語辞書記憶手段と、隣接する前記単語間が文法的に接続することができる条件を記憶している連接可能性辞書記憶手段と、入力された文字列を前記単語辞書記憶手段及び前記連接可能性辞書記憶手段を参照して、前記文字列を所定の単位に分割する分割手段と、を有する形態素解析装置が、前記単語辞書記憶手段に記憶されている前記単語である既知語を検索条件として内部または外部の検索装置に検索結果を要求する既知語検索結果要求ステップと、
    各前記既知語についての検索結果の全部または一部を1文書として文書ベクトルを算出する既知語文書ベクトル算出ステップと、
    前記既知語について生成した文書ベクトルを前記既知語に関連付ける既知語文書ベクトル関連付けステップと、
    前記文字列の中に、前記単語辞書記憶手段に記憶されていない語である未定義語が存在する場合には、前記未定義語を検索条件として内部または外部の検索装置に検索結果を要求する検索結果要求ステップと、
    前記検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出ステップと、
    前記未定義語の文書ベクトルと、前記既知語の文書ベクトルの類似度を算出する類似度算出ステップと、
    前記類似度が高い文書ベクトルに対応する前記既知語である類似語を特定する類似語特定ステップと、
    前記類似語の品詞及びコストを前記未定義語に関連付ける属性付与ステップと、
    前記属性付与ステップにおいて前記未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する分割ステップと、
    を有することを特徴とする形態素解析方法。
  5. コンピュータに、
    日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶している単語辞書記憶手段と、隣接する前記単語間が文法的に接続することができる条件を記憶している連接可能性辞書記憶手段と、入力された文字列を前記単語辞書記憶手段及び前記連接可能性辞書記憶手段を参照して、前記文字列を所定の単位に分割する分割手段と、を有する形態素解析装置が、前記単語辞書記憶手段に記憶されている前記単語である既知語を検索条件として内部または外部の検索装置に検索結果を要求する既知語検索結果要求ステップと、
    各前記既知語についての検索結果の全部または一部を1文書として文書ベクトルを算出する既知語文書ベクトル算出ステップと、
    前記既知語について生成した文書ベクトルを前記既知語に関連付ける既知語文書ベクトル関連付けステップと、
    前記文字列の中に、前記単語辞書記憶手段に記憶されていない語である未定義語が存在する場合には、前記未定義語を検索条件として内部または外部の検索装置に検索結果を要求する検索結果要求ステップと、
    前記検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出ステップと、
    前記未定義語の文書ベクトルと、前記既知語の文書ベクトルの類似度を算出する類似度算出ステップと、
    前記類似度が高い文書ベクトルに対応する前記既知語である類似語を特定する類似語特定ステップと、
    前記類似語の品詞及びコストを前記未定義語に関連付ける属性付与ステップと、
    前記属性付与ステップにおいて前記未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する分割ステップと、
    を実行させることを特徴とする形態素解析プログラム。
JP2007119982A 2007-04-27 2007-04-27 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 Expired - Fee Related JP4953440B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007119982A JP4953440B2 (ja) 2007-04-27 2007-04-27 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007119982A JP4953440B2 (ja) 2007-04-27 2007-04-27 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体

Publications (3)

Publication Number Publication Date
JP2008276561A true JP2008276561A (ja) 2008-11-13
JP2008276561A5 JP2008276561A5 (ja) 2009-05-14
JP4953440B2 JP4953440B2 (ja) 2012-06-13

Family

ID=40054428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007119982A Expired - Fee Related JP4953440B2 (ja) 2007-04-27 2007-04-27 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体

Country Status (1)

Country Link
JP (1) JP4953440B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097533A (ja) * 2011-10-31 2013-05-20 Fujitsu Ltd 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム
JP2014106707A (ja) * 2012-11-27 2014-06-09 Yahoo Japan Corp 単語分割装置、単語分割用辞書のデータ構造、単語分割方法、およびプログラム
JP2014120007A (ja) * 2012-12-18 2014-06-30 Yahoo Japan Corp 辞書登録装置、単語分割装置、辞書登録方法、単語分割方法、およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08315078A (ja) * 1995-05-15 1996-11-29 Nippon Telegr & Teleph Corp <Ntt> 日本語文字認識方法及び装置
JP2005326952A (ja) * 2004-05-12 2005-11-24 Nippon Telegr & Teleph Corp <Ntt> 概念辞書への単語登録方法、装置、およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08315078A (ja) * 1995-05-15 1996-11-29 Nippon Telegr & Teleph Corp <Ntt> 日本語文字認識方法及び装置
JP2005326952A (ja) * 2004-05-12 2005-11-24 Nippon Telegr & Teleph Corp <Ntt> 概念辞書への単語登録方法、装置、およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097533A (ja) * 2011-10-31 2013-05-20 Fujitsu Ltd 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム
JP2014106707A (ja) * 2012-11-27 2014-06-09 Yahoo Japan Corp 単語分割装置、単語分割用辞書のデータ構造、単語分割方法、およびプログラム
JP2014120007A (ja) * 2012-12-18 2014-06-30 Yahoo Japan Corp 辞書登録装置、単語分割装置、辞書登録方法、単語分割方法、およびプログラム

Also Published As

Publication number Publication date
JP4953440B2 (ja) 2012-06-13

Similar Documents

Publication Publication Date Title
Shoufan et al. Natural language processing for dialectical Arabic: A survey
JP5241828B2 (ja) 辞書の単語及び熟語の判定
JP4236057B2 (ja) 新たな複合語を抽出するシステム
US20070118519A1 (en) Question answering system, data search method, and computer program
JP2007257644A (ja) 訳語候補文字列予測に基づく訳語取得のためのプログラム、方法および装置
JP2007226729A (ja) 訳語情報出力処理プログラム,処理方法および処理装置
JP2007334894A (ja) ドキュメントの注釈をソースドキュメントのコンテキスト内で視覚化すること
JP6705318B2 (ja) 対訳辞書作成装置、対訳辞書作成方法、及び対訳辞書作成プログラム
JP2007241764A (ja) 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体
JP2004280574A (ja) 翻訳システム、辞書更新サーバ、翻訳方法、及び、これらのプログラムと記録媒体
JP2007072646A (ja) 検索装置、検索方法およびプログラム
Radoev et al. A language adaptive method for question answering on French and English
JP4953440B2 (ja) 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体
JP4900947B2 (ja) 略語抽出方法、略語抽出装置およびプログラム
US20060248037A1 (en) Annotation of inverted list text indexes using search queries
JP7305566B2 (ja) 情報処理装置、情報処理システム、および情報処理プログラム
JP4143085B2 (ja) 同義語獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JP2008077252A (ja) 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
JP5285491B2 (ja) 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、
JPWO2009113289A1 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP2009140113A (ja) 辞書編集装置、および辞書編集方法、並びにコンピュータ・プログラム
Thanadechteemapat et al. Thai word segmentation for visualization of thai web sites
JP2004334382A (ja) 構造化文書要約装置、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090327

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120312

R150 Certificate of patent or registration of utility model

Ref document number: 4953440

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees