JP2008276561A - 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 - Google Patents
形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 Download PDFInfo
- Publication number
- JP2008276561A JP2008276561A JP2007119982A JP2007119982A JP2008276561A JP 2008276561 A JP2008276561 A JP 2008276561A JP 2007119982 A JP2007119982 A JP 2007119982A JP 2007119982 A JP2007119982 A JP 2007119982A JP 2008276561 A JP2008276561 A JP 2008276561A
- Authority
- JP
- Japan
- Prior art keywords
- word
- document vector
- undefined
- document
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】文字列の中に、単語辞書記憶手段140に記憶されていない語である未定義語が存在する場合には、未定義語を検索条件として内部または外部の検索装置50に検索結果を要求する検索結果要求手段と、検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出手段と、未定義語の文書ベクトルと、既知語の文書ベクトルの類似度を算出する類似度算出手段と、類似度が高い文書ベクトルに対応する既知語である類似語を特定する類似語特定手段と、類似語の品詞及びコストを未定義語に関連付ける属性付与手段と、を有し、分割手段は、未定義語属性付与手段によって未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する構成となっている。
【選択図】図3
Description
このような形態素解析は、機械翻訳や自然言語インターフェース等においても、その第1段階の処理として重要な役割を有する。以下、「単語」のことを適宜、「語」とも呼ぶ。
形態素解析においては、単語辞書と連接可能性辞書が使用される。単語辞書は、各語の品詞、読み、活用型等を指定するものである。連接可能性辞書は、連接可能な2語の「タイプ」を指定するものである。連接可能性辞書における語の「タイプ」は、具体的な語であっても、品詞であっても、活用形であってもよい。文頭にあり得る語、文末にあり得る語は、「文頭」、「文末」という特別な「タイプ」と連接可能であるとする。
形態素解析結果は、入力された文字列を構成する語をノード(矩形)として、位置的かつ文法的に連接可能な単語間をエッジ(辺)としてグラフで表現される。単語分割の多義と、同形語の多義によって、文頭のノードから文末のノードまでのパス(経路)は膨大である。このため、単語に付与されたコスト(以下、「単語コスト」と呼ぶ)と、隣接する2つの単語間に付与されたコスト(以下、「連接コスト」と呼ぶ)を使用して、従来、例えば、文頭から文末までの総コストが低いパスを優先条件として、n個のパスを抽出している。ここで、「単語分割の多義」とは、見出しの分割方法が異なることによる多義である。例えば、「その日本人」という文字列に対して、(a)「その」+「日」+「本人」と、(b)「その」+「日本人」という単語分割があり得る。「同形語」の多義とは、見出しが同じである場合に、その読みや品詞が異なる単語が存在することによる多義である。例えば、「工夫」という見出しに対して、「クフウ」と「コウフ」という読みがあり得る。「単語コスト」とは、その単語がどれくらい出現し易いかを示す指標である。「連接コスト」とは、隣接する2つの単語の隣接が、どれくらい出現し易いかを示す指標である。「単語コスト」及び「連接コスト」は、統計的手法によって設定される。
形態素解析においては、文頭から文末までのパスを選択して、単語列として展開された解を生成するため、単語分割の多義や同系語の多義を把握しにくい。これに対して、同系語をグループ化することにより、単語分割の多義と同系語の多義を分離した形態素解析結果を生成する技術が提案されている(例えば、特許文献1)。
そして、単語辞書に記載されていない語(以下、「未定義語」と呼ぶ)は、その多くが人名、地名、会社名等の固有名詞である。このため、一般的には、連続する漢字列、カタカナ列、記号列等が名詞であると仮定して、一律のコストと品詞を付与して処理する等、便宜的な処理で対処するようになっている。
(システムの概要)
図1は、本発明の第1実施形態の形態素解析システム10(以下、「システム10」と呼ぶ)を示す概略図である。
図2は、サーバ20の主なハードウェア構成を示す概略図である。サーバ20は、コンピュータであり、バス22を有する。バス22には、CPU(Central Processing Unit)24、RAM(Random Access Memory)26、ROM(Read Only Memory)28、HDD(Hard Disk Drive)30、電源装置32、入力装置34、通信装置36及び表示装置38が接続されている。CPU24は、ROM28に記憶された各種プログラムを適宜読み出して実行することにより、上述のハードウェアとその各種プログラムを協働させ、本実施形態に係る各種機能を実現している。RAM26は、プログラムの実行に使用するローカルメモリである。入力装置34は、各種データの入力の受付を行うものであり、キーボード、ポインティング・デバイス等を含んでよい。表示装置38は、ユーザにデータの入力を受け付ける画面を表示したり、当該コンピュータによる演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
図3は、サーバ20の主なソフトウェア構成を示す概略図である。図3に示すように、
サーバ20は、既知語文書ベクトル生成部100、文字列受付部110、単語分割部112、ベストパス探索部114、アプリケーション部116及び単語クラスタリング部120を有する。サーバ20は、また、単語辞書DB140及び連接可能性辞書DB142を有する。上述の各部は、CPU24とROM28に格納された各種プログラムによって実現される。
図4に示すように、単語辞書DB140は、単語辞書を格納している。
単語辞書は、表記(見出し)、読み、品詞、コスト及び文書ベクトルが関連付けられて構成されている。単語辞書は、実際には、トライ(Trie)構造等の高速検索可能な形式に変換されている。
まず、連接可能性辞書DB142の構成を説明する前提として、図5を使用して、連接可能性辞書について説明する。連接可能性辞書には、隣接する2語(例えば、左側の語と右側の語)が、文法的に接続可能であるか否かについての情報が記載されている。連接可能性辞書には、例えば、現在の日本語において、横書の場合、左から右に向かって記載するのが通常であるから、先行する左側の語に対して、後続する右側の語がどのようなタイプ(品詞、または、具体的な単語)であるかが示されている。
既知語検索結果要求部102は、既知語である「トラックバック」、「車」等の既知語を検索条件として、検索サーバ50に対して検索結果を要求する。既知語検索結果要求部102は、図7(a)に示すように、検索サーバ50から検索結果を受信する。
そして、既知語文書ベクトル関連付け部106は、各既知語に対して、その文書ベクトルを関連付ける。
例えば、図8(a)に示すように、「このひとことで元気になった」という文字列が単語分割部112に入力されたとする。
単語分割部112は、図8(b)に示すように、文字列の位置(文字と文字の間、文頭では文字の左側、文末では文字の右側)を示すポインターを設定する。初期状態として、ポインターを位置0(先頭の文字「こ」の左側)に設定する。また、「文頭」という仮想的なノードを設定する。
続いて、単語分割部112は、ポインター位置(以下、「始点」と呼ぶ)から始まる語を単語辞書DB140を参照して検索する。図8(b)の始点0からは、「この(連体詞」と「こ(接尾辞:個)」が検索される。単語分割部112は、始点を後方(右側)に1文字づつずらしながら、単語辞書DB140を参照して網羅的に単語辞書DB140から単語を抽出する。始点nから始まる語を単語辞書DB140から抽出する処理を、「始点n(nは、0及び自然数)についての単語抽出処理」と呼ぶ。
単語分割部112は、始点で終わっている語(位置0の場合は「文頭」、以下「先行語」と呼ぶ)と始点から始まる語(位置0の場合は「この」及び「こ」、以下「後続語」と呼ぶ)の各ペアについて、連接可能性辞書DB142を参照し、図8(c)に示すように、連接可能なものがあればその間にリンクをはる。後続語の中で、いずれの先行語とも連接可能ではない語は排除する。図8(c)の例では、「こ」は排除される。
ポインターが文末位置(図8(b)の例では位置13)に来ると、「文末」という仮想的なノードを設定し、文末位置で終わっている語(図8(b)の例では「た」)と「文末」との連接可能性を調べ、連接可能なものだけを「文末」ノードにリンクして処理を終了する。
最終的に、「文頭」ノードから「文末」ノードまでの経路(パス)が、入力された文字列に対する形態素解析結果となる。
先行語と後続語が連接可能な場合に、文頭から先行語までの部分最小コストと、先行語と後続語との間の連接コストと、後続語の単語コストの和が最小であるような先行語と後続語の間に、図9に示すように、特別のマークをつける。例えば、図9においては、その特別のマークは、太線として示されている。
アプリケーション部116は、形態素解析結果(パス)の入力を受け、例えば、必要に応じて漢字に変換するワープロ部である。なお、アプリケーション部116は、一般的なワープロソフトや翻訳ソフトを含んで構成されるから、説明を省略する。
検索結果要求部122は、未定義語である「トラバ」を検索条件として、検索サーバ50に対して検索結果を要求する。検索結果要求部122は、検索サーバ50から、例えば、図11(a)に示す検索結果を受信する。
まず、サーバ20が、文字列の入力を受け付ける(図13のステップS1)。続いて、サーバ20が、単語辞書DB140及び連接可能性辞書DB142を参照し、文字列の形態素解析を行う(ステップS2)。ステップS2は、分割ステップの一例である。続いて、サーバ20は、総コストが小さいことを優先条件として、予め規定された数のパスを出力する(ステップS3)。
サーバ20は、また、例えば、24時間毎等、定期的に既知語についての文書ベクトルの生成及び更新を行っている。具体的には、サーバ20は、既知語をクエリとして検索サーバ50に検索結果を要求し、検索結果を取得する(図14のステップS11)。ステップS11は、既知語検索結果要求ステップの一例である。続いて、サーバ20は、上位Kページについて、タイトルとスニペットからクエリ以外のターム(語)を抽出し(ステップS12)、各タームに重み付けを行い、文書ベクトルを生成する(ステップS13)。ステップS12及びステップS13は、既知語文書ベクトル算出ステップの一例である。続いて、サーバ20は、既知語と、その文書ベクトルを関連付けて、単語辞書DB140に記憶する(ステップS14)。ステップS14は、既知語文書ベクトル関連付けステップの一例である。
まず、サーバ20は、始点から始まる語(後続語)を単語辞書DB140から検索する(図15のステップS101)。続いて、始点が文末に来たか否かを判断し(ステップS102)、始点が文末に来ていないと判断した場合には、ステップS101及びステップS102を繰り返す。これに対して、ステップS102において、始点が文末に来たと判断した場合には、各始点から始まる語が単語辞書DB140から検索されたか否かを判断する(ステップS103)。ステップS103において、語が検索されたと判断した場合には、後続語に既知語の品詞とコストを関連付ける(ステップS104)。これに対して、ステップS103において、語が検索されないと判断した場合には、未定義語処理をする(ステップS104A)。
まず、サーバ20は、未定義語をクエリとして検索サーバ50に検索結果を要求し、検索結果を取得する(図16のステップS201)。ステップS201は、検索結果要求ステップの一例である。続いて、検索結果の上位Kページについて、タイトルとスニペットからクエリ以外の語を抽出し(ステップS202)、各語に重み付けを行い、上位Kページを1文書として文書ベクトルを生成する(ステップS203)。ステップS202及び
ステップS203は、文書ベクトル算出ステップの一例である。続いて、クエリとして未定義語の文書ベクトルと、単語辞書DB140に記憶されたすべての既知語の文書ベクトルとの類似度を算出する(ステップS204)。ステップS204は、類似度算出ステップの一例である。続いて、クエリとした未定義語に対して、その未定義語についての文書ベクトルと類似度が最も高い既知語を類似語として特定する(ステップS205)。ステップS205は、類似語特定ステップの一例である。続いて、サーバ20は、クエリとした未定義語に対して、その類似語の品詞とコストを関連付ける(ステップS206)。ステップS206は、属性付与ステップの一例である。
次に、上述の第1実施例の変形例を説明する。
図17は、第1実施例の変形例の説明図である。
次に、第1実施例との相違を中心に、第2実施例を説明する。
図18は、第2実施例の説明図である。
コンピュータに上述の動作例の既知語検索結果要求ステップと、既知語文書ベクトル算出ステップと、既知語文書ベクトル関連付けステップと、検索結果要求ステップと、文書ベクトル算出ステップと、類似度算出ステップと、類似語特定ステップと、属性付与ステップと、分割ステップ等を実行させるためのサーバの制御プログラムとすることができる。
20 形態素解析サーバ
50 検索サーバ
100 既知語文書ベクトル生成部
102 既知語検索結果要求部
104 既知語文書ベクトル算出部
106 既知語文書ベクトル関連付け部
110 文字列受付部
112 単語分割部
114 ベストパス探索部
116 アプリケーション部
120 単語クラスタリング部
122 検索結果要求部
124 文書ベクトル生成部
126 類似度算出部
128 類似語特定部
130 属性付与部
140 単語辞書DB
142 連接可能性辞書DB
Claims (5)
- 日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶している単語辞書記憶手段と、
隣接する前記単語間が文法的に接続することができる条件を記憶している連接可能性辞書記憶手段と、
入力された文字列を前記単語辞書記憶手段及び前記連接可能性辞書記憶手段を参照して、前記文字列を所定の単位に分割する分割手段と、
を有する形態素解析装置であって、
さらに、
前記単語辞書記憶手段に記憶されている前記単語である既知語を検索条件として内部または外部の検索装置に検索結果を要求する既知語検索結果要求手段と、
各前記既知語についての検索結果の全部または一部を1文書として文書ベクトルを算出する既知語文書ベクトル算出手段と、
前記既知語について生成した文書ベクトルを前記既知語に関連付ける既知語文書ベクトル関連付け手段と、
前記文字列の中に、前記単語辞書記憶手段に記憶されていない語である未定義語が存在する場合には、前記未定義語を検索条件として内部または外部の検索装置に検索結果を要求する検索結果要求手段と、
前記検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出手段と、
前記未定義語の文書ベクトルと、前記既知語の文書ベクトルの類似度を算出する類似度算出手段と、
前記類似度が高い文書ベクトルに対応する前記既知語である類似語を特定する類似語特定手段と、
前記類似語の品詞及びコストを前記未定義語に関連付ける属性付与手段と、
を有し、
前記分割手段は、前記属性付与手段によって前記未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する構成となっていることを特徴とする形態素解析装置。 - 前記属性付与手段は、前記未定義語に対して、予め規定した前記類似度の範囲に属する少なくとも1つの前記類似語の品詞及びコストを関連付ける構成となっていることを特徴とする請求項1に記載の形態素解析装置。
- 前記形態素解析装置は、
さらに、前記既知語を所定のグループに分類し、各前記既知語の文書ベクトルに基づいて、前記グループの文書ベクトルを生成するグループ文書ベクトル生成手段と、
前記グループと、前記グループに対応する文書ベクトルを関連付けて記憶するグループ文書ベクトル記憶手段と、
を有し、
前記属性付与手段は、前記未定義語の文書ベクトルと類似度が高い文書ベクトルに対応する前記グループの品詞及びコストを前記未定義語に関連付ける構成となっていることを特徴とする請求項1または請求項2のいずれかに記載の形態素解析装置。 - 日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶している単語辞書記憶手段と、隣接する前記単語間が文法的に接続することができる条件を記憶している連接可能性辞書記憶手段と、入力された文字列を前記単語辞書記憶手段及び前記連接可能性辞書記憶手段を参照して、前記文字列を所定の単位に分割する分割手段と、を有する形態素解析装置が、前記単語辞書記憶手段に記憶されている前記単語である既知語を検索条件として内部または外部の検索装置に検索結果を要求する既知語検索結果要求ステップと、
各前記既知語についての検索結果の全部または一部を1文書として文書ベクトルを算出する既知語文書ベクトル算出ステップと、
前記既知語について生成した文書ベクトルを前記既知語に関連付ける既知語文書ベクトル関連付けステップと、
前記文字列の中に、前記単語辞書記憶手段に記憶されていない語である未定義語が存在する場合には、前記未定義語を検索条件として内部または外部の検索装置に検索結果を要求する検索結果要求ステップと、
前記検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出ステップと、
前記未定義語の文書ベクトルと、前記既知語の文書ベクトルの類似度を算出する類似度算出ステップと、
前記類似度が高い文書ベクトルに対応する前記既知語である類似語を特定する類似語特定ステップと、
前記類似語の品詞及びコストを前記未定義語に関連付ける属性付与ステップと、
前記属性付与ステップにおいて前記未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する分割ステップと、
を有することを特徴とする形態素解析方法。 - コンピュータに、
日本語の複数の単語を、それぞれ品詞及びコストを関連付けた状態で記憶している単語辞書記憶手段と、隣接する前記単語間が文法的に接続することができる条件を記憶している連接可能性辞書記憶手段と、入力された文字列を前記単語辞書記憶手段及び前記連接可能性辞書記憶手段を参照して、前記文字列を所定の単位に分割する分割手段と、を有する形態素解析装置が、前記単語辞書記憶手段に記憶されている前記単語である既知語を検索条件として内部または外部の検索装置に検索結果を要求する既知語検索結果要求ステップと、
各前記既知語についての検索結果の全部または一部を1文書として文書ベクトルを算出する既知語文書ベクトル算出ステップと、
前記既知語について生成した文書ベクトルを前記既知語に関連付ける既知語文書ベクトル関連付けステップと、
前記文字列の中に、前記単語辞書記憶手段に記憶されていない語である未定義語が存在する場合には、前記未定義語を検索条件として内部または外部の検索装置に検索結果を要求する検索結果要求ステップと、
前記検索結果の全部または一部を1文書として文書ベクトルを算出する文書ベクトル算出ステップと、
前記未定義語の文書ベクトルと、前記既知語の文書ベクトルの類似度を算出する類似度算出ステップと、
前記類似度が高い文書ベクトルに対応する前記既知語である類似語を特定する類似語特定ステップと、
前記類似語の品詞及びコストを前記未定義語に関連付ける属性付与ステップと、
前記属性付与ステップにおいて前記未定義語に関連付けられた品詞及びコストを使用して、入力された文字列を前記単位に分割する分割ステップと、
を実行させることを特徴とする形態素解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007119982A JP4953440B2 (ja) | 2007-04-27 | 2007-04-27 | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007119982A JP4953440B2 (ja) | 2007-04-27 | 2007-04-27 | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008276561A true JP2008276561A (ja) | 2008-11-13 |
JP2008276561A5 JP2008276561A5 (ja) | 2009-05-14 |
JP4953440B2 JP4953440B2 (ja) | 2012-06-13 |
Family
ID=40054428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007119982A Expired - Fee Related JP4953440B2 (ja) | 2007-04-27 | 2007-04-27 | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4953440B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013097533A (ja) * | 2011-10-31 | 2013-05-20 | Fujitsu Ltd | 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム |
JP2014106707A (ja) * | 2012-11-27 | 2014-06-09 | Yahoo Japan Corp | 単語分割装置、単語分割用辞書のデータ構造、単語分割方法、およびプログラム |
JP2014120007A (ja) * | 2012-12-18 | 2014-06-30 | Yahoo Japan Corp | 辞書登録装置、単語分割装置、辞書登録方法、単語分割方法、およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08315078A (ja) * | 1995-05-15 | 1996-11-29 | Nippon Telegr & Teleph Corp <Ntt> | 日本語文字認識方法及び装置 |
JP2005326952A (ja) * | 2004-05-12 | 2005-11-24 | Nippon Telegr & Teleph Corp <Ntt> | 概念辞書への単語登録方法、装置、およびプログラム |
-
2007
- 2007-04-27 JP JP2007119982A patent/JP4953440B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08315078A (ja) * | 1995-05-15 | 1996-11-29 | Nippon Telegr & Teleph Corp <Ntt> | 日本語文字認識方法及び装置 |
JP2005326952A (ja) * | 2004-05-12 | 2005-11-24 | Nippon Telegr & Teleph Corp <Ntt> | 概念辞書への単語登録方法、装置、およびプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013097533A (ja) * | 2011-10-31 | 2013-05-20 | Fujitsu Ltd | 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム |
JP2014106707A (ja) * | 2012-11-27 | 2014-06-09 | Yahoo Japan Corp | 単語分割装置、単語分割用辞書のデータ構造、単語分割方法、およびプログラム |
JP2014120007A (ja) * | 2012-12-18 | 2014-06-30 | Yahoo Japan Corp | 辞書登録装置、単語分割装置、辞書登録方法、単語分割方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4953440B2 (ja) | 2012-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shoufan et al. | Natural language processing for dialectical Arabic: A survey | |
JP5241828B2 (ja) | 辞書の単語及び熟語の判定 | |
JP4236057B2 (ja) | 新たな複合語を抽出するシステム | |
US20070118519A1 (en) | Question answering system, data search method, and computer program | |
JP2007257644A (ja) | 訳語候補文字列予測に基づく訳語取得のためのプログラム、方法および装置 | |
JP2007226729A (ja) | 訳語情報出力処理プログラム,処理方法および処理装置 | |
JP2007334894A (ja) | ドキュメントの注釈をソースドキュメントのコンテキスト内で視覚化すること | |
JP6705318B2 (ja) | 対訳辞書作成装置、対訳辞書作成方法、及び対訳辞書作成プログラム | |
JP2007241764A (ja) | 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体 | |
JP2004280574A (ja) | 翻訳システム、辞書更新サーバ、翻訳方法、及び、これらのプログラムと記録媒体 | |
JP2007072646A (ja) | 検索装置、検索方法およびプログラム | |
Radoev et al. | A language adaptive method for question answering on French and English | |
JP4953440B2 (ja) | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 | |
JP4900947B2 (ja) | 略語抽出方法、略語抽出装置およびプログラム | |
US20060248037A1 (en) | Annotation of inverted list text indexes using search queries | |
JP7305566B2 (ja) | 情報処理装置、情報処理システム、および情報処理プログラム | |
JP4143085B2 (ja) | 同義語獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP2007011973A (ja) | 情報検索装置及び情報検索プログラム | |
JP2008077252A (ja) | 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体 | |
JPH08129554A (ja) | 関係表現抽出装置および関係表現検索装置 | |
JP5285491B2 (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
JPWO2009113289A1 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
JP2009140113A (ja) | 辞書編集装置、および辞書編集方法、並びにコンピュータ・プログラム | |
Thanadechteemapat et al. | Thai word segmentation for visualization of thai web sites | |
JP2004334382A (ja) | 構造化文書要約装置、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090327 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110607 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120312 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4953440 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150323 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |