JP4468608B2 - 意味情報推定装置、意味情報推定方法、及びプログラム - Google Patents

意味情報推定装置、意味情報推定方法、及びプログラム Download PDF

Info

Publication number
JP4468608B2
JP4468608B2 JP2001131379A JP2001131379A JP4468608B2 JP 4468608 B2 JP4468608 B2 JP 4468608B2 JP 2001131379 A JP2001131379 A JP 2001131379A JP 2001131379 A JP2001131379 A JP 2001131379A JP 4468608 B2 JP4468608 B2 JP 4468608B2
Authority
JP
Japan
Prior art keywords
word
semantic information
occurrence
character string
occurrence pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001131379A
Other languages
English (en)
Other versions
JP2002328943A (ja
Inventor
雅子 望主
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001131379A priority Critical patent/JP4468608B2/ja
Publication of JP2002328943A publication Critical patent/JP2002328943A/ja
Application granted granted Critical
Publication of JP4468608B2 publication Critical patent/JP4468608B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、意味情報推定装置、意味情報推定方法、及びプログラムに関する。
【0002】
【従来の技術】
いわゆる言語処理に用いられる単語辞書には、単語の表記や読み、活用等の情報に加え、単語の意味(分類)に関する情報が登録されている。このように単語辞書に登録された単語の意味情報は、文書検索処理や文書分類処理の際に非常に有効となる。
【0003】
ところで、大規模な文書データベース中から所定の文書を検索する際には、キーワードによる検索が一般的である。このようなキーワードによる文書検索においては、実際には、例えばOA機器を製造販売するメーカーである「○×電気」という特定のキーワードにより検索する場合に加え、「○×電気」よりも上位の概念にあたる「OA機器メーカー」といったキーワードにより検索する場合もある。
【0004】
しかしながら、通常の文書では、企業名である「○×電気」等の固有名詞はあっても、「○×電気」の上位概念を表すことば(「OA機器メーカー」)は表現されないのが普通である。
【0005】
そこで、このような問題を解決するための一つの方策として、企業名等の固有名詞に対し、その企業が属する業種等の意味的な情報を付与する方法がある。しかし、このような意味や知識に関する情報の単語辞書への付与や単語辞書の作成は、かなりの労力、知識、技術を要するものである。そのため、意味や知識に関する各種情報の単語辞書への付与等については、様々な手法が考えられている。
【0006】
知識情報の効率的な獲得手法としては、自然言語文を解析し、特定の対象に対してデータベース登録を行なうものが特開平6−223109号公報において開示されている。
【0007】
また、構文情報によって単語を推定するものとしては、構文情報を用いて単語間の関係を含む情報を一定形式で抽出する手法が、特開平7−85071号公報において開示されている。特開平7−85071号公報において開示されている技術によれば、構文情報を用いて単語間の関係を含む情報を一定形式で抽出する際に、未登録語の単語とその意味を推定している。例えば、「○×電気がスパッタリング装置を開発した」という表現について、「○×電気」が未知の単語であっても、共起する「装置を開発した」という表現から装置開発者として認識する方法を提案している。
【0008】
【発明が解決しようとする課題】
しかしながら、特開平6−223109号公報に開示されている技術によれば、単語辞書にある程度の意味情報が予め登録されていることが前提とされている。すなわち、対象領域の意味とこれに対応付けられる表現とを予め規定しておく必要があり、この設定自体、非常に労力を要するものとなっている。
【0009】
また、特開平7−85071号公報に開示されている技術によれば、構文解析規則を用いた詳細な構文解析を行なって情報を獲得しているが、構文解析自体難しい技術であり、単語が未登録である場合や意味情報がない場合に解析自体が難しいことがある。また、この方法では、例えば「○×電気が通信装置を開発した」という文においても同様な結果が得られるものの、どのような装置を開発する者であるかといった詳細な意味情報まではわからない。
【0010】
本発明の目的は、人手や構文解析等の技術を用いずに、単語辞書に登録された単語に対してその単語の意味情報を自動的に付与することである。
【0011】
本発明の目的は、入力された文書の情報を利用し、単語辞書に未登録の単語とその意味情報とを自動的に獲得することである。
【0012】
【課題を解決するための手段】
請求項1記載の発明の意味情報推定装置は、単語の表記を複数記憶する単語辞書記憶手段と、前記単語辞書記憶手段に記憶されている1の単語の表記の少なくとも一部を構成する文字列と共通する共通文字列を、前記1の単語以外の単語の表記の中から検索し、前記共通文字列が所定数以上検索された場合に、前記共通文字列を、前記共通文字列を含む表記の単語の意味情報として推定する意味推定手段と、前記意味推定手段により推定された前記意味情報を、前記共通文字列を含む単語の表記に対応付けて前記単語辞書記憶手段に記憶させる意味情報格納手段と、共起する単語間の関係を規定した第1共起パタンと、当該第1共起パタンの各単語の意味情報とを、対応付けて記憶するとともに、前記第1共起パタンのいずれかの単語と他の単語との階層関係又は関連付け関係を規定した第2共起パタンと、当該第2共起パタンの前記他の単語の意味情報とを、対応付けて記憶する共起パタン辞書記憶手段と、入力部から文書の入力を受付ける文書受付手段と、前記文書受付手段により受付けられた前記文書の中から、前記共起パタン辞書記憶手段に記憶されている前記第1共起パタンを満足する各単語を抽出する共起情報抽出手段と、を備え、前記意味情報格納手段は、更に、前記共起情報抽出手段により抽出された前記各単語の表記と、前記共起パタン辞書記憶手段に記憶されている当該単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させるとともに、前記共起情報抽出手段により抽出された前記各単語のいずれかの単語と他の単語との階層関係又は関連付け関係が前記共起パタン辞書記憶手段に記憶されている前記第2共起パタンに規定されている場合には、前記他の単語の表記と、前記共起パタン辞書記憶手段に記憶されている前記他の単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させる
【0013】
したがって、単語において共通する文字列は共通する概念を表す可能性が高いことから、これを利用することで簡単に意味を付与することが可能になる。これにより、人手や構文解析等の技術を用いずに単語辞書に登録された単語に対してその単語の意味情報を自動的に付与することが可能になる。また、文書に出現した共起パタンを利用することで単語辞書に未登録の単語とその意味情報とを自動的に獲得することが可能になる。また、共起パタンを関連付け、あるいは階層的に記述することにより、パタン記述の労力を削減することが可能になる。また、関連付けされることにより、未登録の語があっても関連する既知の情報をもとに意味情報を推定することが可能になる。更に、関連付けられた共起パタンによって、意味情報だけでなく、意味情報同士を関連付けすることが可能になるので、より詳細な意味情報を推定することが可能になる。
【0014】
請求項2記載の発明は、請求項1記載の意味情報推定装置において、前記意味推定手段は、前記1の単語以外の単語の表記の末部分の文字列又は先頭部分の文字列の中から、前記共通文字列を検索する
【0015】
したがって、共通する文字列位置を制限することにより、より精度の高い意味推定が可能になる。
【0026】
請求項記載の発明の意味情報推定方法は、意味推定手段が、単語の表記を複数記憶する単語辞書記憶手段に記憶されている1の単語の表記の少なくとも一部を構成する文字列と共通する共通文字列を、前記1の単語以外の単語の表記の中から検索し、前記共通文字列が所定数以上検索された場合に、前記共通文字列を、前記共通文字列を含む表記の単語の意味情報として推定する意味推定工程と、 意味情報格納手段が、前記意味推定工程により推定された前記意味情報を、前記共通文字列を含む単語の表記に対応付けて前記単語辞書記憶手段に記憶させる第1意味情報格納工程と、文書受付手段が、入力部から文書の入力を受付ける文書受付工程と、共起情報抽出手段が、前記文書受付工程により受付けられた前記文書の中から、共起する単語間の関係を規定した第1共起パタンと当該第1共起パタンの各単語の意味情報とを対応付けて記憶するとともに、前記第1共起パタンのいずれかの単語と他の単語との階層関係又は関連付け関係を規定した第2共起パタンと当該第2共起パタンの前記他の単語の意味情報とを対応付けて記憶する共起パタン辞書記憶手段に記憶されている前記第1共起パタンを満足する各単語を抽出する共起情報抽出工程と、前記意味情報格納手段が、更に、前記共起情報抽出工程により抽出された前記各単語の表記と、前記共起パタン辞書記憶手段に記憶されている当該単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させるとともに、前記共起情報抽出工程により抽出された前記各単語のいずれかの単語と他の単語との階層関係又は関連付け関係が前記共起パタン辞書記憶手段に記憶されている前記第2共起パタンに規定されている場合には、前記他の単語の表記と、前記共起パタン辞書記憶手段に記憶されている前記他の単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させる第2意味情報格納工程と、を含んでなる。
【0027】
したがって、単語において共通する文字列は共通する概念を表す可能性が高いことから、これを利用することで簡単に意味を付与することが可能になる。これにより、人手や構文解析等の技術を用いずに単語辞書に登録された単語に対してその単語の意味情報を自動的に付与することが可能になる。また、文書に出現した共起パタンを利用することで単語辞書に未登録の単語とその意味情報とを自動的に獲得することが可能になる。また、共起パタンを関連付け、あるいは階層的に記述することにより、パタン記述の労力を削減することが可能になる。また、関連付けされることにより、未登録の語があっても関連する既知の情報をもとに意味情報を推定することが可能になる。更に、関連付けられた共起パタンによって、意味情報だけでなく、意味情報同士を関連付けすることが可能になるので、より詳細な意味情報を推定することが可能になる。
【0028】
請求項記載の発明は、請求項記載の意味情報推定方法において、前記意味推定工程では、前記意味推定手段が、前記1の単語以外の単語の表記の末部分の文字列又は先頭部分の文字列の中から、前記共通文字列を検索する。
【0029】
したがって、共通する文字列位置を制限することにより、より精度の高い意味推定が可能になる。
【0040】
請求項記載の発明のプログラムは、単語の意味情報の推定をコンピュータに実行させるためのプログラムであって、前記コンピュータに、単語の表記を複数記憶する単語辞書記憶手段に記憶されている1の単語の表記の少なくとも一部を構成する文字列と共通する共通文字列を、前記1の単語以外の単語の表記の中から検索し、前記共通文字列が所定数以上検索された場合に、前記共通文字列を、前記共通文字列を含む表記の単語の意味情報として推定する意味推定機能と、前記意味推定機能により推定された前記意味情報を、前記共通文字列を含む単語の表記に対応付けて前記単語辞書記憶手段に記憶させる第1意味情報格納機能と、入力部から文書の入力を受付ける文書受付機能と、前記文書受付機能により受付けられた前記文書の中から、共起する単語間の関係を規定した第1共起パタンと当該第1共起パタンの各単語の意味情報とを対応付けて記憶するとともに、前記第1共起パタンのいずれかの単語と他の単語との階層関係又は関連付け関係を規定した第2共起パタンと当該第2共起パタンの前記他の単語の意味情報とを対応付けて記憶する共起パタン辞書記憶手段に記憶されている前記第1共起パタンを満足する各単語を抽出する共起情報抽出機能と、前記共起情報抽出機能により抽出された前記各単語の表記と、前記共起パタン辞書記憶手段に記憶されている当該単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させるとともに、前記共起情報抽出機能により抽出された前記各単語のいずれかの単語と他の単語との階層関係又は関連付け関係が前記共起パタン辞書記憶手段に記憶されている前記第2共起パタンに規定されている場合には、前記他の単語の表記と、前記共起パタン辞書記憶手段に記憶されている前記他の単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させる第2意味情報格納機能と、を実行させる。
【0041】
したがって、単語において共通する文字列は共通する概念を表す可能性が高いことから、これを利用することで簡単に意味を付与することが可能になる。これにより、人手や構文解析等の技術を用いずに単語辞書に登録された単語に対してその単語の意味情報を自動的に付与することが可能になる。また、文書に出現した共起パタンを利用することで単語辞書に未登録の単語とその意味情報とを自動的に獲得することが可能になる。また、共起パタンを関連付け、あるいは階層的に記述することにより、パタン記述の労力を削減することが可能になる。また、関連付けされることにより、未登録の語があっても関連する既知の情報をもとに意味情報を推定することが可能になる。更に、関連付けられた共起パタンによって、意味情報だけでなく、意味情報同士を関連付けすることが可能になるので、より詳細な意味情報を推定することが可能になる。
【0042】
請求項記載の発明は、請求項記載のプログラムにおいて、前記意味推定機能は、前記1の単語以外の単語の表記の末部分の文字列又は先頭部分の文字列の中から、前記共通文字列を検索する。
【0043】
したがって、共通する文字列位置を制限することにより、より精度の高い意味推定が可能になる。
【0056】
【発明の実施の形態】
本発明の第一の実施の形態を図1ないし図5に基づいて説明する。
【0057】
図1は、意味情報推定装置1のハードウェア構成を概略的に示すブロック図である。図1に示すように、意味情報推定装置1は、この意味情報推定装置1の各部を集中的に制御するCPU(Central Processing Unit)2を備えており、このCPU2には、BIOSなどを記憶した読出し専用メモリであるROM(Read Only Memory)3と、各種データを書換え可能に記憶するRAM(Random Access Memory)4とがバス5で接続されている。さらにバス5には、外部記憶となるHDD(Hard Disk Drive)6と、CD(Compact Disc)−ROM7を読み取るCD−ROMドライブ8と、意味情報推定装置1とネットワーク9との通信を司る通信制御装置10と、入力部として機能するキーボードやマウスなどの入力装置11と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)などの出力装置12とが、図示しないI/Oを介して接続されている。
【0058】
RAM4は、各種データを書換え可能に記憶する性質を有していることから、CPU2の作業エリアとして機能し、例えば入力バッファ、解析バッファ等の役割を果たす。
【0059】
また、HDD6には、各種のプログラムを格納するプログラムファイルのほか、単語の表記及び意味情報が格納される単語辞書13が格納されている。本実施の形態の単語辞書13には、図2に示すように、初期状態としては例えば企業等の名称(単語の表記)のみが格納されている。
【0060】
図1に示すCD−ROM7は、この発明の記憶媒体を実施するものであり、所定のプログラムが記憶されている。CPU2は、CD−ROM7に記憶されているプログラムをCD−ROMドライブ8で読み取り、HDD6にインストールする。これにより、意味情報推定装置1は、後述するような各種の処理を行なうことが可能な状態となる。
【0061】
なお、記憶媒体としては、CD−ROM7のみならず、DVDなどの各種の光ディスク、各種光磁気ディスク、フロッピーディスクなどの各種磁気ディスク等、半導体メモリ等の各種方式のメディアを用いることができる。また、通信制御装置10を介してインターネットなどのネットワーク9からプログラムをダウンロードし、HDD6にインストールするようにしてもよい。この場合に、送信側のサーバでプログラムを記憶している記憶装置も、この発明の記憶媒体である。なお、プログラムは、所定のOS(Operating System)上で動作するものであってもよいし、その場合に後述の各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、ワープロソフトなど所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。
【0062】
次に、意味情報推定装置1のCPU2がプログラムに基づいて実行する各種処理の内容について説明する。本発明の意味情報推定装置1は概略的には単語の意味情報を推定するものであって、図3に示すように、CPU2がプログラムに基づいて動作することで、意味情報推定装置1には単語辞書13に基づいて単語の意味情報を推定する機能を発揮する意味情報推定部14が形成される。
【0063】
次に、本実施の形態の意味情報推定部14における意味情報推定処理の流れについて図4を参照して説明する。図4に示すように、本実施の形態の意味情報推定処理は、単語辞書13に登録されている各単語の中で未処理の単語が有る場合には(ステップS1のY)、ステップS2に進み、当該単語を単語辞書13中の他の単語と文字列比較し、共通文字列があればその文字列を記憶し、その文字列に対応付けられたカウンタを1カウントアップするとともに、単語辞書13中の照合した文字列部分をマークする。なお、照合時にすでに照合したマークが共通文字列と完全一致する場合は重複カウントをさけるためにカウントしない。ここに、意味推定手段の機能が実行される。
【0064】
一方、単語辞書13に登録されている各単語の中で未処理の単語がなくなった場合、つまり単語辞書13に登録されている全ての単語についての処理が終了した場合には(ステップS1のN)、ステップS3に進み、共通文字列のカウントが一定数以上であるときに、この共通文字列を意味情報として、当該文字列を持つ単語辞書13中の単語にこの意味情報を付与する。なお、一定数は単語辞書13の語数等によって変更できる。ここに、意味情報格納手段の機能が実行される。
【0065】
上記の意味情報推定処理について具体例を用いて説明する。ここでは、図2に示した単語辞書13の各単語を順に処理するものとして以下において説明する。
【0066】
まず、「AA商事」について処理する。「AA商事」と単語辞書13中の他の単語の共通文字列を検索する。この場合、「AA商事」は、「BBB商事」及び「ZZZ商事」に対して「商事」という単語で共通するので、「商事」という語を共通文字列としてカウント“2”として記憶する。このとき、単語辞書13中の「AA商事」「BBB商事」「ZZZ商事」の「商事」部分をカウント済みとしてマークしておく。
【0067】
続く、「BBB商事」「ZZZ商事」についても、「商事」が共通するが、カウント済みなので、カウントアップしない。
【0068】
次に、「XYビール」について処理する。「XYビール」と単語辞書13中の他の単語の共通文字列を検索する。この場合、「XYビール」は、「YYYビール」に対して「ビール」という単語で共通するので、「ビール」という語を共通文字列としてカウント“1”として記憶する。このとき、単語辞書13中の「XYビール」「YYYビール」の「ビール」部分をカウント済みとしてマークしておく。
【0069】
続く、「YYYビール」についても、「ビール」が共通するが、カウント済みなので、カウントアップしない。
【0070】
単語辞書13に登録されている全ての単語について終了すると、共通文字列のカウントを調べ、例えばカウント“1”以上のものを、意味情報とし、この共通文字列(「商事」「ビール」)を単語辞書13の各単語の表記に対応付けて付与する。
【0071】
ここで、図5は意味情報推定部14の処理によって意味情報が付与された単語辞書13の一例を示す説明図である。図5に示すように、企業等の名称に対して、それぞれの業種分野が意味情報として付与されている。
【0072】
ここに、単語において共通する文字列は共通する概念を表す可能性が高いことから、これを利用することで簡単に意味を付与することができるので、人手や構文解析等の技術を用いずに単語辞書13に登録された単語に対してその単語の意味情報を自動的に付与することができる。
【0073】
次に、本発明の第二の実施の形態を図6ないし図8に基づいて説明する。なお、前述した実施の形態と同一部分は同一符号で示し説明も省略する。本実施の形態は、第一の実施の形態で説明した意味情報推定装置1の意味情報推定部14における意味情報推定処理の変形例である。
【0074】
本実施の形態の意味情報推定部14における意味情報推定処理の流れについて図6を参照して説明する。図6に示すように、本実施の形態の意味情報推定処理は、単語辞書13に登録されている各単語の中で未処理の単語が有る場合には(ステップS11のY)、ステップS12に進み、当該単語を単語辞書13中の他の単語と文字列比較し、共通文字列が単語末か単語頭に位置する場合に、その共通文字列を記憶し、その文字列に対応付けられたカウンタを1カウントアップするとともに、単語辞書13中の照合した文字列部分をマークする。なお、照合時にすでに照合したマークが共通文字列と完全一致する場合は重複カウントをさけるためにカウントしない。
【0075】
一方、単語辞書13に登録されている各単語の中で未処理の単語がなくなった場合、つまり単語辞書13に登録されている全ての単語についての処理が終了した場合には(ステップS11のN)、ステップS13に進み、共通文字列のカウントが一定数以上であるときに、この共通文字列を意味情報として、当該文字列を持つ単語辞書13中の単語にこの意味情報を付与する。なお、一定数は単語辞書13の語数等によって変更できる。
【0076】
つまり、本実施の形態の意味情報推定処理は、第一の実施の形態の意味情報推定処理と比較して、共通する文字かどうかを判定する際に照合する単語での共通文字列の位置を単語末か単語頭に制限した点が異なるものである。
【0077】
上記の意味情報推定処理について具体例を用いて説明する。ここでは、図7に示した単語辞書13の各単語を順に処理するものとして以下において説明する。
【0078】
まず、「(株)○○」について処理する。「(株)○○」と単語辞書13中の他の単語の共通文字列を検索する。この場合、「(株)○○」は、「(株)××証券」及び「(株)AA証券」に対して「(株)」という単語で共通するので、「(株)」という語を共通文字列としてカウント“2”として記憶する。このとき、単語辞書13中の「(株)○○」「(株)××証券」「(株)AA証券」の「(株)」部分をカウント済みとしてマークしておく。
【0079】
次に、「(株)××証券」について処理する。「(株)××証券」と単語辞書13中の他の単語の共通文字列を検索する。この場合、「(株)××証券」は、「(株)AA証券」に対して「証券」という単語で共通するので、「証券」という語を共通文字列としてカウント“1”として記憶する。
【0080】
続く、「(株)AA証券」については、「(株)」及び「証券」が共通するが、カウント済みなので、カウントアップしない。
【0081】
次に、「XYビール」について処理する。「XYビール」と単語辞書13中の他の単語の共通文字列を検索する。この場合、「XYビール」は、「ZZZビール」に対して「ビール」という単語で共通するので、「ビール」という語を共通文字列としてカウント“1”として記憶する。このとき、単語辞書13中の「XYビール」「ZZZビール」の「ビール」部分をカウント済みとしてマークしておく。
【0082】
続く、「ZZZビール」についても、「ビール」が共通するが、カウント済みなので、カウントアップしない。
【0083】
単語辞書13に登録されている全ての単語について終了すると、共通文字列のカウントを調べ、例えばカウント“1”以上のものを、意味情報とし、この共通文字列(「(株)」「証券」「ビール」)を単語辞書13の各単語の表記に対応付けて付与する。
【0084】
ここで、図8は意味情報推定部14の処理によって意味情報が付与された単語辞書13の一例を示す説明図である。図8に示すように、共通文字列を単語末に制限することで、企業等の名称に対して、ものの概念を表す語句の上位分類にあたる語句だけを抽出することができる。ここでは、「ビール」「証券」という業種分野が意味情報として付与されている。また、共通文字列を単語頭に制限することで、企業等の名称に対して、「(株)」といった語全体の意味を特徴付ける表現を抽出できる。ここでは、「(株)」という会社形態が意味情報として付与されている。
【0085】
ここに、共通する文字列位置を制限することにより、より精度の高い意味推定を実現することができる。
【0086】
次に、本発明の第三の実施の形態を図9ないし図11に基づいて説明する。なお、前述した実施の形態と同一部分は同一符号で示し説明も省略する。本実施の形態は、第一の実施の形態で説明した意味情報推定装置1の意味情報推定部14におけるの意味情報推定処理の変形例である。本実施の形態は、第一の実施の形態及び第二の実施の形態で説明したような単語辞書13に意味情報が全くない状態とは異なり、単語辞書13に意味情報が未登録の単語がいくつかある場合や単語を新規に登録した場合の意味情報推定処理である。
【0087】
本実施の形態の意味情報推定部14における意味情報推定処理の流れについて図9を参照して説明する。図9に示すように、本実施の形態の意味情報推定処理は、単語辞書13中に意味情報が未登録の単語が有る場合には(ステップS21のY)、ステップS22に進み、当該単語を単語辞書13中の他の単語と文字列比較し、共通文字列があればその文字列を記憶し、その文字列に対応付けられたカウンタを1カウントアップする。ここに、第二意味推定手段の機能が実行される。
【0088】
一方、意味情報が未登録の単語が単語辞書13中からなくなった場合には(ステップS21のN)、ステップS23に進み、カウントが一定数以上である共通文字列、もしくは、その共通文字列をもつ単語の意味情報を、当該文字列を持つ単語辞書13中の単語に付与する。なお、一定数は単語辞書13の語数等によって変更できる。ここに、第二意味情報格納手段の機能が実行される。
【0089】
上記の意味情報推定処理について具体例を用いて説明する。ここでは、図10に示した単語辞書13の単語を処理するものとして以下において説明する。
【0090】
単語辞書13中には意味情報が未登録の単語(「ZZZ商事」「XYZビール」)が有ることから、まず、「ZZZ商事」について処理する。「ZZZ商事」と単語辞書13中の他の単語の共通文字列を検索する。この場合、「ZZZ商事」は、「AA商事」及び「BBB商事」に対して「商事」という単語で共通するので、「商事」という語を共通文字列としてカウント“2”として記憶する。
【0091】
次に、「XYZビール」について処理する。「XYZビール」と単語辞書13中の他の単語の共通文字列を検索する。この場合、「XYZビール」は、「XYビール」に対して「ビール」という単語で共通するので、「ビール」という語を共通文字列としてカウント“1”として記憶する。
【0092】
単語辞書13中の意味情報が未登録の単語(「ZZZ商事」「XYZビール」)について共通文字列を調べ終わった後、共通文字列のカウントを調べ、例えばカウント“1”以上のものを、意味未登録の単語の意味情報とし、この共通文字列(「商事」「ビール」)を単語辞書13の各単語の表記に対応付けて付与する。
【0093】
ここで、図11は意味情報推定部14の処理によって意味情報が付与された単語辞書13の一例を示す説明図である。図11に示すように、意味情報が未登録であった単語に対して、それぞれの業種分野が意味情報として付与されている。
【0094】
ここに、意味情報を持たない未登録の語について、既存の辞書情報から自動的に意味情報を推定することができる。
【0095】
なお、本実施の形態においては、意味情報が未登録の単語が単語辞書13中に有る場合について説明したが、単語自体を新規に登録した場合も同様に処理することが可能である。
【0096】
次に、本発明の第四の実施の形態を図12ないし図15に基づいて説明する。なお、前述した実施の形態と同一部分は同一符号で示し説明も省略する。本実施の形態は、第一の実施の形態ないし第三の実施の形態で説明したような単語辞書13中の単語の意味情報を単語辞書13に基づいて推定するものではなく、入力装置11等を介して入力された文書から単語の意味情報を推定するものである。
【0097】
ここで、図12は本実施の形態の意味情報推定装置1の機能ブロック図である。図12に示すように、CPU2がプログラムに基づいて動作することで、意味情報推定装置1には共起情報抽出部15及び意味情報推定部16が形成される。共起情報抽出手段を実現する共起情報抽出部15は、概略的には、入力装置11等を介して入力された文書に対して共起パタン辞書17(図13参照)を用いて、文書中から該当する表現を抽出するものである。共起パタン辞書17は、図13に示すように、文書中から抽出する共起表現の組(共起パタン)を記述したものである。図13に示す例では、表記や品詞によって共起表現が指定されている。一方、意味情報推定部16は、概略的には、共起情報抽出部15により抽出された該当する表現に対して、単語辞書13にその単語自体が未登録あるいは意味情報が未登録の場合に、単語とその単語の意味情報とを登録するものである。
【0098】
まず、共起情報抽出部15における処理について説明する。共起情報抽出部15は、入力文書中の所定の単語の後に単語辞書13に未登録の単語または名詞の連続が存在し、かつ、その後に助詞が存在する場合に、未登録の単語または連続する名詞に対し、その所定の単語を意味情報として付与するものである。つまり、図13に示す共起パタン辞書17の例においては、入力文書中の「パソコン」という単語の後の未登録の単語または連続する名詞(図13では下線部分:共起単語)に対して、意味情報として「パソコン」及び「メーカー」を付与したものである。なお、共起単語ごとにテーブル等を用いて別の意味情報を付与することも可能である。また、ここでは入力文書は形態素解析などで解析していても、解析していなくてもよい。形態素解析をしない場合は、単語辞書13によって品詞を特定する。
【0099】
次に、意味情報推定部16における処理について説明する。ここで、図14は本実施の形態の意味情報推定部16における意味情報推定処理の流れを示すフローチャートである。図14に示すように、意味情報推定部16の意味情報推定処理は、共起パタン辞書17の共起パタンを一つずつ順に入力文書と照合し(ステップS31:文書受付手段)、共起パタン中の所定の共起単語(図13では下線部分)が、単語辞書13中において未登録または意味情報が未登録の場合(ステップS32のY,ステップS33のY)、共起パタン辞書17の指示にしたがい意味情報を付与、あるいは共起パタン辞書17の記述を別表現に変換して付与する(ステップS34)。これらステップS32〜S34の処理は、すべての共起パタンについて行なわれる。
【0100】
上記の意味情報推定処理について具体例を用いて説明する。ここでは、例えば入力文書中に「大手メーカー○○電気がパソコンAシリーズを発売した」という表現があった場合について考える。
【0101】
まず、図13に示した共起パタン辞書17の共起パタンに基づき、前方に「パソコン」があり、後方に未登録の単語または連続する名詞(共起単語)があり、その後ろに助詞があるかどうかを調べる。ここでは、「パソコンAシリーズを」が該当する。次に、共起パタン辞書17に基づき、「Aシリーズ」を意味情報「パソコン」として抽出する。これを単語辞書13で検索し、未登録の場合には、図15に示すように単語辞書13に登録する。
【0102】
続いて、図13に示した共起パタン辞書17の共起パタンに基づき、前方に「メーカー」があり、後方に未登録の単語または連続する名詞(共起単語)があり、その後ろに助詞があるかどうかを調べる。ここでは、「メーカー○○電気が」が該当する。次に、共起パタン辞書17に基づき、「○○電気」を意味情報「メーカー」として抽出する。これを単語辞書13で検索し、未登録の場合には単語辞書13に「○○電気」を登録し、さらに意味情報として「メーカー」を登録する。
【0103】
ここに、文書に出現した共起情報を利用することで単語辞書13に未登録の単語とその意味情報とを自動的に獲得することができる。特に、語構成の情報を利用することで、より確実にその意味を獲得することができる。
【0104】
次に、本発明の第五の実施の形態を図16ないし図20に基づいて説明する。なお、前述した実施の形態と同一部分は同一符号で示し説明も省略する。本実施の形態は、第四の実施の形態で説明した意味情報推定装置1の共起情報抽出部15及び意味情報推定部16における処理の変形例である。
【0105】
本実施の形態の単語辞書13には、図16に示すように、単語とその単語の意味情報とが格納されている。
【0106】
次に、本実施の形態の共起情報抽出部15において用いられる共起パタン辞書17について説明する。本実施の形態の共起パタン辞書17は、図17に示すように、照合する共起パタンと共起パタン内の語の意味関係とを記述したものである。なお、共起パタン内の語の意味関係は、上位または下位の関係でもその他の関係でもよい。また、図17に示す例では、“( )”はその意味関係を持つ語を示し、“[ ]”は語の表記自体を指定している。ここで、“[X|Y]”は、XまたはYのどちらでも良いことを意味したものである。
【0107】
加えて、本実施の形態の共起パタン辞書17においては、図17に示すように、共起パタン内での階層あるいは関連付けをした記述を行なえるようになっている。図17に示す例では、「(A):(B)(C)」の場合には、「(B)」「(C)」の連鎖全体で意味「(A)」を表しうることを示している。なお、「(名称:名詞連続or未登録語)」は、名称を意味する表現が名詞の連続か未登録の単語によって構成されることを表しており、照合の際の一致の条件とされている。以上により、共起パタン内の表現のうち、複数単語が組み合わされてできる表現について、例えば単語内の内部的な構成単語の連鎖等の場合、これを分けて記述できるので、記述しやすくなる。図17に示す例では、共起パタンのうち「(商品)」で示された商品を意味する単語について、(製品)(名称:名詞連続or未登録語)といった組み合わせで表現されうることを示している。
【0108】
次に、意味情報推定部16における処理について説明する。ここで、図18は本実施の形態の意味情報推定部16における意味情報推定処理の流れを示すフローチャートである。図18に示すように、意味情報推定部16の意味情報推定処理は、入力文書中の表現を順に照合するものであって、入力文書中に共起パタン辞書17の共起パタンがあるかどうかを調べるものである。その際、入力文書中に意味関係を持つ語“( )”が有れば、“( )”による意味も含めた照合を行ない(ステップS42)、入力文書中に共起パタン辞書17の共起パタンがなければ(ステップS42のN)、ステップS43に進んで意味部分“( )”を除いた照合を行なう。
【0109】
入力文書中に共起パタン辞書17の共起パタンがある場合には(ステップS43のY)、ステップS44に進み、意味部分“( )”について共起パタン中の他の共起パタンで規定があるかどうかを調べる。そして、他の共起パタンで規定がある場合には、意味部分“( )”とその該当文字列とを他の共起パタンで照合する。
【0110】
意味部分“( )”とその該当文字列とを他の共起パタンで照合した場合には(ステップS44のY)、一致した共起パタンのうちもっとも未照合の少ない共起パタンを選択し(ステップS45)、未照合部分が“1”であれば(ステップS46のY)、未照合部分をその意味と認定し、一致した共起パタンと該当文字列(語)とを記憶する(ステップS47)。
【0111】
また、入力文書中に共起パタン辞書17の共起パタンが有る場合にも(ステップS42のY)、一致した共起パタンと該当文字列(語)とを記憶する(ステップS47)。
【0112】
一方、入力文書中に共起パタン辞書17の共起パタンがない場合(ステップS43のN)、意味部分“( )”とその該当文字列とを他の共起パタンで照合しない場合(ステップS44のN)、未照合部分が“1”でない場合には(ステップS46のY)、ステップS41に戻る。
【0113】
これらステップS42〜S47の処理は、入力文書中のすべての表現パタンについて行なわれる。
【0114】
入力文書中のすべての表現パタンについて処理が終わると(ステップS41のN)、一致した共起パタンと該当文字列(語)と意味とに基づき、対応する共起パタン辞書17の意味関係の記述を単語辞書13に書き加える(ステップS48)。
【0115】
上記の意味情報推定処理について具体例を用いて説明する。ここでは、例えば入力文書中に
「○○電気がパソコンAシリーズを発売した」
「○○電気がスパッタリング装置を開発した」
という表現があった場合について考える。
【0116】
まず、図17に示した共起パタン辞書17の共起パタンに基づき、「○○電気がパソコンAシリーズを発売した」についての照合を行なう。図17に示した共起パタン辞書17の先頭の共起パタン「(メーカー)が(商品)を発売」について、意味“( )”も含めた照合を行ない、次に意味“( )”以外の部分だけでの照合を行なう。ここでは、意味部分(メーカー)(商品)以外が一致することになる。
【0117】
意味“( )”が規定された部分は一致かどうか不明であるので、それぞれの意味について他の共起パタン辞書17に規定があるかどうか調べる。(商品)については、「(商品):(製品)(名称:名詞連続or未登録語)」という共起パタンが共起パタン辞書17にあり、該当部分の「パソコンAシリーズ」と照合する。図16に示した単語辞書13には「パソコン」が意味「製品」として登録されていることから、「(商品):(製品)(名称:名詞連続or未登録語)」という共起パタンが適用され、「パソコンAシリーズ」は(製品)(名称)として認識され、この部分全体を(商品)と確認することができる。つまり、共起パタン辞書17の先頭の共起パタン「(メーカー)が(商品)を発売」では、(商品)部分が一致することになる。
【0118】
一方、残る「(メーカー)」については、図16に示した単語辞書13に文字列の一致条件がない。この例では、共起パタン辞書17の先頭の共起パタン「(メーカー)が(商品)を発売」が最も良く照合され、かつ未照合部分が“1”であることから、共起パタン辞書17の先頭の共起パタン「(メーカー)が(商品)を発売」を照合したとみなし、未照合部分である「○○電気」を(メーカー)として推定し、単語辞書13には未登録である「○○電気」を意味「メーカー」、「Aシリーズ」を意味「名称」として認定し、照合した共起パタンとその単語とを記憶する。
【0119】
次に、「○○電気がスパッタリング装置を開発した」についての照合を行なう。図17に示した共起パタン辞書17の二番目の共起パタン「(メーカー)が(技術)を開発」について、意味“( )”も含めた照合を行ない、次に意味“( )”以外の部分だけでの照合を行なう。ここでは、意味部分(メーカー)(技術)以外が一致することになる。
【0120】
意味“( )”が規定された部分は一致かどうか不明であるので、それぞれの意味について他の共起パタン辞書17に規定があるかどうか調べる。(技術)については、「(技術):(技術)|(技術)[装置|システム]」という共起パタンが共起パタン辞書17にあり、該当部分の「スパッタリング装置」と照合する。「(技術):(技術)|(技術)[装置|システム]」という共起パタンが適用され、「スパッタリング装置」は(技術)[装置|システム]として認識され、この部分全体を(技術)と確認することができる。つまり、共起パタン辞書17の二番目の共起パタン「(メーカー)が(技術)を開発」では、(技術)部分が一致することになる。
【0121】
一方、残る「(メーカー)」については、図16に示した単語辞書13に文字列の一致条件がない。この例では、共起パタン辞書17の二番目の共起パタン「(メーカー)が(技術)を開発」が最も良く照合され、かつ未照合部分が“1”であることから、共起パタン辞書17の二番目の共起パタン「(メーカー)が(技術)を開発」を照合したとみなし、未照合部分である「○○電気」を(メーカー)として推定し、単語辞書13には未登録である「○○電気」を意味「メーカー」、「スパッタリング」を意味「技術」として認定し、照合した共起パタンとその単語とを記憶する。
【0122】
すべての共起パタンを照合した後、照合された共起パタンについて、単語辞書13中の語に意味情報が付与される。ここでは「○○電気」という語について意味「メーカー」、「Aシリーズ」という語について意味「名称」、「スパッタリング」という語について意味「技術」を図19に示すように単語辞書13に登録することができる。なお、意味関係については、目的に応じて関連付けの順番の変更(例えば、メーカーを図19中左側にする)が可能である。また、図20に示すように、単語辞書13自体に意味付与することも可能である。
【0123】
以上のように、共起パタンによって単語自体や単語の意味が未登録であっても、共起する表現によってそれらが推測でき、また意味同士が関連つけられているので、詳細な照合と、照合結果から詳細な意味情報を推定することができる。
【0124】
ここに、共起パタンを関連付け、あるいは階層的に記述することにより、パタン記述の労力を削減することができる。また、関連付けされることにより、未登録の語があっても関連する既知の情報をもとに意味情報を推定することができる。また、関連付けられた共起パタンによって、意味情報だけでなく、意味情報同士を関連付けすることができるので、より詳細な意味情報を推定することができる。
【0125】
【発明の効果】
請求項1,記載の発明によれば、単語において共通する文字列は共通する概念を表す可能性が高いことから、これを利用することで簡単に意味を付与することができるので、人手や構文解析等の技術を用いずに単語辞書に登録された単語に対してその単語の意味情報を自動的に付与することができる。また、文書に出現した共起パタンを利用することで単語辞書に未登録の単語とその意味情報とを自動的に獲得することができる。また、共起パタンを関連付け、あるいは階層的に記述することにより、パタン記述の労力を削減することができる。また、関連付けされることにより、未登録の語があっても関連する既知の情報をもとに意味情報を推定することができる。更に、関連付けられた共起パタンによって、意味情報だけでなく、意味情報同士を関連付けすることが可能になるので、より詳細な意味情報を推定することが可能になる。
【0126】
請求項2,記載の発明によれば、共通する文字列位置を制限することにより、より精度の高い意味推定を実現することができる。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態の意味情報推定装置のハードウェア構成を概略的に示すブロック図である。
【図2】単語辞書の初期状態を示す説明図である。
【図3】意味情報推定装置の機能ブロック図である。
【図4】意味情報推定処理の流れを概略的に示すフローチャートである。
【図5】意味情報が付与された単語辞書を示す説明図である。
【図6】本発明の第二の実施の形態の意味情報推定装置における意味情報推定処理の流れを概略的に示すフローチャートである。
【図7】単語辞書の初期状態を示す説明図である。
【図8】意味情報が付与された単語辞書を示す説明図である。
【図9】本発明の第三の実施の形態の意味情報推定装置における意味情報推定処理の流れを概略的に示すフローチャートである。
【図10】単語辞書の初期状態を示す説明図である。
【図11】意味情報が付与された単語辞書を示す説明図である。
【図12】本発明の第四の実施の形態の意味情報推定装置の機能ブロック図である。
【図13】共起パタン辞書を示す説明図である。
【図14】意味情報推定処理の流れを概略的に示すフローチャートである。
【図15】意味情報が付与された単語辞書を示す説明図である。
【図16】本発明の第五の実施の形態の意味情報推定装置の単語辞書の初期状態を示す説明図である。
【図17】共起パタン辞書を示す説明図である。
【図18】意味情報推定処理の流れを概略的に示すフローチャートである。
【図19】意味情報が付与された単語辞書を示す説明図である。
【図20】意味情報が付与された単語辞書の別の一例を示す説明図である。
【符号の説明】
1 意味情報推定装置
7 記憶媒体
11 入力部
13 単語辞書
17 共起パタン辞書

Claims (6)

  1. 単語の表記を複数記憶する単語辞書記憶手段と、
    前記単語辞書記憶手段に記憶されている1の単語の表記の少なくとも一部を構成する文字列と共通する共通文字列を、前記1の単語以外の単語の表記の中から検索し、前記共通文字列が所定数以上検索された場合に、前記共通文字列を、前記共通文字列を含む表記の単語の意味情報として推定する意味推定手段と、
    前記意味推定手段により推定された前記意味情報を、前記共通文字列を含む単語の表記に対応付けて前記単語辞書記憶手段に記憶させる意味情報格納手段と、
    共起する単語間の関係を規定した第1共起パタンと、当該第1共起パタンの各単語の意味情報とを、対応付けて記憶するとともに、前記第1共起パタンのいずれかの単語と他の単語との階層関係又は関連付け関係を規定した第2共起パタンと、当該第2共起パタンの前記他の単語の意味情報とを、対応付けて記憶する共起パタン辞書記憶手段と、
    入力部から文書の入力を受付ける文書受付手段と、
    前記文書受付手段により受付けられた前記文書の中から、前記共起パタン辞書記憶手段に記憶されている前記第1共起パタンを満足する各単語を抽出する共起情報抽出手段と、
    を備え、
    前記意味情報格納手段は、更に、前記共起情報抽出手段により抽出された前記各単語の表記と、前記共起パタン辞書記憶手段に記憶されている当該単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させるとともに、前記共起情報抽出手段により抽出された前記各単語のいずれかの単語と他の単語との階層関係又は関連付け関係が前記共起パタン辞書記憶手段に記憶されている前記第2共起パタンに規定されている場合には、前記他の単語の表記と、前記共起パタン辞書記憶手段に記憶されている前記他の単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させる意味情報推定装置。
  2. 前記意味推定手段は、前記1の単語以外の単語の表記の末部分の文字列又は先頭部分の文字列の中から、前記共通文字列を検索する請求項1記載の意味情報推定装置。
  3. 意味推定手段が、単語の表記を複数記憶する単語辞書記憶手段に記憶されている1の単語の表記の少なくとも一部を構成する文字列と共通する共通文字列を、前記1の単語以外の単語の表記の中から検索し、前記共通文字列が所定数以上検索された場合に、前記共通文字列を、前記共通文字列を含む表記の単語の意味情報として推定する意味推定工程と、
    意味情報格納手段が、前記意味推定工程により推定された前記意味情報を、前記共通文字列を含む単語の表記に対応付けて前記単語辞書記憶手段に記憶させる第1意味情報格納工程と、
    文書受付手段が、入力部から文書の入力を受付ける文書受付工程と、
    共起情報抽出手段が、前記文書受付工程により受付けられた前記文書の中から、共起する単語間の関係を規定した第1共起パタンと当該第1共起パタンの各単語の意味情報とを対応付けて記憶するとともに、前記第1共起パタンのいずれかの単語と他の単語との階層関係又は関連付け関係を規定した第2共起パタンと当該第2共起パタンの前記他の単語の意味情報とを対応付けて記憶する共起パタン辞書記憶手段に記憶されている前記第1共起パタンを満足する各単語を抽出する共起情報抽出工程と、
    前記意味情報格納手段が、更に、前記共起情報抽出工程により抽出された前記各単語の表記と、前記共起パタン辞書記憶手段に記憶されている当該単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させるとともに、前記共起情報抽出工程により抽出された前記各単語のいずれかの単語と他の単語との階層関係又は関連付け関係が前記共起パタン辞書記憶手段に記憶されている前記第2共起パタンに規定されている場合には、前記他の単語の表記と、前記共起パタン辞書記憶手段に記憶されている前記他の単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させる第2意味情報格納工程と、
    を含んでなる意味情報推定方法。
  4. 前記意味推定工程では、前記意味推定手段が、前記1の単語以外の単語の表記の末部分の文字列又は先頭部分の文字列の中から、前記共通文字列を検索する請求項記載の意味情報推定方法。
  5. 単語の意味情報の推定をコンピュータに実行させるためのプログラムであって、前記コンピュータに、
    単語の表記を複数記憶する単語辞書記憶手段に記憶されている1の単語の表記の少なくとも一部を構成する文字列と共通する共通文字列を、前記1の単語以外の単語の表記の中から検索し、前記共通文字列が所定数以上検索された場合に、前記共通文字列を、前記共通文字列を含む表記の単語の意味情報として推定する意味推定機能と、
    前記意味推定機能により推定された前記意味情報を、前記共通文字列を含む単語の表記に対応付けて前記単語辞書記憶手段に記憶させる第1意味情報格納機能と、
    入力部から文書の入力を受付ける文書受付機能と、
    前記文書受付機能により受付けられた前記文書の中から、共起する単語間の関係を規定した第1共起パタンと当該第1共起パタンの各単語の意味情報とを対応付けて記憶するとともに、前記第1共起パタンのいずれかの単語と他の単語との階層関係又は関連付け関係を規定した第2共起パタンと当該第2共起パタンの前記他の単語の意味情報とを対応付けて記憶する共起パタン辞書記憶手段に記憶されている前記第1共起パタンを満足する各単語を抽出する共起情報抽出機能と、
    前記共起情報抽出機能により抽出された前記各単語の表記と、前記共起パタン辞書記憶手段に記憶されている当該単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させるとともに、前記共起情報抽出機能により抽出された前記各単語のいずれかの単語と他の単語との階層関係又は関連付け関係が前記共起パタン辞書記憶手段に記憶されている前記第2共起パタンに規定されている場合には、前記他の単語の表記と、前記共起パタン辞書記憶手段に記憶されている前記他の単語の前記意味情報とを、対応付けて前記単語辞書記憶手段に記憶させる第2意味情報格納機能と、
    を実行させるためのプログラム。
  6. 前記意味推定機能は、前記1の単語以外の単語の表記の末部分の文字列又は先頭部分の文字列の中から、前記共通文字列を検索する請求項記載のプログラム。
JP2001131379A 2001-04-27 2001-04-27 意味情報推定装置、意味情報推定方法、及びプログラム Expired - Fee Related JP4468608B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001131379A JP4468608B2 (ja) 2001-04-27 2001-04-27 意味情報推定装置、意味情報推定方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001131379A JP4468608B2 (ja) 2001-04-27 2001-04-27 意味情報推定装置、意味情報推定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2002328943A JP2002328943A (ja) 2002-11-15
JP4468608B2 true JP4468608B2 (ja) 2010-05-26

Family

ID=18979579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001131379A Expired - Fee Related JP4468608B2 (ja) 2001-04-27 2001-04-27 意味情報推定装置、意味情報推定方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP4468608B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148939A (ja) * 2005-11-29 2007-06-14 Kyocera Corp 通信機器及び通信方法
JP5057525B2 (ja) * 2009-02-23 2012-10-24 日本電信電話株式会社 単語ベクトル生成装置、単語ベクトル生成方法、プログラムおよび記録媒体
CN112562849B (zh) * 2020-12-08 2023-11-17 中国科学技术大学 一种基于层次结构和共现结构的临床自动诊断方法及***

Also Published As

Publication number Publication date
JP2002328943A (ja) 2002-11-15

Similar Documents

Publication Publication Date Title
US6098034A (en) Method for standardizing phrasing in a document
JP3579204B2 (ja) 文書要約装置およびその方法
US8458198B1 (en) Document analysis and multi-word term detector
JP4654745B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2008152760A (ja) マシンアシスト翻訳ツール
JP7168411B2 (ja) 情報処理システムおよび情報処理方法
CN109101551B (zh) 一种问答知识库的构建方法及装置
KR20050058189A (ko) 정보 추출을 위한 일반화된 스트링 패턴의 학습 및 사용
US20050071365A1 (en) Method for keyword correlation analysis
CN109376202A (zh) 一种基于nlp的企业供应关系自动抽取分析方法
JP2020113129A (ja) 文書評価装置、文書評価方法及びプログラム
WO2010061733A1 (ja) 誤訳の検出を支援する装置及び方法
JP5204203B2 (ja) 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム
JP2006343925A (ja) 関連語辞書作成装置、および関連語辞書作成方法、並びにコンピュータ・プログラム
JP2006227823A (ja) 情報処理装置及びその制御方法
JP7103763B2 (ja) 情報処理システムおよび情報処理方法
JP5117744B2 (ja) 単語意味タグ付与装置および方法、プログラム並びに記録媒体
JP4468608B2 (ja) 意味情報推定装置、意味情報推定方法、及びプログラム
JPH1145274A (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
WO2015177861A1 (ja) 教師データ作成装置及び方法
JP2005202924A (ja) 対訳判断装置、方法及びプログラム
JP7415495B2 (ja) 文書処理プログラム、文書処理装置、及び文書処理方法
KR100659370B1 (ko) 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법
KR100504632B1 (ko) 비구조 문서에서 사용자가 요구하는 정보를 추출하는 장치및 그 방법
JP2007213336A (ja) 辞書作成装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040930

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060823

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090421

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100223

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100225

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140305

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees