JP4024137B2 - 数量表現検索装置 - Google Patents

数量表現検索装置 Download PDF

Info

Publication number
JP4024137B2
JP4024137B2 JP2002345060A JP2002345060A JP4024137B2 JP 4024137 B2 JP4024137 B2 JP 4024137B2 JP 2002345060 A JP2002345060 A JP 2002345060A JP 2002345060 A JP2002345060 A JP 2002345060A JP 4024137 B2 JP4024137 B2 JP 4024137B2
Authority
JP
Japan
Prior art keywords
document
attribute
quantity expression
prefix
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002345060A
Other languages
English (en)
Other versions
JP2004178351A (ja
Inventor
美樹 佐々木
篤司 池野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2002345060A priority Critical patent/JP4024137B2/ja
Priority to US10/722,554 priority patent/US20040225646A1/en
Publication of JP2004178351A publication Critical patent/JP2004178351A/ja
Application granted granted Critical
Publication of JP4024137B2 publication Critical patent/JP4024137B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、自然言語で数量表現を検索する数量表現検索装置に関する。
【0002】
【従来の技術】
自然言語で様々に表記された同じ意味の数量表現を検索できるようにするには、数量表現を変換する必要がある。
【0003】
従来の数量表現検索装置では、文書内をサーチし、数量表現テンプレートとマッチングを行うことによって、文書内の数量表現を一括して適切な数量表現に変換することが可能となり、機械翻訳システムなどに利用することができる(例えば、特許文献1参照)。
【0004】
【特許文献1】
特開平5−67137号公報
【0005】
【発明が解決しようとする課題】
しかしながら、上記従来の数量表現検索装置では、単語の意味情報と変換関数を用いて変換するだけなので、省略されていて意味が複数考えられる表現には対応することができない。
【0006】
例えば、「尺」を日本語の長さの数量表現に登録し、「centimeter」を英語の長さの数量表現に登録しておくと、「尺」を「centimeter」に変換することができるとなっているが、文書内で「キロ」と省略されている場合は、「キロメートル」なのか、「キログラム」なのか、判断できないので、正しく変換することはできない。
【0007】
本発明は、このような従来の従来の課題に鑑みてなされたものであり、接頭語のみに省略されている場合を意識しなくても数量表現を検索することができる数量表現検索装置を提供することを目的とするものである。
【0008】
【課題を解決するための手段】
本発明の数量表現検索装置は、
検索対象の文書や検索したい数量表現を入力する入力手段と、
上記入力された文書や数量表現の文の構造を解析する文構造解析手段と、
属性を表す属性名と属性の意味を表す属性内容と補完するための基本単位とからなる属性情報、および省略されたと判断するための接頭語と接頭語の意味を表す倍数とからなる単位系情報が格納された属性辞書と、
属性を表す属性名と属性名を判断するための共起語とからなる情報が格納された共起語辞書と、
上記入力された文書や数量表現を受け、上記解析された文構造と上記共起語辞書を参照して上記入力された文書から接頭語のみに省略された数量表現を探し、その省略された数量表現に対して、上記解析された文構造をもとに上記接頭語の共起語を決定し、この決定した共起語をもとに上記共起語辞書を参照して上記接頭語の属性名を決定し、この決定した属性名をもとに上記属性辞書を参照して上記接頭語に基本単位を補完することによって、省略された数量表現を補完する省略補完手段と
上記補完後の文書から接頭語に基本単位を補完した語を検索キーワードとして抽出する抽出手段と、
文書データが格納される文書データベースと、
上記補完後の文書と上記入力された元の文書と上記抽出された検索キーワードとを上記文書データベースに格納し、該検索キーワードを用いて数量表現の検索を行う文書格納検索手段と、
出力手段と
を備え
上記省略補完手段は、上記解析された文構造と上記共起語辞書を参照して上記入力された数量表現が接頭語のみに省略された数量表現であるか否かを判別し、接頭語のみに省略された数量表現であれば、
その旨を上記出力手段によって通知し、再入力を促す
ことを特徴とするものである。
上記省略補完手段として、
上記解析された文構造と上記共起語辞書を参照して上記入力された数量表現が接頭語のみに省略された数量表現であるか否かを判別し、接頭語のみに省略された数量表現であれば、その旨を上記出力手段によって通知し、再入力を促す機能を代わりに、
上記解析された文構造と上記共起語辞書を参照して上記入力された数量表現が接頭語のみに省略された数量表現であるか否かを判別し、接頭語のみに省略された数量表現であれば、基本単位と属性情報を上記出力手段によって提示して、基本単位の内の1つを選択するように促し、選択された基本単位を用いて補完する機能を有するものを用いても良い。
【0009】
【発明の実施の形態】
図1は本発明の実施の形態の数量表現検索装置のブロック構成図である。この実施の形態の数量表現検索装置は、入力手段1と、文構造解析手段2と、省略補完手段3と、属性辞書4と、共起語辞書5と、文書格納検索手段6と、文書データベース7と、抽出手段8と、出力手段9とを備える。
【0010】
入力手段1は、検索対象の文書や検索したい数量表現を入力する手段である。この入力手段1は、入力された文書や数量表現を文構造解析手段2に送る。
【0011】
文構造解析手段2は、入力された文の構造を解析する手段である。この文構造解析手段2は、入力手段1から送られた文書や数量表現の文構造を形態素解析と構文解析によって解析し、解析後の文構造を入力された元の文書や数量表現とともに省略補完手段3に送る。
【0012】
省略補完手段3は、接頭語のみに省略された(省略されて接頭語のみである)数量表現に基本単位を補完する手段である。この省略補完手段3は、文構造解析手段2から送られた文構造をもとに、属性辞書4と共起語辞書5を参照して、文書や数量表現の接頭語に基本単位を補完し、補完後の文書や数量表現を入力された元の文書や数量表現とともに抽出手段8に送る。
【0013】
図2は数量表現を含む文の文構造の解析例を示す図である。数量表現の修飾先の語を、その共起語とする。図2(1),(2),(3)の「5M」の共起語は「メモリ」になる。また、図2(4)の「5M」の共起語は「増設する」になる。
【0014】
属性辞書4は、属性の情報と単位系の情報を格納する辞書である。この属性辞書4は、属性情報が属性名と属性内容と基本単位からなり、単位系情報が接頭語と倍数と基本単位からなる。
【0015】
共起語辞書5は、省略を補完する共起語の情報を格納する辞書である。この共起語辞書5は、属性名と共起語からなる。
【0016】
図3は属性辞書4の構成例を示す図であり、図4は共起語辞書5の構成例を示す図である。
【0017】
文書格納検索手段6は、文書を格納および検索する手段である。この文書格納検索手段6は、抽出手段8から入力された補完後の文書や元の文書や検索キーワードを文書データベース7に格納し、抽出手段8から入力された補完後の数量表現が検索キーワードと一致する文書を文書データベース7から検索して出力手段9に送る。
【0018】
文書データベース7は、検索対象の文書や補完後の文書を格納するデータベースである。
【0019】
抽出手段8は、検索キーワードを抽出する手段である。この抽出手段8は、省略補完手段3から入力された補完後の文書や数量表現と、補完後の語を抽出した検索キーワードを、文書格納検索手段6に送る。
【0020】
出力手段9は、結果を出力する手段である。この出力手段9は、文書格納検索手段6から送られた検索結果を出力する。
【0021】
なお、形態素解析を行う処理、構文解析を行う処理、文書をデータベース化する処理、文書を格納または検索する処理、および該当部分(検索キーワード)を抽出する処理は、一般的な部分に関しては、既知の自然言語処理技術を用いればよい。
【0022】
図5は本発明の実施の形態の数量表現検索装置の動作を説明するフローチャートである。この図5において、入力手段1で処理を選択し(ステップ501)、投入処理を実行するか(ステップ502)、検索処理を実行するか(ステップ503)、または終了する。
【0023】
図6は図5のステップ502の投入処理の動作を説明するフローチャートである。
【0024】
図6の投入処理では、まず最初に、検索対象の文書を入力手段1に投入する(ステップ601)。
例えば、以下の例文(a)または(b)を投入する。
「10キロの荷物を持って歩いた」…(a)
「10キロ荷物を持って歩いた」…(b)
入力手段1に投入された文書は、文書解析手段2に送られる。
【0025】
次に、文構造解析手段2において、投入された文書の文構造を解析する(ステップ602)。
図7は例文(a),(b)の文構造の解析例であり、(1)は例文(a)の解析例、(2)は例文(b)の解析例である。
文構造解析手段2での解析後の文構造は、入力手段1から送られた元の文書とともに、省略補完手段3に送られる。
【0026】
次に、省略補完手段3において、解析後の文構造および属性辞書4(図3参照)の単位系情報を参照して、文書から接頭語を探す(ステップ603)。
例文(a),(b)では、接頭語として、ともに「キロ」が探される。
【0027】
なお、上記ステップ603から以下のステップ607までの処理は、省略補完手段3においての処理である。
【0028】
次に、文構造解析手段2で解析された文構造から共起語を決定する(ステップ604)。
例文(a)の共起語は「荷物」と決定される。
例文(b)の共起語は「歩く」と決定される。
【0029】
次に、共起語辞書5(図4参照)を参照して、属性(属性名)を決定する(ステップ605)。
例文(a)の属性名は「WEIGHT」と決定される。
例文(b)の属性名は「LENGTH」と決定される。
【0030】
さらに、属性辞書4(図3)を参照して、基本単位を決定する(ステップ606)。
例文(a)では、属性が「WEIGHT」なので、基本単位は「グラム」と決定される。
例文(b)では、属性が「LENGTH」なので、基本単位は「メートル」と決定される。
【0031】
そして、接頭語に基本単位を補完する(ステップ607)。
例文(a)では、接頭語「キロ」に基本単位「グラム」が補完され、「10キログラムの荷物を持って歩いた」となる。
例文(b)では、接頭語「キロ」に基本単位「メートル」が補完され、「10キロメートル荷物を持って歩いた」となる。
補完後の文書は、元の文書とともに、抽出手段8に送られる。
【0032】
次に、抽出手段8において、補完後の語を検索キーワードとして抽出する(ステップ608)。
例文(a)では、「10キログラム」がキーワードとして抽出される。
例文(b)では、「10キロメートル」がキーワードとして抽出される。
抽出されたキーワードは、元の文書とともに、文書格納検索手段6に送られる。
【0033】
最後に、文書格納検索手段6によって、文書データベース7に、元の文書と検索キーワードを格納し(ステップ609)、投入処理を終了する。
例文(a)では、元の文書「10キロの荷物を持って歩いていた」とキーワード「10キログラム」が文書データベース7に格納される。
例文(b)では、元の文書「10キロ荷物を持って歩いていた」とキーワード「10キロメートル」が文書データベース7に格納される。
【0034】
図8は図5のステップ503の検索処理の動作を説明するフローチャートである。
【0035】
図8の検索処理では、まず最初に、検索したい数量表現を、検索語として入力手段1に入力する(ステップ801)。
例えば、以下の例文(c)または(d)を検索語として入力する。
「10キロメートル」…(c)
「10キロ」…(d)
入力手段1に入力された数量表現(検索語)は、文書解析手段2に送られる。
【0036】
次に、文構造解析手段2において、検索語の文構造を解析する(ステップ802)。文構造解析手段2での解析後の文構造は、入力手段1から送られた数量表現(検索語)とともに、省略補完手段3に送られる。
【0037】
次に、省略補完手段3において、解析後の文構造および属性辞書4(図3参照)の単位系情報を参照して、検索語が接頭語であるか否か(接頭語のみに省略された数量表現であるか否か)を判別する(ステップ803)。
例文(c)では、接頭語でないと判別される。
例文(d)では、「キロ」が接頭語であると判別される。
接頭語でないと判別された場合は、文書格納検索手段6に送られる。
【0038】
上記ステップ803で接頭語でないと判別された場合は、文書格納検索手段6において、検索語と検索キーワードが一致する文書を文書データベース7に格納されている文書から検索して獲得する(ステップ804)。
例文(c)では、検索キーワードが「10キロメートル」である上記例文(b)の「10キロ荷物を持って歩いた」が、文書データベース7から検索されて獲得される。
【0039】
そして、上記ステップ804で獲得した文書を検索結果として出力手段8から出力する(ステップ805)。
例文(c)では、上記例文(b)の「10キロ荷物を持って歩いた」が検索結果として出力される。
【0040】
また、上記ステップ803で接頭語であると判別された場合は、省略補完手段3において、属性辞書4(図3参照)の属性情報を参照して、基本単位と属性内容の一覧を出力手段9で表示させて、省略された数量表現であることを通知する(ステップ811)。
【0041】
なお、上記ステップ811から以下のステップ815までの処理は、省略補完手段3においての処理である。
【0042】
そして、再入力するか否かを出力手段9で表示させ、再入力するか否かを問い合わせる(ステップ812)。
【0043】
上記ステップ812で、再入力することが選択された場合には、上記ステップ801の検索語の入力に戻る。
【0044】
また、上記ステップ812で、再入力しないことが選択された場合には、基本単位から選択するか否かを出力手段9で表示させ、基本単位から選択するか否かを問い合わせる(ステップ813)。
【0045】
上記ステップ813で、基本単位からの選択がなされた場合には、その選択された基本単位で接頭語(検索語)を補完する(ステップ814)。
例文(d)では、例えば基本単位「グラム」が選択され、その基本単位「グラム」で検索語「10キロ」が補完され、「10キログラム」となる。
補完された検索語は、文書格納検索手段6に送られる。
【0046】
そして、上記ステップ814で検索語に補完がなされた場合には、文書格納検索手段6において、検索語と検索キーワードが一致する文書を文書データベース7に格納されている文書から検索して獲得し(ステップ804)、この獲得した文書を検索結果として出力手段8から出力する(ステップ805)。
例文(d)では、検索キーワードが「10キログラム」である上記例文(a)の「10キロの荷物を持って歩いた」が、文書データベース7から検索されて獲得され、検索結果として出力手段8から出力される。
【0047】
また、上記ステップ813で、基本単位からの選択がなされなかった場合には、全ての基本単位で接頭語(検索語)を補完する(ステップ815)。
例文(d)では、例えば全ての基本単位「メートル」,「グラム」,「バイト」,…で、検索語「10キロ」が補完され、「10キロメートル」,「10キログラム」,「10キロバイト」,…となる。
全ての基本単位で補完されたこれらの検索語は、文書格納検索手段6に送られる。
【0048】
そして、上記ステップ815で検索語に補完がなされた場合には、文書格納検索手段6において、補完された全ての検索語について、変換後の検索キーワードが一致する文書を文書データベース7に格納されている文書からそれぞれ検索して獲得し(ステップ804)、これら獲得した文書を検索結果として出力手段8から出力する(ステップ805)。例文(d)では、検索キーワードが「10キログラム」である上記例文(a)の「10キロの荷物を持って歩いた」、検索キーワードが「10キロメートル」である上記例文(b)の「10キロ荷物を持って歩いた」などが、文書データベース7から検索されて獲得され、検索結果として出力手段8から出力される。
【0049】
共起語として修飾関係や格関係になる語を抽出する方法や、抽出した語の関係を表すシソーラスを作成する手法や、抽出した語の関係から訳し分けを行う手法はすでに存在するが、それらの手法の対象は被修飾語や格になる名詞や動詞であり、それらの手法を用いても、修飾になる数量表現の属性を決定することができない。
【0050】
以上のように本発明の実施の形態によれば、文構造を解析して共起語を決定して省略された数量表現を補完して格納しておく、あるいは省略された数量表現を適切に補完する語のみを検索時に提供して検索することによって、省略された数量表現が検索対象文書と検索語のいずれに存在していても、省略されていることを意識せずに補完して検索できる。また、自然言語の検索に用いると、数量表現の検索が容易になる。
【0051】
なお、上記実施の形態では、数値と単位による数量表現のみを検索対象または検索語とする数量表現検索装置を説明したが、本発明は、その他の数量表現や数量表現以外を検索対象または検索語とする方法や装置と組み合わせて利用することも可能である。
【0052】
【発明の効果】
以上説明したように本発明によれば、接頭語のみに省略されていることを意識せずに数量表現を補完して検索できるという効果がある。
【図面の簡単な説明】
【図1】 本発明の実施の形態の数量表現検索装置のブロック構成図である。
【図2】 数量表現を含む文の文構造の解析例を示す図ある。
【図3】 図1の属性辞書の構成例を示す図である。
【図4】 図1の共起語辞書の構成例を示す図である。
【図5】 図1の数量表現検索装置の動作を説明するフローチャートである。
【図6】 図5のステップ502の投入処理の動作を説明するフローチャートである。
【図7】 図6のステップ602においての文構造の解析例を示す図である。
【図8】 図5のステップ503の検索処理の動作を説明するフローチャートである。
【符号の説明】
1 入力手段、 2 文構造解析手段、 3 省略補完手段、 4 属性辞書、 5 共起語辞書、 6 文書格納検索手段、 7 文書データベース、 8抽出手段、 9 出力手段。

Claims (4)

  1. 自然言語で数量表現を検索する数量表現検索装置において、
    検索対象の文書や検索したい数量表現を入力する入力手段と、
    上記入力された文書や数量表現の文の構造を解析する文構造解析手段と、
    属性を表す属性名と属性の意味を表す属性内容と補完するための基本単位とからなる属性情報、および省略されたと判断するための接頭語と接頭語の意味を表す倍数とからなる単位系情報が格納された属性辞書と、
    属性を表す属性名と属性名を判断するための共起語とからなる情報が格納された共起語辞書と、
    上記入力された文書や数量表現を受け、上記解析された文構造と上記共起語辞書を参照して上記入力された文書から接頭語のみに省略された数量表現を探し、その省略された数量表現に対して、上記解析された文構造をもとに上記接頭語の共起語を決定し、この決定した共起語をもとに上記共起語辞書を参照して上記接頭語の属性名を決定し、この決定した属性名をもとに上記属性辞書を参照して上記接頭語に基本単位を補完することによって、省略された数量表現を補完する省略補完手段と
    上記補完後の文書から接頭語に基本単位を補完した語を検索キーワードとして抽出する抽出手段と、
    文書データが格納される文書データベースと、
    上記補完後の文書と上記入力された元の文書と上記抽出された検索キーワードとを上記文書データベースに格納し、該検索キーワードを用いて数量表現の検索を行う文書格納検索手段と、
    出力手段と
    を備え
    上記省略補完手段は、上記解析された文構造と上記共起語辞書を参照して上記入力された数量表現が接頭語のみに省略された数量表現であるか否かを判別し、接頭語のみに省略された数量表現であれば、その旨を上記出力手段によって通知し、再入力を促す
    ことを特徴とする数量表現検索装置。
  2. 自然言語で数量表現を検索する数量表現検索装置において、
    検索対象の文書や検索したい数量表現を入力する入力手段と、
    上記入力された文書や数量表現の文の構造を解析する文構造解析手段と、
    属性を表す属性名と属性の意味を表す属性内容と補完するための基本単位とからなる属性情報、および省略されたと判断するための接頭語と接頭語の意味を表す倍数とからなる単位系情報が格納された属性辞書と、
    属性を表す属性名と属性名を判断するための共起語とからなる情報が格納された共起語辞書と、
    上記入力された文書や数量表現を受け、上記解析された文構造と上記共起語辞書を参照して上記入力された文書から接頭語のみに省略された数量表現を探し、その省略された数量表現に対して、上記解析された文構造をもとに上記接頭語の共起語を決定し、この決定した共起語をもとに上記共起語辞書を参照して上記接頭語の属性名を決定し、この決定した属性名をもとに上記属性辞書を参照して上記接頭語に基本単位を補完することによって、省略された数量表現を補完する省略補完手段と、
    上記補完後の文書から接頭語に基本単位を補完した語を検索キーワードとして抽出する抽出手段と、
    文書データが格納される文書データベースと、
    上記補完後の文書と上記入力された元の文書と上記抽出された検索キーワードとを上記文書データベースに格納し、該検索キーワードを用いて数量表現の検索を行う文書格納検索手段と、
    出力手段
    を備え、
    上記省略補完手段は、上記解析された文構造と上記共起語辞書を参照して上記入力された数量表現が接頭語のみに省略された数量表現であるか否かを判別し、接頭語のみに省略された数量表現であれば、基本単位と属性情報を上記出力手段によって提示して、基本単位の内の1つを選択するように促し、選択された基本単位を用いて補完する
    ことを特徴とする数量表現検索装置。
  3. 請求項2記載の数量表現検索装置において、
    上記省略補完手段は、省略された数量表現を補完するための基本単位が選択されなかったときに、補完可能な全ての基本単位を用いて補完をする
    ことを特徴とする数量表現検索装置。
  4. 請求項1から3までのいずれかに記載の数量表現検索装置において、
    上記文書格納検索手段は、上記入力された数量表現、上記選択された基本単位で補完された数量表現、または上記補完可能な全ての基本単位で補完された数量表現と検索キーワードが一致する文書を上記文書データベースから検索し、上記検索結果として上記出力手段によって出力する
    ことを特徴とする数量表現検索装置。
JP2002345060A 2002-11-28 2002-11-28 数量表現検索装置 Expired - Fee Related JP4024137B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002345060A JP4024137B2 (ja) 2002-11-28 2002-11-28 数量表現検索装置
US10/722,554 US20040225646A1 (en) 2002-11-28 2003-11-28 Numerical expression retrieving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002345060A JP4024137B2 (ja) 2002-11-28 2002-11-28 数量表現検索装置

Publications (2)

Publication Number Publication Date
JP2004178351A JP2004178351A (ja) 2004-06-24
JP4024137B2 true JP4024137B2 (ja) 2007-12-19

Family

ID=32706334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002345060A Expired - Fee Related JP4024137B2 (ja) 2002-11-28 2002-11-28 数量表現検索装置

Country Status (2)

Country Link
US (1) US20040225646A1 (ja)
JP (1) JP4024137B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258964A (ja) * 2004-03-12 2005-09-22 Nec Corp データ処理システム、データ処理方法及びデータ処理プログラム
US7840033B2 (en) * 2004-04-02 2010-11-23 K-Nfb Reading Technology, Inc. Text stitching from multiple images
GB2470134A (en) * 2008-01-02 2010-11-10 True Engineering Technology Ll Statement-based computing system
JP5426868B2 (ja) * 2008-11-11 2014-02-26 株式会社日立製作所 数値表現処理装置
JP7103763B2 (ja) * 2017-07-20 2022-07-20 株式会社日立製作所 情報処理システムおよび情報処理方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US4864501A (en) * 1987-10-07 1989-09-05 Houghton Mifflin Company Word annotation system
NZ248751A (en) * 1994-03-23 1997-11-24 Ryan John Kevin Text analysis and coding
US5799276A (en) * 1995-11-07 1998-08-25 Accent Incorporated Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
DE69719858T2 (de) * 1996-05-13 2003-12-24 Oki Electric Industry Co., Ltd. Dokumentanzeigesystem und elektronisches Wörterbuch
AUPO525497A0 (en) * 1997-02-21 1997-03-20 Mills, Dudley John Network-based classified information systems
US6278996B1 (en) * 1997-03-31 2001-08-21 Brightware, Inc. System and method for message process and response
WO1999012108A1 (en) * 1997-09-04 1999-03-11 British Telecommunications Public Limited Company Methods and/or systems for selecting data sets
US6377965B1 (en) * 1997-11-07 2002-04-23 Microsoft Corporation Automatic word completion system for partially entered data
US5896321A (en) * 1997-11-14 1999-04-20 Microsoft Corporation Text completion system for a miniature computer
US5991713A (en) * 1997-11-26 1999-11-23 International Business Machines Corp. Efficient method for compressing, storing, searching and transmitting natural language text
US6230168B1 (en) * 1997-11-26 2001-05-08 International Business Machines Corp. Method for automatically constructing contexts in a hypertext collection
JP2001265375A (ja) * 2000-03-17 2001-09-28 Oki Electric Ind Co Ltd 規則音声合成装置
US20010049677A1 (en) * 2000-03-30 2001-12-06 Iqbal Talib Methods and systems for enabling efficient retrieval of documents from a document archive
US6643641B1 (en) * 2000-04-27 2003-11-04 Russell Snyder Web search engine with graphic snapshots
EP1380980A4 (en) * 2001-04-11 2006-12-20 Sony Corp INFORMATION PROCESSING SYSTEM
US20030046311A1 (en) * 2001-06-19 2003-03-06 Ryan Baidya Dynamic search engine and database
US6879987B2 (en) * 2001-10-31 2005-04-12 Inventec Corp. Method for storing records in database or reading the same therefrom
JP2004021791A (ja) * 2002-06-19 2004-01-22 Shuichi Araki 自然言語による既存データの記述方法及びそのためのプログラム
US20050108630A1 (en) * 2003-11-19 2005-05-19 Wasson Mark D. Extraction of facts from text

Also Published As

Publication number Publication date
JP2004178351A (ja) 2004-06-24
US20040225646A1 (en) 2004-11-11

Similar Documents

Publication Publication Date Title
JP3266586B2 (ja) データ分析システム
JPH0644296A (ja) 機械翻訳装置
JP2005165958A (ja) 情報検索システム、情報検索支援システム及びその方法並びにプログラム
US20050273316A1 (en) Apparatus and method for translating Japanese into Chinese and computer program product
JP3015223B2 (ja) 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置
JPH1049543A (ja) 文書検索装置
JP4024137B2 (ja) 数量表現検索装置
JPH0261763A (ja) 機械翻訳装置
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
WO2020079749A1 (ja) 事例検索方法
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4635585B2 (ja) 質問応答システム、質問応答方法及び質問応答プログラム
JP4007630B2 (ja) 対訳例文登録装置
JPH10207896A (ja) 検索用語拡張方法及び装置及び情報検索方法及び装置
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH0561902A (ja) 機械翻訳システム
JP4300056B2 (ja) 概念表現生成方法、プログラム、記憶媒体及び概念表現生成装置
JPH0320866A (ja) テキストベース検索方式
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH09245051A (ja) 自然言語事例検索装置及び自然言語事例検索方法
JP2006190226A (ja) 用言自動換言装置、用言換言方法及び用言換言処理プログラム
JPH05225232A (ja) テキスト自動前編集装置
JP2752025B2 (ja) 機械翻訳装置
KR101450795B1 (ko) 대용어 복원 장치 및 방법
JP2000250914A (ja) 機械翻訳方法、装置、および機械翻訳プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041025

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070807

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071002

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101012

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111012

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111012

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121012

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121012

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131012

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees