JPH09179875A - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPH09179875A
JPH09179875A JP7336692A JP33669295A JPH09179875A JP H09179875 A JPH09179875 A JP H09179875A JP 7336692 A JP7336692 A JP 7336692A JP 33669295 A JP33669295 A JP 33669295A JP H09179875 A JPH09179875 A JP H09179875A
Authority
JP
Japan
Prior art keywords
search
information
accuracy
anaphora
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7336692A
Other languages
English (en)
Inventor
Hiroshi Tanano
裕氏 棚野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP7336692A priority Critical patent/JPH09179875A/ja
Publication of JPH09179875A publication Critical patent/JPH09179875A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 日本語の文に多くみられる語の反復を避ける
ための代名詞などによるいいかえや、名詞の省略に対し
て、いいかえに関しては、同義語テーブルなどを用意す
ることによって、前述されている名詞の中から、該当す
ると考えられる名詞を抽出することが可能であったが、
省略に関しては対応ができず、検索装置においては、省
略されているために検索されない文がでてくるという問
題があった。 【解決手段】 文書データを構文解析処理部2で構文解
析する際に、照応解析処理部3において、欠落している
情報を照応し、検索処理部5によって検索することによ
って、欠落している情報を補完した状態で検索が可能と
なる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然言語で記述さ
れた文書データの内容を検索する情報処理装置に関す
る。
【0002】
【従来の技術】従来、文書データから必要な情報を抽出
する技術として、一番容易に実現できるのは、あるキー
ワードを含む文を抽出する方法である。例えば“コンピ
ュータ”と入力して、“コンピュータ”という単語を含
む文をすべて抽出する方法である。しかしながら、この
場合、コンピュータが主格であろうが目的格であろう
が、さらにどのような用言にかかっていようが抽出して
しまうので、非常に効率が悪いという問題がある。
【0003】文書を構成している各文を構文解析して、
文の骨格を抽出して文書の大意を得るということが有効
な手段として行われている。特開平4−21171号公
報には、文書データからあるひとつの事柄についての情
報を抽出するために、指定された名詞句を主格あるいは
目的格として含む文の述部を抽出することによって、そ
の目的を達成する技術が開示されている。
【0004】この技術では、同義の名詞句であるかどう
かを辞書によって検索するために、「太郎」と入力され
た場合に、辞書を検索し、同義であると考えられる
「彼」に関する文も検索する。例として「太郎は飼い犬
のチビと遊んでいた。」「太郎が走りだすと、チビが彼
の後を追いかけた。」「彼は明るい笑い声をあげた」と
文がある場合においても、最後の文のように「太郎」と
いう単語が文中にない場合でも、“太郎=彼”として検
索が可能となっている。
【0005】
【発明が解決しようとする課題】文書データの例として
日本語で書かれた文書を考えると、主格や目的格といっ
た格要素が言い替えもしくは省略が全くされずに書かれ
ている文は一般に少ない。
【0006】図2に示す例では、「その上に地図などの
イメージ情報を... 」の部分の「その」は、直前にある
「メモ画面の」を指していると考えるのが妥当であると
考えられる。つまり言い換えると「メモ画面の上に地図
などのイメージ情報を... 」と書けるはずである。
【0007】同様に、「市販のアプリケーションの画面
を取り込み、... 」の部分は「市販のアプリケーション
の画面を『メモ画面に』取り込み、... 」であり、この
後の「書き足す」「添付できます」についても「『メモ
画面に』書き足す」「『メモ画面に』添付できます」で
あろうと推察できる。このように、代名詞化による言い
替えや省略を行う表現で十分に意図が通じる場合、その
方が自然な表現であると考えられ、一般に多用される。
【0008】しかし、この例の文書から「メモ画面」に
関する説明を検索しようとしても、単なるキーワード検
索では、「メモ画面」という表記とマッチングしようと
するために、「メモ画面」が言い替えられている文や省
略されている文を抽出することはできない。また、単語
や句に意味情報を持たせることで、意味的に似通った単
語や句を検索対象に加える試みも存在するが、これは言
い替え、代名詞等にはある程度対応できても、省略に対
しては有効でない。上記の特開平4−21171号公報
の技術も同様である。
【0009】言い替えられている語や省略されている語
を機械的に推測することは容易でない。一般的には、直
前に提示されている語が言い替えもしくは省略されてい
ると考えるのが最も確率が高いが、絶対的ではない。
【0010】図3の例では、「今日は戻りません」とい
う文は『誰が?』『どこに?』という要素が省略されて
おり、『誰が?』については直前の文で「課長」のこと
を言っているので「戻らない」のは「課長」であるとほ
ぼ機械的に推測可能である。
【0011】しかしながら、『どこに?』については人
間であれば、「課長」という呼称を用いていることから
発話者は職場の人間であるという推測が成り立つもの
の、後者の推測については機械的に実現するためには多
種多様な知識を事前に準備する必要があり、極めて困難
であると言える。さらに、『誰が?』の問いについても
推測の域を出ない以上、省略の補充については100%
正しい解というのはあり得ない。
【0012】不確実な情報を総合的に組み合わせて判断
する機構を機械的に実現することができれば、確実な情
報だけで行われる処理に比較してより柔軟な対応が可能
になることが期待できる反面、その処理結果の信頼性が
低下する危険性を持ち合わせるという問題もある。
【0013】本発明は、このような課題を解決し、自然
言語により記述された文書データにおいて語の反復を避
けるために多用される省略や言い替えが行われている文
においてそれらを補完し、必要な情報を抽出でき、その
情報の確からしさを併せて示し、さらに一定の確からし
さを確保するための情報検索手段を持つ情報検索装置で
ある。
【0014】
【課題を解決するための手段】本発明の請求項1によれ
ば、文書データを入力する文書入力部と、検索条件を入
力する検索条件入力部と、前記入力された文書データを
構文解析する構文解析処理部と、前記構文解析処理部に
よって解析された文書データのうち、前記検索条件入力
部から入力された検索条件を満たすデータを検索する検
索処理部と、前記検索処理部で検索された検索結果を表
示する出力表示部を備えた情報検索装置において、前構
文解析処理部において、文書データを構文解析する際
に、省略や代名詞などによって欠落している情報を照応
する照応解析処理部を備え、欠落している情報を補完し
た後に、前記検索処理部によって検索を行うことによっ
て、上記課題を解決する。
【0015】本発明の請求項2によれば、前記照応解析
処理部で照応する照応関係に対して、その関係の確から
しさを評価する確度評価部を備え、照応関係の信頼性を
数値として提示するによって、上記課題を解決する。
【0016】また、本発明の請求項3によれば、一定の
確度以上の照応関係による照応のみを有効とする確度の
閾値を入力する確度条件入力部と、前記確度条件入力部
で入力された閾値以上の確度のみを照応処理する確度判
定部を備え、一定の確度以上の照応処理による情報検索
を行うことによって、上記課題を解決する。
【0017】
【発明の実施の形態】この発明の一実施例の文書内容検
索装置について、図面を用いて詳細に説明する。第1図
は、本発明による文書内容検索装置の構成の一例であ
る。1は文書入力部である。文書の入力はキーボードや
タッチパネル等による入力や、HD、FDやなどにあら
かじめ登録されていた文書から読み込む方法などがあ
る。
【0018】2は構文解析処理部である。実際は入力さ
れた文書に対し、形態素解析処理を施し単語ごとに切り
分ける処理が行われた後に、構文解析処理が行われる。
本発明ではこの形態素解析処理、構文解析処理の具体的
な方法についてはどのような方法、方式を用いてもよい
のでここでは詳述しない。構文解析については後で図面
を用いて詳述する。
【0019】3は照応解析処理部である。ここで照応処
理を行い体言の補完等を行う。詳細は図面を用いて後で
詳述する。4は検索条件入力部である。ユーザはここで
検索条件を入力する。キーワードによる検索や自然言語
文による入力などがあるが、特に方法に制限はない。5
は検索処理部である。ユーザから入力された条件にそっ
てデータ文書を検索する。6は出力表示部であり、検索
結果などを出力する手段である。
【0020】7は確度評価部である。確度を評価するに
あたって、確度評価の評価値を知識として記憶している
ので、それらを参照し、確度を算出する。これについて
も図面を用いて後に詳述する。8は確度条件入力部であ
り、ユーザは確度の閾値を入力する。9は確度判定部で
ある。ユーザから入力された閾値より高いかどうかをこ
こで判定する。
【0021】次に、図4のフローチャートを参照しなが
ら、本発明装置における一実施例の動作を具体的に説明
する。
【0022】まず文書入力部1において文書データを入
力し、構文解析処理部2へ送る(ステップS401)。
次に構文解析処理部2では、文単位への切り出しを行
い、切り出された文の構文構造を解析した結果を照応解
析処理部3へ送る(ステップS402)。
【0023】ここで図6を参照しながら、日本語文を解
析した場合を例とした一般的な構文解析処理の内容を説
明する。日本語の場合は係り受け関係の解析に先立っ
て、文を文節と呼ばれる係り受けの基本単位に分割する
処理を行う。これは、形態素解析処理と呼ばれる。形態
素解析の手法としては単語辞書を用いて最長最左一致方
や単語同士の共起情報、接続情報などによって分割され
る。ここでの分割は係り受けの基本単位となる文節ごと
に分割する。さらに各単語に対して文法情報や属性情報
が付与される。このような分割処理によって、図6の例
文「夜店で飴を買った」は、「夜店で」「飴を」「買っ
た」の3文節に分けられる。さらに例えば「夜店(名
詞:場所)」「で(格助詞)」「飴(名詞:具体物)」
「を(格助詞)」「買った(動詞:過去)」などの情報
が付与される。
【0024】この後、体言(名詞、代名詞等)がどの用
言(動詞、形容詞等)に係っているかということを基軸
に係り受け関係を解析する。これは、構文解析処理と呼
ばれる。通常、用言に対しては、図6(a)に示すよう
に、辞書データとしてどのような体言がどの格助詞を伴
ってその用言に係り得るかということを、その用言が持
つ語義毎に記述しておく。つまり複数の語義を持つ単語
はこのようなテーブルを複数持つことになる。このと
き、場所を表す『で』(例:「家で見た」)や時間を表
す『に』(例:5時に起きた)のように、一般にどのよ
うな用言にも係り得るような体言の条件はあえて記述し
ておかなくとも良い。
【0025】この辞書データと体言に辞書データとして
持っている属性値とを参照しながら「夜店で」「飴を」
等の体言が、用言の「買った」に係り得るかどうかを確
認し、図6(b)の結果を得る。ここで「夜店で」は上
記の「場所を表す『で』」に相当するので、用言「買
う」の辞書データに記述されていない係り受け関係であ
るが、これは前述した一般にどのような用言に係り得る
係り受けであるので、係り受けが許される。
【0026】続いて照応解析処理部3では、図7(a)
に示すように、用言の構文解析辞書データにおける格情
報に対応してそれぞれの各要素が照応解析可能かどうか
を示す情報を保持しておき、構文解析処理部2から送ら
れる結果を受けて、照応解析可能な格要素についてのみ
照応解析処理を行う(ステップS403)。
【0027】例えば、照応解析可能かどうかの情報は図
7(a)の例では可/不可の2値としているが、曖昧性
を含んで多値として後述の確度評価の評価値に反映させ
てもよい。例文では、図6(b)において格要素が省略
されていると解析されている『が』『から』『で』のう
ち省略照応が可能な『が』格と、「時間を表す『に』」
格について照応可能であることがわかるので、それぞれ
照応解析を行う。
【0028】図7(b)の例では、『が』格に照応可能
な語を該文書内でこの文より前に述べられている語の範
囲で考えると、「私」と「鈴木さん」が『が』格の条件
である“人間”の属性を持つので、候補として挙げら
れ、「時間を表す『に』」格については同様に“時間”
の属性を持つ「昨日」が挙げられる。このように本発明
においては、体言は常に属性と共に格納しており、照応
の候補としている。
【0029】照応解析結果として得られたら、次に確度
評価部7において照応の確からしさの評価を行う(ステ
ップS404)。一般に日本語の持つ性質として、遠い
文より直前の文に存在する語の方が照応しやすく、主格
の省略に対しては前の文でも主格であった語の方が照応
しやすい等の性質が経験的に知られている。このような
経験的知識を図8(a)の例のように定式化して確度評
価部7に保持しておき、適宜適用することで確度評価を
行う。
【0030】ここで確からしさを表す値は、照応解析結
果の相対的な妥当性を評価する目的で設定されるもの
で、必ずしも統計学的に根拠のある値である必要はな
い。
【0031】例えば、図8(a)の評価値データを図8
(b)の例に適用すると、図8(b)に示すように、こ
の例文の『が』格に照合される語としては、「私」が1
文前に出てきた語であり、主格であるので、確度として
“0.9”、「鈴木さん」が1文前に出てきた語であ
り、主格でないので、確度は“0.1”となり、「私」
で省略補充する方が確からしいという結論を得ることが
できる。
【0032】なお、省略照応する語は必ずしも文書内に
明示されているとは限らないが、対象となる文書の持つ
性質も考慮して照応解析することは可能である。例え
ば、手紙のように書き手と読み手が互いに明らかな場合
は、「私」や「あなた」は一切省かれることが多いが、
これは主格が明示されていない場合は「私」と考えるな
どの規則を盛り込めば対応することも可能である。
【0033】照応解析の確度評価を終えたら、検索処理
に移る(ステップS405)。検索処理の方法は、単純
なキーワード検索であってもいいし、検索キーを意味的
に展開して言葉の揺れに柔軟に対応する検索であっても
よい。つまり同義語テーブルを用いることによって、こ
れらのことは対応可能である。
【0034】例として、単なるキーワードによる検索
と、自然言語文で入力した検索条件から検索式を作成
し、検索する手法を後に示す。検索条件入力部4におい
て検索条件を入力して検索処理部5へ送り(ステップS
406)、検索処理部5において必要な情報検索を行い
(ステップS407)、出力表示部6に検索結果を出力
して(ステップS408)、処理を終える。
【0035】ここで、図5のフローを参照しながら、照
応解析の確からしさをもとに検索結果の絞り込みを行う
動作を説明する。
【0036】照応解析結果に付与されている照応の確度
によって検索結果の絞り込みを行う場合は閾値となる値
を入力する(ステップS501)。確度条件入力部8に
おいて情報を抽出するかどうかの閾値を入力し、確度判
定部9へ送る(ステップS502)。検索処理部5で
は、まず検索条件入力部4から送られてきた検索条件を
直接検索照合できるデータに変換する(ステップS50
3)。キーワード検索のように、その語を直接検索する
ような方式では、ここで何もする必要はない。
【0037】文書データを先頭から順に辿っていき、続
く文の有無を調べる(ステップS504)。文が存在す
れば、この文を検索対象として照応解析結果処理部3に
保持されている照応解析結果を検索処理部5に取り込む
(ステップS505)。この検索対象となっている文の
照応解析結果に対して検索条件が合致するかどうかを評
価し(ステップS506)、合致しなければ、ステップ
S504に戻って次の文を探索する。
【0038】合致する場合には、ステップS501の過
程で確度条件の入力を行ったかどうかを確認し(ステッ
プS507)、入力されている場合はステップS404
において照応解析結果に付与されている確度(閾値)
が、入力されている確度条件を満たしているかどうかを
判定し(ステップS508)、条件を満たさなければス
テップS504に戻って次の文を探索する。ステップS
507で確度条件の入力なしの場合と、ステップS50
8で確度条件を満たした場合は、検索対象となっている
文を抽出し、検索処理部5において一旦別途保存(ステ
ップS509)した後、ステップS504に戻って次の
文を探索する。
【0039】ステップS504で、文がなくなったら抽
出されて検索処理部5に保存している検索結果を、出現
順、確からしさ順等の適当な順番にソートして(ステッ
プS510)検索処理を終える。
【0040】例えば、図8(b)の例文を検索対象文書
として、昨日起きた事柄を抽出する目的で「昨日」とい
う語によるキーワード検索を実行すると、「夜店で飴を
買った」の文には「昨日」という語は明示されていない
が、「時間を表す『に』」格に省略補充されているた
め、この文も抽出することができる。
【0041】ここで操作者が明示されている情報以外の
抽出を望まない場合は、確度1を確度判定の閾値とする
ことで、照応解析で抽出された検索結果の出力を抑える
ことも可能である。つまりまったく照応処理を行わない
場合と同様の結果を出力することになる。
【0042】また、図9に示すように、「飴を買ったの
は誰?」という検索要求に対して、「『誰か』が飴を買
った」という文を検索するための検索キーを作成する。
用言である『買った』に係る格助詞において、入力され
ている『を』格に「飴(具体物)」を入れる。検索要求
は“誰?”と人物を聞いているので、『買った』の用言
のテーブル中で“人間”の属性を持つ『が』格を求める
こととして検索キーを作成する。
【0043】この検索キーを用いて、文を検索すると、
同様の構成を持つ文を抽出することができる。図9に示
すように、「夜店で飴を買った」という文を抽出し、こ
の照応解析結果から「『私』が飴を買った」という出力
をこの結果の確からしさとともに操作者に知らせること
ができる。さらにこのときに確度を付与させて表示させ
てもよい。
【0044】このように本発明の自然言語による質問文
入力、つまり応答形式の装置にも応用できる。さらに、
操作者自らが作成した文書データに対してこのような問
い合わせを行うことによって、誤解を生じる表現の存在
を確認することにも利用できる。
【0045】
【発明の効果】以上詳述したように、この発明によれ
ば、語の省略や言い替えが行われているために検索条件
との直接照合では抽出できない情報を、照応解析処理を
行った結果に対して検索処理を行うことにより抽出可能
となる。
【0046】また、照応解析処理のように経験的に得た
一般的性質を用いた処理においては、一定の割合で網羅
し切れない例外が発生するが、出力に不確実性を伴うも
のとそうでないものが混在することは操作者の混乱を招
く。出力データの信頼性の目安(本発明では“確度”)
を提示することにより、この問題は軽減される。
【0047】さらに、一定の確からしさを保つべく操作
者の指示する閾値により出力結果を絞り込む枠組を実現
することにより、出力データの信頼性に不安がある際に
も任意の確からしさを確保することができる。
【0048】このように、自然言語の持つ一般的な特徴
を利用して、文書データ中に明示されている情報のみな
らず、暗示されている情報についてもその確からしさと
併せて抽出できることにより、長大な文書データから必
要な情報を広く得ることに利用でき、また、操作者自ら
が作成した文書を客観的な視点から校正するのにも有用
であるという効果がある。
【図面の簡単な説明】
【図1】本発明における一実施例を示すブロック図であ
る。
【図2】格要素の省略や言い替えを含む例文を示す図で
ある。
【図3】省略補充における問題点を示す図である。
【図4】本発明における一実施例の動作を示すフローチ
ャートである。
【図5】本発明における検索処理の流れを示すフローチ
ャートである。
【図6】本発明の構文解析処理部で得られる結果及びデ
ータ構造を示す図である。
【図7】本発明の照応解析処理部で得られる結果及びデ
ータ構造を示す図である。
【図8】確度評価についての例および評価例を示す図で
ある。
【図9】自然言語による質問文入力での検索処理過程を
示す図である。
【符号の説明】
1 文書入力部 2 構文解析処理部 3 照応解析処理部 4 検索条件入力部 5 検索処理部 6 出力表示部 7 確度評価部 8 確度条件入力部 9 確度判定部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文書データを入力する文書入力部と、 検索条件を入力する検索条件入力部と、 前記入力された文書データを構文解析する構文解析処理
    部と、 前記構文解析処理部によって解析された文書データのう
    ち、前記検索条件入力部から入力された検索条件を満た
    すデータを検索する検索処理部と、 前記検索処理部で検索された検索結果を表示する出力表
    示部を備えた情報検索装置において、 前構文解析処理部において、文書データを構文解析する
    際に、省略や代名詞などによって欠落している情報を照
    応する照応解析処理部を備え、 欠落している情報を補完した後に、前記検索処理部によ
    って検索を行うことを特徴とする情報検索装置。
  2. 【請求項2】 前記照応解析処理部で照応する照応関係
    に対して、その関係の確からしさを評価する確度評価部
    を備え、 照応関係の信頼性を数値として提示することを特徴とす
    る前記請求項1記載の情報検索装置。
  3. 【請求項3】 一定の確度以上の照応関係による照応の
    みを有効とする確度の閾値を入力する確度条件入力部
    と、 前記確度条件入力部で入力された閾値以上の確度のみを
    照応処理する確度判定部を備え、 一定の確度以上の照応処理による情報検索を行うことを
    特徴とする前記請求項2記載の情報検索装置。
JP7336692A 1995-12-25 1995-12-25 情報検索装置 Pending JPH09179875A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7336692A JPH09179875A (ja) 1995-12-25 1995-12-25 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7336692A JPH09179875A (ja) 1995-12-25 1995-12-25 情報検索装置

Publications (1)

Publication Number Publication Date
JPH09179875A true JPH09179875A (ja) 1997-07-11

Family

ID=18301825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7336692A Pending JPH09179875A (ja) 1995-12-25 1995-12-25 情報検索装置

Country Status (1)

Country Link
JP (1) JPH09179875A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006338457A (ja) * 2005-06-03 2006-12-14 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2006344102A (ja) * 2005-06-10 2006-12-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2010205265A (ja) * 2009-03-05 2010-09-16 Nhn Corp オントロジを用いたコンテンツ検索システムおよび方法
WO2010150910A1 (ja) * 2009-06-26 2010-12-29 楽天株式会社 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体
JP2011081542A (ja) * 2009-10-06 2011-04-21 Ns Solutions Corp 情報処理装置、情報処理方法及びプログラム
JP2020184218A (ja) * 2019-05-08 2020-11-12 富士通株式会社 検索プログラム、検索方法及び検索装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04343173A (ja) * 1991-05-20 1992-11-30 Csk Corp 省略語補完装置及び日本語解析システム
JPH07175808A (ja) * 1993-12-17 1995-07-14 Sharp Corp 自然言語処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04343173A (ja) * 1991-05-20 1992-11-30 Csk Corp 省略語補完装置及び日本語解析システム
JPH07175808A (ja) * 1993-12-17 1995-07-14 Sharp Corp 自然言語処理装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006338457A (ja) * 2005-06-03 2006-12-14 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP4654776B2 (ja) * 2005-06-03 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2006344102A (ja) * 2005-06-10 2006-12-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP4654780B2 (ja) * 2005-06-10 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2010205265A (ja) * 2009-03-05 2010-09-16 Nhn Corp オントロジを用いたコンテンツ検索システムおよび方法
WO2010150910A1 (ja) * 2009-06-26 2010-12-29 楽天株式会社 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体
JP4768882B2 (ja) * 2009-06-26 2011-09-07 楽天株式会社 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体
US8296319B2 (en) 2009-06-26 2012-10-23 Rakuten, Inc. Information retrieving apparatus, information retrieving method, information retrieving program, and recording medium on which information retrieving program is recorded
JP2011081542A (ja) * 2009-10-06 2011-04-21 Ns Solutions Corp 情報処理装置、情報処理方法及びプログラム
JP2020184218A (ja) * 2019-05-08 2020-11-12 富士通株式会社 検索プログラム、検索方法及び検索装置

Similar Documents

Publication Publication Date Title
US6910004B2 (en) Method and computer system for part-of-speech tagging of incomplete sentences
Uma et al. Formation of SQL from natural language query using NLP
US20100332217A1 (en) Method for text improvement via linguistic abstractions
Miller et al. A novel use of statistical parsing to extract information from text
US20120303358A1 (en) Semantic textual analysis
WO2001096980A2 (en) Method and system for text analysis
US20080154853A1 (en) English-language translation of exact interpretations of keyword queries
JPH05314166A (ja) 電子化辞書および辞書検索装置
CN111382571A (zh) 一种信息抽取方法、***、服务器和存储介质
Levinger et al. Learning morpho-lexical probabilities from an untagged corpus with an application to Hebrew
Szolovits Adding a medical lexicon to an English parser
US20080040352A1 (en) Method for creating a disambiguation database
JPH09198395A (ja) 文書検索装置
JPH09179875A (ja) 情報検索装置
Foufi et al. Multilingual parsing and MWE detection
JP4054035B2 (ja) データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体
JP2002278982A (ja) 情報抽出方法および情報検索方法
Ahmed et al. Arabic/english word translation disambiguation approach based on naive bayesian classifier
Laki Investigating the Possibilities of Using SMT for Text Annotation
Fluhr et al. Parallel text alignment using crosslingual information retrieval techniques
Vasuki et al. English to Tamil machine translation system using parallel corpus
JP4177195B2 (ja) 認識文法作成システム
Akkerman et al. Grammatical tagging in ASCOT
JP2752025B2 (ja) 機械翻訳装置
Altunyurt et al. Part of Speech tagger for Turkish

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051018