JPH08335222A - 類似文章及び文書検索機能付コンピュータ装置 - Google Patents

類似文章及び文書検索機能付コンピュータ装置

Info

Publication number
JPH08335222A
JPH08335222A JP7141470A JP14147095A JPH08335222A JP H08335222 A JPH08335222 A JP H08335222A JP 7141470 A JP7141470 A JP 7141470A JP 14147095 A JP14147095 A JP 14147095A JP H08335222 A JPH08335222 A JP H08335222A
Authority
JP
Japan
Prior art keywords
document
sentence
database
terms
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7141470A
Other languages
English (en)
Inventor
Tadashi Maruyama
忠 丸山
Akio Fujinawa
昭男 藤縄
Fumihiro Saito
文弘 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP7141470A priority Critical patent/JPH08335222A/ja
Publication of JPH08335222A publication Critical patent/JPH08335222A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】入力した元の文章に類似した簡潔でより良く情
報を伝達できる文章(事例文章)をコンピュータにより
検索出力させる。 【構成】予め文章データベースDB1に多くの事例文章
を蓄積しておく。そしてコンピュータに元の文章を入力
すると(1)、コンピュータは用語辞書ファイルF1を
参照して入力文章内の用語を検索し(2)、入力文章内
の用語と同じ用語を持つ文章を文章データベースDB1
から検索する(3)。そして入力文章の用語と同じ用語
を持つ割合(類似度)の高い文章を選別して出力する
(4〜6)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は事例となる文章あるいは
文書をコンピュータに登録格納してなるデータベースを
備え、問い合わされた入力となる文章あるいは文書に対
し、類似と判断される事例の文章あるいは文書をこのデ
ータベースから検索する機能を備えたコンピュータ装置
に関する。
【0002】なお、以下各図において同一の符号は同一
もしくは相当部分を示す。
【0003】
【従来の技術】従来、コンピュータに登録されている文
章や文書から問合せの文章や文書に該当もしくは類似す
るものを検索する方法としては、予め登録されている
文章,文書のキーワードを登録して置き、問合せの文
章,文書と同じキーワードがある文章,文書を検索して
類似か否かを判定する方法、あるいは事前に事例を何
等かの基準で分類し、この分類に基づいて検索する方法
などが知られている。
【0004】
【発明が解決しようとする課題】しかしながら前述の
のような方法では、キーワードを持つ文章や文書全てが
検索され、提示されることになり、事例が多数ある場合
には、検索され提示される文章や文書があまりに多くな
り、その中から実際に必要とする文章や文書を見つけに
くいという問題がある。
【0005】また、前述のの分類による検索方法で
は、分類基準を検索する側が知らないと検索したい文章
や文書をみつけにくいという問題がある。さらに、シス
テム提案書や製品取扱説明書などを作成する場合、文章
作成時に過去に作成した文章の類似度合いを検出し、文
章自体を流用できれば、作成工数の削減が期待できる。
しかし従来の方法では、文章自体を検索し、流用すると
いう観点からの検索はなかった。
【0006】そこで本発明はこのような問題を解消でき
る類似文章及び文書検索機能付コンピュータ装置を提供
することを課題とする。
【0007】
【課題を解決するための手段】前記の課題を解決するた
めに、請求項1の類似文章検索機能付コンピュータ装置
は、各種の用語が登録された用語辞書ファイル(F1)
と、事例となる多数の文章が登録された文章データベー
ス(DB1)とを備えたコンピュータ装置であって、さ
らに入力された文章中に存在し、かつ前記用語辞書ファ
イルに登録された全ての用語を検索する手段と、(式
(1)などの演算を介し)この検索された用語と同じ用
語を所定値以上の割合で持つ文章を前記文章データベー
スから検索して出力する手段とを備えたものとする。
【0008】また、請求項2の類似文章及び文書検索機
能付コンピュータ装置は、各種の用語が登録された用語
辞書ファイル(F1)と、事例となる多数の文書が登録
された文書データベース(DB2)と、前記文書データ
ベース内の文書から取出された事例となる多数の文章
が、その文書データベース内での存在位置を示す属性デ
ータ(文書名,段落など)と共に登録された文章データ
ベース(DB1)とを備えたコンピュータ装置であっ
て、さらに入力された文章中に存在し、かつ前記用語辞
書ファイルに登録された全ての用語を検索する手段と、
(式(1)などの演算を介し)この検索された用語と同
じ用語を所定値以上の割合で持つ文章を前記文章データ
ベースから検索して少なくとも属性データを出力する手
段とを備えたものとする。
【0009】また、請求項3の類似文章及び文書検索機
能付コンピュータ装置は、請求項2に記載の類似文章及
び文書検索機能付コンピュータ装置において、前記文書
データベースから前記文章データベースを作成する手段
を備えたものとする。また、請求項4の類似文書検索機
能付コンピュータ装置は、各種の用語が登録された用語
辞書ファイル(F1)と、事例となる多数の文書が登録
された文書データベース(DB2)と、前記文書データ
ベース中の事例文書毎の、その事例文書内に存在し、か
つ前記用語辞書ファイルに登録された全ての用語がその
出現頻度と共に登録された用語頻度データベース(DB
3)とを備えたコンピュータ装置であって、入力された
文書中に存在し、かつ前記用語辞書ファイルに登録され
た全ての用語とその出現頻度とを求める手段と、この求
められた入力文書の用語及びその出現頻度と前記用語頻
度データベース中の事例文書毎の用語のうち、入力文書
中の用語に一致する用語及びその出現頻度とから所定の
演算(式(2)など)で入力文書と各事例文書との類似
度を求め、少なくとも所定値以上の類似度を持つ事例文
書を特定するデータ(文書名など)を出力する手段とを
備えたものとする。
【0010】また、請求項5の類似文書検索機能付コン
ピュータ装置は、請求項4に記載の類似文書検索機能付
コンピュータ装置において、前記用語辞書ファイルと文
書データベースから、前記用語頻度データベースを作成
する手段を備えたものとする。
【0011】
【作用】請求項1に関わる発明(以下第1発明という)
について:事例となる多数の文章を登録した文章データ
ベースを設け、入力した文章中の辞書登録された用語と
同じ用語の出現頻度の計算により、入力した文章に類似
した文章を文章データベースより検索し選別して出力す
る。
【0012】請求項2,3に関わる発明(以下第2発明
という)について:事例となる多数の文書を登録した文
書データベースと、この文書データベースから取出した
事例となる多数の文章に夫々その取出元の文書名,段落
など(つまり文書データベース内での存在位置を示すデ
ータ)を属性として付加して登録した文章データベース
を設け、入力した文書中の辞書登録された用語と同じ用
語の出現頻度の計算により、少なくとも入力した文章に
類似した文章の属性を文章データベースより検索し選別
して出力する。
【0013】請求項4,5に関わる発明(以下第3発明
という)について:事例となる多数の文書を登録した文
書データベースと、この文書データベース中の各文書中
の辞書登録された用語及びその出現頻度をその文書名と
共に登録した用語頻度データベースを設け、入力した文
書中の辞書登録された用語及びその出現頻度と、用語頻
度データベース中の各文書別の用語のうち、入力文書中
の用語に一致する用語及びその出現頻度との比較計算に
より、入力文書に類似した文書の少なくとも文書名を検
索し選別して出力する。
【0014】
【実施例】図1は第1発明の類似文章検索機能付コンピ
ュータ装置の処理手順を示すフローチャートで、1〜6
はそのステップ番号を示す。なお、F1は類似文章や文
書を検索するために、文章や文書中に表れ得る所定の多
数の用語(キーワード)等を予め登録格納したデータベ
ースとしての用語辞書ファイルであり、DB1は事例と
なる、簡潔で情報をより良く伝達できそうな多数の文章
を予め登録格納した文章データベースである。
【0015】図1において、ステップ1でキーボードや
文字読み取り装置などから類似判断の問合せ元となる文
章を入力する。例えば、文1として「自動車販売業界の
ような機械加工ラインにおいては、変更の都度、加工に
かける時間やライン構成の変更がしばしば頻繁に行わ
れ、スケジューリング時におけるスケジューリングシス
テムの対応がうまくいかない。」というような文章を入
力する。すると本発明のコンピュータ装置は最終的にこ
の文章に類似した内容で、よりインパクトのある文章を
検索して出力する。
【0016】そのために、ステップ2の入力文章内用語
検索処理においては、文1を構文解析処理し、文1中の
用語辞書ファイルF1に登録されている用語に一致する
用語としての自動車,販売,業界,機械,機械加工,機
械加工ライン,加工,加工ライン,ライン,ライン構
成,変更,頻繁,スケジューリング,スケジューリング
システムの用語を導出する。さらにこの用語(キーワー
ド)の同義語を用語辞書ファイルF1から探す。例え
ば、ラインは工程と言い換えるような情報が用語辞書フ
ァイルF1に入っているとすると、入力文書としての文
1内の用語は、自動車,販売,業界,機械,機械加工,
機械加工ライン,加工,加工ライン,ライン,ライン構
成,変更,頻繁,スケジューリング,スケジューリング
システム,機械加工工程,加工工程,工程,工程構成と
なる。
【0017】次にステップ3ではこれら用語を文章内に
持つ文章が文章データベースDB1にあるかを検索す
る。例えばこのステップ3の文章検索処理によって、文
章データベースDB1内にある文章のうち、 文2:「電気器具業界での部品組立ラインにおいては、
生産ラインは自動化されても、製品のモデルチェンジ,
生産ラインの変更が頻繁に行われる。」や 文3:「製造製品変更の都度、加工時間,ライン構成,
その他多数の生産諸元が変化し、適切なスケジューリン
グができない。」 文4:「日本の自動車業界は、世界有数の生産数を誇
る。」などが検索されるものとする。
【0018】ステップ4の処理では、これら検索された
文から、文1に各文がどの程度類似しているかの類似度
を次の計算式(1)で算出する。
【0019】
【数1】 (類似度)=(類似文に存在した文1の用語に合致した用語数)/ (文1に存在した用語数) ・・・(1) これを計算すると、 文2:4/17=0.24 文3:5/17=0.29 文4:2/17=0.12である。
【0020】ステップ5の処理ではこれらの類似度の中
から、例えば、0.20以上の類似度の文章を類似性の
ある文章として選別する。その結果、文1のような冗長
度のある長い文章に比較して、文2,文3のような短文
でわかりやすい文章が検索されることになる。ステップ
6の処理ではこの選別結果の文章を出力する。
【0021】図2は第2発明の類似文章及び文書検索機
能付コンピュータ装置の処理手順を示すフローチャート
である。この図2は図1に対応し、ステップ6が6Aに
置換わった点と、文書データベースDB2が新設され、
ステップ7の処理が追加された点が異なる。ここで文書
データベースDB2は、文章データベースDB1中の各
文章の出典元となる事例の多数の文書が登録格納された
データベースである。そしてこの第2発明では予めステ
ップ7の処理により、文書データベースDB2の文書か
ら事例となる多数の文章を取出し、その各文章が夫々文
書データベースDB2中のどの文書のどの章,節等に存
在するかの、文書名,段落箇所等の存在位置を示す属性
をその各文章に付加して文章データベースDB1に登録
する。
【0022】図2において、ステップ1でキーボードや
文字読み取り装置などから類似判断の元となる文章を入
力する。例えば、文1として「自動車販売業界のような
機械加工ラインにおいては、変更の都度、加工にかける
時間やライン構成の変更がしばしば頻繁に行われ、スケ
ジューリング時におけるスケジューリングシステムの対
応がうまくいかない。」というような文章を入力する。
すると本発明のコンピュータ装置は最終的にこの文章の
内容に類似した文章がある文書名と段落を検索して出力
する。
【0023】そのためにステップ2の処理においては図
1のステップ2の処理と同様に、文1を構文解析処理
し、文1中の自動車,販売,業界,機械,機械加工,機
械加工ライン,加工,加工ライン,ライン,ライン構
成,変更,頻繁,スケジューリング,スケジューリング
システムを用語として導出する。さらにこのキーワード
の同義語を用語辞書ファイルF1から探す。例えば、ラ
インは工程と言い換えるような情報が用語辞書ファイル
F1に入っているとすると、入力文書、文1内の用語
は、自動車,販売,業界,機械,機械加工,機械加工ラ
イン,加工,加工ライン,ライン,ライン構成,変更,
頻繁,スケジューリング,スケジューリングシステム,
機械加工工程,加工工程,工程,工程構成となる。
【0024】ステップ3の処理では、これら用語を持つ
文章が文章データベースDB1にあるかを検索する。例
えばステップ3の検索処理によって文章データベースD
B1に登録されている文章とその属性のうち、 文2:「電気器具業界のような部品組立ラインにおいて
は、生産ラインは自動化されても、製品のモデルチェン
ジ,生産ラインの変更が頻繁に行われる。」属性情報:
文書名−B社向け生産管理システム提案書、段落−:ま
えがき、等 文3:「変更の都度、加工時間,ライン構成,その他多
数の生産諸元が変化し、適切なスケジューリングができ
ない。」属性情報:文書名−B社向け生産計画システム
提案書、段落−:生産計画の課題、等 文4:「日本の自動車業界は、世界有数の生産数を誇
る。」属性情報:文書名−D社向け製造管理システム仕
様書、段落−:まえがき、等 などが検索されるものとする。
【0025】ステップ4の処理では、これら検索された
文から、文1に各文がどの程度類似しているかの類似度
を第1発明と同じ計算式(1)で算出する。これを計算
すると 文2:4/17=0.24 文3:5/17=0.29 文4:2/17=0.12 であり、ステップ5の処理ではこれらの類似度の中か
ら、例えば、0.20以上の類似度の文章を類似性のあ
る文章として選別する。
【0026】そしてステップ6Aではさらにこれら類似
性を持つ文章の属性情報としての文2,文3が属する文
章名及び段落等を出力する。図3は第3発明の類似文書
検索機能付コンピュータ装置の処理手順を示すフローチ
ャートで、11〜16はそのステップ番号を示す。この
第3発明では予め図2と同様な文書データベースDB2
から、ステップ16の処理により、文書データベースD
B2内の各事例文書毎の、その文書内に存在する(用語
辞書ファイルF1に登録された)用語及びその頻度数を
求め、用語頻度データベースDB3に登録しておくよう
にする。
【0027】この図3では、ステップ11でキーボード
や文字読み取り装置などから類似判断の元となる文書を
入力する。ステップ12では入力した文書内に存在する
文章全てを構文解析処理し、入力文書内で使用されてい
る用語であって、用語辞書ファイルF1に登録されてい
る用語を全て洗い出す。この際、各用語が入力文書内に
出現した頻度数も計算しておく。
【0028】そしてステップ13においては、ステップ
12の処理による入力文書中の用語とその頻度数、及び
用語頻度データベースDB3内の事例文書毎(ここでは
m番目の事例文書を(事例文書)mと表現するものとす
る)の用語とその頻度数から、入力文書と(事例文書)
mとの類似度((類似度)mと表現する)を全ての事例
文書について次式(2)により計算する。
【0029】
【数2】 (類似度)m=i=K Σi=1 (w(i)−d(m,i))/w(i)・・(2) 但し w(i):入力文書中のi番目に初めて出現した用語a
(i)に対する頻度数 d(m,i):(事例文書)mの上記用語a(i)に対
する頻度数 K :入力文書に出現する用語の数 ステップ14の処理では、上記類似度を元にある一定数
値以上の類似度を持つ事例文書を入力文書に対して、類
似性のある文書として選別する。そしてステップ15の
処理ではこの選別された文書名を出力する。
【0030】
【発明の効果】第1発明によれば、入力文章中の用語に
合致する用語を持つ割合が所定値以上であるような類似
文章を文章データベースから選別して出力するようにす
ることで、文章自体を検索のための入力情報と考えて類
似文章を探索するようにしたので、入力文書が冗長度が
高く、かつ文が長ければ長い程、この入力文書よりもよ
り分かりやすい文章が探せる。
【0031】第2発明によれば、第1発明と同様に選別
された類似文章の属性データからその類似文章の出典元
となる文書データベース中の文書名,段落等を出力する
ようにしたので、文章自体を検索するための入力情報と
する点では、第1発明と同じであるが、類似探索して出
力する情報が第1発明が文章であるのに対し、第2発明
は文書まで類似探索結果として出力できる。
【0032】第3発明によれば、入力文書中の用語及び
頻度数と文書データベース中の各事例文書中の用語及び
頻度数とを比較し、類似度の高い事例文書名を出力する
ようにし、文書を入力情報として類似探索し、類似文書
が出力結果となるようにしたので、文書間の類似性の判
定等に利用できる。
【図面の簡単な説明】
【図1】第1発明の処理手順を示すフローチャート
【図2】第2発明の処理手順を示すフローチャート
【図3】第3発明の処理手順を示すフローチャート
【符号の説明】
F1 用語辞書ファイル DB1 文章データベース DB2 文書データベース DB3 用語頻度データベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 斉藤 文弘 東京都日野市富士町1番地 富士ファコム 制御株式会社内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】各種の用語が登録された用語辞書ファイル
    と、 事例となる多数の文章が登録された文章データベースと
    を備えたコンピュータ装置であって、さらに 入力された文章中に存在し、かつ前記用語辞書ファイル
    に登録された全ての用語を検索する手段と、 この検索された用語と同じ用語を所定値以上の割合で持
    つ文章を前記文章データベースから検索して出力する手
    段とを備えたことを特徴とする類似文章検索機能付コン
    ピュータ装置。
  2. 【請求項2】各種の用語が登録された用語辞書ファイル
    と、 事例となる多数の文書が登録された文書データベース
    と、 前記文書データベース内の文書から取出された事例とな
    る多数の文章が、その文書データベース内での存在位置
    を示す属性データと共に登録された文章データベースと
    を備えたコンピュータ装置であって、さらに入力された
    文章中に存在し、かつ前記用語辞書ファイルに登録され
    た全ての用語を検索する手段と、 この検索された用語と同じ用語を所定値以上の割合で持
    つ文章を前記文章データベースから検索して少なくとも
    属性データを出力する手段とを備えたことを特徴とする
    類似文章及び文書検索機能付コンピュータ装置。
  3. 【請求項3】請求項2に記載の類似文章及び文書検索機
    能付コンピュータ装置において、 前記文書データベースから前記文章データベースを作成
    する手段を備えたことを特徴とする類似文章及び文書検
    索機能付コンピュータ装置。
  4. 【請求項4】各種の用語が登録された用語辞書ファイル
    と、 事例となる多数の文書が登録された文書データベース
    と、 前記文書データベース中の事例文書毎の、その事例文書
    内に存在し、かつ前記用語辞書ファイルに登録された全
    ての用語がその出現頻度と共に登録された用語頻度デー
    タベースとを備えたコンピュータ装置であって、 入力された文書中に存在し、かつ前記用語辞書ファイル
    に登録された全ての用語とその出現頻度とを求める手段
    と、 この求められた入力文書の用語及びその出現頻度と前記
    用語頻度データベース中の事例文書毎の用語のうち、入
    力文書中の用語に一致する用語及びその出現頻度とから
    所定の演算で入力文書と各事例文書との類似度を求め、
    少なくとも所定値以上の類似度を持つ事例文書を特定す
    るデータを出力する手段とを備えたことを特徴とする類
    似文書検索機能付コンピュータ装置。
  5. 【請求項5】請求項4に記載の類似文書検索機能付コン
    ピュータ装置において、 前記用語辞書ファイルと文書データベースから、前記用
    語頻度データベースを作成する手段を備えたことを特徴
    とする類似文書検索機能付コンピュータ装置。
JP7141470A 1995-06-08 1995-06-08 類似文章及び文書検索機能付コンピュータ装置 Pending JPH08335222A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7141470A JPH08335222A (ja) 1995-06-08 1995-06-08 類似文章及び文書検索機能付コンピュータ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7141470A JPH08335222A (ja) 1995-06-08 1995-06-08 類似文章及び文書検索機能付コンピュータ装置

Publications (1)

Publication Number Publication Date
JPH08335222A true JPH08335222A (ja) 1996-12-17

Family

ID=15292641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7141470A Pending JPH08335222A (ja) 1995-06-08 1995-06-08 類似文章及び文書検索機能付コンピュータ装置

Country Status (1)

Country Link
JP (1) JPH08335222A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1173422A (ja) * 1997-08-28 1999-03-16 Hitachi Inf Syst Ltd 類似文書検索システムおよびそれに用いる記憶媒体
JPH11338883A (ja) * 1998-05-29 1999-12-10 Hitachi Ltd 特徴文字列抽出方法および装置とこれを用いた類似文書検索方法および装置並びに特徴文字列抽出プログラムを格納した記憶媒体および類似文書検索プログラムを格納した記憶媒体
JP2003177786A (ja) * 2001-12-11 2003-06-27 Matsushita Electric Ind Co Ltd 言語モデル作成装置及びそれを利用した音声認識装置
KR100685023B1 (ko) * 2001-11-13 2007-02-20 주식회사 포스코 유사성 판단을 위한 예제기반 검색 방법 및 검색 시스템
JP2013200800A (ja) * 2012-03-26 2013-10-03 Dainippon Printing Co Ltd 関連情報提示装置、関連情報提示システム、関連情報提示方法、およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1173422A (ja) * 1997-08-28 1999-03-16 Hitachi Inf Syst Ltd 類似文書検索システムおよびそれに用いる記憶媒体
JPH11338883A (ja) * 1998-05-29 1999-12-10 Hitachi Ltd 特徴文字列抽出方法および装置とこれを用いた類似文書検索方法および装置並びに特徴文字列抽出プログラムを格納した記憶媒体および類似文書検索プログラムを格納した記憶媒体
US6473754B1 (en) 1998-05-29 2002-10-29 Hitachi, Ltd. Method and system for extracting characteristic string, method and system for searching for relevant document using the same, storage medium for storing characteristic string extraction program, and storage medium for storing relevant document searching program
KR100685023B1 (ko) * 2001-11-13 2007-02-20 주식회사 포스코 유사성 판단을 위한 예제기반 검색 방법 및 검색 시스템
JP2003177786A (ja) * 2001-12-11 2003-06-27 Matsushita Electric Ind Co Ltd 言語モデル作成装置及びそれを利用した音声認識装置
JP2013200800A (ja) * 2012-03-26 2013-10-03 Dainippon Printing Co Ltd 関連情報提示装置、関連情報提示システム、関連情報提示方法、およびプログラム

Similar Documents

Publication Publication Date Title
US6243713B1 (en) Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types
US20240028651A1 (en) System and method for processing documents
US5469355A (en) Near-synonym generating method
JP4857333B2 (ja) 諸文書にわたる文脈要約情報の決定方法
US7493252B1 (en) Method and system to analyze data
US20120203778A1 (en) Inferring search category synonyms
US20100228711A1 (en) Enterprise Search Method and System
CN101681348A (zh) 用于文档分析的基于语义的方法和装置
JP2009026195A (ja) 商品分類装置、商品分類方法及びプログラム
JPH11110413A (ja) データベース検索結果を生成するための方法および装置
JPH11102377A (ja) データベースからドキュメントを検索する方法および装置
JPH0484271A (ja) 文書内情報検索装置
JP3612769B2 (ja) 情報検索装置および情報検索方法
US20180314766A1 (en) Data Processing System, Data Processing Method, and Data Structure
US20060184523A1 (en) Search methods and associated systems
US11361565B2 (en) Natural language processing (NLP) pipeline for automated attribute extraction
JPH08335222A (ja) 類似文章及び文書検索機能付コンピュータ装置
JPH1145274A (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007172260A (ja) 文書ルール作成支援装置および文書ルール作成支援方法並びに文書ルール作成支援プログラム
CN112488593B (zh) 一种用于招标的辅助评标***及方法
US20220083736A1 (en) Information processing apparatus and non-transitory computer readable medium
JPH10162008A (ja) 情報検索方法及び装置
US20090259995A1 (en) Apparatus and Method for Standardizing Textual Elements of an Unstructured Text
JPH0581326A (ja) データベース検索装置
JP2002183175A (ja) テキストマイニング方法