JPH01137367A - 略語集作成方式 - Google Patents

略語集作成方式

Info

Publication number
JPH01137367A
JPH01137367A JP62296673A JP29667387A JPH01137367A JP H01137367 A JPH01137367 A JP H01137367A JP 62296673 A JP62296673 A JP 62296673A JP 29667387 A JP29667387 A JP 29667387A JP H01137367 A JPH01137367 A JP H01137367A
Authority
JP
Japan
Prior art keywords
abbreviation
pair
original word
file
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62296673A
Other languages
English (en)
Inventor
Koji Hashiguchi
幸治 橋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62296673A priority Critical patent/JPH01137367A/ja
Publication of JPH01137367A publication Critical patent/JPH01137367A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 文書中から略語と原語との対を検索して略語集データベ
ースを作成する略語集作成方式に関し、略語集データベ
ースを迅速に自動作成することを目的とし、 入力した文書の文字列中から、略語/原!!5のペアを
抽出するための略語/原語ペアーバクーンを指定するペ
アー検索指定部と、このペアー検索指定部によって指定
さ、れた略語/原語ペアーパターンに合致するものを、
入力した文書の文字列中から抽出するペアー抽出部とを
備え、このペアー抽出部によって抽出された略語/原語
ペアーを略語集データベースに格納するように構成する
Cmm上上利用分野〕 本発明は、文書中から略語と原語との対を検索して略語
集データベースを作成する略語集作成方式に関するもの
である。
〔従来の技術と発明が解決しようとする問題点〕マニュ
アルの英文の略語集を作成する場合、計算機上に略語フ
ァイル(略語集データベース)が存在すれば、効率良(
処理を行うことができる。
しかし、従来の略語集の作成方法は、Tl)全て人手で
行う、(2)一部を計算機処理で行うようにしていた。
いずれの場合も、文書の検索対象となるものは、略語だ
けである。このため、略語/原語(フルスペル)の対応
リストを作成するためには、予め人手によって別に作成
した対応ファイルを参照する必要があり、しかも対応フ
ァイル中に抽出された略語が存在しなければ、その都度
、人手によって対応する原語(フルスペル)を対応ファ
イルに人力する必要があり、処理が煩雑となり、迅速に
略語/原語の対を作成し難いという問題点があった。
また、上記対応ファイルを、複数文書間で共用すると、
対応ファイルの容量が次第に増大し、処理速度の低下を
招くと共に、略語−原語の一意の対応づけが望めなくな
るという問題点があった。
本発明は、略語集データベースを迅速に自動作成するこ
とを目的としている。
〔問題点を解決するための手段〕 第1図を参照して問題点を解決するための手段を説明す
る。
第1図において、ペアー検索指定部1は、入力された文
書の文字列中から、略語/原語のペアー抽出するための
略語/原語ペアーパターンを指定するものである。
ペアー抽出部2は、入力した文書の文字列中から略語/
原語ペアーバクーンに合致する略語/原語ペアーを抽出
するものである。
略語ファイル3は、抽出された略語/原語ペアーを格納
するものである。この格納された略語/原語ペアーは、
略語集データベースを形成する。
〔作用〕
本発明は、第1図に示すように、ペアー検索指定部1に
よって指定された略語/原語ペアーパターンに合致する
略語/原語ペアーを、ペアー抽出部2が入力された文書
の文字列中から抽出し、略語ファイル3に略語集データ
ベースとして格納するようにしている。
このため、入力された文書中から、指定された略語/原
語ペアーパターンに合致する略語/原語ペアーを抽出し
て略語集データベースを自動作成することが可能となる
〔実施例〕
次に、第1図ないし第5図を用いて本発明の1実施例の
構成および動作を順次詳細に説明する。
第1図において、ファイルエディタ4は、略語ファイル
3から読み出した略語/原語ペアーを編集(ソート、マ
ージ、デリートなど)シ0、その編集結果を略語ファイ
ル3(あるいは必要に応じて出力ファイル5)に格納す
るものである。これにより、例えばアルファベット順に
並んだ略語−原語の対からなる略語集などが作成される
第2図を用いて第1図構成の動作を詳細に説明する。
第2図において、図中■は、文書ファイルから文書例え
ばマニュアルを読み出し、ペアー抽出部2に入力する状
態を示す、これは、例えば第3図T’ATTHRN 1
に示す(例)  CPU:ccntraI proce
ssing unit″を含む文章を入力することを意
味している。
図中■は、ペアー検索ランク設定し、略語/原語ペアー
検索する状態を示す、これは、後述する第4図に示す何
れかのランクを設定し、図中■でこの設定したランクに
対応する第3図PATT1)IC11N1ないしnのい
ずれかの略語/原語ペアーパターンを取り出し、この取
り出した略語/原語ペアーパターンに合致する略語/原
語ペアーを、文書中から検索開始することを意味してい
る。これら略語/原語ペアーパターンは、通常、検索プ
ログラムに内蔵させておく、また、別ファイルを設けて
これに格納しておいてもよい。
図中0は、略語/原語ペアーを抽出する状態を示す、こ
れは図中■で取り出した略語/原語ペアーパターンに合
致する略語/原語ペアーを、文占中から抽出し、略語フ
ァイル3に転送して格納することを意味している。尚、
この図中■による略語/原語ペアーの抽出は、図中■で
設定したペアー検索ランクに対応する全ての略語/原語
ペアーパターンについて行い、合致した略語/原語ペア
ーの全てを略語ファイル3に格納する。
図中■は、略語ファイル3に格納する状態を示す、これ
により、略語集データベースが作成される。
図中■は、ファイルエディタであって、略語ファイル3
から読み出した略語/原語ペアーについて編集(ソート
、マージ、デリートなど)を行い、その結果を略語ファ
イル3 (必要に応じて出力ファイル5)に格納するも
のである。
図中■は、出力ユーティリティであって、略語ファイル
に格納されている[1後の略語/原語ペアー(略語集デ
ータベース)を各種出力媒体例えばフロッピィディスク
にダンプするものである。
図中■は、用語自動処理システムであって、略語集作成
、用語集作成などの各種作成処理を行うものである。
以上の手順によって、指定したペアー検索ランクに対応
する略語/原語ペアーパターンに合致する略語/原語ペ
アーを、入力された文書中から抽出して略語集データベ
ースを自動作成することが可能となる。
第3図は、略語/原語ペアーパターン例を示す。
これは、文書中から略語/原語ペアーを抽出するための
パターンであって、“FATTr(+?N1”ないしP
ATTP、RNn ’から構成されている。
図中“×1はいずれかの文字を表す0図中“:”、1じ
 (右括弧)、“)” (左括弧)、“、”(スペース
)は、これに対応する記号が文G中に存在する場合に適
用されるものである0図中(例)は、各パターンに対応
する具体例を示す0例えばPATTErlN1”は、”
 xxx : xx・・・××1から構成され、(例)
“CI’U:central processing 
unit”が合致する略語/原語ペアーとして第1図ペ
アー抽出部2によって抽出される。
以上のように略語/原語ペアーパターンを設定すること
により、文書中から当該略語/原語ペアーパターンに合
致する略語/原語ペアーを抽出することが可能となる。
第4図は、ペアー検索ランク例を示す、これは、指定さ
れた検索ランクに対応して第1図ペアー検索指定部1が
解読し、対応する第3図に示す略語/原語ペアーパター
ンをペアー抽出部2に通知するためのものである0図中
’rlANK  Sa ”は、単一パターンのみを検索
対象とするものである。
例えば′″RANKS!”は、FATTEI?N2を用
いて検索するように、第1図ペアー検索指定部1がペア
ー抽出部2に通知する。
図中“RANKM、”は、指定数値以上の複数パターン
を検索対象とするものである0例えば“T?ANKMf
fi”は、P A T T E RN 2〜nを用いて
検索するように、第1図ペアー検索指定部1がペアー抽
出部2に通知する。
図中”RIJK  L、”は、指定数値以下の複数パタ
ーンを検索対象とするものである0例えば′″RANK
LE”は、PATTERN 1〜3を用いて検索するよ
うに、第1図ペアー検索指定部1がペアー抽出部2に通
知する。
図中′″RANK  ALL″は、全登録パターンを検
索対象とするものである。これは、PATTuRN1〜
nを用いて検索するように、第1図ペアー検索指定部l
がペアー抽出部2に通知する。
以上のように、第4図ペアー検索ランクを設けることに
より、第3図FATTEI?N 1〜nのうちのいずれ
に合致する略語/原語ペアーを、文書中から抽出するか
否かを指定することが可能となる。
第5図は略語ファイル(略語集データベース)例を示す
、これは、第2図フローチャートに示す手順によって作
成された略語集データベース例である。第2行目の“M
−800動作説明書”は文古のタイトルである。
第3行目以下に抽出された略語/原語ペアーが示されて
いる。この略語/原語ペアーは、“:1を用いて略語と
原語(フルスペル)との間を区切るように表したもので
ある。抽出′前の文日中には、“ (1、′)”などで
区切られていてもよい、また、第5図は、第1図ファイ
ルエディタ4によってアルファベット順にソートした後
のものである。
〔発明の効果〕
以上説明したように、本発明によれば、入力された文書
中から、指定された略語/原語ペアーパターンに合致す
る略語/原語ペアーを抽出して略語集データベースを作
成する構成を採用しているため、略語集データベースを
自動作成することができる。この自動作成した略a?を
集データベースを編集してマニュアルの略語集、用語集
などを自動作成することができる。これにより 、マニ
ュアル、四節の索引の作成工数の削減、品質の向上、電
子ファイル化の促進などを図ることができる。
【図面の簡単な説明】
第1図は本発明の1実施例構成図、第2図は本発明の動
作説明フローヂャート、第3図は略語/原語ペアーパタ
ーン例、第4図はペアー検索ランク例、第5図は略語フ
ァイル例を示す。 図中、lはペアー検索指定部、2はペアー抽出部、3ば
略語ファイル、4はファイルエディタを表す。 佃瞥語集デ―り■−ス) 木籠明の1奥底例7a床図 尾  ]  図 本衝明の!7)伜tBPJフローナヤート方  2  
日 (注)XXX  英文字列 (El> :、 (、)ノ1itT後1−7:/り12
i1み%;I:!”す旺4ν酬/原話へ゛アーバターン
fダ1第3図 σアー検索うノクイ!IJ 扇4図

Claims (1)

  1. 【特許請求の範囲】 文書中から略語と原語との対を検索して略語集データベ
    ースを作成する略語集作成方式において、入力した文書
    の文字列中から、略語/原語のペアを抽出するための略
    語/原語ペアーパターンを指定するペアー検索指定部(
    1)と、 このペアー検索指定部(1)によって指定された略語/
    原語ペアーパターンに合致するものを、入力した文書の
    文字列中から抽出するペアー抽出部(2)とを備え、 このペアー抽出部(2)によって抽出された略語/原語
    ペアーを略語集データベースに格納するように構成した
    ことを特徴とする略語集作成方式。
JP62296673A 1987-11-25 1987-11-25 略語集作成方式 Pending JPH01137367A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62296673A JPH01137367A (ja) 1987-11-25 1987-11-25 略語集作成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62296673A JPH01137367A (ja) 1987-11-25 1987-11-25 略語集作成方式

Publications (1)

Publication Number Publication Date
JPH01137367A true JPH01137367A (ja) 1989-05-30

Family

ID=17836592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62296673A Pending JPH01137367A (ja) 1987-11-25 1987-11-25 略語集作成方式

Country Status (1)

Country Link
JP (1) JPH01137367A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9785631B2 (en) 2012-03-16 2017-10-10 Entit Software Llc Identification and extraction of acronym/definition pairs in documents

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9785631B2 (en) 2012-03-16 2017-10-10 Entit Software Llc Identification and extraction of acronym/definition pairs in documents

Similar Documents

Publication Publication Date Title
JPH0628403A (ja) 文書検索装置
JPH0315980A (ja) 文字列検索装置
JPH08147311A (ja) 構造化文書検索方法及び装置
JPH01137367A (ja) 略語集作成方式
JP3253657B2 (ja) 文書検索方法
JP3007375B2 (ja) 文書情報検索装置
JP2535629B2 (ja) 検索システムの入力文字列正規化方式
JP2002132789A (ja) 文書検索方法
JPH0750486B2 (ja) キ−ワ−ド抽出装置
JPS61248160A (ja) 文書情報登録方式
JP3666066B2 (ja) 多言語文書登録検索装置
JPS63136224A (ja) キ−ワ−ド自動抽出装置
JPH02113368A (ja) 情報検索方法
JPS63254522A (ja) キ−ワ−ド抽出装置
JPS63226765A (ja) 文書処理装置
JPH0816617A (ja) 文書検索方法及び装置
JPH07249034A (ja) 文字列抽出処理装置
JPH0589174A (ja) 辞書検索方法
JPH09128405A (ja) 文書検索方法及び文書検索装置
JPH09138809A (ja) 全文検索方法
JPH06215038A (ja) データベース検索装置
Aloufi Information Retrieval of Text with Diacritics
JPH08314958A (ja) 議会議事録検索システムにおけるデータ登録方法
JPH0612454A (ja) 文書検索方法及び装置
JPH01137366A (ja) 逆語辞書データベース作成方式