JPS63278174A - 翻訳装置 - Google Patents

翻訳装置

Info

Publication number
JPS63278174A
JPS63278174A JP62112393A JP11239387A JPS63278174A JP S63278174 A JPS63278174 A JP S63278174A JP 62112393 A JP62112393 A JP 62112393A JP 11239387 A JP11239387 A JP 11239387A JP S63278174 A JPS63278174 A JP S63278174A
Authority
JP
Japan
Prior art keywords
field
sentence
language
dictionary
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62112393A
Other languages
English (en)
Inventor
Hideo Ito
秀夫 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62112393A priority Critical patent/JPS63278174A/ja
Publication of JPS63278174A publication Critical patent/JPS63278174A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、翻訳装置に関し、特に入力される原文の分野
に応じた訳語を選択することのできる翻訳装置に関する
従来技術 機械翻訳においては、翻訳の対象となる原文の分野を決
定することが重要な問題である。
翻訳における訳語の選択は、対象とする分野によって異
なるため、翻訳対象の分野が、科学、経済、法律等のい
ずれの分野のものであるかをあらかじめ決定しなければ
適切な翻訳を行うことができない。
例えば英語のcellに対応する日本語の訳語は、一般
分野では部屋、生物分野では細胞、政治社会分野では組
織、物理分野では電池となり、分野により異なっている
。同様に英語のpowerに対応する日本語の訳語は、
一般分野では力、政治社会分野では権力、数学分野では
べき、物理分野では仕事率となる。
このように対象とする分野により選択すべき訳語が異な
るため、原文の解析を正しく行った場合でも、分野を決
定しなければ適切な翻訳を行うことができない。
従来、特開昭55−49771号に示されるように例え
ば日本語のかなの入力を漢字に変換するワードプロセッ
サにおいて、操作者により選択された漢字の回数をカウ
ントし、入力文の分野を決定するものがあった。しかし
、例えば英語の単語の入力に対し、操作者の選択なしに
分野を判定するものはなかった。
また、従来の翻訳装置においては、分野別の辞書を用い
、例えば操作者により指定された分野に応じてその分野
の辞書を用いて訳語を選択していた。したがって、辞書
の容量が増大し、メインテナンスも困難となる欠点があ
った。
目   的 本発明はこのような従来技術の欠点を解消し、入力文の
分野を自動的に決定し、その決定された分野に応じて訳
語を選択することのできる翻訳装置を提供することを目
的とする。
構  成 本発明は上記の目的を達成させるため、第1の言語の文
字列が入力される入力手段と、第1の言語の単語の分野
情報を格納する分野情報辞書手段と、入力手段から入力
された第1の言語の文字列を構成する単語について、分
野情報辞書手段を検索することにより、入力された第1
の言語の文字列の分野を決定する分野決定手段と、第1
の言語の文字列を構成する単語の分野に応じた訳語を格
納する言語生成用辞書手段と、分野決定手段により決定
された分野に応じて言語生成用辞書手段を検索すること
により、入力された第1の言語の文字列を構成する単語
の訳語を選択する訳語選択手段と、訳語選択手段により
選択された訳語に基づき、第2の言語の文字列を生成す
る文字列生成手段と、文字列生成手段により生成された
第2の言語の文字列を出力する出力手段とを有し、分野
決定手段は、第1の言語の文字列を構成する単語の分野
別の使用頻度に基づいて分野を決定することを特徴とし
たものである。以下、本発明の一実施例に基づいて具体
的に説明する。
第1図には本発明による翻訳装置を英日自動翻訳装置に
適用した実施例の全体構成が示されている。なお、本発
明は、英語を日本語に翻訳する英日自動翻訳装置のみな
らず、ある言語を他の言語に翻訳する装置にも効果的に
適用されることは、言うまでもない。
水装置は入力部10を有し、日本語に翻訳すべき英文テ
キストがこれにより入力される。入力部10は例えば、
英数字キー等の文字キーや機能キー等を有するキーボー
ド、紙に記録された英文テキストを読み取る光学的文字
読み取り装置(OCR)および(または)磁気ディスク
等の記憶媒体に記録された英文テキストを読み込むファ
イル記憶装置等を含んでよい。
入力部10から入力された英文は、入力制御部12を介
して文解析部14に入力される。文解析部14は入力さ
れた英文を文単位に分け、文ごとにその構成単語の文法
情報を、言語解析用辞書1Bを検索することによって言
語解析用辞書16から取り込み、文解析部14の有する
文法規則を適用することによって文の構造を解析する。
この解析が全文に対して行われる。
分野決定部18は入力された全文を構成する単語につい
て分野情報辞書20を検索し、分野情報を取り込む。こ
の構成単語の分野情報に基づいて入力文の分野を決定す
る。
分野情報辞書20は第2図に示されるように、各単語ご
とに分野別の使用頻度および言語生成用辞書2Bのアド
レスが登録されている。同図に示されるように、例えば
単語rcellJの場合には、使用頻度は一般分野が0
.3、物理分野が0.3、政治社会分野が0.2、数学
分野が0.1であり、言語生成用辞書26のアドレスは
、一般分野が001、物理分野が002、政治社会分野
が003、数学分野が004である。ここで使用頻度は
、その単語が使用された場合にその分野がXである確率
を表し、統計的に、またはヒユーリスティックに定めら
れている。また、一般分野の使用頻度は各分野の使用頻
度の相加平均として定められる。
訳語選択部22は分野決定部18により決定された分野
に応じて分野情報辞書20から各単語の決定された分野
の訳語のアドレスを読み出す。
文生成部24は各単語ごとに分野情報辞書20から読み
出した訳語アドレスをもとにして言語生成用辞書26を
検索し、訳語、品詞、活用等の生成情報を読み出す。
言語生成用辞書26は第3図に示されるように、各アド
レスに各分野の訳語およびその他の生成情報が格納され
ている。文生成部24は言語生成用辞書26から読み出
した情報を基にして、訳語の変形結合を行い、1つの文
として訳文を生成する。
文解析部14、言語解析用辞書16、分野決定部18、
分野情報辞書20、言語選択部22、文生成部24およ
び言語生成用辞書2Bは、マイクロプロセッサにより有
利に構成される。
文生成部24により生成された訳文は出力制御部28を
介して表示部30に表示される。表示部30は、本実施
例ではディスプレイであるが、ディスプレイに代えてプ
リンタまたは磁気ディスク等のファイル記憶装置を用い
てもよい。
第5図のフローチャートにより動作の全体の流れを説明
する。
入力部10から原文、この場合には英語の文を入力する
(102)。入力された英文は、入力制御部12を介し
て文解析部14に入力され、文解析部14において文単
位に分解され(104) 、文ごとにその構成単語の文
法情報を、言語解析用辞書IBを検索することによって
言語解析用辞書16から取り込み、文解析部14の有す
る文法規則を適用することによって文の構造を解析する
(10B)。
次に分野決定部18において、入力された全文を構成す
る単語について分野情報辞書20を検索し、分野情報を
取り込み、この分野情報に基づいて入力文の分野を決定
する(108)。
決定された分野に従い、訳語選択部22において分野情
報辞書20から各単語の決定された分野の訳語のアドレ
スが読み出され、このアドレスにより言語生成用辞書2
Bを検索し、各単語の訳語が決定される(110)。文
生成部24において訳文が生成され(112) 、生成
された訳文が表示部30に表示される(114)。
次にステップ108の分野決定について、第6図のフロ
ーチャートにより説明する。
まず、メニュ一方式の処理を行う(202)。これは、
表示部30に第7図に示すような分野指定のメニューを
表示し、操作者に対して分野指定の入力を促す。同図に
示す1〜3の数学、物理、政治社会は本装置のシステム
がサポートしている分野である。操作者は、例えば原文
の分野が物理である場合には番号2を入力する。また、
分野を指定したくない場合には番号4を入力する。
操作者がメニュ一方式の処理において分野指定をしたか
否かを判断しく204) 、分野指定をしている場合に
はその分野の情報をメモリに記憶し、分野決定を終了す
る。
操作者が分野指定をしていない場合には、次のステップ
20Bに移り、第5図のステップ106において文解析
部14で解析された原文に含まれる全単語の辞書エント
リ形を分野決定部18においてメモリにリストアツブす
る(2H)。この場合に、リスト中に重複した単語があ
れば1つだけ残して他を削除する。分野決定部18は単
語リストに現れる単語について分野情報辞書20を検索
し、各単語にその分野別使用頻度を付与する(208)
。また、単語リストの全単語数をカウントし、その値N
をメモリに保持する(208)。
第4図に示すような分野レジスタテーブルを分野決定部
18のメモリに設け、各分野に対応するレジスタの値を
初期値Oに設定する。単語リストから単語を1つ取り出
し、その単語の各分野の使用頻度と一般の使用頻度との
差を求め、その差が最大となる分野を求め、分野レジス
タテーブルの最大となる分野に対応するレジスタの値を
1だけ増加させる(210)。
前記単語の各分野の使用頻度と一般の使用頻度との差が
所定の閾値αを越える分野があった場合には、その分野
の分野レジスタテーブルの値に前記全単語数Nを加算す
る(212)。ここで閾値αはヒユーリスティックに定
められるが、次の範囲の値であることが必要条件である
α く 1−(サポートする分野の数)−1洛中語につ
いてステップ210および212を繰り返す。すなわち
、単語リストの最後か否かを判断しく2]4) 、最後
でなければステップ210に戻り、ステップ210およ
び212を繰り返す。
中語りストの最後の場合にはステップ216に進み、分
野レジスタテーブルのレジスタの値を調べ、前記Nを越
えるか否かを判断する(21B)。Nを越えている分野
がある場合には、分野レジスタテーブルのその分野のフ
ラグをオンにする。分野レジスタテーブルのフラグの初
期値はオフに設定されている。Nを越えている分野がな
い場合には、分野レジスタテーブルのフラグをオフのま
まとする。
各分野についてステップ216および218を繰り返す
。すなわち、分野レジスタテーブルのレジスタの値を調
べたものが最後の分野か否かを判断しく220) 、最
後でなければステップ216に戻り、ステップ218お
よび218を繰り返す。
最後の分野である場合、すなわち全分野について分野レ
ジスタがNを越えているか否かを判断し、フラグを処理
した後、ステップ222に進み、分野フラグでオンのも
のがあるか否かを判断する。分野フラグでオンのものが
ある場合には、これにより分野を決定する。フラグでオ
ンのものが1つの場合にはその分野を原文の分野として
決定し、2つ以上の場合には分野レジスタテーブルのレ
ジスタ値が大きい方を原文の分野として決定し、その結
果をメモリに保持しく224) 、分野決定を終了する
ステップ222において分野フラグでオンのものがない
場合には、分野レジスタテーブルのレジスタ値が所定の
閾値βを越えるか否かを判断しく226)、越える場合
にはその分野のフラグをオンにする(228)。このl
a(直βはヒユーリスティックに定められ、当然のこと
であるが、前記の閾値Nよりも小さい値である。各分野
のレジスタ値について1.記ステ、プ228および22
8を繰り返す。すなわち、分野レジスタテーブルのレジ
スタの値を調べたものが最後の分野か否かを判断しく2
30)、最後でなければステップ226に戻り、ステッ
プ226および228を繰り返す。
最後の分野である場合、すなわち全分野について分野レ
ジスタがβを越えているか否かを判断し、フラグを処理
した後、ステップ232に進み、分野フラグでオンのも
のがあるか否かを判断する。分野フラグでオンのものが
ある場合には、これにより分野を決定する。フラグでオ
ンのものが1つの場合にはその分野を原文の分野として
決定し、2つ以上の場合には分野レジスタテーブルのレ
ジスタ値が大きい方を原文の分野として決定し、その結
果をメモリに保持しく224) 、分野決定を終了する
分野フラグでオンのものがない場合には、原文の分野を
一般と決定し、その決定結果をメモリに保持する(23
4)。
以−にのようにして原文の分野が決定される。決定され
た分野は、第8図に示すように対訳表示とともに表示部
30に表示される。操作者はこの表示により原文の分野
を確認する。
本実施例によれば、原文の分野を決定し、その分野に応
じた訳語を選択するから、分野により異なった訳語を選
択すべき?1語について適すJな訳語を得ることができ
、原文の分野に応じた適切な翻訳を行うごとができる。
本装置に英語の原文を入力すれば、その原文の分野を分
野決定部18において自動的に判定し、訳文を得るから
、分野の異なる複数の原文をバッチ的に処理でき、その
都度分野に応じた適切な訳文を得ることができる。
また装置が判定した分野は表示部30に表示されるから
、操作者がこの表示を見て正垂を判断することができる
。操作者が装置と異なる分野の判断を行う場合には、前
述のメニュ一方式により操作者が指定したい分野を入力
することができる。
分野の決定においては、分野情報辞書20に各単語につ
いて分野ごとの使用頻度を格納しておき、原文を構成す
る単語が入力される都度、その単語の各分野の使用頻度
と一般分野の使用頻度との差をそれぞれ求め、この差が
最大となる分野について分野レジスタテーブルのレジス
タを1増加させる。したがって、各単語について使用さ
れる確率の最も高い分野のレジスタをそれぞれl増加さ
せ、すべての単語についてこれを行った後、レジスタの
値が所定の閾値Nを越えているか否かを判断し、越えて
いる分野を入力された原文の分野として決定する。した
がって、各単語ごとに判定された分野を全部の単語につ
いて総合して分野を決定するから、原文の分野として妥
当なものを指定することができる。分野の決定において
前記の閾値Nを種々の値に設定することにより、決定さ
れる分野の確からしさを変化させることができる。
閾値Nを越えているレジスタが複数の場合にはレジスタ
の値の最も大きい分野を指定するから、この場合にも妥
当な分野の決定を行うことができる。
また、分野情報辞書20の使用頻度の値が所定の閾値α
を越えている場合には、分野レジスタテーブルのレジス
タに前単語数Nを加えるから、使用頻度の著しく高いも
のについてはそれを重視して分野を決定することができ
る。
また、分野レジスタテーブルのレジスタに、前記閾値N
を越えているものがない場合には、より小さい閾値βを
設定して同様の判定を行い分野を決定することができる
。これによっても分野の判定ができなければ、分野を一
般と決定する。
以上のようにして分野の決定が行われるから原文を構成
する単語全体から判断して妥昌な分野を決定することが
できる。
さらに、言語生成用辞書2Bには各単語の各分野の訳語
を格納し、言語生成用辞書26のアドレスを分野情報辞
書20に格納するように構成したから、言語生成用辞書
26に各種の分野の訳語を格納し、統一的に扱うことが
でき、分野ごとに別の辞書を用意する場合に比較して辞
書の容量を小さくすることができる。また、言語生成用
辞書26を統一的に扱うことができるため、分野ごとに
別の辞書を持つものよりも辞書のメインテナンスが容易
である。
効  果 本発明によれば、入力される文字列の分野を自動的に決
定し、決定された分野に応じた訳語を選択して翻訳を行
う。
しかも、分野の決定は使用頻度に基づいて行われるから
、決定される分野は妥当なものが得られ、適切な翻訳を
行うことができる。
【図面の簡単な説明】
第1図は本発明を英日翻訳装置に適用した一実施例を示
す機能ブロック図、 第2図は第1図の分野情報辞書に格納されるデータの例
を示す図、 第3図は第1図の言語生成用辞書に格納されるデータの
例を示す図、 第4図は第1図の分野決定部の分野レジスタテーブルの
例を示す図、 第5図は第1図の装置の動作を示すフローチャート、 第6図は第1図の分野決定部の動作を示すフローチャー
ト、 第7図は第6図のメニュ一方式における表示装置の表示
の例を示す図、 第8図は第1図の分野決定部により分野が決定された場
合の表示装置の表示例を示す図である。 主要部分の符号の説明 IQ、、、入力部 14、、、文解析部 Ht、、、言語解析用辞書 18、、、分野決定部 20、、、分野情報辞書 22、、、訳語選択部 24.、、文生成部 2B、、、言語生成用辞書 30、、、表示装置

Claims (1)

  1. 【特許請求の範囲】 1、第1の言語の文字列が入力される入力手段と、 前記第1の言語の単語の分野情報を格納する分野情報辞
    書手段と、 前記入力手段から入力された前記第1の言語の文字列を
    構成する単語について、前記分野情報辞書手段を検索す
    ることにより、前記入力された第1の言語の文字列の分
    野を決定する分野決定手段と、 前記第1の言語の文字列を構成する単語の前記分野に応
    じた訳語を格納する言語生成用辞書手段と、 前記分野決定手段により決定された分野に応じて前記言
    語生成用辞書手段を検索することにより、前記入力され
    た第1の言語の文字列を構成する単語の訳語を選択する
    訳語選択手段と、 該訳語選択手段により選択された訳語に基づき、第2の
    言語の文字列を生成する文字列生成手段と、 該文字列生成手段により生成された第2の言語の文字列
    を出力する出力手段とを有し、 前記分野決定手段は、前記第1の言語の文字列を構成す
    る単語の分野別の使用頻度に基づいて前記分野を決定す
    ることを特徴とする翻訳装置。
JP62112393A 1987-05-11 1987-05-11 翻訳装置 Pending JPS63278174A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62112393A JPS63278174A (ja) 1987-05-11 1987-05-11 翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62112393A JPS63278174A (ja) 1987-05-11 1987-05-11 翻訳装置

Publications (1)

Publication Number Publication Date
JPS63278174A true JPS63278174A (ja) 1988-11-15

Family

ID=14585542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62112393A Pending JPS63278174A (ja) 1987-05-11 1987-05-11 翻訳装置

Country Status (1)

Country Link
JP (1) JPS63278174A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01233667A (ja) * 1988-03-15 1989-09-19 Nec Corp 機械翻訳装置
JPH07262188A (ja) * 1994-03-14 1995-10-13 Internatl Business Mach Corp <Ibm> 言語識別処理方法
WO2014115231A1 (ja) * 2013-01-22 2014-07-31 Necソリューションイノベータ株式会社 入力支援システム、入力支援方法および入力支援プログラム
USRE45530E1 (en) 1999-05-14 2015-05-26 Paterra, Inc. Multilingual electronic transfer dictionary containing topical codes and method of use

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59103171A (ja) * 1982-12-02 1984-06-14 Fujitsu Ltd 機械翻訳装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59103171A (ja) * 1982-12-02 1984-06-14 Fujitsu Ltd 機械翻訳装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01233667A (ja) * 1988-03-15 1989-09-19 Nec Corp 機械翻訳装置
JPH07262188A (ja) * 1994-03-14 1995-10-13 Internatl Business Mach Corp <Ibm> 言語識別処理方法
USRE45530E1 (en) 1999-05-14 2015-05-26 Paterra, Inc. Multilingual electronic transfer dictionary containing topical codes and method of use
WO2014115231A1 (ja) * 2013-01-22 2014-07-31 Necソリューションイノベータ株式会社 入力支援システム、入力支援方法および入力支援プログラム
JPWO2014115231A1 (ja) * 2013-01-22 2017-01-19 Necソリューションイノベータ株式会社 入力支援システム、入力支援方法および入力支援プログラム

Similar Documents

Publication Publication Date Title
KR100330801B1 (ko) 언어식별장치및언어식별방법
US7684975B2 (en) Morphological analyzer, natural language processor, morphological analysis method and program
JPS63278174A (ja) 翻訳装置
JPS63311471A (ja) かな漢字変換装置
JP2007257188A (ja) 辞書検索装置およびその制御プログラム
JP2715419B2 (ja) 翻訳装置
JPH01259448A (ja) 漢字入力方式
JP3585944B2 (ja) データ処理方法及びその装置
JPS6389976A (ja) 言語解析装置
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPS59221732A (ja) カナ漢字変換処理装置
JP4061283B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JP2900628B2 (ja) 辞書検索装置
JP2005275880A (ja) 字句をデータに変換する装置、方法及びプログラム
JPH0668160A (ja) 情報検索方式
JPS61211763A (ja) 自然言語処理装置
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPH0721212A (ja) 文書処理装置
JPH06259468A (ja) 単語スペル自動補正装置
JPH0229858A (ja) 機械翻訳処理方法
JPH086950A (ja) キーワード翻訳機能付き機械翻訳装置
JPH07105232A (ja) 文字列検索方法
JPH06282567A (ja) 翻訳支援装置
JPH0578057B2 (ja)
JP2005165520A (ja) キーワード抽出装置、キーワード抽出方法、プログラム