JPH0644296A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH0644296A JPH0644296A JP5106405A JP10640593A JPH0644296A JP H0644296 A JPH0644296 A JP H0644296A JP 5106405 A JP5106405 A JP 5106405A JP 10640593 A JP10640593 A JP 10640593A JP H0644296 A JPH0644296 A JP H0644296A
- Authority
- JP
- Japan
- Prior art keywords
- word
- text
- tag
- symbol
- buffer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
率よくする。 【構成】 機械翻訳装置は、テキスト原文をマークアッ
プ記号とマークアップ記号を含まないテキスト本体とに
分離するための分離部10と、各マークアップ記号を、
それが付されていた単語と関連づけて記憶する記憶部1
7と、テキスト本体に対応するソース言語の構造解析木
を作成する部分11、12と、得られた構造解析木をタ
ーゲット言語の構造解析木に変換するための変換部13
と、ターゲット言語の構造解析木と記憶部17の記憶内
容とに基づき、テキスト原文においてマークアップ記号
が付されていた単語に対応する訳語に、訳語に付されて
いたマークアップ記号と等価なマークアップ記号を付し
てターゲット言語のテキストを生成する翻訳文生成部1
4とを含む。
Description
特に、組版のためのマークアップ記号等を含む文書を他
の言語に翻訳することが可能な機械翻訳装置に関する。
ものが実用化されている。従来の機械翻訳装置は、たと
えばキーボードなどから入力されたソース言語の文書
を、CPU(中央演算処理装置)の制御により翻訳モジ
ュールに入力する。翻訳モジュールは、入力されたソー
ス言語のテキストを、メモリに記憶されている基本辞書
や、ユーザの登録によって準備されるユーザ辞書からな
る辞書群と、文法規則とを用いて解析し、構造解析木を
生成する。同様に、メモリに予め記憶されている、ソー
ス言語からターゲット言語への木構造変換規則を利用し
て、ソース言語のテキストの構造解析木をターゲット言
語の構造解析木に変換した上、各単語に適切な訳語を割
当て、さらに必要な部分を補ってターゲット言語のテキ
ストを生成する。
いて印刷の版下までも作成するようなシステムが普及し
てきている。そのため、文書の原稿中に、組版のための
指定など、印刷のための付随情報が含まれている場合が
ある。そのような情報は、たとえばタイトルとそれ以外
の部分との指定、使用する書体、フォントのサイズなど
の指定、索引として採用すべき語の指定情報などを含
む。
て、処理の対象となる文書の本文中にテキスト本体を混
在している。文書中にこのようなマークアップ記号を含
ませておくことにより、そのマークアップ情報に従った
体裁、書体、フォントのサイズなどを用いて自動的にそ
の文書を印刷することができる。また、索引用語の指定
を行なった場合には、そのようなマークアップ記号が付
された単語または単語群を検索していくことにより容易
に索引を作成することができる。
マークアップ言語があり、ISO(国際標準化機構)で
制定されたSGML(Standard Generalized Markup La
nguage)がその一例である。SGMLは、文書の論理的
な構造、たとえば章立て、段落、箇条書きなどといった
論理的な構成の指定を行なうためのものである。実際に
SGMLによって作成された文書を印刷する際には、よ
り具体的にフォーマットを決定するためのマークアップ
言語を用いることが多い。そのようなマークアップ言語
の一例がTeXと呼ばれるものである。
の指定がされた文書の数が増大した結果、これらの文書
を他の言語に翻訳する技術に対する需要が増大してい
る。
マークアップ記号を含む文書を従来の機械翻訳装置で翻
訳しようとすれば、ソース言語とは異質のマークアップ
記号が文書に含まれているために、翻訳が適正に行なわ
れず、翻訳不能となったり、あるいは誤訳などが発生し
たりしてしまう。そのため従来は、機械翻訳装置にテキ
ストを入力する前に、エディタ等によりその入力テキス
トにマークアップ記号が含まれているか否かを手操作で
調べ、含まれている場合には1つ1つ削除し、その後に
機械翻訳装置に入力する必要があった。このため、従来
の機械翻訳装置でマークアップ記号を含む文書を翻訳す
る場合の効率は非常に悪かった。
含まれる形式情報などの非言語データを意識せずに行な
うための文書処理システムが、特開平4−259057
号公報に開示されている。この公報に開示されたシステ
ムでは、非言語データと言語データとが混在する文書デ
ータから言語データのみが抽出され、この抽出された言
語データに対して所定の編集処理が行なわれる。さら
に、この編集処理により編集された言語データと、元々
入力された文書データ中の言語データとが比較対照さ
れ、それぞれの対応箇所が決定される。そして、入力文
書データの言語データを、編集後の言語データの対応す
るものにより置換える。このようにすることにより、非
言語データの存在を意識せずに、言語データと形式情報
とが混在する文書データの編集を行なうことができる、
とされている。
入力文書データとの対応箇所を決定するためには、様々
なルールが必要である。それらルールも、真に有効なル
ールかどうかは直ちには定められず、試行錯誤的にこう
した対応ルールを決定していく必要がある。しかも、す
べての場合について有効な対応付けルールが存在すると
は限らない。また、こうしたルールを誤って採用するこ
とにより、かえって最終的に得られる文書の質が低下す
ることも考えられる。
入力テキストにマークアップ記号が含まれる場合でも、
確実に従来より効率よく翻訳を行なうことができる機械
翻訳装置を提供することである。
置は、1または複数個の予め定めるマークアップ記号を
含む第1の言語のテキスト原文を、第2の言語のテキス
トに翻訳するための機械翻訳装置である。この機械翻訳
装置は、テキスト原文をマークアップ記号とマークアッ
プ記号を含まないテキスト本体とに分離するための分離
手段と、各マークアップ記号を、各マークアップ記号が
付されていた単語と関連づけて記憶するための記憶手段
と、分離手段によりマークアップ記号と分離されたテキ
スト本体に所定の文法処理を行なって、テキスト本体に
対応する第1の言語の構造解析木を作成するための手段
と、第1の言語の構造解析木を、予め準備された変換規
則を用いて第2の言語の構造解析木に変換するための手
段と、第2の構造解析木と記憶手段の記憶内容とに基づ
いて、テキスト原文においてマークアップ記号が付され
ていた単語に対応する訳語に、該訳語に付されていたマ
ークアップ記号と等価なマークアップ記号を付した第2
の言語のテキストを生成するための手段とを含む。
キスト原文をマークアップ記号とマークアップ記号を含
まないテキスト本体とに分離する。記憶手段は、各マー
クアップ記号を記憶する。各マークアップ記号は、それ
が付されていた単語と互いに関連づけられる。構造解析
木を作成するための手段がテキスト本体に所定の文法処
理を行なって、第1の言語の構造解析木を作成する。変
換手段がこの構造解析木を第2の言語の構造解析木に変
換する。そして、生成手段が、第2の構造解析木と記憶
手段の記憶内容とに基づいて、第2の言語のテキストを
生成する。生成されるテキストでは、テキスト原文にお
いてマークアップ記号が付されていた単語に対応する訳
語には、該訳語に付されていたマークアップ記号と等価
なマークアップ記号が生成手段により付される。
を参照しながら説明する。以下の実施例の機械翻訳装置
は英語から日本語への英日機械翻訳装置が例として示さ
れる。しかし本発明はこれには限定されず、他のいかな
る言語間の機械翻訳装置に対しても適用できる。また以
下の説明では、本発明をマークアップ記号としてTeX
というマークアップ言語に用いられるマークアップ記号
(「タグ記号」と呼ばれる)を例にとって説明するが、
本発明はこの言語には限定されず、一般的にマークアッ
プ記号を用いる言語に対して適用可能である。
いて簡単に説明する。第1図を参照して、機械翻訳にお
いて行なわれる解析処理には、様々な解析レベルがあ
る。機械翻訳は、図1の左上に示されるソース言語が入
力されると、各レベルの処理を順に行なって最終的に図
1の右側に示されるターゲット言語を得るための処理で
ある。たとえばソース言語のテキストが入力されると、
まずレベルL1の辞書引き処理、レベルL2の形態素解
析処理、レベルL3の構文解析処理、…と処理が進めら
れ、最終的にレベルL10の形態素生成処理が行なわれ
てターゲット言語のテキストが生成される。
なうかによって、大きく次の2つに分けられる。第1
は、レベルL6に示される中間言語まで解析し、そこか
らターゲット言語のテキストを生成していくピボット方
式である。第2は、上述のレベルL2〜レベルL5のい
ずれかまで解析を行なってソース言語の内部構造を得、
次に、得られたソース言語の内部構造と同じレベルのタ
ーゲット言語の内部構造に変換した後、ターゲット言語
のテキストを生成するトランスファ方式である。
とは、ソース言語およびターゲット言語のどちらにも依
存しない概念である。したがってソース言語の解析処理
を一度行なって中間言語を得れば、この中間言語から複
数の言語を生成することができるため、多言語間翻訳に
有利であるとされる。しかし、このようなピボット方式
では、その基本的概念である中間言語を本当に設定でき
るかどうかという点が未解決である。
うな問題に対する妥協案であって、現在の多くのシステ
ムはこのトランスファ方式を採っている。以下の説明は
トランスファ方式についてのものであり、後述する実施
例の機械翻訳装置もトランスファ方式を用いたものであ
る。
ついて説明する。 (1) 辞書引き、形態素解析 この処理においては、入力された文章に対して、形態素
が格納された辞書を参照しながらたとえば最長一致法な
どを用いて形態素列(単語列)に分割する処理がまず行
なわれる。そして、得られた各単語に対する品詞などの
文法情報および訳語を得、さらに時制・人称・数などを
解析する処理が行なわれる。
間のかかり受けなどの文章の構造(構造解析木)を組立
て、決定する処理が行なわれる。この処理においては、
得られた文章の構造が正しい意味を表わすかどうかにつ
いての判断は行なわれない。
味的に正しいものとそうでないものとを判別し、正しい
もののみを採用する処理が行なわれる。
力文章中に含まれる省略部分や曖昧さなどを取去る処理
が行なわれる。
訳装置の翻訳モジュールにおいては、レベルL3までの
解析処理を行なうものとする。すなわち、本実施例の機
械翻訳装置の翻訳モジュールは、図2に示されるような
構造を有する。この翻訳モジュールは、図2を参照し
て、ソース言語のテキスト原文を、タグ記号とテキスト
自体に分離するための分離部10と、タグ記号をそれが
付されていた単語と関連づけて記憶するための記憶部1
7とテキスト本体に対して辞書引き・形態素解析処理を
行なうための辞書引き・形態素解析部11と、形態素解
析された入力文章に対して構文解析を行なうための構文
解析部12と、構文解析の結果を変換してターゲット言
語の構造解析木を生成するための変換部13と、変換部
13によって生成されたターゲット言語の構造解析木に
基づき、かつ記憶部17の内容を参照して、タグ記号が
挿入されたターゲット言語の翻訳文を生成するための翻
訳文生成部14とを含む。各部10〜14で行なわれる
処理については、実施例において詳しく説明する。
置のブロック図である。図3を参照して、この機械翻訳
装置は、メインCPU(中央処理装置)1と、メインC
PU1が接続されたバス7と、バス7に接続されたメイ
ンメモリ2と、バス7に接続されたCRT(陰極線管)
やLCD(液晶表示装置)などからなる表示装置3と、
キーボード4と、バス7に接続された翻訳モジュール5
と、翻訳モジュール5に接続された翻訳用の辞書・文法
規則および木変換構造規則などの知識ベースを格納して
いるメモリ6とを含む。
トが入力されると、それを所定の手順で翻訳してターゲ
ット言語のテキストを出力するためのものである。図4
を参照して、翻訳モジュール5は、バス7に接続され、
バス7を介して入力されるソース言語(本実施例の場合
には英語)のテキストを、所定の翻訳プログラムに従っ
て翻訳してターゲット言語(本実施例の場合には日本
語)のテキストとしてバス7に出力するための翻訳CP
U15と、バス7に接続され、翻訳CPU15で実行さ
れる翻訳プログラムを格納するための翻訳プログラムメ
モリ16と、入力されたソース言語のテキスト原文を各
単語ごとに格納するためのバッファAと、バッファAに
格納された各単語につき、メモリ6に含まれる辞書を参
照して得た各単語の品詞、訳語などの情報を格納するた
めのバッファBと、ソース言語の構造解析木に関する情
報を格納するためのバッファCと、バッファCに格納さ
れたソース言語の構造解析木が変換されたターゲット言
語の構造解析木を格納するためのバッファDと、バッフ
ァDに格納された日本語の構造解析木に適切な助詞を助
動詞などを補充して、日本語の形として整えられた文章
を格納するためのバッファEと、後述するタグ除去処理
の際に用いられる、タグや、そのタグが付されている単
語数等を記憶するためのバッファFとを含む。これらバ
ッファが記憶部17(図2)に相当する。
機械翻訳装置による英日翻訳の動作を説明する。なお、
翻訳CPU15で実行される翻訳プログラムの詳細につ
いては後に具体例を用いて詳述する。
析によって形態素に分解され、分離部10(図2)によ
り、タグ記号とそれ以外のテキスト本体とに分離され
る。テキスト本体は図5に示されるようにバッファA
(図4参照)に格納される。タグ記号はバッファFに格
納される。
PU15の制御の下に、図2に示される辞書引き・形態
素解析部11が、バッファAに格納された原文の各単語
につき、メモリ6に格納されている辞書を参照すること
により各単語の訳語や品詞情報などの情報を得る。この
情報は図4に示されるバッファBに格納される。これら
の情報の一部として、各単語の品詞情報が含まれるが、
これら品詞情報は図6に示されるように格納される。す
なわち“this”は多品詞語であって代名詞、指示形
容詞の2つの品詞を持つ。また“is”の品詞は動詞で
ある。同様に“a”、“pen”についてもそれぞれの
品詞がバッファBに格納される。“this”は多品詞
語であるが、文中の品詞が何であるかについては、図2
に示される構文解析部12に相当する処理によって一意
に決定される。
解析部12に相当する処理においては、メモリ6に格納
された辞書および文法規則に従って、各単語間の修飾・
被修飾関係を示す構造解析木がたとえば図7に示される
ように決定される。この構文解析結果は図4のバッファ
Cに格納される。
れる。メモリ6に格納された文法規則のうち、英語に関
する文法規則は次のようなものから成り立っている。
述部からできている。」ということを表わす。他の規則
についても同様である。これらの規則に従って構造解析
木が決定されるのである。なお、このような文法規則は
同じように日本語についても用意されており、英語の文
法規則と日本語の文法規則との間で対応づけがなされて
いる。
換部13に相当する処理においては、入力された英文の
構造解析木(図7参照)の構造が、図8に示される日本
文に対する構文解析木の構造に変換される。この変換に
おいては、上述の構文解析部12が利用したのと同様
に、メモリ6に格納されている「木構造変換規則」が用
いられる。この変換は、図1でいえばレベルL3からタ
ーゲット言語のレベルL9への変換に相当する。得られ
た結果は図4に示されるバッファDに格納される。この
説明において用いられている例文“This is a
pen”は、この変換によって日本語文字列「これ
ペン である」に変換されたことになる。
14に相当する処理を行なう部分は、得られた日本語文
字列「これ ペン である」に適切な助詞「は」や助動
詞をつけることにより、図9に示されるような文法的な
日本語の形にし、図4に示されるバッファEに格納す
る。この処理は、図1に示されるレベルL9からレベル
L10への変換に相当する。得られた日本文「これはペ
ンである。」は、図4に示される翻訳モジュール5から
出力され、メインメモリ2に格納されるとともに、表示
装置3に表示される。
を含む原文を翻訳する際の処理の詳細を示す。この処理
は、翻訳に先立って、原文に含まれるタグ記号を除去
し、タグ記号を除去した原文を翻訳モジュールの入力と
することに特徴がある。除去したタグ記号は、原文の、
そのタグ記号が付加されていた単語と関連付けて記憶し
ておき、翻訳後の文の、原単語に対応する単語にさらに
この除去されたタグ記号を付加する。
記号の一例を示す。各タグ記号は、開始タグと終了タグ
との組からなり、開始タグと終了タグとによって挟まれ
る単語群をマークアップする。
\term>は、このタグ記号に挟まれた単語群が、特
定の用途に用いられる単語群、たとえば索引として採用
される単語群であることを示す。またタグ記号<emp
h><\emph>は、このタグ記号に挟まれる単語群
を、強調して印刷することを示す。たとえば、このタグ
記号に挟まれる単語群は、印刷時にはボールド体などで
印刷される。
語のテキスト原文の一例である。この原文は、図4およ
び図5に示すバッファAに格納される。図12に示され
る原文においては、タグ記号<term><\term
>に挟まれた単語または単語群としては、“Tag”と
“table chart”とがある。この2つの単語
または単語群は、たとえばこの文を含む文書についての
索引を作成する際の見出し語となる。かつこのタグ記号
によって挟まれて出現する部分が、索引における各単語
群の出現ページとして記録される。またタグ記号<em
ph><\emph>で挟まれた2つの単語“prod
uce”と“specifying”とは、ともに印刷
時には他の部分と異なる字体、たとえば前述のようなボ
ールド体で印刷される。
5の分離部10および辞書引き形態素解析部11(図
2)によって行なわれる、タグ記号処理の詳細なフロー
チャートである。図10を参照して、まずステップS0
1で、図12に示される入力文がバッファA(図4、5
参照)に格納される。
れた原文の処理対象となる単語位置を示す単語位置ポイ
ンタが0にセットされる。これにより単語位置ポインタ
によって指し示される原文単語は、“One”である。
うなタグ記号のテーブルを参照しながら、現在単語位置
ポインタがポイントしている単語の先頭が開始タグか否
かについての判断が行なわれる。開始タグでないと判断
されれば処理はステップS04に進み、開始タグと判断
された場合には処理はステップS09に進む。
された場合、ステップS04では、単語位置ポインタに
よってポイントしている単語が終了タグか否かについて
の判断が行なわれる。終了タグであれば処理はステップ
S08に進み,終了タグでない場合は処理はステップS
05に進む。
いる単語が開始タグでも終了タグでもない場合にはステ
ップS05で、現在単語位置ポインタによってポイント
されている単語をバッファB(図4参照)に格納する処
理が行なわれ、処理はステップS06に進む。終了タグ
であると判断された場合にはステップS08で、その終
了タグを削除したうえ単語位置ポインタによってポイン
トされている単語をバッファBに格納する処理が行なわ
れて処理はステップS06に進む。
によってポイントされている単語の先頭が開始タグであ
ると判断された場合には、ステップS09でその開始タ
グをバッファF(図4参照)に格納する処理が行なわれ
る。
検出された文中の単語位置(すなわち単語位置ポインタ
の値)を、ステップS09で格納された開始タグに関連
付けてバッファFに格納する処理が行なわれる。
うかについての判断が行なわれる。終了タグが存在する
場合には処理はステップS12に進み、存在しない場合
には処理はステップS14に進む。
テップS09で格納された開始タグに関連付けてバッフ
ァFに格納する処理が行なわれる。
単語位置ポインタによって指定された単語に付加されて
いる開始タグおよび終了タグを削除した上、バッファB
に格納する処理が行なわれ、処理はステップS06に進
む。
合、まず終了タグまでの単語数をカウントする処理が行
なわれる。カウントされた単語数はステップS09でバ
ッファFに格納された開始タグに関連付けて、同様にバ
ッファFに格納される。
タによって指し示される単語に付加されている開始タグ
を削除した上この単語をバッファBに格納する処理が行
なわれる。処理はステップS06に進む。
単語が存在しているか否かについての判断が行なわれ
る。存在する場合には処理はステップS07に進み、そ
れ以外の場合には処理はステップS16に進む。
インクリメントする処理が行なわれ、処理はステップS
03に戻る。以下、上述した処理が繰返し行なわれる。
そしてバッファA内に処理対象の単語が存在しなくなる
と処理がステップS16に進む。
れている各見出し語に対して辞書引き処理が行なわれ
る。この結果、各見出し語に対して品詞および単語数の
情報がバッファB内に格納される。
が行なわれたバッファBの結果に、さらにバッファFに
格納されているタグ記号についての情報を付加する処理
が行なわれる。このタグ記号の付加は、各見出し語のう
ち、原文内でタグ記号が付加されていた見出し語に、そ
の付加されていたタグ記号を示す情報を付加する処理で
ある。
0に示される処理を行なった場合の処理の経過について
説明する。まず、単語位置ポインタを0にセットするこ
とにより単語“One”が単語位置ポインタによってポ
イントされる。ステップS03、ステップS04の判断
の結果はいずれも“NO”となるため、ステップS05
でこの単語“One”がバッファBに格納される。ステ
ップS06では、次の単語が存在するために判断の答は
YESとなり処理はステップS07に進む。単語位置ポ
インタの値が1インクリメントされるため、単語位置ポ
インタによってポイントされる単語は次の単語“of”
となる。
上述と同様の処理が繰返され、バッファBにはこれらの
単語が順にその単語位置とともに格納される。
ップS03における判断の答かYESとなり、処理はス
テップS09に進む。ステップS09では、検出された
開始タグ(この場合<term>)をバッファFに格納
する処理が行なわれ、さらにステップS10で、その単
語位置も同様にバッファFに格納される。ステップS1
1の判断はYESとなるため、ステップS12の処理に
より単語数「1」がバッファFに格納される。この結
果、バッファFに格納される、単語“Tag”に関する
タグ記号情報は、図13の第1行目に示されるものとな
る。さらにステップS13では、開始タグおよび終了タ
グを削除した上、単語“Tag”をバッファBに格納す
る処理が行なわれる。
リメントしながら各単語につき開始タグ、終了タグの有
無を判断し、タグ記号を除去しながら各単語をバッファ
Bに格納していく。これにより、バッファBには図14
に示される情報が得られる。またバッファFには、図1
3に示されるようなタグ記号に関する情報が得られる。
8の単語、すなわち単語“Tag”には、タグ記号<t
erm>が付加されており、このタグ記号によって挟ま
れている単語はこの一語のみであることがわかる。同様
に単語“produce”にもタグ記号<emph>が
付加されている。また単語群“table char
t”は、この2語の前後をタグ記号<term><\t
erm>で挟まれている。さらに単語位置25の単語
“specifying”も、その前後をタグ記号<e
mph><\emph>で挟まれている。
辞書引き処理により、バッファBの格納内容は図15に
示されるようになる。すなわち各見出し語には、辞書引
き処理によって得られた品詞および単語数に関する情報
が付加される。ただし、図15においては各見出し語に
付加される品詞および単語数の具体的な内容については
図の簡単化のために省略している。
ッファFの内容を、バッファB内の各見出し語に付加す
る処理が行なわれる。この処理は、図13のバッファF
の単語位置によって示されるバッファB内の単語に、バ
ッファFに保存されているタグ記号を付加することによ
って行なわれる。すなわち、第8番目の単語“Tag”
にはタグ記号<term>が付加される。同様に単語位
置14の単語“produce”にはタグ記号<emp
h>が付加される。また単語位置15番目から始まる2
つの単語“table chart”にも各々タグ記号
<term>が付加される。この図13に示されるバッ
ファFの情報において、単語位置15から始まる2つの
単語にタグ記号<term>を付加することが示されて
いるからである。また単語位置25の単語“speci
fying”にも、タグ記号<emph>が付加され
る。
し語と、その品詞、単語数などに基づいて図3の構文解
析部12、変換部13によって通常どおりの翻訳処理が
行なわれる。そして最終的に生成部14によって訳文が
生成される。
る単語に対応する入力部の単語がタグの情報をもつ場合
には、その訳語の前後に、図16に示されるバッファB
の内容によって示される開始タグおよび終了タグを生成
する。対応する単語にタグの情報がない場合には通常ど
おり訳語だけが生成される。
を参照して以下に説明する。図17に示されるステップ
S21〜S27の処理は、構造解析木の「葉」の部分の
各単語について行なわれる。まずステップS21で、或
る単語につき、バッファB内のその単語に対応する「タ
グ情報」の欄(図16参照)を調べ、タグ情報が存在す
るか否かについての判断を行なう。存在する場合には制
御はステップS22に、そうでない場合には制御はステ
ップS26にそれぞれ進む。
れていた開始タグをまずバッファEに格納する処理が行
なわれる。
対応する訳語をバッファBからバッファEに格納する処
理が行なわれる。
ファBからバッファEに格納する処理が行なわれる。
の訳語に付加するべき適当な助詞が選ばれ、バッファE
に格納される。ステップS25の後、制御はステップS
27に進む。
情報が存在しないと判断された場合、制御はステップS
26に進む。ステップS26では、タグ情報に関する処
理は行なわれない。すなわちステップS22、S24に
対応する処理は行なわれず、単に訳語をバッファBから
バッファEに格納する処理が行なわれる。ステップS2
6の後、制御はステップS25に進む。
る構造解析木の最後の単語まで到達したかどうかについ
ての判断が行なわれる。到達していない場合には制御は
ステップS21に戻り、ステップS21以下の処理が繰
返し行なわれる。もし終了であればこの生成処理も終了
する。
容を図18に示す。この図18に示される翻訳文は、図
12に示される原文に対応するものである。なお、連続
する複数個の単語について同一のタグ情報が付されてい
る場合には、その先頭の単語に対応する訳語の前に開始
タグを、最後の単語の後に終了タグをそれぞれ付加す
る。図18はそのようにして得られたものである。
号などのマークアップ記号が挿入されていても、タグ記
号を一旦除去して自動的に翻訳することができる。さら
に本実施例のように訳文にも等価なタグ記号を付加する
ことにより、タグ記号が挿入されている原文をそのまま
翻訳処理することができる。その結果、翻訳に先立って
人間によりタグ記号を手作業で除去する処理が不要とな
り、効率よく翻訳を行なうことができる。
置では、テキスト本体は自動的にマークアップ記号と分
離され、その分離されたテキスト本体に基づいて従来と
同様に第1の言語の構造解析木が作成される。その第1
の言語の構造解析木は、従来と同様に第2の言語の構造
解析木に変換される。一方各マークアップ記号は、それ
が付されていた単語と関連づけて記憶される。第2の言
語の構造解析木から第2の言語のテキストが生成される
ときには、テキスト原文においてマークアップ記号が付
されていた単語に対応する訳語には、該単語に付されて
いたマークアップ記号と等価なマークアップ記号が付さ
れる。そのため、マークアップ記号が適切な位置に付さ
れることになる。マークアップ記号をテキスト原文から
手操作により削除したり、翻訳結果のテキストにマーク
アップ記号を手操作により挿入する必要がなく、かつ入
力テキストに対応したマークアップ記号を含む翻訳結果
を得ることができる。その結果、マークアップ記号を含
むテキスト原文を、通常のテキスト原文と同様に効率よ
く翻訳することができる機械翻訳装置を提供できる。
模式図である。
である。
ック図である。
る。
る。
る。
る。
る。
式図である。
示す模式図である。
す模式図である。
を示す模式図である。
チャートである。
式図である。
Claims (1)
- 【請求項1】 1または複数個の予め定めるマークアッ
プ記号を含む第1の言語のテキスト原文を、第2の言語
のテキストに翻訳するための機械翻訳装置であって、 テキスト原文をマークアップ記号とマークアップ記号を
含まないテキスト本体とに分離するための分離手段と、 各マークアップ記号を、各マークアップ記号が付されて
いた単語と関連づけて記憶するための記憶手段と、 前記分離手段によりマークアップ記号と分離された前記
テキスト本体に所定の文法処理を行なって、前記テキス
ト本体に対応する前記第1の言語の構造解析木を作成す
るための手段と、 前記第1の言語の構造解析木を、予め準備された変換規
則を用いて前記第2の言語の構造解析木に変換するため
の手段と、 前記第2の構造解析木と前記記憶手段の記憶内容とに基
づいて、前記テキスト原文においてマークアップ記号が
付されていた単語に対応する訳語に、前記訳語に付され
ていた前記マークアップ記号と等価なマークアップ記号
を付して前記第2の言語のテキストを生成するための手
段とを含む、機械翻訳装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10640593A JP3220560B2 (ja) | 1992-05-26 | 1993-05-07 | 機械翻訳装置 |
US08/067,143 US5587902A (en) | 1992-05-26 | 1993-05-26 | Translating system for processing text with markup signs |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4-133552 | 1992-05-26 | ||
JP13355292 | 1992-05-26 | ||
JP10640593A JP3220560B2 (ja) | 1992-05-26 | 1993-05-07 | 機械翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0644296A true JPH0644296A (ja) | 1994-02-18 |
JP3220560B2 JP3220560B2 (ja) | 2001-10-22 |
Family
ID=26446515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10640593A Expired - Lifetime JP3220560B2 (ja) | 1992-05-26 | 1993-05-07 | 機械翻訳装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5587902A (ja) |
JP (1) | JP3220560B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5548508A (en) * | 1994-01-20 | 1996-08-20 | Fujitsu Limited | Machine translation apparatus for translating document with tag |
JPH09305475A (ja) * | 1996-05-14 | 1997-11-28 | Oki Electric Ind Co Ltd | リンク付文書検索表示システム |
US6061701A (en) * | 1996-03-22 | 2000-05-09 | Sharp Kabushiki Kaisha | Hypertext document processing apparatus with display means displaying input data and additional display means displaying translated data |
US6501207B2 (en) | 1999-05-27 | 2002-12-31 | Mitsubishi Denki Kabushiki Kaisha | Rotor for a vehicular A. C. generator |
Families Citing this family (101)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08501166A (ja) * | 1992-09-04 | 1996-02-06 | キャタピラー インコーポレイテッド | 総合オーサリング及び翻訳システム |
GB2272091B (en) * | 1992-10-30 | 1996-10-23 | Canon Europa Nv | Apparatus for use in aligning bilingual corpora |
JP3595564B2 (ja) * | 1993-10-27 | 2004-12-02 | キヤノン株式会社 | 文書処理装置及びその方法 |
JP3380034B2 (ja) * | 1994-05-16 | 2003-02-24 | 松下電器産業株式会社 | 辞書編集装置 |
US5787449A (en) * | 1994-06-02 | 1998-07-28 | Infrastructures For Information Inc. | Method and system for manipulating the architecture and the content of a document separately from each other |
JPH0830620A (ja) * | 1994-07-19 | 1996-02-02 | Fuji Xerox Co Ltd | 構造検索装置 |
US5675817A (en) * | 1994-12-05 | 1997-10-07 | Motorola, Inc. | Language translating pager and method therefor |
US5987402A (en) * | 1995-01-31 | 1999-11-16 | Oki Electric Industry Co., Ltd. | System and method for efficiently retrieving and translating source documents in different languages, and other displaying the translated documents at a client device |
JP2896634B2 (ja) * | 1995-03-02 | 1999-05-31 | 富士ゼロックス株式会社 | 全文登録語検索装置および全文登録語検索方法 |
JP3689954B2 (ja) * | 1995-03-13 | 2005-08-31 | 富士ゼロックス株式会社 | 異種コード文字列転記装置および電子辞書 |
GB2300495A (en) * | 1995-04-13 | 1996-11-06 | Canon Kk | Language processing |
JPH0969101A (ja) * | 1995-08-31 | 1997-03-11 | Hitachi Ltd | 構造化文書生成方法および装置 |
US6073143A (en) * | 1995-10-20 | 2000-06-06 | Sanyo Electric Co., Ltd. | Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request |
US6993471B1 (en) * | 1995-11-13 | 2006-01-31 | America Online, Inc. | Integrated multilingual browser |
JPH09231224A (ja) * | 1996-02-26 | 1997-09-05 | Fuji Xerox Co Ltd | 言語情報処理装置 |
US5758361A (en) * | 1996-03-20 | 1998-05-26 | Sun Microsystems, Inc. | Document editor for linear and space efficient representation of hierarchical documents |
JPH09259127A (ja) * | 1996-03-21 | 1997-10-03 | Sharp Corp | 翻訳装置 |
US5745908A (en) * | 1996-03-29 | 1998-04-28 | Systems Focus International | Method for converting a word processing file containing markup language tags and conventional computer code |
US6470306B1 (en) | 1996-04-23 | 2002-10-22 | Logovista Corporation | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens |
US5848386A (en) | 1996-05-28 | 1998-12-08 | Ricoh Company, Ltd. | Method and system for translating documents using different translation resources for different portions of the documents |
DE69711761T2 (de) * | 1996-05-29 | 2002-08-14 | Matsushita Electric Industrial Co., Ltd. | Anordnung zur Dokumentkonvertierung |
JP2001503540A (ja) * | 1996-06-14 | 2001-03-13 | ロゴヴィスタ株式会社 | アノテートされたテキストの自動翻訳 |
JPH1074204A (ja) * | 1996-06-28 | 1998-03-17 | Toshiba Corp | 機械翻訳方法及び原文・訳文表示方法 |
US5987245A (en) | 1996-07-01 | 1999-11-16 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture (#12) for a client-server state machine framework |
US6424991B1 (en) | 1996-07-01 | 2002-07-23 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server communication framework |
US6272555B1 (en) | 1996-07-01 | 2001-08-07 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server-centric interprise computing framework system |
US5848246A (en) | 1996-07-01 | 1998-12-08 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server session manager in an interprise computing framework system |
US6038590A (en) | 1996-07-01 | 2000-03-14 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server state machine in an interprise computing framework system |
US6304893B1 (en) | 1996-07-01 | 2001-10-16 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server event driven message framework in an interprise computing framework system |
US6434598B1 (en) | 1996-07-01 | 2002-08-13 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server graphical user interface (#9) framework in an interprise computing framework system |
US5999972A (en) | 1996-07-01 | 1999-12-07 | Sun Microsystems, Inc. | System, method and article of manufacture for a distributed computer system framework |
US6266709B1 (en) | 1996-07-01 | 2001-07-24 | Sun Microsystems, Inc. | Object-oriented system, method and article of manufacture for a client-server failure reporting process |
DE69616093D1 (de) * | 1996-07-03 | 2001-11-22 | Sopheon N V | System zum unterstützen der produktion von dokumenten |
JP3121548B2 (ja) * | 1996-10-15 | 2001-01-09 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 機械翻訳方法及び装置 |
US5893127A (en) * | 1996-11-18 | 1999-04-06 | Canon Information Systems, Inc. | Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document |
CA2286935C (en) * | 1997-05-28 | 2001-02-27 | Shinar Linguistic Technologies Inc. | Translation system |
IL121457A (en) * | 1997-08-03 | 2004-06-01 | Guru Internat Inc | Computerized dictionary and thesaurus applications |
WO1999008182A1 (en) * | 1997-08-05 | 1999-02-18 | Lutris Technologies, Inc. | Method and apparatus for static and dynamic generation of information on a user interface |
US20020002458A1 (en) * | 1997-10-22 | 2002-01-03 | David E. Owen | System and method for representing complex information auditorially |
US5960080A (en) * | 1997-11-07 | 1999-09-28 | Justsystem Pittsburgh Research Center | Method for transforming message containing sensitive information |
US6041326A (en) * | 1997-11-14 | 2000-03-21 | International Business Machines Corporation | Method and system in a computer network for an intelligent search engine |
US6085161A (en) * | 1998-10-21 | 2000-07-04 | Sonicon, Inc. | System and method for auditorially representing pages of HTML data |
US6535842B1 (en) * | 1998-12-10 | 2003-03-18 | Global Information Research And Technologies, Llc | Automatic bilingual translation memory system |
EP1266313A2 (en) * | 1999-03-19 | 2002-12-18 | Trados GmbH | Workflow management system |
US6446036B1 (en) | 1999-04-20 | 2002-09-03 | Alis Technologies, Inc. | System and method for enhancing document translatability |
US6338033B1 (en) | 1999-04-20 | 2002-01-08 | Alis Technologies, Inc. | System and method for network-based teletranslation from one natural language to another |
US7139971B1 (en) * | 1999-07-21 | 2006-11-21 | Nec Corporation | Method of searching for and retrieving information from structure documents |
US6993476B1 (en) * | 1999-08-26 | 2006-01-31 | International Business Machines Corporation | System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework |
US6598015B1 (en) * | 1999-09-10 | 2003-07-22 | Rws Group, Llc | Context based computer-assisted language translation |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US7437669B1 (en) * | 2000-05-23 | 2008-10-14 | International Business Machines Corporation | Method and system for dynamic creation of mixed language hypertext markup language content through machine translation |
US6965857B1 (en) * | 2000-06-02 | 2005-11-15 | Cogilex Recherches & Developpement Inc. | Method and apparatus for deriving information from written text |
US7313588B1 (en) | 2000-07-13 | 2007-12-25 | Biap Systems, Inc. | Locally executing software agent for retrieving remote content and method for creation and use of the agent |
US7152058B2 (en) | 2000-07-13 | 2006-12-19 | Biap Systems, Inc. | Apparatus for and method of selectively retrieving information and enabling its subsequent display |
US7613790B2 (en) * | 2000-07-13 | 2009-11-03 | Biap Systems, Inc. | Apparatus for and method of executing customized interactive computing services in a broadband network environment |
US7669051B2 (en) * | 2000-11-13 | 2010-02-23 | DigitalDoors, Inc. | Data security system and method with multiple independent levels of security |
US9311499B2 (en) * | 2000-11-13 | 2016-04-12 | Ron M. Redlich | Data security system and with territorial, geographic and triggering event protocol |
JP2002189627A (ja) * | 2000-12-21 | 2002-07-05 | Tsubasa System Co Ltd | 文書データの変換方法 |
US20020143823A1 (en) * | 2001-01-19 | 2002-10-03 | Stevens Mark A. | Conversion system for translating structured documents into multiple target formats |
US7020611B2 (en) * | 2001-02-21 | 2006-03-28 | Ameritrade Ip Company, Inc. | User interface selectable real time information delivery system and method |
AUPR329501A0 (en) * | 2001-02-22 | 2001-03-22 | Worldlingo, Inc | Translation information segment |
US7016963B1 (en) | 2001-06-29 | 2006-03-21 | Glow Designs, Llc | Content management and transformation system for digital content |
FR2833375B1 (fr) * | 2001-12-07 | 2004-06-04 | Amadeus | Procede, dispositif d'adaptation de fichiers numeriques |
EP1576586A4 (en) * | 2002-11-22 | 2006-02-15 | Transclick Inc | LANGUAGE TRANSLATION SYSTEM AND METHOD |
US7797626B2 (en) * | 2003-02-12 | 2010-09-14 | Sap Ag | Managing different representations of information |
US20050198573A1 (en) * | 2004-02-24 | 2005-09-08 | Ncr Corporation | System and method for translating web pages into selected languages |
US8296126B2 (en) * | 2004-02-25 | 2012-10-23 | Research In Motion Limited | System and method for multi-lingual translation |
WO2005086021A2 (en) * | 2004-03-02 | 2005-09-15 | Melingo, Ltd. | Embedded translation document method and system |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US7185026B2 (en) * | 2004-04-15 | 2007-02-27 | International Business Machines Corporation | Method for synchronizing read/unread data during LOTUS NOTES database migration |
US7577561B2 (en) * | 2004-11-09 | 2009-08-18 | Sony Online Entertainment Llc | System and method for generating a target language markup language text template |
US7711544B2 (en) * | 2004-11-09 | 2010-05-04 | Sony Online Entertainment Llc | System and method for generating markup language text templates |
EP1842143A2 (en) * | 2005-01-10 | 2007-10-10 | Melingo, Ltd. | Embedded translation-enhanced search |
US7509574B2 (en) * | 2005-02-11 | 2009-03-24 | Fujitsu Limited | Method and system for reducing delimiters |
JP2006277103A (ja) * | 2005-03-28 | 2006-10-12 | Fuji Xerox Co Ltd | 文書翻訳方法および文書翻訳装置 |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US8291377B2 (en) * | 2006-01-25 | 2012-10-16 | Microsoft Corporation | External configuration of processing content for script |
US8521506B2 (en) | 2006-09-21 | 2013-08-27 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
US9122674B1 (en) * | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
KR100912502B1 (ko) * | 2007-07-27 | 2009-08-17 | 한국전자통신연구원 | Pdf 파일을 대상으로 하는 자동 번역 방법 |
JP2010055235A (ja) * | 2008-08-27 | 2010-03-11 | Fujitsu Ltd | 翻訳支援プログラム、及び該システム |
US8370126B2 (en) * | 2009-01-30 | 2013-02-05 | Facebook, Inc. | Incorporation of variables into textual content |
US20100217717A1 (en) * | 2009-02-24 | 2010-08-26 | Devonwood Logistics, Inc. | System and method for organizing and presenting evidence relevant to a set of statements |
US9262403B2 (en) | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
GB2468278A (en) | 2009-03-02 | 2010-09-08 | Sdl Plc | Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation |
CN101739395A (zh) * | 2009-12-31 | 2010-06-16 | 程光远 | 机器翻译方法和*** |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
KR101762866B1 (ko) * | 2010-11-05 | 2017-08-16 | 에스케이플래닛 주식회사 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
US9558182B1 (en) * | 2016-01-08 | 2017-01-31 | International Business Machines Corporation | Smart terminology marker system for a language translation system |
US11403078B2 (en) * | 2016-10-21 | 2022-08-02 | Vmware, Inc. | Interface layout interference detection |
US10275462B2 (en) * | 2017-09-18 | 2019-04-30 | Sap Se | Automatic translation of string collections |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
US11289092B2 (en) * | 2019-09-25 | 2022-03-29 | International Business Machines Corporation | Text editing using speech recognition |
US11704507B1 (en) * | 2022-10-31 | 2023-07-18 | Kudo, Inc. | Systems and methods for automatic speech translation |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62163173A (ja) * | 1986-01-14 | 1987-07-18 | Toshiba Corp | 機械翻訳方法 |
US5182709A (en) * | 1986-03-31 | 1993-01-26 | Wang Laboratories, Inc. | System for parsing multidimensional and multidirectional text into encoded units and storing each encoded unit as a separate data structure |
JP2654001B2 (ja) * | 1986-05-08 | 1997-09-17 | 株式会社東芝 | 機械翻訳方法 |
JPS63108461A (ja) * | 1986-10-27 | 1988-05-13 | Toshiba Corp | 機械翻訳装置 |
GB2197510A (en) * | 1986-10-27 | 1988-05-18 | Sharp Kk | Translation apparatus |
GB2198565A (en) * | 1986-11-28 | 1988-06-15 | Sharp Kk | Translation apparatus |
JPS6478372A (en) * | 1987-09-19 | 1989-03-23 | Hitachi Software Eng | Translating device |
US5005127A (en) * | 1987-10-26 | 1991-04-02 | Sharp Kabushiki Kaisha | System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules |
US4994966A (en) * | 1988-03-31 | 1991-02-19 | Emerson & Stern Associates, Inc. | System and method for natural language parsing by initiating processing prior to entry of complete sentences |
JPH0268662A (ja) * | 1988-09-02 | 1990-03-08 | Sharp Corp | 機械翻訳装置 |
US5111398A (en) * | 1988-11-21 | 1992-05-05 | Xerox Corporation | Processing natural language text using autonomous punctuational structure |
JPH039472A (ja) * | 1989-06-06 | 1991-01-17 | Nec Corp | 原文イメージ保存装置 |
US5276616A (en) * | 1989-10-16 | 1994-01-04 | Sharp Kabushiki Kaisha | Apparatus for automatically generating index |
JPH03222065A (ja) * | 1990-01-26 | 1991-10-01 | Sharp Corp | 機械翻訳装置 |
JPH04259057A (ja) * | 1991-02-13 | 1992-09-14 | Toshiba Corp | 文書編集方法及び機械翻訳方法 |
JP2848729B2 (ja) * | 1991-12-06 | 1999-01-20 | 株式会社東芝 | 翻訳方法および翻訳装置 |
JPH07182344A (ja) * | 1993-12-24 | 1995-07-21 | Sharp Corp | 機械翻訳装置 |
-
1993
- 1993-05-07 JP JP10640593A patent/JP3220560B2/ja not_active Expired - Lifetime
- 1993-05-26 US US08/067,143 patent/US5587902A/en not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5548508A (en) * | 1994-01-20 | 1996-08-20 | Fujitsu Limited | Machine translation apparatus for translating document with tag |
US6061701A (en) * | 1996-03-22 | 2000-05-09 | Sharp Kabushiki Kaisha | Hypertext document processing apparatus with display means displaying input data and additional display means displaying translated data |
EP0800141A3 (en) * | 1996-03-22 | 2005-02-16 | Sharp Kabushiki Kaisha | Apparatus for the translation of hypertext documents |
JPH09305475A (ja) * | 1996-05-14 | 1997-11-28 | Oki Electric Ind Co Ltd | リンク付文書検索表示システム |
US6501207B2 (en) | 1999-05-27 | 2002-12-31 | Mitsubishi Denki Kabushiki Kaisha | Rotor for a vehicular A. C. generator |
Also Published As
Publication number | Publication date |
---|---|
JP3220560B2 (ja) | 2001-10-22 |
US5587902A (en) | 1996-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3220560B2 (ja) | 機械翻訳装置 | |
JP3377290B2 (ja) | イディオム処理機能を持つ機械翻訳装置 | |
JP4544674B2 (ja) | 選択文字列に関連する情報を提供するシステム | |
JPH0782498B2 (ja) | 機械翻訳システム | |
US5475586A (en) | Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words | |
US5608623A (en) | Special cooccurrence processing method and apparatus | |
JP2815714B2 (ja) | 翻訳装置 | |
JPH05120324A (ja) | 言語処理方式 | |
JP2632806B2 (ja) | 言語解析装置 | |
JP3136973B2 (ja) | 言語解析システムおよび方法 | |
JPH06259423A (ja) | 要約自動作成方式 | |
JPH0969106A (ja) | 機械翻訳装置及び翻訳処理方法 | |
JP2521435B2 (ja) | 日本語生成装置 | |
JPH08185405A (ja) | 機械翻訳装置 | |
JP2719453B2 (ja) | 機械翻訳装置 | |
JP3701050B2 (ja) | 文書形態素解析装置 | |
JP3233800B2 (ja) | 機械翻訳装置 | |
JP3972697B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP2839419B2 (ja) | イディオム登録機能を持つ機械翻訳装置 | |
JP2972212B2 (ja) | 機械翻訳方法及びシステム | |
JP2752025B2 (ja) | 機械翻訳装置 | |
JPH05225232A (ja) | テキスト自動前編集装置 | |
JP2000029882A (ja) | 要約文作成装置 | |
JPH0348366A (ja) | 形態素解析、構文解析及び形態素生成方式 | |
JPH0816910B2 (ja) | 言語解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20010403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010717 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070810 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080810 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080810 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090810 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090810 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100810 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110810 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110810 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120810 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120810 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130810 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term |