JPH11272671A - 機械翻訳装置及び機械翻訳方法 - Google Patents

機械翻訳装置及び機械翻訳方法

Info

Publication number
JPH11272671A
JPH11272671A JP10071985A JP7198598A JPH11272671A JP H11272671 A JPH11272671 A JP H11272671A JP 10071985 A JP10071985 A JP 10071985A JP 7198598 A JP7198598 A JP 7198598A JP H11272671 A JPH11272671 A JP H11272671A
Authority
JP
Japan
Prior art keywords
translation
document
language
machine
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10071985A
Other languages
English (en)
Inventor
Miwako Shimazu
美和子 島津
Yumiko Yoshimura
裕美子 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10071985A priority Critical patent/JPH11272671A/ja
Publication of JPH11272671A publication Critical patent/JPH11272671A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】効率的な翻訳を行うことにより利用者にとって
必要十分な翻訳結果を迅速に得ることができる機械翻訳
装置及び機械翻訳方法を提供することを目的とする。 【解決手段】翻訳管理部102は、以前に翻訳がなされ
た複数の文書の中から、現在の翻訳対象文書と最も類似
する文書を検索し、その文書との差を文単位で抽出す
る。また翻訳管理部102は、原文の文書データに基づ
き上記重複箇所を除いて原文を翻訳するように、翻訳制
御情報を用いて翻訳エンジン103に対して指示する。
翻訳エンジン103は、かかる指示内容に従い、原文の
文書データを機械翻訳に供し、その結果を翻訳データベ
ース104に記憶させる。出力部105は翻訳結果の出
力処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は自然言語処理技術に
関わり、より詳しくは自然言語による文書を他の自然言
語の文書に機械翻訳する機械翻訳装置及び機械翻訳方法
に関する。
【0002】
【従来の技術】近年、ビジネスの国際化、ボーダーレス
化が進むとともにネットワーク社会も進展し、インター
ネットや電子メール等を用いたデジタルでの情報交換が
日常的になってきている。ネットワーク環境の普及に伴
い、一般のコンピュータ利用者がインターネット上のW
WWを通じて情報獲得を頻繁に行うようになった。とこ
ろで、インターネット上で得られる電子文書は大部分が
英語によって表現されており、英語を母国語とせず、こ
れを不得手と感じる利用者は、原文の意味解釈のために
機械翻訳装置を利用することが一般的である。
【0003】しかしながら、機械翻訳の品質、精度は現
在のところ完全であるとは言い難い。例えば原文中に
は、機械翻訳装置の翻訳処理に供さなくても原文のまま
の方がその意味を容易に汲み取れるような箇所、以前に
読んだことがある箇所、広告掲載箇所、そして版権情報
など情報量が少なく精読を要さない箇所等といった翻訳
不要箇所が同一ページに混在しているが、従来の機械翻
訳システムにおいては、利用者が翻訳したい範囲を自分
で指定しない限り、そのページは一様に翻訳されてしま
う。換言すると、従来の機械翻訳装置においては、原文
の内容を吟味し、あるいは利用者の言語能力を考慮する
ことなく翻訳が行われており、翻訳の必要な部分と不必
要な部分との区別はなされていなかった。このため従来
の機械翻訳装置には、必ずしも翻訳が必要でない部分も
翻訳しているという点で時間的なロスが多いという欠点
があった。また、翻訳すること以前に、ネットワークを
介した文書の取得にも必然的に時間が掛かる。
【0004】したがって、必要十分な情報を迅速に入手
したいという利用者のニーズに十分応えるためにも、翻
訳結果が得られるまでの機械翻訳装置内における翻訳時
間の短縮が望まれている。
【0005】
【発明が解決しようとする課題】本発明はかかる事情を
考慮してなされたものであり、効率的な翻訳を行うこと
により利用者にとって必要十分な翻訳結果を迅速に得る
ことができる機械翻訳装置及び機械翻訳方法を提供する
ことを目的とする。
【0006】
【課題を解決するための手段】本発明の機械翻訳装置
は、第一言語の文書を第二言語の文書に機械翻訳し、当
該第一言語の文書及び前記第二言語の文書を記憶手段に
記憶する機械翻訳装置において、前記第一言語の文書を
入力する入力手段と、前記入力手段により入力された第
一言語の文書と、前記記憶手段に記憶され、過去の機械
翻訳に供された第一言語の文書とを比較し、その差分箇
所を抽出する抽出手段と、前記抽出手段により得られた
差分箇所を翻訳する翻訳手段と、前記第一言語の文書
と、前記翻訳手段による翻訳結果とに基づいて、所定の
出力データを生成して出力する出力手段と、を具備す
る。
【0007】この構成によれば、過去の機械翻訳に供さ
れた第一言語の文書との差分箇所が翻訳され、その翻訳
結果と第一言語の文書とから所定の所定の出力データが
生成される。これにより利用者にとって必要十分な翻訳
結果を迅速に得ることができる。
【0008】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態を説明する。 [第1の実施形態]図1は、本発明の第1実施形態に係
る機械翻訳装置の概略構成を示すブロック図である。同
図において、101は入力部であり、インターネットな
どの通信手段やキーボード等を通じて、原文や利用者か
らの指示(コマンド)を受け取るものである。102は
翻訳管理部であり、翻訳要求を管理するものである。よ
り具体的には、翻訳管理部102はジョブ管理処理、文
書管理処理、文書の比較処理及び翻訳対象部分の抽出処
理を行い、その処理結果を表す翻訳制御情報を出力す
る。
【0009】103は翻訳エンジンであり、翻訳管理部
102から出力された翻訳制御情報に従って原文を機械
翻訳し、その結果を出力するものである。なお、本発明
は翻訳エンジン103による機械翻訳の方法を特に限定
しない。このため、現在知られている種々の翻訳方法が
適用された場合であっても本発明は実施可能である。
【0010】104は翻訳データベースであり、原文及
び翻訳結果(訳文)等を一時的又は長期的に保存するも
のである。105は出力部であり、翻訳データベース1
04に保存された翻訳結果から所定の出力形式のデータ
を生成して出力するものである。この出力データは、図
示しない表示装置に表示して利用者に提示することがで
き、あるいは図示しない記憶装置に出力させることもで
きる。
【0011】以上のように構成された本実施形態の機械
翻訳装置の動作を、図2のフローチャートを参照しなが
ら説明する。同フローチャートは、第一言語(ここでは
例えば「英語」とする)で書かれた原文を読み込み、こ
れを第二言語(ここでは例えば「日本語」とする)の訳
文に機械翻訳して出力するまでの動作を示している。図
3は原文の具体例を示す図である。
【0012】まず、入力部101により、原文の読み込
みが行われる。翻訳管理部102は読み込んだ原文の文
書データを、日付などの付加的な情報とともに翻訳デー
タベース104に記憶させる(ステップS1)。
【0013】次にステップS2では、ステップS1にお
いて読み込んだ原文につき、今回行おうとしている翻訳
が、当該システムにおいて初めて行われる翻訳であるか
否かの判定が行われる。かかる判定は、翻訳データベー
ス104において記憶された日付情報に基づいて行われ
る。
【0014】初回の翻訳である場合(ステップS2にお
いて「NO」)はステップS4に進む。ステップS4に
おいて、翻訳管理部102は原文をそのまま翻訳するよ
うに、翻訳制御情報を用いて翻訳エンジン103に対し
て指示する。翻訳エンジン103は、かかる指示内容に
従い、原文の文書データを機械翻訳処理し、その結果を
翻訳データベース104に記憶させる。そして、ステッ
プS5において翻訳結果の出力処理が行われる。翻訳結
果の出力処理の内容については後述する。
【0015】次に、図4及び図5に示す原文に対する機
械翻訳の要求がなされた場合の動作について説明する。
この原文は、図3に示した原文の内容の一部が変更され
たものである。
【0016】先ず、前回の翻訳と同様に、図4及び図5
に示す文書が第一言語の原文として入力部101により
読み込まれる。翻訳管理部102は、読み込んだ原文の
文書データを、日付などの付加的な情報とともに翻訳デ
ータベース104に記憶させる(ステップS1)。
【0017】次にステップS2では、ステップS1にお
いて読み込んだ原文につき、今回行おうとしている翻訳
が、当該システムにおいて初めて行われる翻訳であるか
否かの判定が行われる。かかる判定は、上述と同様に翻
訳データベース104において記憶された日付情報に基
づいて行われる。
【0018】そして今度は2回目の翻訳となるのでステ
ップS3に進み、翻訳管理部102は、以前に翻訳がな
された複数の文書の中から、現在の翻訳対象文書と最も
類似する文書を検索し、その文書との差を文単位で抽出
する。もちろん、文単位のみならず例えばパラグラフ単
位で抽出しても構わない。ステップS3における類似度
判定の具体的方法については、様々な既存技術を利用可
能である。
【0019】本実施形態に関して言えば、図3と図4
(及び図5)との文書の差分抽出結果としては、両文書
の末尾部分Pが同一であり、他の部分は重複のない新規
な情報であり翻訳を要する。
【0020】そこで翻訳管理部102は、図4(及び図
5)の文書に対しては重複部分以前の本文を翻訳するよ
うに翻訳エンジン103に対し指示する。具体的には、
翻訳管理部102は原文の文書データに基づき上記重複
箇所を除いて原文を翻訳するように、翻訳制御情報を用
いて翻訳エンジン103に対して指示する。翻訳エンジ
ン103は、かかる指示内容に従い、原文の文書データ
を機械翻訳に供し、その結果を翻訳データベース104
に記憶させる。そして、ステップS5において、出力部
105によって翻訳結果の出力処理が行われる。
【0021】すなわち出力部105は、翻訳エンジン1
03によって得られた翻訳結果(訳文)に基づき、所定
(ここでは2通りとする)の出力形式のデータを生成し
て出力する。これらの出力形式はユーザからのコマンド
入力により切り替え可能となっている。
【0022】図6、図7、図8は出力部105による第
1の出力形式に従って出力された翻訳結果を示す図であ
る。これらの図において、例えばF11、F12、及び
F13は原文の一パラグラフを示し、F21、F22、
及びF23は訳文の一パラグラフ(「段落」とも言う)
を示している。本出力形式では、原文と訳文とをパラグ
ラフ毎で交互に出力する。このため、図6に示すように
F11(原文の一パラグラフ),F21(F11に対応
する訳文),F12,F13,...という順序で原文
と訳文が出力されている。
【0023】一方、図9及び図10は出力部105によ
り第2の出力形式に従って出力された翻訳結果を示す図
である。これらの図において、例えばF31及びF32
は原文を示し、F4は訳文を示している。本出力形式で
は、図3に示した原文と図4及び図5に示した原文との
重複部分については原文のまま出力し、他の部分につい
ては訳文を出力する。
【0024】なお、翻訳結果の出力形式は上述したもの
のみに限定されない。以上説明したように、本実施形態
によれば、翻訳データベース104に記憶され既に翻訳
処理が行われた原文のなかから、今回翻訳しようとする
原文と類似する原文が検索され、両原文書間で相違する
部分のみが抽出され、翻訳エンジン103による翻訳に
供される。このように翻訳対象を抽出部分のみとするこ
とにより効率的な翻訳処理を行える。したがって、利用
者は必要十分な翻訳結果を迅速に得ることができるよう
になる。
【0025】また、出力部105は翻訳エンジン103
によって得られた翻訳結果(訳文)に基づき、所定(こ
こでは2通りとする)の出力形式のデータを生成して出
力する。このため利用者は異なる出力形式で翻訳結果を
得ることができる。
【0026】[第2の実施形態]次に本発明に係る機械
翻訳装置の第2実施形態を説明する。第2実施形態は、
原文の内容を吟味する、あるいは利用者の言語能力を考
慮するといった柔軟性の高い機械翻訳を実現すべく構成
されたものである。
【0027】まずはその背景について述べる。機械翻訳
を利用する利用者の語学力レベルには大きな幅がある。
アルファベットもおぼつかないレベルから、上級レベル
ではあるが母国語の方が速読できるというレベルまであ
る。前者の利用者層は文書表示画面に表われる全ての英
単語が日本語に置き換えられることを望んでいる場合が
多い。一方、上級レベルの利用者層は、原文中のタイト
ル、箇条書き、又はリストのような文章表現は、機械翻
訳に要する時間を勘案すると原文のままで読んだ方がそ
の内容を早く理解できる場合がある。また現水準の機械
翻訳技術はこのようなタイトルや箇条書きのように文法
上の観点から不完全な文章表現の翻訳に対し非力であ
り、翻訳せずに原文のままとした方が良い場合もあると
考えられる。
【0028】例えば、一般的な英語力を有する利用者が
米国のホームページを閲覧中に、“National (U.S.); I
nternational”というような表現を見付けた場合、この
“National”は文脈から判断して「国内」の意味である
ことを容易に理解できるが、その一方で、機械翻訳では
利用者から見て明らかに別の意味(例えば「国立」な
ど)を当ててしまう場合がある。これは、機械翻訳にお
いては文脈を考慮した高度な翻訳を行うことが困難であ
ることに起因する。
【0029】このように、タイトルや箇条書き、単語や
句の並びなど文法上の観点から不完全な文章表現は、特
に上級レベルの利用者に対しては、翻訳の対象から除外
することが適切な情報伝達を行うためにも好ましい。
【0030】また、本文以外の部分、例えば図3及び図
4に示した文書の文頭から3行目までの比較から次のこ
とが言える。文書の冒頭部分は一定の形式に則った記述
が多く、例えば日付及び時間(個々の数値は異なる)や
単語の羅列から成る目次(又は「メニュー」とも言う)
等から成る。日付及び時間については、年月日に関する
英単語を知っていれば、あとは万国共通の表記になって
いるので、わざわざ翻訳しなくても理解できる。また、
上記目次は、前日までのものと全く同じであるので重複
箇所とみなすことができる。
【0031】さらに、外電のニュースなど提供者から迅
速に配布される文書には、スペルミスや文法上の誤り箇
所が多く見受けられる傾向にある。スペルミスや文法上
の誤りは、機械翻訳において構文解析の失敗を招く原因
となる。また、たとえ構文解析に成功したとても誤った
スペリングの語が主文の動詞であるような場合は文全体
の意味が不明になってしまうことがある。例えば次の文
(“It is extremelydisturbing that almost two year
s after the signing of the Dayton peace agreement
certain individuals continue to use barbaric tacti
cs to get their point accross .")は、下線で“acr
oss" の綴りが違っているために、スペルチェックを事
前に行わない限り、機械翻訳において“get something
across"という適切な意味付けを行うことは不可能であ
る。したがって、このような文に対し無理に機械翻訳を
行うことは、かえって利用者に対する適切且つ迅速な情
報伝達を阻害することになりかねない。そこで、原文中
に未知なる用語が含まれていた場合や構文解析に失敗し
た場合に限っては、機械翻訳結果はあえて表示せず、原
文のまま提示するという手法が考えられる。
【0032】こうした背景の下、本発明の第2実施形態
に係る機械翻訳装置は次のように構成されている。図1
1は本実施形態の機械翻訳装置の概略構成を示すブロッ
ク図である。同図において、201は入力部であり、イ
ンターネットなどの通信手段やキーボード等を通じて、
原文や利用者からの指示(コマンド)を受け取るもので
ある。202は翻訳管理部であり、翻訳要求を管理する
ものである。より具体的には、翻訳管理部202はジョ
ブ管理処理、文書管理処理、利用者による翻訳不要部指
定に係る処理を行い、その処理結果を表す翻訳制御情報
を出力する。203は不要表現指定画面出力部であり、
翻訳不要表現の種類を指定するための不要表現指定画面
を表示するものである。
【0033】204は翻訳エンジンであり、翻訳管理部
202から出力された翻訳制御情報に従って原文を構文
解釈して機械翻訳し、その結果を出力するものである。
なお、本発明は翻訳エンジン204による機械翻訳の方
法を特に限定しない。このため、現在知られている種々
の翻訳方法が適用された場合であっても本発明は実施可
能である。
【0034】205は翻訳データベースであり、原文及
び翻訳結果(訳文)等を一時的又は長期的に保存するも
のである。そして、206は出力部であり、翻訳データ
ベース205に保存された翻訳結果から所定の出力形式
のデータを生成して出力するものである。この出力デー
タは、図示しない表示装置に表示して利用者に提示する
ことができ、あるいは図示しない記憶装置に出力させる
こともできる。
【0035】以上のように構成された本実施形態の機械
翻訳装置の動作を、図12のフローチャートを参照しな
がら説明する。同フローチャートは、第一言語(ここで
は例えば「英語」とする)で書かれた原文を読み込み、
これを第二言語(ここでは例えば「日本語」とする)の
訳文に機械翻訳して出力するまでの動作を示している。
【0036】まず、入力部201により、原文の読み込
みが行われる。翻訳管理部202は読み込んだ原文の文
書データを、日付などの付加的な情報とともに翻訳デー
タベース205に記憶させる(ステップS21)。
【0037】次にステップS22においては、翻訳不要
表現の種類を利用者が指定するための指定画面が不要表
現指定画面表示部203によって表示される。図13は
この指定画面の表示例を示す図である。この指定画面に
おいて、利用者は例えば言語の習熟度等に応じてあらか
じめ翻訳不要となる表現の種類を指定できる。同図に示
すように、指定可能な翻訳不要表現の種類は、「タイト
ル」、「箇条書き」、「日付・時間のみ異なる文」、
「未知語のある文」、及び「構文解析に失敗した文」で
ある。
【0038】従来の機械翻訳装置では、原文中において
翻訳不要表現を具体的に指定(例えば範囲指定)する必
要があったのに対し、本実施形態では上記「タイトル」
のような抽象的な概念による指定であるので、従来装置
よりも利用者は簡単に指定を行えるという利点がある。
なお、「構文解析に失敗した文」のように、翻訳処理を
行わないと不要と判断できない表現の種類もあるので、
この指定がなされた場合には、翻訳エンジン204にお
いて構文解析処置が行われる。
【0039】不要表現指定画面において利用者により所
定の指定が行われるとステップS23に進む。ここで翻
訳管理部202は上記利用者により指定された不要表現
を除外して原文を翻訳するように、翻訳制御情報を用い
て翻訳エンジン204に対して指示する。翻訳エンジン
204は、かかる指示内容に従い、原文の文書データを
機械翻訳処理し、その結果を翻訳データベース205に
記憶させる。そして、ステップS24において翻訳結果
の出力処理が行われる。
【0040】本実施形態の翻訳処理においては、上記翻
訳不要表現の指定レベルに応じて、例えば次のように翻
訳の行われ方が異なってくる。<1>最下位レベルの指
定がなされた場合は、翻訳不要表現が存在しない場合で
あり、原文をそのまま機械翻訳する。<2>中間レベル
の指定がなされた場合は、「箇条書き」など、文よりも
短い単位の部分を翻訳対象から除外して機械翻訳する。
<3>最上級レベルの指定がなされた場合は、上記<2
>に加え、構文解析に失敗した箇所の翻訳結果は出力せ
ず、もとの英文のままとする。
【0041】例えば、図14に示す原文に対し図13に
示した翻訳不要表現指定画面において「箇条書き」「タ
イトル」が指定された場合、図15に示すような翻訳結
果(訳文)が得られる。図14及び図15において、P
21は「タイトル」を示し、P22は「箇条書き」を示
している。
【0042】原文中から箇条書きやタイトルに相当する
部分を認識する(言い替えれば「原文を吟味するこ
と」)には、既に実用化されている種々の手法を用いれ
ばよい。例えば箇条書きは、図14のP22に示したよ
うに行頭の文字がハイフンであるとか、HTMLやSG
MLのタグ情報を利用して判定することができる。ま
た、タイトルについては、文末にピリオドやクエスチョ
ンマークが記されていないといったことを手がかりに認
識できる。
【0043】以上説明したように、本実施形態によれ
ば、翻訳不要表現の種類を利用者が指定し、当該指定内
容に基づいて翻訳が行われ、また、指定内容に応じた出
力結果が得られる。これにより、原文の内容を吟味す
る、あるいは利用者の言語能力を考慮するといった柔軟
性の高い機械翻訳を実現できる。
【0044】なお、本発明は上述した実施形態に限定さ
れず種々変形して実施可能である。例えば、上記プログ
ラムは、ROMに格納したものを用いてもよいが、次の
ように汎用コンピュータにプログラムをインストールし
て実現することも可能である。すなわち、先ず上記プロ
グラムを、コンピュータ読取可能な記録媒体(例えばフ
ロッピー・ディスクあるいはCR−ROM等の記録媒
体)に記憶させておき、該記録媒体に応じたディスクド
ライブ装置を用いて該プログラムを読取り、RAMに格
納し、実行する。あるいは、いったんハードディスク装
置等にインストールしておき、実行時にハードディスク
装置等からRAMに格納し、実行する。なお、プログラ
ムを格納した記録媒体がICカードである場合は、IC
カードリーダーを用いて該プログラムを読取ることがで
きる。あるいは、ネットワークを介して所定のインタフ
ェース装置からプログラムを受け取ることができる。ま
た、上述した第1及び第2実施形態を組み合わせて実施
可能である。
【0045】
【発明の効果】以上説明したように、本発明によれば、
必要な外国語の情報を、その重要度や価値に応じて、し
かも時間的損失を最小限にとどめて機械翻訳を行うこと
が可能となる。これにより利用者の情報獲得のニーズを
満たす機械翻訳装置及び方法を提供できる。
【図面の簡単な説明】
【図1】本発明の第1実施形態に係る機械翻訳装置の概
略構成を示すブロック図。
【図2】上記実施形態の動作を説明するためのフローチ
ャート。
【図3】上記実施形態の機械翻訳に用いられる第1の原
文の具体例を示す図。
【図4】上記実施形態の機械翻訳に用いられる第2の原
文の具体例の一部分を示す図。
【図5】上記実施形態の機械翻訳に用いられる第2の原
文の具体例の残りの部分を示す図。
【図6】上記実施形態の機械翻訳結果の第1の出力例の
一部分を示す図。
【図7】上記実施形態の機械翻訳結果の第1の出力例の
一部分を示す図。
【図8】上記実施形態の機械翻訳結果の第1の出力例の
残りの部分を示す図。
【図9】上記実施形態の機械翻訳結果の第2の出力例の
一部分を示す図。
【図10】上記実施形態の機械翻訳結果の第2の出力例
の残りの部分を示す図。
【図11】本発明の第2実施形態に係る機械翻訳装置の
概略構成を示すブロック図。
【図12】上記実施形態の動作を説明するためのフロー
チャート。
【図13】上記実施形態に係る翻訳不要表現指定画面の
表示例を示す図。
【図14】上記実施形態の機械翻訳に用いられる原文の
具体例を示す図。
【図15】上記実施形態の機械翻訳結果の出力例を示す
図。
【符号の説明】
101…入力部 102…翻訳管理部 103…翻訳エンジン 104…翻訳データベース 105…出力部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 第一言語の文書を第二言語の文書に機械
    翻訳し、当該第一言語の文書及び前記第二言語の文書を
    記憶手段に記憶する機械翻訳装置において、 前記第一言語の文書を入力する入力手段と、 前記入力手段により入力された第一言語の文書と、前記
    記憶手段に記憶され、過去の機械翻訳に供された第一言
    語の文書とを比較し、その差分箇所を抽出する抽出手段
    と、 前記抽出手段により得られた差分箇所を翻訳する翻訳手
    段と、 前記第一言語の文書と、前記翻訳手段による翻訳結果と
    に基づいて、所定の出力データを生成して出力する出力
    手段と、を具備することを特徴とする機械翻訳装置。
  2. 【請求項2】 前記出力手段は、前記第一言語の文書の
    パラグラフと、当該パラグラフに対応する前記第二言語
    の文書のパラグラフとを交互に出力することを特徴とす
    る請求項1に記載の機械翻訳装置。
  3. 【請求項3】 前記出力手段は、前記抽出手段により抽
    出された差分箇所に対応する前記第一言語の文書の所定
    の箇所を、前記翻訳手段の翻訳結果として得られた第二
    言語の文書に置き換えて出力することを特徴とする請求
    項1に記載の機械翻訳装置。
  4. 【請求項4】 第一言語の文書を第二言語の文書に機械
    翻訳する機械翻訳装置において、 前記第一言語の文書を入力する入力手段と、 翻訳不要表現の種類を利用者が指定するための指定手段
    と、 前記指定手段による指定結果に基づいて、前記入力手段
    により入力された文書中の翻訳不要表現に相当する箇所
    を、前記第一言語の文書に対する構文解析処理を含む処
    理により認識する認識手段と、 前記認識手段により認識された翻訳不要部を除外して、
    前記第一言語の文書を翻訳する翻訳手段と、 前記翻訳手段により得られた翻訳結果に基づいて所定の
    出力データを生成して出力する出力手段と、を具備する
    ことを特徴とする機械翻訳装置。
  5. 【請求項5】 第一言語の文書を第二言語の文書に機械
    翻訳し、当該第一言語の文書及び前記第二言語の文書を
    記憶手段に記憶する機械翻訳方法において、 前記第一言語の文書を入力する入力ステップと、 前記入力ステップにおいて入力された第一言語の文書
    と、前記記憶手段に記憶され、過去の機械翻訳に供され
    た第一言語の文書とを比較し、その差分箇所を抽出する
    抽出ステップと、 前記抽出ステップにおいて得られた差分箇所を翻訳する
    翻訳ステップと、 前記第一言語の文書と、前記翻訳ステップにより得られ
    た翻訳結果とに基づいて、所定の出力データを生成して
    出力する出力ステップと、を具備することを特徴とする
    機械翻訳方法。
  6. 【請求項6】 前記出力ステップは、前記第一言語の文
    書のパラグラフと、当該パラグラフに対応する前記第二
    言語の文書のパラグラフとを交互に出力するステップか
    ら構成されることを特徴とする請求項5に記載の機械翻
    訳方法。
  7. 【請求項7】 前記出力ステップは、前記抽出ステップ
    において抽出された差分箇所に対応する前記第一言語の
    文書の所定の箇所を、前記翻訳手段の翻訳結果として得
    られた第二言語の文書に置き換えて出力するステップか
    ら構成されることを特徴とする請求項5に記載の機械翻
    訳方法。
  8. 【請求項8】 第一言語の文書を第二言語の文書に機械
    翻訳する機械翻訳方法において、 前記第一言語の文書を入力する入力ステップと、 翻訳不要表現の種類を利用者が指定するための指定ステ
    ップと、 前記指定ステップにおける指定結果に基づいて、前記入
    力ステップにおいて入力された文書中の翻訳不要表現に
    相当する箇所を、前記第一言語の文書に対する構文解析
    処理を含む処理により認識する認識ステップと、 前記認識ステップにおいて認識された翻訳不要部を除外
    して、前記第一言語の文書を翻訳する翻訳ステップと、 前記翻訳ステップにおいて得られた翻訳結果に基づいて
    所定の出力データを生成して出力する出力ステップと、
    を具備することを特徴とする機械翻訳方法。
JP10071985A 1998-03-20 1998-03-20 機械翻訳装置及び機械翻訳方法 Pending JPH11272671A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10071985A JPH11272671A (ja) 1998-03-20 1998-03-20 機械翻訳装置及び機械翻訳方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10071985A JPH11272671A (ja) 1998-03-20 1998-03-20 機械翻訳装置及び機械翻訳方法

Publications (1)

Publication Number Publication Date
JPH11272671A true JPH11272671A (ja) 1999-10-08

Family

ID=13476278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10071985A Pending JPH11272671A (ja) 1998-03-20 1998-03-20 機械翻訳装置及び機械翻訳方法

Country Status (1)

Country Link
JP (1) JPH11272671A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007055181A1 (ja) * 2005-11-11 2007-05-18 Matsushita Electric Industrial Co., Ltd. 対話支援装置
WO2012014918A1 (ja) * 2010-07-28 2012-02-02 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
US8793277B2 (en) 2010-03-29 2014-07-29 Ubic, Inc. Forensic system, forensic method, and forensic program
US8799317B2 (en) 2010-03-29 2014-08-05 Ubic, Inc. Forensic system, forensic method, and forensic program
WO2015079752A1 (ja) * 2013-11-28 2015-06-04 シャープ株式会社 翻訳装置、および翻訳装置の制御方法
JP2018195899A (ja) * 2017-05-15 2018-12-06 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007055181A1 (ja) * 2005-11-11 2007-05-18 Matsushita Electric Industrial Co., Ltd. 対話支援装置
US7505893B2 (en) 2005-11-11 2009-03-17 Panasonic Corporation Dialogue supporting apparatus
US8793277B2 (en) 2010-03-29 2014-07-29 Ubic, Inc. Forensic system, forensic method, and forensic program
US8799317B2 (en) 2010-03-29 2014-08-05 Ubic, Inc. Forensic system, forensic method, and forensic program
US9244920B2 (en) 2010-03-29 2016-01-26 Ubic, Inc. Forensic system, forensic method, and forensic program
WO2012014918A1 (ja) * 2010-07-28 2012-02-02 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP2012032859A (ja) * 2010-07-28 2012-02-16 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
CN102959578A (zh) * 2010-07-28 2013-03-06 Ubic股份有限公司 取证***、取证方法及取证程序
US8549037B2 (en) 2010-07-28 2013-10-01 Ubic, Inc. Forensic system, forensic method, and forensic program
WO2015079752A1 (ja) * 2013-11-28 2015-06-04 シャープ株式会社 翻訳装置、および翻訳装置の制御方法
JP2015106183A (ja) * 2013-11-28 2015-06-08 シャープ株式会社 翻訳装置、および翻訳装置の制御方法
JP2018195899A (ja) * 2017-05-15 2018-12-06 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Similar Documents

Publication Publication Date Title
US7774193B2 (en) Proofing of word collocation errors based on a comparison with collocations in a corpus
Atkins et al. Corpus design criteria
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
US5303150A (en) Wild-card word replacement system using a word dictionary
US7991609B2 (en) Web-based proofing and usage guidance
JP4504555B2 (ja) 翻訳支援システム
US7818173B2 (en) Information retrieval system, method, and program
US6286014B1 (en) Method and apparatus for acquiring a file to be linked
US20060149557A1 (en) Sentence displaying method, information processing system, and program product
US20070011160A1 (en) Literacy automation software
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
US8041556B2 (en) Chinese to english translation tool
JPH11272671A (ja) 機械翻訳装置及び機械翻訳方法
Hassel Evaluation of automatic text summarizaiton: a practical implementation
Pinnis et al. Tilde MT platform for developing client specific MT solutions
JP5186165B2 (ja) 組織名抽出装置、方法及びプログラム
Doyle et al. Preservation of original orthography in the construction of an Old Irish corpus
JPH0883280A (ja) 文書処理装置
Round et al. Automated parsing of interlinear glossed text from page images of grammatical descriptions
JP4010589B2 (ja) 文書検索システムおよび同システムに適用される検索文書提示方法
Maynard et al. MUSE: a MUlti-Source Entity recognition system
JP3973496B2 (ja) グループウェアにおけるユーザの対話支援装置
Somers Translation technologies and minority languages
JPH08115330A (ja) 類似文書検索方法および装置
KR20030068502A (ko) 번역 메모리를 이용한 번역 처리방법 및 이 번역소프트웨어를 기록한 판독 가능한 기록매체

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070327

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070724