JP4428266B2 - 翻訳装置およびプログラム - Google Patents

翻訳装置およびプログラム Download PDF

Info

Publication number
JP4428266B2
JP4428266B2 JP2005082048A JP2005082048A JP4428266B2 JP 4428266 B2 JP4428266 B2 JP 4428266B2 JP 2005082048 A JP2005082048 A JP 2005082048A JP 2005082048 A JP2005082048 A JP 2005082048A JP 4428266 B2 JP4428266 B2 JP 4428266B2
Authority
JP
Japan
Prior art keywords
translation
identifier
output
image
morpheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005082048A
Other languages
English (en)
Other versions
JP2006268151A (ja
Inventor
博 増市
道弘 田宗
昌俊 田川
紹明 劉
潔 田代
篤 伊藤
恭輔 石川
直子 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2005082048A priority Critical patent/JP4428266B2/ja
Priority to US11/216,160 priority patent/US8073678B2/en
Priority to CN2005101097096A priority patent/CN1838115B/zh
Publication of JP2006268151A publication Critical patent/JP2006268151A/ja
Application granted granted Critical
Publication of JP4428266B2 publication Critical patent/JP4428266B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Character Discrimination (AREA)

Description

本発明は、文章を異なる言語の文章に翻訳する技術に関する。
ある自然言語で記述された文章(原文)を他の自然言語の文章(翻訳文)に翻訳する機械翻訳の技術が研究されている。機械翻訳の適用例としては、例えば、特許文献1に開示された翻訳装置が知られている。この翻訳装置は、原文の記載された原稿を読み取って文字認識を行い、公知の機械翻訳手法を用いて原文を翻訳する。そして、翻訳文の画像をシート表面に形成して排出する。この技術によれば、キーボードなどを用いて原文を入力する手間がかからないから、手軽に翻訳文の印刷物を得ることができる。
特開昭62−154845号公報
しかし、上記の従来技術には以下のような問題がある。機械翻訳はある程度の時間を要する処理である。そのため、原稿の読み取りから翻訳文の出力までに待ち時間が生じる。この待ち時間は、全文の正確な翻訳文が欲しい場合には致し方のないものであるが、ユーザの望む翻訳のレベルは必ずしも全文の正確な翻訳であるとは限らない。例えば、全体のおおまかな内容が知りたい、特定の部分の正確な翻訳を行いたいなど、翻訳のニーズは多様である。いかなる場合にも無条件に全文の正確な翻訳を行うのは、ユーザに時間を浪費させることになりかねない。
本発明は、上述した背景の下になされたものであり、ユーザの所望する翻訳結果を最小限の時間で得ることのできる技術の提供を目的とする。
上述の課題を解決するために、本発明は、異種言語間で同じ意味の単語を対応付けて記憶した辞書と、原文を表すデータを入力する入力手段と、前記入力手段により入力された原文の文字列を認識する文字認識手段と、前記文字認識手段により認識された文字列を形態素に分割する形態素解析手段と、前記形態素解析手段により得られた形態素に対応する訳語を前記辞書から抽出する訳語抽出手段と、少なくとも前記原文の一部の訳語を表す画像を出力する訳語出力手段と、前記訳語出力手段により出力された画像において、ユーザの指定によって特定された訳語を認識する特定箇所認識手段と、前記特定箇所認識手段により認識された訳語に対応する形態素を含む原文を目的言語で記述された翻訳文に翻訳する翻訳手段とを有することを特徴とする翻訳装置を提供する。
また、本発明は、異種言語間で同じ意味の単語を対応付けて記憶した辞書と、原文を表すデータを入力する入力手段と、前記入力手段により入力された原文の文字列を認識する文字認識手段と、前記文字認識手段により認識された文字列を形態素に分割する形態素解析手段と、前記形態素解析手段により得られた形態素に対応する訳語を前記辞書から抽出する訳語抽出手段と、前記入力手段で入力されたデータに固有の識別子を付与する識別子付与手段と、少なくとも前記原文の一部の訳語および前記識別子を表す画像を出力する訳語出力手段と、前記訳語出力手段により出力された画像において、ユーザの指定によって特定された訳語を認識する特定箇所認識手段と、前記訳語出力手段により出力された画像において付与された前記識別子を認識する識別子認識手段と、前記識別子認識手段により認識された識別子に対応する原文のうち、前記特定箇所認識手段により認識された訳語に対応する原文を目的言語で記述された翻訳文に翻訳する翻訳手段とを有することを特徴とする翻訳装置を提供する。
また、本発明は、制御手段と、異種言語間で同じ意味の単語を対応付けて記憶した辞書とを有するコンピュータ装置に、前記制御手段が、原文を表すデータを入力するステップと、前記制御手段が、前記入力された原文の文字列を認識するステップと、前記制御手段が、前記認識された文字列を形態素に分割するステップと、前記制御手段が、前記形態素に対応する訳語を前記辞書から抽出するステップと、前記制御手段が、少なくとも前記原文の一部の訳語を表す画像を出力するステップと、前記制御手段が、前記出力された画像において、ユーザの指定によって特定された訳語を認識するステップと、前記制御手段が、前記認識された訳語に対応する形態素を含む原文を目的言語で記述された翻訳文に翻訳するステップとを実行させるためのプログラムを提供する。
この翻訳装置またはプログラムによれば、原文を表すデータが入力され、原文の一部の訳語が出力される。そして、訳語の画像において特定された箇所の翻訳文が生成される。
本発明によれば、ユーザの所望する翻訳結果を最小限の時間で得ることができる。
以下、図面を参照して、本発明の実施形態について説明する。
<構成>
翻訳装置1は、入力された原文を翻訳して目的言語の翻訳文を得る翻訳機能と、原稿を読み取って複製物を作成する複写機能とを有している。
まず、翻訳装置1のハードウェア構成について説明する。図1は、本発明の実施形態における翻訳装置1のハードウェア構成を示す図である。
翻訳装置1は、図示しないCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等(いずれも図示省略)からなる制御部4を有し、ROMに格納されているOS(Operating System)プログラムをCPUが実行することによって翻訳装置1各部の制御を行う。
記憶部5は、ハードディスク装置等の不揮発性メモリである。記憶部5には、異種言語間で同じ意味の単語を対応付けて記憶した辞書51が格納されている。また、記憶部5には、原稿の読取、翻訳、出力等の手順を記述したプログラムが記憶されている。
指示入力部41は、テンキー、スタートボタン等からなるキーボード40、タッチパネル機能を有する液晶パネルからなる表示部39を備えており、翻訳装置1に対する指示をユーザが入力することができる。また、翻訳装置1に異常等が発生した場合に、表示部39に翻訳装置1の状態に関する情報を表示することができる。
給紙トレイ9には画像を形成するためのシート10が収容される。ユーザが指示入力部41により画像形成の指示を入力すると、給紙ローラ33が回転駆動され、給紙トレイ9からシート10を1枚ずつ送り出す。給紙トレイ9から送り出されたシート10はローラ対34、35、37によって搬送路36に沿って搬送される。
画像入力部12は、原稿を光学的に読み取って、この原稿の画像を表す画像データを生成するスキャナ装置である。プラテンガラス2上に載置された原稿に対して光源13により光が照射され、その反射光が光学系3によって処理される。反射光は、ミラー14、15、16を介して受光部17で受光される。そして、画像処理部18が反射光を電気信号に変換し、イエロー、マゼンタ、シアン、ブラックの各色からなる画像データを生成する。
画像形成部6は、画像形成エンジン7Y、7M、7C、7K、転写ベルト8等からなる。
画像形成エンジン7Y、7M、7C、7Kは、それぞれイエロー(Y)、マゼンタ(M)、シアン(C)、ブラック(K)の各色のトナー像を形成する。各画像形成エンジンの構成は共通であるから、ここでは画像形成エンジン7Yについてのみ説明する。
画像形成エンジン7Yは、静電潜像が形成される像担持体としての感光体ドラム20Yの周囲に、帯電装置21Y、露光装置19Y、現像装置22Y、クリーナ24Y等を設けて構成されている。
帯電装置21Yは、矢印Aの方向に回転駆動される感光体ドラム20Yの表面を所定の電位に帯電させる。
露光装置19Yは、所定の電位に帯電した感光体ドラム2Yに対して、画像データに基づいた露光用ビームLBを照射するROS(Raster Output Scanner)である。露光装置19Yは、図示しない半導体レーザーから画像データに基づいてレーザー光を出射し、このレーザー光を偏向走査することにより感光体ドラム20Yの表面に静電潜像を形成する。感光体ドラム20Yの表面では、レーザー光が照射された部分の電位が、感光体ドラム20Yの有する光導電性により所定のレベルまで減少する。このように、感光体ドラム20Yの表面電位が変化することにより、感光体ドラム20Yの表面には画像データにもとづいた静電潜像が形成される。
現像装置22Yは、感光体ドラム20Y表面に形成された静電潜像を顕像化する装置である。トナータンク23Yからはトナー(帯電色材)が供給され、感光体ドラム20Yの帯電極性と同極性に帯電したトナーによって静電潜像を反転現像することによってトナー像を得る。
転写ベルト8は、ローラ26、27、28、29に張架されており、矢印Bの方向に循環駆動される。感光体ドラム20Yはその下方に位置する転写ベルト8と圧接しており、上記のようにして形成されたトナー像が転写ベルト8に転写される。
クリーナ24Yは、感光体ドラム20Yに残存したトナーを除去する装置である。
以上が画像形成エンジン7Yの構成である。画像形成エンジン7M、7C、7Kにおいても各色に対応したトナー像が形成され、転写ベルト8に重ねて転写される。なお、これ以降、画像形成エンジン7Y、7M、7C、7Kを区別する必要のない場合には、単に画像形成エンジン7と称する。他の構成要素についても同様に、Y、M、C、Kの別を区別する必要のない場合には、Y、M、C、Kの表記を省略するものとする。
給紙トレイ9から搬送路36上に送り出されたシート10は、転写ベルト8と転写ローラ30とが形成するニップ部に進入し、転写ベルト8に圧接される。この圧接力および静電吸引力によってトナー像がシート10の表面に転写される。
トナー像が転写されたシート10は、ローラ対31によって定着装置11に導かれる。定着装置11においては、シート10に対して加圧および加熱が施され、トナー像がシート10に定着される。このようにして画像形成が行われたシート10は、排紙トレイ32に排出される。
次に、翻訳装置1の機能構成について説明する。図2は、翻訳装置1の機能構成を表す図である。CPUが記憶部5に記憶されているプログラムを実行することによってこれらの機能が実現される。
入力手段101は、原文の記載された原稿を読み取る手段であり、図1の画像入力部12によって原稿の読み取りが行われる。
文字認識手段102は、読取手段101で読み取られた原稿に記載されている原文の文字列を認識する。記憶部5には公知のOCR(Optical Character Recognition)プログラムが記憶されており、CPUがこのOCRプログラムを実行することによって文字認識が行われる。
形態素解析手段103は、文字認識手段102により認識された文字列を形態素(単語等)に分割する。形態素解析手段103は、当該文字列に該当する単語を記憶部5に格納されている辞書51から抽出する。また、辞書51には、単語ごとに自立語/付属語の区別が記憶されており、これによってCPUが単語の自立語/付属語の区別を認識することができる。
訳語抽出手段104は、形態素解析手段103により得られた形態素群に対応する訳語を辞書51から抽出する。また、このとき、原稿に固有の識別子(以下、「原稿識別子」という)を与え(識別子付与手段201)、この原稿識別子を原文の形態素群および訳語群と対応付けて記憶部5に記憶させておく(訳語記憶手段202)。この原稿識別子は、英数字の文字列など、原稿を一意に識別できるものであればどのようなものでもよい。
訳語出力手段105は、訳語抽出手段104で抽出された訳語および原文のうち少なくとも自立語である訳語を表す画像を出力する。具体的には、訳語出力手段105は、画像形成部6によって、シート表面にこの画像を形成して、シートを排紙トレイ32に排出する。自立語は、名詞、動詞、形容詞などの単語であり、単独で文節を構成することのできる語である。これに対して付属語は、助詞、助動詞などの単語であり、単独では文節を構成することができない。本発明の発明者は、少なくとも自立語である訳語を得ることによって、未知の言語で記述された文章の内容をおおまかに把握することができるということに着目した。そのため、本発明の翻訳装置1は、自立語である訳語を出力することを特徴としている。
訳語出力手段105による画像の出力レイアウトは任意であるが、図3(b)に示すように、原文を元原稿(図3(a)参照)と同一のレイアウトとし、原文の行間に各自立語に対応する訳語を配置するのが好ましい。また、このとき、前述の原稿識別子を例えばシートの右上端部などに出力しておく。
特定箇所認識手段106は、訳語出力手段105により出力された訳語または原文の画像において、特定された箇所を認識する。ここで、「特定された箇所」とは、ユーザが訳語を見て、翻訳が必要であると判断した箇所である。ユーザは、翻訳が必要であると判断した箇所を例えば蛍光ペンなどを用いて図3(c)に示すようにシート上にマーキングする。このとき、訳語または原文のいずれをマーキングしてもよい。そしてユーザは、このシートをプラテンガラス2上に載置し、画像入力部12によって画像を読み取らせる。画像入力部12は、読み取った画像中において特定の色で塗色が施された箇所を認識する。このようにして、特定箇所認識手段106は、翻訳対象箇所を認識する。また、ここで読み取られた画像から前述の原稿識別子を認識し(識別子入力手段203)、この原稿識別子に対応する原文の形態素群および訳語群を記憶部5から読み出す(訳語読出手段204)。
翻訳手段107は、特定箇所認識手段106により認識された翻訳対象箇所の原文を翻訳して目的言語で記述された翻訳文を生成する。具体的には、例えば公知の構文解析手法、意味解析手法を用いて原文の構文を解析して構文木を作成し、目的言語における構文木に変換する。そして、各形態素に対応する訳語をあてはめて翻訳文を生成する。
翻訳文出力手段108は、翻訳手段107により生成された翻訳文を出力する。具体的には、翻訳文の画像を画像形成部6によりシート表面に形成して、このシートを排紙トレイ32に排出する。
<動作>
次に、翻訳装置1の動作について説明する。ここで、翻訳装置1には電源が投入されており、CPUがプログラムを実行中であるものとする。図4は、翻訳装置1の動作のフローを示す図である。
最初にステップA01では、CPUは、入力手段101を用いて、原文の記載された原稿の読み取りを行う。原稿の例を図3(a)に示す。ユーザは、原稿の読み取り面がプラテンガラス2に接するように原稿を載置し、指示入力部41のスタートボタンを押下する。すると、翻訳装置1の画像入力部12が原稿の読み取りを開始する。画像入力部12は、読み取った原稿の画像データを生成し、記憶部5に記憶する。
次に、ステップA02では、CPUは、文字認識手段102を用いて、原稿に記載されている文字の認識を行う。ステップA03では、CPUは、形態素解析手段103を用いて、ステップA02で認識された文字列を形態素に分割する。
ステップA04では、CPUは、訳語抽出手段104を用いて、ステップA03で得られた形態素に対応する訳語を辞書51から抽出する。また、CPUは、識別子付与手段201を用いて、原稿に固有の識別子を付与する。図3(b)の例では、識別子として「x49f」という文字列が与えられている。そして、CPUは、当該原稿に付与された識別子、原文を構成する形態素群、各形態素に対応する訳語を対応付けて記憶部5に記憶させる。
ステップA05では、CPUは、訳語出力手段106を用いて、自立語の訳語を表す画像を出力する。画像の出力例を図3(b)に示す。また、シートの右上端部には、原稿識別子が出力される。
ユーザは、訳語の出力されたシートを見て翻訳の必要な箇所を判断し、当該箇所を蛍光ペンなどを用いてマーキングする。マーキングされたシートの例を図3(c)に示す。この例では、「A whale belongs to the Mammalia.」の部分がマーキングされている。
訳語の出力に続いて、ステップA06では、CPUは、原文の全文の翻訳処理を行う。また、ステップA06の処理と並行して、ステップA07では、CPUは、ユーザにより翻訳指示が入力されたか否かを判断する。
ユーザが翻訳対象箇所をマーキングしたシート(図3(c)参照)をプラテンガラス2上に載置し、指示入力部41より翻訳指示を入力すると(ステップA07:YES)、CPUはステップA08の処理を行う。ステップA08では、CPUは、読取手段101によってシート上の画像を読み取り、特定箇所認識手段106を用いてマーキングの箇所を認識する。また、CPUは、シート上の画像から原稿識別子を認識し、この原稿識別子に対応する原文の形態素群と訳語群を記憶部5から読み出す。
ステップA09では、CPUは、マーキングされた箇所、すなわち翻訳対象箇所の翻訳が完了しているか否かを判断する。翻訳対象箇所の翻訳が完了している場合(ステップA09:YES)には、ステップA11に進む。完了していない場合(ステップA09:NO)には、ステップA10に進み、翻訳対象箇所の残りの部分の翻訳処理を行う。
そして、ステップA11では、CPUは、翻訳文出力手段108を用いて、翻訳文の出力を行う。翻訳文の出力例を図3(d)に示す。翻訳結果は、「鯨は哺乳類に属する。」となる。
以上が翻訳装置1の動作である。
以上説明したように、本発明の翻訳装置1によれば、ユーザが自立語の訳語を見て原文のおおまかな内容を把握し、翻訳対象箇所を指定し、指定された箇所のみ翻訳文を出力する。従って、ユーザが所望する翻訳結果を最小限の時間で得ることができる。また、翻訳対象箇所を指定して翻訳指示を入力するまでの間に翻訳装置1が全文の翻訳処理を行っているから、ユーザの待ち時間を最小限に抑えることができる。
<変形例>
以上説明した形態に限らず、本発明は種々の形態で実施可能である。例えば、上述の実施形態を以下のように変形した形態でも実施可能である。
上述の実施形態では、訳語出力に続いて原文の翻訳処理を行う(ステップA05〜A06)例を示したが、ステップA06の翻訳処理を行わずに、ステップA08で認識された翻訳対象箇所のみ翻訳を行うようにしてもよい。
上述の実施形態では、訳語の画像をシートに形成して出力し、ユーザが翻訳対象箇所をマーキングする例を示したが、以下に示す態様でもよい。すなわち、翻訳装置1に液晶パネル等の表示装置とマウス等のポインティングデバイスを設け、この表示装置の画面に自立語である訳語の画像を表示させる。ユーザは、ポインティングデバイスを用いて画面上で翻訳対象箇所を指定し、翻訳装置1に翻訳指示を入力する。このようにすれば、自立語である訳語の出力や翻訳対象箇所の認識に要する時間を短縮することができる。また、自立語である訳語の出力にシートを用いないので、シートの消費を少なくすることができる。
上述の実施形態では、原文の行間に自立語である訳語を配置して出力する例を示したが、原文は出力せず、自立語である訳語のみ出力するようにしてもよい。また、ページの上半部に原文を配置し、下半部に自立語である訳語をまとめて配置するようにしてもよい。
また、上述の実施形態では、蛍光ペンなどを用いて翻訳対象箇所をマーキングする例を示したが、画像解析によって対象箇所を判別することができるならばいかなる態様でマーキングしてもよい。例えば、アンダーラインを用いてもよい。
画像入力部12は、翻訳装置1にネットワークを介して接続された別体のスキャナ装置であってもよい。また、画像形成部6は、翻訳装置1にネットワークを介して接続された別体のプリンタ装置であってもよい。
翻訳装置1のハードウェア構成を示す図である。 翻訳装置1の機能構成を表す図である。 原文、訳語、翻訳文の出力例を示す図である。 翻訳装置1の動作のフローを示す図である。
符号の説明
1…翻訳装置、4…制御部、5…記憶部、51…辞書、41…指示入力部、9…給紙トレイ、10…シート、12…画像入力部、6…画像形成部、7Y、7M、7C、7K…画像形成エンジン、8…転写ベルト、101…入力手段、102…文字認識手段、103…形態素解析手段、104…訳語抽出手段、105…訳語出力手段、106…特定箇所認識手段、107…翻訳手段、108…翻訳文出力手段、201…識別子付与手段、202…訳語記憶手段、203…識別子入力手段、204…訳語読出手段。

Claims (9)

  1. 異種言語間で同じ意味の単語を対応付けて記憶した辞書と、
    原文を表すデータを入力する入力手段と、
    前記入力手段により入力された原文の文字列を認識する文字認識手段と、
    前記文字認識手段により認識された文字列を形態素に分割する形態素解析手段と、
    前記形態素解析手段により得られた形態素に対応する訳語を前記辞書から抽出する訳語抽出手段と、
    少なくとも前記原文の一部の訳語を表す画像を出力する訳語出力手段と、
    前記訳語出力手段により出力された画像において、ユーザの指定によって特定された訳語を認識する特定箇所認識手段と、
    前記特定箇所認識手段により認識された訳語に対応する形態素を含む原文を目的言語で記述された翻訳文に翻訳する翻訳手段と
    を有することを特徴とする翻訳装置。
  2. 前記入力手段で入力されたデータに固有の識別子を付与する識別子付与手段を有し、
    前記訳語出力手段が、少なくとも前記訳語の一部および前記識別子を表す画像を出力し、
    前記訳語出力手段により出力された画像において前記識別子を認識する識別子認識手段を有し、
    前記翻訳手段が、前記識別子認識手段により認識された識別子に対応する原文のうち、前記特定箇所認識手段により認識された訳語に対応する原文を目的言語で記述された翻訳文に翻訳する
    ことを特徴とする請求項1に記載の翻訳装置。
  3. 前記翻訳手段は、前記訳語出力手段による訳語の出力後、直ちに前記原文の全文の翻訳処理を開始することを特徴とする請求項1に記載の翻訳装置。
  4. 前記訳語出力手段は、前記原文の行間に前記訳語を配置した画像を出力することを特徴とする請求項1に記載の翻訳装置。
  5. 前記訳語出力手段により出力された画像をシート表面に形成する画像形成手段を有し、
    前記特定箇所認識手段は、前記シート表面の画像を読み取って、所定の方法でマーキングされた箇所を認識する
    ことを特徴とする請求項1に記載の翻訳装置。
  6. 前記訳語出力手段により出力された画像を表示する表示手段を有し、
    前記特定箇所認識手段は、前記表示手段で表示された画像上で特定された箇所を認識する
    ことを特徴とする請求項1に記載の翻訳装置。
  7. 前記形態素解析手段で得られた形態素群と、前記訳語抽出手段で得られた訳語群と、前記識別子付与手段で付与された識別子とを対応付けて記憶する訳語記憶手段と、
    前記識別子を入力する識別子入力手段と、
    前記識別子入力手段により前記識別子が入力された場合に、前記訳語記憶手段内の記憶内容を参照して、該識別子に対応する形態素群と訳語群とを該訳語記憶手段から読み出して前記翻訳手段に供給する訳語読出手段と
    を有し、
    前記翻訳手段は、前記特定箇所認識手段により認識された訳語に対応する形態素を含む原文を、前記訳語読出手段から供給される形態素群と訳語群とに基づいて該原文に含まれる形態素に対応する訳語をあてはめることによって、目的語で記述された翻訳文に翻訳する
    求項に記載の翻訳装置。
  8. 異種言語間で同じ意味の単語を対応付けて記憶した辞書と、
    原文を表すデータを入力する入力手段と、
    前記入力手段により入力された原文の文字列を認識する文字認識手段と、
    前記文字認識手段により認識された文字列を形態素に分割する形態素解析手段と、
    前記形態素解析手段により得られた形態素に対応する訳語を前記辞書から抽出する訳語抽出手段と、
    前記入力手段で入力されたデータに固有の識別子を付与する識別子付与手段と、
    少なくとも前記原文の一部の訳語および前記識別子を表す画像を出力する訳語出力手段と、
    前記訳語出力手段により出力された画像において、ユーザの指定によって特定された訳語を認識する特定箇所認識手段と、
    前記訳語出力手段により出力された画像において付与された前記識別子を認識する識別子認識手段と、
    前記識別子認識手段により認識された識別子に対応する原文のうち、前記特定箇所認識手段により認識された訳語に対応する原文を目的言語で記述された翻訳文に翻訳する翻訳手段と
    を有することを特徴とする翻訳装置。
  9. 制御手段と、異種言語間で同じ意味の単語を対応付けて記憶した辞書とを有するコンピュータ装置に、
    前記制御手段が、原文を表すデータを入力するステップと、
    前記制御手段が、前記入力された原文の文字列を認識するステップと、
    前記制御手段が、前記認識された文字列を形態素に分割するステップと、
    前記制御手段が、前記形態素に対応する訳語を前記辞書から抽出するステップと、
    前記制御手段が、少なくとも前記原文の一部の訳語を表す画像を出力するステップと、
    前記制御手段が、前記出力された画像において、ユーザの指定によって特定された訳語を認識するステップと、
    前記制御手段が、前記認識された訳語に対応する形態素を含む原文を目的言語で記述された翻訳文に翻訳するステップと
    を実行させるためのプログラム。
JP2005082048A 2005-03-22 2005-03-22 翻訳装置およびプログラム Expired - Fee Related JP4428266B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005082048A JP4428266B2 (ja) 2005-03-22 2005-03-22 翻訳装置およびプログラム
US11/216,160 US8073678B2 (en) 2005-03-22 2005-09-01 Translation device, translation method, and storage medium
CN2005101097096A CN1838115B (zh) 2005-03-22 2005-09-15 翻译设备和翻译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005082048A JP4428266B2 (ja) 2005-03-22 2005-03-22 翻訳装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2006268151A JP2006268151A (ja) 2006-10-05
JP4428266B2 true JP4428266B2 (ja) 2010-03-10

Family

ID=37015513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005082048A Expired - Fee Related JP4428266B2 (ja) 2005-03-22 2005-03-22 翻訳装置およびプログラム

Country Status (3)

Country Link
US (1) US8073678B2 (ja)
JP (1) JP4428266B2 (ja)
CN (1) CN1838115B (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8126700B2 (en) * 2006-03-29 2012-02-28 International Business Machines Corporation Computer-assisted comprehension of texts
JP4483909B2 (ja) * 2007-08-24 2010-06-16 富士ゼロックス株式会社 翻訳装置及びプログラム
US7792785B2 (en) * 2007-11-01 2010-09-07 International Business Machines Corporation Translating text into visual imagery content
JP4626777B2 (ja) * 2008-03-14 2011-02-09 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US20090287471A1 (en) * 2008-05-16 2009-11-19 Bennett James D Support for international search terms - translate as you search
KR101588890B1 (ko) * 2008-07-10 2016-01-27 삼성전자주식회사 카메라 기반 영상의 문자 인식 및 번역 방법
JP4948586B2 (ja) 2009-11-06 2012-06-06 シャープ株式会社 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体
JP5058280B2 (ja) 2010-03-12 2012-10-24 シャープ株式会社 翻訳装置、翻訳方法及びコンピュータプログラム
US20110282647A1 (en) * 2010-05-12 2011-11-17 IQTRANSLATE.COM S.r.l. Translation System and Method
US9767095B2 (en) 2010-05-21 2017-09-19 Western Standard Publishing Company, Inc. Apparatus, system, and method for computer aided translation
JP5124001B2 (ja) * 2010-09-08 2013-01-23 シャープ株式会社 翻訳装置、翻訳方法、コンピュータプログラムおよび記録媒体
US8538742B2 (en) * 2011-05-20 2013-09-17 Google Inc. Feed translation for a social network
US9304712B2 (en) * 2011-10-10 2016-04-05 Alcatel Lucent Automated word substitution for contextual language learning
CN103176966A (zh) * 2011-12-22 2013-06-26 苏州威世博知识产权服务有限公司 一种实现专利基本信息翻译的方法及***
CN102609408B (zh) * 2012-01-11 2014-11-26 清华大学 基于多文种文档图像识别的跨文种理解方法
CN104123552B (zh) * 2013-04-28 2017-08-22 浙江大学 一种可以自动识别的翻译眼镜
JP2015069365A (ja) * 2013-09-27 2015-04-13 シャープ株式会社 情報処理装置、および制御プログラム
US9690780B2 (en) * 2014-05-23 2017-06-27 International Business Machines Corporation Document translation based on predictive use
CN104679737A (zh) * 2015-03-12 2015-06-03 张运泉 基于移动终端的文本信息的翻译处理方法和移动终端
CN112632282B (zh) * 2020-12-30 2021-11-19 中科院计算技术研究所大数据研究院 一种中英文论文数据分类与查询方法

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5727367A (en) * 1980-07-23 1982-02-13 Sharp Corp Electronic translator
DE3616751A1 (de) * 1985-05-20 1986-11-20 Sharp K.K., Osaka Uebersetzungssystem
JPH0797798B2 (ja) 1985-12-26 1995-10-18 株式会社リコー 翻訳機能を設けた多数色画像形成装置
JPH0743719B2 (ja) * 1986-05-20 1995-05-15 シャープ株式会社 機械翻訳装置
JPS63109591A (ja) 1986-10-27 1988-05-14 Sharp Corp 光学的文字読取装置
JP2758952B2 (ja) * 1989-12-28 1998-05-28 富士通株式会社 日本語文書読取翻訳システムの修正時における表示方式
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
JPH05263212A (ja) * 1992-03-16 1993-10-12 Toshiba Corp 耐熱被覆
US5517409A (en) * 1992-03-24 1996-05-14 Ricoh Company, Ltd. Image forming apparatus and method having efficient translation function
JPH05314175A (ja) * 1992-05-13 1993-11-26 Ricoh Co Ltd 対訳画像形成装置
JPH0765012A (ja) 1993-08-27 1995-03-10 Ricoh Co Ltd 対訳画像形成装置
JPH0863478A (ja) * 1994-08-26 1996-03-08 Toshiba Corp 言語処理方法及び言語処理装置
JP3161942B2 (ja) 1995-06-14 2001-04-25 シャープ株式会社 訳振り機械翻訳装置
JP3952216B2 (ja) * 1995-11-27 2007-08-01 富士通株式会社 翻訳装置及び辞書検索装置
JPH09284446A (ja) 1996-04-18 1997-10-31 Ricoh Co Ltd 情報処理装置およびデジタル複写機および情報記憶媒体
US6470306B1 (en) * 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
JP3182362B2 (ja) 1997-02-07 2001-07-03 松下電器産業株式会社 簡易ファイリング装置
JPH11120185A (ja) * 1997-10-09 1999-04-30 Canon Inc 情報処理装置及びその方法
ITUD980032A1 (it) * 1998-03-03 1998-06-03 Agostini Organizzazione Srl D Sistema di traduzione a macchina e rispettivo tradsistema di traduzione a macchina e rispettivo traduttore che comprende tale sistema uttore che comprende tale sistema
US20010032070A1 (en) * 2000-01-10 2001-10-18 Mordechai Teicher Apparatus and method for translating visual text
US7216072B2 (en) * 2000-02-29 2007-05-08 Fujitsu Limited Relay device, server device, terminal device, and translation server system utilizing these devices
US20020041290A1 (en) * 2000-10-06 2002-04-11 International Business Machines Corporation Extending the GUI desktop/paper metaphor to incorporate physical paper input
JP3379090B2 (ja) * 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US20030040899A1 (en) * 2001-08-13 2003-02-27 Ogilvie John W.L. Tools and techniques for reader-guided incremental immersion in a foreign language text
US7398198B2 (en) * 2003-10-16 2008-07-08 Translation Science Llc System and method of identifying a translation resource
JP3840206B2 (ja) 2003-06-23 2006-11-01 株式会社東芝 複写機における翻訳方法及びプログラム
US7826101B2 (en) * 2003-06-25 2010-11-02 Ricoh Company, Ltd. Document management method, document management program, recording medium, and document management apparatus
JP4322169B2 (ja) * 2003-07-16 2009-08-26 株式会社リコー 文書処理システム、文書処理方法、文書処理プログラム

Also Published As

Publication number Publication date
CN1838115A (zh) 2006-09-27
US8073678B2 (en) 2011-12-06
JP2006268151A (ja) 2006-10-05
CN1838115B (zh) 2011-04-13
US20060217961A1 (en) 2006-09-28

Similar Documents

Publication Publication Date Title
JP4428266B2 (ja) 翻訳装置およびプログラム
JP4325577B2 (ja) 翻訳装置およびプログラム
JPH05314175A (ja) 対訳画像形成装置
US9529792B2 (en) Glossary management device, glossary management system, and recording medium for glossary generation
JP2006276903A (ja) 文書処理装置
JP2006276918A (ja) 翻訳装置、翻訳方法およびプログラム
JP4419891B2 (ja) 翻訳装置、翻訳方法およびプログラム
JP4852918B2 (ja) 翻訳装置、翻訳方法およびプログラム
JP2006276905A (ja) 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
US9876916B1 (en) Image forming apparatus that image-forms result of proofreading process with respect to sentence
JPH0765012A (ja) 対訳画像形成装置
Aloraini et al. Data augmentation methods for anaphoric zero pronouns
JP2007086867A (ja) 翻訳装置、翻訳方法およびプログラム
JP3269842B2 (ja) 対訳画像形成装置
US10839272B2 (en) Image forming apparatus that prints image forming data including sentences in plurality of languages, on recording medium
JP2006349836A (ja) 文書処理装置
JP5632213B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JPH05324704A (ja) 対訳画像形成装置
JP2011257946A (ja) 画像処理装置、画像処理方法およびコンピュータプログラム
Ogrodniczuk Fine-Tuning OCR Error Detection and Correction in a Polish Corpus of Scientific Abstracts
JP2023091261A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2020178168A (ja) 画像形成装置
JP2024006384A (ja) 情報処理装置、及び情報処理プログラム
Kupść Aspect assignment in a knowledge-based english-polish machine translation system
Rauff Machine translation with two-level grammars

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121225

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4428266

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121225

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131225

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees
S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350