JP2002132765A - 翻訳システム - Google Patents

翻訳システム

Info

Publication number
JP2002132765A
JP2002132765A JP2000330449A JP2000330449A JP2002132765A JP 2002132765 A JP2002132765 A JP 2002132765A JP 2000330449 A JP2000330449 A JP 2000330449A JP 2000330449 A JP2000330449 A JP 2000330449A JP 2002132765 A JP2002132765 A JP 2002132765A
Authority
JP
Japan
Prior art keywords
translation
code
word
character recognition
source language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000330449A
Other languages
English (en)
Inventor
Masaaki Toyoda
将哲 豊田
Toshiaki Morita
敏昭 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2000330449A priority Critical patent/JP2002132765A/ja
Publication of JP2002132765A publication Critical patent/JP2002132765A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 文字認識部と翻訳部との間のデータ授受をテ
キストデータを介さずに行うことにより、テキストデー
タ保存に必要なメモリを削減すると共に、翻訳処理に必
要なステップ数を全体として減らして翻訳処理時間の短
縮を図る。 【解決手段】 翻訳システムは、スキャナ12と、文字認
識部13と、文字認識部とリンクしたデータ授受のプロト
コルが決められている翻訳部15を備える。文字認識部13
は、認識した文字列から単語を抽出した後、エンコード
テーブルを参照して、抽出した単語をコード14に変換す
る。翻訳部15は、文字認識部13からコード14を受け取る
と、このコードを見出し語のアドレスとして用いて翻訳
用の辞書を引き、さらに所定の解析処理をして訳文を作
成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、スキャナで読み
取ったソース言語のデータをターゲット言語に翻訳する
翻訳システムと、この翻訳システムのために使用される
プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】現在、スキャナにて取り込んだ情報から
文字を抽出してテキストデータとして出力する文字認識
ソフトウェアOCR(オー・シー・アール:Optical ch
aracter recognitionまたはOptical character reader)
がある。また、テキストデータを用いて英語から日本語
に翻訳するソフトウェアも普及している。OCRで取り
込んだ英文を翻訳ソフトにかける場合、OCRで出力さ
れたテキストデータを翻訳ソフトに入力し、翻訳ソフト
側で、単語、句、節、文と判定し、翻訳している。ま
た、専門分野の翻訳については、専用辞書を追加する事
により、精度の高い翻訳を実現している。
【0003】英日翻訳の場合、必要な単語として約13
万語であり、また専門分野として約53万語必要とされ
る。
【0004】次に、図8〜11を用いて、文字認識ソフ
トウェアOCRと翻訳ソフトウェアとを搭載したコンピ
ュータとこれに接続されたスキャナとからなる従来の翻
訳システムを説明する。図8は従来の翻訳システムの要
部の概略構成図であり、図9,10,11はその翻訳シ
ステムで実行される処理のフローチャートである。英日
翻訳の場合、まず、パーソナルコンピュータ(以下、P
C)1に接続されたスキャナ2により、英文原稿を読み
取る。そして、文字認識部(以下、OCR)3では、英
文原稿の画像データからテキストデータ4を生成する。
続いて、翻訳部5は、入カデータとして上記テキストデ
ータ4を取り込み、日本文に変換したテキストデータ6
を生成する。
【0005】次に、OCR3での処理を図9を用いて説
明する。まず画像データを取り込む(S1)。次に、レ
イアウト解析(S2)にて、取り込んだ画像から文字の
部分を見つけて、読む順序を決める。レイアウト解析
(S2)にて見つけた文字のかたまりを1行毎に切り出
す(S3)。次に、その1行に注目し、1文字毎に分解
し、切り出す(S4)。次に、切り出された文字に対し
て、1文字毎に文字認識を行う(S5)。
【0006】図10にステップS5で行われる文字認識
のサブルーチンを示す。文字の大きさ、文字の字体、文
字のつぶれやかすれ、などは文書によって異なってい
る。これらの変動に対して、正確に文字の認識を行う為
に、正規化(S501)、特徴抽出(S502)、マッ
チング(S503)が文字認識サブルーチンにおいて行
われる。マッチング(S503)においては、標準パタ
ーン7を使用してパターンマッチングを行い、文字の認
識を行う。
【0007】このような文字認識サブルーチンによる処
理後、図9のメインルーチンに戻り、ASCIIコード
に変換し(S6)、知識処理を行う(S7)。知識処理
とは、認識された文字列から、漢字列やカタカナ列など
を抜き出し、その部分をあらかじめ登録している単語辞
書8と照合して、誤読した部分を自動的に訂正する処理
である。次に、ASCIIコードをデコードして(S
8)、ソース言語のテキストデータを生成する(S
9)。最近では、インターネットなどの急速な普及もあ
り、マイクロソフト社のワープロソフト「Word」の
フォーマットであるRTF(Rich Text Format)や、イ
ンターネットでの記述言語であるHTML(Hyper Text
Markup Language)の形でデータが生成されるのが一般
化している。
【0008】次に、翻訳部5での処理フローについて図
11を用いて説明する。まず、ソース言語のテキストデ
ータを取り込む(S10)。次に、取り込んだテキスト
データをASCIIコードに変換(S11)した後、こ
のコードを解釈して翻訳用辞書の見出し語のアドレスを
発生し、辞書引き(S12)を行う。この辞書引き処理
とは、原文にある単語の意味、および文法情報を辞書か
ら取り出す処理である。続いて、辞書から引いた語につ
いて、更にどのような要素が接続されているかを解析す
る形態素解析を行う(S13)。そして、どの単語が主
語であり,どの単語が述語であるかなど、文を構成する
単語の関係を解析する構文解析を行う(S14)。この
構文解析の結果に従って、最終的な訳文(ターゲット言
語のテキストデータ)を生成する(S15)。さらに、
ASCIIコードをデコードして(S16)、ソース言
語のテキストデータを生成し(つまり、原文を再生し)
(S17)、訳文と一緒にモニタに表示したり、ファイ
ルに保存する。
【0009】
【発明が解決しようとする課題】上述した従来の翻訳シ
ステムでは、図8にはっきりと示すように、原稿の読み
取りから翻訳開始までにテキストデータが介在している
ため、メモリが消費されることになる。さらに、翻訳ソ
フト側では、翻訳用の辞書を引くためのアドレスを発生
するために、OCR部から受け取ったテキストデータを
一旦ASCIIコードに変換し、訳文生成後に、原文の
表示あるいは保存用に、ASCIIコードをデコードし
て再度テキストデータに戻す処理を行っているため、翻
訳処理に時間がかかる。
【0010】この発明は、以上の点に鑑み、スキャナで
取り込んだ文を翻訳する場合、文字認識部と翻訳部との
間のデータ授受をテキストデータを介さずに行うことに
より、テキストデータ保存に必要なメモリを削減でき、
また、翻訳処理に必要なステップ数を全体として減らし
て翻訳処理時間の短縮もできる翻訳システムを提供する
ことを第1の目的とする。さらに、そのようなシステム
を実現するための文字認識プログラムならびに翻訳プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
を提供することを第2の目的とする。
【0011】
【課題を解決するための手段】上記第1の目的を達成す
るため、本発明の翻訳システムは、スキャナと、上記ス
キャナにより取り込んだソース言語の文字列を含む画像
データに対して文字認識処理を行う文字認識部と、上記
文字認識部とリンクしたデータ授受のプロトコルが決め
られており、上記文字認識部から受け取ったデータをタ
ーゲット言語に翻訳する翻訳部とを備えたことを特徴と
している。
【0012】翻訳部では、文字認識部とリンクしたデー
タ授受のプロトコルが決められているため、文字認識部
からの原文を表すデータをテキストファイルを介さずに
取り込むことができる。よって、従来は必要であった文
字認識部でのテキストデータを生成する処理(デコード
処理)が不要となる。したがって、その分、文字認識か
ら訳文生成までに要する時間が全体として短縮される。
さらに、従来は必要であったこのようなテキストデータ
を保存しておくためのメモリーも不要となる。
【0013】一実施形態では、上記データ授受のプロト
コルは、ソース言語の単語を表すコードを含んでおり、
上記翻訳部は、上記文字認識部から上記コードを受け取
ると、このコードを見出し語のアドレスとして用いて翻
訳用の辞書を引くようになっている。つまり、この翻訳
システムでは、翻訳部は、文字認識部から受け取ったコ
ードによって表されるアドレスにアクセスして翻訳用の
辞書を引いている。従来は原文のデータをテキストデー
タで受け取っていたため、翻訳用の辞書にアクセスする
ためにこのテキストデータを一旦ASCIIコードに変
換してアドレス発生を行っていたが、本発明によれば、
このようなアドレス発生のための処理は不要である。よ
って、その分、翻訳処理時間が短縮される。
【0014】一実施形態では、ソース言語の単語を表す
コードを発生するために、上記文字認識部は、ソース言
語の単語とコードとを1対1で関連付けたエンコードテ
ーブルを有しており、認識した文字列から単語を抽出し
た後、上記エンコードテーブルを参照して、抽出した単
語をコードに変換するようにしている。
【0015】なお、特許請求の範囲を含めて本明細書で
使用している用語「単語」は、文法上の意味、機能を有
する最小単位としての語のほか、ソース言語での文中に
使用される記号(たとえば、ソース言語が英語において
は、例えば、カンマ「,」、ピリオド「.」、セミコロ
ン「;」、コロン「:」、クエスチョンマーク「?」、
エクスクラメンションマーク「!」等々。また、ソース
言語が日本語の場合には、句読点等。)をも含むもの
と、広く解釈されるべきである。
【0016】一実施形態では、翻訳部は、コードとソー
ス言語の単語とを1対1で関連付けたデコードテーブル
を有しており、訳文を生成した後、このデコードテーブ
ルを参照して、上記文字認識部から受け取ったコードを
ソース言語の単語に変換する。この場合、翻訳結果のみ
ならず、原文つまりソース言語の文字列をもモニタに表
示したりファイルに保存したりできる。
【0017】上記文字認識部では、スキャナによって原
稿を読み取りながら、抽出した単語をリアルタイムにコ
ードに変換するようにしてもよい。このようにすること
によって、原稿読み取りから翻訳開始までの時間が短縮
できる。
【0018】また、上記翻訳部は、上記文字認識部から
送信されたコードをリアルタイムに単語に変換するよう
にしてもよい。このようにすることによって、翻訳開始
から翻訳終了までの時間が短縮できる。
【0019】上記エンコードテーブルには単語が、アル
ファベット順等、ソース言語に特有の配列順に配列され
ているのが望ましい。コード化つまり単語からコードへ
の変換を効率的に行えるからである。
【0020】また、本発明の翻訳システムは、よく使用
される単語をコードに対応付けてキャッシュメモリに格
納するようになっており、画像データから抽出した単語
をコードに変換する時に、エンコードテーブルよりも優
先してキャッシュメモリが参照されるようになっていて
もよい。つまり、この場合、この翻訳システムでは、文
字認識部が学習機能を有する上に、キャッシュメモリを
利用するので、更に高速で効率のよいコード化が可能に
なる。
【0021】さらに、翻訳部側においても、よく使用さ
れるコードを単語に対応付けてキャッシュメモリに格納
するようになっており、文字認識部から受け取ったコー
ドを単語へ変換する時に、デコードテーブルよりも優先
してキャッシュメモリが参照されるようになっていても
よい。高速に効率よく、コードから単語への変換を行え
る。
【0022】さらに、本発明は、ソース言語の単語とコ
ードとを1対1で関連付けたエンコードテーブルを有
し、ソース言語の文字列を含む画像データを取り込むス
テップと、取り込まれた画像データに対して文字認識処
理を行うステップと、認識された文字列から単語を抽出
するステップと、上記エンコードテーブルを参照して、
抽出した単語をコードに変換するステップとをコンピュ
ータに実行させる文字認識プログラムを記録したコンピ
ュータ読み取り可能な記録媒体を提供する。
【0023】さらにまた、本発明は、入力されたコード
を見出し語のアドレスとして用いて翻訳用の辞書を引く
ステップと、所定の解析処理を行ってターゲットス言語
による訳文を生成するステップとをコンピュータに実行
させる翻訳プログラムを記録したコンピュータ読み取り
可能な記録媒体を提供する。
【0024】この記録媒体は、コードとソース言語の単
語とを1対1で関連付けたデコードテーブルを有してい
てもよく、この場合、翻訳プログラムは、訳文を生成し
た後、上記デコードテーブルを参照して、上記入力され
たコードをソース言語の単語に変換するステップをさら
にコンピュータに実行させることができる。
【0025】媒体自体としては、各種の光ディスクや、
磁気ディスク、光磁気ディスクが使用でき、これらの媒
体に記録された文字認識プログラムと翻訳プログラムを
コンピュータにインストールすることにより、上述した
翻訳システムを実現することができる。
【0026】
【発明の実施の形態】図1は本発明の一実施の形態であ
る翻訳システムの要部の構成を示している。この翻訳シ
ステムは、図1に示すように、スキャナ12と、文字認
識部13と、翻訳部15を有する。文字認識部13と翻
訳部15はコンピュータ(以下PC)11内に搭載され
ており、スキャナはPC11に接続されている。また、
PC11は図示しないモニタを備えており、プリンタ等
の周辺機器が接続されていてもよい。
【0027】以下、この翻訳システムによる処理の概要
を、英日翻訳の場合について説明する。
【0028】まず、ソース言語として英文の含まれた雑
誌、新聞等をスキャナ12を介してPC11内に取り込
む。そして、取り込んだ画像データから、文字認識部1
3にて、単語を抽出し、この単語を表すコードデータ1
4を生成する。文字認識部13とリンクしたデータ授受
のプロトコルが決められた翻訳部15は、コードデータ
14を取り込み、翻訳のための辞書引きや解析を行っ
て、日本語による訳文(テキストデータ)を生成し、こ
の訳文をモニタに表示する。また、原文をモニタに表示
したりファイルに保存したりするために、コードデータ
14をデコードしてテキストデータ16を生成する。
【0029】ここで、この翻訳システムは、スキャナ1
2によって原稿を読み取りながら、文字認識部13が機
能して、抽出した単語をリアルタイムにコードに変換で
きるようになっている。一方、上記翻訳部も、上記文字
認識部13から送信されたコードをリアルタイムに単語
に変換できるようになっている。
【0030】次に、文字認識部13での処理フローを図
2にて説明する。
【0031】まず、図2におけるステップS21、S2
2、S23、S24、S25において、図9のステップ
S1、S2、S3、S4、S5での処理とそれぞれ同じ
処理が行われる。
【0032】次に、ステップS26で、ステップS25
で得られた文字認識の結果をエンコード処理する。図3
にエンコードサブルーチンを示す。このサブルーチンで
は、先ず、ステップS260で単語を抽出する。単語抽
出法としては、たとえば、特開平4−353989号
(出願人:シャープ株式会社)に開示されている技術を
用いることができる。そして、ステップS261で、そ
れら単語に対して、エンコードテーブル17を参照し
て、コード化する。
【0033】図6はエンコードテーブル17の一例を示
している。図示した例では、各英単語に対して、アルフ
ァベット順にコード番号を割り当てている。更に、英文
で用いられる記号(例えば、カンマ「,」、ピリオ
ド「.」、セミコロン「;」、コロン「:」、クエスチ
ョンマーク「?」、エクスクラメンションマーク「!」
等々)にもコードを割り当てている。
【0034】次に、ステップS27で、図9のステップ
S7と同様に、知識処理(単語照合処理)を行う。この
知識処理では、認識された文字列から、漢字列やカタカ
ナ列などを抜き出し、その部分をあらかじめ登録してい
る単語辞書9と照合して、誤読した部分を自動的に訂正
する。なお、この知識処理用の単語辞書9(図示せず)
を参照する際には、ステップS26で得られたコードを
見出し語のアドレスとして辞書9にアクセスする。
【0035】図2と図9の比較から明らかなように、こ
の実施形態の翻訳システムの文字認識部13で行う処理
には、図9に示すデコード(S9)とテキストデータ生
成(S9)のステップは含まれておらず、その分処理時
間が短縮されている。
【0036】続いて、翻訳部15の機能について、図4
を用いて説明する。翻訳部15は、文字認識部13から
コードデータつまりコード化された単語データ14を受
け取ると、ステップS31で、そのコードを見出し語の
アドレスとして用いて翻訳用の辞書(図示せず)を引い
て、原文にある単語の意味及び文法情報を辞書から取り
出す。つまり、この実施形態では、翻訳用の辞書(見出
し語毎に、日本語による訳語や品詞等の文法情報を記載
した辞書)の各見出し語に、図6に示すコードによって
表されるアドレスを持たせており、したがって、翻訳部
15は、文字認識部から受け取ったコードをそのままア
クセス用のアドレスとして用いて、翻訳用の辞書を引け
るのである。
【0037】続いて、ステップS32で、文字認識部1
3でエンコードして得られた単語14にどのような要素
が接続されているかを解析する形態素解析を行う。さら
に、ステップS33で、どの単語が主語であり,どの単
語が述語であるかなど、文を構成する単語の関係を解析
する構文解析を行う。ステップS34で、この構文解析
の結果に従って、最終的に日本語による訳文(テキスト
データ)を生成する。次に、原文の英文をモニタに表示
したり、ファイルに保存したりできるようにするため
に、ステップS35で、文字認識部13から受け取った
コードデータ14を図5に示すサブルーチンにしたがっ
てデコードし、ステップS36で英語によるテキストデ
ータ16を生成する。デコードのサブルーチンでは、デ
コードテーブル18を参照して、各コードを英単語(ピ
リオドやコンマ等々の記号も含む。)に変換する(S3
10)。図7にデコードテーブル18の一例を示す。最
後に、原文を表すテキストデータは、翻訳結果と一緒あ
るいは別個にモニタに表示したり、ファイルに保存され
る。しかし、原文をモニタに表示したり、ファイルに保
存する必要がなければ、ステップS35およびS36は
省略できる。
【0038】図4と図11との比較から明らかなよう
に、この実施形態の翻訳システムの翻訳部15で行う処
理には、図11に示すテキストデータ取り込み(S1
0)とASCIIコード変換(S11)のステップは含
まれておらず、その分処理時間が短縮されている。
【0039】なお、図2,3および図4,5に記載した
文字認識処理プログラムおよび翻訳プログラムは、これ
を記録したCD(コンパクトディスク)やFD(フロッ
ピー(登録商標)ディスク)等の適切な媒体(あらゆる
可能な媒体が含まれる)を介してPC11内にインスト
ールされたものである。
【0040】本実施形態では、図1からはっきりわかる
ように、画像読み込みから翻訳までテキストファイルを
介さず、ソース言語の単語を表すコードを用いて処理を
行うので、処理時間とメモリを削減することができる。
【0041】本実施形態の変形として、よく使用される
単語をコードに対応付けてキャッシュメモリ(図示せ
ず)に格納するようにし、画像データから抽出した単語
をコードに変換する時に、エンコードテーブル17より
も優先してそのキャッシュメモリが参照されるようにし
てもよい。こうすれば、エンコード時間を上記実施形態
よりもさらに短縮することができる。加えて、デコード
時間をさらに短縮するために、よく使用されるコードを
単語に対応付けてキャッシュメモリ(図示せず)に格納
するようにし、コードデータ14を単語へ変換する時
に、デコードテーブル18よりも優先してそのキャッシ
ュメモリが参照されるようにしてもよい。
【0042】以上、本発明の説明を英日翻訳の場合を用
いて説明したが、ソース言語とターゲット言語はこれら
の言語に限られない。その場合、エンコードテーブルに
おけるソース言語での単語の配列は、アルファベットを
使用しない言語にあっては、その言語に特有な配列順に
行えばよい。
【図面の簡単な説明】
【図1】 本発明の一実施形態に係る翻訳システムの要
部(原稿読み取りから翻訳まで)の構成を示す。
【図2】 図1の翻訳システムにおける文字認識部で行
われる処理のフローを示す。
【図3】 図2におけるエンコード処理のサブルーチン
を示す。
【図4】 図1の翻訳システムにおける翻訳部で行われ
る処理のフローを示す。
【図5】 図4におけるデコード処理のサブルーチンを
示す。
【図6】 図1の翻訳システムで使用されるエンコード
テーブルの一例を示す。
【図7】 図1の翻訳システムで使用されるデコードテ
ーブルの一例を示す。
【図8】 従来の翻訳システムの要部(原稿読み取りか
ら翻訳まで)の構成を示す。
【図9】 図8の翻訳システムにおけるOCR機能処理
フローを示す。
【図10】 図9における文字認識処理のサブルーチン
を示す。
【図11】 図8の翻訳システムにおける翻訳処理フロ
ーを示す。
【符号の説明】
11 コンピュータ 12 スキャナ 13 文字認識部 14 コードデータ 15 翻訳部 16 テキストデータ 17 エンコードテーブル 18 デコードテーブル

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 スキャナと、 上記スキャナにより取り込んだソース言語の文字列を含
    む画像データに対して文字認識処理を行う文字認識部
    と、 上記文字認識部とリンクしたデータ授受のプロトコルが
    決められており、上記文字認識部から受け取ったデータ
    をターゲット言語に翻訳する翻訳部とを備えたことを特
    徴とする翻訳システム。
  2. 【請求項2】 上記データ授受のプロトコルは、ソース
    言語の単語を表すコードを含んでおり、上記翻訳部は、
    上記文字認識部から上記コードを受け取ると、このコー
    ドを見出し語のアドレスとして用いて翻訳用の辞書を引
    くことを特徴とする請求項1に記載の翻訳システム。
  3. 【請求項3】 上記文字認識部は、ソース言語の単語と
    コードとを1対1で関連付けたエンコードテーブルを有
    しており、認識した文字列から単語を抽出した後、上記
    エンコードテーブルを参照して、抽出した単語をコード
    に変換することを特徴とする請求項2に記載の翻訳シス
    テム。
  4. 【請求項4】 上記翻訳部は、コードとソース言語の単
    語とを1対1で関連付けたデコードテーブルを有してお
    り、訳文を生成した後、このデコードテーブルを参照し
    て、上記文字認識部から受け取ったコードをソース言語
    の単語に変換することを特徴とする請求項1乃至3のい
    ずれか1つに記載の翻訳システム。
  5. 【請求項5】 上記文字認識部では、スキャナによって
    原稿を読み取りながら、抽出した単語をリアルタイムに
    コードに変換することを特徴とする請求項3に記載の翻
    訳システム。
  6. 【請求項6】 上記翻訳部は、上記文字認識部から送信
    されたコードをリアルタイムに単語に変換することを特
    徴とする請求項3乃至5のいずれか1つに記載の翻訳シ
    ステム。
  7. 【請求項7】 上記エンコードテーブルには単語が、ソ
    ース言語に特有の配列順に配列されていることを特徴と
    する請求項3乃至6のいずれか1つに記載の翻訳システ
    ム。
  8. 【請求項8】 よく使用される単語をコードに対応付け
    てキャッシュメモリに格納するようになっており、画像
    データから抽出した単語をコードに変換する時に、エン
    コードテーブルよりも優先してキャッシュメモリが参照
    されることを特徴とする請求項3乃至7のいずれか1つ
    に記載の翻訳システム。
  9. 【請求項9】 よく使用されるコードを単語に対応付け
    てキャッシュメモリに格納するようになっており、文字
    認識部から受け取ったコードを単語へ変換する時に、デ
    コードテーブルよりも優先してキャッシュメモリが参照
    されることを特徴とする請求項3乃至8のいずれか1つ
    に記載の翻訳システム。
  10. 【請求項10】 ソース言語の単語とコードとを1対1
    で関連付けたエンコードテーブルを有し、 ソース言語の文字列を含む画像データを取り込むステッ
    プと、 取り込まれた画像データに対して文字認識処理を行うス
    テップと、 認識された文字列から単語を抽出するステップと、 上記エンコードテーブルを参照して、抽出した単語をコ
    ードに変換するステップとをコンピュータに実行させる
    文字認識プログラムを記録したコンピュータ読み取り可
    能な記録媒体。
  11. 【請求項11】 入力されたコードを見出し語のアドレ
    スとして用いて翻訳用の辞書を引くステップと、 所定の解析処理を行ってターゲット言語による訳文を生
    成するステップとをコンピュータに実行させる翻訳プロ
    グラムを記録したコンピュータ読み取り可能な記録媒
    体。
  12. 【請求項12】 請求項11に記載のコンピュータ読み
    取り可能な記録媒体において、 コードとソース言語の単語とを1対1で関連付けたデコ
    ードテーブルを有し、 訳文を生成した後、上記デコードテーブルを参照して、
    上記入力されたコードをソース言語の単語に変換するス
    テップをさらにコンピュータに実行させる翻訳プログラ
    ムを記録したコンピュータ読み取り可能な記録媒体。
JP2000330449A 2000-10-30 2000-10-30 翻訳システム Pending JP2002132765A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000330449A JP2002132765A (ja) 2000-10-30 2000-10-30 翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000330449A JP2002132765A (ja) 2000-10-30 2000-10-30 翻訳システム

Publications (1)

Publication Number Publication Date
JP2002132765A true JP2002132765A (ja) 2002-05-10

Family

ID=18806967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000330449A Pending JP2002132765A (ja) 2000-10-30 2000-10-30 翻訳システム

Country Status (1)

Country Link
JP (1) JP2002132765A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101248449B1 (ko) * 2008-03-14 2013-03-28 후지제롯쿠스 가부시끼가이샤 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체
JP2014137654A (ja) * 2013-01-16 2014-07-28 ▲うぇい▼強科技股▲ふん▼有限公司 翻訳システム及びその翻訳方法
US10035673B2 (en) 2015-06-19 2018-07-31 Canon Kabushiki Kaisha Image forming apparatus for forming image on conveyed sheet

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101248449B1 (ko) * 2008-03-14 2013-03-28 후지제롯쿠스 가부시끼가이샤 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체
US8751214B2 (en) 2008-03-14 2014-06-10 Fuji Xerox Co., Ltd. Information processor for translating in accordance with features of an original sentence and features of a translated sentence, information processing method, and computer readable medium
JP2014137654A (ja) * 2013-01-16 2014-07-28 ▲うぇい▼強科技股▲ふん▼有限公司 翻訳システム及びその翻訳方法
US10035673B2 (en) 2015-06-19 2018-07-31 Canon Kabushiki Kaisha Image forming apparatus for forming image on conveyed sheet

Similar Documents

Publication Publication Date Title
US5548508A (en) Machine translation apparatus for translating document with tag
CA2365937C (en) System and method for distributing multilingual documents
JP4311365B2 (ja) 文書処理装置およびプログラム
JP2006276911A (ja) 電子機器およびプログラム
CN102081594A (zh) 从可移植电子文档中提取字符外接矩形的设备和方法
JP6277921B2 (ja) 用語集管理装置および用語集管理プログラム
US20090182548A1 (en) Handheld dictionary and translation apparatus
Wang et al. Chinese-braille translation based on braille corpus
JP2006085582A (ja) 文書処理装置およびプログラム
JP2002132765A (ja) 翻訳システム
US20020181779A1 (en) Character and style recognition of scanned text
JPH05108716A (ja) 機械翻訳装置
JP2006252164A (ja) 中国語文書処理装置
JP2007052613A (ja) 翻訳装置、翻訳システムおよび翻訳方法
JPH10177623A (ja) 文書認識装置および言語処理装置
JPH0883280A (ja) 文書処理装置
JP2009205209A (ja) 文書画像処理装置、及び文書画像処理プログラム
JP2009110204A (ja) 文書処理装置、文書処理システム、文書処理方法及び文書処理プログラム
US8972239B2 (en) Syntax analysis information generation apparatus, translation apparatus, translation system, syntax analysis information generating method and computer program
JP2002245470A (ja) 言語特定装置及び翻訳装置及び言語特定方法
JP2010134833A (ja) 文書処理装置、文書処理方法、プログラムおよび記録媒体
JP3870251B2 (ja) テンス・アスペクト・モダリティ翻訳処理装置
JPH1166068A (ja) 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体
Chaudhury et al. A finite state transducer (fst) based font converter
JP2000353132A (ja) Eメールfaxサーバおよび情報記録媒体