JPH0554072A - デジタル翻訳装置 - Google Patents

デジタル翻訳装置

Info

Publication number
JPH0554072A
JPH0554072A JP3211711A JP21171191A JPH0554072A JP H0554072 A JPH0554072 A JP H0554072A JP 3211711 A JP3211711 A JP 3211711A JP 21171191 A JP21171191 A JP 21171191A JP H0554072 A JPH0554072 A JP H0554072A
Authority
JP
Japan
Prior art keywords
character
image
word
information
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3211711A
Other languages
English (en)
Inventor
Hitoshi Nakamura
村 仁 中
Takashi Sato
藤 隆 佐
Masumi Sato
藤 眞 澄 佐
Kenichi Hasegawa
谷 川 健 一 長
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3211711A priority Critical patent/JPH0554072A/ja
Publication of JPH0554072A publication Critical patent/JPH0554072A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 翻訳時間を短縮し、さらに翻訳結果を見やす
くする。 【構成】 原稿画像を読み取る原稿読取手段;原稿読取
手段が読み取った原稿の画像情報を格納する記憶手段;
記憶手段に格納された画像情報から、マーク指定された
領域の画像情報を抽出する抽出手段;抽出手段で抽出し
た画像の文字単位の情報を切り出し、切り出した文字単
位の情報の間隔から単語情報を抽出して、単語単位で文
字を認識する文字認識手段;認識した単語を翻訳する翻
訳手段;および、翻訳した単語の文字画像を出力画像メ
モリに書込み、書込んだ情報を出力する出力画像形成手
段;を備える。また、出力画像形成手段は、原稿画像の
指定された全ての領域に対する文字の、翻訳した単語の
文字画像を所定の書式に従って出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデジタル翻訳装置に関
し、特に文章原稿を光学的に読取って文字を認識する際
に、指定した領域の文字のみを認識し、認識した文字に
対して翻訳を行なうデジタル翻訳装置に関する。
【0002】
【従来の技術】翻訳装置においては、例えば、翻訳した
い文章原稿を光学的に読取り、読み取った画像から文字
認識し、この認識結果から辞書検索を行ない翻訳処理を
行なう。この時、入力されたイメージ文字の認識はOC
R(文字認識装置)を用いて行なっている。一般的なO
CRでは、標準文字が登録された標準辞書を用い、読取
った文字画像と標準辞書の文字との類似率より、文字を
認識する。
【0003】
【発明が解決しようとする課題】ところで、従来の翻訳
装置においては、読取った画像のすべての文字に対して
翻訳処理を行なうため、翻訳処理の必要ない単語や、一
度翻訳した単語に対しても翻訳処理を行ない、翻訳に時
間がかかっていた。また、翻訳結果を出力する際に、原
稿文字の下に翻訳結果を表示するスペースを作成し、翻
訳結果の文字長に合わせて原稿文字をずらして表示する
ため、翻訳結果が非常に見づらかった。
【0004】本発明は上記問題を解決すべく考案された
もので、翻訳時間を短縮し、さらに翻訳結果を見やすく
することを目的とする。
【0005】
【課題を解決するための手段】本発明のデジタル翻訳装
置は、原稿画像を読み取る原稿読取手段(2);原稿読取
手段(2)が読み取った原稿の画像情報を格納する記憶手
段(3);記憶手段(3)に格納された画像情報から、マーク
指定された領域の画像情報を抽出する抽出手段(4);抽
出手段(4)で抽出した画像の文字単位の情報を切り出
し、切り出した文字単位の情報の間隔から単語情報を抽
出して、単語単位で文字を認識する文字認識手段(5);
認識した単語を翻訳する翻訳手段(6);および、翻訳し
た単語の文字画像を出力画像メモリに書込み、書込んだ
情報を出力する出力画像形成手段(8);を備える。なお
カッコ内の記号は後述する実施例の対応要素である。
【0006】
【作用】これによれば、まず、原稿読取手段(2)が原稿
画像を読み取り、記憶手段(3)が、原稿読取手段(2)が読
み取った原稿の画像情報を格納する。さらに抽出手段
(4)が、記憶手段(3)に格納された画像情報から、マーク
指定された領域の単語に対応する画像情報を抽出し、文
字認識手段(5)が、抽出手段(4)で抽出した画像の文字単
位の情報を切り出し、切り出した文字単位の情報の間隔
から単語情報を抽出して、単語単位で文字を認識する。
従って例えば、任意の単語に対してマーク処理が施こさ
れた英文章の原稿に対して、まず、マーク処理が施こさ
れた部分の画像のみを抽出し、その後、抽出された領域
において、アルファベット単位の文字情報の切り出しを
行ない、これを基に単語単位で文字を認識することが可
能である。また、翻訳手段(5)が認識した単語を翻訳
し、出力画像形成手段(8)が翻訳した単語の文字画像を
出力画像メモリに書込み、書込んだ情報を出力するの
で、マーク指定された原稿画像に対応したが翻訳画像形
成される。
【0007】以上のように本発明では、マーク処理を施
こした必要な単語以外の文字認識処理および翻訳処理を
省略することができるので、翻訳にかかる処理時間の短
縮が図れる。
【0008】また、本発明の好ましい実施例では、原稿
画像の任意の領域に対するマーク指定を入力する領域指
定入力手段(14);を備える。これにより、原稿画像に
対して直接マーク処理を施こす必要がなく、操作により
容易に原稿画像の任意の領域に対するマーク指定を行な
うことができる。
【0009】さらに、本発明の好ましい実施例では、出
力画像形成手段(8)は、原稿画像の指定された全ての領
域に対する文字の、翻訳した単語の文字画像を所定の書
式に従って表形式で出力する。例えばこの書式を、指定
された領域の原稿文字と翻訳された文字が対応する表に
することにより、非常に見やすい翻訳結果出力が得られ
る。本発明の他の目的および特徴は図面を参照した以下
の実施例の説明により明らかになろう。
【0010】
【実施例】
(実施例1)図1に本発明のデジタル翻訳装置の構成概
略のブロック図を示す。図1において、1は装置全体を
制御するCPU、2は翻訳する原稿を読み込むためのス
キャナ、3はスキャナ2により読取った画像データを格
納する画像メモリ、4は画像メモリ3に格納した画像デ
ータを読出しマークペンでマークした領域の検出を行な
うマーク領域検出部、5はマーク領域検出部4より検出
したマーク領域の文字を切り出して文字認識を行なう文
字認識部、6は文字認識部5で認識した文字を単語とし
て切り出し翻訳を行なう翻訳部、7はスキャナ2におい
て原稿の読取りなどを指示する操作部、8は翻訳した結
果を出力する出力部である。
【0011】図2に、操作部7に対応したCPU1の制
御動作の概要を示す。スキャナ2の原稿設置台(図示し
ない)にマークペンで領域指定された英文文章原稿(翻
訳を行ないたい部分をマークペンで塗りつぶした原稿)
がセットされ、操作部7に「スタート」入力があると、
CPU1はまず、セットされた原稿をスキャナ2の原稿
読取り部により読取って、例えば、図3に示すような原
稿対応の画像を得る(ステップ100:以下カッコ内で
はサブルーチンとかステップと言う語を省略し、それに
付した番号数字のみを記す)。なお、図3において四角
で囲まれた単語は、マークペンで指定された(塗りつぶ
された)単語を示す。
【0012】次にマーク領域検出部4により、マーク領
域の検出処理を行なう(200)。このマーク領域の検
出処理(200)では、ステップ100で読取った画像
に対し、まず、図4に示すように主走査方向の黒画素の
ヒストグラムを計算し、文字画像を行単位で切り出す。
次に、行単位で切り出した1行分の画像において、図5
に示すように、その中心(主走査方向の中心)を通るラ
イン(副走査方向に1画素分のライン)10の濃度値を
検出する。行単位で切り出した画像には、文字画像の領
域,マークペンでマークした領域,および画像のない領
域、の3種類の画像領域があるが、図5において、11
は文字画像の領域、12はマークペンでマークした領
域、13は画像のない領域の濃度13、をそれぞれ示し
ている。3種類の画像領域の副走査方向の1ラインの濃
度値は、それぞれの領域において異なることがわかる。
従って、この濃度の違いにより、原稿のマーク領域の単
語の画像のみを抽出することができる。
【0013】さらに文字検出部5において、図6に示す
ように抽出したマーク領域の文字画像において副走査方
向に黒画素のヒストグラムを計算し、1文字単位の文字
画像を切り出す(300)。なお、1文字単位で切り出
された文字画像の例を図7に示す。また、文字認識部5
において、切り出したある文字単位の画像とその次の文
字単位画像との距離(文字間)が1文字分の距離以上の
場合、そこを単語の切れ目と判断し、1文字単位の文字
画像をグループ化して単語を抽出する(400)。この
抽出した単語の例を図8に示す。その後、文字認識部5
でグループ化した単語の1文字ずつの文字認識を行なう
(500)。
【0014】翻訳部6において、文字認識部5で認識し
た単語単位の文字コードに相当する日本語を翻訳辞書か
ら検索し、翻訳結果を出力する(600)。さらに翻訳
結果の文字コードを文字画像に変換して出力部8が有す
る出力画像メモリに画像を形成する(700)。指定さ
れた単語のすべての出力画像(翻訳画像)が形成される
まで、ステップ300〜700の処理を繰返し、指定さ
れた全ての単語の出力画像が形成されると(800)、
出力画像メモリに書き込みれた出力画像を紙に転写して
排出する(900)。
【0015】以上のようにあらかじめ原稿にマークペン
で領域指定を行なえば、このマーク領域の単語のみを抽
出して翻訳を行なうので、翻訳する必要のない単語を翻
訳する分の時間が短縮される。
【0016】(実施例2)実施例1においては、マーク
ペンにより原稿に直接マークを行ない、翻訳する領域を
指定したが、実施例2では操作入力により翻訳する領域
を指定する。
【0017】図9に本発明(実施例2)のデジタル翻訳
装置の構成概略のブロック図を示す。図9において、C
PU1、スキャナ2、画像メモリ3、文字認識部5、翻
訳部6、操作部7、符出力部8、図1に示す各部と同一
の構成および動作であり、マーク領域検出部4において
そのマーク指定動作が異なる。また付号14は、マーク
領域を指定するための表示部一体型のタブレット(領域
指操作部&表示部)であり、位置指定を行なうためのス
タイラスペンを備えている。
【0018】図10に、操作部7に対応したCPU1の
制御動作の概要を示す。スキャナ2の原稿設置台(図示
しない)に英文文章原稿がセットされ、操作部7に「ス
タート」入力があると、CPU1はまず、セットされた
原稿をスキャナ2の原稿読取り部により読取って、例え
ば、図3に示すような原稿対応の画像を得る(ステップ
100:以下カッコ内ではサブルーチンとかステップと
言う語を省略し、それに付した番号数字のみを記す)。
なお、図3において四角で囲まれたマーク領域はこの実
施例2では付加されていないものとする。
【0019】次に、翻訳単語の指定処理を行なう(20
0a)。この処理(200a)では、まず、ステップ1
00で読取った画像に対し、マーク領域検出部4の文字
切出し手段により、主走査方向の黒画素のヒストグラム
を計算し文字画像を行単位で切り出す。切り出した行単
位の文字画像の全行(原稿画像と同一の画像)を表示部
一体型タブレット14に表示する。この表示された画像
に対してスタイラスペン(図示しない)を用いて翻訳し
たい領域の位置指定を行なうと、指定された領域(位置
情報)を記憶する。
【0020】指定された領域の画像に対して、文字認識
部5で、副走査方向に黒画素のヒストグラムを計算し、
1文字単位の文字画像を切り出す(300)。また、文
字認識部5において、切り出したある文字単位の画像と
その次の文字単位画像との距離(文字間)が1文字分の
距離以上の場合、そこを単語の切れ目と判断し、1文字
単位の文字画像をグループ化して単語を抽出する(40
0)。その後、文字認識部5でグループ化した単語の1
文字ずつの文字認識を行なう(500)。
【0021】翻訳部6において、文字認識部5で認識し
た単語単位の文字コードに相当する日本語を翻訳辞書か
ら検索し、翻訳結果を出力する(600)。さらに翻訳
結果の文字コードを文字画像に変換して出力部8が有す
る出力画像メモリに画像を形成する(700)。指定さ
れた単語のすべての出力画像(翻訳画像)が形成される
まで、ステップ300〜700の処理を繰返し、指定さ
れた全ての単語の出力画像が形成されると(800)、
出力画像メモリに書き込みれた出力画像を紙に転写して
排出する(900)。
【0022】以上のように、読取った原稿画像を表示部
一体型のタブレット14に表示し、この表示に基づいて
翻訳したい単語のみの領域指定を行なえば、指定領域の
単語のみを抽出して翻訳を行なうので、翻訳する必要の
ない単語を翻訳する分の時間が短縮される。
【0023】ここで翻訳結果の出力形態につてい説明す
る。出力形態には、 (1)入力文章に対応して英単語のすぐ下に翻訳結果を
出力する方法 (2)出力用紙の下半分や右半分に翻訳結果を出力した
り、翻訳結果のみを出力する方法、 等があるが、(1)の出力形態では、翻訳結果をための
領域を英文1行の下に作成し、更に英単語に対する日本
語(翻訳結果)の出力する画像の長さ(領域)が長い場
合、英文をずらして出力するため、入力原稿と比べ、単
語間が延び縮みするため非常に見ずらい。また、(2)
出力形態では、使用者が翻訳結果を見る場合、英単語と
翻訳結果の対応がわかりにくい。以上の点から本実施例
1および実施例2においては、図13に示すように、領
域検出した英単語とそれに対する翻訳結果を表形式で出
力するようにしている。これは実施例1および実施例2
のステップ700において、翻訳結果の文字コードを文
字画像に変換して出力部8が有する出力画像メモリに画
像を形成する際に、位置指定(アドレス指定)を行なう
だけで容易に実施することができる。
【0024】
【発明の効果】以上のように本発明によれば、まず、原
稿読取手段(2)が原稿画像を読み取り、記憶手段(3)が、
原稿読取手段(2)が読み取った原稿の画像情報を格納す
る。さらに抽出手段(4)が、記憶手段(3)に格納された画
像情報から、マーク指定された領域の単語に対応する画
像情報を抽出し、文字認識手段(5)が、抽出手段(4)で抽
出した画像の文字単位の情報を切り出し、切り出した文
字単位の情報の間隔から単語情報を抽出して、単語単位
で文字を認識する。従って例えば、任意の単語に対して
マーク処理が施こされた英文章の原稿に対して、まず、
マーク処理が施こされた部分の画像のみを抽出し、その
後、抽出された領域において、アルファベット単位の文
字情報の切り出しを行ない、これを基に単語単位で文字
を認識することが可能である。また、翻訳手段(5)が認
識した単語を翻訳し、出力画像形成手段(8)が翻訳した
単語の文字画像を出力画像メモリに書込み、書込んだ情
報を出力するので、マーク指定された原稿画像に対応し
たが翻訳画像形成される。
【0025】以上のように本発明では、マーク処理を施
こした必要な単語以外の文字認識処理および翻訳処理を
省略することができるので、翻訳にかかる処理時間の短
縮が図れる。
【0026】また、原稿画像の任意の領域に対するマー
ク指定を入力する領域指定入力手段(14)を備えるの
で、原稿画像に対して直接マーク処理を施こす必要がな
く、操作により容易に原稿画像の任意の領域に対するマ
ーク指定を行なうことができる。
【0027】さらに、出力画像形成手段(8)は、原稿画
像の指定された全ての領域に対する文字の、翻訳した単
語の文字画像を所定の書式に従って表形式で出力する。
従って、例えばこの書式を、指定された領域の原稿文字
と翻訳された文字が対応する表にすることにより、非常
に見やすい翻訳結果出力が得られる。
【図面の簡単な説明】
【図1】 本発明のデジタル翻訳装置の構成概略のブロ
ック図である。
【図2】 図1に示す操作部7に対応したCPU1の制
御動作の概要を示すフローチャートである。
【図3】 原稿対応の画像の一例を示す平面図である。
【図4】 図3に示す原稿画像に対して、主走査方向の
黒画素のヒストグラムを計算し文字画像を行単位で切り
出す際の、原稿対応の画像の一例を示す平面図である。
【図5】 行単位で切り出した1行分の画像において、
画像の中心(主走査方向の中心)を通るライン(副走査
方向に1画素分のライン)10の濃度値を示すグラフで
ある。
【図6】 図4に示した行単位で切り出したの文字画像
を、副走査方向に黒画素のヒストグラムを計算し1文字
単位の文字画像を切り出す際の、原稿対応の画像の一例
を示す平面図である。
【図7】 1文字単位で切り出された文字画像の一例を
示す平面図である。
【図8】 1文字単位の文字画像をグループ化して単語
単位で抽出した一例を示す平面図である。
【図9】 図1に示すデジタル翻訳装置(実施例1)と
別の、デジタル翻訳装置(実施例2)の構成概略のブロ
ック図である。
【図10】 図9に示す操作部7に対応したCPU1の
制御動作の概要を示すフローチャートである。
【図11】 図9に示すタブレット14を示す平面図で
ある。
【図12】 翻訳出力の一例を示す平面図である。
【符号の説明】
1:CPU 2:スキャナ(画稿
読取手段) 3:画像メモリ(記憶手段) 4:マーク領域検出
部(抽出手段) 5:文字認識部(文字認識手段) 6:翻訳部(翻訳手
段) 7:操作部 8:出力部(出力画
像形成手段) 14:表示部一体型タブレット(領域指定入力手段)
フロントページの続き (72)発明者 長 谷 川 健 一 東京都大田区中馬込1丁目3番6号 株式 会社リコ−内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】原稿画像を読み取る原稿読取手段;原稿読
    取手段が読み取った原稿の画像情報を格納する記憶手
    段;記憶手段に格納された画像情報から、マーク指定さ
    れた領域の画像情報を抽出する抽出手段;抽出手段で抽
    出した画像の文字単位の情報を切り出し、切り出した文
    字単位の情報の間隔から単語情報を抽出して、単語単位
    で文字を認識する文字認識手段;認識した単語を翻訳す
    る翻訳手段;および、 翻訳した単語の文字画像を出力画像メモリに書込み、書
    込んだ情報を出力する出力画像形成手段;を備える、デ
    ジタル翻訳装置。
  2. 【請求項2】原稿画像の任意の領域に対するマーク指定
    を入力する領域指定入力手段;を備えることを特徴とす
    る、前記請求項1記載のデジタル翻訳装置。
  3. 【請求項3】出力画像形成手段は、原稿画像の指定され
    た全ての領域に対する文字の、翻訳した単語の文字画像
    を所定の書式に従って表形式で出力することを特徴とす
    る、前記請求項1または請求項2記載のデジタル翻訳装
    置。
JP3211711A 1991-08-23 1991-08-23 デジタル翻訳装置 Pending JPH0554072A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3211711A JPH0554072A (ja) 1991-08-23 1991-08-23 デジタル翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3211711A JPH0554072A (ja) 1991-08-23 1991-08-23 デジタル翻訳装置

Publications (1)

Publication Number Publication Date
JPH0554072A true JPH0554072A (ja) 1993-03-05

Family

ID=16610336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3211711A Pending JPH0554072A (ja) 1991-08-23 1991-08-23 デジタル翻訳装置

Country Status (1)

Country Link
JP (1) JPH0554072A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1165753A (ja) * 1997-08-27 1999-03-09 Nippon Telegr & Teleph Corp <Ntt> 文字列入力方法及び装置、並びに、文字列入力プログラムを格納した記憶媒体
JP2005014237A (ja) * 2003-06-23 2005-01-20 Toshiba Corp 複写機における翻訳方法、プログラム及び外部翻訳機能部を有する複写機
US7643986B2 (en) * 2005-03-25 2010-01-05 Fuji Xerox Co., Ltd. Language translation device, method and storage medium for translating abbreviations
EP2159736A3 (en) * 2008-08-28 2010-12-22 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and image processing program
JP2015210611A (ja) * 2014-04-25 2015-11-24 京セラドキュメントソリューションズ株式会社 文書管理装置および文書管理プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1165753A (ja) * 1997-08-27 1999-03-09 Nippon Telegr & Teleph Corp <Ntt> 文字列入力方法及び装置、並びに、文字列入力プログラムを格納した記憶媒体
JP2005014237A (ja) * 2003-06-23 2005-01-20 Toshiba Corp 複写機における翻訳方法、プログラム及び外部翻訳機能部を有する複写機
US7643986B2 (en) * 2005-03-25 2010-01-05 Fuji Xerox Co., Ltd. Language translation device, method and storage medium for translating abbreviations
EP2159736A3 (en) * 2008-08-28 2010-12-22 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and image processing program
US8260064B2 (en) 2008-08-28 2012-09-04 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, computer-readable medium and computer data signal
JP2015210611A (ja) * 2014-04-25 2015-11-24 京セラドキュメントソリューションズ株式会社 文書管理装置および文書管理プログラム

Similar Documents

Publication Publication Date Title
JP2713622B2 (ja) 表形式文書読取装置
JPH05282488A (ja) 文書画像の復号なしに文書の意味的に重要な部分の自動変更のための方法
JPH07200745A (ja) 少なくとも二つのイメージセクションの比較方法
JPH04195692A (ja) 文書読取装置
JPH0554072A (ja) デジタル翻訳装置
US5854860A (en) Image filing apparatus having a character recognition function
JPH05303619A (ja) 電子スクラップブック
JPH0388062A (ja) 文書作成装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH08153110A (ja) 文書ファイリング装置及び方法
JPH0728935A (ja) 文書画像処理装置
JP3060248B2 (ja) 表認識装置
JPH0528319A (ja) 画像処理方法及び装置
US8340434B2 (en) Image processing apparatus, image processing system and computer readable medium
JPH0581318A (ja) デジタル翻訳装置
JP2977247B2 (ja) 文字間スペース処理方法
JPH06274551A (ja) 画像ファイリング装置
JP3424942B2 (ja) 対訳画像形成装置
JP2829186B2 (ja) 光学的文字読取装置
JP2923004B2 (ja) 画像生成装置
JPH08297718A (ja) 文字切り出し装置及び文字認識装置
JPH04302070A (ja) 文字認識装置及び方法
JPH0554071A (ja) デジタル翻訳装置
JPH0728934A (ja) 文書画像処理装置
JPH08185475A (ja) 画像認識装置