JPH0554072A

JPH0554072A - デジタル翻訳装置

Info

Publication number: JPH0554072A
Application number: JP3211711A
Authority: JP
Inventors: Hitoshi Nakamura; 村仁中; Takashi Sato; 藤隆佐; Masumi Sato; 藤眞澄佐; Kenichi Hasegawa; 谷川健一長
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1991-08-23
Filing date: 1991-08-23
Publication date: 1993-03-05

Abstract

(57)【要約】【目的】翻訳時間を短縮し、さらに翻訳結果を見やす
くする。【構成】原稿画像を読み取る原稿読取手段；原稿読取
手段が読み取った原稿の画像情報を格納する記憶手段；
記憶手段に格納された画像情報から、マーク指定された
領域の画像情報を抽出する抽出手段；抽出手段で抽出し
た画像の文字単位の情報を切り出し、切り出した文字単
位の情報の間隔から単語情報を抽出して、単語単位で文
字を認識する文字認識手段；認識した単語を翻訳する翻
訳手段；および、翻訳した単語の文字画像を出力画像メ
モリに書込み、書込んだ情報を出力する出力画像形成手
段；を備える。また、出力画像形成手段は、原稿画像の
指定された全ての領域に対する文字の、翻訳した単語の
文字画像を所定の書式に従って出力する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はデジタル翻訳装置に関
し、特に文章原稿を光学的に読取って文字を認識する際
に、指定した領域の文字のみを認識し、認識した文字に
対して翻訳を行なうデジタル翻訳装置に関する。

【０００２】

【従来の技術】翻訳装置においては、例えば、翻訳した
い文章原稿を光学的に読取り、読み取った画像から文字
認識し、この認識結果から辞書検索を行ない翻訳処理を
行なう。この時、入力されたイメージ文字の認識はＯＣ
Ｒ（文字認識装置）を用いて行なっている。一般的なＯ
ＣＲでは、標準文字が登録された標準辞書を用い、読取
った文字画像と標準辞書の文字との類似率より、文字を
認識する。

【０００３】

【発明が解決しようとする課題】ところで、従来の翻訳
装置においては、読取った画像のすべての文字に対して
翻訳処理を行なうため、翻訳処理の必要ない単語や、一
度翻訳した単語に対しても翻訳処理を行ない、翻訳に時
間がかかっていた。また、翻訳結果を出力する際に、原
稿文字の下に翻訳結果を表示するスペースを作成し、翻
訳結果の文字長に合わせて原稿文字をずらして表示する
ため、翻訳結果が非常に見づらかった。

【０００４】本発明は上記問題を解決すべく考案された
もので、翻訳時間を短縮し、さらに翻訳結果を見やすく
することを目的とする。

【０００５】

【課題を解決するための手段】本発明のデジタル翻訳装
置は、原稿画像を読み取る原稿読取手段(2)；原稿読取
手段(2)が読み取った原稿の画像情報を格納する記憶手
段(3)；記憶手段(3)に格納された画像情報から、マーク
指定された領域の画像情報を抽出する抽出手段(4)；抽
出手段(4)で抽出した画像の文字単位の情報を切り出
し、切り出した文字単位の情報の間隔から単語情報を抽
出して、単語単位で文字を認識する文字認識手段(5)；
認識した単語を翻訳する翻訳手段(6)；および、翻訳し
た単語の文字画像を出力画像メモリに書込み、書込んだ
情報を出力する出力画像形成手段(8)；を備える。なお
カッコ内の記号は後述する実施例の対応要素である。

【０００６】

【作用】これによれば、まず、原稿読取手段(2)が原稿
画像を読み取り、記憶手段(3)が、原稿読取手段(2)が読
み取った原稿の画像情報を格納する。さらに抽出手段
(4)が、記憶手段(3)に格納された画像情報から、マーク
指定された領域の単語に対応する画像情報を抽出し、文
字認識手段(5)が、抽出手段(4)で抽出した画像の文字単
位の情報を切り出し、切り出した文字単位の情報の間隔
から単語情報を抽出して、単語単位で文字を認識する。
従って例えば、任意の単語に対してマーク処理が施こさ
れた英文章の原稿に対して、まず、マーク処理が施こさ
れた部分の画像のみを抽出し、その後、抽出された領域
において、アルファベット単位の文字情報の切り出しを
行ない、これを基に単語単位で文字を認識することが可
能である。また、翻訳手段(5)が認識した単語を翻訳
し、出力画像形成手段(8)が翻訳した単語の文字画像を
出力画像メモリに書込み、書込んだ情報を出力するの
で、マーク指定された原稿画像に対応したが翻訳画像形
成される。

【０００７】以上のように本発明では、マーク処理を施
こした必要な単語以外の文字認識処理および翻訳処理を
省略することができるので、翻訳にかかる処理時間の短
縮が図れる。

【０００８】また、本発明の好ましい実施例では、原稿
画像の任意の領域に対するマーク指定を入力する領域指
定入力手段(14）；を備える。これにより、原稿画像に
対して直接マーク処理を施こす必要がなく、操作により
容易に原稿画像の任意の領域に対するマーク指定を行な
うことができる。

【０００９】さらに、本発明の好ましい実施例では、出
力画像形成手段(8)は、原稿画像の指定された全ての領
域に対する文字の、翻訳した単語の文字画像を所定の書
式に従って表形式で出力する。例えばこの書式を、指定
された領域の原稿文字と翻訳された文字が対応する表に
することにより、非常に見やすい翻訳結果出力が得られ
る。本発明の他の目的および特徴は図面を参照した以下
の実施例の説明により明らかになろう。

【００１０】

【実施例】

（実施例１）図１に本発明のデジタル翻訳装置の構成概
略のブロック図を示す。図１において、１は装置全体を
制御するＣＰＵ、２は翻訳する原稿を読み込むためのス
キャナ、３はスキャナ２により読取った画像データを格
納する画像メモリ、４は画像メモリ３に格納した画像デ
ータを読出しマークペンでマークした領域の検出を行な
うマーク領域検出部、５はマーク領域検出部４より検出
したマーク領域の文字を切り出して文字認識を行なう文
字認識部、６は文字認識部５で認識した文字を単語とし
て切り出し翻訳を行なう翻訳部、７はスキャナ２におい
て原稿の読取りなどを指示する操作部、８は翻訳した結
果を出力する出力部である。

【００１１】図２に、操作部７に対応したＣＰＵ１の制
御動作の概要を示す。スキャナ２の原稿設置台（図示し
ない）にマークペンで領域指定された英文文章原稿（翻
訳を行ないたい部分をマークペンで塗りつぶした原稿）
がセットされ、操作部７に「スタート」入力があると、
ＣＰＵ１はまず、セットされた原稿をスキャナ２の原稿
読取り部により読取って、例えば、図３に示すような原
稿対応の画像を得る（ステップ１００：以下カッコ内で
はサブルーチンとかステップと言う語を省略し、それに
付した番号数字のみを記す）。なお、図３において四角
で囲まれた単語は、マークペンで指定された（塗りつぶ
された）単語を示す。

【００１２】次にマーク領域検出部４により、マーク領
域の検出処理を行なう（２００）。このマーク領域の検
出処理（２００）では、ステップ１００で読取った画像
に対し、まず、図４に示すように主走査方向の黒画素の
ヒストグラムを計算し、文字画像を行単位で切り出す。
次に、行単位で切り出した１行分の画像において、図５
に示すように、その中心（主走査方向の中心）を通るラ
イン（副走査方向に１画素分のライン）１０の濃度値を
検出する。行単位で切り出した画像には、文字画像の領
域，マークペンでマークした領域，および画像のない領
域、の３種類の画像領域があるが、図５において、１１
は文字画像の領域、１２はマークペンでマークした領
域、１３は画像のない領域の濃度１３、をそれぞれ示し
ている。３種類の画像領域の副走査方向の１ラインの濃
度値は、それぞれの領域において異なることがわかる。
従って、この濃度の違いにより、原稿のマーク領域の単
語の画像のみを抽出することができる。

【００１３】さらに文字検出部５において、図６に示す
ように抽出したマーク領域の文字画像において副走査方
向に黒画素のヒストグラムを計算し、１文字単位の文字
画像を切り出す（３００）。なお、１文字単位で切り出
された文字画像の例を図７に示す。また、文字認識部５
において、切り出したある文字単位の画像とその次の文
字単位画像との距離（文字間）が１文字分の距離以上の
場合、そこを単語の切れ目と判断し、１文字単位の文字
画像をグループ化して単語を抽出する（４００）。この
抽出した単語の例を図８に示す。その後、文字認識部５
でグループ化した単語の１文字ずつの文字認識を行なう
（５００）。

【００１４】翻訳部６において、文字認識部５で認識し
た単語単位の文字コードに相当する日本語を翻訳辞書か
ら検索し、翻訳結果を出力する（６００）。さらに翻訳
結果の文字コードを文字画像に変換して出力部８が有す
る出力画像メモリに画像を形成する（７００）。指定さ
れた単語のすべての出力画像（翻訳画像）が形成される
まで、ステップ３００〜７００の処理を繰返し、指定さ
れた全ての単語の出力画像が形成されると（８００）、
出力画像メモリに書き込みれた出力画像を紙に転写して
排出する（９００）。

【００１５】以上のようにあらかじめ原稿にマークペン
で領域指定を行なえば、このマーク領域の単語のみを抽
出して翻訳を行なうので、翻訳する必要のない単語を翻
訳する分の時間が短縮される。

【００１６】（実施例２）実施例１においては、マーク
ペンにより原稿に直接マークを行ない、翻訳する領域を
指定したが、実施例２では操作入力により翻訳する領域
を指定する。

【００１７】図９に本発明（実施例２）のデジタル翻訳
装置の構成概略のブロック図を示す。図９において、Ｃ
ＰＵ１、スキャナ２、画像メモリ３、文字認識部５、翻
訳部６、操作部７、符出力部８、図１に示す各部と同一
の構成および動作であり、マーク領域検出部４において
そのマーク指定動作が異なる。また付号１４は、マーク
領域を指定するための表示部一体型のタブレット（領域
指操作部＆表示部）であり、位置指定を行なうためのス
タイラスペンを備えている。

【００１８】図１０に、操作部７に対応したＣＰＵ１の
制御動作の概要を示す。スキャナ２の原稿設置台（図示
しない）に英文文章原稿がセットされ、操作部７に「ス
タート」入力があると、ＣＰＵ１はまず、セットされた
原稿をスキャナ２の原稿読取り部により読取って、例え
ば、図３に示すような原稿対応の画像を得る（ステップ
１００：以下カッコ内ではサブルーチンとかステップと
言う語を省略し、それに付した番号数字のみを記す）。
なお、図３において四角で囲まれたマーク領域はこの実
施例２では付加されていないものとする。

【００１９】次に、翻訳単語の指定処理を行なう（２０
０ａ）。この処理（２００ａ）では、まず、ステップ１
００で読取った画像に対し、マーク領域検出部４の文字
切出し手段により、主走査方向の黒画素のヒストグラム
を計算し文字画像を行単位で切り出す。切り出した行単
位の文字画像の全行（原稿画像と同一の画像）を表示部
一体型タブレット１４に表示する。この表示された画像
に対してスタイラスペン（図示しない）を用いて翻訳し
たい領域の位置指定を行なうと、指定された領域（位置
情報）を記憶する。

【００２０】指定された領域の画像に対して、文字認識
部５で、副走査方向に黒画素のヒストグラムを計算し、
１文字単位の文字画像を切り出す（３００）。また、文
字認識部５において、切り出したある文字単位の画像と
その次の文字単位画像との距離（文字間）が１文字分の
距離以上の場合、そこを単語の切れ目と判断し、１文字
単位の文字画像をグループ化して単語を抽出する（４０
０）。その後、文字認識部５でグループ化した単語の１
文字ずつの文字認識を行なう（５００）。

【００２１】翻訳部６において、文字認識部５で認識し
た単語単位の文字コードに相当する日本語を翻訳辞書か
ら検索し、翻訳結果を出力する（６００）。さらに翻訳
結果の文字コードを文字画像に変換して出力部８が有す
る出力画像メモリに画像を形成する（７００）。指定さ
れた単語のすべての出力画像（翻訳画像）が形成される
まで、ステップ３００〜７００の処理を繰返し、指定さ
れた全ての単語の出力画像が形成されると（８００）、
出力画像メモリに書き込みれた出力画像を紙に転写して
排出する（９００）。

【００２２】以上のように、読取った原稿画像を表示部
一体型のタブレット１４に表示し、この表示に基づいて
翻訳したい単語のみの領域指定を行なえば、指定領域の
単語のみを抽出して翻訳を行なうので、翻訳する必要の
ない単語を翻訳する分の時間が短縮される。

【００２３】ここで翻訳結果の出力形態につてい説明す
る。出力形態には、（１）入力文章に対応して英単語のすぐ下に翻訳結果を
出力する方法（２）出力用紙の下半分や右半分に翻訳結果を出力した
り、翻訳結果のみを出力する方法、等があるが、（１）の出力形態では、翻訳結果をための
領域を英文１行の下に作成し、更に英単語に対する日本
語（翻訳結果）の出力する画像の長さ（領域）が長い場
合、英文をずらして出力するため、入力原稿と比べ、単
語間が延び縮みするため非常に見ずらい。また、（２）
出力形態では、使用者が翻訳結果を見る場合、英単語と
翻訳結果の対応がわかりにくい。以上の点から本実施例
１および実施例２においては、図１３に示すように、領
域検出した英単語とそれに対する翻訳結果を表形式で出
力するようにしている。これは実施例１および実施例２
のステップ７００において、翻訳結果の文字コードを文
字画像に変換して出力部８が有する出力画像メモリに画
像を形成する際に、位置指定（アドレス指定）を行なう
だけで容易に実施することができる。

【００２４】

【発明の効果】以上のように本発明によれば、まず、原
稿読取手段(2)が原稿画像を読み取り、記憶手段(3)が、
原稿読取手段(2)が読み取った原稿の画像情報を格納す
る。さらに抽出手段(4)が、記憶手段(3)に格納された画
像情報から、マーク指定された領域の単語に対応する画
像情報を抽出し、文字認識手段(5)が、抽出手段(4)で抽
出した画像の文字単位の情報を切り出し、切り出した文
字単位の情報の間隔から単語情報を抽出して、単語単位
で文字を認識する。従って例えば、任意の単語に対して
マーク処理が施こされた英文章の原稿に対して、まず、
マーク処理が施こされた部分の画像のみを抽出し、その
後、抽出された領域において、アルファベット単位の文
字情報の切り出しを行ない、これを基に単語単位で文字
を認識することが可能である。また、翻訳手段(5)が認
識した単語を翻訳し、出力画像形成手段(8)が翻訳した
単語の文字画像を出力画像メモリに書込み、書込んだ情
報を出力するので、マーク指定された原稿画像に対応し
たが翻訳画像形成される。

【００２５】以上のように本発明では、マーク処理を施
こした必要な単語以外の文字認識処理および翻訳処理を
省略することができるので、翻訳にかかる処理時間の短
縮が図れる。

【００２６】また、原稿画像の任意の領域に対するマー
ク指定を入力する領域指定入力手段(14）を備えるの
で、原稿画像に対して直接マーク処理を施こす必要がな
く、操作により容易に原稿画像の任意の領域に対するマ
ーク指定を行なうことができる。

【００２７】さらに、出力画像形成手段(8)は、原稿画
像の指定された全ての領域に対する文字の、翻訳した単
語の文字画像を所定の書式に従って表形式で出力する。
従って、例えばこの書式を、指定された領域の原稿文字
と翻訳された文字が対応する表にすることにより、非常
に見やすい翻訳結果出力が得られる。

【図面の簡単な説明】

【図１】本発明のデジタル翻訳装置の構成概略のブロ
ック図である。

【図２】図１に示す操作部７に対応したＣＰＵ１の制
御動作の概要を示すフローチャートである。

【図３】原稿対応の画像の一例を示す平面図である。

【図４】図３に示す原稿画像に対して、主走査方向の
黒画素のヒストグラムを計算し文字画像を行単位で切り
出す際の、原稿対応の画像の一例を示す平面図である。

【図５】行単位で切り出した１行分の画像において、
画像の中心（主走査方向の中心）を通るライン（副走査
方向に１画素分のライン）１０の濃度値を示すグラフで
ある。

【図６】図４に示した行単位で切り出したの文字画像
を、副走査方向に黒画素のヒストグラムを計算し１文字
単位の文字画像を切り出す際の、原稿対応の画像の一例
を示す平面図である。

【図７】１文字単位で切り出された文字画像の一例を
示す平面図である。

【図８】１文字単位の文字画像をグループ化して単語
単位で抽出した一例を示す平面図である。

【図９】図１に示すデジタル翻訳装置（実施例１）と
別の、デジタル翻訳装置（実施例２）の構成概略のブロ
ック図である。

【図１０】図９に示す操作部７に対応したＣＰＵ１の
制御動作の概要を示すフローチャートである。

【図１１】図９に示すタブレット１４を示す平面図で
ある。

【図１２】翻訳出力の一例を示す平面図である。

【符号の説明】

１：ＣＰＵ２：スキャナ（画稿
読取手段）３：画像メモリ（記憶手段）４：マーク領域検出
部（抽出手段）５：文字認識部（文字認識手段）６：翻訳部（翻訳手
段）７：操作部８：出力部（出力画
像形成手段）１４：表示部一体型タブレット（領域指定入力手段）

フロントページの続き (72)発明者長谷川健一東京都大田区中馬込１丁目３番６号株式会社リコ−内

Claims

【特許請求の範囲】

【請求項１】原稿画像を読み取る原稿読取手段；原稿読
取手段が読み取った原稿の画像情報を格納する記憶手
段；記憶手段に格納された画像情報から、マーク指定さ
れた領域の画像情報を抽出する抽出手段；抽出手段で抽
出した画像の文字単位の情報を切り出し、切り出した文
字単位の情報の間隔から単語情報を抽出して、単語単位
で文字を認識する文字認識手段；認識した単語を翻訳す
る翻訳手段；および、翻訳した単語の文字画像を出力画像メモリに書込み、書
込んだ情報を出力する出力画像形成手段；を備える、デ
ジタル翻訳装置。
【請求項２】原稿画像の任意の領域に対するマーク指定
を入力する領域指定入力手段；を備えることを特徴とす
る、前記請求項１記載のデジタル翻訳装置。
【請求項３】出力画像形成手段は、原稿画像の指定され
た全ての領域に対する文字の、翻訳した単語の文字画像
を所定の書式に従って表形式で出力することを特徴とす
る、前記請求項１または請求項２記載のデジタル翻訳装
置。