JPH05324709A - 対訳画像形成装置 - Google Patents

対訳画像形成装置

Info

Publication number
JPH05324709A
JPH05324709A JP4151316A JP15131692A JPH05324709A JP H05324709 A JPH05324709 A JP H05324709A JP 4151316 A JP4151316 A JP 4151316A JP 15131692 A JP15131692 A JP 15131692A JP H05324709 A JPH05324709 A JP H05324709A
Authority
JP
Japan
Prior art keywords
image
word
information
translated word
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4151316A
Other languages
English (en)
Inventor
Tetsuo Fujisawa
哲夫 藤沢
Takako Satou
多加子 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP4151316A priority Critical patent/JPH05324709A/ja
Publication of JPH05324709A publication Critical patent/JPH05324709A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 原稿画像中に存在する単語に対応する訳語の
位置を明確にし,また,訳語付加により出力画像の内容
が大幅に変更したとしても,複写画像の内容を読みやす
くレイアウトして出力すると共に,特殊記号により接続
されている組単語の処理を適切に実行して,対訳効率を
向上させる。 【構成】 CPU109は,所定の記号を検出し,且
つ,それが行末にあると判断したときは前記所定の記号
を除去して前記訳語情報を検索し,行末にないと判断し
たときは前記所定の記号を含めて訳語情報を検索するよ
うに制御する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,対訳機能を備えたデジ
タル画像データを使用する複写機,ファクシミリ装置等
に適用される対訳画像形成装置に関し,より詳細には,
原稿を光学的に読み取り(或いは通信回線を介して画像
情報を入力し),読み取った(或いは入力した)画像情
報中の単語を認識して,その単語に対応する訳語を出力
する対訳画像形成装置に関する。
【0002】
【従来の技術】他国語で記載された文章を読む人にと
り,該文章の多くの部分については読解に支障はない
が,単に特定の単語についてのみ適切な訳語を知らない
ため,読み進むことができないといった状況が多々あ
る。このような状況において,辞書を用いて該特定単語
の意味を知り,読み進むことはよく経験するところであ
る。
【0003】そこで,他国語で記載された文章を自動的
に翻訳して出力する翻訳複写機として,例えば,特開昭
62−154845号公報に開示されている「翻訳複写
装置」がある。同公報に開示された公報によれば,第1
に,画像読取手段が原画像を読み取り,第2に,識別手
段が読み取った原画像を絵柄情報と文字情報に識別し,
第3に,翻訳手段が文字情報について文字毎に認識し,
更にその内容を他国語に翻訳して原画像と共に翻訳画像
を出力するように構成されている。従って,上記公報に
開示された技術によれば,原画像の複写画像と共に文字
情報に関する翻訳画像が得られるので辞書を用いる手間
を省くことができる。
【0004】
【発明が解決しようとする課題】しかしながら,上記の
従来技術における「翻訳複写装置」にあっては,確かに
原画像の複写画像と共に文字情報に関する翻訳画像が得
られるので辞書を用いる手間を省くことができるが,一
定の言語知識を有した多くの利用者にとって,必ずしも
エラーが皆無とはいえない現在の翻訳語術や実現コスト
等を勘案すれば,冗長性が高く,必ずしも望ましい機能
であるとは言えないという問題点があった。
【0005】また,従来にあっては,複数の段組を持つ
原稿画像に対しては,原稿画像中に存在する単語に対応
する訳語の位置が明確ではなく,また,訳語付加により
出力画像の内容が大幅に変更し,初期のレイアウトがく
ずれ,複写画像が非常に読みづらくなるばかりでなく,
単語と単語を特殊記号「−」,「&」,「/」等により
接続されている組単語或いは行末において完成された1
つの単語を分割して2行に分けたものにあっては,処理
が適切に実行できず,対訳効率を低下させるという問題
点があった。
【0006】本発明は上記の問題点に鑑みてなされたも
のであって,原稿画像中に存在する単語に対応する訳語
の位置を明確にし,また,訳語付加により出力画像の内
容が大幅に変更したとしても,複写画像の内容を読みや
すくレイアウトして出力すると共に,特殊記号により接
続されている組単語等の処理を適切に実行して,対訳効
率を向上させることを目的とする。
【0007】
【発明が解決しようとする課題】この発明は,原稿画像
を光学的に読み取り,画像情報に変換する画像読取手段
と,前記画像読取手段により読み取った画像情報或いは
通信回線を介して入力された画像情報を記憶する画像記
憶手段と,前記画像情報に対し各種画像処理を実行する
画像処理手段と,前記画像処理手段が出力する画像信号
に基づいて画像を記録媒体上に記録する画像記録手段
と,前記原稿画像情報と該情報に対する訳語情報を記憶
する訳語記憶手段と,前記訳語記憶手段の情報に基づい
て前記原稿画像情報に対し対訳処理を実行する制御手段
とを有する対訳画像形成装置において,前記制御手段
は,所定の記号を検出し,且つ,それが行末にあると判
断したときは前記所定の記号を除去して前記訳語情報を
検索し,行末にないと判断したときは前記所定の記号を
含めて訳語情報を検索する対訳画像形成装置を提供する
ものである。
【0008】また,前記制御手段は,前記所定の記号を
除去して訳語情報を検索した場合には,該所定の記号以
前の部分における文字数を以降の部分における文字数と
比較し,文字数の大きい方の部分の下に訳語情報を合成
することが望ましい。
【0009】また,前記制御手段は,前記所定の記号を
含めて訳語情報を検索したときに,前記訳語記憶手段に
該当する訳語がないと判断したときには,末尾(最後)
の所定の記号以降の部分を除去して訳語情報を検索する
ことが望ましい。
【作用】この発明は,特殊記号を検出し,且つ,それが
行末にあると判断したときは該特殊記号を除去して前記
訳語情報を検索し,行末にないと判断したときは前記特
殊記号を含めて訳語情報を検索する。
【0010】また,特殊記号を除去して訳語情報を検索
した場合には,該特殊記号以前の部分における文字数を
以降の部分における文字数とを比較し,文字数の大きい
方の部分の下に訳語情報を合成する。
【0011】また,特殊記号を含めて訳語情報を検索し
たときに,辞書に該当する訳語がないと判断したときに
は,末尾(最後)の特殊記号以降の部分を除去して訳語
情報を検索する。
【0012】
【実施例】以下,この発明に係る対訳画像形成装置の実
施例を, (1) 対訳画像形成装置の概略構成 (2) スキャナ部とプリンタ部の構成 (3) CPUの処理動作 (3)− 原稿認識処理 (3)− 特殊記号の分類 (3)− 段落,行,ページ合成処理 (3)− 訳語辞書検索処理 (3)− 訳語記憶処理 (3)− はめ込み合成画像生成処理 (3)− 訳語合成処理 の順に図面を参照して説明する。
【0013】(1) 対訳画像形成装置の概略構成 図1は,本発明の一実施例である対訳画像形成装置の概
略構成を示すブロック図である。この対訳画像形成装置
は,原稿画像を読み取るスキャナ部101,装置全体の
制御を実行するCPU109,制御プログラムが格納さ
れているROM110,制御プログラムが一時的に使用
するRAM111,読み取った画像を記憶する入力画像
メモリ104,出力画像を記憶する出力画像メモリ10
5,文字認識に使用するデータが格納されている認識辞
書メモリ106,単語とその単語に対応する訳語が格納
されている訳語辞書メモリ107,画像生成に使用する
文字フォントデータが格納されている出力フォントメモ
リ108,各装置間のデータのやりとりを行う内部シス
テム・バス115,アナログ信号をデジタル信号に変換
するA/D変換器102,システム・バス115とのイ
ンターフェイスを行うI/F103,113,出力画像
メモリに格納された画像を出力するプリンタ部114,
スタート,ストップ等の指示を与える操作ボード112
等により構成されている。
【0014】また,この対訳画像形成装置は,ファクシ
ミリ通信機能を具備し,116は電話回線の閉結,開放
或いはダイヤル信号の送出,リンギング周波数の検出等
を実行する網制御部(NCU),117は電話回線(ア
ナログ回線)にデータを送出する際のデータ変調,受信
時のデータ復調を実行するモデム(変復調装置),11
8は画像情報を電話回線に送り出す前の処理(受信側の
ファクシミリ機能に合わせてデータ圧縮をやり直した
り,画像情報の縮小)を実行する通信制御部である。そ
の他,ファクシミリ通信機能に必要な部分の説明は省略
する。
【0015】(2) スキャナ部とプリンタ部の構成 図2は,スキャナ部101及びプリンタ部114の内部
の概略構成を示す説明図である。スキャナ部101にお
ける原稿を載置するためのコンタクトガラス201は,
光源202a,202bによって照明され,読取原稿か
らの反射光はミラー203〜207及びレンズ208を
介してCCDイメージセンサ209の受光面に結像され
る。光源202(202a,202b)及びミラー20
3は,コンタクトガラス201の下面をコンタクトガラ
ス201と平行に副走査方向に移動する走行体210に
搭載され,ミラー204,205はその走行体210に
連動して1/2の速度で副走査方向に移動する走行体2
11に搭載されている。主走査方向のスキャンは,CC
Dイメージセンサ209の固体走査によって行われ,原
稿画像はCCDイメージセンサ209によって読み取ら
れ,前述のような光学系が移動することで原稿全体が走
査されるようになっている。尚,図中239は,原稿を
押圧するための圧板である。
【0016】次に,プリンタ部114は,レーザ書込
系,画像再生系並びに給紙系により構成される。レーザ
書込系は,レーザ出力ユニット221,結像レンズ22
2並びにミラー223を備えている。レーザ出力ユニッ
ト221の内部には,レーザ光源であるレーザダイオー
ド及びモータにより高速で回転する多角形ミラー(ポリ
ゴンミラー)が設けられている。レーザ書込系から出力
されるレーザ光が画像再生系の感光体ドラム224に照
射される。感光体ドラム224の周囲には,帯電チャー
ジャ225,イレーサ226,現像ユニット227,転
写チャージャ228,分離チャージャ229,分離爪2
30,クリーニングユニット231などが具備されてい
る。尚,感光体ドラム224の一端近傍でレーザビーム
が照射される位置に主走査同期信号を発生するビームセ
ンサ(図示せず)が配置されている。
【0017】このプリンタ部114における画像再生プ
ロセスの動作を簡単に説明する。感光体ドラム224の
周面は,帯電チャージャ225によって一様に高電位に
帯電される。その周面にレーザ光が照射されると,照射
された部分は電位が下がる。レーザ光は記録再生の黒/
白に応じてON/OFF制御されるので,レーザ光の照
射によって,感光体ドラム224の周面に記録画像に対
応する電位分布,即ち,静電潜像が形成される。静電潜
像が形成された部分が現像ユニット227を通ると,そ
の電位の高低に応じてトナーが付着し,静電潜像が可視
化したトナー像となる。トナー像が形成された部分に,
所定のタイミングで記録シート232が給紙カセットか
ら送り込まれ,トナー像に重なる。このトナー像は転写
チャージャ228によって記録シート232に転写さ
れ,その後分離チャージャ229並びに分離爪230に
よって,感光体ドラム224から分離される。分離され
た記録シート232は,搬送ベルト234によって搬送
され,ヒータを内蔵した定着ローラ235によって加熱
された後,排紙トレイ236に排紙される。
【0018】また,本実施例では,図2に示す通り,プ
リンタ部114は給紙系を2系統有している。一方の給
紙系は,上段給紙カセット233a及び手差し給紙台2
33cが備わっており,上段給紙カセット233a及び
手差し給紙台233cにセットされた記録シート232
aは,給紙ローラ237aによって給紙される。もう一
方の給紙系には下段給紙カセット233bが備わり,下
段給紙カセット233b内の記録シート232bは,給
紙ローラ237bによって給紙される。そしていずれか
の給紙ローラから給紙された記録シート232はレジス
トローラ238に当接した状態で一旦停止し,記録プロ
セスの進行に同期したタイミングで感光体ドラム224
の転写部へに送り込まれる。
【0019】(3) CPUの処理動作 図3〜図10は,各々CPU109の処理動作を示すフ
ローチャートである。まず,図3のフローチャートを参
照する。電源を投入(ON)すると,処理モード等の初
期化(S301)を行う。次に,操作ボード112から
の対訳動作指示があったか否かを判断する(S30
2)。対訳動作指示がないときは,通常の複写動作(S
303)を行い,再び対訳動作指示(S302)の待機
状態となる。
【0020】反対に,対訳動作指示があった場合は,再
び操作ボード112からスタート指示があったか否かを
判断する(S304)。スタート指示があったと判断す
ると,スキャナ部101にセットされた原稿画像を読み
取り(S305),入力画像メモリ104に記憶する。
次に,原稿のページ数をカウントし(S306),原稿
認識(S307)を実行する。
【0021】(3)− 原稿認識処理 原稿認識(S307)の処理を図4に示す。原稿認識
は,初めに段組認識(S401)を実行する。段組認識
は,主走査方向/副走査方向共に,読取画像データの文
字が存在しない部分(白領域)が一定間隔以上存在した
場合を段の区切りとして認識する。次に,段組位置認識
(S402)を実行する。段組位置認識は,スキャナ部
101により読み取られ,入力画像メモリ104に保存
されている画像情報に,画素単位で座標を与え,認識さ
れた段組が画像中に占める座標を求める。例えば,図1
3に示した原稿中の「Chapter 1」で始まる段
組を例にすると,図14に示すように「Chapter
1」で始まる段組が完全に含まれる長方形の領域を求
め,その領域の左上の座標(bsx,bsy)と右下の
座標(bex,bey)を認識する。
【0022】次に,行認識(S403)を実行する。行
認識は認識された段組ごとに行い,副走査方向に,読取
画像データの文字が存在しない部分(白領域)が一定間
隔以上存在した場合を行の区切りとして認識する。次
に,行位置認識(S404)を実行する。行位置認識
は,スキャナ部101により読み取られ,入力画像メモ
リ104に保存されている画像情報に,画素単位で座標
を与え,認識された行が画像中に占める座標を求める。
例えば,図13に示した原稿中の「from asin
gle」で始まる行を例にすると,図14に示すように
「from asingle」で始まる行が完全に含ま
れる長方形の領域を求め,その領域の左上の座標(ls
x,lsy)と右下の座標(lex,ley)を認識す
る。
【0023】次に,文字認識(S405)を実行する。
文字認識アルゴリズムはテンプレートマッチング,トポ
ロジカルマッチングなど従来用いられている技術の組み
合わせを利用する。次に,文字認識で認識された文字か
ら単語抽出(S406)を実行する。単語抽出は行ごと
に行い,主走査方向に読取画像データの文字が存在しな
い部分(白領域)が一定間隔以上存在した場合,また空
白文字,句読点等の区切記号が存在した場合を単語の区
切りとして抽出する。次に,特殊記号の分類(S40
7)を実行する。その後,単語位置認識(S408)を
実行する。単語位置認識は,スキャナ部101により読
み取られ,入力画像メモリ104に保存されている画像
データに,画素単位で座標を与え,認識された単語が画
像中に占める座標を求める。例えば,図13に示した原
稿中の「This」という単語を例にすると,図14に
示すように「This」が完全に含まれる長方形の領域
を求め,その領域の左上の座標(wsx,wsy)と右
下の座標(wex,wey)を認識する。
【0024】(3)− 特殊記号の分類 図5は,特殊記号の分類動作を示すフローチャートであ
る。まず,改行位置認識を実行し(S501),次に,
文字認識を実行し(S502),その後,ハイフォンが
あるか否かを判断する(S503)。ハイフォンがない
と判断すれば,上記ステップ502に戻り,ハイフォン
があると判断するまでステップ502〜503を繰り返
す。反対に,ハイフォンがあると判断すれば,次に,行
末か否かを判断し(S504),行末であると判断した
場合には,分割単語フラグをリセットする(S50
5)。反対に,行末ではないと判断した場合には,分割
単語フラグをセットして(S506)リターンする。
【0025】(3)− 段落,行,ページ合成処理 次に,図3のフローチャートに戻り,段落,行,ページ
合成(S308)を実行する。この処理を図6に示す。
段落,行,ページ合成処理は,初めに読み取り画像複写
(S601)を実行する。読取画像複写は,スキャナ部
101によって読み取られ,入力画像メモリ104に記
憶されている画像情報を出力画像メモリ105に複写す
る。
【0026】次に,段組枠作画(S602)を実行す
る。段組枠作画は,上記ステップ402における段組位
置認識により求められた座標データに基づいて,それぞ
れの段組が完全に含まれる長方形を作画する。即ち,そ
れぞれの段組で(bsx,bsy)と(bex,be
y)を対角座標に持つ長方形を作画する。図15に段組
枠を作画した例を示す。
【0027】次に,段番号合成(S603)を実行す
る。段番号合成は,上記ステップ401における段組認
識により認識された段組ごとに順番に段番号を各段組の
左上に付加する。段番号の付加方法は,付加する段番号
に使用するフォントデータを,出力フォントメモリ10
8から読み出して,出力画像メモリ105に展開する。
このときの基準座標として(bsx,bsy)を用い
る。即ち,フォントデータの展開は(bsx,bsy)
を始点として実行する。図15に段番号を作画した例を
示す。
【0028】次に,行番号合成(S604)を実行す
る。行番号合成は,上記ステップ403の行認識により
認識された行ごとに順番に行番号を各行の左側に付加す
る。行番号の付加方法は,付加する行番号に使用するフ
ォントデータを出力フォントメモリ108から読み出し
て,出力画像メモリ105に展開する。このときの基準
座標として(lsx,lsy)を用いる。即ち,フォン
トデータの展開は(lsx,lsy)を始点として実行
する。図15に行番号を作画した例を示す。この例で
は,出力する行番号は5の倍数に限定している。
【0029】次に,ページ番号合成(S605)を実行
する。ページ番号合成は,上記ステップ306の原稿ペ
ージ数カウントによりカウントされたページ番号を出力
画像メモリ105中の画像の下中央部に付加する。ペー
ジ番号の付加方法は段番号の付加方法と同じように,付
加するページ番号に使用するフォントデータを,出力フ
ォントメモリ108から読み出して,出力画像メモリ1
05に展開する。このときの基準座標として,出力画像
メモリ105中の画像の下中央部の座標を予め定めてお
く。フォントデータの展開は,その定められた座標を始
点として行う。図15にページ番号を作画した例を示
す。
【0030】以上の処理で,読み取った原稿画像に段落
番号,行番号,ページ番号を合成した画像が出力画像メ
モリ105に作成される。次に,この画像をプリンタ部
114により記録するプリント出力(S309)を実行
する(図3参照)。
【0031】(3)− 訳語辞書検索処理 次に,訳語辞書検索(S310)を行う。この処理を図
7に示す。訳語辞書検索は,初めに上記ステップ406
の単語抽出処理により抽出され記憶されている単語を一
つ読み出す認識単語読み出し(S701)を実行する。
次に,認識単語の中にハイフォンが有るか否かを判断す
る(S702)。ハイフォンがあると判断した場合に
は,次に,分割単語フラグがセットされているか否かを
判断する(S703)。尚,ここで,分割単語とは完成
した単語を接続したもの,例えば,electron−
spinを意味し,前出の組単語を意味する。セットさ
れていると判断されれば,ハイフォンを含めて辞書検索
を実行する(S704)。その後,検索された単語が辞
書にあるか否かを判断する(S705)。辞書にないと
判断した場合には,末尾のハイフォン以降の単語を除い
て辞書検索を実行し(S706),その結果が辞書にあ
るか否かを判断する(S707)。辞書になければ,次
に,検索した単語にハイフォンがあるか否かを判断する
(S708)。ハイフォンがないと判断した場合には,
出力フラグをリセットし(S709),反対に,ハイフ
ォンがあると判断した場合には,上記ステップ706に
戻り,ハイフォンなしと判断するまで以降の処理を繰り
返す。また,上記ステップ707において辞書にあると
判断した場合には,訳語記憶を実行し(S710),出
力フラグをセットする(S711)。
【0032】上記ステップ709/711の出力フラグ
のリセット/セット後,読み出した認識単語の検索が全
て完了か否かを判断する(S712)。全て完了してい
ないと判断した場合には,読み出した認識単語のうち,
除去された単語の読み出しを実行した(S713)後,
上記ステップ705へ戻り,読み出した認識単語の検索
が全て完了したと判断するまで以降の処理を繰り返す。
反対に,上記ステップ712において,読み出した認識
単語の検索が全て完了したと判断した場合には,更に,
全認識単語完了か否かを判断し(S719),完了であ
ればリターンし,反対に,完了していなければ上記ステ
ップ701に戻り,全認識単語完了と判断するまで以降
の処理を繰り返す。
【0033】また,上記ステップ703において,分割
単語フラグがセットされていないと判断した場合には,
ハイフォンを除くと共に次の認識単語を読み出して接続
する(S714)。その後,該単語が辞書にあるか否か
を判断し(S715),辞書にあると判断た場合には訳
語記憶を実行し(S716),出力フラグをセットする
(S717)。反対に,辞書にないと判断した場合には
出力フラグをリセットする(S718)。また,上記テ
ップ702において,認識単語の中にハイフォンがない
と判断した場合には,上記ステップ715に移行する。 (3)− 訳語記憶処理 ここで,上記訳語記憶処理(S710/S716)につ
いて図8のフローチャートを用いて説明する。この訳語
記憶処理は,単語とその単語に対応する訳語を訳語辞書
メモリ107から読み出して記憶する。訳語辞書メモリ
107には単語とその単語に対応する訳語がペアで記憶
されているが,訳語は一つの単語に対して複数の意味が
登録されている。それぞれの訳語は品詞別に優先順位が
付けられている。
【0034】次に,品詞特定により品詞が特定されたか
否かを品詞特定検査(S801)で判断する。品詞が特
定されていた場合は,特定された品詞の訳語を読み出す
(S803)。反対に,品詞が特定されていない場合
は,複数の品詞があるか否かを判断する(S802)。
複数の品詞がある場合は,第一優先品詞の訳語を読み出
す(S804)。複数の品詞がない場合は,訳語を読み
出す(S805)。
【0035】例えば,“play”という単語は,訳語
辞書メモリ107内において,次のように記憶されてい
る。 play [動]遊ぶ;〜する;演奏する [名]遊
び これは,第一優先品詞が動詞で,そのときの訳語が「遊
ぶ」,「〜する」,「演奏する」を表し,第二優先品詞
が名詞で,そのときの訳語が「遊び」であることを表
す。即ち,品詞特定で動詞と特定されれば,「遊ぶ」が
読み出され,名詞と特定されれば「遊び」が読み出され
る。また品詞が特定されている場合は,第一優先品詞の
訳語である「遊ぶ」が読み出される。このようにして読
み出された訳語は単語と共に記憶される(S806)。
【0036】次に,図3のフローチャートに戻り,出力
ページ数カウント(S311)を実行する。本発明で
は,読み取った原稿画像より,画像生成手段によって生
成され出力される画像の方が情報量が多いため,1ペー
ジの原稿画像に対して,複数ページの出力画像が対応す
る場合がある。出力ページ数カウント処理では,この出
力画像のページ数をカウントする。
【0037】(3)− はめ込み合成画像生成処理 次に,はめ込み合成画像生成処理(S312)を実行す
る。この処理を図9に示す。はめ込み合成画像生成は,
初めに段落番号カウント(S901)を実行する。段組
番号カウントは,上記ステップ401における段組認識
により認識された段組を順番にカウントする。次に,段
組番号合成(S902)を実行する。段組番号合成は,
カウントされた段組番号に対応するフォントデータを出
力フォントメモリ108から読み出して,出力画像メモ
リ105に展開することにより実行する。この段組番号
合成を実行した例を,図16に示す。
【0038】次に,行番号カウント(S903)を実行
する。行番号カウントは,上記ステップ403の行認識
により認識された行を順番にカウントする。次に,行番
号合成(S904)を実行する。行番号合成は,カウン
トされた行番号に対応するフォントデータを出力フォン
トメモリ108から読み出して,出力画像メモリ105
に展開することにより実行する。この行番号合成を実行
した例を,図16に示す。ここでは,5の倍数の行番号
のみ展開を行っている。
【0039】次に,読み取り行複写(S905)を実行
する。読み取り行複写は,スキャナ部101により読み
取り,入力画像メモリ104に格納されている画像情報
から,上記ステップ404の行位置認識により求めた座
標(lsx,lsy),(lex,ley)を対角に持
つ長方形領域を,出力画像メモリ105に複写すること
により実行される。
【0040】次に,出力フラグ検査(S906)を実行
する。出力フラグ検査は,上記ステップ711/717
の出力フラグセット,ステップ709/718の出力フ
ラグリセットによって付けられた各単語ごとの出力フラ
グがセットされているか,リセットされているかを判断
する。出力フラグがセットされていると判断した場合に
は,訳語読み取り(S907)を実行する。訳語読み取
りは,上記ステップ710/716における訳語記憶に
より記憶された訳語を読み出す。続いて,訳語合成(S
908)を実行する。
【0041】(3)− 訳語合成処理 訳語合成処理(S908)を図10に示すフローチャー
トに基づいて説明する。まず,ハイフォンが有るか否か
を判断し(S1001),無ければリターンする。反対
に,ハイフォンがあれば,分割単語フラグがセットされ
ているか否かを判断し(S1002),セットされてい
ると判断された場合,認識単語の下行の中央に訳語合成
を実行して(S1003),リターンする。反対に,分
割単語フラグがセットされていないと判断した場合に
は,次に,ハイフォン以前の文字数の方が以降より大き
いか否かを判断する(S1004)。大きくないと判断
した場合には,ハイフォン以降の単語の下行に訳語合成
を実行し(S1006),反対に,大きいと判断した場
合には,ハイフォン以前の単語の下行に訳語合成を実行
する。
【0042】次に,図9のフローチャートに戻り,行内
の全単語についての処理が終了したか否かを判断し(S
909),終了していなければ,次の単語について上記
ステップ906の「出力フラグ検査」から同処理を繰り
返す。行内の全単語について処理が終了したと判断した
場合は,段組内の全行が終了しているか否かの判断を行
う(S910)。終了していなければ,次の行について
上記ステップ903の「行番号カウント」から同じ処理
を繰り返す。段組内の全行についての処理が終了したと
判断した場合は,ページ内の全段が終了しているか否か
の判断を行う(S911)。終了していなければ,次の
段について上記ステップ901の「段組番号カウント」
から同じ処理を繰り返す。
【0043】次に,ページ番号合成(S912)を実行
する。ページ番号合成処理は図6に示したステップ60
5の「ページ番号合成」と同じ処理を実行するが,図1
6に示すように原稿画像のページ数と生成画像のページ
数をハイフォンで接続した番号を合成する。
【0044】図3のフローチャートに戻って,次にプリ
ント出力(S313)を実行する。プリント出力処理は
上記ステップ309の「プリント出力」と同じで,上記
ステップ312の「はめ込み合成画像生成」により生成
された,画像をプリンタ部114によりプリントする。
次に,読み取った原稿に対応するはめ込み合成画像のプ
リントが全て完了したか否かを判断する(S314)。
まだ,完了していないと判断した場合は,上記ステップ
311に戻り,次のページ数カウントから同じ処理を繰
り返す。
【0045】プリントが全て完了した場合,読取原稿を
全て読み取り,処理が完了した否かを判断する(S31
5)。まだ,完了していない場合は,次の原稿について
上記ステップ305の「原稿読み取り」から同じ処理を
繰り返す。以上の処理が全て終了したら,再び上記ステ
ップ302の「対訳動作指示」に戻る。
【0046】以上のように,分割英単語のような特殊記
号を含んだ単語の検索を行う構成の場合,OCR処理に
おいて特殊文字の検索,制御を行う。これは,辞書検索
を行う1単位と見なされた文字列中の特殊記号或いは登
録された文字,記号を認識し,前記記号或いは文字の前
後の文字を1つの辞書検索単位として見なす。このと
き,行末に所定記号(一般にはハイフォン)が認識され
た場合はその前後の文字列を各々辞書検索単位と見なさ
ず,次の文字列(次の行頭の単語)と連結させて辞書検
索1単位とする動作を行い,フォーマットは特殊文字を
考慮した形式でメモリに格納する。
【0047】図11は,単語,分割単語の構造フォーマ
ットの内容を説明するものである。まず単語の構造体フ
ォーマットのメンバーである文字数は,OCRで単語と
認識された文字の数を表し,分割単語オフセットは認識
単語が分割単語の場合,その行での分割単語の個数のオ
フセット値をあらわしている。分割単語でないものには
適当な固定値を代入しておく。図11では0xffを代
入している。次に,分割単語の構造体フォーマットのメ
ンバーである文字数は,認識された分割単語の文字数を
表し,分割単語残り数は注目分割単語に連結している分
割単語の個数を表す。
【0048】図12は,行末にハイフォンがきたときの
処理の説明図である。1)は行末にハイフォンがある場
合の原稿の状態を示す。ここで,“communi―”
の単語の文字数と分割単語の文字数を比較する。その結
果,2)に示したように8と7で分割単語数が1少ない
ことがわかる。そして,この単語は行に存在する最終単
語という情報が既知であるため,分割単語として扱わな
いと認識することができる。そして,行末の分割単語を
分割単語テキストデータから取り出し,次の行頭の単語
を単語テキストから取り出し両者を連結させてから辞書
検索を実行する。次に,行末の文字数と,行頭の文字数
を比較し,3),4)に示すように文字数の多い方に前
記辞書検索処理により検索された訳語を出力させること
ができる。
【0049】また,図17は,特殊記号により接続され
ている複数の単語から構成される組単語が,前記訳語記
憶手段に記憶されていないとき,組単語の接続を分解
し,分割された単語に対して訳語出力するように制御す
るための動作を示すフローチャートである。
【0050】初めに,特殊記号「−」,「&」,「/」
等を含む英単語の検索に関して説明する。特殊記号
「−」,「&」,「/」を含む英単語が与えられたと
き,その英単語を適宜辞書検索し,該英単語を辞書内に
見出せなかったときには,その英単語を特殊記号の部分
で分割し,該分割した各々の英単語について再度検索処
理を実行する。以下に出力例を示す。 入力英単語 :electron−spin 見出し英単語1:electron 訳語1:電子 見出し英単語2:spin 訳語2:紡ぐ 他のモードでは, 入力英単語 :electron−spin 見出し英単語1:electron 訳語1 :[名]電子,エレクトロン 見出し英単語2:spin 訳語2 :[動]紡ぐ,(糸を)かける,回す,
スピンする 上記に示した例は,訳語辞書メモリ107の内容が以下
のようになっている場合である。即ち, electron[名]電子,エレクトロン spin [動]紡ぐ,(糸を)かける,回す,
スピンする
【0051】次に,図17において,abc−de−f
ghの訳語検索処理を例に採って説明する。まず,ab
c−de−fghの状態で訳語検索を実行する(S17
01)。その後,abc−de−fghの状態で,その
訳語が辞書にあるか否かを判断する(S1702)。辞
書にあると判断した場合には,リターンして上記説明し
た処理を実行する。反対に,辞書にないと判断した場合
には,次に,abc−deの状態で訳語検索を実行する
(S1703)。その後,abc−deの状態で,その
訳語が辞書にあるか否かを判断する(S1704)。辞
書にあると判断した場合には,fghの訳語検索を実行
する(S1709)。反対に,辞書にないと判断した場
合には,次に,abcで訳語検索を実行する(S170
5)。次に,de−fghの状態で訳語検索を実行する
(S1706),その後,de−fghの状態で,その
訳語が辞書にあるか否かを判断する(S1707)。辞
書にあると判断した場合には,リターンする。反対に,
辞書にないと判断した場合には,deで訳語検索を実行
し(S1708),更にfghで訳語検索を実行した
(S1709)後リターンする。
【0052】また,上記実施例にあっては,対訳画像形
成装置における各種制御をソフトウェアにより実現して
いるが,処理の高速性に鑑み必要に応じて(全体的に或
いは部分的に)ハードウェアに置換して構成してもよ
い。
【0053】
【発明の効果】以上説明した通り,本発明による対訳画
像形成装置によれば,特殊記号を検出し,且つ,それが
行末にあると判断したときは該特殊記号を除去して前記
訳語情報を検索し,行末にないと判断したときは前記特
殊記号を含めて訳語情報を検索し,また,特殊記号を除
去して訳語情報を検索した場合には,該特殊記号以前の
部分における文字数を以降の部分における文字数とを比
較し,文字数の大きい方の部分の下に訳語情報を合成
し,また,特殊記号を含めて訳語情報を検索したとき
に,辞書に該当する訳語がないと判断したときには,末
尾(最後)の特殊記号以降の部分を除去して訳語情報を
検索するため,原稿画像中に存在する単語に対応する訳
語の位置を明確にし,また,訳語付加により出力画像の
内容が大幅に変更したとしても,複写画像の内容を読み
やすくレイアウトして出力すると共に,特殊記号により
接続されている組単語を処理を適切に行い,対訳効率を
向上させることができる。
【図面の簡単な説明】
【図1】本発明による対訳画像形成装置の構成を示すブ
ロック図である。
【図2】本発明による対訳画像形成装置を具体化した複
写機の構成を示す説明図である。
【図3】図1に示した対訳画像形成装置のメイン動作を
示すフローチャートである。
【図4】図3に示した原稿認識処理の動作を示すフロー
チャートである。
【図5】図3に示した特殊記号の分類動作を示すフロー
チャートである。
【図6】図3に示した段落,行,ページ合成処理の動作
を示すフローチャートである。
【図7】図3に示した訳語辞書検索処理の動作を示すフ
ローチャートである。
【図8】図7に示した訳語記憶処理の動作を示すフロー
チャートである。
【図9】図3に示したはめ込み合成画像生成処理の動作
を示すフローチャートである。
【図10】図8に示した訳語合成処理の動作を示すフロ
ーチャートである。
【図11】単語,分割単語の構造フォーマットの内容を
示す説明図である。
【図12】行末にハイフォンがきたときの処理を示す説
明図である。
【図13】原稿画像例を示す説明図である。
【図14】図13に示した原稿画像に対し座標指定した
状態を示す説明図である。
【図15】図13に示した原稿画像に対し段落番号を付
けた状態を示す説明図である。
【図16】図13に示した原稿画像に対して,この発明
による一連の対訳付加処理を実行した後に出力される複
写画像例を示す説明図である。
【図17】組単語における分割処理動作の一例を示すフ
ローチャートである。
【符号の説明】
101 スキャナ部 104 入力画像
メモリ 105 出力画像メモリ 106 認識辞書
メモリ 107 訳語辞書メモリ 108 出力フォ
ントメモリ 109 CPU 110 ROM 111 RAM 114 プリンタ
部 115 システムバス 116 網制御部
(NCU) 117 モデム 118 通信制御

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 原稿画像を光学的に読み取り,画像情報
    に変換する画像読取手段と,前記画像読取手段により読
    み取った画像情報或いは通信回線を介して入力された画
    像情報を記憶する画像記憶手段と,前記画像情報に対し
    各種画像処理を実行する画像処理手段と,前記画像処理
    手段が出力する画像信号に基づいて画像を記録媒体上に
    記録する画像記録手段と,前記原稿画像情報と該情報に
    対する訳語情報を記憶する訳語記憶手段と,前記訳語記
    憶手段の情報に基づいて前記原稿画像情報に対し対訳処
    理を実行する制御手段とを有する対訳画像形成装置にお
    いて,前記制御手段は,所定の記号を検出し,且つ,そ
    れが行末にあると判断したときは前記所定の記号を除去
    して前記訳語情報を検索し,行末にないと判断したとき
    は前記所定の記号を含めて訳語情報を検索することを特
    徴とする対訳画像形成装置。
  2. 【請求項2】 前記制御手段は,前記所定の記号を除去
    して訳語情報を検索した場合には,該所定の記号以前の
    部分における文字数を以降の部分における文字数と比較
    し,文字数の大きい方の部分の下に訳語情報を合成する
    ことを特徴とする請求項1記載の対訳画像形成装置。
  3. 【請求項3】 前記制御手段は,前記所定の記号を含め
    て訳語情報を検索したときに,前記訳語記憶手段に該当
    する訳語がないと判断したときには,末尾(最後)の所
    定の記号以降の部分を除去して訳語情報を検索すること
    を特徴とする請求項1記載の対訳画像形成装置。
JP4151316A 1992-05-19 1992-05-19 対訳画像形成装置 Pending JPH05324709A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4151316A JPH05324709A (ja) 1992-05-19 1992-05-19 対訳画像形成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4151316A JPH05324709A (ja) 1992-05-19 1992-05-19 対訳画像形成装置

Publications (1)

Publication Number Publication Date
JPH05324709A true JPH05324709A (ja) 1993-12-07

Family

ID=15515978

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4151316A Pending JPH05324709A (ja) 1992-05-19 1992-05-19 対訳画像形成装置

Country Status (1)

Country Link
JP (1) JPH05324709A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830624A (ja) * 1994-07-15 1996-02-02 Matsushita Electric Ind Co Ltd 解読支援装置
JPH1155381A (ja) * 1997-07-29 1999-02-26 Yasue Mamezaki 画像認識送受信装置
JP2010272114A (ja) * 2009-05-21 2010-12-02 Nhn Corp オンライン辞書サービス提供装置及びオンライン辞書サービス提供方法
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830624A (ja) * 1994-07-15 1996-02-02 Matsushita Electric Ind Co Ltd 解読支援装置
JPH1155381A (ja) * 1997-07-29 1999-02-26 Yasue Mamezaki 画像認識送受信装置
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data
JP2010272114A (ja) * 2009-05-21 2010-12-02 Nhn Corp オンライン辞書サービス提供装置及びオンライン辞書サービス提供方法

Similar Documents

Publication Publication Date Title
US5729618A (en) Image forming apparatus for outputting equivalents of words spelled in a foreign language
US5517409A (en) Image forming apparatus and method having efficient translation function
JP4789516B2 (ja) 文書変換装置、文書変換方法並びに記憶媒体
JP3729017B2 (ja) 画像処理装置
JP3050007B2 (ja) 画像読取装置およびこれを備えた画像形成装置
JPH09270902A (ja) 画像ファイリング方法および画像ファイリング装置
JPH0951422A (ja) 画像編集装置
JP5594269B2 (ja) ファイル名作成装置、画像形成装置、およびファイル名作成プログラム
KR100306063B1 (ko) 화상처리방법및장치
JP2006201935A (ja) 画像データ処理装置
EP0961472B1 (en) Image processing apparatus and method and computer-readable memory
JPH05324720A (ja) 対訳画像形成装置
JPH05324709A (ja) 対訳画像形成装置
US5956669A (en) Image forming apparatus with translation capability
JP3269842B2 (ja) 対訳画像形成装置
JPH05266074A (ja) 対訳画像形成装置
JPH11212751A (ja) 画像形成装置、画像形成方法および記憶媒体
JPH05324704A (ja) 対訳画像形成装置
JP4665522B2 (ja) 画像データ処理装置
JPH11213089A (ja) 画像処理装置及びその方法
JPH0477965A (ja) デジタル複写装置
JPH11220557A (ja) 画像処理装置及び方法
JPH0774934A (ja) 翻訳機能を設けた画像形成装置
JP3489788B2 (ja) 原稿画像処理装置
JPH0546659A (ja) デジタル翻訳複写装置