JPH11110480A - テキストの表示方法およびその装置 - Google Patents

テキストの表示方法およびその装置

Info

Publication number
JPH11110480A
JPH11110480A JP10125508A JP12550898A JPH11110480A JP H11110480 A JPH11110480 A JP H11110480A JP 10125508 A JP10125508 A JP 10125508A JP 12550898 A JP12550898 A JP 12550898A JP H11110480 A JPH11110480 A JP H11110480A
Authority
JP
Japan
Prior art keywords
text
document
word
document image
display device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10125508A
Other languages
English (en)
Inventor
A Evans David
エイ.エバンズ デビッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KURARITEC CORP
Original Assignee
KURARITEC CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KURARITEC CORP filed Critical KURARITEC CORP
Publication of JPH11110480A publication Critical patent/JPH11110480A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 元テキストを出力テキスト上に重ね合わせる
ことができるようにすること。 【解決手段】 光学的文字認識(OCR)出力のソース
であるドキュメント・イメージが記述される。元テキス
トからのワードが出力テキストのワード上に重ね合わさ
れる。好適には、ユーザが表示されたドキュメント・イ
メージの領域を選択することができる。領域が選択され
るとき、選択された領域に対応するOCR出力のワード
はポップアップメニュー中に表示される。また、発明
は、ある言語で表されたテキストがその翻訳を示す他の
テキスト上に重ね合わされることを可能にする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学的文字認識お
よびコンピュータ化された翻訳装置の分野に関する。よ
り詳細に、この発明は、元テキスト(source text )を
出力テキスト(output text )に重ね合わせる方法およ
び装置に関する。
【0002】
【従来の技術】紙ドキュメントからテキストおよびグラ
フィックスを得ることは、多くの産業において重要な課
題とされている。例えば、出版社は1年の間に何百また
は何千もの学術論文を印刷することがある。しばしば出
版社は紙ドキュメントから作業を行い、その紙ドキュメ
ントは出版社のコンピュータ設備に入力されなければな
らない。従来のアプローチの一つとして、紙ドキュメン
トを読み、それらをタイプしてコンピュータ・システム
に入力するためにタイピストを雇うというものがある。
しかしながら、ドキュメントをキー入力することは、時
間および費用のかかる作業であるといえる。
【0003】光学的文字認識(OCR)は、出版産業や
他の産業にとって有益であることを保証する技術であ
る。なぜなら、OCR装置の入力処理率がタイピストの
入力処理率をはるかに上回っているからである。したが
って、出版社の従業員は、スキャンされたドキュメント
からしばしば作業を開始する。そのドキュメントは、O
CR装置によってASCIIのようなコンピュータ読み
取り可能なテキスト・フォーマットに変換されている。
しかしながら、最近のOCR装置で可能な高い認識率
(しばしば95%を上回る)でさえ、高い精度を必要と
する出版産業のような産業にとっては十分でないとされ
る。それゆえ、出版社は、しばしば校正担当者(proofr
eader )を雇い、人手でOCR出力をチェックすること
にしている。
【0004】
【発明が解決しようとする課題】しかしながら、人手で
OCR出力を校正することは非常に時間がかかり、それ
を行うことは人々にとって非常に難しい作業である。人
は、元の紙ドキュメントおよびOCR出力のプリントア
ウトまたは画面表示の両方を見比べ、それらを逐語的に
比較しなければならない。それどころか、高い認識率に
より、OCR出力を校正している者は無頓着になり易
く、テキストにおけるエラーを見過ごしてしまう傾向が
ある。
【0005】他の従来のオプションとして、結果物であ
るコンピュータ読み取り可能なテキストについてスペル
チェックを行うというものがある。しかしながら、全て
の認識エラーが、誤ったスペルのワードというわけでは
ない。加えて、入力ワードは曲解されているかもしれな
いため、スペルチェック操作の間中、校正担当者は元の
紙テキストを参照しなければならない。校正担当者が紙
テキストを見て正しいワードを特定したならば、それか
ら正しいワードをOCRの出力テキストにキー入力しな
ければならない。このアプローチは時間がかかると共
に、多少エラーが発生し易い(error-prone )ものであ
るとわかっているため、校正担当者がOCR解釈(OCR
interpretation)を生成するために使用されたオリジナ
ル文書を参照する必要がなく、校正担当者にドキュメン
ト・イメージ(document image)中に現れるテキストを
そのテキストのOCR解釈と一緒に比較できるようにす
ることは有用である。
【0006】出版社が、紙形式ではなくASCIIテキ
ストとしてOCR出力テキストを再版して販売したいと
望む状況において、ドキュメント・イメージとそのテキ
ストのOCR解釈とを一緒に見ることができるようにす
ることは特に有用である。出版社がOCR出力を得て電
子的形式でそれを再販売するという目的を有する場合に
おいて、OCR出力は正しいワードを含むものでなけれ
ばならないというだけでなく、OCR出力がコンピュー
タ・モニタ上で後に表示される際に、OCR出力の形態
がドキュメント・イメージの形態と同一のままであると
いう付加的な関係がある。編集段階において、校正担当
者にOCR出力およびドキュメント・イメージを並べて
比較できるようにすることは相当この目的を進めること
になる。
【0007】校正することに加え、オリジナルの紙ドキ
ュメントは外国語のテキストをしばしば含んでいる。O
CR装置は、オリジナルテキストからイメージを読み込
んだ後、オリジナルテキストに見られるものと同一の言
語でOCR出力を表示する。そして、この外国語のOC
R出力は、様々な市販のコンピュータ翻訳装置を使って
1つの言語から他の言語に翻訳され得る。しかしなが
ら、読者が外国語のOCR出力に基づいてコンピュータ
で生成した翻訳文とオリジナルテキストとを比較して適
切な翻訳文が得られたことを確認したい場合、読者は依
然として2つのドキュメント(すなわち、オリジナルテ
キストおよびコンピュータで生成した翻訳文)を参照し
なければならない。
【0008】さらに、多くの電子メールメッセージは、
母国語でそのようなメッセージを読みたいと思う受取人
に対し、インターネットまたは他のネットワークを介し
て外国語で送信される。これらのメッセージについても
様々な市販のコンピュータ翻訳装置を使っていずれかの
母国語に翻訳することは可能であるが、そのようなメッ
セージの受取人は依然としてオリジナルの外国語テキス
トとその翻訳バージョンとを比較してコンピュータで生
成した翻訳文の精度を確認したいと思うかもしれない。
翻訳された電子メールメッセージの読者に対し、1以上
のドキュメント(すなわち、オリジナルテキストとコン
ピュータで生成したその翻訳文)または個々の本文の節
(separate textual passages )の参照を要求すること
は時間を要する非能率的なプロセスとなり得る。
【0009】本発明は上記に鑑みてなされたものであっ
て、元テキストを出力テキスト上に重ね合わせることが
できるようにすることを目的とする。
【0010】また、本発明は上記に鑑みてなされたもの
であって、OCR解釈を生成するために用いられたオリ
ジナル・ドキュメントをユーザが参照する必要をなく
し、ユーザがドキュメント・イメージで表されたテキス
トをそのテキストのOCR解釈と一緒に比較できるよう
にすることを目的とする。
【0011】また、本発明は上記に鑑みてなされたもの
であって、元テキストからOCR出力テキストへの変換
中に発生したエラーを訂正するために、ドキュメント・
イメージで表されたテキストをそのテキストのOCR解
釈と比較できるようにすることを目的とする。
【0012】さらに、本発明は上記に鑑みてなされたも
のであって、1以上のドキュメントまたは個々の節をユ
ーザが参照する必要をなくし、ユーザがある言語で表さ
れたテキストをその翻訳バージョンと一緒に見ることが
できるようにすることを目的とする。
【0013】
【課題を解決するための手段】人間によるOCR出力の
校正を容易にする必要がある。さらに、1以上のドキュ
メントまたは個々の節をユーザが参照する必要をなく
し、読者がある言語で表されたテキストをその翻訳バー
ジョンと一緒に見ることができるようにする必要があ
る。
【0014】人間によるOCR出力の校正を容易にする
ために、ドキュメント・イメージがオリジナルの紙ドキ
ュメントから生成されると共に、(例えば、OCRを介
して)それが認識されてドキュメント・テキストが生成
される。相関テーブルを用いることによって、ドキュメ
ント・テキスト中の各ワードに対応するドキュメント・
イメージ中の領域が特定され、そしてドキュメント・イ
メージの各領域がドキュメント・テキストの対応する各
ワードに近接して表示される。続いて、ユーザがドキュ
メント・テキスト中のワードを選択すると、置換候補の
ワード(possible replacement words)を表示するポッ
プアップメニューを得ることができる。
【0015】1以上のドキュメントまたは個々の節を参
照することなく、ある言語で表されたテキストの読者が
他の言語によるそのテキストの翻訳文を見ることができ
るようにするため、あるドキュメント・テキストが受信
され、その中の各ワードが翻訳されてドキュメント・テ
キスト中の各ワードについて翻訳ワードが生成される。
そして、各翻訳ワードは、ドキュメント・テキスト中の
それぞれ対応するワードに近接して表示される。続い
て、ユーザがドキュメント・テキスト中のワードを選択
すると、翻訳ワードに対する他の翻訳を表示するポップ
アップメニューを得ることができる。
【0016】すなわち、請求項1のテキストの表示方法
は、文書から文書画像を生成する工程と、前記文書画像
の文字を認識し、文書テキストを生成する工程と、前記
文書テキストの各ワードに対応する前記文書画像の各領
域を特定する工程と、相関表を使用して、前記文書画像
の前記領域を前記文書テキストの対応するワードと関連
付ける工程と、前記文書テキストの前記ワードの近傍に
前記文書画像の前記領域を表示する工程と、を含むもの
である。
【0017】また、請求項2のテキストの表示方法は、
請求項1に記載のテキストの表示方法において、前記文
書画像の前記領域が、前記文書テキストの前記ワードの
上に表示されるものである。
【0018】また、請求項3のテキストの表示方法は、
請求項1に記載のテキストの表示方法において、前記文
書画像の前記領域が、前記文書テキストの前記ワードの
下に表示されるものである。
【0019】また、請求項4のテキストの表示方法は、
請求項1に記載のテキストの表示方法において、ユーザ
が選択した認識信頼パラメータ以下の前記文書画像の前
記領域のみが、前記文書テキストの前記ワードの近傍に
表示されるものである。
【0020】また、請求項5のテキストの表示方法は、
請求項1に記載のテキストの表示方法において、ワード
のリストから選択された任意のワードが、前記文書画像
の前記領域の代わりに、前記文書テキストの対応する前
記ワードの近傍に表示されるものである。
【0021】また、請求項6のテキストの表示方法は、
請求項1に記載のテキストの表示方法において、さら
に、前記文書画像の任意の位置を選択する入力を受信す
る工程と、前記文書テキストの前記位置に対応する選択
されたテキストを特定する工程と、前記選択されたテキ
ストを修正する入力を受信する工程と、前記相関表を更
新して前記選択されたテキストに対して行われた修正を
反映する工程と、を含むものである。
【0022】また、請求項7のテキストの表示方法は、
請求項6に記載のテキストの表示方法において、前記選
択されたテキストを修正する入力を受信する工程が、前
記選択されたテキストを削除することを含むものであ
る。
【0023】また、請求項8のテキストの表示方法は、
請求項6に記載のテキストの表示方法において、前記選
択されたテキストを修正する入力を受信する工程が、前
記選択されたテキストについて1またはそれ以上の置換
候補ワードを決定する工程と、前記選択されたテキスト
について前記1またはそれ以上の置換候補ワードを表示
する工程と、前記選択されたテキストについて任意の置
換候補ワードを指定する入力を受信する工程と、前記選
択されたテキストを前記置換候補ワードで置換する工程
と、を含むものである。
【0024】また、請求項9のテキストの表示方法は、
請求項8に記載のテキストの表示方法において、前記置
換候補ワードを指定する入力を受信する工程が、前記置
換候補ワードのキーボード入力を受信する工程を含むも
のである。
【0025】また、請求項10のテキストの表示方法
は、請求項8に記載のテキストの表示方法において、前
記1またはそれ以上の置換候補ワードが、ポップアップ
メニューに表示されるものである。
【0026】また、請求項11のテキストの表示装置
は、文書の文書画像を生成する読取装置と、文書画像中
の文字を認識し、文書テキストを生成する光学文字認識
装置と、前記文書テキストの各ワードに対応する前記文
書画像の各領域を特定し、相関表を使用して、前記文書
画像の前記領域を前記文書テキストのワードと関連付け
るプロセッサと、前記文書テキストの前記ワードの近傍
に前記文書画像の前記領域を表示する表示装置と、を備
えたものである。
【0027】また、請求項12のテキストの表示装置
は、請求項11に記載のテキストの表示装置において、
前記表示装置が、前記文書テキストの前記ワードの上に
前記文書画像の前記領域を表示するように制御されるも
のである。
【0028】また、請求項13のテキストの表示装置
は、請求項11に記載のテキストの表示装置において、
前記表示装置が、前記文書テキストの前記ワードの下に
前記文書画像の前記領域を表示するように制御されるも
のである。
【0029】また、請求項14のテキストの表示装置
は、請求項11に記載のテキストの表示装置において、
前記表示装置が、ユーザが選択した認識信頼パラメータ
以下の前記文書画像の前記領域のみを前記文書テキスト
の前記ワードの近傍に表示するように制御されるもので
ある。
【0030】また、請求項15のテキストの表示装置
は、請求項11に記載のテキストの表示装置において、
前記表示装置が、前記文書画像の前記領域の代わりに、
前記文書テキストの対応する前記ワードの近傍にワード
のリストから選択された任意のワードを表示するように
制御されるものである。
【0031】また、請求項16のテキストの表示装置
は、請求項11に記載のテキストの表示装置において、
さらに、文書画像の任意の位置を選択する入力を受信す
るカーソル制御装置を備え、前記プロセッサが、前記文
書画像の領域に対応する選択されたワードを特定し、前
記選択されたテキストを修正する入力を受信し、相関表
を更新して、前記選択されたテキストに対する修正を反
映するものである。
【0032】また、請求項17のテキストの表示装置
は、請求項16に記載のテキストの表示装置において、
前記プロセッサが、前記選択されたテキストを削除する
ことにより、前記選択されたテキストを修正する入力を
受信するものである。
【0033】また、請求項18のテキストの表示装置
は、請求項16に記載のテキストの表示装置において、
前記プロセッサが、前記選択されたテキストについて1
またはそれ以上の置換候補ワードを決定し、前記表示装
置を制御して、前記選択されたテキストについて前記1
またはそれ以上の置換候補ワードを表示し、前記選択さ
れたテキストについて置換候補ワードを指定する入力を
受信し、任意の置換候補のワードで前記選択されたテキ
ストを置換することにより、前記選択されたテキストを
修正する入力を受信するものである。
【0034】また、請求項19のテキストの表示装置
は、請求項18に記載のテキストの表示装置において、
さらに、前記選択されたテキストについて前記置換候補
ワードを入力するキーボードを備えたものである。
【0035】また、請求項20のテキストの表示装置
は、請求項18に記載のテキストの表示装置において、
前記表示装置が、前記1またはそれ以上の置換候補ワー
ドをポップアップメニューに表示するように制御される
ものである。
【0036】また、請求項21のテキストの表示方法
は、ある言語で表されたテキストをその翻訳を示す他の
テキスト上に重ね合わせて表示するテキストの表示方法
であって、文書テキストを受信する工程と、前記文書テ
キストの各ワードを翻訳し、前記文書テキストの各ワー
ドについて翻訳されたワードを生成する工程と、前記文
書テキストの前記各ワードの近傍に前記文書テキストの
前記各ワードに対応する翻訳されたワードを表示する工
程と、を含むものである。
【0037】さらに、請求項22のテキストの表示方法
は、請求項21記載のテキストの表示方法において、さ
らに、前記文書画像の任意の位置を選択する入力を受信
する工程と、前記文書テキストの前記位置に対応する選
択されたテキストを特定する工程と、前記選択されたテ
キストの翻訳候補を表示する工程と、を含むものであ
る。
【0038】以下の説明および図面,並びに請求項を参
照することにより、本発明のこれらまたは他の側面と利
点をより良く理解することができるであろう。
【0039】
【発明の実施の形態】以下、本発明に係るテキストの表
示方法およびその装置の一実施の形態について、添付の
図面を参照しつつ詳細に説明する。なお、各図において
同一の符号を有する構成については同一の符号を用いて
示すことにする。
【0040】(1)ハードウエアの概要 図1は、本発明の実施の形態を実現可能なコンピュータ
・システム100のブロック図である。コンピュータ・
システム100は、情報通信を行うためのバス110ま
たは他の通信メカニズムと、情報を処理するためにバス
110に接続されたプロセッサ112とを備えている。
コンピュータ・システム100は、情報およびプロセッ
サ112によって実行される命令を記憶するためにバス
110に接続されたランダム・アクセス・メモリ(RA
M)または他の動的記憶装置114(主記憶装置と記述
する)をさらに備えている。また、主記憶装置114
は、プロセッサ112による命令の実行中において、一
時的な変数または他の中間的な情報を記憶するために使
用可能なものである。また、コンピュータ・システム1
00は、静的情報およびプロセッサ112のための命令
を記憶するためにバス110に接続されたリード・オン
リー・メモリ(ROM)および/または他の静的記憶装
置116を備えている。さらに、磁気ディスクまたは光
ディスク,およびその対応するディスク・ドライブのよ
うなデータ記憶装置118が、情報および命令を記憶す
るためにバス110に接続され得る。
【0041】また、入出力装置は、バス110を介して
コンピュータ・システム100に接続され得る。例え
ば、コンピュータ・システム100は、陰極線管(CR
T)のようなディスプレイ120を使用して、コンピュ
ータ・ユーザに対して情報を表示する。さらに、コンピ
ュータ・システム100は、キーボード122およびマ
ウスのようなカーソル・コントロール124を使用す
る。加えて、コンピュータ・システム100はスキャナ
126を使用することができ、紙ドキュメントをコンピ
ュータ読み取り可能なフォーマットに変換する。また、
コンピュータ・システム100はOCR装置128を使
用することができ、スキャナ126で生成され、また
は、主記憶装置114若しくはデータ記憶装置118に
記憶されているドキュメント・イメージ中の文字の認識
処理を行う。これに代えて、OCR装置128の機能を
ソフトウエア、即ち、主記憶装置114に記憶されてい
る命令をプロセッサ112で実行することで実現するこ
とにしても良い。さらに、スキャナ126およびOCR
装置128を、紙ドキュメントの読み取りおよび紙ドキ
ュメント上の文字の認識処理の両方を行うことが可能な
一つの装置で構成しても良い。
【0042】本発明は、コンピュータ・システム100
を使用して、同一のディスプレイ装置120上で元テキ
ストおよび出力テキストを見ることができるようにする
技術に関するものである。一実施の形態において、この
タスク(task)は、プロセッサ112が主記憶装置11
4に含まれる一連の命令を実行することに応じて、コン
ピュータ100によって実行される。このような命令
は、データ記憶装置118のような他のコンピュータ読
み取り可能な媒体から主記憶装置114に読み込むこと
が可能なものである。主記憶装置114に格納されてい
る一連の命令を実行するということは、後述する処理ス
テップをプロセッサ112に実行させるということであ
る。他の実施の形態においては、ソフトウエアの命令に
代え、またはその命令と組み合わせてハードワイヤード
回路を使用することによって本発明を実現することもで
きる。したがって、本発明は、ハードウエア回路および
ソフトウエアによるどのような特定の組合せにも限定さ
れるものではない。
【0043】(2)複合ドキュメント(compound docum
ent )のアーキテクチャ 複合ドキュメントは、ドキュメントの複数の表現を含
み、複数の表現を論理的な統一体とみなしたものであ
る。図2(a)に示される複合ドキュメント200は、
コンピュータ・システム100の主記憶装置114また
はデータ記憶装置118のようなメモリに記憶される。
【0044】複合ドキュメント200は、例えばスキャ
ナ126で生成されたTIFFファイル等のドキュメン
トのビットマップ表現であるドキュメント・イメージ2
10を有している。例えば、紙ドキュメントであるアメ
リカ憲法のコピーをスキャナ126でスキャニング(読
み取り)することにより、ドキュメント・イメージ21
0の形態で憲法のイメージを生成することができる。
【0045】ビットマップ表現は、モノクロ(例えば白
黒)または多彩色(例えば赤,青,緑,その他)のピク
セルのアレイである。ドキュメント・イメージ210中
の矩形領域の位置は、例えば、矩形の左上コーナーおよ
び右下コーナーの座標によって特定され得る。アメリカ
憲法をスキャニングする例において、アメリカ憲法の前
文中のワード「form」の最初の文字(即ち「f」)
は、左上の座標(16,110)および右下の座標(3
1,119)の矩形内のドキュメント・イメージ210
に配置され、同じワードの最後の文字(即ち「m」)
は、座標(16,140)および(31,149)の矩
形内のドキュメント・イメージ210に配置され得る。
【0046】また、複合ドキュメント200は、ドキュ
メント・テキスト220および相関テーブル230を有
し、これらは図2(b)のフローチャートに示された方
法によって生成可能なものである。ドキュメント・テキ
スト220は、文字をASCII,EBCDICまたは
Unicodeのようなコードにコード化する8ビット
または16ビットのバイト列からなるものである。した
がって、ドキュメント・テキスト220中の文字は、オ
フセットによってドキュメント・テキスト220に配置
され得る。例えば、相関テーブル230のオフセット・
カラムに示されるように、アメリカ憲法の前文中のワー
ド「form」における最初の文字はオフセット57で
ドキュメント・テキスト220に配置されても良く、ワ
ードの最後の文字はオフセット60でドキュメント・テ
キスト220に配置され得る。
【0047】図2(b)において、ドキュメント・イメ
ージ210中の文字は、ステップS250においてOC
R装置128またはその同等物によって文字認識され、
ステップS252において保存されてドキュメント・テ
キスト220が生成される。なお、OCR装置128
は、ステップS250において、文字認識された各文字
についてドキュメント・イメージ中の座標を出力できる
ように構成されている。したがって、ドキュメント・イ
メージ220中の既知のオフセットにある認識文字を、
ドキュメント・イメージ210の領域に関連付けするこ
とができる。前文のイメージの例において、(オフセッ
ト57にある)ドキュメント・テキスト220中のワー
ド「form」の最初の文字は、座標(16,110)
および(31,119)によって定義されたドキュメン
ト・イメージ210の領域に関連付けられる。同様に、
(オフセット60にある)ドキュメント・テキスト22
0中のワード「form」の最後の文字は、座標(1
6,140)および(31,149)によって定義され
たドキュメント・イメージ210の領域に関連付けられ
る。
【0048】ステップS254において、ドキュメント
・テキスト220中の各ワードは、例えば、スペース間
の文字を利用することによってワードとして特定され
る。ステップS254において、これらのワードの個々
の文字に対応するドキュメント・イメージ210中の領
域は、ドキュメント・テキスト220の各ワードに対応
するより大きなドキュメント・イメージ210の領域と
なるように合体される。一実施の形態において、ドキュ
メント・イメージ210の領域は、ドキュメント・テキ
スト220の個々のワードに対応する領域の座標におい
て最も左上の座標および最も右下の座標で特定される矩
形として定義される。例えば、相関テーブル230の座
標カラムおよびオフセットカラムに示されるように、ド
キュメント・テキスト220中のワード「form」
(オフセット57−60)に対応するドキュメント・イ
メージ210の領域は、座標(16,110)および
(31,149)の矩形によって定義される。これに代
えて、異なるサイズの文字を持つドキュメントについて
は特に、ドキュメント・テキスト220の各文字および
それらに対応するドキュメント・イメージ210の領域
に関する座標のリストを個々に保存することにしても良
い。
【0049】加えて、技術的に周知のOCR装置128
のいくつかのインプリメンテーション(implementatio
n)は、ドキュメント・テキスト220中のワードまた
はフレーズ(phrase)が不適当なOCR認識を含むとい
う可能性を推し量る認識信頼パラメータ(recognition
confidence parameter)を出力するように構成されてい
る。例えば、特定のフォントによっては、ドキュメント
・イメージ210中の文字「m」が、OCR装置128
によって文字の組合せ「rn」として認識されることが
ある(例えば、OCR装置128はワード「mode
m」について低い認識信頼パラメータを出力するかもし
れない。なぜなら、OCR装置がそのワードを「mod
ern」として解釈することができるからである。)。
したがって、文字「m」を含むワードは、完全に特有な
(unique)文字からなるワードより比較的低い信頼スコ
アが割り当てられる可能性がある。上記前文の例におい
て、ワード中に文字「m」が存在しているため、ワード
「form」には55%の認識信頼パラメータが割り当
てられるかもしれない。
【0050】ステップS256において、ドキュメント
・テキスト220に現れる各ワードに関する情報が相関
テーブル230に保存されるため、ドキュメント・イメ
ージ210の領域がドキュメント・テキスト220のワ
ードと関連付けられる。より詳細に、相関テーブル23
0は、ドキュメント・イメージ210中の領域を定義す
る一対の座標232,ドキュメント・テキスト220中
のワードを定義する一対のオフセット234,およびワ
ードについての認識信頼パラメータ236を保存する。
例において、ドキュメント・テキスト220中のワード
「form」は、(16,110)および(31,14
9)という一対の座標232,57および60という一
対のオフセット234,ならびに55%という認識信頼
パラメータを持つことになるであろう。
【0051】相関テーブル230を用いることにより、
ドキュメント・テキスト220の各オフセット234
は、ドキュメント・イメージ210のある領域に対応付
けられ、その逆も同じである。例えば、オフセット58
でドキュメント・テキスト220の文字が与えられる
と、相関テーブル230のオフセットカラムが調査さ
れ、文字が(16,110)および(31,149)の
座標を持つドキュメント・イメージ210中の矩形領域
に対応するということを決定することができる。そし
て、これらの座標におけるドキュメント・イメージ21
0の領域(例において、ワード「form」)が、ドキ
ュメント・イメージ210からフェッチ(fetch)され
て表示され得る。他の説明として、(23,127)と
いうドキュメント・イメージ210の座標が与えられる
と、相関テーブル230の座標カラムが調査され、与え
られたドキュメント・イメージ210の座標が57−6
0というオフセットを持つドキュメント・テキスト22
0のワード中にあるということを決定することができ
る。そして、ドキュメント・テキスト220のそのオフ
セット範囲におけるワード(例において、ワード「fo
rm」)を特定することができる。したがって、ここで
説明した複合ドキュメントのアーキテクチャにより、ド
キュメント・テキスト220中のワードの位置とドキュ
メント・イメージ210中の対応する領域とを相互に関
連付ける方法を提供することができる。
【0052】(3)元テキストの各ワードを出力テキス
トに重ね合わせる処理 オリジナルの紙ドキュメントを調べることに関連する時
間を減らすため、オリジナルの紙ドキュメントのスキャ
ンされたイメージ(即ち、ドキュメント・イメージ21
0)が、そのテキストのOCR解釈と一緒に校正担当者
に対して表示される。アメリカ憲法をスキャニングする
例において、図3(a)に示されるように、前文のスキ
ャンされたイメージをイメージ・ディスプレイ(image
display:画面表示)300中に表示することができ
る。
【0053】イメージ・ディスプレイ300において、
ドキュメント・イメージ210の各領域は、各領域が対
応するドキュメント・テキスト220の各ワードに近接
(例えば、上,下,上付き,下付き等)して重ね合わさ
れる。図3(a)に示されるように、例えば、ドキュメ
ント・イメージ210の前文「We」310中の最初の
ワードがユーザに対して表示され、それはドキュメント
・テキスト220の対応するワード320上に直接表示
される。これは、上述した相関テーブル230を用いて
ドキュメント・テキスト220の各ワードの位置をドキ
ュメント・イメージ210の対応する領域と関連付けす
ることによって達成される。ドキュメント・イメージ2
10中の領域がドキュメント・テキスト220中のワー
ドと関連付けられているならば、ドキュメント・イメー
ジ210の領域がフェッチされ、ドキュメント・テキス
ト220の対応するワードに近接して表示される。ドキ
ュメント・イメージ210に現れる各領域がその対応す
るドキュメント・テキスト210のワードに近接して表
示されるまで、この処理は繰り返し実行される。そし
て、ユーザは、ディスプレイ装置120を利用すること
によって、またはオーバレイ(overlay )の印刷結果を
得ることによって、この表示を見ることができる。
【0054】代替的に、ドキュメント・テキスト220
の各ワードに近接(例えば、上,下,上付き,下付き
等)して重ね合わされた各ワードは、OCR装置128
から受信した認識信頼パラメータ236に基づいて表示
される。この実施の形態において、ある閾値以下の認識
信頼パラメータ236を有するワードに対応するドキュ
メント・イメージ210の領域は、ドキュメント・テキ
スト220のワードに近接して表示され得る。例えば、
閾値を60%に設定することができ、オリジナルのワー
ド「form」について55%の認識信頼パラメータ2
36が割り当てられるため、そのワードに対応するドキ
ュメント・イメージ210中の領域は、ドキュメント・
テキスト220においてワード「form」に近接して
表示される。すなわち、例えば、ユーザが選択した認識
信頼パラメータ236以下の値を有するワードに対応す
るドキュメント・イメージ210の領域のみが、ドキュ
メント・テキスト210の対応するワードの近傍に表示
されるようにする。
【0055】他の実施の形態として、特定の重ね合わさ
れたワードは、認識されたテキストを生成することがで
きたであろう置換候補のワードのリストから選択され
る。すなわち、ワードのリストから選択された任意のワ
ードは、ドキュメント・イメージ210の領域の代わり
に、ドキュメント・テキスト220の対応するワードの
近傍に表示される。置換候補のワードを生成するための
多種多様な手法は技術的に知られているものであるが、
熟考された発明ではいずれの特別な手法も必要としな
い。例えば、文字レベルの現象(letter-level phenome
na:即ち、文字または文字の組み合わせが他の文字とし
て誤認識される可能性)が置換候補のワードを生成する
ために適用され得る。他の例として、例えばスペルチェ
ックによって、ワードレベルの挙動(word-level behav
ior )が置換候補のワードを生成するために考慮され得
る。さらに他の例として、フェーズレベル情報(phrase
-levelinformation:例えば、データベースにおけるワ
ードのシーケンスの範囲内のマルコフモデル(Markov m
odel of extent sequences of words in a database
))が使用され得る。さらに、これらの様々な手法を
組み合わせまたは重みづけすることも可能である。しか
しながら、好ましくは、ドキュメント・テキスト220
に現れるワードに対して置換候補として使用される可能
性がありそうなワードが、重ね合わされる対象となるワ
ードまたはテキストとして選択される。
【0056】(4)OCR出力のエラー修正処理 本発明の一実施の形態によるOCR出力のエラー修正操
作は、図4のフローチャートに示されている。修正を行
うために、マウス,トラックボールまたはジョイスティ
ックのようなカーソル・コントロール124を用いて、
カーソル302をドキュメント・テキスト220の任意
の部分に置く。
【0057】ステップS410において、プロセッサ1
12は、カーソル・コントロール124からイメージ・
ディスプレイ300上のカーソル302の位置に関する
入力を受信する。カーソル302がイメージ・ディスプ
レイ300上に置かれたときはいつでも、またはユーザ
がボタンを操作したときのみ、この入力はカーソル・コ
ントロール124によって自動的に生成され得る。後者
の場合(ユーザがボタンを操作したとき)においては、
ユーザがボタンを操作した際に、カーソル・コントロー
ル124が入力としてカーソル302の現在位置を送信
する。
【0058】ステップS410で受信した入力によって
特定されたカーソル302の位置は、技術的に周知のマ
ッピング(写像)手法に従い、イメージ・ディスプレイ
300の座標系からドキュメント・テキスト220のオ
フセット系(offset system)に変換される。図3
(a)に示された例において、イメージ・ディスプレイ
300中のカーソル302の位置は、ドキュメント・テ
キスト220のオフセット59に対応し得る。
【0059】ステップS412において、相関テーブル
230は、ステップS410で受信した入力から得たオ
フセットを含むあるオフセットのペア234を特定する
エントリについて調査される。例において、オフセット
59は、オフセットのペア57‐60に含まれている。
このペアが、オフセットの範囲234中のオフセットに
おいてドキュメント・テキスト220中に置かれた文字
列を抽出するために使用される。
【0060】ステップS414において、オフセット5
7‐60における文字列の置換候補のワードが生成され
る。先に述べたように、置換候補のワードを生成するた
めの多種多様な手法は技術的に知られているものである
が、熟考された発明ではいずれの特別な手法も必要とし
ない。例において、ステップS414では、選択された
テキスト「domestic」について、以下の置換候
補のワードのセットを生成することが可能である。すな
わち、「dominate」,「demeanor」お
よび「demotion」である。
【0061】ステップS416において、ユーザがマウ
スボタンをクリックするか、同様な機能のキーを押下す
ると、選択されたテキストの置換候補のワードがカーソ
ル302の近くのポップアップメニュー330に表示さ
れる。これらの置換候補350のワードは、選択された
テキストに対する置換可能性に従ったランク順でポップ
アップメニュー300に表示されることが好ましい(す
なわち、選択されたテキストが不正確であると考えられ
る場合、ポップアップメニュー330のリストの最上位
の置換候補がたぶん置換候補として用いられるであろ
う)。一実施の形態において、削除オプション340
は、進行中にユーザがドキュメント・テキスト220の
一部を削除できるようにするため、カーソル302近く
のポップアップメニュー330中に提供される。
【0062】他の実施の形態においては、カーソル30
2がドキュメント・テキスト220中のあるワード上に
置かれると、選択されたテキストについてポップアップ
メニュー330が自動的に表示される。したがって、ユ
ーザはドキュメント・テキスト220において表示され
たテキスト行にわたってカーソル302をさっと動か
し、選択されたテキストをポップアップメニュー330
の置換候補と素早く比較することができる。
【0063】ポップアップメニュー330が表示される
と、ユーザは重ね合わされたドキュメント・イメージ2
10の領域を見ることにより、ドキュメント・テキスト
220中の選択されたテキストが正しくないということ
を決定することができる。この場合、ユーザは、正しい
置換候補のワードについてポップアップメニュー330
中の置換候補のワードを見ることになるであろう。正し
い置換候補のワードが発見された場合、それから(例え
ば、適切なワードをハイライト表示し、そしてカーソル
制御124のボタンをクリックまたは実行ボタンを押下
することによって)ユーザは正しい置換候補を選択する
ことができる。例において、ワード「domesti
c」の正しい置換候補は、ポップアップメニュー330
において「dominate」および「demotio
n」の間に表示されている「demeanor」である
かもしれない。
【0064】この点において、プロセッサ112は、ス
テップS418のように意図された修正に関する入力を
受信し、ステップS420のようにユーザが選択した置
換候補を用いてドキュメント・テキスト220のワード
を置換する。しかしながら、正しい置換候補のワードが
ポップアップメニュー330中に存在しない場合、ユー
ザは従来の手段によって(例えば、キーボード122を
介して)、正しい置換候補のワードを入力することがで
きる。置換候補のワードを生成し、ポップアップメニュ
ー330中にそれらを表示することにより、OCR出力
を修正するために消費される時間が削減される。ユーザ
がドキュメント・テキスト220を修正すると、この動
作が行われたことを反映するために、相関テーブル23
0はアップデート(更新)されなければならない。
【0065】(5)出力テキスト上に元テキストの翻訳
文を表示する処理 図3(b)に示すように、外国語テキストに対する本発
明の応用は、同一言語で表されたドキュメントを比較す
る場合と同様である。イメージ・ディスプレイ360の
ように、ドキュメント・テキスト220の各ワードは、
機械翻訳装置を用いてユーザが選択した言語に翻訳さ
れ、主記憶装置114またはデータ記憶装置118のよ
うなメモリに記憶される。そして、プロセッサ112
は、ドキュメント・テキスト220に現れる最初のワー
ドに対応する最初の翻訳文を検索し、ドキュメント・テ
キスト220の最初のワードに近接(例えば、上,下,
上付き,下付き等)して翻訳文を配置する。各翻訳ワー
ドが370および380で示されるように配置されるま
で、この手続きはドキュメント・テキストに現れる各ワ
ードについて繰り返し実行される。そして、ユーザは、
ディスプレイ装置120を利用することによって、また
はオーバレイの印刷物を得ることによってこの表示を見
ることができる。
【0066】更なる実施の形態において、ユーザはドキ
ュメント・テキスト220において任意の与えられたワ
ード上にカーソル385を置くことができ、マウスボタ
ンをクリックし、または同様な機能のキーを押下して、
図3(b)に示されるように選択されたワードの他の翻
訳候補(possible translations )395を見せるポッ
プアップメニュー390を得ることができる。さらに、
他の実施の形態において、ユーザがマウスボタンをクリ
ックしまたは同様な機能のキーを押下する必要なしに、
カーソル385が選択されたワード上に置かれると、直
ちにポップアップメニュー390が自動的に表示され
る。
【0067】なお、ここでは、例えば図3に示すように
英語のドキュメントに基づいて本発明の実施の形態を説
明したが、本発明は英語のドキュメントに限定されるも
のではなく、日本語のドキュメントに対しても同様に適
用可能であることは明らかである。
【0068】ある好適な実施の形態を参照しつつ、相当
詳細に本発明を説明すると共に図示したが、他のバージ
ョンも可能である。上記の説明を読むことで、発明の精
神および範囲から逸脱することなく、形式または詳細に
関して上記の説明または図を変更可能であることは当業
者によって理解されるであろう。
【0069】
【発明の効果】以上説明したように、本発明に係るテキ
ストの表示方法およびその装置によれば、元テキストを
出力テキスト上に重ね合わせることができる。また、O
CR解釈を生成するために用いられたオリジナル・ドキ
ュメントをユーザが参照する必要をなくし、ユーザがド
キュメント・イメージで表されたテキストをそのテキス
トのOCR解釈と一緒に比較できるようにすることが可
能となる。また、元テキストからOCR出力テキストへ
の変換中に発生したエラーを訂正するために、ドキュメ
ント・イメージで表されたテキストをそのテキストのO
CR解釈と比較できるようにすることが可能となる。さ
らに、1以上のドキュメントまたは個々の節をユーザが
参照する必要をなくし、ユーザがある言語で表されたテ
キストをその翻訳バージョンと一緒に見ることができる
ようにすることが可能となる。
【図面の簡単な説明】
【図1】本発明を実現可能なコンピュータ・システムの
概略ブロック図である。
【図2】(a)は複合ドキュメントのアーキテクチャの
ブロック図、(b)は複合ドキュメントを生成する操作
を示すフローチャートである。
【図3】(a)は本発明の一実施の形態における具体的
なスクリーン・ディスプレイ(画面表示)を、(b)は
本発明の他の実施の形態における具体的なスクリーン・
ディスプレイ(画面表示)をそれぞれ示す説明図であ
る。
【図4】本発明の一実施の形態において、OCR出力の
エラー修正操作を示すフローチャートである。
【符号の説明】
100 コンピュータ・システム 110 バス 112 プロセッサ 114 主記憶装置 116 ROM 118 データ記憶装置 120 ディスプレイ 122 キーボード 124 カーソル・コントロール 126 スキャナ 128 OCR装置 200 複合ドキュメント 210 ドキュメント・イメージ 220 ドキュメント・テキスト 230 相関テーブル 232 座標 234 オフセット 300 イメージ・ディスプレイ(画面表示) 302,385 カーソル 330,390 ポップアップメニュー 340 削除オプション 350 置換候補 395 翻訳候補

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 文書から文書画像を生成する工程と、 前記文書画像の文字を認識し、文書テキストを生成する
    工程と、 前記文書テキストの各ワードに対応する前記文書画像の
    各領域を特定する工程と、 相関表を使用して、前記文書画像の前記領域を前記文書
    テキストの対応するワードと関連付ける工程と、 前記文書テキストの前記ワードの近傍に前記文書画像の
    前記領域を表示する工程と、 を含むことを特徴とするテキストの表示方法。
  2. 【請求項2】 前記文書画像の前記領域は、前記文書テ
    キストの前記ワードの上に表示されることを特徴とする
    請求項1に記載のテキストの表示方法。
  3. 【請求項3】 前記文書画像の前記領域は、前記文書テ
    キストの前記ワードの下に表示されることを特徴とする
    請求項1に記載のテキストの表示方法。
  4. 【請求項4】 ユーザが選択した認識信頼パラメータ以
    下の前記文書画像の前記領域のみが、前記文書テキスト
    の前記ワードの近傍に表示されることを特徴とする請求
    項1に記載のテキストの表示方法。
  5. 【請求項5】 ワードのリストから選択された任意のワ
    ードは、前記文書画像の前記領域の代わりに、前記文書
    テキストの対応する前記ワードの近傍に表示されること
    を特徴とする請求項1に記載のテキストの表示方法。
  6. 【請求項6】 さらに、前記文書画像の任意の位置を選
    択する入力を受信する工程と、 前記文書テキストの前記位置に対応する選択されたテキ
    ストを特定する工程と、 前記選択されたテキストを修正する入力を受信する工程
    と、 前記相関表を更新して前記選択されたテキストに対して
    行われた修正を反映する工程と、 を含むことを特徴とする請求項1に記載のテキストの表
    示方法。
  7. 【請求項7】 前記選択されたテキストを修正する入力
    を受信する工程は、前記選択されたテキストを削除する
    ことを含むことを特徴とする請求項6に記載のテキスト
    の表示方法。
  8. 【請求項8】 前記選択されたテキストを修正する入力
    を受信する工程は、 前記選択されたテキストについて1またはそれ以上の置
    換候補ワードを決定する工程と、 前記選択されたテキストについて前記1またはそれ以上
    の置換候補ワードを表示する工程と、 前記選択されたテキストについて任意の置換候補ワード
    を指定する入力を受信する工程と、 前記選択されたテキストを前記置換候補ワードで置換す
    る工程と、 を含むことを特徴とする請求項6に記載のテキストの表
    示方法。
  9. 【請求項9】 前記置換候補ワードを指定する入力を受
    信する工程は、前記置換候補ワードのキーボード入力を
    受信する工程を含むことを特徴とする請求項8に記載の
    テキストの表示方法。
  10. 【請求項10】 前記1またはそれ以上の置換候補ワー
    ドは、ポップアップメニューに表示されることを特徴と
    する請求項8に記載のテキストの表示方法。
  11. 【請求項11】 文書の文書画像を生成する読取装置
    と、 文書画像中の文字を認識し、文書テキストを生成する光
    学文字認識装置と、 前記文書テキストの各ワードに対応する前記文書画像の
    各領域を特定し、相関表を使用して、前記文書画像の前
    記領域を前記文書テキストのワードと関連付けるプロセ
    ッサと、 前記文書テキストの前記ワードの近傍に前記文書画像の
    前記領域を表示する表示装置と、 を備えたことを特徴とするテキストの表示装置。
  12. 【請求項12】 前記表示装置は、前記文書テキストの
    前記ワードの上に前記文書画像の前記領域を表示するよ
    うに制御されることを特徴とする請求項11に記載のテ
    キストの表示装置。
  13. 【請求項13】 前記表示装置は、前記文書テキストの
    前記ワードの下に前記文書画像の前記領域を表示するよ
    うに制御されることを特徴とする請求項11に記載のテ
    キストの表示装置。
  14. 【請求項14】 前記表示装置は、ユーザが選択した認
    識信頼パラメータ以下の前記文書画像の前記領域のみを
    前記文書テキストの前記ワードの近傍に表示するように
    制御されることを特徴とする請求項11に記載のテキス
    トの表示装置。
  15. 【請求項15】 前記表示装置は、前記文書画像の前記
    領域の代わりに、前記文書テキストの対応する前記ワー
    ドの近傍にワードのリストから選択された任意のワード
    を表示するように制御されることを特徴とする請求項1
    1に記載のテキストの表示装置。
  16. 【請求項16】 さらに、文書画像の任意の位置を選択
    する入力を受信するカーソル制御装置を備え、 前記プロセッサは、 前記文書画像の領域に対応する選択されたワードを特定
    し、 前記選択されたテキストを修正する入力を受信し、 相関表を更新して、前記選択されたテキストに対する修
    正を反映することを特徴とする請求項11に記載のテキ
    ストの表示装置。
  17. 【請求項17】 前記プロセッサは、前記選択されたテ
    キストを削除することにより、前記選択されたテキスト
    を修正する入力を受信することを特徴とする請求項16
    に記載のテキストの表示装置。
  18. 【請求項18】 前記プロセッサは、 前記選択されたテキストについて1またはそれ以上の置
    換候補ワードを決定し、 前記表示装置を制御して、前記選択されたテキストにつ
    いて前記1またはそれ以上の置換候補ワードを表示し、 前記選択されたテキストについて置換候補ワードを指定
    する入力を受信し、 任意の置換候補のワードで前記選択されたテキストを置
    換することにより、 前記選択されたテキストを修正する入力を受信すること
    を特徴とする請求項16に記載のテキストの表示装置。
  19. 【請求項19】 さらに、前記選択されたテキストにつ
    いて前記置換候補ワードを入力するキーボードを備えた
    ことを特徴とする請求項18に記載のテキストの表示装
    置。
  20. 【請求項20】 前記表示装置は、前記1またはそれ以
    上の置換候補ワードをポップアップメニューに表示する
    ように制御されることを特徴とする請求項18に記載の
    テキストの表示装置。
  21. 【請求項21】 ある言語で表されたテキストをその翻
    訳を示す他のテキスト上に重ね合わせて表示するテキス
    トの表示方法であって、 文書テキストを受信する工程と、 前記文書テキストの各ワードを翻訳し、前記文書テキス
    トの各ワードについて翻訳されたワードを生成する工程
    と、 前記文書テキストの前記各ワードの近傍に前記文書テキ
    ストの前記各ワードに対応する翻訳されたワードを表示
    する工程と、 を含むことを特徴とするテキストの表示方法。
  22. 【請求項22】 さらに、前記文書画像の任意の位置を
    選択する入力を受信する工程と、 前記文書テキストの前記位置に対応する選択されたテキ
    ストを特定する工程と、 前記選択されたテキストの翻訳候補を表示する工程と、 を含むことを特徴とする請求項21記載のテキストの表
    示方法。
JP10125508A 1997-07-25 1998-05-08 テキストの表示方法およびその装置 Pending JPH11110480A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US90078597A 1997-07-25 1997-07-25
US08/900785 1997-07-25

Publications (1)

Publication Number Publication Date
JPH11110480A true JPH11110480A (ja) 1999-04-23

Family

ID=25413073

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10125508A Pending JPH11110480A (ja) 1997-07-25 1998-05-08 テキストの表示方法およびその装置

Country Status (2)

Country Link
US (1) US20030200505A1 (ja)
JP (1) JPH11110480A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079946A (ja) * 2005-09-14 2007-03-29 Fuji Xerox Co Ltd 表示装置及び翻訳結果表示方法
JP2013020558A (ja) * 2011-07-13 2013-01-31 Nec Biglobe Ltd コンテンツデータ表示装置、コンテンツデータ表示方法及びプログラム
JP2013077157A (ja) * 2011-09-30 2013-04-25 Internatl Business Mach Corp <Ibm> 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001035295A2 (en) * 1999-11-10 2001-05-17 Global Market Insite, Inc. Multi-region market research study processing
US7818691B2 (en) * 2000-05-11 2010-10-19 Nes Stewart Irvine Zeroclick
US20040217987A1 (en) * 2003-05-01 2004-11-04 Solomo Aran Method and system for intercepting and processing data during GUI session
US7614004B2 (en) * 2003-12-15 2009-11-03 Microsoft Corporation Intelligent forward resource navigation
US7962843B2 (en) * 2003-12-15 2011-06-14 Microsoft Corporation Browser session overview
US7774721B2 (en) * 2003-12-15 2010-08-10 Microsoft Corporation Intelligent backward resource navigation
US8874504B2 (en) * 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
JP2006276911A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 電子機器およびプログラム
KR100716288B1 (ko) * 2005-06-17 2007-05-09 삼성전자주식회사 디스플레이장치 및 그 제어방법
TWI317489B (en) * 2006-03-27 2009-11-21 Inventec Appliances Corp Apparatus and method for image recognition and translation
JP4254810B2 (ja) * 2006-05-25 2009-04-15 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
US7801721B2 (en) * 2006-10-02 2010-09-21 Google Inc. Displaying original text in a user interface with translated text
TW200910875A (en) * 2007-08-29 2009-03-01 Inventec Appliances Corp Method and system for instantly translating text within an image
US20090144327A1 (en) * 2007-11-29 2009-06-04 At&T Delaware Intellectual Property, Inc. Methods, systems, and computer program products for extracting data from a visual image
JP4711093B2 (ja) * 2008-08-28 2011-06-29 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US8744135B2 (en) * 2008-09-16 2014-06-03 Kendyl A. Román Methods and data structures for multiple combined improved searchable formatted documents including citation and corpus generation
US9405749B2 (en) * 2008-09-16 2016-08-02 Kendyl A Roman Methods and data structures for improved searchable formatted documents including citation and corpus generation
US8433708B2 (en) * 2008-09-16 2013-04-30 Kendyl A. Román Methods and data structures for improved searchable formatted documents including citation and corpus generation
US8396850B2 (en) * 2009-02-27 2013-03-12 Red Hat, Inc. Discriminating search results by phrase analysis
US8386511B2 (en) * 2009-02-27 2013-02-26 Red Hat, Inc. Measuring contextual similarity
US8527500B2 (en) * 2009-02-27 2013-09-03 Red Hat, Inc. Preprocessing text to enhance statistical features
US10891659B2 (en) 2009-05-29 2021-01-12 Red Hat, Inc. Placing resources in displayed web pages via context modeling
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
WO2012094564A1 (en) * 2011-01-06 2012-07-12 Veveo, Inc. Methods of and systems for content search based on environment sampling
US20130022270A1 (en) * 2011-07-22 2013-01-24 Todd Kahle Optical Character Recognition of Text In An Image for Use By Software
US9037450B2 (en) 2012-12-14 2015-05-19 Microsoft Technology Licensing, Llc Text overlay techniques in realtime translation
US9361278B2 (en) * 2013-03-15 2016-06-07 Facebook, Inc. Overlaying photographs with text on a social networking system
US9905030B2 (en) * 2013-03-29 2018-02-27 Rakuten, Inc Image processing device, image processing method, information storage medium, and program
US20150138220A1 (en) * 2013-11-18 2015-05-21 K-Nfb Reading Technology, Inc. Systems and methods for displaying scanned images with overlaid text
US9331856B1 (en) * 2014-02-10 2016-05-03 Symantec Corporation Systems and methods for validating digital signatures
RU2665274C2 (ru) * 2014-06-27 2018-08-28 Общество с ограниченной ответственностью "Аби Продакшн" Всплывающая панель верификации
US9501853B2 (en) * 2015-01-09 2016-11-22 Adobe Systems Incorporated Providing in-line previews of a source image for aid in correcting OCR errors
US10242277B1 (en) * 2015-07-08 2019-03-26 Amazon Technologies, Inc. Validating digital content rendering
JP6888410B2 (ja) * 2017-05-15 2021-06-16 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
US10817677B2 (en) * 2018-08-28 2020-10-27 Read Twogether Ltd Single-line display of composite-text
US11227176B2 (en) * 2019-05-16 2022-01-18 Bank Of Montreal Deep-learning-based system and process for image recognition
US11580312B2 (en) 2020-03-16 2023-02-14 Servicenow, Inc. Machine translation of chat sessions
US11385916B2 (en) * 2020-03-16 2022-07-12 Servicenow, Inc. Dynamic translation of graphical user interfaces
CN112818987B (zh) * 2021-01-29 2024-05-14 浙江嘉科电子有限公司 一种公交电子站牌屏显内容识别纠正方法及***
WO2024039362A1 (en) * 2022-08-15 2024-02-22 Innopeak Technology, Inc. Methods and systems for text recognition with image preprocessing

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4674065A (en) * 1982-04-30 1987-06-16 International Business Machines Corporation System for detecting and correcting contextual errors in a text processing system
US4773039A (en) * 1985-11-19 1988-09-20 International Business Machines Corporation Information processing system for compaction and replacement of phrases
US5206949A (en) * 1986-09-19 1993-04-27 Nancy P. Cochran Database search and record retrieval system which continuously displays category names during scrolling and selection of individually displayed search terms
US4864502A (en) * 1987-10-07 1989-09-05 Houghton Mifflin Company Sentence analyzer
US5926565A (en) * 1991-10-28 1999-07-20 Froessl; Horst Computer method for processing records with images and multiple fonts
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
US5359673A (en) * 1991-12-27 1994-10-25 Xerox Corporation Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities
US5541836A (en) * 1991-12-30 1996-07-30 At&T Corp. Word disambiguation apparatus and methods
US5440481A (en) * 1992-10-28 1995-08-08 The United States Of America As Represented By The Secretary Of The Navy System and method for database tomography
US6181837B1 (en) * 1994-11-18 2001-01-30 The Chase Manhattan Bank, N.A. Electronic check image storage and retrieval system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079946A (ja) * 2005-09-14 2007-03-29 Fuji Xerox Co Ltd 表示装置及び翻訳結果表示方法
JP4735148B2 (ja) * 2005-09-14 2011-07-27 富士ゼロックス株式会社 表示装置及び翻訳結果表示方法
JP2013020558A (ja) * 2011-07-13 2013-01-31 Nec Biglobe Ltd コンテンツデータ表示装置、コンテンツデータ表示方法及びプログラム
US8848103B2 (en) 2011-07-13 2014-09-30 Nec Biglobe, Ltd. Content data display device, content data display method and program
JP2013077157A (ja) * 2011-09-30 2013-04-25 Internatl Business Mach Corp <Ibm> 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム

Also Published As

Publication number Publication date
US20030200505A1 (en) 2003-10-23

Similar Documents

Publication Publication Date Title
JPH11110480A (ja) テキストの表示方法およびその装置
US6532461B2 (en) Apparatus and methodology for submitting search oueries
US6466694B2 (en) Document image processing device and method thereof
US6363179B1 (en) Methodology for displaying search results using character recognition
JPH11102414A (ja) ヒートマップを用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを発見するための一連の命令を記録したコンピュータ読み取り可能な記録媒体
US20070098263A1 (en) Data entry apparatus and program therefor
JP5089524B2 (ja) 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム
JPH0660222A (ja) 文字認識装置
JP3221968B2 (ja) 文字認識装置
JP3083171B2 (ja) 文字認識装置及び方法
JP2003132078A (ja) データベース構築装置、データベース構築方法、データベース構築プログラム、記録媒体
JPH11102413A (ja) 光学式文字認識出力のポップアップ訂正のための方法および装置
JPH11102412A (ja) ビットマップ選択を用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを訂正するために一連の命令を記録したコンピュータ読み取り可能な記録媒体
JPH06223221A (ja) 文字認識装置
JPH0562008A (ja) 文字認識方法
JPH11102415A (ja) 光学式文字認識出力の二元スクリーン表示のための方法および装置
JP2829186B2 (ja) 光学的文字読取装置
JPH0916717A (ja) 文書読取装置
JP2001318918A (ja) 翻訳装置及び翻訳方法
JPH1069494A (ja) 画像検索方法とその装置
JPS6398788A (ja) 認識装置
JP2669897B2 (ja) 誤読文字の修正方法
JP3077580B2 (ja) 文字読取装置
JPH01287755A (ja) 修正機能付情報入力装置
JP2019144618A (ja) 外字検索用プログラムおよび外字検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080513