JP4915337B2 - 印刷データ処理プログラム、方法及び装置 - Google Patents

印刷データ処理プログラム、方法及び装置 Download PDF

Info

Publication number
JP4915337B2
JP4915337B2 JP2007314347A JP2007314347A JP4915337B2 JP 4915337 B2 JP4915337 B2 JP 4915337B2 JP 2007314347 A JP2007314347 A JP 2007314347A JP 2007314347 A JP2007314347 A JP 2007314347A JP 4915337 B2 JP4915337 B2 JP 4915337B2
Authority
JP
Japan
Prior art keywords
graphic
character
drawing command
command
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007314347A
Other languages
English (en)
Other versions
JP2009140127A (ja
Inventor
勇作 藤井
浩明 武部
克仁 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007314347A priority Critical patent/JP4915337B2/ja
Publication of JP2009140127A publication Critical patent/JP2009140127A/ja
Application granted granted Critical
Publication of JP4915337B2 publication Critical patent/JP4915337B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、印刷データの監視技術に関する。
近年、文書データの情報漏洩が問題となっている。例えば2006年度の個人情報漏洩インシデント調査結果によると、情報漏洩経路別事故発生件数比率では、紙媒体経由が43.8%とトップを占めている。従って、多くの情報が電子化された現在でも、依然、紙文書による情報漏洩は無視できない。すなわち、機密文書の印刷の監視も、依然重要である。
従来の機密文書印刷の監視は、印刷を行う人のユーザIDで行われていた。具体的には、プリンタでの印刷時に、印刷者のユーザIDと印刷文書名や印刷日時をログとして記録する。また、元となる電子ファイルにアクセス権情報として、印刷許可/不許可を設定できるようにし、ユーザID毎に、印刷出来る電子ファイルを制限するという方法が取られていた。
また、ユーザIDとアクセス権に頼らない方法として、印刷データからテキスト情報を抽出し、その中に、個人情報などの機密情報が存在するかどうかを検出する方式もある。この場合、印刷データからテキスト情報を抽出し、予め設定された文字列、例えば人名等が入っていると、管理者に警告が発せられたり、ログとして記録されたりする。
なお、特開平8−221517号公報には、切出し確度の高い文字候補パターンのみに対して文字認識処理を実行することによって、認識処理時間を短縮する技術が開示されている。具体的には、画像メモリに蓄積されている画像データから黒連結成分の外接方形の座標を求める外接方形演算処理部と、個々の外接方形の統合及び統合後の強制切断を行って文字として認識される可能性がある複数の領域を文字候補パターンとして抽出する文字候補パターン抽出部と、文字候補パターンを格納する候補領域格納メモリと、個々の文字候補パターンに対して文字列中の文字としての確からしさを確率的に表す切出し確度を演算する切出し確度設定部とを備えて文字切出し装置を構成するものである。しかし、印刷データの監視という観点は開示されていない。
また、特開平8−202883号公報には、正確な図形認識ができるようにする技術が開示されている。具体的には、イメージスキャナ等により2値画像化する入力処理を行う。この2値画像化されたデータに対して輪郭ベクトル群の抽出とその情報圧縮になる輪郭ベクトル処理を行う。得られたベクトルデータから外周輪郭ベクトルだけでベクトル間距離が1mm以上の線幅があるかどうかを判断し、条件を満足したときには次の処理を行って、塗り潰しとなるベクトルを選択する。選択されたデータは塗り潰し図形変換を行う。図形変換データを基に編集修正を行う。なお、条件を満足しなかったときには、一括ポリゴン、ポリライン認識を行う。しかし、印刷データの監視という観点は開示されていない。
さらに、特開昭55−82381号公報には、原パターンである2次元パターンを周辺追跡してパターン判定を行う装置が開示されている。具体的には、本装置は、2次元パターンを処理して互いに包含関係にある複数個の閉曲線を抽出する手段と、閉曲線の個々についてその周辺追跡を行って得られる軌跡から閉曲線の形態分類を行う手段を有し、抽出された閉曲線の包含関係と、得られた閉曲線の形態分類結果から原パターンを判定する。しかし、印刷データの監視という観点は開示されていない。
また、特開平6−150064号公報には、タブレット上に描かれたストロークや文字のサイズをもとに、図形か文字かを認識し、更に入力が文字の場合には表示する文字フォントのサイズを自動的に決定する手書き文字図形入力装置が開示されている。具体的には、タブレット(入力手段)からの手書き入力データからそのストロークや文字のサイズを判定するストローク、文字サイズ判定手段と、この判定結果をもとに、入力が文字か図形かを判断し、文字の場合には表示フォント格納手段内に格納されているフォントのなかから表示する文字フォントを選択し、これを表示手段に表示するよう指示する表示制御手段とを備える。しかし、印刷データの監視という観点は開示されていない。
さらに、特開平6−141176号公報には、参照エリアを大きくしないで、写真/文字判別の精度を上げるための技術が開示されている。具体的には、記憶部より注目画素を含む4×4の参照エリアの画素データが出力される。補正テーブル部は、この参照エリアの1ライン目の画素値変化箇所と隣接ライン間の画素値変化箇所の個数A、並びに1列目の画素値変化箇所と隣接列間の画素値変化箇所の個数Bを計数し、A,B両方が規定値以上のときにa=”1”を出力する。領域判定部は、a=”1”の画素の連続出現個数を計数し、計数値が規定値以上のときに写真画像と判定しb=”1”を出力する。補正テーブル部はb=”1”の時に写真画像用スムージング補正を選び、b=”0”のときに文字画像用スムージング補正を選ぶ。しかし、文字の可能性を具体的に描画命令を実行してイメージを生成することなく判断するような技術は開示されていない。
特開平8−221517号公報 特開平8−202883号公報 特開昭55−82381号公報 特開平6−150064号公報 特開平6−141176号公報
文書の印刷内容から、その文書が機密書類であるか否かを正しく判定するには、その文書の印刷データからテキスト情報を抽出しなければならない。しかし、印刷データ中の文字は、全て標準文字コードとして埋め込まれているわけではなく、図形や画像として存在する場合がある。この場合、印刷データから文字コードを抽出するだけでは、全ての文字を正しく抽出することはできない。特に、CONFIDENTIAL等、文書の背景に描画される透かし文字等を抽出できない。
従って、本発明の目的は、印刷データの監視を効率的且つ有効に実施するための新規な技術を提供することである。
本発明に係る印刷データ処理方法は、印刷処理の途中で生成される印刷メタデータを取得し、記憶装置に格納するステップと、記憶装置に格納されている印刷メタデータに含まれる描画レコードが図形の描画命令を含む場合、当該図形の描画命令を実行することなく、当該図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、当該図形の描画命令によって生成されることとなる描画オブジェクトが、文字の可能性が高いとされる所定の状態にあるか判断する判断ステップと、図形の描画命令によって生成されることとなる描画オブジェクトが所定の状態にあると判断された場合、図形の描画命令に係る描画レコードに従って描画処理を実施し、記憶装置に格納するステップと、描画処理の描画結果に対して文字認識処理を実施するステップとを含む。
このように図形の描画命令をそのまま実行することなく文字の可能性が高いか否かを判断して、文字の可能性が高い場合に図形の描画命令を実行してさらに文字認識処理を実施することにより、効率的且つ有効に印刷データの監視を行うことができるようになる。
本発明に係る印刷データ処理方法は、記憶装置に格納されている印刷メタデータに含まれる描画レコードがイメージの描画命令を含む場合、当該イメージに対して文字認識処理を実施することなく、当該イメージ中の成分が所定の状態にあるか判断する第2判断ステップと、イメージ中の成分が所定の状態にある場合には、上記イメージに対して文字認識処理を実施するステップとをさらに含むようにしても良い。ビットマップなどのイメージデータにも文字が含まれている場合もあるので、このようにすれば効率的且つ有効に印刷データの監視を行うことができるようになる。
さらに、本発明に係る印刷データ処理方法は、文字認識処理の処理結果に所定の文字が含まれることを検出した場合、印刷処理を中断させるステップをさらに含むようにしても良い。このような制御を行うことによって、情報の漏洩を事前に防止することができるようになる。
また、上で述べた判断ステップが、図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、図形の描画命令によって生成されることとなる描画オブジェクトが、直線状に並んで配置されている状態であるか判断するステップを含むようにしてもよい。文字列は通常直線状に並んでいることが多いためである。
さらに、上で述べた判断ステップが、図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、図形の描画命令によって生成されることとなる描画オブジェクトの線幅の変化が、一定範囲内という状態であるか判断するステップを含むようにしてもよい。文字には様々なフォントが存在しているが、線幅の変化はそれほど大きくないので、このような処理を実施することにより判断することができる。
さらに、上で述べた第2判断ステップが、イメージ中の線成分の傾き角が、90度又は実質的に90度間隔で分布するか判断するステップを含むようにしてもよい。漢字などでは、線が比較的直角に交わることが多いので、このような条件を満たせば文字が含まれている可能性が高いと判断できる。
さらに、上で述べた判断ステップが、図形の描画命令に関連する描画レコードに含まれる描画点の座標値の変化量を算出するステップと、描画点の座標値の変化量が所定の閾値以上となる描画区間を特定するステップと、各描画区間について、当該描画区間における描画点の近似直線を算出するステップと、各描画区間について、当該描画区間における描画点を近似直線に投影して描画点の近似直線上の移動量を算出するステップと、各描画区間について、近似直線上の移動量の分布におけるピークのうち移動量最大のピークについての移動量である推定文字間隔移動量を特定するステップと、各描画区間について、特定された推定文字間隔移動量が発生する描画点が等間隔又は実質的に等間隔に発生しているか判断するステップとを含むようにしてもよい。
また、上で述べた判断ステップが、図形の描画命令に関連する描画レコードに含まれる描画点の座標値から閉曲線毎に曲線長を算出するステップと、閉曲線毎に、当該閉曲線内の面積を算出するステップと、閉曲線毎に、閉曲線内の面積と曲線長とから単位曲線長あたりの面積を算出するステップと、単位曲線長あたりの面積の変動幅が所定範囲内の閉曲線の区間を特定するステップとを含むようにしてもよい。
さらに、上で述べた第2判断ステップが、イメージを二値化し、さらに細線化処理を実施するステップと、細線化されたイメージにおいて、各細線の端点及び分岐点を抽出し、当該端点及び分岐点間を結ぶ直線の傾きの分布を特定するステップと、直線の傾きの分布において頻出する傾き角の上位2つを特定するステップと、特定された傾き角の上位2つが、90度又は実質的に90度間隔で配置されているか判断するステップとを含むようにしてもよい。
なお、本印刷データ処理方法は、コンピュータと当該コンピュータによって実行されるプログラムとの組み合わせにて実行される場合があり、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークなどを介してデジタル信号として配信される場合もある。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
本発明によれば、印刷データの監視を効率的且つ有効に実施することができるようになる。
図1に、パーソナルコンピュータなどの従来のコンピュータのシステム構成及び印刷処理のフローを模式的に示す。従来のコンピュータは、ワードプロセッサー・プログラムなどのアプリケーション10、Windows(登録商標)などのオペレーティング・システム(OS:Operating System)11、プリンタ・ドライバ12及びプリンタ13を有している。そして、ユーザから印刷を指示されると、アプリケーション10は、描画命令をOS11に出力する。OS11の所定のモジュールは、印刷メタデータを生成してプリンタ・ドライバ12に出力する。印刷メタデータは、例えばEMF(Enhanced Meta File)、XPS(XML Paper Specification)、PostScript、PDF(Portable Document Format)などが該当する。プリンタ・ドライバ12は、コンピュータに接続されているプリンタ13のためのプリンタ固有データを生成して、プリンタ13に出力する。プリンタ13は、プリンタ固有データを受信して、当該プリンタ固有データに従って印刷処理を実施する。
印刷メタデータには、文字描画のためのデータが含まれているが、その文字描画の方法には、1)標準文字コードによる文字描画、2)Type3フォントを用いた文字描画、3)図形としての文字描画、4)ビットマップ画像としての文字描画といったものがある。標準文字コードによる文字描画の場合には、印刷メタデータには標準文字コードが含まれているので、この標準文字コードを抽出すればどのような情報が印刷されるかを把握することができる。しかし、2乃至4の方法が採用されている場合には、標準文字コードは印刷メタデータには含まれておらず、標準文字コードだけに着目していては印刷データの監視という意味では有効性が低くなる。
そこで、本発明の実施の形態では、図2に示すようなシステムを採用することとする。すなわち、アプリケーション10、OS11、プリンタ・ドライバ12及びプリンタ13については図1と同様であるが、OS11から出力される印刷メタデータを処理するプリントマネージャ200を導入する。プリントマネージャ200は、OS11から出力された印刷メタデータをフックして、以下で述べるような処理を実施し、印刷される情報に問題がなければ、OS11から受け取った印刷メタデータをそのままプリンタ・ドライバ12に出力する。一方、印刷される情報に問題があれば、印刷処理を停止又は中止したり、管理者などに警告などを出力する。単にログを生成して記録するようにするだけでも良い。
次に、プリントマネージャ200によって実現される機能の機能ブロック図を図3に示す。図3に示されるようにプリントマネージャ200により、印刷メタデータ取得部201と、印刷メタデータ取得部201により取得された印刷メタデータを格納する印刷メタデータ格納部203と、印刷メタデータ格納部203に格納されている印刷メタデータから処理単位毎に描画レコードを抽出する描画レコード抽出部205と、描画レコード抽出部205によって抽出された描画レコードを格納する抽出描画レコード格納部207と、抽出描画レコード格納部207に格納された描画レコードについて判断処理を実施する描画命令判断部209と、描画命令判断部209の指示により抽出描画レコード格納部207に格納された描画レコードについて処理を実施する描画命令処理部211と、描画命令処理部211又は描画命令判断部209の指示により抽出描画レコード格納部207に格納されている描画レコードの実行処理を行う描画命令実行部213と、描画命令処理部211から出力されたイメージ・データ又は描画命令実行部213により生成された描画結果を格納する画像格納部217と、画像格納部217に格納されたデータについて周知の文字認識処理を実施する文字認識部219と、描画命令判断部209によって抽出された標準文字コード又は文字認識部219によって抽出された文字コードを格納する文字コード格納部215と、描画レコード抽出部205からの指示に応じて文字コード格納部215に格納されている文字コードに対して判定処理を実施し、問題がなければ印刷メタデータ格納部203に格納された印刷メタデータをプリンタ・ドライバ12に出力する文字判定部221とが実現される。
以下、図4乃至図20を用いて図3に示した機能ブロックの処理について説明する。まず、印刷メタデータ取得部201は、OS11が印刷メタデータを出力すると、当該印刷メタデータをフックして印刷メタデータ格納部203に格納する(ステップS1)。このようにして、印刷メタデータを一旦プリンタ・ドライバ12に出力しないようにする。印刷メタデータは、例えば図5に示すような構造を有する。
図5に示すように、印刷メタデータは、複数の描画レコードで構成される。描画レコードには、描画ペンの作成、描画開始位置(描画座標)の設定、各種描画命令(直線描画、円弧描画、ベジェ曲線描画、文字の描画など)、描画ペンの破棄などであって、印刷に必要なデータが複数の描画レコードにて規定されている。描画レコードの順番に特に規則はないので、例えば描画ペンの作成と描画開始位置の設定の順番は、逆転する場合もある。標準文字コードでの文字描画であれば、標準文字コード及びフォント種別が含まれており、Type3フォントを用いた文字描画であれば、グリフ(Gryph)IDとフォントデータが含まれており、図形による文字描画の場合には、1又は複数の輪郭線の描画命令及び描画開始位置が含まれており、イメージによる文字描画の場合には、ビットマップ画像及び描画開始位置等が含まれている。これらを用いて以下の処理を行う。
図6に示すような一般的な印刷物を印刷する場合、全てが標準文字コードで文字が印刷されるのではなく、図7に示すように、「新入社員の研修日程について」については例えば文節毎にイメージとして文字を描画し、「第1日目」から「運用コスト試算」までの文字については標準文字コードによる文字描画(テキスト文字として描画)を行い、「関係者外秘」については、図形(ポリゴン)として描画し、右下の絵については図形(ポリゴン)として描画する。このように様々な描画方法が採用されている場合には、印刷メタデータには、各描画方法についての描画レコードが全て含まれる。各文字は複数の描画レコードで構成される場合もある。
図4の処理の説明に戻って、描画レコード抽出部205は、印刷メタデータ格納部203から、例えば描画命令の種別が変化するまで未処理の描画レコードを読み出し、抽出描画レコード格納部207に格納する(ステップS3)。図7に示した例でも、1つイメージを描画した後に、標準文字コードの文字を1つ描画するということも可能であるが、通常はある程度のかたまりでイメージを連続して描画し、標準文字コードの文字を連続して描画し、図形を連続して描画するため、ステップS3では、描画方法が同じ描画レコードについては一括して処理する。
そして、描画命令判断部209は、抽出描画レコード格納部207を参照して、格納されている描画レコードが、標準文字コードによる文字描画を指示するものであるか判断する(ステップS5)。抽出描画レコード格納部207に格納されている描画レコードが、標準文字コードによる文字描画を指示するものである場合には、当該標準文字コードを描画レコードから抽出し、文字コード格納部215に格納する(ステップS7)。そして処理は、端子Aを介して図20に移行する。
一方、標準文字コードによる文字描画を指示するものではない場合には、描画命令判断部209は、抽出描画レコード格納部207に格納されている描画レコードが、Type3フォントによる文字描画を指示するものであるか判断する(ステップS9)。抽出描画レコード格納部207に格納されている描画レコードが、Type3フォントによる文字描画を指示するものである場合には、描画命令判断部209は、描画命令実行部213に指示を出力し、描画命令実行部213は、抽出描画レコード格納部207に格納されている描画レコードの描画命令を実行して画像として実体化し、画像格納部217に格納する(ステップS11)。そして、文字認識部219は、画像格納部217に格納されているイメージ・データに対して周知の文字認識処理を実施する(ステップS13)。そして、端子Aを介して図20の処理に移行する。
一方、Type3フォントによる文字描画を指示するものではない場合には、描画命令判断部209は、図形(ポリゴン)の描画であるか判断する(ステップS15)。図形の描画である場合には、描画命令判断部209は、描画命令処理部211に指示して、第1文字包含判断処理を実施する(ステップS17)。
第1文字包含判断処理については、図8乃至図18を用いて説明する。なお、本実施の形態では、2つの第1文字包含判断処理について説明するが、これらのうちいずれかを実施するようにしても良いし、両方を重複して実施するようにしても良い。
まず図8乃至図15を用いて1つ目の第1文字包含判断処理(第1文字包含判断処理A)について説明する。第1文字包含判断処理Aは、文字は等間隔に直線状に配置されることが多いという性質を用いて文字の可能性が高いか否かを判断するものである。
まず、描画命令処理部211は、抽出描画レコード格納部207に格納されている描画レコードから、描画点の描画座標を抽出する(ステップS31)。そして、描画座標の変化量を算出し、例えばメインメモリなどの記憶装置に格納する(ステップS33)。例えば、1番目の描画座標と2番目の描画座標との距離を変化量として算出し、2番目の描画座標と3番目の描画座標との距離を変化量として算出し、といったように、順番に変化量を算出する。
例えば、図9に示すように、1乃至6が第1のサイズで図形により描画される文字であり、7乃至11が第2のサイズで図形により描画される文字であり、右下には数千個の図形がランダムに配置されているような場合を考える。このような場合、通常であれば、1乃至6の文字を描画した後に、7乃至11の文字を描画し、さらに数千個の図形をランダムに描画する。このように、1乃至6の文字を左から順番に描画する場合には、その輪郭線の描画開始位置の変化量は、大小はあるもののそれほど大きく変化はしない。同様に、7乃至11の文字を左下から右上に順番に描画する場合には、その輪郭線の描画開始位置の変化量は、大小はあるもののそれほど大きくは変化しない。文字が大きいので1乃至6の文字の場合に比して相対的に大きくなる。但し、6の文字から7の文字の描画に遷移する際に描画開始位置の変化量は大きくなる。同様に、11の文字から数千個の図形のうち最初の図形の描画に遷移する際にも描画開始位置の変化量は大きくなる。移動量をグラフ化して模式的に示せば、図10に示すようになる。図10では、横軸は、描画の順番を示しており、縦軸は、描画開始位置の移動量を示している。このように、☆印で示すように移動量のピークが2つ現れ、3つの区間に分かれていることを特定できるようになる。
図8の説明に戻って、描画命令処理部211は、描画座標の変化量(例えば図10のようなグラフ)に対して周知の平滑化処理を実施し、例えばメインメモリなどの記憶装置に格納する(ステップS35)。このような平滑化処理によって、図10のグラフにおいて小さなピークが丸められ、2つの大きなピークを特定しやすくなる。そして、平滑化後の描画座標の変化量が閾値を超える箇所を検出し、描画区間を特定する(ステップS37)。図10のようなグラフの場合には、2つのピークから、第1乃至第3の区間を特定する。すなわち、第1の区間が、最初からX1番目の描画開始位置までであり、第2の区間がX1+1番目からX2番目の描画開始位置までであり、第3の区間がX2+1から最後の描画開始位置までである。ほぼ1乃至6の文字が第1の区間になり、7乃至11の文字が第2の区間になり、残りが第3の区間になる。
そして、描画命令処理部211は、各区間において、描画点付近を通る直線を例えば最小自乗法にて算出する(ステップS39)。例えば7乃至11がCONFIDENTIALのような文字であれば、図11に模式的に示すような直線が算出される。小さい点は描画点である。なお、数千個の図形の部分にも、直線が算出されるが、以下の処理で文字の可能性小と判断される。
その後、描画命令処理部211は、1つの未処理区間を特定し(ステップS41)、描画点移動判定処理を実施する(ステップS43)。描画点移動判定処理については、図12を用いて説明する。なお、描画点移動判定処理の後には端子Dを介して図15の処理に移行する。まず、描画命令処理部211は、描画点を、ステップS39で算出された直線に投影した際の位置及び移動量を算出し、例えばメインメモリなどの記憶装置に格納する(ステップS61)。例えば、第1の描画点の投影位置と、第2の描画点の投影位置との距離を移動量として算出し、第2の描画点の投影位置と、第3の描画点の投影位置との距離を移動量として算出し、といったように直線上における移動量を算出してゆく。
例えば、図11の例では、図13に示すような移動量の変化を得られる。図13では、横軸は描画点の移動順番を示し、縦軸は直線上の描画点の移動量を示す。このように、文字内の移動量(例えば「C」「O」「N」を描画中の移動量)の絶対値はあまり大きくないが、文字間を移動する際には移動量の絶対値は大きくなる。もし、文字列でない区間であれば、移動量はばらばらであって、ピークが規則的に現れることはなく、ピークはばらばらで特徴的な規則はない。
そして、描画命令処理部211は、移動量のヒストグラムを生成し、例えばメインメモリなどの記憶装置に格納する(ステップS63)。図11の例では、例えば図14に示すようなヒストグラムが得られる。図14では、横軸は描画点の移動量を表し、縦軸は頻度を表す。図11のような例では、文字内の移動量を代表する小さい移動量のピークと、文字間の移動量を代表する大きい移動量のピークの2つのピークが現れる。もし、文字列でない区間であれば、移動量がばらばらなので意味のあるピークは現れない。
その後、描画命令処理部211は、ヒストグラムにおけるピーク位置から、文字間移動時の推定移動量を特定する(ステップS65)。具体的には、ヒストグラムにおけるピークのうち移動量が最も大きいピークを特定し、当該ピークの移動量を、文字間移動時の推定移動量として特定する。
さらに、描画命令処理部211は、文字間移動時の推定移動量に一致する又はほぼ一致する描画位置(ここでは直線上に投影した際の位置)を特定する(ステップS67)。具体的には、
|描画位置の移動量−文字間移動時の推定移動量|/(文字間移動時の推定移動量)<α
を満たすような描画点の位置を特定する。なお、αは、微小の閾値である。図11の例では、図13に示すグラフにおける☆印の位置で、上記の条件を満たすようになるので、その描画点の直線上の投影位置を特定する。
そして、描画命令処理部211は、ステップS67で特定された描画位置間の距離(ここでは直線上に投影した際の距離)を算出し、例えばメインメモリなどの記憶装置に格納する(ステップS69)。
このようにして、直線上の描画点の移動状況を特定する。
そして、端子Dの後の図15の処理の説明に移行して、描画命令処理部211は、ステップS69で算出された距離が一致又はほぼ一致しているか判断する(ステップS45)。すなわち、文字がほぼ等間隔で並んでいるか判断する。例えば、距離の差が、予め定められた閾値未満であるか判断する。距離がほぼ一致すると判断された場合には、処理対象区間について文字の可能性大と設定し、例えばメインメモリなどの記憶装置に格納する(ステップS47)。一方、距離がほぼ一致するとは判断できない場合には、処理対象区間について文字の可能性小と設定し、例えばメインメモリなどの記憶装置に格納する(ステップS49)。そして、ステップS47又はS49の後に、全ての区間について処理したか判断し(ステップS51)、未処理の区間が存在する場合には端子Eを介してステップS41に戻り、未処理の区間が存在しない場合には元の処理に戻る。
このようにすれば、描画オブジェクトがほぼ等間隔に直線状に並んでいる区間を特定することができ、その区間について文字の可能性大と判定することができるようになる。
次に、図16乃至図18を用いて、2つ目の第1文字包含判断処理(第1文字包含判断処理B)について説明する。図16(a)には文字の一例として「関」という漢字が示されている。文字の場合フォントの種類にもよるが、図形の線幅(例えば閉曲線で囲まれる領域の面積/閉曲線の長さ又は2×(閉曲線で囲まれる領域の面積)/閉曲線の長さ)はあまり変動することはない。一方、図16(b)には文字以外のポリゴンの一例を示しているが、このようなポリゴンの場合、図形の線幅については様々に変化する。第1文字包含判断処理Bでは、このような特徴を用いて文字の可能性の高い部分を特定する。
まず、描画命令処理部211は、抽出描画レコード格納部207から、閉曲線単位で、描画レコードを抽出する(ステップS71)。そして、閉曲線毎に曲線長を算出し、例えばメインメモリなどの記憶装置に格納する(ステップS73)。描画点の間については直線近似して距離を求めるようにしても良い。その後、閉曲線毎に、当該閉曲線内の面積を算出し、例えばメインメモリなどの記憶装置に格納する(ステップS75)。面積については、例えば描画点で構成される三角形や四角形に分割して、加算減算を行うことによって算出することができる。このような手法は周知であるからここでは詳細な説明を省略する。
さらに、描画命令処理部211は、閉曲線毎に、単位曲線長あたりの面積を算出し、例えばメインメモリなどの記憶装置に格納する(ステップS77)。具体的には、ステップS75で算出された面積/ステップS73で算出された閉曲線の曲線長で算出される。そして、単位曲線長あたりの面積を列挙して、その変動幅が所定範囲内の区間を抽出する(ステップS79)。図18に一例を示す。図18の例では、横軸は描画の順番を表し、縦軸は単位曲線長あたりの面積を表す。図18に示すように、小さい文字の文字列では、単位曲線長あたりの面積は、低位安定でばらつきは少なく、大きい文字の文字列では、単位曲線長あたりの面積、高位安定でばらつきは少ない。一方、文字列でない区間では、単位曲線長あたりの面積は、大きくばらつく。従ってステップS79では、単位曲線長あたりの面積の変動幅が所定範囲内の区間(閉曲線の区間)を特定する。
そして、描画命令処理部211は、抽出された閉曲線の区間については文字の可能性大を設定し、抽出された閉曲線の区間以外の区間については文字の可能性小を設定し、例えばメインメモリなどの記憶装置に格納する(ステップS81)。
このようにすれば、線幅に基づき文字の可能性が大である区間を抽出することができるようになる。
図4の処理フローの説明に戻って、ステップS17の後に、描画命令処理部211は、文字の可能性大とされた区間又は部分が存在するか判断する(ステップS21)。文字の可能性大とされた区間又は部分が存在しない場合には、端子Bを介して図20のステップS113に移行する。一方、文字の可能性大とされた区間又は部分が存在した場合には、描画命令処理部211は、描画命令実行部213に指示を出力し、描画命令実行部213は、抽出描画レコード格納部207に格納されている描画レコードについての描画命令を実行して画像として実体化し、画像格納部217に格納する(ステップS23)。なお、文字の可能性大とされた区間又は部分についてのみ画像として実体化するようにしてもよいし、念のため全体を画像として実体化させるようにしてもよい。一方、ステップS15で図形の描画ではないと判断された場合には、イメージの描画であるから、描画命令処理部211は、第2文字包含判断処理を実行する(ステップS19)。この第2文字包含判断処理の後にステップS21に移行する。第2文字包含判断処理を経てステップS23に到達した場合には、ステップS23で、描画命令処理部211は、抽出描画レコード格納部207から、ビットマップ画像を抽出して、画像格納部217に格納する。そして、ステップS13に移行する。
図19を用いて第2文字包含判断処理について説明する。本実施の形態では、主に漢字であれば直交する直線が多数存在するという性質を用いて、ビットマップ画像に文字が含まれる可能性が高いか否かを判断するものである。
まず、描画命令処理部211は、抽出描画レコード格納部207から描画レコードに含まれるビットマップ画像のデータを抽出する(ステップS91)。そして、当該ビットマップ画像を周知の手法にて二値化し(ステップS93)、さらに周知の細線化処理を実施する(ステップS97)。二値化及び細線化の処理結果は、例えばメインメモリなどの記憶装置に格納する。さらに、細線化されたビットマップ画像中の細線における端点及び分岐点を抽出し(ステップS97)、端点同士、分岐点同士、及び端点と分岐点を結ぶ直線の傾き角度を特定する(ステップS99)。
そして、描画命令処理部211は、ステップS99で特定された傾き角度についてヒストグラムを生成し、頻出角度の上位2つを特定する(ステップS101)。ここで、頻出角度の上位2つの差が直角又はほぼ直角であれば文字の可能性大と設定し、そうでなければ文字の可能性小と設定し、例えばメインメモリなどの記憶装置に格納する(ステップS103)。そして元の処理に戻る。
このようにして、ビットマップ画像において文字が含まれる可能性について判断することができる。但し、他の手法を用いるようにしても良い。
次に、図4の端子A以降の処理(図20)について説明する。図4の端子Aの前に、文字認識処理を実施しているので、文字認識部219は、当該文字認識処理の処理結果である文字コードを文字コード格納部215に格納する(ステップS111)。その後、描画レコード抽出部205は、全ての描画レコードを処理したか判断する(ステップS113)。未処理の描画レコードが存在する場合にはステップS3(図4)に戻る。一方、全ての描画レコードについて処理した場合には、描画レコード抽出部205は、文字判定部221に指示を出力し、文字判定部221は、文字コードが文字コード格納部215に格納されているか判断する(ステップS115)。上で述べた処理を実施しても全て絵だけで、文字が含まれていない場合もあるので、ここで判断する。文字コードが含まれていない場合にはステップS119に移行する。一方、文字コードが含まれている場合には、文字判定部221は、文字コードを解析する処理を実施する(ステップS117)。例えば、特定すべき文字列についての文字コードを予め格納したファイル等(図示せず)を用意しておき、当該ファイルを参照して一致するか否かを判断する。
そして、文字判定部221は、文字コードの解析処理の結果として印刷停止を行うべきか判断する(ステップS119)。例えば重要な書類に付される文字列(厳秘など)が含まれると判断された場合には、印刷停止にする(ステップS123)。すなわち、印刷メタデータ格納部203に格納されている印刷メタデータをプリンタ・ドライバ12に出力することなく、処理を終了する。印刷停止と併せて又は印刷停止ではなく、管理者などに警告を出力するようにしても良い。その後処理を終了する。
一方、文字コードが含まれていない等の印刷停止する必要がないケースでは、文字判定部221は、印刷メタデータ格納部203に格納されている印刷メタデータを、プリンタ・ドライバ12に出力する(ステップS121)。そして処理を終了する。
以上のように、印刷メタデータに含まれる描画命令を実際に実行することなく文字が含まれる可能性について適切に判断し、その結果文字が含まれる可能性が大きい場合には描画命令を実際に実行して文字認識を実行している。従って、効率的に文字の有無を判断して、印刷メタデータから文字コードを抽出することができ、適切に印刷の可否を判断することができるようになる。印刷の可否ではなく、警告の有無を判断するようにしても良い。
以上本発明の実施の形態について説明したが、本発明はこれに限定されるものではない。例えば、上で述べた処理フローは一例であって、処理結果が同じであれば、処理ステップの順番を入れ替えたり、並列実行するように変更することも可能である。
さらに図3に示した機能ブロック図については一例であって、必ずしもプリントマネージャ200のプログラム・モジュールに対応しない場合もある。
さらに、第1文字包含判断処理についても、文字又は文字列が有する特徴を、イメージではなく図形の描画命令等から抽出する他の処理で代替することも可能である。さらに、上で述べた処理に加えて実施するようにしても良い。
なお、図2に示したコンピュータは、例えばコンピュータ装置であって、図21に示すように当該コンピュータ装置においては、メモリ2501(記憶部)とCPU2503(処理部)とハードディスク・ドライブ(HDD)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517と、プリンタ2521とがバス2519で接続されている。オペレーティング・システム(OS)及びWebブラウザを含むアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。必要に応じてCPU2503は、表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、必要な動作を行わせる。また、処理途中のデータについては、メモリ2501に格納され、必要があればHDD2505に格納される。このようなコンピュータは、上で述べたCPU2503、メモリ2501などのハードウエアとOS及び必要なアプリケーション・プログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
(付記1)
印刷処理の途中で生成される印刷メタデータを取得し、記憶装置に格納するステップと、
前記記憶装置に格納されている前記印刷メタデータに含まれる描画レコードが図形の描画命令を含む場合、当該図形の描画命令を実行することなく、当該図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、当該図形の描画命令によって生成されることとなる描画オブジェクトが、文字の可能性が高いとされる所定の状態にあるか判断する判断ステップと、
前記図形の描画命令によって生成されることとなる描画オブジェクトが前記所定の状態にあると判断された場合、前記図形の描画命令に係る描画レコードに従って描画処理を実施し、前記記憶装置に格納するステップと、
前記描画処理の描画結果に対して文字認識処理を実施するステップと、
をコンピュータに実行させるための印刷データ処理プログラム。
(付記2)
前記記憶装置に格納されている前記印刷メタデータに含まれる描画レコードがイメージの描画命令を含む場合、当該イメージに対して文字認識処理を実施することなく、当該イメージ中の成分が所定の状態にあるか判断する第2判断ステップと、
前記イメージ中の成分が所定の状態にある場合には、前記イメージに対して文字認識処理を実施するステップと、
をさらに前記コンピュータに実行させるための付記1記載の印刷データ処理プログラム。
(付記3)
前記文字認識処理の処理結果に所定の文字が含まれることを検出した場合、前記印刷処理を中断させるステップ
をさらに実行させるための付記1記載の印刷データ処理プログラム。
(付記4)
前記判断ステップが、
前記図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、前記図形の描画命令によって生成されることとなる前記描画オブジェクトが、直線状に並んで配置されている状態であるか判断するステップ
を含む付記1記載の印刷データ処理プログラム。
(付記5)
前記判断ステップが、
前記図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、前記図形の描画命令によって生成されることとなる前記描画オブジェクトの線幅の変化が、一定範囲内という状態であるか判断するステップ
を含む付記1記載の印刷データ処理プログラム。
(付記6)
前記第2判断ステップが、
前記イメージ中の線成分の傾き角が、90度又は実質的に90度間隔で分布するか判断するステップ
を含む付記2記載の印刷データ処理プログラム。
(付記7)
前記判断ステップが、
前記図形の描画命令に関連する描画レコードに含まれる描画点の座標値の変化量を算出するステップと、
前記描画点の座標値の変化量が所定の閾値以上となる描画区間を特定するステップと、
各前記描画区間について、当該描画区間における前記描画点の近似直線を算出するステップと、
各前記描画区間について、当該描画区間における前記描画点を前記近似直線に投影して前記描画点の近似直線上の移動量を算出するステップと、
各前記描画区間について、前記近似直線上の移動量の分布におけるピークのうち移動量最大のピークについての移動量である推定文字間隔移動量を特定するステップと、
各前記描画区間について、特定された前記推定文字間隔移動量が発生する前記描画点が等間隔又は実質的に等間隔に発生しているか判断するステップと、
を含む付記1記載の印刷データ処理プログラム。
(付記8)
前記判断ステップが、
前記図形の描画命令に関連する描画レコードに含まれる描画点の座標値から閉曲線毎に曲線長を算出するステップと、
前記閉曲線毎に、当該閉曲線内の面積を算出するステップと、
前記閉曲線毎に、前記閉曲線内の面積と前記曲線長とから単位曲線長あたりの面積を算出するステップと、
前記単位曲線長あたりの面積の変動幅が所定範囲内の前記閉曲線の区間を特定するステップと、
を含む付記1記載の印刷データ処理プログラム。
(付記9)
前記第2判断ステップが、
前記イメージを二値化し、さらに細線化処理を実施するステップと、
細線化された前記イメージにおいて、各細線の端点及び分岐点を抽出し、当該端点及び分岐点間を結ぶ直線の傾きの分布を特定するステップと、
前記直線の傾きの分布において頻出する傾き角の上位2つを特定するステップと、
特定された前記傾き角の上位2つが、90度又は実質的に90度間隔で配置されているか判断するステップと、
を含む付記2記載の印刷データ処理プログラム。
(付記10)
印刷処理の途中で生成される印刷メタデータを取得し、記憶装置に格納するステップと、
前記記憶装置に格納されている前記印刷メタデータに含まれる描画レコードが図形の描画命令を含む場合、当該図形の描画命令を実行することなく、当該図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、当該図形の描画命令によって生成されることとなる描画オブジェクトが、文字の可能性が高いとされる所定の状態にあるか判断する判断ステップと、
前記図形の描画命令によって生成されることとなる描画オブジェクトが前記所定の状態にあると判断された場合、前記図形の描画命令に係る描画レコードに従って描画処理を実施し、前記記憶装置に格納するステップと、
前記描画処理の描画結果に対して文字認識処理を実施するステップと、
を含み、コンピュータに実行される印刷データ処理方法。
(付記11)
印刷処理の途中で生成される印刷メタデータを取得し、記憶装置に格納する手段と、
前記記憶装置に格納されている前記印刷メタデータに含まれる描画レコードが図形の描画命令を含む場合、当該図形の描画命令を実行することなく、当該図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、当該図形の描画命令によって生成されることとなる描画オブジェクトが、文字の可能性が高いとされる所定の状態にあるか判断する判断手段と、
前記図形の描画命令によって生成されることとなる描画オブジェクトが前記所定の状態にあると判断された場合、前記図形の描画命令に係る描画レコードに従って描画処理を実施し、前記記憶装置に格納する手段と、
前記描画処理の描画結果に対して文字認識処理を実施する手段と、
を有する印刷データ処理装置。
従来技術の問題を説明するための図である。 本発明の実施の形態に係るシステム概要を示す図である。 プリントマネージャ200により実現される機能ブロックを表す図である。 本発明の実施の形態におけるメインの処理フローを示す図である。 印刷メタデータの構造例を示す図である。 印刷物の一例を示す図である。 印刷物の描画方法例を示す図である。 第1文字包含判断処理Aの処理フローを示す図である。 図形による文字描画の例を示す図である。 描画開始位置の移動量変化の一例を示す図である。 傾いている文字列の近傍を通る直線の一例を示す図である。 描画点移動判定処理の処理フローを示す図である。 直線上に対する描画点の投影位置の移動量の変化を示す図である。 描画点の移動量のヒストグラムの一例を示す図である。 第1文字包含判断処理Aの処理フローを示す図である。 (a)は、漢字の一例を示す図であり、(b)は図形(絵)の一例を示す図である。 第1文字包含判断処理Bの処理フローを示す図である。 単位曲線長あたりの面積の変化を示す図である。 第2文字包含判断処理の処理フローを示す図である。 本発明の実施の形態におけるメインの処理フローを示す図である。 コンピュータの機能ブロック図である。
符号の説明
10 アプリケーション 11 OS 12 プリンタ・ドライバ
13 プリンタ 200 プリンタマネージャ
201 印刷メタデータ取得部 203 印刷メタデータ格納部
205 描画レコード抽出部 207 抽出描画レコード格納部
209 描画命令判断部 211 描画命令処理部
213 描画命令実行部 215 文字コード格納部
217 画像格納部 219 文字認識部
221 文字判定部

Claims (7)

  1. 印刷処理の途中で生成される印刷メタデータを取得し、記憶装置に格納するステップと、
    前記記憶装置に格納されている前記印刷メタデータに含まれる描画レコードが図形の描画命令を含む場合、当該図形の描画命令を実行することなく、当該図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、当該図形の描画命令によって生成されることとなる描画オブジェクトが、文字の可能性が高いとされる所定の状態にあるか判断する判断ステップと、
    前記図形の描画命令によって生成されることとなる描画オブジェクトが前記所定の状態にあると判断された場合、前記図形の描画命令に係る描画レコードに従って描画処理を実施し、前記記憶装置に格納するステップと、
    前記描画処理の描画結果に対して文字認識処理を実施するステップと、
    をコンピュータに実行させるための印刷データ処理プログラム。
  2. 前記記憶装置に格納されている前記印刷メタデータに含まれる描画レコードがイメージの描画命令を含む場合、当該イメージに対して文字認識処理を実施することなく、当該イメージ中の成分が所定の状態にあるか判断する第2判断ステップと、
    前記イメージ中の成分が所定の状態にある場合には、前記イメージに対して文字認識処理を実施するステップと、
    をさらに前記コンピュータに実行させるための請求項1記載の印刷データ処理プログラム。
  3. 前記判断ステップが、
    前記図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、前記図形の描画命令によって生成されることとなる前記描画オブジェクトが、直線状に並んで配置されている状態であるか判断するステップ
    を含む請求項1記載の印刷データ処理プログラム。
  4. 前記判断ステップが、
    前記図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、前記図形の描画命令によって生成されることとなる前記描画オブジェクトの線幅の変化が、一定範囲内という状態であるか判断するステップ
    を含む請求項1記載の印刷データ処理プログラム。
  5. 前記第2判断ステップが、
    前記イメージ中の線成分の傾き角が、90度又は実質的に90度間隔で分布するか判断するステップ
    を含む請求項2記載の印刷データ処理プログラム。
  6. 印刷処理の途中で生成される印刷メタデータを取得し、記憶装置に格納するステップと、
    前記記憶装置に格納されている前記印刷メタデータに含まれる描画レコードが図形の描画命令を含む場合、当該図形の描画命令を実行することなく、当該図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、当該図形の描画命令によって生成されることとなる描画オブジェクトが、文字の可能性が高いとされる所定の状態にあるか判断する判断ステップと、
    前記図形の描画命令によって生成されることとなる描画オブジェクトが前記所定の状態にあると判断された場合、前記図形の描画命令に係る描画レコードに従って描画処理を実施し、前記記憶装置に格納するステップと、
    前記描画処理の描画結果に対して文字認識処理を実施するステップと、
    を含み、コンピュータに実行される印刷データ処理方法。
  7. 印刷処理の途中で生成される印刷メタデータを取得し、記憶装置に格納する手段と、
    前記記憶装置に格納されている前記印刷メタデータに含まれる描画レコードが図形の描画命令を含む場合、当該図形の描画命令を実行することなく、当該図形の描画命令に関連する描画レコードに含まれる描画点の座標値から、当該図形の描画命令によって生成されることとなる描画オブジェクトが、文字の可能性が高いとされる所定の状態にあるか判断する判断手段と、
    前記図形の描画命令によって生成されることとなる描画オブジェクトが前記所定の状態にあると判断された場合、前記図形の描画命令に係る描画レコードに従って描画処理を実施し、前記記憶装置に格納する手段と、
    前記描画処理の描画結果に対して文字認識処理を実施する手段と、
    を有する印刷データ処理装置。
JP2007314347A 2007-12-05 2007-12-05 印刷データ処理プログラム、方法及び装置 Expired - Fee Related JP4915337B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007314347A JP4915337B2 (ja) 2007-12-05 2007-12-05 印刷データ処理プログラム、方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007314347A JP4915337B2 (ja) 2007-12-05 2007-12-05 印刷データ処理プログラム、方法及び装置

Publications (2)

Publication Number Publication Date
JP2009140127A JP2009140127A (ja) 2009-06-25
JP4915337B2 true JP4915337B2 (ja) 2012-04-11

Family

ID=40870691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007314347A Expired - Fee Related JP4915337B2 (ja) 2007-12-05 2007-12-05 印刷データ処理プログラム、方法及び装置

Country Status (1)

Country Link
JP (1) JP4915337B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3683925B2 (ja) * 1994-11-18 2005-08-17 キヤノン株式会社 電子ファイリング装置
JP2006171851A (ja) * 2004-12-13 2006-06-29 Nec Corp 文書ファイル解析システム、文書ファイル解析方法及びプログラム

Also Published As

Publication number Publication date
JP2009140127A (ja) 2009-06-25

Similar Documents

Publication Publication Date Title
EP0543598B1 (en) Method and apparatus for document image processing
EP2241999A2 (en) Underline removal apparatus
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP4443576B2 (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
US6947596B2 (en) Character recognition method, program and recording medium
CN104809099A (zh) 文档文件生成装置及文档文件生成方法
US20030118211A1 (en) Watermark information extraction apparatus and method of controlling thereof
US8600175B2 (en) Apparatus and method of processing image including character string
US10984277B2 (en) Image analysis apparatus, image analysis method, and non-transitory computer readable medium
JP2008312139A (ja) 印刷装置及び印刷方法
JPH10171922A (ja) 罫線消去装置及び記録媒体
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4915337B2 (ja) 印刷データ処理プログラム、方法及び装置
JP4522323B2 (ja) 画像処理装置及びその制御方法
JP4078045B2 (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP5361315B2 (ja) 情報処理装置及び情報処理方法
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体
JP2009193170A (ja) 文字認識装置及び文字認識方法
JP3880091B2 (ja) 情報処理装置及び方法
JP5402417B2 (ja) 画像処理装置
JP3133797B2 (ja) 文字認識方法及びその装置
JP2003030585A (ja) 画像処理装置、方法、プログラム及び記憶媒体
JPH0535916A (ja) 文字切り出し方法
CN115631493A (zh) 文本区确定方法、***及相关装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111227

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees