JP3373811B2 - 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置 - Google Patents

白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置

Info

Publication number
JP3373811B2
JP3373811B2 JP22349099A JP22349099A JP3373811B2 JP 3373811 B2 JP3373811 B2 JP 3373811B2 JP 22349099 A JP22349099 A JP 22349099A JP 22349099 A JP22349099 A JP 22349099A JP 3373811 B2 JP3373811 B2 JP 3373811B2
Authority
JP
Japan
Prior art keywords
embedding
groups
information
detecting
watermark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22349099A
Other languages
English (en)
Other versions
JP2001078006A (ja
Inventor
富夫 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP22349099A priority Critical patent/JP3373811B2/ja
Priority to US09/621,567 priority patent/US6983056B1/en
Publication of JP2001078006A publication Critical patent/JP2001078006A/ja
Application granted granted Critical
Publication of JP3373811B2 publication Critical patent/JP3373811B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0062Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0065Extraction of an embedded watermark; Reliable detection

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像中に人間
の目には一見わからないような形で透かし情報を埋め込
み、不正行為の防止や各種の権利保護に役立てる白黒2
値文書画像への透かし情報埋め込み・検出方法及びその
装置に関するものである。
【0002】
【従来の技術】ビジネス活動のグローバル化や消費者の
権利意識の普及に伴い、企業や公共機関が取り扱う情報
に関して、より厳格な管理が要求されるようになってき
ている。情報の不正な流出や偽造・改竄が、公正な競争
の阻害やプライバシーの侵害等というかたちで社会全体
に多くの不利益をもたらす、というコンセンサスが確立
した結果と考えられる。
【0003】コンピュータによる情報管理が主流となっ
た昨今でも情報の流出・漏洩は、紙によって行われるこ
とが多い。また、ペーパーレスが叫ばれている昨今であ
るが、コンピュータからプリントアウトされる形態で、
オフィス内での紙の消費量はむしろ増加している。更
に、コピアやファックスなどのOA機器の普及は情報流出
が起りやすい状況をもたらした。このような状況の下で
は、紙ベースの情報流出・漏洩を防ぎ、また流出・漏洩
した文書を追跡するための技術的手段が求められてい
る。
【0004】また、DTP(Desk Top Publishing)ソフト
ウェアやプリンタの普及により高品質の印刷文書の作成
が容易になったが、このことは外見上はもっともらしい
が内容が本来と異なる文書が作成、即ち改竄され、悪用
される危険性を増大させた。文書が偽者でないことを示
すために特別な用紙−例えば物理的な透かしの入った用
紙−やインクを用いることもできるが、ランニングコス
トが高くなってしまう。しかし、一般の文書は通常の用
紙やインクを用いて印刷、コピーされたものであり、こ
れらの文書に対してその正当性を保証する情報を付加す
る方法が求められている。
【0005】例えば、特開平7-84485号公報はコピアの
出力機を同定するための透かしの埋め込み手法を開示し
ているが、この手法はページ全体に配置した複数の領域
の黄色のトナーの輝度を変化させることにより埋め込み
を行っている。当然検出にはカラーの多値画像のスキャ
ンが要求されるが、一般的に文書は多値ではなく白黒2
値であり、また透かし検出のために白黒コピアやファッ
クスにまでカラー画像を取り込む機能を付加するのはコ
スト面で実用的ではない。
【0006】特開平6-324625号公報は文字のはねなどの
微妙な形状の差異によって透かしを埋め込む手法を開示
している。しかし、紙に印刷後スキャンした画像は、プ
リンタ印字機構の種類やプリンタとスキャナの解像度の
違いなどの影響を受けるため、画素レベルでは元画像か
ら変化している。また、コピー・印刷・スキャン時の濃
度の設定や文書の置き方−位置ずれやスキュー(紙の傾
き)−による変化、更に染み・かすれ等のノイズの影響
も加わる。これらの変動の中から埋め込みによる局所的
な形状の変化を、安定的に検出することは困難である。
【0007】
【発明が解決しようとする課題】特開平7-222000号公報
はテキスト行における中心線の縦方向の間隔を増減させ
て透かしを埋め込む手法を開示している。この手法は印
刷後のスキャンに耐え得るが検出時にオリジナル文書か
ら抽出しておいた情報が必要となるため、上述の流出・
漏洩防止のシナリオには適用できない。
【0008】本発明の目的は上述した課題を解決して、
通常白黒2値のデータである紙の文書画像でも透かし情
報を埋め込むことができ、かつ埋め込んだ情報を安定し
て検出できる白黒2値文書画像への透かし情報埋め込み
・検出方法及びその装置を提供しようとするものであ
る。
【0009】
【課題を解決するための手段】最初に文書画像からテキ
スト行の領域を検出し領域内の特徴を変化させ、この特
徴の変化を観測することにより、透かしの埋め込み及び
検出を行う。画像自体から検出されたテキスト行(通常
は外接矩形)を基準にすることにより位置ずれやスキュ
ーに対して頑健であり、1つの特徴量また複数の特徴量
の組み合わせの差・比を利用することにより染みやかす
れ等の全体的なノイズに対しても頑健な透かしを実現す
ることができる。
【0010】透かしの埋め込みにあたっては対象となる
画像領域(テキスト行)を複数の小区画に分割し、小区
画を2つのグループに分ける。一方のグループに属する
小区画に対しては特徴の量を増やす操作を行い、他方の
グループに属する小区画に対しては特徴の量を減らす操
作を施す。透かしの検出時には各小区画から抽出される
特徴をグループ毎に集計し、2つのグループから得られ
た値を比較することによって、透かしが埋め込まれてい
るのか否か、もしも透かしが埋め込まれているなら透か
しのビットは1か0かを判定する。局所的な特徴の変化
を集積することにより、コピー・印刷・スキャン時に加
えられるランダムな特徴の変化(染み、かすれ等)、ノ
イズの多い文書、印字品質の低い文書に対して耐性を持
たせることができる。
【0011】更に、2つのグループから得られた値を、
値の差や比を用いて情報を表現することにより、ページ
全体にわたって特徴量を増加または減少させるような種
類のノイズに対しても安定して透かを検出することが可
能になる。説明の便宜上、2つの小区画のグループで説
明しているが、例えばグループを2以上にしても良い。
また、特徴量の増減についても、増加と減少といいう2
段階の操作には限定されず、特徴量を段階的に増加や減
少させることにより、より多くの透かし情報を埋め込む
ことも可能である。ただし、同一領域内に透かし情報を
より多く埋め込むほど、透かし情報を埋め込んだ文書画
像から埋め込まれている情報を検出する確度(安定性)
が低くなるという問題がある。しかしこの問題は1ビッ
ト当りの透かし情報を埋め込む領域を大きくすること、
即ち1ビット当りに対して数行のテキスト行の特徴量を
集積することで、透かし情報を検出する確度を高めるこ
とが可能であるため対処可能である。
【0012】上述のように方法に即して説明してきた
が、画像中のテキスト領域を検出する手段とその検出さ
れたテキスト領域の特徴量を操作・検出する手段を含む
透かし情報埋め込み・検出装置というような、装置の形
態であっても、本発明の目的、効果等は達成可能であ
る。
【0013】
【発明の実施の形態】例えば、電子透かしを用いた機密
情報の漏洩防止・追跡は以下のようにして行われる。−
文書の印刷時に、印字される画像データ中にセキュリテ
ィに関する情報を電子透かしの技術を用いて埋め込んで
おく。−コピアやファックスで紙文書をスキャンする際
に、画像データ中に透かしが埋め込まれているか否かを
チェックし、検出されたセキュリティに応じてコピーや
ファックスを禁止したり、記録(ファックスであれば、
誰が何処に送ったかの発信記録をとる等)をとる、等の
措置を講ずる。文書の偽造防止や真贋の判断に電子透か
しを用いる場合には、印刷時に透かしを埋め込んでお
き、提示された文書から同じ透かしが検出できるか否か
によって文書の正当性を検証する。
【0014】ただし、電子透かしを用いて上記のシナリ
オ実現するためには、以下の点を考慮する。−文書画像
は白黒2値のデータとして表現されることが多いため、
濃淡の変化を用いた埋め込み手法の適用は不可であるこ
と。−印刷・コピー時やスキャン時における紙の位置ず
れやスキュー(紙の傾き)、染みやかすれ等のノイズに
対して頑健であること。−印刷物をスキャンした画像
は、画素レベルで見れば元画像と同一ではないこと。
【0015】図1に文書画像への透かし埋め込み/検出
を用いたアプリケーションの構成例を示す。埋め込み側
モジュール内の1の「文書作成/管理」は文書を電子的
に作成、保管、伝達するためのシステムであり、既存の
ワードプロセッサ、グループウェア、文書データベース
等が相当する。コード化されている文書データを紙など
の媒体に出力する場合、2の「出力用画像の作成」によ
りページ毎に画像データ(あるいは同等のデータ表現)
が生成され、4の「透かしの埋め込み」が透かしの埋め
込みを行う。画像は、図1のように他の処理や3の「入
力デバイス」から4の「透かしの埋め込み」モジュール
に入力させるような構成をとることも可能である。他の
処理から紙の文書が送られてきた場合は、3の「入力デ
バイス」(例えばイメージスキャナ)によって画像デー
タが取り込まれ、4の「透かしの埋め込み」モジュール
への入力になる。透かしが埋め込まれた画像は5の適当
な「出力デバイス」(プリンタ等)により紙文書として
出力される。
【0016】出力された紙文書は以後物理的に保存/伝
達されるが、その過程で不正に持ち出されたり、改竄・
偽造が行われる可能性がある。検出側モジュールでは正
しい透かしが埋め込まれているか否かをチェックし、不
正と判断した場合は以後の処理(コピーやファックスの
送信等)を行わないよう制御する。まず、6の「入力デ
バイス」(イメージスキャナ等)によって画像として取
り込まれる。画像は7の「透かしの検出」モジュールに
よって処理され、その後、結果が8の「チェックロジッ
ク」に渡されて、そこで要求された処理(コピーやファ
ックス等)を実行して良いか否かを判定する。図1にお
いて、2の「出力用画像の作成」、4の「透かしの埋め
込み」モジュールをファームウェアとして5の「出力デ
バイス」の中に組み込むような構成も可能である。同様
に、7の「透かしの検出」や8の「チェックロジック」
をファームウェア(装置内に保存される,その当該装置
を動かすのに必要なプログラムの一種)として6の「入
力デバイス」に組み込むような構成も可能である。5の
「出力デバイス」と6の「入力デバイス」を省略し電子
的な画像データの偽造・改竄・不正な送信をチェックす
るアプリケーション・ソフトウェアを構成することも可
能である。
【0017】上述の構成の中で、4の「透かしの埋め込
み」モジュール及び7の「透かしの検出」モジュールの
内容が、本発明の中心部分である。図2は、本手法によ
る透かし埋め込み/検出処理のフローチャートである。
埋め込み処理の入力はオリジナル文書のページ画像、出
力は透かしが埋め込まれたページ画像である。検出処理
は、画像(通常は印刷後にスキャンされたもの)を入力
として、透かしの埋め込みが無いこと、または透かし情
報を示すビット列を出力する。説明の便宜上、ここでは
1ビットを埋め込み、それを検出する場合について説明
をおこなう。もちろん、本発明の趣旨から外れることな
く、複数ビットを埋め込むことも可能である。
【0018】埋め込み処理の最初のステップとして画像
中のテキスト領域を検出し、各行に外接する矩形の座標
を計算する。これは従来技術であり、OCRや文書画像解
析分野で開発された既存のレイアウト解析手法を用いる
ことができる。
【0019】検出された行の外接矩形集合について、そ
れぞれの矩形を小区画に分割し、小区画を2つのグルー
プに分ける。分割やグルーピングは、透かしの埋め込み
時と検出時で同一のものを使用する限り、任意(ランダ
ム)に決定することができる。ただし、透かし検出の確
度を上げるため、即ち安定して透かしを検出するために
は、 1) 各グループに属する区画の面積の総和に大きな差
がないこと 2) 行矩形を上下で分割した場合には、上下の小区画
が別々のグループに属すること が望ましい。2)は、埋め込みに使われる特徴量に変動
を与える要素、例えば明朝体のテキスト中に一部ゴシッ
ク体が使われている場合等の影響を相殺する効果があ
る。
【0020】図3に行矩形の分割とグルーピングの例を
示す。この例では、「ビジネス活動のグローバル化や消
費者の権」というテキスト行に外接する矩形を水平方向
に6等分、垂直方向に2等分して計12個の小区画に分
割している。図3(c)のとは小区画の属するグル
ープを示し、即ちとの2種類にグループ分けを行
う。
【0021】透かしの情報として1を埋め込むか、0を
埋め込むかに応じて、各グループに対して画像の特徴量
を増減する処理を施す。本実施例では1を埋め込む場合
にはグループに属する小区画に対してはその特徴量を
増加させる処理を行い、グループに属する小区画に対
してはその特徴量を逆に減少させる処理を行うこととす
る。0を埋め込む場合は、これとは逆の操作を行うこと
とする。このルールは、透かしの埋め込み時と検出時に
おいて整合性があれば、逆に定めることもできる。ここ
で特徴とは、画像から適当なルールに基づいて計算され
るスカラー量のことをいう。例えば、黒画素の数、黒白
の遷移の数(ある画像の範囲をラスタ走査して黒画素お
よび白画素のランを観測したとき画素の値が白から黒
(または黒から白)に変化する回数)、特定の局所パター
ンの出現頻度、線分の平均太さ等はいずれも特徴である
が、透かしに使用可能な特徴は、透かしが無い状態であ
る程度統計的に一定である必要がある。統計的に一定で
なければ、透かし情報の検出の確度(安定性)が低くな
るからである。本実施例では、小区画内の黒画素の数を
黒画素領域の周囲長の2乗で正規化した値を特徴として
用いている。
【0022】その他の例として、線分の平均太さを特徴
として利用することも可能である。図8に線分の平均太
さを検出する場合のフローチャートを示す。図9のよう
に、太さの検出は対象となる矩形領域について主操作方
向を垂直方向とするラスタ操作をすることによって行
う。太さ情報検出プログラムは垂直の走査線各ラインを
観測して黒画素のラン(連)を検出しランデータ(視点
と長さの情報)に変換する。各ランについてその長さを
予め設定しておいた閾値と比較して短いランの長さと数
を記録する。ラスタ操作が終了した時点でランの長さの
平均を計算する。図8のフローチャートでは、水平線分
及び水平に近い線分を検出の対象としている。長さを閾
値と比較しているのは、水平及び水平に近い線分を上か
ら横切るかたちになっているランのみをカウントに対象
として考慮するためである。
【0023】斜め線分に対しては見かけの「太さ」が大
きくなるが、特に補正をしなくとも、透かしの無い状態
で統計的に一定であり透かしの特徴として使用すること
が可能である。ラスタ走査の主走査方向を水平に変えて
垂直及び垂直に近い線分の太さ、水平と垂直両方を組み
合わせたもの、または黒画素領域の輪郭追跡を行って正
確な意味での線分太さ(ただし、計算量が増加する)、
局所的な輪郭特徴(輪郭線を局所的に観測したとき縦/
横/斜めといった方向毎に集計したもの)なども、透か
しの特徴として使用できる。本実施例の場合は、特徴量
を変化させるための操作として図4に示すような太め処
理(特徴量の増加)と細め処理(特徴量の減少)を用い
ている。
【0024】図5に本実施例による透かし埋め込みの結
果を示す。この例では、各行を上下左右に2等分して4
つの小区画に分割し、左上と右下の小区画をグループ
1、右下と左上の小区画をグループ2と定義している。
太め処理と細め処理は文字を構成している水平線分に対
して1画素分ずつ行った。この処理は、特徴量の差また
は比において、透かしの埋め込みを安定的に検出・確認
できる限り画素を増減させることも可能である。ただ
し、特徴量の差・比がより大きくなるような処理をすれ
ば、透かしの検出・確認の確度(安定性)は高くなる
が、逆に透かしが利用者に視覚で認識される可能性が高
くなり、透かしの性質上あまり好ましくない結果とな
る。
【0025】透かしの検出処理(図2(b)参照)で
は、埋め込み処理と同様にテキスト行矩形の同定、小区
画への分割、グルーピングを行った後、各小区画から特
徴(黒画素の数を黒画素領域の周囲長の2乗で正規化し
た値)を抽出し各グループ毎に集計する。集計値の差
(図2(b)のF−Fの値)が正の閾値より大きい
場合( F1−F2>|T|)であれば1を出力し、負の閾値
よりも小さい場合(F1−F2<−|T|)であれば0を出
力し、これら以外の場合は埋め込みなしと判定する。ま
たは、集計値の比(F1/F2)が1より十分大きい場
合は1を出力し、小さい場合は0を出力させ、これら以
外の場合は埋め込み無しと判定しても良い。
【0026】表1に各行ごとに(F−F)×10
の値を計算した結果を示す。この値は透かし埋め込み後
の画像、及び透かし無しの画像を解像度300dpiの
プリンタで紙に出力し、400dpiのスキャナで取り
込んだ画像にスキュー補正を行った後で計算したもので
ある。この例では、印刷とスキャンを経ても1/0を埋
め込んだ画像は埋め込み無しの画像に対して正負に大き
く振れた値を示す。ただし、埋め込み無しも−613〜
91の範囲に広がっており、1行分のデータに1ビット
を埋め込み安定して検出するほどの確度は無い。しか
し、表1のように平均及び標準偏差を計算してみると複
数行で1ビットを表現すれば安定した(何も埋め込まれ
ていないのに透かし有りと判定されてしまう確率が十分
低い)検出が可能であることがわかる。
【0027】
【表1】
【0028】図10(a),(b)のように、画像中のテキス
ト領域を検出する手段(12,22)とその検出されたテキス
ト領域の特徴量を操作する手段13または特徴量を抽出す
る手段23を含む装置の形態としても、本発明は実現可能
である。同様に、図11(a),(b)のように、画像中のテ
キスト領域を検出する手段(32,42)と、その検出された
画像領域を小区画に分割する手段(33,43)、その小区画
をグループに分ける手段(34,44)、及びその検出された
テキスト領域の特徴量を操作する手段35または特徴量を
抽出する手段45を含む透かし情報埋め込み装置31または
透かし情報検出装置41の形態としても、本発明は実現可
能である
【0029】上述した本発明の利点を以下にまとめる。 (1) 小区画に分割された領域における特徴量を集積
(各グループでの集積、複数行にわたる特徴量の集積)
することによって、印刷やスキャン時に加わるランダム
な特徴の変化(ノイズ)に対して頑健であり、比較的印
字品質の低い文書、染みやかすれ(ノイズ)がある文書
などにおいても、安定して透かしを埋め込み・検出する
ことができる。 (2) 特徴量は透かしの無い状態で統計的に一定であ
れば良く、水平線分の平均太さ、垂直線分の平均太さ、
またはこれらの組み合わせ等様々な特徴を使用すること
が可能であり、汎用性が非常に高い。 (3) 画像自体から検出されたテキスト行(通常は外
接矩形)を基準にすることによって、位置ずれやスキュ
ーに対して頑健な透かしを実現できる。 (4) 小区画の分割やグルーピングの仕方、どの特徴
量を使用するかを発行者だけの秘密としておけば、たと
え偽造者が透かしのアルゴリズムを知っていたり、透か
し埋め込み機能付きのプリンタを持っていても、偽造者
が同じ透かしを文書に埋め込むことはできない。 (5) 小区分の分割やグルーピングをすることによっ
て、同一文書内に異なる字体が使用された場合における
特徴量への影響を相殺し、安定した透かしの埋め込みが
可能である。
【0030】図6はコンテンツ識別の応用例として本発
明を用いた文書情報の機密管理の枠組みを示している。
図中のプリンタには透かしの埋め込み機能がファックス
とコピアには透かしの検出機能が組み込まれている。プ
リンタで印刷される際に、文書にはファックスやコピー
の許可ビットが透かしとして埋め込まれる。この文書を
コピーまたはファックスしようとすると、スキャン時に
透かし情報がチェックされ、許可ビットがオンの場合に
は処理が続行され、許可ビットがオフの場合には処理の
中止や記録(使用者や目的等)をとる等の措置が取られ
る。このように本発明によって紙の文書がコピアやファ
ックス等により不正に複製されたり流出するのを防ぐこ
とが可能となる。一般にオリジナルの紙文書は比較的厳
重に管理されておりオリジナルを外部に持ち出しても、
その文書を次に利用(閲覧)する際に不正に持ち出され
た事が発覚する可能性が高いのに対して、複製された文
書を追跡し管理することは困難である。持ち出す側にと
っては「文書を盗んだ訳ではない」という意味で心理的
障壁も低い。実際、多くの不正情報流出事件でコピアや
ファックスが使われている。本発明の提供する枠組みは
複製が作られる時点でその行為の妥当性をチェックする
ことができ、紙文書の不正な流出を防止する上で大きな
効果を持つ。
【0031】図7に本発明を用いた文書の偽造防止の枠
組みを示す。正当な文書の発行者は透かしの埋め込み機
能付きのプリンタを用いて文書を印刷し流通させる。透
かし埋め込みの対象となる文書としては、他者の行動に
影響を与えるような経済情報、証明書、チケットの類が
考えられる。透かしの内容や埋め込み時の小区画への分
割やグルーピングの仕方、特徴量の設定は発行者のみが
保持しているものとする。文書の正当性を検証する必要
が生じた場合には、ファックスやインターネット経由等
で文書イメージを発行者に送り透かしが正しく検出でき
るか否かの判定を依頼すれば良い。仮に偽造者が透かし
の埋め込みアルゴリズムを知っていたり、透かし埋め込
み機能付きのプリンタを持っていても小区画の分割やグ
ルーピングの仕方、特徴量の設定を発行者固有の秘密と
すれば、偽造者が同じ透かしを埋め込んだり検出したり
することは不可能である。
【0032】
【発明の効果】本発明では秘密通信で要求されるような
多量の情報を文書画像に埋め込むことには適さないが、
紙に出力後にスキャンしても安定して透かし情報を検出
することが可能である。従って、紙として出力された後
のコンテンツ識別や偽造防止の手段として用いることが
できる。
【図面の簡単な説明】
【図1】 透かしを利用した文書画像アプリケーション
の構成を示す図である。
【図2】 文書画像への透かし情報埋め込み/検出処理
のフローチャートを示す図である。
【図3】 テキスト行矩形の小区画への分割とグルーピ
ングを示す図である。
【図4】 特徴量(線分の太さ)の操作の例を示す図で
ある。
【図5】 埋め込み後にスキャンした画像の例を示す図
である。
【図6】 透かしによる機密文書管理を示す図である。
【図7】 透かしによる偽造の防止を示す図である。
【図8】 特徴量(線分太さ情報)の検出処理のフロー
チャートを示す図である。
【図9】 特徴量(線分太さ情報)の検出処理におい
て、主走査方向を垂直方向とするラスタ走査を示す図で
ある。
【図10】 文書画像への透かし情報埋め込み・検出装
置を示すブロック図である。
【図11】 文書画像への透かし情報埋め込み・検出装
置を示すブロック図である。
【符号の説明】
1 文書作成/管理、2 出力用画像の作成、3、6
入力デバイス、4 透かしの埋め込み、5 出力デバイ
ス、7 透かしの検出、8 チェックロジック、 1
1、31 透かし情報埋め込み装置、21、41 透か
し情報検出装置、12、22、32、42 テキスト領
域検出手段、13、35 特徴量操作手段、33、43
テキスト領域分割手段、34、44 小区画グルーピ
ング手段、23、45特徴量抽出手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−84485(JP,A) 特開 平6−324625(JP,A) 特開 平7−222000(JP,A) ”Copyright Protec tion for the Elect ronic Distribu ”Electronic Marki ng and Identificat ion Techniques (58)調査した分野(Int.Cl.7,DB名) H04N 1/387

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】テキスト情報を白黒2値文書画像として表
    現したデータ中に透かし情報を埋め込む方法であって、 画像中の埋め込み対象テキスト領域を検出する段階と、 前記埋め込み対象テキスト領域を複数の小区画に分割す
    る段階と、 前記分割した小区画を複数のグループに分ける段階と、 前記各々のグループ毎の特徴量を抽出する段階と、 埋め込む情報に応じて前記抽出された特徴量を操作する
    段階と、 前記操作した特徴量を前記各々のグループ毎に埋め込む
    段階を有する、透かし情報埋め込み方法。
  2. 【請求項2】前記特徴量を前記各々のグループ毎に埋め
    込む段階が、各々のグループに対して特徴量を多段階に
    増減させる操作を施すことを特徴とする、請求項1に記
    載の方法。
  3. 【請求項3】テキスト情報を白黒2値文書画像として表
    現したデータ中に埋め込まれた透かし情報を検出する方
    法であって、 画像中の埋め込み対象テキスト領域を検出する段階と、 前記埋め込み対象テキスト領域を複数の小区画に分割す
    る段階と、 前記分割した小区画を複数のグループに分ける段階と、 前記各々のグループ毎の特徴量を抽出する段階と、 前記抽出した特徴量に基づき埋め込まれた情報を検出す
    る段階を有する、透かし情報検出方法。
  4. 【請求項4】前記抽出した特徴量に基づき埋め込まれた
    情報を検出する段階が、前記各々のグループにおける小
    区画から検出される特徴量を集積することにより埋め込
    まれた情報を検出する段階である、請求項3に記載の方
    法。
  5. 【請求項5】特徴量が黒画素数、黒白の遷移数、特定の
    局所パターンの出現頻度、線分の平均太さのいずれか1
    つまたはその組み合わせからなる、請求項1または3に
    記載の方法。
  6. 【請求項6】透かし情報埋め込みまたは検出対象の画像
    領域がテキスト行の外接矩形である、請求項1または3
    に記載の方法。
  7. 【請求項7】前記埋め込み対象テキスト領域を複数の小
    区画に分割する段階が、埋め込み対象テキスト領域を複
    数の行に分割し、各行のそれぞれについて複数の小区画
    に分割し、各行の各々について複数のグループが混在す
    るよう小区画のグループ分けを行う段階であることを特
    徴とする、請求項1または3に記載の方法。
  8. 【請求項8】テキスト情報を白黒2値文書画像として表
    現したデータ中に透かし情報を埋め込む装置であって、 画像中の埋め込み対象テキスト領域を検出する手段と、 前記埋め込み対象テキスト領域を複数の小区画に分割す
    る手段と、 前記分割した小区画を複数のグループに分ける手段と、 前記各々のグループ毎の特徴量を抽出する手段と、 埋め込む情報に応じて前記抽出された特徴量を操作する
    手段と、 前記操作した特徴量を前記各々のグループ毎に埋め込む
    手段を有する、透かし情報埋め込み装置。
  9. 【請求項9】前記特徴量を前記各々のグループ毎に埋め
    込む手段が、各々のグループに対して特徴量を多段階に
    増減させる操作を施すことを特徴とする、請求項8に記
    載の装置。
  10. 【請求項10】テキスト情報を白黒2値文書画像として
    表現したデータ中に埋め込まれた透かし情報を検出する
    装置であって、 画像中の埋め込み対象テキスト領域を検出する手段と、 前記埋め込み対象テキスト領域を複数の小区画に分割す
    る手段と、 前記分割した小区画を複数のグループに分ける手段と、 前記各々のグループ毎の特徴量を抽出する手段と、 前記抽出した特徴量に基づき埋め込まれた情報を検出す
    る手段を有する、透かし情報検出装置。
  11. 【請求項11】前記抽出した特徴量に基づき埋め込まれ
    た情報を検出する手段が、前記各々のグループにおける
    小区画から検出される特徴量を集積することにより埋め
    込まれた情報を検出する手段である、請求項10に記載
    の装置。
  12. 【請求項12】特徴量が黒画素数、黒白の遷移数、特定
    の局所パターンの出現頻度、線分の平均太さのいずれか
    1つまたはその組み合わせからなる、請求項8または1
    0に記載の装置。
  13. 【請求項13】前記埋め込み対象テキスト領域を複数の
    小区画に分割する手段が、埋め込み対象テキスト領域を
    複数の行に分割し、各行のそれぞれについて複数の小区
    画に分割し、各行の各々について複数のグループが混在
    するよう小区画のグループ分けを行う手段であることを
    特徴とする、請求項8または10に記載の装置。
JP22349099A 1999-08-06 1999-08-06 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置 Expired - Fee Related JP3373811B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP22349099A JP3373811B2 (ja) 1999-08-06 1999-08-06 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
US09/621,567 US6983056B1 (en) 1999-08-06 2000-07-21 Method and device for embedding and detecting watermarking information into a black and white binary document image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22349099A JP3373811B2 (ja) 1999-08-06 1999-08-06 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置

Publications (2)

Publication Number Publication Date
JP2001078006A JP2001078006A (ja) 2001-03-23
JP3373811B2 true JP3373811B2 (ja) 2003-02-04

Family

ID=16798964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22349099A Expired - Fee Related JP3373811B2 (ja) 1999-08-06 1999-08-06 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置

Country Status (2)

Country Link
US (1) US6983056B1 (ja)
JP (1) JP3373811B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8411313B2 (en) 2007-09-14 2013-04-02 Ricoh Company, Limited Image forming apparatus and image reading method for reading an untargeted page of an original

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002344736A (ja) 2001-05-21 2002-11-29 Oki Electric Ind Co Ltd プリント紙の原本保証システム,プリンタ装置,および,検証装置
US20030042399A1 (en) * 2001-06-19 2003-03-06 Umax Data Systems Inc. Calibration method of an image-capture apparatus
KR100403204B1 (ko) * 2001-07-11 2003-10-23 주식회사 마크애니 이진화 문서에 대한 워터마크 삽입 및 검출 방법과 그 장치
US7039215B2 (en) 2001-07-18 2006-05-02 Oki Electric Industry Co., Ltd. Watermark information embedment device and watermark information detection device
JP2003259112A (ja) * 2001-12-25 2003-09-12 Canon Inc 透かし情報抽出装置及びその制御方法
KR100469999B1 (ko) * 2002-03-19 2005-02-05 주식회사 실트로닉 영상의 해쉬 값을 이용한 이진 정지 영상 인증용 워터마킹방법 및 장치
US7085399B2 (en) 2002-06-18 2006-08-01 Oki Electric Industry Co., Ltd. Watermark information embedding device and watermark information detection device
JP2004104494A (ja) * 2002-09-10 2004-04-02 Canon Inc 電子透かし埋め込み装置及びその制御方法
JP4277800B2 (ja) 2003-04-25 2009-06-10 沖電気工業株式会社 透かし情報検出方法
US7245740B2 (en) 2003-07-01 2007-07-17 Oki Electric Industry Co., Ltd. Electronic watermark embedding device, electronic watermark detection device, electronic watermark embedding method, and electronic watermark detection method
GB2404296A (en) * 2003-07-23 2005-01-26 Sony Uk Ltd Data content identification using watermarks as distinct codes
JP4298588B2 (ja) 2004-05-31 2009-07-22 株式会社リコー 情報検出装置および情報検出方法
WO2006053023A2 (en) 2004-11-09 2006-05-18 Digimarc Corporation Authenticating identification and security documents
JP4170318B2 (ja) * 2005-07-12 2008-10-22 シャープ株式会社 画像形成装置、制御方法、制御プログラム、および、コンピュータ読取り可能な記録媒体
JP2007060467A (ja) * 2005-08-26 2007-03-08 Fuji Xerox Co Ltd インターネットファクシミリ中継装置、プログラム、方法、ファクシミリ受信装置
JP4510092B2 (ja) 2005-10-25 2010-07-21 富士通株式会社 電子透かしの埋め込み及び検出
JP4620741B2 (ja) 2005-10-25 2011-01-26 富士通株式会社 印刷画像生成プログラムおよびその記録媒体並びに印刷画像生成方法
JP4449921B2 (ja) * 2006-02-23 2010-04-14 村田機械株式会社 ファクシミリ装置およびクライアント端末
ATE457111T1 (de) * 2006-03-13 2010-02-15 Fraunhofer Ges Forschung Robustes digitales wasserzeichen für vektorschriften
JP4123282B2 (ja) * 2006-03-14 2008-07-23 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置、画像形成装置の制御方法、および画像形成装置の制御プログラム
JP4082432B2 (ja) * 2006-03-15 2008-04-30 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置、画像形成装置の制御方法、および画像形成装置の制御プログラム
EP1840777A1 (de) * 2006-03-27 2007-10-03 Mediasec Technologies GmbH Verfahren zur Einbringung einer digitalen Markierung in ein digitales Dokument
JP4904911B2 (ja) * 2006-05-11 2012-03-28 富士ゼロックス株式会社 画像処理装置及びその制御方法
JP5015540B2 (ja) 2006-09-28 2012-08-29 富士通株式会社 電子透かし埋め込み装置および検出装置
JP5103479B2 (ja) * 2006-10-18 2012-12-19 デスティニー ソフトウェア プロダクションズ インコーポレイテッド メディアデータに電子透かしを付与する方法
US8064636B2 (en) * 2007-05-31 2011-11-22 Canon Kabushiki Kaisha Image processing apparatus and method of controlling the same
US8059859B2 (en) * 2007-05-31 2011-11-15 Canon Kabushiki Kaisha Image processing apparatus and method of controlling the same
US20080307233A1 (en) * 2007-06-09 2008-12-11 Bank Of America Corporation Encoded Data Security Mechanism
JP4837101B2 (ja) 2007-08-31 2011-12-14 富士通株式会社 電子透かし埋め込み装置、電子透かし検出装置およびプログラム
CN101122995B (zh) * 2007-09-11 2010-10-13 北京大学 二值图像中数字水印的嵌入、提取方法和装置
JP2009076957A (ja) * 2007-09-18 2009-04-09 Panasonic Electric Works Co Ltd 撮像装置
US7974437B2 (en) * 2007-11-19 2011-07-05 Seiko Epson Corporation Identifying steganographic data in an image
US8081823B2 (en) * 2007-11-20 2011-12-20 Seiko Epson Corporation Segmenting a string using similarity values
US8031905B2 (en) * 2007-11-21 2011-10-04 Seiko Epson Corporation Extracting data from images
US8243981B2 (en) * 2007-11-26 2012-08-14 Seiko Epson Corporation Identifying embedded data in an image
US8009862B2 (en) * 2007-11-27 2011-08-30 Seiko Epson Corporation Embedding data in images
JP4973540B2 (ja) * 2008-02-21 2012-07-11 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4587058B2 (ja) * 2008-09-10 2010-11-24 富士ゼロックス株式会社 画像処理装置、画像処理システム及びプログラム
US8289574B2 (en) * 2009-09-02 2012-10-16 Xerox Corporation Method and system for controlling darkening of image data
EP2614486B1 (en) * 2010-09-06 2015-07-01 Anteleon Imaging S.a.r.l. Method for marking graphical elements and method for detecting said marking in a graphical element
CN102567938B (zh) * 2010-12-23 2014-05-14 北大方正集团有限公司 用于西文水印处理的水印图像分块方法和装置
CN103138926B (zh) * 2011-11-30 2016-01-13 中国电信股份有限公司 水印签名方法与装置
CN111005260A (zh) * 2019-11-25 2020-04-14 广东侨盛防伪材料有限公司 一种黑水印纸及其制作方法
CN111445376B (zh) * 2020-03-24 2023-08-18 五八有限公司 视频水印的检测方法、装置、电子设备和存储介质
CN111767787B (zh) * 2020-05-12 2023-07-18 北京奇艺世纪科技有限公司 身份证图像的正反面判断方法、装置、设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0629972A3 (en) 1993-04-23 1995-05-24 Hewlett Packard Co Method and device for embedding identification codes in printed documents.
JPH0784485A (ja) 1993-05-31 1995-03-31 Canon Inc 画像形成システム
US6086706A (en) * 1993-12-20 2000-07-11 Lucent Technologies Inc. Document copying deterrent method
US5530759A (en) 1995-02-01 1996-06-25 International Business Machines Corporation Color correct digital watermarking of images
US5761686A (en) * 1996-06-27 1998-06-02 Xerox Corporation Embedding encoded information in an iconic version of a text image
US5825892A (en) 1996-10-28 1998-10-20 International Business Machines Corporation Protecting images with an image watermark
JP3008908B2 (ja) * 1997-11-10 2000-02-14 日本電気株式会社 文字切り出し装置および文字切り出し方式
GB9809679D0 (en) * 1998-05-06 1998-07-01 Xerox Corp Portable text capturing method and device therefor
JP3592545B2 (ja) * 1998-08-07 2004-11-24 株式会社リコー 画像処理装置および画像処理方法および情報記録媒体
US6456393B1 (en) * 1998-08-18 2002-09-24 Seiko Epson Corporation Information embedding in document copies
JP2000099501A (ja) * 1998-09-17 2000-04-07 Internatl Business Mach Corp <Ibm> 文書データへの情報の埋め込み方法およびシステム
US6753977B2 (en) * 2001-01-31 2004-06-22 Hewlett-Packard Development Company, L.P. Machine-readable information embedded on a document

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Copyright Protection for the Electronic Distribu
"Electronic Marking and Identification Techniques

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8411313B2 (en) 2007-09-14 2013-04-02 Ricoh Company, Limited Image forming apparatus and image reading method for reading an untargeted page of an original

Also Published As

Publication number Publication date
JP2001078006A (ja) 2001-03-23
US6983056B1 (en) 2006-01-03

Similar Documents

Publication Publication Date Title
JP3373811B2 (ja) 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
Wu et al. Data hiding in binary image for authentication and annotation
Wu et al. Data hiding in digital binary image
US7227661B2 (en) Image generating method, device and program, and illicit copying prevention system
JP4071261B2 (ja) ディジタル透かしを用いた方法及びシステム
EP1209897B1 (en) Systems and method for policy based printing and forgery detection
US6970259B1 (en) Systems and methods for forgery detection and deterrence of printed documents
Zhu et al. Print signatures for document authentication
EP1591953A1 (en) System and method for decoding digital encoded images
US6978035B2 (en) Information hiding system, method, and printed matter into which information is hidden
US8335342B2 (en) Protecting printed items intended for public exchange with information embedded in blank document borders
US20070003341A1 (en) Image processing device, image processing method, program, and recording medium
WO2002065381A1 (en) Document printed with graphical symbols which encode information
KR20000048145A (ko) 티켓발행방법, 티켓발행시스템 및 티켓조합방법
US6636614B1 (en) Method for preventing the falsification of documents comprising a photograph, preferably a facial-view photograph
WO2007025423A1 (fr) Procede empechant la copie d&#39;un document
JP2006245980A (ja) 画像処理方法、改ざん検出方法、画像処理装置、改ざん検出装置、画像処理プログラム、改ざん検出プログラムおよび記録媒体
JP2001126046A (ja) Icカード、icカード認証システム、及びその認証方法
US8038073B2 (en) Tamper detection of documents using encoded dots
CN101344748B (zh) 具有复印防止功能的复印装置及其复印防止方法
JP3818177B2 (ja) 付加情報埋め込み方法および画像処理システム並びに付加情報埋め込みプログラム
Song et al. Digital watermarking for forgery detection in printed materials
Chen et al. Data hiding in document images
CN112616311B (zh) 防伪用印刷品及其制造方法
JP2000079782A (ja) 個人識別情報作成装置及び個人識別情報読み取り装置からなる個人識別情報システム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071122

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121122

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees