JP2002269075A - 文章への情報の埋め込み、復号 - Google Patents

文章への情報の埋め込み、復号

Info

Publication number
JP2002269075A
JP2002269075A JP2001071565A JP2001071565A JP2002269075A JP 2002269075 A JP2002269075 A JP 2002269075A JP 2001071565 A JP2001071565 A JP 2001071565A JP 2001071565 A JP2001071565 A JP 2001071565A JP 2002269075 A JP2002269075 A JP 2002269075A
Authority
JP
Japan
Prior art keywords
information
word
text
data
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001071565A
Other languages
English (en)
Inventor
Kazuyoshi Nagaho
和義 長保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2001071565A priority Critical patent/JP2002269075A/ja
Publication of JP2002269075A publication Critical patent/JP2002269075A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 デジタル化された通常の文章中に異なる情報
を埋め込み、その情報を復号することで、秘密情報の伝
達を秘密裏に行う。 【解決手段】 任意の文章(原文)を構成している文章
中にある同じ概念を表す単語及び/または表記によって
書き換えられ得る文言を、互いに共有している辞書デー
タベースに従って基本単語に書き換えて標準化文章を作
成する(ステップS110)。埋め込もうとするデータ
をバイナリコード化したデータ列に従って、標準化文章
の文頭から順に0なら基本単語、1なら基本単語以外に
書き換える暗号化処理を行なう(ステップS130)。
従って、暗号化文章は、一見したときには原文と何ら変
わらない、ごく自然な文章として生成される。この暗号
化文章は、標準化文章との差を上述のアルゴリズムとは
逆のアルゴリズムにより復号することで、埋め込まれた
データを再現することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、任意のデジタル化
された文章に所望の情報を埋め込む情報埋め込み技術及
びその埋め込まれた情報を復号する情報復号技術に関す
る。
【0002】
【従来の技術】ワードプロセッサや文字読み取り装置の
進歩により、日記や手紙などの個人的な文章、契約書な
どの業務用の文章あるいは論文や小説などの専門的な文
章までがデジタル化されている。また、インターネット
などの情報配信技術の飛躍的な向上により、デジタル化
された文章を瞬時に世界中へ配信したり、公衆に開示す
ることが可能となっている。
【0003】一方、デジタル化された文章は、容易に複
製したり、その一部分のみを変更、削除するなどの編集
も簡単に行なうことができる。この様にデジタル化され
た文章は、紙に記述された文字による文章と異なり、利
用者の発想によって無限の利用形態が考えられるように
なっている。この様な多様な利用形態は、時にはそのデ
ジタル化された文章の正当な権利者にとって不測の不利
益をもたらすことも考えられる。そこで、デジタル化さ
れた文章に限らず、画像やデータなどのデジタル情報の
保護技術開発が行なわれている。例えば、この種の保護
技術としては、インターネットで秘密情報を送受信する
際の暗号化技術、デジタル著作物に著作権情報などを埋
め込む電子透かし技術などが知られている。これらの情
報保護の技術によれば、デジタル化された文章は、暗号
キーを用いなければ意味のない文字列としてしか認識す
ることができず、正当な権利者による許可が無い限りに
おいて、デジタル化された文章の利用を制限することが
できる。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
デジタル化された文章の暗号化技術や電子透かし技術
は、次のような課題が未解決であった。従来の暗号化の
技術などは、デジタル化された文章を意味のない文字列
に変換して配布するため、その保護された文章は暗号キ
ーを用いて復元しなければ何の意味も有しておらず、そ
の文章を安心して配信、開示することが可能となる。
【0005】反面、第三者には、意味のない文字列をイ
ンターネット上など発見したとき、その文字列は暗号化
された文章であり、その文字列には暗号化するほどに重
要な何らかの情報が隠されていることを容易に知ること
ができる。従って、これらの暗号化された文字列は、い
わゆるハッカーなどの恰好のターゲットとなり、暗号が
解読される危険性に曝されることとなる。また、意味の
ない文字列が暗号化された文章であると直ぐに判明する
ため、例えば仲間と秘密の連絡が取りたい場合などであ
っても、暗号化された文章でやり取りをしている事実が
第三者に容易に分かってしまう。
【0006】他方、電子透かしは、やり取りするデータ
自体は暗号化されていないので、上記の問題は生じな
い。しかし、通常電子透かしは、人間の視聴覚では判読
できない形態で、オリジナルのデータに埋め込まれるの
で、画像や音楽のように冗長性の高い情報には、容易か
つかなりの量のデータを埋め込むことができるものの、
テキストデータ、特に何ら装飾されていないプレーンな
テキストデータには、情報を埋め込むことが困難であっ
た。文字コードは、例えば日本語であれば1文字が2バ
イト(16ビット)で表現されるが、どの1ビットを変
更しても異なる文字コードに該当することになり、1文
字=16ビットという制約を守って、何らかの情報をこ
こに埋め込むことはできない。
【0007】本発明は、上記した問題点を解決するため
になされたものであり、デジタル化された通常の文章中
に異なる情報を埋め込み、その情報を再現することで、
秘密情報の伝達を秘密裏に行なうことができる優れた情
報埋め込み技術および情報再現技術を提供することを目
的とする。
【0008】
【課題を解決するための手段およびその作用・効果】上
記目的を達成するために本発明の原理的な発明として、
まず情報の取扱方法について説明する。すなわち、本発
明の情報の取扱方法は、デジタル化された文章に所望の
情報を埋め込み、復号する情報の取扱方法であって、所
定の規定に基づき、異なる単語及び/または表記であり
ながらも同じ概念を表す単語及び/または表記によっ
て、前記文章を標準文章に書き換える標準化工程と、前
記標準化の工程で書き換えの対象となった単語及び/ま
たは表記に関し、前記所望の情報に対応したデータに従
って、前記同じ概念を表す単語及び/または表記のいず
れを用いるかを決定し、前記文章を書き換えて該データ
を埋め込む埋込工程と、当該工程によってデータが埋め
込まれた暗号化文章を受け取り、前記所定の規則に基づ
いて、該暗号化文章の書き換えられた単語及び/または
表記を抽出する抽出工程と、該抽出した単語及び/また
は表記に基づいて、前記埋め込まれたデータを復号する
復号工程とを備えたことを要旨とする。
【0009】かかる情報の取扱方法によれば、デジタル
化された文章に対してこれを標準化する処理を行ない、
この標準化の際に、埋め込もうとする情報に対応したデ
ータに従って、標準化に用いられた同じ概念を表わす単
語及び/または表記のうちのいずれを用いるかを決定
し、これに従って、文章を書き換えることで、データを
文章に埋め込み、暗号化文章を生成する。この暗号化さ
れた文章を復号する場合には、暗号化文書から、所定の
規則に基づいて、書き換えられた単語及び/または表記
を抽出し、ここから埋め込まれたデータを復号する。
【0010】即ち、本発明の情報の取扱方法によれば、
デジタル化された文章において、データ自体ではなく、
異なる単語及び/または表記を標準化する部分に冗長性
を持たせ、ここに所望の情報に対応したデータを埋め込
んでいる。このため、テキストデータのような冗長性が
ほとんどないと考えられていた情報に、他の情報を埋め
込むことができる。しかも、この場合、デジタル化され
た文章はそのまま読み取ることができるので、データが
埋め込まれていること自体が外見からは分からないと言
う利点が得られる。
【0011】かかる方法に対応した本発明の情報埋込装
置は、デジタル化された文章に所望の情報を埋め込む情
報埋め込み装置であって、所定の規定に基づき、異なる
単語及び/または表記でありながらも同じ概念を表す単
語及び/または表記によって、前記文章を標準文章に書
き換える標準化手段と、前記標準化の工程で書き換えの
対象となった単語及び/または表記に関し、前記所望の
情報に対応したデータに従って、前記同じ概念を表す単
語及び/または表記のいずれを用いるかを決定し、前記
文章を書き換えて該データを埋め込んだ暗号化文章を生
成する埋込手段とを備えることを要旨としている。
【0012】これにより本発明の情報埋込装置は、デジ
タル化された文章を、その文章を構成している文言と同
じ概念を表す単語及び/または表記によって書き換える
ことで暗号化文章を生成することができる。従って暗号
化文章は、一見したときには当初の文章と何ら変わらな
い、ごく自然な文章として生成される。従って、他のデ
ータが埋め込まれていること自体が、外見からは分から
ないと言う利点を有する。
【0013】この暗号化文章は、当初の文章を構成して
いる単語及び/または表記を一旦標準文章に書き換えて
標準化し、この標準文章を、データと所定の規則とによ
って書き換えたものである。従って、暗号化文章と標準
文章との差を前記所定の規則の逆のアルゴリズムにより
検出することで、暗号化文章に埋め込まれたデータを、
容易に抽出することができる。そして、この抽出された
コードから、埋め込まれた所望の情報を再現することが
可能となる。かかる本発明の情報埋込装置は、例えば、
暗号送信用として、著作権情報や情報配信者を特定する
情報を埋め込む電子透かしとしてなど、幅広い応用が考
えられる。
【0014】ここで、標準化手段及び埋込手段は、単語
及び/または表記の書き換えのための所定の規則とし
て、同一の辞書データベースを利用することが好まし
い。なお、辞書データベースとは、例えば特開平1−2
73171号公報、特開平10−240743号公報、
特開平6−301718、特開昭62−17872号公
報に開示されるように、単語や表記の不確定さに起因す
る文章の多様さを一定の表現に変化させるために利用さ
れる各種技術が利用可能である。いわゆるシソーラスや
類義語辞書などを利用することもできるし、日本語にお
ける表記のゆれ、例えば「書換」と「書き換え」などの
表記のゆれや、「エネルギ」と「エネルギー」といった
長音記号の扱いのゆれなどを利用することも可能であ
る。この様な辞書データベースは、より自然な文章作成
のためには複雑で大容量となる傾向にあるため、標準化
手段及び埋込手段で同一の辞書データベースを利用する
ことで、情報埋込装置を小型、安価に構成し、また処理
速度を向上させることができる。
【0015】また辞書データベースは、書き換えの候補
として文字、単語、文節の段階を有することが好まし
い。同じ概念を表す単語及び/または表記への書き換え
は、全角カタカナから半角カタカナなどのような単なる
文字の書き換え、類義語による単語の書き換え、文章の
解析による文節の書き換えの順に処理が複雑となり、か
つ、その書き換えによる概念の微妙な差異が発生する。
従って、辞書データベースが文字、単語、文節の段階を
備えるようにして構成することで、埋め込む情報量に応
じて文字のレベルから文節のレベルにまで段階的に書き
換えが有効となるようにすることで、より高速な処理
で、かつ、概念の変化を少なくして情報を埋め込むこと
が可能となる。
【0016】更に辞書データベースは、任意のデータの
使用禁止及び/またはデータ変更を可能に構成すること
がより好ましい。この様にして辞書データベースのカス
タマイズを行なった情報埋込装置は、そのカスタマイズ
を行なった辞書データベースと同じ規則性を有した者に
しか再現することができない情報の埋め込みを行なうこ
とができ、埋め込まれた情報の秘密性を一層向上させる
ことができる。
【0017】なお、標準化手段は、デジタル化された文
章を標準文章に書き換えるに際して、デジタル化された
文章と標準文章との差分に基づく差分データを生成する
差分データ生成部を備える構成としても良い。この様な
差分データは、暗号化文章から当初のデジタル化された
文章を再現するために利用することができる。
【0018】以上説明した情報埋込装置は、完成した装
置としてばかりではなく、その処理のアルゴリズムであ
る処理方法としても有意義である。すなわち、他の発明
としての情報埋め込み方法は、デジタル化された文章に
所望の情報を埋め込む情報埋込方法であって、所定の規
定に基づき、異なる単語及び/または表記でありながら
も同じ概念を表す単語及び/または表記によって、前記
文章を標準文章に書き換える標準化工程と、前記標準化
の工程で書き換えの対象となった単語及び/または表記
に関し、前記所望の情報に対応したデータに従って、前
記同じ概念を表す単語及び/または表記のうちのいずれ
を用いるかを決定し、前記文章を書き換えて該データを
埋め込む埋込工程とを備えることを要旨としている。
【0019】この方法の発明によっても、上記情報埋込
装置と同じ作用、効果を奏することができることは明白
である。また、この方法の発明による処理方法をコンピ
ュータにて実現させるため、この方法をコンピュータに
実行させるプログラムとして構成し、そのプログラムを
インターネットなどで配信したり、CD−ROMやフロ
ッピー(登録商標)ディスクなどの記録媒体に記録して
配布してもよい。
【0020】以上説明した情報埋込装置、その方法やプ
ログラムによって所望の情報が埋め込まれた暗号化文章
は、他の発明である情報再現装置によって以下のように
解析され、埋め込まれた所望の情報を簡単に再現するこ
とができる。すなわち、他の発明である情報復号装置
は、請求項1記載の情報埋込装置によって得られた暗号
化文章から前記所望の情報に対応したデータを復号する
情報復号装置であって、前記所定の規則に基づいて、前
記暗号化文章の書き換えられた単語及び/または表記を
抽出する抽出手段と、該抽出した単語及び/または表記
に基づいて、前記埋め込まれたデータを復号する復号手
段とを備えることを要旨としている。
【0021】本発明における抽出手段は、所定の規則に
基づいて、暗号化文章の書き換えられた単語及び/また
は表記を抽出する。そして、復号手段は、この抽出手段
により抽出した単語及び/または表記に基づいて埋め込
まれたデータを復号するのである。
【0022】これにより本発明の情報再現装置は、デジ
タル化された通常の文章である暗号化文章に埋め込まれ
た所望のデータを再現することができるため、暗号化文
章を介して所望のデータの受け取りを秘密裏に行なうこ
とができる。従って、所望の情報を埋め込んだ暗号化文
章を受け取るに当たって、第三者には暗号化文章の受け
取りそのもののに意味があるかのように思え、秘密の通
信を行なっている痕跡を残さずに所望の情報を受け取る
ことができる。このため、いたずらにデータが埋め込ま
れていこと自体を教えることがなく、秘密保持の信頼性
を高めることができる。
【0023】この様に優れた効果を発揮する本発明の情
報再現装置は、上記の情報埋込装置と一対となって、例
えば、暗号送信用として、著作権情報や情報配信者を特
定する情報を埋め込む電子透かしとしてなど、幅広い応
用が考えられる。
【0024】ここで、抽出手段は、書き換えられた単語
及び/または表記を抽出するための所定の規則として、
上述した標準化手段及び埋込手段と同一の辞書データベ
ースを利用することが望ましい。予め定められた辞書デ
ータベースを利用することで、情報の再現精度が飛躍的
に向上するからである。また、この辞書データベースが
カスタマイズされたものである場合には、同様なアルゴ
リズムを有する情報埋込装置や情報再現装置であっても
所望の情報を再現することは不可能であり、情報の秘密
保持性能が一段と向上する。
【0025】
【発明の実施の形態】以上説明した本発明の構成及び作
用を一層明らかにするために、以下本発明の実施の形態
を実施例を通して説明する。 (1)実施例の構成:図1は、本発明の実施例である情
報埋込方法及び情報復号方法を具現化するプログラム
が、インターネットのようなネットワーク10に接続さ
れたコンピュータ20,30にインストールされている
例を示している。また、多数のその他のコンピュータ4
0は、ネットワーク10に接続されている不特定の利用
者のものであり、コンピュータ20は、これらの多数の
コンピュータ30,40の利用者との間で、メールなど
のテキストデータのやり取りを行なっている。こうした
コンピュータ40の中には、ネットワーク10上を行き
交っている情報を不正に入手しようとする悪意の利用者
も含まれている。なお、本実施例では、以下のような例
を説明する。まず、コンピュータ20にてデジタル化さ
れた文章(テキストデータ)に情報の埋め込みを行なっ
た後に、その文章をネットワーク10を通じて他のコン
ピュータ30へメール送信する。次いで、そのメールを
受け取ったコンピュータ30では、メールの文章からコ
ンピュータ20にて埋め込まれた情報を再現する。
【0026】コンピュータ20,30の内部構成を図2
に示した。この図では、コンピュータ20を例として取
り上げた。コンピュータ20は、モデムやルータ18を
介してネットワーク10とのデータのやり取りを制御す
るネットワークインタフェース(NT−I/F)21、
処理を行なうCPU22、処理プログラムや固定的なデ
ータを記憶するROM23、ワークエリアとしてのRA
M24、時間を管理するタイマ25、モニタ29への表
示を司る表示回路26、後述する各種のデータを蓄積す
るハードディスク(HD)27、キーボード11やマウ
ス12とのインタフェースを司る入力インタフェース
(I/F)28等を備える。なお、ハードディスク27
は、固定式のものとして記載したが、着脱式のものでも
良いし、着脱式の記憶装置(他とえ゛はCD−ROM、
CD−R、CD−RW、DVD、フレキシブルディスク
など)を併用することも可能である。また、この実施例
では、コンピュータ20の処理プログラムは、ROM2
3内に記憶されているものとしたが、ハードディスク2
7に記憶しておき、起動時にRAM24上に展開して実
行するものとしても良い。あるいは、上述した着脱式の
記録媒体から読み込むものとしても良い。更には、ネッ
トワーク10を介して、他のサーバから読み込んで実行
するものとしても良い。
【0027】図1に示したコンピュータ20では、使用
者は、キーボード11から入力した文書(テキストデー
タ)や、ネットワーク10を介して外部から取り込んだ
テキストデータを編集し、最終的にはハードディスク2
7に格納する。その上で、これをメールに添付書類とし
て添付し、他のコンピュータ30の使用者に、ネットワ
ーク10を介して送信する。
【0028】本実施例では、コンピュータ20,30
は、そのハードディスク27に、かな漢字変換用の辞書
の他に、文書の標準化を行なうための辞書データベース
DDBを記憶している。図3は、この辞書データベース
のデータ例の説明図である。図示するように辞書データ
ベースは、異なる単語や表記でありながらも同じ概念を
表す単語や表記、いわゆる表記のゆれのデータを集積し
たものであり、いわゆる標準化用の辞書である。コンピ
ュータ20は、作成され、ハードディスク27に記憶さ
れた文章に対して、次の4つのレベルの標準化を行な
う。 文字の標準化処理(予め定めた文字に置き換える文字
の標準化)、文字レベルの表記のゆれであり、カタカナ
語尾の長音の有無、カタカナ全角/半角といった全く概
念に変化のない表記のゆれを統一するのである。 表記の統一処理(表記のゆれを予め定めた表記に統一
する処理)、単語レベルの表記のゆれであり、ほとんど
意味の異ならない複数漢字表記などを統一するのであ
る。 自立語処理(自立語を、予め定めた置き換えの基準に
従って、他の自立語に置き換える処理)、自立語の表記
のゆれであり、わずかに意味の異なることがある単語間
の入れ替えを行なって、使用する自立語を統一するので
ある。 付属語処理(付属語を、所定の規則に従って他の付属
語に置き換える処理)文節レベルの表記のゆれを統一す
るものであり、冗長な文末と体言止め、くだけた表現と
通常の表現、受け身表現と受け身語などを一方に統一す
るのである。
【0029】なお、この第4の付属語処理(文節レベル
の表記のゆれの処理)は、文章の多様さを一定の表現に
変化させるために利用される、いわゆる文章の標準化技
術などにより、前後の文章や単語の用法などを加味して
行なわれるものであって、辞書データベースのデータの
一部であることの説明のために図3に一例を示してい
る。
【0030】コンピュータ20では、図4のフローチャ
ート示すような情報埋め込みプログラムが実行され、任
意のデジタル文章に所望の情報を埋め込む。この情報埋
め込みプログラムが実行されると、まず情報を埋め込む
対象となるデジタル文章(以下、単に原文という)の特
定処理(ステップS100)が行なわれ、コンピュータ
20の利用者に原文を特定するように催促する。原文
は、ハードディスク27に記憶された文書により特定し
ても良いし、電子メールなどで作成し、一旦メールソフ
ト内で保存した文書として特定しても良い。図5は、こ
の特定処理(ステップS100)にてコンピュータ20
の利用者が特定した原文の一例である。
【0031】こうして原文が特定されると、次にその原
文の文章中に存在する表現のゆれを特定し、標準化する
標準化処理(ステップS110)が実行される。図6
は、この標準化処理の実行時にコンピュータ20に表示
される表示画面である。図示するように、標準化処理に
は文字レベル、単語レベル、文節レベルのどのレベルで
行なうかを指定するチェックボックスRB1、後述する
差分データを作成するか否かを選択するラジオボタンR
B2と、標準化の実行,キャンセルを指示するボタンB
B3,BB4が用意されている。本実施例では、図6に
示すように標準化レベルとして単語レベルが、差分デー
タでは作成するが選択され、実行ボタンBB3がクリッ
クされた場合について説明する。
【0032】標準化レベルが単語レベルであるときは、
図5に示した原文の文章中から辞書データベースの文字
レベルと単語レベルで定義されている表記のゆれが検索
され、その検索結果を総て基本単語に置き換える標準化
処理が実行される。従って、本実施例では、原文は図7
に示すような文章に書き換えられることとなる。なお、
図7は、原文の文章中に存在する表記のゆれについ
て()を、また基本単語に置き換えられた表記のゆれに
ついて[]を付している。この標準化処理(ステップS
110)により、原文は辞書データベースの基本単語を
用いた文章(以下、標準化文章という)に書き換えられ
る。
【0033】また、差分データの作成が選択されている
ときには、図7に(),[]で示したそれぞれの表記の
ゆれに対して、()には0を,[]には1を割り当てた
データ列が作成される。従って図7に示した例では、そ
のデータ列は「010000000000001」とな
る。そして、このデータ列を先頭から8ずつに区分し、
8ビットのASCIIコードの2進表記の文字表現した
ものが差分データとして決定される。なお、データ列が
8の倍数でないときは、0のデータを追加して8の倍数
となるように末尾で調整する。従って本実施例の場合の
差分データは、「01000000b」(「b」はバイ
ナリデータを示す)と「00000010b」の2バイ
トのデータとなる。なお、このバイナリコードは、AS
CIIコードに変換すると、「@」「SX」(制御コー
ド)に相当する。
【0034】こうして原文の標準化処理(ステップS1
10)が終了して標準化文章と差分データが用意される
と、次に埋め込む情報をコンピュータ20の利用者に催
促する埋め込み情報の特定処理(ステップS120)が
行なわれる。この処理では、予め埋め込む情報が記述さ
れた電子ファイルを特定したり、あるいはコンピュータ
20のキーボード11から直接情報をキー入力するなど
の方法により、埋め込もうとするデータを特定する。以
下、本実施例では、埋め込むデータとしてキーボードか
らキャラクタ「A」(半角)が入力された場合について
説明する。
【0035】キーボード11からデータが入力される
と、これを受けて暗号化処理(ステップS130)が実
行される。この暗号化処理では、埋め込む情報が半角の
「A」であるとすると、そのASCIIコード「41」
をバイナリデータ「01000001b」に変換し、こ
のビット列に従い、図7に(),[]で示した標準化の
実行箇所について、データ列の順番に文頭から0ならば
基本文字のまま、1ならば基本文字以外の同義語などに
書き換える処理を行なう。すなわち、(),[]で示し
た表記のゆれの文頭から2番目と8番目の文字「御社」
「工員」を基本文字とは異なる「貴社」「職工」に書き
換え、図8に示すような文章(以下、暗号化文章とい
う)を作成するのである。
【0036】続いて、差分データを出力する処理を行な
う(ステップS140)。この差分データは、原文と標
準化された文章との差分を、同様に「0」「1」のビッ
ト列に変換したものである。本実施例では、差分データ
は、暗号化文章に付属する形態で出力するものとした
が、暗号化文章とは異なるファイルとして出力するもの
としても良い。
【0037】こうして、コンピュータ20の利用者は、
データ「A」が埋め込まれた暗号化文章を得ることがで
き、その暗号化文章をメールとしてコンピュータ30へ
送信する。なお、この時、メールに差分データを添付し
たり、あるいは差分データも埋め込み情報として暗号化
文章に含ませて送信することもできる。
【0038】以上説明した本実施例の暗号化処理によれ
ば、通常のテキストデータに、これとは異なるデータを
重畳し、埋め込むことができる。即ち、テキストデータ
の標準化という作業により得られた冗長性を巧みに利用
して、ここに他のデータを埋め込んでいるのである。し
かも、こうして得られた暗号化文章は、通常のテキスト
と同様に読み取ることができるから、他人に暗号文であ
ると悟られるおそれがない。更に、文章を構成する単語
や表記を異ならせることでデータを埋め込んでいるの
で、得られた暗号化文章は、読めばそのまま意味を通じ
ることができる。
【0039】次に、コンピュータ30にて暗号化文章か
ら情報「A」を再現する情報復号プログラムについて説
明する。図9は、コンピュータ30にて実行される情報
復号プログラムのフローチャートである。このプログラ
ムが実行されると、コンピュータ30は、情報復号の要
領を決定する復号要領決定処理(ステップS200)を
実行する。図10は、この復号要領決定処理の実行時に
コンピュータ30のモニタ29に表示される表示画面で
ある。図示するように、暗号解読を、文字レベル、表記
のゆれレベル、自立語レベル、付属語(文節)レベルの
うち、どれとどれを用いて行なうかを指定するためのチ
ェックボックスRB11、差分データの有無を指定する
ラジオボタンRB12と、解読の実行,キャンセルを指
示するボタンBB13,BB14が用意されている。本
実施例では、コンピュータ20の利用者から単語レベル
の暗号化文章が送られ、差分データもメールに添付して
送信されている場合を想定して説明する。この場合に
は、図10に示すように単語レベルのチェックボックス
と差分データ有りのラジオボタンが選択され、実行ボタ
ンがクリックされる。どのレベルで暗号解読を行なうか
は、データの送信者と受信者で一致していなければ、解
読はできない。従って、この暗号解読のレベル自体を両
者以外に秘匿しておけば、暗号の信頼性は更に高められ
る。もとより、暗号解読用の辞書データベースも、両者
で同一のものを使用している必要があり、この点でも暗
号の信頼性は極めて高い。
【0040】続いて、文章のファイルの特定を催促する
暗号化文章の特定処理(ステップS210)が実行さ
れ、特定された暗号化文章を読み出す処理が行なわれ
る。コンピュータ30の利用者は、この時にメールに添
付されて送られてきた暗号化文章(図7)を特定する。
このとき、差分データも読み取られる。
【0041】続く暗号解読処理(ステップS220)で
は、その特定された暗号化文章に対して、図3に例示し
た辞書データベースとを用いて、暗号化文章の文章中の
表記のゆれを文頭から検索する処理を行なう。その表記
のゆれが基本単語であるときは0,基本単語以外である
ときは1とするデータ列を作成し、このデータ列を先頭
から8ずつに区切る。例えば、図8に示した暗号化文章
の場合には、最初の8カ所の標準化が行なわれ得る単語
について、順に「基本単語」「基本単語以外」「基本単
語」「基本単語」・・・・となっているので、これを最
初の8カ所についてバイナリコードにすると、「010
00001b」というデータ列が作成される。これをA
SCIIコードに変換すると、キャラクタ「A」が復号
されるのである。
【0042】次の原文再現処理(ステップS230)
は、ステップS200にて差分データが有るとチェック
した場合にのみ実行される処理であり、コンピュータ3
0は利用者に差分データの特定を促してこれを入手し、
暗号化文章から原文を再現する。この処理は、初めに暗
号化文章を標準化文章に再変換するために、総ての表記
のゆれを基本単語に変換する。そして、特定された差分
データ「@」「SX」をバイナリコードに変換し、その0
と1のデータに基づいてその標準化文頭から0ならば基
本文字のまま、1ならば基本文字以外の文字に書き換え
る処理を実行するのである。この処理により、図8に示
した暗号化文章は、図5に示した原文へと変換され、コ
ンピュータ20の利用者が最初に作成した文章を再現す
ることができる。以上の説明では、理解の便を優先し
て、埋め込まれるデータには圧縮処理などは施されてい
ないものとしたが、実際には、文章に埋め込まれるデー
タは、圧縮されている。圧縮の手法は、LZ符号化な
ど、周知の手法を利用することができる。埋め込むべき
情報を圧縮することにより、テキストデータに埋め込め
る情報量は増加するから、本実施例のように、原文に回
復するための差分情報を一緒に埋め込む場合などには、
効果は特に大きい。
【0043】以上のように構成される本実施例の情報埋
め込み方法及び情報再現方法によれば、ネットワーク1
0を介して送受信される暗号化文章は、ごく普通の文章
の形態(図8参照)をしており、この文章に他のデータ
(本実施例では「A」)が埋め込まれているとは気づか
れることがない。デジタル化された通常の文章に異なる
情報を埋め込んで暗号化文章とすることができ、この暗
号化文章により所望の情報の伝達を秘密裏に行なうこと
ができるのである。従って、所望の情報を埋め込んだ暗
号化文章を配信すると、第三者には暗号化文章そのもの
の配信に意味があるかのように思え、秘密の通信を行な
っている痕跡を残さずに所望の情報を配布することがで
きる。このため、ハッカーなどによる暗号破りの対象と
なることもなく、信頼性の高い秘密保護が達成される。
しかも、暗号化された文章を読んでも意味は通り、こち
らも情報の伝達用に用いることができる。なお、本実施
例では情報「A」を埋め込む暗号化の利用形態を説明し
たが、埋め込む情報を著作権情報とすることで電子透か
しとしても利用することができる。
【0044】また図3に示した辞書データベースは、書
き換えの候補として文字レベル、単語レベル、文節レベ
ルの3つの段階を任意に設定することができる。このた
め、原文と暗号化文章とを僅かな表現の違いに抑えたい
ときには文字レベルあるいは表記のゆれレベルを選択
し、埋め込む情報量が多いときには、自立語レベルや付
属語(文節)レベルも選択するなど、多様な利用が可能
となる。しかも、原文の標準化処理(ステップS11
0)の際に差分データを作成することで、暗号化文章か
ら原文を忠実に再現することができ、微妙なニュアンス
が必要な文章にも安心して暗号化文章を作成し、秘密裏
に埋め込み情報を送信することができる。
【0045】なお、図3に示した辞書データベースで
は、標準化の対象となる表記を二者択一にしているが、
実際には、例えば「重要な」という自立語であれば「大
切な」以外にも「大事な」「肝要な」といった多数の同
義語が存在する。また、表記のゆれにおいても、「書き
換え」「書換」「書換え」など複数の表記のゆれが存在
する語もありえる。こうした類義語が多数存在する自立
語を置き換えるような場合には、例えば辞書における語
の並びを利用して、標準化した場合に利用する基本単語
の直後に配列されている単語に置き換えるものとすれば
よい。また、差分データについては、何番目の単語から
置き換えたかを複数ビットにより表現するものとして生
成すればよい。即ち、辞書データベースに「重要な、大
切な、大事な、肝要な」という類義語がこの順に並んで
おり、基本単語が「重要な」であるとして、原文が「大
事な」であってこれを「重要な」という基本単語に置き
換えた場合には、基本単語との距離を2と見て「10」
という差分データを生成するのである。こうしておけ
ば、標準化の辞書データベースが、一つの基本単語につ
いて複数個の置き換え語を有している場合でも、暗号化
および復号化、更には原文の回復を行なうことができ
る。
【0046】なお、本発明は上記実施例に限定されるも
のではなく、その要旨を逸脱しない各種態様により具現
化されることは勿論である。例えば、上記実施例で辞書
データベースの任意のデータの使用禁止及び/またはデ
ータ変更を可能とする辞書ユーティリティプログラムを
付加し、辞書データベースのカスタマイズを行なっても
よい。こうしてカスタマイズした辞書データベースをコ
ンピュータ20,30の利用者が共有するならば、同じ
アルゴリズムで暗号の送受信をしている他のコンピュー
タ40によって暗号化文章が不正入手された場合であっ
ても、原文や埋め込み情報が再現されることもなく、秘
密性を一層向上させることができる。
【0047】また、上記実施例では、基本単語またはそ
れ以外の文字を利用することを0または1に対応させる
ことで、1つの表記のゆれを利用して1ビットの情報を
埋め込む例を示したが、特定の表記のゆれに多ビットを
埋め込むようにしてもよい。例えば、図3に例示した辞
書データベースにある基本単語「先日」には「先日」
「以前」「過日」「先頃」の4つの置き換え語が登録さ
れているとすれば、基本単語「先日」には「0」、「以
前」には「1」、「過日」には「00」、「先頃」には
「01」を対応させることで、1つの表記のゆれを利用
して2ビットの情報を埋め込むことができる。
【図面の簡単な説明】
【図1】本発明の実施例である情報の埋め込み方法と情
報再現方法が適用されるコンピュータ20,30のイン
ターネット接続の説明図である。
【図2】コンピュータ20の内部構成を示すブロック図
である。
【図3】そのコンピュータ20,30に記憶されている
辞書データベースの構成を説明する説明図である。
【図4】そのコンピュータ20にて実行される情報埋め
込みプログラムのフローチャートである。
【図5】情報が埋め込まれる原文を説明する説明図であ
る。
【図6】原文の標準化処理に際してのコンピュータ20
の表示画面の説明図である。
【図7】原文を標準化した標準化文章を説明する説明図
である。
【図8】標準化文章に情報「A」を埋め込んだ暗号化文
章を説明する説明図である。
【図9】コンピュータ30にて実行される情報再現プロ
グラムのフローチャートである。
【図10】暗号化文章の解読処理に際してのコンピュー
タ30の表示画面の説明図である。
【符号の説明】
10…ネットワーク 11…キーボード 12…マウス 18…ルータ 20…コンピュータ 22…CPU 23…ROM 24…RAM 25…タイマ 26…表示回路 27…ハードディスク 29…モニタ 30…コンピュータ 40…コンピュータ

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 デジタル化された文章に所望の情報を埋
    め込む情報埋め込み装置であって、 所定の規定に基づき、異なる単語及び/または表記であ
    りながらも同じ概念を表す単語及び/または表記によっ
    て、前記文章を標準文章に書き換える標準化手段と、 前記標準化の工程で書き換えの対象となった単語及び/
    または表記に関し、前記所望の情報に対応したデータに
    従って、前記同じ概念を表す単語及び/または表記のう
    ちのいずれを用いるかを決定し、前記文章を書き換えて
    該データを埋め込んだ暗号化文章を生成する埋込手段と
    を備える情報埋込装置。
  2. 【請求項2】 標準化手段及び埋込手段は、単語及び/
    または表記の書き換えのための所定の規則として、同一
    の辞書データベースを利用する請求項1記載の情報埋込
    装置。
  3. 【請求項3】 前記辞書データベースは、書き換えの候
    補として文字、単語、文節の少なくとも一つの段階を有
    する請求項2記載の情報埋込装置。
  4. 【請求項4】 前記辞書データベースは、任意のデータ
    の使用禁止及び/またはデータ変更が可能である請求項
    2または請求項3記載の情報埋込装置。
  5. 【請求項5】 前記標準化手段は、デジタル化された文
    章を標準文章に書き換えるに際して、該デジタル化され
    た文章と該標準文章との差分に基づく差分データを生成
    する差分データ生成部を備える請求項1ないし請求項4
    のいずれか記載の情報埋込装置。
  6. 【請求項6】 デジタル化された文章に所望の情報を埋
    め込む情報埋込方法であって、 所定の規定に基づき、異なる単語及び/または表記であ
    りながらも同じ概念を表す単語及び/または表記によっ
    て、前記文章を標準文章に書き換える標準化工程と、 前記標準化の工程で書き換えの対象となった単語及び/
    または表記に関し、前記所望の情報に対応したデータに
    従って、前記同じ概念を表す単語及び/または表記のう
    ちのいずれを用いるかを決定し、前記文章を書き換えて
    該データを埋め込む埋込工程とを備える情報埋込方法。
  7. 【請求項7】 請求項1記載の情報埋込装置によって得
    られた暗号化文章から前記所望の情報に対応したデータ
    を復号する情報復号装置であって、 前記所定の規則に基づいて、前記暗号化文章の書き換え
    られた単語及び/または表記を抽出する抽出手段と、 該抽出した単語及び/または表記に基づいて、前記埋め
    込まれたデータを復号する復号手段とを備える情報復号
    装置。
  8. 【請求項8】 抽出手段は、書き換えられた単語及び/
    または表記を抽出する際、前記データの埋込を行なった
    際の辞書データベースと同一の辞書データベースを利用
    する請求項7記載の情報再現装置。
  9. 【請求項9】 デジタル化された文章に所望の情報を埋
    め込む処理をコンピュータにおいて実現するプログラム
    であって、 所定の規定に基づき、異なる単語及び/または表記であ
    りながらも同じ概念を表す単語及び/または表記によっ
    て、前記文章を標準文章に書き換える機能と、 前記書き換えの対象となった単語及び/または表記に関
    し、前記所望の情報に対応したデータに従って、前記同
    じ概念を表す単語及び/または表記のうちのいずれを用
    いるかを決定し、前記文章を書き換えて該データを埋め
    込む機能をコンピュータに実現させるためのプログラ
    ム。
  10. 【請求項10】 デジタル化された文章に所望の情報を
    埋め込み、復号する情報の取扱方法であって、 所定の規定に基づき、異なる単語及び/または表記であ
    りながらも同じ概念を表す単語及び/または表記によっ
    て、前記文章を標準文章に書き換える標準化工程と、 前記標準化の工程で書き換えの対象となった単語及び/
    または表記に関し、前記所望の情報に対応したデータに
    従って、前記同じ概念を表す単語及び/または表記のう
    ちのいずれを用いるかを決定し、前記文章を書き換えて
    該データを埋め込む埋込工程と、 当該工程によってデータが埋め込まれた暗号化文章を受
    け取り、前記所定の規則に基づいて、該暗号化文章の書
    き換えられた単語及び/または表記を抽出する抽出工程
    と、 該抽出した単語及び/または表記に基づいて、前記埋め
    込まれたデータを復号する復号工程とを備える情報取扱
    方法。
JP2001071565A 2001-03-14 2001-03-14 文章への情報の埋め込み、復号 Pending JP2002269075A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001071565A JP2002269075A (ja) 2001-03-14 2001-03-14 文章への情報の埋め込み、復号

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001071565A JP2002269075A (ja) 2001-03-14 2001-03-14 文章への情報の埋め込み、復号

Publications (1)

Publication Number Publication Date
JP2002269075A true JP2002269075A (ja) 2002-09-20

Family

ID=18929271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001071565A Pending JP2002269075A (ja) 2001-03-14 2001-03-14 文章への情報の埋め込み、復号

Country Status (1)

Country Link
JP (1) JP2002269075A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009198816A (ja) * 2008-02-21 2009-09-03 Nec Corp 情報隠蔽システム、装置及び方法
WO2015009119A1 (ko) * 2013-07-19 2015-01-22 고려대학교 산학협력단 거부적 암호화 시스템 및 방법
KR20150010571A (ko) * 2013-07-19 2015-01-28 고려대학교 산학협력단 거부적 암호화 시스템 및 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009198816A (ja) * 2008-02-21 2009-09-03 Nec Corp 情報隠蔽システム、装置及び方法
WO2015009119A1 (ko) * 2013-07-19 2015-01-22 고려대학교 산학협력단 거부적 암호화 시스템 및 방법
KR20150010571A (ko) * 2013-07-19 2015-01-28 고려대학교 산학협력단 거부적 암호화 시스템 및 방법
KR101584127B1 (ko) 2013-07-19 2016-01-11 고려대학교 산학협력단 거부적 암호화 시스템 및 방법

Similar Documents

Publication Publication Date Title
Taleby Ahvanooey et al. A comparative analysis of information hiding techniques for copyright protection of text documents
JP3859313B2 (ja) タグ文書の圧縮装置および復元装置,圧縮方法および復元方法,圧縮/復元装置および圧縮/復元方法並びに圧縮,復元もしくは圧縮/復元プログラムを記録したコンピュータ読み取り可能な記録媒体
Banerjee et al. Novel text steganography through special code generation
JP5121930B2 (ja) 暗号値のテキスト表示を提供する方法
KR100352782B1 (ko) 소프트웨어 암호화 방법, 소프트웨어 암호화 시스템 및 소프트웨어 복호화 시스템
Rafat et al. Secure digital steganography for ASCII text documents
Zheng et al. Autoregressive linguistic steganography based on BERT and consistency coding
WO2010131939A1 (en) Text steganography
JP2011081030A (ja) 検索型カラー暗号化ファイルの構成方法および検索型カラー暗号化ファイルシステム
JP2002269075A (ja) 文章への情報の埋め込み、復号
JP6907948B2 (ja) ファイル生成プログラム、ファイル生成方法及びファイル生成装置
WO2007091336A1 (ja) 文字の暗号化方法及び暗号化文字コードの描画方法並びにプログラム
Din et al. Performance analysis on secured data method in natural language steganography
US20040034602A1 (en) Method and apparatus for watermarking binary computer code
Huang et al. A Homophone-based Chinese Text Steganography Scheme for Chatting Applications.
Wai et al. Syntactic bank-based linguistic steganography approach
JP3676120B2 (ja) テキスト電子認証装置、方法、及び、テキスト電子認証プログラムを記録した記録媒体
Wai et al. Modified linguistic steganography approach by using syntax bank and digital signature
Kazmi et al. Unihach: unicode and hash function supported with counting and frequency recurrence of Arabic characters for Quranic text watermarking
Kankana et al. A robust audio authentication scheme using (11, 7) hamming error correcting code
Tiwari et al. A novel steganographic methodology for high capacity data hiding in executable files
JP4506831B2 (ja) 音声データ再生方法、音声データ再生システム、音声データ送信処理プログラム、音声データ受信端末
JP2007156169A (ja) 音声合成装置及び音声合成方法
Askari et al. A novel font color and compression text steganography technique
JP3814618B2 (ja) 文章処理装置、及び制御方法