JP2009145973A - Information processor and information processing method - Google Patents

Information processor and information processing method Download PDF

Info

Publication number
JP2009145973A
JP2009145973A JP2007319855A JP2007319855A JP2009145973A JP 2009145973 A JP2009145973 A JP 2009145973A JP 2007319855 A JP2007319855 A JP 2007319855A JP 2007319855 A JP2007319855 A JP 2007319855A JP 2009145973 A JP2009145973 A JP 2009145973A
Authority
JP
Japan
Prior art keywords
masking
information
target
width
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007319855A
Other languages
Japanese (ja)
Inventor
Yasuo Okuya
泰夫 奥谷
Toshiaki Fukada
俊明 深田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007319855A priority Critical patent/JP2009145973A/en
Publication of JP2009145973A publication Critical patent/JP2009145973A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Document Processing Apparatus (AREA)
  • Storage Device Security (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information processor allowing control of a masking width without simply painting over a masking area in black to improve confidentiality of a paper document. <P>SOLUTION: This information processor has: a masking information acquisition means for acquiring masking information for specifying a masking target; a masking width determination means for determining independently a masking width of a length of the masking target based on the acquired masking information; and a masking means for masking the masking target based on a determination result. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、電子透かし技術を利用したマスキング処理技術に関する。   The present invention relates to a masking processing technique using a digital watermark technique.

近年、役所の文書や企業内文書に関する情報公開が進んでいる。その一方で、個人情報や機密情報保護の重要性が増している。例えば、病院のカルテを開示する場合は、患者の氏名、住所等を秘匿する必要がある。このような場合、秘匿したい部分をマスキング(黒く塗りつぶす)した上で公開することが一般的である。従来、特許文献1に示すように、プロファイル情報と規則を用いて、マスキング領域を自動的に決定する方式がある。
特開平11−143871号公報
In recent years, information disclosure regarding government office documents and corporate documents has been progressing. On the other hand, the importance of protecting personal information and confidential information is increasing. For example, when disclosing a hospital chart, it is necessary to conceal the patient's name and address. In such a case, it is common to publish after masking (blacking out) a portion to be concealed. Conventionally, as shown in Patent Document 1, there is a method of automatically determining a masking region using profile information and rules.
Japanese Patent Laid-Open No. 11-143871

しかしながら、特許文献1では、単純にマスキング領域を黒く塗りつぶすため、マスキング後も長さの情報が残るという課題がある。例えば、人名部分が10文字分塗りつぶされている場合、そのように長い氏名の人物は特定されやすくなる。   However, in Patent Document 1, since the masking area is simply painted black, there is a problem that length information remains after masking. For example, when a person name portion is filled with 10 characters, a person with such a long name is easily identified.

本発明は上記の課題に鑑みてなされたものであり、マスキング幅を制御することが可能な情報処理装置を提供する。   The present invention has been made in view of the above problems, and provides an information processing apparatus capable of controlling the masking width.

上記の目的を達成するための本発明による情報処理装置は、マスキング対象を特定するマスキング情報を取得するマスキング情報取得手段と、前記取得したマスキング情報に基づいてマスキング対象の長さと独立してマスキング幅を決定するマスキング幅決定手段と、前記決定結果に基づいてマスキング対象をマスキングするマスキング手段とを備える。   In order to achieve the above object, an information processing apparatus according to the present invention includes a masking information acquisition unit that acquires masking information for specifying a masking target, and a masking width that is independent of the length of the masking target based on the acquired masking information. And a masking width determining means for masking a masking target based on the determination result.

本発明によれば、マスキング幅を制御することによりマスキング処理を施した紙文書の秘匿性が向上する。   According to the present invention, the confidentiality of the paper document subjected to the masking process is improved by controlling the masking width.

以下、添付の図面を参照して本発明の好適な実施形態のいくつかについて詳細に説明する。ただし、この実施の形態に記載されている構成要素はあくまでも例示であり、本発明の範囲をそれらのみに限定する趣旨のものではない。   Hereinafter, some preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. However, the constituent elements described in this embodiment are merely examples, and are not intended to limit the scope of the present invention only to them.

<第1実施形態>
本実施形態では、マスキング個所を電子透かしで予め埋め込んだ紙文書を入力とする。当該紙文書をスキャナなどの入力装置で取込み、マスキング領域を特定後、マスキング領域にマスキングを施して、再び紙文書として出力する場合について説明する。
<First Embodiment>
In this embodiment, a paper document in which a masking portion is embedded in advance with a digital watermark is used as an input. A case will be described in which the paper document is captured by an input device such as a scanner, the masking area is specified, the masking area is masked, and the paper document is output again.

なお、マスキング情報を電子透かしとして埋め込む方法としては、例えば、文字間透かしやドットパターン透かし等を用いることができる。   As a method for embedding the masking information as an electronic watermark, for example, an inter-character watermark or a dot pattern watermark can be used.

図1は、第1実施形態における情報処理装置のハードウエア構成を示すブロック図である。図1において、101は制御メモリであり、本実施形態の処理手順および固定的データが格納される。102は中央処理装置であり、数値演算/制御等の処理を行う。103はメモリであり、一時的なデータが格納される。104はスキャナなどの入力装置であり、紙文書を画像データとして取り込む。105はプリンタなどの出力装置であり、画像データを紙に出力する。106はバスであり、各装置間のデータのやり取りはこのバスを通じて行われる。   FIG. 1 is a block diagram illustrating a hardware configuration of the information processing apparatus according to the first embodiment. In FIG. 1, reference numeral 101 denotes a control memory, which stores the processing procedure and fixed data of this embodiment. A central processing unit 102 performs processing such as numerical calculation / control. Reference numeral 103 denotes a memory in which temporary data is stored. Reference numeral 104 denotes an input device such as a scanner, which captures a paper document as image data. Reference numeral 105 denotes an output device such as a printer, which outputs image data on paper. Reference numeral 106 denotes a bus, and data exchange between the devices is performed through this bus.

図2は、第1実施形態における音声合成装置のモジュール構成を示すブロック図である。図2において、スキャン処理部201は、入力装置104を介して、紙文書を電子データに変換し文書画像として取り込む。文書画像保持部202は、文書画像を保持する。マスキング情報抽出部203は、文書画像に電子透かしとして埋め込まれているマスキング情報を抽出する。マスキング情報保持部204はマスキング情報を保持する。マスキング処理部205は、マスキング情報保持部204が保持するマスキング情報を基にマスキング領域を黒く塗りつぶす。マスキング文書画像保持部206は、マスキングが施されたマスキング文書画像を保持する。印刷処理部207は、出力装置105を介してマスキング文書画像を紙に出力する。   FIG. 2 is a block diagram illustrating a module configuration of the speech synthesizer according to the first embodiment. In FIG. 2, the scan processing unit 201 converts a paper document into electronic data via the input device 104 and captures it as a document image. The document image holding unit 202 holds a document image. The masking information extraction unit 203 extracts masking information embedded as a digital watermark in the document image. The masking information holding unit 204 holds masking information. The masking processing unit 205 paints the masking area black based on the masking information held by the masking information holding unit 204. A masking document image holding unit 206 holds a masked document image that has been subjected to masking. The print processing unit 207 outputs the masking document image on paper via the output device 105.

図3は第1実施形態における情報処理装置の処理の流れを示すフローチャートである。ステップS301では、スキャン処理部201が、入力装置104を介して紙文書を文書画像として取り込み、文書画像を文書画像保持部202に保持してステップS302に移る。   FIG. 3 is a flowchart showing the flow of processing of the information processing apparatus in the first embodiment. In step S301, the scan processing unit 201 captures a paper document as a document image via the input device 104, holds the document image in the document image holding unit 202, and proceeds to step S302.

ステップS302では、マスキング情報抽出部203が、文書画像保持部202に保持されている文書画像からマスキング情報を抽出し、マスキング情報保持部204に保持してステップS303に移る。前記マスキング情報には、少なくともマスキング対象の開始位置および終了位置を特定可能な情報が含まれているものとする。   In step S302, the masking information extraction unit 203 extracts masking information from the document image held in the document image holding unit 202, holds it in the masking information holding unit 204, and proceeds to step S303. The masking information includes at least information capable of specifying a start position and an end position to be masked.

ステップS303では、マスキング処理部205が、マスキング情報204が保持するマスキング情報を基にマスキングの開始位置を決定し、所定のマスキング幅のマスキング処理を行う。ここでのマスキング処理とは、マスキング幅にわたって黒く塗りつぶす処理と、さらに、マスキング対象の長さがマスキング幅よりも長い場合は、はみ出す部分の画像を消去する処理を含む。なお、マスキング幅は、予め与えられた固定値でもよいし、ランダムに決定してもよいし、さらには、電子透かしとして埋め込んでおいてもよいものとする。マスキング処理部205は、マスキング処理が施されたマスキング文書画像をマスキング文書画像保持部206に保持して、ステップS304に移る。   In step S303, the masking processing unit 205 determines a masking start position based on the masking information held by the masking information 204, and performs a masking process with a predetermined masking width. The masking process here includes a process of painting black over the masking width and a process of erasing the image of the protruding portion when the length of the masking target is longer than the masking width. The masking width may be a fixed value given in advance, may be determined at random, or may be embedded as a digital watermark. The masking processing unit 205 holds the masking document image subjected to the masking process in the masking document image holding unit 206, and proceeds to step S304.

ステップS304では、印刷処理部207が、出力装置105を介して、マスキング文書画像保持部206に保持されているマスキング文書画像を紙に出力して、終了する。   In step S304, the print processing unit 207 outputs the masking document image held in the masking document image holding unit 206 to the paper via the output device 105, and the process ends.

図4は、定型文書(帳票、表形式など)に対して、本実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。   FIG. 4 is a schematic diagram showing a paper document before and after performing masking processing described in the present embodiment for a standard document (form, table format, etc.).

図4(a)はマスキング処理前の紙文書である。マスキング対象が下線で示されているが、本来は電子透かしとして埋め込まれているため下線は表示されない。この例では、患者名および住所の一部がマスキングの対象である。   FIG. 4A shows a paper document before the masking process. Although the masking target is indicated by an underline, the underline is not displayed because it is originally embedded as a digital watermark. In this example, a part of the patient name and address is a masking target.

図4(b)は、従来技術によるマスキング処理を施した後の紙文書である。マスキング幅がマスキング対象の長さと一致しており、特に、患者の氏名が長い場合、患者名が特定されやすくなり、マスキング対象の秘匿性が低下する。   FIG. 4B shows a paper document after the masking process according to the prior art is performed. The masking width coincides with the length of the masking target. In particular, when the patient's name is long, the patient name is easily identified, and the masking target is less confidential.

図4(c)は、本実施形態で説明したマスキング処理を施した後の紙文書である。マスキング幅が固定値になっており、マスキング対象の長さとは独立に制御されているため、マスキング対象の秘匿性が高い。   FIG. 4C is a paper document after the masking process described in this embodiment is performed. Since the masking width is a fixed value and is controlled independently of the length of the masking target, the masking target is highly confidential.

以上説明したように、マスキング対象の長さと独立にマスキング幅を制御することにより、マスキング対象の秘匿性を向上することができる。   As described above, it is possible to improve the confidentiality of the masking target by controlling the masking width independently of the length of the masking target.

<第2実施形態>
第1実施形態では、定型文書のようにマスキング対象の終端が自明である場合について説明したが、これに限定されるものではなく、不定型文書(一般的な文章)にマスキング処理を施す場合もよいものである。
Second Embodiment
In the first embodiment, the case where the end of the masking target is self-explanatory as in a standard document has been described. However, the present invention is not limited to this, and a masking process may be applied to an irregular document (general text). It ’s good.

図5は、第2実施形態における情報処理装置のモジュール構成を示すブロック図である。図5において、第1実施形態と同じ処理を行うモジュールには図2と同じ番号を付与し、説明を省略する。レイアウト調整部501は、マスキング対象の長さとマスキング幅の差分を文書中の文字間隔に配分することによって文書のレイアウトを調整する。調整済み文書画像保持部502は、レイアウト調整済み文書画像を保持する。印刷処理部207は、出力装置105を介してレイアウト調整済み文書画像を紙に出力する。   FIG. 5 is a block diagram illustrating a module configuration of the information processing apparatus according to the second embodiment. In FIG. 5, modules that perform the same processing as in the first embodiment are assigned the same numbers as in FIG. 2, and descriptions thereof are omitted. The layout adjustment unit 501 adjusts the document layout by allocating the difference between the masking target length and the masking width to the character spacing in the document. The adjusted document image holding unit 502 holds the layout adjusted document image. The print processing unit 207 outputs the layout adjusted document image on paper via the output device 105.

図6は、第2実施形態における情報処理装置の処理の流れを示すフローチャートである。図6において、第1実施形態と同じ処理を行うステップには図3と同じ番号を付与し、説明を省略する。   FIG. 6 is a flowchart showing the flow of processing of the information processing apparatus in the second embodiment. In FIG. 6, steps that perform the same processing as in the first embodiment are given the same numbers as in FIG.

ステップS601では、レイアウト調整部601が、マスキング文書画像保持部206が保持するマスキング文書画像を基に、マスキング対象の長さとマスキング幅の差分を、当該行の文字間隔を変更することによって吸収する。なお、文字間隔の変更を行うための前段として、レイアウト調整部601は、マスキング文書画像から少なくとも文字画像の抽出、および各文字画像の始端、終端を認識する必要がある。これには既存技術(例えばOCRの前処理技術)を適用することが可能である。一方、マスキング対象の長さは、マスキング情報保持部204が保持するマスキング情報から取得するものとする。レイアウト調整部501は、レイアウト調整済み文書画像を調整済み文書画像保持部502に保持して、ステップS304に移る。   In step S601, the layout adjustment unit 601 absorbs the difference between the length to be masked and the masking width by changing the character spacing of the line based on the masking document image held by the masking document image holding unit 206. As a previous stage for changing the character spacing, the layout adjustment unit 601 needs to extract at least a character image from the masking document image and recognize the start and end of each character image. It is possible to apply existing technology (for example, OCR pretreatment technology) to this. On the other hand, the length to be masked is acquired from the masking information held by the masking information holding unit 204. The layout adjustment unit 501 holds the layout adjusted document image in the adjusted document image holding unit 502, and proceeds to step S304.

ステップS304では、印刷処理部207が、出力装置105を介して、調整済み文書画像保持部502に保持されているレイアウト調整済み文書画像を紙に出力して、終了する。   In step S304, the print processing unit 207 outputs the layout adjusted document image held in the adjusted document image holding unit 502 to the paper via the output device 105, and the process ends.

図7は、不定型文書に対して、本実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。この例では、行単位でレイアウト調整を行っている。   FIG. 7 is a schematic diagram illustrating a paper document before and after performing masking processing described in the present embodiment for an indefinite document. In this example, layout adjustment is performed in units of lines.

図7(a)はマスキング処理前の紙文書である。マスキング対象が下線で示されているが、本来は電子透かしとして埋め込まれているため下線は表示されない。この例では、固有名詞がマスキングの対象である。   FIG. 7A shows a paper document before the masking process. Although the masking target is indicated by an underline, the underline is not displayed because it is originally embedded as a digital watermark. In this example, the proper noun is the target of masking.

図7(b)は、従来技術によるマスキング処理を施した後の紙文書である。マスキング幅がマスキング対象の長さと一致しており、この例のように氏名が長いまたは短い場合はマスキング対象の秘匿性が低下する。   FIG. 7B shows a paper document after the masking process according to the prior art is performed. When the masking width matches the length of the masking target and the name is long or short as in this example, the confidentiality of the masking target is reduced.

図7(c)は、本実施形態で説明したマスキング処理を施した後の紙文書である。マスキング幅は固定値となっており、また、マスキング処理は行単位で行っている。例えば2行目では、マスキング対象の長さに比べてマスキング幅が短くなった分、同一行に存在する非マスキング対象部分の文字間隔が広くなるように調整されている。   FIG. 7C is a paper document after the masking process described in this embodiment is performed. The masking width is a fixed value, and the masking process is performed in units of rows. For example, in the second line, the character spacing of the non-masking target portion existing in the same line is adjusted to be wide by the amount of the masking width being shorter than the length of the masking target.

次に、マスキング対象が2行に渡る場合(図7(a)の3行目終わりから4行目にかけて)について説明する。この場合、図7(c)の3行目から4行目に示すように、マスキング処理により黒く塗りつぶされた矩形画像も2行に渡るように分割して配置される。両方の矩形画像の長さの和は固定値のマスキング幅に等しくなる。また、それぞれの長さの比は、図7(a)において2行に分割されたマスキング対象の比に等しいものとする。   Next, a case where the masking target extends over two lines (from the end of the third line to the fourth line in FIG. 7A) will be described. In this case, as shown in the third to fourth lines in FIG. 7C, the rectangular image painted black by the masking process is divided and arranged so as to cover two lines. The sum of the lengths of both rectangular images is equal to a fixed masking width. Further, the ratio of the lengths is assumed to be equal to the ratio of the masking target divided into two lines in FIG.

以上説明したように、マスキング対象の長さと独立にマスキング幅を制御することにより、マスキング対象の秘匿性を向上することができる。   As described above, it is possible to improve the confidentiality of the masking target by controlling the masking width independently of the length of the masking target.

<第3実施形態>
第1実施形態のステップS303に示したマスキング処理では、マスキング幅にわたって黒く塗りつぶし、さらにマスキング対象の長さがマスキング幅よりも長い場合は、はみ出す部分の画像を消去する場合について説明したが、これに限定されるものではない。例えば、まずマスキング対象を消去し、さらに所定のマスキング幅の、黒く塗りつぶされた矩形画像を挿入する(つまり、マスキング対象を黒矩形画像で置換する)ことによってマスキング処理を実現してもよい。
<Third Embodiment>
In the masking process shown in step S303 of the first embodiment, the case where the masking width is painted black and the image of the protruding portion is erased when the length of the masking target is longer than the masking width has been described. It is not limited. For example, the masking process may be realized by first erasing the masking target and then inserting a rectangular black image with a predetermined masking width (that is, replacing the masking target with a black rectangular image).

<第4実施形態>
第2実施形態では、日本語等のように単語間にスペースが挿入されない言語の文書を対象にした場合について説明したが、これに限定されるものではなく、英語等のように単語がスペースで区切られている言語に対して適用する場合もよいものとする。この場合、レイアウト調整部601は、単語間隔の調整を行う。すなわち、マスキング対象の長さとマスキング幅の差分を単語間のスペースの長さを調整することによって吸収するように実現する。なお、いうまでもないことであるが、スペース長と文字間隔の両方を調整することによって吸収するように実現してもよい。
<Fourth embodiment>
In the second embodiment, a case has been described in which a document in a language in which a space is not inserted between words such as Japanese is targeted. However, the present invention is not limited to this, and a word is a space such as English. It may also be applied to a delimited language. In this case, the layout adjustment unit 601 adjusts the word spacing. That is, the difference between the length of the masking target and the masking width is realized by adjusting the length of the space between words. Needless to say, it may be realized to absorb by adjusting both the space length and the character spacing.

図8は、英語の文書に対して、本実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。   FIG. 8 is a schematic diagram showing a paper document before and after performing masking processing described in the present embodiment for an English document.

図8(a)はマスキング処理前の紙文書である。マスキング対象が下線で示されているが、本来は電子透かしとして埋め込まれているため下線は表示されない。この例では、固有名詞がマスキング対象である。   FIG. 8A shows a paper document before the masking process. Although the masking target is indicated by an underline, the underline is not displayed because it is originally embedded as a digital watermark. In this example, the proper noun is a masking target.

図8(b)は、従来技術によるマスキング処理を施した後の紙文書である。マスキング幅がマスキング対象の長さと一致しており、この例のように固有名詞が長い場合はマスキング対象の秘匿性が低下する。   FIG. 8B is a paper document after the masking process according to the prior art is performed. When the masking width matches the length of the masking target and the proper noun is long as in this example, the confidentiality of the masking target is lowered.

図8(c)は、本実施形態で説明したマスキング処理を施した後の紙文書である。マスキング幅は固定値となっており、マスキング処理は行単位で行っている。また、マスキング対象の長さとマスキング幅の差分は単語の間隔で調整している。例えば1行目では、マスキング対象の長さに比べてマスキング幅が短くなった分、同一行に存在する単語の間隔が広くなるように調整されている。   FIG. 8C is a paper document after the masking process described in this embodiment is performed. The masking width is a fixed value, and the masking process is performed in units of rows. Further, the difference between the length of the masking target and the masking width is adjusted by the interval between words. For example, in the first line, the interval between the words existing on the same line is adjusted to be wider by the amount of the masking width shorter than the length of the masking target.

次に、マスキング対象が2行に渡る場合(図8(a)の3行目終わりから4行目にかけて)について説明する。この場合、図8(c)の3行目から4行目に示すように、マスキング処理により黒く塗りつぶされた矩形画像も2行に渡るように分割して配置される。両方の矩形画像の長さの和は固定値のマスキング幅に等しくなる。また、それぞれの長さの比は、図8(a)において2行に分割されたマスキング対象の長さの比に等しいものとする。   Next, a case where the masking target extends over two lines (from the end of the third line to the fourth line in FIG. 8A) will be described. In this case, as shown in the third to fourth lines in FIG. 8C, the rectangular image painted black by the masking process is also divided and arranged so as to cover two lines. The sum of the lengths of both rectangular images is equal to a fixed masking width. Further, the ratio of the lengths is assumed to be equal to the ratio of the lengths of the masking objects divided into two lines in FIG.

以上説明したように、マスキング幅をマスキング対象の長さとは独立に制御し、マスキング対象の長さとマスキング幅の差分をスペースで吸収しているため、マスキング対象の秘匿性が高い。つまり、英語等のように単語間にスペースが挿入される言語において、マスキング対象の長さとマスキング幅の差分をスペースで吸収することによって、マスキング対象の秘匿性を向上させることが可能である。   As described above, the masking width is controlled independently of the length of the masking target, and the difference between the length of the masking target and the masking width is absorbed by the space, so the masking target is highly confidential. That is, in a language in which a space is inserted between words such as English, it is possible to improve the confidentiality of the masking target by absorbing the difference between the length of the masking target and the masking width with the space.

<第5実施形態>
第2実施形態乃至第4実施形態では、レイアウト調整を行単位で行う場合について説明したが、これに限定されるものではなく、段落単位、ページ単位、文書単位、または、文単位など、任意の処理単位を対象に行う場合もよいものとする。段落単位の場合は、段落の行数が増減しない限りにおいて、段落末を最終行の任意の位置に移動してもよいものとする。
<Fifth Embodiment>
In the second embodiment to the fourth embodiment, the case where the layout adjustment is performed in units of lines has been described. However, the present invention is not limited to this, and any unit such as a paragraph unit, a page unit, a document unit, or a sentence unit may be used. The processing unit may be performed as a target. In the case of a paragraph unit, the end of a paragraph may be moved to an arbitrary position on the last line as long as the number of lines in the paragraph does not increase or decrease.

図9は、図8(a)に示した紙文書に対して、文単位でマスキング処理を施した後の紙文書である。   FIG. 9 shows a paper document after the masking process is performed on a paper document shown in FIG.

第4実施形態では、図8(a)の3行目から4行目に存在するマスキング対象の長さとマスキング幅の差分が大きいため、図8(c)の3行目では、マスキング処理後の単語間隔が極端に長くなってしまっている。極端な単語間隔は、レイアウトの劣化に加えて、秘匿性の低下につながる。すなわち、極端に長い単語間隔が存在する行では、そのマスキング対象がマスキング幅に比べて極端に長いことを意味する。一方、本実施形態では、図9に示す通り、大きな差分を文単位で分散して吸収しているため、図8(c)の場合に比べて単語間隔が均等になっており、レイアウトの劣化を低減し、さらに秘匿性の低下を軽減している。   In the fourth embodiment, since the difference between the masking target length and the masking width existing in the third to fourth lines in FIG. 8A is large, the third line in FIG. The word spacing has become extremely long. Extreme word spacing leads to a decrease in confidentiality in addition to layout degradation. In other words, in a line where an extremely long word interval exists, the masking target is extremely longer than the masking width. On the other hand, in the present embodiment, as shown in FIG. 9, since large differences are dispersed and absorbed in units of sentences, the word spacing is uniform compared to the case of FIG. This reduces the loss of confidentiality.

以上説明したように、マスキングの処理単位を長くすることによって、レイアウトの劣化を低減し、さらに秘匿性の低下を軽減することが可能である。   As described above, it is possible to reduce the deterioration of layout and further reduce the decrease in confidentiality by lengthening the masking processing unit.

<第6実施形態>
第1実施形態乃至第5実施形態では、紙文書を入力とする場合について説明したが、これに限定されるものではなく、電子データを入力とする場合もよいものとする。また、同様に、マスキング処理を施した結果を紙文書として出力する場合について説明したが、これに限定されるものではなく、電子データを保持または出力する場合もよいものとする。
<Sixth Embodiment>
In the first to fifth embodiments, the case where a paper document is input has been described. However, the present invention is not limited to this, and electronic data may be input. Similarly, the case where the result of the masking process is output as a paper document has been described. However, the present invention is not limited to this, and electronic data may be held or output.

入力が電子データの場合は、スキャン処理部201が不要となる。また、電子データを保持または出力する場合は、印刷処理部207が不要となる。   When the input is electronic data, the scan processing unit 201 is not necessary. In addition, when the electronic data is held or output, the print processing unit 207 is not necessary.

<第7実施形態>
第1実施形態乃至第5実施形態では、マスキング情報がマスキング対象の位置、または、長さの少なくともいずれかを含む場合について説明したが、これに限定されるものではなく、マスキング情報がマスキング対象のキーワードである場合もよいものとする。
<Seventh embodiment>
In the first to fifth embodiments, the case where the masking information includes at least one of the position and the length of the masking target has been described. However, the present invention is not limited to this, and the masking information is the masking target. It may be a keyword.

この場合、マスキング処理部205は、マスキング対象が含まれる電子データをキーワードで検索することによりマスキング対象を特定し、該マスキング対象の長さと独立して前記マスキング幅を決定し、該マスキング幅で前記マスキング対象をマスキングする。   In this case, the masking processing unit 205 specifies the masking target by searching the electronic data including the masking target using a keyword, determines the masking width independently of the length of the masking target, and uses the masking width to determine the masking width. Mask the masking target.

<第8実施形態>
第1実施形態では、マスキング情報を電子透かしとして埋め込む場合について説明したが、これに限定されるものではなく、マスキング情報がQRコードやXMLタグなど任意の形態で埋め込まれている場合もよいものとする。この場合、マスキング情報抽出部203が、QRコードやXMLタグなどを解析して、マスキング情報を抽出する。
<Eighth Embodiment>
In the first embodiment, the case where the masking information is embedded as a digital watermark has been described. However, the present invention is not limited to this, and the masking information may be embedded in an arbitrary form such as a QR code or an XML tag. To do. In this case, the masking information extraction unit 203 analyzes the QR code, the XML tag, etc., and extracts the masking information.

<その他の実施形態>
なお、本発明の目的は次のようにしても達成される。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。このようにしても目的が達成されることは言うまでもない。
<Other embodiments>
The object of the present invention can also be achieved as follows. That is, a storage medium in which a program code of software that realizes the functions of the above-described embodiments is recorded is supplied to the system or apparatus. Then, the computer (or CPU or MPU) of the system or apparatus reads and executes the program code stored in the storage medium. It goes without saying that the purpose is achieved even in this way.

この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶したコンピュータ読取可能な記憶媒体は本発明を構成することになる。   In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the computer-readable storage medium storing the program code constitutes the present invention.

プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。   As a storage medium for supplying the program code, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a magnetic tape, a nonvolatile memory card, a ROM, or the like can be used.

また、本発明に係る実施の形態は、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される場合に限られない。例えば、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。   Further, the embodiments according to the present invention are not limited to the case where the functions of the above-described embodiments are realized by executing the program code read by the computer. For example, an OS (operating system) running on a computer performs part or all of actual processing based on an instruction of the program code, and the functions of the above-described embodiments may be realized by the processing. Needless to say, it is included.

さらに、本発明に係る実施形態の機能は次のようにしても実現される。即ち、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれる。そして、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行う。この処理により前述した実施形態の機能が実現されることは言うまでもない。   Furthermore, the functions of the embodiment according to the present invention are also realized as follows. That is, the program code read from the storage medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer. Then, based on the instruction of the program code, the CPU provided in the function expansion board or function expansion unit performs part or all of the actual processing. It goes without saying that the functions of the above-described embodiments are realized by this processing.

第1実施形態における情報処理装置のハードウエア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of the information processing apparatus in 1st Embodiment. 第1実施形態における情報処理装置のモジュール構成を示すブロック図である。It is a block diagram which shows the module structure of the information processing apparatus in 1st Embodiment. 第1実施形態における情報処理装置の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process of the information processing apparatus in 1st Embodiment. 定型文書(帳票、表形式など)に対して、第1実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。FIG. 3 is a schematic diagram showing a paper document before and after performing masking processing described in the first embodiment for a standard document (form, table format, etc.). 第2実施形態における情報処理装置のモジュール構成を示すブロック図である。It is a block diagram which shows the module structure of the information processing apparatus in 2nd Embodiment. 第2実施形態における音声合成装置の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process of the speech synthesizer in 2nd Embodiment. 不定型文書に対して、第2実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。It is the schematic diagram which showed the paper document before and behind performing the masking process demonstrated in 2nd Embodiment with respect to an irregular document. 英語に対して、第4実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。It is the schematic diagram which showed the paper document before and behind performing the masking process demonstrated in 4th Embodiment with respect to English. 第5実施形態で説明したマスキング処理を行った後の紙文書を示した模式図である。It is the schematic diagram which showed the paper document after performing the masking process demonstrated in 5th Embodiment.

符号の説明Explanation of symbols

101 制御メモリ
102 中央処理装置
103 メモリ
104 入力装置
105 出力装置
106 バス
201 スキャン処理部
202 文書画像保持部
203 マスキング情報抽出部
204 マスキング情報保持部
205 マスキング処理部
206 マスキング文書画像保持部
207 印刷処理部
501 レイアウト調整部
502 調整済み文書画像保持部
DESCRIPTION OF SYMBOLS 101 Control memory 102 Central processing unit 103 Memory 104 Input device 105 Output device 106 Bus 201 Scan processing part 202 Document image holding part 203 Masking information extraction part 204 Masking information holding part 205 Masking processing part 206 Masking document image holding part 207 Print processing part 501 Layout adjustment unit 502 Adjusted document image holding unit

Claims (13)

マスキング対象を特定するマスキング情報を取得する取得手段と、
前記取得したマスキング情報に基づいて、マスキング対象の長さと独立してマスキング幅を決定する決定手段と、
前記決定結果に基づいてマスキング対象をマスキングするマスキング手段と、
を備えることを特徴とする情報処理装置。
Obtaining means for obtaining masking information for specifying a masking target;
A determining means for determining a masking width independently of a length of a masking target based on the acquired masking information;
Masking means for masking a masking target based on the determination result;
An information processing apparatus comprising:
マスキング情報が埋め込まれた文書をスキャンして電子データに変換するスキャン手段をさらに備え、
前記取得手段は、前記スキャン手段が変換した電子データから前記マスキング情報を取得することを特徴とする請求項1記載の情報処理装置。
Scanning means for scanning a document with masking information embedded therein and converting it into electronic data,
The information processing apparatus according to claim 1, wherein the acquisition unit acquires the masking information from the electronic data converted by the scanning unit.
前記マスキング対象は電子データに含まれ、
前記マスキング手段によりマスキング対象がマスキングされた前記電子データを出力する出力手段をさらに備えることを特徴とする請求項1記載の情報処理装置。
The masking object is included in electronic data,
2. The information processing apparatus according to claim 1, further comprising output means for outputting the electronic data masked by the masking means.
前記出力手段は、非マスキング対象部分の文字の間隔を変更して出力することを特徴とする請求項3に記載の情報処理装置。   The information processing apparatus according to claim 3, wherein the output unit changes the interval between characters in the non-masking target part. 前記出力手段は、非マスキング対象部分の文字の間隔を変更する際に、行単位、段落単位、ページ単位、文書単位、または、文単位のいずれかを処理単位として文字間の変更処理を行うことを特徴とする請求項4に記載の情報処理装置。   The output means, when changing the character spacing of the non-masking target part, performs a change process between characters by using any one of a unit of line, paragraph, page, document, or sentence as a processing unit. The information processing apparatus according to claim 4. 前記マスキング情報は、マスキング対象の位置および長さの少なくともいずれかを含むことを特徴とする請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the masking information includes at least one of a position and a length to be masked. 前記マスキング情報は、マスキング対象のキーワードであって、
前記決定手段は、前記マスキング対象が含まれる電子データをキーワードで検索することによりマスキング対象を特定し、該マスキング対象の長さと独立して前記マスキング幅を決定することを特徴とする請求項1記載の情報処理装置。
The masking information is a keyword to be masked,
2. The determination unit according to claim 1, wherein the determination unit specifies a masking target by searching electronic data including the masking target with a keyword, and determines the masking width independently of a length of the masking target. Information processing device.
前記決定手段は、マスキング幅を固定長とする、または、マスキング幅をランダムな長さとすることを特徴とする請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the determining unit sets the masking width to a fixed length or sets the masking width to a random length. 前記マスキング情報は、マスキング対象とは独立に決定されたマスキング幅を含み、
前記決定手段は、前記マスキング情報に含まれるマスキング幅に基づいてマスキング幅を決定することを特徴とする請求項1記載の情報処理装置。
The masking information includes a masking width determined independently of a masking target,
The information processing apparatus according to claim 1, wherein the determining unit determines a masking width based on a masking width included in the masking information.
前記マスキング情報は電子透かし、QRコード、またはXMLタグとして前記文書に埋め込まれており、
前記取得手段は、前記電子透かし、QRコード、またはXMLタグを解析してマスキング情報を取得することを特徴とする請求項2記載の情報処理装置。
The masking information is embedded in the document as a digital watermark, QR code, or XML tag,
The information processing apparatus according to claim 2, wherein the acquisition unit acquires masking information by analyzing the digital watermark, QR code, or XML tag.
マスキング対象を特定するマスキング情報を取得する取得工程と、
前記取得したマスキング情報に基づいてマスキング対象の長さと独立してマスキング幅を決定する決定工程と、
前記決定結果に基づいてマスキング対象をマスキングするマスキング工程と、
を備えることを特徴とする情報処理方法。
An acquisition step of acquiring masking information for specifying a masking target;
A determination step of determining a masking width independently of the length of a masking target based on the acquired masking information;
A masking step of masking a masking target based on the determination result;
An information processing method comprising:
コンピュータを請求項1乃至10のいずれか1項に記載の情報処理装置として機能させるためのプログラム。   A program for causing a computer to function as the information processing apparatus according to any one of claims 1 to 10. 請求項12に記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。   A computer-readable storage medium storing the program according to claim 12.
JP2007319855A 2007-12-11 2007-12-11 Information processor and information processing method Pending JP2009145973A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007319855A JP2009145973A (en) 2007-12-11 2007-12-11 Information processor and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007319855A JP2009145973A (en) 2007-12-11 2007-12-11 Information processor and information processing method

Publications (1)

Publication Number Publication Date
JP2009145973A true JP2009145973A (en) 2009-07-02

Family

ID=40916545

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007319855A Pending JP2009145973A (en) 2007-12-11 2007-12-11 Information processor and information processing method

Country Status (1)

Country Link
JP (1) JP2009145973A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011170637A (en) * 2010-02-18 2011-09-01 Nikon Corp Information processor
US9013399B2 (en) 2010-02-18 2015-04-21 Nikon Corporation Information processing device, portable device and information processing system
JP2016021083A (en) * 2014-07-11 2016-02-04 日本精工株式会社 Document masking system, document masking method, and document masking program
JP2016062284A (en) * 2014-09-18 2016-04-25 日本精工株式会社 Document masking system, document masking method, and document masking program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011170637A (en) * 2010-02-18 2011-09-01 Nikon Corp Information processor
US9013399B2 (en) 2010-02-18 2015-04-21 Nikon Corporation Information processing device, portable device and information processing system
US9626151B2 (en) 2010-02-18 2017-04-18 Nikon Corporation Information processing device, portable device and information processing system
JP2016021083A (en) * 2014-07-11 2016-02-04 日本精工株式会社 Document masking system, document masking method, and document masking program
JP2016062284A (en) * 2014-09-18 2016-04-25 日本精工株式会社 Document masking system, document masking method, and document masking program

Similar Documents

Publication Publication Date Title
US8595614B2 (en) Document generating apparatus, document generating method, computer program and recording medium
US20030004991A1 (en) Correlating handwritten annotations to a document
US8225200B2 (en) Extracting a character string from a document and partitioning the character string into words by inserting space characters where appropriate
US6678409B1 (en) Parameterized word segmentation of unsegmented text
US20120117461A1 (en) Document generating apparatus, document generating method, computer program and recording medium
JP5661663B2 (en) Information extraction device
JP2009053932A (en) Document image processor and document image processing program
JP2009145973A (en) Information processor and information processing method
US20070127085A1 (en) Printing system, printing method and program thereof
US7987494B1 (en) Method and apparatus providing end to end protection for a document
JP2003186889A (en) Method and apparatus for annotating document and generating summary from document image
JP2006276905A (en) Translation device, image processing device, image forming device, and translation method and program
JP2010108296A (en) Information processor and information processing method
JP5612974B2 (en) Serif check device, serif check method, and program
JP2010105191A (en) Image processing apparatus
JP2009205209A (en) Document image processor and document image processing program
JP4848866B2 (en) Image processing apparatus and program
JP2006217035A (en) Printer, image processing apparatus, image processing system, image processing method
JP2006264062A (en) Variable printer and variable printing system
US20050188301A1 (en) Method for providing data for a sheet, in particular for creating a print, and sheet provided thereby
CN108509393A (en) A kind of method and apparatus of edit text message
KR100366657B1 (en) Method of reverse-transforming print output image data to text data file and apparatus therefor
KR101196412B1 (en) Host apparatus capable of selective printing and printing method
JPH0631983A (en) Printer device
JP4185645B2 (en) Image processing system, image processing method, and computer-readable storage medium

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630