JP2012216083A - Document creation apparatus, document creation program, document creation method, and leakage source identifying system using document creation apparatus - Google Patents

Document creation apparatus, document creation program, document creation method, and leakage source identifying system using document creation apparatus Download PDF

Info

Publication number
JP2012216083A
JP2012216083A JP2011080959A JP2011080959A JP2012216083A JP 2012216083 A JP2012216083 A JP 2012216083A JP 2011080959 A JP2011080959 A JP 2011080959A JP 2011080959 A JP2011080959 A JP 2011080959A JP 2012216083 A JP2012216083 A JP 2012216083A
Authority
JP
Japan
Prior art keywords
replacement
document
character string
replaceable
locations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011080959A
Other languages
Japanese (ja)
Inventor
Motomu Ito
求 伊藤
Masayuki Nihei
正之 二瓶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nifty Corp
Original Assignee
Nifty Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nifty Corp filed Critical Nifty Corp
Priority to JP2011080959A priority Critical patent/JP2012216083A/en
Publication of JP2012216083A publication Critical patent/JP2012216083A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Storage Device Security (AREA)

Abstract

PROBLEM TO BE SOLVED: To create a document for enhancing the possibility of identifying the source of any document leakage.SOLUTION: A document creation apparatus that creates replacement documents of the number to be distributed in which character strings in electronic documents are replaced with different character strings comprises replaceable part specifying means that specifies replaceable parts, where the character strings in the electronic documents are replaceable with the different character strings, by referencing a database in which target character strings to be searched for in the electronic documents are stored in association with replacing character strings; and replacing means that selects a prescribed number of replacement parts to be actually replaced out of the replaceable parts so that the combination of replacement parts in a replacement document does not coincide with the combination of replacement parts in another replacement document, and creates the replacement document by replacing the character strings in the selected replacement parts with replacing character strings matching the target character strings to be searched for that coincide with the respectively pertinent character strings.

Description

本発明は、文書の漏洩元特定の可能性を高めるための文書を作成する文書作成装置、文書作成プログラム、文書作成方法及び文書作成装置を用いた漏洩元特定システムに関する。   The present invention relates to a document creation device, a document creation program, a document creation method, and a leak source identification system using a document creation device for creating a document for increasing the possibility of specifying a document leakage source.

近年、企業、官公庁、学校、病院等の内部の機密情報(電子文書等)が外部に漏れてしまう情報漏洩が問題となっている。そのため、情報漏洩を防止すること及び情報漏洩を行った情報漏洩元を特定することが、ますます重要とされている。この情報漏洩の問題に対処する技術としては、電子文書にIDを付加することや電子透かしを用いる技術が知られている。また、その他の技術として、文書の特徴を捕捉することや文書間の類似度を算出することで、ある文書が他の文書を無断で引用しているか否か等を判断する技術が知られている。   In recent years, there has been a problem of information leakage in which confidential information (electronic documents, etc.) inside companies, government offices, schools, hospitals, etc. leaks outside. For this reason, it is increasingly important to prevent information leakage and identify the information leakage source that performed the information leakage. As a technique for coping with this information leakage problem, a technique for adding an ID to an electronic document or using a digital watermark is known. In addition, as another technique, a technique for determining whether or not a document quotes another document without permission by capturing the characteristics of the document or calculating the similarity between documents is known. Yes.

特開2009−205674号公報JP 2009-205694 A 特開2009−211703号公報JP 2009-217113 A 特開2010−9621号公報JP 2010-9621 A

しかしながら、電子文書に付加されたIDが削除された場合や電子透かしが用いられた電子文書の書写が行われた場合等のように、電子文書が電子文書に含まれるテキスト(文章)が抽出され、あるいは編集された後に、当該電子文書を漏洩されると情報漏洩元の特定が困難になる。また、文章の特徴を捕捉することや文書間の類似度を算出することにより、文章が流出されたものであると判断できた場合であっても、予め当該漏洩された文書の所有者を把握していないと当該文章の漏洩元を特定することは困難である。   However, the text (sentence) included in the electronic document is extracted, such as when the ID added to the electronic document is deleted or when the electronic document is copied using the digital watermark. If the electronic document is leaked after being edited, it becomes difficult to specify the information leak source. In addition, even if it can be determined that the sentence has been leaked by capturing the characteristics of the sentence or calculating the similarity between documents, the owner of the leaked document can be grasped in advance. If not, it is difficult to specify the source of the leakage of the sentence.

そこで、本発明は、文書の漏洩元特定の可能性を高めるための文書を作成することを目的とする。   Therefore, an object of the present invention is to create a document for increasing the possibility of specifying the leakage source of a document.

上記目的を達成するための本発明の第1の態様は、次のような文書作成装置として例示できる。この文書作成装置は、電子文書中の文字列を異なる文字列により置換した置換文書を配布数分作成する文書作成装置であって、電子文書中の、文字列を異なる文字列に置換可能な箇所である置換可能箇所を、前記電子文書中で検索の対象となる検索文字列と置換文字列とが対応付けられて記憶されたデータベースを参照することで特定する置換可能箇所特定手段と、前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を、置換文書内の置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択し、選択された前記置換箇所の文字列を当該文字列と一致する検索文字列と対応する置換文字列により置換することで前記置換文書を作成する置換手段とを備える。   The first aspect of the present invention for achieving the above object can be exemplified as the following document creation apparatus. This document creation device is a document creation device that creates a replacement document in which a character string in an electronic document is replaced by a different character string for the number of distributions, and where the character string can be replaced with a different character string in the electronic document. The replaceable portion specifying means for specifying the replaceable portion by referring to a database in which a search character string to be searched and a replacement character string are stored in association with each other in the electronic document, and the replacement Select a predetermined number of replacement locations to be actually replaced from the possible locations so that the combination of replacement locations in the replacement document does not match the combination of replacement locations in other replacement documents. And replacement means for creating the replacement document by replacing the character string with a replacement character string corresponding to the search character string that matches the character string.

かかる第1の態様では、置換可能箇所の中から置換箇所を、置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択することで、配布先毎に置換箇所の組み合わせが異なる置換文書を作成することが可能となる。すなわち、電子文書の
文字列を意図的に異なる文字列に置換(変換)することで、配布先毎に、異なる文章の置換文書を配布することが可能となる。これによって、当該電子文書が漏洩されたときに、漏洩文書と置換文書とを比較し漏洩文書がどの置換文書と類似するかを確認することで、漏洩文書がどの配布先の人物から漏洩したか(漏洩元)の特定の可能性を高めることが可能となる。
In such a first aspect, by selecting a replacement part from among the replaceable parts so that the combination of the replacement part does not match the combination of the replacement part of other replacement documents, the combination of the replacement part is determined for each distribution destination. Different replacement documents can be created. That is, by replacing (converting) the character string of the electronic document with a different character string intentionally, it is possible to distribute a replacement document with a different sentence for each distribution destination. As a result, when the electronic document is leaked, compare the leaked document with the replacement document and check which replacement document the leaked document is similar to. It becomes possible to increase the specific possibility of (leakage source).

また、配布先毎に異なる文章の置換文書を配布することが可能であるため、元文書である電子文書の文章のみが漏洩した場合や、人の手により書写された後に漏洩された場合においても、置換文書及び漏洩文書の文章の比較により、漏洩元の特定の可能性を高めることが可能となる。   In addition, since it is possible to distribute replacement texts with different texts for each distribution destination, even if only the text of the original electronic document is leaked or if it is leaked after being copied by a human hand By comparing the texts of the replacement document and the leaked document, it is possible to increase the possibility of specifying the leak source.

また、置換可能箇所を、検索文字列と置換文字列が対応付けられて記憶されたデータベースを参照することで特定するため、データベースに記憶された検索文字列及び置換文字列の数を増やすことで、置換可能箇所の数を増やすことが可能となる。すなわち、置換のパターン(数)を増やすことが可能となり、電子文書の配布先毎に異なる置換文書を数多く作成することが可能となる。   In addition, in order to identify the replaceable portion by referring to the database stored in association with the search character string and the replacement character string, by increasing the number of search character strings and replacement character strings stored in the database Thus, it is possible to increase the number of places that can be replaced. That is, it is possible to increase the number of replacement patterns (number), and it is possible to create many different replacement documents for each electronic document distribution destination.

本発明の第2の態様は、第1の態様に記載する文書作成装置において、前記データベースは、置換方法の種類毎に、検索文字列と置換文字列が対応付けられて記憶されたデータベースであり、前記置換可能箇所特定手段は、前記置換方法の種類のうちユーザにより選択された置換方法の種類毎に前記置換可能箇所を特定し、前記置換手段は、前記選択された各置換方法の種類について、前記選択された置換方法の種類毎に前記特定された前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を選択することを特徴とする。   According to a second aspect of the present invention, in the document creation device described in the first aspect, the database is a database in which a search character string and a replacement character string are stored in association with each type of replacement method. The replaceable part specifying unit specifies the replaceable part for each type of replacement method selected by the user among the types of replacement methods, and the replacement unit is configured to select the type of each selected replacement method. A predetermined number of replacement locations for actual replacement are selected from the identified replaceable locations for each type of the selected replacement method.

かかる第2の態様では、ユーザにより選択された置換方法の種類毎に、検索文字列と置換文字列が対応付けられて記憶されたデータベースを参照し、置換箇所を選択することで、ユーザが置換に使用したい置換方法の種類についての置換を行うことが可能となる。   In the second aspect, for each type of replacement method selected by the user, the user replaces the search character string by referring to a database stored in association with the replacement character string and selecting a replacement location. It is possible to perform replacement for the type of replacement method that is desired to be used.

本発明の第3の態様は、第2の態様に記載する文書作成装置において、ユーザにより前記置換方法の種類が選択されたときに、前記選択された前記置換方法の種類毎に、前記置換方法の種類毎の前記置換箇所の数の初期値と前記置換の種類毎の重み付け値を乗算し、さらに、各置換方法の種類について前記乗算された値を加算することで、置換による前記電子文書の変更度合を示す置換ノイズ値を算出する置換ノイズ算出手段であって、前記置換ノイズ値がユーザにより変更されたときに、変更後の置換ノイズ値及び前記置換方法の種類毎の重み付け値に基づき、前記置換方法の種類毎の置換箇所の数を算出する置換ノイズ算出手段を備え、前記置換手段は、前記置換ノイズ値がユーザにより変更されたときに算出された前記置換方法の種類毎の置換箇所の数分置換箇所を選択することを特徴とする。   According to a third aspect of the present invention, in the document creation device described in the second aspect, when the type of the replacement method is selected by the user, the replacement method is selected for each type of the selected replacement method. By multiplying the initial value of the number of replacement locations for each type by a weighting value for each type of replacement, and further adding the multiplied value for each type of replacement method, Replacement noise calculation means for calculating a replacement noise value indicating the degree of change, when the replacement noise value is changed by a user, based on the replacement noise value after the change and the weighting value for each type of the replacement method, A replacement noise calculating unit that calculates the number of replacement locations for each type of the replacement method, the replacement unit calculating the type of the replacement method calculated when the replacement noise value is changed by a user. And selects the number of substitution positions of substituents locations.

かかる第3の態様では、置換による電子文書の変更度合を示す置換ノイズ値がユーザにより変更されたときに、変更後の置換ノイズ値に基づき置換箇所の数を算出することで、ユーザにより選択された元文書からの変更度合いに応じた置換文書を作成することが可能となる。   In the third aspect, when the replacement noise value indicating the degree of change of the electronic document due to the replacement is changed by the user, the number of replacement locations is calculated based on the replacement noise value after the change, and is selected by the user. It is possible to create a replacement document according to the degree of change from the original document.

本発明の第4の態様は、第2又は第3の態様に記載する文書作成装置において、前記置換方法の種類は、常用漢字又は常用漢字以外の漢字を用いた置換、送り仮名を変更することによる置換、類義語を用いた置換、言葉の誤使用による置換、誤字を用いた置換及び脱字を用いた置換の少なくとも1つを含むことを特徴とする。   According to a fourth aspect of the present invention, in the document creation device described in the second or third aspect, the type of the replacement method is to change the substitution or sending kana using a kanji other than the common kanji or the common kanji. And at least one of substitution using synonyms, substitution due to misuse of words, substitution using typographical errors, and substitution using omissions.

かかる第4の態様では、置換方法の種類を常用漢字又は常用漢字以外の漢字を用いた置
換、送り仮名を変更することによる置換、類義語を用いた置換、言葉の誤使用による置換、誤字を用いた置換及び脱字を用いた置換とすることにより、様々な文字列による置換を行うことが可能となる。また、文章量が少ない場合であっても、当該文章に含まれる文字列に対して上記複数種類の置換を行うことにより、置換のパターン(数)を増やすことが可能となる。すなわち、電子文書の配布先毎に異なる置換文書を数多く作成することが可能となる。
In such a fourth aspect, the type of substitution method is substitution using common or non-common kanji, substitution by changing the kana, substitution using synonyms, substitution due to misuse of words, typographical errors. It is possible to perform substitution with various character strings by performing substitution using substitution and omission. Further, even when the amount of text is small, it is possible to increase the number of replacement patterns (number) by performing the above-described multiple types of replacement on the character string included in the text. That is, it is possible to create many different replacement documents for each electronic document distribution destination.

また、ユーザが公文書について置換文書を作成するとき等は、公文書に誤字、脱字を含むことを避けるために、置換方法の種類として、誤字を用いた置換及び脱字を用いた置換以外の置換方法の種類を選択することが可能となる。すなわち、複数種類の置換方法の中から、ユーザの意向や元文書の内容及び属性に基づいた置換方法の種類による置換を行うこと(置換文書を作成すること)が可能となる。   In addition, when a user creates a replacement document for an official document, the substitution method other than substitution using a typographical error and substitution using a typographical error is used to avoid including typographical errors and typographical errors in the official document. It is possible to select the type of method. That is, it is possible to perform replacement (create a replacement document) according to the type of replacement method based on the user's intention, the contents and attributes of the original document, from among a plurality of types of replacement methods.

本発明の第5の態様は、次のような文書作成プログラムとして例示できる。この文書作成プログラムは、コンピュータに、電子文書中の文字列を異なる文字列により置換した置換文書を配布数分作成させるための文書作成プログラムであって、電子文書中の、文字列を異なる文字列に置換可能な箇所である置換可能箇所を、前記電子文書中で検索の対象となる検索文字列と置換文字列とが対応付けられて記憶されたデータベースを参照することで特定し、前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を、置換文書内の置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択し、選択された前記置換箇所の文字列を当該文字列と一致する検索文字列と対応する置換文字列により置換することで前記置換文書を作成する処理をコンピュータに行わせる。   The fifth aspect of the present invention can be exemplified as the following document creation program. This document creation program is a document creation program for causing a computer to create replacement documents obtained by replacing character strings in an electronic document with different character strings. A replaceable portion that is a replaceable portion can be identified by referring to a database in which a search character string to be searched and a replacement character string are stored in association with each other in the electronic document, and the replaceable portion Select a predetermined number of replacement locations to be actually replaced from the locations so that the combination of replacement locations in the replacement document does not match the combination of replacement locations in other replacement documents, and the characters of the selected replacement locations The computer is caused to perform the process of creating the replacement document by replacing the column with a replacement character string corresponding to the search character string that matches the character string.

かかる第5の態様では、置換可能箇所の中から置換箇所を、置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択することで、配布先毎に置換箇所の組み合わせが異なる置換文書を作成することが可能となる。すなわち、電子文書の文字列を意図的に異なる文字列に置換(変換)することで、配布先毎に、異なる文章の置換文書を配布することが可能となる。これによって、当該電子文書が漏洩されたときに、漏洩文書と置換文書とを比較し漏洩文書がどの置換文書と類似するかを確認することで、漏洩文書がどの配布先の人物から漏洩したか(漏洩元)の特定の可能性を高めることが可能となる。   In the fifth aspect, by selecting a replacement part from among the replaceable parts so that the combination of the replacement part does not coincide with the combination of the replacement part of the other replacement document, the combination of the replacement part is determined for each distribution destination. Different replacement documents can be created. That is, by replacing (converting) the character string of the electronic document with a different character string intentionally, it is possible to distribute a replacement document with a different sentence for each distribution destination. As a result, when the electronic document is leaked, compare the leaked document with the replacement document and check which replacement document the leaked document is similar to. It becomes possible to increase the specific possibility of (leakage source).

また、配布先毎に異なる文章の置換文書を配布することが可能であるため、元文書である電子文書の文章のみが漏洩した場合や、人の手により書写された後に漏洩された場合においても、置換文書及び漏洩文書の文章の比較により、漏洩元の特定の可能性を高めることが可能となる。   In addition, since it is possible to distribute replacement texts with different texts for each distribution destination, even if only the text of the original electronic document is leaked or if it is leaked after being copied by a human hand By comparing the texts of the replacement document and the leaked document, it is possible to increase the possibility of specifying the leak source.

また、置換可能箇所を、検索文字列と置換文字列が対応付けられて記憶されたデータベースを参照することで特定するため、データベースに記憶された検索文字列及び置換文字列の数を増やすことで、置換可能箇所の数を増やすことが可能となる。すなわち、置換のパターン(数)を増やすことが可能となり、電子文書の配布先毎に異なる置換文書を数多く作成することが可能となる。   In addition, in order to identify the replaceable portion by referring to the database stored in association with the search character string and the replacement character string, by increasing the number of search character strings and replacement character strings stored in the database Thus, it is possible to increase the number of places that can be replaced. That is, it is possible to increase the number of replacement patterns (number), and it is possible to create many different replacement documents for each electronic document distribution destination.

本発明の第6態様は、次のような文書作成方法として例示できる。この文書作成方法は、電子文書中の文字列を異なる文字列により置換した置換文書を配布数分作成することが可能なコンピュータを用いた文書作成方法であって、電子文書中の、文字列を異なる文字列に置換可能な箇所である置換可能箇所を、前記電子文書中で検索の対象となる検索文字列と置換文字列とが対応付けられて記憶されたデータベースを参照することで特定し、前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を、置換文書内の置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択し、選択され
た前記置換箇所の文字列を当該文字列と一致する検索文字列と対応する置換文字列により置換することで前記置換文書を作成する。
The sixth aspect of the present invention can be exemplified as the following document creation method. This document creation method is a document creation method using a computer capable of creating a replacement document obtained by replacing a character string in an electronic document with a different character string. A replaceable portion that is a portion that can be replaced with a different character string is identified by referring to a database that is stored in association with a search character string and a replacement character string to be searched in the electronic document, A predetermined number of replacement locations to be actually replaced are selected from the replaceable locations so that a combination of replacement locations in the replacement document does not match a combination of replacement locations in other replacement documents, and the selected replacement The replacement document is created by replacing the character string at the place with the replacement character string corresponding to the search character string that matches the character string.

かかる第6の態様では、置換可能箇所の中から置換箇所を、置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択することで、配布先毎に置換箇所の組み合わせが異なる置換文書を作成することが可能となる。すなわち、電子文書の文字列を意図的に異なる文字列に置換(変換)することで、配布先毎に、異なる文章の置換文書を配布することが可能となる。これによって、当該電子文書が漏洩されたときに、漏洩文書と置換文書とを比較し漏洩文書がどの置換文書と類似するかを確認することで、漏洩文書がどの配布先の人物から漏洩したか(漏洩元)の特定の可能性を高めることが可能となる。   In the sixth aspect, by selecting a replacement part from among the replaceable parts so that the combination of the replacement part does not coincide with the combination of the replacement part of another replacement document, the combination of the replacement part is determined for each distribution destination. Different replacement documents can be created. That is, by replacing (converting) the character string of the electronic document with a different character string intentionally, it is possible to distribute a replacement document with a different sentence for each distribution destination. As a result, when the electronic document is leaked, compare the leaked document with the replacement document and check which replacement document the leaked document is similar to. It becomes possible to increase the specific possibility of (leakage source).

また、配布先毎に異なる文章の置換文書を配布することが可能であるため、元文書である電子文書の文章のみが漏洩した場合や、人の手により書写された後に漏洩された場合においても、置換文書及び漏洩文書の文章の比較により、漏洩元の特定の可能性を高めることが可能となる。   In addition, since it is possible to distribute replacement texts with different texts for each distribution destination, even if only the text of the original electronic document is leaked or if it is leaked after being copied by a human hand By comparing the texts of the replacement document and the leaked document, it is possible to increase the possibility of specifying the leak source.

また、置換可能箇所を、検索文字列と置換文字列が対応付けられて記憶されたデータベースを参照することで特定するため、データベースに記憶された検索文字列及び置換文字列の数を増やすことで、置換可能箇所の数を増やすことが可能となる。すなわち、置換のパターン(数)を増やすことが可能となり、電子文書の配布先毎に異なる置換文書を数多く作成することが可能となる。   In addition, in order to identify the replaceable portion by referring to the database stored in association with the search character string and the replacement character string, by increasing the number of search character strings and replacement character strings stored in the database Thus, it is possible to increase the number of places that can be replaced. That is, it is possible to increase the number of replacement patterns (number), and it is possible to create many different replacement documents for each electronic document distribution destination.

本発明の第7態様は、次のような文書作成システムとして例示できる。この文書作成システムは、電子文書中の文字列を異なる文字列により置換した置換文書を配布数分作成する文書作成装置と類似文書チェック装置を備える漏洩元特定システムであって、文書作成装置が、電子文書中の、文字列を異なる文字列に置換可能な箇所である置換可能箇所を、前記電子文書中で検索の対象となる検索文字列と置換文字列とが対応付けられて記憶されたデータベースを参照することで特定する置換可能箇所特定手段と、前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を、置換文書内の置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択し、選択された前記置換箇所の文字列を当該文字列と一致する検索文字列と対応する置換文字列により置換することで前記置換文書を作成する置換手段と、を備え、類似文書チェック装置が、前記作成された前記置換文書と漏洩された文書である漏洩文書との文章の類似度を算出する類似度算出手段と、を備える。   The seventh aspect of the present invention can be exemplified as the following document creation system. This document creation system is a leakage source identification system comprising a document creation device and a similar document check device for creating replacement documents obtained by replacing character strings in an electronic document with different character strings, and the document creation device includes: A database in which a searchable character string to be searched in the electronic document and a replacement character string are stored in association with each other in the electronic document, where a replaceable character string can be replaced with a different character string. The replaceable part specifying means for specifying by referring to and a predetermined number of replacement parts to be actually replaced from the replaceable parts, the combination of the replacement parts in the replacement document is the replacement part of another replacement document The replacement document is selected by selecting not to match a combination, and replacing the selected replacement character string with a replacement character string corresponding to the search character string that matches the character string. Comprising a substitution means for forming, a similar document checking device, and a similarity calculation means for calculating the similarity of the text with the created the leaked document is a document that has been leaked and substituted document.

かかる第7の態様では、置換可能箇所の中から置換箇所を、置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択することで、配布先毎に置換箇所の組み合わせが異なる置換文書を作成することが可能となる。すなわち、電子文書の文字列を意図的に異なる文字列に置換(変換)することで、配布先毎に、異なる文章の置換文書を配布することが可能となる。これによって、当該電子文書が漏洩されたときに、漏洩文書と置換文書とを比較し漏洩文書がどの置換文書と類似するかを確認することで、漏洩文書がどの配布先の人物から漏洩したか(漏洩元)の特定の可能性を高めることが可能となる。   In the seventh aspect, by selecting a replacement part from among the replaceable parts so that the combination of the replacement part does not match the combination of the replacement part of other replacement documents, the combination of the replacement part is determined for each distribution destination. Different replacement documents can be created. That is, by replacing (converting) the character string of the electronic document with a different character string intentionally, it is possible to distribute a replacement document with a different sentence for each distribution destination. As a result, when the electronic document is leaked, compare the leaked document with the replacement document and check which replacement document the leaked document is similar to. It becomes possible to increase the specific possibility of (leakage source).

また、配布先毎に異なる文章の置換文書を配布することが可能であるため、元文書である電子文書の文章のみが漏洩した場合や、人の手により書写された後に漏洩された場合においても、置換文書及び漏洩文書の文章の比較により、漏洩元の特定の可能性を高めることが可能となる。   In addition, since it is possible to distribute replacement texts with different texts for each distribution destination, even if only the text of the original electronic document is leaked or if it is leaked after being copied by a human hand By comparing the texts of the replacement document and the leaked document, it is possible to increase the possibility of specifying the leak source.

また、置換可能箇所を、検索文字列と置換文字列が対応付けられて記憶されたデータベースを参照することで特定するため、データベースに記憶された検索文字列及び置換文字列の数を増やすことで、置換可能箇所の数を増やすことが可能となる。すなわち、置換のパターン(数)を増やすことが可能となり、電子文書の配布先毎に異なる置換文書を数多く作成することが可能となる。   In addition, in order to identify the replaceable portion by referring to the database stored in association with the search character string and the replacement character string, by increasing the number of search character strings and replacement character strings stored in the database Thus, it is possible to increase the number of places that can be replaced. That is, it is possible to increase the number of replacement patterns (number), and it is possible to create many different replacement documents for each electronic document distribution destination.

また、類似文書チェック装置が、作成された置換文書と漏洩文書との文章の類似度を算出することにより、各類似文書がどの程度元文書である電子文書と類似しているかを正確に判断することが可能となる。   In addition, the similar document check device accurately determines how similar each similar document is to the original electronic document by calculating the similarity between the created replacement document and the leaked document. It becomes possible.

本発明によれば、文書の漏洩元特定の可能性を高めるための文書を作成することが可能となる。   According to the present invention, it is possible to create a document for increasing the possibility of specifying the leakage source of a document.

図1は実施形態1に係る文書作成装置を含む文書の漏洩元の特定を行う漏洩元特定システムの概略を示す概略構成図である。FIG. 1 is a schematic configuration diagram illustrating an outline of a leakage source identification system that identifies a leakage source of a document including the document creation apparatus according to the first embodiment. 図2は実施形態1に係る文書作成装置のハードウェアの一例を示す構成図である。FIG. 2 is a configuration diagram illustrating an example of hardware of the document creation apparatus according to the first embodiment. 図3は実施形態1に係る文書作成装置の機能構成の一例を示す機能ブロック図である。FIG. 3 is a functional block diagram illustrating an example of a functional configuration of the document creation apparatus according to the first embodiment. 図4は実施形態1に係る常用漢字DBのデータ構成例を示す図である。FIG. 4 is a diagram illustrating a data configuration example of the common kanji DB according to the first embodiment. 図5は実施形態1に係る送り仮名DBのデータ構成例を示す図である。FIG. 5 is a diagram illustrating a data configuration example of the sending pseudonym DB according to the first embodiment. 図6は実施形態1に係る類義語DBのデータ構成例を示す図である。FIG. 6 is a diagram illustrating a data configuration example of the synonym DB according to the first embodiment. 図7は実施形態1に係る誤使用DBのデータ構成例を示す図である。FIG. 7 is a diagram illustrating a data configuration example of the misuse DB according to the first embodiment. 図8は実施形態1に係る誤字DBのデータ構成例を示す図である。FIG. 8 is a diagram illustrating a data configuration example of the typographical DB according to the first embodiment. 図9は実施形態1に係る脱字DBのデータ構成例を示す図である。FIG. 9 is a diagram illustrating a data configuration example of the omitted character DB according to the first embodiment. 図10は実施形態1に係る置換ノイズ重み付けDBのデータ構成例を示す図である。FIG. 10 is a diagram illustrating a data configuration example of the replacement noise weighting DB according to the first embodiment. 図11は実施形態1に係る文書作成装置の電子文書置換全体フローを示す図である。FIG. 11 is a diagram showing the entire electronic document replacement flow of the document creation apparatus according to the first embodiment. 図12は実施形態1に係る文書作成装置の元文書登録処理フローを示す図である。FIG. 12 is a diagram illustrating an original document registration process flow of the document creation apparatus according to the first embodiment. 図13は実施形態1に係る元文書登録画面の一例を示す図である。FIG. 13 is a diagram illustrating an example of an original document registration screen according to the first embodiment. 図14は実施形態1に係る元文書の一例を示す図である。FIG. 14 is a diagram illustrating an example of an original document according to the first embodiment. 図15Aは実施形態1に係る文書作成装置の元文書置換処理フローを示す図である。FIG. 15A is a diagram illustrating an original document replacement process flow of the document creation apparatus according to the first embodiment. 図15Bは実施形態1に係る文書作成装置の置換設定変更処理フローを示す図である。FIG. 15B is a diagram illustrating a replacement setting change process flow of the document creation apparatus according to the first embodiment. 図16は実施形態1に係る置換画面の一例を示す図である。FIG. 16 is a diagram illustrating an example of a replacement screen according to the first embodiment. 図17は実施形態1に係る置換画面の一例を示す図である。FIG. 17 is a diagram illustrating an example of a replacement screen according to the first embodiment. 図18は実施形態1に係る置換画面の一例を示す図である。FIG. 18 is a diagram illustrating an example of a replacement screen according to the first embodiment. 図19は実施形態1に係る置換可能箇所データベースのデータ構成例を示す図である。FIG. 19 is a diagram illustrating a data configuration example of a replaceable place database according to the first embodiment. 図20は実施形態1に係る置換文書の例を示す図である。FIG. 20 is a diagram illustrating an example of a replacement document according to the first embodiment. 図21は実施形態1に係る文書作成装置の置換文書登録処理フローを示す図である。FIG. 21 is a diagram showing a replacement document registration process flow of the document creation apparatus according to the first embodiment. 図22は実施形態1に係る置換文書登録画面の一例を示す図である。FIG. 22 is a diagram showing an example of a replacement document registration screen according to the first embodiment. 図23は実施形態1に係る置換結果の結果確認画面の一例を示す図である。FIG. 23 is a diagram illustrating an example of a result confirmation screen for replacement results according to the first embodiment. 図24は実施形態1に係る文書作成装置の漏洩文書特定フローを示す図である。FIG. 24 is a diagram showing a leakage document specifying flow of the document creation apparatus according to the first embodiment. 図25は実施形態1に係る文書作成装置の漏洩文書登録処理フローを示す図である。FIG. 25 is a diagram showing a leaked document registration process flow of the document creation apparatus according to the first embodiment. 図26は実施形態1に係る漏洩文書登録画面の一例を示す図である。FIG. 26 is a diagram illustrating an example of a leaked document registration screen according to the first embodiment. 図27は実施形態1に係る漏洩文書の一例を示す図である。FIG. 27 is a diagram illustrating an example of a leaked document according to the first embodiment. 図28は実施形態1に係る漏洩元確認結果画面の一例を示す図である。FIG. 28 is a diagram illustrating an example of a leakage source confirmation result screen according to the first embodiment. 図29は実施形態2に係る文書作成装置の電子文書置換全体フローを示す図である。FIG. 29 is a diagram showing the entire electronic document replacement flow of the document creation apparatus according to the second embodiment. 図30は実施形態3に係る文書作成装置の電子文書置換全体フローを示す図である。FIG. 30 is a diagram illustrating an entire electronic document replacement flow of the document creation apparatus according to the third embodiment.

以下、本発明を実施するための最良の形態について説明する。なお、以下の各実施形態の構成は例示であり、本発明は以下の構成に限定されない。   Hereinafter, the best mode for carrying out the present invention will be described. In addition, the structure of each following embodiment is an illustration, and this invention is not limited to the following structures.

<実施形態1>
[概略構成]
図1は、本発明の実施形態1に係る文書作成装置を含む文書の漏洩元の特定を行う漏洩元特定システムの概略構成図である。図示するように、本実施形態1の漏洩元特定システムは、文書作成装置1とファイルサーバ20と、類似文書チェック装置30を有する。文書作成装置1は、ネットワークN1を介して、ファイルサーバ20及び類似文書チェック装置30と通信可能となるように接続されている。
<Embodiment 1>
[Outline configuration]
FIG. 1 is a schematic configuration diagram of a leakage source identification system that identifies a leakage source of a document including a document creation apparatus according to Embodiment 1 of the present invention. As shown in the figure, the leakage source identification system of the first embodiment includes a document creation device 1, a file server 20, and a similar document check device 30. The document creation apparatus 1 is connected to be able to communicate with the file server 20 and the similar document check apparatus 30 via the network N1.

文書作成装置1は、本発明に係る「文書作成装置」の一例である。文書作成装置1は、用語データベース18を備えている。以下、データベースを「DB」と呼ぶ。用語DB19は、文書内の文字列を、後述する「置換文字列」である他の文字列で置換するために用いられるDBである。用語DB19は、常用漢字DB191、送り仮名DB192、類義語DB193、誤使用DB194、誤字DB195、脱字DB196を備える。これらのDBには、上述した文字列の置換を行なうための置換文字列である置換ワード等が格納されている。   The document creation device 1 is an example of a “document creation device” according to the present invention. The document creation device 1 includes a term database 18. Hereinafter, the database is referred to as “DB”. The term DB 19 is a DB used to replace a character string in a document with another character string that is a “replacement character string” described later. The term DB 19 includes a common Chinese character DB 191, a sending kana DB 192, a synonym DB 193, an erroneous use DB 194, an erroneous character DB 195, and an escape character DB 196. These DBs store replacement words, which are replacement character strings for replacing the character strings described above.

文書作成装置1は、用語DB19に基づいて、元文書である電子文書に置換文字列を含めた置換文書を作成する。文書作成装置1は、元文書である電子文書及び前記置換文書等を、ネットワークN1を介して、ファイルサーバ20に送信する。   Based on the term DB 19, the document creation device 1 creates a replacement document that includes a replacement character string in an electronic document that is an original document. The document creation apparatus 1 transmits the electronic document that is the original document, the replacement document, and the like to the file server 20 via the network N1.

ファイルサーバ20は、従来のファイルサーバと同様の構成を含む。そのため、ファイルサーバ20の構成についての詳細説明は省略する。ファイルサーバ20は、ネットワークN1を介して、文書作成装置1及び類似文書チェック装置30と通信可能となるよう接続されている。ファイルサーバ20は、ネットワークN1を介して、文書作成装置1から元文書である電子文書及び置換文書等を受信する。   The file server 20 includes a configuration similar to that of a conventional file server. Therefore, detailed description of the configuration of the file server 20 is omitted. The file server 20 is connected to be able to communicate with the document creation device 1 and the similar document check device 30 via the network N1. The file server 20 receives an electronic document, a replacement document, and the like, which are original documents, from the document creation device 1 via the network N1.

類似文書チェック装置30は、ネットワークN1を介して文書作成装置1及びファイルサーバ20と接続する。類似文書チェック装置30は、置換文書と漏洩された文書(漏洩文書)の文章間の類似度を算出する。   The similar document check device 30 is connected to the document creation device 1 and the file server 20 via the network N1. The similar document check device 30 calculates the similarity between sentences of the replacement document and the leaked document (leakage document).

ネットワークN1は、例えば、無線LAN(Local Area Network)、WAN(Wide Area Network)、WiMAX(Worldwide Interoperability for Microwave Access)等の有線及び無線ネットワーク等のいずれか、またはいずれか2以上の組み合わせで例示される。   The network N1 is exemplified by any one of wired and wireless networks such as wireless LAN (Local Area Network), WAN (Wide Area Network), and WiMAX (Worldwide Interoperability for Microwave Access), or any combination of two or more. The

[文書作成装置のハードウェア構成]
図2は、本実施形態1に係る文書作成装置1のハードウェアの構成例を示すハードウェア構成図である。図示するように、文書作成装置1は、CPU(Central Processing Unit)2、主記憶装置3、外部記憶装置4、通信IF(Interface)5、通信バス6、入力装置7、表示装置8を備えている。なお、類似文書チェック装置30についても、図2に示す文書作成装置1と同様のハードウェア構成を備える。
[Hardware configuration of document creation device]
FIG. 2 is a hardware configuration diagram illustrating a hardware configuration example of the document creation apparatus 1 according to the first embodiment. As illustrated, the document creation apparatus 1 includes a CPU (Central Processing Unit) 2, a main storage device 3, an external storage device 4, a communication IF (Interface) 5, a communication bus 6, an input device 7, and a display device 8. Yes. The similar document check device 30 also has the same hardware configuration as the document creation device 1 shown in FIG.

CPU2は、文書作成装置1全体の制御を行い、具体的には、主記憶装置3に実行可能に展開されたプログラムを実行し、文書作成装置1の機能を提供する。CPU2は、通信バス6を介して、文書作成装置1の各装置と接続される。   The CPU 2 controls the entire document creation apparatus 1. Specifically, the CPU 2 executes a program that is loaded in the main storage device 3 so as to be executable, and provides the function of the document creation apparatus 1. The CPU 2 is connected to each device of the document creation device 1 via the communication bus 6.

主記憶装置3は、処理対象のデータ、例えば、元文書である電子文書や電子文書に置換文字列を含めた置換文書等のデータ、あるいは、CPU2が実行するプログラムを保持する。主記憶装置3としては、ROM(Read Only Memory)及びRAM(Random Access Memory)が例示される。   The main storage device 3 holds data to be processed, for example, an electronic document that is an original document, data of a replacement document including a replacement character string in the electronic document, or a program executed by the CPU 2. Examples of the main storage device 3 include a ROM (Read Only Memory) and a RAM (Random Access Memory).

外部記憶装置4は、主記憶装置3に格納されるデータやプログラム等を保存する。例えば、外部記憶装置4は、元文書である電子文書や電子文書に置換文字列を含めた置換文書等のデータを含むようにしてもよい。外部記憶装置4としては、HDD(Hard disk drive)、CD(Compact Disc)、DVD(Digital Versatile Disk)、フロッピー(登録商
標)ディスク(floppy disk、以下、FDと言う)、MO(Magneto-Optical disk)、U
SB(Universal Serial Bus)フラッシュメモリが例示される。CD、DVD、FD、MO、USBフラッシュメモリ等は着脱可能記憶媒体ともいう。
The external storage device 4 stores data and programs stored in the main storage device 3. For example, the external storage device 4 may include data such as an electronic document that is an original document or a replacement document that includes a replacement character string in the electronic document. The external storage device 4 includes an HDD (Hard disk drive), a CD (Compact Disc), a DVD (Digital Versatile Disk), a floppy (registered trademark) disk (hereinafter referred to as FD), and an MO (Magneto-Optical disk). ), U
An SB (Universal Serial Bus) flash memory is exemplified. CD, DVD, FD, MO, USB flash memory, and the like are also called removable storage media.

通信IF5は、ファイルサーバ20及び類似文書チェック装置30と情報の送受信を行うインタフェースである。例えば、通信IF5は、元文書である電子文書や電子文書に置換文字列を含めた置換文書等のデータを、ネットワークN1を介してファイルサーバ20に送信する。また、例えば、通信IF5は、類似文書ユーザ装置30から、後述する文書間の類似度などの情報を、ネットワークN1を介して受信する。   The communication IF 5 is an interface that transmits / receives information to / from the file server 20 and the similar document check device 30. For example, the communication IF 5 transmits data such as an electronic document that is an original document or a replacement document including a replacement character string to the electronic document to the file server 20 via the network N1. Further, for example, the communication IF 5 receives information such as similarity between documents described later from the similar document user device 30 via the network N1.

なお、CPU2が実行するプログラムは、例えば、通信IF5を通じた文書作成装置1外のコンピュータとの通信によりインストールできる。インストールとは、例えば、実行可能なプログラムを外部記憶装置4に展開すること、又は、主記憶装置3に展開することをいう。但し、着脱可能な記憶媒体を通じてプログラムをインストールしてもよい。   Note that the program executed by the CPU 2 can be installed, for example, by communication with a computer outside the document creation apparatus 1 through the communication IF 5. Installation means, for example, developing an executable program in the external storage device 4 or developing it in the main storage device 3. However, the program may be installed through a removable storage medium.

入力装置7は、キーボード、マウス、タッチパネルによって例示される。入力装置7は、ユーザからの入力を受け付ける装置である。マウス、タッチパネルはポインティングデバイスとも呼ばれる。入力装置7は、例えば、文書作成装置1を使用するユーザにより、ユーザID(Identification)、パスワード等のユーザ情報や文書を配布する数である配布数等の入力を受け付ける。   The input device 7 is exemplified by a keyboard, a mouse, and a touch panel. The input device 7 is a device that receives an input from a user. The mouse and touch panel are also called pointing devices. The input device 7 receives, for example, input of user information such as a user ID (Identification) and a password, and the number of distributions, which is the number of documents distributed, by a user who uses the document creation device 1.

表示装置8は、例えば、CRT(Cathode Ray Tube)、液晶表示パネル(LCD:Liquid Crystal Display)、エレクトロルミネッセンス(EL:Electro- Luminescence)パ
ネル等で例示されるディスプレイであって、各種画面を表示する。表示装置8は、例えば、元文書である電子文書に置換文字列を含めた置換文書を作成するための置換画面等を表示する。
The display device 8 is a display exemplified by a CRT (Cathode Ray Tube), a liquid crystal display panel (LCD), an electro-luminescence (EL) panel, and the like, and displays various screens. . The display device 8 displays, for example, a replacement screen for creating a replacement document that includes a replacement character string in the electronic document that is the original document.

[文書作成装置の機能構成]
図3は、本実施形態1に係る文書作成装置1の機能構成を示す機能ブロック図である。
図示するように、文書作成装置1は、置換可能箇所数算出部10、配布可能数算出部11、置換ノイズ算出部12、文書置換部13、送信部14、受信部15、入力部16、表示部17、記憶部18、用語DB19、置換ノイズ重み付けDB1A、ユーザ情報DB1B、置換可能箇所記録DB1C、読み出し部1D、置換箇所記録DB1Eを備えている。CPU2が主記憶装置3などに保持されたプログラムを呼び出して実行することにより、図3の各部の機能が提供される。
[Functional configuration of document creation device]
FIG. 3 is a functional block diagram showing a functional configuration of the document creation apparatus 1 according to the first embodiment.
As shown in the figure, the document creation apparatus 1 includes a replaceable part number calculating unit 10, a distributable number calculating unit 11, a replacement noise calculating unit 12, a document replacing unit 13, a transmitting unit 14, a receiving unit 15, an input unit 16, and a display. Unit 17, storage unit 18, term DB 19, replacement noise weighting DB 1 </ b> A, user information DB 1 </ b> B, replaceable part record DB 1 </ b> C, reading part 1 </ b> D, and replacement part record DB 1 </ b> E. When the CPU 2 calls and executes a program stored in the main storage device 3 or the like, the functions of the respective units in FIG. 3 are provided.

また、用語DB19は、常用漢字DB191、送り仮名DB192、類義語DB193、誤使用DB194、誤字DB195、脱字DB196を備える。   The term DB 19 includes a common Chinese character DB 191, a sending kana DB 192, a synonym DB 193, an erroneous use DB 194, an erroneous character DB 195, and an escape character DB 196.

図4は、常用漢字DB191の構成例を示した図である。図示するように、常用漢字DB191の各行には、No(番号)、分類コード、検索ワード(word)、置換ワードの項目が含まれている。また、図4の各行は、置換前のワードである検索ワードと置換後のワードである置換ワードとの対応付けを示す情報1レコードを表している。   FIG. 4 is a diagram showing a configuration example of the common kanji DB 191. As shown in the figure, each line of the common kanji DB 191 includes items of No (number), classification code, search word (word), and replacement word. Each row in FIG. 4 represents an information 1 record indicating correspondence between a search word that is a word before replacement and a replacement word that is a word after replacement.

図4のNo(番号)は、常用漢字DB191の各行のレコードを識別する情報、例えば、行番号、又は常用漢字DB191が含まれるファイルのレコード番号、主記憶装置3のアドレス等である。図4の分類コードは、置換方法の種類を識別する識別情報であり、例えば、置換方法の種類別に割り当てられた番号や英字と番号の組み合わせによるもの等が例示される。   No. in FIG. 4 is information for identifying a record in each line of the common kanji DB 191, for example, a line number, a record number of a file including the common kanji DB 191, an address of the main storage device 3, or the like. The classification code in FIG. 4 is identification information for identifying the type of replacement method, and examples thereof include numbers assigned for each type of replacement method and combinations of letters and numbers.

実施形態1において「置換方法」とは、文書内の文字列をどのように置換を行うかその方法をいう。「置換方法」としては、常用漢字又は常用漢字以外の漢字を用いて置換を行う方法、送り仮名を変更することで置換を行う方法、類義語を用いて置換を行う方法、言葉の誤使用により置換を行う方法、誤字を用いて置換を行う方法、あるいは脱字を用いて置換を行う方法が例示される。   In the first embodiment, “replacement method” refers to a method of replacing a character string in a document. "Replacement method" includes a method of performing substitution using common or non-common Kanji characters, a method of performing substitution by changing the sending kana, a method of performing substitution using synonyms, and a replacement by misuse of words A method of performing replacement, a method of performing substitution using typographical characters, or a method of performing substitution using omitted characters.

実施形態1において「文字列」とは、文字が1つ以上連続したものをいい、漢字、ひらがな、カタカナ、記号、数字などのうちいずれか1つによるもの、又は2つ以上の組み合わせによるものを含む概念である。   In the first embodiment, the “character string” refers to a string in which one or more characters are continuous, and includes any one of kanji, hiragana, katakana, symbols, numbers, etc., or a combination of two or more. It is a concept that includes.

「常用漢字又は常用漢字以外の漢字を用いて置換を行う方法」は、常用漢字又は常用漢字以外の漢字を用いた文字列を、これらの漢字の読み仮名であるひらがなを用いた文字列で置換する方法、又は常用漢字の読み仮名であるひらがなを用いた文字列を、常用漢字を用いた文字列で置換する方法をいう。   "Replacement using common kanji or non-common kanji" replaces a character string using a kanji other than a common kanji or a common kanji with a character string using the hiragana that is the reading of these kanji Or a method of replacing a character string using hiragana, which is a reading of common kanji, with a character string using common kanji.

「送り仮名を変更することで置換を行う方法」は、文字列を、当該文字列の送り仮名を変更した文字列により置換を行う方法をいう。   The “method of replacing by changing a sending kana” refers to a method of replacing a character string with a character string obtained by changing the sending kana of the character string.

「類義語を用いて置換を行う方法」は、文字列を、当該文字列の類義語である文字列により置換を行う方法をいう。   The “method of replacing using a synonym” refers to a method of replacing a character string with a character string that is a synonym of the character string.

「言葉の誤使用により置換を行う方法」は、正しく使用された言葉(文字列)を、当該言葉について誤使用した言葉(文字列)により置換を行う方法をいう。   The “method of replacing by misuse of words” refers to a method of replacing a correctly used word (character string) with a word (character string) misused for the word.

「誤字を用いて置換を行う方法」は、誤字のない文字列を、当該文字列に誤字を含ませた文字列により置換を行う方法をいう。   The “method of replacing using a typographical character” refers to a method of replacing a character string having no typographical character with a character string including the typographical character in the character string.

「脱字を用いて置換を行う方法」は、脱字のない文字列を、当該文字列に脱字を含ませた文字列により置換を行う方法をいう。   The “method of performing replacement using a missing character” refers to a method of replacing a character string without a missing character with a character string in which the character string includes a missing character.

また、実施形態1において、「置換方法の種類」とは、文字列の置換を行う方法(置換方法)の種類をいう。「置換方法の種類」としては、「常用漢字又は常用漢字以外の漢字を用いた置換」、「送り仮名を変更することによる置換」、「類義語を用いた置換」、「言葉の誤使用による置換」、「誤字を用いた置換」、あるいは「脱字を用いた置換」等が例示される。以下、これらの「置換方法の種類」をそれぞれ、「常用漢字」、「送り仮名」、「類義語」、「誤使用」、「誤字」、「脱字」と呼ぶ。   In the first embodiment, the “type of replacement method” refers to the type of method for replacing a character string (replacement method). “Replacement method types” include “replacement using common or non-common kanji”, “replacement by changing the kana”, “replacement using synonyms”, “replacement due to misuse of words” ”,“ Substitution using typographical errors ”,“ substitution using typographical characters ”, and the like. Hereinafter, these “types of replacement methods” are referred to as “common kanji”, “feed kana”, “synonyms”, “misuse”, “wrong”, and “missing”, respectively.

図4の検索ワードは、常用漢字以外の漢字を含む文字列である。検索ワードは、「検索文字列」の一例である。実施形態1において「検索文字列」とは、他の文字列により置換される文字列をいい、当該検索文字列により、電子文書の文章のどの箇所が、他の文字列により置換可能な箇所であるかを特定することが可能となる。   The search word in FIG. 4 is a character string including kanji other than the common kanji. The search word is an example of a “search character string”. In the first embodiment, the “search character string” refers to a character string that is replaced with another character string, and any part of the text of the electronic document can be replaced with another character string by the search character string. It becomes possible to specify whether or not there is.

図4の置換ワードは、常用漢字以外の漢字を含む文字列(検索ワード)を置換するための文字列(置換後のワード)である。置換ワードは、「置換文字列」の一例である。実施形態1において「置換文字列」とは、文字列を置換するための文字列をいい、検索ワードである常用漢字以外の漢字文字列の読み仮名が例示される。検索ワードと置換ワードの組み合わせとしては、「噂」と「うわさ」や、「叩く」と「たたく」等が例示される。意図的に文書内の文字列を置換文字列に変換(置換)することで、当該文書が漏洩された際に漏洩元を特定する可能性を高めることが可能となる。   The replacement word in FIG. 4 is a character string (word after replacement) for replacing a character string (search word) including a kanji other than the common kanji. The replacement word is an example of a “replacement character string”. In the first embodiment, the “replacement character string” refers to a character string for replacing a character string, and is exemplified by a reading kana of a kanji character string other than a regular kanji that is a search word. Examples of combinations of search words and replacement words include “rumors” and “rumors”, “slap” and “tap”, and the like. By intentionally converting (substituting) a character string in a document into a replacement character string, it is possible to increase the possibility of specifying a leakage source when the document is leaked.

なお、図4の検索ワードは、常用漢字以外の漢字を含む文字列に限らず、常用漢字を含む文字列であってもよい。また、図4の検索ワードは、常用漢字の読み仮名であってもよい。この場合は、図4の置換ワードが当該常用漢字の読み仮名に対応する常用漢字を用いた文字列となる。   The search word in FIG. 4 is not limited to a character string including kanji other than the common kanji, but may be a character string including common kanji. Further, the search word in FIG. 4 may be a reading kana of common kanji. In this case, the replacement word in FIG. 4 is a character string using the common kanji corresponding to the reading kana of the common kanji.

図5〜図9はそれぞれ、送り仮名DB192、類義語DB193、誤使用DB194、誤字DB195、脱字DB196の構成例を示した図である。図5〜9に示すように、図4の常用漢字DBと同様、送り仮名DB192、類義語DB193、誤使用DB194、誤字DB195、脱字DB196の各行には、No(番号)、分類コード、検索ワード、置換ワードの項目が含まれている。また、図5〜図9の各行は、置換前のワードである検索ワードと置換後のワードである置換ワードとの対応付けを示す情報1レコードを表している。   FIGS. 5 to 9 are diagrams showing configuration examples of the sending pseudonym DB 192, the synonym DB 193, the misuse DB 194, the typographical DB 195, and the omission DB 196. As shown in FIGS. 5 to 9, as in the common kanji DB in FIG. Contains a replacement word entry. Each row in FIG. 5 to FIG. 9 represents one information record indicating correspondence between a search word that is a word before replacement and a replacement word that is a word after replacement.

図5〜図9のNo(番号)は、各DBの各行のレコードを識別する情報、例えば、行番号、又は各DBが含まれるファイルのレコード番号、主記憶装置3のアドレス等である。図5〜図9の分類コードは、図4の分類コードと同様に、置換の法方法の種類を識別する情報をいい、例えば、置換の方法の種類別に割り当てられた番号や、番号と特定の英字の組み合わせ等が例示される。   5 to 9, No (number) is information for identifying a record of each row of each DB, for example, a row number, a record number of a file including each DB, an address of the main storage device 3, or the like. The classification codes in FIG. 5 to FIG. 9 are the information for identifying the type of replacement method as in the case of the classification code in FIG. 4. For example, the number assigned for each type of replacement method, Examples are combinations of English letters.

図5の送り仮名DB192の検索ワードは、異なる送り仮名を用いることができる文字列である。図5の置換ワードは、検索ワードである文字列について異なる送り仮名を用いた文字列(置換後のワード)である。検索ワードと置換ワードの組み合わせとしては、「行う」と「行なう」や、「組合せ」と「組み合わせ」等が例示される。   The search word in the sending kana DB 192 of FIG. 5 is a character string that can use different sending kana. The replacement word in FIG. 5 is a character string (word after replacement) using a different kana for the character string that is the search word. Examples of combinations of search words and replacement words include “do” and “do”, “combination” and “combination”, and the like.

図6の類義語DB193の検索ワードは、類義語を有する文字列である。図6の置換ワードは、検索ワードである文字列の類義語(置換後のワード)である。検索ワードと置換ワードの組み合わせとしては、「ベンダー」と「ベンダ」や、「ディスカウント」と「値引き」等が例示される。   The search word in the synonym DB 193 in FIG. 6 is a character string having a synonym. The replacement word in FIG. 6 is a synonym (word after replacement) of a character string that is a search word. Examples of combinations of search words and replacement words include “vendor” and “vendor”, “discount” and “discount”, and the like.

図7の誤使用DB194の検索ワードは、日本語として正しく使用されている言葉である文字列である。図7の置換ワードは、検索ワードである文字列について日本語として誤って使用された文字列(置換後のワード)である。検索ワードと置換ワードの組み合わせとしては、「見られる」と「見れる」や、「自分」と「ご自分」等が例示される。   The search word in the misuse DB 194 in FIG. 7 is a character string that is a word that is correctly used as Japanese. The replacement word in FIG. 7 is a character string (word after replacement) that is mistakenly used as Japanese for the character string that is the search word. Examples of combinations of search words and replacement words include “seen” and “seen”, “self” and “self”.

図8の誤字DB195の検索ワードは、誤字のない文字列である。図8の置換ワードは、検索ワードである文字列について誤字を含めた文字列(置換後のワード)である。検索ワードと置換ワードの組み合わせとしては、「弊社」と「幣社」や、「自転車」と「自転者」等が例示される。   The search word in the erroneous character DB 195 in FIG. 8 is a character string having no erroneous characters. The replacement word in FIG. 8 is a character string (word after replacement) including an erroneous character with respect to the character string that is the search word. Examples of the combination of the search word and the replacement word include “our company” and “money company”, “bicycle” and “rotator”, and the like.

図9の脱字DB196の検索ワードは、脱字のない文字列である。図9の置換ワードは、検索ワードである文字列について脱字を含めた文字列(置換後のワード)である。検索ワードと置換ワードの組み合わせとしては、「送ります」と「送ます」や、「されていて」と「されてて」等が例示される。   The search word in the caret DB 196 in FIG. 9 is a character string without a caret. The replacement word in FIG. 9 is a character string (word after replacement) including a missing letter for a character string that is a search word. Examples of combinations of search words and replacement words include “send” and “send”, “being done”, “being done”, and the like.

図10は、置換ノイズ重み付けDB1Aの例を示した図である。図示するように、置換ノイズ重み付けDB1Aの各行には、分類、分類コード、置換ノイズ重み付け値の項目が含まれている。また、図10の各行は、分類、分類コード及び置換ノイズ重み付け値の対応付けを示す情報1レコードを表している。   FIG. 10 is a diagram illustrating an example of the replacement noise weighting DB 1A. As shown in the drawing, each row of the replacement noise weighting DB 1A includes items of classification, classification code, and replacement noise weighting value. Further, each row in FIG. 10 represents an information 1 record indicating the association between the classification, the classification code, and the replacement noise weight value.

図10の分類とは、実施形態1の「置換方法の種類」をいい、上述した、常用漢字、送り仮名、類義語、誤使用、誤字、脱字等が例示される。図10の分類コードは、図4〜9の分類コードと同様に、置換方法の種類を識別する識別情報をいい、例えば、置換方法の種類別に割り当てられた番号等が例示される。   The classification of FIG. 10 refers to the “type of replacement method” in the first embodiment, and examples include the above-mentioned common kanji characters, feed kana characters, synonyms, misuse, typographical errors, omissions, and the like. The classification code in FIG. 10 refers to identification information for identifying the type of replacement method, as in the classification codes in FIGS. 4 to 9. Examples include numbers assigned for each type of replacement method.

図10の置換ノイズ重み付け値は、「置換方法の種類」である分類毎の置換ノイズ値に対する重み付けを行なう値である。実施形態1において「置換ノイズ値」とは、電子文書内の文字列を他の文字列により置換することにより生じる元文書からの変更度合い(ノイズ)の大きさを表す値をいう。   The replacement noise weighting value in FIG. 10 is a value for weighting the replacement noise value for each classification, which is the “type of replacement method”. In the first embodiment, the “replacement noise value” refers to a value indicating the degree of change (noise) from the original document that occurs when a character string in an electronic document is replaced with another character string.

図10の場合では、例えば、分類「常用漢字」については重み付け値が「1」であり、分類「誤字」については重み付け値が「10」である。この場合、分類が「常用漢字」である場合は、置換文字列により文字列が置換された場合の置換ノイズ値は「1」となる。また、分類が「誤字」である場合は、置換文字列により文字列が置換された場合の置換ノイズ値は「10」となる。すなわち、分類が「誤字」である置換文字列により文字列を置換した場合、分類が「常用漢字」である置換文字列により置換した場合より、元文書からの変更度合い(ノイズ)は大きいことを示す。   In the case of FIG. 10, for example, the weighting value is “1” for the classification “common Chinese characters”, and the weighting value is “10” for the classification “wrong characters”. In this case, when the classification is “common kanji”, the replacement noise value when the character string is replaced with the replacement character string is “1”. When the classification is “wrong character”, the replacement noise value when the character string is replaced with the replacement character string is “10”. That is, when a character string is replaced with a replacement character string whose classification is “wrong characters”, the degree of change (noise) from the original document is greater than when a character string is replaced with a replacement character string whose classification is “common kanji”. Show.

上記DB191〜196を備える用語DB19及び置換ノイズ重み付けDB1Aは、あらかじめ主記憶装置3や外部記憶装置4に格納される。また、用語DB19及び置換ノイズ重み付けDB1Aは、例えば、通信IF5を通じた文書作成装置1外のコンピュータとの通信によりインストール可能である。そのため、用語DB19及び置換ノイズ重み付けDB1Aは、例えば、ファイルサーバ20に格納されていてもよい。また、着脱可能な記憶媒体を通じて用語DB19及び置換ノイズ重み付けDB1Aをインストールしてもよい。   The term DB 19 and the replacement noise weighting DB 1A including the DBs 191 to 196 are stored in the main storage device 3 or the external storage device 4 in advance. The term DB 19 and the replacement noise weighting DB 1A can be installed by communication with a computer outside the document creation apparatus 1 through the communication IF 5, for example. Therefore, the term DB 19 and the replacement noise weighting DB 1A may be stored in the file server 20, for example. Further, the term DB 19 and the replacement noise weighting DB 1A may be installed through a removable storage medium.

なお、図4〜9に、各DBの検索ワード及び置換ワードを例示しているが、実施形態1の漏洩元特定システムでは、図4〜9に例示されている検索ワード及び置換ワードに限るものではなく、さらに複数の検索ワード及び置換ワードを格納する。また、必要に応じて、検索ワードや置換ワードを変更、削除、追加することが可能である。   4 to 9 illustrate search words and replacement words of each DB. However, in the leak source identification system according to the first embodiment, the search words and replacement words illustrated in FIGS. 4 to 9 are limited. Instead, a plurality of search words and replacement words are stored. Further, the search word and the replacement word can be changed, deleted, and added as necessary.

また、図10では、置換ノイズ重み付け値の数値が「1」、「2」、「5」、「10」と設定されているが、実施形態1ではこれらの数値に限るものではなく、任意で設定可能な値である。また、置換ノイズ重み付け値は、必要に応じて、変更可能である。   In FIG. 10, the numerical values of the replacement noise weighting values are set to “1”, “2”, “5”, and “10”. It is a settable value. Further, the replacement noise weighting value can be changed as necessary.

ユーザ情報DB1Bには、文書作成装置1へのアクセスが許可されたユーザの、ユーザを一意に特定するユーザ情報が記憶(登録)される。ユーザ情報としては、ユーザの電話番号や、ユーザID、パスワードなどが例示される。なお、ユーザ情報データベース1Bはファイルサーバ20へのアクセスが許可されたユーザについてのユーザ情報が記憶されるようにしてもよい。   In the user information DB 1B, user information that uniquely identifies a user who is permitted to access the document creation apparatus 1 is stored (registered). As user information, a user's telephone number, user ID, a password, etc. are illustrated. Note that the user information database 1B may store user information regarding users who are permitted to access the file server 20.

置換可能箇所記録DB1Cは、文書内の置換可能箇所を一意に特定する情報を記録(格納)するDBである。実施形態1において「置換可能箇所」とは、文書内の、他の文字列(置換文字列)により置換可能な文字列(検索文字列)が存在する箇所をいう。置換可能箇所を特定する情報としては、置換可能箇所が存在する頁番号、行番号、行の先頭文字からの当該箇所までの文字数などの組み合わせによるものや、文章の先頭文字からの当該箇所までの文字数などが例示される。   The replaceable part record DB 1C is a DB that records (stores) information that uniquely specifies a replaceable part in a document. In the first embodiment, “replaceable part” refers to a part in a document where a character string (search character string) that can be replaced by another character string (replacement character string) exists. Information that identifies the replaceable part includes information such as the page number, line number, and the number of characters from the first character of the line to the relevant part, or from the first character of the sentence to the relevant part. The number of characters is exemplified.

置換可能箇所記録DB1Cには、置換可能箇所を特定する情報及び当該置換可能箇所に存在する文字列(検索ワード)などが対応付けて記憶される。なお、置換可能箇所記録DB1Cには、さらに、置換ワード、分類、分類コード、置換可能箇所数、置換ノイズ値などの情報が記憶されてもよい。   In the replaceable part record DB 1C, information for specifying a replaceable part and a character string (search word) existing in the replaceable part are stored in association with each other. The replaceable part record DB 1C may further store information such as a replacement word, a classification, a classification code, the number of replaceable parts, and a replacement noise value.

置換箇所記録DB1Eは、置換箇所を一意に特定する情報を記録(格納)するデータベースである。実施形態1において「置換箇所」とは、文書内で実際に置換を行う箇所をいう。置換箇所を特定する情報としては、置換箇所が存在する頁番号、行番号、行の先頭文字からの当該箇所までの文字数などの組み合わせによるものや、文章の先頭文字からの当該箇所までの文字数などが例示される。   The replacement part record DB 1E is a database that records (stores) information that uniquely specifies a replacement part. In the first embodiment, “replacement location” refers to a location where replacement is actually performed in a document. Information specifying the replacement location includes information such as the page number where the replacement location exists, the line number, the number of characters from the first character of the line to the relevant location, the number of characters from the first character of the sentence to the relevant location, etc. Is exemplified.

置換箇所記録DB1Eには、置換文書毎に、置換箇所を特定する情報及び当該置換箇所に存在する文字列(検索ワード)に加え、置換文書を識別する情報である置換文書の識別情報などが対応付けて記憶される。置換文書の識別情報としては、置換文書毎に定められた番号や、置換文書に一時的に設定されたファイル名などが例示される。なお、置換箇所記録DB1Eには、さらに、置換ワード、分類、分類コード、置換箇所数、置換ノイズ値などの情報が記憶されてもよい。   In the replacement part record DB 1E, for each replacement document, in addition to the information for specifying the replacement part and the character string (search word) existing in the replacement part, the identification information of the replacement document, which is information for identifying the replacement document, corresponds. It is memorized. Examples of the replacement document identification information include a number determined for each replacement document and a file name temporarily set in the replacement document. The replacement location record DB 1E may further store information such as replacement words, classifications, classification codes, the number of replacement locations, and replacement noise values.

置換可能箇所数算出部10は、用語DB19に基づき、置換を行なう対象(元文書)である電子文書の中で、置換ワードによる置換が可能な箇所である置換可能箇所の数(置換可能箇所数)を算出する。具体的には、用語DB19が備えるDB191〜196に含まれている全検索ワード(検索文字列)について、各検索ワードと同じ文字列が電子文書内に何箇所存在するか、すなわち置換可能箇所数をカウント(算出)する。そして、各検索ワードについての置換可能箇所数の算出結果を、置換方法の種類である分類毎に加算(合計)する。これにより、置換方法の種類(分類)毎に、電子文書内の置換可能箇所数を求めることが可能となる。   Based on the term DB 19, the replaceable part number calculating unit 10 calculates the number of replaceable parts (number of replaceable parts) that can be replaced with replacement words in the electronic document to be replaced (original document). ) Is calculated. Specifically, for all search words (search character strings) included in the DBs 191 to 196 included in the term DB 19, how many character strings are present in the electronic document as the search words, that is, the number of replaceable parts Is counted (calculated). Then, the calculation result of the number of replaceable locations for each search word is added (totaled) for each classification that is the type of replacement method. As a result, the number of replaceable places in the electronic document can be obtained for each type (classification) of the replacement method.

なお、同一の検索ワードについて、当該検索ワードと同じ文字列が電子文書内に複数箇所存在する場合、当該検索ワードについての置換可能箇所数は1とせず、当該複数箇所分の数とする。なお、上記では、置換可能箇所数算出部10は、用語DB19が備える全てのDB191〜196に含まれている検索ワードについて置換可能箇所数を算出することとした。しかしながら、実施形態1の漏洩特定システムの処理はこれに限るものではなく
、置換可能箇所数算出部10は、選択された分類に対応するDBに含まれている検索ワードについてのみ置換可能箇所数を算出するようにしてもよい。
When there are a plurality of character strings that are the same as the search word in the electronic document for the same search word, the number of replaceable locations for the search word is not set to 1, but the number for the plurality of locations. In the above description, the replaceable part number calculation unit 10 calculates the number of replaceable parts for the search words included in all the DBs 191 to 196 included in the term DB 19. However, the processing of the leakage specifying system according to the first embodiment is not limited to this, and the replaceable part number calculating unit 10 calculates the number of replaceable parts only for the search words included in the DB corresponding to the selected classification. You may make it calculate.

さらに、置換可能箇所数算出部10は、電子文書内の置換可能箇所を特定する情報を、各置換可能箇所の文字列(検索ワード)などと対応付けて、置換可能箇所記録DB1Cに記憶する。なお、置換可能箇所DB1Cには、さらに、置換ワード、分類、分類コード、置換可能箇所数、置換ノイズ値などの情報が記憶されてもよい。   Furthermore, the number-of-replaceable-parts calculation unit 10 stores information for identifying the replaceable parts in the electronic document in the replaceable part record DB 1C in association with the character string (search word) of each replaceable part. In addition, information such as a replacement word, a classification, a classification code, the number of replaceable places, and a replacement noise value may be further stored in the replaceable place DB1C.

配布可能数算出部11は、置換可能箇所数算出部10が算出した分類毎の置換可能箇所数と分類毎の置換箇所の数(置換箇所数)に基づき、全ての置換箇所の組み合わせ(パターン)数である配布可能数を算出する。配布可能数とは、文書の配布先に同一の文章(置換箇所が同一である文章)の文書を渡さないことを前提とし、選択された分類の置換ワードによって、置換箇所の組み合わせが異なる文章を、幾つ作成可能かを示す数値である。すなわち、配布可能数算出部11は、分類毎の置換可能箇所の中から置換箇所数分の置換箇所を選択する組合せの数を算出する。   The distributable number calculation unit 11 combines all the replacement parts (pattern) based on the number of replaceable parts for each classification calculated by the replaceable part number calculator 10 and the number of replacement parts for each classification (number of replacement parts). Calculate the distributable number, which is a number. The number that can be distributed is based on the premise that documents with the same sentence (sentences with the same replacement part) are not passed to the document distribution destination, and sentences with different combinations of replacement parts depending on the replacement word of the selected category. , A number indicating how many can be created. In other words, the distributable number calculating unit 11 calculates the number of combinations for selecting the replacement places for the number of replacement places from the replaceable places for each classification.

置換ノイズ算出部12は、置換ノイズ重み付けDB1Aを参照することで、置換ノイズ重み付け値に基づき、置換ノイズ値を算出する。具体的には、置換ノイズ重み付けDB1Aにおいて、ユーザに選択された分類毎に対応付けられている置換ノイズ重み付け値と分類毎の置換数を乗算し、この分類毎に乗算された置換数を加算したものを置換ノイズ値とする。   The replacement noise calculation unit 12 calculates the replacement noise value based on the replacement noise weighting value by referring to the replacement noise weighting DB 1A. Specifically, in the replacement noise weighting DB 1A, the replacement noise weighting value associated with each classification selected by the user is multiplied by the number of replacements for each classification, and the number of replacements multiplied for each classification is added. This is the replacement noise value.

例えば、分類「常用漢字」と分類「類義語」がユーザにより選択された場合、各分類の置換数は初期値(例えば、1)に設定される。置換ノイズ重み付けDB1Aにおいて分類「常用漢字」及び「類義語」はそれぞれ、置換ノイズ重み付け値が“1”、“2”と対応付けられている。この場合の置換ノイズ値は、3(=1×1+2×1)となる。   For example, when the category “common Chinese characters” and the category “synonyms” are selected by the user, the number of replacements for each category is set to an initial value (for example, 1). In the replacement noise weighting DB 1A, the classifications “common kanji” and “synonyms” are associated with replacement noise weighting values “1” and “2”, respectively. In this case, the replacement noise value is 3 (= 1 × 1 + 2 × 1).

文書置換部13は、置換を行なう対象(元文書)である電子文書内の置換箇所について、置換ワード(置換文字列)による置換を行なう。例えば、電子文書内の、分類「送り仮名」のDBに含まれる検索ワード「行う」が存在する箇所について置換が行なわれる場合、当該箇所の「行う」を、送り仮名DB192において検索ワード「行う」に対応付けられた置換ワード「行なう」により置換を行なう。   The document replacement unit 13 performs replacement with a replacement word (replacement character string) for a replacement location in the electronic document that is a target to be replaced (original document). For example, when a place where the search word “perform” included in the DB of the classification “transmission kana” exists in the electronic document is replaced, “perform” of the corresponding section is replaced with the search word “perform” in the transmission kana DB 192. The replacement is performed by the replacement word “perform” associated with.

また、文書置換部13は、電子文書内の置換箇所を特定する情報を、各置換箇所の文字列(検索ワード)などと対応付けて、置換箇所記録DB1Eに記憶する。なお、置換箇所記録DB1Eには、さらに、置換ワード、分類、分類コード、置換箇所数、置換ノイズ値などの情報が記憶されてもよい。   Further, the document replacement unit 13 stores information for specifying a replacement part in the electronic document in the replacement part record DB 1E in association with a character string (search word) of each replacement part. The replacement location record DB 1E may further store information such as replacement words, classifications, classification codes, the number of replacement locations, and replacement noise values.

送信部14は、電子文書などのデータを外部の装置やサーバへ送信(登録)させる。送信部14は、例えば、置換を行う対象となる元文書である電子文書や置換が行われた置換文書をファイルサーバ20へ送信(登録)する。また、送信部14は、例えば、漏洩された文書である漏洩文書を類似文書チェック装置30へ送信(登録)する。   The transmission unit 14 transmits (registers) data such as an electronic document to an external device or server. For example, the transmission unit 14 transmits (registers) an electronic document that is an original document to be replaced or a replacement document that has been replaced to the file server 20. For example, the transmission unit 14 transmits (registers) a leaked document that is a leaked document to the similar document check device 30.

受信部15は、他の装置やサーバが各種データを受信する。受信部15は、例えば、類似文書チェック装置30から、漏洩文書と類似文書の類似度等を受信する。   The receiving unit 15 receives various data by other devices and servers. The receiving unit 15 receives, for example, the similarity between the leaked document and the similar document from the similar document check device 30.

入力部16は、入力装置7から、ユーザによる操作入力により発生するイベントを受け付ける。入力部16は、例えば、ユーザからのユーザ情報の入力や分類などの選択操作により発生するイベント等を受け付ける。   The input unit 16 receives from the input device 7 an event generated by an operation input by a user. The input unit 16 receives, for example, an event generated by a selection operation such as input of user information or classification from a user.

表示部17は、表示装置8に各種画面を表示させる。表示部17は、元文書登録画面表示部171、置換画面表示部172、置換文書登録画面表示部173、結果確認画面表示部174、漏洩文書登録画面表示部175、漏洩元確認結果画面表示部176を備える。   The display unit 17 displays various screens on the display device 8. The display unit 17 includes an original document registration screen display unit 171, a replacement screen display unit 172, a replacement document registration screen display unit 173, a result confirmation screen display unit 174, a leaked document registration screen display unit 175, and a leak source confirmation result screen display unit 176. Is provided.

元文書登録画面表示部171は、置換を行なう対象(元文書)である電子文書をユーザに選択させ、さらに配布数を入力させるための画面であるファイル登録画面を表示させる。実施形態1において「配布数」とは、置換文書が配布される数であり、例えば配布先の数をいう。   The original document registration screen display unit 171 displays a file registration screen that is a screen for allowing the user to select an electronic document that is a target to be replaced (original document) and for inputting the number of distributions. In the first embodiment, the “number of distributions” is the number of replacement documents distributed, for example, the number of distribution destinations.

置換画面表示部172は、どの置換方法の種類(分類)の置換ワードにより置換を行なうかをユーザに選択させ、また、置換可能箇所数や置換ノイズ値等を視認させるための画面であるファイル置換画面を表示させる。また、置換画面表示部172において、各種設定が行なわれることで、電子文書内の文字列について置換ワードによる置換が行なわれる。   The replacement screen display unit 172 allows the user to select which replacement method type (classification) is used for replacement, and allows the user to visually recognize the number of replaceable locations, replacement noise values, and the like. Display the screen. In addition, by performing various settings in the replacement screen display unit 172, the character string in the electronic document is replaced with a replacement word.

置換文書登録画面表示部173は、置換文書、置換文書の配布先名などを対応付けて保存するための画面であるファイル登録画面を表示する。   The replacement document registration screen display unit 173 displays a file registration screen which is a screen for storing the replacement document and the distribution destination name of the replacement document in association with each other.

結果確認画面表示部174は、元文書や置換文書の内容を視認可能とするプレビュー(preview)画面であるファイル置換結果確認画面を表示する。   The result confirmation screen display unit 174 displays a file replacement result confirmation screen which is a preview screen that allows the contents of the original document and the replacement document to be visually recognized.

漏洩文書登録画面表示部175は、漏洩された文書である漏洩文書をユーザに選択させるための画面である漏洩文書登録画面を表示させる。   The leaked document registration screen display unit 175 displays a leaked document registration screen that is a screen for allowing the user to select a leaked document that is a leaked document.

漏洩元確認結果画面表示部176は、漏洩文書と類似する類似文書の配布先名や漏洩文書と当該類似文の文章間の類似度を視認可能とする画面である漏洩元確認結果画面を表示させる。   The leakage source confirmation result screen display unit 176 displays a leakage source confirmation result screen, which is a screen that makes it possible to visually recognize the distribution destination name of a similar document similar to the leakage document and the similarity between the leakage document and the sentence of the similar sentence. .

記憶部18は、各種データを主記憶装置3及び外部記憶装置4に記憶する。記憶部18は、例えば、置換文書や置換箇所等を主記憶装置3及び外部記憶装置4に記憶する。   The storage unit 18 stores various data in the main storage device 3 and the external storage device 4. The storage unit 18 stores, for example, a replacement document, a replacement part, and the like in the main storage device 3 and the external storage device 4.

読み出し部1Dは、主記憶装置3及び外部記憶装置4から、これらの記憶装置に格納されている各種データを読み出す。読み出し部1Dは、例えば、主記憶装置3又は外部記憶装置4に格納されている元文書や漏洩文書などを読み出す。   The reading unit 1D reads various data stored in these storage devices from the main storage device 3 and the external storage device 4. The reading unit 1D reads, for example, an original document or a leaked document stored in the main storage device 3 or the external storage device 4.

(動作フローの説明:電子文書置換全体フロー)
図11は、実施形態1に係る文書作成装置1の電子文書置換全体フローである。図11を用いて、文書作成装置1の電子文書置換についての全体フローについて説明する。文書作成装置1のCPU2は、主記憶装置3のコンピュータプログラムにより、図11の処理を実行する。
(Explanation of operation flow: Overall flow of electronic document replacement)
FIG. 11 is an overall electronic document replacement flow of the document creation apparatus 1 according to the first embodiment. With reference to FIG. 11, the overall flow of electronic document replacement in the document creation apparatus 1 will be described. The CPU 2 of the document creation device 1 executes the processing of FIG. 11 by the computer program of the main storage device 3.

ユーザが入力装置7を介して所定の方法で置換文書作成処理のためのプログラムの実行を指示すると、まず初めに、ユーザ情報入力画面(図示しない)が表示部17によって表示装置8に表示される。入力部16は、ユーザ情報入力画面において、ユーザからのユーザ情報の入力を受けたか否かを判断する(S101)。ユーザ情報の入力を受けていない場合(S101;No)、再度ステップ101の処理に戻る。入力部16は、ユーザ情報の入力を受けた場合(S101;Yes)、このユーザ情報とユーザ情報DB1Bとの照合を行う(S102)。   When the user instructs execution of a program for replacement document creation processing by a predetermined method via the input device 7, first, a user information input screen (not shown) is displayed on the display device 8 by the display unit 17. . The input unit 16 determines whether or not an input of user information from the user is received on the user information input screen (S101). When the input of user information has not been received (S101; No), the processing returns to step 101 again. When receiving the input of user information (S101; Yes), the input unit 16 collates this user information with the user information DB 1B (S102).

入力部16は、ユーザにより入力されたユーザ情報がユーザ情報DB1Bに登録されて
いるか否かを判断し(S103)、入力されたユーザ情報がユーザ情報DB1Bに登録されていない場合(S103;No)、再度ステップ101の処理に戻る。入力されたユーザ情報がユーザ情報DB1Bに登録されている場合(S103;Yes)、ステップ104の処理に進む。
The input unit 16 determines whether or not user information input by the user is registered in the user information DB 1B (S103), and when the input user information is not registered in the user information DB 1B (S103; No) Then, the process returns to step 101 again. When the input user information is registered in the user information DB 1B (S103; Yes), the process proceeds to step 104.

ステップ104では、元文書である電子文書をファイルサーバに送信(登録)する処理(元文書登録処理)が行われる。元文書登録処理では、ユーザが入力装置7を介して、元文書登録画面にて置換を行いたい電子文書(元文書)を選択すると、読み出し部1Dは当該元文書を主記憶装置3又は外部記憶装置4から読み出す。読みされた元文書は、送信部14によってファイルサーバ20へ送信(登録)される。送信部14がファイルサーバへ元文書を送信すると、ステップ105(S105)の処理に進む。   In step 104, processing (original document registration processing) for transmitting (registering) an electronic document, which is an original document, to the file server is performed. In the original document registration process, when the user selects an electronic document (original document) to be replaced on the original document registration screen via the input device 7, the reading unit 1D stores the original document in the main storage device 3 or the external storage. Read from device 4. The read original document is transmitted (registered) to the file server 20 by the transmission unit 14. When the transmission unit 14 transmits the original document to the file server, the process proceeds to step 105 (S105).

ステップ105では、元文書である電子文書内の文字列を置換ワード(置換文字列)によって置換を行う処理(元文書置換処理)が行われる。元文書置換処理では、ユーザが入力装置7を介して、置換画面にて置換の実行を指示すると、文書置換部13が元文書内の文字列を置換ワードにより置換する。文書置換部13が元文書の置換を行うと、ステップ106の処理に進む。   In step 105, processing for replacing a character string in the electronic document that is the original document with a replacement word (replacement character string) (original document replacement processing) is performed. In the original document replacement process, when the user instructs execution of replacement on the replacement screen via the input device 7, the document replacement unit 13 replaces the character string in the original document with a replacement word. When the document replacement unit 13 replaces the original document, the process proceeds to step 106.

ステップ106では、ステップ106により置換が行われた置換文書と当該置換文書を配布する宛名である配布先名を対応付けて、ファイルサーバ20へ送信(登録)する処理(置換文書登録処理)が行われる。置換文書登録処理では、ユーザが入力装置7を介して、置換文書登録画面にて配布先名の入力を行い保存の実行を指示すると、送信部14が置換文書と配布先名を対応付けてファイルサーバ20へ送信(登録)する。置換文書等をファイルサーバ20へ送信すると、ステップ107に進む。   In step 106, a process (replacement document registration process) is performed in which the replacement document subjected to the replacement in step 106 is associated with the distribution destination name to which the replacement document is distributed and transmitted (registered) to the file server 20. Is called. In the replacement document registration process, when the user inputs the distribution destination name on the replacement document registration screen via the input device 7 and instructs execution of the storage, the transmission unit 14 associates the replacement document with the distribution destination name and creates a file. Transmit (register) to the server 20. When the replacement document or the like is transmitted to the file server 20, the process proceeds to step 107.

記憶部18は、ファイルサーバ20へ送信した置換文書等を主記憶装置3又は外部記憶装置4に記憶する(S107)。   The storage unit 18 stores the replacement document transmitted to the file server 20 in the main storage device 3 or the external storage device 4 (S107).

ステップ107で、置換文書等が主記憶装置3又は外部記憶装置4に記憶されると、文書作成装置1は、本文書作成装置の電子文書置換全体フローを終了する。   When the replacement document or the like is stored in the main storage device 3 or the external storage device 4 in step 107, the document creation device 1 ends the entire electronic document replacement flow of the document creation device.

(動作フローの説明:元文書登録処理)
図12は、実施形態1に係る文書作成装置1の元文書登録処理フローである。図12を用いて、文書作成装置1の元文書登録処理について説明する。文書作成装置1のCPU2は、主記憶装置3のコンピュータプログラムにより、図12の処理を実行する。
(Explanation of operation flow: Original document registration process)
FIG. 12 is an original document registration process flow of the document creation apparatus 1 according to the first embodiment. The original document registration process of the document creation apparatus 1 will be described with reference to FIG. The CPU 2 of the document creation device 1 executes the processing of FIG. 12 by the computer program of the main storage device 3.

ステップ103で、入力されたユーザ情報がユーザ情報DB1Bに登録されている場合(S103;Yes)、元文書登録画面表示部171は、元文書登録画面を表示させる(S1041)。   If the input user information is registered in the user information DB 1B in step 103 (S103; Yes), the original document registration screen display unit 171 displays the original document registration screen (S1041).

図13は、元文書登録画面の一例を示す図である。図示するように、元文書登録画面には、「参照」ボタン、「次へ」ボタン、ファイル名が表示されるテキストボックス、及び配布数が入力されるテキストボックスが用意される。この元文書登録画面で、「参照」ボタンがクリックされると、電子文書を参照(選択)可能な参照画面(図示しない)が表示される。表示された参照画面で電子文書が選択された場合、選択された電子文書のファイル名が、テキストボックスに表示される。なお、ファイル名が表示されるテキストボックスには、ファイル名ではなく、当該ファイルのファイルパスが表示されるようにしてもよい。   FIG. 13 is a diagram showing an example of the original document registration screen. As shown, the original document registration screen includes a “reference” button, a “next” button, a text box for displaying a file name, and a text box for inputting the number of distributions. When a “reference” button is clicked on the original document registration screen, a reference screen (not shown) that allows reference (selection) of the electronic document is displayed. When an electronic document is selected on the displayed reference screen, the file name of the selected electronic document is displayed in a text box. The text box that displays the file name may display the file path of the file instead of the file name.

ユーザにより元文書登録画面上で「参照」ボタンがクリックされ電子文書が選択される
と、入力部16はそのイベントを受信し、読み出し部1Dが、選択された電子文書を主記憶装置3又は外部記憶装置4から読み出す(S1042)。また、同時に、元文書登録画面表示部171が、元文書登録画面のテキストボックスに、選択された電子文書のファイル名を表示する。
When the user clicks the “reference” button on the original document registration screen and selects an electronic document, the input unit 16 receives the event, and the reading unit 1D transmits the selected electronic document to the main storage device 3 or an external device. Read from the storage device 4 (S1042). At the same time, the original document registration screen display unit 171 displays the file name of the selected electronic document in the text box on the original document registration screen.

図14は、元文書の一例として、図13で元文書として選択された「ご案内.txt」の内容を示す図である。本実施形態1では、元文書をこの「ご案内.txt」として、以下説明を行う。   FIG. 14 is a diagram showing the contents of “Guidance.txt” selected as the original document in FIG. 13 as an example of the original document. In the first embodiment, the original document is referred to as “Guidance.txt” and will be described below.

ユーザにより元文書登録画面のテキストボックスに配布数が入力されると、入力部16は入力された配布数を受け付ける(取得する)(S1043)。   When the number of distributions is input to the text box on the original document registration screen by the user, the input unit 16 receives (acquires) the input number of distributions (S1043).

上記のとおり、ユーザによる、元文書登録画面上での電子文書の選択及び配布数の入力が行われた後に、本画面上で「次へ」ボタンがクリックされると、入力部16はそのイベントを受信する。これによって、送信部14が、元文書である電子文書及び元文書の作成者の識別情報などをファイルサーバ20へ送信(登録)する(S1044)。   As described above, after the user selects an electronic document on the original document registration screen and inputs the number of distributions, when the “Next” button is clicked on this screen, the input unit 16 displays the event. Receive. As a result, the transmission unit 14 transmits (registers) the electronic document as the original document and the identification information of the creator of the original document to the file server 20 (S1044).

元文書の作成者の識別情報とは、作成者を一意に特定するための情報であり、作成者の氏名や作成者のIDなどが例示される。作成者の識別情報は、例えば、ステップ101でユーザにより入力されたユーザIDとしてもよい。また、作成者の識別情報は、例えば、元文書登録画面に作成者の識別情報を入力するテキストボックス(図示しない)を用意することで、ユーザに入力させるようにしてもよい。また、作成者の識別情報は、例えば、元文書である電子文書のプロパティに含まれる作成者名を抽出することで取得するようにしてもよい。   The identification information of the creator of the original document is information for uniquely identifying the creator, and examples include the name of the creator and the ID of the creator. The creator identification information may be, for example, the user ID input by the user in step 101. Further, the creator identification information may be input by the user by preparing a text box (not shown) for inputting the creator identification information on the original document registration screen, for example. Further, the creator identification information may be acquired, for example, by extracting the creator name included in the property of the electronic document that is the original document.

送信部14は、元文書及び元文書の作成者の識別情報に加え、日時情報をファイルサーバ20へ送信するようにしてもよい。日時情報とは、日時を一意に特定するものであり、日にちのみの情報や日にち及び時間を組み合わせた情報などを含む概念である。日時情報としては、例えば、元文書等をファイルサーバ20に送信する日時や元文書の作成日時などが例示される。   The transmission unit 14 may transmit date and time information to the file server 20 in addition to the original document and the identification information of the creator of the original document. The date / time information uniquely identifies the date / time, and is a concept including date-only information, information combining date and time, and the like. Examples of the date / time information include the date / time when the original document and the like are transmitted to the file server 20 and the creation date / time of the original document.

送信部14が、元文書をファイルサーバ20へ送信すると、文書作成装置1は、本元文書登録処理フローを終了する。   When the transmission unit 14 transmits the original document to the file server 20, the document creation apparatus 1 ends the original document registration processing flow.

(動作フローの説明:元文書置換処理)
図15Aは、実施形態1に係る文書作成装置1の元文書置換処理フローである。図15Aを用いて、文書作成装置1の元文書置換処理について説明する。文書作成装置1のCPU2は、主記憶装置3のコンピュータプログラムにより、図15Aの処理を実行する。
(Explanation of operation flow: Original document replacement processing)
FIG. 15A is an original document replacement process flow of the document creation apparatus 1 according to the first embodiment. The original document replacement process of the document creation apparatus 1 will be described with reference to FIG. 15A. The CPU 2 of the document creation device 1 executes the processing of FIG. 15A by the computer program of the main storage device 3.

置換可能箇所数算出部10は、元文書登録画面にて選択された電子文書内の置換可能箇所数を算出する(S1051)。置換可能箇所数算出部10は、例えば、DB191〜196毎に、DBに含まれる検索ワードをキーとして電子文書内の文章を走査することで、DB(分類)毎の置換可能箇所数を算出可能となる。   The replaceable part number calculation unit 10 calculates the number of replaceable parts in the electronic document selected on the original document registration screen (S1051). The number-of-replaceable-location calculating unit 10 can calculate the number of replaceable locations for each DB (classification), for example, by scanning the text in the electronic document using the search word included in the DB as a key for each of the DBs 191 to 196. It becomes.

また、ステップ1051では、置換可能箇所数算出部10は、上記で特定された置換可能箇所を、当該置換可能箇所の文字列(検索ワード)などと対応付けて、置換可能箇所記録DB1Cに記憶する。   Further, in step 1051, the replaceable part number calculating unit 10 stores the replaceable part specified above in the replaceable part record DB 1C in association with the character string (search word) of the replaceable part. .

ここで、図14の元文書「ご案内.txt」を例に、置換可能箇所数算出部10の算出方法を説明する。置換可能箇所数算出部10は、用語DBが備えるDB191〜196毎に、
「ご案内.txt」の文章の中に、DBに含まれる各検索ワードが何箇所存在するかを算出する。
Here, the calculation method of the number-of-replaceable portion calculation unit 10 will be described by taking the original document “Guidance.txt” of FIG. The number-of-replaceable-location calculating unit 10 includes the DBs 191 to 196 included in the term DB.
The number of search words included in the DB is calculated in the text “Guidance.txt”.

図19は、置換可能箇所記録データベース1Cのデータ構成例を示す図である。図19には、図14の元文書「ご案内.txt」について、分類毎の置換可能箇所数が算出された結果が示されている。図示するように、置換可能箇所記録データベース1Cの各行には、分類、検索ワード、位置情報、置換ワード、置換可能箇所数の項目が含まれるようにしてもよい。なお、置換可能箇所記録データベース1Cの項目は、これらの項目に加え、分類コードや置換ノイズ値を含むこととしてもよい。   FIG. 19 is a diagram showing a data configuration example of the replaceable place recording database 1C. FIG. 19 shows the result of calculating the number of replaceable places for each classification for the original document “Guidance.txt” in FIG. As shown in the figure, each row of the replaceable portion record database 1C may include items of classification, search word, position information, replacement word, and number of replaceable portions. The items in the replaceable place record database 1C may include a classification code and a replacement noise value in addition to these items.

図19では、「位置情報」として、“1行目, 11文字目”などの、置換可能箇所が存在する行番号と行の先頭文字から当該箇所までの文字数の組み合わせによるものが例示されている。   In FIG. 19, “position information” is exemplified by a combination of a line number where a replaceable part exists and the number of characters from the first character of the line to the relevant part, such as “first line, eleventh character”. .

図14及び図19に示すように、元文書「ご案内.txt」には、検索ワード「炒める」、「嘘」、「行う」、「組合せ」、「ベンダー」、「闇市場」、「程度」、「ディスカウント」、「ユーザ」、「自分」、「あるとのこと」が含まれる。これより、置換可能箇所数算出部10は、各分類「常用漢字」、「送り仮名」、「類義語」、「誤使用」、「誤字」、「脱字」についての置換可能箇所数を、それぞれ、“2”、“2”、“5”、“1”、“0”、“1”と算出することができる。   As shown in FIGS. 14 and 19, the original document “Guidance.txt” includes the search words “stir fry”, “lie”, “do”, “combination”, “vendor”, “black market”, “degree ”,“ Discount ”,“ user ”,“ self ”, and“ something ”. From this, the number-of-replaceable-location calculating unit 10 calculates the number of replaceable locations for each classification “common kanji”, “feed kana”, “synonyms”, “misuse”, “wrong”, “missing”, respectively. “2”, “2”, “5”, “1”, “0”, “1” can be calculated.

なお、図19に示した置換可能箇所記録DB1Cに記憶されたデータは、置換画面表示部172により表示装置8に表示されるようにしてもよい。例えば、置換画面に「置換可能箇所表示」ボタンを用意し、ユーザがこのボタンをクリックすることで、図19に示された表が表示されるようにしてもよい。   The data stored in the replaceable place record DB 1C shown in FIG. 19 may be displayed on the display device 8 by the replacement screen display unit 172. For example, a “replaceable part display” button may be prepared on the replacement screen, and the table shown in FIG. 19 may be displayed when the user clicks this button.

置換可能箇所数算出部10により、分類毎の置換可能箇所数が算出されると、ステップ1052に進む。置換画面表示部172は、置換画面を表示させる(S1052)。   When the number of replaceable places calculation unit 10 calculates the number of replaceable places for each classification, the process proceeds to step 1052. The replacement screen display unit 172 displays a replacement screen (S1052).

図16は、置換画面の初期画面の一例を示す図である。図示するように、置換画面には、元文書のファイル名(又はファイルパス)である元文書名及び配布数を表示させるテキストボックスが用意される。また、置換画面には、適用チェックボックスが用意され、その他表示項目として分類、ノイズレベル、置換可能箇所数、置換数が用意される。また、置換画面には、置換ノイズの表示項目に加え、置換ノイズ値の大きさを視覚的に表示させるスライドバーが用意されている。さらに、置換画面には、配布可能数を表示させるテキストボックス及び「置換」ボタンが用意されている。   FIG. 16 is a diagram illustrating an example of the initial screen of the replacement screen. As shown in the drawing, the replacement screen is provided with a text box for displaying the original document name and the number of distributions which are the file names (or file paths) of the original document. In addition, an application check box is prepared on the replacement screen, and classification, noise level, number of replaceable parts, and number of replacements are prepared as other display items. The replacement screen also includes a slide bar for visually displaying the size of the replacement noise value in addition to the display item of the replacement noise. Furthermore, the replacement screen is provided with a text box for displaying the number of distributions and a “replace” button.

適用チェックボックスには、ユーザが入力装置7(例えば、マウス)を介して選択することで、チェック印が表示される。チェック印としては、“〆”や“レ”などが例示される。分類の欄には、「常用漢字」、「送り仮名」、「類義語」、「誤使用」、「誤字」、「脱字」等、置換方法の種類(分類)が表示される。ノイズレベルの欄には、各分類に対応する置換ノイズ重み付け値が表示される。   A check mark is displayed in the application check box when the user makes a selection through the input device 7 (for example, a mouse). Examples of the check mark include “〆” and “Re”. In the classification column, the type (classification) of the replacement method such as “common kanji”, “feed kana”, “synonym”, “misuse”, “wrong”, “missing”, and the like is displayed. In the noise level column, a replacement noise weighting value corresponding to each classification is displayed.

置換可能箇所数の欄には、分類毎の置換可能箇所数が表示される。置換数の欄には、置換箇所の数である置換箇所数が分類毎に表示される。置換数の欄に表示される置換数の数値は、後述するスライドバーのポイントを左右に移動させると置換ノイズ値が増減するのに伴い、変動する。また、ユーザが直接、置換数の欄に置換数を入力するようにしてもよい。置換数のスライドバーのポイントを移動させた場合の処理については、以下、図18で詳細を説明する。   In the column of the number of replaceable places, the number of replaceable places for each classification is displayed. In the column for the number of replacements, the number of replacement locations, which is the number of replacement locations, is displayed for each classification. The numerical value of the number of replacements displayed in the column of the number of replacements varies as the replacement noise value increases or decreases when a slide bar point described later is moved to the left or right. Alternatively, the user may directly input the replacement number in the replacement number column. Details of the processing when the points of the number of replacement slide bars are moved will be described below with reference to FIG.

置換ノイズの欄には、置換画面上でユーザにより選択された分類毎の置換箇所について、置換ワードによる置換が行われた場合の置換文書の置換ノイズ値が表示される。   In the replacement noise column, the replacement noise value of the replacement document when the replacement portion for each classification selected by the user on the replacement screen is replaced with a replacement word is displayed.

スライドバーは、置換画面上でユーザにより選択された分類毎の置換箇所について、置換ワードによる置換が行われた場合の置換文書の置換ノイズ値の大きさを視認可能とする。スライドバーは、前記置換ノイズ値の取り得る範囲を示すものであり、ユーザによりこのスライドバーのポイント(図26の白丸に相当)を移動させることで、置換ノイズ値を選択(変更)可能とする。例えば、ユーザは、このスライドバーを左にスライドすることで、置換文書が含む置換ノイズ値を下げることが可能となる。   The slide bar makes it possible to visually recognize the magnitude of the replacement noise value of the replacement document when replacement with a replacement word is performed for the replacement portion for each classification selected by the user on the replacement screen. The slide bar indicates the range that the replacement noise value can take, and the replacement noise value can be selected (changed) by moving the point of the slide bar (corresponding to the white circle in FIG. 26) by the user. . For example, the user can lower the replacement noise value included in the replacement document by sliding the slide bar to the left.

スライドバーには、図16のように、置換ノイズ値の取り得る最小値と最大値を表示するようにしてもよい。ここで、スライドバーの最小値は、例えば、原文(元文書)の場合の置換ノイズ値“0”である。これは、元文書の電子文書は置換が行われていないため、置換ノイズを含まないことを意味する。また、スライドバーの最大値は、例えば、選択された分類の置換ワードにより置換を行った置換文書が、最大限含むことが可能である置換ノイズの値(最大置換ノイズ値)である。そのため、分類が選択されていない状態(初期状態)では、図16で示すように、最大置換ノイズ値は“---”や空白などの表示として
もよい。
As shown in FIG. 16, the slide bar may display a minimum value and a maximum value that the replacement noise value can take. Here, the minimum value of the slide bar is, for example, the replacement noise value “0” in the case of the original text (original document). This means that the electronic document of the original document does not include replacement noise because no replacement is performed. Further, the maximum value of the slide bar is, for example, a replacement noise value (maximum replacement noise value) that can be included in the replacement document that has been replaced by the replacement word of the selected classification. Therefore, in a state where the classification is not selected (initial state), the maximum replacement noise value may be displayed as “---” or blank as shown in FIG.

配布可能数のテキストボックスには、置換可能箇所から置換数分の置換箇所を選択する組み合わせ(パターン)数である配布可能数が表示される。   The distributable number text box displays the distributable number, which is the number of combinations (patterns) for selecting the replacement positions corresponding to the replacement number from the replaceable positions.

「置換」ボタンは、元文書を置換ワードにより置換するためのボタンである。ユーザが入力装置7(例えば、マウス)を介して「置換」ボタンをクリックすることで、入力部16はそのイベントを受信する。これによって、文書置換部13が、元文書である電子文書内の文字列を置換ワードにより置換を行う。   The “replace” button is a button for replacing the original document with a replacement word. When the user clicks a “replace” button via the input device 7 (for example, a mouse), the input unit 16 receives the event. Thereby, the document replacement unit 13 replaces the character string in the electronic document that is the original document with the replacement word.

置換画面表示部17は、置換画面に、元文書登録画面で選択された元文書のファイル名である元文書名及び同画面で入力された配布数を表示させる(ステップ1052)。読み出し部1Dは、置換ノイズ重み付けDB1Aに分類毎に対応付けて記憶された置換ノイズ重み付け値を読み出す。これによって、置換画面表示部17は、置換ノイズ重み付け値を、置換画面の各分類に対応する「(ノイズレベル)」欄に表示させる(ステップ1052)。また、置換画面表示部17は、ステップ1051で算出された分類毎の置換可能箇所数を、各分類に対応する置換可能箇所数の欄に表示させる(ステップ1052)。   The replacement screen display unit 17 causes the replacement screen to display the original document name that is the file name of the original document selected on the original document registration screen and the number of distributions input on the same screen (step 1052). The reading unit 1D reads the replacement noise weighting value stored in the replacement noise weighting DB 1A in association with each classification. Thereby, the replacement screen display unit 17 displays the replacement noise weighting value in the “(noise level)” column corresponding to each classification of the replacement screen (step 1052). Further, the replacement screen display unit 17 displays the number of replaceable places for each category calculated in step 1051 in the column of the number of replaceable places corresponding to each category (step 1052).

なお、図16に示すように、置換画面表示部17は、置換画面の初期画面の、適用ボックス、置換数の欄、及び配布可能数の欄を空白表示としてもよい。また、同図に示すように、置換画面表示部17は、置換ノイズの欄には“0”と表示し、それに伴いスライドバーについても最小ノイズ値である“0”にポイントするように表示してもよい。   As shown in FIG. 16, the replacement screen display unit 17 may display the application box, the replacement number column, and the distributable number column in the initial screen of the replacement screen as blank display. Further, as shown in the figure, the replacement screen display unit 17 displays “0” in the column of replacement noise, and accordingly, the slide bar is also displayed so as to point to “0” which is the minimum noise value. May be.

ここで、ステップ1051とステップ1052は順不同である。そのため、置換画面(初期画面)の表示が行われた後に、置換可能箇所数の算出が行われるようにしてもよい。この場合、置換画面表示部17は、置換画面の初期画面において、置換可能箇所数を表示しない、又は全て“0”と表示するようにしてもよい。このようにすると、置換可能箇所数の表示は、初期画面が表示され置換可能箇所数が算出された後に、置換画面表示部17によって行われることとなる。   Here, step 1051 and step 1052 are in no particular order. Therefore, after the replacement screen (initial screen) is displayed, the number of replaceable locations may be calculated. In this case, the replacement screen display unit 17 may not display the number of places that can be replaced on the initial screen of the replacement screen, or may display all “0”. In this way, the number of replaceable locations is displayed by the replacement screen display unit 17 after the initial screen is displayed and the number of replaceable locations is calculated.

ステップ1052で置換画面が表示されると、ステップ1053の処理に進む。   When the replacement screen is displayed in step 1052, the process proceeds to step 1053.

ステップ1053では、まず、ユーザにより、置換画面上で各分類についての適用チェ
ックボックスがクリックされると、入力部16はそのイベントを受信し、選択された分類を受け付ける。これによって、置換画面表示部172が、選択チェックボックスにチェック印(例えば“〆”)を表示させる。また、置換画面表示部172は、選択された「適用」チェックボックスに対応する分類の置換数の欄に、読み出し部1Dにより主記憶装置3等から読み出された置換数の初期値を表示する。
In step 1053, first, when the user clicks the application check box for each category on the replacement screen, the input unit 16 receives the event and accepts the selected category. As a result, the replacement screen display unit 172 displays a check mark (for example, “〆”) in the selection check box. Further, the replacement screen display unit 172 displays the initial value of the number of replacements read from the main storage device 3 or the like by the reading unit 1D in the column for the number of replacements of the classification corresponding to the selected “apply” check box. .

図17は、ユーザによって各分類に対応する適用チェックボックスが選択された場合の置換画面の一例を示す図である。図17に表示される項目については、図16の表示項目と同じであるため、図17の表示項目についての説明は省略する。   FIG. 17 is a diagram illustrating an example of a replacement screen when an application check box corresponding to each classification is selected by the user. The items displayed in FIG. 17 are the same as the display items in FIG. 16, and thus the description of the display items in FIG. 17 is omitted.

図17では、ユーザにより、分類「常用漢字」、「送り仮名」、「類義語」についての適用チェックボックスが選択されている。また、分類「常用漢字」、「送り仮名」、「類義語」の置換数の欄にはそれぞれ、初期値である“1置換”が表示される。図17の例では、選択チェックボックスが選択された場合の置換数の初期値が“1”に設定されているが、実施形態1ではこれに限るものではなく、任意に設定可能である。   In FIG. 17, the application check boxes for the classifications “common kanji”, “feed kana”, and “synonyms” are selected by the user. In addition, an initial value of “1 replacement” is displayed in the column of the number of replacements of the classifications “common kanji”, “feed kana”, and “synonyms”. In the example of FIG. 17, the initial value of the number of replacements when the selection check box is selected is set to “1”. However, the first embodiment is not limited to this and can be arbitrarily set.

ステップ1053で、「分類」が選択されると、ステップ1054の処理に進む。   If “classification” is selected in step 1053, the process proceeds to step 1054.

置換ノイズ算出部12は、選択された分類の置換数の初期値とノイズレベル(置換ノイズ重み付け値)に基づき、最小置換ノイズ値を算出する(ステップ1054)。具体的には、置換ノイズ算出部12は、分類毎の最小置換ノイズ値Aiminを、Aimin=(分類毎の)置換数の初期値×(分類毎の)ノイズレベルにより算出する。置換ノイズ算出部12は、この分類毎の置換ノイズ値Aiminを加算する、すなわち、ΣAiminを算出することで、置換文書に含まれる置換ノイズの取り得る最小値である最小置換ノイズ値を算出する。 The replacement noise calculation unit 12 calculates the minimum replacement noise value based on the initial value of the number of replacements of the selected classification and the noise level (replacement noise weighting value) (step 1054). Specifically, the replacement noise calculation unit 12 calculates the minimum replacement noise value A imin for each classification by A imin = initial value of the number of replacements (for each classification) × noise level (for each classification). The replacement noise calculation unit 12 adds the replacement noise value A imin for each classification, that is, calculates the minimum replacement noise value that is the minimum value that can be taken by the replacement noise included in the replacement document by calculating ΣA imin. To do.

図17の例では、分類「常用漢字」については、ノイズレベル“1”、置換数の初期値“1”であるため、置換ノイズ値は、“1”となる。分類「送り仮名」については、ノイズレベル“1”、置換数の初期値“1”であるため、置換ノイズ値は、“1”となる。分類「類義語」については、ノイズレベル“2”、置換数の初期値“1”であるため、最小置換ノイズ値は、“2”となる。これより、置換文書に含まれる置換ノイズ値は4(=1+1+2)となる。   In the example of FIG. 17, the classification “common kanji” has a noise level “1” and an initial value “1” of the number of substitutions, and thus the substitution noise value is “1”. The classification “feed pseudonym” has a noise level “1” and an initial value “1” of the number of substitutions, so the substitution noise value is “1”. The classification “synonyms” has a noise level “2” and an initial value “1” of the number of substitutions, so the minimum substitution noise value is “2”. Thus, the replacement noise value included in the replacement document is 4 (= 1 + 1 + 2).

置換画面表示部172は、置換ノイズ算出部12により算出された置換文書の最小置換ノイズ値を、置換画面に表示する。図17の例では、「置換ノイズ」の欄に“4”が表示されている。   The replacement screen display unit 172 displays the minimum replacement noise value of the replacement document calculated by the replacement noise calculation unit 12 on the replacement screen. In the example of FIG. 17, “4” is displayed in the “replacement noise” field.

また、置換ノイズ算出部12は、置換ノイズ最大値を求めるようにしてもよい。置換ノイズ最大値は、分類毎のノイズレベル及び置換可能箇所数に基づき算出可能である。具体的には、置換ノイズ算出部12は、分類毎に置換ノイズ最大値Aimaxを、Aimax=(分類毎の)置換可能箇所数×(分類毎の)ノイズレベルにより算出する。置換ノイズ算出部12は、この分類毎の最大置換ノイズ値Aimaxを加算する、すなわち、ΣAimaxを算出することで、置換文書が含むことが可能な最大の置換ノイズ値(最大置換ノイズ値)を算出する。 Further, the replacement noise calculation unit 12 may obtain a replacement noise maximum value. The maximum replacement noise value can be calculated based on the noise level for each classification and the number of replaceable places. Specifically, the replacement noise calculation unit 12 calculates the replacement noise maximum value A imax for each category by A imax = number of replaceable locations (for each category) × noise level (for each category). The replacement noise calculation unit 12 adds the maximum replacement noise value A imax for each classification, that is, calculates the maximum replacement noise value (maximum replacement noise value) that can be included in the replacement document by calculating ΣA imax. Is calculated.

図17の例では、分類「常用漢字」については、ノイズレベル“1”、置換可能箇所数“2箇所”であるため、最大置換ノイズ値は、“2”となる。分類「送り仮名」については、ノイズレベル“1”、置換可能箇所数“2箇所”であるため、最大置換ノイズ値は、“2”となる。分類「類義語」については、ノイズレベル“2”、置換可能箇所数“5置換”であるため、置換ノイズ値は、“10”となる。これより、置換文書の置換ノイズ値は14(=2+2+10)となる。   In the example of FIG. 17, for the classification “common kanji”, the noise level is “1” and the number of replaceable places is “2 places”, so the maximum replacement noise value is “2”. The classification “feed pseudonym” has a noise level “1” and the number of replaceable places “2 places”, so the maximum replacement noise value is “2”. For the classification “synonyms”, the noise level is “2” and the number of replaceable places is “5 replacements”, so the replacement noise value is “10”. Thus, the replacement noise value of the replacement document is 14 (= 2 + 2 + 10).

置換画面表示部172は、置換ノイズ算出部12により算出された置換文書の最大置換ノイズ値を、置換画面のスライドバーの右側下部に表示するようにしてもよい。図17の例では、最大置換ノイズ値として“14”が表示されている。   The replacement screen display unit 172 may display the maximum replacement noise value of the replacement document calculated by the replacement noise calculation unit 12 in the lower right portion of the slide bar of the replacement screen. In the example of FIG. 17, “14” is displayed as the maximum replacement noise value.

また、置換画面表示部172は、スライドバーのポイントが、置換ノイズ算出部12により算出された最小置換ノイズ値(図17の場合“4”)を示すように、表示する。   The replacement screen display unit 172 displays the slide bar so that the point of the slide bar indicates the minimum replacement noise value calculated by the replacement noise calculation unit 12 (“4” in FIG. 17).

ステップ1054で最小置換ノイズ値の算出が行われると、ステップ1055の処理に進む。   When the minimum replacement noise value is calculated in step 1054, the process proceeds to step 1055.

配布可能数算出部11は、ユーザにより選択された分類の置換可能箇所数及び置換数に基づき、配布可能数を算出する(ステップ1055)。具体的には、配布可能数算出部11は、分類毎に配布可能数を、(分類毎の)置換可能箇所(数)から置換箇所(置換数)を選ぶ組み合わせの総数により算出する。すなわち、配布可能数算出部11は、分類毎の置換可能箇所数をn、分類毎の置換数をmとすると、分類毎の配布可能数を、配布可能数
(分類毎)=nmにより算出する。配布可能数算出部11は、この分類毎の配布可能数を掛け合わせることで、置換文書の配布可能数を算出する。
The distributable number calculation unit 11 calculates the distributable number based on the number of replaceable places and the number of replacements of the classification selected by the user (step 1055). Specifically, the distributable number calculating unit 11 calculates the distributable number for each classification based on the total number of combinations for selecting replacement positions (replacement numbers) from replaceable positions (number) (for each classification). That is, the distributable number calculating unit 11 assumes that the number of replaceable places for each classification is n and the number of replacement for each classification is m, and the distributable number for each classification is expressed as follows: Distributable number (for each classification) = n C m calculate. The distributable number calculation unit 11 calculates the distributable number of replacement documents by multiplying the distributable number for each classification.

図17の例では、分類「常用漢字」については、置換可能箇所数“2箇所”、置換数“1置換”であるため、配布可能数は、“2(=21)”となる。分類「送り仮名」については、置換可能箇所数 “2箇所”、置換数“1置換”であるため、配布可能数は、“2
(=21)”となる。分類「類義語」については、置換可能箇所数“5箇所”、置換数“1置換”であるため、置換ノイズ値は、“5(=51)”となる。これより、置換文書の配布可能数は20(=21×21×51=2×2×5)となる。
In the example of FIG. 17, for the classification “common kanji”, the number of replaceable places is “2 places” and the number of replacements is “1 replace”, so the number of distributable numbers is “2 (= 2 C 1 )”. For the classification “sent pseudonym”, the number of places that can be replaced is “2 places” and the number of replacement is “1 replacement”.
(= 2 C 1 ) ”. The classification“ synonyms ”has the number of replaceable locations“ 5 ”and the number of replacement“ 1 ”, so the replacement noise value is“ 5 (= 5 C 1 ) ”. It becomes. As a result, the distributable number of replacement documents is 20 (= 2 C 1 × 2 C 1 × 5 C 1 = 2 × 2 × 5).

置換画面表示部172は、配布可能数算出部11により算出された置換文書の配布可能数を置換画面に表示する。図17の例では、配布可能数として“20”が表示されている。   The replacement screen display unit 172 displays the distributable number of replacement documents calculated by the distributable number calculating unit 11 on the replacement screen. In the example of FIG. 17, “20” is displayed as the distributable number.

なお、ステップ1054とステップ1055は順不同である。そのため、配布可能数の算出が行われた後に、置換ノイズの算出が行われるようにしてもよい。   Note that step 1054 and step 1055 are in no particular order. For this reason, the replacement noise may be calculated after calculating the distributable number.

ステップ1055で配布可能数の算出が行われると、ステップ1056の処理に進む。   When the number of distributable numbers is calculated in step 1055, the process proceeds to step 1056.

入力部16は、置換画面において、ユーザにより、新たに適用チェックボックスをクリックされたか否か(置換に適用する分類が変更されたか否か)、スライドバーのポイントを移動されたか否か(置換ノイズ値が変更されたか否か)、又は置換数を変更されたか否かを判断する(S1056)。これらユーザにより新たに操作が行われたことを入力部16が受け付けると(S1056;Yes)、ステップ1058の処理に進む。これらユーザによる操作が行われていない場合(S1056;No)、ステップ1057の処理に進む。   The input unit 16 determines whether or not the user has newly clicked the application check box on the replacement screen (whether the classification applied to the replacement has been changed) or whether the point on the slide bar has been moved (replacement noise). It is determined whether or not the value has been changed) or the number of replacements has been changed (S1056). When the input unit 16 accepts that a new operation has been performed by these users (S1056; Yes), the process proceeds to step 1058. When these user operations are not performed (S1056; No), the process proceeds to step 1057.

ユーザにより新たに操作が行われる理由としては、例えば、算出された配布可能数が、ユーザの入力した配布数より少ないことより、配布先毎に異なる置換文書を配布することができないため、ユーザにより適用する分類の数を増やされることが考えられる。   The reason why a new operation is performed by the user is that, for example, since the calculated number of distributions is smaller than the number of distributions input by the user, different replacement documents cannot be distributed for each distribution destination. It may be possible to increase the number of classifications applied.

また、ある文書について、漏洩された場合に確実に漏洩元を特定したいとユーザが希望する場合は、置換ノイズ値、すなわち、元文書から変更度合(変更箇所)、を増やすことが考えられる。   In addition, when a user desires to specify a leakage source with certainty when a document is leaked, the replacement noise value, that is, the degree of change (change location) from the original document may be increased.

ユーザによる操作が行われたことを入力部16が受け付けた場合(S1056;Yes)、ステップ1058の処理(置換設定変更処理)に進む。ユーザにより上記操作が行われた場合、すなわち、ユーザにより分類、置換ノイズ値、置換数の変更がなされた場合の、置換を行うための設定変更を行う処理について、図15Bにより説明する。   When the input unit 16 accepts that the operation by the user has been performed (S1056; Yes), the process proceeds to step 1058 (replacement setting change process). A process for changing the setting for replacement when the above operation is performed by the user, that is, when the classification, the replacement noise value, and the number of replacements are changed by the user will be described with reference to FIG. 15B.

(動作フローの説明:置換設定変更処理)
図15Bは、本実施形態1に係る文書作成装置1の置換設定変更処理フローである。図15Bを用いて、文書作成装置1の置換設定変更処理について説明する。文書作成装置1のCPU2は、主記憶装置3のコンピュータプログラムにより、図15Bの処理を実行する。
(Explanation of operation flow: Replacement setting change processing)
FIG. 15B is a replacement setting change processing flow of the document creation apparatus 1 according to the first embodiment. The replacement setting change process of the document creation apparatus 1 will be described with reference to FIG. 15B. The CPU 2 of the document creation device 1 executes the processing of FIG. 15B by the computer program of the main storage device 3.

入力部16は、ユーザによる操作により変更された内容を判断する(S1058A)。入力部16が判断した結果、ユーザによる操作により変更された内容が「置換数」である場合(S1058A;置換数)、置換ノイズ算出部12は、置換ノイズ値の算出を行う(S1058B)。   The input unit 16 determines the content changed by the user's operation (S1058A). As a result of the determination by the input unit 16, when the content changed by the user's operation is “number of replacements” (S 1058 A; number of replacements), the replacement noise calculation unit 12 calculates a replacement noise value (S 1058 B).

ステップ1058Bで置換算出部12が行う置換ノイズ値の算出方法は、図15Aのステップ1054の最小置換ノイズ値の算出方法と基本的には同様である。但し、ステップ1058Bでは、ステップ1054と違い、置換ノイズ値の算出に用いる置換数を初期値に限らない。例えば、ユーザにより変更された後の置換数が初期値と異なる場合(例えば、初期値“1”でなく、“2”や“3”などの場合)は、当該変更された後の置換数を用いて、置換ノイズ値の算出を行う。   The replacement noise value calculation method performed by the replacement calculation unit 12 in step 1058B is basically the same as the minimum replacement noise value calculation method in step 1054 of FIG. 15A. However, in step 1058B, unlike step 1054, the number of replacements used for calculating the replacement noise value is not limited to the initial value. For example, if the number of replacements after being changed by the user is different from the initial value (for example, “2” or “3” instead of the initial value “1”), the number of replacements after the change is To calculate a replacement noise value.

入力部16が判断した結果、ユーザによる操作により変更された内容が「分類」である場合(S1058A;分類)、置換ノイズ算出部12は、まず、分類の選択を受け付ける(S1058C)。   As a result of the determination by the input unit 16, when the content changed by the user's operation is “classification” (S 1058 A; classification), the replacement noise calculation unit 12 first receives selection of the classification (S 1058 C).

ステップ1058Cで行われる分類の選択の受け付け方法は、図15Aのステップ1053の分類の選択の受け付け方法と基本的には同様であるため、詳細説明は省略する。なお、ユーザの操作により、ある分類が除外されたときは、置換画面表示部172は、当該分類の選択チェックボックスからチェック印を削除して表示させる。また、置換画面表示部172は、当該分類に対応する置換数の欄から置換数を削除し、空白や“---”などを
表示させる。
The method for accepting classification selection performed in step 1058C is basically the same as the method for accepting classification selection in step 1053 of FIG. When a certain category is excluded by the user's operation, the replacement screen display unit 172 deletes the check mark from the selection check box for the category and displays it. In addition, the replacement screen display unit 172 deletes the number of replacements from the column of the number of replacements corresponding to the classification, and displays a blank or “---” or the like.

ステップ1058Cの分類の選択の受け付けが終了すると、置換ノイズ算出部12は、置換ノイズ値を算出する(S1058D)。   When the acceptance of the selection of the classification in step 1058C is completed, the replacement noise calculation unit 12 calculates a replacement noise value (S1058D).

ステップ1058Dで置換算出部12が行う置換ノイズ値の算出方法は、図15Aのステップ1054の最小置換ノイズ値の算出方法と基本的には同様であるため、詳細説明は省略する。但し、ステップ1058Dでは、ステップ1054と違い、置換ノイズ値の算出に用いる置換数を初期値に限らない。例えば、ユーザにより「置換数」や「置換ノイズ値」が変更された後に、さらに、「分類」が変更されたときは、置換数が初期値と異なる値である場合が考えられるため、この場合は当該初期値と異なる値である置換数を用いて、置換ノイズ値の算出を行う。   The replacement noise value calculation method performed by the replacement calculation unit 12 in step 1058D is basically the same as the minimum replacement noise value calculation method in step 1054 in FIG. However, in step 1058D, unlike step 1054, the number of replacements used to calculate the replacement noise value is not limited to the initial value. For example, if the “number of replacements” or “replacement noise value” is changed by the user and then the “classification” is changed, the number of replacements may be different from the initial value. Calculates the replacement noise value using the number of replacements that is different from the initial value.

入力部16が判断した結果、ユーザによる操作により変更された内容が「置換ノイズ値」である場合(S1058A;置換ノイズ値)、置換ノイズ算出部12は、分類毎の置換数を算出する(S1058E)。   As a result of the determination by the input unit 16, when the content changed by the user's operation is “replacement noise value” (S 1058 A; replacement noise value), the replacement noise calculation unit 12 calculates the number of replacements for each classification (S 1058 E). ).

ステップ1058Eでは、置換ノイズ算出部12は、変更された後の置換ノイズ値に基づき、分類毎の置換数を算出する。ここで、分類毎の置換ノイズ値Aiは、Ai=(分類毎の)置換数×(分類毎の)ノイズレベルにより算出される。また、置換文書に含まれる置換ノイズ値Aは、A=ΣAi=Σ{(分類毎の)置換数×(分類毎の)ノイズレベル}に
より算出される。
In step 1058E, the replacement noise calculation unit 12 calculates the number of replacements for each classification based on the changed replacement noise value. Here, the replacement noise value A i for each classification is calculated by A i = number of replacements (for each classification) × noise level (for each classification). The replacement noise value A included in the replacement document is calculated by A = ΣA i = Σ {number of replacements (for each category) × noise level (for each category)}.

これより、上記置換ノイズ値Aの算出式を使用することで、分類毎の置換数を算出する。この際、上記置換ノイズ値Aの算出式における「置換ノイズ値A」を、変更された後の置換ノイズ値とする。また、上述のとおり、「(分類毎の)ノイズレベル」は、置換ノイズ重み付けDB1Aに記憶された分類毎の置換重み付け値とする。   Thus, the number of replacements for each classification is calculated by using the above calculation formula for the replacement noise value A. At this time, the “replacement noise value A” in the calculation formula for the replacement noise value A is used as the replaced replacement noise value. Further, as described above, the “noise level (for each classification)” is the replacement weight value for each classification stored in the replacement noise weighting DB 1A.

なお、分類毎の置換数を算出(変更)する際、置換可能箇所数が2箇所以下の分類についての置換数は“1置換”から変更しないこととする。これは、置換可能箇所数が2箇所である分類についての置換数を、“1置換”から“2置換”にしてしまうと、配布可能数が減少してしまうことを防ぐためである。具体的には、置換可能箇所数が2箇所の場合に置換数を“1置換”とすると、2通り(パターン)の置換文書が作成可能となる。しかし、置換数を“2置換”とすると、2箇所のうち2箇所とも置換を行う1つの置換文書しか作成されないこととなるからである。   Note that when calculating (changing) the number of replacements for each category, the number of replacements for a category having two or less replaceable locations is not changed from “1 replacement”. This is to prevent the number of distributable numbers from decreasing if the number of replacements for a classification having two replaceable locations is changed from “1 replacement” to “2 replacements”. Specifically, if the number of replaceable places is two and the number of replacement is “1 replacement”, two (pattern) replacement documents can be created. However, if the number of replacements is “two replacements”, only one replacement document that replaces two of the two locations is created.

なお、置換画面において、ユーザが置換数を変更する操作を行う場合は、上記のような、置換可能箇所数が2箇所以下の場合の置換数の制限はないものとしてもよい。   In the replacement screen, when the user performs an operation of changing the number of replacements, the number of replacements may not be limited when the number of replaceable places is 2 or less as described above.

ここで、図18を用いて、置換ノイズ算出部12による分類毎の置換数の算出方法を例示する。   Here, an example of a method for calculating the number of replacements for each classification by the replacement noise calculation unit 12 will be described with reference to FIG.

図18は、図17の置換画面において、ユーザの操作により置換ノイズ値を増加する変更がなされた場合の置換画面の一例を示す図である。図18に表示される項目については、図16の表示項目と同じであるため、図18の表示項目についての説明は省略する。   FIG. 18 is a diagram illustrating an example of the replacement screen when the replacement screen of FIG. 17 is changed to increase the replacement noise value by a user operation. The items displayed in FIG. 18 are the same as the display items in FIG. 16, and thus the description of the display items in FIG. 18 is omitted.

図18では、ユーザによるスライドバーの操作により、置換ノイズ値が“4”から“10”に変更されている。なお、図18では、ユーザにより選択された分類は3つ(常用漢字、送り仮名、類義語)である。   In FIG. 18, the replacement noise value is changed from “4” to “10” by the user's operation of the slide bar. In FIG. 18, the number of categories selected by the user is three (common kanji, feed kana, and synonyms).

ここで、図18の場合には、これらの分類の置換文字列により置換された置換文書に含まれる置換ノイズ値Aは、以下の式により算出される。
(式)A=置換数(常用漢字)×ノイズレベル(常用漢字)+置換数(送り仮名)×ノイズレベル(送り仮名)+置換数(類義語)×ノイズレベル(類義語)
Here, in the case of FIG. 18, the replacement noise value A included in the replacement document replaced by the replacement character string of these classifications is calculated by the following equation.
(Expression) A = number of substitutions (common kanji) x noise level (common kanji) + number of substitutions (feed kana) x noise level (feed kana) + number of substitutions (synonyms) x noise level (synonyms)

図18の場合、置換ノイズ値Aは、変更後の置換ノイズ値である“8”である。また、ノイズレベル(常用漢字)、ノイズレベル(送り仮名)、ノイズレベル(類義語)はそれぞれ、置換ノイズ重み付けDB1Aに記憶された置換ノイズ重み付け値“1”、“1”、“2”である。   In the case of FIG. 18, the replacement noise value A is “8” which is the replacement noise value after the change. Also, the noise level (common kanji), noise level (feed kana), and noise level (synonyms) are the replacement noise weight values “1”, “1”, and “2” stored in the replacement noise weight DB 1A, respectively.

上記より、置換ノイズ算出部12は、以下の式を満たすような、分類毎の置換数を算出する。
(式)8=置換数(常用漢字)+置換数(送り仮名)+置換数(類義語)×2
From the above, the replacement noise calculation unit 12 calculates the number of replacements for each classification so as to satisfy the following expression.
(Expression) 8 = number of substitutions (common kanji) + number of substitutions (feed kana) + number of substitutions (synonyms) × 2

なお、上述のとおり、分類「常用漢字」、「送り仮名」の置換可能箇所数はいずれも2箇所であるため、置換ノイズ算出部12は、これらの分類の置換数は増加させないこととする。すなわち、置換数(常用漢字)及び置換数(送り仮名)はそれぞれ“1”とする。
よって、上記式より、置換ノイズ算出部12は、置換数(類義語)を“3”と算出できる。
As described above, since the number of replaceable places in the categories “common kanji” and “feed kana” is two, the replacement noise calculation unit 12 does not increase the number of replacements in these classifications. That is, the number of substitutions (common kanji) and the number of substitutions (feed kana) are each “1”.
Therefore, from the above equation, the replacement noise calculation unit 12 can calculate the number of replacements (synonyms) as “3”.

ここで、上記置換ノイズAの算出式を満たす、分類毎の置換数の組み合わせが複数ある場合、置換ノイズ算出部12は、複数の組み合わせからランダムに1つの組み合わせを選択するようにしてもよい。また、置換ノイズ算出部12は、複数の組み合わせから1つの組み合わせを選択する際に優先順位を持たせる等の一定のルールを設定するようにしてもよい。   Here, when there are a plurality of combinations of the number of replacements for each classification that satisfy the calculation formula for the replacement noise A, the replacement noise calculation unit 12 may select one combination randomly from the plurality of combinations. Further, the replacement noise calculation unit 12 may set a certain rule such as giving priority when selecting one combination from a plurality of combinations.

なお、ステップ1058Eでは、置換画面表示部172が、変更された後の置換ノイズ値を置換ノイズの欄に表示する。また、置換画面表示部172は、算出された分類毎の置換数を、置換画面の置換数の欄に表示する。   In step 1058E, replacement screen display unit 172 displays the changed replacement noise value in the replacement noise column. Further, the replacement screen display unit 172 displays the calculated number of replacements for each category in the column of the number of replacements on the replacement screen.

上述したステップ1058B、1058D、1058Eでの処理が終了すると、ステップ1058Fの処理(配布可能数の算出処理)へ進む。   When the processing in steps 1058B, 1058D, and 1058E described above is completed, the processing proceeds to processing in step 1058F (processing for calculating the number of distributable numbers).

ステップ1058Fで配布可能数算出部11が行う配布可能数の算出方法は、図15Aのステップ1055と基本的には同様であるため、詳細説明を省略する。図18の置換画面の例では、配置可能数算出部11が算出した配置可能数は、“40(=21×21×5
3=2×2×10)”となる。
The method of calculating the distributable number performed by the distributable number calculating unit 11 in step 1058F is basically the same as step 1055 in FIG. In the example of the replacement screen in FIG. 18, the possible arrangement number calculated by the possible arrangement number calculation unit 11 is “40 (= 2 C 1 × 2 C 1 × 5).
C 3 = 2 × 2 × 10) ”.

なお、ステップ1058Bとステップ1058Fは順不同である。また、ステップ1058Dとステップ1058Fも順不同である。   Step 1058B and step 1058F are in no particular order. Step 1058D and step 1058F are also out of order.

ステップ1058Fで配布可能数の算出が行われると、文書作成装置1は、本置換設定変更処理フローを終了し、再度ステップ1056の処理へ進む。   When the number of distributable numbers is calculated in step 1058F, the document creation apparatus 1 ends the replacement setting change processing flow and proceeds to the processing of step 1056 again.

図16のステップ1057の説明に戻る。ステップ1057では、まず、ユーザが入力装置7(例えば、マウス)を介して「置換」ボタンをクリックすることで、入力部16はそのイベントを受信する。これによって、文書置換部13が、元文書である電子文書内の文字列を置換ワードにより置換を行うことで、元文書登録画面で入力された配布数分の置換文書を作成する。   Returning to step 1057 in FIG. In step 1057, first, the user clicks a “replace” button via the input device 7 (for example, a mouse), and the input unit 16 receives the event. As a result, the document replacement unit 13 replaces the character string in the electronic document that is the original document with the replacement word, thereby creating replacement documents for the number of distributions input on the original document registration screen.

具体的には、文書置換部13は、選択された分類毎に、置換可能箇所の中から置換箇所数(置換数)分の箇所(置換箇所)をランダムに選択する。すなわち、文書置換部13は、図19に示した置換可能箇所記録データベース1Cに記憶された置換可能箇所からランダムに、置換箇所数分の箇所(置換箇所)を選択する。但し、文書置換部13は、置換箇所の組み合わせが全く同一である置換文書は作成しないこととする。これより、各配布先に異なる内容(文章)の置換文書を配布することが可能となる。   Specifically, the document replacement unit 13 randomly selects places (replacement places) corresponding to the number of replacement places (the number of substitutions) from the replaceable places for each selected classification. That is, the document replacement unit 13 randomly selects places (replacement places) corresponding to the number of replacement places from the replaceable places stored in the replaceable place record database 1C shown in FIG. However, the document replacement unit 13 does not create a replacement document in which the combination of replacement parts is exactly the same. This makes it possible to distribute replacement documents with different contents (sentences) to each distribution destination.

文書置換部13は、選択した箇所(置換箇所)に存在する文字列(検索ワード)を、当該検索ワードに対応付けられて用語DB19に記憶された置換ワードにより置換を行う。   The document replacement unit 13 replaces a character string (search word) existing at the selected location (replacement location) with a replacement word stored in the term DB 19 in association with the search word.

図17の例では、同図で示された置換画面において、「置換」ボタンが押下された場合、ユーザにより選択された分類「常用漢字」、「送り仮名」、「類義語」について、それぞれ1箇所の置換箇所について文字列の置換が行われる。   In the example of FIG. 17, when the “replace” button is pressed on the replacement screen shown in FIG. 17, each of the categories “common kanji”, “feed kana”, and “synonyms” selected by the user is one place. Character string replacement is performed for the replacement part of.

図20は、図17の置換画面で「置換」ボタンが選択され、文書置換部13により置換が行われた置換文書の例を示す図である。図20の置換文書例1では、元文書内に存在した「行う」、「ベンダー」、「嘘」の文字列(検索ワードと一致)がそれぞれ、置換文字
列(置換ワード)である「行なう」、「ベンダ」、「うそ」により置換されている。「行う」は分類「送り仮名」に、「ベンダー」は分類「類義語」に、「嘘」は分類「常用漢字」に属している。これより、分類毎に1箇所のみ置換が行われていることがわかる。
FIG. 20 is a diagram illustrating an example of a replacement document in which the “replace” button is selected on the replacement screen of FIG. 17 and the replacement is performed by the document replacement unit 13. In the replacement document example 1 in FIG. 20, the character strings “match”, “vendor”, and “lie” (matching the search word) that existed in the original document are “perform” that is the replacement character string (replacement word). , “Vendor”, and “lie”. “Done” belongs to the category “sending kana”, “vendor” belongs to the category “synonyms”, and “lie” belongs to the category “common kanji”. From this, it can be seen that only one replacement is performed for each classification.

また、図20の置換文書例2では、元文書内に存在した「ディスカウント」、「嘘」、「組合せ」の文字列(検索ワードと一致)がそれぞれ、置換文字列(置換ワード)である「値引き」、「うそ」、「組み合わせ」により置換されている。「ディスカウント」は分類「類義語」に、「嘘」は分類「常用漢字」に、「組合せ」は分類「送り仮名」に属している。   In the replacement document example 2 of FIG. 20, the character strings (matching the search word) of “discount”, “lie”, and “combination” that existed in the original document are the replacement character strings (replacement words). It is replaced by “discount”, “lie”, and “combination”. “Discount” belongs to the category “synonyms”, “lie” belongs to the category “common kanji”, and “combination” belongs to the category “feed kana”.

なお、ステップ1057では、元文書に対して置換が行われると、記憶部18は、実際に置換を行った箇所である置換箇所を特定する情報を、置換文書毎に、検索ワードと対応付けて置換箇所記録DB1Eに記憶する。   In step 1057, when replacement is performed on the original document, the storage unit 18 associates information for specifying a replacement part, which is a part where the replacement is actually performed, with a search word for each replacement document. Store in the replacement location record DB 1E.

ステップ1057で、文書置換部13が、元文書である電子文書を置換ワードにより置換を行うと、文書作成装置1は、本元文書置換処理フローを終了する。   In step 1057, when the document replacement unit 13 replaces the electronic document that is the original document with a replacement word, the document creation apparatus 1 ends the original document replacement processing flow.

(動作フローの説明:置換文書登録処理)
図21は、実施形態1に係る文書作成装置1の置換文書登録処理フローである。図21を用いて、文書作成装置1の置換文書登録処理について説明する。文書作成装置1のCPU2は、主記憶装置3のコンピュータプログラムにより、図21の処理を実行する。
(Description of operation flow: Replacement document registration processing)
FIG. 21 is a replacement document registration process flow of the document creation apparatus 1 according to the first embodiment. The replacement document registration process of the document creation apparatus 1 will be described with reference to FIG. The CPU 2 of the document creation device 1 executes the processing of FIG. 21 by the computer program of the main storage device 3.

ステップ105で、元文書が置換文字列により置換された場合、置換文書登録画面表示部173は、置換文書登録画面を表示装置8に表示させる(S1061)。   When the original document is replaced with the replacement character string in step 105, the replacement document registration screen display unit 173 displays the replacement document registration screen on the display device 8 (S1061).

図22は、置換文書登録画面の一例を示す図である。図示するように、置換文書登録画面には、元文書のファイル名である元文書名、元文書の作成者を一意に特定する識別情報及び元文書のプレビューを表示させるプレビューボタンが用意される。   FIG. 22 is a diagram illustrating an example of a replacement document registration screen. As shown in the figure, the replacement document registration screen includes an original document name that is the file name of the original document, identification information that uniquely identifies the creator of the original document, and a preview button that displays a preview of the original document.

また、置換文書登録画面には、番号の表示項目に加え、配布先名を入力させるテキストボックスが用意される。なお、本実施形態では置換文書が5つ作成されるため、配布先名を入力させるテキストボックスは5つ用意される。また、置換文書登録画面には、置換文書のプレビュー画面である結果確認画面を表示させるプレビューボタン及び置換文書を保存するための保存ボタンが用意される。   In addition, in the replacement document registration screen, a text box for inputting a distribution destination name is prepared in addition to the number display item. In the present embodiment, since five replacement documents are created, five text boxes for inputting a distribution destination name are prepared. The replacement document registration screen is provided with a preview button for displaying a result confirmation screen that is a preview screen for the replacement document and a save button for saving the replacement document.

なお、配布先名を予め登録したCSV(Comma Separated Values)ファイルを読み込むことで、配布先名を自動入力するようにしてもよい。この場合、図22の置換文書登録画面には、CSVファイルを呼び出すボタン等を用意する必要がある。   The distribution destination name may be automatically input by reading a CSV (Comma Separated Values) file in which the distribution destination name is registered in advance. In this case, it is necessary to prepare a button for calling a CSV file on the replacement document registration screen of FIG.

また置換文書登録画面には、画面を閉じるための「終了」ボタンが用意される。   In the replacement document registration screen, an “end” button for closing the screen is prepared.

置換文書登録画面の番号は、各置換文書を一意に特定する識別情報であり、行番号、置換文書毎に定められた番号や、置換文書に一時的に設定されたファイル名などが例示される。置換文書登録画面表示部173は、置換文書登録画面に、元文書登録画面で選択された元文書のファイル名である元文書名を表示させる(ステップ1061)。また、置換文書登録画面表示部17は、置換文書登録画面に、元文書の作成者の識別情報を表示させる(ステップ1061)。元文書の作成者の識別情報としては、作成者の氏名やIDなどが例示される。なお、この作成者の識別情報は、元文書登録画面にて入力された識別情報であってもよいし、ステップ101で受け付けたユーザのIDであってもよい。   The number on the replacement document registration screen is identification information for uniquely identifying each replacement document, and includes a line number, a number determined for each replacement document, a file name temporarily set in the replacement document, and the like. . The replacement document registration screen display unit 173 displays the original document name that is the file name of the original document selected on the original document registration screen on the replacement document registration screen (step 1061). Further, the replacement document registration screen display unit 17 displays identification information of the creator of the original document on the replacement document registration screen (step 1061). The identification information of the creator of the original document is exemplified by the name and ID of the creator. The creator identification information may be the identification information input on the original document registration screen or the user ID received in step 101.

置換文書登録画面上で元文書のプレビューボタンが選択されると、入力部16がこのイベントを受信し、結果確認画面表示部174によって、元文書の結果確認画面(図示しない)が表示される。これより、ユーザは元文書の内容を視認することが可能となる。   When the original document preview button is selected on the replacement document registration screen, the input unit 16 receives this event, and the result confirmation screen display unit 174 displays a result confirmation screen (not shown) of the original document. As a result, the user can visually recognize the contents of the original document.

置換文書登録画面上で置換文書のプレビューボタンが選択されると、入力部16がこのイベントを受信し、結果確認画面表示部174によって、図23のような置換結果確認画面が表示される。   When the replacement document preview button is selected on the replacement document registration screen, the input unit 16 receives this event, and the result confirmation screen display unit 174 displays a replacement result confirmation screen as shown in FIG.

図23は、置換結果の結果確認画面の一例を示す図である。置換結果の結果確認画面には、元文書名、作成者の識別情報、置換文書を一意に特定する識別情報(番号)、配布先名などが表示される。また、本結果確認画面には、元文書のプレビューを表示させるためのプレビューボタンを用意するようにしてもよい。また、本結果確認画面には、置換文書の内容が表示されるテキストボックスが用意される。これより、ユーザは各置換文書の内容を視認することが可能となる。また、図23に示すように、太字や下線などの表示方法により、置換された箇所(文字列)を視認可能とするようにしてもよい。   FIG. 23 is a diagram showing an example of a result confirmation screen for replacement results. On the result confirmation screen of the replacement result, the original document name, creator identification information, identification information (number) for uniquely identifying the replacement document, the distribution destination name, and the like are displayed. Further, a preview button for displaying a preview of the original document may be prepared on the result confirmation screen. In the result confirmation screen, a text box for displaying the contents of the replacement document is prepared. As a result, the user can visually recognize the contents of each replacement document. Further, as shown in FIG. 23, the replaced portion (character string) may be made visible by a display method such as bold or underline.

置換文書登録画面のテキストボックスに配布先名が入力されると、入力部16は入力された配布先名を受け付ける(取得する)(S1062)。「配布先名」は、置換文書の配布先を一意に特定する識別情報であり、配布先の人物の氏名、当該人物のID、電話番号などが例示される。   When the distribution destination name is input in the text box of the replacement document registration screen, the input unit 16 receives (acquires) the input distribution destination name (S1062). The “distribution destination name” is identification information that uniquely identifies the distribution destination of the replacement document, and includes the name of the person of the distribution destination, the ID of the person, a telephone number, and the like.

上記のとおり、ユーザによる、置換文書登録画面上での配布先名の入力が行われた後に、本画面上で「保存」ボタンがクリックされると、入力部16はそのイベントを受信する。これによって、送信部14が、各置換文書と配布先名を対応付けて、ファイルサーバ20へ送信(登録)する(S1063)。   As described above, after the user inputs the distribution destination name on the replacement document registration screen, when the “Save” button is clicked on this screen, the input unit 16 receives the event. Accordingly, the transmission unit 14 associates each replacement document with the distribution destination name and transmits (registers) the file to the file server 20 (S1063).

送信部14は、置換文書及び配布先名に加え、日時情報をファイルサーバ20へ送信するようにしてもよい。日時情報としては、例えば、置換文書及び配布先名をファイルサーバ20に送信する日時や置換文書の作成日時(置換を実施した日時)などが例示される。   The transmission unit 14 may transmit date and time information to the file server 20 in addition to the replacement document and the distribution destination name. Examples of the date / time information include the date / time when the replacement document and the distribution destination name are transmitted to the file server 20, the creation date / time of the replacement document (date / time when the replacement was performed), and the like.

なお、ステップ1063でファイルサーバ20へ置換文書と配布先名を送信すると、ファイルサーバ20は、元文書と当該元文書から作成された置換文書との対応関係がわかるように、置換文書及び配布先名を記憶(保存)する。なお、ファイルサーバ20は、置換文書毎に異なるファイル名を設定し、当該ファイル名により置換文書を記憶(保存)する。「ファイル名」は、“元文書名_配布先名.txt”や“置換日_元文書名_配布先名.txt”
など、任意に設定されるものであってよい。
Note that when the replacement document and the distribution destination name are transmitted to the file server 20 in step 1063, the file server 20 knows the correspondence between the original document and the replacement document created from the original document, and the replacement document and the distribution destination. Remember (save) your name. The file server 20 sets a different file name for each replacement document, and stores (saves) the replacement document with the file name. “File name” is “original document name_distribution name.txt” or “replacement date_original document name_distribution name.txt”
For example, it may be arbitrarily set.

なお、ファイルサーバ20では、各置換文書について、置換文書の「ファイル名」と「配布先名」を対応付けた、ファイル名対応付けDB(図示しない)を備えるようにしてもよい。なお、「ファイル名」と「配布先名」に加えて、当該置換文書へのリンク情報、例えば、ファイルパス名などを対応付けるようにしてもよい。   Note that the file server 20 may include a file name association DB (not shown) in which “file name” and “distribution destination name” of the replacement document are associated with each replacement document. In addition to “file name” and “distribution destination name”, link information to the replacement document, for example, a file path name may be associated.

ファイルサーバ20で置換文書が保存(格納)されると、受信部15は、ファイルサーバ20から各置換文書に割り当てられたファイル名を受信するようにしてもよい。この場合、文書作成装置1において、上述したファイル名対応付けDBを備えるようにしてもよい。なお、受信された「ファイル名」は、置換文書登録画面上で視認可能としてもよい。   When the replacement document is stored (stored) in the file server 20, the receiving unit 15 may receive the file name assigned to each replacement document from the file server 20. In this case, the document creation apparatus 1 may include the file name association DB described above. The received “file name” may be visible on the replacement document registration screen.

送信部14が、置換文書及び配布先名をファイルサーバ20へ送信し、「終了」ボタンが選択されると、文書作成装置1は、本置換文書登録処理フローを終了する。   When the transmission unit 14 transmits the replacement document and the distribution destination name to the file server 20 and the “end” button is selected, the document creation apparatus 1 ends the replacement document registration processing flow.

なお、上述のとおり、受信部15が、ファイルサーバ20からファイル名を受信した場合、図11のステップ107で、記憶部18が、各置換文書を受信したファイル名で記憶(保存)するようにしてもよい。   As described above, when the receiving unit 15 receives a file name from the file server 20, in step 107 in FIG. 11, the storage unit 18 stores (saves) each replacement document with the received file name. May be.

(動作フローの説明:漏洩元特定処理)
図24は、実施形態1に係る文書作成装置1の漏洩文書特定フローである。図24を用いて、文書作成装置1の漏洩元特定フローについて説明する。文書作成装置1のCPU2は、主記憶装置3のコンピュータプログラムにより、図24の処理を実行する。
(Explanation of operation flow: leak source identification processing)
FIG. 24 is a leakage document specifying flow of the document creation apparatus 1 according to the first embodiment. With reference to FIG. 24, the leakage source specifying flow of the document creation apparatus 1 will be described. The CPU 2 of the document creation device 1 executes the processing of FIG. 24 by the computer program of the main storage device 3.

ユーザが入力装置7を介して所定の方法で漏洩元特定に係る漏洩元特定処理プログラムの実行を指示すると、まず初めに、ユーザ情報入力画面(図示しない)が表示部17によって表示装置8に表示される。入力部16は、ユーザ情報入力画面において、ユーザからのユーザ情報の入力を受けたか否かを判断する(SA101)。ユーザ情報の入力を受けていない場合(SA101;No)、再度ステップA101の処理に戻る。入力部16は、ユーザ情報の入力を受けた場合(SA101;Yes)、このユーザ情報とユーザ情報DB1Bとの照合を行う(SA102)。   When a user instructs execution of a leakage source identification processing program related to leakage source identification by a predetermined method via the input device 7, first, a user information input screen (not shown) is displayed on the display device 8 by the display unit 17. Is done. The input unit 16 determines whether or not an input of user information from the user is received on the user information input screen (SA101). When the input of user information has not been received (SA101; No), the process returns to step A101 again. When receiving input of user information (SA101; Yes), the input unit 16 collates this user information with the user information DB 1B (SA102).

入力部16は、ユーザにより入力されたユーザ情報がユーザ情報DB1Bに登録されているか否かを判断し(SA103)、入力されたユーザ情報がユーザ情報DB1Bに登録されていない場合(SA103;No)、再度ステップA101の処理に戻る。入力されたユーザ情報がユーザ情報DB1Bに登録されている場合(SA103;Yes)、ステップA104の処理に進む。   The input unit 16 determines whether the user information input by the user is registered in the user information DB 1B (SA103). When the input user information is not registered in the user information DB 1B (SA103; No) Then, the process returns to step A101 again. When the input user information is registered in the user information DB 1B (SA103; Yes), the process proceeds to step A104.

ステップA104では、漏洩文書である電子文書を類似文書チェック装置30に送信(登録)する処理(漏洩文書登録処理)が行われる。漏洩文書登録処理では、ユーザが入力装置7を介して、漏洩文書登録画面にて漏洩元の特定を行いたい電子文書(漏洩文書)を選択すると、読み出し部1Dは当該漏洩文書を主記憶装置3又は外部記憶装置4から読み出す。読みされた漏洩文書は、送信部14によって類似文書チェック装置30へ送信(登録)される。送信部14が類似文書チェック装置30へ漏洩文書を送信すると、ステップA105(SA105)の処理に進む。   In step A104, processing (leakage document registration processing) of transmitting (registering) an electronic document that is a leaked document to the similar document check device 30 is performed. In the leaked document registration process, when the user selects an electronic document (leakage document) for which a leak source is to be specified on the leaked document registration screen via the input device 7, the reading unit 1D reads the leaked document into the main storage device 3. Alternatively, it is read from the external storage device 4. The read leaked document is transmitted (registered) to the similar document check device 30 by the transmission unit 14. When the transmission unit 14 transmits the leaked document to the similar document check device 30, the process proceeds to step A105 (SA105).

受信部15は、類似文書チェック装置30から、漏洩文書と漏洩文書に類似すると判断された置換文書である類似文書との文章間の類似の度合いである類似度を受信(取得)する(SA105)。またこの際、受信部15は、類似度と共に、当該類似度が算出された類似文書(置換文書)のファイル名を受信(取得)する(SA105)。また、この際、受信部15は、類似度及び類似文書のファイル名と共に、類似文書を受信してもよい。   The receiving unit 15 receives (acquires) the similarity that is the degree of similarity between sentences of the leaked document and the similar document that is a replacement document determined to be similar to the leaked document from the similar document check device 30 (SA105). . At this time, the receiving unit 15 receives (acquires) the file name of the similar document (replacement document) for which the similarity is calculated together with the similarity (SA105). At this time, the receiving unit 15 may receive the similar document together with the similarity and the file name of the similar document.

ここで、類似文書チェック装置30は、汎用的な類似度算出などの判定アルゴリズムを用いて、特定の文書と他の文書とを比較し、両文書の文章間の類似度を算出する。   Here, the similar document check apparatus 30 compares a specific document with another document using a determination algorithm such as general-purpose similarity calculation, and calculates the similarity between sentences of both documents.

本実施形態1に係る類似文書チェック装置30は、ファイルサーバ20に格納された上述の複数の置換文書を読み出すことで、これら複数の置換文書とステップA104により送信された漏洩文書とを比較し、両者の文章間の類似度を算出する。例えば、類似文書チェック装置30は、比較を行う全ての文書について形態素解析を行うことにより、文書内の要素を抽出する。類似文書チェック装置30は、比較を行う文書間で共通して出現する要素(単語)の数をカウントし、類似度を算出することが可能である。また、類似文書チェック装置30は、例えば、特開2000−311173号公報で開示されるような、ベクトル空間法を用いた類似度算出を行うことが可能である。また、類似文書チェック装置30は、例えば、特開2009−205674号公報で開示された技術を用いてもよい。   The similar document check device 30 according to the first embodiment reads the plurality of replacement documents stored in the file server 20 to compare the plurality of replacement documents with the leaked document transmitted in step A104. The similarity between both sentences is calculated. For example, the similar document check device 30 extracts elements in a document by performing morphological analysis on all documents to be compared. The similar document check device 30 can count the number of elements (words) that appear in common between documents to be compared, and calculate the similarity. Further, the similar document check device 30 can perform similarity calculation using a vector space method as disclosed in, for example, Japanese Patent Laid-Open No. 2000-31173. The similar document check device 30 may use, for example, the technique disclosed in Japanese Patent Application Laid-Open No. 2009-205684.

ステップA105で、受信部15が、類似度及び類似文書のファイル名を取得すると、読み出し部1Dは、当該類似文書のファイル名に基づき、ファイルサーバ20から当該ファイル名と対応付けて記憶された配布先名を取得する(SA106)。具体的には、読み出し部1Dは、当該類似文書のファイル名をキーとしてファイルサーバ20のファイル名対応付けDBを参照することで、ファイル名に対応する配布先名を取得する。   When the reception unit 15 acquires the similarity and the file name of the similar document in step A105, the reading unit 1D distributes the distribution stored from the file server 20 in association with the file name based on the file name of the similar document. The name is acquired (SA106). Specifically, the reading unit 1D acquires the distribution destination name corresponding to the file name by referring to the file name association DB of the file server 20 using the file name of the similar document as a key.

なお、類似文書のファイル名すなわち、置換文書のファイル名と当該置換文書の配布先名を対応付けたファイル名対応付けDBが文書作成装置1に格納されている場合は、受信部16が、当該DBを参照することで配布先名を取得するようにしてもよい。   If a file name association DB in which the file name of the similar document, that is, the file name of the replacement document and the distribution destination name of the replacement document are associated with each other, is stored in the document creation apparatus 1, The distribution destination name may be acquired by referring to the DB.

ステップA106で配布先名を受信すると、漏洩元確認結果画面表示部176は、漏洩元確認結果画面を表示させる(SA107)。また、漏洩元確認結果画面表示部176は、漏洩元確認結果画面に、類似度及び当該類似度の算出を行った類似文書の配布先名を表示させる(SA107)。これより、ユーザは、漏洩された文書(漏洩文書)と類似する置換文書及び当該置換文書の配布先名を視認(特定)可能となり、また、漏洩された文書と当該置換文書との類似度についても視認可能となる。これより、ユーザは、例えば、当該漏洩文書は、漏洩文書との類似度が最も高い置換文書が漏洩されたものである可能性が高いと判断することが可能である。また、ユーザは、当該漏洩文書の漏洩元(漏洩させた人物)は、漏洩文書との類似度が最も高い置換文書の配布先名で示された人物である可能性が高いと判断することが可能である。   When the distribution destination name is received in step A106, the leakage source confirmation result screen display unit 176 displays the leakage source confirmation result screen (SA107). Further, the leakage source confirmation result screen display unit 176 displays the similarity and the distribution destination name of the similar document for which the similarity is calculated on the leakage source confirmation result screen (SA107). Accordingly, the user can visually recognize (specify) the replacement document similar to the leaked document (leakage document) and the distribution destination name of the replacement document, and the similarity between the leaked document and the replacement document. Is also visible. Accordingly, the user can determine, for example, that the leaked document has a high possibility that the replacement document having the highest similarity with the leaked document is leaked. In addition, the user may determine that the leakage source (the leaked person) of the leaked document is highly likely to be a person indicated by the replacement document distribution destination name having the highest similarity to the leaked document. Is possible.

図28は、漏洩元確認結果画面の一例を示す図である。図示するように、漏洩元確認結果画面には、漏洩文書のファイル名である漏洩文書名が表示されるテキストボックスが用意される。また、漏洩元確認結果画面には、番号、漏洩確率(類似度)の表示項目に加え、類似文書の配布先名が表示されるテキストボックスが用意される。また、漏洩元確認結果画面には、類似文書のプレビューを表示させるプレビューボタン及び漏洩元確認結果画面を閉じるための「終了」ボタンが用意される。   FIG. 28 is a diagram illustrating an example of a leakage source confirmation result screen. As shown in the drawing, a text box for displaying a leaked document name that is a file name of a leaked document is prepared on the leak source confirmation result screen. In addition, in the leakage source confirmation result screen, a text box for displaying the distribution destination name of the similar document in addition to the display items of the number and the leakage probability (similarity) is prepared. The leakage source confirmation result screen is provided with a preview button for displaying a preview of a similar document and an “end” button for closing the leakage source confirmation result screen.

漏洩元確認結果画面の番号は、各類似文書を識別する情報であり、例えば、類似文書毎に定められた番号や、類似文書のファイル名などが例示される。漏洩元確認結果画面表示部176は、漏洩元確認結果画面に、漏洩文書登録画面で選択された漏洩文書のファイル名(漏洩文書名)を表示させる(SA107)。また、漏洩元確認結果画面表示部176は、漏洩元確認結果画面に、取得した類似度と、類似文書の配布先名を表示させる(SA107)。   The number on the leakage source confirmation result screen is information for identifying each similar document, and includes, for example, a number determined for each similar document, a file name of the similar document, and the like. The leakage source confirmation result screen display unit 176 displays the file name (leakage document name) of the leakage document selected on the leakage document registration screen on the leakage source confirmation result screen (SA107). Further, the leakage source confirmation result screen display unit 176 displays the obtained similarity and the distribution destination name of the similar document on the leakage source confirmation result screen (SA107).

類似文書(ファイル)のプレビューボタンが選択されると、入力部16がこのイベントを受信し、読み出し部1Dが当該類似文書を読み出し、結果確認画面表示部174によって、類似文書確認画面(図示しない)が表示される。これより、ユーザは類似文書の内容を視認することが可能となる。なお、読み出し部1Dは、文書作成装置1に格納された類似文書である置換文書を読み出すようにしてもよいし、類似文書チェック装置30又はファイルサーバ20から類似文書を読み出すようにしてもよい。これより、結果確認画面表示部174は、類似文書確認画面に類似文書を表示させる。   When a preview button for a similar document (file) is selected, the input unit 16 receives this event, the reading unit 1D reads the similar document, and the result confirmation screen display unit 174 displays a similar document confirmation screen (not shown). Is displayed. As a result, the user can visually recognize the contents of the similar document. Note that the reading unit 1 </ b> D may read a replacement document that is a similar document stored in the document creation device 1, or may read a similar document from the similar document check device 30 or the file server 20. As a result, the result confirmation screen display unit 174 displays the similar document on the similar document confirmation screen.

なお、漏洩文書は電子文書であり、WORD(Microsoft Office Word)などの文書作
成ソフトウェアにより作成された電子文書に限らず、紙上に印刷された文書などをOCR(Optical Character Reader)により電子化された電子文書などを含む。
The leaked document is an electronic document, and is not limited to an electronic document created by document creation software such as WORD (Microsoft Office Word), but a document printed on paper is digitized by an OCR (Optical Character Reader). Includes electronic documents.

漏洩元確認結果画面表示部176が、漏洩元確認結果画面に、類似度や類似文書(置換文書)の配布先名を表示し、同画面上で「終了」ボタンが選択されると、文書作成装置1は、本漏洩文書特定フローを終了する。   The leakage source confirmation result screen display unit 176 displays the similarity and the distribution destination name of the similar document (replacement document) on the leakage source confirmation result screen, and when the “end” button is selected on the same screen, the document is created. The apparatus 1 ends the leaked document specifying flow.

(動作フローの説明:漏洩文書登録処理)
図25は、実施形態1に係る文書作成装置1の漏洩文書登録処理フローである。図25を用いて、文書作成装置1の漏洩文書登録処理について説明する。文書作成装置1のCPU2は、主記憶装置3のコンピュータプログラムにより、図25の処理を実行する。
(Explanation of operation flow: Leaked document registration processing)
FIG. 25 is a leakage document registration process flow of the document creation apparatus 1 according to the first embodiment. The leaked document registration process of the document creation apparatus 1 will be described with reference to FIG. The CPU 2 of the document creation device 1 executes the processing of FIG. 25 by the computer program of the main storage device 3.

ステップA103で、入力されたユーザ情報がユーザ情報DB1Bに登録されている場合(SA103;Yes)、漏洩文書登録画面表示部175は、漏洩文書登録画面を表示させる(SA1041)。   In step A103, when the input user information is registered in the user information DB 1B (SA103; Yes), the leaked document registration screen display unit 175 displays the leaked document registration screen (SA1041).

図26は、漏洩文書登録画面の一例を示す図である。図示するように、漏洩文書登録画面には、「参照」ボタン、「次へ」ボタン及びファイル名が表示されるテキストボックスが用意される。この漏洩文書登録画面で、「参照」ボタンがクリックされると、電子文書を参照(選択)可能な参照画面(図示しない)が表示される。表示された参照画面で電子文書が選択された場合、選択された電子文書のファイル名が、テキストボックスに表示される。なお、ファイル名が表示されるテキストボックスには、ファイル名ではなく、当該ファイルのファイルパスが表示されるようにしてもよい。   FIG. 26 is a diagram illustrating an example of a leaked document registration screen. As shown in the drawing, a “reference” button, a “next” button, and a text box for displaying a file name are prepared on the leaked document registration screen. When a “reference” button is clicked on the leaked document registration screen, a reference screen (not shown) that allows the electronic document to be referenced (selected) is displayed. When an electronic document is selected on the displayed reference screen, the file name of the selected electronic document is displayed in a text box. The text box that displays the file name may display the file path of the file instead of the file name.

漏洩文書登録画面上で「参照」ボタンがクリックされ電子文書が選択されると、入力部16はそのイベントを受信し、読み出し部1Dが、選択された電子文書を主記憶装置3又は外部記憶装置4から読み出す(SA1042)。また、同時に、漏洩文書登録画面表示部175が、漏洩文書登録画面のテキストボックスに、選択された電子文書のファイル名を表示する。   When the “reference” button is clicked on the leaked document registration screen and an electronic document is selected, the input unit 16 receives the event, and the reading unit 1D stores the selected electronic document in the main storage device 3 or the external storage device. 4 is read out (SA1042). At the same time, the leaked document registration screen display unit 175 displays the file name of the selected electronic document in the text box of the leaked document registration screen.

図27は、図26で漏洩文書として選択された「ご案内_20110101.txt」の内容の一例
である。
FIG. 27 shows an example of the contents of “Guidance_20110101.txt” selected as the leaked document in FIG.

上記のとおり、ユーザによる、漏洩文書登録画面上での電子文書の選択が行われた後に、本画面上で「次へ」ボタンがクリックされると、入力部16はそのイベントを受信する。これによって、送信部14が、漏洩文書である電子文書を類似文書チェック装置30へ送信(登録)する(SA1043)。送信部14が、漏洩文書を類似文書チェック装置30へ送信すると、文書作成装置1は、本漏洩文書登録処理フローを終了する。   As described above, when the “next” button is clicked on this screen after the user selects an electronic document on the leaked document registration screen, the input unit 16 receives the event. As a result, the transmission unit 14 transmits (registers) the electronic document that is the leaked document to the similar document check device 30 (SA1043). When the transmission unit 14 transmits the leaked document to the similar document check device 30, the document creation device 1 ends the leaked document registration processing flow.

以上に説明したように、文書作成装置1は、置換可能箇所の中から置換箇所を、置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択することで、配布先毎に置換箇所の組み合わせが異なる置換文書を作成することが可能となる。すなわち、電子文書の文字列を意図的に異なる文字列に置換(変換)することで、配布先毎に、異なる文章の置換文書を配布することが可能となる。これによって、当該電子文書が漏洩されたときに、漏洩文書と置換文書とを比較し漏洩文書がどの置換文書と類似するかを確認することで、漏洩文書がどの配布先の人物から漏洩したか(漏洩元)の特定の可能性を高めることが可能となる。   As described above, the document creation apparatus 1 selects each replacement location from the replaceable locations so that the combination of replacement locations does not match the combination of replacement locations of other replacement documents. It is possible to create replacement documents with different combinations of replacement locations. That is, by replacing (converting) the character string of the electronic document with a different character string intentionally, it is possible to distribute a replacement document with a different sentence for each distribution destination. As a result, when the electronic document is leaked, compare the leaked document with the replacement document and check which replacement document the leaked document is similar to. It becomes possible to increase the specific possibility of (leakage source).

また、文書作成装置1は、配布先毎に異なる文章の置換文書を配布することが可能であるため、元文書である電子文書の文章のみが漏洩した場合や、人の手により書写された後に漏洩された場合においても、置換文書及び漏洩文書の文章の比較により、漏洩元の特定の可能性を高めることが可能となる。   In addition, since the document creation device 1 can distribute a replacement document with a different text for each distribution destination, when only the text of the electronic document that is the original document is leaked, or after being copied by a human hand Even in the case of leakage, it is possible to increase the possibility of specifying the leakage source by comparing the text of the replacement document and the leakage document.

また、文書作成装置1は、置換可能箇所を、検索文字列と置換文字列が対応付けられて記憶されたデータベースを参照することで特定するため、データベースに記憶された検索文字列及び置換文字列の数を増やすことで、置換可能箇所の数を増やすことが可能となる
。すなわち、置換のパターン(数)を増やすことが可能となり、電子文書の配布先毎に異なる置換文書を数多く作成することが可能となる。
In addition, the document creation device 1 identifies the replaceable portion by referring to a database stored in association with the search character string and the replacement character string, and thus the search character string and the replacement character string stored in the database. It is possible to increase the number of places that can be replaced by increasing the number of. That is, it is possible to increase the number of replacement patterns (number), and it is possible to create many different replacement documents for each electronic document distribution destination.

また、文書作成装置1は、ユーザにより選択された置換方法の種類毎に、検索文字列と置換文字列が対応付けられて記憶されたデータベースを参照し、置換箇所を選択することで、ユーザが置換に使用したい置換方法の種類についての置換を行うことが可能となる。   Further, the document creation apparatus 1 refers to a database in which a search character string and a replacement character string are stored in association with each type of replacement method selected by the user, and selects a replacement portion so that the user can select a replacement portion. It is possible to perform substitution for the type of substitution method to be used for substitution.

また、文書作成装置1は、置換ノイズ値がユーザにより変更されたときに、変更後の置換ノイズ値に基づき置換箇所の数を算出することで、ユーザにより選択された元文書からの変更度合いに応じた置換文書を作成することが可能となる。   In addition, when the replacement noise value is changed by the user, the document creation apparatus 1 calculates the number of replacement portions based on the changed replacement noise value, thereby obtaining the degree of change from the original document selected by the user. It is possible to create a corresponding replacement document.

また、文書作成装置1は、置換方法の種類を常用漢字又は常用漢字以外の漢字を用いた置換、送り仮名を変更することによる置換、類義語を用いた置換、言葉の誤使用による置換、誤字を用いた置換及び脱字を用いた置換とすることにより、様々な文字列による置換を行うことが可能となる。また、文章量が少ない場合であっても、当該文章に含まれる文字列に対して上記複数種類の置換を行うことにより、置換のパターン(数)を増やすことが可能となる。すなわち、電子文書の配布先毎に異なる置換文書を数多く作成することが可能となる。   In addition, the document creation apparatus 1 replaces the type of the replacement method with a common kanji or a kanji other than the common kanji, a substitution by changing the feed kana, a substitution using a synonym, a substitution due to misuse of a word, or a typo. By using substitution and substitution using omission, substitution with various character strings can be performed. Further, even when the amount of text is small, it is possible to increase the number of replacement patterns (number) by performing the above-described multiple types of replacement on the character string included in the text. That is, it is possible to create many different replacement documents for each electronic document distribution destination.

さらに、文書作成装置1は、ユーザが公文書について置換文書を作成するとき等は、公文書に誤字、脱字を含むことを避けるために、置換方法の種類として、誤字を用いた置換及び脱字を用いた置換以外の置換方法の種類を選択することが可能となる。すなわち、複数種類の置換方法の中から、ユーザの意向や元文書の内容及び属性に基づいた置換方法の種類による置換を行うこと(置換文書を作成すること)が可能となる。   Furthermore, when the user creates a replacement document for an official document, the document creation apparatus 1 performs substitution and erasure using typographical errors as types of substitution methods in order to avoid including typographical and typographical errors in the official document. It is possible to select the type of substitution method other than the substitution used. That is, it is possible to perform replacement (create a replacement document) according to the type of replacement method based on the user's intention, the contents and attributes of the original document, from among a plurality of types of replacement methods.

<変形例1>
本実施形態1では、文書作成装置1において、図11(電子文書置換全体フロー)のステップ102及び図24(漏洩文書特定フロー)のステップA102で照合するユーザ情報DBは同一のものとした。しかしながら、本発明はこれに限るものではなく、ステップ102及びステップA102で照合するユーザ情報DBは別のDBとしてもよい。この場合、例えば、ステップ102で照合するユーザ情報DBは、電子文書の置換を行うことが許可されているユーザについてのユーザ情報が記憶されるようにしてもよい。また、例えば、ステップA102で照合するユーザ情報DBは、漏洩文書の特定処理を行うことが許可されたユーザについてのユーザ情報が記憶されるようにしてもよい。
<Modification 1>
In the first embodiment, in the document creation apparatus 1, the user information DBs to be collated in step 102 in FIG. 11 (overall electronic document replacement flow) and step A102 in FIG. 24 (leakage document specifying flow) are the same. However, the present invention is not limited to this, and the user information DB collated in step 102 and step A102 may be another DB. In this case, for example, the user information DB to be collated in step 102 may store user information regarding users who are permitted to replace electronic documents. Further, for example, the user information DB to be collated in step A102 may store user information about a user who is permitted to perform a leaked document specifying process.

<変形例2>
本実施形態1では、文書作成装置1において、置換文書の作成(図)及び漏洩元特定(類似度の表示等)を行うこととしたが、置換文書の作成及び漏洩元特定は異なる装置において実行されるようにしてもよい。例えば、文書作成装置1では置換文書の作成を行い、他の装置において漏洩元特定処理を行うようにしてもよい。この場合、少なくとも、図3に示した、漏洩文書登録画面表示部175及び漏洩元確認結果画面表示部176は上記他の装置が備えるものとする。また、この場合、漏洩元特定を行う他の装置は、当該他の装置にアクセス可能なユーザ情報を記憶したユーザ情報DB(図示しない)を備えるようにする。
<Modification 2>
In the first embodiment, the document creation device 1 creates the replacement document (figure) and specifies the leakage source (similarity display, etc.), but the creation of the replacement document and the leakage source identification are executed by different devices. You may be made to do. For example, the document creation device 1 may create a replacement document, and the other device may perform the leakage source identification process. In this case, at least the leaked document registration screen display unit 175 and the leak source confirmation result screen display unit 176 shown in FIG. Further, in this case, another device that identifies the leakage source is provided with a user information DB (not shown) that stores user information accessible to the other device.

<変形例3>
本実施形態1では、類似度の算出を行う類似文書チェック装置30を文書作成装置1とは別の装置として説明したが、本発明はこれに限るものではない。例えば、類似度の算出を行うプログラムが文書作成装置1にインストールされることで、文書作成装置1において類似度の算出等を行うようにしてもよい。
<Modification 3>
In the first embodiment, the similar document check device 30 for calculating the similarity is described as a device different from the document creation device 1, but the present invention is not limited to this. For example, the similarity may be calculated in the document creation apparatus 1 by installing a program for calculating the similarity in the document creation apparatus 1.

<変形例4>
本実施形態1では、置換可能箇所記録DB1Cと置換箇所記録DB1Eは別のデータベースとして説明したが、これらのDB1C及びDB1Eを統合させて、1つのデータベースとしてもよい。この場合、統合されたデータベースには、例えば、上述したこれらのDBに含まれる項目に加え、各置換可能箇所について実際に置換が行われたか否かの情報を記憶する「置換有無」の項目が含まれるようにしてもよい。
<Modification 4>
In the first embodiment, the replaceable place record DB1C and the replaceable place record DB1E have been described as separate databases. However, these DB1C and DB1E may be integrated into a single database. In this case, in the integrated database, for example, in addition to the items included in these DBs described above, there is an item “replacement presence / absence” that stores information on whether or not each replaceable portion has actually been replaced. It may be included.

<変形例5>
本実施形態1では、ステップ1044で元文書をファイルサーバ20へ送信し、ステップ1063で置換文書をファイルサーバ20へ送信するようにしたが、元文書と置換文書を同時に送信するようにしてもよい。例えば、ステップ1044では元文書はファイルサーバ20へ送信されず、図21のステップ1063で置換文書と併せて元文書が送信されるようにしてもよい。
<Modification 5>
In the first embodiment, the original document is transmitted to the file server 20 in step 1044 and the replacement document is transmitted to the file server 20 in step 1063. However, the original document and the replacement document may be transmitted simultaneously. . For example, the original document may not be transmitted to the file server 20 in step 1044, and the original document may be transmitted together with the replacement document in step 1063 of FIG.

<変形例6>
本実施形態1では、類似文書チェック装置30は、文書作成装置1に対して、類似度及びファイル名を送信するようにしたが、本発明はこれに限るものではない。類似文書チェック装置30は、例えば、ファイルサーバ20に格納されたファイル名対応付けDBを参照することにより、類似度及びファイル名と共に配布先名を文書作成装置1に送信するようにしてもよい。これによって、文書作成装置1は、ステップ1062でファイルサーバ20から配布先名を受信せずとも、配布先名を取得することが可能となる。
<Modification 6>
In the first embodiment, the similar document check device 30 transmits the similarity and the file name to the document creation device 1, but the present invention is not limited to this. The similar document check device 30 may transmit the distribution destination name to the document creation device 1 together with the similarity and the file name, for example, by referring to the file name association DB stored in the file server 20. Thus, the document creation apparatus 1 can acquire the distribution destination name without receiving the distribution destination name from the file server 20 in step 1062.

<変形例7>
本実施形態1では、文書作成装置1において、ステップ1051で全ての分類についての置換可能箇所数が算出されるようにしたが、ステップ1053により分類が選択された後に、選択された分類についてのみ置換可能箇所数が算出されるようにしてもよい。
<Modification 7>
In the first embodiment, the document creation apparatus 1 calculates the number of replaceable places for all the classifications in Step 1051, but only the selected classification is replaced after the classification is selected in Step 1053. The number of possible locations may be calculated.

<その他の実施形態>
上述の実施形態1では、Web(World Wide Web)画面である各種画面により置換文書の作成及び保存が行われるようにしたが、本発明では置換文書の作成及び保存のみを行う文書作成装置(プログラム)に限るものではない。本発明に係る文書作成装置(プログラム)は、例えば、メールシステム(メーラー)やプリンタドライバを利用した漏洩元特定システムに応用できる。
<Other embodiments>
In the first embodiment, the replacement document is created and stored on various screens that are Web (World Wide Web) screens. However, in the present invention, a document creation device (program that only creates and saves a replacement document) Is not limited to). The document creation apparatus (program) according to the present invention can be applied to, for example, a leak source identification system using a mail system (mailer) or a printer driver.

<実施形態2:メールシステムを利用した場合>
本発明に係る文書作成装置(プログラム)は、メールシステムを利用した漏洩元特定システムに応用できる。本メールシステムを利用した漏洩元特定システムでは、置換文書の作成及び保存を行い、メールシステムを利用して置換文書を配布先に送信可能とする。
<Embodiment 2: When using a mail system>
The document creation apparatus (program) according to the present invention can be applied to a leakage source identification system using a mail system. In the leakage source identification system using this mail system, a replacement document is created and stored, and the replacement document can be transmitted to the distribution destination using the mail system.

図29は、実施形態2に係るメールシステムを利用した漏洩元特定システムの漏洩元特定全体フローである。図11の実施形態1に係る漏洩元特定全体フローと同様の処理については、図11と同様のステップ番号を付す。   FIG. 29 is a leakage source identification overall flow of the leakage source identification system using the mail system according to the second embodiment. The same steps as those in FIG. 11 are assigned to the same processes as those in the entire leakage source specifying overall flow according to the first embodiment in FIG.

但し、図29のステップ106で入力される「配布先名」としては、上述した、配布先の人物の氏名、当該人物のID、電話番号などに加え、「送信先メールアドレス」が例示される。また、送信先のメールアドレスが格納されたCSVファイルを読み込むことで、配布先名の入力を行うようにしてもよい。   However, the “distribution destination name” input in step 106 of FIG. 29 is exemplified by “transmission destination mail address” in addition to the name of the distribution destination person, the ID of the person, the telephone number, and the like. . Alternatively, the distribution destination name may be input by reading a CSV file storing the destination mail address.

また、図29のステップ107Aでは、メールシステムの送信者情報登録画面(図示し
ない)において、送信者の名前や送信者のメールアドレスを入力し、「送信」ボタンがユーザにより押下されることで、置換文書を添付したメールが配布先へ送信されるようにする。
Also, in step 107A of FIG. 29, on the sender information registration screen (not shown) of the mail system, the sender's name and sender's mail address are input, and the “send” button is pressed by the user. The mail with the replacement document attached is sent to the distribution destination.

実施形態2に係る文書作成装置(プログラム)は、例えば、メールシステムを起動させることで、上記で示した漏洩元特定全体フロー(置換文書の作成等)が開始されるように設定されてもよい。また、例えば、Web画面で各種設定を行い、「送信」ボタンが押下されることで、メールシステムが起動し、メールが送信されるようにしてもよい。   The document creation apparatus (program) according to the second embodiment may be set so that, for example, the leakage source identification overall flow (creation of a replacement document, etc.) described above is started by starting a mail system. . In addition, for example, various settings may be performed on the Web screen, and the mail system may be activated and mail transmitted by pressing a “send” button.

これにより、メールシステムを利用した、本発明に係る文書作成プログラム(装置)により、メールシステムで個別に各送信先メールアドレス及び置換文書を設定することなく、配布先へ置換文書をメール送信することが可能となる。   Thereby, the document creation program (apparatus) according to the present invention using the mail system can send the replacement document to the distribution destination by mail without individually setting each destination mail address and replacement document in the mail system. Is possible.

<実施形態3:プリンタドライバを利用した場合>
本発明に係る文書作成プログラムは、プリンタドライバを利用した漏洩元特定システムに応用できる。本プリンタドライバを利用した漏洩元特定システムでは、置換文書の作成及び保存を行い、プリンタドライバを利用して置換文書を印刷可能とする。
<Third Embodiment: When Using a Printer Driver>
The document creation program according to the present invention can be applied to a leakage source identification system using a printer driver. In the leak source identification system using this printer driver, a replacement document is created and stored, and the replacement document can be printed using the printer driver.

図30は、実施形態3に係るプリンタドライバを利用した漏洩元特定システムの漏洩元特定全体フローである。図11の実施形態1に係る漏洩元特定全体フローと同様の処理については、図11と同様のステップ番号を付す。   FIG. 30 is an entire leakage source identification flow of the leakage source identification system using the printer driver according to the third embodiment. The same steps as those in FIG. 11 are assigned to the same processes as those in the entire leakage source specifying overall flow according to the first embodiment in FIG.

図30のステップ103Bでは、ユーザが文書作成ソフトウェア等の画面から「印刷ボタン」を押下し、プリンタドライバを選択すると、入力部16はこのイベントを受信する。これによって、印刷画面表示部(図示しない)が印刷画面を表示させる。   In step 103B of FIG. 30, when the user presses the “print button” from the screen of the document creation software or the like and selects the printer driver, the input unit 16 receives this event. As a result, a print screen display unit (not shown) displays the print screen.

実施形態1では、表示部17が各種画面を表示させることにより、置換文書の作成等を行うようにしたが、本実施形態3のステップ104以降の処理は、この印刷画面上で行うものとする。印刷画面は、上述した各種画面における設定項目を具備するものであり、例えば、ユーザは印刷画面上で、配布数の入力や分類等を選択可能とする。   In the first embodiment, the display unit 17 displays various screens to create a replacement document. However, the processing after step 104 in the third embodiment is performed on this print screen. . The print screen includes the setting items on the various screens described above. For example, the user can select input of distribution numbers, classification, and the like on the print screen.

また、図30のステップ107Bでは、プリンタドライバの印刷画面において、「印刷」ボタンがユーザにより押下されることで、配布先毎の置換文書がプリンタから出力(印刷)される。この際、印刷された置換文書の紙のヘッダ部分や本文の中に、配布先名が表示されるようにしてもよい。   In step 107B of FIG. 30, the replacement document for each distribution destination is output (printed) from the printer when the user presses the “print” button on the print screen of the printer driver. At this time, the distribution destination name may be displayed in the paper header or body of the printed replacement document.

これにより、プリンタドライバを利用した、本発明に係る文書作成プログラム(装置)により、元文書である電子文書を開いた状態で、プリンタドライバの印刷画面上において各種設定を行うことにより、簡単に、置換文書の作成及び配布先毎の置換文書の印刷を、一括して行うことが可能となる。   Thus, by making various settings on the print screen of the printer driver with the electronic document as the original document opened by the document creation program (apparatus) according to the present invention using the printer driver, It is possible to create a replacement document and print a replacement document for each distribution destination in a batch.

1 文書作成装置
2 CPU
3 主記憶装置
4 外部記憶装置
5 通信IF
6 通信バス
7 入力装置
8 表示装置
10 置換可能箇所数算出部
11 配布可能数算出部
12 置換ノイズ算出部
13 文書置換部
14 送信部
15 受信部
16 入力部
17 表示部
171 元文書登録画面表示部
172 置換画面表示部
173 置換文書登録画面表示部
174 結果確認画面表示部
175 漏洩文書登録画面表示部
176 漏洩元確認結果画面表示部
18 記憶部
19 用語データベース
191 常用漢字データベース
192 送り仮名データベース
193 類義語データベース
194 誤使用データベース
195 誤字データベース
196 脱字データベース
1A 置換ノイズ重み付けデータベース
1B ユーザ情報データベース
1C 置換可能箇所記録データベース
1D 読み出し部
1E 置換箇所記録データベース
20 ファイルサーバ
30 類似文書チェック装置
N1 ネットワーク
1 Document creation device 2 CPU
3 Main storage device 4 External storage device 5 Communication IF
6 Communication bus 7 Input device 8 Display device 10 Replaceable part number calculation unit 11 Distributable number calculation unit 12 Replacement noise calculation unit 13 Document replacement unit 14 Transmission unit 15 Reception unit 16 Input unit 17 Display unit 171 Original document registration screen display unit 172 Replacement screen display unit 173 Replacement document registration screen display unit 174 Result confirmation screen display unit 175 Leaked document registration screen display unit 176 Leakage source confirmation result screen display unit 18 Storage unit 19 Term database 191 Common kanji database 192 Sending kana database 193 Synonym database 194 Misuse database 195 Erroneous character database 196 Omission database 1A Replacement noise weighting database 1B User information database 1C Replaceable portion recording database 1D Reading unit 1E Replacement portion recording database 20 File server 30 Similar document Click device N1 network

Claims (7)

電子文書中の文字列を異なる文字列により置換した置換文書を配布数分作成する文書作成装置であって、
電子文書中の、文字列を異なる文字列に置換可能な箇所である置換可能箇所を、前記電子文書中で検索の対象となる検索文字列と置換文字列とが対応付けられて記憶されたデータベースを参照することで特定する置換可能箇所特定手段と、
前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を、置換文書内の置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択し、選択された前記置換箇所の文字列を当該文字列と一致する検索文字列と対応する置換文字列により置換することで前記置換文書を作成する置換手段と、
を備える文書作成装置。
A document creation device that creates replacement documents by replacing character strings in an electronic document with different character strings,
A database in which a searchable character string to be searched in the electronic document and a replacement character string are stored in association with each other in the electronic document, where a replaceable character string can be replaced with a different character string. Replaceable part specifying means for specifying by referring to,
A predetermined number of replacement locations to be actually replaced are selected from the replaceable locations so that a combination of replacement locations in the replacement document does not match a combination of replacement locations in other replacement documents, and the selected replacement A replacement means for creating the replacement document by replacing the character string of the place with a replacement character string corresponding to the search character string matching the character string;
A document creation apparatus comprising:
前記データベースは、置換方法の種類毎に、検索文字列と置換文字列が対応付けられて記憶されたデータベースであり、
前記置換可能箇所特定手段は、前記置換方法の種類のうちユーザにより選択された置換方法の種類毎に前記置換可能箇所を特定し、
前記置換手段は、前記選択された各置換方法の種類について、前記選択された置換方法の種類毎に前記特定された前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を選択することを特徴とする請求項1に記載の文書作成装置。
The database is a database in which a search character string and a replacement character string are stored in association with each type of replacement method,
The replaceable location specifying means specifies the replaceable location for each type of replacement method selected by the user among the types of replacement methods,
The replacement means selects, for each of the selected replacement method types, a predetermined number of replacement locations for actual replacement from the identified replaceable locations for each of the selected replacement method types. The document creation apparatus according to claim 1.
ユーザにより前記置換方法の種類が選択されたときに、前記選択された前記置換方法の種類毎に、前記置換方法の種類毎の前記置換箇所の数の初期値と前記置換の種類毎の重み付け値を乗算し、さらに、各置換方法の種類について前記乗算された値を加算することで、置換による前記電子文書の変更度合を示す置換ノイズ値を算出する置換ノイズ算出手段であって、前記置換ノイズ値がユーザにより変更されたときに、変更後の置換ノイズ値及び前記置換方法の種類毎の重み付け値に基づき、前記置換方法の種類毎の置換箇所の数を算出する置換ノイズ算出手段を備え、
前記置換手段は、前記置換ノイズ値がユーザにより変更されたときに算出された前記置換方法の種類毎の置換箇所の数分置換箇所を選択する
ことを特徴とする請求項2に記載の文書作成装置。
When the type of the replacement method is selected by the user, an initial value of the number of replacement locations for each type of the replacement method and a weighting value for each type of replacement for each type of the selected replacement method And a replacement noise calculation means for calculating a replacement noise value indicating the degree of change of the electronic document due to the replacement by adding the multiplied values for each replacement method type, wherein the replacement noise When the value is changed by the user, based on the replacement noise value after the change and the weighting value for each type of the replacement method, comprising replacement noise calculation means for calculating the number of replacement locations for each type of the replacement method,
3. The document creation according to claim 2, wherein the replacement unit selects a replacement part by the number of replacement parts for each type of the replacement method calculated when the replacement noise value is changed by a user. apparatus.
前記置換方法の種類は、常用漢字又は常用漢字以外の漢字を用いた置換、送り仮名を変更することによる置換、類義語を用いた置換、言葉の誤使用による置換、誤字を用いた置換及び脱字を用いた置換の少なくとも1つを含むことを特徴とする請求項2又は3に記載の文書作成装置。   The types of the replacement methods include substitution using common kanji or non-common kanji, substitution by changing the feed kana, substitution using synonyms, substitution due to misuse of words, substitution using typographical characters and omission. 4. The document creation apparatus according to claim 2, further comprising at least one of the substitutions used. コンピュータに、電子文書中の文字列を異なる文字列により置換した置換文書を配布数分作成させるための文書作成プログラムであって、
電子文書中の、文字列を異なる文字列に置換可能な箇所である置換可能箇所を、前記電子文書中で検索の対象となる検索文字列と置換文字列とが対応付けられて記憶されたデータベースを参照することで特定し、
前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を、置換文書内の置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択し、選択された前記置換箇所の文字列を当該文字列と一致する検索文字列と対応する置換文字列により置換することで前記置換文書を作成する処理をコンピュータに行わせるための文書作成プログラム。
A document creation program for causing a computer to create a replacement document by replacing a character string in an electronic document with a different character string,
A database in which a searchable character string to be searched in the electronic document and a replacement character string are stored in association with each other in the electronic document, where a replaceable character string can be replaced with a different character string. Identify by referring to
A predetermined number of replacement locations to be actually replaced are selected from the replaceable locations so that a combination of replacement locations in the replacement document does not match a combination of replacement locations in other replacement documents, and the selected replacement A document creation program for causing a computer to perform a process of creating the replacement document by replacing a character string at a place with a replacement character string corresponding to a search character string that matches the character string.
電子文書中の文字列を異なる文字列により置換した置換文書を配布数分作成することが可能なコンピュータを用いた文書作成方法であって、
電子文書中の、文字列を異なる文字列に置換可能な箇所である置換可能箇所を、前記電子文書中で検索の対象となる検索文字列と置換文字列とが対応付けられて記憶されたデータベースを参照することで特定し、
前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を、置換文書内の置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択し、選択された前記置換箇所の文字列を当該文字列と一致する検索文字列と対応する置換文字列により置換することで前記置換文書を作成する文書作成方法。
A document creation method using a computer capable of creating replacement documents by replacing character strings in electronic documents with different character strings,
A database in which a searchable character string to be searched in the electronic document and a replacement character string are stored in association with each other in the electronic document, where a replaceable character string can be replaced with a different character string. Identify by referring to
A predetermined number of replacement locations to be actually replaced are selected from the replaceable locations so that a combination of replacement locations in the replacement document does not match a combination of replacement locations in other replacement documents, and the selected replacement A document creation method for creating the replacement document by replacing a character string at a place with a replacement character string corresponding to a search character string that matches the character string.
電子文書中の文字列を異なる文字列により置換した置換文書を配布数分作成する文書作成装置と類似文書チェック装置を備える漏洩元特定システムであって、
文書作成装置が、
電子文書中の、文字列を異なる文字列に置換可能な箇所である置換可能箇所を、前記電子文書中で検索の対象となる検索文字列と置換文字列とが対応付けられて記憶されたデータベースを参照することで特定する置換可能箇所特定手段と、
前記置換可能箇所の中から実際に置換を行う所定数の置換箇所を、置換文書内の置換箇所の組み合わせが他の置換文書の置換箇所の組み合わせと一致しないように選択し、選択された前記置換箇所の文字列を当該文字列と一致する検索文字列と対応する置換文字列により置換することで前記置換文書を作成する置換手段と、
を備え、
類似文書チェック装置が、
前記作成された前記置換文書と漏洩された文書である漏洩文書との文章の類似度を算出する類似度算出手段と、
を備えることを特徴とする漏洩元特定システム。
A leak source identification system comprising a document creation device and a similar document check device for creating replacement documents by replacing character strings in electronic documents with different character strings,
The document creation device
A database in which a searchable character string to be searched in the electronic document and a replacement character string are stored in association with each other in the electronic document, where a replaceable character string can be replaced with a different character string. Replaceable part specifying means for specifying by referring to,
A predetermined number of replacement locations to be actually replaced are selected from the replaceable locations so that a combination of replacement locations in the replacement document does not match a combination of replacement locations in other replacement documents, and the selected replacement A replacement means for creating the replacement document by replacing the character string of the place with a replacement character string corresponding to the search character string matching the character string;
With
Similar document check device
Similarity calculation means for calculating the similarity of a sentence between the created replacement document and a leaked document that is a leaked document;
A leak source identification system comprising:
JP2011080959A 2011-03-31 2011-03-31 Document creation apparatus, document creation program, document creation method, and leakage source identifying system using document creation apparatus Withdrawn JP2012216083A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011080959A JP2012216083A (en) 2011-03-31 2011-03-31 Document creation apparatus, document creation program, document creation method, and leakage source identifying system using document creation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011080959A JP2012216083A (en) 2011-03-31 2011-03-31 Document creation apparatus, document creation program, document creation method, and leakage source identifying system using document creation apparatus

Publications (1)

Publication Number Publication Date
JP2012216083A true JP2012216083A (en) 2012-11-08

Family

ID=47268794

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011080959A Withdrawn JP2012216083A (en) 2011-03-31 2011-03-31 Document creation apparatus, document creation program, document creation method, and leakage source identifying system using document creation apparatus

Country Status (1)

Country Link
JP (1) JP2012216083A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014103115A1 (en) * 2012-12-26 2014-07-03 三菱電機株式会社 Illicit intrusion sensing device, illicit intrusion sensing method, illicit intrusion sensing program, and recording medium
JP2019505937A (en) * 2015-12-31 2019-02-28 アクシオム コーポレーション Sorting text in database tables, text files, and data feeds
JP2019121138A (en) * 2017-12-29 2019-07-22 富士通株式会社 Data processing device, data processing method and data processing program
JP2019185570A (en) * 2018-04-13 2019-10-24 富士ゼロックス株式会社 Information processing apparatus, information processing system, and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014103115A1 (en) * 2012-12-26 2014-07-03 三菱電機株式会社 Illicit intrusion sensing device, illicit intrusion sensing method, illicit intrusion sensing program, and recording medium
JP2019505937A (en) * 2015-12-31 2019-02-28 アクシオム コーポレーション Sorting text in database tables, text files, and data feeds
US11003747B2 (en) 2015-12-31 2021-05-11 Liveramp, Inc. Salting text in database tables, text files, and data feeds
JP2019121138A (en) * 2017-12-29 2019-07-22 富士通株式会社 Data processing device, data processing method and data processing program
JP7053987B2 (en) 2017-12-29 2022-04-13 富士通株式会社 Data processing equipment, data processing methods and data processing programs
JP2019185570A (en) * 2018-04-13 2019-10-24 富士ゼロックス株式会社 Information processing apparatus, information processing system, and program
JP7275477B2 (en) 2018-04-13 2023-05-18 富士フイルムビジネスイノベーション株式会社 Information processing device, information processing system, and program

Similar Documents

Publication Publication Date Title
CN109101469B (en) Extracting searchable information from digitized documents
JP4995950B2 (en) Forensic system, forensic method, and forensic program
US9262104B2 (en) Information processing apparatus, image processing apparatus, and information processing system
US7668372B2 (en) Method and system for collecting data from a plurality of machine readable documents
US8713054B2 (en) System or method to assist and automate an information security classification and marking process for government and non-government organizations for information of an electronic document
US9372721B2 (en) System for processing data received from various data sources
US7711191B2 (en) Electronic transaction processing server with automated transaction evaluation
US20110276872A1 (en) Dynamic font replacement
US20090112652A1 (en) Project publishing system and method
US20120179702A1 (en) Method for setting metadata, system for setting metadata, and program
US20150095356A1 (en) Automatic keyword tracking and association
JP5735403B2 (en) Document management device
JP2012216083A (en) Document creation apparatus, document creation program, document creation method, and leakage source identifying system using document creation apparatus
JP2007108889A (en) Intellectual property management system, intellectual property management method and program
US20090100426A1 (en) Methods and systems of reconciling sources of print job processing information in a print processing environment
JP6976763B2 (en) Journal information processing device, journal information processing method, and program
JP5400496B2 (en) System for creating articles based on the results of financial statement analysis
CN113168538A (en) Scanning device with regional OCR user interface
JP5243054B2 (en) Data management system, method and program
JP5550959B2 (en) Document processing system and program
JP2008171123A (en) Accounting/tax data confirmation processor, accounting/tax data confirmation processing program, and accounting/tax data confirmation processing method
JP5708372B2 (en) Document file difference extraction system, image processing apparatus, document file difference extraction method, and program
US20130185317A1 (en) Pdf address extractor for mail
JP2007058415A (en) Text mining device, text mining method, and program for text mining
JP6554841B2 (en) Information processing apparatus and information processing program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140603