JP2013084180A - Document management device - Google Patents

Document management device Download PDF

Info

Publication number
JP2013084180A
JP2013084180A JP2011224716A JP2011224716A JP2013084180A JP 2013084180 A JP2013084180 A JP 2013084180A JP 2011224716 A JP2011224716 A JP 2011224716A JP 2011224716 A JP2011224716 A JP 2011224716A JP 2013084180 A JP2013084180 A JP 2013084180A
Authority
JP
Japan
Prior art keywords
word
document
determination
correction
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011224716A
Other languages
Japanese (ja)
Other versions
JP5683428B2 (en
Inventor
Seiji Takano
誠司 高野
Satoshi Naganuma
聡 永沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2011224716A priority Critical patent/JP5683428B2/en
Publication of JP2013084180A publication Critical patent/JP2013084180A/en
Application granted granted Critical
Publication of JP5683428B2 publication Critical patent/JP5683428B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a technology which is helpful for preliminary check in a pre-stage of storing document data in a database in the organization.SOLUTION: The document management device includes: dictionary storage means for NG determination for storing an NG word; object document reception means for receiving document data to be inspected from a predetermined terminal; morphemic analysis means for extracting a word by performing morphemic analysis to the document of the received document data; and NG determination means. The NG determination means determines whether or not the word extracted by the morphemic analysis means is the NG word by referring to the dictionary storage means for NG determination, and when determining that the NG word exists, determines whether or not the document of the document data is a correction candidate by using the NG word as a start point.

Description

本発明は、組織内における文書管理をする際に、不適切な表現を含む文書が保存されることを未然に防止する技術に関する。   The present invention relates to a technique for preventing documents containing inappropriate expressions from being saved when managing documents in an organization.

情報処理技術の進展に伴って、法人でも個人でも、保有作成する書類に関してはペーパーレス化が進展し、書類が電子化されて保存され管理されるようになった。 特に、組織内での情報共有や情報検索において、効率的な管理運営に寄与している。   Along with the progress of information processing technology, both corporations and individuals have become paperless with respect to the documents they create, and the documents have been stored and managed electronically. In particular, it contributes to efficient management and operation in information sharing and information retrieval within an organization.

さて、米国の訴訟制度において、訴訟の被告となった場合に必要な証拠文書を相手方に提示しなければならない「ディスカバリー」と呼ばれる制度がある。 たとえば、X社が製造販売している製品AがY社の保有する特許権Bを侵害している、と訴訟を起こされた場合を想定する。 X社が特許権Bの存在をいつくらいから認識していたのか、製品Aの製造販売に際して特許権Bの侵害とならない(あるいは、なる)といつ判断したのか、といったことが、損害額の認定などにおいて争われることがある。 そうした場合に、裁判所が必要と認めた場合に、X社は関連する社内の書類提出を命じられることがある。
ディスカバリー制度は、前述した知的財産関連の訴訟の他、金融税金といった事件における訴訟において用いられる制度である。
Now, in the US litigation system, there is a system called “Discovery” that requires the other party to provide necessary evidence in the case of becoming a defendant in a lawsuit. For example, assume a case in which a lawsuit is filed that product A manufactured and sold by company X infringes patent right B owned by company Y. The amount of damage is determined by how long company X has been aware of the existence of patent right B, and when it was determined that it would not infringe (or become) infringement of patent right B when manufacturing and selling product A May be contested. In such cases, if the court finds it necessary, Company X may be ordered to submit relevant internal documents.
The discovery system is used in litigation in cases such as financial taxes in addition to the aforementioned intellectual property-related litigation.

近年のディスカバリー制度では、書類の電子化の進展に伴い、電子化された文書が保存された記録媒体の提出が命じられることとなる。旧来の「ディスカバリー制度」と区別するために「イー・ディスカバリー(e-Discovery)」と呼ばれることもある。
電子化された書類は、タイムスタンプといった認証技術を併用しない限り、作成日時や改訂日時を変更することは容易であるものの、作成日時や改訂日時を改ざん等したことが発覚したとすれば、裁判において不利な状況に追い込まれる可能性がある。 したがって、「イー・ディスカバリー(e-Discovery)」を意識した適切な書類管理が、多くの企業で求められる。
In the recent discovery system, with the progress of computerization of documents, submission of a recording medium storing the digitized document is ordered. It is sometimes called “e-Discovery” to distinguish it from the traditional “Discovery System”.
Although it is easy to change the date and time of revision of the electronic document without using authentication technology such as a time stamp, if it is discovered that the date of creation or date of revision has been altered, There is a possibility that it will be driven into a disadvantageous situation. Accordingly, many companies require appropriate document management that is conscious of “e-Discovery”.

企業における情報管理システムは、オーダーメイドされることも少なくないが、導入コストや納期の面で導入が容易な情報管理システムも望まれている。
たとえば、特許文献1に開示された技術では、各企業における機密文書を、それら企業と契約を締結した外部の事業者が管理するサーバ装置を用いることによって一括して保管するシステムが提案されている。
An information management system in a company is often made to order, but an information management system that is easy to introduce in terms of introduction cost and delivery time is also desired.
For example, in the technology disclosed in Patent Document 1, a system is proposed in which confidential documents in each company are collectively stored by using a server device managed by an external operator who has concluded a contract with those companies. .

また、特許文献1に開示された技術に内在する問題点を見いだし、企業における一般的なセキュリティポリシーに反している等の点を解決した技術として、特許文献2に開示された情報管理システムも提案されている。
Also, an information management system disclosed in Patent Document 2 is proposed as a technique for finding out problems inherent in the technology disclosed in Patent Document 1 and solving problems such as violation of a general security policy in a company. Has been.

特開2001−222525号公報JP 2001-222525 A 特開2009−9551号公報JP 2009-9551 A

「イー・ディスカバリー(e-Discovery)」においては、膨大な書類が開示対象となり、中には例えば担当者の誤解に基づく記録で後に訂正されたにもかかわらずその訂正の記録が脱落した文章のように、不要な誤解を招くような記録(すなわち開示要求を受けた組織にとって不都合な記録)が含まれる場合もある。
開示要求があってから当該組織にとってこのような不都合な文書ファイルを削除したり改訂したりすれば、裁判において不利になる可能性がある。 不都合な文書ファイルの削除はその証跡が残る可能性がある。改訂した文書ファイルに改訂の日時データが残り、その日時データが裁判準備の開始後であれば、改訂前の文書ファイルを破棄したことに等しい。 そうした事実が裁判上で明らかになれば、関係者の心証は悪くなり、裁判が不利に進行する可能性がある。
In “e-Discovery”, an enormous amount of documents are subject to disclosure. For example, a document based on a misunderstanding by the person in charge of a document that was later corrected but the record of the correction was lost. As described above, there may be a record that causes unnecessary misunderstanding (that is, a record that is inconvenient for an organization that has requested disclosure).
If such an inconvenient document file is deleted or revised after the disclosure request is made, there is a possibility that it will be disadvantaged in a trial. Deletion of an inconvenient document file may leave a trail. If the revised date and time data remains in the revised document file and the date and time data is after the start of trial preparation, it is equivalent to discarding the document file before revision. If such facts are revealed in the trial, the stakeholder's morale will worsen and the trial may proceed unfavorably.

以上のような課題を回避するためには、その組織において文書ファイルを保管する前の段階で当組織にとって誤解を招くような不都合な文書ファイルが存在していないか事前チェックすることが望ましい、ということになる。
しかし、出願人が先行技術調査のため、民間の特許情報サービスを使用してキーワード検索などを試みたが、文書ファイルを組織で利用するサーバやデータベースへ格納する前段階で事前チェックするシステムは見あたらなかった。
In order to avoid the above problems, it is desirable to check in advance whether there is any inconvenient document file that would cause misunderstanding for the organization before storing the document file in the organization. It will be.
However, the applicant tried to search for keywords using a private patent information service for prior art search, but there was no system that pre-checks document files before storing them in the server or database used by the organization. There wasn't.

本発明が解決しようとする課題は、文書ファイルを組織で利用するサーバやデータベースへ格納する前段階で事前チェックする際に役立つ技術を提供することにある。
The problem to be solved by the present invention is to provide a technique useful for pre-checking a document file before it is stored in a server or database used in an organization.

(第一の発明)
第一の発明は、 NGワードを格納するNG判定用辞書記憶手段と、 検閲対象となる文書データを所定の端末から受信する対象文書受信手段と、 その対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、 その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、を備えた文書管理装置 に係る。
(First invention)
NG determination dictionary storing means for storing NG words, target document receiving means for receiving document data to be censored from a predetermined terminal, and document data document received by the target document receiving means Morphological analysis means for extracting words by morphological analysis, and determining whether or not the word extracted by the morphological analysis means is the NG word by referring to the dictionary storage means for NG determination, and NG word exists In this case, the document management apparatus includes an NG determination unit that determines whether or not it is a correction candidate from the NG word as a starting point.

「検閲対象」が「文書データ」であるとしているのは、文書ファイルのほか、文書ファイル中の所定の文書データや、電子メールの中の一文、といった場合もあるからである。   The reason that the “censored object” is “document data” is because there are cases in which, in addition to the document file, predetermined document data in the document file, or a sentence in an e-mail.

「NGワード」とは、本願に係る文書管理装置を導入する組織において文書中に用いる単語として相応しくない、と判断すべきワードである。たとえば、公序良俗を害するような言葉、差別用語、などである。 NGワードは、同一組織内であっても部署が異なればNGワードに該当したりしなかったりする場合もあるので、部署毎にNGワードを区別するようにしてもよい。
公共放送における禁止用語集などを用いることで、NG判定用辞書記憶手段への入力の手間を軽減してもよい。
The “NG word” is a word that should be determined not to be suitable as a word used in a document in an organization that introduces the document management apparatus according to the present application. For example, words that discourage public order and morals, discriminatory terms, etc. Since the NG word may or may not correspond to the NG word if the department is different even within the same organization, the NG word may be distinguished for each department.
By using a collection of prohibited terms in public broadcasting, etc., the trouble of inputting to the NG determination dictionary storage means may be reduced.

(作用)
NG判定用辞書記憶手段には、NGワードを予め格納する。
検閲対象となる文書データを、所定の端末から対象文書受信手段が受信する。 その受信した文書データに対して形態素解析手段が形態素解析をし、当該文書データを単語ごとに分割する。
NG判断手段は、形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断する。 そして、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断する。
(Function)
The NG determination dictionary storage means stores NG words in advance.
The target document receiving means receives the document data to be censored from a predetermined terminal. The morphological analysis means performs morphological analysis on the received document data, and divides the document data into words.
The NG determination means determines whether the word extracted by the morphological analysis means is the NG word with reference to the NG determination dictionary storage means. When it is determined that an NG word exists, it is determined whether or not it is a correction candidate with the NG word as a starting point.

(第一の発明のバリエーション1)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、格納されるNGワード毎にランクデータを含み、 前記NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は当該NGワードを起点として当該起点のランクによって修正候補であるか否かを判断することとしてもよい。
(Variation 1 of the first invention)
The document management apparatus according to the first invention may be formed as follows.
That is, the NG determination dictionary storage means includes rank data for each NG word to be stored, and when the NG determination means determines that an NG word exists in the document of the document data to be censored, the NG word It is good also as judging whether it is a correction candidate by the rank of the said starting point.

「ランクデータ」とは、たとえば、どんな文書にも使ってはいけない言葉、場合によっては使うことが許される言葉、といった危険度のランクである。 たとえば、どんな文書にも使ってはいけない言葉が「5」、場合によっては使うことが許される言葉が「4」、という具合に危険度のランク情報を設定すればよい。このように、ランクデータは危険度を数値で記述することが好ましい。処理が容易となるからである。しかし、数値の記述のみならず、文字(例えば「使用禁止」「場合によって使用可」「警告表示」等)情報や色などで記述するようにしてもよい。一方、チェック結果を表示する出力の際には危険度のランクを数値ではなく、色や文字の太さで表現すると直感的な認識が可能となって好ましい。
他の請求項にて特定する「処理結果出力手段」においては、修正候補に対してランク表示を実行する。 ここで「ランク表示」とは、NGワードとして抽出された際に、そのNGワードの危険度を赤や黄の色で着色表現される表示、ハイライトの色や濃さ、網掛けの種類や濃さ、下線の種類や太さ、イタリックの角度、フォントの変更、文字の大小、文字の太さ、で表現される表示、当該ランクがカーソルを当てると吹き出しなどで危険度が表現される表示、あるいはこれらを組み合わせた表示である。
なお、NGワードの登録時にランクデータが入力されていない場合には、後に入力することとしてもよい。また、入力されていたランクデータがふさわしくない場合には、改訂して入力し直してもよい。
“Rank data” is, for example, a rank of danger such as a word that should not be used in any document and a word that may be used in some cases. For example, the rank information of the risk level may be set such that the word that should not be used in any document is “5” and the word that is allowed to be used in some cases is “4”. Thus, it is preferable that the rank data describes the degree of danger as a numerical value. This is because processing becomes easy. However, not only numerical description but also character (for example, “use prohibited”, “usable in some cases”, “warning display”, etc.) information or color may be used. On the other hand, when outputting the check result, it is preferable to express the rank of the degree of danger not by a numerical value but by a color or a thickness of a character because intuitive recognition is possible.
In the “processing result output means” specified in another claim, rank display is executed for the correction candidates. Here, “rank display” means that when extracted as an NG word, the danger level of the NG word is expressed by coloring in red or yellow color, the color and intensity of highlight, the type of shading, Display expressed by darkness, underline type and thickness, italic angle, font change, character size, character thickness, and display of the degree of danger with a balloon when the rank is placed over the cursor Or a combination of these.
If rank data is not input at the time of NG word registration, it may be input later. If the rank data that has been input is not appropriate, it may be revised and input again.

(作用)
NG判定用辞書記憶手段は、格納されるNGワード毎にランクデータを含んで登録されている。
NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は、当該NGワードを起点として当該起点のランクによって修正候補であるか否かを判断する。
修正候補を出力された作業者は、ランクデータを意識しながら修正作業が行える。
(Function)
The NG determination dictionary storage means is registered including rank data for each stored NG word.
When it is determined that there is an NG word in the document of the document data to be censored, the NG determination unit determines whether the correction candidate is a correction candidate based on the rank of the starting point.
The worker who has output the correction candidate can perform the correction work while being aware of the rank data.

(第一の発明のバリエーション2)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納し、 前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析し、 前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断するとともに、 NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断することとしてもよい。
(Variation 2 of the first invention)
The document management apparatus according to the first invention may be formed as follows.
That is, the NG determination dictionary storage means stores an NG dependency that constitutes an NG sentence by dependency of two or more words, and the NG determination means uses one of the sentences of the document data as a determination target. At least one NG word in the one sentence is used as a starting point, and the relationship between the starting point and another word is parsed, and the relation between the starting point and the other word is determined as NG with reference to the NG determination dictionary storage means. It may be determined whether or not it is a dependency, and if it is determined that there is an NG dependency, it may be determined whether or not it is a correction candidate starting from the NG dependency.

「NG係り受け」とは、NG文例を予め構文解析した結果から抽出したサンプルや、係り受けによってNGとなる場合の規則性など関する情報などである。
たとえば、「主語−述語」の関係において「当社−侵害」をNG係り受けとして登録しておく。 「当社」について、「弊社」、「我が社」、「うちの会社」、正式な社名などは、シソーラスとして登録すると効果的である。
係り受けにおける目的節の「A社(競合他社の正式名や俗称としての社名)−特許権」をNG係り受けとして登録しておくと、「他社の特許に抵触するおそれ」という趣旨の表現を抽出しやすくなるので、効果的である。
“NG dependency” refers to a sample extracted from a result of parsing an NG sentence example in advance, information related to regularity in the case of becoming NG due to dependency, and the like.
For example, “our company-infringement” is registered as an NG dependency in the “subject-predicate” relationship. About "our company", "our company", "our company", "our company", the official company name, etc. are effective if they are registered as a thesaurus.
If you register “Company A (Company name as the official name or slang name of a competitor)-patent right” in the objective section of the dependency as an NG dependency, you will be able to express the meaning of “may conflict with another company's patent”. Since it becomes easy to extract, it is effective.

(作用)
NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納している。
NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析する。 そして、前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断する。NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断する。
(Function)
The NG determination dictionary storage means stores NG dependency that forms an NG sentence by dependency of two or more words.
The NG determination means uses one sentence of the document data as a determination target, and parses the relationship between the start point and another word from at least one NG word in the one sentence. Then, referring to the NG determination dictionary storage means, it is determined whether or not the relationship between the starting point and another word is NG dependency. If it is determined that there is an NG dependency, it is determined whether or not it is a correction candidate from the NG dependency.

(第一の発明のバリエーション3)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納し、 前記のNG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析するとともに、前記NG判定用辞書記憶部を参照してNG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断することとしてもよい。
(Variation 3 of the first invention)
The document management apparatus according to the first invention may be formed as follows.
That is, the NG determination dictionary storage means stores a group of NG sentence composing words that constitute an NG sentence when a combination of two or more words that are not NG words coexists in the same sentence, The judging means parses the one sentence as one of the sentences of the document data and judges that there is no NG word in the one sentence, and stores the NG judgment dictionary storage It is good also as judging whether the said one sentence is a correction candidate by referring to a part according to whether an NG sentence structure word group is contained.

「NG文章構成単語群」とは、NG文章である、と判断すべき文章構成単語群である。たとえば、「他社の特許×号は、当社の製品の障害となるおそれがある。」という文章がNGワードをひとつも含まないが、単語の組み合わせが同一文中に併存することでNG文章を構成することとなるとして格納するのである。   The “NG sentence constituent word group” is a sentence constituent word group to be determined as an NG sentence. For example, the sentence “Other company's patent x number may be an obstacle to our products” does not contain any NG word, but the combination of words co-exists in the same sentence constitutes the NG sentence. It is stored as it happens.

(作用)
NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納しておく。
NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析する。そして、NG判定用辞書記憶部を参照し、NG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断する。
(Function)
The NG determination dictionary storage means stores an NG sentence constituent word group that constitutes an NG sentence when a combination of two or more words that are not NG words coexists in the same sentence.
The NG determination unit parses one sentence when one of the sentences in the document data is determined as a determination target and it is determined that no NG word exists in the one sentence. Then, referring to the NG determination dictionary storage unit, it is determined whether or not the one sentence is a correction candidate depending on whether or not an NG sentence constituent word group is included.

(第一の発明のバリエーション4)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 前記NG判断手段による判断結果として修正候補と判断された部位を表示させる処理結果出力手段と、 その処理結果出力手段によって修正候補と判断された部位に対する修正入力を所定の端末から受け付ける修正入力手段と、 その修正入力手段によって修正された文書データを受信する適正文書データ受信手段と、を備えることとしてもよい。
(Variation 4 of the first invention)
The document management apparatus according to the first invention may be formed as follows.
That is, a processing result output means for displaying a part determined as a correction candidate as a determination result by the NG determination means, and a correction input for receiving a correction input for a part determined as a correction candidate by the processing result output means from a predetermined terminal Means and appropriate document data receiving means for receiving the document data corrected by the correction input means.

「修正データ」には、修正が不要である場合に、修正が不要であったことを確認した場合に入力される確認データをも含む。
「修正入力手段」は、検閲対象となる文書ファイルを作成した端末(被管理部門端末)であってもよいし(図13参照)、検閲対象となる文書ファイルを作成した端末(被管理部門端末)以外の端末(管理部門端末)であってもよい(図1参照)。前者の場合は、検閲対象となる文書ファイルを作成した作成者が自ら「管理者」となる場合が含まれる。
The “correction data” includes confirmation data that is input when it is confirmed that correction is not necessary when correction is not necessary.
The “correction input unit” may be a terminal (managed department terminal) that created a document file to be censored (see FIG. 13), or a terminal (managed department terminal) that created a document file to be censored. ) May be a terminal (management department terminal) (see FIG. 1). The former case includes a case where the creator who created the document file to be censored becomes the “manager” himself.

(作用)
NG判断手段による判断結果として修正候補と判断された部位を処理結果出力手段が表示させる。
所定の端末操作者(たとえば文書データの管理者)は表示された修正候補と判断された部位を閲覧し、それに対して修正入力手段を用いて修正データを入力する。その修正入力手段によって修正された文書データを適正文書データ受信手段が受信する。
以上により、本願に係る文書管理装置を導入する組織内で保管すべき文書ファイルを保管前に事前チェックをする体制が、その組織へ提供されることとなる。
(Function)
The processing result output means displays the part determined as the correction candidate as the determination result by the NG determination means.
A predetermined terminal operator (for example, an administrator of document data) browses the displayed portion determined to be a correction candidate, and inputs correction data using a correction input unit. The proper document data receiving means receives the document data corrected by the correction input means.
As described above, a system for pre-checking document files to be stored in the organization in which the document management apparatus according to the present application is installed is provided to the organization.

(第一の発明のバリエーション5)
第一の発明に係る文書管理装置は、以下のように形成してもよい。
すなわち、 NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを予め格納する推奨ワード辞書記憶手段を備え、 前記処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力することしてもよい。
(Variation 5 of the first invention)
The document management apparatus according to the first invention may be formed as follows.
That is, it comprises recommended word dictionary storage means for storing in advance recommended words corresponding to NG words stored in the NG determination dictionary storage means, and the processing result output means is a part determined as a correction candidate by the NG determination means May be output as a recommended word corresponding to the correction candidate.

(作用)
NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを、推奨ワード辞書記憶手段が予め格納しておく。
処理結果出力手段は、修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力する。
(Function)
The recommended word dictionary storage means stores in advance recommended words corresponding to the NG words stored in the NG determination dictionary storage means.
The processing result output means outputs a recommended word corresponding to the correction candidate when outputting the part determined as the correction candidate.

(第一の発明のバリエーション6)
前記した第一の発明のバリエーション4または5に係る文書管理装置においては、修正入力手段による修正の結果をNG判定用辞書記憶手段へ登録することとしてもよい。
ここで、「修正の結果」とは、修正が不要である場合に、修正が不要であったことを確認した場合に入力される確認データをも含む。 また、修正候補と判断された部位、修正入力手段によって入力された修正データ、修正データを入力した主体に関するデータ、修正データの入力日時などのデータを含む。
(Variation 6 of the first invention)
In the document management apparatus according to Variation 4 or 5 of the first invention described above, the result of correction by the correction input means may be registered in the NG determination dictionary storage means.
Here, the “correction result” includes confirmation data that is input when it is confirmed that the correction is unnecessary when the correction is unnecessary. In addition, it includes data such as a part determined as a correction candidate, correction data input by the correction input means, data relating to a subject who has input the correction data, and input date and time of the correction data.

(作用)
修正入力手段によって入力された修正の結果がNG判定用辞書記憶手段へ登録されるので、NG判定用辞書記憶手段は修正データが入力されるたびに進化する。
本願発明に係る文書管理装置を備えることとした組織に適合したNG判定能力に修正される。 これによって、本願に係る文書管理装置の徐々に解析能力が向上し、修正を担当する者の負担が軽減される。
(Function)
Since the correction result input by the correction input means is registered in the NG determination dictionary storage means, the NG determination dictionary storage means evolves every time correction data is input.
The document management apparatus according to the present invention is modified to have an NG determination capability suitable for an organization. Thereby, the analysis capability of the document management apparatus according to the present application is gradually improved, and the burden on the person in charge of correction is reduced.

(第一の発明のバリエーション7)
前記した第一の発明のバリエーション4から6に係る文書管理装置においては、前記の修正入力手段にて入力された修正データが反映された適正文書データを記録する文書ファイルに対して、電子的なタイムスタンプを押すタイムスタンプ手段を備えることとしてもよい。
(Variation 7 of the first invention)
In the document management apparatus according to Variations 4 to 6 of the first invention described above, electronic processing is performed on a document file that records appropriate document data reflecting the correction data input by the correction input means. It is good also as providing the time stamp means which presses a time stamp.

「タイムスタンプ手段」とは、文書ファイルに対して保存日時を記録する機能である。 文書ファイルまたはその文書ファイルのハッシュ値を日時特定のための時計が備えられたサーバへ送信する機能、当該サーバが文書ファイルまたはその文書ファイルのハッシュ値に対して日時データを付加して送り返してきたファイルを受信する機能などが含まれる。
なお、保存日時を特定するための時計は、本願に係る文書管理装置を導入しているイントラネットの外部であることが望ましく、公的または準公的な第三者機関であることがより好ましい。日時データの客観性が高まるからである。
The “time stamp means” is a function for recording the save date and time for a document file. A function for sending a document file or a hash value of the document file to a server equipped with a clock for specifying the date and time, and the server sends back the date and time data to the document file or the hash value of the document file. Includes the ability to receive files.
Note that the clock for specifying the storage date and time is preferably outside the intranet in which the document management apparatus according to the present application is installed, and more preferably a public or semi-public third party organization. This is because the objectivity of date / time data is increased.

(第一の発明のバリエーション8)
前述した第一の発明のバリエーション4に係る文書管理装置は、以下のように形成してもよい。
すなわち、前記の修正入力手段を複数備えることとし、 一の修正入力手段から入力された修正データは、他の修正入力手段における出力において前記の解析結果表示手段による解析結果とは識別が可能な表示としてもよい。
(Variation 8 of the first invention)
The document management apparatus according to Variation 4 of the first invention described above may be formed as follows.
That is, a plurality of the correction input means are provided, and the correction data input from one correction input means can be distinguished from the analysis result by the analysis result display means in the output of the other correction input means. It is good.

(作用)
ある修正を担当する者は、一の修正手段にて修正する。 「修正文書ファイル送信手段」が送信する「所定の端末」は、一の修正手段にて修正作業をした者とは別の者に係る端末となる。
その別の者に係る端末において出力された出力結果は、一の修正入力手段から入力された修正データが、解析結果表示手段による解析結果とは識別が可能な表示となっている。 したがって、別の修正者は、解析結果と修正データとを識別しながら、修正内容を検討することができる。
(Function)
A person in charge of a certain correction uses a single correction means. The “predetermined terminal” transmitted by the “corrected document file transmitting means” is a terminal related to a person other than the person who performed the correction work by the one correcting means.
The output result output from the terminal according to the other person is displayed so that the correction data input from one correction input means can be distinguished from the analysis result by the analysis result display means. Therefore, another corrector can examine the correction contents while identifying the analysis result and the correction data.

(第二の発明)
本願は、コンピュータプログラムに係る第二の発明を提供することもできる。
その第二の発明は、 NGワードをNG判定用辞書記憶手段へ格納するNG判定用辞書記憶手順と、 検閲対象となる文書データを所定の端末から受信する対象文書受信手順と、 その対象文書受信手順にて受信した文書データの文書を形態素解析して単語を抽出する形態素解析手順と、 その形態素解析手順にて抽出された単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断するNGワード判断手順と、 そのNGワード判断手順にてNGワードが存在すると判断された場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手順とを、コンピュータに実行させるためのコンピュータプログラムに係る。
(Second invention)
The present application can also provide a second invention relating to a computer program.
The second invention includes an NG determination dictionary storage procedure for storing NG words in an NG determination dictionary storage means, a target document reception procedure for receiving document data to be censored from a predetermined terminal, and reception of the target document A morpheme analysis procedure for extracting a word by performing a morphological analysis on a document of document data received in the procedure, and a word extracted in the morpheme analysis procedure is the NG word with reference to the NG determination dictionary storage means An NG word determination procedure for determining whether or not an NG word is present in the NG word determination procedure, and an NG determination procedure for determining whether or not the NG word is a correction candidate. The present invention relates to a computer program for causing a computer to execute.

(第二の発明のバリエーション)
第二の発明は、第一の発明のバリエーション1から8に対応したバリエーションを実現可能な各手順を含んだコンピュータプログラムとしてもよい。
(Variation of the second invention)
The second invention may be a computer program including each procedure capable of realizing variations corresponding to variations 1 to 8 of the first invention.

第二の発明に係るコンピュータプログラムは、バリエーションを含め、ハードディスク、DVD−Rなどの記録媒体に格納して提供することもできる。 また、第二の発明に係るコンピュータプログラムを格納した記録媒体から、通信回線を介して所定の情報端末に受信することもできる。受信した情報端末は、第一の発明に係る文書管理装置となる。   The computer program according to the second invention, including variations, can be provided by being stored in a recording medium such as a hard disk or a DVD-R. It can also be received from a recording medium storing the computer program according to the second invention to a predetermined information terminal via a communication line. The received information terminal becomes the document management apparatus according to the first invention.

本願発明によれば、文書ファイルや文書データをその組織内のデータベースへ格納する前段階で事前チェックするのに役立つ技術を提供することができた。
According to the present invention, it is possible to provide a technique that is useful for pre-checking a document file and document data before storing them in a database in the organization.

第一の実施形態の全体構成を示すブロック図である。It is a block diagram which shows the whole structure of 1st embodiment. 第一の実施形態における主要な処理手順を示すフローチャートである。It is a flowchart which shows the main process procedures in 1st embodiment. 構文解析手段による解析の前後を示す図である。It is a figure which shows before and after the analysis by a syntax analysis means. NG判定用辞書記憶手段の構造を示すブロック図である。It is a block diagram which shows the structure of the dictionary memory | storage means for NG determination. 検閲対象文書ファイルが構文解析手段によってどのように解析されるかを示す図示例である。It is an illustration which shows how a document file to be censored is analyzed by a syntax analysis means. 解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを示す図示例である。It is an illustration which shows how the document file to be censored after analysis is corrected by the correction input means. 検閲対象文書ファイルが構文解析手段によってどのように解析されるかを示す図示例である。It is an illustration which shows how a document file to be censored is analyzed by a syntax analysis means. 解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを示す図示例である。It is an illustration which shows how the document file to be censored after analysis is corrected by the correction input means. 検閲対象文書ファイルがどのような理由で修正されるかを示す図示例である。It is an example of illustration which shows why the document file to be censored is corrected. 検閲対象文書ファイルが複数回の修正を経て戻される場合を概念的に示すブロック図である。It is a block diagram which shows notionally the case where a document file to be censored is returned after being corrected a plurality of times. 文書ファイルにタイムスタンプが付与される手順を概念的に示すブロック図である。It is a block diagram which shows notionally the procedure in which a time stamp is provided to a document file. 文書ファイルを事後的にチェックする実施形態を示すブロック図である。FIG. 6 is a block diagram illustrating an embodiment for checking a document file afterwards. 文書ファイルを文書作成者が自ら修正する実施形態を示すブロック図である。FIG. 3 is a block diagram illustrating an embodiment in which a document creator himself modifies a document file.

以下、本発明を実施形態に基づいて更に詳しく説明する。ただし、本発明は、実施形態の態様に限られるものではない。
以下の説明に使用する図面は、図1から図13である。
Hereinafter, the present invention will be described in more detail based on embodiments. However, the present invention is not limited to the embodiments.
The drawings used for the following description are FIGS. 1 to 13.

(図1)
図1では、本願発明の主要な構成を概念的にブロック図で示したものである。
管理部門に係る端末(図中では「管理部門端末」と表記)、NG文言サーバ、および管理される部門に係る端末(図中では「被管理部門端末」と表記)が、社内のイントラネットで接続されている。 事業者がインターネットなどを通じたASP形態によって必要な構成を提供してもよい。
管理部門とは、社内の各部門(「被管理部門」)にて作成されたり改訂されたりする文書に対して、法律的なチェックや必要な修正を行う部署であり、一般的には法務部門や総務部門である。
(Figure 1)
FIG. 1 conceptually shows a main configuration of the present invention in a block diagram.
A terminal related to the management department (indicated as “management department terminal” in the figure), an NG wording server, and a terminal related to the managed department (indicated as “managed department terminal” in the figure) are connected via the company intranet. Has been. A company may provide a necessary configuration by an ASP form through the Internet or the like.
Administrative departments are departments that perform legal checks and necessary corrections on documents created or revised in each department within the company ("managed departments"). Generally, legal departments And the general affairs department.

管理部門端末からは、NG文言入力手段(当該端末のキーボード等)を用いてNGワードやNG文例を入力する。入力されたNGワード、NG文章構成単語群、NG文例、NG係り受け等を入力する。入力されたNGワード等は、NG文言サーバにおけるNG判定用辞書データベース(NG判定用辞書手段)に格納される。
「NG文例」とは、NGワードを含む一文のほか、NGワードではない特定のワードの組み合わせを所定の組織において文書中に用いたとすると相応しくない、と判断すべき文例(NG文章構成)である。たとえば、「他社の特許×号は、当社の製品の障害となるおそれがある。」といった文である。
From the management department terminal, an NG word or an NG sentence example is input using an NG word input means (such as a keyboard of the terminal). The input NG word, NG sentence constituent word group, NG sentence example, NG dependency, etc. are input. The input NG word or the like is stored in the NG determination dictionary database (NG determination dictionary means) in the NG wording server.
An “NG sentence example” is a sentence example (NG sentence structure) that should be determined to be inappropriate if a combination of specific words that are not NG words is used in a document in a predetermined organization in addition to a single sentence that includes NG words. . For example, it is a sentence such as “other company's patent × number may be an obstacle to our products”.

さて、被管理部門端末の対象文書入力手段(当該端末のキーボード等)から、検閲対象の文書データを含む文書ファイルが準備され、NG文言サーバに送信されてきたとする(図中、「文書ファイル」は、単に「文書」と表記している)。
ここで、「検閲対象文書ファイル」とは、たとえば、技術担当者らにメール回覧予定の電子回覧板のような文書を含むファイルであり、文書データとして「Y社の特許abcd号は、当社の製品Aの障害となるおそれあり。」という一文のデータを含むものであったとする。
Now, it is assumed that a document file including document data to be censored is prepared and transmitted to the NG wording server from the target document input means (such as the keyboard of the terminal) of the managed department terminal (“document file” in the figure). Is simply written as “document”).
Here, the “document file to be censored” is, for example, a file including a document such as an electronic circulation board scheduled to be circulated to technical personnel, and “Y company's patent abcd is our company's patent abcd”. Suppose that it contains a sentence of data “There is a risk of an obstacle to product A”.

NG文言サーバに送信されてきた検閲対象文書に対しては、まず、形態素解析手段による形態素解析処理が実行される。
形態素解析処理は、自然言語文を形態素に分割し単語辞書を参照して単語を抽出し文章を単語単位に分割する自然言語処理であり、形態素解析手段は公知の形態素解析ツールで構成できる。
For the document to be censored transmitted to the NG wording server, first, morphological analysis processing by the morphological analysis means is executed.
The morpheme analysis process is a natural language process in which a natural language sentence is divided into morphemes, a word is extracted by referring to a word dictionary, and a sentence is divided into words, and the morpheme analysis means can be configured by a known morpheme analysis tool.

検閲対象文書に含まれる単語は、前述の形態素解析手段で抽出された後、NG判断手段によるNG判断処理を受ける。NG判断手段は、NG判定用辞書記憶部を参照して検閲対象文書中の単語がNGワードであるか否かを判断し、NGワードであると判断した単語があればこれを起点として修正候補であるか否かを判断する。
NGワードであると判断した単語を起点として修正候補であるか否かを判断する方法としては、第一に、NG判定用辞書記録部に格納されたNGワードのランクデータを参照し、最高ランクのNGワードを起点とし、その起点のランクが所定値以上である場合に修正候補と判断する方法が挙げられる。
第二に、検閲対象の一文中の起点の数(すなわちNGワードの数)が所定数以上である場合に修正候補と判断する方法、検閲対象の一文中のNGワードの全てを起点とし、それぞれの起点のランクの合計値が所定値以上の場合に修正候補と判断する方法が挙げられる。
第三に、一文中の起点と他の単語との関係(すなわち単語同士の係り受け)を構文解析し、その起点と他の単語との関係がNG係り受けである場合に修正候補と判断する方法が挙げられる。
After the words included in the document to be censored are extracted by the morphological analysis unit described above, they are subjected to NG determination processing by the NG determination unit. The NG determination means refers to the NG determination dictionary storage unit to determine whether or not the word in the document to be censored is an NG word. If there is a word determined to be an NG word, the correction candidate is based on this word It is determined whether or not.
As a method for determining whether or not a correction candidate is based on a word determined to be an NG word, first, the rank data of the NG word stored in the NG determination dictionary recording unit is referred to, and the highest rank A method of determining a candidate for correction when the rank of the starting point is a predetermined value or more is used.
Second, the method of determining a candidate for correction when the number of starting points in a sentence to be censored (ie, the number of NG words) is a predetermined number or more, starting from all NG words in a sentence to be censored, There is a method of determining a candidate for correction when the total value of the starting ranks is equal to or greater than a predetermined value.
Third, the relationship between the starting point in one sentence and other words (that is, dependency between words) is parsed, and if the relationship between the starting point and other words is NG dependency, it is determined as a correction candidate. A method is mentioned.

さらに、検閲対象文にNGワードがない場合、NG判断手段は構文解析を行って二以上の単語で構成される構文(解析)木を作成し、一つの構文木を構成する二以上の単語の組み合わせがNG文章構成単語群に該当しないか否かによって修正候補と判断してもよい。
構文解析処理は、形態素解析処理の結果(形態素列)を入力とし、単語同士の係り受け関係や格関係を表す構文木を出力する処理であり、公知の構文解析ツールで構成できる。構文解析処理を実行することによって、NGとして抽出する部位に対する精度が向上する。そのため、構文解析の手順が無い場合に比べて、修正候補として出力される箇所が減ったり、抽出し損なう箇所が減ったりするので、修正入力の手間を軽減することに寄与する。
Further, when there is no NG word in the sentence to be censored, the NG determination means performs a syntax analysis to create a syntax (analysis) tree composed of two or more words, and to analyze two or more words constituting one syntax tree. The combination may be determined as a correction candidate depending on whether the combination does not correspond to the NG sentence constituent word group.
The parsing process is a process of inputting a result of the morpheme analysis process (morpheme string) and outputting a syntax tree representing a dependency relation or a case relation between words, and can be configured by a known parsing tool. By executing the parsing process, the accuracy of the part extracted as NG is improved. For this reason, compared to the case where there is no syntax analysis procedure, the number of portions output as correction candidates is reduced, and the number of portions that are not extracted is reduced, which contributes to reducing the trouble of correction input.

なお、本実施形態では構文解析処理の「係り受けの解析手法」としては、例えば特開2004−21445号の「テキストデータ分析システム」に開示された手法を採用している。
用語間の対応関係を分析するために抽出するシステムも併用してもよい。用語間の対応関係抽出システムとしては、たとえば、特開2011−103038号に開示された手法である。
In the present embodiment, as the “dependency analysis method” of the syntax analysis process, for example, the method disclosed in “Text Data Analysis System” of Japanese Patent Application Laid-Open No. 2004-21445 is adopted.
An extraction system may be used in combination to analyze the correspondence between terms. As a system for extracting correspondence between terms, for example, a method disclosed in Japanese Patent Application Laid-Open No. 2011-103038 is used.

構文解析処理が実行された後、NG判定用辞書記憶部を用いて、NGワードやNG係り受けに該当する箇所を抽出する。そして、結果表示手段にて、抽出した箇所を他とは区別できるように表示する。NG判定用辞書記憶部がインテリジェント化している場合には、単なる解析結果のみならず、修正候補の文言を含んだ対象文書として送信する。   After the parsing process is executed, a part corresponding to the NG word or the NG dependency is extracted by using the NG determination dictionary storage unit. Then, the result display means displays the extracted location so that it can be distinguished from others. When the NG determination dictionary storage unit is intelligent, it is transmitted as a target document including not only the analysis result but also the wording of the correction candidate.

結果表示手段を介して、管理部門の端末の出力画面には、修正候補の文言を含んだ対象文書ファイルが出力される。出力された文書ファイルは、管理部門の担当者が閲覧し、解析結果として抽出されたNGワードやNG文章を検討する。そして、その管理部門の担当者が修正の必要ありと判断すれば、修正入力手段を用いて、修正データを入力する。 たとえば、「Y社の特許abcd号は、当社の製品Aの改良に参考となる。」というように修正する。   Through the result display means, the target document file including the words of the correction candidates is output to the output screen of the management department terminal. The person in charge of the management department views the output document file, and examines NG words and NG sentences extracted as analysis results. If the person in charge of the management department determines that correction is necessary, correction data is input using correction input means. For example, “Y company's patent abcd is useful for improvement of our product A”.

修正の必要が無く、元の文言で問題ないと判断した場合には、修正しない旨を入力する。なお、管理部門の担当者が判断不能な場合に「保留」という選択をし、その旨を入力することとしてもよい。
修正後の文書ファイルは、検閲対象文書ファイルを送信した被管理部門端末へ送信される。そして、被管理部門端末から、修正後の文書ファイルを送信すべき人や部門へ送信するため、社内メールサーバに送信される。同時に、管理部門が管轄する保存文書データベースにも蓄積される。
なお、修正前の文書ファイルは、本システムを採用する組織におけるポリシーによって異なる。たとえば、修正前の文書ファイルは管理部門などの所定部署において回覧用に印刷出力し、保存文書データベースには保存しないとする、としてもよい。
If there is no need for correction and it is determined that there is no problem with the original wording, input that no correction is required. If the person in charge of the management department cannot determine, “pending” may be selected and a message to that effect may be input.
The corrected document file is transmitted to the managed department terminal that has transmitted the document file to be censored. Then, in order to transmit the corrected document file to the person or department to be transmitted from the managed department terminal, it is transmitted to the in-house mail server. At the same time, it is also stored in a stored document database managed by the management department.
Note that the document file before correction differs depending on the policy in the organization that employs the system. For example, a document file before correction may be printed out for circulation in a predetermined department such as a management department and not stored in a saved document database.

(図2)
図2では、前述した修正候補であるか否かを判断する手順の一例を示している。
検閲対象となる文書データに対して、まず形態素解析処理を実行し、文書データを単語に分割する。
分割された単語にNGワードが含まれているか否かを判断する。含まれていない場合には、文書データにおける一文中の起点と他の単語との関係(すなわち単語同士の係り受け)を構文解析し、その起点と他の単語との関係がNG係り受けである場合に修正候補と判断する。
NG係り受けと判断されない場合には、構文解析を行って二以上の単語で構成される構文(解析)木を作成し、一つの構文木を構成する二以上の単語の組み合わせがNG文章構成単語群に該当しないか否かによって修正候補と判断する。
(Figure 2)
FIG. 2 shows an example of a procedure for determining whether or not the correction candidate is described above.
First, morphological analysis processing is executed on document data to be censored, and the document data is divided into words.
It is determined whether or not NG words are included in the divided words. If not included, the relationship between the starting point in one sentence in the document data and other words (that is, the dependency between words) is parsed, and the relationship between the starting point and other words is NG dependency. In this case, it is determined as a correction candidate.
When it is not determined to be NG dependency, a syntax (analysis) tree composed of two or more words is generated by performing parsing, and a combination of two or more words constituting one syntax tree is an NG sentence constituent word. It is determined as a correction candidate depending on whether or not it falls into the group.

この図2に示したフローチャートは一例であり、本願に係る文書管理装置を導入する組織における環境、規模、予算、処理ポリシーなどに応じて、前述した方法の組み合わせを採択できる。   The flowchart shown in FIG. 2 is an example, and a combination of the above-described methods can be adopted according to the environment, scale, budget, processing policy, and the like in the organization that introduces the document management apparatus according to the present application.

(自主修正と管理部門とによる修正の複数チェック)
図1において波線にて示しているが、被管理部門端末にて文書ファイルを作成する段階でNG判定用辞書記憶手段にもアクセスし、NGワード等を入力したら警告が発せられるといったシステムを構築してもよい。こうすることで、検閲対象文書においてNGワード等がなるべく使われないようにするとともに、検閲対象文書ファイルを作成する者と、管理部門の担当者との二重チェックのシステムが形成できる。
(Self-correction and multiple checks of corrections by the management department)
As indicated by the wavy line in FIG. 1, a system is constructed in which an NG determination dictionary storage means is accessed at the stage of creating a document file at the managed department terminal, and a warning is issued when an NG word or the like is input. May be. By doing so, it is possible to prevent NG words and the like from being used in the censored document as much as possible, and to form a double check system between the person who creates the censored document file and the person in charge of the management department.

(図3)
図3では、「A社が当社の特許権を侵害している。」という一文を構文解析した場合(A)と、「当社がA社の特許権を侵害している。」という一文を構文解析した場合(B)とを示している。
構文解析を実行しないと、(A),(B)のいずれもが修正候補として抽出されてしまう可能性が高い。しかし、NG係り受けにおいて「主語=当社、述語=侵害」と登録しており、構文解析を実行していれば、(A)が修正候補として抽出されず、(B)のみが修正候補として抽出される。
(Figure 3)
In FIG. 3, when a sentence “A company infringes our patent right” is parsed (A), and a sentence “our company infringes the patent right of company A”. The case of analysis (B) is shown.
If syntax analysis is not performed, there is a high possibility that both (A) and (B) will be extracted as correction candidates. However, if NG dependency is registered as “subject = our company, predicate = infringement” and syntax analysis is executed, (A) is not extracted as a correction candidate and only (B) is extracted as a correction candidate. Is done.

(図4)
図4は、NG文言サーバにおけるNG判定用辞書記憶部の構造を概念的に示したブロック図である。
予め登録しておくべきNGワードなどは、NG文言入力手段によって入力され、NGワードデータベースなどにそれぞれ登録される。
一方、前記した修正入力手段にて修正した文言は、OKワードやOK文例としてOKワードデータベースなどにそれぞれ登録される。すなわち、修正作業によって、事後的に登録され、学習する。
学習したNG文言辞書データベースは、学習前よりも、本実施形態に係る文書管理装置を導入する組織における不適切な表現を含んだ文書ファイルが作成される蓋然性を低くする。
(Fig. 4)
FIG. 4 is a block diagram conceptually showing the structure of the NG determination dictionary storage unit in the NG wording server.
An NG word or the like to be registered in advance is input by the NG word input unit and is registered in the NG word database or the like.
On the other hand, the words corrected by the correction input means are registered in the OK word database or the like as OK words or OK sentence examples. That is, it is registered and learned after the correction work.
The learned NG word dictionary database reduces the probability that a document file including an inappropriate expression is created in an organization in which the document management apparatus according to the present embodiment is introduced than before learning.

なお、図4には図示していないが、NG判定用辞書記憶手段について、検閲対象となる文書ファイルの種類ごと、および/または被管理部門ごとに、NGワードやNG文例やNG係り受けを予め格納することとしてもよい。
所定の分野における営業的なワード(たとえば「クレーム」)として用いられていたとしてNGワードに該当したとしても、別の部署においてはNGワードとならない場合(「クレーム」は「請求項」という意味しか持たない場合)があり、そのような場合には修正作業の効率を落とすこととなってしまうからである。
Although not shown in FIG. 4, an NG word, an NG sentence example, or an NG dependency is previously stored in the NG determination dictionary storage unit for each type of document file to be censored and / or for each managed department. It may be stored.
Even if it falls under the NG word as being used as a business word (for example, “claim”) in a given field, it does not become an NG word in another department (“claim” means only “claim”) This is because the efficiency of the correction work is reduced in such a case.

(推奨文章の出力)
検閲対象文書ファイルにNGワードやNG文章が使用されているという解析結果を所定の端末へ出力する際、前述のOKワードデータベース、OK文例データベースを用いて、推奨文章を出力することとしてもよい。修正データ入力手段を操作する操作者が推奨文章をそのまま使ってよいと判断した場合には、その推奨文章を選択するだけで修正データの入力が完了する。 そのまま使わない場合でも、操作者にとって修正の参考となる。
なお、推奨文章の採用結果(採用した場合も不採用の場合も)についても、NG判定用辞書記憶手段にフィードバックされ、以後の精度を高めることに寄与する。
(Output recommended text)
When an analysis result indicating that NG words or NG sentences are used in the document file to be censored is output to a predetermined terminal, the recommended sentence may be output using the above-described OK word database or OK sentence example database. When the operator who operates the correction data input means determines that the recommended text can be used as it is, the input of the correction data is completed only by selecting the recommended text. Even if it is not used as it is, it will be a reference for correction for the operator.
Note that the result of adopting the recommended text (whether it is adopted or not adopted) is also fed back to the NG determination dictionary storage means, which contributes to improving the accuracy thereafter.

(図5)
図5は、検閲対象文書ファイルが、構文解析手段によってどのように解析されるかについて具体的に示したものである。
検閲対象文書ファイルは、技術開発を担当するメンバー全員に回覧される「電子回覧板」である。閲覧した者は電子的に「閲覧済み」というデータを、この検閲対象文書ファイルに格納させる。また、回覧された内容についてコメントがあれば、コメントも記入して保存できる。
構文解析手段によって解析された後の検閲対象文書ファイルにおけるメモには、「α関連と推測」という箇所と、「製品Aの障害」という箇所が抽出され、その抽出箇所は、他の箇所と識別可能であるように出力表示(いわゆるハイライト表示)される。
(Fig. 5)
FIG. 5 specifically shows how the censored document file is analyzed by the syntax analysis means.
The document file to be censored is an “electronic circulation board” that is circulated to all members in charge of technology development. The person who browsed electronically stores the data “read” in this document file to be censored. In addition, if there is a comment on the circulated content, it can be entered and saved.
In the memo in the document file to be censored after being analyzed by the parsing means, the part “α-related and guessed” and the part “product A failure” are extracted, and the extracted part is distinguished from other parts. Output display (so-called highlight display) is performed as possible.

(図6)
図6は、解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを具体的に示している。
修正入力手段を操作したのは、管理部門の担当者である。その担当者は、「α関連と推測」という箇所の修正は不要であると判断し、その判断を反映させている。 また、「製品Aの障害」というフレーズを含んだ箇所は、「改良に参考となる」というように修正し、その修正内容を確定させている。
この修正によって、製品Aが特許公開番号2011−abcd号に開示されている内容と抵触していることを伺わせる記載が、社内の文書として保存されることを未然に防止したこととなる。
(Fig. 6)
FIG. 6 specifically shows how the censored document file after analysis is corrected by the correction input means.
The person in charge of the management department has operated the correction input means. The person in charge determines that the correction of the part “estimated as α-related” is unnecessary, and reflects the determination. In addition, a part including the phrase “product A failure” is corrected to “use as a reference for improvement”, and the correction content is confirmed.
By this correction, the description that indicates that the product A is in conflict with the content disclosed in the patent publication number 2011-abcd is prevented from being stored as an in-house document.

(図7)
図7もまた、検閲対象文書ファイルが、構文解析手段によってどのように解析されるかについて具体的に示したものであり、検閲対象文書ファイルは「発明届出書」である。
構造解析手段は、「怪我をするおそれ」と「怪我のおそれ」という二カ所を抽出している。
(Fig. 7)
FIG. 7 also specifically shows how the censored document file is analyzed by the syntax analysis means, and the censored document file is an “invention notification form”.
The structural analysis means extracts two places: “injury” and “injury”.

(図8)
図8もまた、解析後の検閲対象文書ファイルが修正入力手段によってどのように修正されるかを具体的に示したものである。
管理部門の担当者は、構造解析手段が抽出した部位のみならずその前の部分までを、修正前の文言を一切使わず、大幅に修正している。 このような修正をしたのは、いわゆる製造物責任法において、自社製品の危険性を認識しながら放置したと解釈されかねない記載が、社内の文書として保存されることを未然に防止するためである。
(Fig. 8)
FIG. 8 also specifically shows how the censored document file after analysis is corrected by the correction input means.
The person in charge of the management department corrects not only the part extracted by the structural analysis means but also the part before it, without using the wording before correction at all. The reason for making such amendments is to prevent the so-called Product Liability Act from preserving descriptions that could be interpreted as being left unrecognized while recognizing the dangers of our products. is there.

(図9)
図9では、検閲対象文書ファイルがどのような理由で修正されるかを例示している。
修正前の検索対象文書ファイルの中には、以下のようなフレーズが存在していたとする。 『当社製品「A」が、例の安全基準に対してセーフであるとは思えない。』
最初の「A」は、固有名詞または登録商標に係る名称であるため、普通名称に変換している。 なお、社内文書には、こうした固有名詞や登録商標に係る名称がいろいろな部署で使われる蓋然性が高いので、予め変換テーブルをNG判定用辞書記憶部に備えることとしてもよい。
(Fig. 9)
FIG. 9 illustrates why the censored document file is modified.
Assume that the following phrase exists in the search target document file before correction. “I don't think our product“ A ”is safe against the example safety standards. ]
Since the first “A” is a name associated with a proper noun or a registered trademark, it is converted to a common name. Note that in-house documents are likely to be used in various departments for names associated with proper nouns and registered trademarks, so a conversion table may be provided in the NG determination dictionary storage unit in advance.

次に「例の安全基準」といった略語または隠語を、普通に用いられる用語(Z号安全基準)に変換している。 略語は、社内どころか、社内の他の部署でも通じない用語があるため、変換の必要性が高い。 また、隠語については、裁判などにおいては不利な証拠となりかねないため、変換の必要性が高い。   Next, abbreviations or concealed words such as “example safety standards” are converted into commonly used terms (No. Z safety standards). Abbreviations need to be converted because some terms are not understood by other departments in the company. In addition, there is a high need for conversion of slang words because they can be disadvantageous evidence in trials.

次に、「セーフであるとは思えない」という二重否定の構文を、構文解析手段が指摘し、管理部門の担当者が修正している。
二重否定のフレーズは一般的にわかりにくく、正確な表現ではないためである。修正前における該当箇所の前後との整合性から、「安全性を確認したい」という修正を行った。
Next, the syntax analysis means pointed out the double negation syntax “I don't think it is safe”, and the person in charge in the management department has corrected it.
This is because double negative phrases are generally difficult to understand and are not accurate. From the consistency with the relevant part before and after the revision, the revision “I want to confirm safety” was made.

(図10)
図10は、検閲対象文書ファイルが複数回の修正を経て戻される場合を概念的に示している。
被管理部門のA氏が検閲対象文書ファイルを作成したとする。なお、A氏の作成段階においても、A氏が文書ファイルを作成していた端末は、NG判定用辞書記憶部にアクセスし、NGワードやNG文例に該当する入力を指摘していたとする。
前記の検閲対象文書ファイルが管理部門へ送信され、管理部門のB氏が検閲対象文書ファイルを閲覧し、B氏ができる範囲で修正をし、判断がつかない箇所を保留して、上司であるC氏に係る端末へ、第一修正ファイルを保留箇所である旨のメモデータを付属させて送信する。
(Fig. 10)
FIG. 10 conceptually shows a case where the censored document file is returned after being corrected a plurality of times.
Assume that Mr. A of the managed department has created a document file to be censored. In the creation stage of Mr. A, it is assumed that the terminal where Mr. A has created the document file accesses the NG determination dictionary storage unit and points out an input corresponding to an NG word or an NG sentence example.
The document file to be censored is sent to the management department, Mr. B of the management department browses the document file to be censored, makes corrections as far as Mr. B can do, holds the part that cannot be judged, and is the supervisor The memo data indicating that the first correction file is a reserved part is attached to the terminal associated with Mr. C and transmitted.

C氏は、保留箇所である旨のメモデータと、その保留箇所を見ながら、必要な修正を入力し、第二修正ファイルとして被管理部門の端末(A氏に係る端末)と、保存文書データベースとに送信する。また、B氏に係る端末へも送信する。
以上の手順を踏めば、管理部門においてダブルチェック、A氏の自己チェックを含めればトリプルチェックを実行できたこととなる。 B氏が管理業務に成熟していない場合には、B氏のスキルアップにも寄与する。
Mr. C inputs the memo data indicating that it is a reserved part and the necessary correction while looking at the reserved part, as a second corrected file, the terminal of the managed department (the terminal related to Mr. A), and the stored document database And send to. It is also transmitted to the terminal related to Mr. B.
By following the above procedure, the double check can be executed in the management department and the triple check can be executed if Mr. A's self-check is included. If Mr. B is not matured in management work, it will contribute to Mr. B's skill improvement.

(図11)
図11は、修正後の文書ファイルに対して、電子的なタイムスタンプを付与するシステムについて説明するための概念図である。手順をカッコ書きのローマ数字で示している。
まず、タイムスタンプを欲する文書ファイル(ここでは、修正後の文書ファイルとしているが、修正前や修正中でも、必要に応じて含めてもよい)をタイムスタンプ要求手段にかける。 NG文言サーバ内のタイムスタンプ要求手段は、その文書ファイルのハッシュ値を算出し、第三者機関に係るサーバへ、そのハッシュ値をインターネット経由で送信する。
(Fig. 11)
FIG. 11 is a conceptual diagram for explaining a system for giving an electronic time stamp to a corrected document file. The procedure is shown in parenthesized Roman numerals.
First, a document file that wants a time stamp (here, it is a document file after correction, but may be included before or during correction, if necessary) is applied to the time stamp requesting means. The time stamp requesting means in the NG wording server calculates the hash value of the document file and transmits the hash value to the server related to the third party via the Internet.

第三者機関に係るサーバは、更に時刻認証局へインターネット経由でアクセスし、そのハッシュ値に対して時刻認証情報を得てタイムスタンプを取得する。そして、時刻認証情報をNG文言サーバへ返信する。
受信した時刻認証情報は、修正後の文書ファイルに合成する。時刻認証情報が合成された文書ファイルは、保存すべきデータベースに保存する。 その文書ファイルを必要とする端末が呼び出すと、時刻認証情報が押された文書ファイルが出力される。
The server related to the third party further accesses the time certificate authority via the Internet, obtains time authentication information for the hash value, and acquires a time stamp. Then, the time authentication information is returned to the NG wording server.
The received time authentication information is combined with the corrected document file. The document file combined with the time authentication information is stored in a database to be stored. When a terminal that requires the document file calls, the document file with the time authentication information pressed is output.

前記の例示では、文書ファイルそのものではなくその文書ファイルのハッシュ値を第三者機関へ送信することとしたが、文書ファイルそのものを第三者機関へ送信することとしても良い場合はある。
また、前記の例示では、第三者機関と時刻認証局とを分けて説明したが、時刻認証局が第三者機関として時刻認証情報を直接発行し、発送することとしてもよい。
In the above example, the hash value of the document file is transmitted to the third party instead of the document file itself. However, there are cases where the document file itself may be transmitted to the third party.
In the above example, the third party organization and the time certification authority are described separately. However, the time certification authority may issue and send out the time certification information directly as a third party organization.

(図12)
図12は、既に格納された文書ファイルのデータベースや、送信を終えたメールの送信済みメールの保存データベースに対して、事後的にNGワードやNG文例に該当しないかどうかをチェックする場合を示したものである。
図2と同様、NG文言サーバに送信されてきた検閲対象文書は、構文解析手段に入力され、構文解析手段では、前記のNG文言辞書データベースのデータを用いるとともに、単語間の係り受け関係を抽出する構文分析手段などに基づいて、検閲対象文書ファイルにNGワードやNG文章が使用されているか否かを解析する。
(Fig. 12)
FIG. 12 shows a case where it is checked whether the document file database that has already been stored or the stored database of the mail that has already been sent is not applicable to an NG word or an NG sentence example. Is.
As in FIG. 2, the document to be censored sent to the NG wording server is input to the syntax analysis unit, which uses the data of the NG wording dictionary database and extracts the dependency relationship between words. Based on the syntax analysis means, etc., it is analyzed whether NG words or NG sentences are used in the document file to be censored.

(事後的なNGチェック)
文書ファイルが作成され、必要なチェックもなされ、格納された後に、事後的に登録されたNGワードやNG文例に該当してしまうことがある。 図12に示したように、一旦格納された文書ファイルに対しても、事後的に構文解析を実行することができるようにしてもよい。 ただし、事後的な構文解析は、修正候補の文言を含む対象文書を抽出するにとどめる。 修正入力手段によってデータを修正できるが、修正した文書ファイルは上書きをせず、別名でなければ保存できないようにしている。
(Ex-post NG check)
After a document file is created, necessary checks are made, and stored, it may correspond to an NG word or an NG sentence example registered afterwards. As shown in FIG. 12, it may be possible to execute syntax analysis later on a document file once stored. However, the subsequent parsing only extracts the target document including the wording of the correction candidate. Data can be corrected by the correction input means, but the corrected document file is not overwritten and can only be saved with a different name.

(図13)
図13に示す実施形態は、図1や図2と異なり、管理部門端末において検閲対象文書ファイルを修正するのではなく、文書作成者が自ら修正する実施形態を示すブロック図である。
解析結果送信手段は、被管理対象部門の端末、すなわち、検閲対象文書ファイルを作成した作成者に係る端末へ送信される。そして、出力された修正候補などを参照しながら、修正データを入力する。
修正データを入力して適正文書ファイルとなった文書ファイルは、社内の保存文書データベースへ格納するとともに、社内メールサーバなど、必要な出力に供する。
(Fig. 13)
The embodiment shown in FIG. 13 is a block diagram showing an embodiment in which the document creator corrects itself instead of correcting the document file to be censored in the management department terminal, unlike FIG. 1 and FIG.
The analysis result transmitting means is transmitted to the terminal of the managed department, that is, the terminal related to the creator who created the censored document file. Then, the correction data is input while referring to the output correction candidates.
The document file that has become the proper document file by inputting the correction data is stored in the in-house stored document database and provided for necessary output such as an in-house mail server.

(翻訳への応用)
なお、ここまでの記載では、法律的な背景から、不適切な表現を効率的に発見し、未然に修正することを趣旨として説明してきた。しかし、法律の面のみならず、グローバル企業においては一つの文書ファイルを複数の言語へ翻訳する必要がある場合も多い。 その翻訳に誤りがないように、あわよくば機械翻訳で済むようにする、という目的として使用しても有益である。
(Application to translation)
In addition, the description so far has been described with the aim of efficiently discovering and correcting inappropriate expressions from a legal background. However, not only legally but also global companies often need to translate a single document file into multiple languages. It is also useful to use it for the purpose of using machine translation at best so that there is no error in the translation.

(組織内の略語や隠語)
本実施形態に係る文書管理装置を導入する組織、またはその組織内の更に細かな組織内においてのみ通用している略語、特殊用語、隠語などについては、前述のNG言語辞書データベースとは別に、特殊用語データベースを備えることとしてもよい。 その場合、その特殊用語データベースには、それぞれの略語、特殊用語、隠語などに対応する一般用語をそれぞれ登録しておく。
検閲対象文書において、特殊用語データベースに登録されている用語が使われている場合には、一般用語に変換する。 そして、前述の修正入力手段を操作する管理者等が表示させる出力画面においては、その用語が変換された旨を認識できるように表示する。
(Abbreviations and secret words in the organization)
For the abbreviations, special terms, secret words, etc. that are valid only in the organization in which the document management apparatus according to the present embodiment is introduced, or in a more detailed organization in the organization, a special language is used separately from the above-mentioned NG language dictionary database. A term database may be provided. In that case, general terms corresponding to each abbreviation, special term, secret word, etc. are registered in the special term database.
If a term registered in the special term database is used in the document to be censored, it is converted to a general term. Then, on the output screen displayed by the administrator or the like who operates the above-described correction input means, it is displayed so that the fact that the term has been converted can be recognized.

(NGランク)
NG文言辞書データベースへ予め格納されるNGワードは、そのNGワード毎にランクデータを含ませることとしてもよい。 そして解析結果表示手段は、検閲対象となる文書ファイルにおいてNGワードを出力する際に、当該NGワードのランクデータに応じた識別が可能なランク表示を含ませることとしてもよい。
この場合、修正を担当する者は、そのランクデータを意識しながら修正作業が行える。
(NG rank)
The NG word stored in advance in the NG word dictionary database may include rank data for each NG word. The analysis result display means may include a rank display that enables identification according to rank data of the NG word when outputting the NG word in the document file to be censored.
In this case, the person in charge of the correction can perform the correction work while being aware of the rank data.

(検閲対象文書の分類)
検閲対象文書について分類が可能な場合には、NG文言辞書データベースにおいて格納されるNGワードやNG文言についても、対象とする検閲対象文書の種類についてのデータを予め入力しておいたり、追加で登録したりするようにする。 たとえば、検閲対象文書が発明届出書である場合に特有なNGワードやNG文言である場合には、検閲対象文書が発明届出書である場合にのみ、構文解析手段が用いるようにする。
(Classification of documents subject to censorship)
If the document to be censored can be classified, data on the type of the document to be censored is entered in advance or registered for the NG word or NG word stored in the NG word dictionary database. To do. For example, when the censored document is an invention notification form, the parse word is used only when the censored document is an invention notification form.

(応用例)
前述してきた実施形態においては、組織における文書ファイル保存前の文書チェック補助技術として説明したが、本発明に示すアイディアのコンセプトは、契約書の作成支援システム、特許明細書の作成支援システムなどにも応用可能である。
特許明細書の作成支援システムにおけるNGワードとしては、例えば登録商標となっている自社や競合他社の製品名がある。 これらの製品名は、その製品を示す普通名称に自動変換することとしてもよい。 すなわち、NG文言辞書データベース内のOKワードを格納したデータベースに、その製品を示す普通名称を登録しておき、登録商標となっている自社や競合他社の製品名が検閲対象文書ファイルに含まれていたら、自動変換するのである。
(Application examples)
In the embodiment described above, the document check assisting technology before storing the document file in the organization has been described. However, the idea concept shown in the present invention is also applied to a contract creation support system, a patent specification creation support system, and the like. Applicable.
As an NG word in the patent specification creation support system, for example, there are registered product names of the company and competitors. These product names may be automatically converted to ordinary names indicating the products. That is, an ordinary name indicating the product is registered in the database storing the OK word in the NG wording dictionary database, and the product name of the registered company or competitor is included in the censored document file. Then, it will convert automatically.

本発明は、所定の組織内のイントラネットを構築するシステムインテグレータ、イントラネットにインストールするためのソフトウェア開発をするソフトウェア開発業、イントラネットを構築するためのハードウェア製造業、インターネットを通じたASP事業などにおいて利用可能性を有する。   The present invention can be used in a system integrator that builds an intranet in a predetermined organization, a software development industry that develops software for installation on an intranet, a hardware manufacturing industry that builds an intranet, an ASP business that runs over the Internet, etc. Have sex.

Claims (8)

NGワードを格納するNG判定用辞書記憶手段と、
検閲対象となる文書データを所定の端末から受信する対象文書受信手段と、
その対象文書受信手段が受信した文書データの文書を形態素解析して単語を抽出する形態素解析手段と、
その形態素解析手段が抽出した単語が前記NG判定用辞書記憶手段を参照して前記NGワードであるか否かを判断し、NGワードが存在すると判断した場合には当該NGワードを起点として修正候補であるか否かを判断するNG判断手段と、
を備えた文書管理装置。
NG determination dictionary storage means for storing NG words;
Target document receiving means for receiving document data to be censored from a predetermined terminal;
Morphological analysis means for extracting a word by performing morphological analysis on the document data document received by the target document reception means;
It is determined whether the word extracted by the morphological analysis means is the NG word by referring to the NG determination dictionary storage means, and when it is determined that the NG word exists, the correction candidate with the NG word as a starting point NG determination means for determining whether or not
Document management device with
前記NG判定用辞書記憶手段は、格納されるNGワード毎にランクデータを含み、
前記NG判断手段は、検閲対象となる文書データの文書においてNGワードが存在すると判断した場合は当該NGワードを起点として当該起点のランクによって修正候補であるか否かを判断することとした請求項1に記載の文書管理装置。
The NG determination dictionary storage means includes rank data for each NG word stored,
The NG determination means, when determining that an NG word exists in a document of document data to be censored, determines whether the NG word is a correction candidate based on the rank of the start point from the NG word. The document management apparatus according to 1.
前記NG判定用辞書記憶手段は、二以上の単語の係り受けによってNG文章を構成するNG係り受けを格納し、
前記NG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中の少なくとも一つのNGワードを起点として当該起点と他の単語との関係を構文解析し、
前記NG判定用辞書記憶手段を参照して当該起点と他の単語との関係がNG係り受けであるか否かを判断するとともに、 NG係り受けが存在すると判断した場合には当該NG係り受けを起点として修正候補であるか否かを判断することとした請求項1または請求項2のいずれかに記載の文書管理装置。
The NG determination dictionary storage means stores NG dependency that constitutes an NG sentence by dependency of two or more words,
The NG determination means uses one sentence of the document data as a determination target, parses the relationship between the starting point and another word, starting from at least one NG word in the one sentence,
Referring to the NG determination dictionary storage means, it is determined whether or not the relationship between the starting point and another word is NG dependency, and if it is determined that NG dependency exists, the NG dependency is determined. 3. The document management apparatus according to claim 1, wherein it is determined whether or not a correction candidate is a starting point.
前記NG判定用辞書記憶手段には、NGワードではない二以上の単語の組み合わせが同一文中に併存することでNG文章を構成することとなるNG文章構成単語群を格納し、
前記のNG判断手段は、前記文書データの文章の一つを判断対象として、当該一つの文章中にNGワードが存在しないと判断した場合に、当該一つの文章を構文解析するとともに、前記NG判定用辞書記憶部を参照してNG文章構成単語群が含まれるか否かによって当該一つの文章が修正候補であるか否かを判断することとした
請求項1から請求項3のいずれかに記載の文書管理装置。
In the NG determination dictionary storage means, an NG sentence constituent word group that constitutes an NG sentence when a combination of two or more words that are not NG words coexists in the same sentence is stored,
The NG determination means parses the one sentence when one of the sentences of the document data is determined as a determination target and determines that no NG word exists in the one sentence, and determines the NG determination 4. The method according to claim 1, wherein it is determined whether or not the one sentence is a correction candidate by referring to the dictionary storage unit and determining whether or not the NG sentence constituent word group is included. Document management device.
前記NG判断手段による判断結果として修正候補と判断した部位を表示させる処理結果出力手段と、
その処理結果出力手段によって修正候補と判断された部位に対する修正入力を所定の端末から受け付ける修正入力手段と、
その修正入力手段によって修正された文書データを受信する適正文書データ受信手段と、
を備えた請求項1から請求項4のいずれかに記載の文書管理装置。
Processing result output means for displaying a part determined as a correction candidate as a determination result by the NG determination means;
Correction input means for receiving correction input for a part determined as a correction candidate by the processing result output means from a predetermined terminal;
Proper document data receiving means for receiving the document data corrected by the correction input means;
The document management apparatus according to claim 1, further comprising:
NG判定用辞書記憶手段に格納されたNGワードに対応した推奨ワードを予め格納する推奨ワード辞書記憶手段を備え、
前記処理結果出力手段は、前記NG判断手段によって修正候補と判断された部位を出力する際に、当該修正候補に対応する推奨ワードを出力することとした請求項1から請求項5のいずれかに記載の文書管理装置。
A recommended word dictionary storing means for storing in advance a recommended word corresponding to the NG word stored in the NG determination dictionary storing means;
The processing result output unit outputs a recommended word corresponding to the correction candidate when outputting the portion determined as the correction candidate by the NG determination unit. The document management apparatus described.
前記NG判定用辞書記憶手段は、前記の修正入力手段による修正の結果を登録することとした請求項5または請求項6に記載の文書管理装置。   7. The document management apparatus according to claim 5, wherein the NG determination dictionary storage unit registers a correction result by the correction input unit. 前記の修正入力手段にて入力された修正データが反映された適正文書データを記録する文書ファイルに対して、電子的なタイムスタンプを押すタイムスタンプ手段を備えた請求項5から請求項7のいずれかに記載の文書管理装置。   8. The time stamp unit according to claim 5, further comprising a time stamp unit that presses an electronic time stamp on a document file that records proper document data reflecting the correction data input by the correction input unit. Document management device according to the above.
JP2011224716A 2011-10-12 2011-10-12 Document management device Active JP5683428B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011224716A JP5683428B2 (en) 2011-10-12 2011-10-12 Document management device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011224716A JP5683428B2 (en) 2011-10-12 2011-10-12 Document management device

Publications (2)

Publication Number Publication Date
JP2013084180A true JP2013084180A (en) 2013-05-09
JP5683428B2 JP5683428B2 (en) 2015-03-11

Family

ID=48529295

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011224716A Active JP5683428B2 (en) 2011-10-12 2011-10-12 Document management device

Country Status (1)

Country Link
JP (1) JP5683428B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018160159A (en) * 2017-03-23 2018-10-11 日本電信電話株式会社 Uttered sentence determining device, method, and program

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0883286A (en) * 1994-09-13 1996-03-26 Canon Inc Method and device for document processing
JPH11195024A (en) * 1997-12-26 1999-07-21 Just Syst Corp Detection device for distribution information of concentrated appearance unsuitable expression part and its method
JPH11203298A (en) * 1998-01-08 1999-07-30 Nippon Telegr & Teleph Corp <Ntt> Contributed character information pre-check method and its device, and storage medium storing contributed character information pre-check program
US6336117B1 (en) * 1999-04-30 2002-01-01 International Business Machines Corporation Content-indexing search system and method providing search results consistent with content filtering and blocking policies implemented in a blocking engine
JP2005135211A (en) * 2003-10-31 2005-05-26 Hitachi Ltd Method and apparatus for managing document
JP2008059386A (en) * 2006-08-31 2008-03-13 Toshiba Corp Information processor and content disclosure method
JP2010044462A (en) * 2008-08-08 2010-02-25 Twobytes Corp Content evaluation server, content evaluation method and content evaluation program
US20100287182A1 (en) * 2009-05-08 2010-11-11 Raytheon Company Method and System for Adjudicating Text Against a Defined Policy
JP2011059032A (en) * 2009-09-14 2011-03-24 Canvas Mapple Co Ltd Navigation device and navigation program
JP2011186762A (en) * 2010-03-08 2011-09-22 Arches Co Ltd Document evaluation imparting method, program, and device

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0883286A (en) * 1994-09-13 1996-03-26 Canon Inc Method and device for document processing
JPH11195024A (en) * 1997-12-26 1999-07-21 Just Syst Corp Detection device for distribution information of concentrated appearance unsuitable expression part and its method
JPH11203298A (en) * 1998-01-08 1999-07-30 Nippon Telegr & Teleph Corp <Ntt> Contributed character information pre-check method and its device, and storage medium storing contributed character information pre-check program
US6336117B1 (en) * 1999-04-30 2002-01-01 International Business Machines Corporation Content-indexing search system and method providing search results consistent with content filtering and blocking policies implemented in a blocking engine
JP2005135211A (en) * 2003-10-31 2005-05-26 Hitachi Ltd Method and apparatus for managing document
JP2008059386A (en) * 2006-08-31 2008-03-13 Toshiba Corp Information processor and content disclosure method
JP2010044462A (en) * 2008-08-08 2010-02-25 Twobytes Corp Content evaluation server, content evaluation method and content evaluation program
US20100287182A1 (en) * 2009-05-08 2010-11-11 Raytheon Company Method and System for Adjudicating Text Against a Defined Policy
JP2011059032A (en) * 2009-09-14 2011-03-24 Canvas Mapple Co Ltd Navigation device and navigation program
JP2011186762A (en) * 2010-03-08 2011-09-22 Arches Co Ltd Document evaluation imparting method, program, and device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018160159A (en) * 2017-03-23 2018-10-11 日本電信電話株式会社 Uttered sentence determining device, method, and program

Also Published As

Publication number Publication date
JP5683428B2 (en) 2015-03-11

Similar Documents

Publication Publication Date Title
US8127365B1 (en) Origination-based content protection for computer systems
JP5735403B2 (en) Document management device
US8286171B2 (en) Methods and systems to fingerprint textual information using word runs
US9811518B2 (en) Systems, methods, and software for questionbased sentiment analysis and summarization
TWI417747B (en) Enhancing multilingual data querying
US10089287B2 (en) Redaction with classification and archiving for format independence
Russo et al. Summarizing vulnerabilities’ descriptions to support experts during vulnerability assessment activities
US20100254615A1 (en) Methods for document-to-template matching for data-leak prevention
US8433560B2 (en) Rule based apparatus for modifying word annotations
US9165065B2 (en) Terminology management database
WO2021121158A1 (en) Official document file processing method, apparatus, computer device, and storage medium
KR20080045698A (en) Digital signing policy
US11537727B2 (en) Systems and methods for creating enhanced documents for perfect automated parsing
RU2544739C1 (en) Method to transform structured data array
US9928015B2 (en) Copyright infringement prevention
US8676791B2 (en) Apparatus and methods for providing assistance in detecting mistranslation
Papanikolaou et al. Towards natural-language understanding and automated enforcement of privacy rules and regulations in the cloud: survey and bibliography
US20220374616A1 (en) Sentence data management method and sentence data management system
WO2014203573A1 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
KR20210013991A (en) Apparatus, method, computer program, computer-readable storage device, server and system for drafting patent document
US10713482B2 (en) Method and apparatus for analyzing defined terms in a document
JP5683428B2 (en) Document management device
Elstermann et al. Automatic tool support possibilities for the text-based S-BPM process modelling methodology
KR101523842B1 (en) Method and apparatus for translation management
Anish et al. Towards enhanced accountability in complying with healthcare regulations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150113

R150 Certificate of patent or registration of utility model

Ref document number: 5683428

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250