JP5572252B1 - デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム - Google Patents

デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム Download PDF

Info

Publication number
JP5572252B1
JP5572252B1 JP2013188296A JP2013188296A JP5572252B1 JP 5572252 B1 JP5572252 B1 JP 5572252B1 JP 2013188296 A JP2013188296 A JP 2013188296A JP 2013188296 A JP2013188296 A JP 2013188296A JP 5572252 B1 JP5572252 B1 JP 5572252B1
Authority
JP
Japan
Prior art keywords
classification code
unit
target data
determination
relevance score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013188296A
Other languages
English (en)
Other versions
JP2015055976A (ja
Inventor
正宏 守本
秀樹 武田
和巳 蓮子
ハルスコウ ヤコブ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ubic Inc
Original Assignee
Ubic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubic Inc filed Critical Ubic Inc
Priority to JP2013188296A priority Critical patent/JP5572252B1/ja
Priority to EP14843714.8A priority patent/EP3046036A4/en
Priority to PCT/JP2014/057114 priority patent/WO2015037263A1/ja
Priority to US14/389,594 priority patent/US20160267611A1/en
Application granted granted Critical
Publication of JP5572252B1 publication Critical patent/JP5572252B1/ja
Priority to TW103128572A priority patent/TW201513034A/zh
Publication of JP2015055976A publication Critical patent/JP2015055976A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Technology Law (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 デジタル情報に対する判断の精度を高めることを目的とする。
【解決手段】 本発明のデジタル情報分析システムは、対象データに対して手動で付与された第1の分別符号を受け付ける第1の分別符号受付部と、対象データの関連性スコアを計算する関連性スコア計算部と、関連性スコアに基づいて、第1の分別符号の正誤を判断する正誤判断部と、正誤判断部の判断結果に基づいて、対象データに付与すべき分別符号を決定する分別符号決定部とを備える。
【選択図】 図1

Description

本発明は、デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラムに関し、特に、複数の対象データに対して手動で付与された分別符号の正誤を判断するためのデジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラムに関する。
米国の民事訴訟では、「ディスカバリー制度」と呼ばれる情報開示義務がある。これは、訴訟に関連した証拠の開示を相手方に要求することができる制度であり、特にコンピュータ等に保存された電子データの開示を「eDiscovery(電子情報開示)」という。この制度により、訴訟における原告および被告のいずれもが、関連するデジタル情報をすべて証拠として提出する責任を負うことになった。
従来、上記デジタル情報が訴訟に関連するか否かの判断は、人間によって行われていた。すなわち、人間がデジタル情報の内容を一つ一つ確認し、訴訟に関連するかどうかの判断を行っていた。しかしながら、人間が膨大な量のデジタル情報の全てに対して判断を行うと、時間が掛かりすぎてしまうという問題があった。
この問題を改善するため、特許文献1には、指定された特定の者に関するアクセス履歴情報に基づいて、膨大な量のデジタル情報の中から、特定の者がアクセスしたデジタル文書情報のみを抽出し、この抽出されたデジタル文書情報に対して人間による判断を行う技術が開示されている。
また、近年では、上記デジタル情報が訴訟に関連するか否かの判断をコンピュータにより自動で行う技術が研究されている。この技術は、所定の基準に基づいて、コンピュータがデジタル情報を自動で判断および分類するものである。この技術によれば、上述した人間による判断と比較して大幅に判断時間を短縮できるものの、その判断の精度に関しては、さらなる改善が求められていた。
特開2011−209930号公報
本発明の目的は、デジタル情報に対する判断の精度を高めることを目的とする。
本発明のデジタル情報分析システムは、対象データに対して手動で付与された第1の分別符号を受け付ける第1の分別符号受付部と、対象データの関連性スコアを計算する関連性スコア計算部と、関連性スコアに基づいて、第1の分別符号の正誤を判断する正誤判断部と、正誤判断部の判断結果に基づいて、対象データに付与すべき分別符号を決定する分別符号決定部とを備える。
正誤判断部は、関連性スコアに対する閾値を受け付ける閾値受付部、および、関連性スコア計算部によって計算された関連性スコアと、閾値とを比較し、第1の分別符号の正誤を判断する比較判断部を有することができる。
分別符号決定部は、正誤判断部の判断の検証結果を受け付ける判断検証受付部、および、判断検証受付部が受け付けた検証結果に基づいて、対象データに付与すべき分別符号を決定する決定部を有することができる。
分別符号決定部は、さらに、判断検証受付部が受け付けた検証結果に基づいて、対象データに対して手動で付与された第2の分別符号を受け付ける第2の分別符号受付部を有することができる。
関連性スコア計算部は、複数の前記対象データの一部を抽出する抽出部、抽出部によって抽出された対象データに対して手動で付与された分別符号を受け付ける分別符号受付部、分別符号受付部が受け付けた分別符号および/または分別符号決定部が決定した分別符号に基づいて、対象データを解析する解析部、および、解析部の解析結果に基づいて、対象データの関連性スコアを計算する計算部を有することができる。
本発明のデジタル情報分析方法は、対象データに対して手動で付与された第1の分別符号を受け付ける第1の分別符号受付ステップと、対象データの関連性スコアを計算する関連性スコア計算ステップと、関連性スコアに基づいて、第1の分別符号の正誤を判断する正誤判断ステップと、正誤判断ステップにおける判断結果に基づいて、対象データに付与すべき分別符号を決定する分別符号決定ステップとを備える。
本発明のデジタル情報分析プログラムは、コンピュータに、対象データに対して手動で付与された第1の分別符号を受け付ける第1の分別符号受付機能と、対象データの関連性スコアを計算する関連性スコア計算機能と、関連性スコアに基づいて、第1の分別符号の正誤を判断する正誤判断機能と、正誤判断機能の判断結果に基づいて、対象データに付与すべき分別符号を決定する分別符号決定機能とを実現させる。
本発明のデジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラムによれば、デジタル情報に対して行われた判断の精度を高めることができる。
本発明のデジタル情報分析システムの全体構成を表すブロック図を示す 本発明のデジタル情報分析システムの正誤判断部の構成を表すブロック図を示す 本発明のデジタル情報分析システムの分別符号決定部の構成を表すブロック図を示す 本発明のデジタル情報分析システムの関連性スコア計算部の構成を表すブロック図を示す 本発明のデジタル情報分析方法の全体フローを表すフローチャートを示す 本発明のデジタル情報分析方法の正誤判断ステップのフローを表すフローチャートを示す 本発明のデジタル情報分析方法の分別符号決定ステップのフローを表すフローチャートを示す 本発明のデジタル情報分析方法の関連性スコア計算ステップのフローを表すフローチャートを示す
本発明のデジタル情報分析システムの実施形態について、図面を参照しながら説明する。
本実施形態では、一例として、ユーザ端末またはサーバ等の情報処理装置に格納されている複数の対象データから、予め定められた特定事項に関連性のある対象データを自動的に抽出する場合について説明する。ここで、予め定められた特定事項とは、例えば、訴訟に関連することを示す情報である。
図1に示すように、本発明のデジタル情報分析システム100は、第1の分別符号受付部110と、関連性スコア計算部120と、正誤判断部130と、分別符号決定部140とを備える。
第1の分別符号受付部110は、対象データに対して手動で付与された第1の分別符号を受け付ける。ここで、対象データとは、データベース等に保存された文書ファイルや電子メール等のデジタル情報である。第1の分別符号付与者は、ディスプレイ等の表示画面に表示された各対象データの内容を確認し、適切な分別符号を付与する。
ここでいう分別符号とは、「重要」、「関連性有」、「関連性無」等の符号であり、例えば、「重要」は、当該訴訟に関連性があることを意味し、「関連性有」は、当該訴訟に関連性がある可能性があることを意味し、「関連性無」は、当該訴訟に関連性がないことを意味する。なお、上記第1の分別符号の付与は、マウスやキーボード等の入力手段を介して行われることができる。ここでは、上記第1の分別符号付与者によって付与された分別符号を、第1の分別符号と呼ぶ。この第1の分別符号は、上記対象データに対応づけられ、メモリ等の記憶装置によって記憶される。
関連性スコア計算部120は、対象データの関連性スコアを計算する。関連性スコアとは、ある文書において、予め定められた特定事項との関連性を示す値であり、値が大きい程関連性が高いことを示す。この関連性スコアは、上記対象データに対応づけられ、メモリ等の記憶装置によって記憶される。この関連性スコアの計算は、対象データに含まれるキーワードまたは関連用語に基づいて行われることができる。詳細については後述する。
正誤判断部130は、関連性スコアに基づいて、第1の分別符号の正誤を判断する。例えば、正誤判断部130は、設定された閾値に基づいて、上記関連性スコアと上記第1の分別符号とを比較し、第1の分別符号の正誤を判断することができる。詳細については後述する。
分別符号決定部140は、正誤判断部130の判断結果に基づいて、対象データに付与すべき分別符号を決定する。詳細については後述する。
図2は、上記正誤判断部130の詳細な構成を示すブロック図である。図2に示すように、正誤判断部130は、閾値受付部131および比較判断部132を有するのが好ましい。
閾値受付部131は、関連性スコアに対する閾値を受け付けることができる。この閾値は、管理者等によって予め適切に設定されるのが好ましい。以下、閾値受付部131が、閾値Xおよび閾値X(X<X)を受け付けた場合の例について説明する。
比較判断部132は、関連性スコア計算部120によって計算された関連性スコアと、上記閾値とを比較し、第1の分別符号の正誤を判断することができる。
具体的には、関連性スコア計算部120によって計算された関連性スコアが、X(X≦X)であった場合、比較判断部132は、関連性スコアXと閾値Xおよび閾値Xとを比較し、第1の分別符号が「重要」または「関連性有」である場合には正しい、第1の分別符号が「関連性無」である場合には誤りであると判断する。
一方、関連性スコア計算部120によって計算された関連性スコアが、X(X≦X)であった場合、比較判断部132は、関連性スコアXと閾値Xおよび閾値Xとを比較し、第1の分別符号が「重要」または「関連性有」である場合には誤り、第1の分別符号が「関連性無」である場合には正しいと判断する。
図3は、上記分別符号決定部140の詳細な構成を示すブロック図である。図3に示すように、分別符号決定部140は、判断検証受付部141および決定部142を有するのが好ましい。
判断検証受付部141は、正誤判断部130の判断の検証結果を受け付けることができる。具体的には、正誤判断部130によって、第1の分別符号が誤りであると判断された場合、後述する第2の分別符号付与者によって上記判断が検証され、判断検証受付部141は、この検証結果を受け付ける。
決定部142は、判断検証受付部141が受け付けた検証結果に基づいて、対象データに付与すべき分別符号を決定することができる。具体的には、判断検証受付部141が受け付けた検証結果が、上記正誤判断部130の判断が誤りであるというものであった場合、決定部142は、対象データに付与すべき分別符号を、上記第1の分別符号に決定する。
この場合、分別符号決定部140によって決定された分別符号は、後述する関連性スコア計算部120の解析部123で利用されることができる。
分別符号決定部140は、さらに、第2の分別符号受付部143を有するのが好ましい。この第2の分別符号受付部143は、判断検証受付部141が受け付けた検証結果に基づいて、対象データに対して手動で付与された第2の分別符号を受け付けることができる。
具体的には、判断検証受付部141が受け付けた検証結果が、上記正誤判断部130の判断が正しいというものであった場合、第2の分別符号受付部143は、対象データに対して手動で付与された第2の分別符号を受け付ける。
第2の分別符号付与者は、ディスプレイ等の表示画面に表示された各対象データの内容を確認し、適切な分別符号を付与する。ここでは、上記第2の分別符号付与者によって付与された分別符号を、第2の分別符号と呼ぶ。この第2の分別符号は、上記対象データに対応づけられ、メモリ等の記憶装置によって記憶される。そして、決定部142は、対象データに付与すべき分別符号を、上記第2の分別符号に決定する。
図4は、上記関連性スコア計算部120の詳細な構成を示すブロック図である。図4に示すように、関連性スコア計算部120は、抽出部121、分別符号受付部122、解析部123および計算部124を有するのが好ましい。
抽出部121は、複数の対象データの一部を抽出することができる。この抽出は、ランダムに行われることもできるし、対象データを、作成日時や名称順に並べ替え、上から所定の割合を選んで行われることもできる。
分別符号受付部122は、抽出部121によって抽出された対象データに対して手動で付与された分別符号を受け付けることができる。分別符号付与者は、ディスプレイ等の表示画面に表示された各対象データの内容を確認し、適切な分別符号を付与する。ここでは、上記分別符号付与者によって付与された分別符号を、分別符号と呼ぶ。この分別符号は、上記抽出された対象データに対応づけられ、メモリ等の記憶装置によって記憶される。
解析部123は、分別符号受付部122が受け付けた分別符号および/または分別符号決定部140が決定した分別符号に基づいて、対象データを解析することができる。この解析は、例えば各分別符号に対応するキーワードまたは関連用語を特定することで行われる。キーワードとは、1つまたは複数の単語を組み合わせたものをいう。具体的には、特定の分別符号と密接な関係を持ち、キーワードが文書中に含まれると、分別符号が一意に決まるものをいってもよい。例えば、特許侵害訴訟が発生した場合において、当該訴訟と関連度の高い文書に重要という分別符号を付与する場合のキーワードとして、特許公報の番号、弁理士、侵害者等が挙げられる。関連用語とは、所定の分別符号が付与された文書に共通して出現頻度が高い単語のうち、評価値が一定値以上のものをいう。例えば、出現頻度は、ひとつの文書中に登場する単語の総数のうち、関連用語が出現する割合をいう。評価値とは、各単語がある文書中で発揮する情報量をいい、伝達情報量を基準に算出することができる。なお、本実施形態においては、キーワードには形態素が含まれるものとする。
計算部124は、解析部123の解析結果に基づいて、対象データの関連性スコアを計算することができる。計算は、例えば対象データに含まれるキーワードまたは関連用語に基づいて行われ、具体的には、キーワードまたは関連用語の評価値およびキーワードまたは関連用語の数に基づいて行われる。
続いて、本発明のデジタル情報分析方法の実施形態について、図面を参照しながら説明する。
図5は、本発明のデジタル情報分析方法の処理フローを示すフローチャートである。
図5に示すように、本発明のデジタル情報分析方法は、第1の分別符号受付ステップ(S210)と、関連性スコア計算ステップ(S220)と、正誤判断ステップ(S230)と、分別符号決定ステップ(S240)とを備える。
第1の分別符号受付ステップ(S210)では、対象データに対して手動で付与された第1の分別符号を受け付ける。この処理は、上述した第1の分別符号受付部によって行われることができる。
関連性スコア計算ステップ(S220)では、対象データの関連性スコアを計算する。この処理は、上述した関連性スコア計算部によって行われることができる。
正誤判断ステップ(S230)では、関連性スコアに基づいて、第1の分別符号の正誤を判断する。この処理は、上述した正誤判断部によって行われることができる。
分別符号決定ステップ(S240)では、正誤判断ステップにおける判断結果に基づいて、前記対象データに付与すべき分別符号を決定する。この処理は、上述した分別符号決定部によって行われることができる。
図6は、上記正誤判断ステップ(S230)の詳細なフローを示すフローチャートである。図6に示すように、正誤判断ステップ(S230)は、閾値受付ステップ(S231)および比較判断ステップ(S232)を有するのが好ましい。
閾値受付ステップ(S231)では、関連性スコアに対する閾値を受け付けることができる。
比較判断ステップ(S232)では、関連性スコア計算ステップ(S120)で計算された関連性スコアと、閾値とを比較し、第1の分別符号の正誤を判断することができる。
図7は、上記分別符号決定ステップ(S240)の詳細なフローを示すフローチャートである。図7に示すように、分別符号決定ステップ(S240)は、判断検証受付ステップ(S241)および決定ステップ(S242)を有するのが好ましい。
判断検証受付ステップ(S241)は、正誤判断ステップ(S230)の判断の検証結果を受け付けることができる。
決定ステップ(S242)は、判断検証受付ステップ(S241)が受け付けた検証結果に基づいて、対象データに付与すべき分別符号を決定することができる。
分別符号決定ステップ(S240)は、さらに、第2の分別符号受付ステップ(S243)を有するのが好ましい。
第2の分別符号受付ステップ(S243)は、判断検証受付ステップ(S241)が受け付けた検証結果に基づいて、対象データに対して手動で付与された第2の分別符号を受け付けることができる。そして、決定ステップ(S242)は、対象データに付与すべき分別符号を、上記第2の分別符号に決定する。
図8は、上記関連性スコア計算断ステップ(S220)の詳細なフローを示すフローチャートである。図8に示すように、関連性スコア計算ステップ(S220)は、抽出ステップ(S221)、分別符号受付ステップ(S222)、解析ステップ(S223)および計算ステップ(S224)を有するのが好ましい。
抽出ステップ(S221)は、複数の対象データの一部を抽出することができる。
分別符号受付ステップ(S222)は、抽出ステップ(S221)によって抽出された対象データに対して手動で付与された分別符号を受け付けることができる。
解析ステップ(S223)は、分別符号受付ステップ(S222)が受け付けた分別符号に基づいて、対象データを解析することができる。
計算ステップ(S224)は、解析ステップ(S223)の解析結果に基づいて、対象データの関連性スコアを計算することができる。
続いて、本発明のデジタル情報分析プログラムの実施形態について説明する。
本発明のデジタル情報分析プログラムは、コンピュータに、第1の分別符号受付機能と、関連性スコア計算機能と、正誤判断機能と、分別符号決定機能とを実現させる。
第1の分別符号受付機能は、対象データに対して手動で付与された第1の分別符号を受け付ける。この機能は、例えば上述した第1の分別符号受付部によって実現されることができる。
関連性スコア計算機能は、対象データの関連性スコアを計算する。この機能は、例えば上述した関連性スコア計算部によって実現されることができる。
正誤判断機能は、関連性スコアに基づいて、第1の分別符号の正誤を判断する。この機能は、例えば上述した正誤判断部によって実現されることができる。
分別符号決定機能は、正誤判断機能の判断結果に基づいて、前記対象データに付与すべき分別符号を決定する。この機能は、例えば上述した分別符号決定部によって実現されることができる。
本発明のデジタル情報分析プログラムは、コンピュータが読み取り可能な記録媒体によって記録され、提供されることができる。
なお、上述した第1の分別符号付与者、第2の分別符号付与者、分別符号付与者は、異なる人間であるのが好ましい。特に、誤りを正すことを目的とするため、少なくとも第2の分別符号付与者は、専門性の高い者とするのが好ましい。
また、上記正誤判断部が、第3の分別符号受付部によって受け付けられた第3の分別符号に基づいて、第1の分別符号の正誤を判断するように構成することもできる。この場合、人間による判断と人間による判断とを比較することになり、例えば、分別符号付与者の判断の精度を確認する手段として、本発明のシステムを活用することもできる。
上述したところは、代表的な実施形態の例を示したものであって、本発明はこの実施形態に限定されるものではない。
100 デジタル情報分析システム
110 第1の分別符号受付部
120 関連性スコア計算部
130 正誤判断部
140 分別符号決定部
121 抽出部
122 分別符号受付部
123 解析部
124 計算部
131 閾値受付部
132 比較判断部
141 判断検証受付部
142 第2の分別符号受付部
143 決定部

Claims (7)

  1. 対象データに対して手動で付与された第1の分別符号を受け付ける第1の分別符号受付部と、
    前記対象データの関連性スコアを計算する関連性スコア計算部と、
    前記関連性スコアに基づいて、前記第1の分別符号の正誤を判断する正誤判断部と、
    前記正誤判断部の判断結果に基づいて、前記対象データに付与すべき分別符号を決定する分別符号決定部と
    を備えるデジタル情報分析システム。
  2. 前記正誤判断部は、
    前記関連性スコアに対する閾値を受け付ける閾値受付部、および、
    前記関連性スコア計算部によって計算された関連性スコアと、前記閾値とを比較し、前記第1の分別符号の正誤を判断する比較判断部を有することを特徴とする請求項1に記載のデジタル情報分析システム。
  3. 前記分別符号決定部は、
    前記正誤判断部の判断の検証結果を受け付ける判断検証受付部、および、
    前記判断検証受付部が受け付けた検証結果に基づいて、前記対象データに付与すべき分別符号を決定する決定部を有することを特徴とする請求項1または2に記載のデジタル情報分析システム。
  4. 前記分別符号決定部は、さらに、
    前記判断検証受付部が受け付けた検証結果に基づいて、前記対象データに対して手動で付与された第2の分別符号を受け付ける第2の分別符号受付部を有することを特徴とする請求項3に記載のデジタル情報分析システム。
  5. 前記関連性スコア計算部は、
    複数の前記対象データの一部を抽出する抽出部、
    前記抽出部によって抽出された対象データに対して手動で付与された分別符号を受け付ける分別符号受付部、
    前記分別符号受付部が受け付けた分別符号および/または前記分別符号決定部が決定した分別符号に基づいて、前記対象データを解析する解析部、および、
    前記解析部の解析結果に基づいて、前記対象データの関連性スコアを計算する計算部を有することを特徴とする請求項1〜4のいずれか一項に記載のデジタル情報分析システム。
  6. 対象データに対して手動で付与された第1の分別符号を受け付ける第1の分別符号受付ステップと、
    前記対象データの関連性スコアを計算する関連性スコア計算ステップと、
    前記関連性スコアに基づいて、前記第1の分別符号の正誤を判断する正誤判断ステップと、
    前記正誤判断ステップにおける判断結果に基づいて、前記対象データに付与すべき分別符号を決定する分別符号決定ステップと
    を備える、コンピュータが実行するデジタル情報分析方法。
  7. コンピュータに、
    対象データに対して手動で付与された第1の分別符号を受け付ける第1の分別符号受付機能と、
    前記対象データの関連性スコアを計算する関連性スコア計算機能と、
    前記関連性スコアに基づいて、前記第1の分別符号の正誤を判断する正誤判断機能と、
    前記正誤判断機能の判断結果に基づいて、前記対象データに付与すべき分別符号を決定する分別符号決定機能と
    を実現させるためのデジタル情報分析プログラム。
JP2013188296A 2013-09-11 2013-09-11 デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム Active JP5572252B1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2013188296A JP5572252B1 (ja) 2013-09-11 2013-09-11 デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム
EP14843714.8A EP3046036A4 (en) 2013-09-11 2014-03-17 Digital information analysis system, digital information analysis method, and digital information analysis program
PCT/JP2014/057114 WO2015037263A1 (ja) 2013-09-11 2014-03-17 デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム
US14/389,594 US20160267611A1 (en) 2013-09-11 2014-03-17 Digital information analysis system, digital information analysis method, and digital information analysis program
TW103128572A TW201513034A (zh) 2013-09-11 2014-08-20 數位資訊分析系統、數位資訊分析方法及數位資訊分析程式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013188296A JP5572252B1 (ja) 2013-09-11 2013-09-11 デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム

Publications (2)

Publication Number Publication Date
JP5572252B1 true JP5572252B1 (ja) 2014-08-13
JP2015055976A JP2015055976A (ja) 2015-03-23

Family

ID=51427300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013188296A Active JP5572252B1 (ja) 2013-09-11 2013-09-11 デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム

Country Status (5)

Country Link
US (1) US20160267611A1 (ja)
EP (1) EP3046036A4 (ja)
JP (1) JP5572252B1 (ja)
TW (1) TW201513034A (ja)
WO (1) WO2015037263A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9569696B1 (en) * 2015-08-12 2017-02-14 Yahoo! Inc. Media content analysis system and method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009098811A (ja) * 2007-10-15 2009-05-07 Toshiba Corp 文書分類装置およびプログラム
JP2011170786A (ja) * 2010-02-22 2011-09-01 Nomura Research Institute Ltd 文書分類システムおよび文書分類プログラムならびに文書分類方法
JP2011209930A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030130993A1 (en) * 2001-08-08 2003-07-10 Quiver, Inc. Document categorization engine
US7219148B2 (en) * 2003-03-03 2007-05-15 Microsoft Corporation Feedback loop for spam prevention
US20100198823A1 (en) * 2009-02-05 2010-08-05 Tsoukalas Kathleen J Systems and methods to automatically generate enhanced information associated with a selected web table
US8364776B1 (en) * 2009-09-15 2013-01-29 Symantec Corporation Method and system for employing user input for website classification
US9110971B2 (en) * 2010-02-03 2015-08-18 Thomson Reuters Global Resources Method and system for ranking intellectual property documents using claim analysis
US8521662B2 (en) * 2010-07-01 2013-08-27 Nec Laboratories America, Inc. System and methods for finding hidden topics of documents and preference ranking documents
US8494983B2 (en) * 2010-11-16 2013-07-23 Microsoft Corporation Object-sensitive image search
US20160117324A1 (en) * 2011-05-11 2016-04-28 Google Inc. Ranking labeled instances extracted from text
JP5530476B2 (ja) * 2012-03-30 2014-06-25 株式会社Ubic 文書分別システム及び文書分別方法並びに文書分別プログラム
US9489636B2 (en) * 2012-04-18 2016-11-08 Tagasauris, Inc. Task-agnostic integration of human and machine intelligence
JP5823943B2 (ja) * 2012-10-10 2015-11-25 株式会社Ubic フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
US10296850B2 (en) * 2013-03-15 2019-05-21 Konstantinos (Constantin) F. Aliferis Document coding computer system and method with integrated quality assurance
US9275331B2 (en) * 2013-05-22 2016-03-01 International Business Machines Corporation Document classification system with user-defined rules

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009098811A (ja) * 2007-10-15 2009-05-07 Toshiba Corp 文書分類装置およびプログラム
JP2011170786A (ja) * 2010-02-22 2011-09-01 Nomura Research Institute Ltd 文書分類システムおよび文書分類プログラムならびに文書分類方法
JP2011209930A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Also Published As

Publication number Publication date
EP3046036A4 (en) 2017-03-15
TW201513034A (zh) 2015-04-01
US20160267611A1 (en) 2016-09-15
EP3046036A1 (en) 2016-07-20
WO2015037263A1 (ja) 2015-03-19
JP2015055976A (ja) 2015-03-23

Similar Documents

Publication Publication Date Title
US11475143B2 (en) Sensitive data classification
US10489830B2 (en) Aggregation of rating indicators
TWI603220B (zh) Method and device for network verification information
WO2017216980A1 (ja) 機械学習装置
JP6252283B2 (ja) キュレーションされたコンテンツを評価する方法及びシステム
US9767388B2 (en) Method and system for verification by reading
US20210157900A1 (en) Securing passwords by using dummy characters
WO2021169626A1 (zh) 基于词库的匹配推荐方法、装置、设备及存储介质
CN110019640B (zh) 涉密文件检查方法及装置
US10073891B2 (en) Forensic system, forensic method, and forensic program
TW201545104A (zh) 資料分析系統、資料分析方法、及資料分析程式
JP6419667B2 (ja) テストdbデータ生成方法及び装置
US20240202344A1 (en) Use of word embeddings to locate sensitive text in computer programming scripts
JP5572252B1 (ja) デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム
US9626356B2 (en) System support for evaluation consistency
CN111950267A (zh) 文本三元组的抽取方法及装置、电子设备及存储介质
US20170032484A1 (en) Systems, devices, and methods for detecting firearm straw purchases
CN111209733B (zh) 文本记录处理方法及装置
JP6204923B2 (ja) アセスメント装置、アセスメントシステム、アセスメント方法、及びプログラム
WO2016056095A1 (ja) データ分析システム、データ分析システムの制御方法、およびデータ分析システムの制御プログラム
JP2009157693A (ja) データ入力装置、データ入力方法、そのプログラムおよび記憶媒体
KR102533833B1 (ko) 배송 주소를 번역하여 배송원에게 제공할 수 있는 배송 주소 번역 서버 및 그 동작 방법
US10296990B2 (en) Verifying compliance of a land parcel to an approved usage
JP6939600B2 (ja) 校閲方法、校閲プログラムおよび情報処理装置
JP6631122B2 (ja) プログラム、情報処理装置及び情報処理方法

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20140519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140627

R150 Certificate of patent or registration of utility model

Ref document number: 5572252

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250