JP2014078081A - フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム - Google Patents

フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム Download PDF

Info

Publication number
JP2014078081A
JP2014078081A JP2012224582A JP2012224582A JP2014078081A JP 2014078081 A JP2014078081 A JP 2014078081A JP 2012224582 A JP2012224582 A JP 2012224582A JP 2012224582 A JP2012224582 A JP 2012224582A JP 2014078081 A JP2014078081 A JP 2014078081A
Authority
JP
Japan
Prior art keywords
sentence
keyword
document information
unit
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012224582A
Other languages
English (en)
Other versions
JP5823942B2 (ja
Inventor
Masahiro Morimoto
正宏 守本
Yoshikatsu Shirai
喜勝 白井
Hideki Takeda
秀樹 武田
Kazumi Hasuko
和巳 蓮子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
UBIC KK
Ubic Inc
Original Assignee
UBIC KK
Ubic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by UBIC KK, Ubic Inc filed Critical UBIC KK
Priority to JP2012224582A priority Critical patent/JP5823942B2/ja
Priority to US14/434,589 priority patent/US9542474B2/en
Priority to TW102136454A priority patent/TW201415402A/zh
Priority to PCT/JP2013/077440 priority patent/WO2014057962A1/ja
Publication of JP2014078081A publication Critical patent/JP2014078081A/ja
Application granted granted Critical
Publication of JP5823942B2 publication Critical patent/JP5823942B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • G06F7/36Combined merging and sorting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computer Hardware Design (AREA)

Abstract

【課題】特定のキーワードを含む箇所をセンテンス単位でハイライト表示することにより、訴訟において証拠として提出するべきか否かの分別作業の精度の向上及び効率化を図ることが可能となる。
【解決手段】デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するデータベースと、データベースに登録されたキーワードを文書情報から検索する検索部と、文書情報から、検索されたキーワードを含むセンテンスを抽出するセンテンス抽出部と、センテンス抽出部により抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するスコア算出部と、スコアに応じてセンテンスの強調の程度を変化させる強調部とを備える。
【選択図】図1

Description

本発明は、フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムに関するものであって、特に、訴訟に関連する文書情報を収集するためのフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムに関する。
従来、不正アクセスや機密情報漏洩などコンピュータに関する犯罪や法的紛争が生じた際に、原因究明や捜査に必要な機器やデータ、電子的記録を収集・分析し、その法的な証拠性を明らかにする手段や技術が提案されている。
また、米国民事訴訟では、eDiscovery(電子証拠開示)等が求められており、当該訴訟の原告および被告のいずれもが、関連するデジタル情報をすべて証拠として提出する責任を負う。そのため、コンピュータやサーバに記録されたデジタル情報を証拠として、提出しなければならない。
一方、ITの急速な発達と普及に伴い、今日のビジネスの世界ではほとんどの情報がコンピュータで作成されているため、同一企業内であっても多くのデジタル情報が氾濫している。
そのため、法廷への証拠資料提出のための準備作業を行う過程において、当該訴訟に必ずしも関連しない機密なデジタル情報までも証拠資料として含めてしまうミスが生じやすい。また、当該訴訟に関連しない機密な文書情報を提出してしまうことが問題になっていた。
近年、フォレンジックシステムにおける文書情報に関する技術が、特許文献1乃至特許文献3に提案されている。特許文献1には、文書提出命令の対象者情報に含まれる少なくとも1人以上の対象者から、特定の者を指定し、指定された特定の者に関するアクセス履歴情報に基づいて、特定の者がアクセスしたデジタル文書情報のみを抽出し、抽出されたデジタル文書情報の文書ファイルそれぞれが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
また、特許文献2には、記録されたデジタル情報を表示し、複数の文書ファイル毎に、対象者情報に含まれる対象者のうちいずれの対象者に関連するものであるかを示す対象者特定情報を設定し、該設定された対象者特定情報を記憶部に記録するように設定し、少なくとも一人以上の対象者を指定し、指定された対象者に対応する対象者特定情報が設定された文書ファイルを検索し、表示部を介して、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
さらに、特許文献3には、デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳し、記録部に記録されたデジタル文書情報から、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成し、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
特開2011−209930号公報 特開2011−209931号公報 特開2012−32859号公報
しかしながら、例えば、特許文献1乃至特許文献3のようなフォレンジックシステムおいては、複数のコンピュータ及びサーバを利用した対象者の膨大な文書情報を収集することになる。
このようなデジタル化された膨大な文書情報を訴訟の証拠資料として妥当であるか否かの分別をする作業は、レビュワーと呼ばれる利用者が目視により確認し、当該文書情報をひとつひとつ分別していく必要があり、多大な労力と時間がかかるという問題があった。
そこで、本発明は、上記事情に鑑み、特定のキーワードを含む箇所を、センテンス単位でハイライト表示することにより、管理者の負荷を軽減し、分別作業の精度の向上及び効率化を図ることを可能とするフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムを提供することを目的とするものである。
本発明のフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するデータベースと、データベースに登録されたキーワードを文書情報から検索する検索部と、文書情報から、検索されたキーワードを含むセンテンスを抽出するセンテンス抽出部と、センテンス抽出部により抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するスコア算出部と、スコアに応じてセンテンスの強調の程度を変化させる強調部とを備える。
「文書情報」は、1つ以上の単語を含むデータをいう。文書情報の一例として、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書等が挙げられる。
「キーワード」は、ある言語において、一定の意味を持つ文字列のまとまりをいう。例えば、「文書を分別する」という文章のキーワードは、「文書」「分別」「する」としてもよい。
「検索部」は、所定の文書情報からキーワードを検索するものをいう。データベースに登録されたキーワードを、文書情報の中から検索するものとしてもよい。
「センテンス」は、句点やピリオドによって分けられたひとつづきの言葉をいう。センテンスは1つの文書情報中に複数含まれるものとしてもよい。
「センテンス抽出部」は、文書情報からセンテンスを抽出するものをいう。特定のキーワードを含むセンテンスを抽出するものとしてもよい。また、センテンス抽出部は、検索されたキーワードの隣接の程度に基づいて、抽出するセンテンスの量を決定するものであってもよい。例えば、類似度の高いキーワードが隣接するセンテンスに含まれる場合、該二つのセンテンスを抽出するものとしてもよい。
「スコア算出部」は、センテンスのスコアを算出するものをいう。抽出されたセンテンスの特徴量に基づいてセンテンスのスコアを算出するものとしてもよい。
「特徴量」は、各キーワードがある文書情報中で発揮する情報量をいう。特徴量は、センテンスに含まれる、キーワードに基づいて算出されたものであってもよい。例えば、キーワードの出現頻度や伝達情報量に基づいて算出するとしてもよい。
「スコア」は、ある文書情報において、訴訟とセンテンスとの関連度合を示すものをいう。スコアはセンテンスの特徴量に基づいて算出される。例えば、訴訟時に提出する必要が高い文書情報に含まれるセンテンスほど、高いスコアを有するとしてもよい。また、スコアは、センテンスが有する固有の意味情報から算出されたものであってもよい。具体的にいうと、肯定文や否定文・疑問文などセンテンスの性質に基づいて算出してもよい。例えば、センテンスが肯定文である場合には、特徴量から算出したスコアに得点を加点し、否定文である場合には、減点するものとしてもよい。
「強調部」は、文書情報中の特定のセンテンスの強調の程度を変化させるものをいう。例えば、一定の閾値を超過したセンテンスをハイライト表示させるよう指示するものであってもよい。また、強調部は、特徴量に応じて強調する色を変えるものであってもよい。
また、データベースは、過去に利用者が訴訟に関連するか否かを判断した文書情報に共通して頻出するキーワードを解析し、該解析されたキーワードに関する結果に基づいて、キーワードを自動で登録するものであってもよい。具体的には、利用者が訴訟に関連すると判断した文書情報群を用いてキーワードに重みづけを行い、該重みづけが一定の閾値を超過したものをデータベースに登録するものとしてもよい。例えば、訴訟に関連すると判断された文書情報群を解析し、該文書情報群に共通して含まれるキーワードに対して、重みづけを行うものとしてもよい。
また、本発明に係るフォレンジックシステムは、更に、センテンスを強調された文書情報に対して、利用者が行った関連性の判断結果を受け付ける結果受付部と、判断結果に基づいて、抽出された文書情報を判断結果ごとに分別し、該分別された文書情報おいて、共通して出現するキーワードを解析し、選定する選定部と、選定したキーワードを記録するキーワード記録部と、キーワード記録部に記録されたキーワードを文書情報から探索する探索部と、探索部の探索結果と選定部の解析結果を用いて、判断結果と文書情報との関連性を示す文書スコアを算出する文書スコア算出部と、文書スコアに基づいて、自動で関連性の判断を行う自動判断部とを備えてもよい。
「結果受付部」は、利用者の関連性判断の結果を受け付けるものをいう。
「選定部」は、キーワードを選定するものをいう。同一の判断結果がなされた文書情報に共通して出現するキーワードを解析し、選定するものとしてもよい。
「キーワード記録部」は、キーワードを記録するものをいう。データベースとしてもよい。
「探索部」は、キーワードを文書情報から探索するものをいう。
「文書スコア算出部」は、文書情報の文書スコアを算出するものをいう。文書情報に含まれるキーワードの評価値に基づいて文書スコアを算出するものとしてもよい。評価値は、文書情報中のキーワードの出現頻度や伝達情報量に基づいて算出するとしてもよい。
「文書スコア」は、ある文書情報において、訴訟との関連度合を示すものをいう。文書スコアは、文書情報に含まれるキーワードに基づいて算出される。例えば、訴訟時に提出する必要が高いキーワードが含まれる文書情報ほど、高い文書スコアを有するとしてもよい。文書情報は、一定の要件に基づいて文書スコアの初期値を与えられるものとしてもよい。例えば、文書情報に出現するキーワードと、各キーワードの持つ評価値とにより初期の文書スコアを算出するものとしてもよい。
「自動判断部」は、スコア算出部が算出した文書スコアに基づいて、自動で関連性の判断を行うものをいう。具体的には、所定の閾値をスコアが超過した文書情報については、関連性ありと判断し、閾値を超過しない文書情報に対しては関連性なしと判断するものとしてもよい。
また、本発明に係るフォレンジック方法は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック方法において、コンピュータが、デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するステップと、登録されたキーワードを文書情報から検索するステップと、文書情報から、検索されたキーワードを含むセンテンスを抽出するステップと、抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するステップと、スコアに応じてセンテンスの強調の程度を変化させるステップとを実現する。
また、本発明に係るフォレンジックプログラムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックプログラムにおいて、コンピュータに、デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録する機能と、登録されたキーワードを文書情報から検索する機能と、文書情報から、検索されたキーワードを含むセンテンスを、抽出する機能と、抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出する機能と、スコアに応じてセンテンスの強調の程度を変化させる機能とを実現させる。
本発明のフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するデータベースと、データベースに登録されたキーワードを文書情報から検索する検索部と、文書情報から、検索されたキーワードを含むセンテンスを抽出するセンテンス抽出部と、センテンス抽出部により抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するスコア算出部と、スコアに応じてセンテンスの強調の程度を変化させる強調部とを備える際には、特定のキーワードを含む箇所を、センテンス単位でハイライト表示することにより、管理者の負荷を軽減し、分別作業の精度の向上及び効率化を図ることを可能となる。
また、本発明のフォレンジックシステムは、更に、特徴量が、センテンスに含まれる、キーワードに基づいて算出されたものである際においては、特定のキーワードを含むセンテンスをセンテンス単位で強調することが可能となる。
また、本発明のフォレンジックシステムは、更に、スコアが、センテンスが有する固有の意味情報から算出されたものである際においては、センテンスが有する、肯定文か否定文かといった固有の性質に応じて、強調の程度を変化させることが可能となる。
また、本発明に係る強調部が、特徴量に応じて強調する色を変えるものである際においては、センテンスが有する固有の意味情報やキーワードに応じて、強調する方法を変化させることができ、より利用者の訴訟に関連するか否かの判断が容易となる。
また、本発明に係るセンテンス抽出部が、検索されたキーワードの隣接の程度に基づいて、抽出するセンテンスの量を決定するものである際においては、類似のキーワードを含む隣接するセンテンスに対して、同一の強調表示をすることが可能となる。
また、本発明に係るデータベースが、過去に利用者が訴訟に関連するか否かを判断した文書情報に共通して頻出するキーワードを解析し、該解析されたキーワードに関する結果に基づいて、キーワードを自動で登録するものである際においては、過去の判断結果を踏まえて、有効なキーワードを効率的に登録することが可能となる。
また、本発明に係るフォレンジックシステムは、更に、センテンスを強調された文書情報に対して、利用者が行った関連性の判断結果を受け付ける結果受付部と、判断結果に基づいて、抽出された文書情報を判断結果ごとに分別し、該分別された文書情報おいて、共通して出現するキーワードを解析し、選定する選定部と、選定したキーワードを記録するキーワード記録部と、キーワード記録部に記録されたキーワードを文書情報から探索する探索部と、探索部の探索結果と選定部の解析結果を用いて、判断結果と文書情報との関連性を示す文書スコアを算出する文書スコア算出部と、文書スコアに基づいて、自動で関連性の判断を行う自動判断部とを備える際においては、利用者の関連性判断の結果に基づいて、フォレンジックシステムが、自動で残りの文書情報に関連性判断を行うことが可能となる。
本発明の第1の実施形態におけるフォレンジックシステムのブロック図 本発明の第1の実施形態におけるレビュー画面を模式的に示した図 本発明の第1の実施形態の処理を表すフローチャート 本発明の第1の実施形態のデータベースの処理を表すフローチャート 本発明の第1の実施形態のデータベースの解析結果を表すグラフ 本発明の第2の実施形態におけるフォレンジックシステムのブロック図 本発明の第2の実施形態におけるレビュー画面を模式的に示した図 本発明の第2の実施形態の処理を表すフローチャート 本発明の第3の実施形態におけるフォレンジックシステムのブロック図 本発明の第3の実施形態の処理を表すフローチャート
[第1の実施形態]
以下、本発明の第1の実施形態を図1乃至図5を用いて説明する。
本発明の第1の実施形態に係るフォレンジックシステムは、デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するデータベース101と、データベース101に登録されたキーワードを文書情報から検索する検索部111と、文書情報から、検索されたキーワードを含むセンテンスを抽出するセンテンス抽出部112と、センテンス抽出部112により抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するスコア算出部113と、スコアに応じてセンテンスの強調の程度を変化させる強調部114とを備える。
フォレンジックシステムは、コンピュータまたはサーバを備え、各種入力に基づきCPUがROMに記録されたプログラムを実行することで、各種機能部として動作する。該プログラムは、CD−ROM等の記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされるものであってもよい。
本実施形態においては、レビュワーと呼ばれる利用者が、文書情報の中から、訴訟に提出が必要な文書を抽出するために、訴訟との関連性の判断を行う。この、システム又は利用者が訴訟に関連するか否かを判断する行為をレビューという。レビューでは、レビューの対象となる文書情報を、訴訟の関連の度合いや、訴訟との関連の仕方に基づいて、複数の種類に分類を行う。
図1は、第1の実施形態におけるフォレンジックシステムのブロック図を示している。本実施形態において、フォレンジックシステムは、サーバ装置100と、クライアント端末200とを備えている。
サーバ装置100とクライアント端末200とは通信ネットワークを介して接続されている。通信ネットワークは、有線あるいは無線の通信回線をいう。例えば、電話回線、インターネット回線等である。
クライアント端末200は、コンピュータであり、それぞれ図2に示すレビュー画面I1を表示する画面表示部211および指示部(不図示)を有している。
画面表示部211は、表示用のディスプレイ(液晶ディスプレイ、CRTモニター、有機ELディスプレイ等)をいう。また、指示部(不図示)はマウスやキーボードをいう。
レビュワーは、クライアント端末200を介して、サーバ装置100と接続し、画面表示部211が表示する、図2に示すようなレビュー画面I1上でレビューを行う。
サーバ装置100は、検索部111と、センテンス抽出部112と、スコア算出部113と、強調部114と、データベース101とを備えている。
サーバ装置は、内部に表示部(不図示)を設け、強調部でハイライトしたセンテンスを表示する構成としてもよい。
本実施形態において、各構成はサーバ装置100上に搭載されているが、それぞれ別筐体に搭載されるものであってもよい。
本実施形態では、システム管理者がキーワードを事前にデータベース101に登録しておき、該登録されたキーワードが文書情報に含まれるか検索部111が検索する。検索結果は、センテンス単位での強調表示として利用者に提示される。また、本実施形態では、データベース101が、後述するように、過去のレビュー結果に基づいて、キーワードを自動で登録することも可能である。これによって、利用者が提示された文書情報が訴訟に関連するか否か判断する際に、キーワードを秘匿化することができる。
データベース101は、電子媒体にデータを記録する記録装置である。本実施形態では、データベース101は、サーバ装置100内部に搭載されている。尚、ストレージ装置として単独筐体で設置することも可能である。
文書情報は、1つ以上の単語を含むデータをいう。文書情報の一例として、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書等が挙げられる。また、スキャンデータを文書として扱うことも可能である。この場合、スキャンデータをテキストデータへと変換できるように、文書判別システム内にOCR(Optical Character Reader)装置を備えてもよい。OCR装置によってテキストデータへ変更することで、スキャンデータからキーワードの解析や探索が可能になる。
キーワードは、ある言語において、一定の意味を持つ文字列のまとまりをいう。例えば、「文書を分別する」という文章のキーワードは、「文書」「分別」「する」としてもよい。
センテンスは、句点やピリオドによって分けられたひとつづきの言葉をいう。センテンスは1つの文書情報中に複数含まれるものとしてもよい。
図1のサーバ装置100内の各機能を説明する。検索部111は、所定の文書情報から、データベース101に登録されたキーワードを検索する機能を有している。
センテンス抽出部112は、文書情報から特定のキーワードを含むセンテンスを抽出する。また、センテンス抽出部112は、検索されたキーワードの隣接の程度に基づいて、抽出するセンテンスの量を決定することも可能である。具体的にいうと、類似度の高いキーワードが隣接するセンテンスに含まれる場合、隣接する二つのセンテンスを抽出するものとしてもよい。これによって、関連性の高いキーワードを有するセンテンスが隣接している場合には同じ程度で強調することが可能となる。
スコア算出部113は、センテンス抽出部112が抽出したセンテンスの特徴量に基づいて、スコアを算出する。スコアは、ある文書情報において、訴訟とセンテンスとの関連度合を示すものをいう。本実施形態では、スコアが高いほど、訴訟との関連性が高いことを示している。
特徴量は、各キーワードがある文書情報中で発揮する情報量をいう。特徴量は、センテンスに含まれる、キーワードに基づいて算出されたものであってもよい。例えば、キーワードの出現頻度や伝達情報量に基づいて算出するとしてもよい。
強調部114は、文書情報中の特定のセンテンスの強調の程度をスコアに応じて変化させる。例えば、スコアが一定の閾値を超過したセンテンスに特定の色でハイライトすることが可能である。また、強調部114は、特徴量に応じて強調する色を変えるものであってもよい。
レビュワーは、分類を行う際に、文書情報の中に、特定のキーワードが含まれているか否か、また、該特定のキーワードが、どのような文脈で用いられているかを手掛かりにする。そのため、強調部114がスコアに応じて変化させることにより、注目すべきセンテンスを、文書情報中から即座に発見することができる。これによって、レビューの精度の向上と効率化を実現することが可能となる。
図2は、レビュー画面I1において、強調部114が強調表示した様子を模式的に表した図である。図2の(A)及び(B)は、強調部114によって強調されたセンテンスを表している。強調部114は、図2の(A)と(B)のように含まれるキーワードによって、強調の程度を変化させることができる。
次に、図3を用いて本実施形態における、フォレンジックシステムの処理フローを説明する。まず、システム管理者がキーワードを登録する(STEP101)。
図4はデータベース101が自動でキーワードを登録する処理フローを示すフローチャートである。データベース101は、過去に利用者が訴訟に関連するか否かを判断した結果に基づいて、キーワードを自動で登録する。具体的には、利用者が訴訟に関連すると判断した文書情報群を用いてキーワードに重みづけを行い、該重みづけが一定の閾値を超過したものをデータベース101に登録する。例えば、訴訟に関連すると判断された文書情報群を解析し、該文書情報群に共通して含まれるキーワードに対して、重みづけを行うものとしてもよい。
まず、データベース101が、過去のレビューで訴訟に関係すると判断された文書情報群に対して、キーワード解析を行う(STEP151)。
図5は、データベース101が、過去にレビューされた文書情報を解析した結果を示したグラフである。図5において、縦軸R_hotは、レビュワーによって、訴訟に関連すると判断された全文書情報のうち、該文書情報に紐づくキーワードとして登録されたキーワードを含み、かつ訴訟に関連すると判断された文書情報の割合を示している。横軸R_allは、レビュワーがレビューを実施した全文書情報のうち、データベース101によって登録されたキーワードを含む文書情報の割合を示している。
本実施形態において、図4に示す処理フローにおいて、データベース101では、図5の直線R_hot=R_allよりも上部にプロットされるようなキーワードに重みづけを行い、閾値を超過したものを登録する(STEP152)。
図3に戻り、処理の続きを説明する。検索部111が、文書情報の中から、登録されたキーワードを検索し(STPE102)、検索されたキーワードを含むセンテンスをセンテンス抽出部112が抽出する(STEP103)。
センテンス抽出部112が抽出したセンテンスにおける、キーワードの出現頻度、伝達情報量から、該センテンスのスコアをスコア算出部113が算出する。このときセンテンスが有する固有の意味情報によって、算出されたスコアに得点が加点・減点される(STEP104)。算出されたスコアに基づいて、強調部114がセンテンスを強調する(STEP105)。サーバ装置100にネットワークを介してアクセスしてきたクライアント端末200に、図2に示す、センテンスを強調表示したレビュー画面I1を表示させる(STEP106)。
[第2の実施形態]
以下、本発明の第2の実施形態を図6乃至図8を用いて説明する。
本発明の第2の実施形態に係るフォレンジックシステムは、デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するデータベース101と、データベース101に登録されたキーワードを文書情報から検索する検索部111と、文書情報から、検索されたキーワードを含むセンテンスを抽出するセンテンス抽出部112と、センテンス抽出部112により抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するスコア算出部113と、スコアに応じてセンテンスの強調の程度を変化させる強調部114とを備える。
図6は、第2の実施形態におけるフォレンジックシステムのブロック図を示している。本実施形態において、フォレンジックシステムは、サーバ装置100と、クライアント端末200とデータベース101とを備えている。
サーバ装置100とクライアント端末200とデータベース101とは通信ネットワークを介して接続されている。通信ネットワークは、有線あるいは無線の通信回線をいう。例えば、電話回線、インターネット回線等である。
サーバ装置100は、検索部111と、センテンス抽出部112と、スコア算出部113と、強調部114と、登録受付部115とを備えている。
本実施形態において、各構成はサーバ装置100上に搭載されているが、それぞれ別筐体に搭載されるものであってもよい。
本実施形態では、キーワードは、レビュワーと呼ばれる利用者が、登録する。
図7は、本実施形態において、レビュワーがレビューを実施するレビュー画面I1を模式的に示した図である。
図7の(A)は検索ウィンドウである。該検索ウィンドウにレビュワーは検索したいキーワードを入力する。入力されたキーワードは、登録受付部115によって受付られ、データベース101に記録される。図7の(B)は、文書情報表示画面である。レビュワーが入力したキーワードの検索結果は、(B)に示すようにセンテンス単位で強調表示される。本実施形態では、類似のキーワードを有する隣接したセンテンスは、同一の色で強調表示される。
検索部111は、所定の文書情報からキーワードを検索する。具体的には、レビュワーが図7の(A)に入力したキーワードを、文書情報の中から検索する。
センテンス抽出部112は、レビュワーが入力した特定のキーワードを含むセンテンスを文書情報の中から抽出する。このとき、センテンス抽出部112は、検索されたキーワードの隣接の程度に基づいて、抽出するセンテンスの量を決定することも可能である。例えば、類似度の高いキーワードが隣接するセンテンスに含まれる場合、該二つのセンテンスを抽出するものとしてもよい。
スコア算出部113は、センテンス抽出部112が抽出したセンテンス特徴量に基づいて、センテンスのスコアを算出する。
スコアは、ある文書情報において、訴訟とセンテンスとの関連度合を示すものをいう。本実施形態では、肯定文や否定文・疑問文などセンテンスの性質に応じてスコアは算出される。例えば、センテンスが肯定文である場合には、特徴量に基づいて算出されたスコアに得点を加点し、否定文である場合には、減点するものとしてもよい。
特徴量は、各キーワードがある文書情報中で発揮する情報量をいう。特徴量は、センテンスに含まれる、キーワードに基づいて抽出される。本実施形態では、キーワードの出現頻度や伝達情報量から抽出されたものであってもよい。
強調部114は、文書情報中の特定のセンテンスの強調の程度をスコアに基づいて変化させる。本実施形態では、スコアがある一定の閾値を超えたセンテンスをハイライト表示し、特徴量に応じて強調する色を変えることが可能である。
次に、図8を用いてフォレンジックシステムの処理フローを説明する。まず、レビュワーが図7の(A)に示す検索ウィンドウからキーワードを入力する(STEP201)。次に、登録受付部115が、入力されたキーワードを受け付け(STEP202)、データベース101がキーワードを記録する(STPE203)。記録されたキーワードを、検索部111が検索し(STEP204)、検索されたキーワードを含むセンテンスをセンテンス抽出部112が抽出する(STEP205)。
センテンス抽出部112が抽出したセンテンスにおける、キーワードの出現頻度、伝達情報量及びセンテンスが有する固有の意味情報から、該センテンスのスコアをスコア算出部113が算出する(STEP206)。算出されたスコアに基づいて、強調部114がセンテンスを強調表示する(STEP207)。サーバ装置100にネットワークを介してアクセスしてきたクライアント端末200に、図7の(B)に示す、センテンスを強調表示したレビュー画面I1を表示させる(STEP208)。
その他の構成、機能については第1の実施形態と同様である。
[第3の実施形態]
以下、本発明の第3の実施形態を図9および図10を用いて説明する。
本発明の第3の実施形態に係るフォレンジックシステムは、デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するデータベース101と、データベース101に登録されたキーワードを文書情報から検索する検索部111と、文書情報から、検索されたキーワードを含むセンテンスを抽出するセンテンス抽出部112と、センテンス抽出部112により抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するスコア算出部113と、スコアに応じてセンテンスの強調の程度を変化させる強調部114とを備える。
また、本実施形態に係るフォレンジックシステムは、更に、センテンスを強調された文書情報に対して、利用者が行った関連性の判断結果を受け付ける結果受付部123と、判断結果に基づいて、抽出された文書情報を判断結果ごとに分別し、該分別された文書情報おいて、共通して出現するキーワードを解析し、選定する選定部124と、選定したキーワードを記録するキーワード記録部125と、キーワード記録部125に記録されたキーワードを文書情報から探索する探索部126と、探索部の探索結果と選定部の解析結果を用いて、判断結果と文書情報との関連性を示す文書スコアを算出する文書スコア算出部127と、文書スコアに基づいて、自動で関連性の判断を行う自動判断部128とを備える。
図9は、本実施形態に係るフォレンジックシステムのブロック図を示している。
サーバ装置100は、検索部111と、センテンス抽出部112と、スコア算出部113と、強調部114と、データベース101と、結果受付部123と、選定部124と、キーワード記録部125と、探索部126と、文書スコア算出部127と、自動判断部128を備えている。
本実施形態において、各構成はサーバ装置100上に搭載されているが、それぞれ別筐体に搭載されるものであってもよい。
クライアント端末200は、図2に示すレビュー画面I1を表示する画面表示部211を有している。レビュワーと呼ばれる利用者は、クライアント端末200を介して、サーバ装置100と接続し、レビュー画面I1上でレビューを行う。
図9を用いて各構成要素の機能について説明する。
選定部124は、キーワードを選定する。同一の判断結果がなされた文書情報に共通して出現するキーワードを解析し、選定するものとしてもよい。
キーワード記録部125は、キーワードを記録するものをいう。データベースとしてもよい。
探索部126は、キーワードを文書情報から探索するものをいう。
文書スコア算出部127は、文書情報の文書スコアを算出するものをいう。文書情報に含まれるキーワードの評価値に基づいて文書スコアを算出するものとしてもよい。評価値は、各キーワードがある文書情報中で発揮する情報量をいってもよい。評価値は、文書情報中のキーワードの出現頻度や伝達情報量に基づいて算出するとしてもよい。
文書スコアは、ある文書情報において、訴訟との関連度合を示すものをいう。文書スコアは文書情報に含まれるキーワードに基づいて算出される。例えば、訴訟時に提出する必要が高いキーワードが含まれる文書情報ほど、高い文書スコアを有するとしてもよい。文書情報は、一定の要件に基づいて文書スコアの初期値を与えられるものとしてもよい。例えば、文書情報に出現するキーワードと、各キーワードの持つ評価値とにより初期スコアを算出するものとしてもよい。
文書スコア算出部127は、文書群中に出現するキーワードと、各キーワードの持つ重みづけにより、以下の式から文書スコアを算出することが可能である。
Figure 2014078081

各キーワードがもつ重みづけは、該キーワードが持つ伝達情報量をもとに決定する。該重みづけは以下の式により、学習することが可能である。
Figure 2014078081
自動判断部128は、スコア算出部127が算出した文書スコアに基づいて、自動で関連性の判断を行う。具体的には、所定の閾値をスコアが超過した文書情報については、関連性ありと判断し、閾値を超過しない文書情報に対しては関連性なしと判断する。
図10を用いて、本実施形態における関連性自動判断の処理フローについて説明する。まず、結果受付部123は、利用者が強調表示されたセンテンスを参考にしながら文書情報に対して行った関連性判断の結果を受け付け(STEP301)、選定部124が利用者の関連性判断の結果から文書情報を解析し、キーワードを選定する(STEP302)。選定されたキーワードはキーワード記録部125によって記録される(STEP303)。次に、各文書情報から記録されたキーワードを探索部126が探索し(STEP304)、文書スコア算出部127が式(1)を用いて各文書情報の文書スコアを算出する(STEP305)。算出された文書スコアに基づいて、自動判断部128が、自動で関連性の判断を行う(STEP306)。
その他の構成、機能については第1または第2の実施形態と同様である。
フォレンジックシステムは、デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するデータベース101と、登録されたキーワードを文書情報から検索する検索部111と、文書情報から、検索されたキーワードを含むセンテンスを抽出するセンテンス抽出部112と、抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するスコア算出部113と、スコアに応じてセンテンスの強調の程度を変化させる強調部114とを備えることによって、利用者の訴訟に関連するか否かの判断の精度及び速度を向上させることが可能となる。
フォレンジックシステムは、更に、特徴量が、センテンスに含まれる、キーワードに基づいて算出されたものである際においては、特定のキーワードを含むセンテンスをセンテンス単位で強調することが可能となる。
また、フォレンジックシステムは、更に、スコアが、センテンスが有する固有の意味情報から算出されたものである際においては、センテンスが有する、肯定文か否定文かといった固有の性質に応じて、強調の程度を変化させることが可能となる。
また、強調部114が、特徴量に応じて強調する色を変えるものである際においては、センテンスが有する固有の意味情報やキーワードに応じて、強調する方法を変化させることができ、より利用者の訴訟に関連するか否かの判断が容易となる。
また、センテンス抽出部112が、検索されたキーワードの隣接の程度に基づいて、抽出するセンテンスの量を決定するものである際においては、類似のキーワードを含む隣接するセンテンスに対して、同一の強調表示をすることが可能となる。
また、データベース101が、過去に利用者が訴訟に関連するか否かを判断した文書情報に共通して頻出するキーワードを解析し、該解析されたキーワードに関する結果に基づいて、キーワードを自動で登録するものである際においては、過去の判断結果を踏まえて、有効なキーワードを効率的に登録することが可能となる。
また、フォレンジックシステムが、更に、センテンスを強調された文書情報に対して、利用者が行った関連性の判断結果を受け付ける結果受付部123と、判断結果に基づいて、抽出された文書情報を判断結果ごとに分別し、該分別された文書情報おいて、共通して出現するキーワードを解析し、選定する選定部124と、選定したキーワードを記録するキーワード記録部125と、キーワード記録部125に記録されたキーワードを文書情報から探索する探索部126と、探索部の探索結果と選定部の解析結果を用いて、判断結果と文書情報との関連性を示す文書スコアを算出する文書スコア算出部127と、文書スコアに基づいて、自動で関連性の判断を行う自動判断部128とを備える際においては、利用者の関連性判断の結果に基づいて、フォレンジックシステムが、自動で残りの文書情報に関連性判断を行うことが可能となる。
100 サーバ装置
101 データベース
111 検索部
112 センテンス抽出部
113 スコア算出部
114 強調部
115 登録受付部
123 結果受付部
124 選定部
125 キーワード記録部
126 探索部
127 文書スコア算出部
128 自動判断部
200 クライアント端末
211 画面表示部
I1 レビュー画面

Claims (9)

  1. 複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、
    前記デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するデータベースと、
    前記データベースに登録された前記キーワードを文書情報から検索する検索部と、
    前記文書情報から、前記検索されたキーワードを含むセンテンスを抽出するセンテンス抽出部と、
    前記センテンス抽出部により抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するスコア算出部と、
    前記スコアに応じて前記センテンスの強調の程度を変化させる強調部とを備えるフォレンジックシステム。
  2. 前記特徴量は、前記センテンスに含まれる、キーワードに基づいて算出されたものであることを特徴とする請求項1記載のフォレンジックシステム。
  3. 前記スコアは、更に、
    前記センテンスが有する固有の意味情報から算出されたものであることを特徴とする請求項1または2記載のフォレンジックシステム。
  4. 前記強調部は、
    前記特徴量に応じて強調する色を変えるものであることを特徴とする請求項1から3いずれか1項記載のフォレンジックシステム。
  5. 前記センテンス抽出部は、前記検索されたキーワードの隣接の程度に基づいて、抽出するセンテンスの量を決定するものであることを特徴とする請求項1から4いずれか1項記載のフォレンジックシステム。
  6. 前記データベースは、
    過去に利用者が訴訟に関連すると判断した文書情報に共通して頻出するキーワードを解析し、該解析されたキーワードに関する解析結果に基づいて、前記キーワードを自動で登録するものであることを特徴とする請求項1から5いずれか1項記載のフォレンジックシステム。
  7. 前記フォレンジックシステムは、更に、
    前記センテンスを強調された文書情報に対して、利用者が行った関連性の判断結果を受け付ける結果受付部と、
    前記判断結果に基づいて、前記抽出された文書情報を判断結果ごとに分別し、該分別された文書情報において、共通して出現するキーワードを解析し、選定する選定部と、
    前記選定したキーワードを記録するキーワード記録部と、
    前記キーワード記録部に記録されたキーワードを前記文書情報から探索する探索部と、
    前記探索部の探索結果と前記選定部の解析結果を用いて、判断結果と文書情報との関連性を示す文書スコアを算出する文書スコア算出部と、
    前記文書スコアに基づいて、自動で関連性の判断を行う自動判断部とを備える1から6いずれか1項記載のフォレンジックシステム。
  8. 複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデ
    ジタル情報を分析するフォレンジック方法において、
    コンピュータが、
    前記デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを登録するステップと、
    前記登録された前記キーワードを文書情報から検索するステップと、
    前記文書情報から、前記検索されたキーワードを含むセンテンスを抽出するステップと、
    前記抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出するステップと、
    前記スコアに応じて前記センテンスの強調の程度を変化させるステップとを実現することを特徴とするフォレンジック方法。
  9. 複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデ
    ジタル情報を分析するフォレンジックプログラムにおいて、
    コンピュータに、
    前記デジタル情報に含まれる複数の文書情報に対して、利用者が訴訟に関連するか否かを判断するためのキーワードを、登録する機能と、
    前記登録された前記キーワードを文書情報から検索する機能と、
    前記文書情報から、前記検索されたキーワードを含むセンテンスを抽出する機能と、
    前記抽出されたセンテンスから抽出される特徴量により、訴訟との関連度合を示すスコアを算出する機能と、
    前記スコアに応じて前記センテンスの強調の程度を変化させる機能とを実現させることを特徴とするフォレンジックプログラム。
JP2012224582A 2012-10-09 2012-10-09 フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム Active JP5823942B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012224582A JP5823942B2 (ja) 2012-10-09 2012-10-09 フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
US14/434,589 US9542474B2 (en) 2012-10-09 2013-10-09 Forensic system, forensic method, and forensic program
TW102136454A TW201415402A (zh) 2012-10-09 2013-10-09 取證系統、取證方法及取證程式
PCT/JP2013/077440 WO2014057962A1 (ja) 2012-10-09 2013-10-09 フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012224582A JP5823942B2 (ja) 2012-10-09 2012-10-09 フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Publications (2)

Publication Number Publication Date
JP2014078081A true JP2014078081A (ja) 2014-05-01
JP5823942B2 JP5823942B2 (ja) 2015-11-25

Family

ID=50477430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012224582A Active JP5823942B2 (ja) 2012-10-09 2012-10-09 フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Country Status (4)

Country Link
US (1) US9542474B2 (ja)
JP (1) JP5823942B2 (ja)
TW (1) TW201415402A (ja)
WO (1) WO2014057962A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016207071A (ja) * 2015-04-27 2016-12-08 アイ・ピー・ファイン株式会社 情報処理装置
WO2017061253A1 (ja) * 2015-10-09 2017-04-13 アイビーリサーチ株式会社 表示制御装置、表示制御方法及び表示制御プログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107851097B (zh) 2015-03-31 2021-10-01 株式会社Fronteo 数据分析***、数据分析方法、数据分析程序及存储介质
CN106095270B (zh) * 2016-06-06 2020-05-01 北京京东尚科信息技术有限公司 展示重点语句及确定标记范围的方法和终端装置及服务器
JP2018013893A (ja) * 2016-07-19 2018-01-25 Necパーソナルコンピュータ株式会社 情報処理装置、情報処理方法、およびプログラム
JP6868186B2 (ja) * 2017-03-24 2021-05-12 富士フイルムビジネスイノベーション株式会社 検索情報生成装置、画像処理装置、検索情報生成プログラム
CN111127183B (zh) * 2018-10-31 2023-10-17 重庆小雨点小额贷款有限公司 数据处理方法、装置、服务器及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230210A (ja) * 2008-03-19 2009-10-08 Katsuyoshi Nagashima テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法
JP2011209931A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP2011209930A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6721728B2 (en) * 2001-03-02 2004-04-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for discovering phrases in a database
US20030144970A1 (en) * 2001-12-10 2003-07-31 Coyne Patrick J. Project management database and method of managing project related information
US8090754B2 (en) * 2007-12-07 2012-01-03 Sap Ag Managing relationships of heterogeneous objects
US9501467B2 (en) * 2007-12-21 2016-11-22 Thomson Reuters Global Resources Systems, methods, software and interfaces for entity extraction and resolution and tagging
US20100250340A1 (en) * 2009-03-24 2010-09-30 Ip Street, Inc. Processing and Presenting Intellectual Property and Other Information
US8572376B2 (en) * 2009-03-27 2013-10-29 Bank Of America Corporation Decryption of electronic communication in an electronic discovery enterprise system
US8706742B1 (en) * 2009-04-22 2014-04-22 Equivio Ltd. System for enhancing expert-based computerized analysis of a set of digital documents and methods useful in conjunction therewith
CA2788330C (en) * 2010-01-29 2018-05-08 Gaurav Mehra Systems and methods for providing a validation tool
JP4995950B2 (ja) 2010-07-28 2012-08-08 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
US20130231971A1 (en) * 2011-08-23 2013-09-05 Judy Bishop Legal project management system and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230210A (ja) * 2008-03-19 2009-10-08 Katsuyoshi Nagashima テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法
JP2011209931A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP2011209930A (ja) * 2010-03-29 2011-10-20 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016207071A (ja) * 2015-04-27 2016-12-08 アイ・ピー・ファイン株式会社 情報処理装置
WO2017061253A1 (ja) * 2015-10-09 2017-04-13 アイビーリサーチ株式会社 表示制御装置、表示制御方法及び表示制御プログラム

Also Published As

Publication number Publication date
US20150286706A1 (en) 2015-10-08
US9542474B2 (en) 2017-01-10
JP5823942B2 (ja) 2015-11-25
WO2014057962A1 (ja) 2014-04-17
TW201415402A (zh) 2014-04-16

Similar Documents

Publication Publication Date Title
KR101658794B1 (ko) 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램
JP5823942B2 (ja) フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP5530476B2 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
JP5827208B2 (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
JP5823943B2 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP5827206B2 (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
JP6025487B2 (ja) フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム
JP5526209B2 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP5592552B1 (ja) 文書分別調査システム及び文書分別調査方法並びに文書分別調査プログラム
JP5669904B1 (ja) 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム
WO2015025978A1 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
JP2015172952A (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム
JP5898371B2 (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム
JP6404294B2 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP5746403B2 (ja) 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム
JP5850973B2 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
JP2016012365A (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP2015084244A (ja) 事前情報を提供する文書調査システム、文書調査方法、及び文書調査プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150409

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20150409

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20150422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151008

R150 Certificate of patent or registration of utility model

Ref document number: 5823942

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250