JP2021015371A - 情報処理プログラム、情報処理方法、情報処理装置 - Google Patents

情報処理プログラム、情報処理方法、情報処理装置 Download PDF

Info

Publication number
JP2021015371A
JP2021015371A JP2019128649A JP2019128649A JP2021015371A JP 2021015371 A JP2021015371 A JP 2021015371A JP 2019128649 A JP2019128649 A JP 2019128649A JP 2019128649 A JP2019128649 A JP 2019128649A JP 2021015371 A JP2021015371 A JP 2021015371A
Authority
JP
Japan
Prior art keywords
information
difference
occurrence
document
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019128649A
Other languages
English (en)
Inventor
明▲哲▼ 張
Ming-Che Chang
明▲哲▼ 張
豊 岩山
Yutaka Iwayama
豊 岩山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019128649A priority Critical patent/JP2021015371A/ja
Publication of JP2021015371A publication Critical patent/JP2021015371A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】情報の正確性を評価することを目的としている。【解決手段】予め規定される正確な情報を示す第1文書に含まれる単語又は単語群の共起関係と、評価対象となる第2文書に含まれる単語又は単語群の共起関係と、に基づいて、前記第1文書と前記第2文書との差異の有無を判定する処理と、前記差異が有る場合に、判定結果を出力する処理と、をコンピュータに実行させる。【選択図】図25

Description

本発明は、情報処理プログラム、情報処理方法、情報処理装置に関する。
近年では、企業等の組織内において、ファイル共有ストレージサービス等を利用して情報を共有することが知られている。
特開平9−153031号公報 特開2010−146171号公報 特開2003−163735号公報
上述したファイル共有ストレージサービスにおいて共有される情報の中には、不正確な情報が含まれる可能性がある。しかしながら、どの情報が不正確な情報に該当するのか判別することが困難である。
1つの側面では、本発明は、情報の正確性を評価することを目的としている。
一つの態様では、予め規定される正確な情報を示す第1文書に含まれる単語又は単語群の共起関係と、評価対象となる第2文書に含まれる単語又は単語群の共起関係と、に基づいて、前記第1文書と前記第2文書との差異の有無を判定する処理と、前記差異が有る場合に、判定結果を出力する処理と、をコンピュータに実行させる情報処理プログラムである。
上記各処理は、上記各処理を実現する機能部、各処理を実現する手順としても良く、各処理をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体とすることもできる。
情報の正確性を評価できる。
情報処理システムのシステム構成の一例を示す図である。 情報処理装置の動作の概略を説明する図である。 情報処理装置のハードウェア構成の一例を示す図である。 情報処理装置の有する情報処理部の機能を説明する図である。 重なり範囲特定部の処理を説明する図である。 共起関係作成部の処理を説明する図である。 情報処理装置の処理を説明する第一のフローチャートである。 差異判定部と差異抽出部の処理を説明するフローチャートである。 第一の差異判定処理を説明するフローチャートである。 第一の差異判定処理について説明する第一の図である。 第一の差異判定処理について説明する第二の図である。 第二の差異判定処理を説明するフローチャートである。 第二の差異判定処理を説明する図である。 第三の差異判定処理を説明する第一のフローチャートである。 第三の差異判定処理を説明する第二のフローチャートである。 第三の差異判定処理を説明する第一の図である。 第三の差異判定処理を説明する第二の図である。 第三の差異判定処理を説明する第三の図である。 第三の差異判定処理を説明する第四の図である。 第三の差異判定処理を説明する第五の図である。 第三の差異判定処理を説明する第六の図である。 第三の差異判定処理を説明する第七の図である。 評価結果記憶部の一例を示す図である。 共有情報管理部の処理を説明するフローチャートである。 端末装置(管理者用)の表示例を示す図である。 端末装置(利用者用)の表示例を示す第一の図である。 端末装置(利用者用)の表示例を示す第二の図である。 端末装置(利用者用)の表示例を示す第三の図である。
以下に図面を参照して本実施形態の情報処理システムについて説明する。図1は、情報処理システムのシステム構成の一例を示す図である。
本実施形態の情報処理システム100は、情報処理装置200、端末装置300、端末装置400を含む。情報処理装置200は、端末装置300、端末装置400とネットワークを介して接続される。
また、本実施形態の情報処理システム100は、端末装置300、400によって共有される文書データ等が格納された共有情報データベース500とネットワークを介して接続される。
本実施形態の情報処理装置200は、正確情報記憶部205、共有情報記憶部206、第一共起関係記憶部210、第二共起関係記憶部220、差異記憶部230、評価結果記憶部235、情報処理部240を有する。
本実施形態の情報処理装置200の情報処理部240は、ネットワークを介して正確情報を収集し、正確情報記憶部205に格納する。
正確情報とは、例えば、インターネット上に公開された論文、実験・研究レポート、学会発表の内容等の根拠のある情報や、国際基準(ITIL、SDEM)、法律等の標準となる情報、プレスリリース、記者会見、製品発表会等の公式な場で公開された情報等を含む。正確情報は、例えば、複数の単語(単語群)を含む文書情報と、正確情報を特定する情報とを含んでも良い。
また、本実施形態の情報処理部240は、共有情報データベース500に格納された共有情報を収集し、共有情報記憶部206に格納する。
共有情報とは、例えば、共有情報データベース500の利用者によって作成された情報である。共有情報は、正確情報に基づく正確性の評価対象であり、例えば、複数の単語を含む文書情報と、文書情報を作成した作成者を特定する情報と、共有情報を特定する情報とが含まれても良い。文書情報を作成した作成者を特定する情報とは、例えば、作成者の名称等であり、共有情報を特定する情報とは、例えば、文書情報のファイル名等である。
本実施形態では、共有情報データベース500の利用者は、例えば、端末装置300の利用者や端末装置400の利用者を含む。尚、端末装置300は、主に、共有情報を作成し、共有情報データベース500へ格納する共有情報の作成者によって利用されても良い。また、端末装置400は、共有情報データベース500に格納された共有情報を管理する管理者によって利用されても良い。
また、図1の例では、共有情報データベース500は、1つとされているが、これに限定されない。共有情報データベース500は、複数のデータベースを含んでいてよいし、複数の異なるサーバ装置上に設けられていても良い。
情報処理部240は、差異抽出処理部250と共有情報管理部260を有する。差異抽出処理部250は、正確情報記憶部205に格納された正確情報に含まれる各文書データについて、文書データに含まれる単語の共起関係を示す第一共起テーブルを作成し、第一共起関係記憶部210へ格納する。また、差異抽出処理部250は、共有情報記憶部206に格納された共有情報に含まれる各文書データについて、文書データに含まれる単語の共起関係を示す第二共起テーブルを作成し、第二共起関係記憶部220へ格納する。
そして、差異抽出処理部250は、第一共起テーブルと第二共起テーブルを参照し、正確情報と共有情報との差異の有無を判定し、差異がある場合には、差異を示す差異情報を抽出して、差異記憶部230に格納する。
本実施形態の共有情報管理部260は、差異記憶部230に格納された差異情報を集計し、集計の結果を示す評価結果情報を、評価結果記憶部235に格納する。また、共有情報管理部260は、評価結果記憶部235に格納された評価結果情報に基づき、端末装置300や端末装置400に、差異情報を表示させ、共有情報データベース500の更新を促す。
以下に、図2を参照して、本実施形態の情報処理装置200の動作の概略を説明する。図2は、情報処理装置の動作の概略を説明する図である。
本実施形態の情報処理装置200は、ネットワークを介して外部から正確情報を収集して正確情報記憶部205に格納し(ステップS1)、共有情報データベース500から共有情報を収集して共有情報記憶部206に格納する(ステップS2)。
続いて、情報処理装置200は、正確情報と共有情報との重なりの範囲を特定し、特定された範囲の正確情報と共有情報を抽出する(ステップS3)。そして、情報処理装置200は、抽出された正確情報から作成した第一共起テーブルと、共有情報から作成した第二共起テーブルとを比較し、両者の共起関係を比較する(ステップS4)。
次に、情報処理装置200は、比較結果に基づき、正確情報に対する共有情報の差異を示す差異情報を抽出し(ステップS5)、差異情報を集計して(ステップS6)、集計したて評価結果情報を端末装置300、400に表示させる(ステップS7)。
以上のように、本実施形態では、予め規定される正確な情報を示す単語群を含む第1文書(正確情報)における単語同士の共起関係と、評価対象となる第2文書(共有情報)に含まれる単語群における単語同士の共起関係と、に基づいて、第1文書と第2文書の差異を判定する。そして、本実施形態では、判定結果を集計した結果を出力する。
また、本実施形態では、端末装置300、400によって、評価結果情報に応じて共有情報が更新されると、共有情報データベース500に格納された共有情報が更新される。
本実施形態では、このように、正確情報と共有情報を、共起関係を用いて比較し、差異情報を抽出することで、共有情報の正確性を評価することができる。また、本実施形態では、差異情報を集計した評価結果情報を、共有情報の作成者や管理者等に通知することで、不正確であった共有情報の修正や確認を促すことができ、共有情報の正確性を向上させることができる。
以下に、本実施形態の情報処理装置200について、さらに説明する。図3は、情報処理装置のハードウェア構成の一例を示す図である。
本実施形態の情報処理装置200は、それぞれバスBで相互に接続されている入力装置21、出力装置22、ドライブ装置23、補助記憶装置24、メモリ装置25、演算処理装置26及びインターフェース装置27を含む情報処理装置である。
入力装置21は、各種の情報の入力を行うための装置であり、例えばキーボードやポインティングデバイス等により実現される。出力装置22は、各種の情報の出力を行うためものであり、例えばディスプレイ等により実現される。インターフェース装置27は、LANカード等を含み、ネットワークに接続する為に用いられる。
情報処理部240を実現させる情報処理プログラムは、情報処理装置200を制御する各種プログラムの少なくとも一部である。情報処理プログラムは、例えば記憶媒体28の配布やネットワークからのダウンロード等によって提供される。情報処理プログラムを記録した記憶媒体28は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記憶媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記憶媒体を用いることができる。
また、情報処理プログラムは、情報処理プログラムを記録した記憶媒体28がドライブ装置23にセットされると、記憶媒体28からドライブ装置23を介して補助記憶装置24にインストールされる。ネットワークからダウンロードされた情報処理プログラムは、インターフェース装置27を介して補助記憶装置24にインストールされる。
補助記憶装置24は、情報処理装置200の有する各記憶部等を実現するものであり、情報処理装置200にインストールされた情報処理プログラムを格納すると共に、情報処理装置200による各種の必要なファイル、データ等を格納する。メモリ装置25は、情報処理装置200の起動時に補助記憶装置24から情報処理プログラムを読み出して格納する。そして、演算処理装置26はメモリ装置25に格納された情報処理プログラムに従って、後述するような各種処理を実現している。
次に、図4を参照して、本実施形態の情報処理装置200の機能について説明する。図4は、情報処理装置の有する情報処理部の機能を説明する図である。
本実施形態の情報処理部240は、差異抽出処理部250と、共有情報管理部260と、を有する。
差異抽出処理部250は、情報収集部251、重なり範囲特定部252、共起関係作成部253、差異判定部254、差異抽出部255、格納部256を有する。
情報収集部251は、ネットワークを介してインターネット上に存在する正確情報を収集し、正確情報記憶部205に格納する。また、情報収集部251は、共有情報データベース500に格納された共有情報を収集し、共有情報記憶部206に格納する。尚、本実施形態の情報収集部251は、正確情報を不定期に収集し、正確情報記憶部205を更新しても良い。
重なり範囲特定部252は、正確情報記憶部205に格納された正確情報と、共有情報記憶部206に格納された共有情報との重なり範囲を特定する。重なり範囲特定部252の処理の詳細は後述する。
共起関係作成部253は、重なり範囲特定部252によって特定された範囲の正確情報における単語間の共起関係を示す第一共起テーブルを作成し、第一共起関係記憶部210に格納する。また、共起関係作成部253は、特定された範囲の共有情報における単語間の共起関係を示す第二共起テーブルを作成し、第二共起関係記憶部220に格納する。共起関係作成部253の処理の詳細は後述する。
差異判定部254は、第一共起テーブルと第二共起テーブルとを比較して、正確情報に対する共有情報の差異の有無を判定する。
具体的には、本実施形態の差異判定部254は、正確情報と共有情報との第一の差異の有無と、第二の差異の有無と、第三の差異の有無と、を判定する。
第一の差異とは、正確情報と矛盾する内容を示す。つまり、第一の差異がある場合とは、共有情報が正確情報と矛盾する内容を有することを示す。
第二の差異とは、共有情報が有する共起関係であって、正確情報に一致する共起関係が存在しない共起関係を示す。つまり、第二の差異がある場合とは、共有情報が、正確情報とは異なる共起関係を有することを示す。
第三の差異とは、共有情報における、正確情報の共起関係には存在しない距離の共起関係、又は、正確情報と同義ではない修飾成分を示す。つまり、第三の差異がある場合とは、共有情報における共起関係の距離と、正確情報における共起関係の距離とが異なっていること、又は、共有情報における修飾成分と正確情報における修飾成分とが異なっていること、を示す。言い換えれば、第三の差異がある場合とは、共有情報が、正確情報とは異なる文脈を有することを示す。
以下の説明では、差異判定部254が、共有情報と正確情報における第一の差異の有無を判定することを、共有情報が正確情報と矛盾する情報であるか否かを判定する、と表現する場合がある。また、第一の差異を、共有情報と正確情報との矛盾、と表現する場合がある。
また、以下の説明では、差異判定部254が、共有情報と正確情報とにおける第二の差異の有無を判定することを、共有情報が正確情報と相違するか否かを判定する、と表現する場合がある。また、以下の説明では、第二の差異を、共有情報と正確情報との相違と表現する場合がある。
また、以下の説明では、差異判定部254が、共有情報と正確情報とにおける第三の差異の有無を判定することを、共有情報に注意すべき箇所が存在するか否かを判定する、と表現する場合がある。また、以下の説明では、第三の差異を、共有情報において注意すべき箇所、と表現する場合がある。
さらに、以下の説明では、差異判定部254によって、第一の差異、第二の差異、第三の差異の何れかの有無を判定することを、差異判定部254によって差異の有無を判定する、と表現する場合がある。
差異抽出部255は、差異が有ると判定された場合に、差異を示す差異情報を抽出する。格納部256は、抽出された差異情報を差異記憶部230に格納する。
本実施形態の共有情報管理部260は、集計部261、表示部262、更新部263を有する。集計部261は、差異記憶部230に格納された差異情報を集計した評価結果情報を評価結果記憶部235に格納する。表示部262は、評価結果記憶部235に格納された評価結果情報を端末装置300や端末装置400に表示させる。つまり表示部262は、差異判定部254による判定結果を出力する出力部の一例である。
更新部263は、端末装置300や端末装置400から入力された情報に応じて、共有情報データベース500に格納された共有情報を更新する。
次に、図5を参照して、本実施形態の重なり範囲特定部252の処理について説明する。図5は、重なり範囲特定部の処理を説明する図である。
本実施形態の重なり範囲特定部252は、正確情報と共有情報のそれぞれに含まれる単語のうち、名詞に着目し、重なり範囲を判定する。
図5(A)は、正確情報51に共有情報52が含まれる状態を示している。この状態では、共有情報52に含まれる単語(名詞)の全てと一致する単語(名詞)が正確情報51に含まれる。したがって、この場合、重なり範囲特定部252は、共有情報52全てを重なり範囲に特定する。
図5(B)は、共有情報52の一部が正確情報51に含まれる状態を示している。この状態では、共有情報52に含まれる単語の一部が、正確情報51に含まれる。したがって、重なり範囲特定部252は、共有情報52のうち、正確情報51に一致する単語が含まれる共有情報53を重なり範囲に特定する。また、重なり範囲特定部252は、共有情報52のうち、共有情報53以外の共有情報は、差異判定部254による判定の対象外とする。
図5(C)は、正確情報51と共有情報52とが重なっていない状態を示している。この状態では、重なり範囲特定部252は、重なり範囲はなしとする。
図5(D)は、図5(B)に示した状態と同様の状態を示している。本実施形態の重なり範囲特定部252は、図5(D)の状態において、情報Zは、正確情報51との重なり範囲に特定された共有情報53に含まれるため、差異判定部254による判定の対象となる。また、情報Wは、一部が共有情報53に含まれるため、差異判定部254による判定の対象となる。また、情報Vは、共有情報53に含まれないため、差異判定部254による判定の対象外とされる。
言い換えれば、共有情報52のうち、情報Zと情報Wは、比較対象となる正確情報が存在するため、正確性の評価の対象とされ、情報Vは、比較対象となる正確情報が存在しないため、正確性の評価の対象外とされる。
次に、図6を参照して、本実施形態の共起関係作成部253の処理について説明する。図6は、共起関係作成部の処理を説明する図である。
本実施形態の共起関係作成部253は、正確情報と共有情報について、以下の処理を行う。尚、正確情報と共有情報とは、それぞれが文書情報とする。
共起関係作成部253は、文書情報から、主語を特定する。また、共起関係作成部253は、文書情報から、主語以外の単語を特定し、主語からの距離に応じて共起テーブルに格納する。主語以外の単語とは、名詞と動詞等である。
本実施形態では、ある文書情報中に出現する単語同士を、共起関係がある単語とする。具体的には、共起関係作成部253は、主語とされる単語と共起関係があり、名詞である単語を共起名詞として、共起テーブルに格納する。また、共起関係作成部253は、主語とされる単語と共起関係があり、動詞である単語を共起動詞として、共起テーブルに格納する。
図6の例では、文書情報60について、共起テーブルを作成した場合を示している。文書情報60は、正確情報記憶部205に格納された正確情報とする。したがって、文書情報60に基づき作成された共起テーブル61は、第一共起テーブルとして、第一共起関係記憶部210に格納される。
例えば、文書情報にNn個の単語が存在するものとし、主語N1と共起関係を持つ単語がa個ある場合について考える。
この場合、共起関係作成部253は、単語N1と共起している単語を文書情報から抽出し、第一共起テーブルの第一レコードに格納する。尚、単語N1と単語N2とが同時に出現した場合、共起関係のある単語はb個となる。
次に、共起関係作成部253は、単語N1および単語N2と共起する単語を抽出して、第一共起テーブルの第二レコードに格納する。
文書情報60は、「人工知能ソフトはチャットボットとの連携の開発を進められている」という内容であり、単語が5個含まれる。また、主語N1は「人工知能ソフト」である。
したがって、共起関係作成部253は、主語である単語N1と、単語N1と共起する単語N2〜N5とを対応付けて一番目のレコード601とし、第一共起テーブル61に格納する。このとき、共起関係作成部253は、文書情報を特定する情報を情報名欄62に格納し、主語となる単語N1を単語/単語群欄63に格納し、単語N2〜N4は名詞であるため、共起名詞欄64に格納し、単語N5は動詞であるため、共起動詞欄65に格納する。
また、共起関係作成部253は、単語N2〜N4を共起名詞欄64に格納するとき、主語となる単語N1の近くの出現する単語から順番に格納する。したがって、第一共起テーブルでは、共起名詞欄64に格納された単語の順番が、主語とされる単語/単語群欄に格納された単語との距離と言える。具体的には、例えば、単語/単語群欄63の単語N1と、共起名詞欄64の1番目に格納された共起名詞である単語N2との距離は「1」となる。
次に、共起関係作成部253は、単語N1と単語N2を含む単語群を主語として、単語群と、単語群と共起する単語N2〜N5とを対応付けて二番目のレコード602とし、第一共起テーブル61に格納する。
このとき、共起関係作成部253は、単語N1と単語N2を含む単語群を単語/単語群欄63に格納し、単語N3、N4を共起名詞欄64に格納し、単語N5を共起動詞欄65に格納する。
共起関係作成部253は、文書情報に含まれる単語N1から単語Nn−1までが単語/単語群欄63に格納されるまで、レコードを作成し、第一共起テーブルへ格納する。
図6の例では、単語N1〜N4が単語/単語群に格納されるレコード605が格納されるまで、レコードを作成し、文書情報60についての第一共起テーブル61の作成を終了する。
本実施形態の共起関係作成部253は、重なり範囲特定部252によって特定された各共有情報について、上述した方法で第二共起テーブルを作成し、第二共起関係記憶部220に格納する。また、共起関係作成部253は、共有情報の評価に用いられる各正確情報について、上述した方法で第一共起テーブルを作成し、第一共起関係記憶部210に格納する。
次に、図7を参照して、本実施形態の情報処理装置200の処理について説明する。図7は、情報処理装置の処理を説明する第一のフローチャートである。
本実施形態の情報処理装置200の情報処理部240は、差異抽出処理部250の情報収集部251により、正確情報を収集する(ステップS701)。続いて、情報収集部251は、共有情報データベース500から共有情報を収集する(ステップS702)。
続いて、差異抽出処理部250は、重なり範囲特定部252により、収集した正確情報と共有情報との重なり範囲を特定し、特定された共有情報と、共有情報との比較対象とされる正確情報とを抽出する(ステップS703)。
続いて、差異抽出処理部250は、共起関係作成部253により、抽出された正確情報に基づいて、第一共起テーブルを作成して第一共起関係記憶部210に格納し、抽出された共有情報に基づいて第二共起テーブルを作成して第二共起関係記憶部220に格納する(ステップS704)。
続いて、差異抽出処理部250は、差異判定部254により、第一共起テーブルと第二共起テーブルとに基づいて、正確情報に対する共有情報の差異の有無を判定し、差異抽出部255により、差異情報を抽出する(ステップS705)。ステップS705の詳細は、後述する。
続いて、差異抽出処理部250は、格納部256により、抽出された差異情報を差異記憶部230に格納する(ステップS706)。
続いて、情報処理部240は、共有情報管理部260の集計部261により、差異記憶部230に格納された差異情報を集計した評価結果情報を表示部262により、端末装置300、400に表示させる(ステップS707)。
続いて、共有情報管理部260は、更新部263により、端末装置300や端末装置400から差異の確認結果が入力されると、対象の共有情報を更新し(ステップS708)、処理を終了する。
次に、図8を参照して、本実施形態のステップS705の処理について説明する。図8は、差異判定部と差異抽出部の処理を説明するフローチャートである。
本実施形態の差異抽出処理部250において、差異判定部254は、第一共起関係記憶部210と第二共起関係記憶部220とを参照して、第一の差異判定処理を行う(ステップS801)。
本実施形態の第一の差異判定処理とは、第一共起テーブルと第二共起テーブルとに基づき、正確情報に含まれる単語同士の共起関係と、共有情報に含まれる単語同士の共起関係とを比較し、共有情報と正確情報の間の矛盾又は相違の有無を判定する処理である。言い換えれば、第一の差異判定処理は、第一の差異又は第二の差異の有無を判定する処理である。ステップS801の詳細は後述する。
続いて、差異判定部254は、第一の差異判定処理による判定結果が、矛盾がないこと、又は、相違がないことを示すか否かを判定する(ステップS802)。ステップS802において、矛盾がある又は相違がある場合には、差異抽出処理部250は、後述するステップS807へ進む。
ステップS802において、矛盾がない又は相違がない場合、差異判定部254は、第二の差異判定処理を行う(ステップS803)。尚、矛盾がない場合とは、共有情報には、正確情報との矛盾は存在しないが、正確情報との相違か、注意すべき箇所が存在する可能性がある。
本実施形態の第二の差異判定処理とは、正確情報と共有情報とにおいて、共起関係が確定された単語を組み合わせた単語群と、他の単語又は単語群との共起関係を比較し、共有情報における共起関係と一致する共起関係が、正確情報に存在するか否かを判定する処理である。言い換えれば、第二の差異判定処理は、共有情報が、正確情報とは異なる共起関係を有するか否かを判定する処理である。つまり、第二の差異判定処理とは、第二の差異の有無を判定する処理である。ステップS803の詳細は後述する。
続いて、差異判定部254は、第二の差異判定処理による判定結果が、相違があることを示すか否かを判定する(ステップS804)。ステップS804において、相違がある場合、差異抽出処理部250は、後述するステップS807へ進む。
ステップS804において、相違がない場合、差異判定部254は、第三の差異判定処理を行う(ステップS805)。
本実施形態の第三の差異判定処理とは、正確情報と共有情報とにおいて、共起関係にある単語間の距離や修飾条件を分析し、共有情報に注意すべき箇所が存在するか否かを判定する処理である。言い換えれば、第三の差異判定処理は、第三の差異の有無を判定する処理である。ステップS805の処理の詳細は後述する。
続いて、差異判定部254は、第三の差異判定処理による判定結果が、注意すべき箇所が存在することを示すか否かを判定する(ステップS806)。ステップS806において、注意すべき箇所が存在しない場合、差異抽出処理部250は、処理を終了する。ステップS806において、注意すべき箇所が存在しない場合とは、正確情報と照合された共有情報が正確であることを示す。
ステップS806において、注意すべき箇所が存在する場合、差異抽出処理部250は、差異抽出部255により、正確情報と共有情報との差異を示す差異情報を抽出し(ステップS807)、格納部256により、差異情報を差異記憶部230へ格納し(ステップS808)、処理を終了する。
尚、本実施形態の差異情報は、正確情報と共有情報とが矛盾していることを示す情報と、共有情報が正確情報と相違することを示す情報と、共有情報に注意すべき箇所が存在することを示す情報と、の何れかを含む。言い換えれば、差異情報は、第一の差異の有無を示す情報、第二の差異の有無を示す情報、第三の差異の有無を示す情報の何れかを含む。
より具体的には、差異情報とは、共有情報を特定する情報と、各判定処理において参照された正確情報を特定する情報と、各判定処理の結果とを対応付けた情報を含む。
正確情報と共有情報とが矛盾することは、共有情報が不正確であることを意味する。共有情報が正確情報と相違することは、共有情報が不正確である可能性があることを意味する。共有情報に注意すべき箇所が存在することは、共有情報の文脈が正確情報と異なることを意味する。
また、本実施形態の差異情報には、共有情報において、正確情報と矛盾すると判定された箇所、相違があると判定された箇所、注意すべき箇所を示す情報が含まれても良い。また、本実施形態の差異情報には、共有情報と比較された正確情報が含まれても良い。
本実施形態では、これらの判定処理を行って差異情報を得ることを、正確情報と共有情報との差異の有無を判定する、と表現する場合がある。
本実施形態の差異抽出処理部250は、図8に示す処理を、第一共起関係記憶部210と第二共起関係記憶部220に格納された全ての第二共起テーブルと第二共起テーブルについて実行しても良い。
次に、図9を参照して、第一の差異判定処理について説明する。図9は、第一の差異判定処理を説明するフローチャートである。図9に示す処理は、図8のステップS801の処理の詳細を示している。尚、図9の処理は、第一共起テーブルの第一レコードと第二共起テーブルの第一レコードと、を用いて行う。
本実施形態の差異判定部254は、第一共起テーブルと第二共起テーブルを参照し、第二共起テーブルにおいて、第一共起テーブルに含まれる共起名詞以外の共起名詞が存在するか否かを判定する(ステップS901)。つまり、ここでは、共有情報が、正確情報とは異なる共起関係(第二の差異)を有するか否かを判定している。
ステップS901において、該当する共起名詞が存在する場合、差異判定部254は、共有情報と正確情報とに相違あることを示す情報を差異記憶部230に保持させて(ステップS902)、図8のステップS802へ進む。
具体的には、差異記憶部230には、共有情報を特定する情報と、参照された正確情報を特定する情報と、共有情報と正確情報とに相違があることを示す情報とが対応付けられて、保持される。共有情報を特定する情報、正確情報を特定する情報は、それぞれの情報を示すファイル名等であって良い。
ステップS901において、該当する共起名詞が存在しない場合、差異判定部254は、第一共起テーブルと第二共起テーブルとに、同じ主語が存在するか否かを判定する(ステップS903)。ステップS903以降の処理は、共有情報と正確情報とに矛盾があるか否かを判定する処理である。言い換えれば、ステップS903以降の処理は、第一の差異の有無を判定する処理である。
ステップS903において、同じ主語が存在しない場合、差異判定部254は、ステップS902へ進む。
ステップS903において、同じ主語が存在する場合、差異判定部254は、第二共起テーブルの第一レコードにおいて、主語と対応する共起名詞の数をxとし、共起動詞の数をyとする(ステップS904)。また、差異判定部254は、変数z=z′=1とする(ステップS905)。
続いて、差異判定部254は、xが0より大きい場合、つまり、ステップS907以降の処理を行っていない共起名詞が存在するか否かを判定する(ステップS906)。ステップS906において、処理を行っていない共起名詞が存在する場合、差異判定部254は、第二共起テーブルにおける主語とz番目の共起名詞の共起関係を評価する(ステップS907)。
具体的には、差異判定部254は、第二共起テーブルにおけるz番目の共起名詞が、第一共起テーブルにおいて主語と共起していることを照合している。
続いて、差異判定部254は、yが0より大きい場合、つまり、ステップS909以降の処理を行っていない共起動詞が存在するか否かを判定する(ステップS908)。
ステップS908において、該当する共起動詞が存在しない場合、差異判定部254は、後述するステップS914へ進む。
ステップS908において、該当する共起動詞が存在する場合、差異判定部254は、第二共起テーブルにおけるz′番目の共起動詞と、第一共起テーブルに含まれる共起動詞とを比較する(ステップS909)。
続いて、差異判定部254は、両者が矛盾した内容を示すか否かを判定する(ステップS910)。ステップS910において、共起動詞の内容が矛盾する場合、共有情報に矛盾があることを示す情報を差異記憶部230に保持させて(ステップS911)、図8のステップS802へ進む。
ここでは、差異記憶部230には、共有情報を特定する情報と、参照された正確情報を特定する情報と、共有情報と正確情報とに矛盾があることを示す情報とが対応付けられて、保持される。
ステップS910において、両者が矛盾していない場合、差異判定部254は、第一のレコードに含まれる共起動詞全てについて処理したか否かを判定する(ステップS912)。
ステップS912において、処理していない共起動詞が存在する場合、差異判定部254は、z′の値に1を追加し(ステップS913)、ステップS909へ戻る。
ステップS912において、共起動詞全てについて処理した場合、差異判定部254は、全ての共起名詞について処理を行ったか否かを判定する(ステップS914)。ステップS914において、全ての共起名詞に処理を行っていない場合、差異判定部254は、zの値に1を追加し(ステップS915)、ステップS907へ戻る。
ステップS914において、全ての共起名詞に処理を行っていない場合、差異判定部254は、zの値に1を追加し(ステップS915)、ステップS907へ戻る。
ステップS914において、全ての共起名詞に処理を行った場合、差異判定部254は、共起関係の距離を差異記憶部230に保持させて(ステップS916)、図8のステップS802へ進む。
具体的には、差異判定部254は、共有情報について、単語/単語群と、各共起名詞との距離、単語/単語群と、各共起動詞との距離を求め、共有情報を特定する情報と対応付けて差異記憶部230に格納する。
また、差異判定部254は、参照された正確情報について、単語/単語群と、各共起名詞との距離、単語/単語群と、各共起動詞との距離を求め、共有情報を特定する情報と対応付けて差異記憶部230に格納する。
したがって、差異記憶部230には、共有情報を特定する情報と、参照された正確情報を特定する情報と、判定結果を示す情報とが対応付けられた差異情報が格納される。
また、差異記憶部230には、判定の対象とされた共有情報を特定する情報と、共有情報における単語と各共起名詞との距離、単語と共起動詞との距離とを対応付けた情報が格納される。また、差異記憶部230には、判定の差異に参照された正確情報を特定する情報と、正確情報における単語と各共起名詞との距離、単語と共起動詞との距離とを対応付けた情報が格納される。
以下に、図10及び図11を参照して、図8の処理について具体的に説明する。図10は、第一の差異判定処理について説明する第一の図である。
図10では、正確情報1に基づき作成された第一共起テーブル211と、共有情報1に基づき作成された第二共起テーブル221とから、正確情報1と共有情報1との相違の有無を判定する例について説明する。
第一共起テーブル211の第一レコード211−1の共起名詞は、「チャットボット」、「連携」である。また、第二共起テーブル221の第一レコード211−1の共起名詞は、「チャットボット」、「開発」、「連携」である。
したがって、第二共起テーブル221には、第一共起テーブル211に含まれない共起名詞が存在する。このため、差異判定部254は、正確情報1と共有情報1には相違があることを示す情報を保持させて、図8のステップS802へ戻る。
図11は、第一の差異判定処理について説明する第二の図である。
図11では、正確情報2に基づき作成された第一共起テーブル212と、共有情報2に基づき作成された第二共起テーブル222とから、正確情報2と共有情報2との矛盾の有無を判定する例について説明する。
第二共起テーブル222の第一レコード222−1の共起名詞は「開発」であり、この共起名詞は、第一共起テーブル212の第一レコード212−1の共起名詞に含まれる。また、第一レコード212−1の主語と、第一レコード222−1の主語は、「人工知能ソフト」であり、一致している。
したがって、差異判定部254は、図9のステップS905以降の処理において、第一レコード212−1と第一レコード222−1の共起動詞の内容に矛盾が存在するか否かを判定する。
図11の例では、第一レコード212−1の共起動詞は「進められている」であり、第一レコード222−1の共起動詞は「進められていない」であり、両者の内容は矛盾している。
したがって、差異判定部254は、正確情報2と共有情報2とが矛盾することを示す情報を差異記憶部230に保持させて、図8のステップS802へ戻る。
具体的には、差異判定部254は、正確情報2と共有情報2とが矛盾することを示す情報と、正確情報2を特定する情報と、共有情報2を特定する情報と、共有情報4と正確情報5とにおいて、共起関係が矛盾する箇所を示す情報と、を差異情報とする。
図11の例では、共有情報4と正確情報5とにおいて共起関係が矛盾する箇所とは、差異判定部254によって、共有情報4と正確情報5から抽出された箇所を示す。また、共有情報4と正確情報5とにおいて共起関係が矛盾する箇所を示す情報は、正確情報5側の「人工知能ソフト」、「開発」、「進められている」と、共有情報4側の「人工知能ソフト」、「開発」、「進められていない」と、を対応付けた情報となる。
次に、第二の差異判定処理を説明する図である。を参照して、第二の差異判定処理について説明する。図12は、第二の差異判定処理を説明するフローチャートである。図12では、図8のステップS803の処理の詳細を示している。
本実施形態の差異判定部254は、第二共起テーブルの第二レコード以降のレコード数をrとする(ステップS1201)。言い換えれば、差異判定部254は、ステップS1201では、第二共起テーブルの単語/単語群欄に格納された、主語と共起名詞との組み合わせの単語群数をrとする。
続いて、差異判定部254は、変数u=u′=u″=1とする(ステップS1202)。
続いて、差異判定部254は、第二共起テーブルにおいて、単語群を含むレコードから、u番目の単語群を含むu番目のレコードを取得する(ステップS1203)。言い換えれば、差異判定部254は、第二共起テーブルの第二レコード以降のレコードから、u番目のレコードを取得する。
続いて、差異判定部254は、第一共起テーブルと、ステップS1203で取得したu番目のレコードと、に共通する共起名詞の数をvとし、共通する共起動詞の数をwとする(ステップS1204)。
続いて、差異判定部254は、ステップS1203で取得したu番目のレコードに、単語群と共起する共起名詞が存在するか否かを判定する(ステップS1205)。
ステップS1205において、該当する共起名詞が存在しない場合、差異判定部254は、後述するステップS1210へ進む。
ステップS1205において、該当する共起名詞が存在する場合、差異判定部254は、vが整数であるか否かを判定する(ステップS1206)。つまり、差異判定部254は、ステップS1203で取得したレコードに含まれる共起名詞が、第一共起テーブルの共起名詞にも含まれるか否かを判定している。
ステップS1206において、vが0の場合、つまり、第一共起テーブルにステップS1203で取得したレコードと共通する共起名詞が存在しない場合、差異判定部254は、第一共起テーブルの元となる正確情報と、第二共起テーブルの元となる共有情報との相違があることを示す情報を差異記憶部230に保持させて(ステップS1207)、図8のステップS804へ進む。
ステップS1206において、vが0より大きい場合、つまり、第一共起テーブルにステップS1203で取得したレコードと共通する共起名詞が存在する場合、差異判定部254は、第一共起テーブルを参照して、ステップS1203で取得したレコードに含まれるu′番目の共起名詞の共起関係について評価する(ステップS1208)。
具体的には、差異判定部254は、第二共起テーブルのu番目のレコードに含まれる単語群(u番目の単語群)と対応するu′番目の共起名詞が、第一共起テーブルにおいても、同じ単語群と共起しているか否かを照合している。
続いて、差異判定部254は、評価の結果、第一共起テーブルに、u番目の単語群とu′番目の共起名詞とが共起関係にあるレコードが存在したか否かを判定する(ステップS1209)。ステップS1209において、該当するレコードが存在しない場合、差異判定部254は、ステップS1207へ進む。
ステップS1209において、該当するレコードが存在する場合、差異判定部254は、wが整数であるか否かを判定する(ステップS1210)。つまり、差異判定部254は、ステップS1203で取得したレコードに含まれる共起動詞が、第一共起テーブルの共起動詞にも含まれるか否かを判定している。
ステップS1210において、wが0である場合、差異判定部254は、後述するステップS1215へ進む。
ステップS1210において、wが整数である場合、差異判定部254は、ステップS1203で取得したレコードの共起動詞のうち、第一共起テーブルを参照して、u″番目の共起動詞の共起関係について評価する(ステップS1211)。
具体的には、差異判定部254は、ステップS1203で取得したレコードに含まれる単語群と対応するu″番目の共起動詞が、第一共起テーブルにおいても、同様の単語群と共起しているか否かを照合している。
続いて、差異判定部254は、評価の結果、第一共起テーブルに、u番目の単語群とu″番目の共起動詞とが共起関係にあるレコードが存在するか否かを判定する(ステップS1212)。ステップS1212において、該当するレコードが存在しない場合、差異判定部254は、ステップS1207へ進む。
ステップS1212において、該当するレコードが存在する場合、差異判定部254は、wの値がu″の値より大きいか否かを判定する(ステップS1213)。つまり、差異判定部254は、ステップS1203で取得したu番目のレコードに含まれる全て共起動詞について、ステップS1212までの処理を行ったか否かを判定している。
ステップS1213において、wの値がu″の値より大きい場合、差異判定部254は、u″の値に1を足して(ステップS1214)、ステップS1211へ戻る。
ステップS1213において、w=u″である場合、差異判定部254は、vの値がu′の値より大きいか否かを判定する(ステップS1215)。つまり、差異判定部254は、ステップS1203で取得したu番目のレコードに含まれる全て共起名詞について、ステップS1214までの処理を行ったか否かを判定している。
ステップS1215において、vの値がu′の値より大きい場合、差異判定部254は、u′の値に1を足して(ステップS1216)、ステップS1208へ戻る。
ステップS1215において、v=u′である場合、差異判定部254は、rの値がuの値より大きいか否かを判定する(ステップS1217)。つまり、差異判定部254は、第二共起テーブルにおける第二レコード以降の全てのレコードについて、ステップS1216までの処理を実行したか否かを判定している。
ステップS1217において、rの値がuの値より大きい場合、差異判定部254は、uの値に1を足して(ステップS1218)、ステップS1203へ戻る。
ステップS1217において、r=uである場合、差異判定部254は、単語群と共起名詞、共起動詞のそれぞれに対する距離を差異記憶部230に格納し(ステップS1219)、図8のステップS804へ進む。
具体的には、差異記憶部230には、共有情報を特定する情報と、共有情報における各単語群と各共起名詞との距離、各単語群と共起動詞との距離とを対応付けた情報が格納される。また、差異記憶部230には、参照された正確情報を特定する情報と、正確情報における各単語群と各共起名詞との距離、各単語群と共起動詞との距離とを対応付けた情報が格納される。
以下の説明では、差異記憶部230に格納された、共有情報と正確情報のそれぞれを特定する情報と、単語/単語群と共起名詞、共起動詞との距離とを対応付けた情報を、距離情報と呼ぶ。
以下に、図13を参照して、第二の差異判定処理について、具体的に説明する。図13は、第二の差異判定処理を説明する図である。
図13の例では、正確情報3に基づき作成された第一共起テーブル213と、正確情報4に基づき作成された第一共起テーブル214と、共有情報3に基づき作成された第二共起テーブル223を用いて、第二の差異判定処理について説明する。
第二共起テーブル223では、第一レコード223−1に含まれる単語「人工知能ソフト」の共起名詞「チャットボット」、「開発」、「連携」と、共起動詞「進められている」とが、正確情報3、4に存在する。したがって、共有情報3は、第一の差異判定処理において、正確情報3、4との矛盾も相違もないものと判定され、第二の差異判定処理が行われる。
第二共起テーブル223の第二レコード223−2では、単語群「人工知能ソフト・チャットボット」と、共起名詞「開発」、「連携」とが共起している。
このうち、第一共起テーブル214の第二レコード214−2では、単語群「人工知能ソフト・チャットボット」と、共起名詞「連携」とが共起している。したがって、単語群「人工知能ソフト・チャットボット」と、共起名詞「連携」との共起関係は、正確情報4に存在する。
しかし、単語群「人工知能ソフト・チャットボット」と、共起名詞「開発」との共起関係は、正確情報3、4に存在しない。したがって、差異判定部254は、共有情報3は、正確情報3、4と相違があるものと判定される。
よって、差異判定部254は、共有情報3を特定する情報と、正確情報3、4を特定する情報と、共有情報3は、正確情報3、4と相違があることを示す情報と、相違がある共起関係を示す情報である「人工知能ソフト・チャットボット」と「開発」とを含む差異情報を差異記憶部230へ保持させる。
次に、図14、図15を参照して、第三の差異判定処理について説明する。図14は、第三の差異判定処理を説明する第一のフローチャートである。
本実施形態の差異判定部254は、第二共起テーブルの第一レコードを取得し、第一レコードに含まれる共起関係の数をKの値とする(ステップS1401)。第一レコードに含まれる共起関係の数とは、ここでは、第一レコードに含まれる共起名詞の数である。続いて、差異判定部254は、変数k=k′=1とする(ステップS1402)。
続いて、差異判定部254は、第一レコードのk個目の共起関係の距離dと、第一共起テーブルにおいて、第一レコードのk個目の共起関係と同じ共起関係の距離Dとを比較する(ステップS1403)。
つまり、差異判定部254は、第一レコードにおいて、主語となる単語と、k番目に格納された共起名詞との距離dを取得する。この場合、距離dは、kとなる。また、差異判定部254は、参照した正確情報と対応する第一共起テーブルから、第二共起テーブルの第一レコードにおいて主語とされた単語と、k番目の共起名詞と一致する単語とが共起関係にあるレコードを特定する。そして、差異判定部254は、特定されたレコードにおける単語間の距離Dを取得する。
続いて、差異判定部254は、距離dと距離Dの関係が、第一の条件を満たすか否かを判定する(ステップS1404)。第一の条件とは、距離Dの最小値<距離d<距離Dの最大値である。
ステップS1404において、第一の条件を満たしていない場合、差異判定部254は、この共有情報について、注意すべき箇所があることを示す情報を差異記憶部230に保持させて(ステップS1405)、後述するステップS1409へ進む。
つまり、ここでは、差異判定部254は、共有情報を特定する情報と、参照された正確情報を特定する情報と、注意すべき箇所が存在することを示す情報と、を差異情報として差異記憶部230に保持させる。
ステップS1404において、第一の条件を満たす場合、差異判定部254は、ステップS1403で参照された第一共起テーブルの元となる正確情報において、k個目の単語と一致する単語を修飾する修飾成分が存在するか否かを判定する(ステップS1406)。
ステップS1406において、該当する修飾成分が存在しない場合、差異判定部254は、後述するステップS1409へ進む。
ステップS1406において、該当する修飾成分が存在する場合、差異判定部254は、該当する修飾成分を分析する(ステップS1407)。具体的には、差異判定部254は、例えば、情報処理装置200の外部等に存在する同義語データベース等を参照し、修飾成分と同義の単語等を抽出しておく。
続いて、差異判定部254は、修飾成分が、共有情報におけるk個目の単語の修飾成分と同様であるか否かを判定する(ステップS1408)。言い換えれば、差異判定部254は、共有情報におけるk個目の単語の修飾成分の意味が、正確情報における修飾成分と同義であるか否かを判定する。
ステップS1408において、修飾成分が同様でない場合、差異判定部254は、ステップS1405へ進む。
ステップS1408において、修飾成分が同様である場合、差異判定部254は、K>kであるか否かを判定する(ステップS1409)。つまり、差異判定部254は、第二共起テーブルの第一レコードに含まれる全ての共起名詞について、ステップS1408までの処理を行ったか否かを判定している。
ステップS1409において、K>kである場合、差異判定部254は、kの値に1を追加し(ステップS1410)、ステップS1403に戻る。
ステップS1409において、K=kである場合、差異判定部254は、後述する図15のステップS1501へ進む。
図15は、第三の差異判定処理を説明する第二のフローチャートである。本実施形態の差異判定部254は、第二共起テーブルから、主語と共起名詞との組み合わせた単語群数rを読み込み、変数r′=1とする(ステップS1501)。主語と共起名詞との組み合わせた単語群数rとは、第二共起テーブルの第二レコード以降のレコード数である。
続いて、差異判定部254は、第二共起テーブルのr′行目のレコードRaを取得する(ステップS1502)。
続いて、差異判定部254は、第一共起テーブルにおいて、レコードRaに含まれる単語群と一致する単語群、又は単語群に含まれる単語と一致する単語と、共起名詞Mkと一致する単語Mk′とが共起関係を有するレコードRbを取得する(ステップS1503)。
続いて、差異判定部254は、レコードRaにおける単語群単語群と共起名詞Mkとの距離d1と、レコードRaにおける単語群に含まれる各単語と共起名詞Mkとの距離d2、d3と、を取得する。また、差異判定部254は、レコードRbにおける単語群と単語Mk′との距離D1と、単語群に含まれる各単語と単語Mk′との距離D2、D3と、とを取得する(ステップS1504)。
以下に、ステップS1504の処理について説明する。
レコードRaは、2つの単語g1,g2を含む単語群と、k個目の共起名詞Mkとが含まれ、レコードRbには、単語g1,g2を含む単語群と、共起名詞Mkと一致する単語Mk′とが含まれるものとする。
差異判定部254は、レコードRaにおいて、単語g1と共起名詞Mkとの距離をd2とし、単語g2と共起名詞Mkとの距離をd3とする。そして、差異判定部254は、距離d2と距離d3とを加算した値を距離d1とする。
また、差異判定部254は、レコードRbにおいて、単語g1と単語Mk′との距離をD2とし、単語g2と単語Mk′との距離をD3とする。そして、差異判定部254は、距離D2と距離D3とを加算した値を距離D1とする。
ステップS1504に続いて、差異判定部254は、距離d2と距離D2との関係と、距離d3と距離D3との関係が、第二の条件を満たすか否かを判定する(ステップS1505)。
第二の条件とは、距離D2の最小値<距離d2<距離D2の最大値、且つ、距離D3の最小値<距離d3<距離D3の最大値である。
ステップS1505において、第二の条件が満たされない場合、差異判定部254は、後述するステップS1509へ進む。
ステップS1505において、第二の条件を満たす場合、差異判定部254は、距離d1と距離D1との関係が第三の条件を満たすか否かを判定する(ステップS1506)。
第三の条件とは、距離D1の最小値<距離d1<距離D1の最大値である。
ステップS1506において、第三の条件を満たす場合、差異判定部254は、第一共起テーブルの元となる正確情報において、単語Mk′を修飾する修飾成分を分析する(ステップS1507)。
続いて、差異判定部254は、単語Mk′を修飾する修飾成分が、共有情報における共起名詞Mkの修飾成分と同様であるか否かを判定する(ステップS1508)。
ステップS1508において、修飾成分が同様でない場合、差異判定部254は、この共有情報について、注意すべき箇所があることを示す情報を差異記憶部230に保持させて(ステップS1509)、後述するステップS1510へ進む。
ステップS1508において、修飾成分が同様である場合、差異判定部254は、K>k′であるか否かを判定する(ステップS1509)。つまり、差異判定部254は、第二共起テーブルのr′番目のレコードに含まれる全ての共起名詞について、ステップS1508までの処理を行ったか否かを判定している。
ステップS1510において、K>k′である場合、差異判定部254は、k′の値に1を追加し(ステップS1511)、ステップS1503に戻る。
ステップS1510において、K=k′である場合、差異判定部254は、r>r′であるか否かを判定する(ステップS1512)。つまり、差異判定部254は、第二共起テーブルの第二レコード以降の全てのレコードについて、ステップS1511までの処理を実行したか否かを判定している。
ステップS1512において、r>r′である場合、差異判定部254は、r′の値に1を追加し(ステップS1513)、ステップS1502に戻る。
ステップS1513において、r=r′である場合、差異判定部254は、処理を終了する。
以下に、図16乃至図22を参照して、第三の差異判定処理について具体的に説明する。図16は、第三の差異判定処理を説明する第一の図である。
図16の例では、ステップS1401において、共有情報4に基づき作成された第二共起テーブル224が取得されたものとする。
この場合、差異判定部254は、第二共起テーブル224の第一レコード224−1に含まれる共起関係の数をKとする。つまり、差異判定部254は、第一レコード224−1に含まれる共起名詞の数をKとする。図16の例では、第一レコード224−1に含まれる共起名詞の数は1であるため、K=1となる。また、第一レコード224−1において、主語「人工知能ソフト」と、共起名詞「開発」とが共起関係にある。
よって、差異判定部254は、主語「人工知能ソフト」と共起名詞「開発」とが共起関係にある正確情報を特定する。
図16の例では、主語「人工知能ソフト」と共起名詞「開発」が共起関係にある正確情報として、正確情報5が特定された場合を示す。図16に示す第一共起テーブル215は、正確情報5に基づき作成されたものある。
差異判定部254は、第一レコード224−1における主語「人工知能ソフト」と、共起名詞「開発」との距離d1を求める。共起名詞「開発」は、第二共起テーブル224に1番目に格納される共起名詞である。したがって、共有情報4における主語「人工知能ソフト」と、共起名詞「開発」との距離d=1となる。
また、第一共起テーブル215においても、共起名詞「開発」は、1番目に格納される共起名詞である。したがって、正確情報5における主語「人工知能ソフト」と、共起名詞「開発」との距離D=1となる。
このとき、距離d=距離Dであるため、距離dは、距離Dの最大値以下であり最小値以上である。よって、距離dと距離Dとの関係は第一の条件を満たす。
続いて、差異判定部254は、正確情報5において、共起名詞「開発」を修飾する修飾成分があるか否かを判定する。
図17は、第三の差異判定処理を説明する第二の図である。図17に示すように、正確情報5において、共起名詞「開発」は、「チャットボットとの連携の」によって修飾されており、修飾成分を有する。尚、図17において、単語の付された下線の近傍に示す数字は、主語からその単語までの距離を示す。
これに対し、共有情報4には、修飾成分が存在しない。
この場合、共有情報4における「開発」は、正確情報5における「開発」よりも広義な文言として使用されており、共有情報4における「開発」と、正確情報5における「開発」とでは、意味が異なる可能性がある。
したがって、差異判定部254は、共有情報4を特定する情報と、正確情報5を特定する情報と、注意すべき箇所が存在することを示す情報と、注意すべき箇所を示す情報とを、対応付けて差異情報とし、差異記憶部230に保持させる。
図17の例では、注意すべき箇所とは、差異判定部254によって共有情報4から抽出された箇所と、正確情報5かに抽出された箇所とを示す。また、注意すべき箇所を示す情報は、正確情報5側の「チャットボットとの連携の開発」と、共有情報4側の「開発」とが対応付けられた情報となる。
図18は、第三の差異判定処理を説明する第三の図である。図18の例では、主語「人工知能ソフト」と共起名詞「開発」との共起関係を有する正確情報6が特定された場合を示している。第一共起テーブル216は、正確情報6に基づいて作成された第一共起テーブルである。
第一共起テーブル216では、レコード216−1において、主語「人工知能ソフト」と、共起名詞「開発」とが共起関係にある。
レコード216−1において、共起名詞「開発」は、3番目に第一共起テーブル216に格納される単語であるため、主語「人工知能ソフト」と、共起名詞「開発」との距離Dは「3」となる。
図19は、第三の差異判定処理を説明する第四の図である。図19において、正確情報6と共有情報4のそれぞれに含まれる単語に付された下線の近傍に示す数字は、主語からその単語までの距離を示す。
共有情報4における主語「人工知能ソフト」と、共起名詞「開発」との距離dは1である。また、正確情報6における主語「人工知能ソフト」と、共起名詞「開発」との距離Dは3である。
正確情報6では、距離Dの値は1つのみであるため、距離Dの値「3」が距離Dの最小値又は最大値となり得る。したがって、距離dと距離Dとの関係は、距離Dの最小値<距離d<距離Dの最大値である第一の条件を満たさない。
よって、差異判定部254は、注意すべき箇所が存在することを示す情報を、共有情報4を特定する情報と、正確情報6を特定する情報と対応付けた差異情報とし、差異記憶部230に保持させる。
図20は、第三の差異判定処理を説明する第五の図である。
図20の例では、共有情報5に含まれる単語間の共起関係と一致する共起関係を含む正確情報として、正確情報5と正確情報7が特定された場合を示している。
図20に示す第一共起テーブル215は、正確情報5に基づき作成されたものであり、第一共起テーブル217は、正確情報7に基づき作成されたものであり、第二共起テーブル225は、共有情報5に基づき作成されたものである。
図21は、第三の差異判定処理を説明する第六の図である。図21では、第二共起テーブル225の第一レコード225−1を、第一共起テーブル215の第一レコード215−1、第一共起テーブル217の第一レコード217−1と比較する場合を示している。
第一レコード225−1において、共有情報5の主語「人工知能ソフト」と、共起名詞「チャットボット」との距離dは1であり、共起名詞「連携」との距離dは2であり、共起名詞「開発」との距離dは3である。
また、第一レコード215−1において、正確情報5の主語「人工知能ソフト」と、共起名詞「チャットボット」との距離Dは1であり、共起名詞「連携」との距離Dは2である。
また、第一レコード217−1において、正確情報7の主語「人工知能ソフト」と、共起名詞「チャットボット」との距離Dは2であり、共起名詞「連携」との距離Dは1であり、共起名詞「開発」との距離Dは3である。
したがって、共有情報4との比較対象とされる正確情報5、7において、主語「人工知能ソフト」と、共起名詞「チャットボット」の距離Dの最大値は2であり、最小値は1である。したがって、共有情報4の距離dは、距離Dの最小値<距離d<距離Dの最大値であり、距離Dとの関係は第一の条件を満たす。
また、正確情報5、7において、共起名詞「チャットボット」の修飾成分は存在しない。したがって、差異判定部254は、共有情報4について注意すべき箇所を抽出しない。
また、共有情報4における主語「人工知能ソフト」と、共起名詞「連携」との距離dは2であり、正確情報5における距離Dは2であり、正確情報7における距離Dは1である。
したがって、距離Dの最小値が1、最大値が2となり、距離dと距離Dとの関係は、第一の条件を満たす。また、正確情報5、7において、共起名詞「連携」の修飾成分は存在しない。したがって、差異判定部254は、共有情報4について注意すべき箇所を抽出しない。
共有情報4における主語「人工知能ソフト」と共起名詞「開発」との共起関係と、正確情報5、7における主語「人工知能ソフト」と共起名詞「開発」との共起関係においても同様に、共有情報4について注意すべき箇所は抽出されない。
図22は、第三の差異判定処理を説明する第七の図である。図22では、第二共起テーブル225の第二レコード以降と、第一共起テーブル215と第一共起テーブル217のそれぞれの第二レコード以降とを比較する場合を示している。
第二共起テーブル225の第二レコード225−2では、主語となる単語群に含まれる単語g1,g2は、「人工知能ソフト」と「チャットボット」であり、単語群の共起名詞Mkは「開発」、「連携」となる。
よって、差異判定部254は、単語群「人工知能ソフト/チャットボット」と、1つめの共起名詞Mkである「連携」との共起関係について、正確情報5、7と比較する。
第二レコード225−2において、単語g1と1つ目の共起名詞Mkである「連携」との距離d2は2であり、単語g2と1つ目の共起名詞Mkである「連携」との距離d3は1となる。したがって、単語群「人工知能ソフト」、「チャットボット」と、共起名詞「連携」との距離d1は、距離d2と距離d3とを合計した値3となる。
また、正確情報5において、単語g1である「人工知能ソフト」と、単語Mk′である「連携」との距離D2は2であり、正確情報7において、単語g1である「人工知能ソフト」と、単語Mk′である「連携」との距離D2は1である。よって、距離D2の最大値は2、最小値は1であり、距離d2は、距離D2の最大値となる。
また、正確情報5において、単語g2である「チャットボット」と、単語Mk′である「連携」との距離D3は1であり、正確情報7において、単語g2である「チャットボット」と、単語Mk′である「連携」との距離D3も1である。よって、距離D3の最大値と最小値は共に1であり、距離d3=距離D3となる。
したがって、距離d2は、距離D2の最小値<距離d2<距離D2の最大値であり、且つ、距離d3は、距離D3の最小値<距離d3<距離D3の最大値であり、第二の条件を満たす。
また、距離D1の最大値は、距離D2の最大値2と距離D3の最大値1との合計値3であり、距離D1の最小値は、距離D2の最小値1と距離D3の最小値1との合計値2である。
したがって、距離d1=距離D3の最大値となり、距離d1と距離D1との関係は、距離D1の最小値<距離d1<距離D1の最大値である第三の条件を満たす。
また、正確情報5、7に、単語Mk′である「連携」の修飾成分は存在しない。したがって、この場合、差異判定部254は、共有情報4について注意すべき箇所を抽出しない。
次に、差異判定部254は、単語群「人工知能ソフト/チャットボット」と、2つめの共起名詞Mkである「開発」との共起関係について、正確情報5、7と比較する。
第二レコード225−2において、単語g1と2つ目の共起名詞Mkである「開発」との距離d2は3であり、単語g2と2つ目の共起名詞Mkである「開発」との距離d3は2となる。
また、正確情報5において、単語Mk′である「開発」は存在しない。また、正確情報7において、単語g1と単語Mk′である「開発」との距離D2は3である。したがって、距離D2の最小値=最大値=3となる。
このため、距離d2=距離D2=3となり、距離d2と距離D2との関係は、距離D2の最小値<距離d2<距離D2の最大値となる。
また、正確情報5において、単語Mk′である「開発」は存在しない。また、正確情報7において、単語g2と単語Mk′である「開発」との距離D3は1である。したがって、距離D3の最小値=最大値=1となる。
このため、距離d3>距離D3の最大値となり、距離d2と距離D2との関係は、距離D3の最小値<距離d3<距離D3の最大値を満たさない。
したがって、距離d2と距離D2の関係と、距離d3と距離D3の関係とは、第二の条件を満たさない。
よって、差異判定部254は、共有情報4を特定する情報と、正確情報5、7のそれぞれを特定する情報と、注意すべき箇所が存在することを示す情報と、注意すべき共起関係を示す情報と、を対応付けて差異情報とし、差異記憶部230に保持させる。
図22の例では、注意すべき共起関係を示す情報は、正確情報7側の「人工知能ソフト/チャットボット」、「開発」と、共有情報4側の「人工知能ソフト/チャットボット」、開発とを対応付けた情報となる。
このように、本実施形態では、正確情報に含まれる単語間の共起関係と、共有情報に含まれる単語間の共起関係とを算しようすることで、文の組み立てが合理的か否かを判定することができ、文脈に基づいて文書情報が示す内容の正誤の判定が可能となる。
次に、本実施形態の情報処理装置200における評価結果記憶部235と、共有情報管理部260の処理について説明する。
図23は、評価結果記憶部の一例を示す図である。本実施形態の評価結果記憶部235は、共有情報管理部260の集計部261によって、差異記憶部230に格納された差異情報が集計された結果である評価結果情報が格納される。
本実施形態の評価結果情報は、差異判定部254による判定の結果を示す判定結果情報と、差異の属性を示す属性情報と、共有情報に関連する関連情報を含む。
本実施形態の評価結果情報は、情報の項目として、ID、正確情報、共有情報、判定結果、カテゴリ、抽出回数、共起回数、ファイル名、作成者、管理者等を含み、項目「ID」とその他の項目とが対応付けられている。
項目「ID」の値は、評価結果情報を識別するための識別情報である。項目「正確情報」の値は、差異判定部254によって正確情報から抽出された箇所を示す。したがって、項目「正確情報」の値は、正確情報記憶部205に格納された正確情報の一部である。尚、正確情報から抽出された箇所は、抽出元となる正確情報を特定する情報と対応付けられていても良い。
項目「共有情報」の値は、差異判定部254によって共有情報から抽出された箇所を示す。したがって、項目「共有情報」の値は、共有情報記憶部206に格納された共有情報の一部である。尚、共有情報から抽出された箇所は、抽出元となる共有情報を特定する情報と対応付けられていても良い。
項目「判定結果」の値は、差異情報に含まれる情報であり、正確情報と共有情報とに矛盾があること、正確情報と共有情報とに相違があること、共有情報に注意すべき箇所があること、の何れかを示す情報となる。言い換えれば、項目「判定結果」の値は、共有情報と正確情報との間にある第一の差異、第二の差異、第三の差異の何れかを示す。
項目「カテゴリ」の値は、評価結果情報が新たに評価結果記憶部235に格納された新規の情報であるか、又は、既に評価結果記憶部235に格納されていた評価結果情報が更新されたのかを示す。
具体的には、項目「カテゴリ」の値が「新規」である場合、この評価結果情報は新たに評価結果記憶部235に格納されたことを示す。また、項目「カテゴリ」の値が「既存」である場合、この評価結果情報が、既に評価結果記憶部235に格納されていた評価結果情報を更新した情報であることを示す。
項目「抽出回数」の値は、対応する共有情報について、差異情報が差異記憶部230に格納された回数を示す。言い換えれば、項目「抽出回数」の値は、対応する共有情報から、正確情報と相違する箇所が抽出された回数を示す。
項目「共起回数」の値は、対応する共有情報において、差異情報として抽出された共起関係が出現する回数を示す。項目「ファイル名」の値は、共有情報を特定する情報を示す。項目「作成者」の値は、共有情報を作成した作成者を特定する情報を示す。項目「管理者」の値は、共有情報を管理する管理者を特定する情報を示す。共有情報を管理する管理者とは、例えば、評価結果情報に基づき、共有情報の正誤を確認する役割を担う人物であっても良い。
本実施形態では、項目「正確情報」、「共有情報」、「判定結果」の値が判定結果情報235−1に含まれ、項目「カテゴリ」、「抽出回数」、「共起回数」の値が属性情報235−2に含まれ、項目「ファイル名」、「作成者」、「管理者」の値が関連情報235−3に含まれるものとした。
本実施形態の共有情報管理部260は、例えば、図8に示す処理が実行される度に、集計部261によって差異記憶部230に格納された差異情報を集計し、更新部263によって評価結果記憶部235に格納された評価結果情報を更新しても良い。
以下に、集計部261の処理について説明する。
本実施形態の集計部261は、例えば、差異情報から、差異判定部254によって抽出された正確情報の一部と共有情報の一部とを取得し、判定結果を示す情報を対応付けて、判定結果情報235−1とする。
また、集計部261は、差異記憶部230において、評価結果記憶部235に、判定結果情報235−1を含む評価結果情報が存在するか否かを判定する。そして、集計部261は、該当する評価結果情報が存在しない場合には、項目「カテゴリ」の値を新規とする。
また、集計部261は、判定結果情報235−1を含む評価結果情報が存在する場合、項目「カテゴリ」の値を既存とする。
また、集計部261は、差異情報に含まれる、共有情報を特定する情報から、差異記憶部230に格納された差異情報における共有情報の出現回数を集計し、項目「抽出回数」の値とする。
また、集計部261は、共有情報において、判定結果情報235−1に含まれる共有情報の一部が示す共起関係の出現回数を集計し、項目「共起回数」の値とする。そして、集計部261は、項目「カテゴリ」の値と、項目「抽出回数」の値と、項目「共起回数」の値と、を対応付けて、差異の属性を示す属性情報235−2とする。
また、集計部261は、共有情報のファイル名、作成者、管理者を取得して、共有情報の関連情報235−3とする。
また、本実施形態の集計部261は、項目「カテゴリ」の値が新規であった場合は、判定結果情報235−1と、属性情報235−2と、関連情報235−3とを対応付けて評価結果情報とし、新たなIDを付与して評価結果記憶部235に格納する。
また、本実施形態の集計部261は、項目「カテゴリ」の値が既存であった場合は、評価結果記憶部235に格納された該当する評価結果情報のうち、属性情報235−2の項目「抽出回数」の値と、項目「共起回数」の値と、を更新すれば良い。
本実施形態の共有情報管理部260は、表示部262によって、評価結果記憶部235に格納された情報を端末装置300、端末装置400に表示させる。また、共有情報管理部260は、更新部263により、端末装置300、400からの入力に応じて、共有情報データベース500と評価結果記憶部235を更新する。
以下に、図24を参照して、共有情報管理部260の処理について説明する。図24は、共有情報管理部の処理を説明するフローチャートである。
本実施形態の共有情報管理部260において、表示部262は、端末装置300によって、評価結果情報の表示要求を受け付けると、表示要求を行った端末装置300へ評価結果情報を表示させる(ステップS2401)。具体的には、表示部262は、端末装置300から、端末装置300の利用者を特定する識別情報等の入力を受け付けると、関連情報235−3に、この識別情報と対応付けられた作成者名が含まれる評価結果情報を抽出し、端末装置300に表示させる。
続いて、共有情報管理部260は、端末装置300において、評価結果情報に関するレビューの依頼が入力されると、この評価結果情報の関連情報235−3に含まれる管理者名と対応付けられた利用者の端末装置400へ、レビュー依頼を通知し、レビュー依頼を完了する(ステップS2402)。
続いて、共有情報管理部260は、レビュー依頼を通知した端末装置400において、レビューの実施が完了したことを示す通知を受けて(ステップS2403)、更新部263により、レビューの結果を参照し、評価結果情報の削除が許可されたか否かを判定する(ステップS2404)。
ステップS2404において、評価結果情報の削除が許可されていない場合、共有情報管理部260は処理を終了する。
ステップS2404において、評価結果情報の削除が許可された場合、更新部263は、レビューの結果によって、評価結果情報によって評価が示された共有情報が正確情報となり得るか否かを判定する(ステップS2405)。具体的には、更新部263は、共有情報は、正確な情報であることが確認されたことを示す通知を受け付けたか否かを判定している。
ステップS2405において、正確情報となり得ると判定された場合、更新部263は、共有情報を正確情報に追加し(ステップS2406)、評価結果情報を削除する(ステップS2407)。
ステップS2405において、正確情報となり得ると判定されなかった場合、更新部263は、ステップS32407へ進み、評価結果情報を削除する。
続いて、更新部263は、評価結果記憶部235を更新し(ステップS2408)、処理を終了する。尚、更新部263は、レビューによって共有情報が修正され、修正後の共有情報が正確情報となり得ると判定された場合には、共有情報データベース500に格納された共有情報を、修正後の共有情報に更新し、さらに、修正後の共有情報を正確情報記憶部205に格納する。
以下に、図25乃至図28を参照して、本実施形態の端末装置300と端末装置400の表示例について説明する。以下の説明では、端末装置300は、共有情報を作成した作成者が利用する端末装置とし、端末装置400は、共有情報を管理する管理者が利用する端末装置とする。
図25は、端末装置(管理者用)の表示例を示す図である。図25に示す画面401は、端末装置400に表示される画面の一例を示す。
画面401は、表示欄402、403、404、405、406を有する。表示欄402は、評価結果記憶部235に格納された評価結果情報おける、判定結果毎のレコード数が表示される。具体的には、表示欄402には、評価結果記憶部235に格納された評価結果情報のうち、項目「判定結果」の値が「矛盾(第一の差異)」である評価結果情報の数と、項目「判定結果」の値が「相違(第二の差異)」である評価結果情報の数と、項目「判定結果」の値が「注意(第三の差異)」である評価結果情報の数とが表示される。
表示欄403は、評価結果記憶部235に格納された評価結果情報の数の日毎の推移を示す情報が表示される。表示欄403の例では、評価結果情報の数の推移がグラフとして表示されている。
表示欄404は、差異判定部254により判定によって抽出された共有情報のファイル名の一覧が表示される。表示欄404では、抽出された日時に従って一覧を表示させても良い。また、表示欄404では、共有情報のファイル名と対応付けて、判定結果とレビューの状況を示す情報を表示させても良い。
図25の例では、評価結果記憶部235に格納された評価結果情報のうち、最新の評価結果情報から特定される共有情報のファイル名が「資料XX」であり、この共有情報には、正確情報と比較して、矛盾する箇所、相違がある箇所、注意すべき箇所が存在することがわかる。また、この共有情報については、作成者からのレビューの依頼を受けていることがわかる。
表示欄405は、表示欄404の一覧において選択された共有情報についての評価結果情報が表示される。図25の例では、表示欄404において、ファイル名「資料XX」の共有情報が選択されているため、表示欄405には、項目「ファイル名」の値が「資料XX」である評価結果情報が表示される。
具体的には、表示欄405には、ファイル名「資料XX」を含む評価結果情報の項目「正確情報」の値と、項目「共有情報」の値と、判定結果とが表示される。
表示欄405では、表示欄405−1に、ファイル名「資料XX」の共有情報の一部が表示される。共有情報の一部とは、ファイル名「資料A」の正確情報と比較した結果、相違があると判定され、ファイル名「資料B」の正確情報と比較した結果、注意すべき箇所と判定された箇所である。尚、表示欄405−1には、共有情報の作成者を示す情報が表示されても良い。
また、表示欄405−2には、ファイル名「資料A」の正確情報の一部が表示される。ファイル名「資料A」の正確情報の一部とは、ファイル名「資料XX」の共有情報との相違があった箇所である。また、表示欄405−2には、ファイル名「資料A」の正確情報を参照してファイル名「資料XX」の共有情報との差異を判定した結果の判定結果として、「相違」が表示される。
また、表示欄405−3には、ファイル名「資料B」の正確情報の一部が表示される。ファイル名「資料B」の正確情報の一部とは、ファイル名「資料XX」の共有情報と文脈が異なる箇所である。また、表示欄405−3には、ファイル名「資料B」の正確情報を参照してファイル名「資料XX」の共有情報との差異を判定した結果の判定結果として、「注意」が表示される。
表示欄406は、共有情報と、共有情報と比較された正確情報との関係を示す図が表示される。表示欄406では、ファイル名「資料XX」の共有情報は、ファイル名「資料A」の正確情報との相違が存在し、ファイル名「資料B」の正確情報した結果、注意すべき箇所が存在し、ファイル名「資料D」の正確情報と矛盾することがわかる。
したがって、ファイル名「資料XX」の共有情報は、正確な情報ではない可能性が高いことがわかる。
このように、本実施形態では、共有情報毎の判定結果の一覧と、一覧から選択された共有情報と対応する評価結果情報とを同一画面に表示させる。したがって、本実施形態によれば、共有情報の管理者は、正確情報と異なる共有情報がどの程度存在し、各共有情報がどの程度正確情報と異なっているのかを容易に把握することができる。
図26は、端末装置(利用者用)の表示例を示す第一の図である。図26に示す画面301は、端末装置300に表示される画面の一例を示す。
本実施形態の画面301に表示される評価結果情報は、項目「作成者」の値が、端末装置300の利用者を示す評価結果情報である。
画面301は、表示欄302、303、304、305、306を有する。表示欄302には、評価結果記憶部235に格納された評価結果情報で、項目「作成者」の値が端末装置300の利用者を示す評価結果情報のうち、項目「判定結果」の値が「矛盾」である評価結果情報の数と、項目「判定結果」の値が「相違」である評価結果情報の数と、項目「判定結果」の値が「注意」である評価結果情報の数とが表示される。
表示欄303は、項目「作成者」の値が端末装置300の利用者を示す評価結果情報と対応付けられた共有情報のファイル名の一覧が表示される。また、表示欄303には、ファイル名と対応付けて、ファイル名が示す共有情報の判定結果とレビューの状況を示す情報を表示させる。
図26の例では、表示欄303では、最新の評価結果情報から特定される共有情報のファイル名が「資料XX」であり、この共有情報には、正確情報と比較して、矛盾する箇所、相違がある箇所、注意すべき箇所が存在することがわかる。また、この共有情報については、作成者からのレビューの依頼を受けていることがわかる。
表示欄304は、表示欄303の一覧において選択された共有情報について、レビューの依頼状況が表示される。図26の例では、表示欄304に、ファイル名「資料XX」の共有情報のレビューを行う管理者と日時が表示されているため、この共有情報について、レビュー依頼が完了していることがわかる。
また、表示欄304には、操作ボタン304−1、304−2が表示される。端末装置300は、操作ボタン304−1が操作されると、表示欄304に、レビューの依頼状況(管理者や日時)を変更するための入力欄等を表示させても良い。また、操作ボタン304−2が操作されると、レビュー依頼が削除される。
表示欄305は、図25の表示欄405と同様の内容が表示される。つまり、表示欄303の一覧で選択された共有情報と対応する評価結果情報が表示される。また、表示欄
305には、レビューが完了した共有情報のレビュー結果が表示される。
表示欄306は、図25の表示欄403と同様の内容が表示される。表示欄303の一覧で選択された共有情報と比較された正確情報との関係を示す図が表示される。
図27は、端末装置(利用者用)の表示例を示す第二の図である。図27に示す画面301Aは、レビューが完了したときに端末装置300に表示される画面の一例を示す。
画面301Aの表示欄301Aでは、ファイル名「資料00」の共有情報が選択されている。また、ファイル名「資料00」と対応付けられて、「レビュー完了」が表示されている。
したがって、ファイル名「資料00」の共有情報のレビューが完了していることがわかる。
図27の例では、表示欄303Aにおいて、ファイル名「資料00」が選択されると、表示欄304Aには、ファイル名「資料00」のレビューが行われた日時と、レビューが完了していることを示す情報とが表示さける。
また、表示欄305Aには、ファイル名「資料00」のレビューの結果を示す情報307と、操作ボタン308とが表示される。
情報307は、ファイル名「資料00」の共有情報は、正確情報と相違は存在するが、共有情報が正確な情報であることが確認されたことを示す。また、操作ボタン308は、ファイル名「資料00」の共有情報を正確情報に追加することを指示するための操作ボタンである。
本実施形態では、操作ボタン308が操作されると、ファイル名「資料00」の共有情報と、ファイル名「資料M」の正確情報とを比較した結果である評価結果情報が、評価結果記憶部235から削除される。また、ファイル名「資料00」の共有情報が、正確情報記憶部205に追加される。
表示欄306Aは、ファイル名「資料00」の共有情報と比較された正確情報との関係を示す図が表示される。
図28は、端末装置(利用者用)の表示例を示す第三の図である。図28に示す画面301Bは、レビューによって、ファイル名「資料00」の共有情報が正確な情報であることが確認できなかった場合の表示例を示している。
この場合、表示欄305Bには、情報307Aと操作ボタン308Aとが表示される。情報307Aは、ファイル名「資料00」の共有情報が正確な情報であることが確認できなかったため、評価結果情報の保存を指示する情報である。操作ボタン308Aは、レビューを再度依頼するための操作ボタンである。
本実施形態では、例えば、端末装置300において、ファイル名「資料00」の共有情報が修正された後に、操作ボタン308Aが操作されると、修正後のファイル名「資料00」の共有情報に対するレビューの依頼が管理者に対して行われる。
このように、本実施形態では、レビューの結果を共有情報の作成者に閲覧させることができる。また、本実施形態では、共有情報が正確な情報だと確認されかなった場合には、再度レビューを依頼することができる。
以上のように、本実施形態によれば、共有情報の正誤を知らずに、使用してしまうリスクを削減することができる。また、本実施形態によれば、共有情報記憶部206に格納された共有情報の中から不正確な情報を自動的に特定することができるため、不正確な情報を特定するための調査や検証を行うための工数を削減できる。また、本実施形態では、差異記憶部230に格納された差異情報を集計することで、組織内の共有情報の正確性を継続的に向上させることができる。
開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
予め規定される正確な情報を示す第1文書に含まれる単語又は単語群の共起関係と、評価対象となる第2文書に含まれる単語又は単語群の共起関係と、に基づいて、前記第1文書と前記第2文書との差異の有無を判定する処理と、
前記差異が有る場合に、判定結果を出力する処理と、をコンピュータに実行させる情報処理プログラム。
(付記2)
前記判定する処理は、
前記第1文書と前記第2文書との矛盾である第一の差異の有無を判定する処理と、
前記第1文書と前記第2文書との相違である第二の差異の有無を判定する処理と、
前記第1文書と前記第2文書とにおける文脈の違いである第三の差異の有無を判定する処理と、を含む、付記1記載の情報処理プログラム。
(付記3)
前記出力する処理は、
前記第1文書と前記第2文書とが矛盾することを示す情報と、前記第1文書と前記第2文書とが相違することを示す情報と、前記第2文書に注意すべき箇所が存在することを示す情報と、少なくとも何れか1つを出力する、付記2記載の情報処理プログラム。
(付記4)
前記出力する処理は、
前記第1文書との差異があると判定された前記第2文書の一部と、前記第2文書の一部と差異があると判定された前記第1文書の一部と、を出力する、付記3記載の情報処理プログラム。
(付記5)
前記出力する処理は、
前記第2文書を特定する情報と、前記第2文書の作成者を示す情報と、前記第2文書と対応する判定結果と、を対応付けた一覧を出力する、付記1乃至4の何れか一項に記載の情報処理プログラム。
(付記6)
前記出力する処理は、
前記判定結果を集計し、前記第2文書と、前記第2文書と比較された第1文書と、前記判定結果との関係を対応付けて出力する、付記1乃至5の何れか一項に記載の情報処理プログラム。
(付記7)
前記第二の差異は、
前記第2文書が有する共起関係であって、前記第1文書に一致する共起関係が存在しない共起関係であり、
前記第三の差異は、
前記第2文書における、前記第1文書の共起関係には存在しない距離の共起関係、又は、前記第1文書と同義ではない修飾成分である、付記2記載の情報処理プログラム。
(付記8)
前記第1文書に基づき、前記第1文書に含まれる単語間の共起関係と、単語と単語群との間の共起関係と、単語群と単語群との間の共起関係と、を対応付けた第一共起テーブルを生成する処理と、
前記第2文書に基づき、前記第2文書に含まれる単語間の共起関係と、単語と単語群との間の共起関係と、単語群と単語群との間の共起関係と、を対応付けた第二共起テーブルを生成する処理と、を前記コンピュータに実行させ、
前記判定する処理は、
前記第一共起テーブルと前記第二共起テーブルとを用いて実行される、付記1乃至7の何れか一項に記載の情報処理プログラム。
(付記9)
コンピュータによる情報処理方法であって、前記コンピュータが、
予め規定される正確な情報を示す第1文書に含まれる単語又は単語群の共起関係と、評価対象となる第2文書に含まれる単語又は単語群の共起関係と、に基づいて、前記第1文書と前記第2文書との差異の有無を判定し、
前記差異が有る場合に、判定結果を出力する、情報処理方法。
(付記10)
予め規定される正確な情報を示す第1文書に含まれる単語又は単語群の共起関係と、評価対象となる第2文書に含まれる単語又は単語群の共起関係と、に基づいて、前記第1文書と前記第2文書との差異の有無を判定する差異判定部と、
前記差異が有る場合に、判定結果を出力する出力部と、を有する情報処理装置。
本発明は、具体的に開示された実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
100 情報処理システム
200 情報処理装置
205 正確情報記憶部
206 共有情報記憶部
210 第一共起関係記憶部
220 第二共起関係記憶部
230 差異記憶部
235 評価結果記憶部
240 情報処理部
250 差異抽出処理部
251 入力受付部
252 重なり範囲特定部
253 共起関係作成部
254 差異判定部
255 差異抽出部
256 格納部
260 共有情報管理部
261 集計部
262 表示部
263 更新部
300、400 端末装置
500 共有情報データベース

Claims (8)

  1. 予め規定される正確な情報を示す第1文書に含まれる単語又は単語群の共起関係と、評価対象となる第2文書に含まれる単語又は単語群の共起関係と、に基づいて、前記第1文書と前記第2文書との差異の有無を判定する処理と、
    前記差異が有る場合に、判定結果を出力する処理と、をコンピュータに実行させる情報処理プログラム。
  2. 前記判定する処理は、
    前記第1文書と前記第2文書との矛盾である第一の差異の有無を判定する処理と、
    前記第1文書と前記第2文書との相違である第二の差異の有無を判定する処理と、
    前記第1文書と前記第2文書とにおける文脈の違いである第三の差異の有無を判定する処理と、を含む、請求項1記載の情報処理プログラム。
  3. 前記出力する処理は、
    前記第1文書と前記第2文書とが矛盾することを示す情報と、前記第1文書と前記第2文書とが相違することを示す情報と、前記第2文書に注意すべき箇所が存在することを示す情報と、少なくとも何れか1つを出力する、請求項2記載の情報処理プログラム。
  4. 前記出力する処理は、
    前記第1文書との差異があると判定された前記第2文書の一部と、前記第2文書の一部と差異があると判定された前記第1文書の一部と、を出力する、請求項3記載の情報処理プログラム。
  5. 前記出力する処理は、
    前記第2文書を特定する情報と、前記第2文書の作成者を示す情報と、前記第2文書と対応する判定結果と、を対応付けた一覧を出力する、請求項1乃至4の何れか一項に記載の情報処理プログラム。
  6. 前記出力する処理は、
    前記判定結果を集計し、前記第2文書と、前記第2文書と比較された第1文書と、前記判定結果との関係を対応付けて出力する、請求項1乃至5の何れか一項に記載の情報処理プログラム。
  7. コンピュータによる情報処理方法であって、前記コンピュータが、
    予め規定される正確な情報を示す第1文書に含まれる単語又は単語群の共起関係と、評価対象となる第2文書に含まれる単語又は単語群の共起関係と、に基づいて、前記第1文書と前記第2文書との差異の有無を判定し、
    前記差異が有る場合に、判定結果を出力する、情報処理方法。
  8. 予め規定される正確な情報を示す第1文書に含まれる単語又は単語群の共起関係と、評価対象となる第2文書に含まれる単語又は単語群の共起関係と、に基づいて、前記第1文書と前記第2文書との差異の有無を判定する差異判定部と、
    前記差異が有る場合に、判定結果を出力する出力部と、有する情報処理装置。
JP2019128649A 2019-07-10 2019-07-10 情報処理プログラム、情報処理方法、情報処理装置 Pending JP2021015371A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019128649A JP2021015371A (ja) 2019-07-10 2019-07-10 情報処理プログラム、情報処理方法、情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019128649A JP2021015371A (ja) 2019-07-10 2019-07-10 情報処理プログラム、情報処理方法、情報処理装置

Publications (1)

Publication Number Publication Date
JP2021015371A true JP2021015371A (ja) 2021-02-12

Family

ID=74531431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019128649A Pending JP2021015371A (ja) 2019-07-10 2019-07-10 情報処理プログラム、情報処理方法、情報処理装置

Country Status (1)

Country Link
JP (1) JP2021015371A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004110161A (ja) * 2002-09-13 2004-04-08 Fuji Xerox Co Ltd テキスト文比較装置
JP2013105321A (ja) * 2011-11-14 2013-05-30 Hitachi Ltd 文書処理装置、文書構成要素間の関係解析方法およびプログラム
WO2015053236A1 (ja) * 2013-10-08 2015-04-16 独立行政法人情報通信研究機構 矛盾表現収集装置及びそのためのコンピュータプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004110161A (ja) * 2002-09-13 2004-04-08 Fuji Xerox Co Ltd テキスト文比較装置
JP2013105321A (ja) * 2011-11-14 2013-05-30 Hitachi Ltd 文書処理装置、文書構成要素間の関係解析方法およびプログラム
WO2015053236A1 (ja) * 2013-10-08 2015-04-16 独立行政法人情報通信研究機構 矛盾表現収集装置及びそのためのコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP3943824B2 (ja) 情報管理方法および情報管理装置
JP4574356B2 (ja) 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
US20050149538A1 (en) Systems and methods for creating and publishing relational data bases
US20170228356A1 (en) System Generator Module for Electronic Document and Electronic File
JP5424798B2 (ja) メタデータ設定方法及びメタデータ設定システム、並びにプログラム
CN106462632A (zh) 具有内容规范层的媒体商店
JP6586050B2 (ja) 管理装置、管理方法および管理プログラム
CN116304347A (zh) 一种基于群智知识的Git命令推荐方法
JP2005293384A (ja) コンテンツレコメンドシステムと方法、及びコンテンツレコメンドプログラム
JP2021015371A (ja) 情報処理プログラム、情報処理方法、情報処理装置
WO2022018899A1 (ja) Kpiツリーから部分ツリーを抽出するシステム
JP5587744B2 (ja) プログラムコンポーネント検索方法、プログラムコンポーネント検索システムおよびコンポーネント検索プログラム
JP4469818B2 (ja) データ管理装置、データプログラム及びデータ管理方法
CN114118078A (zh) 制作辅助装置、制作辅助方法及记录介质
JP2020181516A (ja) テンプレート検索システムおよびテンプレート検索方法
WO2020116014A1 (ja) ドキュメント作成支援システム
JP3526198B2 (ja) データベース類似検索方法及び装置及び類似検索プログラムを格納した記憶媒体
JP2001056809A (ja) 文書管理システム
CN113032518A (zh) 信息处理装置、存储介质及信息处理方法
JP6160422B2 (ja) 情報管理装置、プログラム及び情報処理システム
WO2020183538A1 (ja) 計算機システム及びデータレイクに格納されるデータを用いた処理方法
JP2018049361A (ja) システム構成案設計装置およびシステム構成案設計方法
JP2008059196A (ja) プロセス管理方法及びプロセス管理システム
US9727525B2 (en) Data exchange system and data exchange method
JP2024046177A (ja) データセットマッチングシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220407

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230526

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230912