JPWO2023037398A5

JPWO2023037398A5 -

Info

Publication number: JPWO2023037398A5
Application number: JP2023546584A
Authority: JP
Filing date: 2021-09-07
Publication date: 2024-05-10

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。

データ分析作業においては、「仮説設定、分析・可視化、仮説検証」のサイクルを回すことが一般的であるが、その作業は非常に時間と労力を要するものである。インサイト自動発見技術は、人が有益と考える可視化候補をデータの特徴に基づいて自動的に発見する技術である。これによって、データ分析作業における作業負荷を大幅に低減することが可能である。例えば、下記の特許文献１には、データの分析結果を可視化する方法を表現したキーワードを有するテンプレートデータに基づいて、可視化対象データを可視化したインスタンスデータを生成し、インスタンスデータをインスタンスメタデータの評価値に基づいて再生成する方法が記載されている。

国際公開第２０１８／１７３２５１号

しかしながら、ユーザの求めるデータの可視化結果は、データの内容及びユーザのニーズ等により様々であり、画一的に定まるものではない。特許文献１に記載の技術では、テンプレートデータがユーザコンテキストを捉えていない場合には、提示された可視化候補が必ずしもユーザの求める可視化結果とは限らない、という問題があった。

本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的の一例は、データの可視化候補がユーザの求めるインサイトを与えるかについての評価を可能にする技術を提供することである。

本発明の一側面に係る情報処理装置は、評価用データセット及びコンテキストデータを取得する取得手段と、少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う評価手段とを備える。

本発明の一側面に係る情報処理方法は、少なくとも１つのプロセッサが、評価用データセット、及びコンテキストデータを取得すること、及び少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行うことを含む。

本発明の一側面に係るプログラムは、コンピュータに、評価用データセット、及びコンテキストデータを取得する処理と、少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う処理とを実行させる。

本発明の一態様によれば、データの可視化候補がユーザの求めるインサイトを与えるかについての評価を可能にすることができる。

本発明の例示的実施形態１に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態１に係る情報処理方法の流れを示すフロー図である。本発明の例示的実施形態１に係るインサイトサブジェクト及び評価結果の例を示す図である。本発明の例示的実施形態２に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態２に係る情報処理方法の流れを示すフロー図である。本発明の例示的実施形態２に係る入力データの例を示す図である。本発明の例示的実施形態２に係るコンテキスト及び可視化情報の例を示す図である。本発明の例示的実施形態２に係る特徴ベクトルの生成例を示す図である。本発明の例示的実施形態２に係る集計データ及び統計量の例を示す図である。本発明の例示的実施形態２に係る評価モデルの例を示す図である。本発明の例示的実施形態２に係るインサイトサブジェクトを評価結果と共に表示する例を示す図である。本発明の例示的実施形態２に係る可視化情報を評価結果と共に表示する例を示す図である。本発明の例示的実施形態２に係るインサイトサブジェクトを評価結果と共に表示する例を示す図である。本発明の例示的実施形態３に係る情報処理装置の構成を示すブロック図である。上記情報処理装置の各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータの一例を示す図である。

〔例示的実施形態１〕
本発明の第１の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。

＜情報処理装置の構成＞
本例示的実施形態に係る情報処理装置１の構成について、図１を参照して説明する。図１は、情報処理装置１の構成を示すブロック図である。情報処理装置１は、データの可視化候補がユーザの求めるインサイトを与えるかについて評価する装置である。図示のように、情報処理装置１は、取得部１１及び評価部１２を備える。取得部１１は、評価用データセット及びコンテキストデータを取得する。評価部１２は、少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行う。

（評価用データセット）
評価用データセットは、データの可視化候補を情報処理装置１が評価するために用いるデータである。評価用データセットは、可視化の対象のデータである評価用データ、及び、当該評価用データに関連する関連データ、の少なくともいずれか一方を含む。ただし、評価用データセットに含まれるデータは上述した例に限られず、評価用データセットは他の情報を含んでいてもよい。

（評価用データ）
評価用データは、可視化の対象のデータであり、一例として、複数のレコードを含む多次元データである。評価用データは一例として、ある店舗の月間の売上記録を示すデータ、店舗の規模及びエリアを示すデータ、店舗で販売されている商品の商品コード、商品名及び単価を示すデータ、及び／又は、顧客の性別、年齢、居住地、職業等を示すデータを含む。ただし、評価用データはこれに限られず、他のデータであってもよい。評価用データは、一例として、評価用データの内容を表すチャート（円グラフ、棒グラフ、線グラフ、等）として可視化される。

（関連データ）
関連データは、評価用データに関連するデータである。関連データは、一例として、評価用データの集計結果を示す集計データ、集計データの統計量、及び／又は、評価用データの可視化に利用される各種情報の集合である関連情報を含む。関連情報は、一例として、評価用データの可視化に利用されるデータの名前、データ型、集計方法の種別、及びチャートデザインの種別、の一部又は全部を含む。なお、関連データに含まれるデータは上述した例に限られず、関連データは他のデータを含んでいてもよい。

（コンテキストデータ）
コンテキストデータは、ユーザがどのようなインサイトを求めるかを表すデータである。コンテキストデータは、一例として、ユーザが求めるインサイトに関するデータであるコンテキスト、及び、コンテキストをベクトル空間で表した特徴ベクトル、の少なくともいずれか一方を含む。なお、コンテキストデータに含まれるデータは上述した例に限られず、コンテキストデータは他のデータを含んでいてもよい。

（コンテキスト）
コンテキストは、ユーザが求めるインサイトに関するデータであり、一例として、ユーザクエリ又はメタデータから抽出される言語情報である。具体的には例えば、コンテキストは、「商品Ａの顧客について」というユーザクエリから抽出される「商品Ａ」及び「顧客」という単語である。また、他の例として、コンテキストは例えば、「売上推移について」というユーザクエリから抽出される「売上」及び「推移」という単語である。また、コンテキストは例えば、「検索履歴」が「商品Ａの顧客」であるメタデータから抽出される「商品Ａ」及び「顧客」という単語である。また、コンテキストは例えば、「検索履歴」が「売上推移」であるメタデータから抽出される「売上」及び「推移」という単語である。ただし、コンテキストは言語情報に限られず、他の情報であってもよい。コンテキストは例えば、ユーザの位置を示す位置情報、単語間の関連度を表す情報、又はサイトの閲覧履歴を示す情報であってもよい。

（インサイトサブジェクト）
インサイトサブジェクトは、少なくとも評価用データセットを参照して生成されるデータである。インサイトサブジェクトは、一例として、評価用データの可視化結果を表すデータ、及び、評価用データを可視化するために用いられるデータ、の少なくともいずれか一方を含む。評価用データを可視化した可視化結果は、例えば評価用データの内容を表すチャート（円グラフ、棒グラフ、線グラフ、等）である。また、インサイトサブジェクトは、一例として、上述した関連データの一部、例えば関連データに含まれる関連情報であってもよい。換言すると、インサイトサブジェクトは、評価用データセットの一部であってもよい。ただし、インサイトサブジェクトは上述した例に限られず、他のデータであってもよい。

（インサイト）
また、本明細書において、インサイトとは、人が有益と認識する可視化結果、及び、そのような可視化結果を表すデータ、のことをいう。換言すれば、インサイトとは、人が有益と認識するインサイトサブジェクトのことをいう。

取得部１１が評価用データセット及びコンテキストデータを取得する方法は特に限定されない。例えば、取得部１１は、外部の記憶装置又は内部の記憶装置から評価用データセット及びコンテキストデータを読み出すことにより取得してもよく、また、通信ＩＦ又は入出力ＩＦを介して評価用データセット及びコンテキストデータを取得してもよい。

また、評価部１２が複数のインサイトサブジェクトをコンテキストデータに応じて評価する手法は特に限定されない。評価部１２は、一例として、複数のインサイトサブジェクトのそれぞれについて、ユーザが求めるインサイトを与えるかの評価結果である評価値を算出する。以下では、この評価値をインサイトスコアともいう。インサイトスコアは、そのまま出力してもユーザが求めるインサイトを与えるインサイトサブジェクトを発見する大きな助けとなる。また、インサイトスコアを用いることにより、インサイトスコアが高い、すなわちユーザが求めるインサイトを与える可能性が高いインサイトサブジェクトを自動で検出することも可能になる。

評価部１２は一例として、関連データとコンテキストデータとが入力され、評価値を出力する評価モデルを用いて、複数のインサイトサブジェクトに対して評価を行う。評価モデルは、予め規定されたスコア関数であってもよく、また、機械学習により構築された学習済モデルであってもよい。スコア関数を用いる場合、評価部１２は一例として、関連データとコンテキストデータとの関連性が高いほど、高い評価値を出力するスコア関数を用いて、複数のインサイトサブジェクトに対して評価を行う。ただし、評価部１２が行う評価の手法はこれらに限られず、他の手法が用いられてもよい。

評価用データを可視化した可視化結果は、可視化に利用される関連情報等の内容によってそれぞれ異なる。評価用データを複数の異なるパターンで可視化した複数の可視化結果のそれぞれを、以下では「可視化候補」ともいう。評価用データの複数の可視化候補がユーザに与える視覚的な特徴は、複数の可視化候補のそれぞれで異なる。

インサイトサブジェクトは、評価用データの可視化候補と１対１で対応する。そのため、評価部１２が複数のインサイトサブジェクトに対してコンテキストデータに応じた評価を行うことにより、複数の可視化候補に対してコンテキストデータに応じた評価が行われる。

＜情報処理方法の流れ＞
本例示的実施形態に係る情報処理方法Ｓ１の流れについて、図２を参照して説明する。図２は、情報処理方法Ｓ１の流れを示すフロー図である。

ステップＳ１１では、少なくとも１つのプロセッサが、評価用データセット、及びコンテキストデータを取得する。そして、ステップＳ１２では、少なくとも１つのプロセッサが、少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行う。これにより、図２の情報処理方法Ｓ１は終了する。

なお、１つのプロセッサにＳ１１～Ｓ１２の処理を実行させてもよいし、Ｓ１１の処理とＳ１２の処理とをそれぞれ別のプロセッサに実行させてもよい。後者の場合、各プロセッサは、１つの情報処理装置が備えているものであってもよいし、それぞれ異なる情報処理装置が備えているものであってもよい。また、Ｓ１１～Ｓ１２の処理を実行する少なくとも１つのプロセッサは、情報処理装置１が備えているものであってもよい。

図３は、インサイトサブジェクト及び評価結果の例を示す図である。図３の例において、インサイトサブジェクトＶ１～Ｖ８は、評価用データの可視化候補を表すデータである。評価結果は、インサイトサブジェクトＶ１～Ｖ８のそれぞれについて、評価部１２がインサイトスコアを算出した結果である。図３の例では、インサイトサブジェクトＶ１のインサイトスコアは「０．２」であり、インサイトサブジェクトＶ２のインサイトスコアは「０．１」である。同様に、インサイトサブジェクトＶ３～Ｖ８のインサイトスコアはそれぞれ、「０．８」、「０．６」、「０．３」、「０．５」、「０．９」、「０．７」である。

本例示的実施形態に係る情報処理装置１においては、評価用データセット及びコンテキストデータを取得する取得部１１と、少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行う評価部１２と、を備える、という構成が採用されている。このため、本例示的実施形態に係る情報処理装置１によれば、データの可視化候補がユーザの求めるインサイトを与えるかについて評価することが可能になる、という効果が得られる。

上述の情報処理装置１の機能は、プログラムによって実現することもできる。本例示的実施形態に係るプログラムは、コンピュータに、評価用データセット、及びコンテキストデータを取得する処理と、少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行う処理と、を実行させる。したがって、本例示的実施形態に係るプログラムによれば、データの可視化候補がユーザの求めるインサイトを与えるかについて評価することが可能になる、という効果が得られる。

また、本例示的実施形態に係る情報処理方法Ｓ１においては、少なくとも１つのプロセッサが、評価用データセット、及びコンテキストデータを取得すること、及び少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行うことを含む、という構成が採用されている。このため、本例示的実施形態に係る情報処理方法Ｓ１によれば、ユーザが求めるインサイトを与えるかについて可視化候補を評価することが可能になるという効果が得られる。

〔例示的実施形態２〕
本発明の第２の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態１にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を繰り返さない。

＜情報処理装置の構成＞
図４は、情報処理装置１Ａの構成を示すブロック図である。情報処理装置１Ａは、情報処理装置１Ａの各部を統括して制御する制御部１０Ａと、情報処理装置１Ａが使用する各種データを記憶する記憶部１７とを備える。また、情報処理装置１Ａは、情報処理装置１Ａが他の装置と通信するための通信部１８、情報処理装置１Ａがデータを表示出力するための表示部１９、及び情報処理装置１Ａに対する入力を受け付ける入力部２０を備える。以下では、表示部１９がデータを表示出力する例を説明するが、情報処理装置１Ａは、例えば印字出力や音声出力等の態様でデータを出力してもよい。また、表示部１９と入力部２０とは、情報処理装置１Ａに外付けされた、情報処理装置１Ａの外部の機器であってもよい。

制御部１０Ａは、取得部１１、評価部１２、第１の生成部１３、及び第２の生成部１４を含む。また、記憶部１７には、評価用データセットＤＳ、コンテキストデータＣＤ、評価モデルパラメータＥＭＰ、評価結果ＥＲ、及び表示用データＤＤが記憶される。

（評価用データセットＤＳ）
評価用データセットＤＳには、評価用データと、当該評価用データに関連する関連データＶＤとが含まれている。評価用データは、可視化の対象であるデータであり、一例として、ある店舗の月間の売上記録を示すデータ、店舗の規模及びエリアを示すデータ、店舗で販売されている商品の商品コード、商品名及び単価を示すデータ、及び／又は、顧客の性別、年齢、居住地、職業等を示すデータである。

（関連データＶＤ）
関連データＶＤは、評価用データに関連するデータである。関連データＶＤには、
・評価用データに関連する関連情報Ｖ
・関連情報Ｖをベクトル空間で表した特徴ベクトルｄ^Ｖ
・評価用データに含まれるデータであって関連情報Ｖに対応するデータを集計して得られる集計データｓ^Ｖ、及び、
・集計データｓ^Ｖの統計量ｔ^Ｖ
の少なくともいずれかが含まれる。

（関連情報Ｖ）
関連情報Ｖは、一例として、評価用データの可視化に利用される各種情報の集合であり、例えば以下の情報を含む。
・評価用データに含まれる各データの属性情報
・集計方法（フィルタ、集計関数、集計のキーとなる列名、等）に関する情報（評価用データに対して適用するフィルタに関する情報、等）
・チャートデザイン（ｘ軸、ｙ軸、チャートタイプ、プロットタイプ、等）に関する情報（チャートの各軸と項目との関係に関する情報、等）

（特徴ベクトルｄ^Ｖ）
関連情報の特徴ベクトルｄ^Ｖは、関連情報Ｖをベクトル空間で表現したものである。ベクトル化の方法は任意であるが、例えば単語の分散表現などを用いてもよい。

（集計データｓ^Ｖ）
集計データｓ^Ｖは、評価用データから関連情報Ｖに対応する数値を集計したデータである。集計データｓ^Ｖは、関連情報Ｖの可視化結果としてチャートにプロットされる。

（統計量ｔ^Ｖ）
集計データｓ^Ｖの統計量ｔ^Ｖは、集計データｓ^Ｖについての各種統計量を並べたものである。利用する統計量は任意であるが、例えば以下のものが統計量ｔ^Ｖとして利用可能である。
・最大値、最小値、中央値
・平均値、標準偏差、分散
・カーディナリティ
・ゼロ値の割合、欠損値の割合
・尖度、歪度
・エントロピー
・ジニ係数

（コンテキストデータＣＤ）
コンテキストデータＣＤには、
・コンテキストＣ、及び、
・コンテキストをベクトル空間で表した特徴ベクトルｄ^Ｃ
の少なくとも何れかが含まれる。

（コンテキストＣ）
コンテキストＣは、ユーザが求めるインサイトに関するデータである。コンテキストＣは、一例として、ユーザが求めるインサイトを自然言語で表すデータであり、ユーザが求めるインサイトの質及び量に関するデータを含む。コンテキストＣは、後述のユーザクエリＱ及び／又はメタデータＭから抽出されてもよい。コンテキストＣは一例として、「商品Ａ」及び「顧客」という単語を含む。

（特徴ベクトルｄ^Ｃ）
コンテキストＣの特徴ベクトルｄ^Ｃは、コンテキストＣをベクトル空間で表したものである。ベクトル化の方法は任意であるが、一例として、単語の分散表現などを用いてもよい。

（ユーザクエリＱ）
ユーザクエリＱは、ユーザが求めるインサイトに関するクエリであり、ユーザによって自然言語で与えられる。ユーザクエリＱは、例えば以下の情報を含む。
・分析対象とするデータについての情報（例：「商品Ａ」、「売上」）
・インサイトに対する仮説（例：「～が増加している」、「～が突出している」）
・想定するチャートの特徴（例：地域別集計、円グラフ）

（メタデータＭ）
メタデータＭは、ユーザの求めるインサイトが推定できる情報である。メタデータＭは、一例として、所定のシステムにより自動的に収集される。メタデータＭは、例えば以下の情報を含む。
・ユーザの検索履歴（例：「商品Ａ、顧客」で検索している）
・ユーザの分析履歴（例：商品Ａの顧客分析を過去に実施）
・ユーザの評価履歴（例：商品Ａの顧客についてのチャート等を高く評価していた）
・ユーザの行動履歴（例：商品Ａのサイト又は販売店舗をｘｘ分滞在していた）

（評価モデルパラメータＥＭＰ）
評価モデルパラメータＥＭＰは、評価モデルｆを規定するパラメータである。評価モデルｆは、関連データＶＤ及びコンテキストデータＣＤを入力とし、入力された関連データＶＤに対応するインサイトサブジェクトを定量的に評価するモデルである。評価モデルｆとしては、インサイトサブジェクトの評価結果の推定に利用できるものであれば任意のモデルが利用可能である。例えば、後述するようなルールベースのモデル、又は、機械学習により構築されたモデル等が評価モデルｆとして利用可能である。評価モデルｆの出力は、一例として、評価結果を表すスコア、又は、ラベル確率である。評価モデルｆについては後述する。

（評価結果ＥＲ）
評価結果ＥＲは、評価部１２によるインサイトサブジェクトの評価結果を示すデータである。評価結果ＥＲは、一例として、複数のインサイトサブジェクトのそれぞれについての評価結果を表すインサイトスコアｙ＾である。

（インサイトスコアｙ＾）
インサイトスコアｙ＾は、評価モデルｆの出力値に基づいて計算される可視化のよさの定量的指標である。インサイトスコアｙ＾は例えば、評価モデルｆの出力値であってもよく、また、評価モデルｆの出力値に正規化及び／又は重み付け等の処理を加えた値であってもよい。インサイトスコアｙ＾の算出方法の具体例については後述する。

（表示用データＤＤ）
表示用データＤＤは、情報処理装置１Ａによるインサイトサブジェクトの評価結果をユーザに提示するためのデータ、すなわちユーザが求めるインサイトを与えるかについてのインサイトサブジェクトの評価結果に関するデータである。

（取得部１１）
取得部１１は、評価用データセットＤＳ及びコンテキストデータＣＤを取得する。取得部１１は、一例として、評価用データセットＤＳ及びコンテキストデータＣＤを記憶部１７から読み出すことにより取得する。ただし、評価用データセットＤＳ及びコンテキストデータＣＤの取得方法は特に限定されない。例えば、取得部１１は、情報処理装置１Ａのユーザが入力部２０を介して入力した評価用データセットＤＳ及びコンテキストデータＣＤを取得してもよい。また、例えば、取得部１１は、通信部１８を介した通信により、外部の装置から評価用データセットＤＳ及びコンテキストデータＣＤを取得してもよい。

（評価部１２）
評価部１２は、少なくとも評価用データセットＤＳを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータＣＤに応じた評価を行う。評価部１２は、一例として、複数のインサイトサブジェクトのそれぞれについてインサイトスコアｙ＾を算出し、その算出結果を示す評価結果ＥＲを生成して記憶部１７に記憶させる。

（第１の生成部１３・第２の生成部１４）
第１の生成部１３は、評価用データセットＤＳを参照して複数のインサイトサブジェクトを生成する。また、第１の生成部１３は、評価部１２の評価結果に関する表示用データＤＤを生成する。第２の生成部１４は、コンテキストデータＣＤの少なくとも一部と関連データＶＤの少なくとも一部とを生成する。

＜情報処理方法の流れ＞
本例示的実施形態に係る情報処理方法の流れについて、図面を参照して説明する。図５は、情報処理方法の流れを示すフロー図である。以下では、関連情報Ｖが評価用データの可視化に利用される可視化情報である場合について説明する。以下では、関連情報Ｖの一例である可視化情報を「可視化情報Ｖ」ともいう。

（ステップＳ１０１）
ステップＳ１０１では、取得部１１が、入力データＤ及びコンテキスト生成用データを取得する。入力データＤは、本明細書に係る評価用データの一例である。入力データＤは、チャートにプロットされるデータを含んでいればよく、入力データＤのフォーマットとしては任意のフォーマットが利用可能である。取得部１１は一例として、入力部２０又は通信部１８を介して入力データＤを取得する。

図６は、入力データＤの例を示す図である。図６の例では、入力データＤは、売上データ、店舗データ、商品データ、及び顧客データを含む。売上データ、店舗データ、商品データ及び顧客データは、何れも複数のレコードを含む多次元データのデータセットである。売上データは、「日付」、「商品コード」、「顧客コード」、「店舗コード」、及び「売上」のデータ項目を含む多次元データである。店舗データは、「店舗コード」、「店舗名」、「エリア」、及び「規模」のデータ項目を含む多次元データである。商品データは、「商品コード」、「商品名」、「分類」、及び「単価」のデータ項目を含む多次元データである。顧客データは、「顧客コード」、「年齢」、「性別」、「居住地」、「職業」、及び「収入」のデータ項目を含む多次元データである。

（コンテキスト生成用データ）
コンテキスト生成用データは、コンテキストＣを生成するためのデータであり、一例として、ユーザクエリＱ及びメタデータＭの一方又は両方を含む。コンテキスト生成用データは、複数のユーザクエリを含んでいてもよく、また、複数のメタデータを含んでいてもよい。ただし、コンテキスト生成用データはユーザクエリ及びメタデータに限られず、他のデータであってもよい。また、コンテキスト生成用データは、そのままでコンテキストＣとして利用可能なデータであってもよい。取得部１１は、一例として、入力部２０又は通信部１８を介してコンテキスト生成用データを取得してもよく、また、記憶部１７からコンテキスト生成用データを読み出すことにより取得してもよい。

（ステップＳ１０２）
ステップＳ１０２では、第２の生成部１４が評価用データセットＤＳ及びコンテキストデータＣＤを生成する。評価用データセットＤＳの生成及びコンテキストデータＣＤの生成の具体例について以下に説明する。

（評価用データセットＤＳの生成）
第２の生成部１４は、まず、可視化情報Ｖを取得する。第２の生成部１４は、記憶部１７の所定の記憶領域から可視化情報Ｖを読み出すことにより取得してもよく、また、入力部２０又は通信部１８を介して可視化情報Ｖを取得してもよい。このとき、第２の生成部１４は、複数の可視化情報Ｖを取得する。可視化情報Ｖは、一例として、入力データＤに含まれる各データの属性情報、チャートの各軸と項目との関係に関する情報、入力データＤに対して適用するフィルタ、チャートタイプ、集計方法、等の情報を含む。

また、第２の生成部１４は、任意の言語モデルを用いて、取得した可視化情報Ｖをベクトル空間で表現する特徴ベクトルｄ^Ｖを生成する。特徴ベクトルｄ^Ｖは、複数の可視化情報Ｖのそれぞれについて生成される。また、第２の生成部１４は、入力データＤから可視化情報Ｖに対応する数値を集計した集計データｓ^Ｖ、及び、集計データｓ^Ｖについての各種統計量の集合である統計量ｔ^Ｖを生成する。

第２の生成部１４は、取得した可視化情報Ｖ、及び、生成した特徴ベクトルｄ^Ｖ、集計データｓ^Ｖ、統計量ｔ^Ｖを含む関連データＶＤと、ステップＳ１０１で取得部１１が取得した入力データＤとを含む評価用データセットＤＳを生成する。関連データＶＤには、複数の可視化情報Ｖ及び複数の特徴ベクトルｄ^Ｖが含まれてもよく、また、１対の可視化情報Ｖ及び特徴ベクトルｄ^Ｖが含まれてもよい。

（コンテキストデータＣＤの生成）
また、第２の生成部１４は、ステップＳ１０１で取得部１１が取得したコンテキスト生成用データに対し任意の自然言語処理を実行してコンテキストＣを生成する。なお、第２の生成部１４は、コンテキスト生成用データをそのままコンテキストＣとして用いてもよい。

一例として、第２の生成部１４は、「商品Ａの顧客について」というユーザクエリに対し自然言語処理を実行し、「商品Ａ」、「顧客」というコンテキストＣを生成する。また、他の例として、第２の生成部１４は、「売上推移について」というユーザクエリに対し自然言語処理を行い、「売上」、「推移」というコンテキストＣを生成する。また、他の例として、第２の生成部１４は、「検索履歴」が「商品Ａの顧客」であるメタデータに対し自然言語処理を行って「商品Ａ」、「顧客」というコンテキストＣを生成する。また、他の例として、第２の生成部１４は、「検索履歴」が「売上推移」であるメタデータに対し自然言語処理を行った「売上」、「推移」というコンテキストＣを生成する。

第２の生成部１４は、任意の言語モデルを用いて、生成したコンテキストＣをベクトル空間で表現する特徴ベクトルｄ^Ｃを生成し、生成した特徴ベクトルｄ^ＣとコンテキストＣとを含むコンテキストデータＣＤを生成する。

図７は、コンテキストＣ及び可視化情報Ｖの例を示す図である。また、図８は、特徴ベクトルｄ^Ｃ及び特徴ベクトルｄ^Ｖの生成例を示す図である。図７の例では、コンテキストＣは、「商品Ａ」及び「顧客」という単語を含む。可視化情報Ｖは、入力データＤに含まれる各データの属性情報、チャートの各軸と項目との関係に関する情報、入力データＤに対して適用するフィルタ、チャートタイプ、集計方法、等の情報を含む。また、図８に示すように、可視化情報Ｖから特徴ベクトルｄ^Ｖが生成されるとともに、コンテキストＣから特徴ベクトルｄ^Ｃが生成される。

図９は、第２の生成部１４が生成する集計データｓ^Ｖ及び統計量ｔ^Ｖの例を示す図である。図９の例で、集計データｓ^Ｖは、入力データＤに含まれるデータであって可視化情報Ｖに対応するデータを集計して得られるデータである。統計量ｔ^Ｖは、集計データｓ^Ｖの統計量を表すデータである。

（ステップＳ１０３）
図５のステップＳ１０３では、第１の生成部１３は、評価用データセットＤＳを参照して複数のインサイトサブジェクトを生成する。インサイトサブジェクトが可視化候補を示すデータである場合、第１の生成部１３は、一例として、評価用データと関連データＶＤとを参照して複数のインサイトサブジェクトを生成する。この場合、第１の生成部１３は例えば、関連データＶＤに含まれる集計データｓ ^Ｖを、可視化情報Ｖが表す表示態様のチャートにプロットした可視化結果を表すインサイトサブジェクトを生成する。このとき、第１の生成部１３が、複数の可視化情報Ｖのそれぞれについてインサイトサブジェクトを生成することにより、複数のインサイトサブジェクトが生成される。また、１つの可視化情報Ｖについて１つのインサイトサブジェクトが生成されるため、可視化情報Ｖとインサイトサブジェクトとは１対１で対応する。なお、インサイトサブジェクトは可視化候補を表すデータに限られず、例えば、可視化情報Ｖがそのままインサイトサブジェクトとして扱われてもよい。

（ステップＳ１０４）
ステップＳ１０４では、評価部１２は、複数のインサイトサブジェクトの各々に対して、コンテキストデータＣＤを参照した評価を行う。このとき、評価部１２は例えば、コンテキストデータＣＤとの関連性がより高いインサイトサブジェクトに対して、より高い評価を与える。

より具体的には、評価部１２は、複数のインサイトサブジェクトの各々に対して、関連データＶＤとコンテキストデータＣＤとを参照した評価を行う。このとき、複数のインサイトサブジェクトは関連情報Ｖと１対１で対応しているため、評価部１２は、可視化情報Ｖのそれぞれについて評価を行う。換言すると、評価部１２は、複数のインサイトサブジェクトの各々に対して、関連データＶＤに含まれる関連情報Ｖ毎に評価を行う。

評価部１２が実行する評価の具体例として、ルールベースでの評価と学習ベースでの評価とについて説明する。

（ルールベースでの評価）
ルールベースの場合、評価部１２は関連データＶＤを用いてスコアｙ_０＾を計算し、スコアｙ_０＾を用いてインサイトスコアｙ＾を計算する。このとき、評価部１２は、スコアｙ_０＾をそのままインサイトスコアｙ＾として用いてもよいし、スコアｙ_０＾に正規化又は重み付けなどの処理を加えてインサイトスコアｙ＾を算出してもよい。

スコアｙ_０＾の計算方法は限定されないが、評価部１２は例えば、インサイトの種別ごとにルールベースで定義されたスコア関数を用いてもよく、また、インサイトを与えるチャートの特徴量を学習するモデルを用いてスコアｙ_０＾を算出してもよい。

スコア関数を用いる場合、スコア関数は、一例として、関連データＶＤとコンテキストデータＣＤとの関連性が高い程、高い評価値を出力する関数である。換言すると、評価部１２は、予め規定されたスコア関数であって、関連データＶＤとコンテキストデータＣＤとの関連性が高い程、高い評価値を出力するスコア関数を用いて、複数のインサイトサブジェクトに対して評価を行う。

（ルールベースでの評価の例１）
評価部１２は例えば、コンテキストデータＣＤとの関連性が低い関連データＶＤについてのインサイトスコアｙ＾をゼロ、又はマイナス値にするなどして、評価結果が低くなるようにする。コンテキストデータＣＤと関連データＶＤとの関連性の程度（類似度）の計算方法は限定されないが、評価部１２は例えば、集合の類似度（Jaccard、Dice、Simpson、等）、文字列の類似度（ハミング距離、レーベンシュタイン距離、ジャロ・ウィンクラー距離、等）、分散表現（word2vec、fastText、BERT、等）の類似度を用いる。

（ルールベースでの評価の例２）
また、評価部１２は、コンテキストデータＣＤと関連データＶＤの類似度によって重み付けされたスコアを用いて、インサイトスコアｙ＾を算出してもよい。より具体的には、例えば、関連データＶＤを用いて計算されたスコアｙ_０＾と、類似度ｓｉｍ（ＣＤ，ＶＤ）の積をインサイトスコアｙ＾としてもよい。

（学習ベースでの評価）
学習ベースの場合、評価部１２は、予め学習された評価モデルであって、関連データＶＤとコンテキストデータＣＤとが入力され、評価値を出力する評価モデルｆを用いて、複数のインサイトサブジェクトに対して評価を行う。評価モデルｆの機械学習の手法は限定されず、一例として、決定木ベース、線形回帰、又はニューラルネットワークの手法が用いられてもよく、また、これらのうちの１以上の手法が用いられてもよい。決定木ベースとしては、例えば、ＬｉｇｈｔＧＢＭ（Light Gradient Boosting Machine）、及びＸＧＢｏｏｓｔが挙げられる。線形回帰としては、例えば、サポートベクター回帰、Ｒｉｄｇｅ回帰、Ｌａｓｓｏ回帰、及びＥｌａｓｔｉｃＮｅｔが挙げられる。ニューラルネットワークとしては、例えばディープラーニングが挙げられる。

評価モデルｆの学習においては、インサイトがあるとみなせる任意の教師データが利用可能である。例えば、過去にデータ分析者によって作成されたチャートがインサイトを与える特徴を含んでいるとみなして、それらの可視化情報Ｖをポジティブサンプルとして学習に用いてもよい。また、インサイトがないと考えられるチャートの可視化情報Ｖをネガティブサンプルとして学習に用いてもよい。

図１０は、評価モデルｆの一例を示す図である。図１０の例で、評価モデルｆの入力は、特徴ベクトルｄ^Ｖ、特徴ベクトルｄ^Ｃ、集計データｓ ^Ｖ、及び統計量ｔ^Ｖを含む。評価モデルｆの出力は、評価結果であり、一例として、ユーザの求めるインサイトを与えるかを示すラベル確率である。

（学習ベースにおける評価モデルの例１）
可視化情報Ｖのインサイトに関する教師ラベルｙが与えられる場合には、分類モデルとして評価モデルを学習させることができる。例えば、ｙ∈｛０，１｝が１の場合はインサイトあり、０の場合はインサイトなし、を示すラベルとして与えられているとき、２クラス分類タスクとして、例えば以下の式（１）により与えられる損失関数Ｅ（θ）を最小化する機械学習モデルを学習させればよい。式（１）において、Ｎは学習データの数である。

上記損失関数を最小化する機械学習モデルの出力は、ｐ（ｙ＝１｜ＶＤ_ｉ，ＣＤ_ｉ）、すなわちインサイトありと判定される確率と解釈することができ、これをインサイトスコアｙ＾として用いることができる。

（学習ベースにおける評価モデルの例２）
可視化情報Ｖごとの可視化のよさを表すスコアやランキングが教師データとして与えられる場合、回帰モデルとして評価モデルを学習させることができる。例えば、ｙを教師データによって与えられたスコアであるとした場合、例えば以下の式（２）により与えられる損失関数Ｅ（θ）を最小化する機械学習モデルを学習させればよい。式（２）において、Ｎは学習データの数である。

上記の損失関数を最小化する機械学習モデルの出力は、教師データのスコアと同様に可視化のよさを表すスコアであり、これをインサイトスコアｙ＾として用いてもよい。

（ステップＳ１０５）
図５のステップＳ１０５では、評価部１２は、インサイトサブジェクトに関連する情報を表示部１９に出力し、表示部１９は、インサイトサブジェクトに関連する情報を表示する。具体的には、例えば、表示部１９は、評価部１２による評価結果と共に、又は評価部１２による評価結果に応じた表示態様にて、複数のインサイトサブジェクトの少なくとも何れかを表示する。評価結果に応じた表示態様とは、例えば、表示順、又は、表示の大きさを含む。

評価結果の表示例について、図１１～図１３を参照しつつ説明する。図１１は、インサイトサブジェクトを評価結果と共に表示する例を示す図である。図１１の例で、インサイトサブジェクトＶ７、Ｖ３、Ｖ８、…は、入力データＤの可視化結果を表すチャートであり、インサイトサブジェクトＶ７、Ｖ３、Ｖ８、…の視覚的特徴はそれぞれ異なっている。インサイトサブジェクトＶ７、Ｖ３、Ｖ８、…のそれぞれに隣接して各インサイトサブジェクトのインサイトスコアｙ＾が表示される。また、複数のインサイトサブジェクトＶ７、Ｖ３、Ｖ８、…は、インサイトスコアｙ＾の降順で表示される。

図１１の例によれば、複数のインサイトサブジェクトがインサイトスコアｙ＾の降順で表示されることにより、どのインサイトサブジェクトの評価が高いかをユーザが把握し易い。

図１２は、可視化情報Ｖを評価結果と共に表示する例を示す図である。図１２の例では、表示部１９は、関連データに含まれる各関連情報Ｖと、評価部１２による評価とを対応付けて表示する。具体的には、表示部１９は、可視化情報Ｖ１１～Ｖ１８と、可視化情報Ｖ１１～Ｖ１８のそれぞれに対応するインサイトスコアｙ＾とを対応付けて表示する。

図１３は、インサイトサブジェクトを評価結果と共に表示する例を示す図である。図１３の例では、表示部１９は、入力データＤの可視化結果であるチャート（棒グラフ）を表示するとともに、表示したチャートに対応するインサイトスコアｙ＾をチャートと共に表示する。

以上のように、本例示的実施形態に係る情報処理装置１Ａにおいては、評価部１２がコンテキストデータとの関連性がより高いインサイトサブジェクトに対して、より高い評価を与える構成が採用されている。このため、本例示的実施形態に係る情報処理装置１Ａによれば、例示的実施形態１に係る情報処理装置１の奏する効果に加えて、コンテキストデータとインサイトサブジェクトとの関連性の程度を把握し易い評価を行うことができるという効果が得られる。

〔例示的実施形態３〕
本発明の第３の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態１にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。

図１４は、本例示的実施形態に係る情報処理装置１Ｂの構成を示すブロック図である。図１４に示すように、情報処理装置１Ｂは、例示的実施形態２に係る情報処理装置１Ａの制御部１０Ａに代えて制御部１０Ｂを備える。制御部１０Ｂは、取得部１１、評価部１２、第１の生成部１３及び第２の生成部１４に加えて、学習部１５を備える。

本例示的実施形態において、入力部２０は、評価部１２の評価結果に対するユーザからのフィードバックを受け付ける。また、学習部１５は、ユーザからのフィードバックを参照して、評価モデルｆを再学習する。

学習部１５は例えば、表示部１９が表示したインサイトサブジェクトに関連する情報（インサイトスコアｙ＾、可視化情報Ｖ、チャート、等）に関するユーザの操作履歴を、ユーザからのフィードバックとして記憶部１７等に記録する。ユーザの操作履歴は、一例として、インサイトサブジェクトに関連する情報の表示時間、インサイトサブジェクトに関連する情報に対する評価ボタンの押下、等を含む。

学習部１５は、ユーザからのフィードバックを反映した評価モデルｆの再学習を行う。学習部１５は例えば、評価の高い可視化情報Ｖをポジティブサンプルとし、評価の低い可視化情報をネガティブサンプルとして、評価モデルｆの再学習を行う。

本例示的実施形態に係る情報処理装置１Ｂにおいては、入力部２０が評価結果に対するユーザからのフィードバックを受け付け、学習部１５が、ユーザからのフィードバックを参照して、評価モデルを再学習する構成が採用されている。このため、本例示的実施形態に係る情報処理装置１Ｂによれば、例示的実施形態１に係る情報処理装置１の奏する効果に加えて、評価モデルの評価精度をより高くすることができるという効果が得られる。

〔変形例〕
上述の例示的実施形態１において、１つの情報処理装置１が行っていた処理は、複数の情報処理装置に分担させてもよい。言い換えれば、情報処理装置１が行う処理の一部を、少なくとも１つの他の情報処理装置に実行させてもよい。さらに言い換えれば、上述の各処理を少なくとも１つのプロセッサに行わせる場合、その少なくとも１つのプロセッサは、１つの情報処理装置１が備えているものであってもよいし、それぞれ異なる情報処理装置が備えているものであってもよい。これは、上述の例示的実施形態２における情報処理装置１Ａ、および例示的実施形態３における情報処理装置１Ｂについても同様である。

〔ソフトウェアによる実現例〕
情報処理装置１、１Ａ、１Ｂの一部又は全部の機能は、集積回路（ＩＣチップ）等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。

後者の場合、情報処理装置１、１Ａ、１Ｂは、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例（以下、コンピュータＣと記載する）を図１５に示す。コンピュータＣは、少なくとも１つのプロセッサＣ１と、少なくとも１つのメモリＣ２と、を備えている。メモリＣ２には、コンピュータＣを情報処理装置１、１Ａ、１Ｂとして動作させるためのプログラムＰが記録されている。コンピュータＣにおいて、プロセッサＣ１は、プログラムＰをメモリＣ２から読み取って実行することにより、情報処理装置１、１Ａ、１Ｂの各機能が実現される。

プロセッサＣ１としては、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＭＰＵ（Micro Processing Unit）、ＦＰＵ（Floating point number Processing Unit）、ＰＰＵ（Physics Processing Unit）、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリＣ２としては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、又は、これらの組み合わせなどを用いることができる。

なお、コンピュータＣは、プログラムＰを実行時に展開したり、各種データを一時的に記憶したりするためのＲＡＭ（Random Access Memory）を更に備えていてもよい。また、コンピュータＣは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータＣは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。

また、プログラムＰは、コンピュータＣが読み取り可能な、一時的でない有形の記録媒体Ｍに記録することができる。このような記録媒体Ｍとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータＣは、このような記録媒体Ｍを介してプログラムＰを取得することができる。また、プログラムＰは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータＣは、このような伝送媒体を介してプログラムＰを取得することもできる。

〔付記事項１〕
本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。

〔付記事項２〕
上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。

（付記１）
評価用データセット及びコンテキストデータを取得する取得手段と、
少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う評価手段と、
を備える情報処理装置。

上記の構成によれば、データの可視化候補がユーザの求めるインサイトを与えるかについて評価することができる。

（付記２）
前記評価手段は、
前記コンテキストデータとの関連性がより高いインサイトサブジェクトに対して、より高い評価を与える、付記１に記載の情報処理装置。

上記の構成によれば、コンテキストデータとインサイトサブジェクトとの関連性の程度を把握し易い評価を行うことができる。

（付記３）
前記評価用データセットを参照して前記複数のインサイトサブジェクトを生成する第１の生成手段を更に備え、
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記コンテキストデータを参照した評価を行う、付記１または２に記載の情報処理装置。

上記の構成によれば、評価用データセットを参照して生成した複数のインサイトサブジェクトの各々に対して、ユーザの求めるインサイトを与えるかについての評価を行うことができる。

（付記４）
前記評価用データセットには、評価用データと、当該評価用データに関連する関連データとが含まれており、
前記第１の生成手段は、前記評価用データと前記関連データとを参照して前記複数のインサイトサブジェクトを生成し、
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データと前記コンテキストデータとを参照した評価を行う、付記３に記載の情報処理装置。

上記の構成によれば、評価用データセットと評価用データセットに関連する関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、ユーザの求めるインサイトを与えるかについての評価を行うことができる。

（付記５）
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データに含まれる関連情報毎に評価を行う、付記４に記載の情報処理装置。

上記の構成によれば、関連情報毎にインサイトサブジェクトを評価することができる。

（付記６）
前記コンテキストデータの少なくとも一部と前記関連データの少なくとも一部とを生成する第２の生成手段を更に備えている、付記４又は５に記載の情報処理装置。

上記の構成によれば、評価用データセットと関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、ユーザの求めるインサイトを与えるかについての評価を行うことができる。

（付記７）
前記コンテキストデータには、
コンテキスト、及び、
コンテキストの特徴ベクトル
の少なくとも何れかが含まれる、付記４から６の何れか１つに記載の情報処理装置。

（付記８）
前記関連データには、
前記評価用データに関連する関連情報、
前記関連情報の特徴ベクトル、
前記評価用データに含まれるデータであって前記関連情報に対応するデータを集計して得られる集計データ、及び、
前記集計データの統計量
の少なくとも何れかが含まれる、付記４から７の何れか１つに記載の情報処理装置。

（付記９）
前記評価手段は、
予め規定されたスコア関数であって、前記関連データと前記コンテキストデータとの関連性が高い程、高い評価値を出力するスコア関数を用いて、前記複数のインサイトサブジェクトに対して評価を行う、付記４から８の何れか１つに記載の情報処理装置。

上記の構成によれば、評価用データセットと関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、スコア関数を用いた評価を行うことができる。

（付記１０）
前記評価手段は、
予め学習された評価モデルであって、前記関連データと前記コンテキストデータとが入力され、評価値を出力する評価モデルを用いて、前記複数のインサイトサブジェクトに対して評価を行う、付記４から８の何れか１つに記載の情報処理装置。

上記の構成によれば、評価用データセットと関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、評価モデルを用いた評価を行うことができる。

（付記１１）
前記評価手段の評価結果に対するユーザからのフィードバックを受け付ける受付手段を更に備え、
前記評価手段は、前記ユーザからのフィードバックを参照して、前記評価モデルを再学習する、付記１０に記載の情報処理装置。

上記の構成によれば、インサイトサブジェクトに対する評価を行う評価モデルの評価精度をより高くすることができる。

（付記１２）
前記インサイトサブジェクトに関連する情報を表示する表示手段を更に備えている、付記４から１１の何れか１つに記載の情報処理装置。

上記の構成によれば、表示手段が表示する情報によりユーザがインサイトサブジェクトに対する評価を把握することができる。

（付記１３）
前記表示手段は、
前記評価手段による評価結果と共に、又は前記評価手段による評価結果に応じた表示態様にて、前記複数のインサイトサブジェクトの少なくとも何れかを表示する、付記１２に記載の情報処理装置。

上記の構成によれば、表示手段が表示するインサイトサブジェクトによりユーザがインサイトサブジェクトに対する評価をより把握し易くすることができる。

（付記１４）
前記表示手段は、
前記関連データに含まれる各関連情報と、前記評価手段による評価とを対応付けて表示する、付記１２に記載の情報処理装置。

上記の構成によれば、表示手段が表示する情報によりユーザが複数のインサイトサブジェクトのそれぞれに対する評価を把握することができる。

（付記１５）
少なくとも１つのプロセッサが、
評価用データセット、及びコンテキストデータを取得すること、及び、
少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行うこと、
を含む情報処理方法。

（付記１６）
コンピュータに、
評価用データセット、及びコンテキストデータを取得する処理と、
少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う処理と、
を実行させるプログラム。

〔付記事項３〕
上述した実施形態の一部又は全部は、更に、以下のように表現することもできる。

少なくとも１つのプロセッサを備え、前記プロセッサは、評価用データセット及びコンテキストデータを取得する取得処理と、少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う評価処理とを実行する情報処理装置。

なお、この情報処理装置は、更にメモリを備えていてもよく、このメモリには、前記取得処理と、前記評価処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。

１、１Ａ、１Ｂ情報処理装置
１０Ａ、１０Ｂ制御部
１１取得部（取得手段）
１２評価部（評価手段）
１３第１の生成部（第１の生成手段）
１４第２の生成部（第２の生成手段）
１５学習部（評価手段）
１７記憶部
１８通信部
１９表示部
２０入力部（受付手段）

Claims

評価用データセット及びコンテキストデータを取得する取得手段と、
少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う評価手段と
を備える情報処理装置。
前記評価手段は、
前記コンテキストデータとの関連性がより高いインサイトサブジェクトに対して、より高い評価を与える、請求項１に記載の情報処理装置。
前記評価用データセットを参照して前記複数のインサイトサブジェクトを生成する第１の生成手段を更に備え、
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記コンテキストデータを参照した評価を行う、請求項１または２に記載の情報処理装置。
前記評価用データセットには、評価用データと、当該評価用データに関連する関連データとが含まれており、
前記第１の生成手段は、前記評価用データと前記関連データとを参照して前記複数のインサイトサブジェクトを生成し、
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データと前記コンテキストデータとを参照した評価を行う、請求項３に記載の情報処理装置。
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データに含まれる関連情報毎に評価を行う、請求項４に記載の情報処理装置。
前記コンテキストデータの少なくとも一部と前記関連データの少なくとも一部とを生成する第２の生成手段を更に備えている、請求項４又は５に記載の情報処理装置。
前記コンテキストデータには、
コンテキスト、及び、
コンテキストの特徴ベクトル
の少なくとも何れかが含まれる、請求項４から６の何れか１項に記載の情報処理装置。
前記関連データには、
前記評価用データに関連する関連情報、
前記関連情報の特徴ベクトル、
前記評価用データに含まれるデータであって前記関連情報に対応するデータを集計して得られる集計データ、及び
前記集計データの統計量
の少なくとも何れかが含まれる、請求項４から７の何れか１項に記載の情報処理装置。
少なくとも１つのプロセッサが、
評価用データセット、及びコンテキストデータを取得すること、及び
少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行うこと
を含む情報処理方法。
コンピュータに、
評価用データセット、及びコンテキストデータを取得する処理と、
少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う処理と
を実行させるプログラム。