JPWO2023037398A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2023037398A5
JPWO2023037398A5 JP2023546584A JP2023546584A JPWO2023037398A5 JP WO2023037398 A5 JPWO2023037398 A5 JP WO2023037398A5 JP 2023546584 A JP2023546584 A JP 2023546584A JP 2023546584 A JP2023546584 A JP 2023546584A JP WO2023037398 A5 JPWO2023037398 A5 JP WO2023037398A5
Authority
JP
Japan
Prior art keywords
data
evaluation
insight
context
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023546584A
Other languages
English (en)
Other versions
JPWO2023037398A1 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/JP2021/032766 external-priority patent/WO2023037398A1/ja
Publication of JPWO2023037398A1 publication Critical patent/JPWO2023037398A1/ja
Publication of JPWO2023037398A5 publication Critical patent/JPWO2023037398A5/ja
Pending legal-status Critical Current

Links

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
データ分析作業においては、「仮説設定、分析・可視化、仮説検証」のサイクルを回すことが一般的であるが、その作業は非常に時間と労力を要するものである。インサイト自動発見技術は、人が有益と考える可視化候補をデータの特徴に基づいて自動的に発見する技術である。これによって、データ分析作業における作業負荷を大幅に低減することが可能である。例えば、下記の特許文献1には、データの分析結果を可視化する方法を表現したキーワードを有するテンプレートデータに基づいて、可視化対象データを可視化したインスタンスデータを生成し、インスタンスデータをインスタンスメタデータの評価値に基づいて再生成する方法が記載されている。
国際公開第2018/173251号
しかしながら、ユーザの求めるデータの可視化結果は、データの内容及びユーザのニーズ等により様々であり、画一的に定まるものではない。特許文献1に記載の技術では、テンプレートデータがユーザコンテキストを捉えていない場合には、提示された可視化候補が必ずしもユーザの求める可視化結果とは限らない、という問題があった。
本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的の一例は、データの可視化候補がユーザの求めるインサイトを与えるかについての評価を可能にする技術を提供することである。
本発明の一側面に係る情報処理装置は、評価用データセット及びコンテキストデータを取得する取得手段と、少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う評価手段とを備える。
本発明の一側面に係る情報処理方法は、少なくとも1つのプロセッサが、評価用データセット、及びコンテキストデータを取得すること、及び少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行うことを含む。
本発明の一側面に係るプログラムは、コンピュータに、評価用データセット、及びコンテキストデータを取得する処理と、少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う処理とを実行させる。
本発明の一態様によれば、データの可視化候補がユーザの求めるインサイトを与えるかについての評価を可能にすることができる。
本発明の例示的実施形態1に係る情報処理装置の構成を示すブロック図である。 本発明の例示的実施形態1に係る情報処理方法の流れを示すフロー図である。 本発明の例示的実施形態1に係るインサイトサブジェクト及び評価結果の例を示す図である。 本発明の例示的実施形態2に係る情報処理装置の構成を示すブロック図である。 本発明の例示的実施形態2に係る情報処理方法の流れを示すフロー図である。 本発明の例示的実施形態2に係る入力データの例を示す図である。 本発明の例示的実施形態2に係るコンテキスト及び可視化情報の例を示す図である。 本発明の例示的実施形態2に係る特徴ベクトルの生成例を示す図である。 本発明の例示的実施形態2に係る集計データ及び統計量の例を示す図である。 本発明の例示的実施形態2に係る評価モデルの例を示す図である。 本発明の例示的実施形態2に係るインサイトサブジェクトを評価結果と共に表示する例を示す図である。 本発明の例示的実施形態2に係る可視化情報を評価結果と共に表示する例を示す図である。 本発明の例示的実施形態2に係るインサイトサブジェクトを評価結果と共に表示する例を示す図である。 本発明の例示的実施形態3に係る情報処理装置の構成を示すブロック図である。 上記情報処理装置の各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータの一例を示す図である。
〔例示的実施形態1〕
本発明の第1の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。
<情報処理装置の構成>
本例示的実施形態に係る情報処理装置1の構成について、図1を参照して説明する。図1は、情報処理装置1の構成を示すブロック図である。情報処理装置1は、データの可視化候補がユーザの求めるインサイトを与えるかについて評価する装置である。図示のように、情報処理装置1は、取得部11及び評価部12を備える。取得部11は、評価用データセット及びコンテキストデータを取得する。評価部12は、少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行う。
(評価用データセット)
評価用データセットは、データの可視化候補を情報処理装置1が評価するために用いるデータである。評価用データセットは、可視化の対象のデータである評価用データ、及び、当該評価用データに関連する関連データ、の少なくともいずれか一方を含む。ただし、評価用データセットに含まれるデータは上述した例に限られず、評価用データセットは他の情報を含んでいてもよい。
(評価用データ)
評価用データは、可視化の対象のデータであり、一例として、複数のレコードを含む多次元データである。評価用データは一例として、ある店舗の月間の売上記録を示すデータ、店舗の規模及びエリアを示すデータ、店舗で販売されている商品の商品コード、商品名及び単価を示すデータ、及び/又は、顧客の性別、年齢、居住地、職業等を示すデータを含む。ただし、評価用データはこれに限られず、他のデータであってもよい。評価用データは、一例として、評価用データの内容を表すチャート(円グラフ、棒グラフ、線グラフ、等)として可視化される。
(関連データ)
関連データは、評価用データに関連するデータである。関連データは、一例として、評価用データの集計結果を示す集計データ、集計データの統計量、及び/又は、評価用データの可視化に利用される各種情報の集合である関連情報を含む。関連情報は、一例として、評価用データの可視化に利用されるデータの名前、データ型、集計方法の種別、及びチャートデザインの種別、の一部又は全部を含む。なお、関連データに含まれるデータは上述した例に限られず、関連データは他のデータを含んでいてもよい。
(コンテキストデータ)
コンテキストデータは、ユーザがどのようなインサイトを求めるかを表すデータである。コンテキストデータは、一例として、ユーザが求めるインサイトに関するデータであるコンテキスト、及び、コンテキストをベクトル空間で表した特徴ベクトル、の少なくともいずれか一方を含む。なお、コンテキストデータに含まれるデータは上述した例に限られず、コンテキストデータは他のデータを含んでいてもよい。
(コンテキスト)
コンテキストは、ユーザが求めるインサイトに関するデータであり、一例として、ユーザクエリ又はメタデータから抽出される言語情報である。具体的には例えば、コンテキストは、「商品Aの顧客について」というユーザクエリから抽出される「商品A」及び「顧客」という単語である。また、他の例として、コンテキストは例えば、「売上推移について」というユーザクエリから抽出される「売上」及び「推移」という単語である。また、コンテキストは例えば、「検索履歴」が「商品Aの顧客」であるメタデータから抽出される「商品A」及び「顧客」という単語である。また、コンテキストは例えば、「検索履歴」が「売上推移」であるメタデータから抽出される「売上」及び「推移」という単語である。ただし、コンテキストは言語情報に限られず、他の情報であってもよい。コンテキストは例えば、ユーザの位置を示す位置情報、単語間の関連度を表す情報、又はサイトの閲覧履歴を示す情報であってもよい。
(インサイトサブジェクト)
インサイトサブジェクトは、少なくとも評価用データセットを参照して生成されるデータである。インサイトサブジェクトは、一例として、評価用データの可視化結果を表すデータ、及び、評価用データを可視化するために用いられるデータ、の少なくともいずれか一方を含む。評価用データを可視化した可視化結果は、例えば評価用データの内容を表すチャート(円グラフ、棒グラフ、線グラフ、等)である。また、インサイトサブジェクトは、一例として、上述した関連データの一部、例えば関連データに含まれる関連情報であってもよい。換言すると、インサイトサブジェクトは、評価用データセットの一部であってもよい。ただし、インサイトサブジェクトは上述した例に限られず、他のデータであってもよい。
(インサイト)
また、本明細書において、インサイトとは、人が有益と認識する可視化結果、及び、そのような可視化結果を表すデータ、のことをいう。換言すれば、インサイトとは、人が有益と認識するインサイトサブジェクトのことをいう。
取得部11が評価用データセット及びコンテキストデータを取得する方法は特に限定されない。例えば、取得部11は、外部の記憶装置又は内部の記憶装置から評価用データセット及びコンテキストデータを読み出すことにより取得してもよく、また、通信IF又は入出力IFを介して評価用データセット及びコンテキストデータを取得してもよい。
また、評価部12が複数のインサイトサブジェクトをコンテキストデータに応じて評価する手法は特に限定されない。評価部12は、一例として、複数のインサイトサブジェクトのそれぞれについて、ユーザが求めるインサイトを与えるかの評価結果である評価値を算出する。以下では、この評価値をインサイトスコアともいう。インサイトスコアは、そのまま出力してもユーザが求めるインサイトを与えるインサイトサブジェクトを発見する大きな助けとなる。また、インサイトスコアを用いることにより、インサイトスコアが高い、すなわちユーザが求めるインサイトを与える可能性が高いインサイトサブジェクトを自動で検出することも可能になる。
評価部12は一例として、関連データとコンテキストデータとが入力され、評価値を出力する評価モデルを用いて、複数のインサイトサブジェクトに対して評価を行う。評価モデルは、予め規定されたスコア関数であってもよく、また、機械学習により構築された学習済モデルであってもよい。スコア関数を用いる場合、評価部12は一例として、関連データとコンテキストデータとの関連性が高いほど、高い評価値を出力するスコア関数を用いて、複数のインサイトサブジェクトに対して評価を行う。ただし、評価部12が行う評価の手法はこれらに限られず、他の手法が用いられてもよい。
評価用データを可視化した可視化結果は、可視化に利用される関連情報等の内容によってそれぞれ異なる。評価用データを複数の異なるパターンで可視化した複数の可視化結果のそれぞれを、以下では「可視化候補」ともいう。評価用データの複数の可視化候補がユーザに与える視覚的な特徴は、複数の可視化候補のそれぞれで異なる。
インサイトサブジェクトは、評価用データの可視化候補と1対1で対応する。そのため、評価部12が複数のインサイトサブジェクトに対してコンテキストデータに応じた評価を行うことにより、複数の可視化候補に対してコンテキストデータに応じた評価が行われる。
<情報処理方法の流れ>
本例示的実施形態に係る情報処理方法S1の流れについて、図2を参照して説明する。図2は、情報処理方法S1の流れを示すフロー図である。
ステップS11では、少なくとも1つのプロセッサが、評価用データセット、及びコンテキストデータを取得する。そして、ステップS12では、少なくとも1つのプロセッサが、少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行う。これにより、図2の情報処理方法S1は終了する。
なお、1つのプロセッサにS11~S12の処理を実行させてもよいし、S11の処理とS12の処理とをそれぞれ別のプロセッサに実行させてもよい。後者の場合、各プロセッサは、1つの情報処理装置が備えているものであってもよいし、それぞれ異なる情報処理装置が備えているものであってもよい。また、S11~S12の処理を実行する少なくとも1つのプロセッサは、情報処理装置1が備えているものであってもよい。
図3は、インサイトサブジェクト及び評価結果の例を示す図である。図3の例において、インサイトサブジェクトV1~V8は、評価用データの可視化候補を表すデータである。評価結果は、インサイトサブジェクトV1~V8のそれぞれについて、評価部12がインサイトスコアを算出した結果である。図3の例では、インサイトサブジェクトV1のインサイトスコアは「0.2」であり、インサイトサブジェクトV2のインサイトスコアは「0.1」である。同様に、インサイトサブジェクトV3~V8のインサイトスコアはそれぞれ、「0.8」、「0.6」、「0.3」、「0.5」、「0.9」、「0.7」である。
本例示的実施形態に係る情報処理装置1においては、評価用データセット及びコンテキストデータを取得する取得部11と、少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行う評価部12と、を備える、という構成が採用されている。このため、本例示的実施形態に係る情報処理装置1によれば、データの可視化候補がユーザの求めるインサイトを与えるかについて評価することが可能になる、という効果が得られる。
上述の情報処理装置1の機能は、プログラムによって実現することもできる。本例示的実施形態に係るプログラムは、コンピュータに、評価用データセット、及びコンテキストデータを取得する処理と、少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行う処理と、を実行させる。したがって、本例示的実施形態に係るプログラムによれば、データの可視化候補がユーザの求めるインサイトを与えるかについて評価することが可能になる、という効果が得られる。
また、本例示的実施形態に係る情報処理方法S1においては、少なくとも1つのプロセッサが、評価用データセット、及びコンテキストデータを取得すること、及び少なくとも評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータに応じた評価を行うことを含む、という構成が採用されている。このため、本例示的実施形態に係る情報処理方法S1によれば、ユーザが求めるインサイトを与えるかについて可視化候補を評価することが可能になるという効果が得られる。
〔例示的実施形態2〕
本発明の第2の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を繰り返さない。
<情報処理装置の構成>
図4は、情報処理装置1Aの構成を示すブロック図である。情報処理装置1Aは、情報処理装置1Aの各部を統括して制御する制御部10Aと、情報処理装置1Aが使用する各種データを記憶する記憶部17とを備える。また、情報処理装置1Aは、情報処理装置1Aが他の装置と通信するための通信部18、情報処理装置1Aがデータを表示出力するための表示部19、及び情報処理装置1Aに対する入力を受け付ける入力部20を備える。以下では、表示部19がデータを表示出力する例を説明するが、情報処理装置1Aは、例えば印字出力や音声出力等の態様でデータを出力してもよい。また、表示部19と入力部20とは、情報処理装置1Aに外付けされた、情報処理装置1Aの外部の機器であってもよい。
制御部10Aは、取得部11、評価部12、第1の生成部13、及び第2の生成部14を含む。また、記憶部17には、評価用データセットDS、コンテキストデータCD、評価モデルパラメータEMP、評価結果ER、及び表示用データDDが記憶される。
(評価用データセットDS)
評価用データセットDSには、評価用データと、当該評価用データに関連する関連データVDとが含まれている。評価用データは、可視化の対象であるデータであり、一例として、ある店舗の月間の売上記録を示すデータ、店舗の規模及びエリアを示すデータ、店舗で販売されている商品の商品コード、商品名及び単価を示すデータ、及び/又は、顧客の性別、年齢、居住地、職業等を示すデータである。
(関連データVD)
関連データVDは、評価用データに関連するデータである。関連データVDには、
・評価用データに関連する関連情報V
・関連情報Vをベクトル空間で表した特徴ベクトルd
・評価用データに含まれるデータであって関連情報Vに対応するデータを集計して得られる集計データs、及び、
・集計データsの統計量t
の少なくともいずれかが含まれる。
(関連情報V)
関連情報Vは、一例として、評価用データの可視化に利用される各種情報の集合であり、例えば以下の情報を含む。
・評価用データに含まれる各データの属性情報
・集計方法(フィルタ、集計関数、集計のキーとなる列名、等)に関する情報(評価用データに対して適用するフィルタに関する情報、等)
・チャートデザイン(x軸、y軸、チャートタイプ、プロットタイプ、等)に関する情報(チャートの各軸と項目との関係に関する情報、等)
(特徴ベクトルd
関連情報の特徴ベクトルdは、関連情報Vをベクトル空間で表現したものである。ベクトル化の方法は任意であるが、例えば単語の分散表現などを用いてもよい。
(集計データs
集計データsは、評価用データから関連情報Vに対応する数値を集計したデータである。集計データsは、関連情報Vの可視化結果としてチャートにプロットされる。
(統計量t
集計データsの統計量tは、集計データsについての各種統計量を並べたものである。利用する統計量は任意であるが、例えば以下のものが統計量tとして利用可能である。
・最大値、最小値、中央値
・平均値、標準偏差、分散
・カーディナリティ
・ゼロ値の割合、欠損値の割合
・尖度、歪度
・エントロピー
・ジニ係数
(コンテキストデータCD)
コンテキストデータCDには、
・コンテキストC、及び、
・コンテキストをベクトル空間で表した特徴ベクトルd
の少なくとも何れかが含まれる。
(コンテキストC)
コンテキストCは、ユーザが求めるインサイトに関するデータである。コンテキストCは、一例として、ユーザが求めるインサイトを自然言語で表すデータであり、ユーザが求めるインサイトの質及び量に関するデータを含む。コンテキストCは、後述のユーザクエリQ及び/又はメタデータMから抽出されてもよい。コンテキストCは一例として、「商品A」及び「顧客」という単語を含む。
(特徴ベクトルd
コンテキストCの特徴ベクトルdは、コンテキストCをベクトル空間で表したものである。ベクトル化の方法は任意であるが、一例として、単語の分散表現などを用いてもよい。
(ユーザクエリQ)
ユーザクエリQは、ユーザが求めるインサイトに関するクエリであり、ユーザによって自然言語で与えられる。ユーザクエリQは、例えば以下の情報を含む。
・分析対象とするデータについての情報(例:「商品A」、「売上」)
・インサイトに対する仮説(例:「~が増加している」、「~が突出している」)
・想定するチャートの特徴(例:地域別集計、円グラフ)
(メタデータM)
メタデータMは、ユーザの求めるインサイトが推定できる情報である。メタデータMは、一例として、所定のシステムにより自動的に収集される。メタデータMは、例えば以下の情報を含む。
・ユーザの検索履歴(例:「商品A、顧客」で検索している)
・ユーザの分析履歴(例:商品Aの顧客分析を過去に実施)
・ユーザの評価履歴(例:商品Aの顧客についてのチャート等を高く評価していた)
・ユーザの行動履歴(例:商品Aのサイト又は販売店舗をxx分滞在していた)
(評価モデルパラメータEMP)
評価モデルパラメータEMPは、評価モデルfを規定するパラメータである。評価モデルfは、関連データVD及びコンテキストデータCDを入力とし、入力された関連データVDに対応するインサイトサブジェクトを定量的に評価するモデルである。評価モデルfとしては、インサイトサブジェクトの評価結果の推定に利用できるものであれば任意のモデルが利用可能である。例えば、後述するようなルールベースのモデル、又は、機械学習により構築されたモデル等が評価モデルfとして利用可能である。評価モデルfの出力は、一例として、評価結果を表すスコア、又は、ラベル確率である。評価モデルfについては後述する。
(評価結果ER)
評価結果ERは、評価部12によるインサイトサブジェクトの評価結果を示すデータである。評価結果ERは、一例として、複数のインサイトサブジェクトのそれぞれについての評価結果を表すインサイトスコアy^である。
(インサイトスコアy^)
インサイトスコアy^は、評価モデルfの出力値に基づいて計算される可視化のよさの定量的指標である。インサイトスコアy^は例えば、評価モデルfの出力値であってもよく、また、評価モデルfの出力値に正規化及び/又は重み付け等の処理を加えた値であってもよい。インサイトスコアy^の算出方法の具体例については後述する。
(表示用データDD)
表示用データDDは、情報処理装置1Aによるインサイトサブジェクトの評価結果をユーザに提示するためのデータ、すなわちユーザが求めるインサイトを与えるかについてのインサイトサブジェクトの評価結果に関するデータである。
(取得部11)
取得部11は、評価用データセットDS及びコンテキストデータCDを取得する。取得部11は、一例として、評価用データセットDS及びコンテキストデータCDを記憶部17から読み出すことにより取得する。ただし、評価用データセットDS及びコンテキストデータCDの取得方法は特に限定されない。例えば、取得部11は、情報処理装置1Aのユーザが入力部20を介して入力した評価用データセットDS及びコンテキストデータCDを取得してもよい。また、例えば、取得部11は、通信部18を介した通信により、外部の装置から評価用データセットDS及びコンテキストデータCDを取得してもよい。
(評価部12)
評価部12は、少なくとも評価用データセットDSを参照して生成された複数のインサイトサブジェクトに対して、コンテキストデータCDに応じた評価を行う。評価部12は、一例として、複数のインサイトサブジェクトのそれぞれについてインサイトスコアy^を算出し、その算出結果を示す評価結果ERを生成して記憶部17に記憶させる。
(第1の生成部13・第2の生成部14)
第1の生成部13は、評価用データセットDSを参照して複数のインサイトサブジェクトを生成する。また、第1の生成部13は、評価部12の評価結果に関する表示用データDDを生成する。第2の生成部14は、コンテキストデータCDの少なくとも一部と関連データVDの少なくとも一部とを生成する。
<情報処理方法の流れ>
本例示的実施形態に係る情報処理方法の流れについて、図面を参照して説明する。図5は、情報処理方法の流れを示すフロー図である。以下では、関連情報Vが評価用データの可視化に利用される可視化情報である場合について説明する。以下では、関連情報Vの一例である可視化情報を「可視化情報V」ともいう。
(ステップS101)
ステップS101では、取得部11が、入力データD及びコンテキスト生成用データを取得する。入力データDは、本明細書に係る評価用データの一例である。入力データDは、チャートにプロットされるデータを含んでいればよく、入力データDのフォーマットとしては任意のフォーマットが利用可能である。取得部11は一例として、入力部20又は通信部18を介して入力データDを取得する。
図6は、入力データDの例を示す図である。図6の例では、入力データDは、売上データ、店舗データ、商品データ、及び顧客データを含む。売上データ、店舗データ、商品データ及び顧客データは、何れも複数のレコードを含む多次元データのデータセットである。売上データは、「日付」、「商品コード」、「顧客コード」、「店舗コード」、及び「売上」のデータ項目を含む多次元データである。店舗データは、「店舗コード」、「店舗名」、「エリア」、及び「規模」のデータ項目を含む多次元データである。商品データは、「商品コード」、「商品名」、「分類」、及び「単価」のデータ項目を含む多次元データである。顧客データは、「顧客コード」、「年齢」、「性別」、「居住地」、「職業」、及び「収入」のデータ項目を含む多次元データである。
(コンテキスト生成用データ)
コンテキスト生成用データは、コンテキストCを生成するためのデータであり、一例として、ユーザクエリQ及びメタデータMの一方又は両方を含む。コンテキスト生成用データは、複数のユーザクエリを含んでいてもよく、また、複数のメタデータを含んでいてもよい。ただし、コンテキスト生成用データはユーザクエリ及びメタデータに限られず、他のデータであってもよい。また、コンテキスト生成用データは、そのままでコンテキストCとして利用可能なデータであってもよい。取得部11は、一例として、入力部20又は通信部18を介してコンテキスト生成用データを取得してもよく、また、記憶部17からコンテキスト生成用データを読み出すことにより取得してもよい。
(ステップS102)
ステップS102では、第2の生成部14が評価用データセットDS及びコンテキストデータCDを生成する。評価用データセットDSの生成及びコンテキストデータCDの生成の具体例について以下に説明する。
(評価用データセットDSの生成)
第2の生成部14は、まず、可視化情報Vを取得する。第2の生成部14は、記憶部17の所定の記憶領域から可視化情報Vを読み出すことにより取得してもよく、また、入力部20又は通信部18を介して可視化情報Vを取得してもよい。このとき、第2の生成部14は、複数の可視化情報Vを取得する。可視化情報Vは、一例として、入力データDに含まれる各データの属性情報、チャートの各軸と項目との関係に関する情報、入力データDに対して適用するフィルタ、チャートタイプ、集計方法、等の情報を含む。
また、第2の生成部14は、任意の言語モデルを用いて、取得した可視化情報Vをベクトル空間で表現する特徴ベクトルdを生成する。特徴ベクトルdは、複数の可視化情報Vのそれぞれについて生成される。また、第2の生成部14は、入力データDから可視化情報Vに対応する数値を集計した集計データs、及び、集計データsについての各種統計量の集合である統計量tを生成する。
第2の生成部14は、取得した可視化情報V、及び、生成した特徴ベクトルd、集計データs、統計量tを含む関連データVDと、ステップS101で取得部11が取得した入力データDとを含む評価用データセットDSを生成する。関連データVDには、複数の可視化情報V及び複数の特徴ベクトルdが含まれてもよく、また、1対の可視化情報V及び特徴ベクトルdが含まれてもよい。
(コンテキストデータCDの生成)
また、第2の生成部14は、ステップS101で取得部11が取得したコンテキスト生成用データに対し任意の自然言語処理を実行してコンテキストCを生成する。なお、第2の生成部14は、コンテキスト生成用データをそのままコンテキストCとして用いてもよい。
一例として、第2の生成部14は、「商品Aの顧客について」というユーザクエリに対し自然言語処理を実行し、「商品A」、「顧客」というコンテキストCを生成する。また、他の例として、第2の生成部14は、「売上推移について」というユーザクエリに対し自然言語処理を行い、「売上」、「推移」というコンテキストCを生成する。また、他の例として、第2の生成部14は、「検索履歴」が「商品Aの顧客」であるメタデータに対し自然言語処理を行って「商品A」、「顧客」というコンテキストCを生成する。また、他の例として、第2の生成部14は、「検索履歴」が「売上推移」であるメタデータに対し自然言語処理を行った「売上」、「推移」というコンテキストCを生成する。
第2の生成部14は、任意の言語モデルを用いて、生成したコンテキストCをベクトル空間で表現する特徴ベクトルdを生成し、生成した特徴ベクトルdとコンテキストCとを含むコンテキストデータCDを生成する。
図7は、コンテキストC及び可視化情報Vの例を示す図である。また、図8は、特徴ベクトルd及び特徴ベクトルdの生成例を示す図である。図7の例では、コンテキストCは、「商品A」及び「顧客」という単語を含む。可視化情報Vは、入力データDに含まれる各データの属性情報、チャートの各軸と項目との関係に関する情報、入力データDに対して適用するフィルタ、チャートタイプ、集計方法、等の情報を含む。また、図8に示すように、可視化情報Vから特徴ベクトルdが生成されるとともに、コンテキストCから特徴ベクトルdが生成される。
図9は、第2の生成部14が生成する集計データs及び統計量tの例を示す図である。図9の例で、集計データsは、入力データDに含まれるデータであって可視化情報Vに対応するデータを集計して得られるデータである。統計量tは、集計データsの統計量を表すデータである。
(ステップS103)
図5のステップS103では、第1の生成部13は、評価用データセットDSを参照して複数のインサイトサブジェクトを生成する。インサイトサブジェクトが可視化候補を示すデータである場合、第1の生成部13は、一例として、評価用データと関連データVDとを参照して複数のインサイトサブジェクトを生成する。この場合、第1の生成部13は例えば、関連データVDに含まれる集計データ を、可視化情報Vが表す表示態様のチャートにプロットした可視化結果を表すインサイトサブジェクトを生成する。このとき、第1の生成部13が、複数の可視化情報Vのそれぞれについてインサイトサブジェクトを生成することにより、複数のインサイトサブジェクトが生成される。また、1つの可視化情報Vについて1つのインサイトサブジェクトが生成されるため、可視化情報Vとインサイトサブジェクトとは1対1で対応する。なお、インサイトサブジェクトは可視化候補を表すデータに限られず、例えば、可視化情報Vがそのままインサイトサブジェクトとして扱われてもよい。
(ステップS104)
ステップS104では、評価部12は、複数のインサイトサブジェクトの各々に対して、コンテキストデータCDを参照した評価を行う。このとき、評価部12は例えば、コンテキストデータCDとの関連性がより高いインサイトサブジェクトに対して、より高い評価を与える。
より具体的には、評価部12は、複数のインサイトサブジェクトの各々に対して、関連データVDとコンテキストデータCDとを参照した評価を行う。このとき、複数のインサイトサブジェクトは関連情報Vと1対1で対応しているため、評価部12は、可視化情報Vのそれぞれについて評価を行う。換言すると、評価部12は、複数のインサイトサブジェクトの各々に対して、関連データVDに含まれる関連情報V毎に評価を行う。
評価部12が実行する評価の具体例として、ルールベースでの評価と学習ベースでの評価とについて説明する。
(ルールベースでの評価)
ルールベースの場合、評価部12は関連データVDを用いてスコアy^を計算し、スコアy^を用いてインサイトスコアy^を計算する。このとき、評価部12は、スコアy^をそのままインサイトスコアy^として用いてもよいし、スコアy^に正規化又は重み付けなどの処理を加えてインサイトスコアy^を算出してもよい。
スコアy^の計算方法は限定されないが、評価部12は例えば、インサイトの種別ごとにルールベースで定義されたスコア関数を用いてもよく、また、インサイトを与えるチャートの特徴量を学習するモデルを用いてスコアy^を算出してもよい。
スコア関数を用いる場合、スコア関数は、一例として、関連データVDとコンテキストデータCDとの関連性が高い程、高い評価値を出力する関数である。換言すると、評価部12は、予め規定されたスコア関数であって、関連データVDとコンテキストデータCDとの関連性が高い程、高い評価値を出力するスコア関数を用いて、複数のインサイトサブジェクトに対して評価を行う。
(ルールベースでの評価の例1)
評価部12は例えば、コンテキストデータCDとの関連性が低い関連データVDについてのインサイトスコアy^をゼロ、又はマイナス値にするなどして、評価結果が低くなるようにする。コンテキストデータCDと関連データVDとの関連性の程度(類似度)の計算方法は限定されないが、評価部12は例えば、集合の類似度(Jaccard、Dice、Simpson、等)、文字列の類似度(ハミング距離、レーベンシュタイン距離、ジャロ・ウィンクラー距離、等)、分散表現(word2vec、fastText、BERT、等)の類似度を用いる。
(ルールベースでの評価の例2)
また、評価部12は、コンテキストデータCDと関連データVDの類似度によって重み付けされたスコアを用いて、インサイトスコアy^を算出してもよい。より具体的には、例えば、関連データVDを用いて計算されたスコアy^と、類似度sim(CD,VD)の積をインサイトスコアy^としてもよい。
(学習ベースでの評価)
学習ベースの場合、評価部12は、予め学習された評価モデルであって、関連データVDとコンテキストデータCDとが入力され、評価値を出力する評価モデルfを用いて、複数のインサイトサブジェクトに対して評価を行う。評価モデルfの機械学習の手法は限定されず、一例として、決定木ベース、線形回帰、又はニューラルネットワークの手法が用いられてもよく、また、これらのうちの1以上の手法が用いられてもよい。決定木ベースとしては、例えば、LightGBM(Light Gradient Boosting Machine)、及びXGBoostが挙げられる。線形回帰としては、例えば、サポートベクター回帰、Ridge回帰、Lasso回帰、及びElasticNetが挙げられる。ニューラルネットワークとしては、例えばディープラーニングが挙げられる。
評価モデルfの学習においては、インサイトがあるとみなせる任意の教師データが利用可能である。例えば、過去にデータ分析者によって作成されたチャートがインサイトを与える特徴を含んでいるとみなして、それらの可視化情報Vをポジティブサンプルとして学習に用いてもよい。また、インサイトがないと考えられるチャートの可視化情報Vをネガティブサンプルとして学習に用いてもよい。
図10は、評価モデルfの一例を示す図である。図10の例で、評価モデルfの入力は、特徴ベクトルd、特徴ベクトルd 、集計データ 、及び統計量tを含む。評価モデルfの出力は、評価結果であり、一例として、ユーザの求めるインサイトを与えるかを示すラベル確率である。
(学習ベースにおける評価モデルの例1)
可視化情報Vのインサイトに関する教師ラベルyが与えられる場合には、分類モデルとして評価モデルを学習させることができる。例えば、y∈{0,1}が1の場合はインサイトあり、0の場合はインサイトなし、を示すラベルとして与えられているとき、2クラス分類タスクとして、例えば以下の式(1)により与えられる損失関数E(θ)を最小化する機械学習モデルを学習させればよい。式(1)において、Nは学習データの数である。
Figure 2023037398000001
上記損失関数を最小化する機械学習モデルの出力は、p(y=1|VD,CD)、すなわちインサイトありと判定される確率と解釈することができ、これをインサイトスコアy^として用いることができる。
(学習ベースにおける評価モデルの例2)
可視化情報Vごとの可視化のよさを表すスコアやランキングが教師データとして与えられる場合、回帰モデルとして評価モデルを学習させることができる。例えば、yを教師データによって与えられたスコアであるとした場合、例えば以下の式(2)により与えられる損失関数E(θ)を最小化する機械学習モデルを学習させればよい。式(2)において、Nは学習データの数である。
Figure 2023037398000002
上記の損失関数を最小化する機械学習モデルの出力は、教師データのスコアと同様に可視化のよさを表すスコアであり、これをインサイトスコアy^として用いてもよい。
(ステップS105)
図5のステップS105では、評価部12は、インサイトサブジェクトに関連する情報を表示部19に出力し、表示部19は、インサイトサブジェクトに関連する情報を表示する。具体的には、例えば、表示部19は、評価部12による評価結果と共に、又は評価部12による評価結果に応じた表示態様にて、複数のインサイトサブジェクトの少なくとも何れかを表示する。評価結果に応じた表示態様とは、例えば、表示順、又は、表示の大きさを含む。
評価結果の表示例について、図11~図13を参照しつつ説明する。図11は、インサイトサブジェクトを評価結果と共に表示する例を示す図である。図11の例で、インサイトサブジェクトV7、V3、V8、…は、入力データDの可視化結果を表すチャートであり、インサイトサブジェクトV7、V3、V8、…の視覚的特徴はそれぞれ異なっている。インサイトサブジェクトV7、V3、V8、…のそれぞれに隣接して各インサイトサブジェクトのインサイトスコアy^が表示される。また、複数のインサイトサブジェクトV7、V3、V8、…は、インサイトスコアy^の降順で表示される。
図11の例によれば、複数のインサイトサブジェクトがインサイトスコアy^の降順で表示されることにより、どのインサイトサブジェクトの評価が高いかをユーザが把握し易い。
図12は、可視化情報Vを評価結果と共に表示する例を示す図である。図12の例では、表示部19は、関連データに含まれる各関連情報Vと、評価部12による評価とを対応付けて表示する。具体的には、表示部19は、可視化情報V11~V18と、可視化情報V11~V18のそれぞれに対応するインサイトスコアy^とを対応付けて表示する。
図13は、インサイトサブジェクトを評価結果と共に表示する例を示す図である。図13の例では、表示部19は、入力データDの可視化結果であるチャート(棒グラフ)を表示するとともに、表示したチャートに対応するインサイトスコアy^をチャートと共に表示する。
以上のように、本例示的実施形態に係る情報処理装置1Aにおいては、評価部12がコンテキストデータとの関連性がより高いインサイトサブジェクトに対して、より高い評価を与える構成が採用されている。このため、本例示的実施形態に係る情報処理装置1Aによれば、例示的実施形態1に係る情報処理装置1の奏する効果に加えて、コンテキストデータとインサイトサブジェクトとの関連性の程度を把握し易い評価を行うことができるという効果が得られる。
〔例示的実施形態3〕
本発明の第3の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態1にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。
図14は、本例示的実施形態に係る情報処理装置1Bの構成を示すブロック図である。図14に示すように、情報処理装置1Bは、例示的実施形態2に係る情報処理装置1Aの制御部10Aに代えて制御部10Bを備える。制御部10Bは、取得部11、評価部12、第1の生成部13及び第2の生成部14に加えて、学習部15を備える。
本例示的実施形態において、入力部20は、評価部12の評価結果に対するユーザからのフィードバックを受け付ける。また、学習部15は、ユーザからのフィードバックを参照して、評価モデルfを再学習する。
学習部15は例えば、表示部19が表示したインサイトサブジェクトに関連する情報(インサイトスコアy^、可視化情報V、チャート、等)に関するユーザの操作履歴を、ユーザからのフィードバックとして記憶部17等に記録する。ユーザの操作履歴は、一例として、インサイトサブジェクトに関連する情報の表示時間、インサイトサブジェクトに関連する情報に対する評価ボタンの押下、等を含む。
学習部15は、ユーザからのフィードバックを反映した評価モデルfの再学習を行う。学習部15は例えば、評価の高い可視化情報Vをポジティブサンプルとし、評価の低い可視化情報をネガティブサンプルとして、評価モデルfの再学習を行う。
本例示的実施形態に係る情報処理装置1Bにおいては、入力部20が評価結果に対するユーザからのフィードバックを受け付け、学習部15が、ユーザからのフィードバックを参照して、評価モデルを再学習する構成が採用されている。このため、本例示的実施形態に係る情報処理装置1Bによれば、例示的実施形態1に係る情報処理装置1の奏する効果に加えて、評価モデルの評価精度をより高くすることができるという効果が得られる。
〔変形例〕
上述の例示的実施形態1において、1つの情報処理装置1が行っていた処理は、複数の情報処理装置に分担させてもよい。言い換えれば、情報処理装置1が行う処理の一部を、少なくとも1つの他の情報処理装置に実行させてもよい。さらに言い換えれば、上述の各処理を少なくとも1つのプロセッサに行わせる場合、その少なくとも1つのプロセッサは、1つの情報処理装置1が備えているものであってもよいし、それぞれ異なる情報処理装置が備えているものであってもよい。これは、上述の例示的実施形態2における情報処理装置1A、および例示的実施形態3における情報処理装置1Bについても同様である。
〔ソフトウェアによる実現例〕
情報処理装置1、1A、1Bの一部又は全部の機能は、集積回路(ICチップ)等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。
後者の場合、情報処理装置1、1A、1Bは、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例(以下、コンピュータCと記載する)を図15に示す。コンピュータCは、少なくとも1つのプロセッサC1と、少なくとも1つのメモリC2と、を備えている。メモリC2には、コンピュータCを情報処理装置1、1A、1Bとして動作させるためのプログラムPが記録されている。コンピュータCにおいて、プロセッサC1は、プログラムPをメモリC2から読み取って実行することにより、情報処理装置1、1A、1Bの各機能が実現される。
プロセッサC1としては、例えば、CPU(Central Processing Unit)、GPU(Graphic Processing Unit)、DSP(Digital Signal Processor)、MPU(Micro Processing Unit)、FPU(Floating point number Processing Unit)、PPU(Physics Processing Unit)、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリC2としては、例えば、フラッシュメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又は、これらの組み合わせなどを用いることができる。
なお、コンピュータCは、プログラムPを実行時に展開したり、各種データを一時的に記憶したりするためのRAM(Random Access Memory)を更に備えていてもよい。また、コンピュータCは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータCは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。
また、プログラムPは、コンピュータCが読み取り可能な、一時的でない有形の記録媒体Mに記録することができる。このような記録媒体Mとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータCは、このような記録媒体Mを介してプログラムPを取得することができる。また、プログラムPは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータCは、このような伝送媒体を介してプログラムPを取得することもできる。
〔付記事項1〕
本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。
〔付記事項2〕
上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。
(付記1)
評価用データセット及びコンテキストデータを取得する取得手段と、
少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う評価手段と、
を備える情報処理装置。
上記の構成によれば、データの可視化候補がユーザの求めるインサイトを与えるかについて評価することができる。
(付記2)
前記評価手段は、
前記コンテキストデータとの関連性がより高いインサイトサブジェクトに対して、より高い評価を与える、付記1に記載の情報処理装置。
上記の構成によれば、コンテキストデータとインサイトサブジェクトとの関連性の程度を把握し易い評価を行うことができる。
(付記3)
前記評価用データセットを参照して前記複数のインサイトサブジェクトを生成する第1の生成手段を更に備え、
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記コンテキストデータを参照した評価を行う、付記1または2に記載の情報処理装置。
上記の構成によれば、評価用データセットを参照して生成した複数のインサイトサブジェクトの各々に対して、ユーザの求めるインサイトを与えるかについての評価を行うことができる。
(付記4)
前記評価用データセットには、評価用データと、当該評価用データに関連する関連データとが含まれており、
前記第1の生成手段は、前記評価用データと前記関連データとを参照して前記複数のインサイトサブジェクトを生成し、
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データと前記コンテキストデータとを参照した評価を行う、付記3に記載の情報処理装置。
上記の構成によれば、評価用データセットと評価用データセットに関連する関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、ユーザの求めるインサイトを与えるかについての評価を行うことができる。
(付記5)
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データに含まれる関連情報毎に評価を行う、付記4に記載の情報処理装置。
上記の構成によれば、関連情報毎にインサイトサブジェクトを評価することができる。
(付記6)
前記コンテキストデータの少なくとも一部と前記関連データの少なくとも一部とを生成する第2の生成手段を更に備えている、付記4又は5に記載の情報処理装置。
上記の構成によれば、評価用データセットと関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、ユーザの求めるインサイトを与えるかについての評価を行うことができる。
(付記7)
前記コンテキストデータには、
コンテキスト、及び、
コンテキストの特徴ベクトル
の少なくとも何れかが含まれる、付記4から6の何れか1つに記載の情報処理装置。
上記の構成によれば、評価用データセットと関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、ユーザの求めるインサイトを与えるかについての評価を行うことができる。
(付記8)
前記関連データには、
前記評価用データに関連する関連情報、
前記関連情報の特徴ベクトル、
前記評価用データに含まれるデータであって前記関連情報に対応するデータを集計して得られる集計データ、及び、
前記集計データの統計量
の少なくとも何れかが含まれる、付記4から7の何れか1つに記載の情報処理装置。
上記の構成によれば、評価用データセットと関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、ユーザの求めるインサイトを与えるかについての評価を行うことができる。
(付記9)
前記評価手段は、
予め規定されたスコア関数であって、前記関連データと前記コンテキストデータとの関連性が高い程、高い評価値を出力するスコア関数を用いて、前記複数のインサイトサブジェクトに対して評価を行う、付記4から8の何れか1つに記載の情報処理装置。
上記の構成によれば、評価用データセットと関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、スコア関数を用いた評価を行うことができる。
(付記10)
前記評価手段は、
予め学習された評価モデルであって、前記関連データと前記コンテキストデータとが入力され、評価値を出力する評価モデルを用いて、前記複数のインサイトサブジェクトに対して評価を行う、付記4から8の何れか1つに記載の情報処理装置。
上記の構成によれば、評価用データセットと関連データとを参照して生成した複数のインサイトサブジェクトの各々に対して、評価モデルを用いた評価を行うことができる。
(付記11)
前記評価手段の評価結果に対するユーザからのフィードバックを受け付ける受付手段を更に備え、
前記評価手段は、前記ユーザからのフィードバックを参照して、前記評価モデルを再学習する、付記10に記載の情報処理装置。
上記の構成によれば、インサイトサブジェクトに対する評価を行う評価モデルの評価精度をより高くすることができる。
(付記12)
前記インサイトサブジェクトに関連する情報を表示する表示手段を更に備えている、付記4から11の何れか1つに記載の情報処理装置。
上記の構成によれば、表示手段が表示する情報によりユーザがインサイトサブジェクトに対する評価を把握することができる。
(付記13)
前記表示手段は、
前記評価手段による評価結果と共に、又は前記評価手段による評価結果に応じた表示態様にて、前記複数のインサイトサブジェクトの少なくとも何れかを表示する、付記12に記載の情報処理装置。
上記の構成によれば、表示手段が表示するインサイトサブジェクトによりユーザがインサイトサブジェクトに対する評価をより把握し易くすることができる。
(付記14)
前記表示手段は、
前記関連データに含まれる各関連情報と、前記評価手段による評価とを対応付けて表示する、付記12に記載の情報処理装置。
上記の構成によれば、表示手段が表示する情報によりユーザが複数のインサイトサブジェクトのそれぞれに対する評価を把握することができる。
(付記15)
少なくとも1つのプロセッサが、
評価用データセット、及びコンテキストデータを取得すること、及び、
少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行うこと、
を含む情報処理方法。
(付記16)
コンピュータに、
評価用データセット、及びコンテキストデータを取得する処理と、
少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う処理と、
を実行させるプログラム。
〔付記事項3〕
上述した実施形態の一部又は全部は、更に、以下のように表現することもできる。
少なくとも1つのプロセッサを備え、前記プロセッサは、評価用データセット及びコンテキストデータを取得する取得処理と、少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う評価処理とを実行する情報処理装置。
なお、この情報処理装置は、更にメモリを備えていてもよく、このメモリには、前記取得処理と、前記評価処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。
1、1A、1B 情報処理装置
10A、10B 制御部
11 取得部(取得手段)
12 評価部(評価手段)
13 第1の生成部(第1の生成手段)
14 第2の生成部(第2の生成手段)
15 学習部(評価手段)
17 記憶部
18 通信部
19 表示部
20 入力部(受付手段)

Claims (10)

  1. 評価用データセット及びコンテキストデータを取得する取得手段と、
    少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う評価手段と
    を備える情報処理装置。
  2. 前記評価手段は、
    前記コンテキストデータとの関連性がより高いインサイトサブジェクトに対して、より高い評価を与える、請求項1に記載の情報処理装置。
  3. 前記評価用データセットを参照して前記複数のインサイトサブジェクトを生成する第1の生成手段を更に備え、
    前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記コンテキストデータを参照した評価を行う、請求項1または2に記載の情報処理装置。
  4. 前記評価用データセットには、評価用データと、当該評価用データに関連する関連データとが含まれており、
    前記第1の生成手段は、前記評価用データと前記関連データとを参照して前記複数のインサイトサブジェクトを生成し、
    前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データと前記コンテキストデータとを参照した評価を行う、請求項3に記載の情報処理装置。
  5. 前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データに含まれる関連情報毎に評価を行う、請求項4に記載の情報処理装置。
  6. 前記コンテキストデータの少なくとも一部と前記関連データの少なくとも一部とを生成する第2の生成手段を更に備えている、請求項4又は5に記載の情報処理装置。
  7. 前記コンテキストデータには、
    コンテキスト、及び、
    コンテキストの特徴ベクトル
    の少なくとも何れかが含まれる、請求項4から6の何れか1項に記載の情報処理装置。
  8. 前記関連データには、
    前記評価用データに関連する関連情報、
    前記関連情報の特徴ベクトル、
    前記評価用データに含まれるデータであって前記関連情報に対応するデータを集計して得られる集計データ、及び
    前記集計データの統計量
    の少なくとも何れかが含まれる、請求項4から7の何れか1項に記載の情報処理装置。
  9. 少なくとも1つのプロセッサが、
    評価用データセット、及びコンテキストデータを取得すること、及び
    少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行うこと
    を含む情報処理方法。
  10. コンピュータに、
    評価用データセット、及びコンテキストデータを取得する処理と、
    少なくとも前記評価用データセットを参照して生成された複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う処理と
    を実行させるプログラム。
JP2023546584A 2021-09-07 2021-09-07 Pending JPWO2023037398A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/032766 WO2023037398A1 (ja) 2021-09-07 2021-09-07 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2023037398A1 JPWO2023037398A1 (ja) 2023-03-16
JPWO2023037398A5 true JPWO2023037398A5 (ja) 2024-05-10

Family

ID=85507260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023546584A Pending JPWO2023037398A1 (ja) 2021-09-07 2021-09-07

Country Status (2)

Country Link
JP (1) JPWO2023037398A1 (ja)
WO (1) WO2023037398A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020153221A1 (ja) * 2019-01-21 2020-07-30 日本電気株式会社 無線通信品質可視化システム、無線通信品質可視化装置、および測定装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5855290B2 (ja) * 2014-06-16 2016-02-09 パナソニックIpマネジメント株式会社 接客評価装置、接客評価システム及び接客評価方法
JP6401074B2 (ja) * 2015-02-20 2018-10-03 三菱重工業株式会社 解析支援装置、解析支援方法、解析支援プログラム
JP6533416B2 (ja) * 2015-06-03 2019-06-19 株式会社日立製作所 営業支援サーバ、営業支援端末及び営業支援システム
US20180095945A1 (en) * 2016-09-30 2018-04-05 Wipro Limited Methods and systems for creating new presentations using existing presentations

Similar Documents

Publication Publication Date Title
Cheng et al. Evaluation methods and measures for causal learning algorithms
US20190318407A1 (en) Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof
US10558657B1 (en) Document content analysis based on topic modeling
WO2018184518A1 (zh) 微博数据处理方法、装置、计算机设备及存储介质
US10255283B1 (en) Document content analysis based on topic modeling
Akter et al. Towards autism subtype detection through identification of discriminatory factors using machine learning
JP6567484B2 (ja) 推計モデル構築システム、推計モデル構築方法及びプログラム
Chaplot et al. A comprehensive analysis of artificial intelligence techniques for the prediction and prognosis of genetic disorders using various gene disorders
Pargent et al. Predictive modeling with psychological panel data
WO2017203672A1 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
WO2023037398A1 (ja) 情報処理装置、情報処理方法及びプログラム
JPWO2023037398A5 (ja)
WO2023037399A1 (ja) 情報処理装置、情報処理方法及びプログラム
Xiong et al. Daehr: A discriminant analysis framework for electronic health record data and an application to early detection of mental health disorders
JPWO2023037399A5 (ja)
KR102126911B1 (ko) KeyplayerRank를 이용한 소셜 미디어상의 주제별 키플레이어 탐지 방법
US20230317215A1 (en) Machine learning driven automated design of clinical studies and assessment of pharmaceuticals and medical devices
JP6026036B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
JP6178480B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
US11900060B2 (en) Information processing device, information processing method, and computer program product
JP7292235B2 (ja) 分析支援装置及び分析支援方法
Li Data Mining Algorithm for College Students’ Mental Health Questionnaire Based on Semisupervised Deep Learning Method
JP6039057B2 (ja) 文書分析装置及び文書分析プログラム
JP5020274B2 (ja) 意味ドリフトの発生評価方法及び装置
Tavabi et al. Pattern discovery in time series with byte pair encoding