JP2017215669A - 確率密度関数推定装置、連続値予測装置、方法、及びプログラム - Google Patents

確率密度関数推定装置、連続値予測装置、方法、及びプログラム Download PDF

Info

Publication number
JP2017215669A
JP2017215669A JP2016107501A JP2016107501A JP2017215669A JP 2017215669 A JP2017215669 A JP 2017215669A JP 2016107501 A JP2016107501 A JP 2016107501A JP 2016107501 A JP2016107501 A JP 2016107501A JP 2017215669 A JP2017215669 A JP 2017215669A
Authority
JP
Japan
Prior art keywords
topic
continuous value
individual
value data
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016107501A
Other languages
English (en)
Other versions
JP6517731B2 (ja
Inventor
秀明 金
Hideaki Kim
秀明 金
澤田 宏
Hiroshi Sawada
宏 澤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016107501A priority Critical patent/JP6517731B2/ja
Publication of JP2017215669A publication Critical patent/JP2017215669A/ja
Application granted granted Critical
Publication of JP6517731B2 publication Critical patent/JP6517731B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】個体が生成する連続値データを表す正しい確率密度関数を推定することができる。
【解決手段】トピック推定部24が、各連続値データについて、所属するトピックを推定し、各個体の各トピックに対する重みの分布を表すハイパーパラメータと、各トピックに対するヒストグラムを特徴付ける形状パラメータの分布を表すハイパーパラメータとを推定する。個体確率密度関数推定部26が、形状パラメータの事後確率、及び重みの事後確率に従って、各トピックに対する形状パラメータ、及び各個体の各トピックに対する重みを推定し、各個体について、推定された各トピックに対する前記形状パラメータに基づく各トピックに対するヒストグラムの、推定された個体の各トピックに対する重みを用いた線形和で表される、個体が生成する連続値データの確率密度関数を出力する。
【選択図】図1

Description

本発明は、確率密度関数推定装置、連続値予測装置、方法、及びプログラムに関する。
一般に、確率的に振る舞う個体が連続値を生成し、その連続値をデータとして我々が観測する状況を考える。本状況としては、例えば、消費者(=個体)がある金額(=連続値)の購買を行う、消費者(=個体)がある時間間隔(=連続値)で購買を行う、旅行者(=個体)がある時間間隔(=連続値)で次の滞在地に移動する、旅行者(=個体)がある位置座標(=連続値)に滞在する、文書(=個体)の中のある単語がある時刻(=連続値)に出現する、機器(=個体)の故障がある時刻(=連続値)に発生する、など様々なものが挙げられる。
個体が連続値を生成する時に従う確率的な規則、すなわち確率密度関数をデータから推定することができれば、個体が将来に生成する連続値を予測することができる。上記の例では、消費者の将来の購買時刻や旅行者の将来の滞在地を予測できることになる。確率密度関数の推定方法は大きく分けて、パラメトリック密度推定とノンパラメトリック密度推定の二種類が存在する。パラメトリック密度推定とは、確率密度関数を、パラメータを有した分布関数で表現し、データからそのパラメータの値を決める方法である。一方ノンパラメトリック密度推定とは、確率密度関数の形状に強い仮定を置かずにデータから推定する方法である。強い仮定を置かないため、ノンパラメトリック密度推定では正確な推定のためにより多くのデータが必要である。ノンパラメトリック密度推定の代表的なものにヒストグラム法があり、本発明はこのヒストグラム法に関するものである。なお、ヒストグラム法とは、連続値を取る変数の定義域を有限個の区間に分割し、各区間において確率密度関数が一定値を取ると仮定し、その各区間の値を観測データから推定することで確率密度関数を推定する手法である。ヒストグラム法に基づき推定された確率密度関数を特にヒストグラムと呼ぶこととする。個体の確率密度関数をヒストグラムで表現する装置に非特許文献1がある。
J. Rissanen, "Density estimation by stochastic complexity", IEEE Transactions on Information Theory, Vol. 38, pp.315-323, 1992.
個体から観測されたデータが十分手に入る場合、密度関数の形状が制限される(自由度が低い)パラメトリック密度推定ではなく、より多様な形状を再現できるヒストグラム法が適している。しかし多くの場合、手に入る個体のデータは少ないため、ヒストグラム法は適用できずパラメトリック密度推定が用いられる。このとき、パラメトリック密度推定において仮定された分布関数の形状が真の形状と異なる場合、正しい確率密度関数を推定することができず、結果予測精度が低くなる。ヒストグラム法とパラメトリック密度推定の長所と短所について表1にまとめる。
我々は個体に内在する真の確率密度関数を知り得ないため、可能な限りヒストグラム法を使用すべきである。
本発明は、上記事情を鑑みて成されたものであり、個体が生成する連続値データを表す正しい確率密度関数を推定することができる確率密度関数推定装置、方法、及びプログラムを提供することを目的とする。
また、個体が生成する連続値データを精度よく予測することができる連続値予測装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係る確率密度関数推定装置は、複数の個体で観測された、前記個体が生成した連続値データの集合を入力とし、前記連続値データの集合に含まれる各連続値データについて、連続値の確率密度を表す、各トピックに対するヒストグラムの、前記トピック毎に定められた分割数及びビン幅を用いて表される、前記連続値データが所属するトピックの事後確率に従って、前記連続値データが所属するトピックを推定し、各連続値データについての前記トピックの推定結果に基づいて、各個体の各トピックに対する重みの分布を表すハイパーパラメータと、各トピックに対するヒストグラムを特徴付ける形状パラメータの分布を表すハイパーパラメータとを推定するトピック推定部と、前記トピック推定部によって推定された、前記重みの分布を表すハイパーパラメータ、前記形状パラメータの分布を表すハイパーパラメータ、及び各連続値データについての前記トピックの推定結果に基づく、前記形状パラメータの事後確率、及び前記重みの事後確率に従って、各トピックに対する前記形状パラメータ、及び各個体の各トピックに対する重みを推定し、各個体について、前記推定された各トピックに対する前記形状パラメータに基づく各トピックに対するヒストグラムの、前記推定された個体の各トピックに対する重みを用いた線形和で表される、前記個体が生成する連続値データの確率密度関数を出力する個体確率密度関数推定部と、を含んで構成されている。
また、第2の発明に係る確率密度関数推定方法は、トピック推定部が、複数の個体で観測された、前記個体が生成した連続値データの集合を入力とし、前記連続値データの集合に含まれる各連続値データについて、連続値の確率密度を表す、各トピックに対するヒストグラムの、前記トピック毎に定められた分割数及びビン幅を用いて表される、前記連続値データが所属するトピックの事後確率に従って、前記連続値データが所属するトピックを推定し、各連続値データについての前記トピックの推定結果に基づいて、各個体の各トピックに対する重みの分布を表すハイパーパラメータと、各トピックに対するヒストグラムを特徴付ける形状パラメータの分布を表すハイパーパラメータとを推定し、個体確率密度関数推定部が、前記トピック推定部によって推定された、前記重みの分布を表すハイパーパラメータ、前記形状パラメータの分布を表すハイパーパラメータ、及び各連続値データについての前記トピックの推定結果に基づく、前記形状パラメータの事後確率、及び前記重みの事後確率に従って、各トピックに対する前記形状パラメータ、及び各個体の各トピックに対する重みを推定し、各個体について、前記推定された各トピックに対する前記形状パラメータに基づく各トピックに対するヒストグラムの、前記推定された個体の各トピックに対する重みを用いた線形和で表される、前記個体が生成する連続値データの確率密度関数を出力する。
第3の発明に係る確率密度関数推定装置は、複数の個体で観測された、前記個体が生成した連続値データの集合を入力とし、前記連続値データの集合に含まれる各連続値データについて、連続値の確率密度を表す、各トピックに対するヒストグラムの、前記トピック毎の分割数及びビン幅を用いて表される、前記連続値データが所属するトピックの事後確率に従って、前記連続値データが所属するトピックを推定し、各トピックについて、各連続値データについての前記トピックの推定結果と、前記トピックに対するヒストグラムのビン幅とを用いて表される、前記トピックに対するヒストグラムの分割数の事後確率に従って、前記トピックに対するヒストグラムの分割数を推定し、各連続値データについての前記トピックの推定結果と、各トピックに対するヒストグラムの分割数とを用いて表される、各トピックに対するヒストグラムのビン幅の事後確率に従って、各トピックに対するヒストグラムのビン幅を推定し、各連続値データについての前記トピックの推定結果に基づいて、各個体の各トピックに対する重みの分布を表すハイパーパラメータと、各トピックに対するヒストグラムを特徴付ける形状パラメータの分布を表すハイパーパラメータとを推定する分割数ビン幅トピック推定部と、前記分割数ビン幅トピック推定部によって推定された、前記重みの分布を表すハイパーパラメータ、前記形状パラメータの分布を表すハイパーパラメータ、及び各連続値データについての前記トピックの推定結果に基づく、前記形状パラメータの事後確率、及び前記重みの事後確率に従って、各トピックに対する前記形状パラメータ、及び各個体の各トピックに対する重みを推定し、前記推定された各トピックに対する前記形状パラメータ、前記分割数、及び前記ビン幅に基づく各トピックに対するヒストグラムの、前記推定された個体の各トピックに対する重みを用いた線形和で表される、前記個体が生成する連続値データの確率密度関数を出力する個体確率密度関数推定部と、を含んで構成されている。
また、第4の発明に係る確率密度関数推定方法は、分割数ビン幅トピック推定部が、複数の個体で観測された、前記個体が生成した連続値データの集合を入力とし、前記連続値データの集合に含まれる各連続値データについて、連続値の確率密度を表す、各トピックに対するヒストグラムの、前記トピック毎の分割数及びビン幅を用いて表される、前記連続値データが所属するトピックの事後確率に従って、前記連続値データが所属するトピックを推定し、各トピックについて、各連続値データについての前記トピックの推定結果と、前記トピックに対するヒストグラムのビン幅とを用いて表される、前記トピックに対するヒストグラムの分割数の事後確率に従って、前記トピックに対するヒストグラムの分割数を推定し、各連続値データについての前記トピックの推定結果と、各トピックに対するヒストグラムの分割数とを用いて表される、各トピックに対するヒストグラムのビン幅の事後確率に従って、各トピックに対するヒストグラムのビン幅を推定し、各連続値データについての前記トピックの推定結果に基づいて、各個体の各トピックに対する重みの分布を表すハイパーパラメータと、各トピックに対するヒストグラムを特徴付ける形状パラメータの分布を表すハイパーパラメータとを推定し、個体確率密度関数推定部が、前記分割数ビン幅トピック推定部によって推定された、前記重みの分布を表すハイパーパラメータ、前記形状パラメータの分布を表すハイパーパラメータ、及び各連続値データについての前記トピックの推定結果に基づく、前記形状パラメータの事後確率、及び前記重みの事後確率に従って、各トピックに対する前記形状パラメータ、及び各個体の各トピックに対する重みを推定し、前記推定された各トピックに対する前記形状パラメータ、前記分割数、及び前記ビン幅に基づく各トピックに対するヒストグラムの、前記推定された個体の各トピックに対する重みを用いた線形和で表される、前記個体が生成する連続値データの確率密度関数を出力する。
また、第5の発明に係る連続値予測装置は、予測対象の個体が生成する連続値データを予測する連続値予測装置であって、前記予測対象の個体に対して予め求められた、連続値の確率密度を表す、各トピックに対するヒストグラムを特徴付ける形状パラメータ、各トピックに対する前記ヒストグラムの分割数、各トピックに対する前記ヒストグラムのビン幅に基づく各トピックに対するヒストグラムの、前記個体の各トピックに対する重みを用いた線形和で表される、個体が生成する連続値データの確率密度関数に従って、前記予測対象の個体が生成する連続値データを予測する連続値予測部を含んで構成されている。
第6の発明に係る連続値予測方法は、予測対象の個体が生成する連続値データを予測する連続値予測装置における連続値予測方法であって、連続値予測部が、前記予測対象の個体に対して予め求められた、連続値の確率密度を表す、各トピックに対するヒストグラムを特徴付ける形状パラメータ、各トピックに対する前記ヒストグラムの分割数、各トピックに対する前記ヒストグラムのビン幅に基づく各トピックに対するヒストグラムの、前記個体の各トピックに対する重みを用いた線形和で表される、個体が生成する連続値データの確率密度関数に従って、前記予測対象の個体が生成する連続値データを予測する。
第7の発明に係るプログラムは、コンピュータを、上記確率密度関数推定装置、又は上記連続値予測装置を構成する各部として機能させるためのプログラム。
本発明の確率密度関数推定装置、方法、及びプログラムによれば、各トピックに対する前記形状パラメータ、及び各個体の各トピックに対する重みを推定し、各個体について、前記推定された各トピックに対する前記形状パラメータに基づく各トピックに対するヒストグラムの、前記推定された個体の各トピックに対する重みを用いた線形和で表される、前記個体が生成する連続値データの確率密度関数を出力することにより、個体が生成する連続値データを表す正しい確率密度関数を推定することができる、という効果が得られる。
また、本発明の連続値予測装置、方法、及びプログラムによれば、各トピックに対するヒストグラムを特徴付ける形状パラメータ、各トピックに対する前記ヒストグラムの分割数、各トピックに対する前記ヒストグラムのビン幅に基づく各トピックに対するヒストグラムの、前記個体の各トピックに対する重みを用いた線形和で表される、個体が生成する連続値データの確率密度関数に従って、前記予測対象の個体が生成する連続値データを予測することにより、個体が生成する連続値データを精度よく予測することができる、という効果が得られる。
本発明の第1の実施の形態に係る確率密度関数推定装置の構成を示すブロック図である。 本発明の第1、第2の実施の形態に係る連続値予測装置の構成を示すブロック図である。 本発明の第1の実施の形態に係る確率密度関数推定装置における確率密度関数推定処理ルーチンを示すフローチャートである。 本発明の第1の実施の形態に係る連続値予測装置における連続値予測処理ルーチンを示すフローチャートである。 ヒストグラムの一例を示す図である。 本発明の第2の実施の形態に係る確率密度関数推定装置の構成を示すブロック図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態に係る概要>
まず、本発明の実施の形態における概要を説明する。
多くの場合、個体一つ一つから得られるデータは少ないが、一方で複数の個体からそれぞれ少数のデータを得ることができる。例えばeコマースサイトにおいて、大半の顧客は数回しか購買を行っていないが、登録されている顧客数が極めて多い、という状況である。個体はそれぞれ独自の確率密度関数を有しているが、互いに似た密度関数を有する個体群が存在するはずである。このとき、(i) 全個体の確率密度関数が少数のヒストグラムの線形和で表現される、(ii) 個体ごとの確率密度関数の違いは線形和の重み付けの違いで表現される、の二点を仮定することで、ヒストグラム法の長所である高い自由度を担保しつつ、その弱みであるデータのスパース性を回避することができる、と着想した。個体の確率密度関数をヒストグラムの線形和で表現する装置はすでに存在するが(上記非特許文献1)、それは単一の個体に対してであり、ヒストグラム法の弱点であるデータのスパース性を回避することはできない。
さらに上記に加え、(iii) 可変ビン幅ヒストグラムを構成することを着想した。ヒストグラム法にて決定される区間の幅をビン幅と呼ぶが、ビン幅が等間隔であるという制限が存在する場合、以下に挙げる問題が生じる。
ヒストグラムにおける分割位置、すなわち確率密度関数の不連続点を任意の位置に設定できないため、真の確率密度関数と推定確率密度関数との間にズレが生じる可能性がある。
推定対象の確率密度関数において関数形が局在している領域と広く分布している領域が共存している場合、前者ではビン幅を狭く、後者ではビン幅を広く設定すべきであるが、ビン幅は単一の値しか取れないため全領域で狭いビン幅(あるいは中途半端なビン幅)がデータから決定されてしまう。その結果、確率密度関数の推定精度が悪化する可能性がある。また、必要以上に狭いビン幅が選ばれるということは、定義域を必要以上に多くの区間に分割するということであり、このときヒストグラム法においてデータから推定すべきパラメータ数が多くなり、推定/予測時の計算コストが増大してしまう。
一定でないビン幅をデータから推定するヒストグラム法(以後、可変ビン幅ヒストグラム)の先行技術は存在するが(例えば、非特許文献2)、全個体の確率密度関数を少数のヒストグラムの線形和で表現し、かつ個体ごとの確率密度関数の違いを線形和の重み付けの違いで表現した上で、可変ビン幅ヒストグラムを実現する装置は未だ存在しない。
本発明の実施の形態は上記の点に鑑みてなされたものであり、(i) 全個体の確率密度関数を少数のヒストグラムの線形和で表現する、(ii) 個体ごとの確率密度関数の違いを線形和の重み付けの違いで表現する、(iii) 可変ビン幅ヒストグラムを構成することにより、確率密度関数の推定を高精度かつ個体単位で実現することを可能とする技術を提供することを目的とする。
[非特許文献2]:P. Kontkanen and P. Myllymaki, "MDL Histogram Density Estimation", International Conference on Artificial Intelligence and Statistics, pp.219-226, 2007.
本発明の実施の形態では、各個体の連続値データの集合から確率密度関数を推定する確率密度関数推定装置と、連続値予測装置とに本発明を適用させた場合を例に説明する。具体的には、まず確率密度関数推定装置において、ヒストグラムで表現された個体の確率密度関数が推定される。次に、連続値予測装置においては、推定された個体の確率密度関数に基づき将来観測される連続値が予測される。各装置の詳細を以下で説明する。
[第1の実施の形態]
<本発明の第1の実施の形態に係る確率密度関数推定装置の構成>
次に、本発明の第1の実施の形態に係る確率密度関数推定装置の構成について説明する。図1に示すように、本発明の第1の実施の形態に係る確率密度関数推定装置100は、CPUと、RAMと、後述する確率密度関数推定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この確率密度関数推定装置100は、機能的には図1に示すように入力部10と、演算部20と、出力部40とを備えている。
入力部10は、複数の個体で観測された、当該個体の連続値データの集合の入力を受け付ける。
連続値データは、解析対象である個体から生成される。また、連続値データは、個体ID(以下、uと表記する)、個体uで観測された連続値データの個数(以下、Nと表記する)、全個体で観測された連続値データの総数(以下、Nと表記する)、全個体で観測された連続値データの集合({t}≡(t,t,…t)と表記)、及び各連続値データを生成した個体IDの集合({u}≡(u,u,…u)と表記)を含む。
また、入力部10は、個体の確率密度関数を表現するためのヒストグラムの個数K、及び確率密度関数の定義域(連続値が取りうる値の範囲)

を入力として受け付ける。ただし以後、K個のヒストグラムをそれぞれk=1,2,3,…,Kで表記し、k番目のヒストグラムをトピックkと呼ぶこととする。
また、入力部10は、各トピックの定義域の分割数Wk、及び各トピックの各分割区間の幅(=ビン幅)Δlk(T1−T0)を入力として受け付ける(1≦k≦K、1≦l≦Wk)。ただし、Δlkは単位化されたビン幅で、

が成り立つ。以後、以下の式に示すように、特にインデックスを付けない場合は各パラメータの集合を表すものとする。
ここで、本実施の形態で用いる生成モデルの原理について説明する。
まず、以下のような生成モデルに基づき、各個体から連続値データが生成されると仮定する。j番目のデータtを生成した個体uは、K個のヒストグラムの線形和で表現される確率密度関数p(t|φ,W,Δ)からデータtを生成する。

・・・(1)
ただし、zはj番目のデータが所属するトピック(1〜K)を表す潜在変数であり、

は個体uのトピックkに対する重み、p(t|z=k,φ.k)はヒストグラム

・・・(2)
で表されるトピックkの分布、φlkはヒストグラムの形状を決めるパラメータ、wj k

・・・(3)
を満たす整数l(1<wj k<Wk)である。ヒストグラムによって表現される確率密度関数は、定義域[T0,T1]をWk個の区間に等分割しその各区間l(1〜Wk)での確率密度の値を一定値φlkで表現したものであり、wj kは連続値データtjが何番目の区間内に入っているかを示している。
次に、上記式(1)〜(3)の生成モデルに現れる二種類のパラメータ

及びφlkに対して、共役な事前分布であるディリクレ分布をそれぞれに仮定する。

・・・(4)
次に、上記式(1)〜(4)より、データの所属トピックz≡(z,z,…z)及び観測される連続値データt≡(t,t,…t)の同時確率を得る。

・・・(5)
ただし、Nkuは個体uのデータのうち所属トピックがkであるデータの個数、Nklは所属トピックがkである全データの中でヒストグラムのl番目の区間に含まれているデータの個数、Nkは所属トピックがkであるデータの総数を表しており、また、モデルを簡潔にするためディリクレ分布のパラメータβの全要素を等しいと置いた(β1=β2=…=β)。
上記(1)〜(5)式によって本実施の形態における生成モデルが計算できる。以上が本実施の形態における生成モデルの原理である。
演算部20は、連続値データ記憶部22と、トピック推定部24と、個体確率密度関数推定部26とを含んで構成されている。
連続値データ記憶部22には、入力部10によって受け付けた連続値データの集合が格納される。
トピック推定部24は、連続値データ記憶部22に記憶された連続値データの集合に含まれる各連続値データについて、各トピックに対するヒストグラムの、トピックk毎に定められた分割数Wk及びビン幅Δlkを用いて表される、連続値データが所属するトピックzの事後確率p(z|t,α,β,W)に従って、連続値データが所属するトピックkを推定する。また、トピック推定部24は、各連続値データについてのトピックkの推定結果に基づいて、各個体uの各トピックkに対する重み

の分布を表すハイパーパラメータαと、各トピックに対するヒストグラムを特徴付ける形状パラメータφ.kの分布を表すハイパーパラメータβとを推定する。トピック推定部24は、上記のトピックの推定及びハイパーパラメータの推定を繰り返し行う。
トピック推定部24で行われる具体的な計算方法について以下に詳述する。まず、連続値データ毎の所属トピックz≡(z,z,…z)の事後確率p(z|t,α,β,W)を計算することで、未知のパラメータα、β、

、φをすべて推定することが出来る。事後確率を解析的に扱うのは困難であるので、トピック推定部24による所属トピックの推定は、上記式(5)の同時確率から得られる、各連続値データtjが所属するトピックzjをギブスサンプリングするための公式

・・・(6)
を用いてz≡(z,z,…z)のP回分のサンプル(z(1),z(2),…,z(P))を生成し、保持しておく。ただし、上記式(6)に現れる−jは、総数Nの全データ集合からj番目のデータを除いた部分集合を表す。実際にはzのサンプルそのものではなく、その十分統計量である

を保持することになる。
また、トピック推定部24は、P回分のサンプルを生成するのと同時に、確率的EM法(例えば、非特許文献3を参照)に基づき、以下の式(7)に従って、未知のハイパーパラメータα,βの値をP回更新する。そして、トピック推定部24は、P回更新後のハイパーパラメータ値α(P),β(P)をそれぞれの推定値とする。

・・・(7)
具体的な更新式は、以下の(8)式で与えられる。

・・・(8)
[非特許文献3]:C. Bishop.“Pattern Recognition and Machine Learning”, Springer, New York, 2006.
個体確率密度関数推定部26は、トピック推定部24によって推定されたハイパーパラメータα、β、及び各連続値データについてのトピックの推定結果(z(1),z(2),…,z(P))に基づく、形状パラメータの事後確率、及び重みの事後確率に従って、各トピックkに対する形状パラメータφlk、及び各個体uの各トピックkに対する重み

を推定する。
具体的には、個体確率密度関数推定部26は、トピック推定部24によって得られたα、β,十分統計量

を用いて、以下の式(9)、(10)に従って、各トピックkに対する形状パラメータφlk、及び各個体uの各トピックkに対する重み

を推定する。
なお、本実施の形態では、各トピックkに対する形状パラメータφlk、及び各個体uの各トピックkに対する重み

の推定値として、それぞれの事後確率の平均を採用する。

・・・(9)

・・・(10)
また、個体確率密度関数推定部26は、上記式(9)、(10)で得られた結果を用いて、各個体uについて、推定された各トピックに対する形状パラメータφlkに基づく各トピックに対するヒストグラムの、推定された個体の各トピックに対する重みを用いた線形和で表される個体uが生成する連続値データの確率密度関数の推定値

を、出力部40より出力する。

・・・(11)
ただし、ヒストグラム

は式(2)で定義される。
ここで、個体の確率密度関数は

で表現される。個体uごとに

(1≦k≦K)が出力され、トピックkごとに分割数Wkと、単位化されたビン幅Δlkと、φlk(1≦l≦Wk)が出力され、そして共通の定義域としてT≡[T0,T1]が出力される。出力例を表2に示す。なお、表2では、トピック数K=3の場合の例を示している。
<本発明の第1の実施の形態に係る連続値予測装置の構成>
次に、本発明の第1の実施の形態に係る連続値予測装置の構成について説明する。図2に示すように、本発明の第1の実施の形態に係る連続値予測装置200は、CPUと、RAMと、後述する連続値予測処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この連続値予測装置200は、機能的には図2に示すように入力部50と、演算部60と、出力部70とを備えている。連続値予測装置200は、予測対象の個体が将来生成する連続値データを予測する。
入力部50は、予測対象の個体uに対して予め確率密度関数推定装置100によって推定された、各トピックkに対するヒストグラムを特徴付ける形状パラメータφlk、各トピックに対する重み

と、各トピックに対するヒストグラムの分割数Wkと、各トピックに対するヒストグラムのビン幅Δlkとを受け付ける。
演算部60は、連続値予測部62を含んで構成されている。
連続値予測部62は、入力部50により受け付けた、各トピックkに対するヒストグラムを特徴付ける形状パラメータφlk、各トピックに対する重み

、各トピックに対するヒストグラムの分割数Wk、各トピックに対するヒストグラムのビン幅Δlkに基づいて、各トピックに対するヒストグラムの、個体uの各トピックに対する重み

を用いた線形和で表される、上記式(11)に示す個体ujが生成する連続値データの確率密度関数に従って、予測対象の個体uが将来生成する連続値データを予測する。
具体的には、連続値予測部62は、確率密度関数推定装置100によって出力された予測対象の個体uの確率密度関数

を用いて、将来生成される連続値データの期待値E[tu]を計算し、連続値データの予測値として出力部70により出力する。
<本発明の第1の実施の形態に係る確率密度関数推定装置の作用>
次に、本発明の第1の実施の形態に係る確率密度関数推定装置100の作用について説明する。入力部10において個体の個体IDが付与された連続値データの集合を受け付けると、確率密度関数推定装置100は、連続値データの集合を、連続値データ記憶部22に格納する。また、入力部10において、トピック数Kと、連続値の定義域と、トピックkの各々のヒストグラムの分割数Wk及びビン幅Δlkとを受け付けると、確率密度関数推定装置100は、図3に示す確率密度関数推定処理ルーチンを実行する。
まず、ステップS100では、入力部10において受け付けた連続値データの集合と、トピック数Kと、連続値の定義域と、トピックkの各々のヒストグラムの分割数Wk及びビン幅Δlkとを取得する。
次に、ステップS102において、トピック推定部24は、連続値データ記憶部22に記憶された連続値データの集合に含まれる各連続値データについて、α、βの初期値又は前回のステップS104で推定されたα、βと、各連続値データについてのトピックkの初期値又は前回の推定結果から得られる十分統計量Nku、Nkl、Nkとに基づいて、上記式(6)に従って、各連続値データが所属するトピックkを推定する。また、各連続値データについてのトピックkの推定結果に基づいて十分統計量Nku、Nkl、Nk、Nlを計算する。
ステップS104において、トピック推定部24は、上記ステップS102で得られた各連続値データについてのトピックkの推定結果から得られる十分統計量Nku、Nkl、Nk、Nlに基づいて、各個体uの各トピックkに対する重み

の分布を表すハイパーパラメータαと、各トピックに対するヒストグラムを特徴付ける形状パラメータφ.kの分布を表すハイパーパラメータβを、上記式(8)に従って更新する。
ステップS106において、ステップS102〜S104の処理が予め定められたP回繰り返したかを判定し、P回繰り返していなければステップS102へ戻ってステップS102〜S104の処理を繰り返し、P回繰り返していればステップS108へ移行する。
ステップS108において、個体確率密度関数推定部26は、上記ステップS104で更新されたハイパーパラメータα、β、及び繰り返し毎に得られた、上記ステップS102で計算された各連続値データについてのトピックの計算結果(z(1),z(2),…,z(P))に対応する十分統計量

に基づく、上記式(9)、(10)に示す、各トピックkに対する形状パラメータφlkの事後確率の平均、及び各個体uの各トピックkに対する重み

の事後確率の平均から、各トピックkに対する形状パラメータφlk、及び各個体uの各トピックkに対する重み

を推定する。
そして、ステップS110において、推定された各トピックkに対する形状パラメータφlk、及び各個体uの各トピックkに対する重み

を用いた、各個体uが生成する連続値データの確率密度関数の推定値

を、出力部40より出力して、確率密度関数推定処理ルーチンを終了する。
<本発明の第1の実施の形態に係る連続値予測装置の作用>
次に、本発明の第1の実施の形態に係る連続値予測装置200の作用について説明する。入力部50において、予測対象の個体uについて確率密度関数推定装置100により推定された、個体uが生成する連続値データの確率密度関数を受け付けると、連続値予測装置200は、図4に示す予測処理ルーチンを実行する。
ステップS200において、個体uが生成する連続値データの確率密度関数を取得する。
ステップS202において、連続値予測部62は、入力部50において受け付けた個体uが生成する連続値データの確率密度関数に基づいて、連続値データの期待値を計算し、予測値とする。
そして、ステップS204において、出力部70は、上記ステップS202で得られた連続値データの予測値を結果として出力して、予測処理ルーチンを終了する。
以上説明したように、第1の実施の形態に係る確率密度関数推定装置によれば、各トピックに対する形状パラメータ、及び各個体の各トピックに対する重みを推定し、各個体について、推定された各トピックに対する前記形状パラメータに基づく各トピックに対するヒストグラムの、推定された個体の各トピックに対する重みを用いた線形和で表される、個体が生成する連続値データの確率密度関数を出力することにより、個体が生成する連続値データを表す正しい確率密度関数を推定することができる。
また、第1の実施の形態によれば、全個体の確率密度関数を少数のヒストグラムの線形和で表現し、かつ個体ごとの確率密度関数の違いを線形和の重みで表現し、かつ可変ビン幅ヒストグラムを構成することで、確率密度関数の推定を高精度かつ個体単位で実現することを可能とする。例えば、図5に示すような、可変ビン幅ヒストグラムを用いて、確率密度関数を推定することができる。
また、第1の実施の形態に係る連続値予測装置によれば、各トピックに対するヒストグラムを特徴付ける形状パラメータ、各トピックに対する前記ヒストグラムの分割数、各トピックに対する前記ヒストグラムのビン幅に基づく各トピックに対するヒストグラムの、個体の各トピックに対する重みを用いた線形和で表される、個体が生成する連続値データの確率密度関数に従って、予測対象の個体が生成する連続値データを予測することにより、個体が生成する連続値データを精度よく予測することができる。
[第2の実施の形態]
ついて説明する。なお、第1の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。
第2の実施の形態では、所属トピックを推定すると同時に、各トピックのヒストグラムの分割数とビン幅を推定している点が、第1の実施の形態と異なっている。
<本発明の第2の実施の形態に係る確率密度関数推定装置の構成>
図6に示すように、第2の実施の形態に係る確率密度関数推定装置300は、入力部10、演算部320、及び出力部40を備えている。
入力部10は、複数の個体で観測された、当該個体の連続値データの集合の入力を受け付ける。また、入力部10は、個体の確率密度関数を表現するためのヒストグラムの個数K、及び確率密度関数の定義域(連続値が取りうる値の範囲)

を入力として受け付ける。
演算部320は、連続値データ記憶部22と、分割数ビン幅トピック推定部324と、個体確率密度関数推定部26とを含んで構成されている。
分割数ビン幅トピック推定部324は、第1の実施の形態のトピック推定部24と同様に、連続値データ記憶部22に記憶された連続値データの集合に含まれる各連続値データについて、連続値の確率密度を表す、各トピックに対するヒストグラムの、トピックk毎に定められた分割数Wk及びビン幅Δlkを用いて表される、連続値データが所属するトピックzの事後確率p(z|t,α,β,W,Δ)に従って、連続値データが所属するトピックkを推定する。
また、分割数ビン幅トピック推定部324は、各トピックについて、各連続値データについてのトピックの推定結果と、トピックに対するヒストグラムのビン幅とを用いて表される、トピックに対するヒストグラムの分割数の事後確率p(W|z、t、α、β、W、Δ)に従って、トピックに対するヒストグラムの分割数を推定する。また、分割数ビン幅トピック推定部324は、各連続値データについてのトピックの推定結果と、各トピックに対するヒストグラムの分割数とを用いて表される、各トピックに対するヒストグラムのビン幅の事後確率p(Δ|z、t、α、β、W、Δ)に従って、各トピックに対するヒストグラムのビン幅を推定する。
また、分割数ビン幅トピック推定部324は、第1の実施の形態のトピック推定部24と同様に、各連続値データについてのトピックkの推定結果に基づいて、各個体uの各トピックkに対する重み

の分布を表すハイパーパラメータαと、各トピックに対するヒストグラムを特徴付ける形状パラメータφ.kの分布を表すハイパーパラメータβとを推定する。トピック推定部24は、上記のトピックの推定、分割数の推定、ビン幅の推定、及びハイパーパラメータの推定を繰り返し行う。
分割数ビン幅トピック推定部324で行われる、具体的な計算方法について以下に詳述する。
まず、第1の実施の形態のトピック推定部24と同様に、所属トピックのギブスサンプリングを一度実行する。次に、分割数Wのサンプリングを得るために、事前分布としてディリクレ分布

・・・(12)
を仮定し、上記式(5)の同時分布をビン幅 Δについて周辺化を行う。γはディリクレ分布のパラメータである。周辺化はBayesian Information Criteria(上記非特許文献3)に基づき近似的に実行される。

・・・(13)
ただし、Δ*はビン幅の最大事後確率推定値である。

・・・(14)
さらに分割数に関する無情報事前分布として一様分布

・・・(15)
を仮定し、分割数Wについてのギブスサンプリングの公式

・・・(16)
を得る。上記式(16)に従い分割数Wのサンプリングを実行する。その際同時にビン幅は式(14)により与えられる。経験的に分割数Wの分布は鋭いので、最後のサンプリングで得られた分割数
を推定値とする。未知のハイパーパラメータα、βの更新式は上記式(8)と同様にして以下の(17)式で与えられる。


・・・(17)
個体確率密度関数推定部26は、分割数ビン幅トピック推定部324によって得られたα、β、十分統計量

、W、Δを用いて、上記の式(9)、(10)に従って、各トピックkに対する形状パラメータφlk、及び各個体uの各トピックkに対する重み

を推定する。
また、個体確率密度関数推定部26は、上記式(9)、(10)で得られた結果を用いて、各個体uについて、推定された各トピックに対する形状パラメータφlkに基づく各トピックに対するヒストグラムの、推定された個体の各トピックに対する重みを用いた線形和で表される個体uが生成する連続値データの確率密度関数の推定値

を、出力部40より出力する。
なお、第2の実施の形態に係る確率密度関数推定装置300の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
<本発明の第2の実施の形態に係る連続値予測装置の構成>
第2の実施の形態に係る連続値予測装置は、第1の実施の形態と同様に、予測対象の個体uについて確率密度関数推定装置300により推定された、個体uが生成する連続値データの確率密度関数に基づいて、連続値データの期待値を計算し、予測値とする。
以上説明したように、第2の実施の形態に係る確率密度関数推定装置によれば、各トピックに対するヒストグラムの分割数、及び各トピックに対するヒストグラムのビン幅を推定し、各トピックに対する形状パラメータ、及び各個体の各トピックに対する重みを推定し、各個体について、推定された各トピックに対する形状パラメータ、各トピックに対する分割数、各トピックに対するビン幅に基づく各トピックに対するヒストグラムの、推定された個体の各トピックに対する重みを用いた線形和で表される、個体が生成する連続値データの確率密度関数を出力することにより、個体が生成する連続値データを表す正しい確率密度関数を推定することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記実施の形態に係る確率密度関数推定装置100、300は、連続値データ記憶部22を備えている場合について説明したが、例えば連続値データ記憶部22が確率密度関数推定装置100、300の外部装置に設けられ、確率密度関数推定装置100、300は、外部装置と通信手段を用いて通信することにより、連続値データ記憶部22を参照するようにしてもよい。
また、上記実施の形態では、確率密度関数推定装置100、300と連続値予測装置200とを別々の装置として構成する場合を例に説明したが、確率密度関数推定装置100、300と連続値予測装置200とを1つの装置として構成してもよい。
また、上述の確率密度関数推定装置及び連続値予測装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10、50 入力部
20、60、320 演算部
22 連続値データ記憶部
24 トピック推定部
26 個体確率密度関数推定部
40、70 出力部
62 連続値予測部
100、300 確率密度関数推定装置
200 連続値予測装置
324 分割数ビン幅トピック推定部

Claims (7)

  1. 複数の個体で観測された、前記個体が生成した連続値データの集合を入力とし、前記連続値データの集合に含まれる各連続値データについて、連続値の確率密度を表す、各トピックに対するヒストグラムの、前記トピック毎に定められた分割数及びビン幅を用いて表される、前記連続値データが所属するトピックの事後確率に従って、前記連続値データが所属するトピックを推定し、
    各連続値データについての前記トピックの推定結果に基づいて、各個体の各トピックに対する重みの分布を表すハイパーパラメータと、各トピックに対するヒストグラムを特徴付ける形状パラメータの分布を表すハイパーパラメータとを推定するトピック推定部と、
    前記トピック推定部によって推定された、前記重みの分布を表すハイパーパラメータ、前記形状パラメータの分布を表すハイパーパラメータ、及び各連続値データについての前記トピックの推定結果に基づく、前記形状パラメータの事後確率、及び前記重みの事後確率に従って、各トピックに対する前記形状パラメータ、及び各個体の各トピックに対する重みを推定し、各個体について、前記推定された各トピックに対する前記形状パラメータに基づく各トピックに対するヒストグラムの、前記推定された個体の各トピックに対する重みを用いた線形和で表される、前記個体が生成する連続値データの確率密度関数を出力する個体確率密度関数推定部と、
    を含む確率密度関数推定装置。
  2. 複数の個体で観測された、前記個体が生成した連続値データの集合を入力とし、前記連続値データの集合に含まれる各連続値データについて、連続値の確率密度を表す、各トピックに対するヒストグラムの、前記トピック毎の分割数及びビン幅を用いて表される、前記連続値データが所属するトピックの事後確率に従って、前記連続値データが所属するトピックを推定し、
    各トピックについて、各連続値データについての前記トピックの推定結果と、前記トピックに対するヒストグラムのビン幅とを用いて表される、前記トピックに対するヒストグラムの分割数の事後確率に従って、前記トピックに対するヒストグラムの分割数を推定し、
    各連続値データについての前記トピックの推定結果と、各トピックに対するヒストグラムの分割数とを用いて表される、各トピックに対するヒストグラムのビン幅の事後確率に従って、各トピックに対するヒストグラムのビン幅を推定し、
    各連続値データについての前記トピックの推定結果に基づいて、各個体の各トピックに対する重みの分布を表すハイパーパラメータと、各トピックに対するヒストグラムを特徴付ける形状パラメータの分布を表すハイパーパラメータとを推定する分割数ビン幅トピック推定部と、
    前記分割数ビン幅トピック推定部によって推定された、前記重みの分布を表すハイパーパラメータ、前記形状パラメータの分布を表すハイパーパラメータ、及び各連続値データについての前記トピックの推定結果に基づく、前記形状パラメータの事後確率、及び前記重みの事後確率に従って、各トピックに対する前記形状パラメータ、及び各個体の各トピックに対する重みを推定し、前記推定された各トピックに対する前記形状パラメータ、前記分割数、及び前記ビン幅に基づく各トピックに対するヒストグラムの、前記推定された個体の各トピックに対する重みを用いた線形和で表される、前記個体が生成する連続値データの確率密度関数を出力する個体確率密度関数推定部と、
    を含む確率密度関数推定装置。
  3. 予測対象の個体が生成する連続値データを予測する連続値予測装置であって、
    前記予測対象の個体に対して予め求められた、連続値の確率密度を表す、各トピックに対するヒストグラムを特徴付ける形状パラメータ、各トピックに対する前記ヒストグラムの分割数、各トピックに対する前記ヒストグラムのビン幅に基づく各トピックに対するヒストグラムの、前記個体の各トピックに対する重みを用いた線形和で表される、個体が生成する連続値データの確率密度関数に従って、前記予測対象の個体が生成する連続値データを予測する連続値予測部
    を含む連続値予測装置。
  4. トピック推定部が、複数の個体で観測された、前記個体が生成した連続値データの集合を入力とし、前記連続値データの集合に含まれる各連続値データについて、連続値の確率密度を表す、各トピックに対するヒストグラムの、前記トピック毎に定められた分割数及びビン幅を用いて表される、前記連続値データが所属するトピックの事後確率に従って、前記連続値データが所属するトピックを推定し、
    各連続値データについての前記トピックの推定結果に基づいて、各個体の各トピックに対する重みの分布を表すハイパーパラメータと、各トピックに対するヒストグラムを特徴付ける形状パラメータの分布を表すハイパーパラメータとを推定し、
    個体確率密度関数推定部が、前記トピック推定部によって推定された、前記重みの分布を表すハイパーパラメータ、前記形状パラメータの分布を表すハイパーパラメータ、及び各連続値データについての前記トピックの推定結果に基づく、前記形状パラメータの事後確率、及び前記重みの事後確率に従って、各トピックに対する前記形状パラメータ、及び各個体の各トピックに対する重みを推定し、各個体について、前記推定された各トピックに対する前記形状パラメータに基づく各トピックに対するヒストグラムの、前記推定された個体の各トピックに対する重みを用いた線形和で表される、前記個体が生成する連続値データの確率密度関数を出力する
    確率密度関数推定方法。
  5. 分割数ビン幅トピック推定部が、複数の個体で観測された、前記個体が生成した連続値データの集合を入力とし、前記連続値データの集合に含まれる各連続値データについて、連続値の確率密度を表す、各トピックに対するヒストグラムの、前記トピック毎の分割数及びビン幅を用いて表される、前記連続値データが所属するトピックの事後確率に従って、前記連続値データが所属するトピックを推定し、
    各トピックについて、各連続値データについての前記トピックの推定結果と、前記トピックに対するヒストグラムのビン幅とを用いて表される、前記トピックに対するヒストグラムの分割数の事後確率に従って、前記トピックに対するヒストグラムの分割数を推定し、
    各連続値データについての前記トピックの推定結果と、各トピックに対するヒストグラムの分割数とを用いて表される、各トピックに対するヒストグラムのビン幅の事後確率に従って、各トピックに対するヒストグラムのビン幅を推定し、
    各連続値データについての前記トピックの推定結果に基づいて、各個体の各トピックに対する重みの分布を表すハイパーパラメータと、各トピックに対するヒストグラムを特徴付ける形状パラメータの分布を表すハイパーパラメータとを推定し、
    個体確率密度関数推定部が、前記分割数ビン幅トピック推定部によって推定された、前記重みの分布を表すハイパーパラメータ、前記形状パラメータの分布を表すハイパーパラメータ、及び各連続値データについての前記トピックの推定結果に基づく、前記形状パラメータの事後確率、及び前記重みの事後確率に従って、各トピックに対する前記形状パラメータ、及び各個体の各トピックに対する重みを推定し、前記推定された各トピックに対する前記形状パラメータ、前記分割数、及び前記ビン幅に基づく各トピックに対するヒストグラムの、前記推定された個体の各トピックに対する重みを用いた線形和で表される、前記個体が生成する連続値データの確率密度関数を出力する
    確率密度関数推定方法。
  6. 予測対象の個体が生成する連続値データを予測する連続値予測装置における連続値予測方法であって、
    連続値予測部が、前記予測対象の個体に対して予め求められた、連続値の確率密度を表す、各トピックに対するヒストグラムを特徴付ける形状パラメータ、各トピックに対する前記ヒストグラムの分割数、各トピックに対する前記ヒストグラムのビン幅に基づく各トピックに対するヒストグラムの、前記個体の各トピックに対する重みを用いた線形和で表される、個体が生成する連続値データの確率密度関数に従って、前記予測対象の個体が生成する連続値データを予測する
    連続値予測方法。
  7. コンピュータを、請求項1若しくは請求項2に記載の確率密度関数推定装置、又は請求項3に記載の連続値予測装置を構成する各部として機能させるためのプログラム。
JP2016107501A 2016-05-30 2016-05-30 確率密度関数推定装置、連続値予測装置、方法、及びプログラム Active JP6517731B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016107501A JP6517731B2 (ja) 2016-05-30 2016-05-30 確率密度関数推定装置、連続値予測装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016107501A JP6517731B2 (ja) 2016-05-30 2016-05-30 確率密度関数推定装置、連続値予測装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017215669A true JP2017215669A (ja) 2017-12-07
JP6517731B2 JP6517731B2 (ja) 2019-05-22

Family

ID=60576974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016107501A Active JP6517731B2 (ja) 2016-05-30 2016-05-30 確率密度関数推定装置、連続値予測装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6517731B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7493752B2 (ja) 2020-03-26 2024-06-03 国立研究開発法人量子科学技術研究開発機構 データ処理装置、データ処理方法、プログラム、及び記録媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004133553A (ja) * 2002-10-08 2004-04-30 Toshiba Corp 設備診断装置
US20060116920A1 (en) * 2004-12-01 2006-06-01 Shan Jerry Z Methods and systems for forecasting with model-based PDF estimates
US8645259B1 (en) * 2008-02-14 2014-02-04 Tyche Technologies LLC Mitigating risk associated with executing limit orders for trading securities

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004133553A (ja) * 2002-10-08 2004-04-30 Toshiba Corp 設備診断装置
US20060116920A1 (en) * 2004-12-01 2006-06-01 Shan Jerry Z Methods and systems for forecasting with model-based PDF estimates
US8645259B1 (en) * 2008-02-14 2014-02-04 Tyche Technologies LLC Mitigating risk associated with executing limit orders for trading securities

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7493752B2 (ja) 2020-03-26 2024-06-03 国立研究開発法人量子科学技術研究開発機構 データ処理装置、データ処理方法、プログラム、及び記録媒体

Also Published As

Publication number Publication date
JP6517731B2 (ja) 2019-05-22

Similar Documents

Publication Publication Date Title
JP5362823B2 (ja) 無限次元を用いた高速行列因子分解による推薦システム
Pillonetto A new kernel-based approach to hybrid system identification
Guillotte et al. Non-parametric Bayesian inference on bivariate extremes
CN110097088A (zh) 一种基于迁移学习与特殊点策略的动态多目标进化方法
US10635078B2 (en) Simulation system, simulation method, and simulation program
Ratnapinda et al. Learning discrete Bayesian network parameters from continuous data streams: What is the best strategy?
JP2016161968A (ja) 単語ベクトル学習装置、自然言語処理装置、方法、及びプログラム
Zhao et al. High-dimensional linear regression via implicit regularization
JP6744767B2 (ja) 人流予測装置、パラメータ推定装置、方法、及びプログラム
Yıldırım et al. Calibrating the Gaussian multi-target tracking model
Nemeth et al. Particle Metropolis-adjusted Langevin algorithms
JP2015038709A (ja) モデルパラメータ推定方法、装置、及びプログラム
JP2017215669A (ja) 確率密度関数推定装置、連続値予測装置、方法、及びプログラム
JP6190771B2 (ja) パラメータ推定方法、装置、及びプログラム
Lin et al. Simulation analytics for virtual statistics via k nearest neighbors
Liang et al. Learning Bayesian networks for discrete data
Singham et al. Density estimation of simulation output using exponential epi-splines
Armstrong et al. Estimating probability density functions using a combined maximum entropy moments and Bayesian method. Theory and numerical examples
JP6558860B2 (ja) 推定装置、予測装置、方法、及びプログラム
CN114880363A (zh) 一种数据中心流量预测***及训练方法、预测方法
JP6649182B2 (ja) 確率密度関数推定装置、連続値予測装置、方法、及びプログラム
JP6745507B2 (ja) パラメータ推定装置、方法、及びプログラム
JP6433858B2 (ja) 確率密度関数推定装置、連続値予測装置、方法、及びプログラム
Zhang A note on supply risk and inventory outsourcing
Huber et al. The hybrid density filter for nonlinear estimation based on hybrid conditional density approximation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190418

R150 Certificate of patent or registration of utility model

Ref document number: 6517731

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150