JP2011081491A - 時系列分析装置、時系列分析方法、及びプログラム - Google Patents

時系列分析装置、時系列分析方法、及びプログラム Download PDF

Info

Publication number
JP2011081491A
JP2011081491A JP2009231488A JP2009231488A JP2011081491A JP 2011081491 A JP2011081491 A JP 2011081491A JP 2009231488 A JP2009231488 A JP 2009231488A JP 2009231488 A JP2009231488 A JP 2009231488A JP 2011081491 A JP2011081491 A JP 2011081491A
Authority
JP
Japan
Prior art keywords
parameter
trend
value
time series
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009231488A
Other languages
English (en)
Other versions
JP5077711B2 (ja
Inventor
Norikazu Matsumura
憲和 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biglobe Inc
Original Assignee
NEC Biglobe Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Biglobe Ltd filed Critical NEC Biglobe Ltd
Priority to JP2009231488A priority Critical patent/JP5077711B2/ja
Publication of JP2011081491A publication Critical patent/JP2011081491A/ja
Application granted granted Critical
Publication of JP5077711B2 publication Critical patent/JP5077711B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】Web関係のデータの予測値を正確に求める。
【解決手段】時系列分析装置は、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出し、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、算出された前記トレンドパラメータを適用した前記トレンド関数と、算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する。
【選択図】図1

Description

本発明は、時系列データの推移を推測する技術に関する。
非特許文献1に示すように、ブログや掲示板上のクチコミ情報をリアルタイムに収集、分析するASP型サービスが各社から提供されている。但し、これらのサービスでは、将来のブログの書き込み数がどのように推移していくかは予測されない。
ここで、経済や交通など、他の分野であれば、株価や交通情報の推移を予測する技術が用いられている。
例えば、特許文献1に記載された学習装置は、ブログの書き込み数を予測するものでないが、交通情報に関する時系列データを取得し、AR(Auto Regression)モデルのクラスを使用して、周期的なパターンを付加した、将来の予測値を算出することができる。
[online]、[平成21年9月25日検索]、インターネット<URL:http://kandoreport.jp/>
特開2006−11572号公報
しかし、特許文献1に記載された学習装置では、ブログの書き込み数など、Web関係のデータの推移を正確に予測できない場合があった。
Web関係のデータの変動には、周期性のほか、特有の傾向も存在する。これに対し、特許文献1の学習装置は、周期的な変動を考慮して、予測値を算出するが、データが上昇傾向、下降傾向にあるといった特有の傾向については考慮していない。
このため、特許文献1に記載された技術をWeb関係のデータに適用すると、予測値と実際の値との間のずれが大きくなってしまうという問題があった。
本発明は、Web関係のデータの予測値を正確に求めることを目的とする。
上記目的を達成するために、本発明の時系列分析装置は、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手段と、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、を有する。
本発明の時系列分析方法は、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め保持したトレンドパラメータ算出手段が、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出し、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め保持した周期パラメータ算出手段が、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、予測式算出手段が、前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する、時系列分析方法である。
本発明のプログラムは、コンピュータに、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、及び前記トレンドパラメータ算出手順で算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手順で算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、を実行させるためのプログラムである。
本発明によれば、時系列分析装置は、Web関係のデータに特有の増減傾向や周期性を表す関数のパラメータを算出するので、周期性のほか、増減傾向も存在するブログなどに関する時系列値について、予測値を正確に算出できる。
本発明の第1の実施形態の時系列データ分析システムの一構成例を示す全体図である。 本発明の第1の実施形態のブログ抽出・集計部の一構成例を示すブロック図である。 本発明の第1の実施形態の時系列分析要求データに含まれる情報を示す図である。 本発明の第1の実施形態の学習データの示す内容をまとめた表である。 本発明の第1の実施形態のバースト期間を可変して算出されたバースト値を示す表である。 (a)本発明の第1の実施形態の整列したバースト値を示す図である。(b)本発明の第1の実施形態の整列したバースト値を示す図である。 本発明の第1の実施形態の予測式データの示す内容をまとめた表である。 本発明の第1の実施形態の分析・可視化サーバの時系列分析処理を示すフローチャートである。 本発明の第1の実施形態のブログ抽出・集計処理を示すフローチャートである。 本発明の第1の実施形態の周期成分抽出処理を示すフローチャートである。 外れ値の補正前における、本発明の第1の実施形態の時系列値をプロットした折れ線グラフである。 外れ値の補正後における、本発明の第1の実施形態の時系列値をプロットした折れ線グラフである。 トレンド関数算出後における、本発明の第1の実施形態の時系列値をプロットした折れ線グラフである。 トレンド成分除去後における、本発明の第1の実施形態の時系列値をプロットした折れ線グラフである。 本発明の第1の実施形態の予測値をプロットした折れ線グラフである。 本発明の第1の実施形態の予測値をプロットした折れ線グラフである。 本発明の第2の実施形態の影響度分析要求データに含まれる情報を示す図である。 本発明の第2の実施形態の予測式データの示す内容をまとめた表である。 本発明の第2の実施形態の分析・可視化サーバの影響度分析処理を示すフローチャートである。 本発明の第2の実施形態の予測値をプロットした折れ線グラフである。 本発明の第3の実施形態の成長度スコア算出要求データに含まれる情報を示す図である。 本発明の第3の実施形態の分析・可視化サーバの成長度算出処理を示すフローチャートである。 本発明の第3の実施形態の予測値をプロットした折れ線グラフである。 本発明の第4の実施形態のシミュレーション要求データに含まれる情報を示す図である。 本発明の第4の実施形態のイベント効果予測処理を示すフローチャートである。
本発明を実施するための形態について図面を参照して詳細に説明する。図1は、本実施形態の時系列データ分析システム1の一構成例を示す全体図である。時系列データ分析システムは、時系列で集計された値(以下、「時系列値」という)を示す時系列データを分析する。本実施形態では、時系列で集計されたブログの書き込み数を時系列値とする。
図1を参照すると、時系列データ分析システム1は、利用者PC10と、分析・可視化サーバ20と、ブログDB30と、予測パラメータDB40とを有する。
分析・可視化サーバ20は、ブログ抽出・集計部201、トレンド成分学習部202、周期成分学習部203、および分析結果作成部204を有する。
ブログDB30は、ブログデータを収集し、それらのデータをカテゴリに分類して格納する。
利用者PC10は、時系列値の分析を要求する時系列分析要求データを受け付ける。時系列分析要求データが入力されると、利用者PC10は、その時系列分析要求データを分析・可視化サーバ20へ送信する。
図2は、時系列分析要求データに含まれる情報を示す図である。同図を参照すると、時系列分析要求データは、「カテゴリ」、「キーワード」、「教師データ期間」、および「予測期間」を示す情報を含む。
「カテゴリ」は、集計対象のブログの属性である。例えば、飲料、電化製品、携帯電話、ビール、有名人など、キーワードのジャンルが指定される。「キーワード」は、ブログにおいて検索される語句である。「教師データ期間」は、ブログが集計される期間である。「予測期間」は、ブログの書き込み数の予測値が算出される期間である。
図3は、ブログ抽出・集計部201の一構成例を示すブロック図である。同図を参照すると、ブログ抽出・集計部201は、集計部2011、および特異点補正部2012を有する。
集計部2011は、図2に示した時系列分析要求データから、カテゴリ、キーワード、教師データ期間、および予測範囲を取得する。集計部2011は、教師データ期間における、そのカテゴリに属するブログデータをブログDB30に格納されたブログデータから抽出する。集計部2011は、それらのブログデータから、キーワードを含むブログの書き込みを検索し、教師データ期間内の各日付において、検索されたブログの書き込み数を集計する。
特異点補正部2012は、集計結果から外れ値を検出し、補正する。外れ値は、不定期なイベントによる書き込み数の急増やシステム障害による書き込み数の急減・欠損など、時系列値が突発的に増減したときの値である。外れ値は、特異点とも呼ばれる。
外れ値の抽出において、特異点補正部2012は、長さが最小値から最大値までの範囲で可変のバースト期間について、その長さを最小値に設定する。本実施形態では、最小値は1日に設定され、利用者は最大値のみを設定する。
そして、特異点補正部2012は、バースト期間の初日を教師データ期間の初日とし、下記の式によりバースト値を算出する。以降、特異点補正部2012は、バースト期間の各日付をバースト期間の初日として、各日付に対応するバースト値を算出する。同様の手順で、特異点補正部2012は、最大値に達するまで、バースト期間の長さを可変し、各日付に対応するバースト値を算出する。
Figure 2011081491
Figure 2011081491
Figure 2011081491
上記(式1)において、「BURST」はバースト値であり、「α」は、長期間選択調整係数(例えば、2.5)である。「mintime」は、バースト期間内の最初の日付である。「maxtime」は、バースト期間内の最後の日付である。
上記(式3)において、「yi」は、「mintime」から数えて「i」番目の日付において集計されたブログの書き込み数である。「m」は、バースト期間の最大値以上で、教師データ期間の長さ以下の値(例えば、7)である。つまり、「SABUNi」は、「i」番目の日付において集計されたブログの書き込み数「yi」と、「i」番目の日付の「m」日前から「i」番目の日付までの間におけるブログの書き込み数の平均値と、の間の差分である。
バースト期間の長さ「W」と、「m」の値とは、外れ値が適切に検出されるように調整される。例えば、外れ値を1日単位で検出したい場合は、「W」は0に設定される。また、外れ値が2日以上連続で出現することが多い場合、利用者は「W」を1以上に設定すればよい。「m」は、「W」の大きさに応じて適切な値が設定される。
あるバースト期間内に外れ値がある場合、そのバースト期間のバースト値の絶対値は、バースト期間内に外れ値のない場合よりも大きくなる。このため、特異点補正部2012は、バースト期間ごとに、バースト値を算出することで、どのバースト期間内に外れ値があるのかを効率的に判断できる。
特異点補正部2012は、バースト値が高い順に各バースト期間をソートする。特異点補正部2012は、バースト値が高い所定個のバースト期間とバースト値の低い所定個のバースト期間とを、特異点を含むバースト期間として抽出する。例えば、上位、下位10個のバースト期間が抽出される。
但し、バースト期間の抽出においては、特異点補正部2012は、バースト値の絶対値の高い期間を優先してバースト期間を順に抽出する。そして、既に抽出したバースト期間と日付が重複するバースト期間は、抽出対象から除外する。
特異点補正部2012は、抽出したバースト期間内の時系列値を外れ値として、それらの外れ値を補正する。例えば、特異点補正部2012は、直近データの平均値で補正する。但し、特異点補正部2012は、外れ値が最後のデータで、直後のデータがない場合、その外れ値を除外し、以下に説明する時系列分析において、その値を用いない。特異点補正部2012は、補正後の集計結果を示す学習データを出力する。
図1に戻り、トレンド成分学習部202、周期成分学習部203、および分析結果作成部204について説明する。
トレンド成分学習部202は、特異点補正部2012が出力した学習データから、トレンドパラメータを算出する。
トレンドパラメータとは、教師データ期間におけるブログ書き込み数の増加傾向、または減少傾向を示す関数(以下、「トレンド関数」という)のパラメータである。例えば、トレンドパラメータとして、トレンド関数の係数や指数が算出される。
トレンド関数は、例えば、下記の式で表わされる関数である。トレンド関数は、ブログ書き込み数の予測において、増減傾向のみが抽出された成分であるから、トレンド成分とも呼ばれる。
Figure 2011081491
上記(式4)において、関数「y(x)」は、トレンド関数である。この「y(x)」の値は、教師データ期間における最初の日付から「x」日目におけるブログ書き込み数となる。「α」、「β」は、トレンドパラメータである。
トレンド成分学習部202は、例えば、最小ニ乗法を使用することにより、測定データを上記(式4)に近似し、トレンドパラメータを算出する。
具体的には、下記の式に、測定値を代入することにより、トレンドパラメータを算出する。
Figure 2011081491
Figure 2011081491
上記(式5)、(式6)において、「t」は教師データ期間内の最初の日からの日数であり、「Σ」は、教師データ期間における総和をとることを示している。「α」
、「β」は、トレンドパラメータである。「y」は、集計されたブログの書き込み数である。
トレンド成分学習部202は、算出したトレンドパラメータを適用したトレンド関数を導出し、学習データの各日付の書き込み数から、トレンド関数にその日付に対応する日数(「x」)を代入することで得られた書き込み数(「y(x)」)を減算する。
周期成分学習部203は、トレンド関数の算出値を減算した後の学習データをフーリエ解析することにより、周期パラメータを算出する。
周期パラメータとは、教師データ期間におけるブログ書き込み数、すなわち時系列値の周期的な変動を示す関数(以下、「周期関数」という)のパラメータである。例えば、周期パラメータとして、周期関数の係数や指数が算出される。
周期関数は、例えば、下記の式で表わされる関数である。周期関数は、ブログ書き込み数の予測において、周期性のみが抽出された成分であるから、周期成分とも呼ばれる。
Figure 2011081491
Figure 2011081491
Figure 2011081491
Figure 2011081491
Figure 2011081491
Figure 2011081491
Figure 2011081491
上記(式7)〜(式13)において、「Y(t)」は周期関数である。この「Y(t)」の値は、教師データ期間における最初の日付から「t」日目におけるブログ書き込み数となる。「An」、および「Bn」は、1年を周期とする周期パラメータである。「an」、および「bn」は、1週間を周期とする周期パラメータである。「n」は、フーリエ係数である。例えば、周期成分学習部203は、1〜5の「n」について、周期パラメータを算出し、それぞれを加算する。
分析結果作成部204は、トレンド関数と周期関数とを加算して、ブログ書き込み数の推移を予測するための予測式を生成する。
また、分析結果作成部204は、その予測式の各パラメータ、すなわちトレンドパラメータおよび周期パラメータを示す予測式データを予測パラメータDB40に格納する。
そして、分析結果作成部204は、時系列分析要求データの示す予測期間内の各日付のブログ書き込み数を、予測式を使用して算出する。分析結果作成部204は、予測期間内で算出した値を予測値として、各予測値を示す分析結果データを利用者PC10へ送信する。
また、分析結果作成部204は、時系列分析要求データの示すカテゴリ、キーワードが、以前にトレンド成分、周期成分を算出したカテゴリ、キーワードと同じであれば、以前に求めた予測式を用いて予測値を算出する。
図4は、ブログ抽出・集計部201が作成する学習データの示す内容をまとめた表である。同図を参照すると、学習データは、「カテゴリ」、および「キーワード」に対応付けて、複数の「日付」および「書き込み件数」を示すデータを含む。「カテゴリ」は、抽出対象のブログデータが属するカテゴリである。「キーワード」は、ブログデータにおいて検索されたキーワードである。「日付」は、集計期間内の各日付である。「書き込み件数」は、キーワードを含むブログが書き込まれた件数である。
例えば、時系列分析要求データの示すカテゴリが「食料品」で、キーワードとして「値上げ」が指定された場合について考える。ブログ抽出・集計部201は、「食料品」のカテゴリに属するブログデータについて、指定されたキーワードを検索する。ブログ抽出・集計部201は、キーワード「値上げ」を含むブログデータを抽出し、教師データ期間内、各日付のデータ数をそれぞれ集計する。
図5および図6を参照して、学習データから特異点を検出し、補正する方法について説明する。ここでは、バースト期間の長さを1日から7日に可変するものとする。また、上記(式3)における「m」を7に設定する。
図5に示すように、ブログ抽出・集計部201は、バースト期間の長さ(バースト範囲)を1から7に可変し、教師データ期間内の各日付をバースト期間の初日としたバースト値を算出する。
図5を参照すると、例えば、バースト範囲が1日で、「mintime」が2009年8月25日の場合のバースト値は「0」である。バースト範囲が2日で、「mintime」が2009年8月25日の場合、「maxtime」は2009年8月26日となり、バースト値は「22.5」である。
ブログ抽出・集計部201は、図6(a)のように、各期間において算出したバースト値について降順でソートする。ブログ抽出・集計部201は、バースト値の上位から順にバースト期間を抽出する。
ここで、バースト値が同一の値となる期間が複数あった場合、バースト範囲の長い方が優先して抽出される。なお、バースト値の同じ期間が複数あっても、ブログ抽出・集計部201がいずれも抽出する構成としてもよい。
図6(a)を参照すると、最もバースト値が高いのは、バースト期間の初日を2009年8月28日、バースト範囲を1日として算出されたバースト値である。2番目にバースト値が高いのは、バースト期間の初日を2009年9月14日、バースト範囲を2日として算出されたバースト値である。3番目にバースト値が高いのは、2009年9月14日に対応するバースト値である。まず、これらの3つの期間が、外れ値を含みうるバースト期間として抽出される。
そして、4番目にバースト値が高いのは、バースト期間の初日を2009年8月27日、バースト範囲を2日として算出されたバースト値であった。このバースト期間は、既に抽出されたバースト期間内の日付である8月28日を含む。このため、バースト期間の初日を2009年8月27日、バースト範囲を2日とするバースト期間は、抽出対象から除外される。図6(a)における斜線部分は、抽出対象から除外されたバースト期間である。これらのバースト期間が除外された結果を図6(b)に示す。
図5における、太い実線で囲まれた数字は、抽出されたバースト期間に対応するバースト値である。斜線で囲まれた数字は、この抽出済みのバースト期間と日付が重複するバースト期間に対応するバースト値である。これらの斜線で囲まれた部分に対応するバースト期間は、抽出対象から除外される。
ブログ抽出・集計部201は、図5、図6(a)の斜線部分に対応するバースト期間を除いた後、上位10個のバースト期間を抽出する。次に、最もバースト値が低いバースト値から順に、同様の方法で下位10個のバースト期間が抽出される。
なお、上位、下位に関わらず、最も絶対値の大きなバースト値に対応するバースト期間から順に抽出される構成としてもよい。
このように、日付が重複するバースト期間を抽出しないことにより、ブログ抽出・集計部201は、外れ値を精度よく検出できる。
そして、ブログ抽出・集計部201は、抽出したバースト期間内の値を、その前後の平均値に補正する。
図7は、予測式データの示す内容をまとめた図である。同図に示すように、予測式データは、「カテゴリ」、「キーワード」、「教師データ期間」、「トレンドパラメータ」、および「周期パラメータ」を示す情報を含む。
「カテゴリ」は、抽出対象のブログデータが属するカテゴリである。「キーワード」は、ブログデータにおいて検索されたキーワードである。「教師データ期間」は、予測式を算出するために時系列値が集計された期間である。「トレンドパラメータ」は、最小二乗法により算出されたトレンド関数のパラメータである。「周期パラメータ」は、フーリエ解析により算出された周期関数のパラメータである。
続いて、分析・可視化サーバ20の動作について説明する。図8は、分析・可視化サーバ20の動作を示すフローチャートである。この動作は、分析・可視化サーバ20が時系列分析要求データを受信したときに開始する。
ブログ抽出・集計部201は、時系列分析要求データに基づいてブログデータを抽出し、集計するブログ抽出・集計処理を実行する(ステップS1)。
トレンド成分学習部202は、集計結果を上記(4)式に近似することにより、トレンド成分を抽出する(ステップS2)。周期成分学習部203は、周期成分を抽出するための周期成分抽出処理を実行する(ステップS3)。
分析結果作成部204は、トレンドパラメータ、周期パラメータを予測パラメータDB40に格納し、トレンド関数および周期関数を加算して予測式を作成する(ステップS4)。分析結果作成部204は、予測式から、指定された予測期間における時系列値の予測値を算出し、分析結果データを利用者PC10へ出力する(ステップS5)。ステップS5の後、分析・可視化サーバ20は動作を終了する。
図9は、ブログ抽出・集計処理を示すフローチャートである。同図を参照すると、ブログ抽出・集計部201は、教師データ期間内において、時系列分析要求データで指定されたカテゴリ、キーワードと全部一致または部分一致する単語を含むブログを抽出し、集計する(ステップS11)。
ブログ抽出・集計部201は、教師データ期間をバースト期間ごとに分割し、各バースト期間におけるバースト値を算出する。そして、ブログ抽出・集計部201は、バースト値が高い所定個のバースト期間を抽出することにより特異点を検出し、補正する(ステップS12)。ステップS12の後、ブログ抽出・集計部201は、ブログ抽出・集計処理を終了する。
図10は、周期成分抽出処理を示すフローチャートである。同図を参照すると、周期成分学習部203は、上記(式8)、(式9)を使用して年単位の周期パラメータAn、Bnを算出する(ステップS31)。そして、周期成分学習部203は、上記(式10)、(式11)を使用して年単位の周期パラメータan、bnを算出する(ステップS32)。ステップS32の後、周期成分学習部203は、周期成分抽出処理を終了する。
図11〜図15を参照して、分析・可視化サーバ20の動作結果の一例について説明する。図11は、分析・可視化サーバ20が、時系列分析要求データに基づいて、教師データ期間でブログの書き込み数を集計した結果をプロットした折れ線グラフである。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。
分析・可視化サーバ20は、教師データ期間を、複数のバースト期間に分割し、上記(式1)を使用して、各バースト期間におけるバースト値を算出する。同図に示すように、B1において書き込み数が突発的に増加し、B2において書き込み数が突発的に減少しているので、これらのB1,B2を含むバースト期間において、バースト値の絶対値が高くなる。分析・可視化サーバ20は、これらバースト期間内の外れ値を補正する。
図12は特異点を補正した後の集計結果を示す折れ線グラフである。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。同図に示すように、特異点B1,B2は、いずれも補正されている。
図13は、分析・可視化サーバ20が、集計結果からトレンド成分を求めた結果を示す図である。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。集計結果から、最小二乗法により、同図の一点鎖線で表わされる対数関数が導出される。同図に示すように、ブログの書き込み件数の推移には、時間の経過とともに徐々に増加してゆく傾向、すなわちトレンドがある。
図14は、分析・可視化サーバ20が集計結果からトレンド成分を除去し、周期成分を求めた結果を示す図である。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。集計結果から、フーリエ解析より、同図のニ点鎖線で表わされる周期関数が導出される。同図に示すように、ブログの書き込み件数は、年単位で周期的に変化し、週単位でも周期的に変化する。
図15は、分析・可視化サーバ20が、予測式を使用して予測値を算出した結果を示す折れ線グラフである。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。同図の実線の部分は、特異点を補正した集計結果であり、同図の二点鎖線の部分は、予測式で算出した予測期間内の予測値をプロットした結果である。同図に示すように、分析・可視化サーバ20は、予測式を使用することにより、今後のブログ書き込み数の推移を予測することができる。
分析・可視化サーバ20は、異なる条件で集計された集計結果や、異なる条件で算出された分析結果を、比較のために同時に表示することもできる。
図16は、同じカテゴリにおいて、類似する製品「製品A」、「製品B」をキーワードとして集計された集計結果と算出された分析結果とを示す折れ線グラフである。同図において、実線の部分が、これらのキーワードについての集計結果である。破線の部分が、これらのキーワードについての予測値をプロットしたものである。
利用者は、各製品に関する書き込み数がどのように推移するかを比較し、どのように商品の販売、宣伝などを実行するかを検討することができる。
なお、本実施形態では、分析・可視化サーバ20は、ブログの書き込み数を時系列値として収集しているが、時系列で収集された値であれば、他の時系列値を収集し、分析することもできる。例えば、時系列値は、ブログ以外のWeb関係のデータであってもよい。Web関係のデータは、Webページの記事数や、記事が検索された回数、Webサイトへのアクセスログなどである。
また、時系列値は、株価、為替とすることも可能である。若しくは、分析・可視化サーバ20は、CPU使用率などのシステムログデータなどを時系列値として分析することもできる。
本実施形態では、分析・可視化サーバ20は、1日ごとにブログ書き込み数を集計しているが、集計する時期は、教師データ期間内の時期であれば、1日に限らない。例えば、分析・可視化サーバ20は、1時間ごとにブログ書き込み数を集計してもよい。
本実施形態では、分析・可視化サーバ20は、上記(式1)〜(式3)を使用して外れ値を検出しているが、突発的に増減する値を検出できるのであれば、これらの数式以外の式を使用して外れ値を検出してもよい。
例えば、上記(式3)において、平均値と「yi」との間の差分を「SABUNi」としているが、差分の絶対値を「SABUNi」として算出してもよい。この場合、分析・可視化サーバ20は、バースト値の上位、所定個のバースト期間を抽出する。
本実施形態では、分析・可視化サーバ20は、上記(式4)のように、集計結果を対数関数に近似しているが、対数関数以外の関数に近似してもよいのは勿論である。例えば、分析・可視化サーバ20は、下記に示すような式を用いて線形近似を行ってもよい。
Figure 2011081491
または、分析・可視化サーバ20は、下記に示すような式を用いて累乗近似を行ってもよい。
Figure 2011081491
もしくは、分析・可視化サーバ20は、下記に示すような式を用いて指数近似を行ってもよい。
Figure 2011081491
上記(式14)〜(式16)において、「α」、「β」はトレンドパラメータ、「y」はブログ書き込み数、「x」は集計日である。
本実施形態では、分析・可視化サーバ20は、1年を周期とする周期成分と、1週間を周期とする周期成分とを求めているが、これらと異なる周期の周期成分を求めてもよいのは勿論である。例えば、ブログの書き込み数が1時間ごとに集計される場合、分析・可視化サーバ20は、周期を1日とする周期成分を算出することもできるし、周期を1年でなく、2年や3年としてもよい。
本実施形態の分析・可視化サーバ20は、トレンド成分の算出において、最小ニ乗法を使用しているが、集計結果を回帰分析できるのであれば、最小二乗法以外の手法により、トレンド成分を算出してもよい。
本実施形態の分析・可視化サーバ20は、フーリエ解析を行うことにより、周期成分を算出しているが、周期的な変動パターンを求めることができるのであれば、フーリエ解析以外の手法により周期成分を算出してよい。例えば、分析・可視化サーバ20は、AR(Autoregressive model)モデルを使用することにより、周期成分を求めることが可能である。
以上説明したように、本実施形態によれば、時系列分析装置は、Web関係のデータに特有の増減傾向や周期性を表す関数のパラメータを算出するので、時系列値に、周期性のほか、増減傾向があっても、予測値を正確に算出できる。
(第2の実施形態)
本発明の第2の実施形態について説明する。本実施形態の時系列分析システムは、イベントの影響度を更に算出できる点で、第1の実施形態の時系列分析システムと異なる。なお、本実施形態の時系列分析システムについて、図1〜図16で説明した構成と同様な構成の詳細な説明を省略し、第1の実施形態と異なる点について詳しく説明する。
本実施形態の利用者PC10は、時系列分析要求データの他、イベントの影響度の算出を要求する影響度分析要求データの入力を受け付ける。イベントの影響度とは、イベントを実行後の、実際のブログの書き込み数が予測値に対して増減した度合を示す値である。例えば、分析・可視化サーバ20は、実際の書き込み数を予測値で割った値を影響度とする。
具体的には、イベントの開始から一定期間が経過した時点におけるイベントの影響度を求めたいとき、利用者は、イベントの種類、イベントの開始時期、予測期間、および教師データ期間を利用者PC10に入力する。ここで、イベントの開始時期以前の所定期間が教師データ期間として設定される。また、イベントの開始時期以降の所定期間が予測期間として設定される。本実施形態では、教師データ期間の長さは、予測期間の長さ以上に設定されることが望ましい。
例えば、イベントの開始から1カ月感が経過し、その1カ月間におけるイベントの影響度を算出したい場合、利用者は、イベント開始以前の1年間を教師データ期間、イベント開始時から1カ月間の期間を予測期間として入力する。
利用者PC10は、イベントの種類、イベントの開始時期、予測期間、および教師データ期間を示す情報を含む影響度分析要求データを分析・可視化サーバ20へ出力する。
図17は、影響度分析要求データに含まれる情報を示す図である。同図を参照すると、影響度分析要求データには、「カテゴリ」、「キーワード」、「イベント種類」、「教師データ期間」、および「予測期間」を示す情報を含む。
「カテゴリ」、「キーワード」は、第1の実施形態と同様である。「教師データ期間」は、イベント開始時期以前の所定期間である。「予測期間」は、イベント開始時期以降の所定期間である。
影響度分析要求データが入力されたとき、分析・可視化サーバ20は、第1の実施形態と同様の方法で予測式を求め、その予測式から、予測期間内の各日付の予測値を算出する。
一方、分析・可視化サーバ20は、予測期間内におけるブログデータをブログDB30から読み出し、予測期間における実際のブログ書き込み数を集計して実測値とする。そして、分析・可視化サーバ20は、予測期間内の実測値の合計を、予測期間内の予測値の合計で除算して得た値をイベントの影響度とする。
分析・可視化サーバ20は、予測値、実測値を表示するための分析結果データを利用者PC10へ送信する。また、分析・可視化サーバ20は、イベントの種類、影響度を示す情報を更に含む予測式データを予測パラメータDB40に格納する。
図18は、予測式データの示す内容をまとめた図である。同図に示すように、予測式データは、「カテゴリ」、「キーワード」、「教師データ期間」、「トレンドパラメータ」、および「周期パラメータ」を示す情報に加え、「イベント」および「影響度」を示す情報を含む。
「イベント」は、分析対象のイベントの種類である。「影響度」は、実測値と予測値とから得られるイベントの影響度である。
図19は、本実施形態の分析・可視化サーバ20の動作を示すフローチャートである。この動作は、分析・可視化サーバ20が影響度分析要求データを受信したときに開始する。
分析・可視化サーバ20は、教師データ期間のブログ書き込み数の集計結果から、予測期間における予測値を算出するための時系列分析処理を実行する(ステップT1)。図19における時系列分析処理は、図8に示した時系列分析処理と同様の処理である。
分析・可視化サーバ20は、予測期間内の実測値の合計を、予測期間内の予測値の合計で除算することにより、イベントの影響度を算出する(ステップT2)。
図20を参照して、イベントの影響度の算出結の一例について説明する。同図は、予測値と実測値とを示す折れ線グラフである。同図における実線は、実際に集計されたブログの書き込み数をプロットしたものである。一点鎖線は、予測値をプロットしたものである。「P1」の時期はイベントの開始時期である。斜線部分は、予測値と実測値との間の差分を示す部分である。
図20に示すように、イベントの開始時期「P1」から、予測期間内において、予測値に対し、実際のブログ書き込み数が増加している。この増加分がイベントの影響により増加した書き込み数と推測される。
なお、本実施形態では、分析・可視化サーバ20は、実測値の合計を予測値の合計で除算した値を影響度としているが、予測値に対する実測値の増減の度合を示す値であれば、他の方法で影響度を算出してもよい。例えば、予測期間内のある日付における実測値と予測値との間の差分自体を影響度としてもよい。
以上説明したように、本実施形態によれば、分析・可視化サーバ20は、イベントの効果を定量的に測定することができる。
(第3の実施形態)
本発明の第3の実施形態について説明する。本実施形態の時系列分析システムは、成長度スコアを更に算出できる点で、第1の実施形態の時系列分析システムと異なる。なお、本実施形態の時系列分析システムについて、図1〜図16で説明した構成と同様な構成の詳細な説明を省略し、第1の実施形態と異なる点について詳しく説明する。
本実施形態の利用者PC10は、時系列分析要求データの他、成長度スコアの算出を要求する成長度スコア算出要求データの入力を受け付ける。
成長度スコアとは、ある時期を教師データ期間の終日として算出された予測値に対する、それ以降の時期を教師データ期間の終日として算出された予測値の増減の度合を示す値である。例えば、教師データ期間の終日が遅い方の予測値の合計を、教師データ期間の終日が早い方の予測値の合計で除算した値を成長度スコアとする。
分析・可視化サーバ20は、成長度スコア算出要求データに基づいて、成長度スコアを算出する。
ここでは、最後にブログ書き込み数が集計された日付を「現在」とする。利用者は、「比較対象時期」として、その現在以前の日付を設定する。利用者は、現在を基準として現在以降の所定期間を予測期間に設定し、現在以前の所定期間を教師データ期間に設定する。
例えば、利用者は、現在より1週間前の日付を比較対象時期に設定し、現在以降の2カ月間を予測期間に設定し、現在以前の1年間を教師データ期間に設定する。
利用者PC10は、比較対象時期、予測期間、および教師データ期間を示す情報を含む成長度スコア算出要求データを分析・可視化サーバ20へ出力する。
図21は、成長度スコア算出要求データに含まれる情報を示す図である。同図を参照すると、影響度分析要求データには、「カテゴリ」、「キーワード」、「教師データ期間」、「予測期間」、および「比較対象時期」を示す情報を含む。
「カテゴリ」、「キーワード」は、第1の実施形態と同様である。「教師データ期間」、「予測期間」は、現在を基準に設定された教師データ期間、予測期間である。「比較対象時期」は、現在以前の所定の日付である。
図22は、本実施形態の分析・可視化サーバ20の動作を示すフローチャートである。この動作は、分析・可視化サーバ20が成長度スコア算出要求データを受信したときに開始する。
分析・可視化サーバ20は、成長度スコア算出要求データの示す、現在を基準とした「教師データ期間」、「予測期間」を設定する(ステップT3)。
分析・可視化サーバ20は、教師データ期間のブログ書き込み数の集計結果から、予測期間における予測値を算出するための時系列分析処理を実行する(ステップT4)。図22における時系列分析処理は、図8に示した時系列分析処理と同様の処理である。
次いで、分析・可視化サーバ20は、成長度スコア算出要求データの示す「教師データ期間」の長さは変えずに、その終日が「比較対象時期」になるように、「教師データ期間」を設定し直す。
また、分析・可視化サーバ20は、成長度スコア算出要求データの示す「予測期間」の長さは変えずに、その初日が「比較対象時期」になるように、「予測期間」を設定し直す。
つまり、分析・可視化サーバ20は、比較対象時期を基準とした教師データ期間、予測期間を設定する(ステップT5)。
分析・可視化サーバ20は、新たに設定された教師データ期間、予測期間に基づいて、時系列分析処理を実行する(ステップT6)。
分析・可視化サーバ20は、現在を基準として算出された予測期間内の予測値の合計を、比較対象時期を基準として算出された予測期間内の予測値の合計で除算することにより、成長度スコアを算出する(ステップT7)。ステップT7の後、分析・可視化サーバ20は、動作を終了する。
図23を参照して、成長度スコアの算出結の一例について説明する。同図は、現在、比較対象時期のそれぞれを基準として算出された予測値をプロットした折れ線グラフである。同図における細い実線は、現在を基準とした教師データ期間の集計結果の一部をプロットしたものである。太い実線は、現在を基準とした予測期間内の予測値をプロットしたものである。一点鎖線は、比較対象時期を基準とした予測期間内の予測値をプロットしたものである。比較対象時期は1週間前に設定されたものとする。
図23に示すように、1週間前を基準として算出された予測値よりも、現在を基準として算出された予測値は増加している。この予測値の増加率が成長度スコアとして算出される。
なお、本実施形態では、分析・可視化サーバ20は、現在を基準として算出された予測期間内の予測値の合計を、比較対象時期を基準として算出された予測期間内の予測値の合計で除算することにより、成長度スコアを算出している。
しかし、過去の時点の予測値に対する、それ以降における予測値の増減の度合を示す値であれば、他の算出方法で算出した値を成長度スコアとしてもよい。例えば、分析・可視化サーバ20は、現在を基準として算出された予測期間内の予測値の合計と、比較対象時期を基準として算出された予測期間内の予測値の合計との差分を成長度スコアとしてもよい。
また、本実施形態では、比較対象時期を1つだけ設定しているが、複数設定してもよいのは勿論である。例えば、分析・可視化サーバ20は、現在、その1週間前、1カ月前の3つの時点が設定されたとき、1週間前に対する現在の成長度、1カ月前に対する現在の成長度を算出する。
以上説明したように、本実施形態によれば、過去の予測値と、それ以降の予測値との差を成長度として定量化することができる。
(第4の実施形態)
本発明の第4の実施形態について説明する。本実施形態の時系列分析システムは、イベントの効果を更に予測できる点で、第2の実施形態の時系列分析システムと異なる。なお、本実施形態の時系列分析システムについて、図17〜図20で説明した構成と同様な構成の詳細な説明を省略し、第2の実施形態と異なる点について詳しく説明する。
本実施形態の利用者PC10は、時系列分析要求データの他、イベントの効果の予測を要求するシミュレーション要求データの入力を受け付ける。
利用者は、カテゴリ、キーワード、イベントの種類、イベントの開始時期、および予測期間を設定する。利用者PC10は、これらを示す情報を含むシミュレーション要求データを送信する。
分析・可視化サーバ20は、予測パラメータDB40に格納されたデータの中から、シミュレーション要求データの示すカテゴリと同一カテゴリに属し、類似するイベントを検索する。類似するイベントとは、キーワードの一部または全部が一致し、イベント種類が同じイベントである。分析・可視化サーバ20は、検索したイベントの予測式の成分を読み出す。また、分析・可視化サーバ20は、ブログDB30のブログデータから、検索したイベントのイベント開始時期以降の実測値を取得する。
分析・可視化サーバ20は、予測式から算出された予測値と、実測値とを表示するためのデータを利用者PC10へ送信する。
図24はシミュレーション要求データに含まれる情報を示す図である。同図を参照すると、シミュレーション要求データには、「カテゴリ」、「キーワード」、「イベント種類」、「イベント開始時期」、および「予測期間」を示す情報を含む。「カテゴリ」、「キーワード」、「イベント種類」、「イベント開始時期」、および「予測期間」の内容は、第2の実施形態と同様である。
図25は、本実施形態の分析・可視化サーバ20の実行するイベント効果予測処理を示すフローチャートである。イベント効果予測処理は、分析・可視化サーバ20がシミュレーション要求データを受信したときに開始する。
分析・可視化サーバ20は、シミュレーション要求データの示すカテゴリと同一カテゴリに属し、類似するイベントを検索する。分析・可視化サーバ20は、検索したイベントの予測式の成分を読み出す。複数のイベントが検索された場合、それらのイベントの成分の平均値を算出する(ステップT11)。
分析・可視化サーバ20は、取得した成分から得た予測式で、シミュレーション要求データの示す予測期間における予測値を算出する(ステップT12)。
分析・可視化サーバ20は、ブログDB30から、検索したイベントのブログデータを読み出し、そのイベントの開始時期以降のブログ書き込み数の実測値を集計する。複数のイベントが検索された場合、それらのイベントの実測値の平均値を算出する。分析・可視化サーバ20は、イベント開始時期から、シミュレーション要求データの示す予測期間と同じ長さの期間が経過するまでの期間について集計する。
分析・可視化サーバ20は、予測値と実測値とを表示するためのデータを利用者PC10へ送信する(ステップT13)。ステップT13の後、分析・可視化サーバ20は、イベント効果予測処理を終了する。
以上説明したように、分析・可視化サーバ20は、過去の類似イベントの予測値と、実測値とを求めるので、イベントを実行した場合の効果をシミュレートできる。
1 時系列データ分析システム
10 利用者PC
20 分析・可視化サーバ
30 ブログDB
40 予測パラメータDB
201 ブログ抽出・集計部
202 トレンド成分学習部
203 周期成分学習部
204 分析結果作成部
2011 測定部
2012 特異点検出・補正部

Claims (16)

  1. Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手段と、
    Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、
    前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、
    を有する時系列分析装置。
  2. 前記周期パラメータ算出手段は、周期が異なる複数の周期関数を定義しておき、それぞれの周期関数に対応する複数の周期パラメータを算出する、請求項1に記載の時系列分析装置。
  3. 前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手段を更に有し、
    前記トレンドパラメータ算出手段は、前記補正手段により外れ値が検出された場合、該補正手段により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出する、請求項1又は2に記載の時系列分析装置。
  4. 前記補正手段は、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をyt、自然数をm、該バースト期間におけるバースト値をBURSTとして、
    Figure 2011081491
    Figure 2011081491
    Figure 2011081491
    の式により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正する、請求項3に記載の時系列分析装置。
  5. 前記補正手段は、前記バースト期間の長さを、最小値から最大値まで変化させて、各バースト値を算出する、請求項4に記載の時系列分析装置。
  6. 前記補正手段は、バースト値の絶対値が高いバースト期間を優先して順に抽出し、既に抽出したバースト期間と時期が重複するバースト期間は抽出しない、請求項5に記載の時系列分析装置。
  7. 時系列値の値を予測すべき予測時期が入力されたとき、前記予測式算出手段により算出された前記予測式に、該予測時期を代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手段を更に有する、請求項1乃至6のいずれか1項に記載の時系列分析装置。
  8. イベントが開催された時期から所定の期間が経過するまでに集計された時系列値と、前記予測値算出手段により該期間内で算出された予測値とに基づいて該イベントの影響度を算出する影響度算出手段を更に有する、請求項7に記載の時系列分析装置。
  9. 前記予測値算出手段は、第1の集計期間と、第2の集計期間と、予測時期とが入力されたとき、該第1の集計期間内に集計された時系列値に基づいて第1の予測式を算出し、該第2の集計期間内に集計された時系列値に基づいて第2の予測式を算出し、該第1の予測式に該予測時期を代入して得た予測値に対する、該第2の予測式に該予測時期を代入して得た予測値の度合を成長度として算出する、請求項7に記載の時系列分析装置。
  10. 前記予測式算出手段により算出された前記予測式と、該時系列値が集計された条件とを対応付けて記憶する記憶手段を更に有し、
    前記予測値算出手段は、前記記憶手段に記憶された前記条件と類似する条件で集計された時系列値と予測時期とが入力されたとき、前記記憶手段から該類似する条件に対応する前記予測式を読み出し、該予測式に該予測時期を代入することにより予測値を算出する、請求項7に記載の時系列分析装置。
  11. 前記トレンド関数は、対数関数、一次関数、累乗関数、及び指数関数のうち、いずれかの関数である、請求項1乃至10のいずれか1項に記載の時系列分析装置。
  12. 前記トレンドパラメータ算出手段は、最小ニ乗法を使用して前記時系列値と、該時系列値が集計された時期をトレンド関数に代入して得た値との差異が最小となる前記トレンドパラメータを算出する、請求項1乃至11のいずれか1項に記載の時系列分析装置。
  13. 前記周期パラメータ算出手段は、前記減算後の前記時系列値をフーリエ解析することにより、前記周期パラメータを算出する、請求項1乃至12のいずれか1項に記載の時系列分析装置。
  14. 前記周期パラメータ算出手段は、前記減算後の前記時系列値をARモデル解析することにより、前記周期パラメータを算出する、請求項1乃至13のいずれか1項に記載の時系列分析装置。
  15. Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め保持したトレンドパラメータ算出手段が、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出し、
    Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め保持した周期パラメータ算出手段が、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、
    予測式算出手段が、前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する、時系列分析方法。
  16. コンピュータに、
    Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、
    Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、及び
    前記トレンドパラメータ算出手順で算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手順で算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、
    を実行させるためのプログラム。
JP2009231488A 2009-10-05 2009-10-05 時系列分析装置、時系列分析方法、及びプログラム Active JP5077711B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009231488A JP5077711B2 (ja) 2009-10-05 2009-10-05 時系列分析装置、時系列分析方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009231488A JP5077711B2 (ja) 2009-10-05 2009-10-05 時系列分析装置、時系列分析方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2011081491A true JP2011081491A (ja) 2011-04-21
JP5077711B2 JP5077711B2 (ja) 2012-11-21

Family

ID=44075502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009231488A Active JP5077711B2 (ja) 2009-10-05 2009-10-05 時系列分析装置、時系列分析方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5077711B2 (ja)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013167980A (ja) * 2012-02-14 2013-08-29 Nippon Telegr & Teleph Corp <Ntt> 語彙学習曲線パラメータ推定装置、方法、及びプログラム
JP2013167981A (ja) * 2012-02-14 2013-08-29 Nippon Telegr & Teleph Corp <Ntt> 語彙学習曲線パラメータ推定装置、方法、及びプログラム
JP2014085862A (ja) * 2012-10-24 2014-05-12 Kddi Corp 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
JP2014164576A (ja) * 2013-02-26 2014-09-08 Kddi Corp 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
JP5622969B1 (ja) * 2014-02-04 2014-11-12 株式会社Ubic 文書分析システム、文書分析方法、および、文書分析プログラム
JP5627820B1 (ja) * 2014-02-04 2014-11-19 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
JP2015011690A (ja) * 2013-07-02 2015-01-19 ニフティ株式会社 効果測定プログラム、方法及び装置
JP2015011391A (ja) * 2013-06-26 2015-01-19 日本電信電話株式会社 変化検知装置、変化検知システム、変化検知方法及びプログラム
JP2015064650A (ja) * 2013-09-24 2015-04-09 ビッグローブ株式会社 情報処理装置、記事情報生成方法およびプログラム
WO2015118619A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
JP2016510441A (ja) * 2012-11-30 2016-04-07 フェイスブック,インク. オンライン・システム内のユーザ行動に関するカスタマイズされた予測器
JP2017097793A (ja) * 2015-11-27 2017-06-01 富士通株式会社 分析方法、分析プログラム、分析装置、情報表示方法、情報表示プログラム及び情報表示装置
KR20180117460A (ko) * 2017-04-19 2018-10-29 아시아나아이디티 주식회사 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치
KR101927872B1 (ko) * 2018-06-18 2018-12-12 현대멀티캡 주식회사 사용량 모니터링 및 코어 파킹을 이용한 전력 절감형 컴퓨터
CN109933607A (zh) * 2019-01-25 2019-06-25 四川眷诚天佑科技有限公司 周期性时间序列数据处理方法
JP2019153115A (ja) * 2018-03-05 2019-09-12 東京瓦斯株式会社 ガスデータの遠隔処理システム、プログラムおよび方法
WO2021112102A1 (ja) * 2019-12-06 2021-06-10 Arithmer株式会社 状態判定システム、状態判定方法および状態判定プログラム
CN113837503A (zh) * 2021-11-29 2021-12-24 新风光电子科技股份有限公司 基于人工智能的电网负荷预测方法及***
CN117056663A (zh) * 2023-10-13 2023-11-14 腾讯科技(深圳)有限公司 一种数据处理方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003281342A (ja) * 2002-03-25 2003-10-03 Nri & Ncc Co Ltd 販売施策効果分析方法およびその分析装置
JP2006227965A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd トレンド予測装置およびトレンド予測方法
JP2007141036A (ja) * 2005-11-21 2007-06-07 Ricoh Co Ltd 需要予測方法及び需要予測プログラム
JP2009116440A (ja) * 2007-11-02 2009-05-28 Yahoo Japan Corp 情報伝播抽出装置および情報伝播抽出方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003281342A (ja) * 2002-03-25 2003-10-03 Nri & Ncc Co Ltd 販売施策効果分析方法およびその分析装置
JP2006227965A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd トレンド予測装置およびトレンド予測方法
JP2007141036A (ja) * 2005-11-21 2007-06-07 Ricoh Co Ltd 需要予測方法及び需要予測プログラム
JP2009116440A (ja) * 2007-11-02 2009-05-28 Yahoo Japan Corp 情報伝播抽出装置および情報伝播抽出方法

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013167980A (ja) * 2012-02-14 2013-08-29 Nippon Telegr & Teleph Corp <Ntt> 語彙学習曲線パラメータ推定装置、方法、及びプログラム
JP2013167981A (ja) * 2012-02-14 2013-08-29 Nippon Telegr & Teleph Corp <Ntt> 語彙学習曲線パラメータ推定装置、方法、及びプログラム
JP2014085862A (ja) * 2012-10-24 2014-05-12 Kddi Corp 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
JP2016510441A (ja) * 2012-11-30 2016-04-07 フェイスブック,インク. オンライン・システム内のユーザ行動に関するカスタマイズされた予測器
JP2014164576A (ja) * 2013-02-26 2014-09-08 Kddi Corp 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
JP2015011391A (ja) * 2013-06-26 2015-01-19 日本電信電話株式会社 変化検知装置、変化検知システム、変化検知方法及びプログラム
JP2015011690A (ja) * 2013-07-02 2015-01-19 ニフティ株式会社 効果測定プログラム、方法及び装置
JP2015064650A (ja) * 2013-09-24 2015-04-09 ビッグローブ株式会社 情報処理装置、記事情報生成方法およびプログラム
WO2015118618A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
WO2015118616A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic 文書分析システム、文書分析方法、および、文書分析プログラム
WO2015118619A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
JP5622969B1 (ja) * 2014-02-04 2014-11-12 株式会社Ubic 文書分析システム、文書分析方法、および、文書分析プログラム
JP5627820B1 (ja) * 2014-02-04 2014-11-19 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
JP2017097793A (ja) * 2015-11-27 2017-06-01 富士通株式会社 分析方法、分析プログラム、分析装置、情報表示方法、情報表示プログラム及び情報表示装置
KR20180117460A (ko) * 2017-04-19 2018-10-29 아시아나아이디티 주식회사 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치
KR101924352B1 (ko) * 2017-04-19 2019-02-20 아시아나아이디티 주식회사 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치
JP2019153115A (ja) * 2018-03-05 2019-09-12 東京瓦斯株式会社 ガスデータの遠隔処理システム、プログラムおよび方法
KR101927872B1 (ko) * 2018-06-18 2018-12-12 현대멀티캡 주식회사 사용량 모니터링 및 코어 파킹을 이용한 전력 절감형 컴퓨터
CN109933607A (zh) * 2019-01-25 2019-06-25 四川眷诚天佑科技有限公司 周期性时间序列数据处理方法
CN109933607B (zh) * 2019-01-25 2023-10-03 微诺时代(北京)科技股份有限公司 周期性时间序列数据处理方法
WO2021112102A1 (ja) * 2019-12-06 2021-06-10 Arithmer株式会社 状態判定システム、状態判定方法および状態判定プログラム
JP6923864B1 (ja) * 2019-12-06 2021-08-25 Arithmer株式会社 状態判定システム、状態判定方法および状態判定プログラム
CN113837503A (zh) * 2021-11-29 2021-12-24 新风光电子科技股份有限公司 基于人工智能的电网负荷预测方法及***
CN117056663A (zh) * 2023-10-13 2023-11-14 腾讯科技(深圳)有限公司 一种数据处理方法、装置、电子设备及存储介质
CN117056663B (zh) * 2023-10-13 2024-02-13 腾讯科技(深圳)有限公司 一种数据处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
JP5077711B2 (ja) 2012-11-21

Similar Documents

Publication Publication Date Title
JP5077711B2 (ja) 時系列分析装置、時系列分析方法、及びプログラム
JP6703031B2 (ja) キーワードと資産価格との関連性評価方法及びその装置及び資産情報のディスプレイ方法
Davydenko et al. Measuring forecasting accuracy: The case of judgmental adjustments to SKU-level demand forecasts
US20180047071A1 (en) System and methods for aggregating past and predicting future product ratings
TWI518614B (zh) Method and Device for E - commerce Information Based on User Behavior
TWI539305B (zh) Personalized information push method and device
CN107516279B (zh) 一种网络舆情自动预警的方法
CN107093091B (zh) 一种数据处理方法和装置
WO2013073377A1 (ja) 情報拡散規模予測装置、情報拡散規模予測方法、および情報拡散規模予測プログラム
JP2009187151A (ja) 在庫管理システム及び発注量算出プログラム
JP2011141833A (ja) 株価予測装置、方法及びプログラム
JP5258532B2 (ja) 評判指数を出力する方法及び評判指数出力装置
JP2009244981A (ja) 解析装置、解析方法及び解析プログラム
CN110648045A (zh) 风险评估方法、电子装置及计算机可读存储介质
Michis A wavelet smoothing method to improve conditional sales forecasting
JP7235960B2 (ja) ジョブ電力予測プログラム、ジョブ電力予測方法、およびジョブ電力予測装置
JP2018195099A (ja) 性格分析装置、性格判定用モデル生成装置および性格分析用プログラム
WO2023085004A1 (ja) クーポン価値定量化プログラム、記録媒体、クーポン価値定量化方法、及び、クーポン価値定量化装置
WO2019205381A1 (zh) 股票筛选方法、装置及计算机可读存储介质
US20130185315A1 (en) Identification of Events of Interest
JP6617605B6 (ja) 需要量予測プログラム、需要量予測方法、及び情報処理装置
JP2008305229A (ja) 需要予測方法および装置
Lu Applying fast initial response features on GWMA control charts for monitoring autocorrelation data
JP2010282580A (ja) ライフサイクル分析装置、ライフサイクル分析プログラム、ライフサイクル分析方法およびライフサイクル分析システム
JP2017227942A (ja) 情報処理装置及び方法、並びにプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120731

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120815

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150907

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5077711

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250