JP6585998B2

JP6585998B2 - コンテンツ決定装置

Info

Publication number: JP6585998B2
Application number: JP2015230607A
Authority: JP
Inventors: 宰出水; 佑介深澤; 悠菊地
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2015-11-26
Filing date: 2015-11-26
Publication date: 2019-10-02
Anticipated expiration: 2035-11-26
Also published as: JP2017097699A

Description

本発明は、ユーザに提示されるコンテンツを決定するコンテンツ決定装置に関する。

従来、ウェブページやアプリケーション等に表示されるオンライン広告を配信するシステムが知られている。このようなシステムにおいて、ユーザの過去の製品及びサービスの購入履歴や人柄データ等の特徴量に基づいて、ユーザに配信するコンテンツを決定する仕組みが知られている（下記特許文献１参照）。この仕組みでは、ユーザの特徴量から、複数のコンテンツの各々のレスポンス率（クリック率）が予測され、レスポンス率が最も高いと予測されたコンテンツがユーザに配信される。

特開２００２−１２３７３９号公報

しかしながら、一般にユーザの特徴量の個数（次元数）は膨大であるため、ユーザの特徴量に基づいて配信コンテンツを決定しようとした場合、計算量が膨大になるおそれがある。一方、オンライン広告等のコンテンツは、なるべく早くユーザの目に触れさせるために、ユーザがウェブページ等にアクセスした後、直ちに表示されることが好ましい。このため、配信コンテンツを決定する処理は、短時間で行われること、すなわち計算量がなるべく少ないことが求められる。

ここで、計算量を削減するための手法としては、予めオフラインで、過去の特定期間にウェブページにアクセスしたユーザの特徴量に基づいて主成分分析を行い、元の次元数よりも少ない数の主成分を新たな特徴量として用いることで、次元数を削減する手法がある。しかし、このようにオフラインでの処理によって生成される新たな特徴量は、上記特定期間にウェブページにアクセスしたユーザ群の傾向を反映する一方で、上記特定期間以外にウェブページにアクセスしたユーザ群の傾向を反映したものではない。このため、上記手法では、ユーザ群の傾向が動的に変動する場合に、ユーザの興味関心に合った適切なコンテンツを配信コンテンツとして決定できないおそれがある。

本発明は、上記課題に鑑みてなされたものであり、ユーザ群の傾向の変動に応じてユーザに提示されるコンテンツを決定できるコンテンツ決定装置を提供することを目的とする。

本発明の一側面に係るコンテンツ決定装置は、端末のユーザに提示するコンテンツを決定するコンテンツ決定装置であって、端末のユーザの特徴を示す複数の項目からなる第１特徴量を取得する第１特徴量取得手段と、第１特徴量取得手段により取得された第１特徴量をコンテンツの提示に対応する提示時点と関連付けて蓄積する第１特徴量記憶手段と、提示するコンテンツを新たに決定する対象のユーザである対象ユーザに対して、予め用意された複数の候補期間の中から一の候補期間を分析期間として確率的に選択する分析期間選択手段と、第１特徴量記憶手段に蓄積された第１特徴量のうち提示時点が分析期間に含まれる第１特徴量に基づいて、対象ユーザの第１特徴量を当該第１特徴量よりも項目数が少ない第２特徴量に変換する特徴量変換手段と、特徴量変換手段によって得られた対象ユーザの第２特徴量と、対象ユーザよりも前に対象ユーザと同一の候補期間が分析期間として選択されたユーザである過去ユーザの第２特徴量と、当該過去ユーザに提示されたコンテンツに対して当該過去ユーザによる操作がされたか否かを示す操作情報と、に基づいて、対象ユーザに提示するコンテンツを複数の候補コンテンツの中から決定する決定手段と、を備える。

上記コンテンツ決定装置では、提示するコンテンツを新たに決定する対象の対象ユーザに対して、予め用意された複数の候補期間の中から一の候補期間が分析期間として確率的に選択される。そして、分析期間にコンテンツが提示されたユーザの第１特徴量に基づいて次元数（項目数）が削減された第２特徴量が得られる。続いて、対象ユーザの第２特徴量と、対象ユーザと同一の候補期間が分析期間として選択された過去ユーザの第２特徴量と、過去ユーザによるコンテンツに対する操作がされたか否かを示す操作情報とに基づいて、対象ユーザに提示されるコンテンツが決定される。このように、上記コンテンツ決定装置では、次元数を削減する処理を実行するために用いられる分析期間が全てのユーザに対して一律に決定されるのではなく、複数の候補期間のうちの一の候補期間が分析期間として確率的に割り当てられる。これにより、全てのユーザについて、特定の期間にコンテンツを要求したユーザ群の傾向に偏った分析結果のみに基づいて提示されるコンテンツが決定されることを防止できる。その結果、ユーザ群の傾向の変動に応じてユーザに提示されるコンテンツを決定することが可能となる。

上記コンテンツ決定装置では、分析期間選択手段は、決定手段により決定されたコンテンツに対してユーザによる操作がされた割合を示す操作率を、同一の候補期間が分析期間として選択されたユーザ群毎に取得し、予め定めた確率で、複数の候補期間のうちユーザ群毎の操作率が最大となる候補期間を分析期間として選択し、残りの確率で、複数の候補期間のうちからランダムに一の候補期間を分析期間として選択してもよい。

上記コンテンツ決定装置では、決定手段によって決定されたコンテンツに対してユーザによる操作（例えばクリック操作）がされた割合を示すユーザ群毎の操作率（例えばクリック率）が最大の候補期間（以下「最良候補期間」）が最も高い確率で選択される。その一方で、最良候補期間以外の候補期間も所定の確率でランダムに選択される。このような構成によれば、現時点で操作率が最大の最良候補期間を分析期間として決定する処理（活用）を一定の割合で行いつつ、最良候補期間以外の候補期間を分析期間として決定する処理（探索）も併せて行うことができる。その結果、活用の処理が適用される対象ユーザについては、現時点において当該対象ユーザが操作する可能性の高いコンテンツを提示することができる。また、探索の処理が適用される対象ユーザについて得られる操作情報によって、ユーザ傾向の変動を把握可能となる。

上記コンテンツ決定装置では、決定手段は、コンテンツに対して対象ユーザによる操作がされる期待値を対象ユーザの第２特徴量から算出するためのパラメータを、複数の候補コンテンツの各々について推定し、複数の候補コンテンツの各々について推定されたパラメータに基づいて対象ユーザに提示されるコンテンツを決定してもよい。

上記コンテンツ決定装置によれば、複数の候補コンテンツの各々について推定されたパラメータに基づいて、対象ユーザに提示するコンテンツを適切に決定することができる。例えば、対象ユーザによる操作がされる期待値が最大の候補コンテンツを対象ユーザに提示するコンテンツとして決定することで、対象ユーザによってコンテンツが操作される可能性を高めることが可能となる。

上記コンテンツ決定装置では、複数の候補コンテンツの各々について推定されたパラメータに基づいてバンディットアルゴリズムを用いた計算を実行することにより、対象ユーザに提示されるコンテンツを決定してもよい。

上記コンテンツ決定装置によれば、バンディットアルゴリズムを用いた計算により、現時点で最良と推定されるコンテンツ（例えば、対象ユーザによる操作がされる期待値が最大の候補コンテンツ）を対象ユーザに提示されるコンテンツとして決定する処理（活用）を実行する割合と、それ以外の候補コンテンツを対象ユーザに提示されるコンテンツとして決定する処理（探索）を実行する割合と、を適切に調整することができる。これにより、上述した活用及び探索をバランスよく実行するように、対象ユーザに提示されるコンテンツを決定することが可能となる。

本発明の一側面によれば、ユーザ群の傾向の変動に応じてユーザに提示するコンテンツを決定できる。

本実施形態に係るコンテンツ決定装置を含むコンテンツ決定システムの機能構成を示す図である。図１のコンテンツ決定装置のハードウェア構成を示す図である。ユーザ情報の一例を示す図である。履歴情報の一例を示す図である。履歴情報の集計結果の一例を示す図である。分析期間選択部及び特徴量変換部の処理を説明するための図である。 ε−Ｇｒｅｅｄｙ法による分析期間の選択方法を説明するための図である。主成分分析による特徴量の変換処理を説明するための図である。第２特徴量記憶部に記憶される情報の一例を示す図である。コンテンツ情報の一例を示す図である。コンテンツ決定装置の動作を示すフローチャートである。

以下、図面を参照しながら、本発明に係る実施形態を説明する。可能な場合には、同様の機能を有する部分には適宜同一の符号を付して、重複する説明を省略する。

図１は、本実施形態に係るコンテンツ決定装置を含むコンテンツ決定システムの機能構成を示すブロック図である。図１に示すコンテンツ決定システム１は、ユーザが所有する端末２と、当該端末２と通信ネットワークを介して通信可能とされたサーバ装置であるコンテンツ決定装置３と、を含む。コンテンツ決定装置３は、複数のユーザの各々の端末と接続され、各端末との間で以降に説明する処理を実行するように構成されている。

コンテンツ決定装置３は、予め用意された複数の候補コンテンツの中からユーザに提示するコンテンツを決定し、決定されたコンテンツを端末２に送信する装置である。コンテンツ決定装置３は、例えば、ユーザの端末２からの要求に応じてユーザに提示するコンテンツを決定する。端末２からコンテンツ決定装置３へのコンテンツ要求は、例えば以下のような場面で行われる。

ウェブブラウザ等を介してアクセス可能なインターネット上に公開されているウェブページには、各種情報へのリンクを含むコンテンツ（例えば広告コンテンツ等）を表示するための表示エリアが設けられている場合がある。このような場合、例えば、端末２が当該端末２に搭載されたウェブブラウザ等を介してウェブページにアクセスした際に、当該ウェブページ内の表示エリアに表示するためのコンテンツの取得要求が、当該端末２からコンテンツ決定装置３に送信される。その後、コンテンツ決定装置３において、予め用意された複数の候補コンテンツの中から一のコンテンツがユーザに提示するコンテンツとして決定され、端末２に送信される。その結果、端末２のウェブブラウザに表示されたウェブページの表示エリアに、コンテンツ決定装置３によって決定されたコンテンツが表示されることとなる。

また、スマートフォン等にインストールされる各種アプリケーションの専用画面等においても、各種情報へのリンクを含むコンテンツを表示するための表示エリアが設けられている場合がある。このような場合、例えば、ユーザが端末２にインストールされたアプリケーションを起動して専用画面を開いた際に、当該アプリケーションの機能により、端末２からコンテンツ決定装置３に対して、コンテンツの取得要求が送信される。その後、コンテンツ決定装置３において、予め用意された複数の候補コンテンツの中から一のコンテンツがユーザに提示するコンテンツとして決定され、端末２に送信される。その結果、端末２のアプリケーションの専用画面上の表示エリアに、コンテンツ決定装置３によって決定されたコンテンツが表示されることとなる。

本実施形態における「コンテンツ」とは、上述したように、各種情報へのリンクを含む表示要素を意味する。このようなコンテンツは、端末２の画面上において、文字や画像等の組み合わせによって表示されるのが一般的である。コンテンツの例としては、特定の商品・サービスを購入するためのウェブページや特定の情報（例えばグルメ情報等）が掲載されたウェブページ等へのリンクを含む広告コンテンツ等が挙げられる。このようなコンテンツをユーザに提示するにあたっては、ユーザの利便性や広告主の利益の最大化を図る観点から、ユーザの興味及び関心に合ったコンテンツをユーザに提示することが好ましい。すなわち、ユーザによって選択され、コンテンツに関連付けられたリンク先の情報にアクセスされる可能性の高いコンテンツをユーザに提示することが好ましい。

続いて、図１を用いてコンテンツ決定システム１の構成要素について説明する。

端末２は、ユーザと１対１に対応する装置であり、インターネット等の通信ネットワークを介してコンテンツ決定装置３と通信可能となっている。端末２の具体例としては、携帯電話機、スマートフォン、タブレット、ＰＤＡ等の携帯端末、デスクトップＰＣ、ノートＰＣ等が挙げられる。ただし、端末２の具体的な形態は、これらに限られない。端末２は、ユーザ情報送信部２１と、表示部２２と、を備える。

ユーザ情報送信部２１は、端末２からコンテンツ決定装置３に対してコンテンツ取得要求が送信される際に、当該端末２のユーザを識別するユーザＩＤと、当該ユーザの特徴を示す複数の項目からなる第１特徴量とを関連付けたユーザ情報をコンテンツ決定装置３に送信する手段である。第１特徴量は、例えば、性別、年齢、居住エリア、商品（又はサービス）の購入経験の有無、例えばグルメ、スポーツ等のジャンル毎のウェブページ訪問履歴等に関する複数の項目を含む情報である。このような第１特徴量は、例えば端末２に設けられた記憶装置等に予め記憶されている。

ユーザ情報は、端末２からコンテンツ決定装置３に直接送信されてもよいし、端末２とコンテンツ決定装置３との間を仲介する他の装置を介して送信されてもよい。例えば、ユーザが端末２に搭載されたウェブブラウザを介して会員制のウェブサイトにアクセスする場合を考える。この場合、当該ウェブサイトを提供する事業者のサーバ装置に会員ユーザの情報が管理されている場合がある。このような場合、事業者のサーバ装置が、当該事業者が提供するウェブサイトへのユーザからのアクセスを受け付けた際に、当該ユーザのユーザＩＤと第１特徴量とをコンテンツ決定装置３に送信してもよい。

表示部２２は、コンテンツ決定装置３から送信されたコンテンツを上述したウェブページや各種アプリケーションの専用画面等に設けられた表示エリアに表示する手段である。表示部２２により表示エリアにコンテンツが表示された後、ユーザは、表示エリアに表示されたコンテンツに対する操作を行うことにより、当該コンテンツに設定されたリンク先の情報（例えば特定の商品・サービスを購入するためのウェブページ等）にアクセスすることができる。ここで、「コンテンツに対する操作」とは、コンテンツに関連付けられたリンク先の情報にアクセスするための操作として予め定められた操作である。コンテンツに対する操作の典型例としては、マウスカーソルの位置を表示エリア上に表示されたコンテンツに合わせた状態でのマウスクリック操作や、端末２のディスプレイがタッチパネルである場合における表示エリア上に表示されたコンテンツに対するタッチ操作等が挙げられる。以降の説明では、上記のような種々の態様のコンテンツに対する操作を総称してクリック操作という。

続いて、コンテンツ決定装置３の構成について説明する。図１に示すように、コンテンツ決定装置３は、ユーザ情報取得部（第１特徴量取得手段）３１と、ユーザ情報記憶部（第１特徴量記憶手段）３２と、履歴情報記憶部３３と、履歴情報取得部３４と、分析期間選択部（分析期間選択手段）３５と、特徴量変換部（特徴量変換手段）３６と、第２特徴量記憶部３７と、決定部（決定手段）３８と、送信部３９と、コンテンツ情報記憶部３９ａと、を備える。

図２は、コンテンツ決定装置３のハードウェア構成の一例を示すブロック図である。図２に示すように、コンテンツ決定装置３は、物理的には、１又は複数のＣＰＵ（Central Processing Unit）３０１、主記憶装置であるＲＡＭ（Random Access Memory）３０２及びＲＯＭ（Read Only Memory）３０３、入力デバイスである入力装置３０４、ディスプレイ等の出力装置３０５、データ送受信デバイスである通信モジュール３０６、ハードディスクドライブ等の補助記憶装置３０７等を含むコンピュータシステムとして構成されている。図１におけるコンテンツ決定装置３の各機能は、図２に示されるＲＡＭ３０２等のハードウェア上に１又は複数の所定のコンピュータソフトウェアを読み込ませることにより、ＣＰＵ３０１の制御のもとで入力装置３０４、出力装置３０５、通信モジュール３０６を動作させるとともに、ＲＡＭ３０２や補助記憶装置３０７におけるデータの読み出し及び書き込みを行うことで実現される。

ユーザ情報取得部３１は、端末２からコンテンツの要求を受け付けた際に、当該端末２のユーザ情報送信部２１（或いは上述した事業者のサーバ装置等の他の装置）によって送信されたユーザ情報を取得する手段である。すなわち、ユーザ情報取得部３１は、端末２からコンテンツの要求を受け付ける度に、当該端末２のユーザの第１特徴量を取得する。ユーザ情報取得部３１により取得されたユーザ情報は、ユーザ情報記憶部３２に記憶される。

ユーザ情報記憶部３２は、ユーザ情報取得部３１により取得されたユーザ情報を、コンテンツの提示に対応する提示時点と関連付けて蓄積する手段である。ここで、コンテンツの提示に対応する提示時点は、例えば、端末２からユーザ情報を取得してから当該端末２に対してコンテンツが送信されるまでの間で任意に定められた時点であればよい。本実施形態では一例として、ユーザ情報記憶部３２においてユーザ情報と関連付けられる提示時点は、ユーザ情報がユーザ情報取得部３１によって取得された取得日時であるものとする。

図３に、ユーザ情報記憶部３２に蓄積されるユーザ情報の一例を示す。例えば、図３の１つ目のユーザ情報は、ユーザＩＤが「ｕｓｅｒ＿００１」で示されるユーザが、４４歳の男性であり、商品Ａ及び商品Ｂを購入したことがあり、当該ユーザのユーザ情報が２０１５年９月１日の１０時に取得されたことを示している。なお、図３の例に示される性別、年齢、居住エリア、商品Ａ購入有無、及び商品Ｂ購入有無は、第１特徴量に含まれる項目である。性別、年齢、及び居住エリアは、ユーザの属性を示す特徴であり、商品Ａ購入有無及び商品Ｂ購入有無は、ユーザの行動履歴を示す特徴である。商品購入有無のようなユーザの行動履歴を示す項目数は、管理対象として登録される商品（或いはサービス）の数だけ存在するため、一般に非常に膨大となる。また、行動履歴を示す特徴としては、商品購入有無に関する情報だけでなく、グルメサイトやニュースサイト等のジャンル毎のウェブサイト訪問履歴等も挙げられる。このような訪問履歴に関する特徴量により、ユーザの嗜好・趣味に関する特徴が把握可能となる。

履歴情報記憶部３３は、各ユーザの端末２上にコンテンツが表示された際に当該コンテンツに対するクリック操作がされたか否かを示すクリック情報（操作情報）を含む履歴情報を記憶する手段である。図４は、履歴情報の一例を示す図である。図４に示すように、履歴情報記憶部３３に記憶される履歴情報は、一例として、提示日時、ユーザＩＤ、分析期間、コンテンツＩＤ、及びクリック情報が互いに関連付けられた情報である。

「提示日時」は、ユーザに対してコンテンツが提示された日時である。なお、提示日時としては、後述する送信部３９によって端末２にコンテンツが送信された日時が格納されてもよい。「ユーザＩＤ」は、コンテンツが送信された端末２のユーザを識別するユーザＩＤである。「分析期間」は、後述する分析期間選択部３５によってユーザに対して割り当てられた分析期間である。「コンテンツＩＤ」は、コンテンツを識別するＩＤである。「クリック情報」は、上述の通り、コンテンツに対してクリック操作がされたか否かを示す情報である。例えば、図４の１つ目の履歴情報は、後述する候補期間Ｃ１が分析期間として割り当てられたユーザ「ｕｓｅｒ＿００１」に対して、２０１５年９月１日１０時にコンテンツ「ａｄ＿００１」が提示され、当該コンテンツが当該ユーザによってクリック操作されたことを示している。

図５は、履歴情報記憶部３３に記憶された複数の履歴情報の集計結果の一例を示す。このような集計処理は、例えばデータベース上のクエリ処理等によって容易に行うことができる。従って、履歴情報記憶部３３は、図４に示した履歴情報だけでなく、図５に示すように複数の履歴情報を集計することにより得られる各種集計情報を実質的に記憶しているといえる。図５に示す集計結果は、分析期間毎のコンテンツ表示回数、コンテンツクリック数、クリック率（ＣＴＲ：Click Through Ratio）を集計した結果である。

ここで、分析期間毎のコンテンツ表示回数及びコンテンツクリック数は、同一の候補期間（詳しくは後述）が分析期間として選択されたユーザ群毎に、コンテンツの違いを区別することなく、コンテンツ表示回数及びコンテンツクリック数をそれぞれ集計したものである。分析期間毎のクリック率は、同一の候補期間が分析期間として選択されたユーザ群毎のクリック率（操作率）であり、分析期間毎のコンテンツ表示回数に対するコンテンツクリック数の割合を示す値である。例えば、図５の１つ目のレコードのクリック率は、後述する候補期間Ｃ１が分析期間として選択されたユーザ群についてのクリック率である。

履歴情報取得部３４は、上述した履歴情報を取得し、履歴情報記憶部３３に格納する手段である。履歴情報取得部３４は、例えば後述する送信部３９によって端末２に対してコンテンツが送信された際に、コンテンツの送信日時を提示日時として取得する。また、履歴情報取得部３４は、端末２のユーザのユーザＩＤと端末２に送信されたコンテンツのコンテンツＩＤとを関連付けるとともに、後述する第２特徴量記憶部３７を参照することにより当該ユーザＩＤのユーザに割り当てられた分析期間を取得する。また、履歴情報取得部３４は、送信部３９により端末２に送信されたコンテンツに対して当該端末２のユーザによるクリック操作がされたか否かを示すクリック情報を、端末２からの通知を受けること等により把握することができる。なお、上記の各種情報の取得方法は一例であり、履歴情報取得部３４は、上記以外の方法によって履歴情報を取得してもよい。

分析期間選択部３５は、コンテンツを新たに要求する端末２のユーザである対象ユーザに対して、予め用意された複数の候補期間の中から一の候補期間を分析期間として確率的に選択する手段である。ここで、分析期間とは、後述する特徴量変換部３６によって対象ユーザの第１特徴量を次元削減するために用いる期間である。具体的には、分析期間選択部３５は、コンテンツの表示エリアが設けられたウェブページやアプリケーションの専用画面等（以下「特定ページ」という。）に対象ユーザが新たにアクセスする毎に、後述する特徴量変換部３６による変換処理を行うための分析期間を複数の候補期間の中から選択する。

図６を用いて分析期間選択部３５の処理について説明する。図６の例では、ある基準時刻ｔ０から所定時間間隔（一例として１時間間隔）で基準時刻ｔ１、ｔ２、ｔ３、ｔ４が設定されている。この例において、基準時刻ｔ３と基準時刻ｔ４との間の時刻ｔに特定ページへの対象ユーザのアクセス（すなわち、対象ユーザの端末２からのコンテンツ取得要求）が発生した場合について説明する。本実施形態では一例として、分析期間選択部３５は、上述のように設定された基準時刻ｔｋと基準時刻ｔｋ＋１との間の期間（１時間）を１単位期間として管理する。また、分析期間選択部３５は、対象ユーザの特定ページへのアクセス時刻ｔよりも過去の直近の基準時刻ｔ３から、互いに異なる単位期間数だけ遡る複数の期間を候補期間として設定する。

図６の例では、分析期間選択部３５は、時刻ｔに特定ページにアクセスした対象ユーザに対する候補期間として、以下の３つの候補期間Ｃ１〜Ｃ３を用意する。ただし、候補期間の個数は３つに限られず、２つ又は４つ以上であってもよい。候補期間Ｃ１は、３つの候補期間のうち最も長い長期期間であり、基準時刻ｔ３を基点として３単位期間だけ遡る期間（すなわち基準時刻ｔ０から基準時刻ｔ３までの３時間）である。候補期間Ｃ２は、３つの候補期間のうち２番目に長い中期期間であり、基準時刻ｔ３を基点として２単位期間だけ遡る期間（すなわち基準時刻ｔ１から基準時刻ｔ３までの２時間）である。候補期間Ｃ３は、３つの候補期間のうち最も短い短期期間であり、基準時刻ｔ３を基点として１単位期間だけ遡る期間（すなわち基準時刻ｔ２から基準時刻ｔ３までの１時間）である。

分析期間選択部３５は、例えば、いわゆるコンテキストなしのバンディットアルゴリズムに分類されるε−Ｇｒｅｅｄｙ法により、上述した候補期間Ｃ１〜Ｃ３のうちの一の候補期間を、対象ユーザに割り当てる分析期間として選択する。具体的には、分析期間選択部３５は、履歴情報記憶部３３に記憶された履歴情報を参照することにより、同一の候補期間が分析期間として選択されたユーザ群毎のクリック率の観点から最も良い候補期間（以下「最良候補期間」）を抽出する。より具体的には、分析期間選択部３５は、ユーザ群毎のクリック率が最大となる候補期間を最良候補期間として抽出する。図６の例では、対象ユーザよりも前に候補期間Ｃ１〜Ｃ３のうち一の候補期間が分析期間として選択されるユーザとは、基準時刻ｔ３から時刻ｔまでの間に特定ページにアクセスしたユーザ（過去ユーザ）である。基準時刻ｔ３からの時間が経過するほど、過去ユーザのクリック情報が履歴情報として取得され、図５に示す集計数（コンテンツ表示回数、コンテンツクリック数）が増加することとなる。そして、分析期間選択部３５は、予め定めた確率で最良候補期間を分析期間として選択し、残りの確率で複数の候補期間Ｃ１〜Ｃ３のうちからランダムに一の候補期間を分析期間として選択する。

具体的には、分析期間選択部３５は、履歴情報記憶部３３を参照することにより、ユーザ群毎のクリック率が最大となる候補期間を最良候補期間として抽出する。ここで、図５の例が、時刻ｔにおける履歴情報（集計結果）を示しているものとする。この場合、分析期間選択部３５は、ユーザ群毎のクリック率が最大となる候補期間Ｃ３を最良候補期間として特定する。そして、図７に示すように、分析期間選択部３５は、最良候補期間として特定された候補期間Ｃ３を予め定められた確率１−ε（０＜ε＜１）で対象ユーザに割り当てる分析期間として選択する。一方、分析期間選択部３５は、残りの確率（探索確率）εで複数の候補期間Ｃ１〜Ｃ３のうちからランダムに抽出される一の候補期間を対象ユーザに割り当てる分析期間として選択する。

このような処理により、現時点で最良の結果（すなわち最大のクリック率）が得られている最良候補期間（候補期間Ｃ３）を分析期間として選択する処理（活用）を一定の割合（１−ε）で行いつつ、最良候補期間以外の候補期間Ｃ１，Ｃ２も含めた全候補期間Ｃ１〜Ｃ３の中から分析期間を選択する処理（探索）を併せて行うことができる。例えば、探索確率εを０．３とした場合、分析期間選択部３５は、０．７の確率で「活用」の処理を実行し、０．３の確率で「探索」の処理を実行する。探索処理では全ての候補期間がランダムに選択されるため、この場合、分析期間選択部３５は、０．８の確率で候補期間Ｃ３を分析期間として選択し、それぞれ０．１の確率で候補期間Ｃ１，Ｃ２を分析期間として選択することとなる。「活用」の処理が適用された対象ユーザについては、現時点において当該対象ユーザがクリック操作する可能性の高いコンテンツを提示することができる。また、「探索」の処理が適用されて候補期間Ｃ１，Ｃ２のいずれかが分析期間として選択された対象ユーザについて得られるクリック情報によって、ユーザ傾向の変動を把握可能となる。具体的には、最良候補期間である候補期間Ｃ３以外の候補期間Ｃ１，Ｃ２が分析期間として選択されたユーザ群のクリック率の変動を把握可能となる。このように、「活用」の処理を全てのユーザに適用するのではなく、一定の割合で「探索」の処理を適用することにより、トレンドの変化（例えば最大のクリック率が得られるユーザ群が、候補期間Ｃ３が分析期間として選択されたユーザ群から、候補期間Ｃ１が分析期間として選択されたユーザ群に変化すること等）を把握可能となる。

また、分析期間選択部３５は、時間の経過に合わせて、一定時間毎に候補期間Ｃ１〜Ｃ３が示す期間を変化させてもよい。具体的には、現在時刻が基準時刻ｔ４を経過した際に、分析期間選択部３５は、候補期間Ｃ１〜Ｃ３を１時間ずつスライドさせてもよい。すなわち、分析期間選択部３５は、基準時刻ｔ１から基準時刻ｔ４までの３時間を新たな候補期間Ｃ１とし、基準時刻ｔ２から基準時刻ｔ４までの２時間を新たな候補期間Ｃ２とし、基準時刻ｔ３から基準時刻ｔ４までの１時間を新たな候補期間Ｃ３とする。このようにすることで、後述する特徴量変換部３６によって、現在時刻から比較的直近の時間帯に特定ページにアクセスしたユーザの傾向（特徴）に基づく特徴量の次元削減を行うことが可能となる。

特徴量変換部３６は、分析期間選択部３５によって選択された分析期間に特定ページにアクセスしたユーザ（分析対象ユーザ）の第１特徴量に基づいて、対象ユーザの第１特徴量を当該第１特徴量よりも項目数（次元数）が少ない第２特徴量に変換する手段である。具体的には、特徴量変換部３６は、ユーザ情報記憶部３２に蓄積された各ユーザの第１特徴量のうち取得日時が上記分析期間に含まれる第１特徴量に基づく主成分分析を実行し、予め定めた個数の主成分を決定する。ただし、特徴量変換部３６は、対象ユーザの第１特徴量の次元を削減して第２特徴量を得る手法として、主成分分析以外の手法を用いてもよい。

このような処理により、分析期間として選択された期間に特定ページにアクセスした分析対象ユーザ群の傾向を反映した主成分分析を実行することが可能となる。例えば、分析期間として選択された期間に特定ページにアクセスした分析対象ユーザ群において、グルメ情報に対する興味が強いユーザ（過去にグルメに関するウェブサイトに訪問している回数が多いユーザ等）の割合が大きい場合、グルメ情報に対する興味に関する特徴量が強調される形で主成分分析が実行されることになる。これにより、後述する決定部３８の処理において、グルメ情報に対する興味の強さに着目して適切なコンテンツ（例えばグルメ情報に対する興味が強いユーザがクリックする可能性の高いコンテンツ）を対象ユーザに提示するコンテンツとして決定することが可能となる。このように、選択された分析期間によって主成分分析に用いられる分析対象ユーザ群が変化し、変換後の第２特徴量が異なる。このため、どの候補期間が分析期間として選択されるかによって、後述する決定部３８によってどのコンテンツが決定され易くなるかが変化する。

図６の右側部分は、上述の主成分を決定する処理の概要を示す。図６に示すように、特徴量変換部３６は、第１特徴量を表現するｎ次元の項目軸（Ｆ１〜Ｆｎ）を、分析期間に特定ページにアクセスした分析対象ユーザの第１特徴量に基づく主成分分析を実行することで、ｎ個よりも少ない個数（ここでは一例として３つ）の主成分１〜主成分３に変換する。

以下、特徴量変換部３６について詳しく説明する。特徴量変換部３６は、まず上記分析期間に特定ページにアクセスした分析対象ユーザの第１特徴量を数値化する。なお、第１特徴量が予め数値化されている場合には、当該数値化処理は省略可能である。特徴量変換部３６は、例えば性別について、女性を「０」、男性を「１」といったように数値化する。また、特徴量変換部３６は、例えば年齢について、例えば０歳〜９歳を「０」、１０歳〜１９歳を「１」、２０歳〜２９歳を「２」といったように年代別にグループ化して数値化する。特徴量変換部３６は、第１特徴量に含まれる他の項目についても、予め定めた変換ルールに基づいて数値化する。

続いて、図８に示すように、特徴量変換部３６は、分析期間に特定ページにアクセスした分析対象ユーザの第１特徴量（ｎ個の項目ｘ１〜ｘｎの各値）に基づいて、図８に示す変換式のパラメータａ_ｉｊ（ｉ＝１…ｎ，ｊ＝１…ｋ）を決定する。このようなパラメータａ_ｉｊは、分析期間に依存する。例えば、上述のように分析期間に特定ページにアクセスした分析対象ユーザ群の中に例えばグルメ情報に対する興味が強いユーザが多く含まれる場合、グルメ情報に対する興味に関する特徴量が他の特徴量よりも強調されるように、パラメータａ_ｉｊが決定される。

ここで、Ｚ_１〜Ｚ_ｋは、第１特徴量として表現される元の情報（項目ｘ１〜ｘｎにより表現される情報）からの情報損失が少ない順に並べられた主成分を示している。特徴量変換部３６は、このようにして得られる主成分のうち、元の情報からの情報損失が少ない順に予め定めた個数（本実施形態では一例として３つ）の主成分を利用する。すなわち、特徴量変換部３６は、上記処理によって決定されたパラメータａ_ｉｊを用いることで、対象ユーザの第１特徴量（ｘ１〜ｘｎの各値）を当該第１特徴量よりも次元の少ない個数（３つ）の第２特徴量（主成分１〜主成分３）に変換する。なお、パラメータａ_ｉｊについては、対象ユーザの第１特徴量を変換する処理を実行する前に、予め各候補期間Ｃ１〜Ｃ３について算出しておくことができる。これにより、対象ユーザの第１特徴量を第２特徴量に変換する際には、既に各候補期間Ｃ１〜Ｃ３について得られているパラメータのうち対象ユーザに割り当てられた分析期間に対応するパラメータを用いて図８に示す変換式の計算を実行するだけでよくなる。このため、変換処理を短時間で実行することができる。

第２特徴量記憶部３７は、ユーザ毎に、選択された分析期間と、特徴量変換部３６によって得られた第２特徴量（主成分１〜主成分３）とを蓄積する手段である。図９に、第２特徴量記憶部３７に蓄積される情報の一例を示す。第２特徴量記憶部３７には、対象ユーザがアクセスする毎に、当該対象ユーザについての情報（図９に示すテーブルの１レコード分）が蓄積される。第２特徴量記憶部３７に蓄積された情報は、履歴情報取得部３４等によって適宜参照される。

決定部３８は、特徴量変換部３６によって得られた対象ユーザの第２特徴量に基づいて、当該対象ユーザに提示するコンテンツを複数の候補コンテンツの中から決定する手段である。具体的には、決定部３８は、対象ユーザによるクリック操作がされる期待値を対象ユーザの第２特徴量から算出するためのパラメータを、複数の候補コンテンツの各々について推定し、複数の候補コンテンツの各々について推定されたパラメータに基づいて対象ユーザに提示するコンテンツを決定する。本実施形態では一例として、決定部３８は、上述のパラメータの推定を行うにあたって、特徴量変換部３６によって得られた対象ユーザの第２特徴量と、対象ユーザよりも前に対象ユーザと同一の分析期間が選択された過去ユーザの第２特徴量と、当該過去ユーザに提示されたコンテンツ（すなわち、過去に決定部３８により決定されたコンテンツ）に対して当該過去ユーザによるクリック操作がされたか否かを示すクリック情報と、を用いて、線形モデルによる計算処理を行う。以下、この線形モデルによる計算処理について説明する。なお、以下に説明する計算過程は、線形モデルを用いた公知の計算アルゴリズムに基づいている。

決定部３８は、分析期間と候補コンテンツとの組毎に用意される下記式（１）に示される線形モデルにおいて、対象ユーザによるクリック操作がされる期待値Ｅ［ｒ_ｉ（ｔ）｜ｂ_ｉ（ｔ）］を当該対象ユーザの第２特徴量ｂ_ｉ（ｔ）から算出するためのパラメータμを推定する。このようなパラメータμを、対象ユーザに割り当てられた分析期間と各候補コンテンツとの組毎の線形モデル（下記式（１））について推定することで、複数の候補コンテンツの各々について対象ユーザによるクリック操作がされる期待値Ｅ［ｒ_ｉ（ｔ）｜ｂ_ｉ（ｔ）］を算出することができる。なお、候補コンテンツを種別（例えば「グルメ」、「スポーツ」等のジャンル）毎に予め分類しておくことで、同じ種別の候補コンテンツを１つのグループにまとめて集計してもよい。この場合、下記式（１）に示される線形モデルは、分析期間と候補コンテンツの種別との組毎に用意される。
Ｅ［ｒ_ｉ（ｔ）｜ｂ_ｉ（ｔ）］＝ｂ_ｉ（ｔ）^Ｔμ ・・・（１）

具体的には、期待値Ｅ［ｒ_ｉ（ｔ）｜ｂ_ｉ（ｔ）］は、第２特徴量ｂ_ｉ（ｔ）を持つ対象ユーザに候補コンテンツを提示した場合に、当該対象ユーザが候補コンテンツに対するクリック操作を行う期待値である。また、ｂ_ｉ（ｔ）は、対象ユーザの第２特徴量の各主成分（本実施形態では３つの主成分）を並べたベクトルであり、図８の例の場合、ｂ_ｉ（ｔ）＝（０．１１，０．５４，０．３５）である。また、パラメータμは、第２特徴量と同次元のベクトルであり、μ＝（μ_１，μ_２，μ_３）と表される。決定部３８は、上記式（１）を満たすパラメータμ_１〜μ_３を推定するために、分析期間と候補コンテンツとの組毎に、以下に述べる計算処理を実行する。

以下、特定の分析期間Ｃ（Ｃ１〜Ｃ３のいずれか）が割り当てられた対象ユーザが特定の候補コンテンツＴに対するクリック操作を行う期待値を推定するための決定部３８の処理について説明する。以下に説明する処理が各候補コンテンツについて同様に実行されることで、対象ユーザによるクリック操作がされる期待値を各候補コンテンツについて推定することが可能となる。

まず、決定部３８は、第２特徴量ｂ_ｉ（ｔ）の次元をｋ（本実施形態ではｋ＝３）とすると、決定部３８は、初期値がゼロベクトルであるｋ次元のベクトルｆと、初期値が単位行列であるｋ×ｋの行列Ｂと、初期値がゼロベクトルであって上記式（１）のパラメータμの推定値であるｋ次元のベクトルμ’を予め用意する。

分析期間Ｃが割り当てられた一の過去ユーザＵに提示するコンテンツとして候補コンテンツＴが決定された場合、決定部３８は、下記の更新式（２−１）〜（２−３）によって、上述したベクトルｆ、行列Ｂ、及びベクトルμ’を更新する。
Ｂ＝Ｂ＋ｂ_ｕ（ｔ）ｂ_ｕ（ｔ）^Ｔ・・・（２−１）
ｆ＝ｆ＋ｂ_ｕ（ｔ）ｒ_ｕ（ｔ）・・・（２−２）
μ’＝Ｂ^−１ｆ・・・（２−３）

上記更新式（２−１）〜（２−３）において、ｂ_ｕ（ｔ）は、過去ユーザＵの第２特徴量の各主成分を並べたベクトルである。また、ｒ_ｕ（ｔ）は、候補コンテンツＴに対して過去ユーザＵによるクリック操作がされたか否かを示すクリック情報である。候補コンテンツＴに対して過去ユーザＵによるクリック操作がされている場合にはｒ_ｕ（ｔ）は「１」となり、候補コンテンツＴに対して過去ユーザＵによるクリック操作がされていない場合にはｒ_ｕ（ｔ）は「０」となる。なお、決定部３８は、履歴情報記憶部３３に記憶された履歴情報（図４参照）を参照することにより、候補コンテンツＴに対して過去ユーザＵによるクリック操作がされたか否かを示すクリック情報を把握することができる。決定部３８は、分析期間Ｃが割り当てられたユーザに提示するコンテンツとして候補コンテンツＴが決定される毎に、上述のように各ユーザのクリック情報を取得することで、各パラメータ（ベクトルｆ、行列Ｂ、ベクトルμ’）を上記更新式（２−１）〜（２−３）によって更新する。

以上まとめると、決定部３８は、分析期間Ｃが割り当てられた対象ユーザによって候補コンテンツＴがクリックされる期待値Ｅ［ｒ_ｉ（ｔ）｜ｂ_ｉ（ｔ）］を時刻ｔにおいて推定する際には、時刻ｔにおけるベクトルｆ及び行列Ｂ（初期値である場合もあるし、上記更新式による更新がされている場合もある）を用いて、上記式（２−３）によりベクトルμ’を算出する。決定部３８は、このように算出されたベクトルμ’を上記式（１）のパラメータμに代入することにより、対象ユーザによって候補コンテンツＴがクリックされる期待値Ｅ［ｒ_ｉ（ｔ）｜ｂ_ｉ（ｔ）］を算出（推定）することができる。

決定部３８は、以上述べた計算を複数の候補コンテンツの各々について実行することにより、分析期間Ｃが割り当てられた対象ユーザによって候補コンテンツがクリックされる期待値を各候補コンテンツについて推定することができる。以下、「分析期間Ｃが割り当てられた対象ユーザによって候補コンテンツがクリックされる期待値」のことを、「クリック期待値」という。

（第１の例）
決定部３８は、複数の候補コンテンツのうち上述した計算処理により推定されるクリック期待値が最大となる候補コンテンツを、対象ユーザに提示するコンテンツとして決定してもよい。この場合、対象ユーザの興味関心に合った適切なコンテンツ（すなわち、対象ユーザがクリック操作を行うことが最も期待されるコンテンツ）を対象ユーザに対して表示することが可能となる。

（第２の例）
また、決定部３８は、複数の候補コンテンツの各々について推定されたパラメータ（ベクトルμ’）に基づいて、上述した分析期間選択部３５と同様にε−Ｇｒｅｅｄｙ法（バンディットアルゴリズム）を用いた計算を実行することで、対象ユーザに提示するコンテンツを決定してもよい。具体的には、決定部３８は、複数の候補コンテンツの各々について、上述した計算処理により推定されたベクトルμ’を用いてクリック期待値を上記式（１）により算出する。そして、決定部３８は、複数の候補コンテンツのうちクリック期待値が最大となる候補コンテンツを、予め定めた確率で対象ユーザに提示するコンテンツとして決定し、残りの確率で複数の候補コンテンツのうちからランダムに一の候補コンテンツを対象ユーザに提示するコンテンツとして決定してもよい。

（第３の例）
また、決定部３８は、複数の候補コンテンツの各々について算出されたパラメータ（ベクトルμ’）に基づいて、上述したε−Ｇｒｅｅｄｙ法よりも高度な、いわゆるコンテキスト付きバンディットアルゴリズムを用いた計算を実行することで、対象ユーザに提示するコンテンツを決定してもよい。上述のコンテキスト付きバンディットアルゴリズムによる計算処理自体は、従来公知の計算アルゴリズムであるため、概略のみ述べる。

決定部３８は、上記式（２−３）により算出されたベクトルμ’と行列Ｂ^−１とを用いて、下記式（３）に示す正規分布Ｎ（平均μ’、分散ｖ^２Ｂ^−１の多次元正規分布）に従う乱数μ’’を抽出する。下記式（３）において、ｖはバンディットアルゴリズムにおける探索の度合いを決定する分散パラメータである。ｖは、任意の実数値であり、例えばコンテンツ決定装置３のオペレータ等によって、所望される探索の度合いに応じて任意に設定される。
μ’’〜Ｎ（μ’，ｖ^２Ｂ^−１）・・・（３）

続いて、決定部３８は、抽出された乱数μ’’に基づいて、候補コンテンツについてのスコア値ｂ_ｉ（ｔ）^Ｔμ’’を算出する。決定部３８は、上述したスコア値の算出処理（一の候補コンテンツに対する上記式（２−１）〜（２−３）及び（３）を用いた一連の算出処理）を各候補コンテンツについて同様に行うことで、候補コンテンツ毎のスコア値を得ることができる。そして、決定部３８は、複数の候補コンテンツのうちスコア値が最大の候補コンテンツを対象ユーザに提示するコンテンツとして決定する。

上記の第２の例及び第３の例のように、バンディットアルゴリズムを用いた計算を実行することで対象ユーザに提示するコンテンツを決定した場合、現時点で最良と推定されるコンテンツ（すなわち、上記式（１）で算出される期待値が最大の候補コンテンツ）を対象ユーザに提示するコンテンツとして決定する処理（活用）を実行する割合と、それ以外の候補コンテンツを対象ユーザに提示するコンテンツとして決定する処理（探索）を実行する割合と、を適切に調整することができる。これにより、上述した活用及び探索をバランスよく実行するように、対象ユーザに提示するコンテンツを決定することが可能となる。

送信部３９は、決定部３８によって決定されたコンテンツを端末２に送信（配信）する手段である。本実施形態では一例として、コンテンツを識別するコンテンツＩＤを含む各候補コンテンツの情報（コンテンツ情報）は、予めコンテンツ情報記憶部３９ａに格納されている。送信部３９は、決定部３８から対象ユーザに提示するコンテンツとして決定された候補コンテンツを識別するコンテンツＩＤを通知され、当該コンテンツＩＤをキーとしてコンテンツ情報記憶部３９ａから該当するコンテンツ情報を取得し、当該コンテンツ情報を端末２に送信する。なお、図１０に示すように、コンテンツ情報には、コンテンツＩＤとコンテンツの内容（情報提示画面に表示される文字や画像、リンク先等）を示す情報以外に、コンテンツに関連付けられる各種情報（ストア種別、ジャンル、広告作成会社）が含まれていてもよい。

次に、図１１を用いて、コンテンツ決定装置３の動作について説明する。具体的には、対象ユーザが特定ページにアクセスしてから、当該対象ユーザに提示するコンテンツを決定して送信するまでの動作について説明する。まず、ユーザ情報取得部３１が、特定ページにアクセスする対象ユーザのユーザ情報（第１特徴量を含む）を当該対象ユーザの端末２から取得する（ステップＳ１）。

続いて、分析期間選択部３５が、予め用意された複数の候補期間Ｃ１〜Ｃ３（図６参照）の中から、対象ユーザに割り当てる分析期間を選択する（ステップＳ２）。例えば、分析期間選択部３５は、ε−Ｇｒｅｅｄｙ法を用いて分析期間を選択する。具体的には、分析期間選択部３５は、履歴情報記憶部３３を参照することによりユーザ群毎のクリック率が最大の候補期間（図５の例では候補期間Ｃ３）を抽出する。そして、分析期間選択部３５は、予め定められた確率１−εでクリック率が最大の候補期間を分析期間として選択し、残りの確率εで複数の候補期間のうちからランダムに一の候補期間を分析期間として選択する（図７参照）。

続いて、特徴量変換部３６が、分析期間選択部３５によって選択された分析期間に基づく主成分分析を実行することにより、対象ユーザの第１特徴量を当該第１特徴量よりも項目数（次元数）の少ない第２特徴量（本実施形態では一例として主成分１〜主成分３）に変換する（ステップＳ３）。具体的には、特徴量変換部３６は、分析期間に特定ページにアクセスした分析対象ユーザの第１特徴量に基づく主成分分析を実行することで、予め定めた個数（一例として３つ）の主成分を決定する。

続いて、決定部３８が、特徴量変換部３６によって得られた対象ユーザの第２特徴量に基づいて、当該対象ユーザに提示するコンテンツを決定する（ステップＳ４）。例えば、決定部３８は、上述したような線形モデル及びバンディットアルゴリズム等を用いて対象ユーザに提示するコンテンツを決定することができる。

続いて、送信部３９が、決定部３８によって決定されたコンテンツの情報を対象ユーザの端末２に送信する（ステップＳ５）。これにより、対象ユーザの端末２の表示部２２により、特定ページの表示エリアにコンテンツが表示される。なお、ステップＳ５で対象ユーザにコンテンツが送信された後、履歴情報取得部３４によって、当該対象ユーザによるクリック操作が表示されたコンテンツに対してされたか否かを示すクリック情報が取得され、履歴情報記憶部３３に蓄積される。そして、決定部３８が、履歴情報記憶部３３を参照するとともに上記更新式（２−１）〜（２−３）による計算を実行することで、ベクトルｆ、行列Ｂ、及びベクトルμ’を更新する。

以上述べたコンテンツ決定装置３では、分析期間選択部３５により、提示するコンテンツを新たに決定する対象の対象ユーザに対して、予め用意された複数の候補期間Ｃ１〜Ｃ３の中から一の候補期間が分析期間として確率的に選択される。そして、特徴量変換部３６により、分析期間にコンテンツが提示されたユーザの第１特徴量に基づいて次元数（項目数）が削減された第２特徴量が得られる。具体的には、例えば主成分分析により得られる主成分が第２特徴量として得られる。そして、決定部３８により、対象ユーザの第２特徴量と、対象ユーザと同一の候補期間が分析期間として選択された過去ユーザの第２特徴量と、過去ユーザのクリック情報と、に基づいて、対象ユーザに提示するコンテンツが決定される。このように、上記コンテンツ決定装置３では、次元数を削減する処理を実行するために用いられる分析期間が全てのユーザに対して一律に決定されるのではなく、複数の候補期間Ｃ１〜３のうちの一の候補期間が分析期間として確率的に割り当てられる。これにより、全てのユーザについて、特定の期間にコンテンツを要求したユーザ群の傾向に偏った分析結果（主成分分析の結果）のみに基づいて提示するコンテンツが決定されることを防止できる。その結果、ユーザ群の傾向の変動に応じてユーザに提示するコンテンツを決定することが可能となる。

例えば、ある時点において、図６に示す長期期間である候補期間Ｃ１が分析期間として選択されたユーザ群のクリック率が最大である場合について考える。つまり、候補期間Ｃ１を分析期間とした主成分分析によって特徴量の次元削減を行い、次元削減後の特徴量（第２特徴量）に基づいて提示するコンテンツを決定した場合に、他の候補期間Ｃ２，Ｃ３を用いて次元削減した場合よりも良いクリック率が得られている場合について考える。この場合、仮に、当該時点以降に特定ページにアクセスする対象ユーザに対して、当該時点において最良の候補期間Ｃ１のみを分析期間として割り当てた場合、それ以降、候補期間Ｃ１以外の候補期間Ｃ２，Ｃ３を分析期間として用いた場合のクリック率の測定が行えなくなる。その結果、特定ページにアクセスする対象ユーザの傾向が変化し、実際には候補期間Ｃ３を分析期間として選択されたユーザ群のクリック率が最大となる状況になったとしても、そのような状況の変化を把握することができない。一方、コンテンツ決定装置３では、特徴量の次元削減を行うために用いる分析期間の選択に関して、バンディットアルゴリズム（ε−Ｇｒｅｅｄｙ法）によって「活用」と「探索」とを所定の割合で実行することで、ある時点において最良と推定される最良候補期間以外の候補期間についても所定の確率で選択されるように構成されている。このため、最良候補期間以外の候補期間を分析期間とした場合のクリック率の測定をある程度の精度（探索の割合に応じた精度）で行うことが可能となる。従って、最良候補期間の変化等の状況の変化を適切に把握することができ、そのような変化に応じて対象ユーザに割り当てる分析期間を選択することができる。

さらに、コンテンツ決定装置３では、決定部３８がユーザに提示するコンテンツを決定する段階でも、バンディットアルゴリズムを実行することで、コンテンツに関しても「活用」と「探索」とを所定の割合で実行する。これにより、コンテンツの観点でも、ユーザ群の傾向の変動（例えば、時間変化によるユーザの興味関心の変化）に応じて、対象ユーザに提示するコンテンツを決定することができる。

以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。

１…コンテンツ決定システム、２…端末、３…コンテンツ決定装置、３１…ユーザ情報取得部、３２…ユーザ情報記憶部、３３…履歴情報記憶部、３４…履歴情報取得部、３５…分析期間選択部、３６…特徴量変換部、３７…第２特徴量記憶部、３８…決定部、３９…送信部、３９ａ…コンテンツ情報記憶部。

Claims

端末のユーザに提示するコンテンツを決定するコンテンツ決定装置であって、
前記端末のユーザの特徴を示す複数の項目からなる第１特徴量を取得する第１特徴量取得手段と、
前記第１特徴量取得手段により取得された前記第１特徴量を前記コンテンツの提示に対応する提示時点と関連付けて蓄積する第１特徴量記憶手段と、
提示するコンテンツを新たに決定する対象のユーザである対象ユーザに対して、予め用意された複数の候補期間の中から一の候補期間を分析期間として確率的に選択する分析期間選択手段と、
前記第１特徴量記憶手段に蓄積された前記第１特徴量のうち前記提示時点が前記分析期間に含まれる第１特徴量に基づいて、前記対象ユーザの第１特徴量を当該第１特徴量よりも項目数が少ない第２特徴量に変換する特徴量変換手段と、
前記特徴量変換手段によって得られた前記対象ユーザの第２特徴量と、前記対象ユーザよりも前に前記対象ユーザと同一の候補期間が前記分析期間として選択されたユーザである過去ユーザの第２特徴量と、当該過去ユーザに提示されたコンテンツに対して当該過去ユーザによる操作がされたか否かを示す操作情報と、に基づいて、前記対象ユーザに提示するコンテンツを複数の候補コンテンツの中から決定する決定手段と、
を備えるコンテンツ決定装置。
前記分析期間選択手段は、
前記決定手段により決定されたコンテンツに対してユーザによる操作がされた割合を示す操作率を、同一の候補期間が前記分析期間として選択されたユーザ群毎に取得し、
予め定めた確率で、前記複数の候補期間のうち前記ユーザ群毎の操作率が最大となる候補期間を前記分析期間として選択し、
残りの確率で、前記複数の候補期間のうちからランダムに一の候補期間を前記分析期間として選択する、
請求項１に記載のコンテンツ決定装置。
前記決定手段は、前記コンテンツに対して前記対象ユーザによる操作がされる期待値を前記対象ユーザの第２特徴量から算出するためのパラメータを、前記複数の候補コンテンツの各々について推定し、前記複数の候補コンテンツの各々について推定された前記パラメータに基づいて前記対象ユーザに提示されるコンテンツを決定する、
請求項１又は２に記載のコンテンツ決定装置。
前記決定手段は、前記複数の候補コンテンツの各々について推定された前記パラメータに基づいてバンディットアルゴリズムを用いた計算を実行することにより、前記対象ユーザに提示されるコンテンツを決定する、
請求項３に記載のコンテンツ決定装置。