JP6226846B2 - 情報分析装置、情報分析方法および情報分析プログラム - Google Patents
情報分析装置、情報分析方法および情報分析プログラム Download PDFInfo
- Publication number
- JP6226846B2 JP6226846B2 JP2014191104A JP2014191104A JP6226846B2 JP 6226846 B2 JP6226846 B2 JP 6226846B2 JP 2014191104 A JP2014191104 A JP 2014191104A JP 2014191104 A JP2014191104 A JP 2014191104A JP 6226846 B2 JP6226846 B2 JP 6226846B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- user
- cluster
- information analysis
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 60
- 230000009471 action Effects 0.000 claims description 62
- 230000006399 behavior Effects 0.000 claims description 55
- 238000010801 machine learning Methods 0.000 claims description 47
- 238000011156 evaluation Methods 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 2
- 238000000034 method Methods 0.000 description 29
- 230000008569 process Effects 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000013075 data extraction Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000002354 daily effect Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
特許文献1のID価値評価装置は、予め用意されたユーザ属性情報、サービス属性情報、一般情報、ユーザの行動履歴の組を学習データとする機械学習により評価関数を生成し、この評価関数で評価対象のユーザの価値を示す価値評価値を出力していた。
また、ユーザの行動履歴は、購入の有無やブログで紹介したか否かであり、定性的に与えられるデータであった。
[全体構成]
図1は、本実施形態の情報分析システム1の概略構成を示すブロック図である。
図1に示すように、情報分析システム1は、ユーザ端末10と、本発明の情報分析装置として機能するサーバ装置20と、を備え、これらのユーザ端末10及びサーバ装置20がネットワーク(例えばインターネット等のWAN(Wide Area Network))5を介して通信可能に接続されている。
ユーザ端末10としては、例えば、デスクトップ型パーソナルコンピュータ、ノート側パーソナルコンピュータ、スマートフォン、携帯電話、タブレット端末等の各種デバイスを例示できる。また、図1に示すように、一人のユーザが、デスクトップ型パーソナルコンピュータ(パソコン10A)、スマートフォン10B、タブレット端末10Cの複数のデバイスを所持している場合もある。
ユーザ端末10は、図1に示すように、表示部11と、入力操作部12と、端末通信部13と、端末記憶部14と、端末制御部15と、を含んで構成される。
入力操作部12は、ユーザ操作による操作信号を端末制御部15に出力する。入力操作部12としては、例えば、表示部11と一体に設けられたタッチパネルや、キーボード、マウス等の入力装置等を例示できる。
端末通信部13は、ネットワーク5上の所定の装置と通信する。
ユーザIDは、ユーザ端末10がサーバ装置20にアクセスした際に、サーバ装置20から送信されるクッキーに記憶されている番号などが利用できる。
デバイスデータとしては、例えばユーザ端末10のデバイス製造会社や、デバイスの機種名、通信会社のキャリア名等が記録される。
また、端末記憶部14には、その他、ユーザ端末を制御するための各種プログラム等が記憶される。
図2は、サーバ装置20の概略構成を示すブロック図である。
サーバ装置20は、コンピュータにより構成され、本発明の情報分析装置として機能するとともに、ユーザ端末10に対して各種サービスを提供するWEBサーバ等のサービス提供装置としても機能する。このサーバ装置20は、サーバ通信部21と、サーバ記憶部22と、サーバ制御部30と、入力装置24と、表示装置25等を含んで構成されている。
また、入力装置24は、キーボード、タッチパネル、マウス等で構成される。入力装置24は、分析条件等を入力する場合等に利用される。例えば、クラスタリングする際のハイパーパラメータα、βやクラスタリング上限数等を入力装置24で入力することができる。
表示装置25は、液晶ディスプレイなどで構成され、分析結果等を表示する。なお、サーバ装置20には、入力装置24および表示装置25を設けずに、サーバ装置20にLAN等を介して分析用端末を接続し、この分析用端末で分析条件を入力したり、分析結果を表示してもよい。
サーバ制御部30は、CPU等の演算回路、RAM等の記憶回路により構成され、サーバ記憶部22等に記憶されているプログラム(ソフトウェア)をRAMに展開し、RAMに展開されたプログラムとの協働で、各種処理を実行する。そして、サーバ制御部30は、上記各種処理を実行することで、図2に示すように、ログ取得手段31、クラスタリング手段32、代表パターン生成手段33、機械学習手段34、評価値算出手段35、情報配信手段36、クラスタ特性推定手段37及びサービス提供手段40等として機能する。
ログ取得手段31は、ユーザ端末10からアクセスがあった際に、ユーザID、アクセス時刻(時刻情報)、ユーザ端末10のデバイスデータ、アクセス先のサービスである利用サービスデータ等を取得し、これらを関連付けて、図3に示すようなアクセスログとしてサーバ記憶部22に蓄積する。すなわち、アクセスログは、分析対象であるユーザ(ユーザ端末10)のアクセス行動が検出された時刻を示す時刻情報と、前記ユーザの状況を特定可能な分類情報(デバイスデータや利用サービスデータ)とを含む行動ログ(行動履歴)データである。従って、ログ取得手段31は、行動ログデータ(アクセスログ)を取得する行動履歴取得手段として機能する。
アクセス時刻は、ユーザ端末10がWEBサーバであるサーバ装置20にアクセスした時刻である。
なお、デバイスデータは、必ずしも必須のデータではないが、デバイスデータを備えていれば、アクセス環境の分析を詳細に行うことができる。
クラスタリング手段32は、サーバ記憶部22に記憶、蓄積されたアクセスログに基づいた各ユーザの行動パターンを、ディリクレ過程(Dirichlet process)などを用いて少なくとも1以上つまり複数の行動グループ(クラスタ)に分類(クラスタリング)する。
このため、クラスタリング手段32は、分析対象設定部321と、行動履歴データ抽出手段322と、行動パターン作成手段323と、グループ化手段324とを備える。これらの各手段の詳細は、後述するクラスタリング処理において説明する。
代表パターン生成手段33は、各行動グループの代表的な行動パターンを生成する。
従って、本実施形態では、クラスタリング手段32および代表パターン生成手段33によって、行動パターン分析装置が構成される。
機械学習手段34は、例えばサポートベクターマシーン(SVM)等の手法を利用して識別関数f(x)を生成する。識別関数f(x)は下記の式(1)のように表される。
具体的には、xNCTRおよびwNCTRは実績CTRの素性および重みである。実績CTRとは、過去にその広告がクリックされた回数を配信された回数で割った値である。この実績CTRは様々な粒度で集計することができる。例えば、その広告の単位や、広告主単位、ユーザの性別や年齢の単位、またはそれらを掛け合わせた単位などである。
xcosおよびwcosは単語のコサイン類似度の素性および重みである。単語のコサイン類似度とは、ユーザ端末10でアクセスしたページと広告の類似度に着目したものであり、前記ページの語句ベクトルと、テキスト広告の語句ベクトルのコサイン類似度を求めたものである。
xbtcosおよびwbtcosはカテゴリーのコサイン類似度の素性および重みである。カテゴリーのコサイン類似度とは、ユーザと広告の関連度に着目したものであり、ユーザおよび広告の双方にカテゴリーを付与し、カテゴリーベクトルのコサイン類似度を求めたものである。
xtermαおよびwtermαは広告(AD)の単語の素性および重みである。
xfidiおよびwfidiは広告(AD)とユーザの両方に出てくる(共起する)カテゴリーの素性および重みである。
wrk,dはページのドメイン毎のポジションの重みである。
カテゴリー情報は、配信された各広告のカテゴリーを表すコードである。
そして、xnewには、前記クラスタ情報およびカテゴリー情報を掛け渡したクロス素性が設定される。
機械学習手段34は、機械学習を行うことで各素性の重みを算出する。
評価値算出手段35は、評価値として各テキスト広告がクリックされる確率である予測CTRを求める。具体的には、評価値算出手段35は、ロジスティック回帰モデルを用いて構築した次の式(3)のCTR予測モデルを用いて評価値である予測CTRを算出する。
情報配信手段36は、評価値算出手段35で算出した評価値(予測CTR)が高い情報(テキスト広告)をユーザがアクセスしているページに配信する。
情報配信手段36が、予測CTRが高い広告を配信するのは、期待収益の高い広告を配信して表示させるためである。すなわち、クリック課金型の広告では、ユーザが広告をクリックした場合のみ広告主はその代金を支払う。したがって、オンライン広告サービスの提供者が得られる収益を最大化するためには、期待収益(eCPM)の高い広告をユーザ端末に配信する必要がある。
そして、正確な期待収益(eCPM)を求めるためには、CTRの予測が必要となる。期待収益は、広告主が設定した入札額(Bid)と、クリック率(click-through rate;CTR)とで求められる(eCPM=CTR×bid)。
ここで、あるユーザが操作するユーザ端末に広告を表示したときに、どのくらいの確率で前記広告がクリックされるのかというクリック率は未知なので、予測する必要がある。このため、式(2)を用いた機械学習によって式(3)のCTR予測モデルを構築し、情報配信手段36は予測CTRの高い広告を優先して配信している。
クラスタ特性推定手段37は、クラスタリング手段32でグループ化された各クラスタの特性を推定する。すなわち、クラスタリング手段32は、ディリクレ過程等を用いてクラスタリングするため、グループ化された各クラスタがどのような特性を有するものであるかは不明であった。そこで、クラスタ特性推定手段37は、後述するように、機械学習手段34においてクラスタ情報およびカテゴリー情報を掛け渡したクロス素性を用いていることを利用し、重みの高いクロス素性を調べることで、各クラスタの特性を推定する。
サービス提供手段40は、ユーザ端末10からの要求に応じて、WEB上で利用可能なサービスをユーザ端末10に提供する。サービス提供手段40により提供されるサービスとしては、例えば、ニュース等の情報発信サービス、オンライン上での商取引サービス(例えば株取引やオンライショッピング等)、メールサービス等が含まれる。
次に、上記のようなサーバ装置(情報分析装置)20における処理方法について図4のフローチャートも参照して説明する。図4のステップS1〜S4は、蓄積されたアクセスログに基づいて、各ユーザの行動パターンをクラスタリングして行動グループを分類するクラスタリング処理であり、ステップS5はその代表パターンを生成する代表パターン生成処理である。さらに、ステップS6は、クロス素性を作成する処理であり、ステップS7は、ペアワイズ法などを用いて機械学習する処理である。
サーバ装置20は、ユーザ端末10から所定のサービス提供サイトに対してアクセスがあった際に、サーバ装置20は、そのアクセスログ(行動ログ)を検出して蓄積する。
サービス提供サイトが提供するサービスしては、ニュース等の情報発信サービス、オンライン上での商取引サービス(例えば株取引やオンライショッピング等)、メールサービス等が含まれる。これらのサービス提供サイトは、サーバ装置20で構築することもできるし、図示しない他のサーバ装置で構築することもできる。
さらに、サーバ装置20は、サービス提供サイト毎にアクセスログを蓄積することもできるし、これらの各種サービスへのアクセスログをまとめて蓄積してもよい。
サーバ装置20のクラスタリング手段32によるクラスタリング処理について、図面に基づいて説明する。
分析準備として、クラスタリング手段32の分析対象設定部321は、行動パターンを分析する際に、どのようなユーザの行動を分析するかを指定する分析対象条件を設定する(ステップS1)。具体的には、分析対象とする行動ログデータを収集する収集期間情報と、行動パターンを分析するための期間を示す分析期間情報と、行動パターンを分析する際の単位期間情報とを設定する。さらに、ハイパーパラメータα、βと、クラスタリング上限数を適切に入力する。例えば、ハイパーパラメータα、βは共に「1」に設定し、クラスタリング上限数は「10」に設定する。この設定は、分析者が入力装置24を用いてサーバ装置20に入力することで設定される。
分析期間情報は、どの程度の期間の行動パターンを分析対象とするかを設定するものである。例えば、1日毎の行動パターンを分析する場合には、前記分析期間情報は1日(例えば、00:00:00から23:59:59)が設定される。また、1週間毎の行動パターンを分析する場合には、前記分析期間情報は1週間(例えば、日曜日から土曜日)が設定される。さらに、6時間毎の行動パターンを分析する場合には、前記分析期間情報は6時間(例えば、00:00:00から05:59:59、06:00:00〜11:59:59、12:00:00から17:59:59、18:00:00〜23:59:59)が設定される。
単位期間情報は、前記分析期間情報よりも短い時間間隔であり、行動(アクセス)の有無を判定する単位時間を設定するものである。例えば、分析期間情報が1日である場合に、単位期間情報は1時間単位(例えば、00:00:00から00:59:59、01:00:00から01:59:59、…、23:00:00から23:59:59)に設定される。なお、単位期間情報は、1時間単位に限定されず、30分単位としてもよいし、2時間単位にしてもよく、行動パターンの分析目的等に応じて設定すればよい。
さらに、分類情報としては、デバイスデータのうちの1つあるいは複数のデバイスを指定することもできる。例えば、パソコン10Aのみを指定したり、スマートフォン10Bのみを指定してもよいし、スマートフォン10Bおよびタブレット端末10Cの2つのデバイスを指定してもよい。同様に、サービスデータのうちの1つあるいは複数のサービスを指定してもよい。従って分類情報は、分析者が分析目的に応じて設定する。
図5(A)は、抽出されたユーザの1日分の行動ログデータである。なお、この際、分析対象条件の分類情報には、例えば、利用サービスデータとしてニュースサイトを指定し、デバイスデータは特定していない。また、1時間毎にアクセス回数が集計されている。このため、図5(A)のグラフは、横軸が1日の時間、縦軸がアクセス数とされた時間毎のアクセス数の推移を示すグラフである。
なお、グループ化手段324に入力される各ユーザの行動ログデータは、「1」、「0」の2値で表せるものに限定されず、例えば、図7に示すように、「0〜1」の間の数値で表すものでもよい。図7に示す行動ログデータは、ユーザIDの数が100万程度のデータを抽出したものである。すなわち、平日5日間にアクセスログが記憶された100万程度のユーザ端末(ユーザID)の0時から23時の各時間帯毎のアクセス数をカウントし、各ユーザIDの各時間帯のアクセス数を、そのユーザIDの全時間帯の合計アクセス数で割って正規化したものである。このような行動ログデータをグループ化手段324に入力してグループ化してもよい。
グループ化手段324は、これらの入力データを用いてクラスタリングを実施する。なお、クラスタリングの実施方法は、例えば、多値のパラメータを有する複合ディリクレプロセスモデルを用いて、ノンパラメトリックベイズ法により行うことができる。
グループ化手段324は、最適な数の行動グループを算出し、図5(C)に示すように、行動パターンをクラスタリングした複数個の行動グループを出力する。図5(C)は、4つの行動グループが出力された例である。
さらに、グループ化手段324は、図8(A)に示すように、各ユーザIDがどのグループに該当するかを示すラベル(クラスタリング番号、つまりクラスタ情報)を出力する。
このステップS5では、代表パターン生成手段33は、例えば、各行動グループに含まれる複数の行動パターンの平均値を算出する。図8(B)には、代表パターンの一例が示されている。
図8(B)のType1は、午前中から夜までアクセス数が低い値で一定しているタイプであり、Type2は午前12時頃に最もアクセス数が増加するタイプであり、Type3は深夜の時間帯にアクセス数が増加するタイプである。
このように、代表パターン生成手段33が代表パターンを生成し、表示装置25等に出力すれば、分析者は各パターンの特徴を容易に把握できる。
このため、機械学習手段34は、ラベル番号と広告のカテゴリー情報とをクロスしたクロス素性を作成する(ステップS6)。
そして、機械学習手段34は、前記ステップS4のクラスタリング処理によって、例えば10個のクラスタが生成された場合には、1〜10のラベル番号と、カテゴリーIDとのクロス素性として新たな番号を割り振る。
たとえば、カテゴリーIDが「1000738796(ファッション・アクセサリー)」とラベル番号1とのクロス素性を「10501」とし、「1000738796(ファッション・アクセサリー)」とラベル番号2とのクロス素性を「10502」とし、「1000738796(ファッション・アクセサリー)」とラベル番号10とのクロス素性を「10510」とする。
また、カテゴリーIDが「1000552812(各種人材サービス)」とラベル番号1とのクロス素性を「10621」とし、「1000552812(各種人材サービス)」とラベル番号10とのクロス素性を「10630」とする。
このように、機械学習手段34は、各カテゴリーIDとラベル番号とを掛け合わせたクロス素性を作成して新たな番号を割り振る。
例えば、図10に示すようなテキスト広告のクリックを予測するためには、機械学習手段34は、前記学習期間における、各テキスト広告に対するクリックの有無の行動ログデータを図11に示すようなsvm形式にして前記式(2)に入力し、機械学習を行う。
図11は、1行が1つのテキスト広告に対応している。各行の最初の値はクリックの有無を示し、「+1」はクリック有り、「−1」はクリック無しを示す。したがって、図11の例では、3行目が「+1」であるので、図11の3行目のテキスト広告「《格安》九州旅行なら」がクリックされ、他のテキスト広告はクリックされていないことを示す。
さらに、図11に示すように、各行には、各テキスト広告に対する行動ログデータが素性のkey:valueという形式で並んでいる。
素性のkeyは、各素性の種類を示す番号であり、例えば、図11においては、「1」は「実績CTR」、「2」は「単語のコサイン類似度」、「3」は「カテゴリーのコサイン類似度」などのように、予め設定された素性を示す。
素性のvalueは、各素性の重みを示す値であり、機械学習を行うことで求められ、これにより識別関数が生成される(ステップS8)。
図12に示すように、ユーザがユーザ端末10を用いてニュースサイトなどのサービス提供サイトにアクセスすると、サーバ装置20の評価値算出手段35は、アクセスしたユーザの情報と、アクセス先のページの情報を用いて配信する広告の候補を検索して抽出する(ステップS11)。
そして、評価値算出手段35は、候補の広告に対して前記式(3)のCTR予測モデルを用いて、各広告のCTRを予測する(ステップS12)。
次に、情報配信手段36は、前記CTRのスコア順に基づいて配信する広告とその順序を決定し、ユーザ端末10がアクセスしているページに広告を配信する(ステップS13)。
また、クラスタリング手段32も、サーバ記憶部22に新たに蓄積された行動ログを用いて一定期間毎にクラスタリング処理を行ってもよい。
本実施形態のサーバ装置20は、予測モデルの素性として、各ユーザの行動パターンをクラスタリングして分類した番号(クラスタ情報)を追加したので、予測モデルの精度を向上することができる。実際に、過去のログを用いてオフライン評価を行ったところ、AUC(Area Under the Curve)の評価指標が上昇し、クラスタ情報が有効な素性であることを確認できた。したがって、実際にユーザがユーザ端末10を用いて各種のサービスページにアクセスした場合に、効果的な広告を配信することができ、広告のCTRも向上できて期待収益も向上することができる。
したがって、例えば、予めグループの数を3個などと設定しておき、ユーザの行動パターンをこれらのグループのいずれかに属するかを判定する場合に比べて、各ユーザの固有の行動パターンに合わせた最適なクラスタリングを実施できる。
このため、各ユーザの行動パターンを精度良く判定できることで、各ユーザに適したサービスや情報をユーザに対して提供することができ、ユーザの利便性も向上できる。
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、以下に示される変形をも含むものである。
前記実施形態では、クラスタ情報とカテゴリーIDとを組み合わせたクロス素性を用いていたが、クラスタ情報と組み合わせる素性としてはカテゴリーIDに限定されない。すなわち、同一のユーザIDで同一の値となる素性(例えば年齢、性別等)以外の素性であればよい。換言すれば、ペアワイズ法で差分を取った際に削除されることがない素性であればよい。
さらに、ペアワイズ法以外の手法(例えばポイントワイズ法)で機械学習を行う場合には、前記クラスタ情報を単独の素性として用いてもよい。この場合、識別関数は、例えば、次の式(4)とすればよい。
素性としては、アクセス時の現在地を示す位置データや、アクセス時の天気、気温、湿度などを示す気象データ等を利用してもよい。
位置データは、ユーザ端末10がサーバ装置20にアクセスした際のユーザ端末10の現在位置を示すデータであり、アクセスログに記憶すればよい。この位置データとしては、例えば、現在位置の都道府県を示すパラメータ等に設定した場合は、都道府県数に対応した多値のパラメータとなる。
なお、ユーザ端末10がGPSセンサー等の位置計測手段を備えている場合には、位置計測手段で計測された位置情報(緯度、経度)を前記位置データとして記録すればよい。また、ユーザ端末10が位置計測手段を備えていない場合には、ユーザ端末10が通信する基地局の位置情報(緯度および経度または住所データ)を前記位置データとして記録すればよい。
このような位置データを分類情報として用いれば、ユーザのアクセス時のシチュエーションとして、例えば、自宅でのアクセスか、会社でのアクセスか、あるいは通勤中のアクセスであるかなどのアクセス場所による分類情報に基づいて行動パターンを分析できる。従って、各ユーザの行動パターンをより精度よく分類できる。
このような気象データを分類情報として用いれば、ユーザのアクセス時のシチュエーション、例えば、天気が晴れで湿度が60%以下の場合の行動パターンも分類できる。従って、各ユーザの行動パターンやCTRが天候にどのように影響されるのかなどを高精度に分析することができる。
評価値算出手段35は、予測CTRを算出していたが、広告主が目標とする特定のユーザ行動(例えば、商品の購入行動や資料請求行動など)の確率であるコンバージョン率(conversion rate:CVR)を予測してもよいし、他の評価指標を予測してもよい。
情報配信手段36が配信する情報はテキスト広告に限定されず、画像、動画、音楽などの各種コンテンツであってもよい。
前記実施形態の代表パターン生成手段33は、行動グループに含まれる各行動パターンの平均値、つまり各単位期間の「0,1」の値を単位期間毎に平均したもので代表パターンを生成していたが、他の方法で生成してもよい。例えば、単位期間毎に「0,1」のいずれか最頻値によって代表パターンを生成してもよい。さらに、同じグループ内の各行動パターンの類似度を計算して、似通っているものをまとめる再クラスタリングを行い、まとめられた複数の行動パターンの類似度の中間点によって代表パターンを生成してもよい。
Claims (10)
- ユーザIDで特定されるユーザが端末を用いてサービス提供サイトにアクセスした際の行動ログを取得するログ取得手段と、
前記ログ取得手段で取得した前記行動ログに基づく行動パターンを少なくとも1以上のクラスタに分類するクラスタリング手段と、
前記クラスタリング手段で分類されたクラスタ情報を含む複数の素性を用いて機械学習を行って識別関数を生成する機械学習手段と、を備える
ことを特徴とする情報分析装置。 - 請求項1に記載の情報分析装置において、
前記素性は、前記サービス提供サイトで提供されるサービス内容の属性と、前記クラスタ情報とを組み合わせた素性を含む
ことを特徴とする情報分析装置。 - 請求項1または請求項2に記載の情報分析装置において、
前記機械学習手段は、前記各素性の重みを算出する
ことを特徴とする情報分析装置。 - 請求項1から請求項3のいずれか一項に記載の情報分析装置において、
前記サービス提供サイトで提供されるサービス内容の属性と前記クラスタ情報とを組み合わせた素性の重みに基づいて、前記クラスタの特性を推定するクラスタ特性推定手段を有する
ことを特徴とする情報分析装置。 - 請求項1から請求項4のいずれか一項に記載の情報分析装置において、
前記ログ取得手段は、前記ユーザが端末を用いてサービス提供サイトにアクセスした時刻情報を含む行動ログを取得し、
前記クラスタリング手段は、前記行動ログを所定の分析期間毎に抽出し、前記分析期間を特定の時間単位毎に分割し、各時間単位におけるユーザのアクセス状態を示す値に基づいて前記行動パターンを作成し、前記行動パターンの類似度によって前記行動パターンを少なくとも1以上のクラスタに分類する
ことを特徴とする情報分析装置。 - 請求項1から請求項5のいずれか一項に記載の情報分析装置において、
前記識別関数を用いて前記ユーザIDに対応する評価値を算出する評価値算出手段と、
前記評価値に基づいて選定した配信情報を前記サービス提供サイトに配信する情報配信手段とを備える
ことを特徴とする情報分析装置。 - 請求項6に記載の情報分析装置において、
前記サービス提供サイトに配信される前記配信情報は、広告またはコンテンツであり、
前記評価値算出手段は、前記配信情報がクリックされる確率を予測した予測CTRを算出し、
前記情報配信手段は、前記予測CTRの高い配信情報を前記サービス提供サイトに配信する
ことを特徴とする情報分析装置。 - 請求項7に記載の情報分析装置において、
前記機械学習手段で用いられる前記素性は、
前記配信情報の過去の配信実績に基づく実績CTRと、
前記サービス提供サイトの属性および前記配信情報の属性の類似度と、
前記ユーザIDで特定されるユーザ属性および前記配信情報の属性の類似度と、
前記配信情報の属性と、
前記配信情報の表示位置を示すポジションとを備える
ことを特徴とする情報分析装置。 - コンピュータにより機械学習処理を実施する情報分析方法であって、
前記コンピュータは、
ユーザIDで特定されるユーザが端末を用いてサービス提供サイトにアクセスした際の行動ログを取得し、
取得した前記行動ログに基づく行動パターンを少なくとも1以上のクラスタに分類し、
前記分類されたクラスタ情報を含む複数の素性を用いて機械学習を行って識別関数を生成する
ことを特徴とする情報分析方法。 - コンピュータにより読み込み実行される情報分析プログラムであって、
前記コンピュータを、請求項1から請求項8のいずれか1項に記載の情報分析装置として機能させる
ことを特徴とする情報分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014191104A JP6226846B2 (ja) | 2014-09-19 | 2014-09-19 | 情報分析装置、情報分析方法および情報分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014191104A JP6226846B2 (ja) | 2014-09-19 | 2014-09-19 | 情報分析装置、情報分析方法および情報分析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016062411A JP2016062411A (ja) | 2016-04-25 |
JP6226846B2 true JP6226846B2 (ja) | 2017-11-08 |
Family
ID=55796096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014191104A Active JP6226846B2 (ja) | 2014-09-19 | 2014-09-19 | 情報分析装置、情報分析方法および情報分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6226846B2 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6250106B1 (ja) * | 2016-07-05 | 2017-12-20 | ヤフー株式会社 | 情報解析装置、情報解析方法、および情報解析プログラム |
US9805306B1 (en) * | 2016-11-23 | 2017-10-31 | Accenture Global Solutions Limited | Cognitive robotics analyzer |
JP2018136845A (ja) * | 2017-02-23 | 2018-08-30 | 株式会社Wacul | ログ収集システム、ログ収集方法、アクセス解析システム、アクセス解析方法、及びプログラム |
JP7114037B2 (ja) * | 2017-02-23 | 2022-08-08 | 株式会社Wacul | アクセス解析システム、アクセス解析方法、及びプログラム |
CN108090107A (zh) * | 2017-05-22 | 2018-05-29 | 北京市商汤科技开发有限公司 | 业务对象推荐方法、装置、电子设备和存储介质 |
US11120480B2 (en) | 2017-09-14 | 2021-09-14 | Amadeus S.A.S. | Systems and methods for real-time online traveler segmentation using machine learning |
WO2019052869A1 (en) * | 2017-09-14 | 2019-03-21 | Amadeus S.A.S. | METHOD AND SYSTEM FOR AUTOMATIC LEARNING TO PREDICT USER INTERACTIONS ONLINE |
US10943184B2 (en) | 2017-09-14 | 2021-03-09 | Amadeus S.A.S. | Machine learning methods and systems for predicting online user interactions |
FR3071085B1 (fr) * | 2017-09-14 | 2022-02-04 | Amadeus Sas | Un procede et un systeme d'apprentissage automatique pour predire les interactions d'un utilisateur en ligne |
KR101890805B1 (ko) * | 2018-04-17 | 2018-08-22 | (주)시큐레이어 | 머신 러닝 기반 실시간 비정형 로그 처리 방법 및 이를 사용한 서버 |
JP2022507229A (ja) * | 2018-11-13 | 2022-01-18 | スリーエム イノベイティブ プロパティズ カンパニー | 電子商取引コンテンツ生成及び最適化のための深層因果学習 |
KR101966356B1 (ko) * | 2018-11-30 | 2019-04-08 | (주)시큐레이어 | 머신러닝 기반 무중단 파서 업데이트 방법 및 이를 이용한 솔루션 서버 |
CN111291772B (zh) * | 2018-12-06 | 2024-04-16 | 北京嘀嘀无限科技发展有限公司 | 信息的推送方法、装置、电子设备和计算机可读存储介质 |
JP2020149137A (ja) * | 2019-03-11 | 2020-09-17 | 株式会社ビービット | 行動パターン分析装置、方法及びプログラム |
JP7177107B2 (ja) * | 2020-02-07 | 2022-11-22 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
EP4007960A1 (en) * | 2020-10-14 | 2022-06-08 | Google LLC | Privacy preserving machine learning predictions |
JP7425777B2 (ja) * | 2021-09-21 | 2024-01-31 | Tis株式会社 | 情報処理システム、情報処理方法、及びプログラム |
JP2023125753A (ja) * | 2022-02-28 | 2023-09-07 | 株式会社Uacj | 溶解炉において発生するドロス量を予測する学習済み予測モデルを生成する方法、溶解炉において発生するドロス量を予測する方法、およびコンピュータプログラム |
JP7289418B1 (ja) * | 2023-03-28 | 2023-06-09 | 株式会社ビデオリサーチ | 接続状況分析システム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007247996B2 (en) * | 2006-05-02 | 2012-07-12 | Invidi Technologies Corporation | Fuzzy logic based viewer identification |
JP5049223B2 (ja) * | 2008-07-29 | 2012-10-17 | ヤフー株式会社 | Webクエリに対する検索要求属性を自動推定する検索装置、検索方法及びプログラム |
JP5438087B2 (ja) * | 2011-12-15 | 2014-03-12 | ヤフー株式会社 | 広告配信装置 |
JP5805548B2 (ja) * | 2012-01-20 | 2015-11-04 | 日立マクセル株式会社 | 情報処理装置、及び、情報処理方法 |
JP5507607B2 (ja) * | 2012-04-06 | 2014-05-28 | ヤフー株式会社 | コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム |
-
2014
- 2014-09-19 JP JP2014191104A patent/JP6226846B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016062411A (ja) | 2016-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6226846B2 (ja) | 情報分析装置、情報分析方法および情報分析プログラム | |
JP6271345B2 (ja) | 抽出装置、抽出方法及び抽出プログラム | |
CN107871244B (zh) | 一种广告效果的检测方法和装置 | |
JP5596152B2 (ja) | 電子商取引ウェブサイトでの情報マッチングの方法及びシステム | |
US20150269251A1 (en) | Method and system of evaluating the impact of distributed digital content | |
US20150006295A1 (en) | Targeting users based on previous advertising campaigns | |
Johnson | The impact of privacy policy on the auction market for online display advertising | |
JP6232495B2 (ja) | デジタルレシート経済 | |
JP2011096173A (ja) | 情報提供システム、情報提供端末、情報提供サーバ、情報提供方法および情報提供プログラム | |
US20180240158A1 (en) | Computer implemented system and method for customer profiling using micro-conversions via machine learning | |
CN103942236A (zh) | 用于供应电子内容的***和方法 | |
JP2017016485A (ja) | 算出装置、算出方法及び算出プログラム | |
US10672035B1 (en) | Systems and methods for optimizing advertising spending using a user influenced advertisement policy | |
CN111400613A (zh) | 物品推荐方法、装置、介质及计算机设备 | |
JP2011164811A (ja) | 情報処理装置及び情報処理システム | |
JP2016061987A (ja) | 情報処理装置、配信制御方法および配信制御プログラム | |
CN103177129A (zh) | 互联网实时信息推荐预测*** | |
JP2015535102A (ja) | 二部グラフ又はニューラルネットワークを用いた情報フィルタリング及び学習による、通信用移動体端末を備えるユーザへの情報配信のための方法及びデバイス | |
Wang et al. | Probabilistic models for ad viewability prediction on the web | |
Zhan et al. | Identifying market structure to monitor product competition using a consumer-behavior-based intelligence model | |
Zheng et al. | A scalable purchase intention prediction system using extreme gradient boosting machines with browsing content entropy | |
Lloyd et al. | Detecting address uncertainty in loyalty card data | |
Bucklin et al. | Marketing models for internet advertising | |
Iankovets | MEDIA PLANNING OF DIGITAL ADVERTISING CAMPAIGNS. | |
KR101768637B1 (ko) | 데이터 위탁 판매 및 수익 분배 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171010 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6226846 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |