JP2021105789A - プログラム、情報処理装置、情報処理方法及びシステム - Google Patents

プログラム、情報処理装置、情報処理方法及びシステム Download PDF

Info

Publication number
JP2021105789A
JP2021105789A JP2019236137A JP2019236137A JP2021105789A JP 2021105789 A JP2021105789 A JP 2021105789A JP 2019236137 A JP2019236137 A JP 2019236137A JP 2019236137 A JP2019236137 A JP 2019236137A JP 2021105789 A JP2021105789 A JP 2021105789A
Authority
JP
Japan
Prior art keywords
domain
processor
vector
target
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019236137A
Other languages
English (en)
Inventor
亮 五百井
Ryo Ioi
亮 五百井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Advertising Consortium Co Ltd
Original Assignee
Digital Advertising Consortium Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Advertising Consortium Co Ltd filed Critical Digital Advertising Consortium Co Ltd
Priority to JP2019236137A priority Critical patent/JP2021105789A/ja
Publication of JP2021105789A publication Critical patent/JP2021105789A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ドメインをドメインの特徴を示すベクトルで表記することができるプログラム、情報処理装置、情報処理方法及びシステムを提供する。【解決手段】実施形態によれば、プログラムは、プロセッサに、ユーザがアクセスしたドメインを示すアクセスログを取得する機能と、前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成する機能と、前記教師データに基づいて推測行列を生成する機能と、前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成する機能と、を実現させる。【選択図】 図2

Description

本発明の実施形態は、プログラム、情報処理装置、情報処理方法及びシステムに関する。
ドメイン同士の類似性を判定する手法が提供されている。そのような手法は、ドメインの特徴(たとえば、ドメインが提供するコンテンツの特徴)などに基づいて、所定のドメインに類似するドメインを特定する。
しかしながら、ドメインをドメインの特徴を示すベクトルで表記して同様の特徴を有するドメインを特定する手法は、提供されていない。
そこで、ドメインをドメインの特徴を示すベクトルで表記する手法が望まれる。
特開2019−164504号公報
上記の課題を解決するため、ドメインをドメインの特徴を示すベクトルで表記することができるプログラム、情報処理装置、情報処理方法及びシステムを提供する。
実施形態によれば、プログラムは、プロセッサに、ユーザがアクセスしたドメインを示すアクセスログを取得する機能と、前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成する機能と、前記教師データに基づいて推測行列を生成する機能と、前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成する機能と、を実現させる。
情報処理装置は、各ユーザがドメインにアクセスしたアクセスログに基づいてターゲットとコンテキストとから構成される学習データを生成する。情報処理装置は、生成した学習データに基づいて推測行列を生成する。情報処理装置は、推測行列に基づいて、各ドメインに対応するドメインベクトルを生成する。その結果、情報処理装置は、ドメインを当該ドメインの特徴を示すベクトルで表記することができる。
図1は、実施形態に係る広告システムの構成例を示すブロック図である。 図2は、実施形態に係る解析装置の構成例を示すブロック図である。 図3は、実施形態に係る広告サーバの構成例を示すブロック図である。 図4は、実施形態に係るアクセスログの例を示す図である。 図5は、実施形態に係る教師データの例を示す図である。 図6は、実施形態に係る解析装置の動作例を示す図である。 図7は、実施形態に係る解析装置の出力結果の例を示す図である。 図8は、実施形態に係る解析装置の出力結果の例を示す図である。 図9は、実施形態に係る解析装置の動作例を示すフローチャートである。 図10は、実施形態に係る解析装置の動作例を示すフローチャートである。 図11は、実施形態に係る教師データの他の例を示す図である。
以下、実施形態について、図面を参照して説明する。
実施形態に係る広告システムは、ドメインをベクトルに変換する。即ち、広告システムは、ドメインを複数の数字列で表現する。広告システムは、ベクトル間の類似度に基づいて、所定のドメインに類似するドメインを特定する。また、広告システムは、複数のベクトルを演算して得られたベクトルに基づいて、複数のドメインに関連するドメインを特定する。
また、広告システムは、特定されたドメインにアクセスしたユーザ端末に対して、当該所定のドメインに対応する広告を配信する。
図1は、実施形態に係る広告システム1の構成例を示すブロック図である。図1が示すように、広告システム1は、解析装置10、広告サーバ20、ユーザ端末30及びネットワーク40などを備える。解析装置10、広告サーバ20及びユーザ端末30は、ネットワーク40に接続する。
解析装置10(情報処理装置)は、ドメインをベクトルに変換する。また、解析装置10は、ベクトル間の類似度に基づいて、所定のドメインに類似するドメインを特定する。また、解析装置10は、複数のベクトルを演算して得られたベクトルに基づいて、複数のドメインに関連するドメインを特定する。解析装置10については、後に詳述する。
広告サーバ20は、解析装置10によって特定されたドメインにアクセスしたユーザ端末30に対して、広告を配信する。広告サーバ20については、後に詳述する。
ユーザ端末30は、広告サーバ20が配信する広告をディスプレイなどの表示部に表示する。ユーザ端末30は、ユーザからの操作に従って所定のドメインにアクセスする。ユーザ端末30は、当該所定のドメインから取得したスクリプトなどを実行することで、広告を広告サーバ20から取得し表示部に表示する。
たとえば、ユーザ端末30は、デスクトップPC、ノートPC、タブレットPC、スマートフォン、フィーチャーフォン又はウエアラブル端末などである。
次に、解析装置10について説明する。
図2は、実施形態に係る解析装置10の構成例を示す。図2は、解析装置10の構成例を示すブロック図である。図2が示すように、解析装置10は、プロセッサ11、ROM12、RAM13、NVM14、通信部15、操作部16及び表示部17などを備える。
プロセッサ11と、ROM12、RAM13、NVM14、通信部15、操作部16及び表示部17と、は、データバスなどを介して互いに接続する。
なお、解析装置10は、図2が示すような構成の他に必要に応じた構成を具備したり、解析装置10から特定の構成が除外されたりしてもよい。
プロセッサ11(第1のプロセッサ)は、解析装置10全体の動作を制御する機能を有する。プロセッサ11は、内部キャッシュ及び各種のインターフェースなどを備えてもよい。プロセッサ11は、内部メモリ、ROM12又はNVM14が予め記憶するプログラムを実行することにより種々の処理を実現する。
なお、プロセッサ11がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ11は、ハードウエア回路により実行される機能を制御する。
ROM12は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。ROM12に記憶される制御プログラム及び制御データは、解析装置10の仕様に応じて予め組み込まれる。
RAM13は、揮発性のメモリである。RAM13は、プロセッサ11の処理中のデータなどを一時的に格納する。RAM13は、プロセッサ11からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM13は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。
NVM14は、データの書き込み及び書き換えが可能な不揮発性のメモリである。NVM14は、たとえば、HDD(Hard Disk Drive)、SSD(Solid State Drive)又はフラッシュメモリなどから構成される。NVM14は、解析装置10の運用用途に応じて制御プログラム、アプリケーション及び種々のデータなどを格納する。
通信部15(第1のインターフェース)は、ネットワーク40と通信するためのインターフェースである。即ち、通信部15は、ネットワーク40を通じて広告サーバ20などに接続するためのインターフェースである。たとえば、通信部15は、有線又は無線のLAN(Local Area Network)接続をサポートする。
操作部16は、オペレータから種々の操作の入力を受け付ける。操作部16は、入力された操作を示す信号をプロセッサ11へ送信する。操作部16は、タッチパネルから構成されてもよい。
表示部17は、プロセッサ11からの画像データを表示する。たとえば、表示部17は、液晶モニタから構成される。操作部16がタッチパネルから構成される場合、表示部17は、操作部16と一体的に形成されてもよい。
次に、広告サーバ20について説明する。
図3は、実施形態に係る広告サーバ20の構成例を示す。図3は、広告サーバ20の構成例を示すブロック図である。図3が示すように、広告サーバ20は、プロセッサ21、ROM22、RAM23、NVM24、通信部25、操作部26及び表示部27などを備える。
プロセッサ21と、ROM22、RAM23、NVM24、通信部25、操作部26及び表示部27と、は、データバスなどを介して互いに接続する。
なお、広告サーバ20は、図3が示すような構成の他に必要に応じた構成を具備したり、広告サーバ20から特定の構成が除外されたりしてもよい。
プロセッサ21(第2のプロセッサ)は、広告サーバ20全体の動作を制御する機能を有する。
ROM22は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。
RAM23は、揮発性のメモリである。
NVM24は、データの書き込み及び書き換えが可能な不揮発性のメモリである。
通信部25(第2のインターフェース)は、ネットワーク40と通信するためのインターフェースである。即ち、通信部25は、ネットワーク40を通じて解析装置10及びユーザ端末30などに接続するためのインターフェースである。
操作部26は、オペレータから種々の操作の入力を受け付ける。
表示部27は、プロセッサ21からの画像データを表示する。
次に、解析装置10が実現する機能について説明する。解析装置10が実現する機能は、プロセッサ11がROM12又はNVM14などに格納されるプログラムを実行することで実現される。
まず、プロセッサ11は、ユーザがアクセスしたドメインを示すアクセスログを取得する機能を有する。
アクセスログは、ユーザごとに、ユーザがアクセスしたドメインを時系列で示す。図4は、アクセスログの構成例を示す。図4が示すように、アクセスログは、「ユーザ」、「タイムスタンプ」及び「ドメイン」を対応付けて格納する。
「ユーザ」は、アクセスログの取得の対象となるユーザを示す。ここでは、「ユーザ」は、「user1」及び「user2」を示す。
「タイムスタンプ」は、「ユーザ」がドメインにアクセスした日時を示す。
「ドメイン」は、ユーザがアクセスしたドメインを示す。
アクセスログは、「ドメイン」を時系列に並べて格納する。アクセスログは、所定の期間におけるアクセスを示すものであってもよい。
たとえば、プロセッサ11は、通信部15などを通じて外部装置からアクセスログを取得する。また、プロセッサ11は、解析装置10に接続されたメモリなどからアクセスログを取得するものであっても良い。プロセッサ11がアクセスログを取得する方法は、特定の方法に限定されるものではない。
また、プロセッサ11は、アクセスログに基づいて、コンテキスト及びターゲットを含む教師データを生成する機能を有する。
教師データは、コンテキストを入力するとターゲットを出力する行列(推測行列)を学習により生成するためのデータである。推測行列については、後に詳述する。
プロセッサ11は、アクセスログから連続する3つのドメインを取得する。即ち、プロセッサ11は、ユーザが連続して閲覧した3つのドメイン(ユーザが順に遷移した3つのドメイン)を取得する。3つのドメインを取得すると、プロセッサ11は、中心のドメインをターゲットとして、ターゲットの前後のドメインをコンテキストとして認識する。コンテキストとしてのドメインは、ターゲットとしてのドメインの直前の1つのドメインと直後の1つのドメインとである。プロセッサ11は、ターゲットとしてのドメインとコンテキストとしての2つのドメインを含むセットを生成する。
同様に、プロセッサ11は、異なる連続する3つのドメインからセットを生成する。
なお、プロセッサ11は、連続しない3つのドメインを取得してもよい。たとえば、プロセッサ11は、いくつか置き(たとえば、1つ置きに)に3つのドメインを取得してもよい。また、プロセッサ11は、ターゲットの前のドメインからコンテキストとしてのドメインを取得してもよい。また、プロセッサ11は、ターゲットの後のドメインからコンテキストとしてのドメインを取得してもよい。
また、プロセッサ11は、各ユーザにおいて同様の動作を行うことでさらにセットを生成する。
プロセッサ11は、生成した複数のセットから構成される教師データを生成する。
図5は、プロセッサ11が生成した教師データの例を示す。図5が示すように、教師データは、「第1のコンテキスト」、「ターゲット」及び「第2のコンテキスト」を対応付けて格納する。
「第1のコンテキスト」は、一方のコンテキストである。ここでは、「第1のコンテキスト」は、ターゲットの前のドメインである。
「ターゲット」は、教師データのターゲットを示す。
「第2のコンテキスト」は、他方のコンテキストである。ここでは、「第2のコンテキスト」は、ターゲットの後ろのドメインである。
図4及び図5が示す例では、プロセッサ11は、連続する3つのドメインとして「aaa.com」「bbb.com」及び「ccc.com」を取得する。プロセッサ11は、「aaa.com」及び「ccc.com」をコンテキストとして認識する。また、プロセッサ11は、「bbb.com」をターゲットとして認識する。プロセッサ11は、コンテキストしての「aaa.com」及び「ccc.com」とターゲットとしての「bbb.com」とを含むセットを生成する。
同様に、プロセッサ11は、「bbb.com」「ccc.com」及び「ddd.com」を取得する。プロセッサ11は、「bbb.com」及び「ddd.com」をコンテキストとして認識する。また、プロセッサ11は、「ccc.com」をターゲットとして認識する。プロセッサ11は、コンテキストしての「bbb.com」及び「ddd.com」とターゲットとしての「ccc.com」とを含むセットを生成する。
プロセッサ11は、各ユーザにおいて同様の動作を行うことで複数のセットを生成し、生成したセットから構成される教師データを生成する。
また、プロセッサ11は、生成した教師データを用いて推測行列を生成する機能を有する。
プロセッサ11は、ドメインをベクトルに変換するためのフェイクタスクとして推測行列を生成する。
プロセッサ11は、各ドメインに対して、各ドメインを示すone−hotベクトルを設定する。たとえば、プロセッサ11は、「aaa.com」に対して「(1,0,0,0,0,…)」を設定する。同様に、プロセッサ11は、「bbb.com」に対して「(0,1,0,0,0,…)」を設定する。同様に、プロセッサ11は、「ccc.com」に対して「(0,0,1,0,0,…)」を設定する。
前述の通り、推測行列は、コンテキストを入力するとターゲットを出力するための行列である。即ち、推測行列は、コンテキストを示すベクトルを入力するとターゲットを示すone−hotベクトルを出力する。
ここでは、コンテキストを示すベクトルは、第1のコンテキストを示すone−hotベクトルと第2のコンテキストを示すone−hotベクトルとを加算したベクトルである。たとえば、「aaa.com」と「ccc.com」とを示すベクトルは、「(1,0,0,0,0,…)」と「(0,0,1,0,0,…)」とを加算して得られた「(1,0,1,0,0,…)」である。
図6は、プロセッサ11が推測行列を生成する動作例を示す。図6が示すように、プロセッサ11は、コンテキストを示すベクトルを入力するとターゲットを示すone−hotベクトルを出力する推測行列を生成する。
プロセッサ11は、教師データに基づいて、コンテキストを示すベクトルとターゲットを示すone−hotベクトルとのセットを複数個生成する。プロセッサ11は、複数個のセットを用いて推測行列を生成する。
たとえば、プロセッサ11は、コンテキストとしての単語(たとえば、名詞、動詞、又は、助詞など)からターゲットとしての単語を出力するネットワーク(ここでは、行列)を生成するアルゴリズムに従って推測行列を生成する。当該アルゴリズムは、文章において連続する単語からネットワークを生成する。当該アルゴリズムは、コンテキストとなる単語(ターゲットの前後の単語)とターゲットとなる単語との複数のセットを用いてネットワークを生成する。たとえば、当該アルゴリズムは、word2vecのネットワークを生成するアルゴリズムである。
プロセッサ11は、当該アルゴリズムに従って、コンテキストを示すベクトルとターゲットを示すone−hotベクトルとのセットから推測行列を生成する。
また、プロセッサ11は、生成した推測行列に基づいて、ドメインに対応するベクトル(ドメインベクトル)を生成する機能を有する。
即ち、プロセッサ11は、ドメインの特徴を示すドメインベクトルを生成する。
たとえば、プロセッサ11は、ドメインを示すone−hotベクトルに推測行列を乗算して、当該ドメインのドメインベクトルを生成する。プロセッサ11は、各ドメインにおいて同様の処理を行うことで、各ドメインのドメインベクトルを生成する。
また、プロセッサ11は、所定のベクトル(検索対象ベクトル)に類似するドメインベクトルに対応するドメイン(類似ドメイン)を特定する機能を有する。
たとえば、プロセッサ11は、操作部16に入力される操作などに従って、所定のドメインのドメインベクトルを検索対象ベクトルとして設定する。検索対象ベクトルを設定すると、プロセッサ11は、各ドメインベクトルと検索対象ベクトルとの類似度を算出する。たとえば、プロセッサ11は、各ドメインベクトルと検索対象ベクトルとのコサイン類似度を類似度として算出する。
各ドメインベクトルと検索対象ベクトルとの類似度を算出すると、プロセッサ11は、各類似度に基づいて、検索対象ベクトルに類似するドメインベクトルを特定する。たとえば、プロセッサ11は、類似度が所定の閾値以上であるドメインベクトルを特定する。また、プロセッサ11は、類似度が高い所定の個数のドメインベクトルを特定してもよい。
プロセッサ11は、特定したドメインベクトルに対応するドメインを類似ドメインとして特定する。
図7は、プロセッサ11が特定した類似ドメインの例である。ここでは、プロセッサ11は、検索対象ベクトルとして、「aaa.com」に対応するドメインベクトルを設定したものとする。また、「aaa.com」は、「AA新聞」のドメインであるものとする。
図7が示すように、プロセッサ11が特定した類似ドメインは、「xxx.com」、「yyy.com」及び「zzz.com」などである。これらの類似ドメインは、新聞又はニュースに関連するサイトのドメインである。即ち、これらの類似ドメインは、「aaa.com」の特徴と似た特徴を備えるサイトのドメインである。
また、プロセッサ11は、複数のドメインベクトルを演算して得られたベクトルを検索対象ベクトルとして設定してもよい。たとえば、プロセッサ11は、複数のドメインベクトルを加算したベクトルを検索対象ベクトルとして設定する。
図8は、プロセッサ11が複数のドメインベクトルを加算したベクトルを検索対象ベクトルとして設定した場合において特定した類似ドメインの例である。ここでは、プロセッサ11は、検索対象ベクトルとして、「aaa.com」のドメインベクトルと「nnn.com」のドメインベクトルとを加算して得られたベクトルを設定したものとする。また、また、「nnn.com」は、「NNNスポーツ」のドメインであるものとする。
図8が示すように、プロセッサ11が特定した類似ドメインは、「abc.com」、「xyz.com」及び「efg.com」などである。これらの類似ドメインは、スポーツのニュースに関連するサイトのドメインである。即ち、これらの類似ドメインは、「aaa.com」の特徴及び「nnn.com」の特徴と似た特徴を備えるサイトのドメインである。
プロセッサ11は、特定した類似ドメインを出力する。たとえば、プロセッサ11は、通信部25を通じて、特定した類似ドメインを広告サーバ20に送信する。また、プロセッサ11は、NVM24又は外部メモリに特定した類似ドメインを格納しても良い。
次に、広告サーバ20が実現する機能について説明する。広告サーバ20が実現する機能は、プロセッサ21がROM22又はNVM24などに格納されるプログラムを実行することで実現される。
プロセッサ21は、解析装置10のプロセッサ11が特定した類似ドメインに基づいて、広告を配信する機能を有する。
たとえば、プロセッサ21は、通信部25などを通じて、類似ドメインを解析装置10から取得する。なお、プロセッサ21は、広告サーバ20に接続されたメモリなどから類似ドメインを取得しても良い。
プロセッサ21は、各類似ドメインにアクセスしたユーザ端末30に対して所定の広告を配信する。たとえば、プロセッサ21は、ユーザ端末30が類似ドメインのサイト内のスクリプトに従って送信したリクエストを取得する。プロセッサ21は、所定の広告を含むレスポンスをユーザ端末30に送信する。
所定の広告は、検索対象ベクトルに関するドメインに関連する。検索対象ベクトルがドメインベクトルである場合、当該広告は、当該ドメインベクトルに対応するドメイン(即ち、ドメインの特徴)に関連する。たとえば、当該広告は、当該ドメインベクトルを閲覧しているユーザを対象とする。また、検索対象ベクトルが複数のドメインベクトルを演算して得られたベクトルである場合、当該広告は、当該複数のドメインベクトル(又は、それらの少なくとも1つ)に対応するドメインに関連する。
これにより、プロセッサ21は、所定のドメインの特徴と同様の特徴を有する類似ドメインにアクセスしたユーザに対して所定のドメインに関する広告を配信することができる。
次に、解析装置10の動作例について説明する。
まず、解析装置10がドメインベクトルを生成する動作例について説明する。
図9は、解析装置10がドメインベクトルを生成する動作例について説明するためのフローチャートである。
まず、解析装置10のプロセッサ11は、アクセスログを取得する(S11)。アクセスログを取得すると、プロセッサ11は、取得したアクセスログに基づいて教師データを生成する(S12)。
教師データを生成すると、プロセッサ11は、生成した教師データに基づいて推測行列を生成する(S13)。推測行列を生成すると、プロセッサ11は、生成した推測行列に基づいて各ドメインのドメインベクトルを生成する(S14)。
ドメインベクトルを生成すると、プロセッサ11は、動作を終了する。
次に、解析装置10が類似ドメインを特定する動作例について説明する。
図10は、解析装置10が類似ドメインを特定する動作例について説明するためのフローチャートである。
まず、解析装置10のプロセッサ11は、検索対象ベクトルを設定する(S21)。検索対象ベクトルを設定すると、プロセッサ11は、各ドメインベクトルと検索対象ベクトルとの類似度を算出する(S22)。類似度を算出すると、プロセッサ11は、類似度に基づいて類似ドメインを特定する(S23)。
類似ドメインを特定すると、プロセッサ11は、類似ドメインを出力する(S24)。類似ドメインを出力すると、プロセッサ11は、動作を終了する。
次に、プロセッサ11が教師データを生成する他の動作例について説明する。
図11は、プロセッサ11が教師データを生成する他の動作例について説明するための図である。
ここでは、プロセッサ11は、アクセスログからユーザごとに所定の期間(たとえば、1日)にアクセスされたドメインを抽出する。所定の期間にアクセスされたドメインを抽出すると、プロセッサ11は、抽出したドメインから3つのドメインを取得する。ここで、プロセッサ11は、時系列で連続する3つのドメインを取得してもよいし、時系列で連続しない3つのドメインを取得してもよい。
3つのドメインを取得すると、プロセッサ11は、3つのドメインの中の1つのドメインをターゲットとして認識し、残りのドメインをコンテキストとして認識する。プロセッサ11は、ターゲットとしてのドメインとコンテキストとしての2つのドメインを含むセットを生成する。
また、プロセッサ11は、3つのドメインの中の他の1つのドメインをターゲットとして、残りのドメインをコンテキストとして認識する。プロセッサ11は、ターゲットとしてのドメインとコンテキストとしての2つのドメインを含むセットを生成する。
同様に、3つのドメインの中のさらに他の1つのドメインをターゲットとして、残りのドメインをコンテキストとして認識する。プロセッサ11は、ターゲットとしてのドメインとコンテキストとしての2つのドメインを含むセットを生成する。
また、プロセッサ11は、他の期間においても同様の動作を行うことでさらにセットを生成する。
また、プロセッサ11は、各ユーザにおいて同様の動作を行うことでさらにセットを生成する。
プロセッサ11は、生成した複数のセットから構成される教師データを生成する。
図11が示す例では、プロセッサ11は、アクセスログから「USER1」が「2018/11/11」にアクセスした3つのドメイン(「aaa.com」「bbb.com」及び「ccc.com」)を取得する。3つのドメインを取得すると、プロセッサ11は、「bbb.com」をターゲットとして含み、「aaa.com」及び「ccc.com」をコンテキストとして含むセットを生成する。
また、プロセッサ11は、「ccc.com」をターゲットとして含み、「aaa.com」及び「bbb.com」をコンテキストとして含むセットを生成する。同様に、プロセッサ11は、「aaa.com」をターゲットとして含み、「bbb.com」及び「ccc.com」をコンテキストとして含むセットを生成する。
プロセッサ11は、他のユーザ(たとえば、「USER2」)についても同様の動作を行うことでセットを生成する。
プロセッサ11は、生成した複数のセットから構成される教師データを生成する。
なお、プロセッサ11は、ターゲットとコンテキストとのセットから構成される教師データを生成すればよい。プロセッサ11がアクセスログから教師データを生成する方法は、特定の方法に限定されるものではない。
また、推測行列は、ターゲットを入力するとコンテキストを出力するものであってもよい。
また、ドメインベクトルを生成する装置と類似度を算出する装置(又は、類似ドメインを生成する装置)とは、異なっていても良い。
また、解析装置10と広告サーバ20とは、同一の装置であってもよい。
また、プロセッサ11は、コンテキストを3つ以上含むセットから構成される教師データを生成してもよい。たとえば、プロセッサ11は、ユーザごとの時系列で連続する5つのドメインを取得する。プロセッサ11は、中心のドメインをターゲットとして、前後4つのドメインをコンテキストとして認識してもよい。
また、プロセッサ11は、同様にURL(uniform resource locator)の特徴を示すベクトルを生成するものであっても良い。
なお、本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の発明が含まれており、開示される複数の構成要件から選択された組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、課題が解決でき、効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
1…広告システム、10…解析装置、11…プロセッサ、12…ROM、13…RAM、14…NVM、15…通信部、16…操作部、17…表示部、20…広告サーバ、21…プロセッサ、22…ROM、23…RAM、24…NVM、25…通信部、26…操作部、27…表示部、30…ユーザ端末、40…ネットワーク。
実施形態によれば、プログラムは、プロセッサに、ユーザがアクセスしたドメインを示すアクセスログを取得する機能と、前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成する機能と、前記教師データに基づいて推測行列を生成する機能と、前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成する機能と、を実現させる。ターゲットとしてのドメインは、各ユーザが所定の期間においてアクセスした複数のドメインの中の1つのドメインである。コンテキストとしてのドメインは、前記複数のドメインの他のドメインである。
なお、本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の発明が含まれており、開示される複数の構成要件から選択された組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、課題が解決でき、効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
以下に本件出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
プロセッサに、
ユーザがアクセスしたドメインを示すアクセスログを取得する機能と、
前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成する機能と、
前記教師データに基づいて推測行列を生成する機能と、
前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成する機能と、
を実現させるプログラム。
[C2]
前記アクセスログは、ドメインを時系列で示す、
C1に記載のプログラム。
[C3]
コンテキストとしてのドメインは、ターゲットとしてのドメインの前後のドメインである、
C2に記載のプログラム。
[C4]
コンテキストとしてのドメインは、ターゲットとしてのドメインの直前の1つのドメインと直後の1つのドメインである、
C3に記載のプログラム。
[C5]
ターゲットとしてのドメインは、各ユーザが所定の期間においてアクセスした複数のドメインの中の1つのドメインであり、
コンテキストとしてのドメインは、前記複数のドメインの他のドメインである、
C1に記載のプログラム。
[C6]
前記複数のドメインは、3つのドメインである、
C5に記載のプログラム。
[C7]
前記プロセッサに、さらに、
検索対象ベクトルを設定する機能と、
前記検索対象ベクトルと前記ドメインベクトルとの類似度を算出する機能と、
を実現させる、
C1乃至6の何れか1項に記載のプログラム。
[C8]
前記検索対象ベクトルは、複数のドメインベクトルを演算して得られるベクトルである、
C7に記載のプログラム。
[C9]
前記プロセッサに、さらに、
前記類似度に基づいて前記検索対象ベクトルに類似するドメインベクトルに対応する類似ドメインを特定する機能と、
を実現させる、
C7又は8の何れか1項に記載のプログラム。
[C10]
前記推測行列は、コンテキストを入力するとターゲットを出力するための行列である、
C1乃至9の何れか1項に記載のプログラム。
[C11]
ユーザがアクセスしたドメインを示すアクセスログを取得するインターフェースと、
前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成し、
前記教師データに基づいて推測行列を生成し、
前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成する、
プロセッサと、
を備える情報処理装置。
[C12]
プロセッサによって実行される情報処理方法であって、
ユーザがアクセスしたドメインを示すアクセスログを取得し、
前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成し、
前記教師データに基づいて推測行列を生成し、
前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成する
情報処理方法。
[C13]
情報処理装置と広告サーバとから構成されるシステムであって、
前記情報処理装置は、
ユーザがアクセスしたドメインを示すアクセスログを取得する第1のインターフェースと、
前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成し、
前記教師データに基づいて推測行列を生成し、
前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成し、
検索対象ベクトルを設定し、
前記検索対象ベクトルと前記ドメインベクトルとの類似度を算出し、
前記類似度に基づいて前記検索対象ベクトルに類似するドメインベクトルに対応する類似ドメインを特定する、
第1のプロセッサと、
を備え、
前記広告サーバは、
前記類似ドメインを取得する第2のインターフェースと、
前記類似ドメインにアクセスした端末に対して所定の広告を配信する第2のプロセッサと、
を備える、
システム。

Claims (13)

  1. プロセッサに、
    ユーザがアクセスしたドメインを示すアクセスログを取得する機能と、
    前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成する機能と、
    前記教師データに基づいて推測行列を生成する機能と、
    前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成する機能と、
    を実現させるプログラム。
  2. 前記アクセスログは、ドメインを時系列で示す、
    請求項1に記載のプログラム。
  3. コンテキストとしてのドメインは、ターゲットとしてのドメインの前後のドメインである、
    請求項2に記載のプログラム。
  4. コンテキストとしてのドメインは、ターゲットとしてのドメインの直前の1つのドメインと直後の1つのドメインである、
    請求項3に記載のプログラム。
  5. ターゲットとしてのドメインは、各ユーザが所定の期間においてアクセスした複数のドメインの中の1つのドメインであり、
    コンテキストとしてのドメインは、前記複数のドメインの他のドメインである、
    請求項1に記載のプログラム。
  6. 前記複数のドメインは、3つのドメインである、
    請求項5に記載のプログラム。
  7. 前記プロセッサに、さらに、
    検索対象ベクトルを設定する機能と、
    前記検索対象ベクトルと前記ドメインベクトルとの類似度を算出する機能と、
    を実現させる、
    請求項1乃至6の何れか1項に記載のプログラム。
  8. 前記検索対象ベクトルは、複数のドメインベクトルを演算して得られるベクトルである、
    請求項7に記載のプログラム。
  9. 前記プロセッサに、さらに、
    前記類似度に基づいて前記検索対象ベクトルに類似するドメインベクトルに対応する類似ドメインを特定する機能と、
    を実現させる、
    請求項7又は8の何れか1項に記載のプログラム。
  10. 前記推測行列は、コンテキストを入力するとターゲットを出力するための行列である、
    請求項1乃至9の何れか1項に記載のプログラム。
  11. ユーザがアクセスしたドメインを示すアクセスログを取得するインターフェースと、
    前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成し、
    前記教師データに基づいて推測行列を生成し、
    前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成する、
    プロセッサと、
    を備える情報処理装置。
  12. プロセッサによって実行される情報処理方法であって、
    ユーザがアクセスしたドメインを示すアクセスログを取得し、
    前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成し、
    前記教師データに基づいて推測行列を生成し、
    前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成する
    情報処理方法。
  13. 情報処理装置と広告サーバとから構成されるシステムであって、
    前記情報処理装置は、
    ユーザがアクセスしたドメインを示すアクセスログを取得する第1のインターフェースと、
    前記アクセスログに基づいて、ターゲットとしてのドメインとコンテキストとしてのドメインとから構成される教師データを生成し、
    前記教師データに基づいて推測行列を生成し、
    前記推測行列に基づいてドメインの特徴を示すドメインベクトルを生成し、
    検索対象ベクトルを設定し、
    前記検索対象ベクトルと前記ドメインベクトルとの類似度を算出し、
    前記類似度に基づいて前記検索対象ベクトルに類似するドメインベクトルに対応する類似ドメインを特定する、
    第1のプロセッサと、
    を備え、
    前記広告サーバは、
    前記類似ドメインを取得する第2のインターフェースと、
    前記類似ドメインにアクセスした端末に対して所定の広告を配信する第2のプロセッサと、
    を備える、
    システム。
JP2019236137A 2019-12-26 2019-12-26 プログラム、情報処理装置、情報処理方法及びシステム Pending JP2021105789A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019236137A JP2021105789A (ja) 2019-12-26 2019-12-26 プログラム、情報処理装置、情報処理方法及びシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019236137A JP2021105789A (ja) 2019-12-26 2019-12-26 プログラム、情報処理装置、情報処理方法及びシステム

Publications (1)

Publication Number Publication Date
JP2021105789A true JP2021105789A (ja) 2021-07-26

Family

ID=76918885

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019236137A Pending JP2021105789A (ja) 2019-12-26 2019-12-26 プログラム、情報処理装置、情報処理方法及びシステム

Country Status (1)

Country Link
JP (1) JP2021105789A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017033250A (ja) * 2015-07-31 2017-02-09 デジタル・アドバタイジング・コンソーシアム株式会社 情報処理装置、情報処理方法及びプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017033250A (ja) * 2015-07-31 2017-02-09 デジタル・アドバタイジング・コンソーシアム株式会社 情報処理装置、情報処理方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
保坂 大樹: "意味空間上の分布表現に基づくWebサイトと閲覧ユーザの統合分析モデル", 情報処理学会論文誌 VOL.60 NO.8 [ONLINE], vol. 第60巻,第8号, JPN6021001739, 15 August 2019 (2019-08-15), JP, pages 1390 - 1402, ISSN: 0004529643 *

Similar Documents

Publication Publication Date Title
CN107948314B (zh) 基于规则文件的业务处理方法、装置及服务器
US8195822B2 (en) Substituting content for undesirable content in a web browser
CN104754073A (zh) 一种资源访问方法及装置
US9954880B2 (en) Protection via webpage manipulation
US8250466B2 (en) Computer and method for converting a web page
US20220188402A1 (en) Real-Time Detection and Blocking of Counterfeit Websites
JP2022518724A (ja) ドキュメント入力内容の処理方法、装置、電子機器及び記憶媒体
JP2017168096A5 (ja)
US20180373576A1 (en) Information processing method, device, system, and terminal device
US20090106396A1 (en) Data Extraction System, Terminal Apparatus, Program of the Terminal Apparatus, Server Apparatus, and Program of the Server Apparatus
US11086899B2 (en) On demand synchronization of information
CN107391100B (zh) 一种支持多语言账单的配置文件生成方法及装置
EP3394768A1 (en) A system and method for capturing, storing, sharing page contents in the form of screenshot
KR20180101913A (ko) 디지털 컨텐츠의 공유를 위한 웹 서버, 스크린 샷 서버, 웹 브라우저 및 대상 단말의 동작 방법
JP2021105789A (ja) プログラム、情報処理装置、情報処理方法及びシステム
JP6620788B2 (ja) データ提供システム、情報処理方法および情報処理プログラム
US10659560B2 (en) Mobile device display preference
CN107045549B (zh) 一种电子书页数获取方法和装置
KR20120086037A (ko) 자동 번역 서비스 시스템 및 자동 번역 제공 방법
JP2017517162A (ja) コンテンツのキャプチャによるアセット収集サービス
CN111988405A (zh) 负载均衡装置的报文重写方法及负载均衡装置
JP6900436B2 (ja) プログラム
CN113805968B (zh) 应用程序的功能执行方法、装置、计算机设备和存储介质
JP6840808B1 (ja) プログラム及び情報処理装置
JP6875334B2 (ja) サーバ、システム、クライアント装置、ログ情報記憶方法、クライアント情報送信方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210622