JP7240240B2 - Information processing device, information processing method, and program - Google Patents
Information processing device, information processing method, and program Download PDFInfo
- Publication number
- JP7240240B2 JP7240240B2 JP2019083031A JP2019083031A JP7240240B2 JP 7240240 B2 JP7240240 B2 JP 7240240B2 JP 2019083031 A JP2019083031 A JP 2019083031A JP 2019083031 A JP2019083031 A JP 2019083031A JP 7240240 B2 JP7240240 B2 JP 7240240B2
- Authority
- JP
- Japan
- Prior art keywords
- access log
- web page
- output
- viewer
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 50
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000012545 processing Methods 0.000 claims description 98
- 230000009471 action Effects 0.000 claims description 39
- 238000000034 method Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 230000000306 recurrent effect Effects 0.000 claims description 7
- 230000008901 benefit Effects 0.000 claims description 2
- 239000013598 vector Substances 0.000 description 98
- 238000013527 convolutional neural network Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 15
- 230000006399 behavior Effects 0.000 description 15
- 230000000877 morphologic effect Effects 0.000 description 15
- 210000002569 neuron Anatomy 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 230000001131 transforming effect Effects 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 10
- 230000015654 memory Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 238000007476 Maximum Likelihood Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、情報処理装置、情報処理方法、およびプログラムに関する。 The present invention relates to an information processing device, an information processing method, and a program.
従来、ウェブページを閲覧した閲覧結果に基づいて、ユーザの行動を推定する技術が知られている(例えば、特許文献1参照)。
Conventionally, there is known a technique for estimating a user's behavior based on browsing results of browsing a web page (see
しかしながら、従来の技術では、ユーザの状況に応じた検索結果を出力することができても、その後、ユーザが、商品、またはサービスの購入、サービスへの入会、或いは、不正決済等の所定の行動を行うことを推定することができず、その結果、適切なアクションを行うことができなかった。 However, in the conventional technology, even if the search results according to the user's situation can be output, after that, the user does not perform a predetermined action such as purchasing a product or service, joining a service, or fraudulent payment. and as a result could not take appropriate action.
本発明は、上記の課題に鑑みてなされたものであり、ユーザの行動をより正確に推定し、適切なアクションを行うことができる情報処理装置、情報処理方法、およびプログラムを提供することを目的としている。 SUMMARY OF THE INVENTION It is an object of the present invention to provide an information processing apparatus, an information processing method, and a program capable of more accurately estimating a user's behavior and taking an appropriate action. and
本発明の一態様は、ネットワークを介したウェブページへのアクセスログを取得する取得部と、前記アクセスログにおける所定の行動の有無を教師データとして、入力されたアクセスログにおいて前記所定の行動が行われるかを出力するように学習された分類器の出力結果に基づいて、前記取得部により取得された前記アクセスログに示されるウェブページを閲覧した閲覧者に提供すべき情報を決定する決定部とを備える情報処理装置である。 According to one aspect of the present invention, an acquisition unit acquires an access log to a web page via a network; a determination unit that determines information to be provided to a viewer who viewed the web page indicated in the access log acquired by the acquisition unit, based on the output result of a classifier that has learned to output whether the It is an information processing device comprising
また、本発明の一態様は、ネットワークを介したウェブページへのアクセスログを取得する取得部と、前記アクセスログにおける所定の行動の有無を学習データとして、入力されたアクセスログにおいて前記所定の行動が行われたかを出力するように学習された分類器の出力結果に基づいて、前記取得部によって取得された前記アクセスログに示されるウェブページを閲覧した閲覧者によって前記所定の行動が行われたか否かを推定し、前記所定の行動が行われたと推定した場合、購入に係る処理を実行する外部装置に対して、処理の中止を指示することを決定する決定部とを備える情報処理装置である。 In one aspect of the present invention, an acquisition unit acquires an access log to a web page via a network; Based on the output result of a classifier trained to output whether the predetermined action was performed by the viewer who viewed the web page indicated in the access log acquired by the acquisition unit an information processing apparatus comprising: a determination unit that determines whether or not the purchase has occurred, and if it is estimated that the predetermined action has been performed, instructs an external device that executes processing related to purchase to stop the processing be.
本発明の一態様によれば、ユーザの行動をより正確に推定し、適切なアクションを行うことができる。 ADVANTAGE OF THE INVENTION According to one aspect of the present invention, a user's behavior can be estimated more accurately and an appropriate action can be taken.
以下、本発明を適用した情報処理装置、情報処理方法、およびプログラムを、図面を参照して説明する。 Hereinafter, an information processing apparatus, an information processing method, and a program to which the present invention is applied will be described with reference to the drawings.
[概要]
情報処理装置は、一以上のプロセッサにより実現される。情報処理装置は、ウェブページへのアクセスログを取得する。情報処理装置は、予め学習された分類器に基づいて、取得したアクセスログに示されるウェブページを閲覧する者(以下、閲覧者)によって所定の行動が行われるかを出力する。分類器は、ネットワークを介して所定の行動が行われたアクセスログを学習データ、及び教師データとして、入力されたアクセスログの閲覧者によって所定の行動が行われるか否かを示す分類結果を出力するように学習される。このような分類器を利用することで、情報処理装置は、閲覧者が所定の行動を行うと推定される場合に、適切なアクションを、閲覧者、又は所定の装置に対して行うことができる。以下、商品またはサービスをまとめて単に「商品」と称して説明する。
[overview]
An information processing device is realized by one or more processors. An information processing device acquires an access log to a web page. The information processing device outputs whether a person viewing the web page indicated in the acquired access log (hereinafter referred to as a viewer) performs a predetermined action based on a pre-learned classifier. The classifier outputs a classification result indicating whether or not a given action is taken by a viewer of the input access log, using access logs in which a given action is performed via the network as learning data and teacher data. learned to do. By using such a classifier, the information processing device can perform an appropriate action for the viewer or the predetermined device when it is estimated that the viewer will perform a predetermined action. . Hereinafter, products or services will be collectively referred to simply as "products" for explanation.
<第1実施形態>
[全体構成]
図1は、情報処理装置100を含む情報処理システム1の一例を示す図である。第1実施形態における情報処理システム1は、例えば、一以上の端末装置10と、サービス提供装置20と、決済処理装置30と、情報処理装置100とを備える。これらの装置は、ネットワークNWを介して接続される。また、これらの装置のうち一部は、他の装置に仮想的な装置として包含されてもよく、例えば、サービス提供装置20の機能の一部または全部、決済処理装置30の機能の一部または全部等が、情報処理装置100の機能によって実現される仮想マシンであってもよい。決済処理装置30は、「外部装置」の一例である。
<First embodiment>
[overall structure]
FIG. 1 is a diagram showing an example of an
図1に示す各装置は、ネットワークNWを介して種々の情報を送受信する。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線等を含む。なお、図1に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワークNWは、一部にローカルなネットワークを含んでもよい。 Each device shown in FIG. 1 transmits and receives various information via the network NW. The network NW includes, for example, the Internet, WAN (Wide Area Network), LAN (Local Area Network), provider terminal, wireless communication network, wireless base station, leased line, and the like. Note that not all combinations of the devices shown in FIG. 1 need to be able to communicate with each other, and the network NW may partially include a local network.
端末装置10は、例えば、スマートフォン等の携帯電話、タブレット端末、各種パーソナルコンピュータ等の、入力装置、表示装置、通信装置、記憶装置、および演算装置を備える端末装置である。通信装置は、NIC(Network Interface Card)等のネットワークカード、無線通信モジュール等を含む。端末装置10では、ウェブブラウザやアプリケーションプログラム等のUA(User Agent)が起動し、ユーザの入力する内容に応じたリクエストをサービス提供装置20に送信する。また、UAが起動された端末装置10は、サービス提供装置20から取得した情報に基づいて、表示装置に各種画像を表示させる。端末装置10のユーザは、「ウェブページを閲覧した閲覧者」の一例である。
The
サービス提供装置20は、例えば、UAとして起動されたウェブブラウザからのリクエストに応じてウェブページを端末装置10に提供するウェブサーバである。ウェブページは、例えば、インターネット上において商品を販売するショッピングサイトやオークションサイト、フリーマーケットサイト等のウェブページを構成するウェブページであってよい。また、サービス提供装置20は、検索サイトやSNS(Social Networking Service)、メールサービス等の各種サービスを提供するウェブページを端末装置10に提供してもよい。また、サービス提供装置20は、UAとして起動されたアプリケーションからのリクエストに応じてコンテンツを端末装置10に提供することで、販売サイト等の各種ウェブページと同様のサービスを提供するアプリケーションサーバであってもよい。
The
決済処理装置30は、例えば、サービス提供装置20において販売された商品の決済処理を行う。決済処理装置30は、端末装置10を利用するユーザにより指定された決済手段に基づく決済処理を行う。決済処理は、クレジットカードのシステムやインターネットバンキングを利用して行われてもよいし、端末装置10が携帯電話である場合には、端末装置10の利用料に加算することで行われてもよい。また、決済処理は、コンビニエンスストア等の店舗における支払いにより行われてもよい。
The
ユーザが端末装置10を用いてインターネット上において商品を購入する場合、ユーザは、例えば、サービス提供装置20が提供する検索サイトにアクセスする。ユーザは、商品を販売するショッピングサイトの名称や、購入したい商品の名称等をクエリとして検索し、検索結果として表示されたショッピングサイトの一覧のうち、いずれかのショッピングサイトにアクセス(閲覧)する。ユーザは、ショッピングサイトにおいて購入したい商品を販売している販売サイトにアクセスする。そして、ユーザは、販売サイトのうち、販売される商品(以下、商品ページ)にアクセスし、購入したい商品の商品ページから商品を購入する処理を行う。
When a user purchases a product on the Internet using the
サービス提供装置20は、このようなアクセスの履歴(以下、アクセスログ)をセッション毎に取得する。セッションは、例えば、あるユーザが、サービス提供装置20が提供するいずれかのウェブページにアクセスを開始してから、サービス提供装置20が提供するいずれかのウェブページから離れる、ウェブブラウザを閉じる、又はウェブページへのアクセスを開始してから所定の時間(例えば、30分以上)が経過するまでの期間である。したがって、アクセスログには、1セッションの間にユーザがウェブページ上で行った行動に応じて、ユーザが閲覧したウェブページに係る情報が、1以上含まれる。
The
図2は、アクセスログの一例を示す図である。アクセスログには、例えば、1セッションの間に、ユーザがアクセスしたウェブページを識別可能な識別情報(以下、ウェブID)と、ユーザが当該ウェブページを閲覧した時間(以下、閲覧時間)とが互いに対応付けられたレコードが、時系列順に含まれる情報である。ウェブIDは、例えば、URL(Uniform Resource Locator)であってもよく、予めウェブページに付されるIDであってもよく、サブドメインであってもよい。 FIG. 2 is a diagram showing an example of an access log. For example, the access log contains identification information (hereinafter referred to as web ID) that can identify the web page accessed by the user and the time the user viewed the web page (hereinafter referred to as viewing time) during one session. Records associated with each other are information included in chronological order. The web ID may be, for example, a URL (Uniform Resource Locator), an ID given to a web page in advance, or a subdomain.
図3のアクセスログには、まず、検索サイトにアクセスし、次にショッピングサイトにアクセスし、次に販売サイトにアクセスし、次に商品ページにアクセスしたことが示される。また、アクセスログには、検索サイトのウェブIDと閲覧時間のレコードと、ショッピングサイトのウェブIDと閲覧時間のレコードと、販売サイトのウェブIDと閲覧時間のレコードと、商品ページのウェブIDと閲覧時間のレコードとが含まれる。なお、アクセスログの内容は、一例であってこれに限られない。 The access log in FIG. 3 indicates that the user first accessed the search site, then accessed the shopping site, then accessed the sales site, and then accessed the product page. The access log contains a record of the web ID and browsing time of the search site, a record of the web ID and browsing time of the shopping site, a record of the web ID and browsing time of the sales site, and a record of the web ID and browsing time of the product page. Includes time records. Note that the content of the access log is an example and is not limited to this.
ここで、アクセスログには、ユーザが所定の行動に至るまでの、ユーザの振る舞いの特徴が表れている場合がある。例えば、類似する複数の商品の商品ページを、それぞれ長い時間閲覧していることがアクセスログに示されている場合、ユーザは、商品を購入する可能性が高いことが推定される。また、類似する複数のサービスのウェブページを、それぞれ長い時間閲覧していることがアクセスログに示されている場合、ユーザは、サービスに入会する可能性が高いことが推定される。また、各ウェブページの閲覧時間が極端に短く、商品ページまで最少の数のウェブページを介して到達し、商品を購入したことがアクセスログに示される場合、ユーザは、不正な手段による決済(以下、不正な決済)によって商品を購入した可能性が高いことが推定される。 Here, the access log may show characteristics of the user's behavior until the user reaches a predetermined action. For example, if the access log indicates that product pages of multiple similar products have been viewed for a long time, it is estimated that the user is likely to purchase the product. Also, if the access log indicates that the user browses web pages of a plurality of similar services for a long period of time, it is estimated that the user is highly likely to become a member of the service. In addition, if the access log shows that the browsing time of each web page is extremely short, the user reached the product page through the minimum number of web pages, and purchased the product, the user may make a payment by fraudulent means ( It is presumed that there is a high possibility that the product was purchased by fraudulent payment.
情報処理装置100は、アクセスログを取得し、取得したアクセスログを機械学習することで、ユーザが所定の行動(例えば、商品の購入、サービスの入会、或いは不正決済)を行うか否かを推定する。
The
[情報処理装置の構成]
図3は、情報処理装置100の構成の一例を示す図である。図示のように、情報処理装置100は、例えば、通信部102と、制御部110と、記憶部130とを備える。
[Configuration of information processing device]
FIG. 3 is a diagram showing an example of the configuration of the
通信部102は、例えば、NIC等の通信インターフェースを含む。通信部102は、ネットワークNWを介して、端末装置10、サービス提供装置20、或いは決済処理装置30等と通信する。
The
制御部110は、例えば、取得部112と、形態素解析部114と、行動推定部116と、決定部118と、学習処理部120とを備える。
The
制御部110の構成要素は、例えば、CPU(Central Processing Unit)などのプロセッサが記憶部130に格納されたプログラムを実行することにより実現される。また、制御部110の構成要素の一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、またはGPU(Graphics Processing Unit)などのハードウェア(回路部;circuitry)により実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
The constituent elements of the
記憶部130は、例えば、HDD(Hard Disc Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶装置により実現される。記憶部130には、ファームウェアやアプリケーションプログラムなどの各種プログラムの他に、分類器情報132、及び教師データ134が格納される。これらの詳細については後述する。
The
[運用時の処理フロー]
以下、第1実施形態における情報処理装置100による運用時の一連の処理の流れをフローチャートに即して説明する。運用時とは、既に学習された分類器200を利用する状態である。図4は、第1実施形態における情報処理装置100による運用時の一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、所定の周期で繰り返し行われてもよい。
[Processing flow during operation]
The flow of a series of processes during operation by the
まず、取得部112は、通信部102にサービス提供装置20と通信させ、サービス提供装置20からユーザのアクセスログを取得する(S100)。
First, the acquiring
次に、形態素解析部114は、取得部112によって取得されたアクセスログに含まれる文書(ウェブIDや、閲覧時間)に対して形態素解析を行う(S102)。例えば、形態素解析部114は、ワンホット表現と呼ばれる手法を用いて、単語や語句をベクトル化してもよいし、word2vecやGloVeのような分散表現または単語埋め込み表現(Word Embedding(s))と呼ばれる手法を用いて、単語や語句をベクトル化する。
Next, the
ワンホット表現とは、予め用意された単語または語句のリスト(辞書)と、アクセスログに含まれる単語または語句とを比較して、単語または語句のうち、リストに出現した単語または語句の要素値が1、他の単語または語句の要素値が0となるような多次元のベクトルを生成する手法である。形態素解析部114は、例えば、ワンホット表現によって閲覧時間を示す11次元のベクトルを生成する。
A one-hot expression is a list of words or phrases prepared in advance (dictionary) that is compared with the words or phrases included in the access log, and among the words or phrases that appear in the list, the element values of the words or phrases are found. is 1, and other words or phrases have element values of 0. The
また、分散表現は、形態素解析で得られた単語または語句と、その単語または語句の前後で出現する単語または語句との共起性に基づいて、単語や語句をベクトル化する手法であり、例えば、予め用意された複数の単語や語句を含むコーパスに基づいて、形態素解析で得られた単語または語句の前後に出現する単語または語句の出現確率を求め、その出現確率を要素値とする多次元のベクトルを生成する手法である。 Distributed representation is a method of vectorizing words or phrases based on the co-occurrence of words or phrases obtained by morphological analysis and words or phrases that appear before and after the words or phrases. , Based on a corpus containing multiple words and phrases prepared in advance, the occurrence probability of words or phrases that appear before and after the word or phrase obtained by morphological analysis is obtained, and the occurrence probability is used as an element value. is a method to generate a vector of
例えば、形態素解析部114は、Countinuous Bag-of-WordsおよびSkip-gramの双方の学習モデルを適用したニューラルネットワークに形態素解析で得られた単語または語句を入力することで、その単語や語句が分散表現されたベクトルを生成してよい。
For example, the
形態素解析部114は、ベクトル化した単語または語句(以下、単語ベクトルと称する)を行ベクトルとした2階テンソルの行列(以下、単語行列と称する)を生成する。例えば、形態素解析部114は、形態素解析によってタイトルを10個の単語に分割した場合、10個の単語ベクトルのそれぞれを行ベクトルとした単語行列(10行×n列の行列:nは単語ベクトルの次元数)を生成する。形態素解析部114は、例えば、分散表現によってウェブIDを示す100次元のベクトルを生成する。
The
次に、行動推定部116は、分類器情報132を参照して、分類器200を構築(生成)し、形態素解析部114によって生成された単語行列を、構築した分類器200に入力する(S104)。以下、分類器200が、ユーザが行う所定の行動のうち、「商品を購入するか」について出力するものである場合について説明する。
Next, the
なお、分類器200が、ユーザが行う所定の行動のうち、「サービスに入会するか」について出力するものである場合、以下の説明のうち、「商品を購入(する/しない)」を「サービスに入会(する/しない)」に読み替えればよく、分類器200が、ユーザが行う所定の行動のうち、「不正な決済が行われたか」について出力するものである場合、以下の説明のうち、「商品を購入(する/しない)」を「不正な決済が(行われた/行われていない)」に読み替えればよい。
It should be noted that if the
分類器情報132は、分類器を定義した情報(プログラムまたはデータ構造)である。分類器200は、例えば、コンボリューショナルニューラルネットワーク(Convolutional Neural Network:CNN)や、リカレントネットワーク(Reccurent Neural Network:RNN)等の種々のニューラルネットワークによって実現される。
分類器情報132には、例えば、各ニューラルネットワークを構成する入力層、一以上の隠れ層(中間層)、出力層のそれぞれに含まれるニューロン(ユニット)が互いにどのように結合されるのかという結合情報や、結合されたニューロン間で入出力されるデータに付与される結合係数等の各種情報が含まれる。結合情報とは、例えば、各層に含まれるニューロン数や、各ニューロンの結合先のニューロンの種類を指定する情報、各ニューロンを実現する活性化関数、隠れ層のニューロン間に設けられたゲート等の情報を含む。ニューロンを実現する活性化関数は、例えば、正規化線形関数(ReLU関数)であってもよいし、シグモイド関数や、ステップ関数、その他の関数等であってもよい。ゲートは、例えば、活性化関数によって返される値(例えば1または0)に応じて、ニューロン間で伝達されるデータを選択的に通過させたり、重み付けたりする。結合係数は、活性化関数のパラメータであり、例えば、ニューラルネットワークの隠れ層において、ある層のニューロンから、より深い層のニューロンにデータが出力される際に、出力データに対して付与される重みを含む。また、結合係数は、各層の固有のバイアス成分等を含んでもよい。
The
図5は、分類器200の一例を示す図である。第1実施形態における分類器200は、例えば、第1CNN210と、第2CNN220と、FCNN(Fully-Connected Neural Network)230と、RNN240と、LU250によって実現される。
FIG. 5 is a diagram showing an example of the
第1CNN210および第2CNN220は、単語行列が入力されると、次元数が所定数のベクトルを出力するように学習されたコンボリューショナルニューラルネットワークである。
The
例えば、単語行列を、各要素値が画素値に置き換わった画像とした場合、第1CNN210および第2CNN220は、入力された単語行列に相当する画像と所定のフィルタとを畳み込み(内積を求め)、所定のフィルタと重なる複数の画素を含む画像領域を、一つの単位領域に圧縮する。この単位領域には、畳み込みにより得られた単変量値が特徴量として対応付けられている。第1CNN210および第2CNN220は、画像上で所定のフィルタをシフト移動させながら畳み込み処理を繰り返し、複数の単位領域により形成されたコンボリューショナルレイヤと呼ばれる畳み込みの特徴量を画素値とした特徴画像を生成する。第1CNN210および第2CNN220は、各特徴画像のサイズ(次元数)をプーリング(例えばGlobal Average Pooling)等によって圧縮し、この結果を出力する。圧縮した特徴画像のそれぞれには、単変量の特徴量が対応付けられているため、畳み込み処理の回数分だけ、畳み込みの特徴量を要素としてもつ多次元ベクトル(1階テンソル)が出力される。
For example, if the word matrix is an image in which each element value is replaced with a pixel value, the
例えば、行動推定部116は、閲覧時間から得られた単語行列を第1CNN210に入力し、ウェブIDから得られた単語行列を第2CNN220に入力する。これによって、各CNNは、入力されたデータを所定の次元数のベクトルに変換してFCNN230に出力する。
For example, the
FCNN230は、各層のユニットのそれぞれが、より階層の深い次の層のユニットのそれぞれと接続されたニューラルネットワークである。なお、FCNN230は、中間層がない入力層のユニットのそれぞれと出力層のユニットのそれぞれとが互いに接続された2つの層であってもよい。例えば、FCNN230は、第1CNN210から出力されたベクトルの次元数が11、第2CNN220から出力されたベクトルの次元数が100である場合、それらの全てのベクトルの次元数の総和である111次元の一つのベクトルを出力する。
The
RNN240は、例えば、ネットワークの中間層がLSTM(Long short-term memory)であるRNNであり、1階テンソルであるベクトルが入力されると、そのベクトルの元になったウェブID、及び閲覧時間によって示されるユーザが商品を購入することの確からしさ(尤もらしさ)を表すスコアをレコード毎に出力するように学習されたニューラルネットワークである。例えば、LSTMは、重みと状態変数との内積を計算する。数式(1)は、LSTMのゲートおよびニューロンの計算式を表している。状態変数とは、各ゲートによって求められるベクトルである。
tは、RNN240によって繰り返し行われる再帰処理の処理周期(処理時刻)を表しており、xtは、処理周期tにおいてFCNN230から入力されるベクトル(以下、入力ベクトル)を表し、htは、処理周期tにおいてRNN240により出力されるベクトル(以下、出力ベクトル)を表している。再帰処理とは、過去の処理周期で求めた出力ベクトルを、今回の処理周期での出力ベクトルの導出に利用することである。
t represents the processing cycle (processing time) of the recursive processing repeatedly performed by the
itは、LSTMに含まれるインプットゲートによって出力されるベクトル(以下、インプットゲートベクトル)を表しており、σは、ゲートの活性化関数がシグモイド関数であることを表しており、Wiは、入力ベクトルxtを線形変換するための重みを表しており、Riは、前回の処理周期t-1の出力ベクトルht-1を線形変換するための重みを表しており、Qiは、メモリーセルに記憶された前回の処理周期t-1の内部演算ベクトルct-1を線形変換するための重みを表しており、biは、インプットゲートのバイアス成分を表している。メモリーセルとは、一時的に内部演算ベクトルcを記憶させておくための記憶領域(LSTMブロック)である。 i t represents the vector output by the input gate included in the LSTM (hereinafter, input gate vector), σ represents that the activation function of the gate is a sigmoid function, and Wi is represents the weight for linearly transforming the input vector x t , R i represents the weight for linearly transforming the output vector h t−1 in the previous processing cycle t−1, and Q i is It represents the weight for linearly transforming the internal operation vector ct-1 of the previous processing cycle t- 1 stored in the memory cell, and bi represents the bias component of the input gate. A memory cell is a storage area (LSTM block) for temporarily storing an internal operation vector c.
例えば、RNN240は、重みWiと入力ベクトルxtとの内積値と、重みRiと前回の出力ベクトルht-1との内積値と、重みQiと前回の内部演算ベクトルct-1とのアダマール積(要素毎の積)と、バイアス成分biとの和を変数としたシグモイド関数σを解くことで、処理周期tのインプットゲートベクトルitを導出する。
For example, the
ftは、LSTMに含まれるフォーゲットゲートによって出力されるベクトル(以下、フォーゲットゲートベクトル)を表しており、Wfは、重みWiと同様に、入力ベクトルxtを線形変換するための重みを表しており、Rfは、重みRiと同様に、前回の処理周期t-1の出力ベクトルht-1を線形変換するための重みを表しており、Qfは、重みQiと同様に、メモリーセルに記憶された前回の処理周期t-1の内部演算ベクトルct-1を線形変換するための重みを表しており、bfは、フォーゲットゲートのバイアス成分を表している。 f t represents the vector output by the forget gate included in the LSTM (hereinafter referred to as the forget gate vector), and W f is the weight W i for linearly transforming the input vector x t . R f represents a weight for linearly transforming the output vector h t−1 of the previous processing cycle t−1, similar to the weight R i , and Q f represents the weight Q i , represents the weight for linearly transforming the internal operation vector c t-1 of the previous processing cycle t- 1 stored in the memory cell, and b f represents the bias component of the forget gate. there is
例えば、RNN240は、重みWfと入力ベクトルxtとの内積値と、重みRfと前回の出力ベクトルht-1との内積値と、重みQfと前回の内部演算ベクトルct-1とのアダマール積と、バイアス成分bfとの和を変数としたシグモイド関数σを解くことで、処理周期tのフォーゲットゲートベクトルftを導出する。
For example, the
ctは、LSTMに含まれるメモリーセルに記憶させる内部演算ベクトルを表している。 ct represents an internal operation vector stored in a memory cell included in the LSTM.
例えば、RNN240は、処理周期tのフォーゲットゲートベクトルftおよび後述するベクトルztのアダマール積と、処理周期t-1の内部演算ベクトルct‐1および処理周期tのフォーゲットゲートベクトルftのアダマール積との和を、処理周期tの内部演算ベクトルctとして導出する。
For example, the
ztは、重みWzと入力ベクトルxtとの内積値と、重みRzと前回の出力ベクトルht-1との内積値と、バイアス成分bzとの和を変数としたハイパポリックタンジェント関数tanhを解くことで導出される。Wzは、重みWiやWfと同様に、入力ベクトルxtを線形変換するための重みを表しており、Rfは、重みRiやRfと同様に、前回の処理周期t-1の出力ベクトルht-1を線形変換するための重みを表しており、bzは、メモリーセルのバイアス成分を表している。 z t is a hyperpolic whose variable is the sum of the inner product value of the weight W z and the input vector x t , the inner product value of the weight R z and the previous output vector h t−1 , and the bias component b z It is derived by solving the tangent function tanh. W z represents a weight for linearly transforming the input vector x t like the weights W i and W f , and R f represents the previous processing cycle t− The weights for linearly transforming the output vector h t−1 of 1 are represented, and b z represents the bias component of the memory cell.
otは、LSTMに含まれるアウトプットゲートによって出力されるベクトル(以下、アウトプットゲートベクトル)を表しており、Woは、重みWi等と同様に、入力ベクトルxtを線形変換するための重みを表しており、Roは、重みRi等と同様に、前回の処理周期t-1の出力ベクトルht-1を線形変換するための重みを表しており、Qoは、メモリーセルに記憶された今回の処理周期tの内部演算ベクトルctを線形変換するための重みを表しており、boは、アウトプットゲートのバイアス成分を表している。 o t represents the vector output by the output gate included in the LSTM (hereinafter referred to as the output gate vector), and Wo is for linearly transforming the input vector x t in the same way as the weight W i etc. R o represents the weight for linearly transforming the output vector h t−1 of the previous processing cycle t−1, similar to the weight R i etc., and Q o represents the memory It represents the weight for linearly transforming the internal operation vector ct of the current processing cycle t stored in the cell, and bo represents the bias component of the output gate.
例えば、RNN240は、重みWoと入力ベクトルxtとの内積値と、重みRoと前回の出力ベクトルht-1との内積値と、重みQoと今回の内部演算ベクトルctとのアダマール積と、バイアス成分boとの和を変数としたシグモイド関数σを解くことで、処理周期tのアウトプットゲートベクトルotを導出する。
For example, the
RNN240は、アウトプットゲートベクトルotを導出すると、アウトプットゲートベクトルotと、内部演算ベクトルctを変数としたハイパポリックタンジェント関数tanhの解とのアダマール積を、処理周期tの出力ベクトルhtとして導出する。
After deriving the output gate vector ot , the
出力ベクトルhtの各要素値は、レコード毎の行動(この一例では、ユーザが商品を購入すること)の確からしさのスコアを表している。例えば、ht={e1,e2}であった場合、要素e1は、ユーザが商品を購入することの確からしさを示すスコア(確率)を表し、要素e2は、ユーザが商品を購入しないことの確からしさを示すスコアを表している。RNN240は、上述した数式に基づく計算を繰り返すことで、出力ベクトルを繰り返し導出する。
Each element value of the output vector ht represents the likelihood score of the action (in this example, the user purchasing a product) for each record. For example, when h t ={e1, e2}, the element e1 represents a score (probability) indicating the probability that the user will purchase the product, and the element e2 represents the probability that the user will not purchase the product. It represents a score that indicates certainty. The
図6は、時間経過に応じたRNN240の処理内容を並列に展開した図である。例えば、FCNN230から入力ベクトルxt1が入力された初回の処理周期t1では、RNN240は、出力ベクトルht1を出力する。初回処理時t1の出力ベクトルht1は、アクセスログのうち最初のレコードに係る、ユーザが商品を購入することの確からしさを示すスコアを要素として含んでおり、各要素は、例えば、各要素におけるユーザが商品を購入することの確からしさを示すスコアである。
FIG. 6 is a parallel development diagram of the processing contents of the
次の処理周期t2では、RNN240は、初回の処理周期t1に入力された入力ベクトルxt1と、前回の処理周期t1の出力ベクトルht1とに基づいて、出力ベクトルht2を出力する。処理周期t2の出力ベクトルht2は、2番目のレコードに係るユーザが商品を購入することの確からしさを示すスコアを要素として含んでいる。
In the next processing cycle t2, the
次の処理周期t3では、RNN240は、初回の処理周期t1に入力された入力ベクトルxt1と、前回の処理周期t2の出力ベクトルht2とに基づいて、出力ベクトルht3を出力する。処理周期t3の出力ベクトルht3は、3番目のレコードに係るユーザが商品を購入することの確からしさを示すスコアを要素として含んでいる。
In the next processing cycle t3, the
このように、RNN240は、再帰処理を繰り返すことで、より多くのレコードのスコアを要素とする出力ベクトルを導出する。なお、RNN240は、セッションの最後のレコードのスコアを要素とする出力ベクトルを導出するまで、再帰的に出力ベクトルを導出することを繰り返すものとする。例えば、RNN240の学習時に、セッションの最後のレコードに対して所定の付加的情報(以下、エンドラベルと称する)が付与された商品データが利用された場合、RNN240は、エンドラベルが付与されたレコードのスコアを要素とする出力ベクトルを導出するまで再帰処理を繰り返す。これによって、例えば、ある2つのアクセスログが、いずれもユーザが商品を購入するアクセスログであって、それらのアクセスログには、互いに数が異なるレコードが含まれる場合であっても、最後のレコードまで、アクセスログに含まれるレコードの数と同じ回数だけ再帰処理を繰り返すため、RNN240の再帰処理の回数(図6中のk)というハイパーパラメータを調整せずとも、各レコードの種類に応じて再帰処理の回数を動的に変更しながらスコアを求めることができる。
Thus, the
LU250は、RNN240から出力されたベクトルに対して、線形変換行列を乗算することで、2次元のベクトルに変換(次元を圧縮)し、それを出力層に出力する。
The
図5に戻り、次に、行動推定部116は、分類器200から分類結果を取得し、その分類結果に基づいてユーザが所定の行動を行うか否かを推定する(S106)。カテゴリの分類結果には、RNN240が再帰処理毎に出力した出力ベクトルが含まれており、その出力ベクトルには、行動の確からしさのスコアの結果が要素として含まれている。行動推定部116は、例えば、ユーザが商品を購入することの確からしさを示すスコアと、ユーザが商品を購入しないことの確からしさを示すスコアとのうち、スコアが大きいほうの行動をユーザが行う、或いは行わないと推定する。
Returning to FIG. 5, next, the
決定部118は、行動推定部116の推定結果に基づいて、ユーザに提供する情報を提供すると決定する(S108)。決定部118は、例えば、行動推定部116の推定結果が、ユーザが商品を購入しないと推定した場合、ユーザの商品の購入を促すように、商品の割引や値引き等の商品の購入に係るクーポン(特典)情報をユーザに提供すると決定する。この場合、決定部118は、推定の元になったアクセスログに係るユーザ(の端末装置10)にクーポン情報を送信するようにサービス提供装置20に指示する。これにより、情報処理装置100は、ユーザが商品を購入しないことが推定される場合であっても、ユーザに商品の購入を促すことができる。
The
なお、決定部118は、例えば、行動推定部116の推定結果に基づいて、ユーザが商品を購入すると推定した場合、ユーザが購入する商品の割引や値引き等に係るクーポンを示す情報をユーザに出力するものであってもよい。これにより、情報処理装置100は、商品を購入してくれるユーザに対して特典を付与することにより、今後もサービス提供装置20が提供するサービスを介して商品を購入するように促すことができる。
Note that, for example, when determining that the user will purchase a product based on the estimation result of the
[不正な決済が行われた場合の決定部118の処理]
また、分類器200が、ユーザが行う所定の行動のうち、「サービスに入会するか」について出力するものであり、行動推定部116が、分類器200から分類結果を取得し、その分類結果に基づいてユーザがサービスに入会すると推定する場合、決定部118は、サービスへの入会を促す案内情報をユーザに対して出力する。具体的には、決定部118は、推定の元になったアクセスログに係るユーザ(の端末装置10)に案内情報を提供すると決定し、案内情報を送信するようにサービス提供装置20に指示する。これにより、情報処理装置100は、ユーザがサービスに入会することが推定される場合に、ユーザに適切にサービスの案内をすることができる。
[Processing of
In addition, the
[サービスに入会する場合の決定部118の処理]
また、分類器200が、ユーザが行う所定の行動のうち、「不正な決済が行われたか」について出力するものであり、行動推定部116が、分類器200から分類結果を取得し、その分類結果に基づいてユーザによって不正な決済が行われたと推定する場合、決定部118は、不正な決済によってユーザに購入された商品に係る決済処理を中止すると決定する。この場合、決定部118は、決済処理装置30に対して当該決済処理の中止を指示する情報を送信する。決済処理装置30は、決定部118から受信した情報に基づいて、不正な決済によってユーザに購入された商品に係る決済処理を中止する。これにより、情報処理装置100は、不正な決済によってユーザが商品を購入したことが推定される場合に、当該購入に係る決済処理を中止することができる。
[Processing of
In addition, the
[アクセスログの取得タイミング]
また、上述では、取得部112が、セッション毎のアクセスログを取得する場合について説明したが、これに限られない。取得部112は、例えば、現在、サービス提供装置20が提供するウェブページを閲覧しているアクセスログを、セッションが完結するよりも前に、リアルタイムに取得するものであってもよい。これにより、情報処理装置100は、商品の購入を検討しながらウェブページを閲覧するユーザに対して、即座にクーポンを提供することができ、サービスへの入会を検討しながらウェブページを閲覧するユーザに対して、即座に案内情報を提供することができ、不正な決済で商品を購入しようとしているユーザの決済を抑制したりすることができる。
[Access log acquisition timing]
Also, in the above description, a case where the
[行動推定部116の処理の他の例]
また、上述した説明では、行動推定部116が、分類器200の分類結果を参照し、ユーザが商品を購入することの確からしさを示すスコアと、ユーザが商品を購入しないことの確からしさを示すスコアとのうち、スコアが大きいほうの行動をユーザが行う、或いは行わないと推定したがこれに限られない。例えば、行動推定部116は、分類器200の分類結果として示されるスコアの全部が、或いは所定数以上のスコアが閾値未満である場合、RNN240に、一つ前の再帰処理を再び行わせ、レコードのスコアが閾値未満のレコードの出力ベクトルをあらためて導出させてよい。例えば、RNN240が、処理周期t1において導出した出力ベクトルht1の複数の要素eのうち、最も値が大きい要素だけを残した出力ベクトルht1を基に処理周期t2において出力ベクトルht2を導出したとする。このような場合に、処理周期t2における出力ベクトルht2の要素eがいずれも閾値未満であった場合、すなわち、2番目のレコードのスコアがいずれも閾値未満であった場合、行動推定部116は、RNN240に、処理周期t1の再帰処理を再び行わせる。この際、行動推定部116は、処理周期t1において導出した出力ベクトルht1の複数の要素eのうち、最も値が大きい要素を残すのではなく、例えば、2番目に値が大きい要素、或いは3番目や4番目に値が大きい要素を残した出力ベクトルht1を基にして、RNN240に出力ベクトルht2を導出させる。
[Another example of processing of the action estimation unit 116]
Further, in the above description, the
このように、最初のレコードよりも後に閲覧されたウェブページに係るレコードの分類結果が曖昧である場合、最初のレコードの分類が間違っている蓋然性が高いと判断して、最初のレコードのスコアのうち、二番目以降に確からしいレコードのスコアを基に、以降のレコードのスコアを再計算させる。これによって、最初のレコードの分類を間違ったことにより、それ以降の全てのレコードの分類を間違ってしまうという再帰処理特有の事象が発生するのを抑制することができる。 In this way, when the classification results of records related to web pages viewed after the first record are ambiguous, it is determined that there is a high probability that the classification of the first record is wrong, and the score of the first record is reduced. Based on the scores of the second and subsequent most likely records, the scores of subsequent records are recalculated. As a result, it is possible to suppress the occurrence of an event peculiar to recursive processing, in which all subsequent records are misclassified due to the misclassification of the first record.
[学習時の処理フロー]
以下、第1実施形態における情報処理装置100の学習時の一連の流れをフローチャートに即して説明する。図7は、第1実施形態における情報処理装置100による学習時の一連の処理の流れを示すフローチャートである。
[Processing flow during learning]
A series of flow during learning of the
まず、学習処理部120は、記憶部130に格納された教師データ134から、あるアクセスログを選択する(S200)。教師データ134は、予め、「ユーザが商品を購入したこと」、「ユーザが商品を購入しなかったこと」、「ユーザがサービスに入会したこと」、「ユーザがサービスに入会しなかったこと」、「ユーザによって不正決済が行われたこと」、「ユーザによって不正決済が行われなかったこと」等の各種タグが教師ラベルとして対応付けられたアクセスログである。
First, the
次に、学習処理部120は、教師データ134からアクセスログを選択すると、そのアクセスログを分類器200に入力する(S202)。
Next, when the
次に、学習処理部120は、アクセスログを入力した分類器200から出力結果、すなわち最尤タグベクトルを取得する(S204)。
Next, the
次に、学習処理部120は、最尤タグベクトルによって示されるタグと、分類器200に入力したアクセスログに教師ラベルとした対応付けられたタグとを比較し、双方のタグの組み合わせが一致するか否かを判定する(S206)。
Next, the
学習処理部120は、タグの組み合わせが一致しないと判定した場合、誤差逆伝番等の勾配法に基づいて、分類器200のパラメータを学習する(S208)。例えば、学習処理部120は、教師ラベルとした対応付けられたタグの組み合わせの尤度を最大値とし、その最大値から、最尤タグベクトルによって示されるタグの組み合わせの尤度を減算した差分が小さくなるように、分類器200のパラメータを学習する。これによって、本フローチャートの処理が終了する。
When the
以上説明した第1実施形態の情報処理装置100によれば、アクセスログからユーザの所定の行動を推定し、推定した行動に応じた情報を出力することにより、ユーザに期待する行動(商品の購入やサービスの入会)を促したり、不正な決済による商品の購入を抑制したりすることができる。
According to the
また、上述した第1実施形態によれば、教師ラベルとして正解となるカテゴリと共に、含まれるレコードの数が異なるアクセスログを学習データとして分類器200を学習させるため、全てのレコードについて再帰処理を繰り返すため、RNN240の再帰処理の回数というハイパーパラメータを調整せずとも、各アクセスログのレコードの数に応じて再帰処理の回数を動的に変更しながらスコアを求めることができ、更に、事前にアクセスログのレコードの数がわからなくとも、各レコードを分類することができる。
Further, according to the above-described first embodiment, the
<第2実施形態>
以下、第2実施形態について説明する。上述した第1実施形態では、RNN240が、ネットワークの中間層がLSTMであるものについて説明した。これに対して、第2実施形態では、RNN240が、コンボリューショナルニューラルネットワークと、ネットワークの中間層がLSTMのRNNとを組み合わせたニューラルネットワーク(以下、CONVLSTMと称する)である点で上述した第1から第3実施形態と相違する。以下、第1から第3実施形態との相違点を中心に説明し、第1から第3実施形態と共通する点については説明を省略する。なお、第2実施形態の説明において、第1から第3実施形態と同じ部分については同一符号を付して説明する。
<Second embodiment>
A second embodiment will be described below. In the above-described first embodiment, the
第2実施形態では、例えば、第1CNN210、及び第2CNN220のそれぞれについてプーリング処理が省略されたり、FCNN230が省略されたりすることで、分類器200の上段に設けられた各種ニューラルネットワーク等から、RNN240に3階テンソルが入力される。
In the second embodiment, for example, by omitting the pooling process for each of the
第2実施形態におけるRNN240は、例えば、コンボリューショナルニューラルネットワークと、ネットワークの中間層がLSTMであるRNNとの組み合わせたニューラルネットワーク(以下、CONVLSTMと称する)であり、3階テンソルが入力されると、そのテンソルの元になったタイトルや概要、画像に対応する商品の分類先とするカテゴリの確からしさ(尤もらしさ)を表すスコアをレコード毎に出力するように学習されたニューラルネットワークである。CONVLSTMは、上述したLSTMの各ゲートの計算式において、重みと状態変数との内積計算が畳み込み計算に変更されたものである。数式(2)は、CONVLSTMのゲートおよびニューロンの計算式を表している。
The
第2実施形態におけるxtは、処理周期tにおいて入力される3階テンソル(以下、入力テンソル)を表し、htは、処理周期tにおいてRNN240により出力される3階テンソル(以下、出力テンソル)を表している。
x t in the second embodiment represents a third-order tensor (hereinafter, input tensor) input in processing cycle t, and h t represents a third-order tensor (hereinafter, output tensor) output by
例えば、第2実施形態におけるRNN240は、重みWiと入力テンソルxtとの畳み込み値と、重みRiと前回の出力テンソルht-1との畳み込み値と、重みQiと前回の内部演算テンソル(3階テンソル)ct-1とのアダマール積(要素毎の積)と、バイアス成分biとの和を変数としたシグモイド関数σを解くことで、処理周期tのインプットゲートテンソル(3階テンソル)itを導出する。
For example, the
また、RNN240は、重みWfと入力テンソルxtとの畳み込み値と、重みRfと前回の出力ベクトルht-1との畳み込み値と、重みQfと前回の内部演算テンソルct-1とのアダマール積と、バイアス成分bfとの和を変数としたシグモイド関数σを解くことで、処理周期tのフォーゲットゲートテンソルftを導出する。
In addition, the
また、RNN240は、処理周期tのフォーゲットゲートテンソルftおよびテンソルztのアダマール積と、処理周期t-1の内部演算テンソルct‐1および処理周期tのフォーゲットゲートテンソルftのアダマール積との和を、処理周期tの内部演算テンソルctとして導出する。
In addition, the
ztは、重みWzと入力テンソルxtとの畳み込み値と、重みRzと前回の出力テンソルht-1との畳み込み値と、バイアス成分bzとの和を変数としたハイパポリックタンジェント関数tanhを解くことで導出される。 z t is a hyperpolic whose variable is the sum of the convolution value of the weight W z and the input tensor x t , the convolution value of the weight R z and the previous output tensor h t−1 , and the bias component b z It is derived by solving the tangent function tanh.
また、RNN240は、重みWoと入力テンソルxtとの畳み込み値と、重みRoと前回の出力テンソルht-1との畳み込み値と、重みQoと今回の内部演算テンソルctとのアダマール積と、バイアス成分boとの和を変数としたシグモイド関数σを解くことで、処理周期tのアウトプットゲートテンソル(3階テンソル)otを導出する。
In addition, the
RNN240は、アウトプットゲートテンソルotを導出すると、アウトプットゲートテンソルotと、内部演算テンソルctを変数としたハイパポリックタンジェント関数tanhの解とのアダマール積を、処理周期tの出力テンソルhtとして導出する。
After deriving the output gate tensor o t , the
出力テンソルhtの各要素値は、上述した実施形態の出力ベクトルと同様に、各レコードのスコアを表している。RNN240は、上述した数式に基づく計算を繰り返すことで、出力テンソルを繰り返し導出する。
Each element value of the output tensor ht represents the score of each record, similar to the output vector of the embodiment described above. The
以上説明した第2実施形態によれば、分類器200のRNN240を、中間層がCONVLSTMであるRNNとするため、上述した第1実施形態と比べて、更に適切なユーザの所定の行動に分類することができ、その結果、決定部118は、より適切な情報を提供すると決定することができる。
According to the second embodiment described above, since the
<ハードウェア構成>
上述した実施形態の情報処理装置100は、例えば、図8に示すようなハードウェア構成により実現される。図8は、実施形態の情報処理装置100のハードウェア構成の一例を示す図である。
<Hardware configuration>
The
情報処理装置100は、NIC100-1、CPU100-2、RAM100-3、ROM100-4、フラッシュメモリやHDD等の二次記憶装置100-5、およびドライブ装置100-6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置100-6には、光ディスク等の可搬型記憶媒体が装着される。二次記憶装置100-5、またはドライブ装置100-6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)等によってRAM100-3に展開され、CPU100-2によって実行されることで、制御部110が実現される。制御部110が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。
The
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 As described above, the mode for carrying out the present invention has been described using the embodiments, but the present invention is not limited to such embodiments at all, and various modifications and replacements can be made without departing from the scope of the present invention. can be added.
1…情報処理システム、10…端末装置、20…サービス提供装置、30…決済処理装置、100…情報処理装置、100-5…二次記憶装置、100-6…ドライブ装置、102…通信部、110…制御部、112…取得部、114…形態素解析部、116…行動推定部、118…決定部、120…学習処理部、130…記憶部、132…分類器情報、134…教師データ、200…分類器
Claims (8)
アクセスログにおける所定の行動の有無を教師データとして、入力されたアクセスログにおいて前記所定の行動が行われるかを出力するように学習された分類器に、前記取得されたアクセスログを入力することで得られる出力結果に基づいて、前記取得部により取得された前記アクセスログに示されるウェブページを閲覧した閲覧者に提供すべき情報を決定する決定部と、
を備え、
前記アクセスログには、前記閲覧者が閲覧したウェブページの識別情報と、前記ウェブページをユーザが閲覧した時間の長さである閲覧時間とが、互いに対応付けられたレコードが少なくとも含まれるものであり、
前記分類器は、RNN(Recurrent Neural Network:回帰型ニューラルネットワーク)により、前記ウェブページにアクセスするセッションの最後のレコードに対して所定のエンドラベルが付与されたデータを用いて学習されたものであり、1以上のアクセスログの入力に対してそれぞれ前記エンドラベルが付与されたレコードのスコアを出力するまで再帰処理を繰り返す、
情報処理装置。 an acquisition unit that acquires an access log to a web page via a network;
By inputting the obtained access log to a classifier trained to output whether or not the predetermined action is performed in the input access log, using the presence or absence of the predetermined action in the access log as teacher data. a determination unit that determines information to be provided to a viewer who viewed the web page indicated in the access log acquired by the acquisition unit, based on the obtained output result;
with
The access log includes at least a record in which identification information of the web page viewed by the viewer and viewing time, which is the length of time the user viewed the web page, are associated with each other. can be,
The classifier is trained by an RNN (Recurrent Neural Network) using data in which a predetermined end label is assigned to the last record of a session of accessing the web page. , repeating recursive processing until the score of the record to which the end label is assigned is output for each of the inputs of one or more access logs;
Information processing equipment.
前記決定部は、前記分類器の出力結果に基づいて、前記閲覧者に対して商品またはサービスの購入に係る特典を前記提供するべき情報として決定する、
請求項1に記載の情報処理装置。 the predetermined action includes purchasing a product or service;
The decision unit decides, based on the output result of the classifier, a benefit related to the purchase of a product or service to the viewer as the information to be provided;
The information processing device according to claim 1 .
前記決定部は、前記分類器の出力結果に基づいて、前記閲覧者に対してサービスへの入会を促す案内情報を前記提供すべき情報として決定する、
請求項1又は請求項2に記載の情報処理装置。 the predetermined action includes joining a service;
The decision unit decides, as the information to be provided, guide information that prompts the viewer to join the service, based on the output result of the classifier.
The information processing apparatus according to claim 1 or 2.
アクセスログにおける商取引での不正決済の有無を教師データとして、入力されたアクセスログにおいて前記不正決済が行われたかを出力するように学習された分類器に、前記取得されたアクセスログを入力することで得られる出力結果に基づいて、前記取得部によって取得された前記アクセスログに示されるウェブページを閲覧した閲覧者によって前記不正決済が行われたか否かを推定し、前記不正決済が行われたと推定した場合、前記閲覧者による購入に係る処理を実行する外部装置に対して、処理の中止を指示することを決定する決定部と、
を備え、
前記アクセスログには、前記閲覧者が閲覧したウェブページの識別情報と、前記ウェブページをユーザが閲覧した時間の長さである閲覧時間とが、互いに対応付けられたレコードが少なくとも含まれるものであり、
前記分類器は、RNN(Recurrent Neural Network:回帰型ニューラルネットワーク)により、前記ウェブページにアクセスするセッションの最後のレコードに対して所定のエンドラベルが付与されたデータを用いて学習されたものであり、1以上のアクセスログの入力に対してそれぞれ前記エンドラベルが付与されたレコードのスコアを出力するまで再帰処理を繰り返す、
情報処理装置。 an acquisition unit that acquires an access log to a web page via a network;
Inputting the acquired access log to a classifier trained to output whether or not the fraudulent payment has been made in the input access log, using the presence or absence of fraudulent payment in the commercial transaction in the access log as training data. Based on the output result obtained in , it is estimated whether or not the fraudulent payment has been made by the viewer who viewed the web page indicated in the access log acquired by the acquisition unit, and it is determined that the fraudulent payment has been made. a determination unit that determines, when estimated, to instruct an external device that executes a process related to purchase by the viewer to stop the process;
with
The access log includes at least a record in which identification information of the web page viewed by the viewer and viewing time, which is the length of time the user viewed the web page, are associated with each other. can be,
The classifier is trained by an RNN (Recurrent Neural Network) using data in which a predetermined end label is assigned to the last record of a session of accessing the web page. , repeating recursive processing until the score of the record to which the end label is assigned is output for each of the inputs of one or more access logs;
Information processing equipment.
ネットワークを介したウェブページへのアクセスログを取得し、
アクセスログにおける所定の行動の有無を教師データとして、入力されたアクセスログにおいて前記所定の行動が行われるかを出力するように学習された分類器に、前記取得されたアクセスログを入力することで得られる出力結果に基づいて、取得された前記アクセスログに示されるウェブページを閲覧した閲覧者に提供すべき情報を決定し、
前記アクセスログには、前記閲覧者が閲覧したウェブページの識別情報と、前記ウェブページをユーザが閲覧した時間の長さである閲覧時間とが、互いに対応付けられたレコードが少なくとも含まれるものであり、
前記分類器は、RNN(Recurrent Neural Network:回帰型ニューラルネットワーク)により、前記ウェブページにアクセスするセッションの最後のレコードに対して所定のエンドラベルが付与されたデータを用いて学習されたものであり、1以上のアクセスログの入力に対してそれぞれ前記エンドラベルが付与されたレコードのスコアを出力するまで再帰処理を繰り返す、
情報処理方法。 the computer
Acquire access logs to web pages through the network,
By inputting the obtained access log to a classifier trained to output whether or not the predetermined action is performed in the input access log, using the presence or absence of the predetermined action in the access log as teacher data. Based on the obtained output result, determine information to be provided to the viewer who viewed the web page indicated in the acquired access log;
The access log includes at least a record in which identification information of the web page viewed by the viewer and viewing time, which is the length of time the user viewed the web page, are associated with each other. can be,
The classifier is trained by an RNN (Recurrent Neural Network) using data in which a predetermined end label is assigned to the last record of a session of accessing the web page. , repeating recursive processing until the score of the record to which the end label is assigned is output for each of the inputs of one or more access logs;
Information processing methods.
ネットワークを介したウェブページへのアクセスログを取得し、
アクセスログにおける商取引での不正決済の有無を教師データとして、入力されたアクセスログにおいて前記不正決済が行われたかを出力するように学習された分類器に、前記取得されたアクセスログを入力することで得られる出力結果に基づいて、取得された前記アクセスログに示されるウェブページを閲覧した閲覧者によって前記不正決済が行われたか否かを推定し、
前記不正決済が行われたと推定した場合、前記閲覧者による購入に係る処理を実行する外部装置に対して、処理の中止を指示することを決定し、
前記アクセスログには、前記閲覧者が閲覧したウェブページの識別情報と、前記ウェブページをユーザが閲覧した時間の長さである閲覧時間とが、互いに対応付けられたレコードが少なくとも含まれるものであり、
前記分類器は、RNN(Recurrent Neural Network:回帰型ニューラルネットワーク)により、前記ウェブページにアクセスするセッションの最後のレコードに対して所定のエンドラベルが付与されたデータを用いて学習されたものであり、1以上のアクセスログの入力に対してそれぞれ前記エンドラベルが付与されたレコードのスコアを出力するまで再帰処理を繰り返す、
情報処理方法。 the computer
Acquire access logs to web pages through the network,
Inputting the acquired access log to a classifier trained to output whether or not the fraudulent payment has been made in the input access log, using the presence or absence of fraudulent payment in the commercial transaction in the access log as training data. based on the output result obtained in , estimating whether the unauthorized payment was made by the viewer who viewed the web page indicated in the acquired access log;
deciding to instruct the external device that executes the processing related to the purchase by the viewer to stop the processing when it is estimated that the fraudulent payment has been made;
The access log includes at least a record in which identification information of the web page viewed by the viewer and viewing time, which is the length of time the user viewed the web page, are associated with each other. can be,
The classifier is trained by an RNN (Recurrent Neural Network) using data in which a predetermined end label is assigned to the last record of a session of accessing the web page. , repeating recursive processing until the score of the record to which the end label is assigned is output for each of the inputs of one or more access logs;
Information processing methods.
ネットワークを介したウェブページへのアクセスログを取得させ、
アクセスログにおける所定の行動の有無を教師データとして、入力されたアクセスログにおいて前記所定の行動が行われるかを出力するように学習された分類器に、前記取得されたアクセスログを入力することで得られる出力結果に基づいて、取得された前記アクセスログに示されるウェブページを閲覧した閲覧者に提供すべき情報を決定させ、
前記アクセスログには、前記閲覧者が閲覧したウェブページの識別情報と、前記ウェブページをユーザが閲覧した時間の長さである閲覧時間とが、互いに対応付けられたレコードが少なくとも含まれるものであり、
前記分類器は、RNN(Recurrent Neural Network:回帰型ニューラルネットワーク)により、前記ウェブページにアクセスするセッションの最後のレコードに対して所定のエンドラベルが付与されたデータを用いて学習されたものであり、1以上のアクセスログの入力に対してそれぞれ前記エンドラベルが付与されたレコードのスコアを出力するまで再帰処理を繰り返す、
プログラム。 to the computer,
Acquire the access log to the web page through the network,
By inputting the obtained access log to a classifier trained to output whether or not the predetermined action is performed in the input access log, using the presence or absence of the predetermined action in the access log as teacher data. determining information to be provided to a viewer who viewed the web page indicated in the obtained access log, based on the obtained output result;
The access log includes at least a record in which identification information of the web page viewed by the viewer and viewing time, which is the length of time the user viewed the web page, are associated with each other. can be,
The classifier is trained by an RNN (Recurrent Neural Network) using data in which a predetermined end label is assigned to the last record of a session of accessing the web page. , repeating recursive processing until the score of the record to which the end label is assigned is output for each of the inputs of one or more access logs;
program.
ネットワークを介したウェブページへのアクセスログを取得させ、
アクセスログにおける商取引での不正決済の有無を教師データとして、入力されたアクセスログにおいて前記不正決済が行われたかを出力するように学習された分類器に、前記取得されたアクセスログを入力することで得られる出力結果に基づいて、取得された前記アクセスログに示されるウェブページを閲覧した閲覧者によって前記不正決済が行われたか否かを推定させ、
前記不正決済が行われたと推定した場合、前記閲覧者による購入に係る処理を実行する外部装置に対して、処理の中止を指示することを決定させ、
前記アクセスログには、前記閲覧者が閲覧したウェブページの識別情報と、前記ウェブページをユーザが閲覧した時間の長さである閲覧時間とが、互いに対応付けられたレコードが少なくとも含まれるものであり、
前記分類器は、RNN(Recurrent Neural Network:回帰型ニューラルネットワーク)により、前記ウェブページにアクセスするセッションの最後のレコードに対して所定のエンドラベルが付与されたデータを用いて学習されたものであり、1以上のアクセスログの入力に対してそれぞれ前記エンドラベルが付与されたレコードのスコアを出力するまで再帰処理を繰り返す、
プログラム。 to the computer,
Acquire the access log to the web page through the network,
Inputting the acquired access log to a classifier trained to output whether or not the fraudulent payment has been made in the input access log, using the presence or absence of fraudulent payment in the commercial transaction in the access log as training data. Based on the output result obtained in , to estimate whether the unauthorized payment was made by the viewer who browsed the web page indicated in the acquired access log,
If it is estimated that the fraudulent payment has been made, determine to instruct the external device that executes the process related to the purchase by the viewer to stop the process,
The access log includes at least a record in which identification information of the web page viewed by the viewer and viewing time, which is the length of time the user viewed the web page, are associated with each other. can be,
The classifier is trained by an RNN (Recurrent Neural Network) using data in which a predetermined end label is assigned to the last record of a session of accessing the web page. , repeating recursive processing until the score of the record to which the end label is assigned is output for each of the inputs of one or more access logs;
program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019083031A JP7240240B2 (en) | 2019-04-24 | 2019-04-24 | Information processing device, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019083031A JP7240240B2 (en) | 2019-04-24 | 2019-04-24 | Information processing device, information processing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020181316A JP2020181316A (en) | 2020-11-05 |
JP7240240B2 true JP7240240B2 (en) | 2023-03-15 |
Family
ID=73023997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019083031A Active JP7240240B2 (en) | 2019-04-24 | 2019-04-24 | Information processing device, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7240240B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009175984A (en) | 2008-01-23 | 2009-08-06 | Nippon Telegr & Teleph Corp <Ntt> | Principal authentication device, principal authentication method and principal authentication program |
JP2015230717A (en) | 2014-06-06 | 2015-12-21 | ヤフー株式会社 | Extraction device, extraction method, and extraction program |
JP2019036173A (en) | 2017-08-17 | 2019-03-07 | ヤフー株式会社 | Calculation device, calculation method, calculation program and second model |
JP2019053668A (en) | 2017-09-19 | 2019-04-04 | ヤフー株式会社 | Device, method, and program for granting privilege |
-
2019
- 2019-04-24 JP JP2019083031A patent/JP7240240B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009175984A (en) | 2008-01-23 | 2009-08-06 | Nippon Telegr & Teleph Corp <Ntt> | Principal authentication device, principal authentication method and principal authentication program |
JP2015230717A (en) | 2014-06-06 | 2015-12-21 | ヤフー株式会社 | Extraction device, extraction method, and extraction program |
JP2019036173A (en) | 2017-08-17 | 2019-03-07 | ヤフー株式会社 | Calculation device, calculation method, calculation program and second model |
JP2019053668A (en) | 2017-09-19 | 2019-04-04 | ヤフー株式会社 | Device, method, and program for granting privilege |
Also Published As
Publication number | Publication date |
---|---|
JP2020181316A (en) | 2020-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11354720B2 (en) | Item recommendation techniques | |
CN111784455B (en) | Article recommendation method and recommendation equipment | |
US20220335501A1 (en) | Item recommendations using convolutions on weighted graphs | |
CN112000819B (en) | Multimedia resource recommendation method and device, electronic equipment and storage medium | |
US9223900B2 (en) | Machine optimization devices, methods, and systems | |
CN110717098B (en) | Meta-path-based context-aware user modeling method and sequence recommendation method | |
JP7160980B2 (en) | INFORMATION PROVIDING DEVICE, INFORMATION PROVIDING METHOD AND PROGRAM | |
JP6884116B2 (en) | Information processing equipment, information processing methods, and programs | |
US20150379609A1 (en) | Generating recommendations for unfamiliar users by utilizing social side information | |
US20220027730A1 (en) | Entity transaction attribute determination method and apparatus | |
CN111506820B (en) | Recommendation model, recommendation method, recommendation device, recommendation equipment and recommendation storage medium | |
US11676194B2 (en) | Faceted item recommendation system | |
JP6819355B2 (en) | Recommendation generation | |
CN109584006B (en) | Cross-platform commodity matching method based on deep matching model | |
JP6976207B2 (en) | Information processing equipment, information processing methods, and programs | |
CN110689110B (en) | Method and device for processing interaction event | |
US20210150609A1 (en) | Methods and apparatus for electronically providing item advertisement recommendations | |
US20230267317A1 (en) | Sign-aware recommendation apparatus and method using graph neural network | |
KR102422408B1 (en) | Method and apparatus for recommending item based on collaborative filtering neural network | |
CN111967924A (en) | Commodity recommendation method, commodity recommendation device, computer device, and medium | |
CN111461827A (en) | Product evaluation information pushing method and device | |
CN110781405A (en) | Document context perception recommendation method and system based on joint convolution matrix decomposition | |
CN112560105B (en) | Joint modeling method and device for protecting multi-party data privacy | |
CN112364236A (en) | Target object recommendation system, method and device, and data processing method and device | |
Sengupta et al. | Simple surveys: Response retrieval inspired by recommendation systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210316 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220428 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221206 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20221206 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20221215 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20221220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230303 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7240240 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |