JP7135255B2

JP7135255B2 - アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体

Info

Publication number: JP7135255B2
Application number: JP2021007184A
Authority: JP
Inventors: チェン、リアンフイ; フ、ヤン; ワン、クアンビン; ヤン、シャオシュアン; ペン、リアングアン
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-01-22
Filing date: 2021-01-20
Publication date: 2022-09-13
Anticipated expiration: 2041-01-20
Also published as: JP2021118000A; EP3855369A2; CN111259222B; KR102476056B1; CN111259222A; US20210224879A1; KR20210095579A; EP3855369A3

Description

本出願は、コンピュータ技術分野に関するものであり、特に人工知能、具体的にアイテム推奨方法及びモデルトレーニング方法、システム、プログラム、電子機器及び記憶媒体に関するものである。

インターネットがこれまで発展し、様々なインターネットの製品が生み出された。例えば、電子商取引などのショッピングのプラットフォームの登場により、人々のライフスタイルが変えられてショッピングの利便性を高めた。

様々なインターネットアプリケーション製品において、ユーザーは、インタレストのアイテムを個別に選択してもよく、システムからユーザーにアイテムを推奨してもよい。例えば、既存のアイテム推奨システムでは、協調フィルタリングの推奨様式を採用することができる。例えば、業界で一般的に、アイテムベースの協調フィルタリング推奨であるｉｔｅｍＣＦ、または、ユーザーベースの協調フィルタリング推奨であるｕｓｅｒＣＦを使用する。ｉｔｅｍＣＦは、二つのアイテムに全部インタレストを持つユーザーの重複量を使用して、二つのアイテムの間の類似度を測定して、ユーザーの過去のアイテムをベースに、類似の候補アイテムを推奨する。ｕｓｅｒＣＦは、二つのユーザーが同時にインタレストを持つアイテムの重複量を使用して、二つのユーザーの間の類似度を測定し、類似のユーザーグループが気に入るアイテムをベースに、候補アイテムをターゲットユーザーに推奨する。

しかし、ユーザー数やアイテム数が多い場合、上述の推奨案の計算量の代価が非常に大きくて、計算エラーが発生しやすく、推奨案のアイテム推奨精度が低くなる。

上記技術的課題を解決するために、本出願は、アイテムの推奨方法及びモデルトレーニング方法、システム、電子機器及び記憶媒体を提供して、アイテム推奨精度を高める。

一方、本出願は、
予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築するステップと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得するステップと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースに基づいて、推奨待ちＮ個のアイテムの識別子を取得するステップと、
前記Ｎ個のアイテムの識別子に基づいて、前記ユーザーに前記Ｎ個のアイテムの相関情報を推奨するステップと、を含むアイテム推奨方法を提供する。

さらに、選択的に、上述の方法において、前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースに基づいて、推奨待ちＮ個のアイテムの識別子を取得するステップは、
前記アイテムの特徴表現のデータベースから前記ユーザーの特徴表現と相関性が最も高いＮ個のアイテムの特徴表現を検索するステップと、
前記Ｎ個のアイテムの特徴表現に対応される前記Ｎ個のアイテムの識別子を取得するステップと、を含む。

さらに、選択的に、上述の方法において、予めトレーニングされた、前記ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールを具備し、前記リコールのタスクモジュールと前記クリック率推定のタスクモジュールの間は連合学習を受ける。

他方、本出願は、
複数のトレーニングデータを収集するステップと、
前記複数のトレーニングデータを使用して、前記ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行うステップと、を含み、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法を提供する。

さらに、選択的に、上述の方法において、前記複数のトレーニングデータを使用して、前記ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行うステップは、
各前記トレーニングデータについて、前記トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得るステップと、
前記トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現を、それぞれ完全接続処理や活性化処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの特徴表現と前記トレーニングアイテムの特徴表現を乗じて、前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスを得るステップと、
前記クリック率推定のタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びｓｉｇｍｏｉｄ活性化関数の処理層を含む少なくとも二つの層の処理を通じて、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率を得るステップと、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数を生成するステップと、
前記総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを調整するステップと、
収束される場合は、第１の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、前記ユーザーがアイテムをクリックするタスクモデルを決定するステップと、を含む。

さらに、選択的に、上述の方法において、前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数を生成するステップは、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスと既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第１の交差エントロピー損失関数を生成するステップと、
前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率と既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第２の交差エントロピー損失関数を生成するステップと、
前記第１の交差エントロピー損失関数と前記第２の交差エントロピー損失関数の和を求めて、前記総合的な交差エントロピー損失関数を得るステップと、を含む。

さらに、選択的に、上述の方法において、前記総合的な交差エントロピー損失関数が、前記第１の連続予定ループ数のトレーニングで全部収束すると判断される場合に、
継続して前記複数のトレーニングデータを使用して、前記第１の交差エントロピー損失関数が第２の連続予定ループ数のトレーニングで全部収束するまで、前記リコールのタスクモジュールをトレーニングし、前記リコールのタスクモジュールのパラメータを決定して、前記リコールのタスクモジュールを決定し、前記ユーザーがアイテムをクリックするタスクモデルを決定するステップをさらに含む。

もう一方、本出願は、
予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する構築モジュールと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する特徴取得モジュールと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースに基づいて、推奨待ちＮ個のアイテムの識別子を取得するアイテム取得モジュールと、
前記Ｎ個のアイテムの識別子に基づいて、前記ユーザーに前記Ｎ個のアイテムの相関情報を推奨する推奨モジュールと、を具備するアイテム推奨システムをさらに提供する。

また一方、本出願は、
複数のトレーニングデータを収集する収集モジュールと、
前記複数のトレーニングデータを使用して、前記ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行うトレーニングモジュールと、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む、ユーザーがアイテムをクリックするタスクモデルのトレーニング装置をさらに提供する。

もう他方、本出願は、
少なくとも一つのプロセッサーと、
前記少なくとも一つのプロセッサーに通信接続されるメモリと、を具備して、
前記メモリには、前記少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも一つのプロセッサーによって実行されることで、上述のいずれか一項に記載の方法を前記少なくとも一つのプロセッサーに実行させることができる電子機器をさらに提供する。

また他方、本出願は、コンピューターに上述のいずれか一項に記載の方法を実行させるためのコンピューターコマンドが記憶されている非一時的コンピューター可読記録媒体をさらに提供する。

上記の出願における一実施例は以下の利点又は有益な効果を有する。予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築し、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得し、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちＮ個のアイテムの識別子を取得し、Ｎ個のアイテムの識別子に基づいて、ユーザーにＮ個のアイテムの相関情報を推奨することで、既存の技術に比べて、本出願の技術案は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルを使用してアイテムを推奨し、計算量を効果的に削減することができ、計算エラーを回避し、推奨精度を高めることができる。また、アイテム推奨のインテリジェンスを効果的に高め、アイテム推奨効率を向上させることができる。

また、本出願において、ユーザーがアイテムをクリックするタスクモデルに含まれるリコールのタスクモジュールとクリック率推定のタスクモジュールは、二つの互いに独立したタスクであるので、クリック率推定のタスクモジュールにおいてユーザーの特徴表現とアイテムの特徴表現を相互作用させることができる。このように、トレーニング時、当該クリック率推定のタスクモジュールは、逆伝播を介して、埋め込み処理モジュールの中のｅｍｂｅｄｄｉｎｇパラメータに影響を与えることができ、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がｅｍｂｅｄｄｉｎｇパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させ、アイテム推奨の効果をより効果的に高めることができる。

本出願におけるユーザーがアイテムをクリックするタスクモデルのトレーニング方法は、リコールタスクとクリック率推定タスクを同時にトレーニングすることができ、トレーニング時、逆伝播を介して、埋め込み処理モジュールの中のｅｍｂｅｄｄｉｎｇパラメータに影響を与え、ユーザーの特徴表現とアイテムの特徴表現の間の相互作用がある情報がｅｍｂｅｄｄｉｎｇパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。したがって、本実施例の技術案によってトレーニングされたユーザーがアイテムをクリックするタスクモデルは、リコール効果を効果的に高めることができ、当該ユーザーがアイテムをクリックするタスクモデルに基づいてアイテムを推奨する際、推奨精度をに高めることができ、アイテム推奨効率を向上させることができる。

また、本出願において、総合的な交差エントロピー損失関数が第１の連続予定ループ数のトレーニングで全部収束すると判断される場合に、また、継続して複数のトレーニングデータを使用して、第１の交差エントロピー損失関数が第２の連続予定ループ数のトレーニングで全部収束するまで、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定し、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定することにより、リコール効果をより一層高めることができ、推奨精度を高めることができ、アイテム推奨効率を向上させることができる。

上記好適な方式が有する他の効果ついては、具体的な実施例に基づいて以下説明される

図面はこの方案をよりよく理解するためのものであり、本出願の制限を構成するものではない。
本出願に係る実施例１の概略図である。本実施例で提供されるユーザーがアイテムをクリックするタスクモデルの構成図である。本出願に係る実施例２の概略図である。本出願に係る実施例３の概略図である。本出願に係る実施例４の概略図である。本出願の実施例の上記方法を実現するための電子機器のブロック図である。

以下、図面に基づいて、本発明の例示的な実施例を記述する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。明らか、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。

図１は、本出願に係る実施例１の概略図である。図１に示すように、本実施例のアイテム推奨の方法は、具体的に、ステップＳ１０１、ステップＳ１０２、ステップＳ１０３及びステップＳ１０４を含む。

ステップＳ１０１で、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する。

本実施例におけるアイテム推奨の方法を実行する主体はアイテム推奨装置であり、当該アイテム推奨装置は、電子エンティティであってもよく、またはプログラムが統合されたアプリケーションであってもよく、使用時、コンピュータ装置により実行されると、すぐにアイテム推奨が実現されることができる。

本実施例のアイテム推奨の方法は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルに基づいて実現される。当該ユーザーがアイテムをクリックするタスクモデルは、ニューラルネットワークモデルであり、当該ニューラルネットワークモデルは、ユーザーがアイテムをクリックする少なくとも一つのタスク、例えば、リコールタスク及び/またはクリック率推定タスクについてのシミュレーションを実現することができる。ユーザーがアイテムをクリックするタスクのシミュレーションの過程では、必然的に、まずユーザーの特徴情報とアイテムの特徴情報に基づいて、ユーザーとアイテムのそれぞれについて、埋め込み（ｅｍｂｅｄｄｉｎｇ）処理をして、該当する特徴表現を得た後、特徴表現に基づいて、タスクについてのシミュレーションを実現する。したがって、ユーザーがアイテムをクリックするタスクモデルの中のトレーニングされた特徴表現のパラメータに基づいて、アイテムの特徴情報に基づいてのアイテムの特徴表現の取得を実現することができる。本実施例の特徴表現は、具体的には、ベクトルの様式を採用することができ、ベクトル表現と呼ばれてもよい。したがって、アイテムの特徴表現のデータベースは、ＦＡＩＳＳベクトルインデックスデータベースであることができる。

本実施例の推奨待ちアイテムライブラリは、予め収集された複数のアイテム情報を含み、例えば、各々のアイテム情報には、当該アイテムの識別子と当該アイテムの少なくとも二つの特徴情報を含む。ここで、アイテムの識別子は、当該アイテムを一対一に識別するために使用され、例えば、アイテムの識別子は、数字、アルファベット及び文字の中の少なくとも一つまたは少なくとも二つの組み合わせが使用できる。アイテムの少なくとも二つの特徴情報は、アイテムのタイプ、アイテムのキーワードなどの、その他の情報を含むことができる。

本実施例では、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリ中の各アイテムの少なくとも二つの特徴情報に基づいて、各アイテムの特徴表現を取得することができる。また、各アイテムの特徴表現に基づいて、アイテムライブラリの中の各アイテムの特徴表現を含むアイテムの特徴表現のデータベースを構築することができる。ここで、当該アイテムの特徴表現のデータベースには、各アイテムの識別子をさらに含むことができる。

本実施例の特徴表現は、全部ベクトル様式を使用し、ベクトル表現またはベクトルと呼ばれてもよい。

ステップＳ１０２で、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する。

ステップＳ１０１の実施形態を参照すると、また、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報に基づいて、ユーザーの特徴表現を取得することもできて、詳細については、上述のステップＳ１０１の記載を参照すればよく、ここで繰り返して説明しない。

本実施例のユーザーの少なくとも二つの特徴情報は、ユーザーの動作情報、ユーザーのインタレストタグ及び年齢、性別、ライフステージのようなユーザーのデモグラフィック属性などを含んでもよく、ここでいちいち繰り返して説明しない。

ステップＳ１０３で、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちＮ個のアイテムの識別子を取得する。

具体的には、まず、アイテムの特徴表現のデータベースからユーザーの特徴表現と相関性が最も高いＮ個のアイテムの特徴表現を検索する。次に、Ｎ個のアイテムの特徴表現に対応するＮ個のアイテムの識別子を取得する。

ステップＳ１０４で、Ｎ個のアイテムの識別子に基づいて、ユーザーにＮ個のアイテムの相関情報を推奨する。

例えば、Ｎ個のアイテムの識別子に基づいて、ユーザーに、Ｎ個のアイテムの識別子、特徴情報、詳細情報やリンクなどの相関情報を推奨することができる。本実施例では、ユーザーに推奨待ちＮ個のアイテムの相関情報は、上述のいくつかに制限されず、実際の適用際、Ｎ個のアイテムの他の情報をさらに含んでもよく、ここでいちいち繰り返して説明しない。具体的には、本実施例の技術案の適用シナリオによって、Ｎ個のアイテムの識別子に基づいて、Ｎ個のアイテムの相関情報を取得して、ユーザーに推奨することができる。例えば、インターネットショッピングのプラットフォームの場合は、Ｎ個のアイテムの識別子に基づいて、Ｎ個のアイテムの詳細情報や購入リンクを取得して、ユーザーに推奨することができる。

上記記載によると、本実施例のアイテム推奨方法の適用シナリオが、推奨待ちアイテムライブラリとユーザーの少なくとも二つの特徴情報を分かった場合である時、トレーニングされたユーザーがアイテムをクリックするタスクモデルに基づいて、ユーザーにアイテムライブラリの中のＮ個のアイテムの相関情報を推奨することを実現できることを知ることができる。

選択的に、本実施例の予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールを具備することができ、リコールのタスクモジュールとクリック率推定のタスクモジュールの間は、連合学習（Ｃｏ－ｔｒａｉｎｉｎｇ）を受けて得られる。例えば、図２は、本実施例で提供されるユーザーがアイテムをクリックするタスクモデルの構成図である。図２に示すように、本実施例のユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールを具備するほかに、基本情報の処理モジュール、即ち、埋め込み（ｅｍｂｅｄｄｉｎｇ）処理モジュールをさらに具備する。埋め込み処理モジュールは、ユーザーの少なくとも二つの特徴情報とアイテムの少なくとも二つの特徴情報についてそれぞれ埋め込み（ｅｍｂｅｄｄｉｎｇ）処理を行い、スプライシングさせる。リコールのタスクモジュールとクリック率推定のタスクモジュールは、いずれもスプライシング後の表現を入力として使用して処理を行う。

ここで、リコールのタスクモジュールは、ユーザーについてのアイテム推奨度のインデックスの計算に使用され、当該推奨度のインデックスが高いほど、当該ユーザーにアイテムを推奨する際、当該アイテムがリコールされる可能性が大きい。逆に、当該推奨度のインデックスが小さいほど、当該アイテムがリコールされる可能性が小さい。

クリック率推定のタスクモジュールは、アイテムについてのユーザーのクリック率の予測に使用され、クリック率が大きいほど、当該ユーザーが当該アイテムについてのインタレストがより多く、当該アイテムをクリックする可能性が大きいことを表す。逆に、クリック率が小さいほど、ユーザーが当該アイテムについてのインタレストがより少なく、当該アイテムをクリックする可能性が小さいことを表す。

本実施例のユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールは、二つの互いに独立したタスクである。実際の適用において、埋め込み処理モジュールは、リコールのタスクモジュールと組み合わせて、一つの独立したタスクモデルを形成してリコールタスクを実現することができる。または、埋め込み処理モジュールは、クリック率推定のタスクモジュールと組み合わせて、一つの独立したタスクモデルを形成してクリック率推定を実現することができる。

例えば、本実施例では、ユーザーがアイテムをクリックするタスクモデルは、埋め込み処理モジュールとリコールのタスクモジュールのみ具備して、クリック率推定のタスクモジュールを具備しなくてもよい。当該タスクモデルをトレーニングした後、当該タスクモデルに基づいて、上述の図１に示される実施例のステップＳ１０１及びステップＳ１０２を実現することができる。

しかし、図２に示すように、ユーザーがアイテムをクリックするタスクモデルが、埋め込み処理モジュールとリコールのタスクモジュールのみ具備した場合、ユーザーの特徴表現とアイテムの特徴表現とは、最上位でユーザーについてのアイテム推奨度のインデックスを計算するときに乗ずるほかに、どのような相互作用もない。最上位の情報は既に圧縮されたものであり、モデルには最下位の特徴表現同士の特徴の相互作用が不足して、当該ユーザーがアイテムをクリックするタスクモデルのトレーニング時、ユーザーの特徴表現とアイテムの特徴表現とが完全に独立して、ユーザーとアイテムの間の交差情報を学習することができないので、トレーニングされたモデルのリコール効果が低下する。

図２に示される本実施例のユーザーがアイテムをクリックするタスクモデルは、クリック率推定のタスクモジュールをさらに導入しており、当該クリック率推定のタスクモジュールは、ユーザーの組み合わせ特徴表現とアイテムの組み合わせ特徴表現のスプライシング後の特徴に基づいて、クリック率を予測する。つまり、ユーザーの特徴表現とアイテムの特徴表現を相互作用させた。このように、トレーニング時、当該クリック率推定のタスクモジュールは、逆伝播を介して、埋め込み処理モジュールの中のｅｍｂｅｄｄｉｎｇパラメータに影響を与えることができ、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がｅｍｂｅｄｄｉｎｇパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。

このとき、これに応じて、ステップＳ１０１の実施際、トレーニングされた図２に示されるユーザーがアイテムをクリックするタスクモデルの中の、埋め込み処理モジュールとリコールのタスクモジュールの中のネットワーク構造のパラメータに基づいて、アイテムライブラリの各アイテムの少なくとも二つの特徴情報に基づいて、アイテムライブラリの各アイテムの特徴表現を取得することができる。アイテムライブラリの中のすべてのアイテムの特徴表現を組み合わせて、一つのアイテムの特徴表現のデータベースを構築する。

同様に、ステップＳ１０２の実施際、トレーニングされた図２に示されるユーザーがアイテムをクリックするタスクモデルの中の、埋め込み処理モジュールとリコールのタスクモジュールの中のネットワーク構造のパラメータに基づいて、ユーザーの少なくとも二つの特徴情報に基づいて、ユーザーの特徴表現を取得してもよい。

本実施例でのアイテムは、商品であるほかに、広告などのその他の情報であってもよく、また、他の分野で広告やその他の情報の推奨を実現することができることに留意すべきである。

本実施例のアイテム推奨の方法は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築し、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得し、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちＮ個のアイテムの識別子を取得し、Ｎ個のアイテムの識別子に基づいて、ユーザーにＮ個のアイテムの相関情報を推奨することで、既存の技術に比べて、本実施例の技術案は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルを使用してアイテムを推奨し、計算量を効果的に削減することができ、計算エラーを回避し、推奨精度を高めることができる。また、アイテム推奨のインテリジェンスを効果的に高め、アイテム推奨効率を向上させることができる。

また、本実施例のユーザーがアイテムをクリックするタスクモデルに含まれるリコールのタスクモジュールとクリック率推定のタスクモジュールは、二つの互いに独立したタスクであるので、クリック率推定のタスクモジュールにおいてユーザーの特徴表現とアイテムの特徴表現を相互作用させることができる。このように、トレーニング時、当該クリック率推定のタスクモジュールは、逆伝播を介して、埋め込み処理モジュールの中のｅｍｂｅｄｄｉｎｇパラメータに影響を与えることができ、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がｅｍｂｅｄｄｉｎｇパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させ、アイテム推奨の効果をより効果的に高めることができる。

図３は、本出願の実施例２の概略図であり、図３に示すように、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング方法は、具体的に、ステップＳ３０１、ステップＳ３０２を含むことができる。

ステップＳ３０１で、複数のトレーニングデータを収集し、各トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及びトレーニングユーザーがトレーニングアイテムに対するクリック相互作用情報を含む。

本実施例では、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法の実行主体は、ユーザーがアイテムをクリックするタスクモデルのトレーニング装置である。当該ユーザーがアイテムをクリックするタスクモデルのトレーニング装置は、電子エンティティであってもよく、またはソフトウェアが統合されたアプリケーションであってもよく、使用時、当該アプリケーションを大型コンピュータ装置により実行され、本実施例の技術案を使用して、当該ユーザーがアイテムをクリックするタスクモデルについてのトレーニングを実現する。

本実施例では、収集されたトレーニングデータの量は、百万以上超えることができ、収集されたトレーニングデータの件数が多いほど、トレーニングされたユーザーがアイテムをクリックするタスクモデルがより正確である。

本実施例では、収集された各トレーニングデータに含まれるトレーニングユーザーの少なくとも二つのトレーニング特徴情報とトレーニングアイテムの少なくとも二つのトレーニング特徴情報は、上述の図１に示される実施例のユーザーの少なくとも二つの特徴情報とアイテムの少なくとも二つの特徴情報を参照すればよく、ここで繰り返して説明しない。ここで、トレーニングユーザーがトレーニングアイテムに対するクリック相互作用情報は、ユーザーが当該トレーニングアイテムをクリックしたか、またはユーザーが当該トレーニングアイテムをクリックしなかったことを含むことができる。

本実施例でトレーニングデータを収集する際、サイトまたはアプリケーション（ａｐｐｌｉｃａｔｉｏｎ；ａｐｐ）のイベントトラッキング（ｅｖｅｎｔｔｒａｃｋｉｎｇ）を介してユーザーの過去に現れたクリック、動作データを取得して、トレーニングデータをマイニングする。

ステップＳ３０２で、複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行う。

トレーニング前、ユーザーがアイテムをクリックするタスクモデルの中のネットワーク構造の各層のパラメータについて、ランダムに初期化してから、ランダムに初期化されたパラメータに基づいて、ユーザーがアイテムをクリックするタスクモデルをトレーニングし始めなければならないことに留意すべきである。

本実施例のユーザーがアイテムをクリックするタスクモデルは、図２に示される構造を使用することができ、例えば、トレーニング時、具体的にステップ（ａ）からステップ（ｊ）を含むことができる。

ステップ（ａ）において、各トレーニングデータについて、トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得る。

ステップ（ｂ）において、トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得る。

埋め込み表現して得られたものがすべてベクトル様式的な表現なので、スプライシング後のトレーニングユーザーの組み合わせ特徴表現をまたトレーニングユーザーの組み合わせベクトルと呼ばれてもよく、スプライシング後のトレーニングアイテムの組み合わせ特徴表現をまたトレーニングアイテムの組み合わせベクトルとも呼ばれてもよい。

ステップ（ｃ）において、リコールのタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現を、それぞれ完全接続（fully connected）処理や活性化（Activation）処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得る。

本実施例では、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を生成する過程で、完全接続処理や活性化処理の処理層を含む少なくとも二つの層を通じなければならず、具体的には、処理層の層数はトレーニングユーザーの特徴情報の量によって決定される。トレーニングユーザーの特徴情報の量が比較的多い場合に、情報の混合がより均一でかつより正確なトレーニングユーザーの特徴表現を得るように、処理層の層数も比較的多く要られる。トレーニングアイテムの特徴表現側の原理もこれに似ており、ここで繰り返して説明しない。例えば、図２のネットワーク構造により示すように、リコールのタスクモジュールの各層の処理層には、いずれも完全接続処理や活性化処理を含み、ここで、活性化処理はＲｅＬＵ活性化処理を使用してもよい。

ステップ（ｄ）において、リコールのタスクモジュールにおいて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を乗じて、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスを得る。

本実施例では、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を乗じて得られたものはドット積（ｄｏｔｐｒｏｄｕｃｔ）であり、当該ドット積は、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスを表すために使用される。

ステップ（ｅ）において、クリック率推定のタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びｓｉｇｍｏｉｄ活性化関数の処理層を含む少なくとも二つの層の処理を通じて、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率を得る。

同様に、クリック率推定のタスクモジュールで、トレーニングユーザーの特徴情報とトレーニングアイテムの特徴情報の量が比較的多い場合、より多くの層数の処理層を設定して、特徴情報をより均一に混合して、より正確な特徴情報を得て、予測クリック確率の値を高める。同様に、図２に示されるネットワーク構造では、クリック率推定のタスクモジュールの各層の処理層にも、いずれも完全接続処理や活性化処理を含み、ここで、活性化処理はＲｅＬＵ活性化処理を使用してもよい。

ステップ（ｆ）において、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックス、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率及び既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数（ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ）を生成する。

例えば、当該ステップは、具体的に、下記のステップ（１）、ステップ（２）及びステップ（３）を含むことができる。

ステップ（１）において、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスと既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第１の交差エントロピー損失関数を生成する。

ステップ（２）において、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率と既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第２の交差エントロピー損失関数を生成する。

ステップ（３）において、第１の交差エントロピー損失関数と第２の交差エントロピー損失関数の和を求めて、総合的な交差エントロピー損失関数を得る。

例えば、本実施例の総合的な交差エントロピー損失関数は、下記式で表すことができる。

ここで、

は、第１の交差エントロピー損失関数を表し、

は、リコールタスクの中の既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて得られたトレーニングユーザーに対するトレーニングアイテムの既知の推奨度のインデックスである。例えば、トレーニングユーザーがトレーニングアイテムに対して実際のクリック動作があった場合に、

を１と表記して、そうでない場合、すなわち、実際の動作がなかった場合に、

を０と表記する。

は、トレーニングユーザーに対するトレーニングアイテムの予測推奨度のインデックスを表す。

は、第２の交差エントロピー損失関数を表し、

は、クリック率推定タスクの中の既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて得られたトレーニングユーザーがトレーニングアイテムに対する実際のクリック率である。クリックが１である場合、非クリックは０である。

は、モデルによって予測されたクリック率である。

ステップ（ｇ）において、総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、ステップ（ｈ）を実行し、収束される場合は、ステップ（ｉ）を実行する。

ステップ（ｈ）において、ユーザーがアイテムをクリックするタスクモデルのパラメータを調整し、ステップ（ａ）に戻り、次のトレーニングデータを使用して継続してトレーニングを行う。

具体的に、組み込み処理モジュール、リコールのタスクモジュール及びクリック率推定のタスクモジュールの中のネットワーク構造のパラメータを調整することを含むことができる。

ステップ（ｉ）において、第１の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、ステップ（ｊ）を実行して、収束されていない場合は、ステップ（ａ）に戻り、次のトレーニングデータを使用して継続してトレーニングを行う。

ステップ（ｊ）において、ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、ユーザーがアイテムをクリックするタスクモデルを決定する。

選択的に、ステップ（ｉ）で総合的な交差エントロピー損失関数が、第１の連続予定ループ数のトレーニングで全部収束すると判断される場合に、継続して複数のトレーニングデータを使用して、第１の交差エントロピー損失関数が第２の連続予定ループ数のトレーニングで全部収束するまで、リコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定して、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定するステップをさらに含むことができる。

言い換えると、本実施例のユーザーがアイテムをクリックするタスクモデルの中のクリック率推定のタスクモジュールは、単にモデルをトレーニングする過程のみに使用され、ユーザーの特徴表現とアイテムの特徴表現の相互作用を導入するために使用され、再トレーニング時、逆伝播を介して埋め込み処理モジュールの中のｅｍｂｅｄｄｉｎｇパラメータに影響を与え、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がｅｍｂｅｄｄｉｎｇパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。また、リコールの効果をより一層高めるために、リコールのタスクモジュールのネットワーク構造のパラメータを最適化し、本実施例では、総合的な交差エントロピー損失関数が収束するようにトレーニングした後、さらにリコールのタスクモジュールのネットワーク構造のパラメータを調整して、第１の交差エントロピー損失関数が第２の連続予定ループ数のトレーニングで全部収束するようにして、リコールのタスクモジュールのパラメータを決定し、リコールのタスクモジュールを決定して、ユーザーがアイテムをクリックするタスクモデルを決定する。

本実施例の第１の連続予定ループ数及び第２の連続予定ループ数は、実際の需要に応じて、１００、２００、またはその他の数値に設定することができ、ここでこれに対して限定しない。

図１に示される実施例で使用された、トレーニングされたユーザーがアイテムをクリックするタスクモデルは、上述のトレーニング方法を使用してトレーニングされたユーザーがアイテムをクリックするタスクモデルである。

本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング方法は、上述の技術案を使用することにより、リコールタスクとクリック率推定タスクを同時にトレーニングすることができ、トレーニング時、逆伝播を介して、埋め込み処理モジュールの中のｅｍｂｅｄｄｉｎｇパラメータに影響を与え、ユーザーの特徴表現とアイテムの特徴表現の間の相互作用がある情報がｅｍｂｅｄｄｉｎｇパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。したがって、本実施例の技術案によってトレーニングされたユーザーがアイテムをクリックするタスクモデルは、リコール効果を効果的に高めることができ、当該ユーザーがアイテムをクリックするタスクモデルに基づいてアイテムを推奨する際、推奨精度をに高めることができ、アイテム推奨効率を向上させることができる。

また、本実施例のトレーニングにおいて、総合的な交差エントロピー損失関数が第１の連続予定ループ数のトレーニングで全部収束すると判断される場合に、また、継続して複数のトレーニングデータを使用して、第１の交差エントロピー損失関数が第２の連続予定ループ数のトレーニングで全部収束するまで、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定し、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定することにより、リコール効果をより一層高めることができ、推奨精度を高めることができ、アイテム推奨効率を向上させることができる。

図４は、本出願に係る実施例３の概略図である。図４に示すように、本実施例のアイテム推奨システム４００は、具体的に、構築モジュール４０１、特徴取得モジュール４０２、アイテム取得モジュール４０３及び推奨モジュール４０４を具備する。

構築モジュール４０１は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する。

特徴取得モジュール４０２は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する。

アイテム取得モジュール４０３は、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちＮ個のアイテムの識別子を取得する。

オススメモジュール４０４は、Ｎ個のアイテムの識別子に基づいて、ユーザーにＮ個のアイテムの相関情報を推奨する。

選択的に、本実施例のアイテム推奨システム４００のアイテム取得モジュール４０３は、
アイテムの特徴表現のデータベースからユーザーの特徴表現と相関性が最も高いＮ個のアイテムの特徴表現を検索し、
Ｎ個のアイテムの特徴表現に対応するＮ個のアイテムの識別子を取得する。

選択的に、本実施例のアイテム推奨システム４００において、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールを具備することができ、リコールのタスクモジュールとクリック率推定のタスクモジュールの間は、連合学習（Ｃｏ－ｔｒａｉｎｉｎｇ）を受ける。

本実施例のアイテム推奨システム４００にとって、上述のモジュールによるアイテム推奨を実現する実現原理と技術的効果は、上述の関連方法の実施例の実現と同じであり、詳細は、上述の関連方法の実施例の記載を参照すればよく、ここで繰り返して説明しない。

図５は、本出願に係る実施例４の概略図である。図５に示すように、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置５００は、収集モジュール５０１、トレーニングモジュール５０２を具備する。

収集モジュール５０１は、複数のトレーニングデータを収集し、各トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及びトレーニングユーザーがトレーニングアイテムに対するクリック相互作用情報を含む。

トレーニングモジュール５０２は、複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行う。

選択的に、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置５００において、トレーニングモジュール５０２は、具体的に
各トレーニングデータについて、トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得て、
トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得て、
リコールのタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現を、それぞれ完全接続（fully connected）処理や活性化（Activation）処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得て、
リコールのタスクモジュールにおいて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を乗じて、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスを得て、
クリック率推定のタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びｓｉｇｍｏｉｄ活性化関数の処理層を含む少なくとも二つの層の処理を通じて、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率を得て、
トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックス、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率及び既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数（ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ）を生成し、
総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、ユーザーがアイテムをクリックするタスクモデルのパラメータを調整し、
収束される場合は、第１の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、ユーザーがアイテムをクリックするタスクモデルを決定する。

選択的に、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置５００において、トレーニングモジュール５０２は、
トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスと既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第１の交差エントロピー損失関数を生成し、
トレーニングアイテムに対するトレーニングユーザーの予測クリック確率と既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第２の交差エントロピー損失関数を生成し、
第１の交差エントロピー損失関数と第２の交差エントロピー損失関数の和を求めて、総合的な交差エントロピー損失関数を得る。

選択的に、本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置５００において、トレーニングモジュール５０２は、
総合的な交差エントロピー損失関数が第１の連続予定ループ数のトレーニングで全部収束すると判断される場合に、継続して複数のトレーニングデータを使用して、第１の交差エントロピー損失関数が第２の連続予定ループ数のトレーニングで全部収束するまで、リコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定して、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定する。

本実施例のユーザーがアイテムをクリックするタスクモデルのトレーニング装置５００において、上述のモジュールによるユーザーがアイテムをクリックするタスクモデルのトレーニングを実現する実現原理と技術的効果は、上述の関連方法の実施例の実現と同じであり、詳細は、上述の関連実施例の記載を参照すればよく、ここで繰り返して説明しない。

本発明に係る実施例によれば、本発明は、電子機器と可読記憶媒体を提供する。

図６に示すように、本出願の実施例によるユーザークリックモデルのトレーニング又はリソース推奨方法の電子機器のブロック図である。電子機器は、様々な形式のデジタルコンピューター、例えば、ラップトップ、デスクトップ、ワークステーション、携帯情報端末、サーバー、ブレードサーバ、メインフレームコンピューター、及び他の適切なコンピューターであることが意図される。電子機器は、様々な種類のモバイル装置、例えば、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティング装置を示してもよい。ここで示した構成要素、これらの接続及び関係、ならびにこれらの機能は例示にすぎなく、本明細書において説明及び／又は請求される本出願の実現を限定することが意図されない。

図６に示すように、上記電子機器は、一つ又は複数のプロセッサー６０１、メモリ６０２、及び各構成要素に接続するためのインターフェースを含み、高速インターフェース及び低速インターフェースを含む。各構成要素は、異なるバスで相互接続され、そして、共通マザーボードに、又は必要に応じて、他の方式で実装されてもよい。プロセッサーは、電子機器内で実行されるコマンドを処理してもよく、メモリに又はメモリ上で外部入力／出力装置（例えば、インターフェースに結合される表示装置）にグラフィカルユーザーインターフェースのグラフィカル情報を表示するコマンドを含む。他の実施形態において、複数のプロセッサー及び／又は複数のバスが、適宜、複数のメモリ及びメモリのタイプとともに用いられてもよい。同様に、複数の電子機器が接続されてもよく、それぞれの装置が（例えば、サーババンク、ブレードサーバの集まり、又はマルチプロセッサーシステムとして）必要な操作の一部を提供する。図６において、一つのプロセッサー６０１を例にとる。

メモリ６０２は、本出願で提供される非一時的コンピューター可読記録媒体である。なお、メモリは、少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、少なくとも一つのプロセッサーに本出願で提供されるアイテム推奨方法やユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させる。本出願の非一時的コンピューター可読記録媒体は、上記ココンピューターに本出願で提供されるアイテム推奨方法やユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させるためのコンピューターコマンドが記憶されている。

メモリ６０２は、非一時的コンピューター可読記録媒体として、非一時的ソフトウェアプログラム、非一時的コンピューター実行可能なプログラム、モジュール、例えば、本出願の実施例におけるアイテム推奨方法またはユーザーがアイテムをクリックするタスクモデルのトレーニング方法に対応するプログラムコマンド／モジュール（例えば、図４に示すモジュールのそれぞれ及び図５に示すモジュールのそれぞれ）を記憶するために用いられる。プロセッサー６０１は、メモリ６０２に記憶されている非一時的ソフトウェアプログラム、コマンド及びモジュールを実行することで、サーバーの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記の方法実施例におけるアイテム推奨の方法またはユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現する。

メモリ６０２は、記憶プログラム領域及び記憶データ領域を含んでもよく、記憶プログラム領域はオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶してもよく、記憶データ領域は、アイテム推奨方法またはユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現するための電子機器の使用により作成されたデータなどを記憶してもよい。また、メモリ６０２は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的メモリを含んでもよく、例えば、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体記憶装置を含んでもよい。幾つかの実施例において、メモリ６０２は、プロセッサー６０１に対してリモートに設置されたメモリを選択的に含んでもよく、これらのリモートメモリは、ネットワークを介してアイテム推奨の方法またはユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現するための電子機器に接続されてもよい。上記のネットワークの例には、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。

アイテム推奨方法やユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現するための電子機器は、入力装置６０３及び出力装置６０４をさらに含むことができる。プロセッサー６０１、メモリ６０２、入力装置６０３及び出力装置６０４はバス又は他の方式で接続されてもよく、図６に、バスで接続されることを例にとる。

入力装置６０３は、入力された数値又は文字情報を受信し、また、アイテム推奨方法やユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実現するための電子機器のユーザー設定と機能制御に関連するキー信号入力を生成でき、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置６０４は、表示装置、補助照明装置（例えば、ＬＥＤ）、触覚フィードバック装置（例えば、振動モーター）などを含むことができる。上記表示装置は、液晶ディスプレイ（ＬＣＤ）、発光ダイオードディスプレイ（ＬＥＤ）、及びプラズマディスプレイを含み得るが、これらに限定されない。いくつかの実施形態では、表示装置はタッチスクリーンであってもよい。

本明細書に説明されるシステム及び技術的様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向け集積回路、コンピューターハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及びコマンドを受信し、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置にデータ及びコマンドを送信するようにつなげられた、特殊用途でもよく一般用途でもよい少なくとも一つのプログラマブルプロセッサーを含む、プログラム可能なシステム上で実行可能及び／又は解釈可能な一つ又は複数のコンピュータープログラムにおける実行を含んでもよい。

これらのコンピューティングプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又は、コードとも称される）は、プログラマブルプロセッサーの機械コマンドを含み、高水準のプロセス及び／もしくはオブジェクト向けプログラミング言語、及び／又はアセンブリ／機械言語で実行されることができる。本明細書で用いられる「機械可読媒体」という用語は、機械可読信号としての機械コマンドを受け取る機械可読媒体を含むプログラマブルプロセッサーに機械コマンド及び／又はデータを提供するのに用いられる任意のコンピュータープログラム製品、機器、及び／又は装置（例えば、磁気ディスク、光ディスク、メモリ、及びプログラマブル論理デバイス）を指す。「機械可読信号」という用語は、プログラマブルプロセッサーに機械コマンド及び／又はデータを提供するために用いられる任意の信号を指す。

ユーザーとのインタラクトを提供するために、本明細書に説明されるシステムと技術は、ユーザーに対して情報を表示するためのディスプレイデバイス（例えば、ＣＲＴ（ブラウン管）又はＬＣＤ（液晶ディスプレイ）モニタ）、ユーザーがコンピューターに入力を与えることができるキーボード及びポインティングデバイス（例えば、マウス又はトラックボール）を有するコンピューター上に実施されることが可能である。その他の種類の装置は、さらに、ユーザーとのインタラクションを提供するために使用されることが可能であり、例えば、ユーザーに提供されるフィードバックは、任意の形態の感覚フィードバック（例えば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック）であり得、ユーザーからの入力は、任意の形態で（音響、発話、又は触覚による入力を含む）受信され得る。

本明細書に説明されるシステムと技術的実施形態は、バックエンド構成要素を含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェア構成要素を含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンド構成要素を含むコンピューティングシステム（例えば、グラフィカルユーザーインターフェースもしくはウェブブラウザを有するクライアントコンピューターであり、ユーザーは、上記グラフィカルユーザーインターフェースもしくは上記ウェブブラウザを通じて本明細書で説明されるシステムと技術的実施形態とインタラクションすることができる）、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。ステムの構成要素は、任意の形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネットワークを含む。

コンピューターシステムは、クライアントとサーバーを含み得る。クライアントとサーバーは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバーとの関係は、相応するコンピューター上で実行さ、互いにクライアント－サーバーの関係にあるコンピュータープログラムによって生じる。

本出願の実施例に係る技術案は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築し、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得し、ユーザーの特徴表現とアイテムの特徴表現のデータベースに基づいて、推奨待ちＮ個のアイテムの識別子を取得し、Ｎ個のアイテムの識別子に基づいて、ユーザーにＮ個のアイテムの相関情報を推奨することで、既存の技術に比べて、本出願の本実施例の技術案は、予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルを使用してアイテムを推奨し、計算量を効果的に削減することができ、計算エラーを回避し、推奨精度を高めることができる。また、アイテム推奨のインテリジェンスを効果的に高め、アイテム推奨効率を向上させることができる。

また、本出願の実施形態に係る技術案において、ユーザーがアイテムをクリックするタスクモデルに含まれるリコールのタスクモジュールとクリック率推定のタスクモジュールは、二つの互いに独立したタスクであるので、クリック率推定のタスクモジュールにおいてユーザーの特徴表現とアイテムの特徴表現を相互作用させることができる。このように、トレーニング時、当該クリック率推定のタスクモジュールは、逆伝播を介して、埋め込み処理モジュールの中のｅｍｂｅｄｄｉｎｇパラメータに影響を与えることができ、ユーザーの特徴表現とアイテムの特徴表現との間の相互作用がある情報がｅｍｂｅｄｄｉｎｇパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させ、アイテム推奨の効果をより効果的に高めることができる。

本出願の実施形態に係る技術案において、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法は、リコールタスクとクリック率推定タスクを同時にトレーニングすることができ、トレーニング時、逆伝播を介して、埋め込み処理モジュールの中のｅｍｂｅｄｄｉｎｇパラメータに影響を与え、ユーザーの特徴表現とアイテムの特徴表現の間の相互作用がある情報がｅｍｂｅｄｄｉｎｇパラメータに記録されるようにして、リコールタスクに影響を与え、リコール効果を向上させた。したがって、本出願における実施例の技術案によってトレーニングされたユーザーがアイテムをクリックするタスクモデルは、リコール効果を効果的に高めることができ、当該ユーザーがアイテムをクリックするタスクモデルに基づいてアイテムを推奨する際、推奨精度をに高めることができ、アイテム推奨効率を向上させることができる。

また、本出願の実施形態に係る技術案において、総合的な交差エントロピー損失関数が第１の連続予定ループ数のトレーニングで全部収束すると判断される場合に、また、継続して複数のトレーニングデータを使用して、第１の交差エントロピー損失関数が第２の連続予定ループ数のトレーニングで全部収束するまで、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定し、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定することにより、リコール効果をより一層高めることができ、推奨精度を高めることができ、アイテム推奨効率を向上させることができる。

以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本出願に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本出願で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。

上記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、本出願の保護範囲内に含まれるべきである。

Claims

予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、コンピューターがアイテムの特徴表現のデータベースを構築するステップと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、前記コンピューターがユーザーの特徴表現を取得するステップと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースとに基づいて、前記コンピューターが推奨待ちＮ個のアイテムの識別子を取得するステップと、
前記Ｎ個のアイテムの識別子に基づいて、前記コンピューターが前記ユーザーに前記Ｎ個のアイテムの相関情報を推奨するステップと、を含む
コンピューターにより実行される、アイテム推奨方法。
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースとに基づいて、前記コンピューターが推奨待ちＮ個のアイテムの識別子を取得するステップは、
前記アイテムの特徴表現のデータベースから前記ユーザーの特徴表現と相関性が最も高いＮ個のアイテムの特徴表現を前記コンピューターが検索するステップと、
前記Ｎ個のアイテムの特徴表現に対応される前記Ｎ個のアイテムの識別子を前記コンピューターが取得するステップと、を含む
請求項１に記載のアイテム推奨方法。
予めトレーニングされた、前記ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールとを具備し、前記リコールのタスクモジュールと前記クリック率推定のタスクモジュールの間は連合学習を受ける
請求項１又は請求項２に記載のアイテム推奨方法。
複数のトレーニングデータをコンピューターが収集するステップと、
前記複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールとについて前記コンピューターが連合学習を行うステップと、を含み、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む
コンピューターにより実行される、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法。
前記複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールとについて前記コンピューターが連合学習を行うステップは、
各前記トレーニングデータについて、前記トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、前記コンピューターがトレーニングユーザーの組み合わせ特徴表現を得るステップと、
前記トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、前記コンピューターがトレーニングアイテムの組み合わせ特徴表現を得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現とを、それぞれ完全接続処理や活性化処理の処理層を含む少なくとも二つの層の処理を通じて、前記コンピューターがトレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現とを得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの特徴表現と前記トレーニングアイテムの特徴表現とを乗じて、前記コンピューターが前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスを得るステップと、
前記クリック率推定のタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びｓｉｇｍｏｉｄ活性化関数の処理層を含む少なくとも二つの層の処理を通じて、前記コンピューターが前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率を得るステップと、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが総合的な交差エントロピー損失関数を生成するステップと、
前記総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを前記コンピューターが調整するステップと、
収束される場合は、第１の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、前記ユーザーがアイテムをクリックするタスクモデルを前記コンピューターが決定するステップと、を含む
請求項４に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法。
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが総合的な交差エントロピー損失関数を生成するステップは、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスと既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが第１の交差エントロピー損失関数を生成するステップと、
前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率と既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが第２の交差エントロピー損失関数を生成するステップと、
前記第１の交差エントロピー損失関数と前記第２の交差エントロピー損失関数の和を求めて、前記コンピューターが前記総合的な交差エントロピー損失関数を得るステップと、を含む
請求項５に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法。
前記総合的な交差エントロピー損失関数が、前記第１の連続予定ループ数のトレーニングで全部収束すると判断される場合に、前記方法は、
継続して前記複数のトレーニングデータを使用して、前記第１の交差エントロピー損失関数が第２の連続予定ループ数のトレーニングで全部収束するまで、前記リコールのタスクモジュールをトレーニングし、前記リコールのタスクモジュールのパラメータを決定して、前記リコールのタスクモジュールを決定し、前記ユーザーがアイテムをクリックするタスクモデルを前記コンピューターが決定するステップをさらに含む
請求項６に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法。
予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する構築モジュールと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する特徴取得モジュールと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースとに基づいて、推奨待ちＮ個のアイテムの識別子を取得するアイテム取得モジュールと、
前記Ｎ個のアイテムの識別子に基づいて、前記ユーザーに前記Ｎ個のアイテムの相関情報を推奨する推奨モジュールと、を具備する
アイテム推奨システム。
前記アイテム取得モジュールは、
前記アイテムの特徴表現のデータベースから前記ユーザーの特徴表現と相関性が最も高いＮ個のアイテムの特徴表現を検索し、
前記Ｎ個のアイテムの特徴表現に対応される前記Ｎ個のアイテムの識別子を取得する
請求項８に記載のアイテム推奨システム。
予めトレーニングされた、前記ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールとを具備し、前記リコールのタスクモジュールと前記クリック率推定のタスクモジュールの間は連合学習を受ける
請求項８又は請求項９に記載のアイテム推奨システム。
複数のトレーニングデータを収集する収集モジュールと、
前記複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールとについて連合学習を行うトレーニングモジュールと、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む
ユーザーがアイテムをクリックするタスクモデルのトレーニング装置。
前記トレーニングモジュールは、
各前記トレーニングデータについて、前記トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得て、
前記トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得て、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現とを、それぞれ完全接続処理や活性化処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得て、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの特徴表現と前記トレーニングアイテムの特徴表現とを乗じて、前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスを得て、
前記クリック率推定のタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びｓｉｇｍｏｉｄ活性化関数の処理層を含む少なくとも二つの層の処理を通じて、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率を得て、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数を生成して、
前記総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを調整して、
収束される場合は、第１の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、前記ユーザーがアイテムをクリックするタスクモデルを決定する
請求項１１に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング装置。
前記トレーニングモジュールは、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスと既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第１の交差エントロピー損失関数を生成して、
前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率と既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第２の交差エントロピー損失関数を生成して、
前記第１の交差エントロピー損失関数と前記第２の交差エントロピー損失関数の和を求めて、前記総合的な交差エントロピー損失関数を得る
請求項１２に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング装置。
前記トレーニングモジュールは、
前記総合的な交差エントロピー損失関数が、前記第１の連続予定ループ数のトレーニングで全部収束すると判断される場合に、継続して前記複数のトレーニングデータを使用して、前記第１の交差エントロピー損失関数が第２の連続予定ループ数のトレーニングで全部収束するまで、前記リコールのタスクモジュールをトレーニングし、前記リコールのタスクモジュールのパラメータを決定して、前記リコールのタスクモジュールを決定し、前記ユーザーがアイテムをクリックするタスクモデルを決定する
請求項１３に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング装置。
少なくとも一つのプロセッサーと、
前記少なくとも一つのプロセッサーに通信接続されるメモリと、を具備し、
前記メモリには、前記少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも一つのプロセッサーによって実行されることで、請求項１から３のいずれか一項に記載のアイテム推奨方法または請求項４から７のいずれか一項に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法を前記少なくとも一つのプロセッサーに実行させる、電子機器。
コンピューターに請求項１から３のいずれか一項に記載のアイテム推奨方法または請求項４から７のいずれか一項に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させるためのコンピューターコマンドが記憶されている非一時的コンピューター可読記録媒体。
コンピューターに請求項１から３のいずれか一項に記載のアイテム推奨方法または請求項４から７のいずれか一項に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させるためのコンピュータープログラム。