JP7135255B2 - アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体 - Google Patents
アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体 Download PDFInfo
- Publication number
- JP7135255B2 JP7135255B2 JP2021007184A JP2021007184A JP7135255B2 JP 7135255 B2 JP7135255 B2 JP 7135255B2 JP 2021007184 A JP2021007184 A JP 2021007184A JP 2021007184 A JP2021007184 A JP 2021007184A JP 7135255 B2 JP7135255 B2 JP 7135255B2
- Authority
- JP
- Japan
- Prior art keywords
- training
- item
- user
- task
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 68
- 238000012549 training Methods 0.000 claims description 359
- 238000012545 processing Methods 0.000 claims description 67
- 230000006870 function Effects 0.000 claims description 63
- 230000003993 interaction Effects 0.000 claims description 39
- 230000015654 memory Effects 0.000 claims description 20
- 230000004913 activation Effects 0.000 claims description 16
- 230000014509 gene expression Effects 0.000 claims description 14
- 238000012512 characterization method Methods 0.000 claims description 11
- 230000013016 learning Effects 0.000 claims description 8
- 230000000875 corresponding effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 230000035045 associative learning Effects 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 18
- 238000001994 activation Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 238000004891 communication Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/60—Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
- A63F13/69—Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor by enabling or updating specific game elements, e.g. unlocking hidden features, items, levels or versions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/60—Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
- A63F13/67—Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor adaptively or by learning from player actions, e.g. skill level adjustment or by storing successful combat sequences for re-use
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/70—Game security or game management aspects
- A63F13/79—Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories
- A63F13/795—Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories for finding other players; for building a team; for providing a buddy list
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/50—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
- A63F2300/57—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers details of game services offered to the player
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Multimedia (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築するステップと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得するステップと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得するステップと、
前記N個のアイテムの識別子に基づいて、前記ユーザーに前記N個のアイテムの相関情報を推奨するステップと、を含むアイテム推奨方法を提供する。
前記アイテムの特徴表現のデータベースから前記ユーザーの特徴表現と相関性が最も高いN個のアイテムの特徴表現を検索するステップと、
前記N個のアイテムの特徴表現に対応される前記N個のアイテムの識別子を取得するステップと、を含む。
複数のトレーニングデータを収集するステップと、
前記複数のトレーニングデータを使用して、前記ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行うステップと、を含み、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法を提供する。
各前記トレーニングデータについて、前記トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得るステップと、
前記トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現を、それぞれ完全接続処理や活性化処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの特徴表現と前記トレーニングアイテムの特徴表現を乗じて、前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスを得るステップと、
前記クリック率推定のタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びsigmoid活性化関数の処理層を含む少なくとも二つの層の処理を通じて、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率を得るステップと、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数を生成するステップと、
前記総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを調整するステップと、
収束される場合は、第1の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、前記ユーザーがアイテムをクリックするタスクモデルを決定するステップと、を含む。
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスと既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第1の交差エントロピー損失関数を生成するステップと、
前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率と既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第2の交差エントロピー損失関数を生成するステップと、
前記第1の交差エントロピー損失関数と前記第2の交差エントロピー損失関数の和を求めて、前記総合的な交差エントロピー損失関数を得るステップと、を含む。
継続して前記複数のトレーニングデータを使用して、前記第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、前記リコールのタスクモジュールをトレーニングし、前記リコールのタスクモジュールのパラメータを決定して、前記リコールのタスクモジュールを決定し、前記ユーザーがアイテムをクリックするタスクモデルを決定するステップをさらに含む。
予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する構築モジュールと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する特徴取得モジュールと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースに基づいて、推奨待ちN個のアイテムの識別子を取得するアイテム取得モジュールと、
前記N個のアイテムの識別子に基づいて、前記ユーザーに前記N個のアイテムの相関情報を推奨する推奨モジュールと、を具備するアイテム推奨システムをさらに提供する。
複数のトレーニングデータを収集する収集モジュールと、
前記複数のトレーニングデータを使用して、前記ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールについて連合学習を行うトレーニングモジュールと、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む、ユーザーがアイテムをクリックするタスクモデルのトレーニング装置をさらに提供する。
少なくとも一つのプロセッサーと、
前記少なくとも一つのプロセッサーに通信接続されるメモリと、を具備して、
前記メモリには、前記少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも一つのプロセッサーによって実行されることで、上述のいずれか一項に記載の方法を前記少なくとも一つのプロセッサーに実行させることができる電子機器をさらに提供する。
アイテムの特徴表現のデータベースからユーザーの特徴表現と相関性が最も高いN個のアイテムの特徴表現を検索し、
N個のアイテムの特徴表現に対応するN個のアイテムの識別子を取得する。
各トレーニングデータについて、トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得て、
トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得て、
リコールのタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現を、それぞれ完全接続(fully connected)処理や活性化(Activation)処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得て、
リコールのタスクモジュールにおいて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を乗じて、トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスを得て、
クリック率推定のタスクモジュールにおいて、トレーニングユーザーの組み合わせ特徴表現とトレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びsigmoid活性化関数の処理層を含む少なくとも二つの層の処理を通じて、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率を得て、
トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックス、トレーニングアイテムに対するトレーニングユーザーの予測クリック確率及び既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数(Cross Entropy Loss)を生成し、
総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、ユーザーがアイテムをクリックするタスクモデルのパラメータを調整し、
収束される場合は、第1の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、ユーザーがアイテムをクリックするタスクモデルを決定する。
トレーニングユーザーに対するトレーニングアイテムの推奨度のインデックスと既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第1の交差エントロピー損失関数を生成し、
トレーニングアイテムに対するトレーニングユーザーの予測クリック確率と既知のトレーニングアイテムに対するトレーニングユーザーのクリック相互作用情報に基づいて、第2の交差エントロピー損失関数を生成し、
第1の交差エントロピー損失関数と第2の交差エントロピー損失関数の和を求めて、総合的な交差エントロピー損失関数を得る。
総合的な交差エントロピー損失関数が第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、継続して複数のトレーニングデータを使用して、第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、リコールのタスクモジュールをトレーニングし、リコールのタスクモジュールのパラメータを決定して、リコールのタスクモジュールを決定し、ユーザーがアイテムをクリックするタスクモデルを決定する。
Claims (17)
- 予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、コンピューターがアイテムの特徴表現のデータベースを構築するステップと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、前記コンピューターがユーザーの特徴表現を取得するステップと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースとに基づいて、前記コンピューターが推奨待ちN個のアイテムの識別子を取得するステップと、
前記N個のアイテムの識別子に基づいて、前記コンピューターが前記ユーザーに前記N個のアイテムの相関情報を推奨するステップと、を含む
コンピューターにより実行される、アイテム推奨方法。 - 前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースとに基づいて、前記コンピューターが推奨待ちN個のアイテムの識別子を取得するステップは、
前記アイテムの特徴表現のデータベースから前記ユーザーの特徴表現と相関性が最も高いN個のアイテムの特徴表現を前記コンピューターが検索するステップと、
前記N個のアイテムの特徴表現に対応される前記N個のアイテムの識別子を前記コンピューターが取得するステップと、を含む
請求項1に記載のアイテム推奨方法。 - 予めトレーニングされた、前記ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールとを具備し、前記リコールのタスクモジュールと前記クリック率推定のタスクモジュールの間は連合学習を受ける
請求項1又は請求項2に記載のアイテム推奨方法。 - 複数のトレーニングデータをコンピューターが収集するステップと、
前記複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールとについて前記コンピューターが連合学習を行うステップと、を含み、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む
コンピューターにより実行される、ユーザーがアイテムをクリックするタスクモデルのトレーニング方法。 - 前記複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールとについて前記コンピューターが連合学習を行うステップは、
各前記トレーニングデータについて、前記トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、前記コンピューターがトレーニングユーザーの組み合わせ特徴表現を得るステップと、
前記トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、前記コンピューターがトレーニングアイテムの組み合わせ特徴表現を得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現とを、それぞれ完全接続処理や活性化処理の処理層を含む少なくとも二つの層の処理を通じて、前記コンピューターがトレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現とを得るステップと、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの特徴表現と前記トレーニングアイテムの特徴表現とを乗じて、前記コンピューターが前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスを得るステップと、
前記クリック率推定のタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びsigmoid活性化関数の処理層を含む少なくとも二つの層の処理を通じて、前記コンピューターが前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率を得るステップと、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが総合的な交差エントロピー損失関数を生成するステップと、
前記総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを前記コンピューターが調整するステップと、
収束される場合は、第1の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、前記ユーザーがアイテムをクリックするタスクモデルを前記コンピューターが決定するステップと、を含む
請求項4に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法。 - 前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが総合的な交差エントロピー損失関数を生成するステップは、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスと既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが第1の交差エントロピー損失関数を生成するステップと、
前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率と既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、前記コンピューターが第2の交差エントロピー損失関数を生成するステップと、
前記第1の交差エントロピー損失関数と前記第2の交差エントロピー損失関数の和を求めて、前記コンピューターが前記総合的な交差エントロピー損失関数を得るステップと、を含む
請求項5に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法。 - 前記総合的な交差エントロピー損失関数が、前記第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、前記方法は、
継続して前記複数のトレーニングデータを使用して、前記第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、前記リコールのタスクモジュールをトレーニングし、前記リコールのタスクモジュールのパラメータを決定して、前記リコールのタスクモジュールを決定し、前記ユーザーがアイテムをクリックするタスクモデルを前記コンピューターが決定するステップをさらに含む
請求項6に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法。 - 予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデルと推奨待ちアイテムライブラリの中の各アイテムの少なくとも二つの特徴情報を使用して、アイテムの特徴表現のデータベースを構築する構築モジュールと、
前記予めトレーニングされた、ユーザーがアイテムをクリックするタスクモデル及びユーザーの少なくとも二つの特徴情報を使用して、ユーザーの特徴表現を取得する特徴取得モジュールと、
前記ユーザーの特徴表現と前記アイテムの特徴表現のデータベースとに基づいて、推奨待ちN個のアイテムの識別子を取得するアイテム取得モジュールと、
前記N個のアイテムの識別子に基づいて、前記ユーザーに前記N個のアイテムの相関情報を推奨する推奨モジュールと、を具備する
アイテム推奨システム。 - 前記アイテム取得モジュールは、
前記アイテムの特徴表現のデータベースから前記ユーザーの特徴表現と相関性が最も高いN個のアイテムの特徴表現を検索し、
前記N個のアイテムの特徴表現に対応される前記N個のアイテムの識別子を取得する
請求項8に記載のアイテム推奨システム。 - 予めトレーニングされた、前記ユーザーがアイテムをクリックするタスクモデルは、リコールのタスクモジュールとクリック率推定のタスクモジュールとを具備し、前記リコールのタスクモジュールと前記クリック率推定のタスクモジュールの間は連合学習を受ける
請求項8又は請求項9に記載のアイテム推奨システム。 - 複数のトレーニングデータを収集する収集モジュールと、
前記複数のトレーニングデータを使用して、ユーザーがアイテムをクリックするタスクモデルの中のリコールのタスクモジュールとクリック率推定のタスクモジュールとについて連合学習を行うトレーニングモジュールと、
各前記トレーニングデータは、トレーニングユーザーの少なくとも二つのトレーニング特徴情報、トレーニングアイテムの少なくとも二つのトレーニング特徴情報及び前記トレーニングユーザーが前記トレーニングアイテムに対するクリック相互作用情報を含む
ユーザーがアイテムをクリックするタスクモデルのトレーニング装置。 - 前記トレーニングモジュールは、
各前記トレーニングデータについて、前記トレーニングユーザーの少なくとも二つの特徴情報を埋め込み表現してからスプライシングさせ、トレーニングユーザーの組み合わせ特徴表現を得て、
前記トレーニングアイテムの少なくとも二つのトレーニング特徴情報を埋め込み表現してからスプライシングさせ、トレーニングアイテムの組み合わせ特徴表現を得て、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現とを、それぞれ完全接続処理や活性化処理の処理層を含む少なくとも二つの層の処理を通じて、トレーニングユーザーの特徴表現とトレーニングアイテムの特徴表現を得て、
前記リコールのタスクモジュールにおいて、前記トレーニングユーザーの特徴表現と前記トレーニングアイテムの特徴表現とを乗じて、前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスを得て、
前記クリック率推定のタスクモジュールにおいて、前記トレーニングユーザーの組み合わせ特徴表現と前記トレーニングアイテムの組み合わせ特徴表現をスプライシングさせ、順次に、完全接続処理や活性化処理の処理層、及びsigmoid活性化関数の処理層を含む少なくとも二つの層の処理を通じて、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率を得て、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックス、前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率及び既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、総合的な交差エントロピー損失関数を生成して、
前記総合的な交差エントロピー損失関数が収束されるか否かを判断し、収束されない場合は、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを調整して、
収束される場合は、第1の連続予定ループ数のトレーニングで全部収束されるか否かを判断し、収束される場合、前記ユーザーがアイテムをクリックするタスクモデルのパラメータを決定して、前記ユーザーがアイテムをクリックするタスクモデルを決定する
請求項11に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング装置。 - 前記トレーニングモジュールは、
前記トレーニングユーザーに対する前記トレーニングアイテムの推奨度のインデックスと既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第1の交差エントロピー損失関数を生成して、
前記トレーニングアイテムに対する前記トレーニングユーザーの予測クリック確率と既知の前記トレーニングアイテムに対する前記トレーニングユーザーのクリック相互作用情報に基づいて、第2の交差エントロピー損失関数を生成して、
前記第1の交差エントロピー損失関数と前記第2の交差エントロピー損失関数の和を求めて、前記総合的な交差エントロピー損失関数を得る
請求項12に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング装置。 - 前記トレーニングモジュールは、
前記総合的な交差エントロピー損失関数が、前記第1の連続予定ループ数のトレーニングで全部収束すると判断される場合に、継続して前記複数のトレーニングデータを使用して、前記第1の交差エントロピー損失関数が第2の連続予定ループ数のトレーニングで全部収束するまで、前記リコールのタスクモジュールをトレーニングし、前記リコールのタスクモジュールのパラメータを決定して、前記リコールのタスクモジュールを決定し、前記ユーザーがアイテムをクリックするタスクモデルを決定する
請求項13に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング装置。 - 少なくとも一つのプロセッサーと、
前記少なくとも一つのプロセッサーに通信接続されるメモリと、を具備し、
前記メモリには、前記少なくとも一つのプロセッサーによって実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも一つのプロセッサーによって実行されることで、請求項1から3のいずれか一項に記載のアイテム推奨方法または請求項4から7のいずれか一項に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法を前記少なくとも一つのプロセッサーに実行させる、電子機器。 - コンピューターに請求項1から3のいずれか一項に記載のアイテム推奨方法または請求項4から7のいずれか一項に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させるためのコンピューターコマンドが記憶されている非一時的コンピューター可読記録媒体。
- コンピューターに請求項1から3のいずれか一項に記載のアイテム推奨方法または請求項4から7のいずれか一項に記載のユーザーがアイテムをクリックするタスクモデルのトレーニング方法を実行させるためのコンピュータープログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010073347.4A CN111259222B (zh) | 2020-01-22 | 2020-01-22 | 物品推荐方法、***、电子设备及存储介质 |
CN202010073347.4 | 2020-01-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021118000A JP2021118000A (ja) | 2021-08-10 |
JP7135255B2 true JP7135255B2 (ja) | 2022-09-13 |
Family
ID=70950995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021007184A Active JP7135255B2 (ja) | 2020-01-22 | 2021-01-20 | アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210224879A1 (ja) |
EP (1) | EP3855369A3 (ja) |
JP (1) | JP7135255B2 (ja) |
KR (1) | KR102476056B1 (ja) |
CN (1) | CN111259222B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744011A (zh) * | 2020-06-17 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 物品搭配方法和物品搭配装置 |
CN112766406A (zh) * | 2021-01-29 | 2021-05-07 | 北京达佳互联信息技术有限公司 | 物品图像的处理方法、装置、计算机设备及存储介质 |
CN113360770B (zh) * | 2021-06-30 | 2024-04-12 | 北京百度网讯科技有限公司 | 内容推荐的方法、装置、设备以及存储介质 |
CN113836144B (zh) * | 2021-09-28 | 2023-01-24 | 厦门市美亚柏科信息股份有限公司 | 一种基于字段推荐数据库标准表的方法及装置 |
CN114139052B (zh) * | 2021-11-19 | 2022-10-21 | 北京百度网讯科技有限公司 | 用于智能推荐的排序模型训练方法、智能推荐方法及装置 |
CN114564496B (zh) * | 2022-03-01 | 2023-09-19 | 北京有竹居网络技术有限公司 | 一种内容推荐方法及装置 |
CN114707070A (zh) * | 2022-04-12 | 2022-07-05 | 华为技术有限公司 | 一种用户行为预测方法及其相关设备 |
CN114783563B (zh) * | 2022-05-10 | 2024-07-09 | 浙江工业大学 | 一种视觉训练的推荐方法 |
CN116578875B (zh) * | 2023-07-12 | 2023-11-10 | 深圳须弥云图空间科技有限公司 | 基于多行为的点击预测模型训练方法及装置 |
CN118170993B (zh) * | 2024-05-14 | 2024-07-12 | 云南师范大学 | 一种基于对比学习与场因子分解的教育资源推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016115316A (ja) | 2014-12-18 | 2016-06-23 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 処理装置、処理方法、推測装置、推測方法、およびプログラム |
JP2018005662A (ja) | 2016-07-05 | 2018-01-11 | ヤフー株式会社 | 情報解析装置、情報解析方法、および情報解析プログラム |
JP2018063484A (ja) | 2016-10-11 | 2018-04-19 | 凸版印刷株式会社 | ユーザ評価予測システム、ユーザ評価予測方法及びプログラム |
JP2018181326A (ja) | 2017-04-06 | 2018-11-15 | ネイバー コーポレーションNAVER Corporation | ディープラーニングを活用した個人化商品推薦 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654329A (zh) * | 2015-01-22 | 2016-06-08 | 香港中文大学深圳研究院 | 一种整合性推荐方法及装置 |
US10824941B2 (en) * | 2015-12-23 | 2020-11-03 | The Toronto-Dominion Bank | End-to-end deep collaborative filtering |
CN106169150A (zh) * | 2016-06-29 | 2016-11-30 | 广州市香港科大***研究院 | 基于用户兴趣预测的物品推荐方法和装置 |
KR20180121466A (ko) * | 2017-04-06 | 2018-11-07 | 네이버 주식회사 | 딥러닝을 활용한 개인화 상품 추천 |
US11093992B2 (en) * | 2017-05-05 | 2021-08-17 | Reai Inc. | Smart matching for real estate transactions |
CN107273438B (zh) * | 2017-05-24 | 2021-02-23 | 深圳大学 | 一种推荐方法、装置、设备及存储介质 |
CN107392644A (zh) * | 2017-06-19 | 2017-11-24 | 华南理工大学 | 一种商品购买预测建模方法 |
CN109903103B (zh) * | 2017-12-07 | 2021-08-20 | 华为技术有限公司 | 一种推荐物品的方法和装置 |
KR102061331B1 (ko) * | 2018-03-22 | 2019-12-31 | 네이버 주식회사 | 아이템 추천 방법 및 시스템 |
US20190303835A1 (en) * | 2018-03-30 | 2019-10-03 | Microsoft Technology Licensing, Llc | Entity representation learning for improving digital content recommendations |
CN109191240B (zh) * | 2018-08-14 | 2021-06-08 | 北京九狐时代智能科技有限公司 | 一种进行商品推荐的方法和装置 |
CN109191196A (zh) * | 2018-08-23 | 2019-01-11 | 深圳码隆科技有限公司 | 一种基于用户特征的商品推荐方法、装置和用户终端 |
CN109543066B (zh) * | 2018-10-31 | 2021-04-23 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置和计算机可读存储介质 |
CN109547814B (zh) * | 2018-12-13 | 2021-07-16 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、服务器及存储介质 |
CN110008399B (zh) * | 2019-01-30 | 2023-04-07 | 创新先进技术有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN109993627B (zh) * | 2019-02-28 | 2021-09-07 | 华为技术有限公司 | 推荐方法、推荐模型的训练方法、装置和存储介质 |
CN110084670B (zh) * | 2019-04-15 | 2022-03-25 | 东北大学 | 一种基于lda-mlp的货架商品组合推荐方法 |
CN110162700B (zh) * | 2019-04-23 | 2024-06-25 | 腾讯科技(深圳)有限公司 | 信息推荐及模型的训练方法、装置、设备以及存储介质 |
CN110457589B (zh) * | 2019-08-19 | 2020-05-12 | 上海新共赢信息科技有限公司 | 一种车辆推荐方法、装置、设备及存储介质 |
CN110599295B (zh) * | 2019-08-22 | 2022-04-08 | 创新先进技术有限公司 | 物品的推送方法、装置及设备 |
CN110599307A (zh) * | 2019-09-17 | 2019-12-20 | 北京三快在线科技有限公司 | 一种商品推荐的方法及装置 |
CN110674406A (zh) * | 2019-09-29 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 推荐方法、装置、电子设备及存储介质 |
-
2020
- 2020-01-22 CN CN202010073347.4A patent/CN111259222B/zh active Active
-
2021
- 2021-01-19 US US17/152,562 patent/US20210224879A1/en active Pending
- 2021-01-20 JP JP2021007184A patent/JP7135255B2/ja active Active
- 2021-01-20 EP EP21152576.1A patent/EP3855369A3/en not_active Withdrawn
- 2021-01-21 KR KR1020210008893A patent/KR102476056B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016115316A (ja) | 2014-12-18 | 2016-06-23 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 処理装置、処理方法、推測装置、推測方法、およびプログラム |
JP2018005662A (ja) | 2016-07-05 | 2018-01-11 | ヤフー株式会社 | 情報解析装置、情報解析方法、および情報解析プログラム |
JP2018063484A (ja) | 2016-10-11 | 2018-04-19 | 凸版印刷株式会社 | ユーザ評価予測システム、ユーザ評価予測方法及びプログラム |
JP2018181326A (ja) | 2017-04-06 | 2018-11-15 | ネイバー コーポレーションNAVER Corporation | ディープラーニングを活用した個人化商品推薦 |
Also Published As
Publication number | Publication date |
---|---|
JP2021118000A (ja) | 2021-08-10 |
EP3855369A2 (en) | 2021-07-28 |
CN111259222B (zh) | 2023-08-22 |
KR102476056B1 (ko) | 2022-12-08 |
CN111259222A (zh) | 2020-06-09 |
US20210224879A1 (en) | 2021-07-22 |
KR20210095579A (ko) | 2021-08-02 |
EP3855369A3 (en) | 2022-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7135255B2 (ja) | アイテム推奨方法、システム、プログラム、電子機器及び記憶媒体 | |
JP7076030B2 (ja) | ユーザーインタラクション情報処理モデルの生成方法と装置、ユーザーインタラクション情報処理方法と装置、設備、媒体、及びプログラム | |
JP7316453B2 (ja) | オブジェクト推薦方法及び装置、コンピュータ機器並びに媒体 | |
US11551239B2 (en) | Characterizing and modifying user experience of computing environments based on behavior logs | |
US20180285759A1 (en) | Online hyperparameter tuning in distributed machine learning | |
CN111582479B (zh) | 神经网络模型的蒸馏方法和装置 | |
JP2022023776A (ja) | オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム | |
JP7262539B2 (ja) | 会話推薦方法、装置及び機器 | |
US10102503B2 (en) | Scalable response prediction using personalized recommendation models | |
CN111311321B (zh) | 用户消费行为预测模型训练方法、装置、设备及存储介质 | |
CN112632403B (zh) | 推荐模型的训练方法、推荐方法、装置、设备和介质 | |
EP3353670A1 (en) | Regularized model adaptation for in-session recommendations | |
US20190228105A1 (en) | Dynamic website content optimization | |
JP2021064348A (ja) | ユーザークリックモデルのトレーニング方法、装置、電子機器、及び記憶媒体 | |
CN112163676A (zh) | 多任务服务预测模型训练方法、装置、设备以及存储介质 | |
US11947578B2 (en) | Method for retrieving multi-turn dialogue, storage medium, and electronic device | |
CN111324715A (zh) | 问答机器人的生成方法和装置 | |
CN112288483A (zh) | 用于训练模型的方法和装置、用于生成信息的方法和装置 | |
Jain et al. | Know your action set: Learning action relations for reinforcement learning | |
CN111311000B (zh) | 用户消费行为预测模型训练方法、装置、设备及存储介质 | |
Yin et al. | Predicting changes in user-driven requirements using conditional random fields in agile software development | |
JP7128311B2 (ja) | 文書種別の推奨方法、装置、電子機器、可読記憶媒体及びコンピュータプログラム製品 | |
CN115563399A (zh) | 利用协同过滤、强化学习和消极反馈的包容性集合来生成数字推荐 | |
US20230394095A1 (en) | Systems and methods for a search tool of code snippets | |
CN117541323A (zh) | 用于训练模型的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220809 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7135255 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |