CN116167829A - 一种多维多粒度用户行为分析方法 - Google Patents
一种多维多粒度用户行为分析方法 Download PDFInfo
- Publication number
- CN116167829A CN116167829A CN202310461608.3A CN202310461608A CN116167829A CN 116167829 A CN116167829 A CN 116167829A CN 202310461608 A CN202310461608 A CN 202310461608A CN 116167829 A CN116167829 A CN 116167829A
- Authority
- CN
- China
- Prior art keywords
- user
- webpage
- software
- behavior
- click
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及用户行为分析的技术领域,揭露了一种多维多粒度用户行为分析方法,所述方法包括:采集线上用户行为数据,并将所采集线上用户行为数据构建为用户多维行为轨迹;将用户多维行为轨迹输入到用户群体识别模型,识别得到用户的群体类别;构建多粒度用户点击意向模型,得到不同类别用户对不同页面的意向程度;按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐页面。本发明通过结合用户对网页以及软件的点击频率特征以及时序特征构建得到用户多维行为轨迹,进而基于用户行为实现用户群体识别,根据同一类别用户网页点击时序矩阵的消息递归以及聚合处理得到用户对不同网页的意向程度,进而进行页面推荐。
Description
技术领域
本发明涉及用户行为分析的技术领域,尤其涉及一种多维多粒度用户行为分析方法。
背景技术
随着智能设备、5G等相关产业日趋成熟,用户在线行为的数据规模快速扩大,个人信息泄露、匿名用户身份难以识别等诸多问题日益凸显。然而,传统的在线用户行为分析模型往往针对特定的数据构建,无法结合多维数据进行分析处理,并且需要耗费大量人力物力提取特征,存在提取的特征主观性强、数据噪声大等局限性引起用户网上购物体验性差,无法为用户提供良好的商品推荐。针对该问题,本发明提出一种多维多粒度用户行为分析方法,结合多种类型线上数据对用户行为进行分析,为商品推荐提供有力技术支撑。
发明内容
有鉴于此,本发明提供一种多维多粒度用户行为分析方法,目的在于:1)以用户对不同网页或软件的点击频率、点击总次数为筛选条件,筛选得到候选网页行为轨迹点以及候选软件行为轨迹点,其中点击频率总次数越高、点击频率越大,被判断为轨迹点的概率越大,并通过计算候选轨迹点中任意两个轨迹点同时点击的概率,确定候选行为轨迹的置信度,置信度越高表示该候选行为轨迹中任意两个轨迹点之间的关联性越强,否则表示存在偶然性的轨迹点,进而从网页或软件的点击频率特征以及时序特征构建得到包含用户网页行为轨迹以及用户软件行为轨迹的用户多维行为轨迹;2)构建多粒度用户点击意向模型,通过初始化同一类别用户的用户参数以及网页参数,并搭建消息传播体系,对用户参数以及网页参数执行嵌入递归传播,进而将用户的网页点击时序矩阵同结合点击频率的编码表示进行聚合处理,得到该类用户对不同网页的内积计算表示,即多轮消息传递后该类用户对不同网页点击频率的时序编码表示同网页在向量空间的角度,并将内积计算表示作为同一类别用户对不同网页的意向程度,通过将网页映射到商品页面,将网页意向程度作为映射后商品页面的意向程度,为商品推荐提供有力技术支撑。
实现上述目的,本发明提供的一种多维多粒度用户行为分析方法,包括以下步骤:
S1:采集线上用户行为数据,并将所采集线上用户行为数据构建为用户多维行为轨迹,所述线上用户行为数据包括网页点击数据以及软件点击数据;
S2:构建并训练得到用户群体识别模型,将用户多维行为轨迹输入到用户群体识别模型,识别得到用户的群体类别,所述用户群体识别模型以用户多维行为轨迹为输入,以最大化用户群体分布为训练目标函数;
S3:构建多粒度用户点击意向模型,所述多粒度点击意向模型以同一类别的用户多维行为轨迹集合为输入,以该类别用户对不同页面的意向程度为输出;
S4:根据识别得到的用户群体类别,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐页面。
作为本发明的进一步改进方法:
可选地,所述S1步骤中采集线上用户行为数据,包括:
采集线上用户行为数据,所述线上用户行为数据包括网页点击数据以及软件点击数据,其中线上用户行为数据的采集流程为:
其中:
统计网页点击统计表中每个常见网页的用户总点击次数:
其中:
将网页点击统计表中每个常见网页的用户总点击次数和点击时序数据作为网页点击数据;
统计软件点击统计表中每个常见软件的用户总点击次数:
其中:
将软件点击统计表中每个常见软件的用户总点击次数和点击时序数据作为软件点击数据;
将网页点击数据以及软件点击数据构建为线上用户行为数据。在本发明实施例中,若用户在时段运行并点击第j个常见软件或常见网页的界面,则标记用户在该时段点击第j个常见软件或常见网页,用户在采集时间范围运行并点击常见软件或常见网页界面的总次数即为用户总点击次数。
可选地,所述S1步骤中将所采集线上用户行为数据构建为用户多维行为轨迹,包括:
将所采集线上用户行为数据构建为用户多维行为轨迹,其中用户多维轨迹的构建流程为:
S11:计算用户在采集时间范围内对任意网页以及软件的点击频率:
其中:
S14:将步骤S13中所保留的网页进行两两结合,并计算用户在采集时间范围内同时点击网页结合结果的点击频率,返回步骤S13,直到无法保留新的网页结合结果;
将步骤S13中所保留的软件进行两两结合,并计算用户在采集时间范围内同时点击软件结合结果的点击频率,返回步骤S13,直到无法保留新的软件结合结果;
S15:分别构建得到用户的网页点击时序矩阵A以及软件点击时序矩阵B:
计算得到用户点击任意第i个网页的时段内同时点击第i+1个网页的概率,作为第i个网页同第i+1个网页之间的置信度;
计算得到用户点击任意第j个软件的时段内同时点击第j+1个软件的概率,作为第j个软件同第j+1个软件之间的置信度;
计算步骤S14中所保留网页结合结果中任意两个网页的置信度,并将置信度均值作为所保留网页结合结果的置信度,选取置信度大于等于置信度阈值的网页结合结果作为候选网页行为轨迹,选取候选网页行为轨迹中网页数目最多的轨迹作为用户网页行为轨迹;
计算步骤S14中所保留软件结合结果中任意两个软件的置信度,并将置信度均值作为所保留软件结合结果的置信度,选取置信度大于等于置信度阈值的软件结合结果作为候选软件行为轨迹,选取候选软件行为轨迹中软件数目最多的轨迹作为用户软件行为轨迹;/>
可选地,所述S2步骤中构建得到用户群体识别模型,包括:构建得到用户群体识别模型,所构建用户群体识别模型的输入为待识别用户的用户多维行为轨迹,输出结果为用户的群体类别,所述基于用户群体识别模型的群体类别识别公式为:
其中:
可选地,所述S2步骤中对所构建的用户群体识别模型进行训练,包括:
对所构建的用户群体识别模型进行训练,其中训练流程为:
S21:获取M个用户的线上用户行为数据并提取用户多维行为轨迹,所获取的用户多维行为轨迹互不重复,其中用户多维行为轨迹的获取流程为步骤S1,在本发明实施例中,所获取的M个用户多维行为轨迹的采集时间范围长度相同;
S22:对M个用户多维行为轨迹进行用户群体类别标记,在本发明实施例中,用户群体类别包括游戏用户、新闻用户、电影用户、综艺用户等;
S23:构建用户群体识别模型的训练目标函数:
其中:
可选地,所述S2步骤中将用户多维行为轨迹输入到用户群体识别模型,识别得到用户的群体类别,包括:
可选地,所述S3步骤中构建多粒度用户点击意向模型,包括:
构建多粒度用户点击意向模型,所述多粒度点击意向模型以同一类别的用户多维行为轨迹集合为输入,以该类别用户对不同页面的意向程度为输出;
所构建多粒度用户点击意向模型包括嵌入层、传播层以及输出层,嵌入层用于初始化同一类别用户的用户参数以及网页参数,传播层用于搭建消息传播体系,同一类别的用户参数以及网页参数执行嵌入传播,输出层用于评估同一类别用户对不同网页的意向程度,并将网页映射到商品页面,将网页意向程度作为映射后商品页面的意向程度;在本发明实施例中,网页中所具体描述的内容同映射后商品页面中展示的商品相同;
提取步骤S2中M个用户的网页点击时序矩阵,并将同一类别用户的网页点击时序矩阵作为一组,逐组构建得到多粒度用户点击意向模型,第y组对应的多粒度用户点击意向模型构建流程为:
S32:嵌入层构建用户参数与网页参数的初始编码:
其中:
S33:传播层基于嵌入层的用户参数、网页参数以及初始编码进行消息递归表示:
S34:输出层对传播层的传播结果进行聚合处理:
其中:
S35:计算得到和/>的内积表示,并分别计算得到/>与/>个网页参数的内积表示,利用归一化处理对/>个网页参数的内积表示进行归一化处理,归一化处理结果即为对应的网页参数的意向程度;将网页映射到商品页面,将网页意向程度作为映射后商品页面的意向程度。
可选地,所述S4步骤中根据识别得到的用户群体类别,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐页面,包括:
根据步骤S2识别得到的用户群体类别,基于多粒度用户点击意向模型输出的该类别用户对不同页面的意向程度,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐商品页面。
为了解决上述问题,本发明提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;
通信接口,实现电子设备通信;及处理器,执行所述存储器中存储的指令以实现上述所述的多维多粒度用户行为分析方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的多维多粒度用户行为分析方法。
相对于现有技术,本发明提出一种多维多粒度用户行为分析方法,该技术具有以下优势:首先,本方案提出一种用户多维行为轨迹构建流程,通过计算用户在采集时间范围内对任意网页以及软件的点击频率:
其中:表示用户对第i个常见网页的点击频率,/>表示用户对第j个常见软件的点击频率;分别为网页以及软件设置最小点击频率值/>,其中/>表示网页的最小点击频率值,/>表示软件的最小点击频率值;保留点击频率大于/>的网页;保留点击频率大于/>的软件;将所保留的网页进行两两结合,并计算用户在采集时间范围内同时点击网页结合结果的点击频率,直到无法保留新的网页结合结果;将所保留的软件进行两两结合,并计算用户在采集时间范围内同时点击软件结合结果的点击频率,直到无法保留新的软件结合结果;分别构建得到用户的网页点击时序矩阵A以及软件点击时序矩阵B:
计算得到用户点击任意第i个网页的时段内同时点击第i+1个网页的概率,作为第i个网页同第i+1个网页之间的置信度;计算得到用户点击任意第j个软件的时段内同时点击第j+1个软件的概率,作为第j个软件同第j+1个软件之间的置信度;设置置信度阈值为;计算所保留网页结合结果中任意两个网页的置信度,并将置信度均值作为所保留网页结合结果的置信度,选取置信度大于等于置信度阈值/>的网页结合结果作为候选网页行为轨迹,选取候选网页行为轨迹中网页数目最多的轨迹作为用户网页行为轨迹;计算所保留软件结合结果中任意两个软件的置信度,并将置信度均值作为所保留软件结合结果的置信度,选取置信度大于等于置信度阈值/>的软件结合结果作为候选软件行为轨迹,选取候选软件行为轨迹中软件数目最多的轨迹作为用户软件行为轨迹;过滤用户网页行为轨迹中的重复网页;过滤用户软件行为轨迹中的重复软件;得到用户多维行为轨迹/>,其中表示过滤后的用户网页行为轨迹,/>表示过滤后的用户软件行为轨迹。本方案以用户对不同网页或软件的点击频率、点击总次数为筛选条件,筛选得到候选网页行为轨迹点以及候选软件行为轨迹点,其中点击频率总次数越高、点击频率越大,被判断为轨迹点的概率越大,并通过计算候选轨迹点中任意两个轨迹点同时点击的概率,确定候选行为轨迹的置信度,置信度越高表示该候选行为轨迹中任意两个轨迹点之间的关联性越强,否则表示存在偶然性的轨迹点,进而从网页或软件的点击频率特征以及时序特征构建得到包含用户网页行为轨迹以及用户软件行为轨迹的用户多维行为轨迹。
同时,本方案提出一种页面推荐方法,通过构建多粒度用户点击意向模型,所述多粒度点击意向模型以同一类别的用户多维行为轨迹集合为输入,以该类别用户对不同页面的意向程度为输出;嵌入层初始化第y组用户的网页点击时序矩阵作为用户参数,并初始化用户参数中出现的网页ID名称作为网页参数,其中第y组用户的网页点击时序矩阵数目为,网页ID名称数目为/>;嵌入层构建用户参数与网页参数的初始编码:
其中:表示用户参数传播结果的聚合处理结果;/>表示第c个网页参数/>的聚合处理结果;计算得到/>和/>的内积表示,并分别计算得到/>与/>个网页参数的内积表示,利用归一化处理对/>个网页参数的内积表示进行归一化处理,归一化处理结果即为对应的网页参数的意向程度;将网页映射到商品页面,将网页意向程度作为映射后商品页面的意向程度。本方案通过初始化同一类别用户的用户参数以及网页参数,并搭建消息传播体系,对用户参数以及网页参数执行嵌入递归传播,进而将用户的网页点击时序矩阵同结合点击频率的编码表示进行聚合处理,得到该类用户对不同网页的内积计算表示,即多轮消息传递后该类用户对不同网页点击频率的时序编码表示同网页在向量空间的角度,并将内积计算表示作为同一类别用户对不同网页的意向程度,通过将网页映射到商品页面,将网页意向程度作为映射后商品页面的意向程度,为商品推荐提供有力技术支撑。
附图说明
图1为本发明一实施例提供的一种多维多粒度用户行为分析方法的流程示意图;
图2为本发明一实施例提供的实现多维多粒度用户行为分析方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种多维多粒度用户行为分析方法。所述多维多粒度用户行为分析方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述多维多粒度用户行为分析方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
实施例1
S1:采集线上用户行为数据,并将所采集线上用户行为数据构建为用户多维行为轨迹,所述线上用户行为数据包括网页点击数据以及软件点击数据。
所述S1步骤中采集线上用户行为数据,包括:
采集线上用户行为数据,所述线上用户行为数据包括网页点击数据以及软件点击数据,其中线上用户行为数据的采集流程为:
其中:
统计网页点击统计表中每个常见网页的用户总点击次数:
其中:
将网页点击统计表中每个常见网页的用户总点击次数和点击时序数据作为网页点击数据;
其中:
统计软件点击统计表中每个常见软件的用户总点击次数:
其中:
将软件点击统计表中每个常见软件的用户总点击次数和点击时序数据作为软件点击数据;
将网页点击数据以及软件点击数据构建为线上用户行为数据。在本发明实施例中,若用户在时段运行并点击第j个常见软件或常见网页的界面,则标记用户在该时段点击第j个常见软件或常见网页,用户在采集时间范围运行并点击常见软件或常见网页界面的总次数即为用户总点击次数。
所述S1步骤中将所采集线上用户行为数据构建为用户多维行为轨迹,包括:
将所采集线上用户行为数据构建为用户多维行为轨迹,其中用户多维轨迹的构建流程为:
S11:计算用户在采集时间范围内对任意网页以及软件的点击频率:
其中:
S14:将步骤S13中所保留的网页进行两两结合,并计算用户在采集时间范围内同时点击网页结合结果的点击频率,返回步骤S13,直到无法保留新的网页结合结果;
将步骤S13中所保留的软件进行两两结合,并计算用户在采集时间范围内同时点击软件结合结果的点击频率,返回步骤S13,直到无法保留新的软件结合结果;
S15:分别构建得到用户的网页点击时序矩阵A以及软件点击时序矩阵B:
计算得到用户点击任意第i个网页的时段内同时点击第i+1个网页的概率,作为第i个网页同第i+1个网页之间的置信度;
计算得到用户点击任意第j个软件的时段内同时点击第j+1个软件的概率,作为第j个软件同第j+1个软件之间的置信度;
计算步骤S14中所保留网页结合结果中任意两个网页的置信度,并将置信度均值作为所保留网页结合结果的置信度,选取置信度大于等于置信度阈值的网页结合结果作为候选网页行为轨迹,选取候选网页行为轨迹中网页数目最多的轨迹作为用户网页行为轨迹;
计算步骤S14中所保留软件结合结果中任意两个软件的置信度,并将置信度均值作为所保留软件结合结果的置信度,选取置信度大于等于置信度阈值的软件结合结果作为候选软件行为轨迹,选取候选软件行为轨迹中软件数目最多的轨迹作为用户软件行为轨迹;
S2:构建并训练得到用户群体识别模型,将用户多维行为轨迹输入到用户群体识别模型,识别得到用户的群体类别,所述用户群体识别模型以用户多维行为轨迹为输入,以最大化用户群体分布为训练目标函数。
所述S2步骤中构建得到用户群体识别模型,包括:构建得到用户群体识别模型,所构建用户群体识别模型的输入为待识别用户的用户多维行为轨迹,输出结果为用户的群体类别,所述基于用户群体识别模型的群体类别识别公式为:
其中:
所述S2步骤中对所构建的用户群体识别模型进行训练,包括:
对所构建的用户群体识别模型进行训练,其中训练流程为:
S21:获取M个用户的线上用户行为数据并提取用户多维行为轨迹,所获取的用户多维行为轨迹互不重复,其中用户多维行为轨迹的获取流程为步骤S1在本发明实施例中,所获取的M个用户多维行为轨迹的采集时间范围长度相同;
S22:对M个用户多维行为轨迹进行用户群体类别标记,在本发明实施例中,用户群体类别包括游戏用户、新闻用户、电影用户、综艺用户等;
S23:构建用户群体识别模型的训练目标函数:
所述S2步骤中将用户多维行为轨迹输入到用户群体识别模型,识别得到用户的群体类别,包括:
S3:构建多粒度用户点击意向模型,所述多粒度点击意向模型以同一类别的用户多维行为轨迹集合为输入,以该类别用户对不同页面的意向程度为输出。
所述S3步骤中构建多粒度用户点击意向模型,包括:
构建多粒度用户点击意向模型,所述多粒度点击意向模型以同一类别的用户多维行为轨迹集合为输入,以该类别用户对不同页面的意向程度为输出;
所构建多粒度用户点击意向模型包括嵌入层、传播层以及输出层,嵌入层用于初始化同一类别用户的用户参数以及网页参数,传播层用于搭建消息传播体系,同一类别的用户参数以及网页参数执行嵌入传播,输出层用于评估同一类别用户对不同网页的意向程度,并将网页映射到商品页面,将网页意向程度作为映射后商品页面的意向程度;在本发明实施例中,网页中所具体描述的内容同映射后商品页面中展示的商品相同;
提取步骤S2中M个用户的网页点击时序矩阵,并将同一类别用户的网页点击时序矩阵作为一组,逐组构建得到多粒度用户点击意向模型,第y组对应的多粒度用户点击意向模型构建流程为:
S32:嵌入层构建用户参数与网页参数的初始编码:
其中:
S33:传播层基于嵌入层的用户参数、网页参数以及初始编码进行消息递归表示:
其中:
S34:输出层对传播层的传播结果进行聚合处理:
其中:
S35:计算得到和/>的内积表示,并分别计算得到/>与/>个网页参数的内积表示,利用归一化处理对/>个网页参数的内积表示进行归一化处理,归一化处理结果即为对应的网页参数的意向程度;将网页映射到商品页面,将网页意向程度作为映射后商品页面的意向程度。
S4:根据识别得到的用户群体类别,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐页面。
所述S4步骤中根据识别得到的用户群体类别,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐页面,包括:
根据步骤S2识别得到的用户群体类别,基于多粒度用户点击意向模型输出的该类别用户对不同页面的意向程度,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐商品页面。
实施例2
如图2所示,是本发明一实施例提供的实现多维多粒度用户行为分析方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11、通信接口13和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(SecureDigital, SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(用于实现用户行为分析的程序12等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述通信接口13可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接,并实现电子设备内部组件之间的连接通信。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图2仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图2示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
采集线上用户行为数据,并将所采集线上用户行为数据构建为用户多维行为轨迹;
构建并训练得到用户群体识别模型,将用户多维行为轨迹输入到用户群体识别模型,识别得到用户的群体类别;
构建多粒度用户点击意向模型;
根据识别得到的用户群体类别,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐页面。
具体地,所述处理器10对上述指令的具体实现方法可参考图1至图2对应实施例中相关步骤的描述,在此不赘述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种多维多粒度用户行为分析方法,其特征在于,所述方法包括:
S1:采集线上用户行为数据,并将所采集线上用户行为数据构建为用户多维行为轨迹,所述线上用户行为数据包括网页点击数据以及软件点击数据;
S2:构建并训练得到用户群体识别模型,将用户多维行为轨迹输入到用户群体识别模型,识别得到用户的群体类别,所述用户群体识别模型以用户多维行为轨迹为输入,以最大化用户群体分布为训练目标函数;
S3:构建多粒度用户点击意向模型,所述多粒度点击意向模型以同一类别的用户多维行为轨迹集合为输入,以该类别用户对不同页面的意向程度为输出;
S4:根据识别得到的用户群体类别,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐页面。
2.如权利要求1所述的一种多维多粒度用户行为分析方法,其特征在于,所述S1步骤中采集线上用户行为数据,包括:
采集线上用户行为数据,所述线上用户行为数据包括网页点击数据以及软件点击数据,其中线上用户行为数据的采集流程为:
其中:
统计网页点击统计表中每个常见网页的用户总点击次数:
其中:
将网页点击统计表中每个常见网页的用户总点击次数和点击时序数据作为网页点击数据;
其中:
统计软件点击统计表中每个常见软件的用户总点击次数:
其中:
将软件点击统计表中每个常见软件的用户总点击次数和点击时序数据作为软件点击数据;
将网页点击数据以及软件点击数据构建为线上用户行为数据。
3.如权利要求2所述的一种多维多粒度用户行为分析方法,其特征在于,所述S1步骤中将所采集线上用户行为数据构建为用户多维行为轨迹,包括:
将所采集线上用户行为数据构建为用户多维行为轨迹,其中用户多维轨迹的构建流程为:
S11:计算用户在采集时间范围内对任意网页以及软件的点击频率:
其中:
S14:将步骤S13中所保留的网页进行两两结合,并计算用户在采集时间范围内同时点击网页结合结果的点击频率,返回步骤S13,直到无法保留新的网页结合结果;
将步骤S13中所保留的软件进行两两结合,并计算用户在采集时间范围内同时点击软件结合结果的点击频率,返回步骤S13,直到无法保留新的软件结合结果;
S15:分别构建得到用户的网页点击时序矩阵A以及软件点击时序矩阵B:
计算得到用户点击任意第i个网页的时段内同时点击第i+1个网页的概率,作为第i个网页同第i+1个网页之间的置信度;
计算得到用户点击任意第j个软件的时段内同时点击第j+1个软件的概率,作为第j个软件同第j+1个软件之间的置信度;
计算步骤S14中所保留网页结合结果中任意两个网页的置信度,并将置信度均值作为所保留网页结合结果的置信度,选取置信度大于等于置信度阈值的网页结合结果作为候选网页行为轨迹,选取候选网页行为轨迹中网页数目最多的轨迹作为用户网页行为轨迹;
计算步骤S14中所保留软件结合结果中任意两个软件的置信度,并将置信度均值作为所保留软件结合结果的置信度,选取置信度大于等于置信度阈值的软件结合结果作为候选软件行为轨迹,选取候选软件行为轨迹中软件数目最多的轨迹作为用户软件行为轨迹;
4.如权利要求1所述的一种多维多粒度用户行为分析方法,其特征在于,所述S2步骤中构建得到用户群体识别模型,包括:
构建得到用户群体识别模型,所构建用户群体识别模型的输入为待识别用户的用户多维行为轨迹,输出结果为用户的群体类别,所述基于用户群体识别模型的群体类别识别公式为:
其中:
5.如权利要求4所述的一种多维多粒度用户行为分析方法,其特征在于,所述S2步骤中对所构建的用户群体识别模型进行训练,包括:
对所构建的用户群体识别模型进行训练,其中训练流程为:
S21:获取M个用户的线上用户行为数据并提取用户多维行为轨迹,所获取的用户多维行为轨迹互不重复,其中用户多维行为轨迹的获取流程为步骤S1;
S22:对M个用户多维行为轨迹进行用户群体类别标记;
S23:构建用户群体识别模型的训练目标函数:
其中:
7.如权利要求1所述的一种多维多粒度用户行为分析方法,其特征在于,所述S3步骤中构建多粒度用户点击意向模型,包括:
构建多粒度用户点击意向模型,所述多粒度点击意向模型以同一类别的用户多维行为轨迹集合为输入,以该类别用户对不同页面的意向程度为输出;
所构建多粒度用户点击意向模型包括嵌入层、传播层以及输出层,嵌入层用于初始化同一类别用户的用户参数以及网页参数,传播层用于搭建消息传播体系,同一类别的用户参数以及网页参数执行嵌入传播,输出层用于评估同一类别用户对不同网页的意向程度,并将网页映射到商品页面,将网页意向程度作为映射后商品页面的意向程度;
提取步骤S2中M个用户的网页点击时序矩阵,并将同一类别用户的网页点击时序矩阵作为一组,逐组构建得到多粒度用户点击意向模型,第y组对应的多粒度用户点击意向模型构建流程为:
S32:嵌入层构建用户参数与网页参数的初始编码:
其中:
S33:传播层基于嵌入层的用户参数、网页参数以及初始编码进行消息递归表示:
其中:
S34:输出层对传播层的传播结果进行聚合处理:
其中:
8.如权利要求7所述的一种多维多粒度用户行为分析方法,其特征在于,所述S4步骤中根据识别得到的用户群体类别,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐页面,包括:
根据步骤S2识别得到的用户群体类别,基于多粒度用户点击意向模型输出的该类别用户对不同页面的意向程度,按照该类别用户对不同页面的意向程度由高到低排序,并按顺序依次向用户推荐商品页面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310461608.3A CN116167829B (zh) | 2023-04-26 | 2023-04-26 | 一种多维多粒度用户行为分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310461608.3A CN116167829B (zh) | 2023-04-26 | 2023-04-26 | 一种多维多粒度用户行为分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116167829A true CN116167829A (zh) | 2023-05-26 |
CN116167829B CN116167829B (zh) | 2023-08-29 |
Family
ID=86416810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310461608.3A Active CN116167829B (zh) | 2023-04-26 | 2023-04-26 | 一种多维多粒度用户行为分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116167829B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262661A (zh) * | 2011-07-18 | 2011-11-30 | 南京大学 | 一种基于k阶混合马尔可夫模型的Web页面访问预测方法 |
CN104462156A (zh) * | 2013-09-25 | 2015-03-25 | 阿里巴巴集团控股有限公司 | 一种基于用户行为的特征提取、个性化推荐方法和*** |
CN106383895A (zh) * | 2016-09-27 | 2017-02-08 | 北京金山安全软件有限公司 | 信息推荐方法、装置以及终端设备 |
US20190362408A1 (en) * | 2018-05-25 | 2019-11-28 | Target Brands, Inc. | Personalized recommendations for unidentified users based on web browsing context |
CN110825956A (zh) * | 2019-09-17 | 2020-02-21 | 中国平安人寿保险股份有限公司 | 一种信息流推荐方法、装置、计算机设备及存储介质 |
CN111294620A (zh) * | 2020-01-22 | 2020-06-16 | 北京达佳互联信息技术有限公司 | 视频的推荐方法及装置 |
WO2021139638A1 (zh) * | 2020-01-06 | 2021-07-15 | 阿里巴巴集团控股有限公司 | 行为数据的处理方法和***、存储介质及处理器 |
CN113886204A (zh) * | 2021-09-29 | 2022-01-04 | 平安普惠企业管理有限公司 | 用户行为数据收集方法、装置、电子设备及可读存储介质 |
CN114266625A (zh) * | 2021-12-21 | 2022-04-01 | 中国平安财产保险股份有限公司 | 基于新用户的推荐方法、装置、设备及存储介质 |
CN114637917A (zh) * | 2022-03-28 | 2022-06-17 | 中国银行股份有限公司 | 基于人工智能的资讯头条推荐方法及装置 |
CN115098789A (zh) * | 2022-08-05 | 2022-09-23 | 湖南工商大学 | 基于神经网络的多维兴趣融合推荐方法、装置及相关设备 |
US20220405641A1 (en) * | 2019-10-31 | 2022-12-22 | Bigo Technology Pte. Ltd. | Method for recommending information, recommendation server, and storage medium |
US20230009814A1 (en) * | 2020-08-28 | 2023-01-12 | Tencent Technology (Shenzhen) Company Limited | Method for training information recommendation model and related apparatus |
-
2023
- 2023-04-26 CN CN202310461608.3A patent/CN116167829B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262661A (zh) * | 2011-07-18 | 2011-11-30 | 南京大学 | 一种基于k阶混合马尔可夫模型的Web页面访问预测方法 |
CN104462156A (zh) * | 2013-09-25 | 2015-03-25 | 阿里巴巴集团控股有限公司 | 一种基于用户行为的特征提取、个性化推荐方法和*** |
CN106383895A (zh) * | 2016-09-27 | 2017-02-08 | 北京金山安全软件有限公司 | 信息推荐方法、装置以及终端设备 |
US20190362408A1 (en) * | 2018-05-25 | 2019-11-28 | Target Brands, Inc. | Personalized recommendations for unidentified users based on web browsing context |
CN110825956A (zh) * | 2019-09-17 | 2020-02-21 | 中国平安人寿保险股份有限公司 | 一种信息流推荐方法、装置、计算机设备及存储介质 |
US20220405641A1 (en) * | 2019-10-31 | 2022-12-22 | Bigo Technology Pte. Ltd. | Method for recommending information, recommendation server, and storage medium |
WO2021139638A1 (zh) * | 2020-01-06 | 2021-07-15 | 阿里巴巴集团控股有限公司 | 行为数据的处理方法和***、存储介质及处理器 |
CN111294620A (zh) * | 2020-01-22 | 2020-06-16 | 北京达佳互联信息技术有限公司 | 视频的推荐方法及装置 |
US20230009814A1 (en) * | 2020-08-28 | 2023-01-12 | Tencent Technology (Shenzhen) Company Limited | Method for training information recommendation model and related apparatus |
CN113886204A (zh) * | 2021-09-29 | 2022-01-04 | 平安普惠企业管理有限公司 | 用户行为数据收集方法、装置、电子设备及可读存储介质 |
CN114266625A (zh) * | 2021-12-21 | 2022-04-01 | 中国平安财产保险股份有限公司 | 基于新用户的推荐方法、装置、设备及存储介质 |
CN114637917A (zh) * | 2022-03-28 | 2022-06-17 | 中国银行股份有限公司 | 基于人工智能的资讯头条推荐方法及装置 |
CN115098789A (zh) * | 2022-08-05 | 2022-09-23 | 湖南工商大学 | 基于神经网络的多维兴趣融合推荐方法、装置及相关设备 |
Non-Patent Citations (3)
Title |
---|
QIWEI CHEN: "End-to-End user behavior retrieval in click-through rate prediction model", 《COMPUTING MACHINERY》, pages 1 - 11 * |
YUNPENG XIAO 等: "A click-through rate model of e-commerce based on user interest and temporal behavior", 《EXPERT SYSTEMS WITH APPLICATIONS》, pages 1 - 13 * |
陈冬林: "基于客户web时空行为轨迹的兴趣点预测方法", 《科技导报》, pages 74 - 79 * |
Also Published As
Publication number | Publication date |
---|---|
CN116167829B (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271512B (zh) | 舆情评论信息的情感分析方法、装置及存储介质 | |
CN106874253A (zh) | 识别敏感信息的方法及装置 | |
CN112733023A (zh) | 资讯推送方法、装置、电子设备及计算机可读存储介质 | |
CN114398557B (zh) | 基于双画像的信息推荐方法、装置、电子设备及存储介质 | |
CN112883730B (zh) | 相似文本匹配方法、装置、电子设备及存储介质 | |
CN114491047A (zh) | 多标签文本分类方法、装置、电子设备及存储介质 | |
CN112328657A (zh) | 特征衍生方法、装置、计算机设备及介质 | |
CN115391669A (zh) | 一种智能推荐方法、装置、电子设备 | |
CN113343306B (zh) | 基于差分隐私的数据查询方法、装置、设备及存储介质 | |
CN113505273B (zh) | 基于重复数据筛选的数据排序方法、装置、设备及介质 | |
CN108875050B (zh) | 面向文本的数字取证分析方法、装置和计算机可读介质 | |
CN110968802A (zh) | 一种用户特征的分析方法、分析装置及可读存储介质 | |
CN110929169A (zh) | 基于改进Canopy聚类协同过滤算法的职位推荐方法 | |
CN111652282B (zh) | 基于大数据的用户偏好分析方法、装置及电子设备 | |
CN108345620B (zh) | 品牌信息处理方法、装置、存储介质及电子设备 | |
CN110674020B (zh) | App智能推荐方法、装置及计算机可读存储介质 | |
CN111950623A (zh) | 数据稳定性监控方法、装置、计算机设备及介质 | |
CN116167829B (zh) | 一种多维多粒度用户行为分析方法 | |
CN113918577B (zh) | 数据表识别方法、装置、电子设备及存储介质 | |
CN116168403A (zh) | 医疗数据分类模型训练方法、分类方法、装置及相关介质 | |
CN115641186A (zh) | 直播产品偏好的智能分析方法、装置、设备及存储介质 | |
CN113076450A (zh) | 一种目标推荐列表的确定方法和装置 | |
CN113051475B (zh) | 内容推荐方法、装置、电子设备及可读存储介质 | |
CN113592606B (zh) | 基于多重决策的产品推荐方法、装置、设备及存储介质 | |
CN114723488B (zh) | 课程推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |