CN113128597A - 一种用户行为特征的提取和分类预测的方法及装置 - Google Patents

一种用户行为特征的提取和分类预测的方法及装置 Download PDF

Info

Publication number
CN113128597A
CN113128597A CN202110432496.XA CN202110432496A CN113128597A CN 113128597 A CN113128597 A CN 113128597A CN 202110432496 A CN202110432496 A CN 202110432496A CN 113128597 A CN113128597 A CN 113128597A
Authority
CN
China
Prior art keywords
behavior
target user
target
vector
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110432496.XA
Other languages
English (en)
Other versions
CN113128597B (zh
Inventor
朱海洋
周俊
陈为
严凡
钱中昊
夏祯锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongda Group Co ltd
Zhejiang University ZJU
Original Assignee
Zhongda Group Co ltd
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongda Group Co ltd, Zhejiang University ZJU filed Critical Zhongda Group Co ltd
Priority to CN202110432496.XA priority Critical patent/CN113128597B/zh
Publication of CN113128597A publication Critical patent/CN113128597A/zh
Application granted granted Critical
Publication of CN113128597B publication Critical patent/CN113128597B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书提供一种用户行为特征的提取和分类预测的方法及装置,根据用户行为特征的提取方法,获取目标用户的行为信息;所述行为信息包括所述目标用户在预设时段内的多个行为中各个行为各自所属的行为类别及各自发生的时刻;基于所述行为信息确定所述各个行为各自对应的各个嵌入向量,得到由所述各个嵌入向量构成的初始向量序列;利用目标模型处理所述初始向量序列,得到表征所述目标用户行为特征的目标向量序列;所述目标向量序列用于涉及所述目标用户的分类预测业务。如此使得最终得到的表征目标用户行为特征的目标向量序列能够表达更加丰富的特征信息,从而提高了针对目标用户的分类预测业务的预测能力。

Description

一种用户行为特征的提取和分类预测的方法及装置
技术领域
本说明书一个或多个实施例涉及机器学习技术领域,特别涉及一种用户行为特征的提取和分类预测的方法及装置。
背景技术
随着互联网技术的不断发展,使得人工智能技术越来越多的应用于人们的工作和生活中,为人们的工作和生活提供了诸多便利。由于应用人工智能技术的分类预测业务很大程度上依赖于特征的提取,因此,如何提取包含丰富信息的特征显得尤为重要。
发明内容
为了解决上述技术问题之一,本说明书一个或多个实施例提供一种用户行为特征的提取和分类预测的方法及装置。
根据第一方面,提供一种用户行为特征的提取方法,包括:
获取目标用户的行为信息;所述行为信息包括所述目标用户在预设时段内的多个行为中各个行为各自所属的行为类别及各自发生的时刻;
基于所述行为信息确定所述各个行为各自对应的各个嵌入向量,得到由所述各个嵌入向量构成的初始向量序列;
利用目标模型处理所述初始向量序列,得到表征所述目标用户行为特征的目标向量序列;所述目标向量序列用于涉及所述目标用户的分类预测业务。
可选的,通过如下方式基于所述行为信息确定所述多个行为中任意一个行为对应的嵌入向量:
获取预先针对该行为所属的行为类别而设定的类别向量;
基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数;
利用该修正系数对该类别向量进行修正,得到该行为对应的嵌入向量。
可选的,所述基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数,包括:
获取针对该行为所属的行为类别设定的第一修正向量和第二修正向量;
确定该行为对应的时间因数;所述时间因数与目标时间差正相关;所述目标时间差为该行为发生的时刻与所述预设时段的起始时刻的时间差;
基于所述第一修正向量、所述第二修正向量和所述时间因数,确定该行为对应的修正系数。
可选的,所述基于所述第一修正向量、所述第二修正向量和所述时间因数,确定该行为对应的修正系数,包括:
计算所述第一修正向量与所述时间因数的乘积;
将所述乘积与所述第二修正向量的和作为自变量,输入激活函数;
将所述激活函数的输出的结果确定为该行为对应的修正系数。
可选的,所述涉及所述目标用户的分类预测业务包括以下任意一项或多项:
对涉及所述目标用户的预设信息进行预估的业务;
向所述目标用户推荐信息的业务;
为所述目标用户提供规划的业务;
对所述目标用户进行分类的业务;
为所述目标用户分配服务资源的业务。
可选的,所述目标模型包括以下任意一种:循环神经网络RNN,长短期记忆神经网络LSTM,门控循环单元GRU。
根据第二方面,提供一种分类预测的方法,包括:
获取表征目标用户行为特征的目标向量序列;所述目标向量序列通过第一方面中任一项所述的方法确定;
基于所述目标向量序列执行涉及所述目标用户的分类预测业务。
可选的,所述涉及所述目标用户的分类预测业务包括以下任意一项或多项:
对涉及所述目标用户的预设信息进行预估的业务;
向所述目标用户推荐信息的业务;
为所述目标用户提供规划的业务;
对所述目标用户进行分类的业务;
为所述目标用户分配服务资源的业务。
根据第三方面,提供一种用户行为特征的提取装置,包括:
获取模块,用于获取目标用户的行为信息;所述行为信息包括所述目标用户在预设时段内的多个行为中各个行为各自所属的行为类别及各自发生的时刻;
确定模块,用于基于所述行为信息确定所述各个行为各自对应的各个嵌入向量,得到由所述各个嵌入向量构成的初始向量序列;
处理模块,用于利用目标模型处理所述初始向量序列,得到表征所述目标用户行为特征的目标向量序列;所述目标向量序列用于涉及所述目标用户的分类预测业务。
根据第四方面,提供一种分类预测的装置,包括:
获取模块,用于获取表征目标用户行为特征的目标向量序列;所述目标向量序列通过第三方面所述的装置确定;
业务模块,用于基于所述目标向量序列执行涉及所述目标用户的分类预测业务。
根据第五方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面或第二方面中任一项所述的方法。
根据第六方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一方面或第二方面中任一项所述的方法。
本说明书的实施例提供的技术方案可以包括以下有益效果:
本说明书的实施例提供的用户行为特征的提取方法和装置,通过获取目标用户的行为信息,基于上述行为信息确定上述各个行为各自对应的各个嵌入向量,得到由各个嵌入向量构成的初始向量序列,并利用目标模型处理初始向量序列,得到表征目标用户行为特征的目标向量序列。由于本实施例在提取目标用户行为特征时考虑了目标用户的行为所发生的时刻对行为特征的影响,因此,使得最终得到的表征目标用户行为特征的目标向量序列能够表达更加丰富的特征信息,从而提高了针对目标用户的分类预测业务的预测能力。
本说明书的实施例提供的分类预测的方法和装置,通过获取表征目标用户行为特征的目标向量序列,并基于目标向量序列执行涉及目标用户的分类预测业务。从而提高了针对目标用户的分类预测业务的预测能力,使得针对目标用户的分类预测业务更准确,更具合理性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本说明书根据一示例性实施例示出的一种用户行为特征的提取方法的流程图;
图2是本说明书根据一示例性实施例示出的另一种用户行为特征的提取方法的流程图;
图3是本说明书根据一示例性实施例示出的一种分类预测的方法的流程图;
图4是本说明书根据一示例性实施例示出的一种用户行为特征的提取装置的框图;
图5是本说明书根据一示例性实施例示出的一种分类预测的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本说明书和所附权利要求书中所使用的单数形式的“一种”“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1所示,图1是根据一示例性实施例示出的一种用户行为特征的提取方法的流程图,该方法可以应用于任何具有计算、处理能力的设备、平台、服务器或设备集群。该方法包括以下步骤:
在步骤101中,获取目标用户的行为信息。
在本实施例中,目标用户的行为信息可以包括目标用户在预设时段内的多个行为中各个行为各自所属的行为类别及各自发生的时刻。具体来说,可以预先对用户的行为进行分类,得到多个行为类别。例如,行为类别可以包括但不限于点击广告,浏览新闻资讯,评论留言,搜索商品,购买商品,收付款,收发邮件,呼叫网约车,订购外卖,播放音频,播放视频等等。然后,可以获取预设时段内目标用户通过终端设备进行的各种操作行为的信息,从而得到上述目标用户的行为信息。
在本实施例中,预设时段可以是当前时刻之前的任意预设的时段,该预设时段的时长可以是一个月,或者一周,或者一天,可以理解,本实施例对预设时段的具体设定方面不限定。
在步骤102中,基于上述行为信息确定上述各个行为各自对应的各个嵌入向量,得到由各个嵌入向量构成的初始向量序列。
在本实施例中,可以基于上述行为信息确定上述各个行为各自对应的各个嵌入向量,得到由各个嵌入向量构成的初始向量序列。具体来说,在一种实现方式中,可以通过如下方式基于上述行为信息确定多个行为中任意一个行为对应的嵌入向量:首先,获取预先针对该行为所属的行为类别而设定的类别向量。然后,基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数。最后,利用该修正系数对该类别向量进行修正,得到该行为对应的嵌入向量。
在另一种实现方式中,还可以获取预先针对该行为所属的行为类别而设定的类别向量,并在这个类别向量的基础上加一个时间维度,基于该行为发生的时刻确定时间维度对应的数值,从而得到该行为对应的嵌入向量。
可以理解,还可以通过其它任意合理的方式基于上述行为信息确定上述各个行为各自对应的各个嵌入向量,本实施例对确定上述各个嵌入向量的具体方式方面不限定。
在本实施例中,得到上述各个行为各自对应的各个嵌入向量后,可以按照各个行为各自对应的时刻的先后顺序,将各个行为各自对应的各个嵌入向量进行排序,得到初始向量序列,该初始向量序列为一个时间序列。
在步骤103中,利用目标模型处理初始向量序列,得到表征目标用户行为特征的目标向量序列。
在本实施例中,可以将初始向量序列输入至目标模型进行处理,得到表征目标用户行为特征的目标向量序列。其中,目标模型可以包括编码器和解码器,目标模型可以是以下任意一种类型的模型:RNN(Recurrent Neural Network,循环神经网络),LSTM(LongShort-Term Memory,长短期记忆神经网络),GRU(Gated Recurrent Unit,门控循环单元)。
在本实施例中,目标向量序列可以用于涉及目标用户的分类预测业务,该涉及目标用户的分类预测业务可以包括以下任意一项或多项:对涉及目标用户的预设信息进行预估的业务;向目标用户推荐信息的业务;为目标用户提供规划的业务;对目标用户进行分类的业务;为目标用户分配服务资源的业务。
例如,对涉及目标用户的预设信息进行预估的业务可以包括但不限于点击率预估,消费预估等等。向目标用户推荐信息的业务可以包括但不限于广告推送,好友推荐,优惠券推送等等。为目标用户提供规划的业务可以包括但不限于行程规划,娱乐游玩规划等等。对目标用户进行分类的业务可以包括但不限于圈人,同乘人员匹配等等。为目标用户分配服务资源的业务可以包括但不限于分配司机,分配配送员等等。
可以理解,涉及目标用户的分类预测业务还可以不可其它任意合理的分类预测业务,本实施例对分类预测业务的具体形式方面不限定。
需要说明的是,上述步骤可以在应用阶段执行,例如,当训练完成目标模型之后,可以执行上述步骤101-步骤103,从而得到目标用户的目标向量序列。可以将得到的目标向量序列进行存储,或者将目标向量序列发送给其它设备,以基于目标向量序列进行涉及目标用户的分类预测业务。
上述步骤还可以在目标模型的训练阶段执行,例如,当训练目标模型时,可以执行上述步骤101-步骤103,得到目标向量序列之后,将目标向量序列输入至softmax分类器中,从而得到损失。然后,基于该损失调整目标模型的参数,并重新执行上述步骤101-步骤103,直至满足停止训练的条件。因此,本实施例对执行上述步骤的阶段不限定。
对于本实施例,一种具体的应用场景可以为,在智慧供应链集成服务体系中,可以通过智慧供应链管理平台采集目标用户的行为信息,例如,采集目标用户点击广告的信息,浏览新闻资讯的信息,评论留言的信息以及搜索商品的信息等。然后,基于目标用户的行为信息,应用本实施例提供的用户行为特征的提取方法,得到表征目标用户行为特征的目标向量序列。并应用目标向量序列对目标用户进行分类预测,并根据分类预测的结果,为目标用户提供更符合用户需求的服务。
本实施例并不限于上述的应用场景,还可以应用到其他场景中。本说明书的上述实施例提供的用户行为特征的提取方法,通过获取目标用户的行为信息,基于上述行为信息确定上述各个行为各自对应的各个嵌入向量,得到由各个嵌入向量构成的初始向量序列,并利用目标模型处理初始向量序列,得到表征目标用户行为特征的目标向量序列。由于本实施例在提取目标用户行为特征时考虑了目标用户的行为所发生的时刻对行为特征的影响,因此,使得最终得到的表征目标用户行为特征的目标向量序列能够表达更加丰富的特征信息,从而提高了针对目标用户的分类预测业务的预测能力。
如图2所示,图2根据一示例性实施例示出的另一种用户行为特征的提取方法的流程图,该实施例描述了确定任意一个行为对应的嵌入向量的过程,该方法可以应用于任何具有计算、处理能力的设备、平台、服务器或设备集群。该方法包括以下步骤:
在步骤201中,获取预先针对该行为所属的行为类别设定的类别向量。
在本实施例中,预先针对划分的各个行为类别设定对应的类别向量,以区分不同的行为类别。针对任意一个行为,可以获取预先针对该行为所属的行为类别设定的类别向量。例如,行为类别可以包括点击,浏览,购买,打车。那么可以针对点击设定类别向量(1,0,0,0),针对浏览设定类别向量(0,1,0,0),针对购买设定类别向量(0,0,1,0),针对打车设定类别向量(0,0,0,1)。如果一个行为所属的行为类别为购买,则可以获取针对购买设定类别向量(0,0,1,0)。
在步骤202中,基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数。
在本实施例中,可以基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数。具体来说,首先,可以获取针对该行为所属的行为类别设定的第一修正向量和第二修正向量。其中,可以预先针对划分的各个行为类别设定对应的第一修正向量和第二修正向量。第一修正向量和第二修正向量均为随机设定的向量,其在各个维度上的取值满足正态分布。并且,第一修正向量和第二修正向量维度相同。
然后,确定该行为对应的时间因数,该时间因数与目标时间差正相关,该目标时间差为该行为发生的时刻与预设时段的起始时刻的时间差。例如,在一种实现方式中,设该行为发生的时刻为t1,预设时段的起始时刻为t0,则该目标时间差为Δt=t1-t0。设预设时段的时长为T,该行为对应的时间因数为τ,则可以使τ=Δt/T。
最后,可以基于上述第一修正向量、上述第二修正向量和时间因数,确定该行为对应的修正系数。具体来说,可以先计算第一修正向量与时间因数的乘积,将该乘积与第二修正向量的和作为自变量,输入至Sigmoid激活函数中。将该Sigmoid激活函数的输出的结果确定为该行为对应的修正系数。
例如,在一种实现方式中,该行为对应的时间因数为τ,预先针对该行为所属的行为类别设定的第一修正向量和第二修正向量分别为
Figure BDA0003031918270000101
Figure BDA0003031918270000102
用y=Sigmoid(x)表示Sigmoid激活函数(x为Sigmoid激活函数的自变量,y为Sigmoid激活函数的变量),则该行为对应的修正系数δ可以表示为:
Figure BDA0003031918270000103
在步骤203中,利用该修正系数对该类别向量进行修正,得到该行为对应的嵌入向量。
在本实施例中,可以利用该修正系数对该类别向量进行修正,得到该行为对应的嵌入向量。例如,将该修正系数与该类别向量相乘,从而对该类别向量进行修正,得到该行为对应的嵌入向量。
例如,在一种实现方式中,设该行为所属的行为类别对应的类别向量为
Figure BDA0003031918270000104
该行为对应的修正系数
Figure BDA0003031918270000105
则该行为对应的嵌入向量
Figure BDA0003031918270000106
本说明书的上述实施例提供的用户行为特征的提取方法,通过获取预先针对该行为所属的行为类别设定的类别向量,基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数,并利用该修正系数对该类别向量进行修正,得到该行为对应的嵌入向量。从而进一步使得最终得到的表征目标用户行为特征的目标向量序列能够表达更加丰富的特征信息,有助于提高针对目标用户的分类预测业务的预测能力。
如图3所示,图3是根据一示例性实施例示出的一种分类预测的方法的流程图,该方法可以应用于任何具有计算、处理能力的设备、平台、服务器或设备集群。该方法包括以下步骤:
在步骤301中,获取表征目标用户行为特征的目标向量序列。
在本实施例中,可以获取通过图1或图2实施例的方法得到的表征目标用户行为特征的目标向量序列。例如,可以接收其它设备发送的该目标向量序列,也可以从存储设备中读取该目标向量序列等。可以理解,可以通过任意合理的方式获取目标向量序列,本实施例对获取表征目标用户行为特征的目标向量序列的具体方式方面不限定。
在步骤302中,基于目标向量序列执行涉及目标用户的分类预测业务。
在本实施例中,可以基于目标向量序列执行涉及目标用户的分类预测业务。例如,可以将目标向量序列输入至预先训练的一个或多个模型中,从而执行涉及目标用户的分类预测业务。
在本实施例中,目标向量序列可以用于涉及目标用户的分类预测业务,该涉及目标用户的分类预测业务可以包括以下任意一项或多项:对涉及目标用户的预设信息进行预估的业务;向目标用户推荐信息的业务;为目标用户提供规划的业务;对目标用户进行分类的业务;为目标用户分配服务资源的业务。
例如,对涉及目标用户的预设信息进行预估的业务可以包括但不限于点击率预估,消费预估等等。向目标用户推荐信息的业务可以包括但不限于广告推送,好友推荐,优惠券推送等等。为目标用户提供规划的业务可以包括但不限于行程规划,娱乐游玩规划等等。对目标用户进行分类的业务可以包括但不限于圈人,同乘人员匹配等等。为目标用户分配服务资源的业务可以包括但不限于分配司机,分配配送员等等。
可以理解,涉及目标用户的分类预测业务还可以不可其它任意合理的分类预测业务,本实施例对分类预测业务的具体形式方面不限定。
本说明书的上述实施例提供的分类预测的方法,通过获取表征目标用户行为特征的目标向量序列,并基于目标向量序列执行涉及目标用户的分类预测业务。从而提高了针对目标用户的分类预测业务的预测能力,使得针对目标用户的分类预测业务更准确,更具合理性。
应当注意,尽管在上述的实施例中,以特定顺序描述了本说明书实施例的方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。
与前述用户行为特征的提取方法以及分类预测的方法实施例相对应,本说明书还提供了用户行为特征的提取装置以及分类预测的装置的实施例。
如图4所示,图4是本说明书根据一示例性实施例示出的一种用户行为特征的提取装置框图,该装置可以包括:获取模块401,确定模块402和处理模块403。
其中,获取模块401,用于获取目标用户的行为信息,该行为信息包括目标用户在预设时段内的多个行为中各个行为各自所属的行为类别及各自发生的时刻。
确定模块402,用于基于该行为信息确定各个行为各自对应的各个嵌入向量,得到由各个嵌入向量构成的初始向量序列。
处理模块403,用于利用目标模型处理该初始向量序列,得到表征目标用户行为特征的目标向量序列,该目标向量序列用于涉及目标用户的分类预测业务。
在一些实施方式中,确定模块402通过如下方式基于上述行为信息确定多个行为中任意一个行为对应的嵌入向量:获取预先针对该行为所属的行为类别而设定的类别向量,基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数,利用该修正系数对该类别向量进行修正,得到该行为对应的嵌入向量。
在另一些实施方式中,确定模块402通过如下方式基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数:获取针对该行为所属的行为类别设定的第一修正向量和第二修正向量,确定该行为对应的时间因数,该时间因数与目标时间差正相关,该目标时间差为该行为发生的时刻与预设时段的起始时刻的时间差。基于第一修正向量、第二修正向量和时间因数,确定该行为对应的修正系数。
在另一些实施方式中,确定模块402通过如下方式基于第一修正向量、第二修正向量和时间因数,确定该行为对应的修正系数:计算第一修正向量与时间因数的乘积,将该乘积与第二修正向量的和作为自变量,输入激活函数,将该激活函数的输出的结果确定为该行为对应的修正系数。
在另一些实施方式中,涉及目标用户的分类预测业务可以包括以下任意一项或多项:对涉及目标用户的预设信息进行预估的业务;向目标用户推荐信息的业务;为目标用户提供规划的业务;对目标用户进行分类的业务;为目标用户分配服务资源的业务。
在另一些实施方式中,目标模型可以包括以下任意一种:循环神经网络RNN,长短期记忆神经网络LSTM,门控循环单元GRU。
应当理解,上述装置可以预先设置在计算设备中,也可以通过下载等方式而加载到计算设备中。上述装置中的相应模块可以与计算设备中的模块相互配合以实现用户行为特征的提取方案。
如图5所示,图5是本说明书根据一示例性实施例示出的一种分类预测的装置框图,该装置可以包括:获取模块501和业务模块502。
其中,获取模块501,用于获取表征目标用户行为特征的目标向量序列,目标向量序列通过图4的装置确定。
业务模块502,用于基于目标向量序列执行涉及目标用户的分类预测业务。
在一些实施方式中,涉及目标用户的分类预测业务可以包括以下任意一项或多项:对涉及目标用户的预设信息进行预估的业务;向目标用户推荐信息的业务;为目标用户提供规划的业务;对目标用户进行分类的业务;为目标用户分配服务资源的业务。
应当理解,上述装置可以预先设置在计算设备中,也可以通过下载等方式而加载到计算设备中。上述装置中的相应模块可以与计算设备中的模块相互配合以实现分类预测的方案。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书一个或多个实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。其中,软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种用户行为特征的提取方法,所述方法包括:
获取目标用户的行为信息;所述行为信息包括所述目标用户在预设时段内的多个行为中各个行为各自所属的行为类别及各自发生的时刻;
基于所述行为信息确定所述各个行为各自对应的各个嵌入向量,得到由所述各个嵌入向量构成的初始向量序列;
利用目标模型处理所述初始向量序列,得到表征所述目标用户行为特征的目标向量序列;所述目标向量序列用于涉及所述目标用户的分类预测业务。
2.根据权利要求1所述的方法,其中,通过如下方式基于所述行为信息确定所述多个行为中任意一个行为对应的嵌入向量:
获取预先针对该行为所属的行为类别而设定的类别向量;
基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数;
利用该修正系数对该类别向量进行修正,得到该行为对应的嵌入向量。
3.根据权利要求2所述的方法,其中,所述基于该行为所属的行为类别及发生的时刻,确定该行为对应的修正系数,包括:
获取针对该行为所属的行为类别设定的第一修正向量和第二修正向量;
确定该行为对应的时间因数;所述时间因数与目标时间差正相关;所述目标时间差为该行为发生的时刻与所述预设时段的起始时刻的时间差;
基于所述第一修正向量、所述第二修正向量和所述时间因数,确定该行为对应的修正系数。
4.根据权利要求3所述的方法,其中,所述基于所述第一修正向量、所述第二修正向量和所述时间因数,确定该行为对应的修正系数,包括:
计算所述第一修正向量与所述时间因数的乘积;
将所述乘积与所述第二修正向量的和作为自变量,输入激活函数;
将所述激活函数的输出的结果确定为该行为对应的修正系数。
5.根据权利要求1-4中任一项所述的方法,其中,所述涉及所述目标用户的分类预测业务包括以下任意一项或多项:
对涉及所述目标用户的预设信息进行预估的业务;
向所述目标用户推荐信息的业务;
为所述目标用户提供规划的业务;
对所述目标用户进行分类的业务;
为所述目标用户分配服务资源的业务。
6.根据权利要求1-4中任一项所述的方法,其中,所述目标模型包括以下任意一种:循环神经网络RNN,长短期记忆神经网络LSTM,门控循环单元GRU。
7.一种分类预测的方法,所述方法包括:
获取表征目标用户行为特征的目标向量序列;所述目标向量序列通过权利要求1-4中任一项所述的方法确定;
基于所述目标向量序列执行涉及所述目标用户的分类预测业务。
8.根据权利要求7所述的方法,其中,所述涉及所述目标用户的分类预测业务包括以下任意一项或多项:
对涉及所述目标用户的预设信息进行预估的业务;
向所述目标用户推荐信息的业务;
为所述目标用户提供规划的业务;
对所述目标用户进行分类的业务;
为所述目标用户分配服务资源的业务。
9.一种用户行为特征的提取装置,所述装置包括:
获取模块,用于获取目标用户的行为信息;所述行为信息包括所述目标用户在预设时段内的多个行为中各个行为各自所属的行为类别及各自发生的时刻;
确定模块,用于基于所述行为信息确定所述各个行为各自对应的各个嵌入向量,得到由所述各个嵌入向量构成的初始向量序列;
处理模块,用于利用目标模型处理所述初始向量序列,得到表征所述目标用户行为特征的目标向量序列;所述目标向量序列用于涉及所述目标用户的分类预测业务。
10.一种分类预测的装置,所述装置包括:
获取模块,用于获取表征目标用户行为特征的目标向量序列;所述目标向量序列通过权利要求9所述的装置确定;
业务模块,用于基于所述目标向量序列执行涉及所述目标用户的分类预测业务。
CN202110432496.XA 2021-04-21 2021-04-21 一种用户行为特征的提取和分类预测的方法及装置 Active CN113128597B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110432496.XA CN113128597B (zh) 2021-04-21 2021-04-21 一种用户行为特征的提取和分类预测的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110432496.XA CN113128597B (zh) 2021-04-21 2021-04-21 一种用户行为特征的提取和分类预测的方法及装置

Publications (2)

Publication Number Publication Date
CN113128597A true CN113128597A (zh) 2021-07-16
CN113128597B CN113128597B (zh) 2021-10-08

Family

ID=76778787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110432496.XA Active CN113128597B (zh) 2021-04-21 2021-04-21 一种用户行为特征的提取和分类预测的方法及装置

Country Status (1)

Country Link
CN (1) CN113128597B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116342193A (zh) * 2023-03-29 2023-06-27 上海数禾信息科技有限公司 基于用户旅程的用户分类方法、装置、计算机设备和介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971194A (zh) * 2017-02-16 2017-07-21 江苏大学 一种基于改进hmm和svm双层算法的驾驶意图识别方法
CN109359137A (zh) * 2018-10-16 2019-02-19 大连理工大学 基于特征筛选与半监督学习的用户成长性画像构建方法
CN109684543A (zh) * 2018-12-14 2019-04-26 北京百度网讯科技有限公司 用户行为预测和信息投放方法、装置、服务器和存储介质
CN109815980A (zh) * 2018-12-18 2019-05-28 北京三快在线科技有限公司 用户类型的预测方法、装置、电子设备及可读存储介质
US20200090056A1 (en) * 2018-09-19 2020-03-19 Tata Consultancy Services Limited Systems and methods for real time configurable recommendation using user data
CN111274501A (zh) * 2020-02-25 2020-06-12 支付宝(杭州)信息技术有限公司 推送信息的方法、***和非暂时性存储介质
CN111310676A (zh) * 2020-02-21 2020-06-19 重庆邮电大学 基于CNN-LSTM和attention的视频动作识别方法
CN112488155A (zh) * 2020-11-09 2021-03-12 北京三快在线科技有限公司 用户信息预测方法、装置、设备及介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971194A (zh) * 2017-02-16 2017-07-21 江苏大学 一种基于改进hmm和svm双层算法的驾驶意图识别方法
US20200090056A1 (en) * 2018-09-19 2020-03-19 Tata Consultancy Services Limited Systems and methods for real time configurable recommendation using user data
CN109359137A (zh) * 2018-10-16 2019-02-19 大连理工大学 基于特征筛选与半监督学习的用户成长性画像构建方法
CN109684543A (zh) * 2018-12-14 2019-04-26 北京百度网讯科技有限公司 用户行为预测和信息投放方法、装置、服务器和存储介质
CN109815980A (zh) * 2018-12-18 2019-05-28 北京三快在线科技有限公司 用户类型的预测方法、装置、电子设备及可读存储介质
CN111310676A (zh) * 2020-02-21 2020-06-19 重庆邮电大学 基于CNN-LSTM和attention的视频动作识别方法
CN111274501A (zh) * 2020-02-25 2020-06-12 支付宝(杭州)信息技术有限公司 推送信息的方法、***和非暂时性存储介质
CN112488155A (zh) * 2020-11-09 2021-03-12 北京三快在线科技有限公司 用户信息预测方法、装置、设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116342193A (zh) * 2023-03-29 2023-06-27 上海数禾信息科技有限公司 基于用户旅程的用户分类方法、装置、计算机设备和介质

Also Published As

Publication number Publication date
CN113128597B (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN110413877B (zh) 一种资源推荐方法、装置及电子设备
CN109903103B (zh) 一种推荐物品的方法和装置
CN110880127B (zh) 消费水平的预测方法、装置、电子设备及存储介质
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
CN112528110A (zh) 确定实体业务属性的方法及装置
CN110827138A (zh) 一种推送信息确定方法及装置
CN110598120A (zh) 基于行为数据的理财推荐方法及装置、设备
CN112232546A (zh) 一种推荐概率预估方法、装置、电子设备及存储介质
CN111161104A (zh) 一种社区用户画像的生成方法及装置
CN110766513A (zh) 信息排序方法、装置、电子设备及可读存储介质
Montazery et al. Learning user preferences in matching for ridesharing
CN112132634A (zh) 虚拟馈赠资源发放方法、装置、计算机设备和存储介质
CN113128597B (zh) 一种用户行为特征的提取和分类预测的方法及装置
CN111444930B (zh) 一种确定二分类模型的预测效果的方法及装置
CN113034168A (zh) 内容项投放方法、装置、计算机设备及存储介质
CN112269943B (zh) 一种信息推荐***及方法
CN112785390B (zh) 推荐处理方法、装置、终端设备以及存储介质
CN113592593A (zh) 序列推荐模型的训练及应用方法、装置、设备及存储介质
US20230316106A1 (en) Method and apparatus for training content recommendation model, device, and storage medium
CN111325614B (zh) 电子对象的推荐方法、装置和电子设备
CN113032676A (zh) 基于微反馈的推荐方法和***
CN117422553A (zh) 区块链网络的交易处理方法、装置、设备、介质和产品
CN110852833A (zh) 一种约车订单处理方法及装置
CN110765350A (zh) 一种会员积分的数据融合方法和装置
CN115983902A (zh) 基于用户实时事件的信息推送方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant