CN115249081A - 一种对象类型的预测方法、装置、计算机设备和存储介质 - Google Patents

一种对象类型的预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN115249081A
CN115249081A CN202110462219.3A CN202110462219A CN115249081A CN 115249081 A CN115249081 A CN 115249081A CN 202110462219 A CN202110462219 A CN 202110462219A CN 115249081 A CN115249081 A CN 115249081A
Authority
CN
China
Prior art keywords
time
data
regression
dimension
series data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110462219.3A
Other languages
English (en)
Inventor
林岳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110462219.3A priority Critical patent/CN115249081A/zh
Publication of CN115249081A publication Critical patent/CN115249081A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种对象类型的预测方法、装置、计算机设备和存储介质;本申请实施例可以获取目标对象在历史时间区间内的时间序列数据;对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。该方案可以基于对象的时间序列数据,准确地预测该对象的对象类型。

Description

一种对象类型的预测方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,具体涉及一种对象类型的预测方法、装置、计算机设备和存储介质。
背景技术
时间序列数据是在不同时间上收集到的数据,可以用于描述现象随时间变化的情况,该数据可以反映某一事物或现象等随时间的变化状态或程度。在应用的使用过程中,不同的对象会对应地生成不同的时间序列数据,因此,可以基于对象的时间序列数据对该对象进行分类,以确定其所属的对象类型。而对对象进行类型预测,不仅有利于应用更好地了解对象分布,而且有助于应用提供更好的服务。
在对相关技术的研究和实践过程中,本申请的发明人发现,目前是通过规则判别的方式,来实现基于时间序列数据预测对象的类型,但是,基于规则判别的方法效率低下,预测误差大,在实际应用中也无法进一步优化,使得基于时间序列数据对对象类型进行预测的方法还有待改善。
发明内容
本申请实施例提供一种对象类型的预测方法、装置、计算机设备和存储介质,可以基于对象的时间序列数据,准确地预测该对象的对象类型。
本申请实施例提供一种对象类型的预测方法,包括:
获取目标对象在历史时间区间内的时间序列数据;
对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;
基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;
基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;
基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
相应的,本申请实施例还提供一种对象类型的预测装置,包括:
数据获取单元,用于获取目标对象在历史时间区间内的时间序列数据;
回归处理单元,用于对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;
第一计算单元,用于基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;
第二计算单元,用于基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;
类型预测单元,用于基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
在一实施例中,所述回归处理单元,包括:
系数确定子单元,用于确定所述时间序列数据的回归系数,其中,所述回归系数表征所述时间序列数据的时序相关性;
模型确定子单元,用于基于所述回归系数,确定对所述时间序列数据进行回归处理所需的回归模型;
回归处理子单元,用于通过所述回归模型对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息。
在一实施例中,所述系数确定子单元,用于:
对所述时间序列数据进行数据转换,得到所述时间序列数据对应的平稳时间序列;基于所述平稳时间序列,确定所述时间序列数据的候选回归系数集合,其中,所述候选回归系数集合包括至少一组候选回归系数,每组所述候选回归系数对应于一个回归模型;对每组所述候选回归系数对应的回归模型进行模型评估,得到评估结果;基于所述评估结果,从所述候选回归系数集合中确定目标回归系数,将所述目标回归系数作为所述时间序列数据的回归系数。
在一实施例中,所述第一计算单元,包括:
第一获取子单元,用于获取每个所述时间维度对应的训练后模型;
第一计算子单元,用于基于所述时间序列数据在每个所述时间维度上的数据分布,通过所述时间维度对应的训练后模型,计算所述时间序列数据在所述时间维度上的数据分布特征信息。
在一实施例中,所述时间维度包括趋势性时间维度,所述训练后模型包括所述趋势性时间维度对应的趋势预测模型;所述第一获取子单元,用于:
获取进行模型训练所需的样本数据集;确定模型类型信息以及模型参数信息;基于所述模型类型信息与所述模型参数信息,确定待训练的趋势预测模型;通过所述样本数据集对所述待训练的趋势预测模型进行模型训练,得到训练后的趋势预测模型。
在一实施例中,所述时间维度包括至少一个突变性时间维度,所述训练后模型包括每个所述突变性时间维度对应的突变预测模型;所述第一计算子单元,用于:
确定所述突变性时间维度的时间窗口信息,其中,所述时间窗口信息表征所述突变性时间维度对应的时间窗口的时长;基于所述时间序列数据在所述突变性时间维度上的数据分布,通过所述突变预测模型计算所述时间序列数据在所述时间窗口内的突变性分布特征;对所述突变性分布特征信息进行特征组合,得到所述时间序列数据在所述突变性时间维度上的数据分布特征信息。
在一实施例中,所述时间维度包括至少一个突变性时间维度,所述时间维度包括周期性时间维度,所述训练后模型包括所述周期性时间维度对应的周期预测模型;所述第一计算子单元,用于:
基于所述时间序列数据在所述周期性时间维度上的数据分布,通过所述周期预测模型对所述时间序列数据进行分解,得到所述时间序列数据的周期性分布特征;对所述周期性分布特征进行平滑处理,得到所述时间序列数据在所述周期性时间维度上的数据分布特征信息。
在一实施例中,所述第二计算单元,包括:
第二获取子单元,用于获取训练后的时序关联预测模型,其中,所述时序关联预测模型用于计算时间序列数据的时序关联特征信息;
关系解析子单元,用于通过所述时序关联预测模型,解析所述时间序列数据在历史时间区间内的时序关联关系;
第二计算子单元,用于基于解析结果,计算所述时间序列数据的时序关联特征信息。
在一实施例中,所述类型预测单元,包括:
特征融合子单元,用于对所述回归特征信息、所述各个时间维度对应的数据分布特征信息、以及所述时序关联特征信息进行特征融合,得到融合后特征;
类型预测子单元,用于基于所述融合后特征,预测所述目标对象在预设时间区间内的对象类型。
在一实施例中,所述特征融合子单元,用于:
对所述各个时间维度对应的数据分布特征进行特征融合,得到融合后的数据分布特征信息;分别确定所述回归特征信息、所述时序关联特征信息、以及所述融合后数据分布特征信息的权重;基于所述权重,对所述回归特征信息、所述时序关联特征信息、以及所述融合后数据分布特征信息进行特征融合,得到融合后特征。
相应的,本申请实施例还提供一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如本申请实施例所示的对象类型的预测方法的步骤。
相应的,本申请实施例还提供一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如本申请实施例所示的对象类型的预测方法的步骤。
本申请实施例可以获取目标对象在历史时间区间内的时间序列数据;对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
该方案可以通过对目标对象的时间序列数据进行回归处理,得到回归特征信息,具体地,该回归特征信息可以用于在短期内预测目标对象所属的对象类型;通过计算该目标对象的时间序列数据在多个时间维度上的数据分布特征信息,用以从多个时间维度来预测目标对象在长期内所属的对象类型;通过计算该目标对象的时间序列数据的时序关联特征信息,以使得能够通过神经网络模型来对该目标对象所属的对象类型进行预测。进一步地,该方案能够对前述得到的特征信息进行特征融合,从而实现了对该目标对象的短期预测结果、长期预测结果、以及神经网络预测结果进行融合,并基于融合结果,综合地预测目标对象所属的对象类型。这样的话,该方案避免了基于规则判别过程中,需要人为地对预测对象类型所需的指标进行人工调整的情况,并且,该方案通过基于数据挖掘的方法,能够基于目标对象的时间序列数据,准确并高效的预测该目标对象所属的对象类型。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的对象类型的预测方法的场景示意图;
图2是本申请实施例提供的对象类型的预测方法的流程图;
图3是本申请实施例提供的对象类型的预测方法的模型结构示意图;
图4是本申请实施例提供的对象类型的预测方法的另一模型结构示意图;
图5是本申请实施例提供的对象类型的预测方法的另一模型结构示意图;
图6是本申请实施例提供的对象类型的预测方法的另一模型结构示意图;
图7是本申请实施例提供的对象类型的预测方法的另一模型结构示意图;
图8是本申请实施例提供的对象类型的预测方法的另一模型结构示意图;
图9是本申请实施例提供的对象类型的预测方法的另一模型结构示意图;
图10是本申请实施例提供的对象类型的预测方法的另一流程示意图;
图11是本申请实施例提供的对象类型的预测装置的结构示意图;
图12是本申请实施例提供的对象类型的预测装置的另一结构示意图;
图13是本申请实施例提供的对象类型的预测装置的另一结构示意图;
图14是本申请实施例提供的对象类型的预测装置的另一结构示意图;
图15是本申请实施例提供的对象类型的预测装置的另一结构示意图;
图16是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种对象类型的预测方法及装置。具体地,本申请实施例提供适用于计算机设备的对象类型的预测装置。其中,该计算机设备可以为终端或服务器等设备,该终端可以为手机、平板电脑、笔记本电脑等设备。该服务器可以是单台服务器,也可以是由多个服务器组成的服务器集群。
本申请实施例将以对象类型的预测装置为服务器为例,来介绍对象类型的预测方法。
参考图1,服务器10可以获取目标对象在历史时间区间内的时间序列数据,例如,服务器10可以通过接收终端20发送的时间序列数据,来获取目标对象在历史时间区间内的时间序列数据。
进一步地,服务器10可以对时间序列数据进行回归处理,得到时间序列数据的回归特征信息;基于时间序列数据在至少一个时间维度上的数据分布,计算时间序列数据在每个时间维度上的数据分布特征信息;基于时间序列数据在历史时间区间内的时序关联关系,计算时间序列数据的时序关联特征信息。并且,服务器10可以基于计算得到的回归特征信息、各个时间维度对应的数据分布特征信息、以及时序关联特征信息,预测目标对象在预设时间区间内的对象类型。
可选地,服务器10可以将预测结果发送给终端20,以使得终端20可以基于预测结果,进一步地进行服务的应用管理及产品运营等工作。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的一种对象类型的预测方法,该方法涉及人工智能的机器学习等技术,并且,该方法可以由终端或服务器执行,也可以由终端和服务器共同执行;本申请实施例以对象类型的预测方法由服务器执行为例来进行说明,具体的,由集成在服务器中的对象类型的预测装置来执行,如图2所述,该对象类型的预测方法的具体流程可以如下:
101、获取目标对象在历史时间区间内的时间序列数据。
其中,对象为应用或者服务的使用实体,例如,对象可以包括应用或者服务的使用客户,譬如,个人用户,组织机构等。
在一实施例中,目标对象可以为待预测对象类型的对象,例如,目标对象可以为待预测用户类型的用户,即目标用户;又如,目标对象可以为待预测组织类型的组织机构,即目标组织;等等。
其中,时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。时间序列数据是在不同时间上收集到的数据,用于所描述现象随时间变化的情况。这类数据反映了某一事物、现象等随时间的变化状态或程度。
在一实施例中,目标对象可以为目标用户,并且,可以通过本申请所述的方法来预测游戏应用A的目标用户是否属于高质量用户,例如,可以将更趋于在游戏应用A中付费的用户作为高质量用户,将不趋于在游戏应用A中付费的用户作为低质量用户。则该目标用户的时间序列数据可以为该目标用户在过去某30天内每一天在游戏应用中的消费金额。
在另一实施例中,目标对象可以为目标用户,并且,可以通过本申请所述的方法来预测金融应用A的目标用户是否属于优质用户,具体地,对于金融应用,常常需要评估用户资质以确定向提供用户何种风险等级的服务,譬如,对于优质用户可以提供较高风险的金融服务,如贷款等,而对于劣质用户应提供低风险的金融服务或不予以提供具有风险的金融服务。则目标用户的时间序列数据可以包括该目标用户在过去某半年内每天在金融应用中的金融行为信息,例如,金融行为信息可以包括借贷金额,消费金额等。
其中,历史时间区间为过去的时间范围,例如,历史时间区间可以为最近7天内,过去某月的30天内等。值得注意的是,历史时间区间可以为连续的时间区间,也可以为不连续的时间区间。
获取目标对象在历史时间区间内的时间序列数据的方式可以有多种,例如,终端上可以运行有相关应用,终端可以向服务器发送目标对象在历史时间区间内的时间序列数据,以使得服务器可以获取该时间序列数据,并在后续基于该时间序列数据预测该目标对象的对象类型;又如,服务器可以向数据库发送请求,以通过该请求获取目标对象在历史时间区间内的时间序列数据;等等。
102、对时间序列数据进行回归处理,得到该时间序列数据的回归特征信息。
其中,回归处理为确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回归处理的方式可以有多种,例如,回归处理按照涉及的变量的多少,可以分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性分析;按因变量是否连续又可分为线性回归(因变量为连续变量)和逻辑回归(因变量为逻辑变量);等等。
其中,回归特征信息为经过回归处理后得到的特征信息。
对时间序列数据进行回归处理的方式可以有多种,例如,可以确定对时间序列数据进行回归处理所需的回归模型后,通过该回归模型来对时间序列数据进行回归处理,得到回归特征信息,其中,该回归特征信息可以用于在短期内预测目标对象所属的对象类型。具体地,步骤“对时间序列数据进行回归处理,得到该时间序列数据的回归特征信息”,可以包括:
确定时间序列数据的回归系数,其中,回归系数表征该时间序列数据的时序相关性;
基于回归系数,确定对时间序列数据进行回归处理所需的回归模型;
通过回归模型对时间序列数据进行回归处理,得到该时间序列数据的回归特征信息。
其中,回归系数为对时间序列数据进行回归处理所需的相关系数,在一实施例中,回归系数可以包括时间序列数据的相关系数,例如,自相关系数,偏自相关系数,等等。具体地,相关系数度量指的是两个不同事件彼此之间的相互影响程度;而自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象的讲就是度量对象过去的行为对该对象现在的影响;偏自相关系数则用于去除一些变量的影响后再来考察自相关系数。
其中,相关性指的是两个变量的关联程度,由于时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,因此,时序相关性则指的是时间序列中的统计指标所对应的变量,在不同时期之间的关联程度。
确定时间序列数据的回归系数的方法可以有多种,例如,在一实施例中,待确定的回归系数可以包括时间序列数据的自相关系数与偏自相关系数,则具体地,步骤“确定时间序列数据的回归系数”,可以包括:
对时间序列数据进行数据转换,得到该时间序列数据对应的平稳时间序列;
基于平稳时间序列,确定时间序列数据的候选回归系数集合,其中,该候选回归系数集合包括至少一组候选回归系数,每组候选回归系数对应于一个回归模型;
对每组候选回归系数对应的回归模型进行模型评估,得到评估结果;
基于评估结果,从候选回归系数集合中确定目标回归系数,将目标回归系数作为该时间序列数据的回归系数。
其中,时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。而对于一个时间序列,如果其均值没有***的变化(无趋势)、方差没有***变化,且严格消除了周期性变化,可以认为该时间序列是平稳的,也即,可以认为该时间序列为平稳时间序列。
其中,数据转换指的是将原始的时间序列数据转换为对应的平稳时间序列的数据处理过程。
数据转换的方式可以有多种,例如,可以通过对时间序列数据进行数据绘图,观测其是否为平稳时间序列,若该时间序列数据不为平稳时间序列,则可以对该时间序列数据进行d阶差分运算,以将该时间序列数据转换为平稳时间序列。具体地,差分运算也称差分函数,是数学中的一个概念。其可以将原函数f(x)映射到f(x+a)-f(x+b)。差分运算相应于微分运算,是微积分中重要的一个概念,在实际应用中,差分可以包括前向差分和逆向差分。
在得到时间序列数据对应的平稳时间序列后,即可基于该平稳时间序列,确定该时间序列数据的候选回归系数集合,其中,该候选回归系数集合包括至少一组候选回归系数,每组候选回归系数对应于一个回归模型。
在一实施例中,可以对时间序列数据对应的平稳时间序列分别求得其自相关系数和偏自相关系数,并通过对自相关图和偏自相关图的分析,得到候选的阶层p和阶数q,进而,根据该候选的阶层p和阶数q来确定该时间序列数据的候选回归系数集合。例如,对于某时间序列数据,通过对该时间序列数据的自相关图和偏自相关图进行分析,可以得到自相关图显示滞后有三个阶超出了置信边界,且相关图显示在滞后1至7阶时的偏自相关系数超出了置信边界,因此,可以确定该时间序列数据的候选回归系数集合为{(0,1),(7,0),(7,1)},其中包括三组候选回归系数,每组候选回归系数的格式为(p,q),且每组候选回归系数对应于一个回归模型。
作为示例,每组候选回归系数可以对应于一个差分整合移动平均自回归模型(Autoregressive Integrated Moving Average model,ARIMA),其中,ARIMA模型是时间序列预测分析方法之一。具体地,在ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA为“滑动平均”,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数)。因此,对于候选回归系数集合为{(0,1),(7,0),(7,1)},可以确定以下回归模型:ARMA(0,1),ARMA(7,0)与ARMA(7,1)。
进一步地,可以通过对每组候选回归系数对应的回归模型进行模型评估,以使得能够基于评估结果,从候选回归系数集合中确定目标回归系数。
其中,模型评估的方式可以有多种,例如,对于ARIMA模型,可以采用赤池信息准则(Akaike Information Criterion,AIC)或者贝叶斯信息准则(Bayesian InformationCriterion,BIC)来判断得到的p和q参数值的好坏。其中,AIC信息准则建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性;BIC信息准则是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯对发生概率进行修正,最后再利用期望值和修正概率做出最优决策;
值得注意的是,在实际应用中,可以联合AIC信息准则与BIC信息准则来进行模型评估,也可以引入其他评估的其他信息准则。
在一实施例中,对于候选回归系数集合为{(0,1),(7,0),(7,1)}所对应的以下回归模型ARMA(0,1),ARMA(7,0)与ARMA(7,1),求得模型ARMA(7,0)的AIC与BIC均最小,因此,可以确定(7,0)即为目标回归系数,并且,可以将该目标回归系数作为该时间序列数据的回归系数。
在确定时间序列数据的回归系数后,即可将该回归系数对应的回归模型,确定为对该时间序列数据进行回归处理所需的回归模型,并且,可以通过确定的回归模型对时间序列数据进行回归处理,并将该回归模型的输出结果作为该时间序列数据的回归特征信息。例如,对于候选回归系数集合为{(0,1),(7,0),(7,1)}所对应的以下回归模型ARMA(0,1),ARMA(7,0)与ARMA(7,1),可以确定模型ARMA(7,0)为对时间序列数据进行回归处理所需的回归模型。进一步地,可以通过模型ARMA(7,0)对时间序列数据进行回归处理,得到该时间序列数据的回归特征信息。
103、基于时间序列数据在至少一个时间维度上的数据分布,计算该时间序列数据在每个时间维度上的数据分布特征信息。
其中,时间维度为从时间的角度去划分时间序列数据所属的特征类型,因此,从不同的时间维度对时间序列数据进行分析,可以得到该时间序列数据在不同时间维度上的特征信息。
例如,时间维度可包括趋势性时间维度、周期性时间维度、以及突变性时间维度等。具体地,从趋势性时间维度对时间序列数据进行分析,可以分析整个时间序列数据是如何增长的,以及预测未来时间里将会如何增长,也即未来时间里的整体增长趋势;从周期性时间维度对时间序列数据进行分析,则可以分析该时间序列数据的周期性趋势,例如,每月的变化趋势,每个季度的变化趋势,每年的变化趋势,等等;从突变性时间维度对时间序列数据进行分析,则可以分析该时间序列数据在一些突变性时间中的变化趋势,例如,在节假日或是一些大事件发生时,该时间序列数据的变化趋势。
其中,数据分布特征信息为描述时间序列数据在时间维度上的数据分布的特征信息,例如,时间序列数据在趋势性时间维度上的数据分布特征,可以为描述该时间序列数据在趋势性时间维度上数据分布的特征信息,譬如,该特征信息可以为表征整个时间序列数据是如何增长的,以及预测未来时间里将会如何增长的相关信息。又如,时间序列数据在周期性时间维度上的数据分布特征,可以为描述该时间序列数据在周期性时间维度上数据分布的特征信息,譬如,该特征信息可以为表征该时间序列数据的周期性趋势的相关信息,作为示例,周期性趋势可以为每月的变化趋势,每个季度的变化趋势,每年的变化趋势,等等;又如,时间序列数据在突变性时间维度上的数据分布特征,可以为描述该时间序列数据在突变性时间维度上数据分布的特征信息,譬如,该特征信息可以为表征该时间序列数据在一些突变性时间中的变化趋势的相关信息,作为示例,突变性时间可以为节假日或是一些大事件发生的时间。
其中,数据分布特征信息的表现形式可以有多种,例如,可以为计算后得到的数值;又如,可以为对时间序列数据进行拟合后得到的函数,等等。
由于本申请中通过考虑时间序列数据在多个时间维度上的数据分布,来计算该时间序列数据在每个时间维度上的数据分布特征信息,因此,可以针对每个时间维度训练对应的模型,以使得可以通过各个时间维度对应的训练后模型,来计算该时间序列数据在对应时间维度上的数据分布特征信息。具体地,步骤“基于时间序列数据在至少一个时间维度上的数据分布,计算该时间序列数据在每个时间维度上的数据分布特征信息”,可以包括:
获取每个时间维度对应的训练后模型;
基于时间序列数据在每个时间维度上的数据分布,通过该时间维度对应的训练后模型,计算该时间序列数据在该时间维度上的数据分布特征信息。
在一实施例中,参考图3,可以以下四个时间维度来对时间序列数据进行分析:趋势性时间维度,周期性时间维度,突变性时间维度,以及随机时间维度。其中,趋势性时间维度对应的训练后模型可以用图3中的g(t)表示,用以拟合时间序列中的非周期性变化,判断时间序列处于上升或下降趋势;周期性时间维度对应的训练后模型可以用图3中的p(t)表示,用以拟合时间序列中的周期性变化,例如,每周,每月,每个季节等变化趋势;突变性时间维度对应的训练后模型可以用图3中的h(t)标识,用以拟合潜在的具有非固定周期的节假日及变点对预测值造成的影响,例如,节假日,应用运营活动日等;随机时间维度对应的训练后模型可以用图3中的ε(t)表示,用以拟合未预测到的随机波动,例如ε(t)可以服从高斯分布。
进一步地,在该实施例中,即可基于时间序列数据在每个时间维度上的数据分布,通过该时间维度对应的训练后模型,计算该时间序列数据在该时间维度上的数据分布特征信息。具体地,可以将时间序列数据作为自变量t输入到各训练后模型中,得到各训练后模型的输出值,并将该输出值作为该时间序列数据在对应时间维度上的数据分布特征信息。
在一实施例中,可以将趋势性时间维度对应的训练后模型作为趋势预测模型,具体地,步骤“获取每个时间维度对应的训练后模型”,可以包括:
获取进行模型训练所需的样本数据集;
确定模型类型信息以及模型参数信息;
基于模型类型信息与模型参数信息,确定待训练的趋势预测模型;
通过样本数据集对待训练的趋势预测模型进行模型训练,得到训练后的趋势预测模型。
其中,样本数据集为样本数据的集合,样本数据由样本对象在历史时间区间内的时间序列数据构成。由于样本是观测或调查的一部分个体,总体是研究对象的全部,因此,样本对象即为观测或调差的一部分对象。例如,可以将本申请所述的方法应用在预测游戏应用A的目标用户所属的用户类型,则游戏应用A的样本对象可以为游戏应用A的样本用户,即游戏应用A的部分用户;又如,目标应用可以为向客户提供服务的应用B,其中,客户可以包括个人用户,组织机构等,则应用B的样本对象可以为应用B的样本客户,即应用B的部分客户。
其中,模型类型信息为描述建立趋势预测模型时,所需确定的模型类型的相关信息,以使得建立后的趋势预测模型该模型类型下的模型。例如,当从趋势性时间维度对时间序列数据进行分析时,可以提供两种类型的模型用以建模:非线性增长模型与线性增长模型。
其中,模型参数信息为描述建立趋势预测模型时,所需确定的模型参数的相关信息,以使得建立后的趋势预测模型是基于该模型参数建立得到的。例如,若模型类型为非线性增长模型类别下的逻辑回归模型时,模型参数信息可以包括增长最大值信息、增长率信息、以及偏移量信息等;又如,若模型类型为线性增长模型类别下的分段式线性模型时,模型参数信息可以包括增长率信息、偏移量信息、分段点信息等。
在确定模型类型信息与模型参数信息后,即可基于确定的模型类型信息与模型参数信息,确定待训练的趋势预测模型。进一步地,可以通过样本数据集对待训练的趋势预测模型进行模型训练,得到训练后的趋势预测模型。
进行模型训练的方式可以有多种,例如,可以通过样本数据集来调整模型中的超参数,例如,对于线性增长模型类别下的分段式线性模型,其待调优的模型超参数可以包括分段点数量,具体地,分段点数量的值越大,可以使得训练后的趋势预测模型对样本数据集的拟合程度越强,然而也增加了过拟合的风险,因此,可以通过样本数据集来对模型中的超参数进行调优,以进行模型训练,从而得到训练后的趋势预测模型。
值得注意的是,上述以时间维度为趋势性时间维度为例,对步骤“获取时间维度对应的训练后模型”进行了解释,在实际应用中,当时间维度为其他情况,例如,当时间维度为周期性时间维度,突变性时间维度,或者随机时间维度时,步骤“获取时间维度对应的训练后模型”可以参考当时间维度为周期性时间维度时的方式。
在一实施例中,时间维度可以包括至少一个突变性时间维度,例如,突变性时间维度为从节假日或应用运营活动日对时间序列数据进行分析,因此,不同的节假日或应用运营活动日可以对应不同的突变性时间维度,这样的话,可以将每个突变性时间维度对应的训练后模型,作为该突变性维度对应的突变预测模型,具体地,步骤“基于时间序列数据在每个时间维度上的数据分布,通过该时间维度对应的训练后模型,计算该时间序列数据在该时间维度上的数据分布特征信息”,可以包括:
确定突变性时间维度的时间窗口信息,其中,该时间窗口信息表征该突变性时间维度对应的时间窗口的时长;
基于时间序列数据在突变性时间维度上的数据分布,通过突变预测模型计算时间序列数据在时间窗口内的突变性分布特征;
对突变性分布特征信息进行特征组合,得到时间序列数据在突变性时间维度上的数据分布特征信息。
其中,突变性时间维度的时间窗口信息表征该突变性时间维度对应的时间窗口的时长,也就是说,时间窗口信息用于对各突变预测模型设置时间窗口,用以拟合现实世界中,节假日或应用运营活动日对目标对象的影响常常具有对应的窗口期。例如,在用户消费的场景中,以情人节为例,情人节对用户消费的影响具有窗口期,例如,情人节的前几天与后几天。
进一步地,可以基于时间序列数据在突变性时间维度上的数据分布,通过该突变性时间维度对应的突变预测模型,来计算该时间序列数据在对应时间窗口内的突变性分布特征。
在一实施例中,可以以突变性维度对应的突变性时间事件为节假日为例进行说明,突变预测模型可以通过计算节假日对时间序列数据在时间窗口中的影响,来计算时间序列数据在时间窗口内的突变性分布特征,具体地,由于在实际应用中,节假日会对时间序列造成很大的影响,因此,此处计算的影响即为时间窗口中的节假日对时间序列数据在预设时间区间内最终预测值的影响。
作为示例,突变预测模型可以将同一窗口期中的影响设置为相同的值,又如,突变预测模型可以遵循正态分布来计算该窗口期内各天受到的影响;等等。例如,针对某节假日,其可以以天为计数单位,且针对其设置的时间窗口可以为7天,则可以通过突变预测模型来分别计算时间序列数据在该窗口期的7天中每天的突变性分布特征,例如,可以将该窗口期内每天的影响设置为相同的值;又如,可以遵循正态分布来设置该窗口期内各天受到的影响;等等。在计算出时间序列数据在时间窗口期内每天的突变性分布特征后,即可确定时间序列数据在时间窗口内的突变性时间特征。
在得到时间序列数据在时间窗口内的突变性分布特征后,即可通过对突变性分布特征信息进行特征组合,以确定时间序列数据在突变性时间维度上的数据分布特征信息。
其中,特征组合的方式可以有多种,例如,当突变性分布特征信息的表现形式为具体的数值时,可以通过将各突变性分布特征信息进行相加,相乘,或者加权计算来对各突变性分布特征进行特征组合。
值得注意的是,在本实施例中,考虑到不同的突变性事件,例如,不同的节假日或者应用运营活动日的时间窗口与影响程度存在差异,因此,可以为不同的突变性时间维度设置不同的突变预测模型,这样的话,即可将不同的突变性事件在不同时间点下的影响作为独立的模型。
在一实施例中,可以将周期性时间维度对应的训练后模型作为周期预测模型,具体地,步骤“基于时间序列数据在每个时间维度上的数据分布,通过该时间维度对应的训练后模型,计算该时间序列数据在该时间维度上的数据分布特征信息”,可以包括:
基于时间序列数据在周期性时间维度上的数据分布,通过周期预测模型对该时间序列数据进行分解,得到该时间序列数据的周期性分布特征;
对周期性分布特征进行平滑处理,得到时间序列数据在周期性时间维度上的数据分布特征信息。
由于时间序列数据可以包括多种周期类型的周期变化趋势,例如,每周,每月,每个季节等的周期变化趋势,因此,可以通过对时间序列数据进行分解,来得到该时间序列数据在周期性时间维度上的周期性分布特征。
对时间序列数据进行分解的方式可以有多种,例如,由于任何周期函数都可以由正弦函数和余弦函数构成的无穷级数来表示,因此,在一实施例中,可以用傅里叶级数来对时间序列数据进行分解,具体地,可以通过傅里叶级数来拟合对应的周期属性,以得到该时间序列数据的拟合函数,例如,生成的拟合函数可以为s’(t),其中,s’(t)可以接收过去或将来的时间点t’作为自变量,输出对应的s’(t’)值作为预测值。在该实施例中,可以将该拟合函数作为该时间序列数据的周期性分布特征。
其中,平滑处理用以调整特征的平滑性,在得到该时间序列数据的周期性分布特征后,可以通过对该周期性分布特征进行平滑处理,并将处理后的数据分布特征,作为该时间序列数据在该周期性时间维度上的数据分布特征的表达式,用以计算在预设时间区间内,该时间序列数据在周期性时间维度上的数据分布特征。
在一实施例中,时间序列数据的周期性分布特征可以为s′(t),可以通过下式来对s′(t)进行平滑处理,得到处理后的s(t),并将s(t)作为该时间序列数据在该周期性时间维度上的数据分布特征信息:s(t)=s′(t)β,其中,β~Normal(0,σ)。
作为示例,在实际应用中,可以通过prophet模型来执行步骤103中的相关步骤,其中,prophet是开源的时间序列框架,可以用以对时间序列数据进行处理。
104、基于时间序列数据在历史时间区间内的时序关联关系,计算该时间序列数据的时序关联特征信息。
其中,时间序列数据在历史时间区间内的时序关联关系,用于描述时间序列数据在历史时间区间的不同时间节点之间的关联关系。而时序关联特征信息则为基于时间序列数据的时序关联关系计算得到的特征信息。
基于时序关联关系计算时序关联特征信息的方式可以有多种,例如,可以通过机器学习模型来计算,譬如,可以通过长短期记忆人工神经网络(LongShrot-Term Memory,LSTM)来计算。
其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
其中,LSTM是一种时间循环神经网络,参见图4,图4中右侧的模型即为LSTM模型的模型结构,左侧的模型即为循环神经网络(Recurrent NeuralNetwork,RNN)的模型结构,由于LSTM通过门结构实现了对时间序列数据在历史时间区间内的时序关联关系进行解析,使得LSTM可以用于解决一般的循环神经网络存在的长期依赖问题。
具体地,图4中xt为时间序列数据在当前时间状态下数据的输入,ht-1表示接收到的上一个节点的输入,yt为当前节点状态下的输出,而ht为传递到下一个节点的输出。相比RNN只有一个传递状态ht,LSTM有两个传输状态:ct与ht,其中,对于传递下去的ct改变得很慢,通常输出的ct是上一个状态传过来的ct-1加上一些数值,而ht则在不同节点下往往会有很大的区别。
由于考虑到相比普通的RNN,LSTM能够在更长的序列中有更好的表现,因此,具体地,步骤“基于时间序列数据在历史时间区间内的时序关联关系,计算该时间序列数据的时序关联特征信息”,可以包括:
获取训练后的时序关联预测模型,其中,该时序关联预测模型用于计算时间序列数据的时序关联特征信息;
通过时序关联预测模型,解析时间序列数据在历史时间区间内的时序关联关系;
基于解析结果,计算时间序列数据的时序关联特征信息。
在一实施例中,可以将训练后的LSTM模型作为计算时序关联特征信息所需的时序关联预测模型,进一步地,可以通过该LSTM模型,解析时间序列数据在该历史时间区间内的时序关联关系。
例如,训练后的LSTM模型可以为具有重复神经网络模块的链式结构,并且,LSTM模型中重复的神经网络模块可以参考图5,其中可以包括有用于处理时间序列数据的门结构,具体地,门结构可以实现选择性对信息进行提取。例如,参考图6,基本的门结构可以通过一个sigmoid的神经层和一个逐点相乘的操作来实现,具体地,sigmoid层输出的每个元素都是在0至1之间的实数,其可以用于表征进行信息提取的权重,例如,0表示不提取任何信息,1表示提取所有信息。在LSTM模型中,可以基于基本门结构来解析时间序列数据在历史时间区间内的时序关联关系。
作为示例,LSTM模型中,可以包括以下三个基于基本门结构确定的复合门结构:遗忘门结构、输入门结构、以及输出门结构。其中,遗忘门结构可以用于从时间序列数据xt中选择性地过滤部分信息,输入门结构可以用于从时间序列数据xt中选择性地提取部分信息,输出门结构可以用于确定神经网络模块所输出的信息。这样的话,即可通过这些复合门结构来解析时间序列数据在历史时间区间内的时序关联关系。
具体地,遗忘门结构可以读取ht-1与xt,并输出一个在0至1之间的数值用以确定时序信息保留的权重,例如,1表示保留全部信息,也即不过滤任何信息;0表示不保留任何信息,也即过滤全部信息。在一实施例中,遗忘门结构的实现机制可以参照下式:ft=σ(Wf·[ht-1,xt]+bf),其中,σ表示sigmoid函数,Wf与bf则表示训练后参数。参考图7,可以将遗忘门结构的示意在图5的基础上着重标注。
具体地,输入门结构可以用于从时间序列数据xt中选择性地提取部分信息,例如,输入门结构的实现机制可以参照以下式子:
it=σ(Wi·[ht-1,xt]+bi)
Figure BDA0003042776570000201
其中,σ表示sigmoid函数,Wi、WC、bi与bC则表示训练后参数。参考图8,其中将输入门结构的示意在图5的基础上着重标注。
具体地,输出门机制可以用于确定神经网络模块所输出的信息,例如,输出门结构的实现机制可以参照以下式子:
Figure BDA0003042776570000202
其中,σ表示sigmoid函数,Wo与bo则表示训练后参数。参考图9,其中将输出门结构的示意在图5的基础上着重标注。
这样的话,即可通过LSTM模型来解析时间序列数据xt在历史时间区间内的时序关联关系,由于训练后LSTM模型会基于针对时间序列数据xt的解析结果,来生成最后的输出结果,因此,可以将将训练后LSTM模型的最后输出结果作为时间序列数据的时序关联特征信息。
值得注意的是,本申请不对步骤102,步骤103,以及步骤104之间的执行顺序进行限制,步骤102,步骤103与步骤104可以同时进行,也可以不同时进行,本申请不对此做限制。
105、基于回归特征信息、各个时间维度对应的数据分布特征信息、以及时序关联特征信息,预测目标对象在预设时间区间内的对象类型。
其中,对象类型为目标对象所属的类型,例如,当目标对象为目标用户时,在金融应用的场景中,可以将用户分为两类,一类是严格拒绝并不予提供风险***的劣质用户(以下简称“严拒用户”),另一类则是非严拒的优质用户,因此,在该示例中,用户类型可以包括优质用户类型与劣质用户类型;又如,在游戏应用的场景中,可以将更趋于在游戏应用中付费的用户作为高质用户,将不趋于在游戏应用中付费的用户作为低质用户,因此,在该示例中,用户类型可以包括高质用户类型与低质用户类型;等等。
其中,预设时间区间为待对目标对象进行类型预测的时间区间,例如,预设时间区间可以为未来3个月。值得注意的是,预设时间区间可以为连续的时间区间,也可以为不连续的时间区间。
基于回归特征信息、各个时间维度对应的数据分布特征信息、以及时序关联特征信息,对目标对象在预设时间区间内的对象类型进行预测的方式可以有多种,例如,可以通过对上述特征信息进行特征融合,得到融合后特征,并基于该融合后特征确定该目标对象的对象类型。具体地,步骤“基于回归特征信息、各个时间维度对应的数据分布特征信息、以及时序关联特征信息,预测目标对象在预设时间区间内的对象类型”,可以包括:
对回归特征信息、各个时间维度对应的数据分布特征信息、以及时序关联特征信息进行特征融合,得到融合后特征;
基于融合后特征,预测目标对象在预设时间区间内的对象类型。
其中,特征融合指的是通过对多个特征信息进行处理,以得到参考了多个特征信息的融合后特征。特征融合的方式可以有多种,例如,可以对各个特征信息进行相加,相乘,或者加权处理等。具体地,步骤“对回归特征信息、各个时间维度对应的数据分布特征信息、以及时序关联特征信息进行特征融合,得到融合后特征”,可以包括:
对各个时间维度对应的数据分布特征进行特征融合,得到融合后的数据分布特征信息;
分别确定回归特征信息、时序关联特征信息、以及融合后数据分布特征信息的权重;
基于权重,对回归特征信息、时序关联特征信息、以及融合后数据分布特征信息进行特征融合,得到融合后特征。
类似地,对各个时间维度对应的数据分布特征进行特征融合的方式可以有多种,例如,在一实施例中,可以参考图3,通过对各个时间维度对应的数据分布特征进行相加,以对其进行特征融合,并将相加得到的结果作为融合后的数据分布特征信息。
在另一实施例中,可以通过对各个时间维度对应的数据分布特征进行相乘,以对其进行特征融合,并将相乘得到的结果作为融合后的数据分布特征信息。
在另一实施例中,可以通过对各个时间维度对应的数据分布特征进行加权处理,以对其进行特征融合,并将加权处理得到的结果作为融合后的数据分布特征信息,其中,权重可以基于业务需求进行设置,也可以通过设计权重设计模型来调节。
进一步地,可以对回归特征信息、时序关联特征信息、以及融合后数据分布特征信息进行特征融合,例如,可以通过加权处理的方式进行,具体地,可以分别确定回归特征信息、时序关联特征信息、以及融合后数据分布特征信息的权重;并基于权重,对回归特征信息、时序关联特征信息、以及融合后数据分布特征信息进行特征融合,得到融合后特征,其中,权重可以基于业务需求进行设置,也可以通过设计权重设计模型来调节。
作为示例,可以用具体数值来表示特征信息,其中,时间序列数据的回归特征信息、时序关联特征信息、以及融合后数据分布特征信息可以分别为5.1,4.5,6.2,并且,对应的权重分配可以分别为0.2,0.5,0.3,那么,可以融合后特征即为5.1×0.2+4.5×0.5+6.2×0.3=5.13。
在得到融合后特征后,即可进一步地并基于融合后特征,预测目标对象在预设时间区间内的对象类型。
例如,可以设置特征阈值,以使得可以通过将融合后特征与该特征阈值进行比较,从而确定目标对象在预设时间区间内所属的对象类型;又如,将目标对象的融合后特征与全量对象的融合后特征进行排序,并基于排序结果确定目标对象在预设时间区间内所属的对象类型;等等。
由上可知,本实施例可以获取目标对象在历史时间区间内的时间序列数据;对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
该方案可以通过对目标对象的时间序列数据进行回归处理,得到回归特征信息,具体地,该回归特征信息可以用于在短期内预测目标对象所属的对象类型;通过计算该目标对象的时间序列数据在多个时间维度上的数据分布特征信息,用以从多个时间维度来预测目标对象在长期内所属的对象类型;通过计算该目标对象的时间序列数据的时序关联特征信息,以使得能够通过神经网络模型来对该目标对象所属的对象类型进行预测。进一步地,该方案能够对前述得到的特征信息进行特征融合,从而实现了对该目标对象的短期预测结果、长期预测结果、以及神经网络预测结果进行融合,并基于融合结果,综合地预测目标对象所属的对象类型。这样的话,该方案避免了基于规则判别过程中,需要人为地对预测对象类型所需的指标进行人工调整的情况,并且,该方案通过基于数据挖掘的方法,能够基于目标对象的时间序列数据,准确并高效的预测该目标对象所属的对象类型。
根据上面实施例所描述的方法,以下将举例进一步详细说明。
在本实施例中,将以对象类型的预测装置集成在服务器与终端为例进行说明,该服务器可以是单台服务器,也可以是由多个服务器组成的服务器集群;该终端可以为手机、平板电脑、笔记本电脑等设备。
如图10所示,一种对象类型的预测方法,具体流程如下:
201、终端向服务器发送目标对象在历史时间区间内的时间序列数据。
在一实施例中,可以将本申请所述的对象类型的预测方法应用在资源定向投放的应用场景中,具体地,产品在实际运营过程中,受限于投放资源或降低用户骚扰的考虑,需要对某些特定的符合条件的用户群进行定向投放,在有限资源的前提下,实现投出产出比的最大化,此时业务常常需要锁定一部分高价值用户群进行定向运营,需要借助用户的声明周期总价值进行用户定向筛选进行运营。
其中,生命周期总价值(LiftTimeValue,LTV),意为客户终生价值,是公司从用户所有的互动中所得到的全部经济收益的总和。通常被应用于市场营销领域,用于衡量企业客户对企业所产生的价值,被定为企业是否能够取得高利润的重要参考指标。
因此,可以确定LTV指标,具体地,每个业务场景对LTV的定义不同,一般设置为未来n天发生某行为的次数/金额。进一步地,终端可以收集目标用户在历史时间区间内的LTV指标值,生成目标用户在该历史时间区间内的时间序列数据,并将该时间序列数据发送给服务器。
202、服务器获取终端发送的时间序列数据。
203、服务器对时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息。
在一实施例中,服务器可以确定时间序列数据的回归系数,其中,该回归系数表征该时间序列数据的时序相关性。并且,服务器可以基于确定的回归系数,进一步地确定对时间序列数据进行回归处理所需的回归模型,并通过该回归模型对时间序列数据进行回归处理,得到时间序列数据的回归特征信息。作为示例,回归模型可以包括ARIMA模型。
204、服务器基于时间序列数据在至少一个时间维度上的数据分布,计算时间序列数据在每个时间维度上的数据分布特征信息。
在一实施例中,服务器可以获取每个时间维度对应的训练后模型,并基于时间序列数据在每个时间维度上的数据分布,通过各时间维度对应的训练后模型,计算时间序列数据在各时间维度上的数据分布特征信息。作为示例,时间维度可以包括趋势性时间维度,突变性时间维度,周期性时间维度,随机时间维度等。
205、服务器基于时间序列数据在历史时间区间内的时序关联关系,计算时间序列数据的时序关联特征信息。
在一实施例中,服务器可以获取训练后的时序关联预测模型,其中,该时序关联预测模型用于计算时间序列数据的时序关联特征信息,例如,可以以LSTM模型作为时序关联预测模型。并且,服务器可以通过时序关联预测模型,解析时间序列数据在历史时间区间内的时序关联关系,以使得服务器可以基于解析结果,计算时间序列数据的时序关联特征信息。
作为示例,服务器可以将样本数据集拆分成训练集和测试集,例如,可以按照时间顺序将样本数据集中前2/3部分作为训练集,后1/3部分作为测试集。进一步地,服务器可以对样本做0-1的归一化处理,得到归一化后的样本后,通过该归一化后的样本,对LSTM进行模型训练。可选的,服务器可以对训练后的LSTM进行模型评测,具体地,服务器可以计算最终测试的均方误差,将模型预测得到的预测值进行反归一化,以还原成本身的值,并基于该值对训练后的LSTM进行模型评测。
206、服务器基于回归特征信息、各个时间维度对应的数据分布特征信息、以及时序关联特征信息,预测目标对象在预设时间区间内的对象类型。
在一实施例中,服务器可以对回归特征信息、各个时间维度对应的数据分布特征信息、以及时序关联特征信息进行特征融合,得到融合后特征,具体地,服务器可以对各个时间维度对应的数据分布特征进行特征融合,得到融合后的数据分布特征信息,并且,分别确定回归特征信息、时序关联特征信息、以及融合后数据分布特征信息的权重,以使得可以基于权重,对回归特征信息、时序关联特征信息、以及融合后数据分布特征信息进行特征融合,得到融合后特征。进一步地,服务器可以基于融合后特征,预测目标对象在预设时间区间内的对象类型。
其中,特征融合指的是通过对多个特征信息进行处理,以得到参考了多个特征信息的融合后特征。特征融合的方式可以有多种,例如,可以对各个特征信息进行相加,相乘,或者加权处理等。
207、服务器将预测结果发送给终端。
208、终端获取服务器发送的预测结果,并基于预测结果展开业务。
在一实施例中,终端可以对获取服务器发送的目标用户的类型预测结果,并将该目标用户的类型预测结果与全量用户的类型预测结果进行排序,对排名靠前的用户群优先进行运营。
本申请实施例可以通过对目标对象的时间序列数据进行回归处理,得到回归特征信息,具体地,该回归特征信息可以用于在短期内预测目标对象所属的对象类型;通过计算该目标对象的时间序列数据在多个时间维度上的数据分布特征信息,用以从多个时间维度来预测目标对象在长期内所属的对象类型;通过计算该目标对象的时间序列数据的时序关联特征信息,以使得能够通过神经网络模型来对该目标对象所属的对象类型进行预测。进一步地,本申请实施例能够对前述得到的特征信息进行特征融合,从而实现了对该目标对象的短期预测结果、长期预测结果、以及神经网络预测结果进行融合,并基于融合结果,综合地预测目标对象所属的对象类型。这样的话,本申请实施例避免了基于规则判别过程中,需要人为地对预测对象类型所需的指标进行人工调整的情况,并且,本申请实施例通过基于数据挖掘的方法,能够基于目标对象的时间序列数据,准确并高效的预测该目标对象所属的对象类型。
并且,在用户运营的过程中,本申请实施例通过自动化数据化的方法对用户LTV进行预测,杜绝了产品经理的经验主义及人为判断的失误,帮助产品及业务团队提升了运营效率及带动产品增长,因此,本方案对产品的精细化化运营与增长起着重要的作用。
为了更好地实施以上方法,相应的,本申请实施例还提供一种对象类型的预测装置,其中,该对象类型的预测装置可以集成在服务器或终端中。该服务器可以是单台服务器,也可以是由多个服务器组成的服务器集群;该终端可以为手机、平板电脑、笔记本电脑等设备。
例如,如图11所示,该对象类型的预测装置可以包括数据获取单元301,回归处理单元302,第一计算单元303,第二计算单元304以及类型预测单元305,如下:
数据获取单元301,用于获取目标对象在历史时间区间内的时间序列数据;
回归处理单元302,用于对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;
第一计算单元303,用于基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;
第二计算单元304,用于基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;
类型预测单元305,用于基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
在一实施例中,参考图12,所述回归处理单元302,可以包括:
系数确定子单元3021,可以用于确定所述时间序列数据的回归系数,其中,所述回归系数表征所述时间序列数据的时序相关性;
模型确定子单元3022,可以用于基于所述回归系数,确定对所述时间序列数据进行回归处理所需的回归模型;
回归处理子单元3023,可以用于通过所述回归模型对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息。
在一实施例中,所述系数确定子单元3021,可以用于:
对所述时间序列数据进行数据转换,得到所述时间序列数据对应的平稳时间序列;基于所述平稳时间序列,确定所述时间序列数据的候选回归系数集合,其中,所述候选回归系数集合包括至少一组候选回归系数,每组所述候选回归系数对应于一个回归模型;对每组所述候选回归系数对应的回归模型进行模型评估,得到评估结果;基于所述评估结果,从所述候选回归系数集合中确定目标回归系数,将所述目标回归系数作为所述时间序列数据的回归系数。
在一实施例中,参考图13,所述第一计算单元303,可以包括:
第一获取子单元3031,可以用于获取每个所述时间维度对应的训练后模型;
第一计算子单元3032,可以用于基于所述时间序列数据在每个所述时间维度上的数据分布,通过所述时间维度对应的训练后模型,计算所述时间序列数据在所述时间维度上的数据分布特征信息。
在一实施例中,所述时间维度包括趋势性时间维度,所述训练后模型包括所述趋势性时间维度对应的趋势预测模型;所述第一获取子单元3031,可以具体用于:
获取进行模型训练所需的样本数据集;确定模型类型信息以及模型参数信息;基于所述模型类型信息与所述模型参数信息,确定待训练的趋势预测模型;通过所述样本数据集对所述待训练的趋势预测模型进行模型训练,得到训练后的趋势预测模型。
在一实施例中,所述时间维度包括至少一个突变性时间维度,所述训练后模型包括每个所述突变性时间维度对应的突变预测模型;所述第一计算子单元3032,可以具体用于:
确定所述突变性时间维度的时间窗口信息,其中,所述时间窗口信息表征所述突变性时间维度对应的时间窗口的时长;基于所述时间序列数据在所述突变性时间维度上的数据分布,通过所述突变预测模型计算所述时间序列数据在所述时间窗口内的突变性分布特征;对所述突变性分布特征信息进行特征组合,得到所述时间序列数据在所述突变性时间维度上的数据分布特征信息。
在一实施例中,所述时间维度包括至少一个突变性时间维度,所述时间维度包括周期性时间维度,所述训练后模型包括所述周期性时间维度对应的周期预测模型;所述第一计算子单元3032,可以具体用于:
基于所述时间序列数据在所述周期性时间维度上的数据分布,通过所述周期预测模型对所述时间序列数据进行分解,得到所述时间序列数据的周期性分布特征;对所述周期性分布特征进行平滑处理,得到所述时间序列数据在所述周期性时间维度上的数据分布特征信息。
在一实施例中,参考图14,所述第二计算单元304,可以包括:
第二获取子单元3041,可以用于获取训练后的时序关联预测模型,其中,所述时序关联预测模型用于计算时间序列数据的时序关联特征信息;
关系解析子单元3042,可以用于通过所述时序关联预测模型,解析所述时间序列数据在历史时间区间内的时序关联关系;
第二计算子单元3043,可以用于基于解析结果,计算所述时间序列数据的时序关联特征信息。
在一实施例中,参考图15,所述类型预测单元305,可以包括:
特征融合子单元3051,可以用于对所述回归特征信息、所述各个时间维度对应的数据分布特征信息、以及所述时序关联特征信息进行特征融合,得到融合后特征;
类型预测子单元3052,可以用于基于所述融合后特征,预测所述目标对象在预设时间区间内的对象类型。
在一实施例中,所述特征融合子单元3051,可以具体用于:
对所述各个时间维度对应的数据分布特征进行特征融合,得到融合后的数据分布特征信息;分别确定所述回归特征信息、所述时序关联特征信息、以及所述融合后数据分布特征信息的权重;基于所述权重,对所述回归特征信息、所述时序关联特征信息、以及所述融合后数据分布特征信息进行特征融合,得到融合后特征。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由上可知,本实施例的对象类型的预测装置中由数据获取单元301获取目标对象在历史时间区间内的时间序列数据;由回归处理单元302对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;由第一计算单元303基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;由第二计算单元304,基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;由类型预测单元305,基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
该方案可以通过对目标对象的时间序列数据进行回归处理,得到回归特征信息,具体地,该回归特征信息可以用于在短期内预测目标对象所属的对象类型;通过计算该目标对象的时间序列数据在多个时间维度上的数据分布特征信息,用以从多个时间维度来预测目标对象在长期内所属的对象类型;通过计算该目标对象的时间序列数据的时序关联特征信息,以使得能够通过神经网络模型来对该目标对象所属的对象类型进行预测。进一步地,该方案能够对前述得到的特征信息进行特征融合,从而实现了对该目标对象的短期预测结果、长期预测结果、以及神经网络预测结果进行融合,并基于融合结果,综合地预测目标对象所属的对象类型。这样的话,该方案避免了基于规则判别过程中,需要人为地对预测对象类型所需的指标进行人工调整的情况,并且,该方案通过基于数据挖掘的方法,能够基于目标对象的时间序列数据,准确并高效的预测该目标对象所属的对象类型。
此外,本申请实施例还提供一种计算机设备,该计算机设备可以为服务器或终端等设备,如图16所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括有一个或一个以上计算机可读存储介质的存储器401、包括有一个或者一个以上处理核心的处理器402、以及电源403等部件。本领域技术人员可以理解,图16中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
存储器401可用于存储软件程序以及模块,处理器402通过运行存储在存储器401的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器401可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器401可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器401还可以包括存储器控制器,以提供处理器402和输入单元603对存储器401的访问。
处理器402是计算机设备的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器401内的软件程序和/或模块,以及调用存储在存储器401内的数据,执行计算机设备的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器402可包括一个或多个处理核心;优选的,处理器402可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器402中。
计算机设备还包括给各个部件供电的电源403(比如电池),优选的,电源可以通过电源管理***与处理器402逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,计算机设备还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,计算机设备中的处理器402会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器401中,并由处理器402来运行存储在存储器401中的应用程序,从而实现各种功能,如下:
获取目标对象在历史时间区间内的时间序列数据;对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本实施例的计算机设备可以通过对目标对象的时间序列数据进行回归处理,得到回归特征信息,具体地,该回归特征信息可以用于在短期内预测目标对象所属的对象类型;通过计算该目标对象的时间序列数据在多个时间维度上的数据分布特征信息,用以从多个时间维度来预测目标对象在长期内所属的对象类型;通过计算该目标对象的时间序列数据的时序关联特征信息,以使得能够通过神经网络模型来对该目标对象所属的对象类型进行预测。进一步地,本实施例的计算机设备能够对前述得到的特征信息进行特征融合,从而实现了对该目标对象的短期预测结果、长期预测结果、以及神经网络预测结果进行融合,并基于融合结果,综合地预测目标对象所属的对象类型。这样的话,本实施例的计算机设备避免了基于规则判别过程中,需要人为地对预测对象类型所需的指标进行人工调整的情况,并且,本实施例的计算机设备通过基于数据挖掘的方法,能够基于目标对象的时间序列数据,准确并高效的预测该目标对象所属的对象类型。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种对象类型的预测方法中的步骤。例如,该指令可以执行如下步骤:
获取目标对象在历史时间区间内的时间序列数据;对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种对象类型的预测方法中的步骤,因此,可以实现本申请实施例所提供的任一种对象类型的预测方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述对象类型的预测方面的各种可选实现方式中提供的方法。
以上对本申请实施例所提供的一种对象类型的预测方法、装置、计算机设备和存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (13)

1.一种对象类型的预测方法,其特征在于,包括:
获取目标对象在历史时间区间内的时间序列数据;
对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;
基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;
基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;
基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
2.根据权利要求1所述的对象类型的预测方法,其特征在于,对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息,包括:
确定所述时间序列数据的回归系数,其中,所述回归系数表征所述时间序列数据的时序相关性;
基于所述回归系数,确定对所述时间序列数据进行回归处理所需的回归模型;
通过所述回归模型对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息。
3.根据权利要求2所述的对象类型的预测方法,其特征在于,确定所述时间序列数据的回归系数,包括:
对所述时间序列数据进行数据转换,得到所述时间序列数据对应的平稳时间序列;
基于所述平稳时间序列,确定所述时间序列数据的候选回归系数集合,其中,所述候选回归系数集合包括至少一组候选回归系数,每组所述候选回归系数对应于一个回归模型;
对每组所述候选回归系数对应的回归模型进行模型评估,得到评估结果;
基于所述评估结果,从所述候选回归系数集合中确定目标回归系数,将所述目标回归系数作为所述时间序列数据的回归系数。
4.根据权利要求1所述的对象类型的预测方法,其特征在于,基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息,包括:
获取每个所述时间维度对应的训练后模型;
基于所述时间序列数据在每个所述时间维度上的数据分布,通过所述时间维度对应的训练后模型,计算所述时间序列数据在所述时间维度上的数据分布特征信息。
5.根据权利要求4所述的对象类型的预测方法,其特征在于,所述时间维度包括趋势性时间维度,所述训练后模型包括所述趋势性时间维度对应的趋势预测模型;
获取每个所述时间维度对应的训练后模型,包括:
获取进行模型训练所需的样本数据集;
确定模型类型信息以及模型参数信息;
基于所述模型类型信息与所述模型参数信息,确定待训练的趋势预测模型;
通过所述样本数据集对所述待训练的趋势预测模型进行模型训练,得到训练后的趋势预测模型。
6.根据权利要求4所述的对象类型的预测方法,其特征在于,所述时间维度包括至少一个突变性时间维度,所述训练后模型包括每个所述突变性时间维度对应的突变预测模型;
基于所述时间序列数据在每个所述时间维度上的数据分布,通过所述时间维度对应的训练后模型,计算所述时间序列数据在所述时间维度上的数据分布特征信息,包括:
确定所述突变性时间维度的时间窗口信息,其中,所述时间窗口信息表征所述突变性时间维度对应的时间窗口的时长;
基于所述时间序列数据在所述突变性时间维度上的数据分布,通过所述突变预测模型计算所述时间序列数据在所述时间窗口内的突变性分布特征;
对所述突变性分布特征信息进行特征组合,得到所述时间序列数据在所述突变性时间维度上的数据分布特征信息。
7.根据权利要求4所述的对象类型的预测方法,其特征在于,所述时间维度包括周期性时间维度,所述训练后模型包括所述周期性时间维度对应的周期预测模型;
基于所述时间序列数据在每个所述时间维度上的数据分布,通过所述时间维度对应的训练后模型,计算所述时间序列数据在所述时间维度上的数据分布特征信息,包括:
基于所述时间序列数据在所述周期性时间维度上的数据分布,通过所述周期预测模型对所述时间序列数据进行分解,得到所述时间序列数据的周期性分布特征;
对所述周期性分布特征进行平滑处理,得到所述时间序列数据在所述周期性时间维度上的数据分布特征信息。
8.根据权利要求1所述的对象类型的预测方法,其特征在于,基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息,包括:
获取训练后的时序关联预测模型,其中,所述时序关联预测模型用于计算时间序列数据的时序关联特征信息;
通过所述时序关联预测模型,解析所述时间序列数据在历史时间区间内的时序关联关系;
基于解析结果,计算所述时间序列数据的时序关联特征信息。
9.根据权利要求1所述的对象类型的预测方法,其特征在于,基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型,包括:
对所述回归特征信息、所述各个时间维度对应的数据分布特征信息、以及所述时序关联特征信息进行特征融合,得到融合后特征;
基于所述融合后特征,预测所述目标对象在预设时间区间内的对象类型。
10.根据权利要求9所述的对象类型的预测方法,其特征在于,对所述回归特征信息、所述各个时间维度对应的数据分布特征信息、以及所述时序关联特征信息进行特征融合,得到融合后特征,包括:
对所述各个时间维度对应的数据分布特征进行特征融合,得到融合后的数据分布特征信息;
分别确定所述回归特征信息、所述时序关联特征信息、以及所述融合后数据分布特征信息的权重;
基于所述权重,对所述回归特征信息、所述时序关联特征信息、以及所述融合后数据分布特征信息进行特征融合,得到融合后特征。
11.一种对象类型的预测装置,其特征在于,包括:
数据获取单元,用于获取目标对象在历史时间区间内的时间序列数据;
回归处理单元,用于对所述时间序列数据进行回归处理,得到所述时间序列数据的回归特征信息;
第一计算单元,用于基于所述时间序列数据在至少一个时间维度上的数据分布,计算所述时间序列数据在每个所述时间维度上的数据分布特征信息;
第二计算单元,用于基于所述时间序列数据在所述历史时间区间内的时序关联关系,计算所述时间序列数据的时序关联特征信息;
类型预测单元,用于基于所述回归特征信息、各个所述时间维度对应的数据分布特征信息、以及所述时序关联特征信息,预测所述目标对象在预设时间区间内的对象类型。
12.一种电子设备,其特征在于,包括存储器和处理器;所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序,以执行权利要求1至10任一项所述的对象类型的预测方法中的操作。
13.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至10任一项所述的对象类型的预测方法中的步骤。
CN202110462219.3A 2021-04-27 2021-04-27 一种对象类型的预测方法、装置、计算机设备和存储介质 Pending CN115249081A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110462219.3A CN115249081A (zh) 2021-04-27 2021-04-27 一种对象类型的预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110462219.3A CN115249081A (zh) 2021-04-27 2021-04-27 一种对象类型的预测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN115249081A true CN115249081A (zh) 2022-10-28

Family

ID=83697462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110462219.3A Pending CN115249081A (zh) 2021-04-27 2021-04-27 一种对象类型的预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN115249081A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115983502A (zh) * 2023-03-16 2023-04-18 北京小米移动软件有限公司 数据处理方法、装置及介质
CN116611674A (zh) * 2023-07-20 2023-08-18 中建五局第三建设有限公司 一种建筑供给水智能调度运行方法
CN116993185A (zh) * 2023-09-28 2023-11-03 腾讯科技(深圳)有限公司 时间序列预测方法、装置、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115983502A (zh) * 2023-03-16 2023-04-18 北京小米移动软件有限公司 数据处理方法、装置及介质
CN116611674A (zh) * 2023-07-20 2023-08-18 中建五局第三建设有限公司 一种建筑供给水智能调度运行方法
CN116611674B (zh) * 2023-07-20 2023-09-22 中建五局第三建设有限公司 一种建筑供给水智能调度运行方法
CN116993185A (zh) * 2023-09-28 2023-11-03 腾讯科技(深圳)有限公司 时间序列预测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Barak et al. Forecasting energy consumption using ensemble ARIMA–ANFIS hybrid algorithm
US11663493B2 (en) Method and system of dynamic model selection for time series forecasting
Janardhanan et al. CPU workload forecasting of machines in data centers using LSTM recurrent neural networks and ARIMA models
CN111401433B (zh) 用户信息获取方法、装置、电子设备及存储介质
Flores et al. Evolutive design of ARMA and ANN models for time series forecasting
CN110400021B (zh) 银行网点现金用量预测方法及装置
CN115249081A (zh) 一种对象类型的预测方法、装置、计算机设备和存储介质
Singh et al. Integrated forecasting using the discrete wavelet theory and artificial intelligence techniques to reduce the bullwhip effect in a supply chain
WO2022021727A1 (zh) 城市综合体用电量预测方法、装置、电子设备及存储介质
Sharko et al. Methodological basis of causal forecasting of the economic systems development management processes under the uncertainty
Quek et al. A new hybrid model of fuzzy time series and genetic algorithm based machine learning algorithm: a case study of forecasting prices of nine types of major cryptocurrencies
Handoyo et al. The fuzzy inference system with rule bases generated by using the fuzzy C-means to predict regional minimum wage in Indonesia
Wang et al. A transformer-based multi-entity load forecasting method for integrated energy systems
Hu et al. Challenges of automated machine learning on causal impact analytics for policy evaluation
CN117495094A (zh) 一种产业链安全风险综合评估预警方法与***
Shah et al. A neoteric technique using ARIMA-LSTM for time series analysis on stock market forecasting
Marwala et al. Univariate modelling of electricity consumption in South Africa: neural networks and neuro-fuzzy systems
US11551318B2 (en) Wage garnishments processing using machine learning for predicting field values
Shojaei et al. Univariate modeling of the timings and costs of unknown future project streams: A case study
CN113723660A (zh) 一种基于dnn-lstm融合模型的特定行为类型预测方法及***
US20210133766A1 (en) Multi-Task Deep Learning of Client Demand
De Fausti et al. Multilayer perceptron models for the estimation of the attained level of education in the Italian Permanent Census
Shahoud et al. Incorporating unsupervised deep learning into meta learning for energy time series forecasting
US20210272067A1 (en) Multi-Task Deep Learning of Employer-Provided Benefit Plans
Sarıyer et al. Modeling and forecasting the daily number of emergency department visits using hybrid models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination