CN112116381A - 基于lstm神经网络的月活预测方法、存储介质和计算机设备 - Google Patents

基于lstm神经网络的月活预测方法、存储介质和计算机设备 Download PDF

Info

Publication number
CN112116381A
CN112116381A CN202010894199.2A CN202010894199A CN112116381A CN 112116381 A CN112116381 A CN 112116381A CN 202010894199 A CN202010894199 A CN 202010894199A CN 112116381 A CN112116381 A CN 112116381A
Authority
CN
China
Prior art keywords
day
sequence
neural network
month
lstm neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010894199.2A
Other languages
English (en)
Other versions
CN112116381B (zh
Inventor
李慧斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Keynote Network Inc
Original Assignee
Beijing Keynote Network Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Keynote Network Inc filed Critical Beijing Keynote Network Inc
Priority to CN202010894199.2A priority Critical patent/CN112116381B/zh
Publication of CN112116381A publication Critical patent/CN112116381A/zh
Application granted granted Critical
Publication of CN112116381B publication Critical patent/CN112116381B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种基于LSTM神经网络的月活预测方法、存储介质和计算机设备,其中该方法包括:接收从第i天到第t天中各天的累计活跃设备数,得到第一序列;对第一序列做差分运算得到第二序列,其中第二序列为从第i+1天到第t天的每日新增活跃设备数;使用LSTM神经网络,根据第二序列确定第t+1天至月末的每日新增活跃设备数;根据第t+1天至月末的每日新增活跃设备数和从第i天到第t天中各天的累计活跃设备数,确定月活跃设备数。通过本申请,实现了对当月月活跃设备数进行预测,并可不依赖于自身历史月活跃设备数,亦不受人为的基于先验主义的影响。

Description

基于LSTM神经网络的月活预测方法、存储介质和计算机设备
技术领域
本申请涉及数据分析技术领域,尤其涉及一种基于长短期记忆(Long Short-TermMemory,简称为LSTM)神经网络的月活预测方法、存储介质和计算机设备。
背景技术
相关技术中,基于历史月活预测月活跃设备数(简称为月活)。例如,针对某一个应用的历史月活进行建模,所用模型有ARIMA、多项式拟合、指数平均等,根据历史月活来预测下一个月的月活。该方法依赖于自身的历史数据无法实现快速预测。
相关技术中,还基于日活和同类应用日活与月活之比的预测月活。例如,统计某电商App的日活d,而同类电商的App日活d',同时已知同类电商App的月活m',则估算该电商App的月活m=d*(m'/d'),为了进一步增加精度,d可以取最近n天的平均值,d'、m'可以取多个同类App的统计数据。上述方法虽然解决了快速估算的问题,然而,有时我们基于先验主义的策略通过人工的方法分类并不总是那么的合理,例如,虽然同样为电商,有些App的用户重复登录次数很高,有些则很低。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种基于LSTM神经网络的月活预测方法、存储介质和计算机设备。
第一方面,本申请提供了一种基于LSTM神经网络的月活预测方法,包括:接收从第i天到第t天中各天的累计活跃设备数,得到第一序列;对第一序列做差分运算得到第二序列,其中第二序列为从第i+1天到第t天的每日新增活跃设备数;使用LSTM神经网络,根据第二序列确定第t+1天至月末的每日新增活跃设备数;根据第t+1天至月末的每日新增活跃设备数和从第i天到第t天中各天的累计活跃设备数,确定月活跃设备数。
在某些实施例中,使用LSTM神经网络,根据上述第二序列确定第t+1天至月末的每日新增活跃设备数之前,还包括:使用上述第二序列中的最大值对第二序列做归一化处理得到第三序列;以及,使用LSTM神经网络,根据第二序列确定第t+1天至月末的每日新增活跃设备数,包括:使用LSTM神经网络,根据上述第三序列确定第四序列,其中,第四序列与第t+1天至月末的每日新增活跃设备数对应;以及使用第二序列中的最大值对上述第四序列做反归一化处理得到第t+1天至月末的每日新增活跃设备数。
在某些实施例中,根据第t+1天至月末的每日新增活跃设备数和从第i天到第t天中各天的累计活跃设备数,确定月活跃设备数,包括:确定第t天的累计活跃设备数及第t+1天至月末的每日新增活跃设备数之和,以确定结果作为月活跃设备数。
在某些实施例中,使用LSTM神经网络,根据上述第三序列确定上述第四序列,包括:使用LSTM神经网络,以上述第三序列作为输入得到第三序列的输出,将输出加入上述第三序列作为新的第三序列,循环直到得到月末对应的输出,得到上述第四序列,其中,第四序列与第t+1天至月末的每日新增活跃设备数对应。
在某些实施例中,使用LSTM神经网络,根据上述第二序列确定第t+1天至月末的每日新增活跃设备数,包括:使用LSTM神经网络,以上述第二序列作为输入确定第t+1天的每日新增活跃设备数,将第t+1天的每日新增活跃设备数加入第二序列得到新的第二序列,循环直到得到月末的每日新增活跃设备数。
在某些实施例中,以历史月的第1天到第n-1天的每日新增活跃设备数为输入,并以历史月的第2天到第n天的每日新增活跃设备数为期望,训练LSTM神经网络。
在某些实施例中,以历史月的第1天到第n-1天的每日新增活跃设备数的归一化序列为输入,并以历史月的第2天到第n天的每日新增活跃设备数的归一化序列为期望,训练LSTM神经网络。
在某些实施例中,以AUC(Area Under Curve,被定义为受试者工作特征曲线(ROC曲线)下与坐标轴围成的面积)或均方误差(MSE)作为模型训练指标训练LSTM神经网络。
第二方面,本申请提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序;计算机程序被处理器执行时实现的基于LSTM神经网络的月活预测方法的步骤。
第三方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质上存储有基于LSTM神经网络的月活预测程序,基于LSTM神经网络的月活预测程序被处理器执行时实现基于LSTM神经网络的月活预测方法的步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,实现了对当月月活跃设备数进行预测,并可不依赖于自身历史月活跃设备数,亦不受人为的基于先验主义的影响。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的基于LSTM神经网络的月活预测方法一种实施方式的流程图;
图2为本申请提供的基于LSTM神经网络的月活预测方法另一种实施方式的流程图;
图3为本申请实施例提供的***一种实施方式的结构示意图;
图4为本申请实施例提供的预测装置340一种实施方式的结构框图;以及
图5为本申请实施例提供的计算机设备一种实施方式的硬件结构示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
图1为本申请提供的基于LSTM神经网络的月活预测方法一种实施方式的流程图,如图1所示,该方法包括步骤S102至步骤S108。
步骤S102,接收从第i天到第t天中各天的累计活跃设备数,得到第一序列。
在本文中,各天的累计活跃设备数为各天统计的活跃设备数,月末的累计活跃设备数为当月的月活跃设备数。第一序列如表1所示。
表1第一序列(各天的累计活跃设备数)示意表
日期 1 2 n
累计活跃设备数 x<sub>1</sub> x<sub>2</sub> x<sub>n</sub>
其中,n为当月的天数。第i天到第t天为{xi,…,xt},集合中包含t-i+1个元素。
步骤S104,对第一序列做差分运算得到第二序列,其中第二序列为从第i+1天到第t天的每日新增活跃设备数。
在本文中,基于第一序列确定第二序列,第二序列为从第i+1天到第t天的每日新增活跃设备数。第二序列如表2所示。
表2第二序列(每日新增活跃设备数)示意表
日期 2 3 n
差分(diff) x<sub>2</sub>-x<sub>1</sub> x<sub>3</sub>-x<sub>2</sub> x<sub>n</sub>-x<sub>n-1</sub>
其中,n为当月的天数。从第i+1天到第t天的每日新增活跃设备数为{xi+1-xi,。。。,xt–xt-1},集合中包含t-i个元素。
步骤S106,使用LSTM神经网络,根据第二序列确定第t+1天至月末的每日新增活跃设备数。
步骤S108,根据第t+1天至月末的每日新增活跃设备数和从第i天到第t天中各天的累计活跃设备数,确定月活跃设备数。
在本申请实施例中,已知第i天到第t天中各天的累计活跃设备数,并预测得出第t+1天至月末的每日新增活跃设备数,步骤S108可根据已知的累计活跃设备数和预测出的此后的每日新增活跃设备数确定得出月活跃设备数。
在步骤S106中,使用LSTM预测出第t+1天至月末的每日新增活跃设备数,在步骤S102中接收到从第i天到第t天中各天的累计活跃设备数,可确定得出月活跃设备数。在某些实施例中,上述步骤S108中,确定第t天的累计活跃设备数及第t+1天至月末的每日新增活跃设备数之和,以确定结果作为月活跃设备数,但本申请并不限于此。
在某些实施例中,用LSTM神经网络进行多步预测,上述步骤S106中,使用LSTM神经网络,以上述第二序列作为输入确定第t+1天的每日新增活跃设备数,将第t+1天的每日新增活跃设备数加入第二序列得到新的第二序列,循环直到得到月末的每日新增活跃设备数。
在实际应用中,几天的累计活跃设备数是易于获得的,例如,APP上线运营几天即可采集到这几天的累计活跃设备数。由此,可以在APP仅运营几天的情况下,快速预测APP的月活。
图2为本申请提供的基于LSTM神经网络的月活预测方法另一种实施方式的流程图,在该实施方式中,对数据做归一化处理,以降低误差,提高预测准确度,如图2所示,该方月活预测包括步骤S202至步骤S212。
步骤S202,接收从第i天到第t天中各天的累计活跃设备数,得到第一序列。
在本文中,各天的累计活跃设备数为各天统计的活跃设备数,月末的累计活跃设备数为当月的月活跃设备数。第一序列可参见表1所示。
步骤S204,对第一序列做差分运算得到第二序列,其中第二序列为从第i+1天到第t天的每日新增活跃设备数。
在步骤S204中,第二序列参见表2所示。
步骤S206,使用上述第二序列中的最大值对第二序列做归一化处理得到第三序列。第三序列如表3所示。
表3第三序列示意表
日期 2 3 n
归一化 (x<sub>2</sub>-x<sub>1</sub>)/max<sub>diff</sub> (x<sub>3</sub>-x<sub>2</sub>)/max<sub>diff</sub> (x<sub>n</sub>-x<sub>n-1</sub>)/max<sub>diff</sub>
其中,maxdiff为第二序列中的最大值。从第i+1天到第t天对应的第三序列为{(xi+1-xi)/maxdiff,…,(xt–xt-1)/maxdiff},集合中包含t-i个元素。
步骤S208,使用LSTM神经网络,根据上述第三序列确定第四序列,其中,第四序列与第t+1天至月末的每日新增活跃设备数对应。
步骤S210,使用第二序列中的最大值(参见表3所示maxdiff)对上述第四序列做反归一化处理得到第t+1天至月末的每日新增活跃设备数。
在本文中,第四序列中的元素被表示为scalei,上述步骤S208中确定得出的第四序列为{scalet+1,…,scalen}。
步骤S212,根据第t+1天至月末的每日新增活跃设备数和从第i天到第t天中各天的累计活跃设备数,确定月活跃设备数。
在某些实施例中,使用LSTM神经网络进行多步预测,上述步骤S208中,使用LSTM神经网络,以上述第三序列作为输入得到第三序列的输出,将输出加入上述第三序列作为新的第三序列,循环直到得到月末对应的输出,得到上述第四序列,其中,第四序列与第t+1天至月末的每日新增活跃设备数对应。
在某些实施例中,上述步骤S212中,确定第t天的累计活跃设备数及第t+1天至月末的每日新增活跃设备数之和,以确定结果作为月活跃设备数,但本申请实施例并不限于此,本领域技术人员可以对第t天的累计活跃设备数及第t+1天至月末的每日新增活跃设备数做一定处理(例如加权平均等),凡是基于已知累计活跃设备数和预测出的此后每日新增活跃设备数的方法都是可行的。
图3为本申请实施例提供的***一种实施方式的结构示意图,如图3所示,该***包括:用户设备310、服务器320、数据库330、预测装置340以及应用装置350。其中,服务320与用户设备310通信连接,用于采集活跃设备数,例如,通过使用应用程序(APP)的用户设备310的设备标识(ID)来统计活跃设备数。数据库330设置为存储服务器320采集的活跃设备数。预测装置340,设置为基于采集的活跃设备数预测月活跃设备数。应用装置350,设置为应用预测装置340预测出的月活跃设备数,例如计算采样率以降低存储和贷款成本,动态扩容、生成使用报告、进行使用限制等,但不限于此。
应当理解,图3仅作为一个示例性说明,在本申请中,可以采用本申请的申请日之前或之后的任何方式收集活跃设备数据,本申请实施例对此不做限定。
图4为本申请实施例提供的预测装置340一种实施方式的结构框图,如图4所示,该预测装置340包括:接收模块341,设置为接收从第i天到第t天中各天的累计活跃设备数,得到第一序列;第一确定模块342,与接收模块341相连,设置为对第一序列做差分运算得到第二序列,其中第二序列为从第i+1天到第t天的每日新增活跃设备数;第二确定模块343,与第一确定模块342相连,设置为使用LSTM神经网络,根据第二序列确定第t+1天至月末的每日新增活跃设备数;第三确定模块344,根据第t+1天至月末的每日新增活跃设备数和从第i天到第t天中各天的累计活跃设备数,确定月活跃设备数。
在某些实施例中,参考图4所示,预测装置340还包括第四确定模块345,设置为使用第二序列中的最大值对第二序列做归一化处理得到第三序列。其中,第三确定模块344,设置为使用LSTM神经网络,根据上述第三序列确定第四序列,其中,第四序列与第t+1天至月末的每日新增活跃设备数对应。预测装置340还包括第五确定模块346,设置为使用第二序列中的最大值对上述第四序列做反归一化处理得到第t+1天至月末的每日新增活跃设备数。
在本申请实施例中,已知第i天到第t天中各天的累计活跃设备数,并预测得出第t+1天至月末的每日新增活跃设备数,第三确定模块344用于根据已知的累计活跃设备数和预测出的此后的每日新增活跃设备数确定得出月活跃设备数。
LSTM神经网络训练
LSTM神经网络的训练过程可参见相关技术。本申请实施例中对LSTM神经网络的输入数据做示例性说明。
本申请实施例中,改变了相关技术中以月活数据预测月活数据的预测方法。在某些实施例中,以历史月的第1天到第n-1天的每日新增活跃设备数为输入,并以历史月的第2天到第n天的每日新增活跃设备数为期望,训练LSTM神经网络。由此,使得LSTM申请网络预测出的每日新增活跃设备数与实际上的每日新增活跃设备数接近。
在某些实施例中,以历史月的第1天到第n-1天的每日新增活跃设备数的归一化序列为输入,并以历史月的第2天到第n天的每日新增活跃设备数的归一化序列为期望,训练LSTM神经网络,以使得LSTM根据已知各天的每日新增活跃设备数预测出未知的数据。
在某些实施例中,以AUC(Area Under Curve,被定义为ROC曲线下与坐标轴围成的面积)或均方误差(MSE)作为模型训练指标训练LSTM神经网络。使用AUC或MSE作为模型训练指标的训练过程参见本申请的申请日之前的已知技术,本申请实施例对此不做赘述,并且本申请实施对此不做限定。
在某些实施例中,使用多个APP(但不限于此)多个月份(但不限于此)各天的累计活跃设备数作为LSTM神经网络的训练数据集,训练得到LSTM神经网络能够用于预测该多个APP或者其他一个或多个其他APP的月活跃设备数。作为示例性说明,按月份为单位,对训练数据集中的累计活跃设备数做预处理,对当月各天的累计活跃设备数做差分处理,得到当月每日新增活跃设备数。使用当月的最大每日新增活跃设备数,对当月每日新增活跃设备数做归一化处理,得到当月的归一化序列。由此得到多个APP多个月份的归一化序列。以多个APP多个月份的归一化序列作为数据输入,训练LSTM神经网络。
在某些实施例中,LSTM神经网络的神经元数量为20,最大步长为32。
应当理解,本文中仅对LSTM神经网络的训练做了示例性说明,在本申请实施例中,以各天的累计活跃设备数得到每日新增活跃设备数,以每月的每日新增活跃设备数构成的序列,作为LSTM神经网络的数据输入,都是可行的。
本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备20至少包括但不限于:可通过***总线相互通信连接的存储器21、处理器22,如图5所示。需要指出的是,图5仅示出了具有组件21-22的计算机设备20,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器21(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备20的内部存储单元,例如该计算机设备20的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备20的外部存储设备,例如该计算机设备20上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备20的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备20的操作***和各类应用软件,例如基于LSTM神经网络的月活预测方法的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备20的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如基于LSTM神经网络的月活预测方法的程序代码,以实现基于LSTM神经网络的月活预测方法。
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储基于LSTM神经网络的月活预测程序,被处理器执行时实现实基于LSTM神经网络的月活预测方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种基于长短期记忆LSTM神经网络的月活预测方法,其特征在于,包括:
接收从第i天到第t天中各天的累计活跃设备数,得到第一序列;
对所述第一序列做差分运算得到第二序列,其中所述第二序列为从第i+1天到第t天的每日新增活跃设备数;
使用LSTM神经网络,根据所述第二序列确定第t+1天至月末的每日新增活跃设备数;
根据所述第t+1天至月末的每日新增活跃设备数和从第i天到第t天中各天的累计活跃设备数,确定月活跃设备数。
2.根据权利要求1所述的基于LSTM神经网络的月活预测方法,其特征在于,
使用LSTM神经网络,根据所述第二序列确定第t+1天至月末的每日新增活跃设备数之前,还包括:使用所述第二序列中的最大值对所述第二序列做归一化处理得到第三序列;以及
使用LSTM神经网络,根据所述第二序列确定第t+1天至月末的每日新增活跃设备数,包括:
使用LSTM神经网络,根据所述第三序列确定第四序列,其中,所述第四序列与第t+1天至月末的每日新增活跃设备数对应;以及
使用所述第二序列中的最大值对所述第四序列做反归一化处理得到第t+1天至月末的每日新增活跃设备数。
3.根据权利要求1所述的基于LSTM神经网络的月活预测方法,其特征在于,根据所述第t+1天至月末的每日新增活跃设备数和从第i天到第t天中各天的累计活跃设备数,确定月活跃设备数,包括:
确定第t天的累计活跃设备数及第t+1天至月末的每日新增活跃设备数之和,以确定结果作为月活跃设备数。
4.根据权利要求2所述的基于LSTM神经网络的月活预测方法,其特征在于,使用LSTM神经网络,根据所述第三序列确定第四序列,包括:
使用LSTM神经网络,以所述第三序列作为输入得到所述第三序列的输出,将所述输出加入所述第三序列作为新的第三序列,循环直到得到月末对应的输出,得到所述第四序列,其中,所述第四序列与第t+1天至月末的每日新增活跃设备数对应。
5.根据权利要求1所述的基于LSTM神经网络的月活预测方法,其特征在于,使用LSTM神经网络,根据所述第二序列确定第t+1天至月末的每日新增活跃设备数,包括:
使用LSTM神经网络,以所述第二序列作为输入确定第t+1天的每日新增活跃设备数,将第t+1天的每日新增活跃设备数加入所述第二序列得到新的第二序列,循环直到得到月末的每日新增活跃设备数。
6.根据权利要求1或2所述的基于LSTM神经网络的月活预测方法,其特征在于,以历史月的第1天到第n-1天的每日新增活跃设备数为输入,并以所述历史月的第2天到第n天的每日新增活跃设备数为期望,训练所述LSTM神经网络。
7.根据权利要求2或4所述的基于LSTM神经网络的月活预测方法,其特征在于,以历史月的第1天到第n-1天的每日新增活跃设备数的归一化序列为输入,并以所述历史月的第2天到第n天的每日新增活跃设备数的归一化序列为期望,训练所述LSTM神经网络。
8.根据权利要求1所述的基于LSTM神经网络的月活预测方法,其特征在于,以受试者工作特征曲线下与坐标轴围成的面积AUC或均方误差MSE作为模型训练指标训练所述LSTM神经网络。
9.一种计算机设备,其特征在于,所述计算机设备包括:
存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;
所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的基于长短期记忆LSTM神经网络的月活预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于长短期记忆LSTM神经网络的月活预测程序,所述基于LSTM神经网络的月活预测程序被处理器执行时实现如权利要求1至8中任一项所述的基于LSTM神经网络的月活预测方法的步骤。
CN202010894199.2A 2020-08-31 2020-08-31 基于lstm神经网络的月活预测方法、存储介质和计算机设备 Active CN112116381B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010894199.2A CN112116381B (zh) 2020-08-31 2020-08-31 基于lstm神经网络的月活预测方法、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010894199.2A CN112116381B (zh) 2020-08-31 2020-08-31 基于lstm神经网络的月活预测方法、存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN112116381A true CN112116381A (zh) 2020-12-22
CN112116381B CN112116381B (zh) 2021-05-07

Family

ID=73804546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010894199.2A Active CN112116381B (zh) 2020-08-31 2020-08-31 基于lstm神经网络的月活预测方法、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN112116381B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600344A (zh) * 2016-12-30 2017-04-26 广州虎牙信息科技有限公司 目标产品活跃用户数据获取方法和装置
CN108596652A (zh) * 2018-03-28 2018-09-28 麒麟合盛网络技术股份有限公司 活跃用户数预测方法及装置
CN108881333A (zh) * 2017-05-09 2018-11-23 腾讯科技(深圳)有限公司 一种预测日活跃对象数量的方法及设备
CN109063927A (zh) * 2018-08-28 2018-12-21 成都信息工程大学 一种基于ts-lstm和dnn的微博转发量预测方法
CN109194498A (zh) * 2018-07-27 2019-01-11 南京理工大学 一种基于lstm的网络流量预测方法
CN109360031A (zh) * 2018-11-16 2019-02-19 北京奇虎科技有限公司 一种活跃用户数的预测方法及装置
CN109583946A (zh) * 2018-11-16 2019-04-05 北京奇虎科技有限公司 一种活跃用户数的预测***及方法
CN109784997A (zh) * 2019-01-11 2019-05-21 重庆邮电大学 一种基于大数据的短视频活跃用户预测方法
CN109858694A (zh) * 2019-01-28 2019-06-07 上海连尚网络科技有限公司 一种日活跃用户数预测的方法及设备
CN110782096A (zh) * 2019-10-29 2020-02-11 山东科技大学 一种外汇时间序列预测方法
CN110796484A (zh) * 2019-10-11 2020-02-14 上海上湖信息技术有限公司 客户活跃程度预测模型的构建方法、装置及其应用方法
EP3640902A2 (en) * 2018-10-17 2020-04-22 Tata Consultancy Services Limited System and method for authenticating humans based on behavioral pattern
CN111401433A (zh) * 2020-03-12 2020-07-10 腾讯科技(深圳)有限公司 用户信息获取方法、装置、电子设备及存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600344A (zh) * 2016-12-30 2017-04-26 广州虎牙信息科技有限公司 目标产品活跃用户数据获取方法和装置
CN108881333A (zh) * 2017-05-09 2018-11-23 腾讯科技(深圳)有限公司 一种预测日活跃对象数量的方法及设备
CN108596652A (zh) * 2018-03-28 2018-09-28 麒麟合盛网络技术股份有限公司 活跃用户数预测方法及装置
CN109194498A (zh) * 2018-07-27 2019-01-11 南京理工大学 一种基于lstm的网络流量预测方法
CN109063927A (zh) * 2018-08-28 2018-12-21 成都信息工程大学 一种基于ts-lstm和dnn的微博转发量预测方法
EP3640902A2 (en) * 2018-10-17 2020-04-22 Tata Consultancy Services Limited System and method for authenticating humans based on behavioral pattern
CN109583946A (zh) * 2018-11-16 2019-04-05 北京奇虎科技有限公司 一种活跃用户数的预测***及方法
CN109360031A (zh) * 2018-11-16 2019-02-19 北京奇虎科技有限公司 一种活跃用户数的预测方法及装置
CN109784997A (zh) * 2019-01-11 2019-05-21 重庆邮电大学 一种基于大数据的短视频活跃用户预测方法
CN109858694A (zh) * 2019-01-28 2019-06-07 上海连尚网络科技有限公司 一种日活跃用户数预测的方法及设备
CN110796484A (zh) * 2019-10-11 2020-02-14 上海上湖信息技术有限公司 客户活跃程度预测模型的构建方法、装置及其应用方法
CN110782096A (zh) * 2019-10-29 2020-02-11 山东科技大学 一种外汇时间序列预测方法
CN111401433A (zh) * 2020-03-12 2020-07-10 腾讯科技(深圳)有限公司 用户信息获取方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112116381B (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
WO2020224106A1 (zh) 基于神经网络的文本分类方法、***及计算机设备
EP3543941A1 (en) Time-factor fusion collaborative filtering method, device, server and storage medium
CN113255370B (zh) 基于语义相似度的行业类型推荐方法、装置、设备及介质
CN108229986B (zh) 信息点击预测中的特征构建方法、信息投放方法和装置
CN112328909B (zh) 信息推荐方法、装置、计算机设备及介质
CN110599354B (zh) 线上对账方法、***、计算机设备和计算机可读存储介质
CN108182633B (zh) 贷款数据处理方法、装置、计算机设备和存储介质
US20210089887A1 (en) Variance-Based Learning Rate Control For Training Machine-Learning Models
CN110807547A (zh) 家庭人口结构的预测方法及***
CN110880014A (zh) 数据处理方法、装置、计算机设备及存储介质
CN112669078A (zh) 一种行为预测模型训练方法、装置、设备及存储介质
CN111797320A (zh) 数据处理方法、装置、设备及存储介质
CN113312578A (zh) 一种数据指标的波动归因方法、装置、设备、及介质
CN112819157A (zh) 神经网络训练的方法及装置、智能行驶控制的方法及装置
CN110503507B (zh) 基于大数据的保险产品数据推送方法、***及计算机设备
CN111626898B (zh) 用于实现事件归因的方法、装置、介质和电子设备
CN112116381B (zh) 基于lstm神经网络的月活预测方法、存储介质和计算机设备
CN112669091A (zh) 数据处理方法、装置及存储介质
CN111783883A (zh) 一种异常数据的检测方法及装置
CN111291092A (zh) 一种数据处理方法、装置、服务器及存储介质
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN112667754B (zh) 大数据处理方法、装置、计算机设备及存储介质
CN113780666A (zh) 一种缺失值的预测方法及装置、可读存储介质
CN112784165A (zh) 关联关系预估模型的训练方法以及预估文件热度的方法
CN106547922B (zh) 一种应用程序的排序方法、装置及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant