CN114610986A - 用户资源的推送方法及装置 - Google Patents

用户资源的推送方法及装置 Download PDF

Info

Publication number
CN114610986A
CN114610986A CN202011425387.7A CN202011425387A CN114610986A CN 114610986 A CN114610986 A CN 114610986A CN 202011425387 A CN202011425387 A CN 202011425387A CN 114610986 A CN114610986 A CN 114610986A
Authority
CN
China
Prior art keywords
user
data
flow rate
flow
preset time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011425387.7A
Other languages
English (en)
Inventor
张瑛
金叶
景小芃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202011425387.7A priority Critical patent/CN114610986A/zh
Publication of CN114610986A publication Critical patent/CN114610986A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种用户资源的推送方法及装置,获取用户的若干个特征数据和在不同时段的流速类别;所述若干个特征数据为对用户流量使用行为产生影响的特征数据,根据特征数据和在不同时段的流速类别,通过网络模型预测所述用户在未来预设时段的流速类别,根据所述用户在所述预设时段的流速类别在预设时段为所述用户推送与预测的流速类别对应的资源片,实现了根据用户在不同时段对流速的需求,向用户提供对应大小的资源片,进而降低了与用户的交互频率,提高了现有的计费***的处理效率,减轻了计费***的压力。

Description

用户资源的推送方法及装置
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种用户资源的推送方法及装置。
背景技术
随着移动网络的发展,用户的业务数据流量呈现爆发式增长,给运营商的计费***带来巨大的资源消耗和运维的挑战。
目前,数据的流量话单占运营商话单数据的90%以上,在线计费需要对用户的业务使用量进行控制。现有技术中,在线计费***根据用户对业务资源片的不同需求调整对用户授权的资源片。然而,用户在不同时间对资源片的需求不同,因此计费***需要频繁与网元进行交互以满足用户在不同时间对资源片的需求。
现有的计费***具有处理效率低,***压力大的缺点。
发明内容
本发明实施例提供一种用户资源的推送方法及装置,以提高计费***的处理效率,降低计费***的压力。
第一方面,本发明实施例提供一种用户资源的推送方法,包括:
获取用户的若干个特征数据和在不同时段的流速类别;所述若干个特征数据包括对用户流量使用行为产生影响的特征数据;
根据特征数据和在不同时段的流速类别,通过网络模型预测所述用户在未来预设时段的流速类别;
根据所述用户在所述预设时段的流速类别在预设时段为所述用户推送与预测的流速类别对应的资源片。
可选的,所述获取用户的若干个特征数据,包括:
对获取的用户宽表数据进行预处理,得到预处理后的用户宽表数据;所述宽表数据包含流量使用数据;
对预处理后的用户宽表数据进行相关性分析,得到多个与所述流量使用数据具有相关性的特征数据;
通过随机森林算法对所述多个与所述流量使用数据具有相关性的特征数据进行筛选,获取所述若干个特征数据。
可选的,所述通过随机森林算法对所述多个与所述流量使用数据具有相关性的特征数据进行筛选,获取所述若干个特征数据,包括:
针对每一特征数据,确定所述特征数据的基尼指数;
根据所述基尼指数确定每个特征数据对应的重要性评分;
对所有特征数据的重要性评分排序,获取若干个排序靠前的重要性评分对应的特征数据。
可选的,获取用户在不同时段的流速类别,包括:
对获取的流量详单数据进行预处理,得到预处理后的流量详单数据;
根据所述预处理后的流量详单数据确定所述用户在预设时段消费的流量数据;
对所述用户在预设时段消费的流量数据进行聚类分析,确定所述用户在预设时段的流速类别。
可选的,对所述用户在预设时段消费的流量数据进行聚类分析,确定所述用户在预设时段的流速类别,包括:
通过预设的每个流速类别数量对应的误差平方和确定流速类别数量;
通过K-means方法根据所述流速类别数量和所述用户在预设时段消费的流量数据确定所述用户在预设时段的流速类别。
可选的,所述通过预设的每个流速类别数量对应的误差平方和确定流速类别的数量,包括:
确定预设的每个流速类别数量对应的误差平方和,根据每个流速类别数量对应的误差平方和确定误差平方和曲线;
选取所述误差平方和曲线中的拐点对应的流速类别数量。
可选的,所述网络模型的确定方法为:
根据获取的历史特征数据、在不同时段的历史流速类别以及在对应的未来预设时段的流速类别确定网络模型。
第二方面,本发明实施例提供一种用户资源的推送装置,包括:
获取模块,用于获取用户的若干个特征数据和在不同时段的流速类别;所述若干个特征数据为对用户流量使用行为产生影响的特征数据;
预测模块,用于根据特征数据和在不同时段的流速类别,通过网络模型预测所述用户在未来预设时段的流速类别;
推送模块,用于根据所述用户在所述预设时段的流速类别在预设时段为所述用户推送与预测的流速类别对应的资源片。
第三方面,本发明实施例提供一种用户资源的推送设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的用户资源的推送方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的用户资源的推送方法。
本发明实施例提供一种用户资源的推送方法及装置,获取用户的若干个特征数据和在不同时段的流速类别;所述若干个特征数据为对用户流量使用行为产生影响的特征数据,根据特征数据和在不同时段的流速类别,通过网络模型预测所述用户在未来预设时段的流速类别,根据所述用户在所述预设时段的流速类别在预设时段为所述用户推送与预测的流速类别对应的资源片,实现了根据用户在不同时段对流速的需求,向用户提供对应大小的资源片,进而降低了与用户的交互频率,提高了现有的计费***的处理效率,减轻了计费***的压力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的用户资源的推送方法的应用场景示意图;
图2为本发明实施例提供的用户资源的推送方法的流程图;
图3为本发明实施例提供的另一种用户资源的推送方法的流程图;
图4为本发明实施例提供的又一种用户资源的推送方法的流程图;
图5为本发明实施例提供的用户资源的推送装置的结构示意图;
图6为本发明实施例提供的用户资源的推送设备的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本发明实施例提供的用户资源的推送方法的应用场景示意图。请参见图1,包括计费***101和用户终端102。计费***101中设置有用户资源推送装置,用户资源推送装置通过获取用户终端的用户数据,预测用户终端在未来时段的流速类别,并为用户终端102推送对应的资源片。其中,用户数据包括用户的若干个特征数据和近期在不同时段的流速类别。用户终端102可以根据用户资源推送装置推送的资源片进行上网。
现有技术中,计费***在对用户的使用流量进行控制时,需要根据用户的需求实时调整流量片的大小,这就会造成计费***频繁与网元交互,使得交互频率较大,计费***的压力较大。为了解决上述问题,通过对用户在未来预设时间使用流量的流速类别进行预测,使得计费***在预设时间自动为用户推送对应大小的资源片,则能够避免计费***与网元的频繁交互。此外,在对流速类别进行预测时不仅仅依靠历史的流量消费数据进行预测,还获取与用户流量使用行为有影响的特征数据,根据获取特征数据与流量消费数据对用户的流速类别进行预测,能够使得预测的数据更加准确。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本发明实施例提供的用户资源的推送方法的流程图,本实施例的方法可以由用户资源的推送装置执行,该推送装置可以以软件和/或硬件的形式设置在图1的计费***中。如图2所示,本实施例的方法,可以包括:
S201:获取用户的若干个特征数据和在不同时段的流速类别;所述若干个特征数据包括对用户流量使用行为产生影响的特征数据。
在本实施例中,为了预测用户的流速类别需要先获取对流速类别有影响的数据。对流速类别有影响的数据可以是不同时段的流速类别,其可以代表用户流量的消费行为。例如,可以是该用户在三天内的每小时的流速类别。其中,对于流速类别的时间及时段均不做限定,对于时间可以是最近三天或最近一周,对于时段可以是每小时的流速类别或每三个小时的流速类别,可以根据需求进行设定。其中,对用户流量使用行为产生影响的特征数据是根据步骤S301、S302和S303得到的。
对流速类别有影响的数据还包括特征数据,其中,特征数据是能够间接影响用户对流量的使用量的数据。例如,用户的性别、年龄、用户的价值得分、用户是否开通流量包以及开通流量包的类型等等。
S202:根据特征数据和在不同时段的流速类别,通过网络模型预测所述用户在未来预设时段的流速类别。
在本实施例中,在确定特征数据和不同时段的流速类别后,可以将特征数据和不同时段的流速类别组合为向量数据,通过网络模型预测用户的未来预设时段的流速类别,例如输入的数据为10个包含性别、年龄、用户的价值得分等的特征数据和每小时的流速类别,则通过网络模型输出的数据为未来一天中每小时的流速类别。例如,当输入的数据为每小时的流速类别时,预测的流速类别可以为000001122222221111110000,其表示未来一天24小时的流速类别。
S203:根据所述用户在所述预设时段的流速类别在预设时段为所述用户推送与预测的流速类别对应的资源片。
在本实施例中,可以预先制定一个资源授权策略,对于每一个流速类别设置相对应大小的资源片,并且根据预设时段的流速类别为用户推送对应的资源片。例如,当流速类别分别为0、1、2、3时,设置资源片的大小为5M、8M、12M和15M,则当预测的上午6时至12时的流速类别为011223时,则在上午6时至12时为该用户推送5M、8M、8M、12M、12M和15M的资源片。
本发明实施例提供的用户资源的推送方法,将获取的用户特征数据对流速分类进行预测,可以使得预测的数据更加精准,通过将用户流量使用量划分为不同的类别,可以减少流速预测的复杂度,通过网络模型基于用户特征数据和流速类别对用户未来流速进行分类预测,能够为用户提供个性化和按需调整的资源片控制策略,可以降低与用户的交互频率,提高了现有的计费***的处理效率,减轻了计费***的压力。
下面结合一个具体的实施例对推送设备获取用户的若干个特征数据的过程进行详细描述。
图3为本发明实施例提供的另一种用户资源的推送方法的流程图,如图3所示,在上述实施例的基础上,本实施例的方法,S201中获取用户的若干个特征数据,还可以包括S301、S302和S303。
S301:对获取的用户宽表数据进行预处理,得到预处理后的用户宽表数据;所述宽表数据包含流量使用数据。
在本实施例中,宽表数据为字段比较多的数据库表,通常为与业务主体相关的指标、维度和属性关联在一起的数据库表。此处获取的宽表数据为与流量消费特征相关的数据。其中,宽表数据包含流量使用数据,流量使用数据可以为当月累计使用总流量。
在获取用户宽表数据后,可以对宽表数据进行预处理。具体的,包括对缺失数据的处理,其中,对缺失数据处理可以包括:确定缺失数据的缺失程度和对预测流速类别的影响程度,并根据缺失程度和对预测流速类别的影响程度对缺失数据进行填补或剔除。
当缺失数据的缺失程度较大且对预测流速类别的影响较大时,则对缺失数据进行填补。其中,填补时可以计算该类别数据的平均值作为填补值。例如,采用k-means聚类方法划分为不同的簇,再获取每簇的平均值。当缺失数据的缺失程度较大且对预测流速类别的影响不大时,可以直接将该数据剔除。对于缺失程度较小的数据可以直接平均值作为填补值进行填补。
对宽表数据进行预处理还可以包括对最大值或最小值等差异太大的数据进行标准化。数据标准化的方法可以为Z分数标准化方法,具体的,计算该类别总体数据的均值和标准差,再计算观测值与均值的差值,最后将观测值与标准差的商作为观测值的代替值。通过Z分数标准化可以减小差异太大的数据对预测结果的影响。
S302:对预处理后的用户宽表数据进行相关性分析,得到多个与所述流量使用数据具有相关性的特征数据。
在对用户宽表数据进行预处理后对预处理后的数据进行相关性分析。通过相关性分析可以研究两个或多个随机变量之间的相关关系。其中,用户宽表数据中流量使用数据是用户使用流量情况的重要数据,可以将用户宽表中的各个数据分别与所述流量使用数据进行相关性分析。其中,在进行相关性分析时对于数值型字段采用双变量相关性分析,对于字符型字段采用卡方分析的方法。
具体的,可以通过相关系数确定各个数据分别与所述流量使用数据的相关程度,其中相关系数为-1至1之间的数据,相关系数为正值时,两个变量的关联程度为正相关;相关系数为负值时,两个变量的关联程度为负相关;当相关系数接近0时,两个变量的关联程度越弱。因此,可以剔除与所述流量使用数据关联程度较弱的数据,剩余的数据为与所述流量使用数据具有相关性的特征数据。
S303:通过随机森林算法对所述多个与所述流量使用数据具有相关性的特征数据进行筛选,获取所述若干个特征数据。
在确定与所述流量使用数据具有相关性的特征数据后,由于所述特征数据的数量较大,若直接通过网络模型进行流速类别的预测,具有耗时的缺点。因此,可以进一步的对所述特征数据进行筛选,具体的,可以通过随机森林的方法确定若干个特征数据,使得筛选出的特征数据是最能代表用户流量使用行为的特征。通过随机森林算法可以快速去除部分特征数据。
上述方法通过对宽表数据进行预处理操作,能够减小缺失数据对流速类型预测的影响,通过对预处理后的用户宽表数据进行相关性分析,可以初步筛选出与流量使用数据具有相关性的特征数据,减小了随机森林方法筛选特征数据时对数据的处理量,最后通过随机森林方法能够快速筛选出若干个特征数据。
可选的,所述通过随机森林算法对所述多个与所述流量使用数据具有相关性的特征数据进行筛选,获取所述若干个特征数据,包括:
针对每一特征数据,确定所述特征数据的基尼指数;根据所述基尼指数确定每个特征数据对应的重要性评分;对所有特征数据的重要性评分排序,获取若干个排序靠前的重要性评分对应的特征数据。
在本实施例中,对于每一个特征数据,根据每个特征数据所占的比例确定基尼指数。假设所述随机森林包含m个节点,则获取节点m在分枝前后的基尼指数的变化量,根据节点m在分枝前后的基尼指数的变化量确定特征数据在第i棵树的重要性评分,进而计算所述特征数据在n棵树的重要性评分。
在获取每一特征数据的重要性评分后,对所述重要性评分进行归一化处理,并进行排序,筛选出排序靠前的重要性评分对应的特征数据。例如,可以筛选出10个重要性评分最高的特征数据,如表1所示。
表1
Figure BDA0002824572440000081
Figure BDA0002824572440000091
如上表所示,示例性的给出了本申请筛选的10个特征数据,筛选出的特征数据均是对用户流量使用产生影响的数据。
下面结合一个具体的实施例对推送设备获取用户在不同时段的流速类别的过程进行详细描述。
图4为本发明实施例提供的又一种用户资源的推送方法的流程图,如图4所示,在上述实施例的基础上,本实施例的方法,S201中获取用户在不同时段的流速类别,还可以包括S401、S402和S403。
S401:对获取的流量详单数据进行预处理,得到预处理后的流量详单数据。
在本实施例中,流量详单数据表示用户使用上网功能产生的流量费用的详细记录。在获取流量详单数据后可以对流量详单数据进行预处理,如剔除零流量的详单数据。此处的零流量的详单数据指的是该用户未使用流量。
S402:根据所述预处理后的流量详单数据确定所述用户在预设时段消费的流量数据。
在对流量详单数据进行预处理后可以获取用户在某一时段消费的流量数据。具体的,可以先确定将流量数据划分为几个时段,再计算每个时段消耗的流量数据。例如,可以将一天划分为24个时段,计算在每个时段消费的流量数据;或者,还可以将一天划分为12个时段,计算每两个小时消费的流量数据。
S403:对所述用户在预设时段消费的流量数据进行聚类分析,确定所述用户在预设时段的流速类别。
在本实施例中,在获取的在预设时段的流量数据后,根据流量数据计算在预设时段的平均流速,再对所述平均流速进行聚类分析,得到每一预设时段对应的流速类别。
通过上述方法可以根据流量详单数据得到流速类别,通过流速类别来预测用户的流量使用情况,会大大减小网络模型的计算量,提高计费***的处理效率。
可选的,对所述用户在预设时段消费的流量数据进行聚类分析,确定所述用户在预设时段的流速类别,包括:
通过预设的每个流速类别数量对应的误差平方和确定流速类别数量;通过K-means方法根据所述流速类别数量和所述用户在预设时段消费的流量数据确定所述用户在预设时段的流速类别。
在本实施例中,采用K-means方法确定用户在预设时段的流速类别,其中,在确定流速类别之前,需要先确定流速类别的数量,也就是聚类数K。流速类别的数量对于确定流速类别十分重要,当流速类别的数量设置的过多或过少时,都会影响流速类别的划分。因此,通过数据本身去确定流速类别的数量,能够获取准确的聚类数。具体的,可以根据每个流速类别数量对应的误差平方和来确定流速类别K。
在确定流速类别的数量后,可以根据用户在预设时段消费的流量数据先确定平均流速,再根据K-means的方法确定用户的流速类别。具体的,可以先随机选择K个数据点作为初始聚类中心,计算每一个数据点到初始各个聚类中心的距离,并将数据点指派到最近的簇中,然后重新计算每个簇的均值,并再次将数据点指派到最近的簇中,直至两次分类结果未发生改变,则说明聚类收敛。最终获取预设时段消费的流量数据对应的流速类别。
上述方法通过计算误差平方和来确定流速类别数量,使得确定的流速类别数量更加准确,进而基于流速类别数量确定的预设时段消费的流量数据对应的流速类别也更加准确。此外,采用K-means的方法确定流速类别具有运算速度快的优点。
可选的,所述通过预设的每个流速类别数量对应的误差平方和确定流速类别的数量,包括:
确定预设的每个流速类别数量对应的误差平方和,根据每个流速类别数量对应的误差平方和确定误差平方和曲线;选取所述误差平方和曲线中的拐点对应的流速类别数量。
在本实施例中,在确定流速类别数量时可以计算每个流速类别对应的误差平方和,这是因为当流速类别的数量越多时,样本划分会更加精细,每一个簇的聚合程度提高,从而误差平方和会减小。在获取每个流速类别对应的误差平方和后,可以将流速类别K作为X轴,误差平方和作为Y轴绘制误差平方和曲线。
通过绘制误差平方和曲线可以根据曲线确定流速类别数量,当K值小于最终确定的流速类别数量时,随着K值的增大会使误差平方和会大幅下降;当值达到最终确定的流速类别数量时,再增大K值误差平方和的下降幅度会减小并逐步趋于平缓。拐点位置就是当小于拐点对应的K值时,斜率下降较快,大于拐点对应的K值时斜率趋于平缓的点。例如,经过观察曲线,流速类别8对应的点为曲线的拐点,则最终确定流速类别为8。
通过上述方法,可以使得确定的流速类别数量为更加准确。
此外,当通过观察曲线无法确定拐点时,可以先确定出若干个候选的K值,再计算各候选K值对应的轮廓系数,选取轮廓系数较大的值作为流速类别数量。例如,当通过曲线无法确定拐点为流速类别8对应的点还是流速类别9对应的点时,可以计算两个K值对应的轮廓系数,当流速类别8对应的轮廓系数大于流速类别9对应的轮廓系数时,则最终确定流速类别为8。
可选的,所述网络模型的确定方法为:
根据获取的历史特征数据、在不同时段的历史流速类别以及在对应的未来预设时段的流速类别确定网络模型。
在本实施例中,通过网络模型对用户的流速类别进行预测之前,需要先确定网络模型。在确定网络模型时,可以使用历史数据对网络模型进行训练,其中,历史数据为历史特征数据、在不同时段的历史流速类别以及在对应的未来预设时段的流速类别,将历史特征数据和在不同时段的历史流速类别组合为向量数据作为输入数据,将对应的未来预设时段的流速类别作为输出数据来训练网络模型,取预测准确率最高的模型参数进行保存,得到训练好的网络模型。
通过将历史特征数据、在不同时段的历史流速类别以及在对应的未来预设时段的流速类别对网络进行训练,使得网络能够学习历史数据中隐含的特征,进而能够对用户未来预设时段的流速类别进行预测。具体的,网络模型可以为深度神经网络、卷积神经网络及循环神经网络等等。
上述方法通过相关性分析和随机森林的方法获取若干个特征数据,在采用随机森林的方法确定特征数据时,通过基尼指数和重要性评分能够衡量特征的重要性,使得获取的若干个特征数据为最佳特征数据。在确定流速类别时通过K-means的方法能够较快的确定流速类别,根据用户的若干个特征数据和在不同时段的流速类别,能够获取用户的特征数据对用户的流量使用产生的影响,使得预测的预设时段的流速类别更加准确,进而根据预测的流速类别在预设时段为用户推送对应的资源片,避免了现有技术中计费***需要频繁与网元进行交互以满足用户在不同时间对资源片的需求,提高了计费***的处理效率。
图5为本发明实施例提供的用户资源的推送装置的结构示意图,如图5所示,本实施例提供的用户资源的推送装置50,可以包括:获取模块501、预测模块502和推送模块503。
其中,获取模块501,用于获取用户的若干个特征数据和在不同时段的流速类别;所述若干个特征数据为对用户流量使用行为产生影响的特征数据。
预测模块502,用于根据特征数据和在不同时段的流速类别,通过网络模型预测所述用户在未来预设时段的流速类别。
推送模块503,用于根据所述用户在所述预设时段的流速类别在预设时段为所述用户推送与预测的流速类别对应的资源片。
本发明实施例提供的用户资源的推送装置,可以实现上述如图2、图3和图4所示的实施例的用户资源的推送方法,其实现原理和技术效果类似,此处不再赘述。
图6为本发明实施例提供的用户资源的推送设备的硬件结构示意图。如图6所示,本实施例提供的用户资源的推送设备60包括:至少一个处理器601和存储器602。其中,处理器601、存储器602通过总线603连接。
在具体实现过程中,至少一个处理器601执行所述存储器602存储的计算机执行指令,使得至少一个处理器601执行上述方法实施例中的用户资源的推送方法。
处理器601的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图6所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现上述方法实施例的用户资源的推送方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种用户资源的推送方法,其特征在于,包括:
获取用户的若干个特征数据和在不同时段的流速类别;所述若干个特征数据包括对用户流量使用行为产生影响的特征数据;
根据特征数据和在不同时段的流速类别,通过网络模型预测所述用户在未来预设时段的流速类别;
根据所述用户在所述预设时段的流速类别在预设时段为所述用户推送与预测的流速类别对应的资源片。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的若干个特征数据,包括:
对获取的用户宽表数据进行预处理,得到预处理后的用户宽表数据;所述宽表数据包含流量使用数据;
对预处理后的用户宽表数据进行相关性分析,得到多个与所述流量使用数据具有相关性的特征数据;
通过随机森林算法对所述多个与所述流量使用数据具有相关性的特征数据进行筛选,获取所述若干个特征数据。
3.根据权利要求2所述的方法,其特征在于,所述通过随机森林算法对所述多个与所述流量使用数据具有相关性的特征数据进行筛选,获取所述若干个特征数据,包括:
针对每一特征数据,确定所述特征数据的基尼指数;
根据所述基尼指数确定每个特征数据对应的重要性评分;
对所有特征数据的重要性评分排序,获取若干个排序靠前的重要性评分对应的特征数据。
4.根据权利要求1所述的方法,其特征在于,获取用户在不同时段的流速类别,包括:
对获取的流量详单数据进行预处理,得到预处理后的流量详单数据;
根据所述预处理后的流量详单数据确定所述用户在预设时段消费的流量数据;
对所述用户在预设时段消费的流量数据进行聚类分析,确定所述用户在预设时段的流速类别。
5.根据权利要求4所述的方法,其特征在于,对所述用户在预设时段消费的流量数据进行聚类分析,确定所述用户在预设时段的流速类别,包括:
通过预设的每个流速类别数量对应的误差平方和确定流速类别数量;
通过K-means方法根据所述流速类别数量和所述用户在预设时段消费的流量数据确定所述用户在预设时段的流速类别。
6.根据权利要求5所述的方法,其特征在于,所述通过预设的每个流速类别数量对应的误差平方和确定流速类别的数量,包括:
确定预设的每个流速类别数量对应的误差平方和,根据每个流速类别数量对应的误差平方和确定误差平方和曲线;
选取所述误差平方和曲线中的拐点对应的流速类别数量。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述网络模型的确定方法为:
根据获取的历史特征数据、在不同时段的历史流速类别以及在对应的未来预设时段的流速类别确定网络模型。
8.一种用户资源的推送装置,其特征在于,包括:
获取模块,用于获取用户的若干个特征数据和在不同时段的流速类别;所述若干个特征数据为对用户流量使用行为产生影响的特征数据;
预测模块,用于根据特征数据和在不同时段的流速类别,通过网络模型预测所述用户在未来预设时段的流速类别;
推送模块,用于根据所述用户在所述预设时段的流速类别在预设时段为所述用户推送与预测的流速类别对应的资源片。
9.一种用户资源的推送设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至7任一项所述的用户资源的推送方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至7任一项所述的用户资源的推送方法。
CN202011425387.7A 2020-12-08 2020-12-08 用户资源的推送方法及装置 Pending CN114610986A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011425387.7A CN114610986A (zh) 2020-12-08 2020-12-08 用户资源的推送方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011425387.7A CN114610986A (zh) 2020-12-08 2020-12-08 用户资源的推送方法及装置

Publications (1)

Publication Number Publication Date
CN114610986A true CN114610986A (zh) 2022-06-10

Family

ID=81856283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011425387.7A Pending CN114610986A (zh) 2020-12-08 2020-12-08 用户资源的推送方法及装置

Country Status (1)

Country Link
CN (1) CN114610986A (zh)

Similar Documents

Publication Publication Date Title
CN109242135B (zh) 一种模型运营方法、装置、及业务服务器
JP6869347B2 (ja) リスク制御イベント自動処理の方法および装置
CN111915156B (zh) 基于用户价值的业务推送方法、电子设备及存储介质
CN111797320B (zh) 数据处理方法、装置、设备及存储介质
CN110119948B (zh) 基于时变权重动态组合的电力用户信用评价方法及***
CN110764902A (zh) 基于ai的虚拟资源分配方法、装置、计算机设备及存储介质
CN107622326A (zh) 用户分类、可用资源预测方法、装置及设备
CN110930218A (zh) 一种识别欺诈客户的方法、装置及电子设备
CN115394358A (zh) 基于深度学习的单细胞测序基因表达数据插补方法和***
CN116915710A (zh) 流量预警方法、装置、设备及可读存储介质
CN112348685A (zh) 信用评分方法、装置、设备及存储介质
CN110659930A (zh) 基于用户行为的消费提质方法、装置、存储介质及设备
CN114139931A (zh) 企业数据评估方法、装置、计算机设备及存储介质
CN113159213A (zh) 一种业务分配方法、装置及设备
CN110598090B (zh) 兴趣标签的生成方法、装置、计算机设备和存储介质
CN112529319A (zh) 基于多维特征的评分方法、装置、计算机设备及存储介质
CN114610986A (zh) 用户资源的推送方法及装置
CN113743519B (zh) 电网母线典型负荷曲线识别方法
CN114493250A (zh) 一种异常行为检测方法、计算设备及可读存储介质
CN113822464A (zh) 用户信息的处理方法及装置、电子设备、存储介质
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN110766544A (zh) 信用风险的检测方法及装置、存储介质、电子装置
CN113905400B (zh) 网络优化处理方法、装置、电子设备及存储介质
CN118229402A (zh) 构建零***风险预测模型的方法和零售信贷Scoresigmam2a模型
CN114445122A (zh) 一种用户流失率的预测方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination