发明内容
本发明的目的在于提供一种基于大数据的信息处理***及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:
一种基于大数据的信息处理方法,本方法包括以下步骤:
步骤S100:获取历史数据中注册用户的交互信息,根据所述交互信息构建基础用户数据库和关联用户数据库;
步骤S200:根据所述基础用户数据库,获取基础用户的稳定性指数;根据所述关联用户数据库,获取关联用户的受影响指数;
步骤S300:根据所述基础用户的稳定性指数和所述关联用户的受影响指数,获取用户消费信度;
步骤S400:根据所述用户消费信度,建立商品产量预测模型,进而实时预测商品的产量。
进一步的,根据所述交互信息构建基础用户数据库和关联用户数据库的具体实施过程包括:
步骤S101:获取历史数据中的注册用户的交互信息,所述注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;
步骤S102:提取注册用户中关注IP账号的用户的交互信息;获取历史数据中商品发布的时间段,记为i;获取所述商品发布的时间段的时长,记为Ti;获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将所述关注IP账号的用户的停留时长记为ti和用户互动次数记为ci;将所述用户购买商品次数记为k;将所述用户关注IP账号时长记为w;将所述用户留言次数记为l;建立用户忠诚度评价模型,具体计算公式如下:
其中,n表示商品发布的总次数,G表示用户忠诚度;
步骤S103:设置忠诚度阈值,将大于忠诚度阈值的的关注IP账号的用户筛选出来,同时将筛选出来的用户和该用户的交互信息存储在所述基础用户数据库;
根据上述方法,互联网企业商品生命周期在导入、成长、成熟、衰退等阶段中表现特征各不相同,通过用户留言次数、用户互动次数、用户购买商品次数、用户关注IP账号时长、关注IP账号的用户和没有关注IP账号的用户等多个维度进行数据挖掘和分析,有利于互联网企业全方位精准的把控商品的生产量;公式
表示用户在商品发布时间段期间对该商品的关注持续度,公式
表示用户在商品发布时间段期间每次互动的持续时间,持续时间越长表示该用户对商品的兴趣程度越大;通过公式
来综合评价在商品发布时间段期间用户的活跃度;公式
表示用户对商品的认可程度,在用户关注IP账号期间,购买商品的次数越多,对商品的留言次数越多,表示该用户对商品的认可程度越大;公式
表示用户的忠诚度;
步骤S104:提取基础用户数据库中的关注IP账号的用户和用户的交互信息;获取某个没有关注IP账号的用户在某个商品发布的时间段的停留时长,记为Ai;获取没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数,具体计算公式如下:
其中,P表示没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数,Mij表示第j个基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时长,Bij表示没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时间段的重合停留时长,mi表示基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数;
设置关联指数阈值P0,将P≥P0的没有关注IP账号的用户存储在所述关联用户数据库;
根据上述方法,公式
表示没有关注IP账号的用户在商品发布时间段期间对该商品的关注持续度;公式
表示当基础用户在关注商品时,没有关注IP账号的用户与基础用户的重合时长关系;公式
来综合评价在商品发布时间段期间没有关注IP账号的用户与基础用户的关联程度,通过与基础用户关联比较,能够在非常多的用户中快速筛选出具有消费潜力的用户;
步骤S105:根据步骤S102中用户忠诚度评价模型计算公式对基础用户数据库进行实时更新;根据步骤S104中关联指数计算公式对关联用户数据库进行实时更新。
进一步的,根据所述基础用户数据库,获取基础用户的稳定性指数,以及根据所述关联用户数据库,获取关联用户的受影响指数的具体实施过程包括:
步骤S201:获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为
获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为
获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为
获取基础用户的稳定性指数,具体计算公式如下:
其中,Q1表示基础用户的稳定性指数;
根据上述方法,在互联网企业运营管理中,难免会有关注IP账号的用户的流失和增加;通过对每一次商品发布期间基础用户的变化来获取基础用户的稳定性指数,能够综合判断商品结合市场的方向性有没有出现偏差,使互联网企业能够及时调整应对策略;
步骤S202:获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为
获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为
获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为
获取关联用户的受影响指数,具体计算公式如下:
其中,Q2表示关联用户的受影响指数,vi表示关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数;
根据上述方法,通过基础用户关联得到那些关注IP账号的用户,进一步分析这些用户参与购买的贡献值;在每一次商品发布前后,关联数据库中的用户是在变化的,再进一步分析这些用户的购买情况,能够反应这些用户的潜力值,有利于分析观察在商品生命周期的各个阶段中的效应上的长期性和持续性。
进一步的,根据所述基础用户的稳定性指数和所述关联用户的受影响指数,获取用户消费信度的具体计算公式如下:
其中,X表示用户消费信度。
进一步的,根据所述用户消费信度,建立商品产量预测模型的具体计算公式如下:
其中,Y表示商品的产量,
为调节系数且
Y
i为第i个商品发布的时间段的商品产量,m表示当前时间节点基础用户数据库中关注IP账号的用户的总人数,v表示当前时间节点关联用户数据库中未关注IP账号的用户的总人数;
根据上述方法,基础用户的稳定性指数和关联用户的受影响指数随着基础用户数据库和关联用户数据库的更新而变化,进而用户消费信度在不同的商品发布期间也呈现出不同;以当前时间为节点,以历史数据为基础,能够综合且***的分析出用户的消费意愿的变化,进而实时预测商品的产量,使互联网企业精准的控制商品生产量,避免产能严重不足或者过剩。
一种基于大数据的信息处理***,本***包括:数据采集模块、数据库模块、数据处理模块和产量预测模型模块;
所述数据采集模块,用于采集注册用户的交互信息,所述注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;用于获取商品发布的时间段,记为i,用于获取商品发布的总次数,记为n;用于筛选关注IP账号的用户;
所述数据库模块,用于存储经过筛选后的关注IP账号的用户交互信息和没有关注IP账号的用户交互信息;用于对基础用户数据库和关联用户数据库进行实时更新;
所述数据处理模块,用于获取基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数,记为m
i;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为
获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为
获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为
用于获取关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数,记为v
i;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为
获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为
获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为
所述产量预测模型模块,用于实时预测商品的产量。
进一步的,所述数据采集模块还包括数据采集单元和用户忠诚度评价模型单元;
所述数据采集单元,用于采集注册用户的交互信息;用于获取商品发布的时间段,记为i;用于获取所述商品发布的时间段的时长,记为Ti;用于获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将所述关注IP账号的用户的停留时长记为ti和用户互动次数记为ci;用于将所述用户购买商品次数记为k;将所述用户关注IP账号时长记为w;将所述用户留言次数记为l;
所述用户忠诚度评价模型单元,用于筛选关注IP账号的用户;用于构建用户忠诚度评价模型
进一步的,所述数据库模块还包括基础用户数据库单元、关联用户数据库单元和数据更新单元;
所述基础用户数据库单元,用于存储经过筛选后的关注IP账号的用户交互信息;
所述关联用户数据库单元,用于根据基础用户数据库中关注IP账号的用户交互信息,获取与基础用户数据库中关注IP账号的用户相关联的没有关注IP账号的用户;
所述数据更新单元,用于对基础用户数据库和关联用户数据库进行实时更新。
进一步的,所述数据处理模块还包括稳定性指数计算单元、受影响指数计算单元和用户消费信度计算单元;
所述稳定性指数计算单元,用于获取基础用户的稳定性指数
所述受影响指数计算单元,用于获取关联用户的受影响指数
所述用户消费信度计算单元,用于根据基础用户的稳定性指数和关联用户的受影响指数,获取用户消费信度
与现有技术相比,本发明所达到的有益效果是:本发明提供的一种基于大数据的信息处理***及方法中,通过获取历史数据中注册用户的交互信息,根据交互信息构建基础用户数据库和关联用户数据库;考虑到互联网企业商品生命周期在导入、成长、成熟、衰退等阶段中表现特征各不相同,通过用户留言次数、用户互动次数、用户购买商品次数、用户关注IP账号时长、关注IP账号的用户和没有关注IP账号的用户等多个维度进行数据挖掘和分析,有利于互联网企业全方位精准的把控商品的生产量;
进而,根据基础用户数据库,获取基础用户的稳定性指数,能够有效的筛查出长期没有活跃度的虚假用户,使互联网企业对用户的分析更加精确;根据关联用户数据库,获取关联用户的受影响指数,能够使互联网企业挖掘出更多具有消费潜力的用户;根据基础用户的稳定性指数和关联用户的受影响指数,获取用户消费信度,能够使互联网企业分析出不同时间端用户消费的可能性程度,进一步提高互联网企业运营和管理的效率;根据用户消费信度,建立商品产量预测模型,进而实时预测商品的产量,使互联网企业精准的控制商品生产量,避免产能严重不足或者过剩。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图2,本发明提供技术方案:
请参阅图1,在本实施例一中:提供一种基于大数据的信息处理***,本***包括:数据采集模块、数据库模块、数据处理模块和产量预测模型模块;
数据采集模块,用于采集注册用户的交互信息,其中,注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;用于获取商品发布的时间段,记为i,用于获取商品发布的总次数,记为n;用于筛选关注IP账号的用户;
数据库模块,用于存储经过筛选后的关注IP账号的用户交互信息和没有关注IP账号的用户交互信息;用于对基础用户数据库和关联用户数据库进行实时更新;
数据处理模块,用于获取基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数,记为m
i;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为
获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为
获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为
用于获取关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数,记为v
i;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为
获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为
获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为
产量预测模型模块,用于实时预测商品的产量。
在上述***中,数据采集模块还包括数据采集单元和用户忠诚度评价模型单元;
数据采集单元,用于采集注册用户的交互信息;用于获取商品发布的时间段,记为i;用于获取商品发布的时间段的时长,记为Ti;用于获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将关注IP账号的用户的停留时长记为ti和用户互动次数记为ci;用于将用户购买商品次数记为k;将用户关注IP账号时长记为w;将用户留言次数记为l;
用户忠诚度评价模型单元,用于筛选关注IP账号的用户;用于构建用户忠诚度评价模型
在上述***中,数据库模块还包括基础用户数据库单元、关联用户数据库单元和数据更新单元;
基础用户数据库单元,用于存储经过筛选后的关注IP账号的用户交互信息;
关联用户数据库单元,用于根据基础用户数据库中关注IP账号的用户交互信息,获取与基础用户数据库中关注IP账号的用户相关联的没有关注IP账号的用户;
数据更新单元,用于对基础用户数据库和关联用户数据库进行实时更新。
在上述***中,数据处理模块还包括稳定性指数计算单元、受影响指数计算单元和用户消费信度计算单元;
用户消费信度计算单元,用于根据基础用户的稳定性指数和关联用户的受影响指数,获取用户消费信度
请参阅图2,在本实施例二中:
获取历史数据中的注册用户的交互信息,其中,注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;
提取注册用户中关注IP账号的用户的交互信息;获取历史数据中商品发布的时间段,记为i;获取商品发布的时间段的时长,记为T
i;获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将关注IP账号的用户的停留时长记为t
i和用户互动次数记为c
i;将用户购买商品次数记为k;将用户关注IP账号时长记为w;将用户留言次数记为l;获取商品发布的总次数,记为n;根据用户忠诚度评价模型,计算用户的忠诚度
例如,获取用户购买商品次数为10,用户留言次数为2,用户关注IP账号时长为100,获取商品发布的时间段有3次,分别获取每一次的商品发布的时间段的时长为120、180和180,分别获取每一次商品发布的时间段的用户的停留时长为20、30和20,分别获取每一次商品发布的时间段的用户的互动次数为5、10和10,则用户的忠诚度
设置忠诚度阈值,将大于忠诚度阈值的的关注IP账号的用户筛选出来,同时将筛选出来的用户和该用户的交互信息存储在基础用户数据库;对基础用户数据库进行实时更新;
提取基础用户数据库中的关注IP账号的用户和用户的交互信息;获取某个没有关注IP账号的用户在某个商品发布的时间段的停留时长,记为A
i;获取没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数
其中,P表示没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数,M
ij表示第j个基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时长,B
ij表示没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时间段的重合停留时长,m
i表示基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数;
设置关联指数阈值P0,将P≥P0的没有关注IP账号的用户存储在关联用户数据库;对关联用户数据库进行实时更新;
获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为
获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为
获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为
获取基础用户的稳定性指数
获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为
获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为
获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为
获取关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数,记为v
i;获取关联用户的受影响指数
预测商品产量
其中,
为调节系数且
Y
i为第i个商品发布的时间段的商品产量,m表示当前时间节点基础用户数据库中关注IP账号的用户的总人数,v表示当前时间节点关联用户数据库中未关注IP账号的用户的总人数;例如,获取当前时间节点基础用户数据库中关注IP账号的用户的总人数为50,当前时间节点关联用户数据库中未关注IP账号的用户的总人数为100,用户消费信度为0.6,调节系数为5,预测商品产量Y=5×(50+100)×0.6=450,则在下一次商品发布之前,商品生产量为450。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并且不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。