CN112381338B - 事件概率预测模型训练、事件概率预测方法及相关装置 - Google Patents

事件概率预测模型训练、事件概率预测方法及相关装置 Download PDF

Info

Publication number
CN112381338B
CN112381338B CN202110049876.5A CN202110049876A CN112381338B CN 112381338 B CN112381338 B CN 112381338B CN 202110049876 A CN202110049876 A CN 202110049876A CN 112381338 B CN112381338 B CN 112381338B
Authority
CN
China
Prior art keywords
index
event probability
value
weight
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110049876.5A
Other languages
English (en)
Other versions
CN112381338A (zh
Inventor
傅云凤
童洋
易善鸿
刘慧军
闫智慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xintang Sichuang Educational Technology Co Ltd
Original Assignee
Beijing Xintang Sichuang Educational Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xintang Sichuang Educational Technology Co Ltd filed Critical Beijing Xintang Sichuang Educational Technology Co Ltd
Priority to CN202110049876.5A priority Critical patent/CN112381338B/zh
Publication of CN112381338A publication Critical patent/CN112381338A/zh
Application granted granted Critical
Publication of CN112381338B publication Critical patent/CN112381338B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种事件概率预测模型训练、事件概率预测方法及相关装置,训练方法包括:获取训练数据集;利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率值,根据所述预测事件概率值和所述实际事件概率值获取概率损失,根据所述概率损失调整所述事件概率预测模型的参数,直至所述概率损失满足损失阈值,得到训练好的事件概率预测模型和事件概率权重矩阵,所述事件概率权重矩阵的各个元分别为对应的各个所述指标的权重。本发明实施例所提供的事件概率预测模型训练方法、事件概率预测方法及相关装置,可以实现对于事件概率的预测并确定对事件概率产生影响的影响因素值。

Description

事件概率预测模型训练、事件概率预测方法及相关装置
技术领域
本发明实施例涉及计算机领域,尤其涉及一种事件概率预测模型训练、事件概率预测方法及相关装置。
背景技术
随着计算机技术和深度学习技术的发展,事件未来发生的概率的预测需求得以通过技术进行一定程度的实现。
比如:在教育场景下,为了保证生源的稳定性,需要提高已有学生的续报率、降低已有学生的退费率,因此,需要根据已有学生的基本情况,获取未来的续报率或者退费率,并进一步把握确定影响对现有教学环节的调整达到提高续报率或者降低退费率的目标。
因此,如何实现对于事件概率的预测并确定对事件概率产生影响的影响因素值,就成为亟需解决的技术问题。
发明内容
本发明实施例提供一种事件概率预测模型训练方法、事件概率预测方法及相关装置,以实现对于事件概率的预测并确定对事件概率产生影响的影响因素值。
为解决上述问题,本发明实施例提供一种事件概率预测模型训练方法,包括:
获取训练数据集,其中,所述训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,所述实际事件概率值为各个所述数据单元的事件概率的真实值,所述相关指标数据值为与所述事件概率的相关度满足相关度阈值的各个指标的数值;
利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率值,根据所述预测事件概率值和所述实际事件概率值获取概率损失,根据所述概率损失调整所述事件概率预测模型的参数,直至所述概率损失满足损失阈值,得到训练好的事件概率预测模型和事件概率权重矩阵,所述事件概率权重矩阵的各个元分别为对应的各个所述指标的权重。
为解决上述问题,本发明实施例还提供一种事件概率预测方法,包括:
获取待事件概率预测的数据单元的预测相关指标数据值;
利用如前述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述预测相关指标数据值获取预测事件概率,并根据所述预测相关指标数据值和利用如前述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标的影响因素值。
为解决上述问题,本发明实施例还提供一种事件概率预测方法,包括:
获取待事件概率预测的数据单元的预测相关指标数据值;
利用如前述任一项所述的事件概率预测模型训练方法得到的所述指标权重和与所述指标权重对应的预测相关指标数据值,获取所述数据单元的预测指标类别值;
利用如前述任一项所述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述指标类别值获取预测事件概率,并根据所述指标类别值和利用如前述任一项所述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标类别的影响因素值。
为解决上述问题,本发明实施例还提供一种事件概率预测模型训练装置,包括:
数据集获取单元,适于获取训练数据集,其中,所述训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,所述实际事件概率值为各个所述数据单元的事件概率的真实值,所述相关指标数据值为与所述事件概率的相关度满足相关度阈值的各个指标的数值;
事件概率预测模型及事件概率权重矩阵获取单元,适于利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率值,根据所述预测事件概率值和所述实际事件概率值获取概率损失,根据所述概率损失调整所述事件概率预测模型的参数,直至所述概率损失满足损失阈值,得到训练好的事件概率预测模型和事件概率权重矩阵,所述事件概率权重矩阵的各个元分别为对应的各个所述指标的权重。
为解决上述问题,本发明实施例还提供一种事件概率预测装置,包括:
预测相关指标数据值获取单元,适于获取待事件概率预测的数据单元的预测相关指标数据值;
预测相关指标数据值和影响因素值获取单元,适于利用如前述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述预测相关指标数据值获取预测事件概率,并根据所述预测相关指标数据值和利用如前述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标的影响因素值。
为解决上述问题,本发明实施例还提供一种事件概率预测装置,包括:
预测相关指标数据值获取单元,适于获取待事件概率预测的数据单元的预测相关指标数据值;
预测指标类别值获取单元,适于利用如前述任一项所述的事件概率预测模型训练方法得到的所述指标权重和与所述指标权重对应的预测相关指标数据值,获取所述数据单元的预测指标类别值;
预测相关指标数据值和影响因素值获取单元,适于利用如前述任一项所述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述指标类别值获取预测事件概率,并根据所述指标类别值和利用如前述任一项所述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标类别的影响因素值。
为解决上述问题,本发明实施例提供一种存储介质,所述存储介质存储有适于事件概率预测模型训练的程序,以实现如前述的事件概率预测模型训练方法,或者所述存储介质存储有适于事件概率预测的程序,以实现如前述的事件概率预测方法。
为解决上述问题,本发明实施例提供一种设备,包括至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述程序,以执行如前述的事件概率预测模型训练方法或者如前述的事件概率预测方法。
与现有技术相比,本发明的技术方案具有以下优点:
本发明实施例所提供的事件概率预测模型训练方法、事件概率预测方法及相关装置,其中,事件概率预测模型训练方法,在进行事件概率预测模型训练时,首先获取训练数据集,训练数据集是多个数据单元的数据信息的集合,包括各个数据单元的实际概率值和相关指标数据值,然后根据各个数据单元的相关指标数据值获取预测事件概率,利用预测事件概率和实际事件概率获取概率损失,进而实现事件概率预测模型参数的调整,当概率损失满足损失阈值时,得到训练好的事件概率预测模型的同时,还获取事件概率权重矩阵,以得到影响事件概率的各个指标的权重。可以看出,本发明实施例所提供的事件概率预测模型训练方法,在对待训练的事件概率预测模型进行训练时,利用可以获取的相关指标数据值和实际事件概率值进行,构建起事件概率预测模型中相关指标数据值与事件概率之间的关系,为后续利用训练好的事件概率预测模型,通过当前时刻可以获取的指标数据值,实现对未来事件概率的预测,做好准备,并保证预测的准确性;同时,在模型训练过程中,还获取各个指标的权重,在实际进行事件概率预测时,不仅可以得到预测的事件概率,还可以根据各个指标的相关指标数据值和与其对应的指标的权重,获取得到预测事件概率的各个指标的影响因素值,从而可以提前为后续达到预测事件概率或者避免达到预测事件概率做出相应的准备,以使未来真正得到的事件概率更满足预期。
可选方案中,各个指标还包括预先标注的指标类别和预先获取的指标相关性方向值,在进行事件概率预测模型训练时,还需要通过利用训练数据集进行待训练的降维模型和待训练的事件概率预测模型的串联训练,获取降维模型的降维权重矩阵,然后根据所述降维权重矩阵,获取各个指标权重;进一步根据对应于同一所述指标的所述指标权重和各个所述数据单元的所述相关指标数据值,获取各个所述数据单元的指标类别值,进而利用各个数据单元的指标类别值对事件概率预测模型进行训练,得到利用指标类别值训练完成的事件概率预测模型,以及各个指标类别的权重。从而,一方面可以选择大量的指标以及指标数据值,经过转换得到对应的指标类别值,使得利用训练好的事件概率预测模型进行事件概率预测时,能够利用更多的指标,从而提高事件概率预测模型预测的准确性;同时,在进行事件概率预测模型训练以及后续的事件概率预测时,所使用的数据为数据单元的指标类别值,可以减少模型训练和模型预测时的数据量,降低运算量,提高模型训练效率和事件概率的预测效率,可以实现对于模型训练集事件概率预测的准确性和效率的兼顾。
可选方案中,本发明实施例所提供的事件概率预测模型训练方法,各个指标不仅包括相关指标数据值,还包括预先获取的指标相关性方向值,在获取各个指标权重时,首先对降维权重矩阵进行矩阵转换,得到行数和列数均等于所述指标类别的数量的权重方阵,并利用权重方阵获取目标元,然后根据各个所述目标元在所述权重方阵中的位置,确定降维权重矩阵中的各个降维目标元和各个降维目标元值,利用各个所述降维目标元值和各个所述降维目标元所对应的指标,获取各个指标权重。这样,在计算指标权重时,由于指标向指标类别的转换是将多个数量的数值向较少数量的数值的转换,因此在模型训练过程中,得到降维权重矩阵,但是降维权重矩阵中的各个元所代表的意义无法确定,为此利用权重方阵,实现对于降维权重矩阵中的降维目标元的确定,以及降维目标元所代表的意义的确定,进而根据降维权重矩阵中的降维目标元值,实现对于指标权重的获取,从而,巧妙地利用指标向指标类别转换的逻辑,将无法确定降维权重矩阵的各个元所代表的意义显现出来,实现了黑盒信息的透明化,实现了指标权重的获取,并可以保证后续事件概率预测时,基于相关指标数据值获取指标类别值的实现。
附图说明
图1为本发明实施例所提供的事件概率预测模型训练方法的一流程示意图;
图2为本发明实施例所提供的事件概率预测模型训练方法的训练数据集获取步骤的流程示意图;
图3为本发明实施例所提供的事件概率预测模型训练方法的目标分类维度以及与目标分类维度相对应的指标的获取示意图;
图4为本发明实施例所提供的事件概率预测模型训练方法的另一流程示意图;
图5为本发明实施例所提供的事件概率预测模型训练方法的获取指标权重步骤的流程示意图;
图6为本发明实施例所提供的事件概率预测方法的流程示意图;
图7为本发明实施例所提供的事件概率预测方法的另一流程示意图;
图8是本发明实施例所提供的事件概率预测模型训练装置的一框图;
图9是本发明实施例所提供的事件概率预测模型训练装置的另一框图;
图10是本发明实施例所提供的事件概率预测装置的一框图;
图11是本发明实施例提供的设备一种可选硬件设备架构。
具体实施方式
现有技术中,在对文本进行事件概率预测时,难以实现对于事件概率的预测的同时确定对事件概率产生影响的影响因素值。
为了实现对于事件概率的预测的同时确定对事件概率产生影响的影响因素值,本发明实施例提供了一种事件概率预测模型训练方法,包括:
获取训练数据集,其中,所述训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,所述实际事件概率值为各个所述数据单元的事件概率的真实值,所述相关指标数据值为与所述事件概率的相关度满足相关度阈值的各个指标的数值;
利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率值,根据所述预测事件概率值和所述实际事件概率值获取概率损失,根据所述概率损失调整所述事件概率预测模型的参数,直至所述概率损失满足损失阈值,得到训练好的事件概率预测模型和事件概率权重矩阵,所述事件概率权重矩阵的各个元分别为各个所述指标的权重。
可见,本发明实施例所提供的事件概率预测模型训练方法,在进行事件概率预测模型训练时,首先获取训练数据集,训练数据集是多个数据单元的数据信息的集合,包括各个数据单元的实际概率值和相关指标数据值,然后根据各个数据单元的相关指标数据值获取预测事件概率,利用预测事件概率和实际事件概率获取概率损失,进而实现事件概率预测模型参数的调整,当概率损失满足损失阈值时,得到训练好的事件概率预测模型的同时,还获取事件概率权重矩阵,以得到影响事件概率的各个指标的权重。
可以看出,本发明实施例所提供的事件概率预测模型训练方法,在对待训练的事件概率预测模型进行训练时,利用可以获取的相关指标数据值和实际事件概率值进行,构建起事件概率预测模型中相关指标数据值与事件概率之间的关系,为后续利用训练好的事件概率预测模型,通过当前时刻可以获取的指标数据值,实现对未来事件概率的预测,做好准备,并保证预测的准确性;同时,在模型训练过程中,还获取各个指标的权重,在实际进行事件概率预测时,不仅可以得到预测的事件概率,还可以根据各个指标的相关指标数据值和与其对应的指标的权重,获取得到预测事件概率的各个指标的影响因素值,从而可以提前为后续达到预测事件概率或者避免达到预测事件概率做出相应的准备,以使未来真正得到的事件概率更满足预期。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1是本发明实施例所提供的事件概率预测模型训练方法的一流程示意图。
如图中所示,本发明实施例所提供的事件概率预测模型训练方法,包括以下步骤:
步骤S10:获取训练数据集。
容易理解的是,为了实现对于事件概率预测模型的训练,需要首先获取训练用的数据,即训练数据集,训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,实际事件概率值为各个所述数据单元的事件概率的真实值,相关指标数据值为与所述事件概率的相关度满足相关度阈值的各个指标的数值。
其中,数据单元是指一组相对应的实际事件概率值和相关指标数据值所归属的单元,比如:一个班级、一个学生、一个时段、一个租铺等等,以班级为例,对应于班级的事件概率可以为续报率、退费率,对应于班级的与事件概率可能相关的指标可以包括题目正确率、题目参与率、听懂率、课程喜爱度、抢红包参与率、积分、表扬次数、个人秀查看率、个人秀点赞率等等。
由于能够获取到的、可能与事件概率相关的指标,并不一定与事件概率相关,因此,在进行事件概率预测模型训练之前,需要首先对获取到的各个数据单元的数据进行处理,确定与所述事件概率的相关度满足相关度阈值的各个指标。
然而,对于不同类别的数据单元,与事件概率相关度满足相关度阈值的指标很有可能是不同的,继续以班级单元为例:
当所有班级的数据单元的数据放到一起时,得到的相关度满足相关度阈值的指标可能是A、B、C,而当对班级进行分类后,小学的班级数据得到的相关度满足相关度阈值的指标可能是B、C、D,中学的班级数据得到的相关度满足相关度阈值的指标可能是C、D、E;当选择不同年级的数据单元时,小学低年级的相关度满足相关度阈值的指标与小学高年级的相关度满足相关度阈值的指标也可能是不同的,并且当具体进行事件概率的预测时,也不会按照不同的分类方式分别获取相关度满足相关度阈值的指标,然后再分别进行不同的预测,因此,还需要确定后续预测使用的分类方式和不同分类方式下的相关度满足相关度阈值的指标。
因此,请参考图2,图2为本发明实施例所提供的事件概率预测模型训练方法的训练数据集获取步骤的流程示意图。
如图中所示,在一种具体实施方式中,为了获取训练数据集,包括:
步骤S100:获取原始训练数据集。
容易理解的是,原始训练数据集是直接获取到的未经过处理的训练数据集,所述原始训练数据集包括对应于各个数据单元的实际事件概率值和预计相关指标数据值,所述预计相关指标数据值为预计与所述事件概率相关的各个指标的数值。
具体地,原始训练数据集可以通过对应的统计软件获取。
步骤S101:获取目标分类维度和与所述目标分类维度相对应的指标。
需要说明的是,本文所述的目标分类维度是指经过比较确定,所确定的对于事件概率预测效果较好的分类维度。
当然,目标分类维度需要在具体分类之前获取,在一种具体实施方式中,为了获取目标分类维度,可以通过对多种分类维度进行数据分类后的相关性计算确定。
为此,首先根据各个待定分类维度对所述原始训练数据集进行分类,得到预分类数据集。
其中待定分类维度为根据数据单元的特点,可能的分类维度。比如:对于教学相关的数据单元,可以将预定分类维度确定为:年级、学校、班级类型、整体等等。
按照不同的预定分类维度,分别对原始数据集进行分类,得到各个预分类数据集。
然后,通过相关性计算算法,利用各个所述预分类数据集的各个所述数据单元的所述预计相关指标数据值和实际事件概率值,获取各个预计相关指标数据值与所述实际事件概率值的相关度,得到相关度满足相关度阈值的各个指标,确定相关指标数量最多的待定分类维度,以及与所述待定分类维度相对应的指标,得到所述目标分类维度和与所述目标分类维度相对应的指标,其中相关指标数量为相关度满足相关度阈值的指标的数量。
具体地,请参考图3,图3为本发明实施例所提供的事件概率预测模型训练方法的目标分类维度以及与目标分类维度相对应的指标的获取示意图。
得到各个预分类数据集后,根据不同的预分类数据集,获取对应的数据单元,以及各个数据单元的预计相关指标数据值和实际事件概率值,然后输入到相关性计算算法中,得出与实际事件概率值相关度满足相关度阈值的各个指标。
需要说明的是,相关度可能为正值,表示指标与事件概率之间为正相关,也可能为负值,表示指标与事件概率之间为负相关,其中相关度满足相关度阈值是指相关度的绝对值大于或等于相关度阈值。
由于相关度阈值过高,会造成满足相关度阈值的指标的数量过少,不利于后续对模型的训练,相关度阈值过低,又会造成满足相关度阈值的指标的数量过多,增加模型训练的运算量,因此,在一种具体实施方式中,可以选择相关度阈值为0.2,即将相关度的绝对值大于或等于0.2的指标确定为事件概率的指标,从而同时兼顾模型训练的准确性和运算量。
由于按照各个待定分类维度对所述原始训练数据集进行分类后,受到原始训练数据集的数据单元量的影响,各个预分类数据集的数据单元量不同,可以分别选择不同的相关性计算算法。
具体地,可以选择斯皮尔曼等级相关系数(spearman相关系数)计算算法和肯德尔等级相关系数(Kendal’stau-b相关系数)计算算法。
由于斯皮尔曼等级相关系数(spearman相关系数)计算算法对于数据集的要求既不要求必须符合正态分布,并且对于任何单调函数定义的关系都适用,而且当样本量相对较大时,选择spearman相关系数计算算法更优;当样本量相对较小时,Kendall’s tau-b相关系数计算算法对错误的敏感度更低,更精确。
为此,在进行相关性指标确定时,还可以首先根据预分类数据集的数据单元量选择具体的计算算法。
具体地,先获取预分类数据集的数据单元量,然后判断数据单元量是否超过第一数据量阈值,如果超过,那么选择斯皮尔曼等级相关系数计算算法进行计算,如果没超过,那么可以选择肯德尔等级相关系数计算算法。
为了避免由于数据量过小,对于满足相关度阈值的指标的确定产生不确定影响,还可以在判断数据单元量未超过第一数据量阈值时,再进一步判断数据单元量是否超过第二数据量阈值,如果超过,那么可以选择肯德尔等级相关系数计算算法,否则,直接舍弃。
第一数据量阈值和第二数据量阈值的具体数值可以根据需要确定,容易理解的是,第一数据量阈值大于第二数据量阈值,比如:第一数据量阈值选择150、200等,第二数据量阈值可以选择10、8等。
经过对各个预分类数据集的相关性计算后,可以分别得到与各个预分类数据集对应的满足相关度阈值的各个指标,然后需要根据与各个预分类数据集对应的满足相关度阈值的各个指标从待定分类维度中选择目标分类维度。
为了保证对于模型训练的准确性,可以选择满足相关度阈值的指标的数量最多的待定分类维度为目标分类维度,从而也可以得到与目标分类维度相对应的各个指标。
步骤S102:获取根据所述目标分类维度分类的预分类数据集,并筛选与所述目标分类维度相对应的指标的所述预计相关指标数据值,得到所述训练数据集。
得到目标分类维度后,获取根据目标分类维度分类的预分类数据集,然后选择预分类数据集中的各个数据单元的与目标分类维度相对应的指标的数据值,得到训练数据集。
因此,得到的训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,其中,实际事件概率值为各个数据单元的事件概率的真实值,相关指标数据值为与事件概率的相关度满足相关度阈值的各个指标的数值。
容易理解的是,因为训练数据集是通过对原始训练数据集按照目标分类维度分类后得到的,因此,训练数据集会有多个,基于不同的训练数据集,训练后的事件概率预测模型很有可能是不同的,从而在预测时,基于具体的数据单元所归属的类别,可以选择对应的事件概率预测模型进行预测。
步骤S11:利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率值,根据所述预测事件概率值和所述实际事件概率值获取概率损失。
得到训练数据集后,利用数据单元的相关指标数据值输入待训练的事件概率预测模型,进行事件概率的预测,得到各个预测事件概率值,然后进一步根据预测事件概率值和实际事件概率值获取二者的差别,得到概率损失。
步骤S12:判断所述概率损失是否满足损失阈值,若是,执行步骤S14,若否,执行步骤S13。
得到概率损失后,将概率损失与损失阈值进行比较,如果满足损失阈值,那么事件概率预测模型满足预测的准确性要求,执行步骤S14,否则,事件概率预测模型的预测准确性还不能满足准确性要求,执行步骤S13。
步骤S13:根据所述概率损失调整所述事件概率预测模型的参数,转向执行步骤S11。
基于概率损失,对事件概率预测模型的参数进行调整,然后再次执行步骤S11,利用参数调整后的事件概率预测模型再次获取预测事件概率值。
步骤S14:得到训练好的事件概率预测模型和事件概率权重矩阵。
当概率损失满足损失阈值时,得到训练好的事件概率预测模型,同时还能得到事件概率权重矩阵,其中事件概率权重矩阵的各个元分别为对应的各个所述指标的权重。
从而,当利用事件概率预测模型进行事件概率预测时,不仅能够得到预测的事件概率值,还能够利用事件概率权重矩阵,得到各个指标对事件概率的影响因素值。
可以看出,本发明实施例所提供的事件概率预测模型训练方法,在对待训练的事件概率预测模型进行训练时,利用可以获取的相关指标数据值和实际事件概率值进行,构建起事件概率预测模型中相关指标数据值与事件概率之间的关系,为后续利用训练好的事件概率预测模型,通过当前时刻可以获取的指标数据值,实现对未来事件概率的预测,做好准备,并保证预测的准确性;同时,在模型训练过程中,还获取各个指标的权重,在实际进行事件概率预测时,不仅可以得到预测的事件概率,还可以根据各个指标的相关指标数据值和与其对应的指标的权重,获取得到预测事件概率的各个指标的影响因素值,从而可以提前为后续达到预测事件概率或者避免达到预测事件概率做出相应的准备,以使未来真正得到的事件概率更满足预期。
为了进一步提高模型训练的准确性,请参考图4,图4为本发明实施例所提供的事件概率预测模型训练方法的另一流程示意图。
如图中所示,在另一种具体实施方式中,本发明实施例所提供的事件概率预测模型训练方法包括:
步骤S20:获取训练数据集。
步骤S20的部分具体内容请参考图1中步骤S10的详细描述,在此不再赘述。
在此实施例中,为了实现对待训练的事件概率预测模型的训练,并在保证训练准确性的基础上,降低事件概率预测模型训练的运算量,因此,在一实施例中,可以对相关度满足相关度阈值的指标进行降维处理,以融合较多的相关指标。
为了保证降维的实现,一方面需要确定降维前的指标对应于降维后的那个指标类别,另一方面还需要确定基于降维前的各个指标的相关指标数据值如何得到降维后的指标类别的指标类别值。
在一种具体实施方式中,为了实现降维前的指标与降维后的指标类别的对应,可以对各个指标预先标注指标类别,根据指标与指标类别之间的实际意义关联,对各个指标进行指标类别的标注,即各个指标包括预先标注的指标类别。容易理解的是,指标类别是为了实现对指标的降维而标注的,因此指标类别的数量小于指标的数量。
为方便理解,现结合前述教学场景下的案例对指标的指标类别进行说明:
对于各个指标:题目正确率(包括均值和标准差)、题目参与率(包括均值和标准差)、听懂率(包括均值和标准差)、课程喜爱度(包括均值和标准差)、抢红包参与率(包括均值和标准差)、积分(包括均值和标准差)、表扬次数(包括均值和标准差)、个人秀查看率(包括均值和标准差)、个人秀点赞率(包括均值和标准差),进行指标类别的标注,比如:
指标指标类别
题目正确率、题目参与率、听懂率学会
课程喜爱度、抢红包参与率、积分喜欢
表扬次数、个人秀查看率受关注
从而,对16个指标的多个相关指标数据值进行降维,得到3维的指标类别。
步骤S21:利用所述训练数据集进行待训练的降维模型和待训练的所述事件概率预测模型的串联训练,直至得到满足预定训练目标的所述降维模型和所述事件概率预测模型,获取所述降维模型的降维权重矩阵。
为了实现对于基于降维前的各个指标的相关指标数据值如何得到降维后的指标类别的指标类别值的确定,首先需要确定基于各个相关指标数据值得到各个指标类别值的计算权重,即降维权重。
在一种具体实施方式中,为了获取降维权重,可以首先利用对预先构建的未训练的降维模型和待训练的事件概率预测模型的串联训练,进而得到降维权重矩阵,其中降维权重矩阵的各个行分别对应各个指标,因此有多少个指标,降维权重矩阵就会有多少行。
具体地,降维模型可以为RBM (Restricted Boltzmann Machines, 受限玻尔兹曼机)模型,也可以为PCA(Principal components analysis,主成分分析)模型。
降维权重矩阵的获取步骤,具体包括:
根据所述训练数据集的各个所述数据单元的所述相关指标数据值,利用待训练的所述降维模型和待训练的所述事件概率预测模型获取各个预测事件概率;
根据各个所述预测事件概率和各个所述实际事件概率获取概率损失,利用所述概率损失调整所述降维模型和事件概率预测模型的参数,直至所述概率损失满足第二损失阈值,得到满足预定训练目标的所述降维模型和所述事件概率预测模型。
具体地,首先将训练数据集的各个数据单元的相关指标数据值输入降维模型,得到的输出继续输入事件概率预测模型,得到各个预测事件概率。
当然在进行串联训练的过程中,降维模型的输出直接输入到事件概率模型中,二者是串联进行的,并未有数据的输出。
得到各个预测事件概率后,根据各个预测事件概率以及各个实际事件概率获取概率损失,判断概率损失是否满足第二损失阈值,如果不满足那么根据概率损失同时调整降维模型和事件概率预测模型的参数,并根据参数调整后的降维模型和事件概率预测模型获取预测事件概率,如果满足,那么得到满足预定训练目标的所述降维模型和所述事件概率预测模型,同时还得到降维模型的降维权重矩阵,且降维权重矩阵的各个行对应各个所述指标。
需要说明的是,通过串联训练得到的事件概率预测模型,是为了实现对降维模型的训练而得到的,并非后续进行预测所使用的模型。
步骤S22:根据所述降维权重矩阵,获取各个指标权重。
得到降维权重矩阵,还需要进一步获取各个指标权重。
在一种具体实施方式中,为了获取指标权重,请参考图5,图5为本发明实施例所提供的事件概率预测模型训练方法的获取指标权重步骤的流程示意图。
如图中所示,在一种具体实施方式中,可以通过以下步骤,获取各个指标权重:
步骤S220:利用与所述指标对应的所述指标相关性方向值和所述指标与指标类别的对应关系,对所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的权重方阵,获取所述权重方阵的各个用于表示指标类别的目标元。
为了得到指标权重,首先利用与指标对应的指标相关性方向值和指标与指标类别的对应关系,对降维权重矩阵进行调整,以得到行数和列数均等于所述指标类别的数量的权重方阵。其中指标相关性方向值为所述指标与所述事件概率的相关性方向的数值,如果相关度为正值,则表示指标与事件概率正相关,相关性方向值为1,如果相关度为负值,则表示指标与事件概率负相关,相关性方向值为-1。
实际运算过程中,由于所要预测的事件概率是需提升的事件概率(如续报率)还是需降低的事件概率(如退费率)与指标的关联关系不同,因此,需要根据所要预测的事件概率是哪种类型,确定是否对相关性计算过程中得到的相关度的指标相关性方向值进行取反运算:如果是预测想要提升的概率(如续报率),直接利用相关性计算得到的相关度的指标相关性方向值和指标类别,对降维权重矩阵进行调整,得到行数和列数均等于指标类别的数量的权重方阵;如果是预测想要降低的概率(如退费率),则首先对相关性计算得到的相关度的指标相关性方向值进行一次取反运算,然后利用取反运算得到的指标相关性方向值和指标类别,对降维权重矩阵进行调整,得到行数和列数均等于指标类别的数量的权重方阵。
这样,可以保证后续运算得到的指标类别值都是体现的正向的数值,代表的是好的方向,比如结合前述的案例:学会的分值越高,退费率就会越低。
所述权重方阵的各行分别对应各个所述指标的指标类别,所述目标元的数量等于所述指标类别的数量。
根据降维权重矩阵各个行所代表的指标,获取对应的指标相关性方向值,并根据指标与指标类别之间的对应关系,进行计算,将指标相关性方向值作为权重,将对应于同一指标类别的各个指标同一列的各个元进行加权求和,得到权重方阵的对应位置的元。
为方便理解对降维权重矩阵的调整方式,现举例如下:
其中降维权重矩阵、降维权重矩阵各行所表示的指标以及各个指标对应的指标类别如下所示:
Figure 599957DEST_PATH_IMAGE001
各个指标的指标相关性方向值(当然如果所要预测的事件概率是需降低的事件概率,指标相关性方向值为已经经过取反运算的指标相关性方向值)分别为(1,-1,1,-1,1,-1),即正确率均值、喜爱度均值和表扬次数均值的指标相关性方向值为1,其他三个的指标相关性方向值为-1。
在调整过程中,进行如下计算:
Figure 782676DEST_PATH_IMAGE002
……
从而得到权重方阵,如下:
Figure 93572DEST_PATH_IMAGE003
容易理解的是,权重方阵中,第一行所对应的指标类别为学会,第二行所对应的指标类别为喜欢,第三行所对应的指标类别为受关注。
得到权重方阵后,进一步确定权重方阵中的各个目标元。
通过确定权重方阵中的目标元,可以用于确定降维目标元,实现对于指标权重的获取。
在一种具体实施方式中,可以首先获取所述权重方阵的各个元中数值最大的最大值元,得到一个目标元,并得到目标元所在行和目标元所在列。
如上述示例中的权重方阵,假设m22为数值最大的最大值元,从而可以得到m22为第一个目标元,该目标元的目标元所在行和目标元所在列分别为第二行、第二列。
然后,忽略所述权重方阵中所述目标元所在行的各个元和所述目标元所在列的各个元,得到调整方阵。
如上述示例中的权重方阵,忽略第二行第二列的各个元,得到调整方阵如下:
Figure 895306DEST_PATH_IMAGE004
进一步,以所述调整方阵作为新的权重方阵,获取新的目标元,直至得到全部的所述目标元。
继续结合上述示例,获取调整方阵中的最大值元,假设是m13,从而可以得到m13为第二个目标元,该目标元的目标元所在行和目标元所在列分别为第一行、第三列。
然后再次忽略,第一行和第三列的各个元,得到新的调整方阵:
Figure 975257DEST_PATH_IMAGE005
再获取新的调整方阵中的最大值元:m31,从而可以得到m31为第三个目标元,该目标元的目标元所在行和目标元所在列分别为第三行、第一列。
由于权重方阵为3维的方阵,从而得到全部的目标元。
可以看出,通过上述方法,对权重矩阵的最大值元的获取和调整方阵的获取,可以很方便地实现全部目标元的获取,并且使得所获取的各个目标元更加合理,即目标元确定为指标权重重要性最大的指标类别,相当于对于一种金属混合物体,含金90%,银5%,铜5%,我们把它归类为金更为合理;另一方面,还能够保证降至目标维度的指标类别齐全完整,而不会造成某个指标类别的重复或者某个指标类别的缺失,比如这里的学会、喜欢、受关注三个指标类别都有,而不会出现学会、学会、喜欢这样的方式。
步骤S221:根据各个所述目标元在所述权重方阵中的位置,确定所述降维权重矩阵中与各个所述目标元对应的各个降维目标元和各个降维目标元值。
根据各个目标元在矩阵方阵中的位置,确定降维权重矩阵中的降维目标元。
请继续参考前述示例:
其中权重方阵的各个目标元分别为:m22、m13和m31,各个目标元对应的降维目标元分别为:
m22对应w32和w42;m13对应w13和w23;m31对应w51和w61
从而可以得到各个降维目标元对应的降维目标元值。
步骤S222:利用各个所述降维目标元值和各个所述降维目标元所对应的指标,获取各个指标权重。
得到降维目标元值和降维目标元对应的指标后,进一步获取指标权重。
具体地,获取各个指标类别所包括的指标的各个降维目标元值,然后获取各个降维目标元值在各个降维目标元值之和中的比例。
请继续参考前述示例,其中:w13对应的指标为正确率均值,w23对应的指标为正确率标准差,w32对应的指标为喜爱度均值、w42对应的指标为喜爱度标准差,w51对应的指标为表扬次数均值和w61对应的指标为表扬次数标准差。
然后根据各个降维指标元值计算指标权重,具体可以采用以下公式进行:
正确率均值的权重A1为:w13/(w13+w23);
正确率标准差的权重A2为:w23/(w13+w23);
喜爱度均值的权重B1为: w32/(w32+w42);
喜爱度标准差的权重B2为:w42/(w32+w42);
表扬次数均值的权重C1为:w51/(w51+w61);
表扬次数标准差的权重C2为:w61/(w51+w61)。
从而,本发明实施例所提供的事件概率预测模型训练方法,在计算指标权重时,由于指标向指标类别的转换是将多个数量的数值向较少数量的数值的转换,因此在模型训练过程中,得到降维权重矩阵,但是降维权重矩阵中的各个元所代表的意义无法确定,为此利用权重方阵,实现对于降维权重矩阵中的降维目标元的确定,以及降维目标元所代表的意义的确定,进而根据降维权重矩阵中的降维目标元值,实现对于指标权重的获取,从而,巧妙地利用指标向指标类别转换的逻辑,将无法确定降维权重矩阵的各个元所代表的意义显现出来,实现了黑盒信息的透明化,实现了指标权重的获取,并可以保证后续事件概率预测时,基于相关指标数据值获取指标类别值的实现。
步骤S23:根据对应于同一所述指标的所述指标权重和各个所述数据单元的所述相关指标数据值,获取各个所述数据单元的所述指标类别的数据值,得到各个所述数据单元的指标类别值。
得到指标权重后,进一步获取各个数据单元中对应于同一指标的相关指标数据值,并结合指标与指标类别的对应关系,通过加权求和的方式,获取各个数据单元的各个指标类别的数据值,从而得到各个数据单元的指标类别值。
继续结合前述示例:
假设一数据单元的各个相关指标数据值分别为:
正确率均值的数据值为:D1;
正确率标准差的数据值为:D2;
喜爱度均值的数据值为:D3;
喜爱度标准差的数据值为:D4;
表扬次数均值的数据值为:D5;
表扬次数标准差的数据值为:D6。
那么对应的各个指标类别值为:
学会的指标类别值为:A1*D1+A2*(1-D2)
喜欢的指标类别值为:B1*D3+B2*(1-D4)
受关注的指标类别值为:C1*D5+C2*(1-D6)
从而得到该数据单元的各个指标类别值,通过对训练数据集的各个数据单元的指标类别值的计算,获取整个训练数据集的各个数据单元的指标类别值。
步骤S24:利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述指标类别值获取预测事件概率,根据所述预测事件概率和所述实际事件概率获取概率损失。
得到各个数据单元的指标类别值后,利用待训练的事件概率预测模型,获取各个数据单元的预测事件概率,并进一步根据得到的预测事件概率和对应于同一数据单元的实际事件概率获取概率损失。
步骤S25:判断所述概率损失是否满足损失阈值,若是,执行步骤S27,若否,执行步骤S26。
步骤S26:根据所述概率损失调整所述事件概率预测模型的参数,转向执行步骤S24。
步骤S27:得到训练好的事件概率预测模型和事件概率权重矩阵。
步骤S25-步骤S27的具体内容,请参考图1所示的步骤S12-步骤S14的描述,在此不再赘述。
当然,容易理解的是,利用指标类别值进行事件概率预测模型所得到的事件概率权重矩阵的各个元,分别为各个所述指标类别的权重,而非各个指标的权重。
这样,可以根据各个指标类别的权重获取各个指标类别的影响因素值。
从而,本发明实施例所提供的事件概率预测模型训练方法,一方面可以选择大量的指标以及指标数据值,经过降维转换得到对应的指标类别值,使得利用训练好的事件概率预测模型进行事件概率预测时,能够利用更多的指标,从而提高事件概率预测模型预测的准确性;同时,在进行事件概率预测模型训练以及后续的事件概率预测时,所使用的数据为数据单元的指标类别值,可以减少模型训练和模型预测时的数据量,降低运算量,提高模型训练效率和事件概率的预测效率,可以实现对于模型训练集事件概率预测的准确性和效率的兼顾。
在另一种具体实施方式中,为了进一步提高所获取的各个指标权重的准确性,所述训练数据集包括各个训练数据子集,待训练的所述降维模型的数量与所述训练数据子集的数量至少相等,本发明实施例所提供的事件概率预测模型训练方法包括:
分别利用各个所述训练数据子集进行与其对应的待训练的降维模型和待训练的所述事件概率预测模型的串联训练,直至得到满足预定训练目标的各个所述降维模型和所述事件概率预测模型,获取各个所述降维模型的各个降维权重矩阵;
利用与所述指标对应的所述指标相关性方向值和所述指标类别,对各个所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的各个权重方阵,获取各个所述权重方阵的各个目标元;
确定各个所述权重方阵中各个目标元的位置相同且数量最多的权重方阵,得到各个一致权重方阵,并确定各个所述一致权重方阵所对应的各个降维权重矩阵;
根据各个所述目标元在各个所述一致权重方阵中的位置,确定各个所述降维权重矩阵中与各个所述目标元对应的各个降维目标元和各个降维目标元值,获取各个所述降维权重矩阵中同一位置的各个降维目标元值的均值,得到降维目标元均值,利用各个所述降维目标元均值和各个所述降维目标元所对应的指标,获取各个指标权重。
容易理解的是,各个训练数据子集可以通过对训练数据集的拆分获取,各个降维模型可以为RBM模型,也可以为PCA模型。
在事件概率预测模型训练过程中,分别利用一个训练数据子集中的各个数据单元对一个降维模型和待训练的事件概率预测模型进行串联训练,具体训练的方式请参考前述图4关于步骤S21的描述,在此不再赘述。
经过模型串联训练后,得到各个降维模型的降维权重矩阵,因此,如果有n个降维模型,会得到n个降维权重矩阵。
得到各个降维权重矩阵后,对于各个降维权重矩阵进行调整,即利用与所述指标对应的所述指标相关性方向值和所述指标类别,对各个所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的各个权重方阵,获取各个所述权重方阵的各个目标元。
获取权重方阵和目标元的具体方式请参考前述图5步骤S220的描述,在此不再赘述。
容易理解的是,基于各个降维权重矩阵,获取各个权重方阵,以及各个权重方阵的目标元,如果经过前述步骤得到n个降维权重矩阵,那么得到n个权重方阵,进而得到n组目标元。
得到对应于各个权重方阵的各组目标元后,由于基于各个权重方阵得到目标元的位置会有不同,比如继续结合前述案例:有的权重方阵的目标元的位置分别为第一行第二列、第二行第三列和第三行第一列,而有的权重方阵的目标元的位置分别为第一行第三列、第二行第一列和第三行第二列,等等,会有多种组合方式,为了保证后续运算的实现,同时提高训练的准确性,本发明实施例所提供的事件概率预测模型的训练方法还包括:
确定各个所述权重方阵中各个目标元的位置相同且数量最多的权重方阵,得到各个一致权重方阵,并确定各个所述一致权重方阵所对应的各个降维权重矩阵。
即根据所得到的各组目标元的位置,确定目标元位置相同的权重方阵,然后统计每组目标元位置相同权重方阵的数量,将数量最多的一组权重方阵作为一致权重方阵,然后根据各个一致权重方阵获取各个转换前的各个降维权重矩阵。
进一步地,根据各个一致权重方阵中各个目标元的位置,确定对应的降维权重矩阵中的降维目标元和降维目标元值。
假设,一致权重方阵有k个,那么会确定出k组降维目标元和降维目标元值,然后计算各个一致权重方阵所对应的降维权重矩阵的各个降维目标元值的平均值,即k组降维目标元值的均值,得到降维目标元均值。
然后利用各个降维目标元均值和各个所述降维目标元所对应的指标,获取各个指标权重。
具体地,首先确定所标注的指标类别相同的各个所述指标,得到各个同类别指标;
获取各个所述同类别指标的降维目标元均值之和,得到降维指标和值;
再利用各个所述同类别指标的所述降维指标元均值和与其对应的所述降维指标和值,获取各个所述指标权重。
这样,可以很方便地实现指标权重的获取。
也可以请参考图5关于步骤S222的描述,只是所使用的数值为降维目标元均值。
可以看出,本发明实施例所提供的事件概率预测模型训练方法,通过多个降维模型获取多个降维权重矩阵,进而获取多个权重方阵,进而利用各个权重方阵的目标元的位置的确定和选择,确定进行指标权重计算的降维权重矩阵,利用平均值实现指标权重的获取,从而可以提高所获取的指标权重的准确性,进一步提高模型训练以及后续事件概率预测的准确性。
为了实现对于事件概率的预测并确定对事件概率产生影响的影响因素值,本发明实施例还提供一种事件概率预测方法,请参考图6,图6为本发明实施例所提供的事件概率预测方法的流程示意图。
如图中所示,本发明实施例所提供的事件概率预测方法,包括:
步骤S40:获取待事件概率预测的数据单元的预测相关指标数据值。
容易理解的是,由于待事件概率预测的数据单元的指标有很多,在此,仅需要获取预测相关指标数据值,即前述经过相关性计算获取的,与目标分类维度相对应的,相关度满足相关度阈值的指标的预测相关指标数据值。
步骤S41:利用如前述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述预测相关指标数据值获取预测事件概率,并根据所述预测相关指标数据值和利用如前述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标的影响因素值。
得到预测相关指标数据值后,进一步进行事件概率预测以及指标的影响因素值的获取。
容易理解的是,受到在模型训练阶段所确定的目标分类维度的影响,在进行事件概率预测时,也需要按照目标分类维度,确定待事件概率预测的数据单元所处的训练数据集,然后确定对应的已经训练好的事件概率预测模型,以及事件概率权重矩阵。
在具体预测时,将待事件概率预测的数据单元的预测相关指标数据值输入对应的事件概率预测模型,得到预测事件概率,然后利用预测相关指标数据值和事件概率权重矩阵中同一指标的权重矩阵,获取指标的影响因素值。
可以看出,本发明实施例所提供的事件概率预测方法,不仅可以实现对事件概率的预测,还可以获取事件概率的各个指标的影响因素值,可以提前为后续达到预期的事件概率或者避免达到预测得到事件概率做出相应的准备,以使未来真正得到的事件概率更满足预期。
在另一种具体实施方式中,还可以进一步根据所得到的预测事件概率与预先确定的预定事件概率阈值,确定事件是否发生,当所述预测事件概率超过预定事件概率阈值时,确定所述事件会发生,否则确定所述事件不会发生。
这样,可以让事件是否发生的判断更为直接,使得用户所得到的结果一目了然。
当然,预定事件概率阈值,可以根据需要进行调整,以使最终判断的结果更为准确。
为了实现对于事件概率的预测并确定对事件概率产生影响的影响因素值,本发明实施例还提供另一种事件概率预测方法,请参考图7,图7为本发明实施例所提供的事件概率预测方法的另一流程示意图。
如图中所示,本发明另一实施例所提供的事件概率预测方法,包括:
步骤S50:获取待事件概率预测的数据单元的预测相关指标数据值。
步骤S50的具体内容请参考步骤S40的相关描述,在此不再赘述。
步骤S51:利用如前述任一项所述的事件概率预测模型训练方法得到的所述指标权重和与所述指标权重对应的预测相关指标数据值,获取所述数据单元的预测指标类别值。
得到预测相关指标数据值后,还需要获取经前述事件概率预测模型训练方法得到的指标权重,当然在获取指标权重时,也是与所获取的待预测的数据单元属于目标分类维度下的同一分类的指标权重。
然后根据指标权重和预测相关指标数据值的对应关系(即都对应于相同的指标),以及与指标类别的对应关系(即指标属于哪一个指标类别)进行加权求和,得到数据单元的各个预测指标类别值。
步骤S52:利用如前述任一项所述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述指标类别值获取预测事件概率,并根据所述指标类别值和利用如前述任一项所述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标类别的影响因素值。
步骤S52的具体内容请参考步骤S41的相关描述,需要说明的是,在此实施例中,在获取预测事件概率时,输入事件概率预测模型的为指标类别值,并且所使用的事件概率权重矩阵的各个元分别为指标类别的权重,得到各个指标类别的影响因素值。
可以看出,本发明实施例所提供的事件概率预测方法,可以通过较小的运算量实现更为准确的事件概率的预测,同时还可以得到指标类别的影响因素值,进而根据指标类别的影响因素值对当前行为进行调整,以使未来得到的真实事件概率更满足预期。
在另一种具体实施方式中,还可以进一步根据所得到的预测事件概率与预先确定的预定事件概率阈值,确定事件是否发生,当所述预测事件概率超过预定事件概率阈值时,确定所述事件会发生,否则确定所述事件不会发生。
这样,可以让事件是否发生的判断更为直接,使得用户所得到的结果一目了然。
当然,预定事件概率阈值,可以根据需要进行调整,以使最终判断的结果更为准确。
下面对本发明实施例提供的事件概率预测模型训练装置和事件概率预测装置进行介绍,下文描述的事件概率预测模型训练装置和事件概率预测装置可以认为是,电子设备(如:PC)为分别实现本发明实施例提供的事件概率预测模型训练方法和事件概率预测方法所需设置的功能模块架构。下文描述的事件概率预测模型训练装置和事件概率预测装置的内容,可分别与上文描述的事件概率预测模型训练方法和事件概率预测方法的内容相互对应参照。
图8是本发明实施例所提供的事件概率预测模型训练装置的一框图,该事件概率预测模型训练装置即可应用于客户端,也可应用于服务器端,参考图8,该事件概率预测模型训练装置,包括:
数据集获取单元100,适于获取训练数据集,其中,所述训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,所述实际事件概率值为各个所述数据单元的事件概率的真实值,所述相关指标数据值为与所述事件概率的相关度满足相关度阈值的各个指标的数值;
事件概率预测模型及事件概率权重矩阵获取单元110,适于利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率值,根据所述预测事件概率值和所述实际事件概率值获取概率损失,根据所述概率损失调整所述事件概率预测模型的参数,直至所述概率损失满足损失阈值,得到训练好的事件概率预测模型和事件概率权重矩阵,所述事件概率权重矩阵的各个元分别为对应的各个所述指标的权重。
容易理解的是,为了实现对于事件概率预测模型的训练,需要首先获取训练用的数据,即训练数据集,训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,实际事件概率值为各个所述数据单元的事件概率的真实值,相关指标数据值为与所述事件概率的相关度满足相关度阈值的各个指标的数值。
其中,数据单元是指一组相对应的实际事件概率值和相关指标数据值所归属的单元,比如:一个班级、一个学生、一个时段、一个租铺等等,以班级为例,对应于班级的事件概率可以为续报率、退费率,对应于班级的与事件概率可能相关的指标可以包括题目正确率、题目参与率、听懂率、课程喜爱度、抢红包参与率、积分、表扬次数、个人秀查看率、个人秀点赞率等等。
由于能够获取到的、可能与事件概率相关的指标,并不一定与事件概率相关,因此,在进行事件概率预测模型训练之前,需要首先对获取到的各个数据单元的数据进行处理,确定与所述事件概率的相关度满足相关度阈值的各个指标。
然而,对于不同类别的数据单元,与事件概率相关度满足相关度阈值的指标很有可能是不同的,当具体进行事件概率的预测时,也会按照不同的分类方式分别获取相关度满足相关度阈值的指标,然后再分别进行不同的预测,因此,还需要确定后续预测使用的分类方式和不同分类方式下的相关度满足相关度阈值的指标。
在一种具体实施方式中,为了获取训练数据集,数据集获取单元100,适于获取训练数据集,包括:
获取原始训练数据集;
获取目标分类维度和与所述目标分类维度相对应的指标;
获取根据所述目标分类维度分类的预分类数据集,并筛选与所述目标分类维度相对应的指标的所述预计相关指标数据值,得到所述训练数据集。
容易理解的是,原始训练数据集是直接获取到的未经过处理的训练数据集,所述原始训练数据集包括对应于各个数据单元的实际事件概率值和预计相关指标数据值,所述预计相关指标数据值为预计与所述事件概率相关的各个指标的数值。
具体地,原始训练数据集可以通过对应的统计软件获取。
需要说明的是,本文所述的目标分类维度是指经过比较确定,所确定的对于事件概率预测效果较好的分类维度。当然,目标分类维度需要在具体分类之前获取,在一种具体实施方式中,为了获取目标分类维度,可以通过对多种分类维度进行数据分类后的相关性计算确定。
为此,首先根据各个待定分类维度对所述原始训练数据集进行分类,得到预分类数据集。
其中待定分类维度为根据数据单元的特点,可能的分类维度。比如:对于教学相关的数据单元,可以将预定分类维度确定为:年级、学校、班级类型、整体等等。
按照不同的预定分类维度,分别对原始数据集进行分类,得到各个预分类数据集。
然后,通过相关性计算算法,利用各个所述预分类数据集的各个所述数据单元的所述预计相关指标数据值和实际事件概率值,获取各个预计相关指标数据值与所述实际事件概率值的相关度,得到相关度满足相关度阈值的各个指标,确定相关指标数量最多的待定分类维度,以及与所述待定分类维度相对应的指标,得到所述目标分类维度和与所述目标分类维度相对应的指标,其中相关指标数量为相关度满足相关度阈值的指标的数量。
得到各个预分类数据集后,根据不同的预分类数据集,获取对应的数据单元,以及各个数据单元的预计相关指标数据值和实际事件概率值,然后输入到相关性计算算法中,得出与实际事件概率值相关度满足相关度阈值的各个指标。
需要说明的是,相关度可能为正值,表示指标与事件概率之间为正相关,也可能为负值,表示指标与事件概率之间为负相关,其中相关度满足相关度阈值是指相关度的绝对值大于或等于相关度阈值。
由于相关度阈值过高,会造成满足相关度阈值的指标的数量过少,不利于后续对模型的训练,相关度阈值过低,又会造成满足相关度阈值的指标的数量过多,增加模型训练的运算量,因此,在一种具体实施方式中,可以选择相关度阈值为0.2,即将相关度的绝对值大于或等于0.2的指标确定为事件概率的指标,从而同时兼顾模型训练的准确性和运算量。
由于按照各个待定分类维度对所述原始训练数据集进行分类后,受到原始训练数据集的数据单元量的影响,各个预分类数据集的数据单元量不同,可以分别选择不同的相关性计算算法。
具体地,可以选择斯皮尔曼等级相关系数(spearman相关系数)计算算法和肯德尔等级相关系数(Kendal’stau-b相关系数)计算算法。
由于斯皮尔曼等级相关系数(spearman相关系数)计算算法对于数据集的要求既不要求必须符合正态分布,并且对于任何单调函数定义的关系都适用,而且当样本量相对较大时,选择spearman相关系数计算算法更优;当样本量相对较小时,Kendall’s tau-b相关系数计算算法对错误的敏感度更低,更精确。
为此,在进行相关性指标确定时,还可以首先根据预分类数据集的数据单元量选择具体的计算算法。
具体地,先获取预分类数据集的数据单元量,然后判断数据单元量是否超过第一数据量阈值,如果超过,那么选择斯皮尔曼等级相关系数计算算法进行计算,如果没超过,那么可以选择肯德尔等级相关系数计算算法。
为了避免由于数据量过小,对于满足相关度阈值的指标的确定产生不确定影响,还可以在判断数据单元量未超过第一数据量阈值时,再进一步判断数据单元量是否超过第二数据量阈值,如果超过,那么可以选择肯德尔等级相关系数计算算法,否则,直接舍弃。
第一数据量阈值和第二数据量阈值的具体数值可以根据需要确定,容易理解的是,第一数据量阈值大于第二数据量阈值。
经过对各个预分类数据集的相关性计算后,可以分别得到与各个预分类数据集对应的满足相关度阈值的各个指标,然后需要根据与各个预分类数据集对应的满足相关度阈值的各个指标从待定分类维度中选择目标分类维度。
为了保证对于模型训练的准确性,可以选择满足相关度阈值的指标的数量最多的待定分类维度为目标分类维度,从而也可以得到与目标分类维度相对应的各个指标。
得到目标分类维度后,获取根据目标分类维度分类的预分类数据集,然后选择预分类数据集中的各个数据单元的与目标分类维度相对应的指标的数据值,得到训练数据集。
因此,得到的训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,其中,实际事件概率值为各个数据单元的事件概率的真实值,相关指标数据值为与事件概率的相关度满足相关度阈值的各个指标的数值。
容易理解的是,因为训练数据集是通过对原始训练数据集按照目标分类维度分类后得到的,因此,训练数据集会有多个,基于不同的训练数据集,训练后的事件概率预测模型很有可能是不同的,从而在预测时,基于具体的数据单元所归属的类别,可以选择对应的事件概率预测模型进行预测。
得到训练数据集后,利用数据单元的相关指标数据值输入待训练的事件概率预测模型,进行事件概率的预测,得到各个预测事件概率值,然后进一步根据预测事件概率值和实际事件概率值获取二者的差别,得到概率损失。
得到概率损失后,将概率损失与损失阈值进行比较,如果满足损失阈值,那么事件概率预测模型满足预测的准确性要求,得到训练好的事件概率预测模型和事件概率权重矩阵,其中,事件概率权重矩阵的各个元分别为对应的各个所述指标的权重;否则,事件概率预测模型的预测准确性还不能满足准确性要求,根据所述概率损失调整所述事件概率预测模型的参数,利用参数调整后的事件概率预测模型再次获取预测事件概率值。
从而,当利用事件概率预测模型进行事件概率预测时,不仅能够得到预测的事件概率值,还能够利用事件概率权重矩阵,得到各个指标对事件概率的影响因素值。
可以看出,本发明实施例所提供的事件概率预测模型训练装置,在对待训练的事件概率预测模型进行训练时,利用可以获取的相关指标数据值和实际事件概率值进行,构建起事件概率预测模型中相关指标数据值与事件概率之间的关系,为后续利用训练好的事件概率预测模型,通过当前时刻可以获取的指标数据值,实现对未来事件概率的预测,做好准备,并保证预测的准确性;同时,在模型训练过程中,还获取各个指标的权重,在实际进行事件概率预测时,不仅可以得到预测的事件概率,还可以根据各个指标的相关指标数据值和与其对应的指标的权重,获取得到预测事件概率的各个指标的影响因素值,从而可以提前为后续达到预测事件概率或者避免达到预测事件概率做出相应的准备,以使未来真正得到的事件概率更满足预期。
在另一种具体实施方式中,为了在保证训练准确性的基础上,降低训练的运算量,本发明实施例还提供的一种事件概率预测模型训练装置,请参考图9,图9是本发明实施例所提供的事件概率预测模型训练装置的另一框图,本发明实施例所提供的事件概率预测模型训练装置,还包括:
降维权重矩阵获取单元120,适于利用所述训练数据集进行待训练的降维模型和待训练的所述事件概率预测模型的串联训练,直至得到满足预定训练目标的所述降维模型和所述事件概率预测模型,获取所述降维模型的降维权重矩阵,所述降维权重矩阵的各个行对应各个所述指标;
指标权重获取单元130,适于根据所述降维权重矩阵,获取各个指标权重;
指标类别值获取单元140,适于根据对应于同一所述指标的所述指标权重和各个所述数据单元的所述相关指标数据值,获取各个所述数据单元的所述指标类别的数据值,得到各个所述数据单元的指标类别值;
所述事件概率预测模型及事件概率权重矩阵获取单元110,适于利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率包括:
利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述指标类别值获取预测事件概率,当得到训练好的事件概率预测模型时,所得到的所述事件概率权重矩阵的各个元分别为各个所述指标类别的权重。
为了实现对待训练的事件概率预测模型的训练,并在保证训练准确性的基础上,降低事件概率预测模型训练的运算量,因此,可以对相关度满足相关度阈值的指标进行降维处理,以融合较多的相关指标。
为了保证降维的实现,一方面需要确定降维前的指标对应于降维后的那个指标类别,另一方面还需要确定基于降维前的各个指标的相关指标数据值如何得到降维后的指标类别的指标类别值。
在一种具体实施方式中,为了实现降维前的指标与降维后的指标类别的对应,可以对各个指标预先标注指标类别,根据指标与指标类别之间的实际意义关联,对各个指标进行指标类别的标注,即各个指标包括预先标注的指标类别。容易理解的是,指标类别是为了实现对指标的降维而标注的,因此指标类别的数量小于指标的数量。
为了实现对于基于降维前的各个指标的相关指标数据值如何得到降维后的指标类别的指标类别值的确定,首先需要确定基于各个相关指标数据值得到各个指标类别值的计算权重,即降维权重。
在一种具体实施方式中,为了获取降维权重,可以首先利用对预先构建的待训练的降维模型和待训练的事件概率预测模型的串联训练,进而得到降维权重矩阵,其中降维权重矩阵的各个行分别对应各个指标,因此有多少个指标,降维权重矩阵就会有多少行。
具体地,降维模型可以为RBM (Restricted Boltzmann Machines, 受限玻尔兹曼机)模型,也可以为PCA(Principal components analysis,主成分分析)模型。
降维权重矩阵的获取,具体包括:
根据所述训练数据集的各个所述数据单元的所述相关指标数据值,利用待训练的所述降维模型和待训练的所述事件概率预测模型获取各个预测事件概率;
根据各个所述预测事件概率和各个所述实际事件概率获取概率损失,利用所述概率损失调整所述降维模型和事件概率预测模型的参数,直至所述概率损失满足第二损失阈值,得到满足预定训练目标的所述降维模型和所述事件概率预测模型。
具体地,首先将训练数据集的各个数据单元的相关指标数据值输入降维模型,得到的输出继续输入事件概率预测模型,得到各个预测事件概率。
当然在进行串联训练的过程中,降维模型的输出直接输入到事件概率模型中,二者是串联进行的,并未有数据的输出。
得到各个预测事件概率后,根据各个预测事件概率以及各个实际事件概率获取概率损失,判断概率损失是否满足第二损失阈值,如果不满足那么根据概率损失同时调整降维模型和事件概率预测模型的参数,并根据参数调整后的降维模型和事件概率预测模型获取预测事件概率,如果满足,那么得到满足预定训练目标的所述降维模型和所述事件概率预测模型,同时还得到降维模型的降维权重矩阵,且降维权重矩阵的各个行对应各个所述指标。
需要说明的是,通过串联训练得到的事件概率预测模型,是为了实现对降维模型的训练而得到的,并非后续进行预测所使用的模型。
得到降维权重矩阵,还需要进一步获取各个指标权重,在一种具体实施方式中,指标权重获取单元130,适于获取各个指标权重,可以包括:
利用与所述指标对应的所述指标相关性方向值和所述指标与指标类别的对应关系,对所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的权重方阵,获取所述权重方阵的各个用于表示指标类别的目标元;
根据各个所述目标元在所述权重方阵中的位置,确定所述降维权重矩阵中与各个所述目标元对应的各个降维目标元和各个降维目标元值;
利用各个所述降维目标元值和各个所述降维目标元所对应的指标,获取各个指标权重。
为了得到指标权重,首先利用与指标对应的指标相关性方向值和指标与指标类别的对应关系,对降维权重矩阵进行调整,以得到行数和列数均等于所述指标类别的数量的权重方阵,其中指标相关性方向值为所述指标与所述事件概率的相关性方向的数值,如果相关度为正值,则表示指标与事件概率正相关,相关性方向值为1,如果相关度为负值,则表示指标与事件概率负相关,相关性方向值为-1。
实际运算过程中,由于所要预测的事件概率是需提升的事件概率(如续报率)还是需降低的事件概率(如退费率)与指标的关联关系不同,因此,需要根据所要预测的事件概率是哪种类型,确定是否对相关性计算过程中得到的相关度的指标相关性方向值进行取反运算:如果是预测想要提升的概率(如续报率),直接利用相关性计算得到的相关度的指标相关性方向值和指标类别,对降维权重矩阵进行调整,得到行数和列数均等于指标类别的数量的权重方阵;如果是预测想要降低的概率(如退费率),则首先对相关性计算得到的相关度的指标相关性方向值进行一次取反运算,然后利用取反运算得到的指标相关性方向值和指标类别,对降维权重矩阵进行调整,得到行数和列数均等于指标类别的数量的权重方阵。
所述权重方阵的各行分别对应各个所述指标的指标类别,所述目标元的数量等于所述指标类别的数量。
根据降维权重矩阵各个行所代表的指标,获取对应的指标相关性方向值,并根据指标与指标类别之间的对应关系,进行计算,将指标相关性方向值作为权重,将对应于同一指标类别的各个指标同一列的各个元进行加权求和,得到权重方阵的对应位置的元。
得到权重方阵后,进一步确定权重方阵中的各个目标元。
通过确定权重方阵中的目标元,可以用于确定降维目标元,实现对于指标权重的获取。
在一种具体实施方式中,可以首先获取所述权重方阵的各个元中数值最大的最大值元,得到一个目标元,并得到目标元所在行和目标元所在列。
然后,忽略所述权重方阵中所述目标元所在行的各个元和所述目标元所在列的各个元,得到调整方阵。
进一步,以所述调整方阵作为新的权重方阵,获取新的目标元,直至得到全部的所述目标元,直至得到全部的目标元。
可以看出,通过上述方法,对权重矩阵的最大值元的获取和调整方阵的获取,可以很方便地实现全部目标元的获取,并且使得所获取的各个目标元更加合理,即目标元确定为指标权重重要性最大的指标类别,相当于对于一种金属混合物体,含金90%,银5%,铜5%,我们把它归类为金更为合理;另一方面,还能够保证降至目标维度的指标类别齐全完整,而不会造成某个指标类别的重复或者某个指标类别的缺失,比如这里的学会、喜欢、受关注三个指标类别都有,而不会出现学会、学会、喜欢这样的方式。
根据各个目标元在矩阵方阵中的位置,反向确定降维权重矩阵中的降维目标元。
得到降维目标元值和降维目标元对应的指标后,进一步获取指标权重。
具体地,获取各个指标类别所包括的指标的各个降维目标元值,然后获取各个降维目标元值在各个降维目标元值之和中的比例。
从而,本发明实施例所提供的事件概率预测模型训练方法,在计算指标权重时,由于指标向指标类别的转换是将多个数量的数值向较少数量的数值的转换,因此在模型训练过程中,得到降维权重矩阵,但是降维权重矩阵中的各个元所代表的意义无法确定,为此利用权重方阵,实现对于降维权重矩阵中的降维目标元的确定,以及降维目标元所代表的意义的确定,进而根据降维权重矩阵中的降维目标元值,实现对于指标权重的获取,从而,巧妙地利用指标向指标类别转换的逻辑,将无法确定降维权重矩阵的各个元所代表的意义显现出来,实现了黑盒信息的透明化,实现了指标权重的获取,并可以保证后续事件概率预测时,基于相关指标数据值获取指标类别值的实现。
得到指标权重后,进一步获取各个数据单元中对应于同一指标的相关指标数据值,并结合指标与指标类别的对应关系,通过加权求和的方式,获取各个数据单元的各个指标类别的数据值,从而得到各个数据单元的指标类别值。
通过对训练数据集的各个数据单元的指标类别值的计算,获取整个训练数据集的各个数据单元的指标类别值。
得到各个数据单元的指标类别值后,利用待训练的事件概率预测模型,获取各个数据单元的预测事件概率,并进一步根据得到的预测事件概率和对应于同一数据单元的实际事件概率获取概率损失。
进而判断所述概率损失是否满足损失阈值,若是,得到训练好的事件概率预测模型和事件概率权重矩阵,且利用指标类别值进行事件概率预测模型所得到的事件概率权重矩阵的各个元,分别为各个所述指标类别的权重,而非各个指标的权重;若否,根据所述概率损失调整所述事件概率预测模型的参数,再次进行训练。
从而,本发明实施例所提供的事件概率预测模型训练装置,一方面可以选择大量的指标以及指标数据值,经过降维转换得到对应的指标类别值,使得利用训练好的事件概率预测模型进行事件概率预测时,能够利用更多的指标,从而提高事件概率预测模型预测的准确性;同时,在进行事件概率预测模型训练以及后续的事件概率预测时,所使用的数据为数据单元的指标类别值,可以减少模型训练和模型预测时的数据量,降低运算量,提高模型训练效率和事件概率的预测效率,可以实现对于模型训练集事件概率预测的准确性和效率的兼顾。
在另一种具体实施方式中,为了进一步提高所获取的各个指标权重的准确性,所述训练数据集包括各个训练数据子集,待训练的所述降维模型的数量与所述训练数据子集的数量至少相等,本发明实施例所提供的事件概率预测模型训练装置的降维权重矩阵获取单元120,适于分别利用各个所述训练数据子集进行与其对应的待训练的降维模型和待训练的所述事件概率预测模型的串联训练,直至得到满足预定训练目标的各个所述降维模型和所述事件概率预测模型,获取各个所述降维模型的各个降维权重矩阵;
利用与所述指标对应的所述指标相关性方向值和所述指标类别,对各个所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的各个权重方阵,获取各个所述权重方阵的各个目标元;
确定各个所述权重方阵中各个目标元的位置相同且数量最多的权重方阵,得到各个一致权重方阵,并确定各个所述一致权重方阵所对应的各个降维权重矩阵;
指标权重获取单元130,适于根据各个所述目标元在各个所述一致权重方阵中的位置,确定各个所述降维权重矩阵中与各个所述目标元对应的各个降维目标元和各个降维目标元值,获取各个所述降维权重矩阵中同一位置的各个降维目标元值的均值,得到降维目标元均值,利用各个所述降维目标元均值和各个所述降维目标元所对应的指标,获取各个指标权重。
容易理解的是,各个训练数据子集可以通过对训练数据集的拆分获取,各个降维模型可以为RBM模型,也可以为PCA模型。
在事件概率预测模型训练过程中,分别利用一个训练数据子集中的各个数据单元对一个降维模型和待训练的事件概率预测模型进行串联训练。
经过模型串联训练后,得到各个降维模型的降维权重矩阵,因此,如果有n个降维模型,会得到n个降维权重矩阵。
得到各个降维权重矩阵后,对于各个降维权重矩阵进行调整,即利用与所述指标对应的所述指标相关性方向值和所述指标类别,对各个所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的各个权重方阵,获取各个所述权重方阵的各个目标元。
容易理解的是,基于各个降维权重矩阵,获取各个权重方阵,以及各个权重方阵的目标元,如果经过前述步骤得到n个降维权重矩阵,那么得到n个权重方阵,进而得到n组目标元。
得到对应于各个权重方阵的各组目标元后,由于基于各个权重方阵得到目标元的位置会有不同,为了保证后续运算的实现,同时提高训练的准确性,本发明实施例所提供的事件概率预测模型的训练装置的降维权重矩阵获取单元120,还适于确定各个所述权重方阵中各个目标元的位置相同且数量最多的权重方阵,得到各个一致权重方阵,并确定各个所述一致权重方阵所对应的各个降维权重矩阵。
即根据所得到的各组目标元的位置,确定目标元位置相同的权重方阵,然后统计每组目标元位置相同权重方阵的数量,将数量最多的一组权重方阵作为一致权重方阵,然后根据各个一致权重方阵获取各个转换前的各个降维权重矩阵。
进一步地,根据各个一致权重方阵中各个目标元的位置,确定对应的降维权重矩阵中的降维目标元和降维目标元值。
假设,一致权重方阵有k个,那么会确定出k组降维目标元和降维目标元值,然后计算各个一致权重方阵所对应的降维权重矩阵的各个降维目标元值的平均值,即k组降维目标元值的均值,得到降维目标元均值。
然后利用各个降维目标元均值和各个所述降维目标元所对应的指标,获取各个指标权重。
具体地,首先确定所标注的指标类别相同的各个所述指标,得到各个同类别指标;
获取各个所述同类别指标的降维目标元均值之和,得到降维指标和值;
再利用各个所述同类别指标的所述降维指标元均值和与其对应的所述降维指标和值,获取各个所述指标权重。
这样,可以很方便地实现指标权重的获取。
可以看出,本发明实施例所提供的事件概率预测模型训练装置,通过多个降维模型获取多个降维权重矩阵,进而获取多个权重方阵,进而利用各个权重方阵的目标元的位置的确定和选择,确定进行指标权重计算的降维权重矩阵,利用平均值实现指标权重的获取,从而可以提高所获取的指标权重的准确性,进一步提高模型训练以及后续事件概率预测的准确性。
为了实现对于事件概率的预测并确定对事件概率产生影响的影响因素值,本发明实施例还提供一种事件概率预测装置,请参考图10,图10是本发明实施例所提供的事件概率预测装置的一框图,包括:
预测相关指标数据值获取单元200,适于获取待事件概率预测的数据单元的预测相关指标数据值;
预测相关指标数据值和影响因素值获取单元210,适于利用如前述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述预测相关指标数据值获取预测事件概率,并根据所述预测相关指标数据值和利用如前述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标的影响因素值。
由于待事件概率预测的数据单元的指标有很多,在此,预测相关指标数据值获取单元200仅需要获取预测相关指标数据值,即前述经过相关性计算获取的,与目标分类维度相对应的,相关度满足相关度阈值的指标的预测相关指标数据值。
得到预测相关指标数据值后,进一步进行事件概率预测以及指标的影响因素值的获取。
容易理解的是,受到在模型训练阶段所确定的目标分类维度的影响,在进行事件概率预测时,也需要按照目标分类维度,确定待事件概率预测的数据单元所处的训练数据集,然后确定对应的已经训练好的事件概率预测模型,以及事件概率权重矩阵。
在具体预测时,将待事件概率预测的数据单元的预测相关指标数据值输入对应的事件概率预测模型,得到预测事件概率,然后利用预测相关指标数据值和事件概率权重矩阵中同一指标的权重矩阵,获取指标的影响因素值。
可以看出,本发明实施例所提供的事件概率预测装置,不仅可以实现对事件概率的预测,还可以获取事件概率的各个指标的影响因素值,可以提前为后续达到预期的事件概率或者避免达到预测得到事件概率做出相应的准备,以使未来真正得到的事件概率更满足预期。
在另一种具体实施方式中,预测相关指标数据值和影响因素值获取单元210还可以进一步根据所得到的预测事件概率与预先确定的预定事件概率阈值,确定事件是否发生,当所述预测事件概率超过预定事件概率阈值时,确定所述事件会发生,否则确定所述事件不会发生。
这样,可以让事件是否发生的判断更为直接,使得用户所得到的结果一目了然。
当然,预定事件概率阈值,可以根据需要进行调整,以使最终判断的结果更为准确。
为了实现对于事件概率的预测并确定对事件概率产生影响的影响因素值,本发明实施例还提供另一种事件概率预测装置,还包括:预测指标类别值获取单元,适于利用如前述任一项所述的事件概率预测模型训练方法得到的所述指标权重和与所述指标权重对应的预测相关指标数据值,获取所述数据单元的预测指标类别值;
预测相关指标数据值和影响因素值获取单元210,还适于利用如前述任一项所述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述指标类别值获取预测事件概率,并根据所述指标类别值和利用如前述任一项所述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标类别的影响因素值。
得到预测相关指标数据值后,预测指标类别值获取单元还需要获取经前述事件概率预测模型训练方法得到的指标权重,当然在获取指标权重时,也是与所获取的待预测的数据单元属于目标分类维度下的同一分类的指标权重。
然后根据指标权重和预测相关指标数据值的对应关系(即都对应于相同的指标),以及与指标类别的对应关系(即指标属于哪一个指标类别)进行加权求和,得到数据单元的各个预测指标类别值。
在此实施例中,在获取预测事件概率时,所使用的为指标类别值,并且所使用的事件概率权重矩阵的各个元分别为指标类别的权重,得到各个指标类别的影响因素值。
可以看出,本发明实施例所提供的事件概率预测方法,可以通过较小的运算量实现更为准确的事件概率的预测,同时还可以得到指标类别的影响因素值,进而根据指标类别的影响因素值对当前行为进行调整,以使未来得到的真实事件概率更满足预期。
当然,本发明实施例还提供一种设备,本发明实施例提供的设备可以通过程序形式装载上述所述的程序模块架构,以实现本发明实施例提供的事件概率预测模型训练方法或事件概率预测方法;该硬件设备可以应用于具体数据处理能力的电子设备,该电子设备可以为:例如终端设备或者服务器设备。
可选的,图11示出了本发明实施例提供的设备一种可选硬件设备架构,可以包括:至少一个存储器3和至少一个处理器1;所述存储器存储有程序,所述处理器调用所述程序,以执行前述的事件概率预测模型训练方法或事件概率预测方法,另外,至少一个通信接口2和至少一个通信总线4;处理器1和存储器3可以位于同一电子设备,例如处理器1和存储器3可以位于服务器设备或者终端设备;处理器1和存储器3也可以位于不同的电子设备。
作为本发明实施例公开内容的一种可选实现,存储器3可以存储程序,处理器1可调用所述程序,以执行本发明上述实施例提供的事件概率预测模型训练方法或事件概率预测方法。
本发明实施例中,电子设备可以是能够进行事件概率预测模型训练或事件概率预测的平板电脑、笔记本电脑等设备。
在本发明实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;显然,图11所示的处理器1、通信接口2、存储器3和通信总线4的通信连接示意仅是可选的一种方式;
可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;
处理器1可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
需要说明的是,上述的设备还可以包括与本发明实施例公开内容可能并不是必需的其他器件(未示出);鉴于这些其他器件对于理解本发明实施例公开内容可能并不是必需,本发明实施例对此不进行逐一介绍。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,当该指令被处理器执行时可以实现如上所述事件概率预测模型训练方法或事件概率预测方法。
本发明实施例所提供的存储介质所存储的计算机可执行指令,在对待训练的事件概率预测模型进行训练时,在对待训练的事件概率预测模型进行训练时,利用可以获取的相关指标数据值和实际事件概率值进行,构建起事件概率预测模型中相关指标数据值与事件概率之间的关系,为后续利用训练好的事件概率预测模型,通过当前时刻可以获取的指标数据值,实现对未来事件概率的预测,做好准备,并保证预测的准确性;同时,在模型训练过程中,还获取各个指标的权重,在实际进行事件概率预测时,不仅可以得到预测的事件概率,还可以根据各个指标的相关指标数据值和与其对应的指标的权重,获取得到预测事件概率的各个指标的影响因素值,从而可以提前为后续达到预测事件概率或者避免达到预测事件概率做出相应的准备,以使未来真正得到的事件概率更满足预期。
上述本发明的实施方式是本发明的元件和特征的组合。除非另外提及,否则所述元件或特征可被视为选择性的。各个元件或特征可在不与其它元件或特征组合的情况下实践。另外,本发明的实施方式可通过组合部分元件和/或特征来构造。本发明的实施方式中所描述的操作顺序可重新排列。任一实施方式的一些构造可被包括在另一实施方式中,并且可用另一实施方式的对应构造代替。对于本领域技术人员而言明显的是,所附权利要求中彼此没有明确引用关系的权利要求可组合成本发明的实施方式,或者可在提交本申请之后的修改中作为新的权利要求包括。
本发明的实施方式可通过例如硬件、固件、软件或其组合的各种手段来实现。在硬件配置方式中,根据本发明示例性实施方式的方法可通过一个或更多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器等来实现。
在固件或软件配置方式中,本发明的实施方式可以模块、过程、功能等形式实现。软件代码可存储在存储器单元中并由处理器执行。存储器单元位于处理器的内部或外部,并可经由各种己知手段向处理器发送数据以及从处理器接收数据。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是符合与本文所公开的原理和新颖特点相一致的最宽的范围。
虽然本发明实施例披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种变动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (16)

1.一种事件概率预测模型训练方法,其特征在于,应用于教育领域,包括:
获取训练数据集,其中,所述训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,所述实际事件概率值为各个所述数据单元的事件概率的真实值,所述相关指标数据值为与所述事件概率的相关度满足相关度阈值的各个指标的数值,其中,所述事件概率包括退费率或续报率,所述指标包括题目正确率、题目参与率、听懂率、课程喜爱度、抢红包参与率、积分、表扬次数、个人秀查看率和个人秀点赞率;
利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率值,根据所述预测事件概率值和所述实际事件概率值获取概率损失,根据所述概率损失调整所述事件概率预测模型的参数,直至所述概率损失满足损失阈值,得到训练好的事件概率预测模型和事件概率权重矩阵,所述事件概率权重矩阵的各个元分别为对应的各个所述指标的权重;
各个所述指标均包括预先标注的指标类别,所述指标类别的数量小于所述指标的数量;
所述利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率的步骤之前,还包括:
利用所述训练数据集进行待训练的降维模型和待训练的所述事件概率预测模型的串联训练,直至得到满足预定训练目标的所述降维模型和所述事件概率预测模型,获取所述降维模型的降维权重矩阵,所述降维权重矩阵的各个行对应各个所述指标;
根据所述降维权重矩阵,获取各个指标权重;
根据对应于同一所述指标的所述指标权重和各个所述数据单元的所述相关指标数据值,获取各个所述数据单元的所述指标类别的数据值,得到各个所述数据单元的指标类别值;
所述利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率的步骤包括:
利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述指标类别值获取预测事件概率,当得到训练好的事件概率预测模型时,所得到的所述事件概率权重矩阵的各个元分别为各个所述指标类别的权重。
2.如权利要求1所述的事件概率预测模型训练方法,其特征在于,所述根据所述降维权重矩阵,获取各个指标权重的步骤包括:
利用与所述指标对应的指标相关性方向值和所述指标类别,对所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的权重方阵,获取所述权重方阵的各个用于表示指标类别的目标元,其中,所述指标相关性方向值为所述指标与所述事件概率的相关性方向的数值,所述权重方阵的各行分别对应各个所述指标的指标类别,所述目标元的数量等于所述指标类别的数量;
根据各个所述目标元在所述权重方阵中的位置,确定所述降维权重矩阵中与各个所述目标元对应的各个降维目标元和各个降维目标元值;
利用各个所述降维目标元值和各个所述降维目标元所对应的指标,获取各个指标权重。
3.如权利要求2所述的事件概率预测模型训练方法,其特征在于,所述训练数据集包括各个训练数据子集,待训练的所述降维模型的数量与所述训练数据子集的数量至少相等;
所述利用所述训练数据集进行待训练的降维模型和待训练的所述事件概率预测模型的串联训练,直至得到满足预定训练目标的所述降维模型和所述事件概率预测模型,获取所述降维模型的降维权重矩阵的步骤包括:
分别利用各个所述训练数据子集进行与其对应的待训练的降维模型和待训练的所述事件概率预测模型的串联训练,直至得到满足预定训练目标的各个所述降维模型和所述事件概率预测模型,获取各个所述降维模型的各个降维权重矩阵;
所述利用与所述指标对应的所述指标相关性方向值和所述指标类别,对所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的权重方阵,获取所述权重方阵的各个用于表示指标类别的目标元的步骤包括:
利用与所述指标对应的所述指标相关性方向值和所述指标类别,对各个所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的各个权重方阵,获取各个所述权重方阵的各个目标元;
所述根据各个所述目标元在所述权重方阵中的所在行和所在列,确定所述降维权重矩阵中与各个所述目标元对应的各个降维目标元和各个降维目标元值,利用各个所述降维目标元值和各个所述降维目标元所对应的指标,获取各个指标权重的步骤包括:
确定各个所述权重方阵中各个目标元的位置相同且数量最多的权重方阵,得到各个一致权重方阵,并确定各个所述一致权重方阵所对应的各个降维权重矩阵;
根据各个所述目标元在各个所述一致权重方阵中的位置,确定各个所述降维权重矩阵中与各个所述目标元对应的各个降维目标元和各个降维目标元值,获取各个所述降维权重矩阵中同一位置的各个降维目标元值的均值,得到降维目标元均值,利用各个所述降维目标元均值和各个所述降维目标元所对应的指标,获取各个指标权重。
4.如权利要求3所述的事件概率预测模型训练方法,其特征在于,所述利用各个所述降维目标元均值和各个所述降维目标元所对应的指标,获取各个指标权重的步骤,包括:
确定所标注的指标类别相同的各个所述指标,得到各个同类别指标;
获取各个所述同类别指标的降维目标元均值之和,得到降维指标和值;
利用各个所述同类别指标的所述降维指标元均值和与其对应的所述降维指标和值,获取各个所述指标权重。
5.如权利要求2所述的事件概率预测模型训练方法,其特征在于,所述利用与所述指标对应的指标相关性方向值和所述指标类别,对所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的权重方阵的步骤包括:
当确定所述事件概率的类型为需降低的事件概率时,对与所述指标对应的指标相关性方向值进行取反运算;
利用与所述指标对应的经过取反运算的指标相关性方向值和所述指标类别,对所述降维权重矩阵进行调整,得到行数和列数均等于所述指标类别的数量的权重方阵。
6.如权利要求2所述的事件概率预测模型训练方法,其特征在于,所述获取所述权重方阵的各个用于表示指标类别的目标元的步骤包括:
获取所述权重方阵的各个元中数值最大的最大值元,得到一个目标元,并得到目标元所在行和目标元所在列;
忽略所述权重方阵中所述目标元所在行的各个元和所述目标元所在列的各个元,得到调整方阵,以所述调整方阵作为新的权重方阵,获取新的目标元,直至得到全部的所述目标元。
7.如权利要求1所述的事件概率预测模型训练方法,其特征在于,所述获取训练数据集的步骤包括:
获取原始训练数据集,所述原始训练数据集包括对应于各个数据单元的实际事件概率值和预计相关指标数据值,所述预计相关指标数据值为预计与所述事件概率相关的各个指标的数值;
获取目标分类维度和与所述目标分类维度相对应的指标;
获取根据所述目标分类维度分类的预分类数据集,并筛选与所述目标分类维度相对应的指标的所述预计相关指标数据值,得到所述训练数据集。
8.如权利要求7所述的事件概率预测模型训练方法,其特征在于,所述获取目标分类维度和与所述目标分类维度相对应的指标的步骤包括:
根据各个待定分类维度对所述原始训练数据集进行分类,得到预分类数据集;
通过相关性计算算法,利用各个所述预分类数据集的各个所述数据单元的所述预计相关指标数据值和实际事件概率值,获取各个预计相关指标数据值与所述实际事件概率值的相关度,得到相关度满足相关度阈值的各个指标,确定相关指标数量最多的待定分类维度,以及与所述待定分类维度相对应的指标,得到所述目标分类维度和与所述目标分类维度相对应的指标,其中相关指标数量为相关度满足相关度阈值的指标的数量。
9.如权利要求8所述的事件概率预测模型训练方法,其特征在于,所述相关性计算算法包括:斯皮尔曼等级相关系数计算算法和肯德尔等级相关系数计算算法。
10.如权利要求1所述的事件概率预测模型训练方法,其特征在于,所述利用所述训练数据集进行待训练的降维模型和待训练的所述事件概率预测模型的串联训练,直至得到满足预定训练目标的所述降维模型和所述事件概率预测模型的步骤包括:
根据所述训练数据集的各个所述数据单元的所述相关指标数据值,利用待训练的所述降维模型和待训练的所述事件概率预测模型获取各个预测事件概率,根据各个所述预测事件概率和各个所述实际事件概率获取概率损失,利用所述概率损失调整所述降维模型和事件概率预测模型的参数,直至所述概率损失满足第二损失阈值,得到满足预定训练目标的所述降维模型和所述事件概率预测模型。
11.一种事件概率预测方法,其特征在于,包括:
获取待事件概率预测的数据单元的预测相关指标数据值;
利用如权利要求1-10任一项所述的事件概率预测模型训练方法得到的所述指标权重和与所述指标权重对应的预测相关指标数据值,获取所述数据单元的预测指标类别值;
利用如权利要求1-10任一项所述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述指标类别值获取预测事件概率,并根据所述指标类别值和利用如权利要求1-10任一项所述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标类别的影响因素值。
12.如权利要求11所述的事件概率预测方法,其特征在于,还包括:
当所述预测事件概率超过预定事件概率阈值时,确定所述事件会发生,否则确定所述事件不会发生。
13.一种事件概率预测模型训练装置,其特征在于,应用于教育领域,包括:
数据集获取单元,适于获取训练数据集,其中,所述训练数据集包括对应于各个数据单元的实际事件概率值和相关指标数据值,所述实际事件概率值为各个所述数据单元的事件概率的真实值,所述相关指标数据值为与所述事件概率的相关度满足相关度阈值的各个指标的数值,其中,所述实际事件 概率包括退费率或续报率,所述指标包括题目正确率、题目参与率、听懂率、课程喜爱度、抢红包参与率、积分、表扬次数、个人秀查看率和个人秀点赞率;
事件概率预测模型及事件概率权重矩阵获取单元,适于利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率值,根据所述预测事件概率值和所述实际事件概率值获取概率损失,根据所述概率损失调整所述事件概率预测模型的参数,直至所述概率损失满足损失阈值,得到训练好的事件概率预测模型和事件概率权重矩阵,所述事件概率权重矩阵的各个元分别为对应的各个所述指标的权重;
各个所述指标均包括预先标注的指标类别,所述指标类别的数量小于所述指标的数量,还包括:
降维权重矩阵获取单元,适于利用所述训练数据集进行待训练的降维模型和待训练的所述事件概率预测模型的串联训练,直至得到满足预定训练目标的所述降维模型和所述事件概率预测模型,获取所述降维模型的降维权重矩阵,所述降维权重矩阵的各个行对应各个所述指标;
指标权重获取单元,适于根据所述降维权重矩阵,获取各个指标权重;
指标类别值获取单元,适于根据对应于同一所述指标的所述指标权重和各个所述数据单元的所述相关指标数据值,获取各个所述数据单元的所述指标类别的数据值,得到各个所述数据单元的指标类别值;
所述事件概率预测模型及事件概率权重矩阵获取单元,适于利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述相关指标数据值获取预测事件概率包括:
利用待训练的所述事件概率预测模型,根据各个所述数据单元的所述指标类别值获取预测事件概率,当得到训练好的事件概率预测模型时,所得到的所述事件概率权重矩阵的各个元分别为各个所述指标类别的权重。
14.一种事件概率预测装置,其特征在于,包括:
预测相关指标数据值获取单元,适于获取待事件概率预测的数据单元的预测相关指标数据值;
预测指标类别值获取单元,适于利用如权利要求1-10任一项所述的事件概率预测模型训练方法得到的所述指标权重和与所述指标权重对应的预测相关指标数据值,获取所述数据单元的预测指标类别值;
预测相关指标数据值和影响因素值获取单元,适于利用如权利要求1-10任一项所述的事件概率预测模型训练方法得到的事件概率预测模型,根据所述指标类别值获取预测事件概率,并根据所述指标类别值和利用如权利要求1-10任一项所述的事件概率预测模型训练方法得到的事件概率权重矩阵,获取各个指标类别的影响因素值。
15.一种存储介质,其特征在于,所述存储介质存储有适于事件概率预测模型训练的程序,以实现如权利要求1-10任一项所述的事件概率预测模型训练方法,或者所述存储介质存储有适于事件概率预测的程序,以实现如权利要求11或12所述的事件概率预测方法。
16.一种电子设备,其特征在于,包括至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述程序,以执行如权利要求1-10任一项所述的事件概率预测模型训练方法或者如权利要求11或12所述的事件概率预测方法。
CN202110049876.5A 2021-01-14 2021-01-14 事件概率预测模型训练、事件概率预测方法及相关装置 Active CN112381338B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110049876.5A CN112381338B (zh) 2021-01-14 2021-01-14 事件概率预测模型训练、事件概率预测方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110049876.5A CN112381338B (zh) 2021-01-14 2021-01-14 事件概率预测模型训练、事件概率预测方法及相关装置

Publications (2)

Publication Number Publication Date
CN112381338A CN112381338A (zh) 2021-02-19
CN112381338B true CN112381338B (zh) 2021-07-27

Family

ID=74581853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110049876.5A Active CN112381338B (zh) 2021-01-14 2021-01-14 事件概率预测模型训练、事件概率预测方法及相关装置

Country Status (1)

Country Link
CN (1) CN112381338B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116894653B (zh) * 2023-08-16 2024-02-23 广州红海云计算股份有限公司 一种基于多预测模型联动的人事管理数据处理方法及***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102075352A (zh) * 2010-12-17 2011-05-25 北京邮电大学 一种网络用户行为预测的方法和装置
CN104504460A (zh) * 2014-12-09 2015-04-08 北京嘀嘀无限科技发展有限公司 预测叫车平台的用户流失的方法和装置
CN106682754A (zh) * 2015-11-05 2017-05-17 阿里巴巴集团控股有限公司 事件发生概率预测方法及装置
CN108491817A (zh) * 2018-03-30 2018-09-04 国信优易数据有限公司 一种事件检测模型训练方法、装置以及事件检测方法
CN110956296A (zh) * 2018-09-26 2020-04-03 北京嘀嘀无限科技发展有限公司 一种用户流失概率预测方法及装置
CN111564223A (zh) * 2020-07-20 2020-08-21 医渡云(北京)技术有限公司 传染病生存概率的预测方法、预测模型的训练方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106685674B (zh) * 2015-11-05 2020-01-10 华为技术有限公司 网络事件预测以及建立网络事件预测模型的方法和装置
CN109711534A (zh) * 2018-12-20 2019-05-03 树根互联技术有限公司 降维模型训练方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102075352A (zh) * 2010-12-17 2011-05-25 北京邮电大学 一种网络用户行为预测的方法和装置
CN104504460A (zh) * 2014-12-09 2015-04-08 北京嘀嘀无限科技发展有限公司 预测叫车平台的用户流失的方法和装置
CN106682754A (zh) * 2015-11-05 2017-05-17 阿里巴巴集团控股有限公司 事件发生概率预测方法及装置
CN108491817A (zh) * 2018-03-30 2018-09-04 国信优易数据有限公司 一种事件检测模型训练方法、装置以及事件检测方法
CN110956296A (zh) * 2018-09-26 2020-04-03 北京嘀嘀无限科技发展有限公司 一种用户流失概率预测方法及装置
CN111564223A (zh) * 2020-07-20 2020-08-21 医渡云(北京)技术有限公司 传染病生存概率的预测方法、预测模型的训练方法及装置

Also Published As

Publication number Publication date
CN112381338A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN109446430B (zh) 产品推荐的方法、装置、计算机设备及可读存储介质
Banasik et al. Sample selection bias in credit scoring models
CN114265979B (zh) 确定融合参数的方法、信息推荐方法和模型训练方法
CN111507521A (zh) 台区电力负荷预测方法及预测装置
CN108573358A (zh) 一种逾期预测模型生成方法及终端设备
CN105446988A (zh) 预测类别的方法和装置
CN113239914B (zh) 课堂学生表情识别及课堂状态评估方法、装置
CN114492279A (zh) 一种模拟集成电路的参数优化方法及***
CN112561320A (zh) 机构风险预测模型的训练方法、机构风险预测方法和装置
CN112365384B (zh) 目标事件结果指标权重、影响因素值确定方法及相关装置
CN112381338B (zh) 事件概率预测模型训练、事件概率预测方法及相关装置
CN114202174A (zh) 一种电价风险等级预警方法、装置及存储介质
CN117197559A (zh) 基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质
CN103763123A (zh) 一种网络健康状态的评估方法和装置
US11983633B2 (en) Machine learning predictions by generating condition data and determining correct answers
CN110929516A (zh) 文本的情感分析方法、装置、电子设备及可读存储介质
CN116029760A (zh) 消息推送方法、装置、计算机设备和存储介质
CN115757973A (zh) 推荐***的排序方法、装置、设备及可读存储介质
CN114493674A (zh) 一种广告点击率预测模型及方法
CN113868523A (zh) 推荐模型训练方法、电子设备及存储介质
CN112801362B (zh) 一种基于人工神经网络与lstm网络的学业预警方法
CN111753992A (zh) 筛选方法和筛选***
CN113362179B (zh) 交易数据的预测方法、装置、设备、存储介质及程序产品
CN109740671B (zh) 一种图像识别方法及装置
CN113469450B (zh) 一种数据分类方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant