CN116975580A

CN116975580A - 一种信息评估方法、装置及设备

Info

Publication number: CN116975580A
Application number: CN202310745106.3A
Authority: CN
Inventors: 丁霞; 王志文; 王海丰; 杨晶生; 边超; 霍巧弟; 徐冰; 卢莎; 隗斯诺; 邹刘征; 徐潇; 孟潇; 赵臻宇; 张飞
Original assignee: Beijing Zitiao Network Technology Co Ltd
Current assignee: Beijing Zitiao Network Technology Co Ltd
Priority date: 2023-06-21
Filing date: 2023-06-21
Publication date: 2023-10-31

Abstract

本申请公开一种信息评估方法、装置及设备，获取待评估信息以及待评估信息在信息特征字段下的字段值。将待评估信息在信息特征字段下的字段值输入预先训练的信息评估模型中，获取待评估信息为目标类型信息的信息评估概率。进而，获取信息特征字段中的至少一个关键特征字段，关键特征字段的字段值对信息评估概率的影响程度大于预设程度阈值。再基于待评估信息在关键特征字段下的字段值对得到的信息评估概率进行调整，重新获取待评估信息为目标类型信息的信息评估概率。如此，以影响程度较大的关键特征字段的字段值为调整依据，对信息评估模型输出的信息评估概率重新进行调整，能够将信息评估概率调整为更加准确的信息评估概率。

Description

一种信息评估方法、装置及设备

技术领域

本申请涉及信息处理技术领域，具体涉及一种信息评估方法、装置及设备。

背景技术

随着信息技术的快速发展，在一些场景中会根据需求收集一些信息。例如，在营销场景中，营销人员会收集线索信息，并基于收集到的线索信息挖掘消费者需求。

通常，需要对收集到的信息进行评估，以通过评估结果对信息进行筛选。例如，在营销场景中，会对收集到的线索信息进行质量评估。

目前，可通过模型训练的方式获得评估模型，再将要评估的信息输入评估模型中，评估模型便可输出针对该信息的评估结果。但是，该评估模型的评估准确性不高。

发明内容

有鉴于此，本申请提供一种信息评估方法、装置及设备，能够提高待评估信息的评估准确度。

为解决上述问题，本申请提供的技术方案如下：

第一方面，本申请提供一种信息评估方法，所述方法包括：

获取待评估信息以及所述待评估信息在信息特征字段下的字段值；

将所述待评估信息在信息特征字段下的字段值输入预先训练的信息评估模型中，获取所述信息评估模型输出的所述待评估信息为目标类型信息的信息评估概率；

获取所述信息特征字段中的至少一个关键特征字段；所述关键特征字段的字段值对所述信息评估概率的影响程度大于预设程度阈值；

根据所述待评估信息在所述关键特征字段下的字段值对所述信息评估概率进行调整，重新获取所述待评估信息为所述目标类型信息的信息评估概率。

第二方面，本申请提供一种信息评估装置，所述装置包括：

第一获取单元，用于获取待评估信息以及所述待评估信息在信息特征字段下的字段值；

输入单元，用于将所述待评估信息在信息特征字段下的字段值输入预先训练的信息评估模型中，获取所述信息评估模型输出的所述待评估信息为目标类型信息的信息评估概率；

第二获取单元，用于获取所述信息特征字段中的至少一个关键特征字段；所述关键特征字段的字段值对所述信息评估概率的影响程度大于预设程度阈值；

调整单元，用于根据所述待评估信息在所述关键特征字段下的字段值对所述信息评估概率进行调整，重新获取所述待评估信息为所述目标类型信息的信息评估概率。

第三方面，本申请提供一种电子设备，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现任一所述的信息评估方法。

第四方面，本申请提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现任一所述的信息评估方法。

由此可见，本申请具有如下有益效果：

本申请提供了一种信息评估方法、装置及设备，先获取待评估信息以及待评估信息在信息特征字段下的字段值。进而，将待评估信息在信息特征字段下的字段值输入预先训练的信息评估模型中，获取信息评估模型输出的待评估信息为目标类型信息的信息评估概率。该信息评估概率表示对待评估信息的评估结果。进一步，获取信息特征字段中的至少一个关键特征字段，关键特征字段的字段值对信息评估概率的影响程度大于预设程度阈值。因此，再基于待评估信息在关键特征字段下的字段值对得到的信息评估概率进行调整，重新获取待评估信息为目标类型信息的信息评估概率。如此，以影响程度较大的关键特征字段的字段值为调整依据，对信息评估模型输出的信息评估概率重新进行调整，能够将信息评估概率调整为更加准确的信息评估概率。

附图说明

图1为本申请实施例提供的一种示例性应用场景的框架示意图；

图2为本申请实施例提供的一种信息评估方法的流程图；

图3为本申请实施例提供的一种关键特征字段的权重的调整流程图；

图4为本申请实施例提供的一种信息评估装置的结构示意图；

图5为本申请实施例提供的一种电子设备的基本结构的示意图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。

为了便于理解和解释本申请实施例提供的技术方案，下面将先对本申请的背景技术进行说明。

可以理解的是，在使用本公开中各个实施例的技术方案之前，均会通过恰当的方式对所涉及的个人信息的类型、使用范围、使用场景等告知用户，并获得用户的授权。即，当本申请中的信息涉及用户的个人信息时，均是在获得用户的授权之后获取的。

例如，在响应于接收到用户的主动请求时，向用户发送提示信息，以明确的提示用户，其请求执行的操作将需要获取和使用到用户的个人信息。从而，使得用户可以根据提示信息来自主的选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。

作为一种可选的但非限定的实现方式，响应于接受到用户的主动请求，向用户发送提示信息的方式例如可以是弹窗的方式，弹窗中可以以文字的方式呈现提示信息。此外，弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。

可以理解的是，上述通知和获取用户授权过程仅是示意性的，不对本公开的实现方式构成限定，其他满足相关法律法规的方式也可应用于本公开的实现方式中。

随着信息技术的快速发展，在一些场景中会根据需求收集一些信息。例如，在营销场景中，营销人员会收集线索信息，并基于收集到的线索信息挖掘消费者需求。通常，需要对收集到的信息进行评估，以通过评估结果对信息进行筛选。例如，在营销场景中，会对刚收集到的线索信息进行质量评估。

其中，若刚收集到的信息暂时不能满足使用需求，可先将这部分信息存储下来，这部分信息会转化为存量信息。例如，在营销场景中，当刚收集到的线索信息表明客户暂不具备消费意向时，可先将该线索信息存储为存量线索信息。但是，存量信息可能会随着时间的变化而变化，信息也会从之前的不满足使用需求转变成满足使用需求。因此，也需要定期对存量信息进行评估。

目前，存在以下三种信息评估方式。

第一种，可人工设置评估规则，通过评估规则对信息进行评估。具体地，将信息与评估规则进行匹配，当信息命中评估规则时，便确定该信息的评估效果越好。

第二种，设置评估指标，通过评估指标对信息进行评估。具体地，按照信息在该评估指标下的结果对信息进行排序，排序越靠前表明该信息的评估效果越好。

但是，以上两种评估方式的设置和执行较为主观，会造成评估结果不准确。

第三种，可通过模型训练的方式获得评估模型，再将要评估的信息输入评估模型中，评估模型输出针对该信息的评估结果。但是，经申请人研究发现，在基于历史信息训练评估模型时，历史信息可能包括关键信息，这些关键信息对历史信息的评估结果影响程度较大，但是包括关键信息的历史信息在所有的历史信息中占比较少，较为稀疏。这会使得评估模型的学习不够充分，不能充分学习到这些关键信息，模型训练效果较差，进而训练得到的评估模型的评估准确度不高。

基于此，本申请实施例提供了一种信息评估方法、装置及设备，先获取待评估信息以及待评估信息在信息特征字段下的字段值。进而，将待评估信息在信息特征字段下的字段值输入预先训练的信息评估模型中，获取信息评估模型输出的待评估信息为目标类型信息的信息评估概率。该信息评估概率表示对待评估信息的评估结果。进一步，获取信息特征字段中的至少一个关键特征字段，关键特征字段的字段值对信息评估概率的影响程度大于预设程度阈值。关键特征字段的字段值即为待评估信息中的关键信息。因此，基于待评估信息在关键特征字段下的字段值对得到的信息评估概率进行调整，重新获取待评估信息为目标类型信息的信息评估概率。如此，以影响程度较大的关键特征字段的字段值为调整依据，对信息评估模型输出的信息评估概率重新进行调整，能够将信息评估概率调整为更加准确的信息评估概率。

可以理解的是，针对以上方案所存在的缺陷，均是申请人在经过实践并仔细研究后得出的结果。因此，上述问题的发现过程以及下文中本申请实施例针对上述问题所提出的解决方案，都应该是申请人在本申请过程中对本申请实施例做出的贡献。

为了便于理解本申请实施例提供的信息评估方法，下面结合图1所示的场景示例进行说明。参见图1所示，该图为本申请实施例提供的示例性应用场景的框架示意图。该信息评估方法可由终端设备或服务器实施，这里不进行限定。

在实际应用中，预先训练有信息评估模型。获取待评估信息以及待评估信息在信息特征字段下的字段值。

获取信息特征字段中的至少一个关键特征字段。关键特征字段的字段值为关键信息，通常，待评估信息中的关键信息较为稀疏。但是，关键特征字段的字段值对信息评估概率的影响程度大于预设程度阈值，即关键特征字段的字段值对信息评估概率的影响较大。信息特征字段中除关键特征字段以外的特征字段为普通特征字段。如图1所示，普通特征字段包括字段X1、字段X2、……、字段Xn，关键特征字段包括字段Y1、字段Y2、……、字段Yn。其中，n为正整数。则，待评估信息在信息特征字段下的字段值包括待评估信息在普通特征字段下的字段值以及待评估信息在关键特征字段下的字段值。

将待评估信息在信息特征字段下的字段值输入信息评估模型中，信息评估模型输出待评估信息为目标类型信息的信息评估概率，可用prob1进行表示。其中，“待评估信息为目标类型信息的信息评估概率”用于表示待评估信息的评估结果。

由于关键特征字段的字段值对待评估信息为目标类型信息的信息评估概率的影响较大，则可根据待评估信息在关键特征字段下的字段值对获得的信息评估概率进行调整(即图1中的调整环节)，重新获取待评估信息为目标类型信息的信息评估概率，可用prob2进行表示。其中，对信息评估概率进行调整包括增大信息评估概率或减小信息评估概率。

本领域技术人员可以理解，图1所示的框架示意图仅是本申请的实施方式可以在其中得以实现的一个示例。本申请实施方式的适用范围不受到该框架任何方面的限制。

为了便于理解本申请，下面结合附图对本申请实施例提供的一种信息评估方法进行说明。

参见图2所示，该图为本申请实施例提供的一种信息评估方法的流程图。如图2所示，该方法可以包括S201-S204：

S201：获取待评估信息以及待评估信息在信息特征字段下的字段值。

待评估信息为将要对其进行评估的信息。在本申请实施例中，根据场景的不同，信息可为不同类型的信息，这里不进行限定。例如，在营销场景中，信息具体为线索信息。具体地，营销部门会通过产品官网的注册页面、咨询页面等采集到大量的线索信息，或者从其他信息平台通过购买流量而获取线索信息。线索信息可指的是客户信息。又例，在信息安全场景中，信息还可为网络信息。

信息特征字段对应有字段值，字段值表示信息特征。获取一个信息之后，按照信息特征字段，可从信息中提取或推测得到信息特征字段对应的字段值。例如，信息特征字段为“xx名称”。以获得的信息1为例，从信息1中提取到的该信息特征字段对应的字段值为“名称1”，“名称1”即为“xx名称”下的信息特征。

在本申请实施例中，不限定信息特征字段的数量以及获取方式。信息特征字段可为固定字段，或根据实际情况进行更新。例如，在营销场景中，在注册时会设置一些需要填写的填写项。在填写项处对应填写的内容即为收集到的信息，而这些填写项则可作为信息特征字段。另外，还可根据填写项扩展一些其他相关的信息特征字段。例如，填写项为“xx名称”时，不仅可将“xx名称”作为一个信息特征字段，还可将与“xx名称”相关联的“xxx行业”作为一个信息特征字段。可以理解的是，若注册时增加或减少了一些填写项，信息特征字段则可适应性更新。

另外，信息还可划分为新收集到的信息或存量信息，则该步骤中的待评估信息可能是新收集到的信息，也可能是存量信息。其中，若刚收集到的信息暂时不能满足使用需求，可先将这部分信息存储下来，这部分信息会转化为存量信息。

例如，在营销场景中，一部分线索信息会在其创建时刻(或者获取时刻)就表明客户具备消费意向。而另一部分线索信息表明客户暂不具备消费意向，则可先将该线索信息存储为存量线索信息。其中，可通过营销人员与客户联系或通过客户属性与客户行为确定客户当下是否具备消费意向。如，当客户回复想先试用一下、需要时间和竞品做比较、暂时没有预算等时，表明客户暂不具备消费意向。

但是，存量线索信息可能会随着时间的变化而变化，存量线索信息也会从之前的“表明客户暂不具备消费意向”转变成“表明客户具备消费意向”。例如，在营销场景中，客户经过一定时间后触发了某种付费要求，则之前存储的存量信息会更新，更新后的存量信息包括“客户触发了某种付费要求”这一信息。客户触发了某种付费要求”这一信息表明客户具备消费意向。可知，在存储时，可存储存量线索信息的编号，则存量线索信息在更新前后，对应同一编号。

S202：将待评估信息在信息特征字段下的字段值输入预先训练的信息评估模型中，获取信息评估模型输出的待评估信息为目标类型信息的信息评估概率。

预先训练信息评估模型。作为一种可选示例，信息评估模型是根据训练信息集预先训练得到的。其中，训练信息集包括至少一个历史信息、每个历史信息在信息特征字段下的字段值以及每个历史信息的信息标签。可以认为训练信息集包括至少一条训练数据，每条训练数据包括一个历史信息、该历史信息在信息特征字段下的字段值以及该历史信息的信息标签。

可以理解的是，训练信息集中的历史信息可以是从收集到的所有历史信息中选取的部分历史信息，其余部分历史信息以及对应的信息标签可用于信息评估模型的测试/验证过程。其中，训练信息集中的历史信息可从收集到的所有历史信息中随机选取，也可按照预设规则进行选取，这里不限定预设规则。

当待评估信息为新收集到的信息时，在训练信息评估模型时，训练信息集中的历史信息具体为历史中新收集到的信息(即非历史存量信息)；当待评估信息为待评估存量信息时，在训练信息评估模型时，训练信息集中的历史信息具体为历史中存储的历史存量信息。即，在训练和应用信息评估模型时，输入模型的信息为同类型的信息。

在一种可能的实现方式中，本申请实施例提供了一种信息评估模型的训练过程，包括：

A1：将历史信息在信息特征字段下的字段值输入信息评估模型中，获取历史信息为目标类型信息的预测信息评估概率。

作为一种可选示例，信息评估模型可为机器学习模型，在本申请实施例中，不限定该机器学习模型的模型结构，例如可为梯度提升树模型、决策树模型或神经网络模型。

在该步骤中，历史信息为训练信息集中的历史信息。历史信息在信息特征字段下的字段值作为信息评估模型的输入，信息评估模型输出历史信息为目标类型信息的预测信息评估概率。

其中，预测信息评估概率表示对“历史信息为目标类型信息”的预测评估结果，预测信息评估概率通常为0-1之间的小数。本申请实施例不限定目标类型信息，可根据场景进行确定。例如，在营销场景下，历史信息具体为线索信息。此时，可对历史信息进行质量评估。则，目标类型信息可为“高质量线索信息”，历史信息为“高质量线索信息”的预测信息评估概率越高，表明该历史信息越可能是“高质量线索信息”。目标类型信息还可为“非高质量线索信息”，则历史信息为“非高质量线索信息”的信息评估概率越高，表明该历史信息越可能是“非高质量线索信息”，越不可能是“高质量线索信息”。其中，当满足质量评估条件时，可表明该信息的质量高(例如质量评估条件为信息能够促进产品销售时)，这里不进行信息质量高的评估方式限定。例如，当信息在某一评估指标上的值越大时，也可以表明该信息的质量越高。可以理解的是，在其他场景下，还可对待评估信息进行风险评估，当对待评估信息进行风险评估时，目标类型信息可为“有风险信息”或“无风险信息”，这里不再赘述。

A2：根据历史信息为目标类型信息的预测信息评估概率以及历史信息的信息标签，计算损失值。

历史信息的信息标签表示对“历史信息为目标类型信息”的真实评估结果，历史信息的信息标签可由人工打标获得。在实际应用中，当历史信息为营销场景中的线索信息时，可由营销人员与客户沟通后，根据沟通情况进行打标。

历史信息的信息标签可用0或1进行表示，表示信息评估模型的模型训练方式为常见的二分类模型训练。若信息标签为1，则表示历史信息为高质量线索信息；若信息标签为0，则表示历史信息为非高质量线索信息。

损失值用于表示“历史信息为目标类型信息的预测信息评估概率”与“历史信息的信息标签”之间的差距，即预测评估结果与真实评估结果之间的差距。具体实施时，可构建关于“历史信息为目标类型信息的预测信息评估概率”与“历史信息的信息标签”的损失函数。在获取预测信息评估概率以及信息标签之后，将其输入损失函数中，获取损失值。其中，损失函数可设置为交叉熵损失函数，可知不限于此，还可设置其他的损失函数。

A3：利用损失值训练信息评估模型，获取训练完成的信息评估模型。

利用损失值训练信息评估模型，即调整信息评估模型的模型参数。调整信息评估模型的模型参数之后，判断是否达到训练停止条件，若是，表示信息评估模型训练结束，获得训练完成的信息评估模型。若否，表示信息评估模型未训练结束，此时重新执行A1-A3，获取重新计算得到的损失值。基于重新计算得到的损失值再次调整信息评估模型的模型参数，直至达到训练停止条件。

作为一种可选示例，训练停止条件为达到最大训练次数或损失值达到预设范围。本申请实施例不对最大训练次数和预设范围进行限定，可根据实际情况进行设置。当达到训练停止条件时，表示损失值趋近于0，此时预测信息评估概率以及信息标签之间的差距足够小，信息评估模型的训练结束。

在一种可能的实施方式中，当待评估信息为待评估存量信息，训练信息集中的历史信息具体为历史存量信息时，要确保每个历史存量信息的字段值记录时间和信息标签记录时间在同一时间范围之内。即，将字段值和信息标签进行时间维度上的对齐。

例如，在T日对某个历史存量信息进行打标，记录此时这个历史存量信息的信息标签为L(T)，同时也需要在T日将这个历史存量信息在信息特征字段下各个字段值记录为V(T)。即，L(T)和V(T)的记录时间均为T日。类似地，在T+1日、T+2日等，还会对其他历史存量信息进行打标，相应的历史存量信息的字段值和信息标签记录为V(T+1)、L(T+1)以及V(T+2)、L(T+2)等。如果历史存量信息在T日被打上标签，将历史存量信息在T日的信息标签与历史存量信息在T日的字段值拼接起来，作为一条训练数据，称为“字段值和信息标签对齐”。由此，可进一步获取训练信息集。

其中，本申请实施例不限定“同一时间范围”。例如，“同一时间范围”可以为同一日，即按照“日”的维度记录字段值以及打标，即T日记录字段值、T日打标。“同一时间范围”还可为同一小时或者同一分钟，即字段值按照小时、分钟维度更新，则按照小时、分钟维度来记录字段值以及打标。这里仅作为示例进行说明，不构成限定。

参见表1，表1为在营销场景下的训练信息集，训练信息集中的历史信息为历史存量信息。如表1所示，信息特征字段的字段值记录时间和信息标签记录时间相同，体现了“字段值和信息标签对齐”。另外，在营销场景下，历史存量信息的信息标签可表示历史存量信息是否为高质量线索信息，信息标签可为1(即“是”)或0(即“否”)。另外，如表1所示，还可对训练信息集中的历史存量信息进行编号，如信息编号“1、2、3、……、9999”。

表1训练信息集

可以理解的是，存量信息可能随着时间的变化而变化。例如，信息特征字段为“客户是否触发了某种付费要求”，初始时的存量信息在该信息特征字段下的字段值为“否”，随着时间的变化，存量信息在该信息特征字段下的字段值可能更新为“是”，表示存量信息发生了变化。基于此，若当下时间为T日，存量信息的字段值记录时间和信息标签记录时间不同，如字段值为T日的最新值，信息标签为T-5日标注的，而T-5日的信息标签是以T-5日的字段值为依据进行标注的，这会导致T-5日的信息标签不能准确地用于表征T日字段值的真实评估结果。进而，基于T日的字段值和T-5日的信息标签来训练信息评估模型，会导致存在训练推理不一致的问题，使得训练得到的信息评估模型的信息评估准确度低。

而在本申请实施例中，历史存量信息的字段值记录时间和信息标签记录时间在同一时间范围之内，这能够保证历史存量信息的信息标签对历史存量信息的真实评估结果是准确的，不会存在模型训练推理不一致的问题，从而可以提高训练得到的信息评估模型的信息评估准确度。

基于上述内容，在获取预先训练的信息评估模型之后，将待评估信息在信息特征字段下的字段值作为预先训练的信息评估模型的输入，预先训练的信息评估模型能够输出待评估信息为目标类型信息的信息评估概率。

S203：获取信息特征字段中的至少一个关键特征字段；关键特征字段的字段值对信息评估概率的影响程度大于预设程度阈值。

在本申请实施例中，信息特征字段包括至少一个特征字段。按照类别划分，信息特征字段包括关键特征字段和普通特征字段。即信息特征字段中的部分特征字段为关键特征字段，其余特征字段为普通特征字段。

通常，关键特征字段的字段值对信息评估概率的影响程度大于预设程度阈值。即，以待评估信息为例，待评估信息在关键特征字段下的字段值对待评估信息为目标类型信息的信息评估概率的影响程度较大。其中，这里不限定预设程度阈值的具体大小。另外，关键特征字段的字段值可表示为关键信息。通常，关键信息在信息中的占比较小，较为稀疏。例如，上述训练信息集中包括关键信息的历史信息在所有历史信息的占比较小。又例，待评估信息中的关键信息(即待评估信息在关键特征字段的字段值)在待评估信息整体中的占比也较小。

以营销场景为例，关键特征字段可为“在最近7日是否浏览产品官网付费页面”，该关键特征字段的字段值包括“是”(即在最近7日浏览过产品官网付费页面)或者“否”(即在最近7日未浏览产品官网付费页面)。目标类型信息可为“高质量线索信息”。当关键特征字段的字段值为“是”(即在最近7日浏览过产品官网付费页面)时，表示用户更可能出现消费行为，则包括该关键特征的字段值的信息为高质量线索信息的信息评估概率较大。而当关键特征字段的字段值为“否”(即在最近7日浏览过产品官网付费页面)时，表示用户出现消费行为的可能性较小，则包括该关键特征的字段值的信息为高质量线索信息的信息评估概率较小。即，关键特征字段的字段值对信息评估概率的影响程度较大。

可以理解的是，本申请实施例不限定“影响程度”的实施方式，可以采用现有的或者未来出现的任一种能够计算或者获得影响程度的方法进行实施。

在实际应用中，可先获取信息特征字段中的至少一个关键特征字段，则信息特征字段中的其他特征字段为普通特征字段。可以理解的是，关键特征字段的字段值对信息评估概率的影响程度大于普通特征字段的字段值对信息评估概率的影响程度。

在一种可能的实现方式中，本申请实施例提供了一种基于训练信息集获取信息特征字段中的至少一个关键特征字段的具体实施方式，包括：

B1：计算第一信息集中涉及目标特征字段的信息在第一信息集中的数量占比，以及获取涉及目标特征字段的信息为目标类型信息的概率；目标特征字段为信息特征字段中的每一特征字段。

作为一种可选示例，第一信息集可为上述实施例中用于训练信息评估模型的训练信息集。第一信息集包括至少一个信息。可以理解的是，当待评估信息为待评估存量信息，训练信息集中的历史信息为历史存量信息时，B1-B2中第一信息集中的信息也为存量信息。

目标特征字段为信息特征字段中的每一特征字段，为了便于叙述，以目标特征字段为例进行说明。获取第一信息集中涉及目标特征字段的信息。其中，“涉及目标特征字段”表示信息中包括该目标特征字段的字段值。

数量占比为涉及目标特征字段的信息的数量与第一信息集中所有信息的数量的比值。“涉及目标特征字段的信息为目标类型信息的概率”为0-1之间的小数，即信息评估概率。在实际应用中，该概率值可由人工标注。例如，响应于在终端设备/服务器中对该概率值的输入，获取该概率值。应理解，人工提供的该概率值可为一个经验值，还可为通过其他信息评估模型(非本申请实施例提供的信息评估模型)得到的，这里不进行限定。

B2：当数量占比低于预设占比阈值和/或概率满足预设概率范围时，确定目标特征字段为关键特征字段。

预设占比阈值可预先设置，通常可设置预设占比阈值为1％、2％等数值。当数量占比低于预设占比阈值时，表示涉及目标特征字段的信息的数量较少，符合关键特征字段的字段值(即关键信息)较为稀疏的特性。

预设概率范围也预先设置，预设概率范围根据目标类型信息确定，预设概率范围和预设概率阈值相关，通常可设置预设概率阈值为20％、30％等数值。例如，在营销场景中，当目标类型信息为高质量线索信息时，预设概率范围为大于预设概率阈值。当目标类型信息为非高质量线索信息时，预设概率范围为小于或等于预设概率阈值。

当概率满足预设概率范围时，表示该目标特征字段对概率的影响较大，符合关键特征字段对信息评估概率的影响程度较大的特性。

为了使得确定的关键特征字段较为准确，可当数量占比低于预设占比阈值和概率满足预设概率范围均成立时，确定目标特征字段为关键特征字段。

参见表2，表2为在营销场景下将信息特征字段进行划分后，得到的普通特征字段和关键特征字段，仅作为示例进行说明。如表2所示，普通特征字段包括字段X1、字段X2、……、字段Xn，关键特征字段包括字段Y1、字段Y2、……、字段Yn。

应理解，在执行本申请实施例提供的信息评估方法时，不限定S203和S202的执行顺序。作为一种可选示例，可执行S203中的获取信息特征字段中的关键特征字段和普通特征字段，再执行S202。

在实际应用中，也可先获取信息特征字段中的关键特征字段和普通特征字段，再训练信息评估模型。将信息特征字段的字段值输入信息评估模型中，即将关键特征字段的字段值和普通特征字段的字段值均输入信息评估模型中。在营销场景中，“关键特征字段的字段值对信息评估概率的影响程度较大”表示为关键特征字段的字段值能够直接反映线索信息的质量高低。虽然普通特征字段的字段值无法直接反映线索信息的质量高低，但能丰富线索信息且覆盖率更高，在训练信息评估模型时，普通特征字段的字段值能辅助信息评估模型更全面、更好地的学习。因此，在训练信息评估模型时，同时基于关键特征字段的字段值和普通特征字段的字段值来训练信息评估模型。

表2信息特征字段

S204：根据待评估信息在关键特征字段下的字段值对信息评估概率进行调整，重新获取待评估信息为目标类型信息的信息评估概率。

由于“待评估信息在关键特征字段下的字段值”对“待评估信息为目标类型信息的信息评估概率”的影响程度较大。因而，以影响程度较大的关键特征字段的字段值为调整依据，对信息评估概率重新进行调整，将信息评估概率调整为更加准确的信息评估概率。

作为一种可选示例，根据待评估信息在关键特征字段下的字段值以及目标类型信息对信息评估概率进行调整。为了便于理解该可选示例，详见下面描述。

先考虑待评估信息在关键特征字段下的字段值。具体地，当待评估信息在关键特征字段下的字段值为期望字段值时，对信息评估概率进行调整。若待评估信息在关键特征字段下的字段值不为期望字段值时，则信息评估概率不变。其中，期望字段值对待评估信息为目标类型信息有促进作用，即若待评估信息在关键特征字段下的字段值为期望字段值，待评估信息为目标类型信息的可能性较大。可以理解的是，不同关键特征字段对应的期望字段值不同，根据关键特征字段本身进行确定。

进一步，再考虑目标类型信息。具体地，若对信息评估概率进行调整，则对信息评估概率的调整方向包括增大信息评估概率或减小信息评估概率。其中，调整方向可由目标类型信息进行确定，在实际应用中，可预先确定调整方向和目标类型信息的对应关系。例如，在营销场景中，当目标类型信息为高质量线索信息时，调整方向为增大信息评估概率。当目标类型信息为非高质量线索信息时，调整方向为减小信息评估概率。可以理解的是，本申请实施例不限定增加或减少概率的幅度，可根据实际情况进行确定。

例如，关键特征字段为“在最近7日是否浏览产品官网付费页面”，关键特征字段下的字段值为“是”(即在最近7日浏览过产品官网付费页面，此为期望字段值)或者“否”(即在最近7日未浏览产品官网付费页面)。当目标类型信息为高质量线索信息时，若该字段值为“否”，则不调整信息评估概率。若为“是”，则增大信息评估概率。当目标类型信息为非高质量线索信息时，若该字段值为“否”，则不调整信息评估概率。若为“是”，则减小信息评估概率。

可以理解的是，在该步骤中，若关键特征字段为多个且多个关键特征字段的字段值均为期望字段值时，则不限定作为调整依据的关键特征字段的数量。当确定关键特征字段的数量之后，也不限定具体由是哪个关键特征字段的字段值作为调整依据。例如，关键特征字段包括字段X1、字段X2、……、字段Xn。其中，字段X1、字段X2、字段X3对应的字段值均为对应的期望字段值。则可根据字段X1、字段X2、字段X3中的一个或多个的字段值来调整信息评估概率。作为一种可选示例，当作为调整依据的关键特征字段的数量越多时，对信息评估概率调整的幅度越大，可按照比例进行增加，也可不按比例进行增加，可根据实际情况进行设置。

基于上述S201-S204的相关内容可知，本申请提供了一种信息评估方法，先获取待评估信息以及待评估信息在信息特征字段下的字段值。进而，将待评估信息在信息特征字段下的字段值输入预先训练的信息评估模型中，获取信息评估模型输出的待评估信息为目标类型信息的信息评估概率。该信息评估概率表示对待评估信息的评估结果。进一步，获取信息特征字段中的至少一个关键特征字段，关键特征字段的字段值对信息评估概率的影响程度大于预设程度阈值。因此，再基于待评估信息在关键特征字段下的字段值对得到的信息评估概率进行调整，重新获取待评估信息为目标类型信息的信息评估概率。如此，以影响程度较大的关键特征字段的字段值为调整依据，对信息评估模型输出的信息评估概率重新进行调整，能够将信息评估概率调整为更加准确的信息评估概率。

在一种可能的实现方式中，本申请实施例提供了一种根据待评估信息在关键特征字段下的字段值对信息评估概率进行调整，重新获取待评估信息为目标类型信息的信息评估概率的具体实施方式，包括：

根据待评估信息在关键特征字段下的字段值以及关键特征字段的权重对信息评估概率进行调整，获取待评估信息的信息评估概率。

关键特征字段的权重用于表示对信息评估概率的调整幅度，通常为0-1之间的小数。不同权重，表示调整幅度不同。权重越大，表示对信息评估概率的调整幅度越大，权重越小，表示对信息评估概率的调整幅度越小。

作为一种可选示例，可预先设置权重和概率调整量的对应关系，则在实际对信息评估概率进行调整时，可根据权重，获取对应的概率调整量，再对信息评估概率进行调整。

作为另一种可选示例，权重本身可作为概率调整量。例如，当关键特征字段的字段值为对应的期望字段值时，若调整方向为增大信息评估概率，则可直接在待评估信息的信息评估概率的基础上，增加该关键特征字段对应的权重。若调整方向为减小信息评估概率，则也可直接在待评估信息的信息评估概率的基础上，减少该关键特征字段对应的权重。

基于上述内容，本申请实施例给出了一种在根据待评估信息在关键特征字段下的字段值以及关键特征字段的权重对信息评估概率进行调整，获取待评估信息的信息评估概率的具体实施方式，包括：

将待评估信息在关键特征字段下的字段值进行二值化，获取二值化结果，计算二值化结果与关键特征字段的权重的乘积，并计算各个乘积的和，获取结果值；

根据结果值与信息评估概率，重新确定为待评估信息为目标类型信息的信息评估概率。

其中，存在以下“根据结果值与信息评估概率，重新确定为待评估信息为目标类型信息的信息评估概率”的两种情况。

第一种，将结果值与信息评估概率的和，重新确定为待评估信息为目标类型信息的信息评估概率。即，prob2＝prob1+w1*Y1+······+wn*Yn。

其中，Y1、Y2、……、Yn的值具体为对每个关键特征字段的字段值进行二值化之后的二值化结果，为0或1。例如，当关键特征字段的字段值为对应的期望字段值时，可将其字段值用“1”进行表示；当关键特征字段的字段值不为对应的期望字段值时，可将其字段值用“0”进行表示。参数w1、w2、……、wn为每个关键特征字段的权重。prob2为重新获取的待评估信息为目标类型信息的信息评估概率。

可以理解的是，该公式成立的条件为调整方向为增大信息评估概率。

第二种，将信息评估概率与结果值的差值，重新确定为待评估信息为目标类型信息的信息评估概率。即，prob2＝prob1-w1*Y1+······+wn*Yn。

可以理解的是，该公式成立的条件为调整方向为减小信息评估概率。应理解，应根据目标类型信息来确定调整方向，进而选取对应的计算公式。

还可以理解的是，上述两个公式均为“将权重本身作为概率调整量”的公式表达方式。其中，Y1、Y2···Yn为作为信息评估概率的调整依据的关键特征字段的字段值，其可为全量的关键特征字段的字段值，可为部分关键特征字段的字段值。

从上述公式可知，当待评估信息命中了某个关键特征字段(即关键特征字段的字段值为期望字段值)，就增加信息评估概率(如w1*Y1中的Y1为1时，则prob2提高了w1*Y1)，信息评估概率的增加幅度由这个关键特征字段的权重决定。因此，该这个公式中是否命中关键特征由Yn的值决定，信息评估概率的增加幅度由wn决定，命中的关键特征字段越多，信息评估概率的增加幅度越大，prob2也会越高。由此，通过得到的关键特征字段的字段值能够使得信息评估概率更加准确，能够更准确地识别出为目标类型信息的待评估信息。prob2越高代表待评估信息为目标类型信息的可能性越大(例如在营销场景中，目标类型信息为高质量线索信息，则prob2越高，表示待评估信息的质量越高)。

作为一种可选示例，关键特征字段的权重可由人工输入，响应于在终端设备/服务器中对关键特征字段的权重的输入操作，获取关键特征字段的权重。在实际应用中，关键特征字段的权重可根据经验值获得。

作为另一种可选示例，获取第二信息集，第二信息集包括至少一个信息，确定第二信息集中涉及所述关键特征字段的信息。获取每个关键特征字段的权重，关键特征字段的权重与涉及关键特征字段的信息在第二信息集中的数量占比成负相关。即，涉及关键特征字段的信息在第二信息集中的数量占比越高，关键特征字段的权重越低。涉及关键特征字段的信息在第二信息集中的数量占比越低，关键特征字段的权重越高。即加大稀疏的关键特征字段的权重值，使得稀疏的关键特征字段的字段值对信息评估概率的调整作用更大，以改善关键信息稀疏所导致的信息评估概率不准的情况。

其中，第二信息集可以和第一信息集为同一信息集。作为一种可选示例，第二信息集可为上述实施例中用于训练信息评估模型的训练信息集。可以理解的是，当待评估信息为待评估存量信息，训练信息集中的历史信息为历史存量信息时，第二信息集中的信息也为存量信息。

当关键特征字段的权重与涉及关键特征字段的信息在第二信息集中的数量占比成负相关时，本申请实施例提供了一种详细的获取关键特征字段的权重的具体实施方式。

表3获取关键特征字段的权重所涉及的数据

参见表3，表3为获取关键特征字段的权重所涉及的数据。该数据中，包括第二信息集中的信息的信息标签、按照S202可获取的第二信息集中的信息的信息评估概率prob1、按照S203可获取的第二信息集中的信息在关键特征字段下的字段值。

基于表3的数据，在一种可能的实现方式中，本申请实施例提供了如下获取每个关键特征字段的权重的具体实施方式，包括：

S301-1：设置参数步长、目标数量以及关键特征字段的占比阈值，并对关键特征字段的权重进行初始化。

其中，参数步长为权重每次调整的调整量、目标数量为信息的筛选数量。可以理解的是，通常将关键特征字段的权重初始化为0。

S302-1：获取第二信息集，将第二信息集中的信息输入预先训练的信息评估模型中，获取信息的第一信息评估概率。

具体实施时，将第二信息集中的信息在信息特征字段下的字段值输入预先训练的信息评估模型中，获取信息的第一信息评估概率。其中，第一信息评估概率即为S202中获取的信息评估概率prob1。

S303：判断是否满足权重调整条件，若是，执行S304-1。

可以理解的是，本申请不限定权重调整条件，可根据实际情况进行确定。例如，在下面的实施例中，提供了两种权重调整条件的可选实施示例。

S304-1：若是，根据信息的第一信息评估概率、信息在关键特征字段下的字段值以及关键特征字段的权重，获取信息的第二信息评估概率，并获取第二信息评估概率最高的目标数量个信息。

信息的第二信息评估概率即为调整后的信息评估概率prob2。作为一种可选示例，prob2＝prob1+w1*Y1+······+wn*Yn(具体的公式根据实际情况确定)，即可按照该公式计算第二信息评估概率。

在获取每个信息的第二信息评估概率后，对各个信息的第二信息评估概率进行排序，获取第二信息评估概率最高的目标数量个信息。例如，当目标数量为K时，则在排序之后，选取前K个信息。

S305：计算目标数量个信息中，涉及关键特征字段的信息的占比；当占比小于对应的占比阈值时，将关键特征字段的权重与参数步长的和重新确定为关键特征字段的权重，当占比大于或等于对应的占比阈值时，关键特征字段的权重不变。

涉及关键特征字段的信息的占比即为第二信息集中涉及关键特征字段的信息在第二信息集的所有信息中的比值。当占比小于对应的占比阈值时，表示涉及关键特征字段的信息较为稀疏，此时需要增加该关键特征字段的权重。

在一个或多个实施例中，本申请还提供了权重调整条件的可选实施示例，并将权重调整条件的设置和更新过程融合到上述权重调整过程中，如下：

S301-2：在判断是否满足权重调整条件之前，还包括：设置准确度阈值、最大迭代次数，并对迭代次数进行初始化。

在该示例中，准确度阈值、最大迭代次数用于设置权重调整条件。可以理解的是，通常将迭代次数初始化为0。

S302-2：根据信息的第一信息评估概率与信息的信息标签，计算第一评估准确度，并利用第一评估准确度的值对第二评估准确度进行初始化。

可以理解的是，可以采用现有的或者未来出现的任一种准确度计算方法来计算第一评估准确度和第二评估准确度。评估准确度可以用来表示预测值与真实值相符合的程度。

S304-2：当满足权重调整条件时，还包括：根据信息的第二信息评估概率与信息的信息标签，计算第二评估准确度。

作为一种可选示例，权重调整条件为迭代次数小于或等于最大迭代次数，或者第一评估准确度与第二评估准确度的差值小于或等于准确度阈值。即根据迭代次数或者评估准确度来确定是否还需要对权重进行调整。

S306：当占比大于或等于对应的占比阈值时，关键特征字段的权重不变之后，还包括：更新迭代次数，并重新执行判断是否满足权重调整条件以及后续步骤，直至不满足权重调整条件。

可以理解的是，更新迭代次数，可继续执行新一次的权重调整。作为一种可选示例，迭代次数可在原有的迭代次数的基础上加一，以实现迭代次数的更新。

参见图3，图3为本申请实施例提供的一种关键特征字段的权重的调整流程图。如图3所示，结合上述内容，调整关键特征字段的权重的完整步骤可以包括S301-S306：

S301：设置准确度阈值、参数步长、最大迭代次数、目标数量以及关键特征字段的占比阈值，并对迭代次数以及关键特征字段的权重进行初始化。

可以理解的是，S301由S301-1和S301-2构成。

其中，准确度阈值可表示为auc_threshold，取值通常为一个接近于0的小数，比如0.001、0.002。参数步长可表示为delta，参数步长通常取值为一个接近于0的小数，比如0.01、0.05。最大迭代次数可表示为iter_max，取值为一个比较大的整数，比如50、100。目标数量可表示为K，取值为一个比较大的整数，比如1000、2000。对于每个关键特征字段Y1、Y2、……、Yn，分别设定其占比阈值，占比阈值分别表示为P1、P2、……、Pn，占比阈值取值通常为1％、5％、20％等。

迭代次数表示为iter，将迭代次数初始化为0，即iter＝0。对关键特征字段的权重进行初始化，即，令关键特征字段的权重w1、w2、……、wn初始化均为0。

S302：获取第二信息集，将第二信息集中的信息输入预先训练的信息评估模型中，获取信息的第一信息评估概率，根据信息的第一信息评估概率与信息的信息标签，计算第一评估准确度，并利用第一评估准确度的值对第二评估准确度进行初始化。

可以理解的是，S302由S302-1和S302-2构成。在获取信息的第一信息评估概率prob1之后，根据prob1和信息标签，计算二者的第一评估准确度。第一评估准确度用auc_base进行表示。利用第一评估准确度的值对第二评估准确度进行初始化，即令auc_prob2＝auc_base。其中，auc_prob2表示第二评估准确度，则auc_prob2的初始值为auc_base。

S303：判断是否满足权重调整条件；若是，执行S304。否则，结束。

其中，权重调整条件为迭代次数小于或等于最大迭代次数，或者第一评估准确度与第二评估准确度的差值小于或等于准确度阈值。即iter是否小于或等于iter_max，auc_base-auc_prob2是否小于或等于auc_threshold。

S304：根据信息的第一信息评估概率、信息在关键特征字段下的字段值以及关键特征字段的权重，获取信息的第二信息评估概率，根据信息的第二信息评估概率与信息的信息标签，计算第二评估准确度，并获取第二信息评估概率最高的目标数量个信息。

可以理解的是，S304由S304-1和S304-2构成。例如，可按照公式prob2＝prob1+w1*Y1+……+wn*Yn(具体的公式根据实际情况确定)，计算信息的第二信息评估概率prob2，并根据prob2和信息标签，重新计算二者的第二评估准确度auc_prob2。可以理解的是，重新计算得到的第二评估准确度auc_prob2覆盖了上述S302中的auc_prob2的初始值。

进而，将各个信息按照prob2从大到小排序，取前K个信息。

计算占比，令m依次取值1、2、……、n，m为正整数。对于每一个关键特征字段Ym，计算前K个信息中，涉及关键特征字段的信息的占比，占比分别记作percent_1、percent_2、……、percent_n。

更新w1、w2、……、wn值。令m依次取值1、2、……、n，当percent_m<Pm时，按照公式wm＝wm+delta来更新wm的值，若percent_m>＝Pm，则不更新wm的值。

S306：更新迭代次数，并重新执行S303以及后续步骤，直至不满足权重调整条件。

按照公式iter＝iter+1来更新迭代次数iter的值，并重新执行S303以及后续步骤，来调整关键特征字段的权重，直至不满足权重调整条件。

基于上述S301-S306可知，本申请实施例提供了一种获取每个关键特征字段的权重的具体实施方式，获取的每个关键特征字段的权重满足“关键特征字段的权重与涉及关键特征字段的信息在第二信息集中的数量占比成负相关”这一条件。

综上所述，本申请实施例提供了一种在营销场景下的S201-S204的应用实例，如下：

在该营销场景中，待评估的线索信息为存量线索信息。则不失一般性，假设在T+S日要对该待评估的线索信息进行质量评估。

首先，获取在T+S日，该存量线索信息在信息特征字段下的字段值，记作V(T+S)。进而，可将信息特征字段划分为普通特征字段X1、……、Xn和关键特征字段Y1、……、Yn。进而，V(T+S)也会被分为普通特征字段的字段值和关键特征字段的字段值。

将普通特征字段的字段值和关键特征字段的字段值(即信息特征字段下的字段值)输入信息评估模型中，获得存量线索信息的信息评估概率prob1，该存量线索信息的信息评估概率prob1用于表示该存量线索信息为高质量线索信息的可能性。

进而，进入信息评估概率prob1的调整阶段，按照公式prob2＝prob1+w1*Y1+……+wn*Yn，计算得到调整后的存量线索信息的信息评估概率prob2。

可以理解的是，可对多个存量线索信息进行同样的处理，就能得到多个存量线索信息各自的prob2。prob2即为存量线索信息的质量评估指标，prob2越高，表示存量线索信息成为“高质量线索信息”的可能性越大。

进一步，还可以将存量线索信息按照prob2进行从高到低排序，然后取前K个存量线索信息(K可取1000、2000等值)，则能够得到K条高质量存量线索信息。进而，营销人员便能够以prob2为依据确定存量线索信息的跟进优先级。

参见表4，表4为利用存量信息训练信息评估模型后得到的模型评估指标。模型评估指标包括准确度、精准率和F1分数。其中，存量信息包括两种，一种是在信息特征字段下的字段值的记录时间和存量信息的信息标签的记录时间未在同一时间范围之内的存量信息。另一种是在信息特征字段下的字段值的记录时间和存量信息的信息标签的记录时间在同一时间范围之内的存量信息(即本申请实施例提供的当信息具体为存量信息时的训练方式)。

从表4可知，由模型评估指标对比得到，通过本申请实施例提供的方式训练得到的信息评估模型的指标值更高。这是因为将存量信息的字段值和信息标签在时间维度上进行了对齐，解决了模型训练过程中训练推理不一致问题，从而提升了模型评估指标的指标值。

参见表5，表5为关键特征字段的占比结果。如表5所示，给出了“只用信息评估模型进行信息评估”的方法以及本申请实施例提供的“在利用信息评估模型进行信息评估之后，还对信息评估概率进行调整”的方法，以及两种方法下得到的准确度、两种方法下信息评估概率排序前1000的信息中命中关键特征字段的比例。

表4模型评估指标

表5占比结果

从表5可知，在与“只用信息评估模型进行信息评估”方法的准确度相当的情况下(例如相差不超过给定阈值0.002)，本申请实施例提供的“在利用信息评估模型进行信息评估之后，还对信息评估概率进行调整”的方法显著提升了前1000个信息中的“命中若干关键特征字段”的信息的占比，说明更好地体现这些关键特征字段对判定信息是否为目标类型信息(如营销场景中的高质量线索信息)的作用。同时，说明了通过本申请实施例提供的方法，使得最后获得的信息的信息评估概率更加准确。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于上述方法实施例提供的一种信息评估方法，本申请实施例还提供了一种信息评估装置，下面将结合附图对信息评估装置进行说明。由于本公开实施例中的装置解决问题的原理与本申请实施例上述信息评估方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

参见图4所示，该图为本申请实施例提供的一种信息评估装置的结构示意图。如图4所示，该信息评估装置包括：

在一种可能的实现方式中，所述信息评估模型是根据训练信息集训练得到的；所述训练信息集包括至少一个历史信息、每个所述历史信息在信息特征字段下的字段值以及每个所述历史信息的信息标签；

所述信息评估模型的训练过程，包括：

将所述历史信息在信息特征字段下的字段值输入信息评估模型中，获取所述历史信息为所述目标类型信息的预测信息评估概率；

根据所述历史信息为所述目标类型信息的预测信息评估概率以及所述历史信息的信息标签，计算损失值；

利用所述损失值训练所述信息评估模型，获取训练完成的所述信息评估模型。

在一种可能的实现方式中，当所述待评估信息为待评估存量信息时，所述历史信息为历史存量信息；每个所述历史存量信息的字段值记录时间和信息标签记录时间在同一时间范围之内。

在一种可能的实现方式中，所述信息特征字段包括至少一个特征字段，所述第二获取单元，包括：

第一计算子单元，用于计算第一信息集中涉及目标特征字段的信息在所述第一信息集中的数量占比，以及获取涉及所述目标特征字段的信息为所述目标类型信息的概率；所述目标特征字段为所述信息特征字段中的每一特征字段；

第一确定子单元，用于当所述数量占比低于预设占比阈值和/或所述概率满足预设概率范围时，确定所述目标特征字段为关键特征字段。

在一种可能的实现方式中，所述调整单元，包括：

调整子单元，用于根据所述待评估信息在所述关键特征字段下的字段值以及所述关键特征字段的权重对所述信息评估概率进行调整，获取所述待评估信息的信息评估概率。

在一种可能的实现方式中，所述调整子单元，包括：

第一获取子单元，用于将所述待评估信息在所述关键特征字段下的字段值进行二值化，获取二值化结果，计算所述二值化结果与所述关键特征字段的权重的乘积，并计算各个所述乘积的和，获取结果值；

第二确定子单元，用于根据所述结果值与所述信息评估概率，重新确定为所述待评估信息为所述目标类型信息的信息评估概率。

在一种可能的实现方式中，所述装置还包括：

第三获取单元，用于获取第二信息集，确定所述第二信息集中涉及所述关键特征字段的信息；

第四获取单元，用于获取每个所述关键特征字段的权重；所述关键特征字段的权重与涉及所述关键特征字段的信息在第二信息集中的数量占比成负相关。

在一种可能的实现方式中，所述装置还包括：第五获取单元；

所述第五获取单元，用于获取每个所述关键特征字段的权重；

所述第五获取单元，包括：

第一设置子单元，用于设置参数步长、目标数量以及所述关键特征字段的占比阈值，并对所述关键特征字段的权重进行初始化；

第二获取子单元，用于获取第二信息集，将所述第二信息集中的信息输入所述训练完成的预先训练的信息评估模型中，获取所述信息的第一信息评估概率；

判断子单元，用于判断是否满足权重调整条件，若是，根据所述信息的第一信息评估概率、所述信息在所述关键特征字段下的字段值以及所述关键特征字段的权重，获取所述信息的第二信息评估概率，并获取所述第二信息评估概率最高的目标数量个信息；

第二计算子单元，用于计算所述目标数量个信息中，涉及所述关键特征字段的信息的占比；当所述占比小于对应的占比阈值时，将所述关键特征字段的权重与所述参数步长的和重新确定为所述关键特征字段的权重，当所述占比大于或等于对应的占比阈值时，所述关键特征字段的权重不变。

在一种可能的实现方式中，所述第五获取单元还包括：

第二设置子单元，用于在所述判断是否满足权重调整条件之前，设置准确度阈值、最大迭代次数，并对迭代次数进行初始化；

第三计算子单元，用于根据所述信息的第一信息评估概率与所述信息的信息标签，计算第一评估准确度，并利用所述第一评估准确度的值对第二评估准确度进行初始化；

当满足所述权重调整条件时，所述第五获取单元还包括：

第四计算子单元，用于根据所述信息的第二信息评估概率与所述信息的信息标签，计算第二评估准确度；

所述权重调整条件为所述迭代次数小于或等于所述最大迭代次数，或者所述第一评估准确度与所述第二评估准确度的差值小于或等于所述准确度阈值；

所述第五获取单元还包括：

更新子单元，用于当所述占比大于或等于对应的占比阈值时，所述关键特征字段的权重不变之后，更新所述迭代次数，并重新执行所述判断是否满足权重调整条件以及后续步骤，直至不满足所述权重调整条件。

本申请在上述各方面提供的实现方式的基础上，还可以进行进一步组合以提供更多实现方式。

需要说明的是，本实施例中各个单元的具体实现可以参见上述方法实施例中的相关描述。本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。本申请实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。例如，上述实施例中，处理单元和发送单元可以是同一个单元，也可以是不同的单元。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

基于上述方法实施例提供的一种信息评估方法，本申请还提供一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述任一实施例所述的信息评估方法。

下面参考图5，其示出了适于用来实现本申请实施例的电子设备500的结构示意图。本申请实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(Personal Digital Assistant，个人数字助理)、PAD(portable androiddevice，平板电脑)、PMP(Portable Media Player，便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV(television，电视机)、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示，电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM503中，还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

通常，以下装置可以连接至I/O接口505：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507；包括例如磁带、硬盘等的存储装置508；以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本申请的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本申请的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置509从网络上被下载和安装，或者从存储装置508被安装，或者从ROM502被安装。在该计算机程序被处理装置501执行时，执行本申请实施例的方法中限定的上述功能。

本申请实施例提供的电子设备与上述实施例提供的信息评估方法属于同一发明构思，未在本实施例中详尽描述的技术细节可参见上述实施例，并且本实施例与上述实施例具有相同的有益效果。

基于上述方法实施例提供的一种信息评估方法，本申请实施例提供一种计算机可读介质，其上存储有计算机程序，其中，所述程序被处理器执行时实现如上述任一实施例所述的信息评估方法。

需要说明的是，本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

在一些实施方式中，客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol，超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信，并且可以与任意形式或介质的数字数据通信(例如，通信网络)互连。通信网络的示例包括局域网(“LAN”)，广域网(“WAN”)，网际网(例如，互联网)以及端对端网络(例如，ad hoc端对端网络)，以及任何当前已知或未来研发的网络。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备执行上述信息评估方法。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元/模块的名称在某种情况下并不构成对该单元本身的限定，例如，语音数据采集模块还可以被描述为“数据采集模块”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。

在本申请的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的***或装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种信息评估方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述信息评估模型是根据训练信息集训练得到的；所述训练信息集包括至少一个历史信息、每个所述历史信息在信息特征字段下的字段值以及每个所述历史信息的信息标签；

所述信息评估模型的训练过程，包括：

3.根据权利要求2所述的方法，其特征在于，当所述待评估信息为待评估存量信息时，所述历史信息为历史存量信息；每个所述历史存量信息的字段值记录时间和信息标签记录时间在同一时间范围之内。

4.根据权利要求1-3任一项所述的方法，其特征在于，所述信息特征字段包括至少一个特征字段，所述获取所述信息特征字段中的至少一个关键特征字段，包括：

计算第一信息集中涉及目标特征字段的信息在所述第一信息集中的数量占比，以及获取涉及所述目标特征字段的信息为所述目标类型信息的概率；所述目标特征字段为所述信息特征字段中的每一特征字段；

当所述数量占比低于预设占比阈值和/或所述概率满足预设概率范围时，确定所述目标特征字段为关键特征字段。

5.根据权利要求1-3任一项所述的方法，其特征在于，所述根据所述待评估信息在所述关键特征字段下的字段值对所述信息评估概率进行调整，重新获取所述待评估信息为所述目标类型信息的信息评估概率，包括：

根据所述待评估信息在所述关键特征字段下的字段值以及所述关键特征字段的权重对所述信息评估概率进行调整，获取所述待评估信息的信息评估概率。

6.根据权利要求5所述的方法，其特征在于，所述根据所述待评估信息在所述关键特征字段下的字段值以及所述关键特征字段的权重对所述信息评估概率进行调整，获取所述待评估信息的信息评估概率，包括：

将所述待评估信息在所述关键特征字段下的字段值进行二值化，获取二值化结果，计算所述二值化结果与所述关键特征字段的权重的乘积，并计算各个所述乘积的和，获取结果值；

根据所述结果值与所述信息评估概率，重新确定为所述待评估信息为所述目标类型信息的信息评估概率。

7.根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：

获取第二信息集，确定所述第二信息集中涉及所述关键特征字段的信息；

获取每个所述关键特征字段的权重；所述关键特征字段的权重与涉及所述关键特征字段的信息在第二信息集中的数量占比成负相关。

8.根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：获取每个所述关键特征字段的权重；

所述获取每个所述关键特征字段的权重，包括：

设置参数步长、目标数量以及所述关键特征字段的占比阈值，并对所述关键特征字段的权重进行初始化；

获取第二信息集，将所述第二信息集中的信息输入所述预先训练的信息评估模型中，获取所述信息的第一信息评估概率；

判断是否满足权重调整条件，若是，根据所述信息的第一信息评估概率、所述信息在所述关键特征字段下的字段值以及所述关键特征字段的权重，获取所述信息的第二信息评估概率，并获取所述第二信息评估概率最高的目标数量个信息；

计算所述目标数量个信息中，涉及所述关键特征字段的信息的占比；当所述占比小于对应的占比阈值时，将所述关键特征字段的权重与所述参数步长的和重新确定为所述关键特征字段的权重，当所述占比大于或等于对应的占比阈值时，所述关键特征字段的权重不变。

9.根据权利要求8所述的方法，其特征在于，在所述判断是否满足权重调整条件之前，所述方法还包括：

设置准确度阈值、最大迭代次数，并对迭代次数进行初始化；

根据所述信息的第一信息评估概率与所述信息的信息标签，计算第一评估准确度，并利用所述第一评估准确度的值对第二评估准确度进行初始化；

当满足所述权重调整条件时，所述方法还包括：

根据所述信息的第二信息评估概率与所述信息的信息标签，计算第二评估准确度；

所述当所述占比大于或等于对应的占比阈值时，所述关键特征字段的权重不变之后，所述方法还包括：

更新所述迭代次数，并重新执行所述判断是否满足权重调整条件以及后续步骤，直至不满足所述权重调整条件。

10.一种信息评估装置，其特征在于，所述装置包括：

11.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-9中任一所述的信息评估方法。

12.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-9中任一所述的信息评估方法。