CN114757275A - 业务规则提取方法及装置、存储介质及电子设备 - Google Patents
业务规则提取方法及装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN114757275A CN114757275A CN202210365767.9A CN202210365767A CN114757275A CN 114757275 A CN114757275 A CN 114757275A CN 202210365767 A CN202210365767 A CN 202210365767A CN 114757275 A CN114757275 A CN 114757275A
- Authority
- CN
- China
- Prior art keywords
- model
- business
- target
- determining
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种业务规则提取方法及装置、存储介质及电子设备,可应用于人工智能领域或金融领域,该方法包括:当需要提取业务模型的业务规则时,确定业务模型对应的多个特征属性和每个特征属性对应的重要度;所述业务模型为基于机器学习的模型;依据各个特征属性对应的重要度,在各个特征属性中确定多个目标特征属性;依据各个目标特征属性和预设的规则提取策略,确定业务模型对应的业务规则。应用本发明的方法,可对基于机器学习的业务模型进行业务规则的提取,使业务人员可以获悉模型的业务规则,有利于业务人员调整业务重心,方便业务人员对业务模型进行优化,可提升用户体验。
Description
技术领域
本发明涉及人工智能技术领域,特别是涉及一种业务规则提取方法及装置、存储介质及电子设备。
背景技术
随着人工智能技术的发展,在企业机构的各个业务领域中,已广泛应用基于机器学习的模型满足业务需求。例如在产品营销的场景下,采用基于机器学习的模型作为营销模型。
在业务运营过程中,业务人员通常需要根据业务模型的业务处理逻辑,即业务规则,调整业务重心,不断对业务模型进行优化,使得业务模型更加符合业务需求。
而基于机器学习的模型与基于规则的传统模型不同,基于机器学习的模型是通过训练得到的,具有一定的黑盒性。目前,在采用基于机器学习的模型作为业务模型的情况下,业务人员无法获悉模型的业务规则,不利于业务人员调整业务重心,不便对业务模型进行优化,用户体验较差。
发明内容
有鉴于此,本发明实施例提供了一种业务规则提取方法,以解决业务人员无法获悉基于机器学习得到的业务模型的业务规则,不利于业务人员调整业务重心,不便对业务模型进行优化的问题。
本发明实施例还提供了一种业务规则提取装置,用以保证上述方法实际中的实现及应用。
为实现上述目的,本发明实施例提供如下技术方案:
一种业务规则提取方法,包括:
当需要提取业务模型的业务规则时,确定所述业务模型对应的多个特征属性和每个所述特征属性对应的重要度;所述业务模型为基于机器学习的模型;
依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性;
依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则。
上述的方法,可选的,所述依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性,包括:
确定所述业务模型对应的预测准确率;
确定所述业务模型对应的特征比例,所述特征比例为预设准确率阈值与所述预测准确率的比值;
按照各个所述特征属性对应的重要度由高到低的顺序,在所述多个特征属性中按顺序确定多个第一特征属性;所述多个第一特征属性对应的重要度比重大于或等于所述特征比例,所述重要度比重为各个所述第一特征属性对应的重要度分值的总和与各个所述特征属性对应的重要度分值的总和的比值;
将每个所述第一特征属性作为所述目标特征属性。
上述的方法,可选的,所述依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则,包括:
获取所述业务模型对应的模型文件;
确定所述业务模型的模型类型是否为线性模型;
若所述业务模型的模型类型为所述线性模型,则对所述模型文件进行参数解析,获得所述业务模型对应的多个模型参数;
依据各个所述模型参数,确定所述业务模型对应的多项式表达式;
依据所述多个目标特征属性对所述多项式表达式进行删减,得到删减后的多项式表达式,并将所述删减后的多项式表达式作为所述业务模型对应的业务规则。
上述的方法,可选的,所述依据所述多个目标特征属性对所述多项式表达式进行删减,包括:
在所述多项式表达式中,确定每个所述目标特征属性对应的目标项;
将所述多项式表达式中,各个所述目标项之外的项删除,以对所述多项式表达式进行删减。
上述的方法,可选的,还包括:
若所述业务模型的模型类型并非所述线性模型,则确定所述业务模型的模型类型为树模型,并对所述模型文件进行条件解析,获得所述业务模型对应的多个条件表达式;
对所述多个条件表达式进行筛选与合并操作,获得多个目标条件表达式,并将所述多个目标条件表达式作为所述业务模型对应的业务规则。
上述的方法,可选的,所述对所述多个条件表达式进行筛选与合并操作,获得多个目标条件表达式,包括:
在所述多个条件表达式中,确定每个所述目标特征属性对应的条件表达式集合,每个所述条件表达式集合中包含至少一个所述条件表达式;
判断每个所述目标特征属性对应的条件表达式集合中是否仅包含一个条件表达式;
对于每个所述目标特征属性,若该目标特征属性对应的条件表达式集合中仅包含一个条件表达式,则将该条件表达式作为所述目标条件表达式;
对于每个所述目标特征属性,若该目标特征属性对应的条件表达式集合中包含多个条件表达式,则将该条件表达式集合中的各个条件表达式进行合并,得到合并表达式,并将所述合并表达式作为所述目标条件表达式。
上述的方法,可选的,所述依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则,包括:
获取所述业务模型对应的训练集,所述训练集包括多个训练样本,每个所述训练样本包含每个所述特征属性对应的特征数据;
对所述训练集中的各个训练样本进行特征剔除处理,得到每个所述训练样本对应的目标特征样本,每个所述目标特征样本包含其对应的训练样本中每个所述目标特征属性对应的特征数据;
基于各个所述目标特征样本对预构建的线性模型进行训练,将完成训练的线性模型作为规则模型;
获取所述规则模型的模型参数,并依据所述规则模型的模型参数,确定所述规则模型的多项式表达式;
将所述规则模型的多项式表达式作为所述业务模型对应的业务规则。
一种业务规则提取装置,包括:
第一确定单元,用于当需要提取业务模型的业务规则时,确定所述业务模型对应的多个特征属性和每个所述特征属性对应的重要度;所述业务模型为基于机器学习的模型;
第二确定单元,用于依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性;
第三确定单元,用于依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则。
一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如上述的业务规则提取方法。
一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如上述的业务规则提取方法。
基于上述本发明实施例提供的一种业务规则提取方法,当需要提取业务模型的业务规则时,确定所述业务模型对应的多个特征属性和每个所述特征属性对应的重要度;所述业务模型为基于机器学习的模型;依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性;依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则。应用本发明实施例提供的方法,可对基于机器学习的业务模型进行业务规则的提取,使业务人员可以获悉模型的业务规则,有利于业务人员调整业务重心,方便业务人员对业务模型进行优化,可提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种业务规则提取方法的方法流程图;
图2为本发明实施例提供的一种业务规则提取方法的又一方法流程图;
图3为本发明实施例提供的一种业务规则提取方法的另一方法流程图;
图4为本发明实施例提供的一种业务规则提取装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
需要说明的是,本发明提供的业务规则提取方法及装置、存储介质及电子设备可应用于人工智能领域或金融领域。上述仅为示例,并不对本发明提供的业务规则提取方法及装置、存储介质及电子设备的应用领域进行限定。
本发明实施例提供了一种业务规则提取方法,所述方法可应用于业务规则提取***,其执行主体可以为***的处理器,所述方法的方法流程图如图1所示,包括:
S101:当需要提取业务模型的业务规则时,确定所述业务模型对应的多个特征属性和每个所述特征属性对应的重要度;所述业务模型为基于机器学习的模型;
本发明实施例提供的方法中,当需要提取基于机器学习的业务模型的业务规则时,可以通过前端向业务规则提取***发送对应的触发指令。当***服务器接收到该指令时,可确定待提取业务规则的业务模型对应的各个特征属性,即该业务模型的输入数据中包含的特征,例如年龄、性别、学历等等,由实际的业务情况确定。具体可以预先配置业务模型的相关信息,通过读取预先存储的相关信息得到各个特征属性和每个特征属性对应的重要度,每个特征属性对应的重要度指的是业务模型完成训练后,其处理逻辑中各个特征属性对应的特征数据的重要程度,可通过分析工具对业务模型进行分析得到。
S102:依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性;
本发明实施例提供的方法中,可以按照各个特征属性对应的重要度由高到低的顺序,在各个特征属性中确定多个目标特征属性,各个目标特征属性是重要度较高的特征属性。
S103:依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则。
本发明实施例提供的方法中,可以预先设置规则提取策略,通过预设的规则提取策略和目标特征属性,对业务模型进行业务规则的提取,提取得到的业务规则中包含各个目标特征属性的相关处理逻辑。具体的,可以通过对模型文件进行解析,解析得到初始的规则描述,并基于各个目标特征属性对初始的规则描述进行删减,以得到业务规则。
基于本发明实施例提供的方法,当需要提取基于机器学习的业务模型的业务规则时,确定业务模型对应的多个特征属性和每个特征属性对应的重要度;依据各个特征属性对应的重要度,在各个特征属性中确定多个目标特征属性;依据各个目标特征属性和预设的规则提取策略,确定业务模型对应的业务规则。应用本发明实施例提供的方法,可对基于机器学习的业务模型进行业务规则的提取,使业务人员可以获悉模型的业务规则,有利于业务人员调整业务重心,方便业务人员对业务模型进行优化,可提升用户体验。其次,能够使业务人员理解模型效果的原因,提高模型的可信度。
为了更好地说明本发明实施例提供的方法,在图1所示方法的基础上,本发明实施例提供了又一种业务规则提取方法,参考图2所示流程图,本发明实施例提供的方法中,步骤S102中提及的依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性的过程,包括:
S201:确定所述业务模型对应的预测准确率;
本发明实施例提供的方法中,可以通过业务模型在训练学习阶段的训练效果,确定业务模型对应的预测准确率,也就是业务模型的输出结果的准确性。
S202:确定所述业务模型对应的特征比例,所述特征比例为预设准确率阈值与所述预测准确率的比值;
本发明实施例提供的方法中,可以根据实际的业务需求,预先设置一个预设准确率阈值,也就是业务模型需要达到的准确率的最低值。可将预设的准确率阈值与业务模型对应的预测准确率相除,将两者的比值作为业务模型对应的特征比例。
S203:按照各个所述特征属性对应的重要度由高到低的顺序,在所述多个特征属性中按顺序确定多个第一特征属性;所述多个第一特征属性对应的重要度比重大于或等于所述特征比例,所述重要度比重为各个所述第一特征属性对应的重要度分值的总和与各个所述特征属性对应的重要度分值的总和的比值;
本发明实施例提供的方法中,按照各个特征属性对应的重要度由高到低的顺序,对各个特征属性进行排序,按照排列顺序从前往后依次选取特征属性,将选取的特征属性视为第一特征属性。选取的特征属性的数量以选取的特征属性的重要度分值为参考。
本发明实施例提供的方法中,每个特征属性对应的重要度是以重要度分值表征的,重要度分值越高,对应的重要度亦越高。可预先计算所有特征属性对应的重要度分值的总和,将该总和作为分值总和。在选取第一特征属性的过程中,实时将选取的所有特征属性对应的重要度分值相加,并将相加的总和与上述分值总和相除,得到实时重要度比重,并将实时重要度比重与步骤S202中确定的特征比例相比较,若当前的实时重要度比重小于该特征比例,则继续选取下一个特征属性,直至当前的实时重要度比重大于或等于该特征比例后,结束特征属性的选取,将当前选取得到的每个特征属性作为第一特征属性。也就是按顺序选取得到N个第一特征属性,这N个第一特征属性对应的重要度分值的总和,与所有特征属性对应的重要度分值的总和的比值为A,业务模型对应的特征比例为B,A≥B,而前(N-1)个特征属性对应的重要度分值的总和与所有特征属性对应的重要度分值的总和的比值为C,而C小于B。
S204:将每个所述第一特征属性作为所述目标特征属性。
本发明实施例提供的方法中,将每个第一特征属性作为目标特征属性,以得到多个目标特征属性。
需要说明的是,本发明实施例提供的方法中以预测准确率为参考要素确定目标特征属性,仅是为了更好地说明本发明的方法所提供的一个具体实施例,在实际的应用过程中,可以采用其他指标作为参考要素用于确定目标特征属性,可以选取出重要性相对较高的特征属性作为目标特征属性即可,不影响本发明实施例提供的方法实现功能。
进一步的,在图1所示方法的基础上,本发明实施例提供了又一种业务规则提取方法,参考图3所示流程图,本发明实施例提供的方法中,步骤S103中提及的依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则的过程,包括:
S301:获取所述业务模型对应的模型文件;
本发明实施例提供的方法中,可以从预设的存储位置中读取业务模型的模型文件。
S302:确定所述业务模型的模型类型是否为线性模型;
本发明实施例提供的方法中,业务模型是基于一定的算法原理构建的,其具有对应的模型类型,例如树模型或线性模型等等。每类模型具有其对应的业务规则的规则提取方式,可以根据每类模型的算法原理逻辑进行设置。若业务模型的模型类型为线性模型,则进入步骤S303。
S303:若所述业务模型的模型类型为所述线性模型,则对所述模型文件进行参数解析,获得所述业务模型对应的多个模型参数;
本发明实施例提供的方法中,当业务模型为线性模型时,其模型文件中会记载该业务模型的各个模型参数。可对模型文件进行解析,得到业务模型的各个模型参数。
S304:依据各个所述模型参数,确定所述业务模型对应的多项式表达式;
本发明实施例提供的方法中,线性模型的处理逻辑可以基于线性的多项式进行表征。可以确定业务模型对应的原理多项式,将业务模型对应的各个模型参数代入该原理多项式,可以得到该业务模型对应的多项式表达式。
S305:依据所述多个目标特征属性对所述多项式表达式进行删减,得到删减后的多项式表达式,并将所述删减后的多项式表达式作为所述业务模型对应的业务规则。
本发明实施例提供的方法中,业务模型对应的多项式表达式中包含各个特征属性的相关数据项。可以根据各个目标特征属性对业务模型对应的多项式表达式进行删减。也就是将多项式表达式中各个目标特征属性的相关项保留,而将此外的其他特征属性的相关项删除,得到删减后的多项式表达式,并将删减后的多项式表达式作为业务模型对应的业务规则。删减后的多项式表达式中包含各个目标特征属性的相关项。
进一步的,在上述实施例提供的方法的基础上,本发明实施例提供的方法中,步骤S305中提及的依据所述多个目标特征属性对所述多项式表达式进行删减的过程,包括:
在所述多项式表达式中,确定每个所述目标特征属性对应的目标项;
将所述多项式表达式中,各个所述目标项之外的项删除,以对所述多项式表达式进行删减。
本发明实施例提供的方法中,多项式表达式中包含多个数据项。可以在多项式表达式的各个数据项中,确定每个目标特征属性对应的目标项,也就是包含目标特征属性参数的数据项。将多项式表达式中的各个目标项予以保留,而将包含非目标特征属性的特征属性参数的数据项删除,实现对多项式表达式的删减。也可以理解为,确定多项式表达式中每个数据项对应的特征属性,对于对应的特征属性为目标特征属性的数据项予以保留,而将对应的特征属性为非目标特征属性的数据项删除。
在图3所示方法的基础上,本发明实施例提供的方法中,还包括:
若所述业务模型的模型类型并非所述线性模型,则确定所述业务模型的模型类型为树模型,并对所述模型文件进行条件解析,获得所述业务模型对应的多个条件表达式;
本发明实施例提供的方法中,涉及的模型类型主要有两类,即线性模型和树模型。若当前的业务模型的模型类型并非线性模型,则确定业务模型的模型类型为树模型。对模型文件进行解析,可以得到多个特征树,根据特征数的***阈值,可解析得到多个条件表达式,例如“if……else……”形式的表达式。
需要说明的是,本发明实施例提供的方法仅是为了更好地说明本发明提供的方法所提供的一个具体实施例,在具体的实现过程中,模型类型不限于线性模型和树模型,还可以包含其他的类型,可以进一步对模型类型进行判断,根据实际的模型类型确定规则提取方式。
对所述多个条件表达式进行筛选与合并操作,获得多个目标条件表达式,并将所述多个目标条件表达式作为所述业务模型对应的业务规则。
本发明实施例提供的方法中,可以根据各个目标特征属性对各个条件表达式进行筛选合并,在各个条件表达式中筛选出与目标特征属性相关联的各个条件表达式,还可以对筛选出来的各个条件表达式进行合并,得到各个目标条件表达式,将各个目标条件表达式作为业务模型对应的业务规则。
进一步的,在上述实施例提供的方法的基础上,本发明实施例提供的方法中,所述对所述多个条件表达式进行筛选与合并操作,获得多个目标条件表达式的过程,包括:
在所述多个条件表达式中,确定每个所述目标特征属性对应的条件表达式集合,每个所述条件表达式集合中包含至少一个所述条件表达式;
本发明实施例提供的方法中,可以根据各个目标特征属性在各个条件表达式中确定出各个条件表达式集合,每个条件表达式集合对应的一个目标特征属性,每个目标特征属性对应的条件表达式集合中则包含与该目标特征属性相关联的条件表达式,可以是判断条件中包含该目标特征属性的条件表达式。
判断每个所述目标特征属性对应的条件表达式集合中是否仅包含一个条件表达式;
本发明实施例提供的方法中,确定每个条件表达式集合中的条件表达式的数量,以确定每个条件表达式集合中是否仅包含一个条件表达式,还是包含多个条件表达式。
对于每个所述目标特征属性,若该目标特征属性对应的条件表达式集合中仅包含一个条件表达式,则将该条件表达式作为所述目标条件表达式;
对于每个所述目标特征属性,若该目标特征属性对应的条件表达式集合中包含多个条件表达式,则将该条件表达式集合中的各个条件表达式进行合并,得到合并表达式,并将所述合并表达式作为所述目标条件表达式。
本发明实施例提供的方法中,可以根据条件表达式中包含的条件表达式的数量,进一步对条件表达式进行合并。具体的,若条件表达式集合中仅包含一个条件表达式,则将该条件表达式集合中包含的条件表达式作为一个目标条件表达式。若条件表达式集合中包含多个条件表达式,则判断这各个条件表达式中是否存在可以合并的条件表达式,若存在可以合并的条件表达式,则将可以合并的各个条件表达式进行合并,将合并得到的条件表达式作为一个目标条件表达式。如果条件表达式集合中不存在可以合并的条件表达式,或是存在可合并的条件表达式之外的条件表达式,则将这些条件表达式均作为目标条件表达式。例如目标特征属性对应的条件表达式集合中包含条件表达式1和条件表达式2,条件表达式1的判断条件为该目标特征属性的特征数据大于第一阈值,条件表达式2的判断条件为该目标特征属性的特征数据大于第二阈值,所述第一阈值大于所述第二阈值,那么可以将条件表达式1和条件表达式2合并为判断条件为该目标特征属性的特征数据大于第二阈值的条件表达式。
本发明实施例提供的方法中的筛选与合并的过程,可以理解为,将各个条件表达式中,与目标特征属性相关联的各个条件表达式筛选出来,在筛选得到的各个条件表达式中,判断是否存在可以相互合并的表达式,若存在可以相互合并的表达式,则将可以相互合并的各个表达式合并为一个表达式,将合并得到的表达式作为目标条件表达式,而不能相互合并的条件表达式亦分别作为目标条件表达式,以得到各个目标条件表达式。
为了更好地说明本发明实施例提供的方法,在图1所示方法的基础上,本发明实施例提供了又一种业务规则提取方法,本发明实施例提供的方法中,步骤S103中提及的依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则的过程,包括:
获取所述业务模型对应的训练集,所述训练集包括多个训练样本,每个所述训练样本包含每个所述特征属性对应的特征数据;
本发明实施例提供的方法中,可以通过构建一个线性模型来提取业务规则。业务模型是一个基于机器学习得到的模型,在其构建过程中会采用预设的训练集对其进行训练。可以获取业务模型对应的训练集。
对所述训练集中的各个训练样本进行特征剔除处理,得到每个所述训练样本对应的目标特征样本,每个所述目标特征样本包含其对应的训练样本中每个所述目标特征属性对应的特征数据;
本发明实施例提供的方法中,可以将训练集中目标特征属性之外的特征属性所对应的特征数据剔除,具体的,将每个训练样本中每个目标特征属性对应的特征数据保留,将其他特征属性对应的特征数据剔除,将经过特征数据剔除处理的训练样本作为一个目标特征样本。
基于各个所述目标特征样本对预构建的线性模型进行训练,将完成训练的线性模型作为规则模型;
本发明实施例提供的方法中,可基于原理多项式预先构建一个线性模型,例如逻辑回归的线性模型。通过各个目标特征样本对该线性模型进行训练,将完成训练的线性模型视为表征业务规则逻辑的规则模型。
获取所述规则模型的模型参数,并依据所述规则模型的模型参数,确定所述规则模型的多项式表达式;
将所述规则模型的多项式表达式作为所述业务模型对应的业务规则。
本发明实施例提供的方法中,可以通过解析规则模型的模型文件,获取该规则模型的模型参数,并将该规则模型的模型参数代入其对应的原理多项式,可以得到该规则模型的多项式表达式,将该多项式表达式作为业务模型对应的业务规则。规则模型的模型参数可以包含多个参数。
为了更好地说明本发明实施例提供的方法,接下来对本发明实施例提供的业务规则提取方法作进一步举例说明。本发明实施例提供的方法可应用于业务规则提取***,该***可以由模型解析模块和规则优化模块组成,模块的主要功能:
模型解析模块:对机器学习的模型文件进行解析,基于模型的参数得到模型预测的初始规则集。
规则优化模块:基于模型的特征重要性和业务阈值筛选出主要特征,对主要特征的规则集按照最大化原则进行合并优化,提取出简洁易接受的业务规则。
机器学习的模型主要分为线性模型和树模型。本发明实施例提供的业务规则提取过程,主要包括:
对于线性模型,如基于逻辑回归的模型,在训练完成后,将训练参数带入多项式,可得到模型的多项式表示形式。对于树模型,对模型文件进行解析,得到多颗进行不断***特征树,根据***阈值,将模型文件转换为“if…else…”形式的表达式。
业务根据应用场景的需求,设置一个最低的预测准确概率p1,如模型的预测准确概率为p,即模型的裁剪比例α=p1/p。对于模型,可以得到其对应的特征重要性矩阵,按照从高到低排序,取前n个特征,使得特征重要性分数占总分数的比例β刚好满足β>α。
对于线性模型,从多项式中删除n个特征以外的特征,即为最终的规则;对于树模型,从“if…else…”表达式中删除n个特征以外的特征,当同个特征存在于多个if条件中时,将存在相同特征的多个if条件,合并为一个较大的范围,对判断条件进行简化,最终得到一个相对简单的业务规则。
可选的,另一种业务规则的提取过程,具体包括:按照上述特征筛选过程得到前n个特征后,剔除模型的训练集中的其他特征,使用逻辑回归这种线性模型进行训练,再从训练结果中得到多项式的参数,进而得到最终的业务规则。
本发明实施例提供的方法,通过对机器学习模型文件的解析,得到初始的复杂条件语句,再通过特征重要性进行筛选,对主要特征进行条件的筛选合并,最终得到业务规则。
基于本发明实施例提供的方法,从机器学习模型文件中解析出初始的规则集合,依据特征重要性和业务阈值进行筛选主要特征并进行最大化的规则筛选优化,完成业务规则的提取,使得业务人员能够理解模型效果的原因,增加对模型的可信度,有利于调整业务的重心。
与图1所示的一种业务规则提取方法相对应的,本发明实施例还提供了一种业务规则提取装置,用于对图1中所示方法的具体实现,其结构示意图如图4所示,包括:
第一确定单元401,用于当需要提取业务模型的业务规则时,确定所述业务模型对应的多个特征属性和每个所述特征属性对应的重要度;所述业务模型为基于机器学习的模型;
第二确定单元402,用于依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性;
第三确定单元403,用于依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则。
基于本发明实施例提供的装置,当需要提取基于机器学习的业务模型的业务规则时,确定业务模型对应的多个特征属性和每个特征属性对应的重要度;依据各个特征属性对应的重要度,在各个特征属性中确定多个目标特征属性;依据各个目标特征属性和预设的规则提取策略,确定业务模型对应的业务规则。应用本发明实施例提供的装置,可对基于机器学习的业务模型进行业务规则的提取,使业务人员可以获悉模型的业务规则,有利于业务人员调整业务重心,方便业务人员对业务模型进行优化,可提升用户体验。其次,能够使业务人员理解模型效果的原因,提高模型的可信度。
在上述实施例提供的装置的基础上,本发明实施例提供的装置中,所述第二确定单元402,包括:
第一确定子单元,用于确定所述业务模型对应的预测准确率;确定所述业务模型对应的特征比例,所述特征比例为预设准确率阈值与所述预测准确率的比值;
选取子单元,用于按照各个所述特征属性对应的重要度由高到低的顺序,在所述多个特征属性中按顺序确定多个第一特征属性;所述多个第一特征属性对应的重要度比重大于或等于所述特征比例,所述重要度比重为各个所述第一特征属性对应的重要度分值的总和与各个所述特征属性对应的重要度分值的总和的比值;将每个所述第一特征属性作为所述目标特征属性。
在上述实施例提供的装置的基础上,本发明实施例提供的装置中,所述第三确定单元403,包括:
第一获取子单元,用于获取所述业务模型对应的模型文件;
第二确定子单元,用于确定所述业务模型的模型类型是否为线性模型;
第一解析子单元,用于若所述业务模型的模型类型为所述线性模型,则对所述模型文件进行参数解析,获得所述业务模型对应的多个模型参数;
第三确定子单元,用于依据各个所述模型参数,确定所述业务模型对应的多项式表达式;
删减子单元,用于依据所述多个目标特征属性对所述多项式表达式进行删减,得到删减后的多项式表达式,并将所述删减后的多项式表达式作为所述业务模型对应的业务规则。
在上述实施例提供的装置的基础上,本发明实施例提供的装置中,所述删减子单元,包括:
第四确定子单元,用于在所述多项式表达式中,确定每个所述目标特征属性对应的目标项;将所述多项式表达式中,各个所述目标项之外的项删除,以对所述多项式表达式进行删减。
在上述实施例提供的装置的基础上,本发明实施例提供的装置中,还包括:
第五确定子单元,用于若所述业务模型的模型类型并非所述线性模型,则确定所述业务模型的模型类型为树模型,并对所述模型文件进行条件解析,获得所述业务模型对应的多个条件表达式;
筛选子单元,用于对所述多个条件表达式进行筛选与合并操作,获得多个目标条件表达式,并将所述多个目标条件表达式作为所述业务模型对应的业务规则。
在上述实施例提供的装置的基础上,本发明实施例提供的装置中,所述筛选子单元,包括:
第六确定子单元,用于在所述多个条件表达式中,确定每个所述目标特征属性对应的条件表达式集合,每个所述条件表达式集合中包含至少一个所述条件表达式;
判断子单元,用于判断每个所述目标特征属性对应的条件表达式集合中是否仅包含一个条件表达式;
第七确定子单元,用于对于每个所述目标特征属性,若该目标特征属性对应的条件表达式集合中仅包含一个条件表达式,则将该条件表达式作为所述目标条件表达式;若该目标特征属性对应的条件表达式集合中包含多个条件表达式,则将该条件表达式集合中的各个条件表达式进行合并,得到合并表达式,并将所述合并表达式作为所述目标条件表达式。
在上述实施例提供的装置的基础上,本发明实施例提供的装置中,所述第三确定单元403,包括:
第二获取子单元,用于获取所述业务模型对应的训练集,所述训练集包括多个训练样本,每个所述训练样本包含每个所述特征属性对应的特征数据;
处理子单元,用于对所述训练集中的各个训练样本进行特征剔除处理,得到每个所述训练样本对应的目标特征样本,每个所述目标特征样本包含其对应的训练样本中每个所述目标特征属性对应的特征数据;
训练子单元,用于基于各个所述目标特征样本对预构建的线性模型进行训练,将完成训练的线性模型作为规则模型;
第三获取子单元,用于获取所述规则模型的模型参数,并依据所述规则模型的模型参数,确定所述规则模型的多项式表达式;将所述规则模型的多项式表达式作为所述业务模型对应的业务规则。
本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如上述的业务规则提取方法。
本发明实施例还提供了一种电子设备,其结构示意图如图5所示,具体包括存储器501,以及一个或者一个以上的指令502,其中一个或者一个以上指令502存储于存储器501中,且经配置以由一个或者一个以上处理器503执行所述一个或者一个以上指令502进行以下操作:
当需要提取业务模型的业务规则时,确定所述业务模型对应的多个特征属性和每个所述特征属性对应的重要度;所述业务模型为基于机器学习的模型;
依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性;
依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***或***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的***及***实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种业务规则提取方法,其特征在于,包括:
当需要提取业务模型的业务规则时,确定所述业务模型对应的多个特征属性和每个所述特征属性对应的重要度;所述业务模型为基于机器学习的模型;
依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性;
依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则。
2.根据权利要求1所述的方法,其特征在于,所述依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性,包括:
确定所述业务模型对应的预测准确率;
确定所述业务模型对应的特征比例,所述特征比例为预设准确率阈值与所述预测准确率的比值;
按照各个所述特征属性对应的重要度由高到低的顺序,在所述多个特征属性中按顺序确定多个第一特征属性;所述多个第一特征属性对应的重要度比重大于或等于所述特征比例,所述重要度比重为各个所述第一特征属性对应的重要度分值的总和与各个所述特征属性对应的重要度分值的总和的比值;
将每个所述第一特征属性作为所述目标特征属性。
3.根据权利要求1所述的方法,其特征在于,所述依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则,包括:
获取所述业务模型对应的模型文件;
确定所述业务模型的模型类型是否为线性模型;
若所述业务模型的模型类型为所述线性模型,则对所述模型文件进行参数解析,获得所述业务模型对应的多个模型参数;
依据各个所述模型参数,确定所述业务模型对应的多项式表达式;
依据所述多个目标特征属性对所述多项式表达式进行删减,得到删减后的多项式表达式,并将所述删减后的多项式表达式作为所述业务模型对应的业务规则。
4.根据权利要求3所述的方法,其特征在于,所述依据所述多个目标特征属性对所述多项式表达式进行删减,包括:
在所述多项式表达式中,确定每个所述目标特征属性对应的目标项;
将所述多项式表达式中,各个所述目标项之外的项删除,以对所述多项式表达式进行删减。
5.根据权利要求3所述的方法,其特征在于,还包括:
若所述业务模型的模型类型并非所述线性模型,则确定所述业务模型的模型类型为树模型,并对所述模型文件进行条件解析,获得所述业务模型对应的多个条件表达式;
对所述多个条件表达式进行筛选与合并操作,获得多个目标条件表达式,并将所述多个目标条件表达式作为所述业务模型对应的业务规则。
6.根据权利要求5所述的方法,其特征在于,所述对所述多个条件表达式进行筛选与合并操作,获得多个目标条件表达式,包括:
在所述多个条件表达式中,确定每个所述目标特征属性对应的条件表达式集合,每个所述条件表达式集合中包含至少一个所述条件表达式;
判断每个所述目标特征属性对应的条件表达式集合中是否仅包含一个条件表达式;
对于每个所述目标特征属性,若该目标特征属性对应的条件表达式集合中仅包含一个条件表达式,则将该条件表达式作为所述目标条件表达式;
对于每个所述目标特征属性,若该目标特征属性对应的条件表达式集合中包含多个条件表达式,则将该条件表达式集合中的各个条件表达式进行合并,得到合并表达式,并将所述合并表达式作为所述目标条件表达式。
7.根据权利要求1所述的方法,其特征在于,所述依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则,包括:
获取所述业务模型对应的训练集,所述训练集包括多个训练样本,每个所述训练样本包含每个所述特征属性对应的特征数据;
对所述训练集中的各个训练样本进行特征剔除处理,得到每个所述训练样本对应的目标特征样本,每个所述目标特征样本包含其对应的训练样本中每个所述目标特征属性对应的特征数据;
基于各个所述目标特征样本对预构建的线性模型进行训练,将完成训练的线性模型作为规则模型;
获取所述规则模型的模型参数,并依据所述规则模型的模型参数,确定所述规则模型的多项式表达式;
将所述规则模型的多项式表达式作为所述业务模型对应的业务规则。
8.一种业务规则提取装置,其特征在于,包括:
第一确定单元,用于当需要提取业务模型的业务规则时,确定所述业务模型对应的多个特征属性和每个所述特征属性对应的重要度;所述业务模型为基于机器学习的模型;
第二确定单元,用于依据各个所述特征属性对应的重要度,在所述多个特征属性中确定多个目标特征属性;
第三确定单元,用于依据所述多个目标特征属性和预设的规则提取策略,确定所述业务模型对应的业务规则。
9.一种存储介质,其特征在于,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如权利要求1~7任意一项所述的业务规则提取方法。
10.一种电子设备,其特征在于,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如权利要求1~7任意一项所述的业务规则提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210365767.9A CN114757275A (zh) | 2022-04-08 | 2022-04-08 | 业务规则提取方法及装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210365767.9A CN114757275A (zh) | 2022-04-08 | 2022-04-08 | 业务规则提取方法及装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114757275A true CN114757275A (zh) | 2022-07-15 |
Family
ID=82328856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210365767.9A Pending CN114757275A (zh) | 2022-04-08 | 2022-04-08 | 业务规则提取方法及装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114757275A (zh) |
-
2022
- 2022-04-08 CN CN202210365767.9A patent/CN114757275A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7090936B2 (ja) | Esg基盤の企業評価遂行装置及びその作動方法 | |
CN108073568B (zh) | 关键词提取方法和装置 | |
US10885452B1 (en) | Relation graph optimization using inconsistent cycle detection | |
US20150142423A1 (en) | Phrase-based data classification system | |
CN111767716B (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
US10706359B2 (en) | Method and system for generating predictive models for scoring and prioritizing leads | |
CN112232944B (zh) | 一种评分卡创建方法、装置和电子设备 | |
CN113177700B (zh) | 一种风险评估方法、***、电子设备及存储介质 | |
CN115063035A (zh) | 基于神经网络的客户评估方法、***、设备及存储介质 | |
CN110990627A (zh) | 一种知识图谱构建的方法、装置、电子设备及介质 | |
US11481580B2 (en) | Accessible machine learning | |
CA3092332A1 (en) | System and method for machine learning architecture for interdependence detection | |
CN116049644A (zh) | 特征筛选和聚类分箱方法、装置、电子设备及存储介质 | |
CN114757275A (zh) | 业务规则提取方法及装置、存储介质及电子设备 | |
CN113870998A (zh) | 问诊方法、装置、电子设备和存储介质 | |
CN113379212A (zh) | 基于区块链的物流信息平台违约风险评估方法、装置、设备及介质 | |
CN113469819A (zh) | 基金产品的推荐方法、相关装置及计算机存储介质 | |
Ghosh et al. | Understanding machine learning | |
CN117541044B (zh) | 基于项目风险分析的项目分类方法、***、介质及设备 | |
CN117648635B (zh) | 敏感信息分类分级方法及***、电子设备 | |
CN116028620B (zh) | 一种基于多任务特征协同的生成专利摘要的方法及*** | |
CN117291192B (zh) | 一种政务文本语义理解分析方法及*** | |
CN117041073B (zh) | 网络行为预测方法、***、设备及存储介质 | |
CN112163424B (zh) | 数据的标注方法、装置、设备和介质 | |
CN112509640B (zh) | 基因本体项名称生成方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |