CN111199287A - 一种特征工程实时推荐方法、装置及电子设备 - Google Patents
一种特征工程实时推荐方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111199287A CN111199287A CN201911290187.2A CN201911290187A CN111199287A CN 111199287 A CN111199287 A CN 111199287A CN 201911290187 A CN201911290187 A CN 201911290187A CN 111199287 A CN111199287 A CN 111199287A
- Authority
- CN
- China
- Prior art keywords
- target
- learning model
- data
- feature
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims description 19
- 238000012544 monitoring process Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种特征工程实时推荐方法、装置及电子设备,所述方法包括:配置学习模型数据库和特征标签数据库;显示特征工程配置参数,所述特征工程配置参数包括学习模型、所述调整参数和特征标签数据;获取用户选取的目标特征工程配置参数;根据所述目标特征工程配置参数从所述特征标签数据库中选取目标特征标签数据,并从所述学习模型数据库中选取目标学习模型;根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型;根据输出结果推送对应信息。通过本发明,无需耗费专业人员太多时间和精力,普通用户只需在特征工程配置界面输入目标特征工程配置参数即可输出对应的标签数据,进而推送对应信息。
Description
技术领域
本发明涉及数据信息推荐技术领域,具体而言,涉及一种特征工程实时推荐方法、装置、电子设备及计算机可读介质。
背景技术
随着互联网2.0时代的全面到来,网络中充斥的大量的信息数据,如何利用这些庞大而杂乱的数据,从中挖据出有价值的信息成为了热点话题,这也为数据挖掘中作为一重要分支领域的机器学习带来了发展的春天。在机器学习技术中,很少有人关注特征工程(Feature Engineering),而更多的去在意模型和算法的选择与优化,然而,特征是机器学习***的原材料,对最终模型的影响是毋庸置疑的。
目前,国内外已经存在很多机器学习领域的特征工程建设,如美团订单推荐中的特征工程、百度广告***的特征工程等。
百度广告***的特征工程主要是采用机器学习模型辅助人工抽取的方式,基于大量的经验挑选出合适的特征并经过大量的特征变换与组合,实现特征的高纬度和精确性,更依赖于特征提取的经验和多种模型的组合运用。
美团的推荐***的特征工程建设更具有电商的性质,例如以地理位置为特征构建附近商家推荐的模型等。再根据这些与业务紧密相连的特征,采用多种模型对特征变换与组合来实现特征工程的建设。
传统的特征工程建设更加依赖于对业务的理解经验,要求用户具备非常专业的机器学***台对新老客户的吸纳和对外推广。
发明内容
本发明旨在解决现有技术中特征工程的建设需要耗费专业人员很多时间和精力,且无法实时推荐的技术问题。
为了解决上述技术问题,本发明第一方面提出一种特征工程实时推荐方法,所述方法包括:
配置学习模型数据库和特征标签数据库;
显示特征工程配置参数,所述特征工程配置参数包括学习模型、所述调整参数和特征标签数据;
获取用户选取的目标特征工程配置参数;
根据所述目标特征工程配置参数从所述特征标签数据库中选取目标特征标签数据,并从所述学习模型数据库中选取目标学习模型;
根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型;
根据输出结果推送对应信息。
根据本发明一种较佳的实施方式,当所述目标特征标签数据为实时数据时,通过MYsql,binlog日志监听,log日志监听,Flome监听或Kafka消息获取所述目标特征标签数据对应的实时数据。
根据本发明一种较佳的实施方式,所述将所述目标特征标签数据输入调整后的所述目标学习模型之后,所述方法还包括:
获取所述目标学习模型的第n目标调整参数;
根据所述第n目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型,直至输出结果满足预设条件;
其中,n为自然数。
根据本发明一种较佳的实施方式,所述根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型包括:
将所述目标特征标签数据拆分为训练数据和测试数据;
根据所述目标调整参数调整所述目标学习模型,将所述训练数据输入调整后的所述目标学习模型进行训练;
将所述测试数据输入训练后的所述目标学习模型。
根据本发明一种较佳的实施方式,所述输出结果是通过所述目标学习模型对所述目标特征标签数据的打分值,所述根据输出结果推送对应信息包括:
根据所述打分值将目标特征标签数据对应的用户分为不同等级;
向不同等级的用户推送对应的推送信息;
其中,所述推送信息包括商品信息、优惠劵信息、邀请码信息中的至少一种。
根据本发明一种较佳的实施方式,所述实时数据包括:用户信用度、联系方式、借款金额、还款信息、逾期信息中的至少一种。
为了解决上述技术问题,本发明第二方面提供一种特征工程实时推荐装置,所述装置包括:
配置模块,用于配置学习模型数据库和特征标签数据库;
显示模块,用于显示特征工程配置参数,所述特征工程配置参数包括学习模型、所述调整参数和特征标签数据;
获取模块,用于获取用户选取的目标特征工程配置参数;
选取模块,用于根据所述目标特征工程配置参数从所述特征标签数据库中选取目标特征标签数据,并从所述学习模型数据库中选取目标学习模型;
调整模块,用于根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型;
推送模块,用于根据输出结果推送对应信息。
根据本发明一种较佳的实施方式,当所述目标特征标签数据为实时数据时,通过My sql,binlog日志监听,log日志监听,Flome监听或Kafka消息获取所述目标特征标签数据对应的实时数据。
根据本发明一种较佳的实施方式,所述装置还包括:
循环调整模块,用于获取所述目标学习模型的第n目标调整参数;根据所述第n目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型,直至输出结果满足预设条件;
其中,n为自然数。
根据本发明一种较佳的实施方式,所述调整模块包括:
拆分模块,用于将所述目标特征标签数据拆分为训练数据和测试数据;
调整训练模块,用于根据所述目标调整参数调整所述目标学习模型,将所述训练数据输入调整后的所述目标学习模型进行训练;
测试模块,用于将所述测试数据输入训练后的所述目标学习模型。
根据本发明一种较佳的实施方式,所述输出结果是通过所述目标学习模型对所述目标特征标签数据的打分值,所述推送模块包括:
分组模块,用于根据所述打分值将目标特征标签数据对应的用户分为不同等级,
子推送模块,用于向不同等级的用户推送对应的推荐信息;
其中,所述推荐信息包括商品信息、优惠劵信息、邀请码信息中的至少一种。
根据本发明一种较佳的实施方式,所述实时数据包括:用户信用度、联系方式、借款金额、还款信息、逾期信息中的至少一种。
为了解决上述技术问题,本发明第三方面提供一种电子设备,包括:
处理器;以及
存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行上述的方法。
为了解决上述技术问题,本发明第四方面提出一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现上述方法。
本发明预先配置学习模型数据库和特征标签数据库;通过可视化显示特征工程配置参数来获取用户选取的目标特征工程配置参数,再根据用户选取的目标特征工程配置参数从特征标签数据库中选取目标特征标签数据,并从学习模型数据库中选取目标学习模型;根据目标调整参数调整目标学习模型,并将目标特征标签数据输入调整后的目标学习模型;从而完成对特征工程的自动配置,然后根据输出结果推送对应信息。通过本发明,无需耗费专业人员太多时间和精力,普通用户只需在特征工程配置界面输入目标特征工程配置参数即可输出对应的标签数据,进而推送对应信息。且进一步对特征标签数据库中的实时数据进行实时同步,解决了特征工程时效性的问题,达到实时推荐的效果。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明的示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是本发明一种特征工程实时推荐方法的流程图;
图2a~2b是本发明显示特征工程配置参数步骤的示意图;
图3是本发明应用实例一的示意图;
图4是本发明应用实例二的示意图;
图5是本发明一种特征工程实时推荐装置的结构框架示意图;
图6是根据本发明的一种电子设备的示例性实施例的结构框图;
图7是本发明一个计算机可读介质实施例的示意图。
具体实施方式
现在将参考附图来更加全面地描述本发明的示例性实施例,虽然各示例性实施例能够以多种具体的方式实施,但不应理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例是为了使本发明的内容更加完整,更加便于将发明构思全面地传达给本领域的技术人员。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的结构、性能、效果或者其他特征可以以任何合适的方式结合到一个或更多其他的实施例中。
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
如图1是本发明提供的一种特征工程实时推荐方法的流程图,如图1所示,所述方法包括:
S1、配置学习模型数据库和特征标签数据库;
其中,所述学习模型数据库中包括预先存储的多种机器学习模型,如深度学习模型、神经网络模型、线性模型等。所述特征标签数据库中包含预先存储的各种标签数据,所述标签数据是将源数据通过初步分类并标识标签的数据,其通过标签来标识数据本身所包含的特征信息。例如,源数据包含:用户姓名、联系方式、借款信息、还款记录;则将源数据通过现有模型或算法计算可得到不同信用等级的标签数据,如,标签为第一信用等级的标签数据,标签为第二信用等级的标签数据等。
S2、显示特征工程配置参数;
其中,所述特征工程配置参数包括学习模型、所述调整参数和特征标签数据。所述调整参数用于对学习模型中各个参数的所占的权重值进行调整。
在一种显示方式中,如图2a所示,显示界面10上显示学习模型、调整参数和特征标签数据下拉复选框供用户选择目标学习模型、目标调整参数和目标特征标签数据。
在另一种显示方式中,如图2b所示,显示界面10的第一显示区域11显示所有学习模型、调整参数和特征标签数据,第二显示区域12为拖拽区域,用户通过将第一显示区域11内的某一学习模型、调整参数和特征标签数据拖拽到第二显示区域12实现对目标学习模型、目标调整参数和目标特征标签数据的选择。
S3、获取用户选取的目标特征工程配置参数;
本实施例中,所述目标特征工程配置参数包含用户选取的目标学习模型、目标调整参数和目标特征标签数据。如图2a中,可通过检测用户在各个下拉复选框的选取操作来确定用户对目标学习模型、目标调整参数和目标特征标签数据的选择。如图2b中,可通过检测用户在第二显示区域12的拖拽操作来确定用户对目标学习模型、目标调整参数和目标特征标签数据的选择。
S4、根据所述目标特征工程配置参数从所述特征标签数据库中选取目标特征标签数据,并从所述学习模型数据库中选取目标学习模型;
本发明中,所述目标特征标签数据可以是离线数据,也可以是实时数据。其中,离线数据是指在一定时间段内固定不变的数据,如姓名、身份证号码、家庭住址等数据;实时数据是在随时可能变动的数据,如用户信用度、联系方式、借款金额、还款信息、逾期信息等等数据。
为了保证数据的实时性,本发明中,当所述目标特征标签数据为实时数据时,通过My sql查询,binlog日志监听,log日志监听,Flome监听或Kafka消息获取所述目标特征标签数据对应的实时数据。
S5、根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型;
具体的,根据目标调整参数调整目标学习模型中对应参数的权重值后,将目标特征标签数据输入调整后的目标学习模型中。
进一步的,本步骤中,可以通过多次调整参数的方式来提高模型输出结果的准确性。因此,在步骤S5之后,可以继续执行以下步骤S51~S52。
S51、获取所述目标学习模型的第n调整参数;
S52、根据所述第n调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型,直至输出结果满足预设条件;
其中,n为自然数。所述预设条件具体可以是输出结果的准确率,例如,当输出结果大于预设的准确率时,结束步骤S51~S52的参数调整。所述输出结果的准确率可以通过将输出结果与预设结果对比获取。
此外,本步骤中,如果多次调整目标调整参数后,目标学习模型的输出结果仍然不能满足预设条件,可以考虑从新选取目标学习模型,及目标调整参数,再循环执行步骤S51~S52,直至输出结果满足预设条件。
在另一种实施方式中,为了提高模型输出的准确性,将目标特征标签数据拆分为训练数据和测试数据,通过训练数据对目标学习模型进行训练,从而提高测试数据输出结果的准确性,则本步骤S5具体包括:
S501、将所述目标特征标签数据拆分为训练数据和测试数据;
S502、根据所述目标调整参数调整所述目标学习模型,将所述训练数据输入调整后的所述目标学习模型进行训练;
S503、将所述测试数据输入训练后的所述目标学习模型。
S6、根据输出结果推送对应信息。
本发明中,所述输出结果是通过目标学习模型对目标特征标签数据的打分值,则本步骤S6具体包括:
S61、根据打分值将目标特征标签数据对应的用户分为不同等级,
示例性的,将打分值在60以下的目标特征标签数据对应的用户分至不及格等级队列中,将打分值在60~70的目标特征标签数据对应的用户分至及格等级队列中,将打分值在70~90的目标特征标签数据对应的用户分至良好等级队列中,将打分值在90以上的目标特征标签数据对应的用户分至极好等级队列中。
S62、向不同等级的用户推送对应的推送信息。
本发明中,可以预先设置不同等级用户对应的推送信息列表,根据用户的等级向该用户推送对应的推送信息。所述推送信息可以是商品信息、优惠劵信息、邀请码信息中的至少一种。
具体推送何种推送信息可以根据业务场景而确定,例如,在信贷业务中,可以向不同等级的用户推送对应的优惠劵信息和/或邀请码信息;在商城业务中,可以向不同等级的用户推送对应的商品信息。
下面介绍本发明提供的特征工程实时推荐方法的几个应用实例。
应用实例一
在信贷业务中,为了促进老客户的再次借贷,可以将平台老客户的数据作为目标特征标签数据、选择适应的目标学***台老客户的数据输入调整后的目标学习模型中,根据目标学习模型的输出结果的准确率确定是否要调整目标调整参数、或者是否调整目标学习模型。当输出结果的准确率达到预设准确率时,根据输出结果的打分值将老客户分到不同的用户等级中,再根据老客户所在的用户等级向来客户发送对应的优惠券。
如图3,将老客户1、老客户2、老客户3和老客户4的数据作为目标特征标签数据,经过用户多次选取目标调整参数,通过各个目标调整参数对目标学习模型调整并将老客户1、老客户2、老客户3和老客户4的数据输入目标学习模型后,目标学习模型的输出结果达到预设要求,根据输出结果的打分值将老客户1分至良好等级队列中,将老客户2和老客户3分至及格等级队列中,将老客户4分至极好等级队列中,则将良好等级对应的优惠券A发送给老客户1的账号中,将及格等级对应的优惠券B发送给老客户2和老客户3的账号中,将极好等级对应的优惠券C发送给老客户4的账号中,完成优惠券的实时推送,促进老客户的再次借贷。
应用实例二
在商城业务中,为了促进用户对心仪商品的购买,可以将用户的地理位置作为目标特征标签数据,选择适应的目标学习模型及目标调整参数,通过目标调整参数对目标学习模型进行调整,再将用户的地理位置输入调整后的目标学习模型中,根据目标学习模型的输出结果的准确率确定是否要调整目标调整参数、或者是否调整目标学习模型。当输出结果的准确率达到预设准确率时,根据输出结果的打分值将用户分到不同的用户等级中,再根据用户所在的用户等级向来客户发送对应的商品信息。
如图4,将用户1、用户2、用户3和用户4的地理位置作为目标特征标签数据,经过用户多次选取目标调整参数,通过各个目标调整参数对目标学习模型调整并将老客户1、老客户2、老客户3和老客户4的数据输入目标学习模型后,目标学习模型的输出结果达到预设要求,根据输出结果的打分值将用户1分至第一城市队列中,将用户2分至第二城市队列中,将用户3和用户4分至第三城市队列中,则将第一城市对应的第一城市特产发送给用户1,将第二城市对应的第二城市特产发送给用户2,将第三城市对应的第三城市特产发送给用户3和用户4,完成商品信息的实时推送,促进用户对商品的购买。
图5是本发明一种特征工程实时推荐装置的架构示意图,如图5所示,所述装置包括:
配置模块51,用于配置学习模型数据库和特征标签数据库;
显示模块52,用于显示特征工程配置参数,所述特征工程配置参数包括学习模型、所述调整参数和特征标签数据;
获取模块53,用于获取用户选取的目标特征工程配置参数;
选取模块54,用于根据所述目标特征工程配置参数从所述特征标签数据库中选取目标特征标签数据,并从所述学习模型数据库中选取目标学习模型;
调整模块55,用于根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型;
推送模块56,用于根据输出结果推送对应信息。
其中,当所述目标特征标签数据为实时数据时,通过My sql,binlog日志监听,log日志监听,Flome监听或Kafka消息获取所述目标特征标签数据对应的实时数据。所述实时数据包括:用户信用度、联系方式、借款金额、还款信息、逾期信息中的至少一种。
在一种具体实施方式中,所述装置还包括:
循环调整模块,用于获取所述目标学习模型的第n目标调整参数;根据所述第n目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型,直至输出结果满足预设条件;
其中,n为自然数。
在另一种具体实施方式中,所述调整模块55包括:
拆分模块,用于将所述目标特征标签数据拆分为训练数据和测试数据;
调整训练模块,用于根据所述目标调整参数调整所述目标学习模型,将所述训练数据输入调整后的所述目标学习模型进行训练;
测试模块,用于将所述测试数据输入训练后的所述目标学习模型。
所述输出结果是通过所述目标学习模型对所述目标特征标签数据的打分值,所述推送模块56包括:
分组模块,用于根据所述打分值将目标特征标签数据对应的用户分为不同等级,
子推送模块,用于向不同等级的用户推送对应的推荐信息;
其中,所述推荐信息包括商品信息、优惠劵信息、邀请码信息中的至少一种。
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的实体形式的实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
图6是根据本发明的一种电子设备的示例性实施例的结构框图。图6显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,该示例性实施例的电子设备600以通用数据处理设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同电子设备组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,所述存储单元620存储有计算机可读程序,其可以是源程序或都只读程序的代码。所述程序可以被处理单元610执行,使得所述处理单元610执行本发明各种实施方式的步骤。例如,所述处理单元610可以执行如图1所示的步骤。
所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作电子设备、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备300(例如键盘、显示器、网络设备、蓝牙设备等)通信,使得用户能经由这些外部设备600与该电子设备600交互,和/或使得该电子设备600能与一个或多个其它数据处理设备(例如路由器、调制解调器等等)进行通信。这种通信可以通过输入/输出(I/O)接口650进行,还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)进行。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图6中未示出,电子设备600中可使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID电子设备、磁带驱动器以及数据备份存储电子设备等。
图7是本发明的一个计算机可读介质实施例的示意图。如图7所示,所述计算机程序可以存储于一个或多个计算机可读介质上。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的电子设备、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。当所述计算机程序被一个或多个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法,即:配置学习模型数据库和特征标签数据库;显示特征工程配置参数,所述特征工程配置参数包括学习模型、所述调整参数和特征标签数据;获取用户选取的目标特征工程配置参数;根据所述目标特征工程配置参数从所述特征标签数据库中选取目标特征标签数据,并从所述学习模型数据库中选取目标学习模型;根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型;根据输出结果推送对应信息。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台数据处理设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行电子设备、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以执行计算机程序的方法、装置、电子设备或计算机可读介质来实现。可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现本发明的一些或者全部功能。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种特征工程实时推荐方法,其特征在于,所述方法包括:
配置学习模型数据库和特征标签数据库;
显示特征工程配置参数,所述特征工程配置参数包括学习模型、所述调整参数和特征标签数据;
获取用户选取的目标特征工程配置参数;
根据所述目标特征工程配置参数从所述特征标签数据库中选取目标特征标签数据,并从所述学习模型数据库中选取目标学习模型;
根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型;
根据输出结果推送对应信息。
2.根据权利要求1所述的方法,其特征在于,当所述目标特征标签数据为实时数据时,通过MYsql,binlog日志监听,log日志监听,Flome监听或Kafka消息获取所述目标特征标签数据对应的实时数据。
3.根据权利要求1-2所述的方法,其特征在于,所述将所述目标特征标签数据输入调整后的所述目标学习模型之后,所述方法还包括:
获取所述目标学习模型的第n目标调整参数;
根据所述第n目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型,直至输出结果满足预设条件;
其中,n为自然数。
4.根据权利要求1-3所述的方法,其特征在于,所述根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型包括:
将所述目标特征标签数据拆分为训练数据和测试数据;
根据所述目标调整参数调整所述目标学习模型,将所述训练数据输入调整后的所述目标学习模型进行训练;
将所述测试数据输入训练后的所述目标学习模型。
5.根据权利要求1-4所述的方法,其特征在于,所述输出结果是通过所述目标学习模型对所述目标特征标签数据的打分值,所述根据输出结果推送对应信息包括:
根据所述打分值将目标特征标签数据对应的用户分为不同等级;
向不同等级的用户推送对应的推送信息;
其中,所述推送信息包括商品信息、优惠劵信息、邀请码信息中的至少一种。
6.根据权利要求1-5所述的方法,其特征在于,所述实时数据包括:用户信用度、联系方式、借款金额、还款信息、逾期信息中的至少一种。
7.一种特征工程实时推荐装置,其特征在于,所述装置包括:
配置模块,用于配置学习模型数据库和特征标签数据库;
显示模块,用于显示特征工程配置参数,所述特征工程配置参数包括学习模型、所述调整参数和特征标签数据;
获取模块,用于获取用户选取的目标特征工程配置参数;
选取模块,用于根据所述目标特征工程配置参数从所述特征标签数据库中选取目标特征标签数据,并从所述学习模型数据库中选取目标学习模型;
调整模块,用于根据目标调整参数调整所述目标学习模型,并将所述目标特征标签数据输入调整后的所述目标学习模型;
推送模块,用于根据输出结果推送对应信息。
8.根据权利要求7所述的装置,其特征在于,当所述目标特征标签数据为实时数据时,通过My sql,binlog日志监听,log日志监听,Flome监听或Kafka消息获取所述目标特征标签数据对应的实时数据。
9.一种电子设备,包括:处理器;以及
存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911290187.2A CN111199287A (zh) | 2019-12-16 | 2019-12-16 | 一种特征工程实时推荐方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911290187.2A CN111199287A (zh) | 2019-12-16 | 2019-12-16 | 一种特征工程实时推荐方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111199287A true CN111199287A (zh) | 2020-05-26 |
Family
ID=70747639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911290187.2A Pending CN111199287A (zh) | 2019-12-16 | 2019-12-16 | 一种特征工程实时推荐方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111199287A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861550A (zh) * | 2020-07-08 | 2020-10-30 | 上海视九信息科技有限公司 | 一种基于ott设备的家庭画像构建方法及*** |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163310A (zh) * | 2010-02-22 | 2011-08-24 | 深圳市腾讯计算机***有限公司 | 一种基于用户信用度等级的信息推送方法和装置 |
CN107766940A (zh) * | 2017-11-20 | 2018-03-06 | 北京百度网讯科技有限公司 | 用于生成模型的方法和装置 |
CN109034981A (zh) * | 2018-08-23 | 2018-12-18 | 上海海事大学 | 一种电商协同过滤推荐方法 |
CN109325541A (zh) * | 2018-09-30 | 2019-02-12 | 北京字节跳动网络技术有限公司 | 用于训练模型的方法和装置 |
CN109635186A (zh) * | 2018-11-16 | 2019-04-16 | 华南理工大学 | 一种基于Lambda架构的实时推荐方法 |
CN110276456A (zh) * | 2019-06-20 | 2019-09-24 | 山东大学 | 一种机器学习模型辅助构建方法、***、设备及介质 |
CN110297968A (zh) * | 2019-05-22 | 2019-10-01 | 中国平安人寿保险股份有限公司 | 产品推送方法、装置、计算机设备及存储介质 |
-
2019
- 2019-12-16 CN CN201911290187.2A patent/CN111199287A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163310A (zh) * | 2010-02-22 | 2011-08-24 | 深圳市腾讯计算机***有限公司 | 一种基于用户信用度等级的信息推送方法和装置 |
CN107766940A (zh) * | 2017-11-20 | 2018-03-06 | 北京百度网讯科技有限公司 | 用于生成模型的方法和装置 |
CN109034981A (zh) * | 2018-08-23 | 2018-12-18 | 上海海事大学 | 一种电商协同过滤推荐方法 |
CN109325541A (zh) * | 2018-09-30 | 2019-02-12 | 北京字节跳动网络技术有限公司 | 用于训练模型的方法和装置 |
CN109635186A (zh) * | 2018-11-16 | 2019-04-16 | 华南理工大学 | 一种基于Lambda架构的实时推荐方法 |
CN110297968A (zh) * | 2019-05-22 | 2019-10-01 | 中国平安人寿保险股份有限公司 | 产品推送方法、装置、计算机设备及存储介质 |
CN110276456A (zh) * | 2019-06-20 | 2019-09-24 | 山东大学 | 一种机器学习模型辅助构建方法、***、设备及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861550A (zh) * | 2020-07-08 | 2020-10-30 | 上海视九信息科技有限公司 | 一种基于ott设备的家庭画像构建方法及*** |
CN111861550B (zh) * | 2020-07-08 | 2023-09-08 | 上海视九信息科技有限公司 | 一种基于ott设备的家庭画像构建方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109460513B (zh) | 用于生成点击率预测模型的方法和装置 | |
CN107729937B (zh) | 用于确定用户兴趣标签的方法及装置 | |
US11531817B2 (en) | Creating a knowledge graph based on text-based knowledge corpora | |
US8352495B2 (en) | Distributed platform for network analysis | |
US20240233056A1 (en) | Method and system for curriculum management services | |
US10733197B2 (en) | Method and apparatus for providing information based on artificial intelligence | |
US11074250B2 (en) | Technologies for implementing ontological models for natural language queries | |
CN105573966B (zh) | 电子表格中所呈现的内容的自适应修改 | |
CN106982256A (zh) | 信息推送方法、装置、设备及存储介质 | |
US20170185835A1 (en) | Assisting people with understanding charts | |
CN109840730B (zh) | 用于数据预测的方法及装置 | |
CN110750654A (zh) | 知识图谱获取方法、装置、设备和介质 | |
CN110795621A (zh) | 一种金融产品推荐信息展示方法、装置及电子设备 | |
CN115002200B (zh) | 基于用户画像的消息推送方法、装置、设备及存储介质 | |
CN110795568A (zh) | 基于用户信息知识图谱的风险评估方法、装置和电子设备 | |
CN110798567A (zh) | 短信分类显示方法及装置、存储介质、电子设备 | |
US20150161224A1 (en) | Optimized Network Analysis Rendering and User Interfaces | |
CN111199421A (zh) | 一种基于社交关系的用户推荐方法、装置及电子设备 | |
US20210383426A1 (en) | Creating an effective product using an attribute solver | |
CN111199287A (zh) | 一种特征工程实时推荐方法、装置及电子设备 | |
CN110503306A (zh) | 一种满意度指标可视化处理方法及装置 | |
CN114996574A (zh) | 画像标签的构建方法、装置及电子设备 | |
US20210295036A1 (en) | Systematic language to enable natural language processing on technical diagrams | |
KR20220118703A (ko) | 머신러닝 기반 온라인 쇼핑 리뷰 감정 예측 시스템 및 방법 | |
CN113569929A (zh) | 基于小样本扩展的互联网服务提供方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200526 |