CN115934675B - 动态标签的输出方法及装置、存储介质、电子设备 - Google Patents
动态标签的输出方法及装置、存储介质、电子设备 Download PDFInfo
- Publication number
- CN115934675B CN115934675B CN202211536454.1A CN202211536454A CN115934675B CN 115934675 B CN115934675 B CN 115934675B CN 202211536454 A CN202211536454 A CN 202211536454A CN 115934675 B CN115934675 B CN 115934675B
- Authority
- CN
- China
- Prior art keywords
- data
- label
- service
- sample data
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种动态标签的输出方法及装置、存储介质、电子设备,其中,该方法包括:从客户关系管理CRM***读取原始样本数据;对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据;将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据;响应业务端的标签调用请求,向所述业务端返回所述目标标签数据。通过本发明,解决了相关技术不能实时生成动态标签的技术问题,满足业务端对标签数据的实时性需求。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种动态标签的输出方法及装置、存储介质、电子设备。
背景技术
相关技术中,商家数字化营销需要对消费者在电商平台的历史购买数据进行数据建模,由于用户隐私保护,主流电商平台对消费者敏感数据的输出做了诸多限制,商家无法实时从电商平台的客户关系管理(Customer Relationship Management,CRM)***导出交易数据进行数据建模。
相关技术中,现有技术需要向电商平台提出数据出域预申请,等待若干个工作日审核通过后,才能获取建模需要的敏感数据到本地再进行建模预测。现有电商平台客户关系管理***不提供或只提供基本的标签能力,无法提供通过建模预测生成的动态标签。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
发明内容
本发明实施例提供了一种动态标签的输出方法及装置、存储介质、电子设备。
根据本申请实施例的一个方面,提供了一种动态标签的输出方法,包括:从客户关系管理CRM***读取原始样本数据;对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据;将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据;响应业务端的标签调用请求,向所述业务端返回所述目标标签数据。
进一步,对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据包括:对所述原始样本数据进行去重清洗和格式内容清洗,得到第一样本数据;从所述第一样本数据中选择并提取样本归属标识和样本特征;以所述样本归属标识为key,对应的样本特征为value构建特征表,并将所述特征表确定为中间样本数据。
进一步,将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据包括:确定待输出的标签类型;若所述标签类型为概率标签,从模型库中选择概率预测模型,将所述中间样本数据作为所述概率预测模型的输入数据,在所述CRM***本地从所述概率预测模型输出第一目标标签数据;若所述标签类型为偏好标签,从模型库中选择商品推荐模型,将所述中间样本数据作为所述商品推荐模型的输入数据,在所述CRM***本地从所述商品推荐模型输出第二目标标签数据,其中,所述模型库包括所述概率预测模型和所述商品推荐模型。
进一步,响应业务端的标签调用请求,向所述业务端返回所述目标标签数据包括以下之一:响应业务端的第一标签调用请求,对所述目标标签数据进行可变长度字符编码,生成json数据,采用应用程序编程接口API接口向所述业务端返回所述json数据;响应业务端的第二标签调用请求,对所述目标标签数据进行可变长度字符编码,生成文件数据,采用文件调用接口向所述业务端返回所述文件数据。
进一步,在从客户关系管理CRM***读取原始样本数据之前,所述方法还包括:初始化若干个调度容器的业务处理器类,其中,所述调度容器包括多个容器空间,每个容器空间对应一个业务处理器类,每个业务处理器类对应一个标签类型,每个业务处理器类包括多个由责任链连接的代码数据;在初始化完成之后,获取业务需求信息,并根据所述业务需求信息解析所述调度容器的处理器列表和代码环境参数;若所述处理器列表和代码环境参数解析成功,解析所述处理器列表的类参数;在所述类参数解析成功之后,启动所述调度容器。
进一步,初始化调度容器的业务处理器类包括:对调度最小化动作进行对比,并根据对比结果提取业务处理器的抽象模板,得到业务处理器虚类;采用所述业务处理器虚类生成业务处理器类;调用所述调度容器的主程序初始化所有业务处理器的业务处理器类。
进一步,在初始化若干个调度容器的业务处理器类之前,所述方法还包括:确定当前执行的目标调度容器;解析所述目标调度容器的容器令牌;采用所述容器令牌在先进先出FIFO管道定位所述目标调度容器的调用时序。
根据本申请实施例的另一个方面,还提供了一种动态标签的输出装置,包括:采集模块,用于从客户关系管理CRM***读取原始样本数据;处理模块,用于对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据;预测模块,用于将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据;返回模块,用于响应业务端的标签调用请求,向所述业务端返回所述目标标签数据。
进一步,所述处理模块包括:处理单元,用于对所述原始样本数据进行去重清洗和格式内容清洗,得到第一样本数据;提取单元,用于从所述第一样本数据中选择并提取样本归属标识和样本特征;存储单元,用于以所述样本归属标识为key,对应的样本特征为value构建特征表,并将所述特征表确定为中间样本数据。
进一步,所述预测模块包括:确定单元,用于确定待输出的标签类型;预测单元,用于若所述标签类型为概率标签,从模型库中选择概率预测模型,将所述中间样本数据作为所述概率预测模型的输入数据,在所述CRM***本地从所述概率预测模型输出第一目标标签数据;若所述标签类型为偏好标签,从模型库中选择商品推荐模型,将所述中间样本数据作为所述商品推荐模型的输入数据,在所述CRM***本地从所述商品推荐模型输出第二目标标签数据,其中,所述模型库包括所述概率预测模型和所述商品推荐模型。
进一步,所述返回模块包括以下之一:第一返回单元,用于响应业务端的第一标签调用请求,对所述目标标签数据进行可变长度字符编码,生成json数据,采用应用程序编程接口API接口向所述业务端返回所述json数据;第二返回单元,用于响应业务端的第二标签调用请求,对所述目标标签数据进行可变长度字符编码,生成文件数据,采用文件调用接口向所述业务端返回所述文件数据。
进一步,所述装置还包括:初始化模块,用于在所述采集模块从客户关系管理CRM***读取原始样本数据之前,初始化若干个调度容器的业务处理器类,其中,所述调度容器包括多个容器空间,每个容器空间对应一个业务处理器类,每个业务处理器类对应一个标签类型,每个业务处理器类包括多个由责任链连接的代码数据;第一解析模块,用于在初始化完成之后,获取业务需求信息,并根据所述业务需求信息解析所述调度容器的处理器列表和代码环境参数;第二解析模块,用于若所述处理器列表和代码环境参数解析成功,解析所述处理器列表的类参数;启动模块,用于在所述类参数解析成功之后,启动所述调度容器。
进一步,所述初始化模块包括:提取单元,用于对调度最小化动作进行对比,并根据对比结果提取业务处理器的抽象模板,得到业务处理器虚类;生成单元,用于采用所述业务处理器虚类生成业务处理器类;初始化单元,用于调用所述调度容器的主程序初始化所有业务处理器的业务处理器类。
进一步,所述装置还包括:确定模块,用于在所述初始化模块初始化若干个调度容器的业务处理器类之前,确定当前执行的目标调度容器;第三解析模块,用于解析所述目标调度容器的容器令牌;定位模块,用于采用所述容器令牌在先进先出FIFO管道定位所述目标调度容器的调用时序。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。
根据本申请实施例的另一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
通过本发明,从客户关系管理CRM***读取原始样本数据,对原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据,将中间样本数据输入预训练的标签预测模型,在CRM***上输出目标标签数据,响应业务端的标签调用请求,向业务端返回目标标签数据,通过在,在交易数据等敏感的样本数据不出域的条件下,输出业务端所需要的动态标签,解决了相关技术不能实时生成动态标签的技术问题,满足业务端对标签数据的实时性需求。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种服务器的硬件结构框图;
图2是根据本发明实施例的一种动态标签的输出方法的流程图;
图3是本发明实施例的框架流程示意图;
图4是根据本发明实施例的一种动态标签的输出装置的结构框图;
图5是实施本发明实施例的一种电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
本申请实施例一所提供的方法实施例可以在服务器、计算机、手机、或者类似的运算装置中执行。以运行在服务器上为例,图1是本发明实施例的一种服务器的硬件结构框图。如图1所示,服务器可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述服务器还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述服务器的结构建成限定。例如,服务器还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储服务器程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种动态标签的输出方法对应的服务器程序,处理器102通过运行存储在存储器104内的服务器程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种动态标签的输出方法,图2是根据本发明实施例的一种动态标签的输出方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,从客户关系管理CRM***读取原始样本数据;
在本实施例的CRM***是运行在电商平台(如阿里,京东等),原始样本数据可以是目标商家在电商平台上消费用户的交易数据,销售数据,订单数据、会员数据和商品数据等,CRM***可以是独立的CRM服务器,也可以集成在电商平台的中心服务器上。
步骤S204,对原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据;
本实施例的中间样本数据是指符合标签预测模型要求的样本数据,预设要求包括格式要求,数据量要求,数据质量要求等。
步骤S206,将中间样本数据输入预训练的标签预测模型,在CRM***上输出目标标签数据;
本实施例的标签预测模型配置在CRM***所在的服务器上。
步骤S208,响应业务端的标签调用请求,向业务端返回目标标签数据。
本实施例的业务端可以是需要使用目标标签数据的商户端,也可以是其他需要调用标签数据的客户端,由于目标标签数据不涉及到用户的隐私信息,因此可以快速动态导出,实现标签数据同步。
通过上述步骤,从客户关系管理CRM***读取原始样本数据,对原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据,将中间样本数据输入预训练的标签预测模型,在CRM***上输出目标标签数据,响应业务端的标签调用请求,向业务端返回目标标签数据,通过在,在交易数据等敏感的样本数据不出域的条件下,输出业务端所需要的动态标签,解决了相关技术不能实时生成动态标签的技术问题,满足业务端对标签数据的实时性需求。
在本实施例的一个实施方式中,对原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据包括:对原始样本数据进行去重清洗和格式内容清洗,得到第一样本数据;从第一样本数据中选择并提取样本归属标识和样本特征;以样本归属标识为key,对应的样本特征为value构建特征表,并将特征表确定为中间样本数据。
可选的,样本归属标识可以是用户标识,商品标识,项目标识等,如user_id,item_id等,在一个示例中,特征表的格式为{user_id/item_id,feature_1,feature_2,…},feature_1,feature_2,…为样本特征的序列。
在本实施例的一个示例中,将中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据包括:确定待输出的标签类型;若标签类型为概率标签,从模型库中选择概率预测模型,将中间样本数据作为概率预测模型的输入数据,在所述CRM***本地从概率预测模型输出第一目标标签数据;若标签类型为偏好标签,从模型库中选择商品推荐模型,将中间样本数据作为商品推荐模型的输入数据,在所述CRM***本地从商品推荐模型输出第二目标标签数据,其中,模型库包括概率预测模型和商品推荐模型。
根据业务需求,在数据建模模块中,根据所需要的标签类型选择相应的模型进行建模,比如说,选择“购买概率标签”会调用购买概率预测模型,或“商品偏好标签”会调用商品推荐模型等。
在一些示例中,在所述CRM***上输出目标标签数据之后,还可以对目标标签数据进行后处理,对标签预测得到的连续型数值进行离散化处理,比如说,将购买概率(0-1之间的数值)离散化为(高、中、低)三个购买概率;将标签结果以{user_id:标签值}的形式保存在数据库中,供标签输出模块后续调用。
在本实施例的实施场景中,响应业务端的标签调用请求,向业务端返回目标标签数据可以但不限于为:
方式一:响应业务端的第一标签调用请求,对目标标签数据进行可变长度字符编码,生成json数据,采用应用程序编程接口API接口向业务端返回json数据;
方式二:响应业务端的第二标签调用请求,对目标标签数据进行可变长度字符编码,生成文件数据,采用文件调用接口向业务端返回文件数据。
本实施例的方案支持两种标签输出的方式:方式①以API接口的形式供商家自有***的标签库进行消费,编码方式采用utf-8编码,数据格式为json;方式②以.csv文件下载的形式供商家用户进行应用,编码方式采用utf-8编码,数据格式为文件。
在本实施例的一个实施方式中,在从客户关系管理CRM***读取原始样本数据之前,还包括:
S11,初始化若干个调度容器的业务处理器类,其中,调度容器包括多个容器空间,每个容器空间对应一个业务处理器类,每个业务处理器类对应一个标签类型,每个业务处理器类包括多个由责任链连接的代码数据;
在一些示例中,初始化调度容器的业务处理器类包括:对调度最小化动作进行对比,并根据对比结果提取业务处理器的抽象模板,得到业务处理器虚类;采用业务处理器虚类生成业务处理器类;调用调度容器的主程序初始化所有业务处理器的业务处理器类。
可选的,本实施例采用FIFO管道管理多个调度容器的调用时序,以保证硬件资源的有序调用,防止硬件开销溢出。在初始化若干个调度容器的业务处理器类之前,还包括:确定当前执行的目标调度容器;解析目标调度容器的容器令牌;采用容器令牌在先进先出FIFO管道定位目标调度容器的调用时序。
本实施例在配置基于FIFO管道的执行队列时,包括如下步骤:
步骤1,配置FIFO(First Input First Output,先进先出)队列入队;
步骤2,配置令牌基本属性(包括不限于存储格式、加密方式等),每个令牌用于标识FIFO管道中每个对象,即调度容器;
步骤3,配置队列执行环境(包括不限于管道文件、日志、令牌路径、超时阈值、软硬件版本等);
步骤4,设置队列初始化参数(包括不限于占用硬件资源(cpu、内存)、操作***版本、队初始化令牌数、令牌加密方式等);
步骤5,设置队列业务命令列表(文本文件),初始化队列(操作***进程);
步骤6,启动队列(命令行后台运行方式);
步骤7,根据需要,在修改业务命令列表后重新执行步骤4~6。
S12,在初始化完成之后,获取业务需求信息,并根据业务需求信息解析调度容器的处理器列表和代码环境参数;
S13,若处理器列表和代码环境参数解析成功,解析处理器列表的类参数;
S14,在类参数解析成功之后,启动调度容器。
在本实施例的一些场景中,采用调度容器(调度框架)控制动态标签的输出流程,调度容器包括多个业务处理器类,每个业务处理器类对应一个标签类型。
在一个示例中,调度容器的配置流程包括:
步骤1,对调度最小化动作进行对比,提取处理器抽象模板形成虚类(如Python代码中的基类);
步骤2,实现对应诸多业务的处理器类(抽象模板子类);
步骤3,主程序初始化所有的业务处理器类;
步骤4,主程序开始解析命令行参数,第一阶段解析本次所需业务处理器列表和环境等公共参数;第二阶段解析业务处理器类参数;加载入参数表;
步骤5,处理第一阶段错误,如发生则不进入第二阶段;进入第二阶段后开始执行处理器核心调度方法(串行执行,并发执行依赖执行队列);
步骤6,增加、删减业务处理器类后重新执行上述步骤1~5。
本发明提供了一种在消费者敏感数据不出电商平台域的标签预测方法和***,在电商平台的CRM***上进行数据建模,输出商家数字化营销所需要的动态标签,满足业务实时性的需求。
图3是本发明实施例的框架流程示意图,包括数据加载模块,数据建模模块,标签输出模块,主调度模块,下面对各个模块的功能进行说明:
数据加载模块,该模块从部署在平台域的客户关系管理(CRM)***中加载建模所需的原始数据,并根据建模的需求进行数据清洗和特征工程,以输出满足模型需求的特征数据。
数据建模模块,该模块根据商家标签需求选择合适的模型进行模型训练和模型预测,并将标签结果输出给标签输出模块。
标签输出模块,该模块提供两种方式进行标签输出,方式①以API接口的形式供商家自有***的标签库进行消费,方式②以.csv文件下载的形式供商家用户进行应用。
主调度模块,该模块提供整体流程调度,以定时和随机两种方式进行流程管理。本模块由两部分构成:①基于责任链模式的高性能、可扩展性调度框架,支持多样性建模(含特征工程)。②基于FIFOs管道通讯的受控(有限令牌、时序)多线程、高并发的执行队列。
数据加载模块在执行数据加载时,包括如下步骤:
步骤一:“数据加载模块”从部署在平台域的客户关系管理(CRM)***中加载建模所需的原始数据,原始数据主要包括订单数据、会员数据和商品数据;
步骤二:“数据加载模块”对原始数据进行数据清洗,根据3.2.2中模型算法的要求进行特征工程,将特征加工后的特征以特征表的形式存储在数据库中供模型进行消费,特征表的格式为{user_id/item_id,feature_1,feature_2,…}。
数据建模模块在执行数据建模时,包括如下步骤:
步骤一:商家用户根据业务需求,在“数据建模模块”中,根据所需要的标签类型选择相应的模型进行建模,比如说,选择“购买概率标签”会调用购买概率预测模型,或“商品偏好标签”会调用商品推荐模型;
步骤二:模型训练;
步骤三:标签预测;
步骤四:对标签预测得到的连续型数值进行离散化处理,比如说,将购买概率(0-1之间的数值)离散化为(高、中、低)三个购买概率;
步骤五:将标签结果以{user_id:标签值}的形式保存在数据库中,供3.2.3标签输出模块调用;
标签输出模块在标签输出时,包括如下步骤:
步骤一:通过主调度模块,设定标签的计算、输出任务调度;
步骤二:以两种方式进行标签输出:方式①以API接口的形式供商家自有***的标签库进行消费,编码方式采用utf-8编码,数据格式为json;方式②以.csv文件下载的形式供商家用户进行应用,编码方式采用utf-8编码,数据格式为文件。
本实施例的方案,克服了需要向电商平台提出数据出域预申请,等待若干个工作日审核通过后,才能获取建模需要的敏感数据到本地再进行建模预测的困难;可以在交易数据等敏感数据不出域的条件下,输出商家营销所需要的动态标签,满足业务实时性的需求。动态标签既可以被智能化运营工具调用,也可以独立输出给业务人员使用;通过主调度模块可以定时计算输出,也可以按需计算输出。可以在交易数据不出电商域的条件下进行数据建模;可以满足商家业务实时性的需求。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
在本实施例中还提供了一种动态标签的输出装置,用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的一种动态标签的输出装置的结构框图,如图4所示,该装置包括:采集模块40,处理模块42,预测模块44,返回模块46,其中,
采集模块40,用于从客户关系管理CRM***读取原始样本数据;
处理模块42,用于对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据;
预测模块44,用于将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据;
返回模块46,用于响应业务端的标签调用请求,向所述业务端返回所述目标标签数据。
可选的,所述处理模块包括:处理单元,用于对所述原始样本数据进行去重清洗和格式内容清洗,得到第一样本数据;提取单元,用于从所述第一样本数据中选择并提取样本归属标识和样本特征;存储单元,用于以所述样本归属标识为key,对应的样本特征为value构建特征表,并将所述特征表确定为中间样本数据。
可选的,所述预测模块包括:确定单元,用于确定待输出的标签类型;预测单元,用于若所述标签类型为概率标签,从模型库中选择概率预测模型,将所述中间样本数据作为所述概率预测模型的输入数据,在所述CRM***本地从所述概率预测模型输出第一目标标签数据;若所述标签类型为偏好标签,从模型库中选择商品推荐模型,将所述中间样本数据作为所述商品推荐模型的输入数据,在所述CRM***本地从所述商品推荐模型输出第二目标标签数据,其中,所述模型库包括所述概率预测模型和所述商品推荐模型。
可选的,所述返回模块包括以下之一:第一返回单元,用于响应业务端的第一标签调用请求,对所述目标标签数据进行可变长度字符编码,生成json数据,采用应用程序编程接口API接口向所述业务端返回所述json数据;第二返回单元,用于响应业务端的第二标签调用请求,对所述目标标签数据进行可变长度字符编码,生成文件数据,采用文件调用接口向所述业务端返回所述文件数据。
可选的,所述装置还包括:初始化模块,用于在所述采集模块从客户关系管理CRM***读取原始样本数据之前,初始化若干个调度容器的业务处理器类,其中,所述调度容器包括多个容器空间,每个容器空间对应一个业务处理器类,每个业务处理器类对应一个标签类型,每个业务处理器类包括多个由责任链连接的代码数据;第一解析模块,用于在初始化完成之后,获取业务需求信息,并根据所述业务需求信息解析所述调度容器的处理器列表和代码环境参数;第二解析模块,用于若所述处理器列表和代码环境参数解析成功,解析所述处理器列表的类参数;启动模块,用于在所述类参数解析成功之后,启动所述调度容器。
可选的,所述初始化模块包括:提取单元,用于对调度最小化动作进行对比,并根据对比结果提取业务处理器的抽象模板,得到业务处理器虚类;生成单元,用于采用所述业务处理器虚类生成业务处理器类;初始化单元,用于调用所述调度容器的主程序初始化所有业务处理器的业务处理器类。
可选的,所述装置还包括:确定模块,用于在所述初始化模块初始化若干个调度容器的业务处理器类之前,确定当前执行的目标调度容器;第三解析模块,用于解析所述目标调度容器的容器令牌;定位模块,用于采用所述容器令牌在先进先出FIFO管道定位所述目标调度容器的调用时序。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例3
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,从客户关系管理CRM***读取原始样本数据;
S2,对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据;
S3,将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据;
S4,响应业务端的标签调用请求,向所述业务端返回所述目标标签数据。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,从客户关系管理CRM***读取原始样本数据;
S2,对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据;
S3,将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据;
S4,响应业务端的标签调用请求,向所述业务端返回所述目标标签数据。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
图5是本发明实施例的一种电子设备的结构图,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,存储器503,用于存放计算机程序;处理器501,用于执行存储器503上所存放的程序。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (9)
1.一种动态标签的输出方法,其特征在于,包括:
从客户关系管理CRM***读取原始样本数据;
对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据;
将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据;
响应业务端的标签调用请求,向所述业务端返回所述目标标签数据;
其中,在从客户关系管理CRM***读取原始样本数据之前,所述方法还包括:初始化若干个调度容器的业务处理器类,其中,所述调度容器包括多个容器空间,每个容器空间对应一个业务处理器类,每个业务处理器类对应一个标签类型,每个业务处理器类包括多个由责任链连接的代码数据;在初始化完成之后,获取业务需求信息,并根据所述业务需求信息解析所述调度容器的处理器列表和代码环境参数;若所述处理器列表和代码环境参数解析成功,解析所述处理器列表的类参数;在所述类参数解析成功之后,启动所述调度容器。
2.根据权利要求1所述的方法,其特征在于,对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据包括:
对所述原始样本数据进行去重清洗和格式内容清洗,得到第一样本数据;
从所述第一样本数据中选择并提取样本归属标识和样本特征;
以所述样本归属标识为key,对应的样本特征为value构建特征表,并将所述特征表确定为中间样本数据。
3.根据权利要求1所述的方法,其特征在于,将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据包括:
确定待输出的标签类型;
若所述标签类型为概率标签,从模型库中选择概率预测模型,将所述中间样本数据作为所述概率预测模型的输入数据,在所述CRM***本地从所述概率预测模型输出第一目标标签数据;若所述标签类型为偏好标签,从模型库中选择商品推荐模型,将所述中间样本数据作为所述商品推荐模型的输入数据,在所述CRM***本地从所述商品推荐模型输出第二目标标签数据,其中,所述模型库包括所述概率预测模型和所述商品推荐模型。
4.根据权利要求1所述的方法,其特征在于,响应业务端的标签调用请求,向所述业务端返回所述目标标签数据包括以下之一:
响应业务端的第一标签调用请求,对所述目标标签数据进行可变长度字符编码,生成json数据,采用应用程序编程接口API接口向所述业务端返回所述json数据;
响应业务端的第二标签调用请求,对所述目标标签数据进行可变长度字符编码,生成文件数据,采用文件调用接口向所述业务端返回所述文件数据。
5.根据权利要求1所述的方法,其特征在于,初始化调度容器的业务处理器类包括:
对调度最小化动作进行对比,并根据对比结果提取业务处理器的抽象模板,得到业务处理器虚类;
采用所述业务处理器虚类生成业务处理器类;
调用所述调度容器的主程序初始化所有业务处理器的业务处理器类。
6.根据权利要求1所述的方法,其特征在于,在初始化若干个调度容器的业务处理器类之前,所述方法还包括:
确定当前执行的目标调度容器;
解析所述目标调度容器的容器令牌;
采用所述容器令牌在先进先出FIFO管道定位所述目标调度容器的调用时序。
7.一种动态标签的输出装置,其特征在于,包括:
采集模块,用于从客户关系管理CRM***读取原始样本数据;
处理模块,用于对所述原始样本数据进行数据清洗和特征提取,输出符合预设要求的中间样本数据;
预测模块,用于将所述中间样本数据输入预训练的标签预测模型,在所述CRM***上输出目标标签数据;
返回模块,用于响应业务端的标签调用请求,向所述业务端返回所述目标标签数据;
其中,所述装置还包括:初始化模块,用于在所述采集模块从客户关系管理CRM***读取原始样本数据之前,初始化若干个调度容器的业务处理器类,其中,所述调度容器包括多个容器空间,每个容器空间对应一个业务处理器类,每个业务处理器类对应一个标签类型,每个业务处理器类包括多个由责任链连接的代码数据;第一解析模块,用于在初始化完成之后,获取业务需求信息,并根据所述业务需求信息解析所述调度容器的处理器列表和代码环境参数;第二解析模块,用于若所述处理器列表和代码环境参数解析成功,解析所述处理器列表的类参数;启动模块,用于在所述类参数解析成功之后,启动所述调度容器。
8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至6中任一项所述的方法的步骤。
9.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:
存储器,用于存放计算机程序;
处理器,用于通过运行存储器上所存放的程序来执行权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211536454.1A CN115934675B (zh) | 2022-12-01 | 2022-12-01 | 动态标签的输出方法及装置、存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211536454.1A CN115934675B (zh) | 2022-12-01 | 2022-12-01 | 动态标签的输出方法及装置、存储介质、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115934675A CN115934675A (zh) | 2023-04-07 |
CN115934675B true CN115934675B (zh) | 2023-10-03 |
Family
ID=86653768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211536454.1A Active CN115934675B (zh) | 2022-12-01 | 2022-12-01 | 动态标签的输出方法及装置、存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115934675B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764663A (zh) * | 2018-05-15 | 2018-11-06 | 广东电网有限责任公司信息中心 | 一种电力客户画像生成管理的方法及*** |
CN115344757A (zh) * | 2022-02-07 | 2022-11-15 | 花瓣云科技有限公司 | 一种标签预测方法、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112988727B (zh) * | 2021-03-25 | 2022-09-16 | 北京百度网讯科技有限公司 | 数据标注方法、装置、设备、存储介质及计算机程序产品 |
-
2022
- 2022-12-01 CN CN202211536454.1A patent/CN115934675B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764663A (zh) * | 2018-05-15 | 2018-11-06 | 广东电网有限责任公司信息中心 | 一种电力客户画像生成管理的方法及*** |
CN115344757A (zh) * | 2022-02-07 | 2022-11-15 | 花瓣云科技有限公司 | 一种标签预测方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115934675A (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10142106B2 (en) | System and method for securing sensitive data | |
CN112527528A (zh) | 基于消息队列的数据传输方法、装置及存储介质 | |
CN107273979B (zh) | 基于服务级别来执行机器学习预测的方法及*** | |
CN108388563B (zh) | 信息输出方法和装置 | |
US20200175570A1 (en) | Method for processing orders and electronic device | |
CN112383533A (zh) | 报文格式转换方法及装置 | |
US20170207984A1 (en) | Guaranteed response pattern | |
CN113592593B (zh) | 序列推荐模型的训练及应用方法、装置、设备及存储介质 | |
CN110866040A (zh) | 用户画像生成方法、装置和*** | |
CN111651140B (zh) | 基于工作流的服务方法及装置 | |
CN108932640B (zh) | 用于处理订单的方法和装置 | |
CN109753424B (zh) | Ab测试的方法和装置 | |
CN111427915A (zh) | 信息处理方法及装置、存储介质、电子设备 | |
CN115934675B (zh) | 动态标签的输出方法及装置、存储介质、电子设备 | |
KR20180042726A (ko) | 클라우드 서비스 기반의 빅데이터 분석 방법 및 장치 | |
CN115328457A (zh) | 基于参数配置的表单页面实现方法和装置 | |
CN115495658A (zh) | 一种数据处理方法和装置 | |
CN111601291B (zh) | 一种rfid中间件、发布订阅***和数据传输方法 | |
CN112799797B (zh) | 一种任务管理的方法和装置 | |
CN113973139A (zh) | 一种消息处理的方法和装置 | |
CN113297358A (zh) | 数据处理方法、装置、服务器和计算机可读存储介质 | |
CN112860636A (zh) | 操作数据的存储方法和装置、电子设备和存储介质 | |
CN113448960A (zh) | 一种导入表格文件的方法和装置 | |
CN116501365B (zh) | 基于算法平台的资源调用方法、装置及设备 | |
CN113535186B (zh) | 业务应用部署方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |