CN110135901A - 一种企业用户画像构建方法、***、介质和电子设备 - Google Patents
一种企业用户画像构建方法、***、介质和电子设备 Download PDFInfo
- Publication number
- CN110135901A CN110135901A CN201910389932.2A CN201910389932A CN110135901A CN 110135901 A CN110135901 A CN 110135901A CN 201910389932 A CN201910389932 A CN 201910389932A CN 110135901 A CN110135901 A CN 110135901A
- Authority
- CN
- China
- Prior art keywords
- portrait
- data
- enterprise
- enterprise customer
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种企业用户画像构建方法、***、介质及电子设备,所述方法包括:获取企业用户在互联网平台的历史特征数据,其中,所述历史特征数据包括基本属性数据、行为属性数据及业务属性数据;清洗所述历史特征数据中的异常数据;分析不同企业用户的所述历史特征数据,构建决策树训练模型;根据所述决策树训练模型,对企业用户贴标签,构建企业用户画像。
Description
技术领域
本发明涉及用户画像技术领域,具体而言,涉及一种企业用户画像构建方法、***、介质和电子设备。
背景技术
在互联网逐渐步入大数据时代后,消费者的一切行为在企业面前都将是可视化的。企业的专注点日也开始益聚焦于怎样利用大数据来为精准地向用户提供服务;于是,用户画像也就应运而生了。
用户画像,即用户信息标签化,就是通过收集与分析用户社会属性、生活习惯、行为等主要信息的数据之后,完美地抽象出一个用户的全貌。用户画像实际上是挖掘其中隐藏的价值信息,分析和总结用户的特征行为;目前在B2C、电信等领域运用较多。
此外,随着互联网的迅速发展,网络视频已经成为人们获取视频信息和娱乐信息的主要来源之一。并且视频数量在快速增长,各大视频网站或者客户端为了提高用户的体验效果,往往会根据视频用户的喜爱程度对用户进行相应的视频推荐。向用户推荐视频信息时采用的关键技术之一是建立用户画像,用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来。
目前,用户画像主要通过数据整合及模型训练完成。在数据整合方面,主要是通过用户留在互联网平台上一些行为、交易数据,将结构化数据和非结构化数据进行了整合;模型训练方面,主要是通过机器学***台企业用户的精准画像,需充分考虑业务场景的变化及企业自身的特性。然而,随着业务流程的变化,企业用户的行为也会随之改变,其画像也会改变;同时企业规模、所属行业的不同,企业用户画像的结果也会不同。
因此,在长期的研发当中,发明人对用户画像进行了大量的研究,提出了一种企业用户画像构建方法,以解决上述技术问题之一。
发明内容
本发明的目的在于提供一种企业用户画像构建方法、***、介质和电子设备,能够解决上述提到的至少一个技术问题。具体方案如下:
一种企业用户画像构建方法,该方法用于企业用户画像构建***中,所述画像构建***包括获取模块、清洗模块、模型构建模块、画像构建模块,该方法包括:
步骤1,获取模块获取企业用户在互联网平台的历史特征数据,其中,所述历史特征数据包括基本属性数据、行为属性数据及业务属性数据;
步骤2,清洗模块清洗所述历史特征数据中的异常数据;
步骤3,模型构建模块分析不同企业用户的所述历史特征数据,构建决策树训练模型;
步骤4,画像构建模块根据所述决策树训练模型,对企业用户贴标签,构建企业用户画像。
进一步的,所述基本属性数据包括企业ID、企业规模、企业在互联网平台注册时间、企业所属行业。
进一步的,所述行为属性数据包括企业用户进入互联网平台网站后是否浏览过店铺、在互联网平台网站的停留时间、是否有过咨询行为。
进一步的,所述业务属性数据包括提交订单时间、提交订单数额、订单来源渠道、成交订单时间、成交订单数额、是否撤销、订单所属类目、交易模式、近一年提交订单次数、成交订单次数。
进一步的,所述异常数据包括:历史特征数据中的空数据、重复数据、不符合逻辑数据。
进一步的,根据所述决策树训练模型,对企业用户贴标签,包括:
从根节点开始,测试待分类企业用户相应的特征数据;
根据所述测试结果将所述特征数据分配到其子节点,此时每个子节点对应着该特征的一个取值;
继续对所述特征数据进行递归测试并分配,直到到达叶节点,将叶节点存放的类别作为企业用户标签。
进一步的,进一步包括:对所述企业用户画像进行分析,获得互联网平台客户的所属类别。
一种企业用户画像构建***,该***用于实现所述画像构建方法,包括:
获取模块,用于获取企业用户在互联网平台的历史特征数据,其中,所述历史特征数据包括基本属性数据、行为属性数据及业务属性数据;
清洗模块,用于清洗所述历史特征数据中的异常数据;
模型构建模块,用于分析不同企业用户的所述历史特征数据,构建决策树训练模型;
画像构建模块,用于根据所述决策树训练模型,对企业用户贴标签,构建企业用户画像。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现所述画像构建方法。
一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述画像构建方法。
本发明实施例的上述方案与现有技术相比,本发明实施例根据中小微企业的基本属性、行为、交易等数据,刻画不同规模企业服务需求的特点,相比人工营销更具针对性和实效,同时对于客户留存和客户价值挖掘提供了一种解决方案。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明实施例的一种企业用户画像构建方法的流程图;
图2示出了根据本发明实施例的根据所述决策树训练模型对企业用户贴标签的方法流程图;
图3示出了根据本发明实施例的一种企业用户画像构建***的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述……,但这些……不应限于这些术语。这些术语仅用来将……区分开。例如,在不脱离本发明实施例范围的情况下,第一……也可以被称为第二……,类似地,第二……也可以被称为第一……。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者装置中还存在另外的相同要素。
实施例1
请参阅图1,本发明实施例提供一种企业用户画像构建方法,该方法通过充分考虑业务场景、企业的规模及行业属性,实现对不同类别的企业进行画像。
该方法用于企业用户画像构建***中,所述画像构建***包括获取模块、清洗模块、模型构建模块、画像构建模块,该方法包括:
步骤1,获取模块获取企业用户在互联网平台的历史特征数据,其中,所述历史特征数据包括基本属性数据、行为属性数据及业务属性数据;
具体的,主要采集企业基本属性、行为属性、业务属性三个方面的历史数据。所述企业的基本属性数据包括:企业ID、企业规模、企业在平台注册时间、企业所属行业。所述行为属性数据包括:企业雇主从进入平台网站到离开平台网站的主要路径,主要包括企业雇主是否浏览过店铺、在平台网站的停留时间、是否有过咨询行为。所述业务属性数据主要包括:提交订单时间、提交订单数额、订单来源渠道、成交订单时间、成交订单数额、是否撤销、订单所属类目、交易模式、近一年提交订单次数、成交订单次数。
步骤2,清洗模块清洗所述历史特征数据中的异常数据;
具体的,对所述历史特征数据中的异常数据进行删除;所述异常数据包括各个属性特征中的空数据、重复数据及不符合逻辑数据。
进一步可包括,对所述清洗后的特征数据进行0-1标准化计算处理。也就是说,将分类变量进行0-1标准化计算处理。
步骤3,模型构建模块分析不同企业用户的所述历史特征数据,构建决策树训练模型;
具体的,利用企业用户的历史基本属性数据、行为属性数据、业务属性数据构建决策树训练模型。决策树(decision tree)是一个树结构,具体可以是二叉树或非二叉树;树结构中每个叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。所述决策树中根节点特征的选择过程包括:
首先,确定每个变量的信息熵H(X),变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大,熵是整个***的平均消息量。
其次,确定每个变量的条件信息熵,即按照某种条件下的信息熵
再次,利用信息增益率gr=IG(X)/Hm(X)=H(Y)-H(Y/X)/Hm(X)选择特征,其中,IG(X)=H(Y)-H(Y/X)为信息增益。
步骤4,画像构建模块根据所述决策树训练模型,对企业用户贴标签,构建企业用户画像。具体的,请参阅图2,所述根据所述决策树训练模型对企业用户贴标签,包括:
步骤41,从根节点开始,测试待分类企业用户相应的特征数据;
步骤42,根据所述测试结果将所述特征数据分配到其子节点,此时每个子节点对应着该特征的一个取值;
步骤43,继续对所述特征数据进行递归测试并分配,直到到达叶节点,将叶节点存放的类别作为企业用户标签。
进一步,所述方法包括:对所述企业用户画像进行分析,获取互联网平台客户的所属类别。所述客户类别包括重要价值客户、重要保持客户、重要发展客户及重要挽留客户。
具体的,对所述企业用户画像进行分析是采用RFM模型进行分类,RFM分析是根据企业用户活跃程度和交易金额贡献,进行用户价值细分的一种方法;具体可以通过最近一次消费R(Recency),消费频率F(Frequency),消费金额M(Monetary)三个维度,将企业用户划分为重要价值客户、重要保持客户、重要发展客户及重要挽留客户这4种类型。
具体分析过程包括:首先,计算RFM各项分值,其中,消费日期距离当前日期越近,得分越高;交易频率越高,得分越高;交易金额越高,得分越高;然后归总RFM分值;最后根据RFM分值对企业用户分类。
另一实施例中,可进一步将数据的分析结果及每个企业用户的画像汇总并进行可视化呈现。具体的,将可视化结果给营销人员进行相应处理。
本发明实施例提供的企业用户画像构建方法根据中小微企业的基本属性、行为属性、业务属性等数据,刻画不同规模企业服务需求的特点,相比人工营销更具针对性和实效,同时对于客户留存和客户价值挖掘提供了一种解决方案。
实施例2
请参阅图3,本发明实施例提供一种企业用户画像构建***300,该***300包括:获取模块310,清洗模块320,模型构建模块330及画像构建模块340。
所述获取模块310用于获取企业用户在互联网平台的历史特征数据,其中,所述历史特征数据包括基本属性数据、行为属性数据及业务属性数据。具体的,所述企业的基本属性数据包括:企业ID、企业规模、企业在平台注册时间、企业所属行业。所述行为属性数据包括:企业雇主从进入平台网站到离开平台网站的主要路径,主要包括企业雇主是否浏览过店铺、在平台网站的停留时间、是否有过咨询行为。所述业务属性数据主要包括:提交订单时间、提交订单数额、订单来源渠道、成交订单时间、成交订单数额、是否撤销、订单所属类目、交易模式、近一年提交订单次数、成交订单次数。
所述清洗模块320用于清洗所述历史特征数据中的异常数据。具体的,所述清洗模块320对所述历史特征数据中的异常数据进行删除;所述异常数据包括各个属性特征中的空数据、重复数据及不符合逻辑数据。
进一步可包括标准处理模块350,用于对所述清洗后的特征数据进行0-1标准化计算处理。也就是说,将分类变量进行0-1标准化计算处理。
所述模型构建模块330用于分析不同企业用户的所述历史特征数据,构建决策树训练模型。具体的,所述模型构建模块330利用企业用户的历史基本属性数据、行为属性数据、业务属性数据构建决策树训练模型。决策树(decision tree)是一个树结构,具体可以是二叉树或非二叉树;树结构中每个叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。所述模型构建模块330构建决策树过程中对根节点特征的选择方法包括:
首先,确定每个变量的信息熵H(X),变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大,熵是整个***的平均消息量。
其次,确定每个变量的条件信息熵,即按照某种条件下的信息熵
再次,利用信息增益率gr=IG(X)/Hm(X)=H(Y)-H(Y/X)/Hm(X)选择特征,其中,IG(X)=H(Y)-H(Y/X)为信息增益。
所述画像构建模块340用于根据所述决策树训练模型,对企业用户贴标签,构建企业用户画像。具体的,所述画像构建模块340,包括:
测试模块341,用于从根节点开始,测试待分类企业用户相应的特征数据;
分配模块342,用于根据所述测试结果将所述特征数据分配到其子节点,此时每个子节点对应着该特征的一个取值;
递归模块343,用于继续对所述特征数据进行递归测试并分配,直到到达叶节点,将叶节点存放的类别作为企业用户标签。
进一步,所述***300包括分析模块360,用于对所述企业用户画像进行分析,获取互联网平台客户的所属类别。所述客户类别包括重要价值客户、重要保持客户、重要发展客户及重要挽留客户。
具体的,所述分析模块360采用RFM模型对企业用户进行分类,RFM分析是根据企业用户活跃程度和交易金额贡献,进行用户价值细分的一种方法;可通过最近一次消费R(Recency),消费频率F(Frequency),消费金额M(Monetary)三个维度,将企业用户划分为重要价值客户、重要保持客户、重要发展客户及重要挽留客户这4种类型。
所述分析模块360的分析过程包括:首先,计算RFM各项分值,其中,消费日期距离当前日期越近,得分越高;交易频率越高,得分越高;交易金额越高,得分越高;然后归总RFM分值;最后根据RFM分值对企业用户分类。
进一步,所述***300还包括一可视化展示模块370,用于将数据的分析结果及每个企业用户的画像汇总并进行可视化呈现。具体的,将可视化结果给营销人员进行相应处理。
本发明实施例提供的企业用户画像构建***根据中小微企业的基本属性、行为属性、业务属性等数据,刻画不同规模企业服务需求的特点,相比人工营销更具针对性和实效,同时对于客户留存和客户价值挖掘提供了一种解决方案。
实施例3
本实施例提供一种电子设备,该设备用于财税平台的智能匹配方法,所述电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取企业用户在互联网平台的历史特征数据,其中,所述历史特征数据包括基本属性数据、行为属性数据及业务属性数据;
清洗所述历史特征数据中的异常数据;
分析不同企业用户的所述历史特征数据,构建决策树训练模型;
根据所述决策树训练模型,对企业用户贴标签,构建企业用户画像。
实施例4
本公开实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的***真伪查验方法。
实施例5
本公开实施例提供了一种电子设备,本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。
电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数据。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下装置可以连接至I/O接口:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数据。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
Claims (10)
1.一种企业用户画像构建方法,该方法用于企业用户画像构建***中,所述画像构建***包括获取模块、清洗模块、模型构建模块、画像构建模块,其特征在于,该方法包括:
步骤1,获取模块获取企业用户在互联网平台的历史特征数据,其中,所述历史特征数据包括基本属性数据、行为属性数据及业务属性数据;
步骤2,清洗模块清洗所述历史特征数据中的异常数据;
步骤3,模型构建模块分析不同企业用户的所述历史特征数据,构建决策树训练模型;
步骤4,画像构建模块根据所述决策树训练模型,对企业用户贴标签,构建企业用户画像。
2.根据权利要求1所述的画像构建方法,其特征在于,所述基本属性数据包括企业ID、企业规模、企业在互联网平台注册时间、企业所属行业。
3.根据权利要求1所述的画像构建方法,其特征在于,所述行为属性数据包括企业用户进入互联网平台网站后是否浏览过店铺、在互联网平台网站的停留时间、是否有过咨询行为。
4.根据权利要求1所述的画像构建方法,其特征在于,所述业务属性数据包括提交订单时间、提交订单数额、订单来源渠道、成交订单时间、成交订单数额、是否撤销、订单所属类目、交易模式、近一年提交订单次数、成交订单次数。
5.根据权利要求1所述的画像构建方法,其特征在于,所述异常数据包括:历史特征数据中的空数据、重复数据、不符合逻辑数据。
6.根据权利要求1所述的画像构建方法,其特征在于,根据所述决策树训练模型,对企业用户贴标签,包括:
从根节点开始,测试待分类企业用户相应的特征数据;
根据所述测试结果将所述特征数据分配到其子节点,此时每个子节点对应着该特征的一个取值;
继续对所述特征数据进行递归测试并分配,直到到达叶节点,将叶节点存放的类别作为企业用户标签。
7.根据权利要求1所述的画像构建方法,其特征在于,进一步包括:对所述企业用户画像进行分析,获得互联网平台客户的所属类别。
8.一种企业用户画像构建***,该***用于实现如权利要求1至7之一的所述画像构建方法,其特征在于,包括:
获取模块,用于获取企业用户在互联网平台的历史特征数据,其中,所述历史特征数据包括基本属性数据、行为属性数据及业务属性数据;
清洗模块,用于清洗所述历史特征数据中的异常数据;
模型构建模块,用于分析不同企业用户的所述历史特征数据,构建决策树训练模型;
画像构建模块,用于根据所述决策树训练模型,对企业用户贴标签,构建企业用户画像。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述画像构建方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述画像构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389932.2A CN110135901A (zh) | 2019-05-10 | 2019-05-10 | 一种企业用户画像构建方法、***、介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389932.2A CN110135901A (zh) | 2019-05-10 | 2019-05-10 | 一种企业用户画像构建方法、***、介质和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110135901A true CN110135901A (zh) | 2019-08-16 |
Family
ID=67573298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910389932.2A Pending CN110135901A (zh) | 2019-05-10 | 2019-05-10 | 一种企业用户画像构建方法、***、介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110135901A (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717101A (zh) * | 2019-09-30 | 2020-01-21 | 上海淇玥信息技术有限公司 | 基于应用行为的用户分类方法、装置和电子设备 |
CN110942338A (zh) * | 2019-11-01 | 2020-03-31 | 支付宝(杭州)信息技术有限公司 | 一种营销赋能策略的推荐方法、装置和电子设备 |
CN111191713A (zh) * | 2019-12-27 | 2020-05-22 | 大象慧云信息技术有限公司 | 基于***数据的用户画像方法及装置 |
CN111784385A (zh) * | 2020-06-19 | 2020-10-16 | 杭州未名信科科技有限公司 | 面向制造业的客户画像构建方法及装置、计算机存储介质 |
CN111798265A (zh) * | 2020-05-27 | 2020-10-20 | 北京国电通网络技术有限公司 | 一种适用于企业用户的精准营销方法和装置 |
CN111815173A (zh) * | 2020-07-10 | 2020-10-23 | 东软集团(上海)有限公司 | 一种基于关联规则的企业画像评估方法 |
CN111966904A (zh) * | 2020-08-18 | 2020-11-20 | 平安国际智慧城市科技股份有限公司 | 基于多用户画像模型的信息推荐方法和相关装置 |
CN112269778A (zh) * | 2020-10-15 | 2021-01-26 | 西安工程大学 | 一种设备故障诊断方法 |
CN112446744A (zh) * | 2020-12-14 | 2021-03-05 | 成都航天科工大数据研究院有限公司 | 基于工业产品供需平台构建企业画像的方法、***及介质 |
CN112580332A (zh) * | 2020-11-19 | 2021-03-30 | 淮阴工学院 | 一种基于标签分层延深建模的企业画像方法 |
CN113065894A (zh) * | 2021-03-24 | 2021-07-02 | 天天惠民(北京)智能物流科技有限公司 | 基于用户画像及订单分析的数据归集方法、装置及存储介质 |
CN113079148A (zh) * | 2021-03-25 | 2021-07-06 | 恒安嘉新(北京)科技股份公司 | 一种工业互联网安全监测方法、装置、设备及储存介质 |
CN113362097A (zh) * | 2020-03-06 | 2021-09-07 | 北京京东振世信息技术有限公司 | 一种用户确定方法和装置 |
CN113486225A (zh) * | 2021-07-06 | 2021-10-08 | 北京国联视讯信息技术股份有限公司 | 一种基于大数据的企业画像展现方法及*** |
CN113793061A (zh) * | 2021-09-27 | 2021-12-14 | 武汉众邦银行股份有限公司 | 融合层次分析法和rfm的商业银行客户评级方法及装置 |
WO2022016561A1 (zh) * | 2020-07-22 | 2022-01-27 | 江苏宏创信息科技有限公司 | 一种基于大数据的政策画像ai建模***及方法 |
CN114185880A (zh) * | 2021-12-10 | 2022-03-15 | 北京金堤科技有限公司 | 所属行业数据确定方法及其装置 |
CN114238615A (zh) * | 2021-12-14 | 2022-03-25 | 淄博天大创新科技服务有限公司 | 一种企业服务成果数据处理方法及*** |
CN114841734A (zh) * | 2022-04-06 | 2022-08-02 | 杭州脸脸会网络技术有限公司 | 一种商品信息处理方法、装置、***、电子装置和存储介质 |
CN116776006A (zh) * | 2023-08-24 | 2023-09-19 | 中资科技(江苏)有限公司 | 用于企业融资的客户画像构建方法及*** |
CN117726359A (zh) * | 2024-02-08 | 2024-03-19 | 成都纳宝科技有限公司 | 一种互动营销方法、***和设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339806A (zh) * | 2016-08-24 | 2017-01-18 | 北京创业公社征信服务有限公司 | 一种面向企业信息的行业全息画像构建方法及*** |
CN106503015A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的方法 |
US20170132569A1 (en) * | 2015-11-11 | 2017-05-11 | International Business Machines Corporation | Responsive user onboarding |
CN107818344A (zh) * | 2017-10-31 | 2018-03-20 | 上海壹账通金融科技有限公司 | 用户行为进行分类和预测的方法和*** |
-
2019
- 2019-05-10 CN CN201910389932.2A patent/CN110135901A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503015A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的方法 |
US20170132569A1 (en) * | 2015-11-11 | 2017-05-11 | International Business Machines Corporation | Responsive user onboarding |
CN106339806A (zh) * | 2016-08-24 | 2017-01-18 | 北京创业公社征信服务有限公司 | 一种面向企业信息的行业全息画像构建方法及*** |
CN107818344A (zh) * | 2017-10-31 | 2018-03-20 | 上海壹账通金融科技有限公司 | 用户行为进行分类和预测的方法和*** |
Non-Patent Citations (1)
Title |
---|
R语言中文社区: "案例全是电商零售,B2B的用户画像怎么做???", 《HTTPS://WWW.SOHU.COM/A/274428565_466874》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717101A (zh) * | 2019-09-30 | 2020-01-21 | 上海淇玥信息技术有限公司 | 基于应用行为的用户分类方法、装置和电子设备 |
CN110942338A (zh) * | 2019-11-01 | 2020-03-31 | 支付宝(杭州)信息技术有限公司 | 一种营销赋能策略的推荐方法、装置和电子设备 |
CN111191713A (zh) * | 2019-12-27 | 2020-05-22 | 大象慧云信息技术有限公司 | 基于***数据的用户画像方法及装置 |
CN113362097A (zh) * | 2020-03-06 | 2021-09-07 | 北京京东振世信息技术有限公司 | 一种用户确定方法和装置 |
CN113362097B (zh) * | 2020-03-06 | 2023-11-07 | 北京京东振世信息技术有限公司 | 一种用户确定方法和装置 |
CN111798265A (zh) * | 2020-05-27 | 2020-10-20 | 北京国电通网络技术有限公司 | 一种适用于企业用户的精准营销方法和装置 |
CN111784385A (zh) * | 2020-06-19 | 2020-10-16 | 杭州未名信科科技有限公司 | 面向制造业的客户画像构建方法及装置、计算机存储介质 |
CN111815173A (zh) * | 2020-07-10 | 2020-10-23 | 东软集团(上海)有限公司 | 一种基于关联规则的企业画像评估方法 |
WO2022016561A1 (zh) * | 2020-07-22 | 2022-01-27 | 江苏宏创信息科技有限公司 | 一种基于大数据的政策画像ai建模***及方法 |
CN111966904A (zh) * | 2020-08-18 | 2020-11-20 | 平安国际智慧城市科技股份有限公司 | 基于多用户画像模型的信息推荐方法和相关装置 |
CN111966904B (zh) * | 2020-08-18 | 2023-09-05 | 深圳平安智慧医健科技有限公司 | 基于多用户画像模型的信息推荐方法和相关装置 |
CN112269778A (zh) * | 2020-10-15 | 2021-01-26 | 西安工程大学 | 一种设备故障诊断方法 |
CN112580332B (zh) * | 2020-11-19 | 2022-07-12 | 淮阴工学院 | 一种基于标签分层延深建模的企业画像方法 |
CN112580332A (zh) * | 2020-11-19 | 2021-03-30 | 淮阴工学院 | 一种基于标签分层延深建模的企业画像方法 |
CN112446744A (zh) * | 2020-12-14 | 2021-03-05 | 成都航天科工大数据研究院有限公司 | 基于工业产品供需平台构建企业画像的方法、***及介质 |
CN112446744B (zh) * | 2020-12-14 | 2023-08-08 | 成都航天科工大数据研究院有限公司 | 基于工业产品供需平台构建企业画像的方法、***及介质 |
CN113065894A (zh) * | 2021-03-24 | 2021-07-02 | 天天惠民(北京)智能物流科技有限公司 | 基于用户画像及订单分析的数据归集方法、装置及存储介质 |
CN113079148A (zh) * | 2021-03-25 | 2021-07-06 | 恒安嘉新(北京)科技股份公司 | 一种工业互联网安全监测方法、装置、设备及储存介质 |
CN113486225B (zh) * | 2021-07-06 | 2023-10-31 | 北京国联视讯信息技术股份有限公司 | 一种基于大数据的企业画像展现方法及*** |
CN113486225A (zh) * | 2021-07-06 | 2021-10-08 | 北京国联视讯信息技术股份有限公司 | 一种基于大数据的企业画像展现方法及*** |
CN113793061A (zh) * | 2021-09-27 | 2021-12-14 | 武汉众邦银行股份有限公司 | 融合层次分析法和rfm的商业银行客户评级方法及装置 |
CN114185880A (zh) * | 2021-12-10 | 2022-03-15 | 北京金堤科技有限公司 | 所属行业数据确定方法及其装置 |
CN114238615A (zh) * | 2021-12-14 | 2022-03-25 | 淄博天大创新科技服务有限公司 | 一种企业服务成果数据处理方法及*** |
CN114841734A (zh) * | 2022-04-06 | 2022-08-02 | 杭州脸脸会网络技术有限公司 | 一种商品信息处理方法、装置、***、电子装置和存储介质 |
CN116776006A (zh) * | 2023-08-24 | 2023-09-19 | 中资科技(江苏)有限公司 | 用于企业融资的客户画像构建方法及*** |
CN116776006B (zh) * | 2023-08-24 | 2023-10-27 | 中资科技(江苏)有限公司 | 用于企业融资的客户画像构建方法及*** |
CN117726359A (zh) * | 2024-02-08 | 2024-03-19 | 成都纳宝科技有限公司 | 一种互动营销方法、***和设备 |
CN117726359B (zh) * | 2024-02-08 | 2024-04-26 | 成都纳宝科技有限公司 | 一种互动营销方法、***和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110135901A (zh) | 一种企业用户画像构建方法、***、介质和电子设备 | |
US11488225B2 (en) | Method, medium, and system for surfacing recommendations | |
CN110111156A (zh) | 一种客户流失预警方法、***、介质和电子设备 | |
WO2020227434A1 (en) | Predictive, machine-learning, locale-aware computer models suitable for location- and trajectory-aware training sets | |
WO2020001106A1 (zh) | 分类模型的训练方法、店铺分类的方法及装置 | |
CN107908740A (zh) | 信息输出方法和装置 | |
US20200234218A1 (en) | Systems and methods for entity performance and risk scoring | |
CN112256762B (zh) | 基于产业地图的企业画像方法、***、设备及介质 | |
WO2019072128A1 (zh) | 对象识别方法及其*** | |
CN112215448A (zh) | 分配客服的方法和装置 | |
CN109685537A (zh) | 用户行为的分析方法、装置、介质和电子设备 | |
CN108932625A (zh) | 用户行为数据的分析方法、装置、介质和电子设备 | |
CN109784352A (zh) | 一种评估分类模型的方法和装置 | |
CN107679916A (zh) | 用于获取用户兴趣度的方法及装置 | |
CN112950359B (zh) | 一种用户识别方法和装置 | |
CN109978594B (zh) | 订单处理方法、装置及介质 | |
WO2021093320A1 (zh) | 用于输出信息的方法和装置 | |
CN112287208B (zh) | 用户画像生成方法、装置、电子设备及存储介质 | |
WO2020150597A1 (en) | Systems and methods for entity performance and risk scoring | |
Özdemir et al. | Comparison of machine learning classification algorithms for purchasing forecast | |
CN115983902A (zh) | 基于用户实时事件的信息推送方法及*** | |
CN115795345A (zh) | 信息处理方法、装置、设备及存储介质 | |
CN110033292A (zh) | 信息输出方法和装置 | |
CN112927050A (zh) | 待推荐金融产品确定方法、装置、电子设备及存储介质 | |
CN109344386B (zh) | 文本内容标识方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190816 |
|
RJ01 | Rejection of invention patent application after publication |