CN109003027A - 一种画像标签的管理方法及*** - Google Patents
一种画像标签的管理方法及*** Download PDFInfo
- Publication number
- CN109003027A CN109003027A CN201810780152.6A CN201810780152A CN109003027A CN 109003027 A CN109003027 A CN 109003027A CN 201810780152 A CN201810780152 A CN 201810780152A CN 109003027 A CN109003027 A CN 109003027A
- Authority
- CN
- China
- Prior art keywords
- label
- portrait
- data
- model
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种画像标签的管理方法及***,该方法包括:采集原始数据,原始数据包括:业务数据、行为数据和回流数据;对所述原始数据按照预设清洗条件进行数据清洗,得到清洗后数据;根据清洗后的数据,为每类主体建立对应的画像模型;根据所述清洗后数据和画像模型,生成每个画像模型对应的各个实体的画像标签。本发明提供了画像标签筛选和可视化分析功能,并且标签的使用效果数据可以回流到***,帮助***运维人员合理更新、增加、删除标签,提高标签的准确性和标签的使用效率。
Description
技术领域
本发明涉及互联网领域,尤其涉及一种画像标签的管理方法及***。
背景技术
车货匹配平台让货主和司机可以在线上下订单实现货物的运输,网络之间的数据交互使车货匹配平台融合了大量的司机货主用户数据,为方便用户的管理,会为司机建立画像标签。
但是,现有的画像标签仅针对司机,无法抽象到除司机以外的线路、货物、企业等实体;且在建立画像标签时仅使用了***内的业务数据,无法根据已建立画像标签的使用情况形成闭环。
发明内容
本发明的目的是提供一种画像标签的管理方法及***,为每类实体建立画像标签,且使用了回流数据,形成闭环控制。
本发明提供的技术方案如下:
一种画像标签的管理方法,包括:采集原始数据,所述原始数据包括:业务数据、行为数据和回流数据;对所述原始数据按照预设清洗条件进行数据清洗,得到清洗后数据;根据所述清洗后数据,为每类主体建立对应的画像模型;根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的画像标签。
在上述技术方案中,在画像模型建立时引入了回流数据,使画像模型的定义更精确,且不同类别的主体都有其各自的画像模型,对不同类别下的各实体生成对应的画像标签,应用于后续的管理、分析、风险控制等,大大提高了画像标签的利用率。
进一步,所述回流数据包括:所述画像标签的使用频率数据和使用效果数据。
在上述技术方案中,进一步完善画像模型中各标签体系下的画像标签的定义,驱动画像标签的迭代,满足实际使用需求。
进一步,所述根据清洗后数据,为每类主体建立对应的画像模型具体为:根据清洗后数据,为每类主体建立对应的画像模型中不同的标签体系;其中,所述标签体系包括:事实标签体系、规则标签体系和挖掘标签体系;所述根据清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的画像标签具体为:根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的不同标签体系的画像标签。
在上述技术方案中,不同标签体系的画像标签给予了分析人员更多的选择和监控。
进一步,还包括:将属于实时数据的各个实体的画像标签存储至实时存储服务器;将属于离线数据的各个实体的画像标签存储至离线存储服务器。
在上述技术方案中,属于实时数据的画像标签的实时动态更新,让使用者看到最新的数据,使用时提高准确率。
进一步,还包括:当接收到自定义标签指令时,为自定义标签指令对应的实体添加所述自定义标签指令对应的自定义画像标签。
在上述技术方案中,自定义画像标签的建立给了数据分析者更多筛选数据的选择,无需大工程地改变画像模型即可得到想要画像标签,操作简单、方便。
进一步,还包括:显示所述画像标签。
在上述技术方案中,通过可视化组件进行显示,方便数据分析人员对各个实体的画像标签进行分析、研究。
本发明还提供一种画像标签的管理***,包括:数据采集模块,用于采集原始数据,所述原始数据包括:业务数据、行为数据和回流数据;数据清洗模块,用于对所述原始数据按照预设清洗条件进行数据清洗,得到清洗后数据;模型建立模块,用于根据所述清洗后数据,为每类主体建立对应的画像模型;标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的画像标签。
在上述技术方案中,在画像模型建立时引入了回流数据,使画像模型的定义更精确,且不同类别的主体都有其各自的画像模型,对不同类别下的各实体生成对应的画像标签,应用于后续的管理、分析、风险控制等,大大提高了画像标签的利用率。
进一步,所述模型建立模块,用于根据所述清洗后数据,为每类主体建立对应的画像模型具体为:所述模型建立模块,根据清洗后数据,为每类主体建立对应的画像模型中不同的标签体系;其中,所述标签体系包括:事实标签体系、规则标签体系和挖掘标签体系;所述标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的画像标签具体为:所述标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的不同标签体系的画像标签。
进一步,还包括:存储模块,用于将属于实时数据的各个实体的画像标签存储至实时存储服务器;以及,用于将属于离线数据的各个实体的画像标签存储至离线存储服务器。
进一步,还包括:标签添加模块,用于当接收到自定义标签指令时,为自定义标签指令对应的实体添加所述自定义标签指令对应的自定义画像标签。
与现有技术相比,本发明的画像标签的管理方法及***有益效果在于:
本发明不同的主体都有各自的画像模型;实时数据和离线数据采用不同方式存储,让实时数据的画像标签及时得到更新;不同的标签体系为各实体打上了多样化的画像标签,给予了更多的分析依据;且使用了回流数据进行闭环控制,提高了画像标签的更新频率,帮助***运维人员合理更新、增加、删除标签,提高标签的准确性和标签的使用效率,更符合实际应用需求。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种画像标签的管理方法及***的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明画像标签的管理方法一个实施例的流程图;
图2是本发明画像标签的管理方法另一个实施例的流程图;
图3是本发明将离线数据推送至ES的一个实施例的结构示意图;
图4是本发明画像标签的管理***一个实施例的结构示意图;
图5是本发明画像标签的管理***另一个实施例的结构示意图。
附图标号说明:
10.数据采集模块,20.数据清洗模块,30.模型建立模块,40.标签生成模块,50.标签添加模块,60.存储模块,70.显示模块。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
在本发明的一个实施例中,如图1所示,一种画像标签的管理方法,包括:
S101采集原始数据,原始数据包括:业务数据、行为数据和回流数据。
具体的,业务数据是指在车货匹配平台上进行业务交易的数据,例如:发货表、订单表、加油表等。
行为数据是指司机或货主的行为数据,例如:定位日志、行为日志(指在车货匹配平台上的操作日志)。
回流数据是指已经建立的画像标签的使用情况。可选地,回流数据包括:画像标签的使用频率数据和使用效果数据。将画像标签的使用频率数据和使用效果数据作为回流数据,供画像模型和各实体的画像标签的更新。使各实体对应的画像标签更精准。
S102对原始数据按照预设清洗条件进行数据清洗,得到清洗后数据。
具体的,考虑到每种数据的格式不同,而使用时又对格式有一定要求,因此,会对原始数据按照预设清洗条件进行数据清洗。
预设清洗条件根据实际需求设置,例如:TXT文件格式,将原有原始数据的格式变为TXT文件格式,若不行,则剔除。
S103根据清洗后数据,为每类主体建立对应的画像模型。
具体的,不同类别的主体有:司机、货主(个人和企业)、货物、线路等。在为每个类别建立其对应的画像模型时,因每个类别有自己的特征,因此,即使用了相同的清洗后数据,但是每个画像模型仍然是不同的。
S104根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体的画像标签。
具体的,以司机这个主体为例,其对应的每个实体就是每个司机账号。而货主对应每个实体就是每个货主账号。货物对应的每个实体就是具体的不同的货物,例如:苹果、纸巾、吸尘器等。线路对应的每个实体就是具体的运行线路,例如:上海-北京、天津-南京、河南-新疆等。
每个实体的画像标签会根据其对应的画像模型和收集的清洗后数据生成。而运营人员、风控人员等就可以根据各个实体的画像标签对实体进行筛选,进行风险控制、活动策划、分析数据等。
本实施例在画像模型建立时引入了回流数据,使画像模型的定义更精确,为每个实体生成的画像标签更能反映其实际情况;且不同类别的主体都有其各自的画像模型,对不同类别下的各实体生成对应的画像标签,应用于后续的管理、分析、风险控制等,大大提高了画像标签的利用率。
在本发明的另一个实施例中,如图2所示,一种画像标签的管理方法,包括:
S210采集原始数据,原始数据包括:业务数据、行为数据和回流数据。
S220对原始数据按照预设清洗条件进行数据清洗,得到清洗后数据。
S230根据清洗后数据,为每类主体建立对应的画像模型。其中,S230具体为:
S231根据清洗后数据,为每类主体建立对应的画像模型中不同的标签体系;其中,标签体系包括:事实标签体系、规则标签体系和挖掘标签体系。
S240根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体的画像标签。其中,S240具体为:
S241根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体的不同标签体系的画像标签。
具体的,每一个主体对应的画像模型都有3个标签体系,每个标签体系下都有若干个不同定义的画像标签。
事实标签体系是指固有属性。以司机的画像模型中的事实标签体系为例,有男、女、三个月内的成交次数、年龄等不同定义的画像标签。后续会根据每个司机账号的实际情况,生成对应的事实标签体系下的画像标签。例如:根据清洗后数据和司机类别对应的画像模型,司机A事实标签体系下的画像标签有男、35岁、三个月内的成交次数为10。
规则标签体系是指通过分析数据、进行规则组合得到的。以司机的画像模型中的规则标签体系为例,不同定义的画像标签有:一周成交3次为高活跃度,一个月成交1次及以下为低活跃度,近3个月未登录为沉默用户。后续会根据每个司机账号的实际情况,生成对应的规则标签体系下的画像标签,例如:司机B规则标签体系下的画像标签有高活跃度。
挖掘标签体系是指根据数据分析进行预测得到的,会采用到聚类、分类算法等进行预测。以货主的画像模型中的挖掘标签体系为例,不同定义的画像标签有:是否为黄牛、是否为有可能购买会员的潜在会员。后续会根据每个货主账号的实际情况,生成对应的挖掘标签体系下的画像标签,例如:货主A挖掘标签体系下的画像标签有潜在会员。
优选地,回流数据包括:画像标签的使用频率数据和使用效果数据。
使用频率数据就是指画像标签的使用次数,可以对使用次数少的画像标签对应的画像模型中的定义进行调整或删除。
使用效果数据理解为,画像标签是否达到了其想要的效果。例如:一个为“潜在会员”的画像标签,根据清洗后数据给某些司机和货主打上这个标签,使用一段时间后发现这些人并不会购买会员,则说明这个画像标签的定义有问题,在下次画像模型建立(或者说更新)时,需要对画像标签对应的定义进行调整或删除。
画像模型不同标签体系下的各画像标签的定义就是为每个实体生成对应的画像标签的依据,而画像标签的使用频率数据和使用效果数据作为回流数据进一步完善画像模型中各标签体系下的画像标签的定义,驱动画像标签的迭代,满足实际使用需求。
可选地,还包括:S250当接收到自定义标签指令时,为自定义标签指令对应的实体添加自定义标签指令对应的自定义画像标签。
具体的,除了通过画像模型来为每个实体自动生成画像标签外,也可以手动为实体自行添加自定义画像标签,当基于某些实际需求时,就可以给需要的某些实体手动打标。其与画像模型生成画像标签属于两条并行线,无先后关系。
例如:运营人员想要为货主A、货主B、货主C打上“大客户”的画像标签,但是画像模型中没有这个画像标签的定义,其可以同时选中货A、货主B和货主C,并创建一个“大客户”画像标签,为三个货主统一打上这个画像标签。假设本来货主A通过画像模型得到的画像标签为高活跃度、男;现在进行人工手动打标后变为高活跃度、男、大客户。
再比如:运营人员想选一批司机组织一场活动,其可以选择100个符合他要求的司机,添加“101活动”这个画像标签,为这100个司机统一打标。
需要注意的是,自定义画像标签和画像模型没有关系,因此,自定义画像标签的回流数据不会影响画像模型的更新。
可选地,还包括:S260将属于实时数据的各个实体的画像标签存储至实时存储服务器;S270将属于离线数据的各个实体的画像标签存储至离线存储服务器。
具体的,S260和S270可以并行运行,也可以先270、再260,或先260、再270,对顺序不作要求。
根据实际需求,设置每个主体的实时数据要求和离线数据要求,在得到每个实体的画像标签后,将符合对应的主体的实时数据要求和符合对应的主体的离线数据要求的各个实体的画像标签存储到不同的存储服务器。
实时数据主要是指当天的相关数据,例如:当天的上线时间、当天的成交量、当天是否有这个货物/线路等。离线数据主要是指非实时数据以外的所有数据。
之所以将两者存储到不同的存储服务器,是为了保证属于实时数据的画像标签的实时动态更新,让使用者看到最新的数据,使用时提高准确率。
实际存储的例子如下:
将属于实时数据的各个实体的画像标签存储至Redis;将属于离线数据的各个实体的画像标签通过Flume、Kafka、Logstash推送到ES。
Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库。Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的***。Kafka是由Apache软件基金会开发的一个开源流处理平台。Logstash是一个开源工具,对日志进行收集、分析,并将其存储供以后使用。ES为ElasticSearch的缩写,是一个基于Lucene的个分布式多用户能力的全文搜索引擎。
将属于离线数据的各个实体的画像标签这些文件推送到ES时需要注意以下几点:1)将原有的Flume读写同时进行的方式调整为先从Hive下载到Linux本地,之后对文件Split分割,再通过Flume写入到Kafka,如图3所示,该技术方案解决了Flume在HDFS文件下载到Linux过程中读写同时进行造成的数据丢失问题。2)将Logstash由单条写入ES调整为批量写入,提高数据存储效率,适应大数据的存储。
优选地,还包括:S280显示画像标签。
具体的,各个实体的画像标签(不管是通过画像模型得到,还是人工打标得到)都可以通过可视化组件进行显示,方便数据分析人员对各个实体的画像标签进行分析、研究。
另外,各个实体的画像标签所属的数据可以通过调用接口供第三方***提供其他服务。
本实施例多种主体的各个实体都能得到对应的画像标签,丰富了画像标签的使用范围;对于实时数据和离线数据采用不同方式存储,让实时数据的画像标签及时得到更新;不同的标签体系为各实体打上了多样化的画像标签,给予了更多的分析依据;且使用了回流数据进行闭环控制,提高了画像标签的更新频率,更符合实际应用需求。
在本发明的另一个实施例中,如图4所示,一种画像标签的管理***,包括:
数据采集模块10,用于采集原始数据,原始数据包括:业务数据、行为数据和回流数据。
具体的,业务数据是指在车货匹配平台上进行业务交易的数据,例如:发货表、订单表、加油表等。
行为数据是指司机或货主的行为数据,例如:定位日志、行为日志(指在车货匹配平台上的操作日志)。
回流数据是指已经建立的画像标签的使用情况。可选地,回流数据包括:画像标签的使用频率数据和使用效果数据。将画像标签的使用频率数据和使用效果数据作为回流数据,供画像模型和各实体的画像标签的更新。使各实体对应的画像标签更精准。
数据清洗模块20,与数据采集模块10电连接,用于对原始数据按照预设清洗条件进行数据清洗,得到清洗后数据。
具体的,考虑到每种数据的格式不同,而使用时又对格式有一定要求,因此,会对原始数据按照预设清洗条件进行数据清洗。
预设清洗条件根据实际需求设置,例如:TXT文件格式,将原有原始数据的格式变为TXT文件格式,若不行,则剔除。
模型建立模块30,与数据清洗模块20电连接,用于根据清洗后数据,为每类主体建立对应的画像模型。
具体的,不同类别的主体有:司机、货主(个人和企业)、货物、线路等。在为每个类别建立其对应的画像模型时,因每个类别有自己的特征,因此,即使用了相同的清洗后数据,但是每个画像模型仍然是不同的。
标签生成模块40,与模型建立模块30电连接,用于根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体的画像标签。
具体的,以司机这个主体为例,其对应的每个实体就是每个司机账号。而货主对应每个实体就是每个货主账号。货物对应的每个实体就是具体的不同的货物,例如:苹果、纸巾、吸尘器等。线路对应的每个实体就是具体的运行线路,例如:上海-北京、天津-南京、河南-新疆等。
每个实体的画像标签会根据其对应的画像模型和收集的清洗后数据生成。而运营人员、风控人员等就可以根据各个实体的画像标签进行风险控制、活动策划、分析数据等。
本实施例在画像模型建立时引入了回流数据,使画像模型的定义更精确,为每个实体生成的画像标签更能反映其实际情况;且不同类别的主体都有其各自的画像模型,对不同类别下的各实体生成对应的画像标签,应用于后续的管理、分析、风险控制等,大大提高了画像标签的利用率。
在本发明的另一个实施例中,如图5所示,一种画像标签的管理***,包括:
数据采集模块10,用于采集原始数据,原始数据包括:业务数据、行为数据和回流数据;
数据清洗模块20,与数据采集模块10电连接,用于对原始数据按照预设清洗条件进行数据清洗,得到清洗后数据;
模型建立模块30,与数据清洗模块20电连接,用于根据清洗后数据,为每类主体建立对应的画像模型;
标签生成模块40,与模型建立模块30电连接,用于根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体的画像标签。
模型建立模块30,用于根据清洗后数据,为每类主体建立对应的画像模型具体为:
模型建立模块30,根据清洗后数据,为每类主体建立对应的画像模型中不同的标签体系;其中,标签体系包括:事实标签体系、规则标签体系和挖掘标签体系。
标签生成模块40,用于根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体的画像标签具体为:
标签生成模块40,用于根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体的不同标签体系的画像标签。
具体的,每一个主体对应的画像模型都有3个标签体系,每个标签体系下都有若干个不同定义的画像标签。
事实标签体系是指固有属性。以司机的画像模型中的事实标签体系为例,有男、女、三个月内的成交次数、年龄等不同定义的画像标签。后续会根据每个司机账号的实际情况,生成对应的事实标签体系下的画像标签。例如:根据清洗后数据和司机类别对应的画像模型,司机A事实标签体系下的画像标签有女、30岁、三个月内的成交次数为12。
规则标签体系是指通过分析数据、进行规则组合得到的。以司机的画像模型中的规则标签体系为例,不同定义的画像标签有:一周成交3次为高活跃度,一个月成交1次及以下为低活跃度,购买过ETC的为增值。后续会根据每个司机账号的实际情况,生成对应的规则标签体系下的画像标签,例如:司机B规则标签体系下的画像标签有高活跃度、增值。
挖掘标签体系是指根据数据分析进行预测得到的,会采用到聚类、分类算法等进行预测。以货主的画像模型中的挖掘标签体系为例,不同定义的画像标签有:是否为黄牛、是否为有可能购买会员的潜在会员。后续会根据每个货主账号的实际情况,生成对应的挖掘标签体系下的画像标签,例如:货主A挖掘标签体系下的画像标签有潜在会员。
优选地,回流数据包括:画像标签的使用频率数据和使用效果数据。
使用频率数据就是指画像标签的使用次数,可以对使用次数少的画像标签对应的画像模型中的定义进行调整或删除。
使用效果数据理解为,画像标签是否达到了其想要的效果。例如:一个为“潜在会员”的画像标签,根据清洗后数据给某些司机和货主打上这个标签,使用一段时间后发现这些人并不会购买会员,则说明这个画像标签的定义有问题,在下次画像模型建立(或者说更新)时,需要对画像标签对应的定义进行调整或删除。
画像模型不同标签体系下的各画像标签的定义就是为每个实体生成对应的画像标签的依据,而画像标签的使用频率数据和使用效果数据作为回流数据进一步完善画像模型中各标签体系下的画像标签的定义,驱动画像标签的迭代,满足实际使用需求。
可选地,还包括:标签添加模块50,用于当接收到自定义标签指令时,为自定义标签指令对应的实体添加自定义标签指令对应的自定义画像标签。
具体的,除了通过画像模型来为每个实体自动生成画像标签外,也可以手动为实体自行添加自定义画像标签,当基于某些实际需求时,就可以给需要的某些实体手动打标。具体的例子请参见对应的方法实施例,在此不作赘述。
需要注意的是,自定义画像标签和画像模型没有关系,因此,自定义画像标签的回流数据不会影响画像模型的更新。
可选地,还包括:存储模块60,与标签添加模块50和标签生成模块40电连接,用于将属于实时数据的各个实体的画像标签存储至实时存储服务器;以及,用于将属于离线数据的各个实体的画像标签存储至离线存储服务器。
具体的,根据实际需求,设置每个主体的实时数据要求和离线数据要求,在得到每个实体的画像标签后,将符合对应的主体的实时数据要求和符合对应的主体的离线数据要求的各个实体的画像标签存储到不同的存储服务器。
实时数据主要是指当天的相关数据,例如:当天的上线时间、当天的成交量、当天是否有这个货物/线路等。离线数据主要是指非实际数据以外的所有数据。
之所以将两者存储到不同的存储服务器,是为了保证属于实时数据的画像标签的实时动态更新,让使用者看到最新的数据,使用时提高准确率。具体的例子请参见对应的方法实施例,在此作不赘述。
优选地,还包括:存储模块70,与存储模块60电连接,用于显示画像标签。
具体的,各个实体的画像标签(不管是通过画像模型得到,还是人工打标得到)都可以通过可视化组件进行显示,方便数据分析人员对各个实体的画像标签进行分析、研究。
另外,各个实体的画像标签所属的数据可以通过调用接口供第三方***提供其他服务。
本实施例多种主体的各个实体都能得到对应的画像标签,丰富了画像标签的使用范围;对于实时数据和离线数据采用不同方式存储,让实时数据的画像标签及时得到更新;不同的标签体系为各实体打上了多样化的画像标签,给予了更多的分析依据;且使用了回流数据进行闭环控制,提高了画像标签的更新频率,更符合实际应用需求。
应当说明的是,上述实施例均可根据需要自由组合。以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种画像标签的管理方法,其特征在于,包括:
采集原始数据,所述原始数据包括:业务数据、行为数据和回流数据;
对所述原始数据按照预设清洗条件进行数据清洗,得到清洗后数据;
根据所述清洗后数据,为每类主体建立对应的画像模型;
根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的画像标签。
2.如权利要求1所述的画像标签的管理方法,其特征在于,所述回流数据包括:所述画像标签的使用频率数据和使用效果数据。
3.如权利要求1所述的画像标签的管理方法,其特征在于:
所述根据清洗后数据,为每类主体建立对应的画像模型具体为:
根据清洗后数据,为每类主体建立对应的画像模型中不同的标签体系;其中,所述标签体系包括:事实标签体系、规则标签体系和挖掘标签体系;
所述根据清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的画像标签具体为:
根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的不同标签体系的画像标签。
4.如权利要求1-3任意一项所述的画像标签的管理方法,其特征在于,还包括:
将属于实时数据的各个实体的画像标签存储至实时存储服务器;
将属于离线数据的各个实体的画像标签存储至离线存储服务器。
5.如权利要求1-3任意一项所述的画像标签的管理方法,其特征在于,还包括:
当接收到自定义标签指令时,为自定义标签指令对应的实体添加所述自定义标签指令对应的自定义画像标签。
6.如权利要求1-3任意一项所述的画像标签的管理方法,其特征在于,还包括:显示所述画像标签。
7.一种画像标签的管理***,其特征在于,包括:
数据采集模块,用于采集原始数据,所述原始数据包括:业务数据、行为数据和回流数据;
数据清洗模块,用于对所述原始数据按照预设清洗条件进行数据清洗,得到清洗后数据;
模型建立模块,用于根据所述清洗后数据,为每类主体建立对应的画像模型;
标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的画像标签。
8.如权利要求7所述的画像标签的管理***,其特征在于:
所述模型建立模块,用于根据所述清洗后数据,为每类主体建立对应的画像模型具体为:
所述模型建立模块,根据清洗后数据,为每类主体建立对应的画像模型中不同的标签体系;其中,所述标签体系包括:事实标签体系、规则标签体系和挖掘标签体系;
所述标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的画像标签具体为:
所述标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的不同标签体系的画像标签。
9.如权利要求8或7所述的画像标签的管理***,其特征在于,还包括:
存储模块,用于将属于实时数据的各个实体的画像标签存储至实时存储服务器;以及,用于将属于离线数据的各个实体的画像标签存储至离线存储服务器。
10.如权利要求8或7所述的画像标签的管理***,其特征在于,还包括:
标签添加模块,用于当接收到自定义标签指令时,为所述自定义标签指令对应的实体添加所述自定义标签指令对应的自定义画像标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810780152.6A CN109003027A (zh) | 2018-07-16 | 2018-07-16 | 一种画像标签的管理方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810780152.6A CN109003027A (zh) | 2018-07-16 | 2018-07-16 | 一种画像标签的管理方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109003027A true CN109003027A (zh) | 2018-12-14 |
Family
ID=64598452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810780152.6A Pending CN109003027A (zh) | 2018-07-16 | 2018-07-16 | 一种画像标签的管理方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109003027A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555076A (zh) * | 2019-08-22 | 2019-12-10 | 上海数禾信息科技有限公司 | 数据打标方法、处理方法以及装置 |
CN111460250A (zh) * | 2020-03-02 | 2020-07-28 | 平安科技(深圳)有限公司 | 用于画像的数据的清洗方法、装置、介质及电子设备 |
CN112052972A (zh) * | 2020-09-11 | 2020-12-08 | 广州宸祺出行科技有限公司 | 一种网约车司机行为可视化的方法和*** |
CN112232960A (zh) * | 2020-10-21 | 2021-01-15 | 中国银行股份有限公司 | 交易应用***监控方法及装置 |
CN113010536A (zh) * | 2021-04-21 | 2021-06-22 | 中国平安人寿保险股份有限公司 | 基于流式数据处理的用户标签获取方法及装置 |
CN116258356A (zh) * | 2023-05-16 | 2023-06-13 | 深圳市万物云科技有限公司 | 基于WaveNet的工单派发方法、装置及相关介质 |
WO2023138572A1 (zh) * | 2022-01-24 | 2023-07-27 | 深圳市酷开网络科技股份有限公司 | 用户标签检测方法、装置、电子设备及可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069025A (zh) * | 2015-07-17 | 2015-11-18 | 浪潮通信信息***有限公司 | 一种大数据的智能聚合可视化与管控*** |
CN106156350A (zh) * | 2016-07-25 | 2016-11-23 | 恒安嘉新(北京)科技有限公司 | 一种可视化大数据分析方法及*** |
CN106296445A (zh) * | 2016-08-01 | 2017-01-04 | 国网浙江省电力公司 | 一种电力客户标签构建方法 |
CN106599060A (zh) * | 2016-11-16 | 2017-04-26 | 竹间智能科技(上海)有限公司 | 获取用户画像的方法及*** |
CN106909686A (zh) * | 2017-03-06 | 2017-06-30 | 吉林省盛创科技有限公司 | 一种人机交互构建用户画像聚类计算方法 |
CN106980663A (zh) * | 2017-03-21 | 2017-07-25 | 上海星红桉数据科技有限公司 | 基于海量跨屏行为数据的用户画像方法 |
CN108021929A (zh) * | 2017-11-16 | 2018-05-11 | 华南理工大学 | 基于大数据的移动端电商用户画像建立与分析方法及*** |
-
2018
- 2018-07-16 CN CN201810780152.6A patent/CN109003027A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069025A (zh) * | 2015-07-17 | 2015-11-18 | 浪潮通信信息***有限公司 | 一种大数据的智能聚合可视化与管控*** |
CN106156350A (zh) * | 2016-07-25 | 2016-11-23 | 恒安嘉新(北京)科技有限公司 | 一种可视化大数据分析方法及*** |
CN106296445A (zh) * | 2016-08-01 | 2017-01-04 | 国网浙江省电力公司 | 一种电力客户标签构建方法 |
CN106599060A (zh) * | 2016-11-16 | 2017-04-26 | 竹间智能科技(上海)有限公司 | 获取用户画像的方法及*** |
CN106909686A (zh) * | 2017-03-06 | 2017-06-30 | 吉林省盛创科技有限公司 | 一种人机交互构建用户画像聚类计算方法 |
CN106980663A (zh) * | 2017-03-21 | 2017-07-25 | 上海星红桉数据科技有限公司 | 基于海量跨屏行为数据的用户画像方法 |
CN108021929A (zh) * | 2017-11-16 | 2018-05-11 | 华南理工大学 | 基于大数据的移动端电商用户画像建立与分析方法及*** |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555076A (zh) * | 2019-08-22 | 2019-12-10 | 上海数禾信息科技有限公司 | 数据打标方法、处理方法以及装置 |
CN111460250A (zh) * | 2020-03-02 | 2020-07-28 | 平安科技(深圳)有限公司 | 用于画像的数据的清洗方法、装置、介质及电子设备 |
CN111460250B (zh) * | 2020-03-02 | 2022-07-08 | 平安科技(深圳)有限公司 | 用于画像的数据的清洗方法、装置、介质及电子设备 |
CN112052972A (zh) * | 2020-09-11 | 2020-12-08 | 广州宸祺出行科技有限公司 | 一种网约车司机行为可视化的方法和*** |
CN112052972B (zh) * | 2020-09-11 | 2021-05-18 | 广州宸祺出行科技有限公司 | 一种网约车司机行为可视化的方法和*** |
CN112232960A (zh) * | 2020-10-21 | 2021-01-15 | 中国银行股份有限公司 | 交易应用***监控方法及装置 |
CN112232960B (zh) * | 2020-10-21 | 2023-09-19 | 中国银行股份有限公司 | 交易应用***监控方法及装置 |
CN113010536A (zh) * | 2021-04-21 | 2021-06-22 | 中国平安人寿保险股份有限公司 | 基于流式数据处理的用户标签获取方法及装置 |
CN113010536B (zh) * | 2021-04-21 | 2024-02-06 | 中国平安人寿保险股份有限公司 | 基于流式数据处理的用户标签获取方法及装置 |
WO2023138572A1 (zh) * | 2022-01-24 | 2023-07-27 | 深圳市酷开网络科技股份有限公司 | 用户标签检测方法、装置、电子设备及可读存储介质 |
CN116258356A (zh) * | 2023-05-16 | 2023-06-13 | 深圳市万物云科技有限公司 | 基于WaveNet的工单派发方法、装置及相关介质 |
CN116258356B (zh) * | 2023-05-16 | 2023-08-25 | 深圳市万物云科技有限公司 | 基于WaveNet的工单派发方法、装置及相关介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109003027A (zh) | 一种画像标签的管理方法及*** | |
JP7110217B2 (ja) | キー付きネットワークデータストリームを処理するパラメータ化アプリケーションのダイナミック実行 | |
US8560364B2 (en) | Identifying workforce deployment issues | |
US7797182B2 (en) | Method and apparatus for improved forecasting using multiple sources | |
US20200057918A1 (en) | Systems and methods for training artificial intelligence to predict utilization of resources | |
US20040162753A1 (en) | Resource allocation management and planning | |
CN106897832B (zh) | 生产线的生产排程方法、生产线的生产排程*** | |
CN113626914A (zh) | 基于数字孪生的工程项目管理方法、装置及*** | |
Flatberg et al. | Dynamic and stochastic vehicle routing in practice | |
Chorus | What about behaviour in travel demand modelling? An overview of recent progress | |
Lannez et al. | A railroad maintenance problem solved with a cut and column generation matheuristic | |
Reichelt et al. | Towards an infrastructure for energy model computation and linkage | |
US20220284359A1 (en) | Systems and methods for modeling and analysis of infrastructure services provided by cloud services provider systems | |
Al-Fedaghi et al. | Business process mapping: a case study | |
Amiama et al. | Spatial decision support system for the route management for milk collection from dairy farms | |
US20100293025A1 (en) | Dimensional service-oriented architecture solution modeling and composition | |
Paulson Jr | Man-computer concepts for planning and scheduling | |
Longo et al. | A system for supply chains diversification and (re) design: supporting managers' perspective in the face of uncertainty | |
Mohamed et al. | Quantifying the time and cost associated with the request for information (RFI) process in construction | |
CN104572835B (zh) | 一种过程元模型构建方法及装置 | |
Pena et al. | A Two-Stage Heuristic for a Real Multi-compartment and Multi-trip Vehicle Routing Problem with Time Windows | |
CN102289746A (zh) | 一种计落考管理规划实施与经验转化的方法和*** | |
Kang et al. | Organization-driven business process configurable modeling for spatial variability | |
RU131219U1 (ru) | Система организации решения управленческих задач на основе электронного документооборота | |
Bertazzi et al. | Dynamic project expediting: a stochastic shortest-path approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181214 |