CN115357767B - 一种用户标签画像方法和*** - Google Patents

一种用户标签画像方法和*** Download PDF

Info

Publication number
CN115357767B
CN115357767B CN202211011399.4A CN202211011399A CN115357767B CN 115357767 B CN115357767 B CN 115357767B CN 202211011399 A CN202211011399 A CN 202211011399A CN 115357767 B CN115357767 B CN 115357767B
Authority
CN
China
Prior art keywords
user
tag
data table
labels
derivative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211011399.4A
Other languages
English (en)
Other versions
CN115357767A (zh
Inventor
上官玉将
惠康
李文超
吴俊杰
张晋鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinshang Consumer Finance Co ltd
Original Assignee
Jinshang Consumer Finance Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinshang Consumer Finance Co ltd filed Critical Jinshang Consumer Finance Co ltd
Priority to CN202211011399.4A priority Critical patent/CN115357767B/zh
Publication of CN115357767A publication Critical patent/CN115357767A/zh
Application granted granted Critical
Publication of CN115357767B publication Critical patent/CN115357767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用户标签画像方法和***,所述用户标签画像方法包括:采集若干第一用户的原始数据,构建基础标签;对基础标签进行分层配置,获得衍生标签,构建标签数据表;响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。相比于现有技术,基于用户的数据进而构建基础标签,在基础标签的基础上分层配置,获得衍生标签,相比现有技术提前定义基础标签和衍生标签,具有更高的灵活性,且能适用于更多的业务场景,针对复杂的属性无需后台开发。

Description

一种用户标签画像方法和***
技术领域
本发明涉及用户标签领域,尤其涉及一种用户标签画像方法和***。
背景技术
现有技术通过构建画像和标签实现批量用户管理,以实现对用户进行有效、精准的信息推送。
目前,在标签***中,市面上的产品主要是在***中构建映射表,通过数仓下发数据。并且在基础标签库通过存入oracle、mysql等,生成相应的源表数据。然后,相关人员在基础标签的基础上,提前配置好衍生标签和规则,针对不同用户匹配上对应的用户衍生标签,并通过不同的规则进行衍生标签宽表的生成,用户画像的查询和分析。这种方法由于基础标签以及衍生标签都是预定义的,因此灵活性较低。
发明内容
本发明提供了一种用户标签画像方法和***,以解决如何提高灵活性的技术问题。
为了解决上述技术问题,本发明实施例提供了一种用户标签画像方法,包括:
采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;
对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
作为一种可能的实施方式,所述根据所述若干衍生标签,构建标签数据表,具体为:
将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
作为一种可能的实施方式,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述构建所述标签数据表之前还包括:
对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
作为一种可能的实施方式,所述用户标签画像方法还包括:
获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户u_id的映射表,获得目标用户集合。
作为一种可能的实施方式,所述采集若干第一用户的原始数据,具体为:通过配置接入方式,采集若干所述第一用户的行为数据和状态数据;其中,所述配置接入方式包括配置数据库信息和配置Kafka消费队列。
作为一种可能的实施方式,在所述采集若干第一用户的原始数据之前,还包括:
通过32位整形数字对所有第一用户进行编码,通过与各第一用户的用户标识进行映射,生成各第一用户的u_id,并构建用户u_id映射表。
相应的,本发明实施例还提供了一种用户标签画像***,包括采集模块、分层配置模块、标签数据表构建模块和画像模块,其中,
所述采集模块,用于采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;
所述分层配置模块,用于对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
所述标签数据表构建模块,用于根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
所述画像模块,用于响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
作为一种可能的实施方式,所述标签数据表构建模块根据所述若干衍生标签,构建标签数据表,具体为:
所述标签数据表构建模块将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
作为一种可能的实施方式,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述用户标签画像***还包括存储模块,所述存储模块用于在所述标签数据表构建模块构建所述标签数据表之前,对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
作为一种可能的实施方式,所述用户标签画像***还包括逆向筛选模块;
所述逆向筛选模块,用于获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户u_id的映射表,获得目标用户集合。
相比于现有技术,本发明实施例具有如下有益效果:
本发明实施例提供了一种用户标签画像方法和***,所述用户标签画像方法包括:采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。相比于现有技术,基于用户的数据进而构建基础标签,在基础标签的基础上分层配置,获得衍生标签,相比现有技术提前定义基础标签和衍生标签,具有更高的灵活性,且能适用于更多的业务场景,针对复杂的属性(例如api、全量展示和分页展示)无需后台开发。
附图说明
图1:为本发明提供的用户标签画像方法的一种实施例的流程示意图。
图2:为本发明提供的用户标签画像***的一种实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据相关技术记载,传统的标签方法在新建映射表时,通过数仓下发数据,基础标签库通过存入oracle、mysql等,生成相应的源表数据,需要相关人员提前配置好衍生标签和规则,然后根据配置好的规则,使用户匹配上对应的衍生标签。
但是这些传统的技术不能灵活地配置基础标签以及衍生标签,基础属性和值的管理都是提前预定义的,对于复杂属性(例如API、全量展示和分页展示)都依赖开发,并且基本采用后台开发,不具备页面进行配置的功能。
另一方面,现有的***都是针对入库数据(所使用的基础标签数据全部存储至画像***),按照逻辑规则进行打上标签,对于未入库数据(***中未存储的数据),则无法对之进行分析。此外,该方法在数据获取方面依赖数仓或者上游供给数据,具有实时性低的问题,难以进行监控。并且,在存储方式上,随着衍生标签的数量以及逻辑复杂度,运算效率会明显下降,因此亟需一种能解决上述一个或多个技术问题的画像分析和打标方法。
针对上述一个或多个技术问题,请参照图1,图1为本发明实施例提供的一种用户标签画像方法,包括步骤S1至步骤S4,其中,
步骤S1,采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签。
在本实施例中,首先通过32位整形数字对所有第一用户进行编码,通过与各第一用户的用户标识进行映射,生成各第一用户的u_id,然后构建用户u_id映射表。
进一步地,通过配置接入方式,采集若干所述第一用户的行为数据和状态数据(原始数据包括所述行为数据和状态数据);其中,所述配置接入方式包括配置数据库信息和配置Kafka消费队列。
本实施例中数据源的接入采用数据同步策略进行接入,包括主动抽取和队列接收两种方式。其中,主动抽取就是通过配置数据库信息,例如,包括但不限于JDBC驱动、数据源地址、用户名、密码、表名和表字段信息等。另外,队列接收则是配置Kafka消费队列,主要是按照约定的模板来推送数据,譬如,包括myql驱动、username、password、test表,而test表包含主键、姓名、性别、贷款产品四个字段等。实施本申请实施例,开通了网络策略,上游无需改造即可直接抽取,可以保证数据的有效连通性。
在采集若干第一用户的原始数据之后,将所有的原始数据存储至本地数据库,并基于所述原始数据,构建若干基础标签。
所述基础标签的组成包括名称、运算符和值,且三个组成部分完全解耦。基础标签可以配置包括但不限于API接口以及字典值,运算符号包括大于、小于、交集、并集和异或等运算,且可以针对数据类型,自定义运算值选项类型,以覆盖所有的运算场景。
优选地,在基础标签的配置中,还包括对运算、运算符以及属性类型的配置,例如上述test表,a基础标签:性别配置为字典项(男、女),运算符为“等于”,属性类型配置为下拉;b基础标签:贷款产品配置API接口,运算符为“包含”,属性为下拉,此时则实现了a基础标签和b基础标签的配置。
步骤S2,对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层。
作为优选方案,衍生标签的配置是一系列基础标签的衍生。譬如针对上述test表,针对男性的用户申请A、B产品的人员,在前台进行配置,通过基础标签进行组合,生成分层。具体为基础标签+属性+属性值,例如“性别”+“等于”+“男”,以及“贷款产品”+“包含”+“A、B”,由此生成了一个分层(包括两个基础标签)的衍生标签。在分层保存后,生成HR和LR两个规则,HR用于页面逻辑规则展示,LR用于对数据进行规则判断。对于生成的衍生标签提供实时和定时处理,配置了版本管理功能,且可针对衍生标签生成模板,用于后续的客群生成和分析。
进一步地,衍生标签规则包括前端规则和后端规则算子,前端规则用于快速渲染HTML页面规则,后端规则通过逆波兰表达式,将前端规则解析为可识别的算子框架,用于衍生数据的生成等功能。
步骤S3,根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应。
在本实施例中,对所述若干衍生标签进行加工,处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
进一步地,在构建所述标签数据表之前还包括:
对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。在数据存储方面,通过RoaringBitmap的数据结构进行存储,并且用户通过连续的32位整形数字进行编码,然后通过压缩位图RoaringBitmap进行存储,在海量数据下可以有效节约存储的空间,并且在后续的运算时可以实现快速查询。
步骤S4,响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
在本实施例中,在需要针对用户进行画像时,接收并响应对第二用户也就是目标用户的画像请求。第二用户可以为个人也可以为客群。在针对第二用户进行分析时,根据第二用户的标识匹配对应的u_id,然后通过所述第二用户的u_id查询所述标签数据表,确定命中的所有衍生标签,获得所述第二用户的衍生标签数组,呈现为基础标签的占比以及明细,可以用于对单个用户或者客群进行视图分析。
作为优选实施方式,可以通过对多个衍生标签进行组合以实现客群分析。所述用户标签画像方法还包括:获取目标筛选信息,所述目标筛选信息可以从外部手动导入,然后查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合(对两个衍生标签的标签数据的RoaringBitmap进行交集、并集、差集等运算获得);基于所述新的u_id集合,通过查询用户u_id的映射表,获得目标用户集合。
譬如针对a衍生标签:男性的用户申请A、B产品,以及b衍生标签:女性申请B、C、D三个产品,在需要筛选男女共同申请B产品的客群时(手动导入的目标筛选信息,也就是未入库信息,未进入***),a衍生标签为一种分层,b衍生标签为一种分层(实际应用中衍生标签可以为多个分层,上述的a和b衍生标签只是作为一种举例),此时对两个分层进行交集操作,则完成了客群的筛选和分析。实施本申请实施例,通过将传统的客户+衍生标签(作为属性列)的模式(即一个客户一条数据、以及一个属性对应一个数据表列),解耦转换成了标签=分层(业务维度)+页面规则(前端)+后台规则(后端),和客群=衍生标签(key)+客户群(value,32位整形数值编码的客户集合)的双驱动模式,可以基于用户的数据构建基础标签,进而分层配置,正向生成衍生标签从而实现对用户的画像,也可以逆向查看未入库数据(譬如外部数据或手动导入数据,即目标筛选信息),实现逆向快速打上标签,提高了运算效率和相比于现有技术更强的查询能力。另一方面,基础标签和衍生标签都是灵活配置的,不需要提前预定义,对于复杂的属性都能进行配置,且具备页面配置功能,实现了可视化,提高了对用户画像和分析的效率。
相应的,参照图2,本发明实施例还提供了一种用户标签画像***,包括采集模块101、分层配置模块102、标签数据表构建模块103和画像模块104,其中,
所述采集模块101,用于采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;
所述分层配置模块102,用于对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
所述标签数据表构建模块103,用于根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
所述画像模块104,用于响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
作为一种优选的实施方式,所述标签数据表构建模块103根据所述若干衍生标签,构建标签数据表,具体为:
所述标签数据表构建模块103将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表。
作为一种优选的实施方式,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述用户标签画像***还包括存储模块,所述存储模块用于在所述标签数据表构建模块构建所述标签数据表之前,对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
作为一种优选的实施方式,所述用户标签画像***还包括逆向筛选模块;
所述逆向筛选模块,用于获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户u_id的映射表,获得目标用户集合。
相比于现有技术,本发明实施例具有如下有益效果:
本发明实施例提供了一种用户标签画像方法和***,所述用户标签画像方法包括:采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;对所述若干基础标签进行分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;根据所述若干衍生标签,构建标签数据表;其中,所述标签数据表包括若干u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。相比于现有技术,基于用户的数据进而构建基础标签,在基础标签的基础上分层配置,获得衍生标签,相比现有技术提前定义基础标签和衍生标签,具有更高的灵活性,且能适用于更多的业务场景,针对复杂的属性(例如api、全量展示和分页展示)无需后台开发。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种用户标签画像方法,其特征在于,包括:
采用主动抽取或队列接收的方式采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;基础标签包括名称、运算符和值;
对所述若干基础标签进行组合分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建标签数据表;其中,所述标签数据表包括若干u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
2.如权利要求1所述的一种用户标签画像方法,其特征在于,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述构建所述标签数据表之前还包括:
对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
3.如权利要求1所述的一种用户标签画像方法,其特征在于,所述用户标签画像方法还包括:
获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户u_id的映射表,获得目标用户集合。
4.如权利要求1所述的一种用户标签画像方法,其特征在于,所述采集若干第一用户的原始数据,具体为:通过配置接入方式,采集若干所述第一用户的行为数据和状态数据;其中,所述配置接入方式包括配置数据库信息和配置Kafka消费队列。
5.如权利要求1至4任意一项所述的一种用户标签画像方法,其特征在于,在所述采集若干第一用户的原始数据之前,还包括:
通过32位整形数字对所有第一用户进行编码,通过与各第一用户的用户标识进行映射,生成各第一用户的u_id,并构建用户u_id映射表。
6.一种用户标签画像***,其特征在于,包括采集模块、分层配置模块、标签数据表构建模块和画像模块,其中,
所述采集模块,采用主动抽取或队列接收的方式采集若干第一用户的原始数据,并基于所述原始数据,构建若干基础标签;基础标签包括名称、运算符和值;
所述分层配置模块,用于对所述若干基础标签进行组合分层配置,获得若干衍生标签;其中,每个分层为一个或多个所述基础标签的合集;每个所述衍生标签包括不少于两个分层;
所述标签数据表构建模块将所述若干衍生标签处理成用户id和u_id数组,所述u_id数组中存储有与各衍生标签对应的u_id集合,根据所有所述u_id集合,构建所述标签数据表;其中,所述标签数据表包括若干u_id集合,所述u_id集合中包括所有与所述第一用户一一对应的u_id;所述u_id集合与一衍生标签一一对应;
所述画像模块,用于响应对第二用户的画像请求,根据第二用户的标识匹配对应的u_id,通过所述第二用户的u_id查询所述标签数据表,匹配与所述第二用户对应的不少于一个衍生标签,获得针对所述第二用户的画像;其中,所述若干第一用户包括所述第二用户。
7.如权利要求6所述的一种用户标签画像***,其特征在于,所述标签数据表中的所有u_id集合通过bitmap的方式进行存储;
所述用户标签画像***还包括存储模块,所述存储模块用于在所述标签数据表构建模块构建所述标签数据表之前,对所有u_id集合通过位图压缩算法生成RoaringBitmap结构,并存储为bitmap集合。
8.如权利要求6所述的一种用户标签画像***,其特征在于,所述用户标签画像***还包括逆向筛选模块;
所述逆向筛选模块,用于获取目标筛选信息,并查询所述标签数据表;根据所述目标筛选信息与所述标签数据表中的衍生标签,生成新的u_id集合;基于所述新的u_id集合,通过查询用户u_id的映射表,获得目标用户集合。
CN202211011399.4A 2022-08-23 2022-08-23 一种用户标签画像方法和*** Active CN115357767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211011399.4A CN115357767B (zh) 2022-08-23 2022-08-23 一种用户标签画像方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211011399.4A CN115357767B (zh) 2022-08-23 2022-08-23 一种用户标签画像方法和***

Publications (2)

Publication Number Publication Date
CN115357767A CN115357767A (zh) 2022-11-18
CN115357767B true CN115357767B (zh) 2023-12-19

Family

ID=84002559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211011399.4A Active CN115357767B (zh) 2022-08-23 2022-08-23 一种用户标签画像方法和***

Country Status (1)

Country Link
CN (1) CN115357767B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010693B (zh) * 2022-12-28 2023-11-07 广州市玄武无线科技股份有限公司 基于客群的信息推送方法、装置、设备和计算机存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191158A (zh) * 2018-06-28 2019-01-11 深圳市彬讯科技有限公司 用户画像标签数据的处理方法及处理设备
CN109919652A (zh) * 2019-01-17 2019-06-21 平安城市建设科技(深圳)有限公司 用户群体分类方法、装置、设备及存储介质
CN111858617A (zh) * 2020-08-06 2020-10-30 贝壳技术有限公司 用户查找方法和装置、计算机可读存储介质、电子设备
CN111915366A (zh) * 2020-07-20 2020-11-10 上海燕汐软件信息科技有限公司 一种用户画像构建方法、装置、计算机设备及存储介质
CN112347101A (zh) * 2020-10-28 2021-02-09 北京北明数科信息技术有限公司 标签数据存储方法、计算机装置和存储介质
CN113177051A (zh) * 2021-05-20 2021-07-27 武汉众邦银行股份有限公司 一种数据标签动态新增维护的方法
CN113485638A (zh) * 2021-06-07 2021-10-08 贵州大学 一种面向海量天文数据的存取优化***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060149720A1 (en) * 2004-12-30 2006-07-06 Dehlinger Peter J System and method for retrieving information from citation-rich documents

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191158A (zh) * 2018-06-28 2019-01-11 深圳市彬讯科技有限公司 用户画像标签数据的处理方法及处理设备
CN109919652A (zh) * 2019-01-17 2019-06-21 平安城市建设科技(深圳)有限公司 用户群体分类方法、装置、设备及存储介质
CN111915366A (zh) * 2020-07-20 2020-11-10 上海燕汐软件信息科技有限公司 一种用户画像构建方法、装置、计算机设备及存储介质
CN111858617A (zh) * 2020-08-06 2020-10-30 贝壳技术有限公司 用户查找方法和装置、计算机可读存储介质、电子设备
CN112347101A (zh) * 2020-10-28 2021-02-09 北京北明数科信息技术有限公司 标签数据存储方法、计算机装置和存储介质
CN113177051A (zh) * 2021-05-20 2021-07-27 武汉众邦银行股份有限公司 一种数据标签动态新增维护的方法
CN113485638A (zh) * 2021-06-07 2021-10-08 贵州大学 一种面向海量天文数据的存取优化***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Multimedia venue semantic modeling based on multimodal data;Wei-Zhi Nie et al.;《Journal of Visual Communication and Image Representation》;375-385 *
基于用户画像的运营商客户分析营销***的设计与实现;查明志;《中国优秀硕士学位论文全文数据库 信息科技辑》;I138-385 *

Also Published As

Publication number Publication date
CN115357767A (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
Shao et al. Extreme value theory-based calibration for the fusion of multiple features in high-resolution satellite scene classification
CN115357767B (zh) 一种用户标签画像方法和***
WO2012070405A1 (ja) 医用データ生成装置及び医用データ生成方法
CN108197237A (zh) 可视化数据采集到展现***
CA2519015A1 (en) System and method of providing relational set operations for olap data sources
CN106067132A (zh) 商品属性的设置方法及装置
CN112396462B (zh) 基于Clickhouse的人群圈选方法及装置
CN110751998A (zh) 基于结构化报告数据的查询***及其查询方法
CN104239067B (zh) 微型客户端的制作方法及装置
CN106649363A (zh) 数据查询方法及装置
CN114663186A (zh) 一种应用于私域和电商平台的商品推荐方法、***和存储介质
CN106021528A (zh) 数据处理方法和装置
CN106326243A (zh) 一种数据处理方法及装置
CN112527920A (zh) 一种数据处理的方法和装置
CN112000696A (zh) 一种多架构云平台镜像仓库的镜像列表查询的架构
CN110909017B (zh) 数据分析方法和***
CN110930105B (zh) 任务清单的处理方法、装置、计算机设备和存储介质
CN109636896B (zh) 基于WebGL的人体骨骼及其接骨板三维交互展示方法
CN116303657A (zh) 群体画像生成方法、装置、计算机设备和存储介质
CN107783856A (zh) 一种图像处理器参数的测试方法及***
CN109937413A (zh) 海量人群特征数据的处理方法及***
CN111027093A (zh) 一种访问权限控制方法、装置、电子设备和存储介质
CN109255807A (zh) 一种图像信息处理方法及服务器、计算机存储介质
CN116783587A (zh) 基于列表的数据搜索用数据存储
CN114049484A (zh) 商品图像检索方法及其装置、设备、介质、产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant