CN111192072B - 用户分群方法及装置、存储介质 - Google Patents
用户分群方法及装置、存储介质 Download PDFInfo
- Publication number
- CN111192072B CN111192072B CN201911035045.1A CN201911035045A CN111192072B CN 111192072 B CN111192072 B CN 111192072B CN 201911035045 A CN201911035045 A CN 201911035045A CN 111192072 B CN111192072 B CN 111192072B
- Authority
- CN
- China
- Prior art keywords
- user
- data
- grouping
- condition
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种用户分群方法及装置、存储介质,属于数据处理技术领域。该方法包括:确定属性分群条件和行为分群条件,根据属性分群条件从结构化数据集中获取第一用户标识,结构化数据集用于存储用户标识与用户属性数据的关联关系,根据行为分群条件从非结构化数据集中获取第二用户标识,非结构化数据集用于存储用户标识与用户行为数据的关联关系,从第一用户标识和第二用户标识中,确定至少一个目标用户标识。由于用户行为数据存储在非结构化数据集中,因此可以避免用户行为数据的增加导致结构化数据集膨胀,有助于降低用户分群的局限性。
Description
技术领域
本申请涉及数据处理技术领域,特别涉及一种用户分群方法及装置、存储介质。
背景技术
用户分群是指依据业务场景的需要对用户进行筛选,过滤出符合预期条件的目标用户群体的过程。通常可以根据用户数据进行用户分群。其中,用户数据通常包括用户属性数据和用户行为数据。
目前的用户分群方法包括:确定预期条件对应的标签值,根据该预期条件对应的标签值从用户标签表中,查询符合预期条件的用户标识,将该符合预期条件的用户标识指示的用户构成的群体确定为目标用户群体。其中,用户标签表用于存储用户标识和用户数据的标签值的对应关系。
但是,一个用户可以具有多个行为,用户标识与用户行为数据可以是一对多的关系,因此在用户标签列表中,用户标识与用户行为数据的标签值是一对多的关系。随着用户行为数据的增加,用户标签列表急速膨胀,不利于进行用户分群,增加了用户分群的局限性。
发明内容
本申请实施例提供了一种用户分群方法及装置、存储介质,有助于降低用户分群的局限性。所述技术方案如下:
一方面,提供了一种用户分群方法,所述方法包括:
确定属性分群条件和行为分群条件;
根据所述属性分群条件从结构化数据集中获取第一用户标识,所述结构化数据集用于存储用户标识与用户属性数据的关联关系;
根据所述行为分群条件从非结构化数据集中获取第二用户标识,所述非结构化数据集用于存储用户标识与用户行为数据的关联关系;
从所述第一用户标识和所述第二用户标识中,确定至少一个目标用户标识。
另一方面,提供了一种用户分群装置,包括用于执行上述一方面所述的用户分群的各个模块。
再一方面,提供了一种用户分群装置,包括:处理器和存储器,
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器上所存储的计算机程序,实现如一方面所述的用户分群方法。
又一方面,提供了一种存储介质,当所述存储介质中的程序由处理器执行时,能够实现如一方面所述的用户分群方法。
本申请实施例提供的技术方案带来的有益效果包括:
本申请实施例提供的用户分群方法及装置、存储介质,在确定属性分群条件和行为分群条件后,根据属性分群条件从结构化数据集中获取第一用户标识,根据行为分群条件从非结构化数据集中获取第二用户标识,并从第一用户标识和第二用户标识中确定至少一个目标用户标识,该结构化数据集用于存储用户标识与用户属性数据的关联关系,该非结构化数据集用于存储用户标识与用户行为数据的关联关系,由于用户行为数据存储在非结构化数据集中,因此可以避免用户行为数据的增加导致结构化数据集膨胀,有助于降低用户分群的局限性。
附图说明
图1是本申请各个实施例涉及的一种实施环境的示意图;
图2是本申请实施例提供的一种用户分群方法的方法流程图;
图3是本申请实施例提供的另一种用户分群方法的方法流程图;
图4是本申请实施例提供的一种生成结构化数据集的方法流程图;
图5是本申请实施例提供的一种条件配置界面的示意图;
图6是本申请实施例提供的另一种条件配置界面的示意图;
图7是本申请实施例提供的一种用户分群装置的逻辑框图;
图8是本申请实施例提供的另一种用户分群装置的逻辑框图;
图9是本申请实施例提供的一种用户分群装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1是本申请各个实施例涉及的一种实施环境的示意图,如图1所示,该实施环境可以包括:服务器101、后台终端102和多个用户终端103,服务器101分别与后台终端102和每个用户终端103通信连接,该通信连接可以是有线连接或无线连接,该无线连接可以包括但不限于无线保真(英文:Wireless Fidelity,简称:WIFI)连接、数据连接、蓝牙连接或红外连接等,该有线连接可以包括但不限于通用串行总线(英文:Universal Serial Bus,简称:USB)连接。
服务器101可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心,在本申请实施例中,该服务器101可以是Hadoop服务器集群。后台终端102和用户终端103均可以是智能手机、平板电脑、笔记本电脑或台式电脑等,该图1以后台终端102是台式电脑,用户终端103是智能手机为例进行说明。
在本申请实施例中,后台终端102可以确定属性分群条件和行为分群条件,根据该属性分群条件从结构化数据集中获取第一用户标识,该结构化数据集用于存储用户标识与用户属性数据的关联关系,根据该行为分群条件从非结构化数据集中获取第二用户标识,该非结构化数据集用于存储用户标识与用户行为数据的关联关系,并从该第一用户标识和该第二用户标识中,确定至少一个目标用户标识,将该至少一个目标用户标识指示的用户构成的用户群体确定为目标用户群体,从而实现用户分群。
可选地,后台终端102可以提供条件配置界面,该条件配置界面可以包括条件配置入口,后台用户可以通过该条件配置入口配置属性分群条件和行为分群条件,并触发条件配置指令,后台终端102可以接收该条件配置指令,并根据该条件配置指令确定属性分群条件和行为分群条件。
可选地,后台终端102在确定属性分群条件和行为分群条件之前,可以获取多个用户的用户标识和该多个用户的用户数据,该用户数据可以包括用户属性数据和用户行为数据,后台终端102可以根据该多个用户的用户标识和该多个用户的用户属性数据生成结构化数据集,以及,根据该多个用户的用户标识和该多个用户的用户行为数据生成非结构化数据集。
图2是本申请实施例提供的一种用户分群方法的方法流程图,该用户分群方法可以由图1所示实施环境中的后台终端102执行,如图2所示,该方法可以包括如下步骤:
步骤201、确定属性分群条件和行为分群条件。
步骤202、根据属性分群条件从结构化数据集中获取第一用户标识,结构化数据集用于存储用户标识与用户属性数据的关联关系。
步骤203、根据行为分群条件从非结构化数据集中获取第二用户标识,非结构化数据集用于存储用户标识与用户行为数据的关联关系。
步骤204、从第一用户标识和第二用户标识中,确定至少一个目标用户标识。
综上所述,本申请实施例提供的用户分群方法,后台终端确定属性分群条件和行为分群条件后,根据属性分群条件从结构化数据集中获取第一用户标识,根据行为分群条件从非结构化数据集中获取第二用户标识,并从第一用户标识和第二用户标识中确定至少一个目标用户标识,该结构化数据集用于存储用户标识与用户属性数据的关联关系,该非结构化数据集用于存储用户标识与用户行为数据的关联关系,由于用户行为数据存储在非结构化数据集中,因此可以避免用户行为数据的增加导致结构化数据集膨胀,有助于降低用户分群的局限性。
图3是本申请实施例提供的另一种用户分群方法的方法流程图,该用户分群方法可以应用于图1所示实施环境,如图3所示,该方法可以包括如下步骤:
步骤301、获取多个用户的用户标识和该多个用户的用户数据,该用户数据包括用户属性数据和用户行为数据。
其中,用户属性数据用于表征用户属性,该用户属性数据可以包括年龄数据、性别数据、学历数据或户籍数据中的至少一种,年龄数据表征用户年龄,性别数据表征用户性别,学历数据表征用户学历,户籍数据表征用户户籍。用户行为数据用于表征用户行为,该用户行为数据可以包括用户针对某商品的收藏行为数据、关注行为数据、购买行为数据、用户在某网站的注册行为数据或用户对其他用户的关注行为数据等等。
在本申请实施例中,用户终端在服务器注册时,服务器可以为用户终端分配用户标识,记录并存储用户终端提供的年龄数据、性别数据、学历数据或户籍数据等用户属性数据。在注册成功之后,用户终端可以与服务器交互,使服务器向用户终端提供服务,用户终端在每次与服务器交互时,可以产生用户行为数据,服务器可以记录并存储并该用户行为数据。容易理解,服务器可以将用户标识和用户数据(包括用户属性数据和用户行为数据)关联存储,且服务器可以存储多个用户的用户标识和用户数据。
在该步骤301中,后台终端可以从服务器获取多个用户的用户标识和该多个用户的用户数据。可选地,后台终端可以向服务器发送数据获取请求,服务器接收到该数据获取请求后,根据该数据获取请求从服务器中获取多个用户的用户标识和该多个用户的用户数据,并将该多个用户的用户标识和该多个用户的用户数据发送给后台终端,后台终端接收该多个用户的用户标识和该多个用户的用户数据,实现数据获取。或者,服务器在每次记录用户数据时,可以将用户数据和相应的用户标识同步存储至后台终端,则在该步骤301中,后台终端可以从本地获取多个用户的用户标识和该多个用户的用户数据。
步骤302、根据该多个用户的用户标识和该多个用户的用户属性数据,生成结构化数据集。
其中,结构化数据集中的数据为结构化数据,结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据。
后台终端获取到多个用户的用户标识和多个用户的用户属性数据之后,可以根据该多个用户的用户标识和该多个用户的用户属性数据,生成结构化数据集,该结构化数据集用于存储用户标识与用户属性数据的关联关系,且在该结构化数据集中,用户标识与用户属性数据一一对应,该结构化数据集中,用户标识与用户属性数据均为结构化数据。可选地,该结构化数据集可以为用户属性表,该用户属性表用于存储用户标识和用户属性数据的标签值的对应关系。
示例地,图4是本申请实施例提供的一种根据用户标识和用户属性数据生成结构化数据集的方法流程图,该图4以结构化数据集为用户属性表进行说明。如图4所示,该方法可以包括如下子步骤:
子步骤3021、对于多个用户中的每个用户,根据该每个用户的用户属性数据,确定该每个用户的用户属性数据的标签值。
可选地,后台终端可以根据每个用户的用户属性数据,采用标签生成算法生成该用户属性数据的标签值。或者,后台终端可以维护属性数据与标签值的对应关系,该对应关系中记录有多个属性数据和多个标签值,每个属性数据对应表一个标签值,对于每个用户属性数据,后台终端可以查询该对应关系,得到与该用户属性数据对应的标签值,将该标签值确定为该用户属性数据的标签值。
子步骤3022、根据每个用户的用户标识和该每个用户的用户属性数据的标签值,生成该每个用户的一条结构化数据。
后台终端确定多个用户中每个用户的用户属性数据的标签值后,可以根据每个用户的用户标识和该每个用户的用户属性数据的标签值,生成该每个用户的一条结构化数据。可选地,后台终端可以将每个用户的用户标识和用户属性数据的标签值对应存储,得到该每个用户的一条结构化数据。
子步骤3023、根据多个用户的结构化数据,生成结构化数据集。
容易理解,在上述子步骤3022中,后台终端可以确定出多条结构化数据,后台终端可以按照二维表结构将该多条结构化数据存储,得到结构化数据集,该结构化数据集存储有多个用户的用户标识和该多个用户的用户属性数据的标签值。可选地,该结构化数据集可以是结构化查询语言(英文:Structured Query Language,中文:SQL)数据集。
示例地,在本申请实施例中,该结构化数据集可以如表1所示:
表1
其中,标签值“x01”为性别“女”的标签值,标签值“x02”为性别“男”的标签值,标签值“29”、“30”、“12”分别为年龄“29”、“30”、“12”的标签值。如表1所示,该结构化数据集存储有用户1的用户标识ID-1,以及该用户1的性别标签值“x01”和年龄标签值“29”,用户2的用户标识ID-2,以及该用户2的性别标签值“x01”和年龄标签值“30”,用户3的用户标识ID-3,以及该用户3的性别标签值“x02”和年龄标签值“12”。
步骤303、根据该多个用户的用户标识和该多个用户的用户行为数据,生成非结构化数据集。
其中,非结构化数据集中的数据为非结构化数据。
后台终端获取到多个用户的用户标识和多个用户的用户行为数据之后,可以根据该多个用户的用户标识和该多个用户的用户行为数据,生成非结构化数据集,该非结构化数据集用于存储用户标识与用户行为数据的关联关系,且在该非结构化数据集中,一个用户标识可以对应至少一个用户行为数据,该非结构化数据集中存储的可以是用户行为数据的源数据。
后台终端可以根据多个用户的用户标识和该多个用户的用户行为数据的源数据生成该非结构化数据集。可选地,对于每个用户标识,后台终端可以确定与该用户标识对应的至少一条用户行为数据的源数据,将该用户标识与该至少一条用户行为数据中的每条用户行为数据的源数据对应存储得到一条非结构化数据,从而得到包含每个用户标识的至少一条非结构化数据,根据所有的非结构化数据生成非结构化数据集,该非结构化数据集可以是SQL数据集。
示例地,在本申请实施例中,该非结构化数据集可以如表2所示:
表2
如表2所示,该非结构化数据集记录有用户1的用户标识ID-1,该用户1对商品A的购买行为数据以及该用户1对商品B的关注行为数据,用户2的用户标识ID-2以及该用户2对商品A购买行为数据,用户3的用户标识ID-1以及用户3对商品A的购买行为数据。
步骤304、接收通过条件配置界面触发的条件配置指令。
可选地,后台用户可以触发后台终端显示条件配置界面,该条件配置界面可以包括条件配置入口,后台用户可以通过该配置入口配置分群条件,并触发条件配置指令,后台终端可以接收后台用户触发的该条件配置指令。
可选地,该配置入口可以包括条件输入框和触发控件,后台用户可以在该条件输入框中输入条件配置信息,并点击该触发控件触发条件配置指令,该条件配置指令可以携带用户输入的条件配置信息,该条件配置信息可以包括属性条件配置信息和行为条件配置信息。或者,该配置入口可以包括至少一个条件配置控件,每个条件配置控件可以对应一个条件配置信息,用户可以点击该至少一个条件配置控件触发该条件配置指令,该条件配置指令可以携带该至少一个条件配置控件对应的条件配置信息,且该条件配置信息可以包括属性条件配置信息和行为条件配置信息。
示例地,请参考图5,其示出了本申请实施例提供的一种条件配置界面500的示意图,该条件配置界面500中显示有条件输入框501和触发控件502,后台用户在条件输入框501中输入条件配置信息后,可以点击触发控件502触发条件配置指令,该条件配置指令携带用户在条件输入框501中输入的条件配置信息。再示例地,请参考图6,其示出了本申请实施例提供的另一种条件配置界面600的示意图,该条件配置界面600包括多个条件配置控件,该多个条件配置控件可以包括属性条件配置控件和行为条件配置控件,该属性条件配置控件包括年龄控件601、性别控件602、学历控件603和户籍控件604,该行为条件配置控件包括购买控件605和关注控件606,该年龄控件601对应的条件配置信息为“20岁-30岁”,该性别控件602对应的条件配置信息为“女”,该学历控件603对应的条件配置信息为“本科”,该户籍控件604对应的条件配置信息为“陕西”,该购买控件605对应的条件配置信息为“购买商品A”,该关注控件606对应的条件配置信息为“关注商品A”。示例地,后台用户可以点击该年龄控件601、该性别控件602以及该购买控件605,触发条件配置指令,该条件配置指令携带的条件配置信息包括“20岁-30岁”、“女”和“购买商品A”。
步骤305、根据该条件配置指令,确定属性分群条件和行为分群条件。
后台终端接收到条件配置指令后,可以根据该条件配置指令确定属性分群条件和行为分群条件。可选地,条件配置指令携带条件配置信息,且条件配置信息可以包括属性条件配置信息和行为条件配置信息,后台终端可以根据属性条件配置信息确定属性分群条件,根据行为条件配置信息确定行为分群条件。
示例地,在步骤304中,后台用户可以点击年龄控件601、性别控件602以及购买控件605触发条件配置指令,该条件配置指令携带属性条件配置信息和行为条件配置信息,该属性条件配置信息包括“20岁~30岁”和“女”,该行为条件配置信息为“购买商品A”,则后台终端根据该属性条件配置信息确定属性分群条件可以为:“20岁~30岁”和“女”,根据该行为条件配置信息确定行为分群条件可以为:“购买商品A”。
步骤306、根据该属性分群条件从结构化数据集中获取第一用户标识。
可选地,后台终端可以根据属性分群条件,查询结构化数据集,以从该结构化数据集中确定出符合该属性分群条件的第一用户标识,并获取第一用户标识。容易理解,后台终端通常可以获取到至少一个第一用户标识。
可选地,结构化数据集可以是SQL数据集,后台终端可以将属性分群条件转换成结构化查询语言(英文:Structured Query Language,中文:SQL)语句的属性分群条件,并根据该SQL语句的属性分群条件,查询该结构化数据集。
可选地,根据上述步骤302可知,结构化数据集存储的是用户标识与用户属性数据的标签值的关联关系,因此,后台终端可以先将属性分群条件转换成相应的标签值条件,根据该标签值条件查询结构化数据集,得到符合该属性分群条件的第一用户标识。
示例地,在步骤305中,属性分群条件可以为:“20岁~30岁”和“女”,后台终端将该属性分群条件转换成得到的标签值条件可以为:“20~30”和“x01”,后台终端根据“20~30”和“x01”查询表1得到的第一用户标识可以为ID-1和ID-2。
步骤307、根据该行为分群条件从非结构化数据集中获取第二用户标识。
可选地,后台终端可以根据行为分群条件,查询非结构化数据集,以从该非结构化数据集中确定出符合该行为分群条件的第二用户标识,并获取第二用户标识。容易理解,后台终端通常可以获取到至少一个第二用户标识。
可选地,非结构化数据集可以是SQL数据集,后台终端可以将行为分群条件转换成SQL语句的行为分群条件,并根据该SQL语句的行为分群条件,查询该非结构化数据集。
示例地,在步骤305中,后台终端确定的行为分群条件可以为“购买商品A”,后台终端根据该行为分群条件查询表2得到的第二用户标识为ID-1、ID-2和ID-3。
步骤308、根据该属性分群条件和该行为分群条件确定目标分群条件。
可选地,后台终端可以按照集合运算方式,将属性分群条件和行为分群条件组合,得到目标分群条件,该集合运算可以包括“交”、“并”或“差”中的至少一种。
示例地,后台终端可以按照集合运算“交”将属性分群条件和行为分群条件组合,得到目标分群条件。也即是,后台终端将属性分群条件和行为分群条件的交集确定为目标分群条件。示例地,属性分群条件可以为:“20岁~30岁”和“女”,行为分群条件可以为“购买商品A”,后台终端将该属性分群条件和该行为分群条件的交集确定为目标分群条件,则该目标分群条件为年龄为“20岁~30岁”、“女”和“购买商品A”。
步骤309、根据该目标分群条件,从第一用户标识和第二用户标识中,确定至少一个目标用户标识。
可选地,后台终端可以根据该目标分群条件,将第一用户标识和第二用户标识组合,根据组合结果确定至少一个目标用户标识。
根据步骤308容易知道,目标分群条件是后台终端按照集合运算将属性分群条件和行为分群条件组合得到的,因此,在该步骤308中,后台终端可以按照与步骤308确定目标分群条件同样的集合运算方式,将第一用户标识和第二用户标识组合得到至少一个目标用户标识。
示例地,若目标分群条件是属性分群条件和行为分群条件的交集,则后台终端将第一用户标识和第二用户标识的交集确定为目标用户标识。示例地,后台终端根据属性分群条件“20岁~30岁”和“女”确定出的第一用户标识为ID-1和ID-2,根据行为分群条件“购买商品A”确定出的第二用户标识为ID-1、ID-2和ID-3,目标分群条件为“20岁~30岁”、“女”且“购买商品A”,则后台终端根据该目标分群条件,将第一用户标识D-1、ID-2以及第二用户标识ID-1、ID-2和ID-3的交集确定为目标用户标识,该目标用户标识为ID-1和ID-2。
步骤310、将该至少一个目标用户标识指示的至少一个目标用户构成的群体确定为目标用户群体。
在本申请实施例中,每个用户标识指示一个用户,在确定出至少一个目标用户标识后,后台终端可以将该至少一个目标用户标识指示的至少一个目标用户构成的群体确定为目标用户群体。
示例地,目标用户标识可以为ID-1和ID-2,ID-1指示用户1,ID-2指示用户2,则后台终端可以将用户1与用户2构成的群体称为目标用户群体。
需要说明的是,本申请实施例是以后台终端生成结构化数据集和非结构化数据集为例说明的,实际应用中,可以由服务器生成结构化数据集和非结构化数据集,也即是上述步骤302和303可以由服务器执行,服务器在生成结构化数据集和非结构化数据集后,可以将结构化数据集和非结构化数据集发送至后台终端,使后台终端能够执行上述步骤304至310,本申请实施例对此不做限定。
还需要说明的是,本申请实施例提供的用户分群方法步骤的先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本申请的保护范围之内,因此不再赘述。
综上所述,本申请实施例提供的用户分群方法,后台终端确定属性分群条件和行为分群条件后,根据属性分群条件从结构化数据集中获取第一用户标识,根据行为分群条件从非结构化数据集中获取第二用户标识,并从第一用户标识和第二用户标识中确定至少一个目标用户标识,该结构化数据集用于存储用户标识与用户属性数据的关联关系,该非结构化数据集用于存储用户标识与用户行为数据的关联关系,由于用户行为数据存储在非结构化数据集中,因此可以避免用户行为数据的增加导致结构化数据集膨胀,有助于降低用户分群的局限性。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图7是本申请实施例提供的一种用户分群装置700的逻辑框图,该用户分群装置700可以是后台终端中的程序组件,如图7所示,该用户分群装置700可以包括:
第一确定模块701,用于确定属性分群条件和行为分群条件;
第一获取模块702,用于根据属性分群条件从结构化数据集中获取第一用户标识,结构化数据集用于存储用户标识与用户属性数据的关联关系;
第二获取模块703,用于根据行为分群条件从非结构化数据集中获取第二用户标识,非结构化数据集用于存储用户标识与用户行为数据的关联关系;
第二确定模块704,用于从第一用户标识和第二用户标识中,确定至少一个目标用户标识。
综上所述,本申请实施例提供的用户分群装置,第一确定模块确定属性分群条件和行为分群条件后,第一获取模块根据属性分群条件从结构化数据集中获取第一用户标识,第二获取模块根据行为分群条件从非结构化数据集中获取第二用户标识,第二确定模块从第一用户标识和第二用户标识中确定至少一个目标用户标识,该结构化数据集用于存储用户标识与用户属性数据的关联关系,该非结构化数据集用于存储用户标识与用户行为数据的关联关系。由于用户行为数据存储在非结构化数据集中,因此可以避免用户行为数据的增加导致结构化数据集膨胀,有助于降低用户分群的局限性。
可选地,请参考图8,其示出了本申请实施例提供的另一种用户分群装置700的逻辑框图,如图8所示,在图7的基础上,该用户分群装置700还包括:
第三确定模块705,用于根据属性分群条件和行为分群条件确定目标分群条件;
相应地,第二确定模块704,用于根据该目标分群条件,从第一用户标识和第二用户标识中,确定至少一个目标用户标识。
可选地,第三确定模块705,用于按照集合运算方式将属性分群条件和行为分群条件组合,得到目标分群条件。
可选地,第一确定模块701,用于:
接收通过条件配置界面触发的条件配置指令;
根据该条件配置指令,确定属性分群条件和行为分群条件。
可选地,请继续参考图8,该用户分群装置700还包括:
第三获取模块706,用于获取多个用户的用户标识和该多个用户的用户数据,该用户数据包括用户属性数据和用户行为数据;
第一生成模块707,用于根据该多个用户的用户标识和该多个用户的用户属性数据,生成结构化数据集;
第二生成模块708,用于根据该多个用户的用户标识和该多个用户的用户行为数据,生成非结构化数据集。
可选地,该结构化数据集为用户属性表,该用户属性表用于存储用户标识和用户属性数据的标签值;
第一生成模块708,用于:
对于该多个用户中的每个用户,根据该每个用户的用户属性数据,确定该每个用户的用户属性数据的标签值;
根据该每个用户的用户标识和该每个用户的用户属性数据的标签值,生成该每个用户的一条结构化数据;
根据多个用户的结构化数据,生成结构化数据集。
可选地,第二生成模块708,用于根据该多个用户的用户标识和该多个用户的用户行为数据的源数据,生成非结构化数据集。
综上所述,本申请实施例提供的用户分群装置,第一确定模块确定属性分群条件和行为分群条件后,第一获取模块根据属性分群条件从结构化数据集中获取第一用户标识,第二获取模块根据行为分群条件从非结构化数据集中获取第二用户标识,第二确定模块从第一用户标识和第二用户标识中确定至少一个目标用户标识,该结构化数据集用于存储用户标识与用户属性数据的关联关系,该非结构化数据集用于存储用户标识与用户行为数据的关联关系。由于用户行为数据存储在非结构化数据集中,因此可以避免用户行为数据的增加导致结构化数据集膨胀,有助于降低用户分群的局限性。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本申请实施例提供了一种用户分群装置,包括:处理器和存储器,
存储器,用于存储计算机程序;
处理器,用于执行存储器上所存储的计算机程序,实现如图2至图4所示的用户分群方法。
图9是本申请实施例提供的一种用户分群装置800的结构示意图。该装置800可以是终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。该装置800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,用户分群装置800包括有:处理器801和存储器802。
处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行以实现本申请实施例提供的用户分群方法。
在一些实施例中,该装置800还可以包括有:***设备接口803和至少一个***设备。处理器801、存储器802和***设备接口803之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口803相连。具体地,***设备包括:射频电路804、显示屏805、摄像头组件806、音频电路807和电源809中的至少一种。
***设备接口803可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和***设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和***设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路804用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路804还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏805用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏805可以为一个,设置终端800的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端800的不同表面或呈折叠设计;在再一些实施例中,显示屏805可以是柔性显示屏,设置在终端800的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以为OLED(OrganicLight-Emitting Diode,有机发光二极管)显示屏。
摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在用户分群装置800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。
电源809用于为该装置800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,用户分群装置800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器811、陀螺仪传感器812、压力传感器813、光学传感器815以及接近传感器816。
加速度传感器811可以检测以该装置800建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号,控制触摸显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器812可以检测该装置800的机体方向及转动角度,陀螺仪传感器812可以与加速度传感器811协同采集用户对该装置800的3D动作。处理器801根据陀螺仪传感器812采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器813可以设置在该装置800的侧边框和/或触摸显示屏805的下层。当压力传感器813设置在该装置800的侧边框时,可以检测用户对该装置800的握持信号,由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在触摸显示屏805的下层时,由处理器801根据用户对触摸显示屏805的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
光学传感器815用于采集环境光强度。在一个实施例中,处理器801可以根据光学传感器815采集的环境光强度,控制触摸显示屏805的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏805的显示亮度;当环境光强度较低时,调低触摸显示屏805的显示亮度。在另一个实施例中,处理器801还可以根据光学传感器815采集的环境光强度,动态调整摄像头组件806的拍摄参数。
接近传感器816,也称距离传感器,通常设置在该装置800的前面板。接近传感器816用于采集用户与该装置800的正面之间的距离。在一个实施例中,当接近传感器816检测到用户与该装置800的正面之间的距离逐渐变小时,由处理器801控制触摸显示屏805从亮屏状态切换为息屏状态;当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时,由处理器801控制触摸显示屏805从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图9中示出的结构并不构成对用户分群装置800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请实施例提供了一种存储介质,当存储介质中的程序由处理器执行时,能够实现如图2至图4所示的用户分群方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本申请中,术语“第一”和“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的构思和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (9)
1.一种用户分群方法,其特征在于,所述方法包括:
确定属性分群条件和行为分群条件;
根据所述属性分群条件从结构化数据集中获取第一用户标识,所述结构化数据集用于存储用户标识与用户属性数据的关联关系;
根据所述行为分群条件从非结构化数据集中获取第二用户标识,所述非结构化数据集用于存储用户标识与用户行为数据的关联关系;
根据目标分群条件,从所述第一用户标识和所述第二用户标识中,确定至少一个目标用户标识;
在从所述第一用户标识和所述第二用户标识中,确定至少一个目标用户标识之前,所述方法还包括:根据所述属性分群条件和所述行为分群条件确定所述目标分群条件。
2.根据权利要求1所述的方法,其特征在于,所述根据所述属性分群条件和所述行为分群条件确定所述目标分群条件,包括:
按照集合运算方式将所述属性分群条件和所述行为分群条件组合,得到所述目标分群条件。
3.根据权利要求1所述的方法,其特征在于,所述确定属性分群条件和行为分群条件,包括:
接收通过条件配置界面触发的条件配置指令;
根据所述条件配置指令,确定所述属性分群条件和所述行为分群条件。
4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
获取多个用户的用户标识和所述多个用户的用户数据,所述用户数据包括用户属性数据和用户行为数据;
根据所述多个用户的用户标识和所述多个用户的用户属性数据,生成所述结构化数据集;
根据所述多个用户的用户标识和所述多个用户的用户行为数据,生成所述非结构化数据集。
5.根据权利要求4所述的方法,其特征在于,所述结构化数据集为用户属性表,所述用户属性表用于存储用户标识和用户属性数据的标签值;
所述根据所述多个用户的用户标识和所述多个用户的用户属性数据,生成所述结构化数据集,包括:
对于所述多个用户中的每个用户,根据所述每个用户的用户属性数据,确定所述每个用户的用户属性数据的标签值;
根据所述每个用户的用户标识和所述每个用户的用户属性数据的标签值,生成所述每个用户的一条结构化数据;
根据所述多个用户的结构化数据,生成所述结构化数据集。
6.根据权利要求4所述的方法,其特征在于,
所述根据所述多个用户的用户标识和所述多个用户的用户行为数据,生成所述非结构化数据集,包括:
根据所述多个用户的用户标识和所述多个用户的用户行为数据的源数据,生成所述非结构化数据集。
7.一种用户分群装置,其特征在于,包括用于执行权利要求1至6任一所述的用户分群的各个模块。
8.一种用户分群装置,其特征在于,包括:处理器和存储器,
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器上所存储的计算机程序,实现如权利要求1至6任一所述的用户分群方法。
9.一种存储介质,其特征在于,当所述存储介质中的程序由处理器执行时,能够实现如权利要求1至6任一所述的用户分群方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911035045.1A CN111192072B (zh) | 2019-10-29 | 2019-10-29 | 用户分群方法及装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911035045.1A CN111192072B (zh) | 2019-10-29 | 2019-10-29 | 用户分群方法及装置、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111192072A CN111192072A (zh) | 2020-05-22 |
CN111192072B true CN111192072B (zh) | 2023-08-04 |
Family
ID=70707163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911035045.1A Active CN111192072B (zh) | 2019-10-29 | 2019-10-29 | 用户分群方法及装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111192072B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111782966B (zh) * | 2020-06-30 | 2023-07-28 | 北京百度网讯科技有限公司 | 用户分群方法、装置、计算机设备和介质 |
CN113076473B (zh) * | 2021-03-19 | 2024-05-07 | 土巴兔集团股份有限公司 | 用户数据处理方法、装置、计算机设备及存储介质 |
CN115599976B (zh) * | 2022-11-28 | 2023-06-02 | 中国外运股份有限公司 | 用户分群方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915373A (zh) * | 2012-11-06 | 2013-02-06 | 无锡江南计算技术研究所 | 一种数据存储方法和装置 |
CN103310025A (zh) * | 2013-07-08 | 2013-09-18 | 北京邮电大学 | 非结构化数据的描述方法及装置 |
CN106445988A (zh) * | 2016-06-01 | 2017-02-22 | 上海坤士合生信息科技有限公司 | 一种大数据的智能处理方法和*** |
CN110109890A (zh) * | 2019-05-10 | 2019-08-09 | 京东方科技集团股份有限公司 | 非结构化数据处理方法和非结构化数据处理*** |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7421428B2 (en) * | 2000-02-22 | 2008-09-02 | Harvey Lunenfeld | Metasearching a client's request by sending at least one search query to a plurality of servers for displaying at least one list on the client of at least one item that may be ordered |
US7490091B2 (en) * | 2000-02-22 | 2009-02-10 | Harvey Lunenfeld | Metasearching a client's request for displaying at least one list comprising at least one advertisement on the client |
US7707245B2 (en) * | 2000-02-22 | 2010-04-27 | Harvey Lunenfeld | Metasearching a client's request for displaying different order books on the client |
CA3003084A1 (en) * | 2014-10-23 | 2016-04-28 | Dele Atanda | Intelligent personal information management system |
US20180268052A1 (en) * | 2015-03-20 | 2018-09-20 | Hewlett Packard Enterprise Development Lp | Analysis of information in a combination of a structured database and an unstructured database |
US20170091847A1 (en) * | 2015-09-29 | 2017-03-30 | International Business Machines Corporation | Automated feature identification based on review mapping |
US20180012237A1 (en) * | 2016-07-07 | 2018-01-11 | International Business Machines Corporation | Inferring user demographics through categorization of social media data |
-
2019
- 2019-10-29 CN CN201911035045.1A patent/CN111192072B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915373A (zh) * | 2012-11-06 | 2013-02-06 | 无锡江南计算技术研究所 | 一种数据存储方法和装置 |
CN103310025A (zh) * | 2013-07-08 | 2013-09-18 | 北京邮电大学 | 非结构化数据的描述方法及装置 |
CN106445988A (zh) * | 2016-06-01 | 2017-02-22 | 上海坤士合生信息科技有限公司 | 一种大数据的智能处理方法和*** |
CN110109890A (zh) * | 2019-05-10 | 2019-08-09 | 京东方科技集团股份有限公司 | 非结构化数据处理方法和非结构化数据处理*** |
Non-Patent Citations (2)
Title |
---|
云计算下非结构化大数据存储***设计;涂俊英;李志敏;;现代电子技术(01);全文 * |
基于主体行为的非结构化数据模型;韩晶;鄂海红;宋美娜;宋俊德;;计算机工程与设计(03);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111192072A (zh) | 2020-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109922356B (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
CN111192072B (zh) | 用户分群方法及装置、存储介质 | |
CN111127509B (zh) | 目标跟踪方法、装置和计算机可读存储介质 | |
CN111027490B (zh) | 人脸属性识别方法及装置、存储介质 | |
CN112163406B (zh) | 互动消息显示方法、装置、计算机设备及存储介质 | |
CN109948581B (zh) | 图文渲染方法、装置、设备及可读存储介质 | |
CN112256320B (zh) | 版本号生成方法、装置、终端及存储介质 | |
CN111177137B (zh) | 数据去重的方法、装置、设备及存储介质 | |
CN110147503B (zh) | 信息发布方法、装置、计算机设备和存储介质 | |
CN110705614A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN110677713B (zh) | 视频图像处理方法及装置、存储介质 | |
CN110737692A (zh) | 一种检索数据的方法、建立索引库的方法及装置 | |
CN111428080B (zh) | 录像文件的存储方法、搜索方法及装置 | |
CN116418771A (zh) | 消息显示方法、消息处理方法、装置及电子设备 | |
CN114143280B (zh) | 会话显示方法、装置、电子设备及存储介质 | |
CN112905328B (zh) | 任务处理方法、装置及计算机可读存储介质 | |
CN113343709B (zh) | 意图识别模型的训练方法、意图识别方法、装置及设备 | |
CN113051485B (zh) | 群组搜索方法、装置、终端及存储介质 | |
CN112365088B (zh) | 行程关键点的确定方法、装置、设备及可读存储介质 | |
CN116842047A (zh) | 缓存更新方法、装置、设备及计算机可读存储介质 | |
CN112749583A (zh) | 人脸图像分组方法、装置、计算机设备和存储介质 | |
CN113052408B (zh) | 一种社区聚合的方法及装置 | |
CN112135256A (zh) | 移动轨迹的确定方法、装置、设备及可读存储介质 | |
CN112311652A (zh) | 消息发送方法、装置、终端及存储介质 | |
CN111367949A (zh) | 数据查询方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |