CN115510324B - 一种标签体系的确定方法、装置、电子设备及存储介质 - Google Patents
一种标签体系的确定方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115510324B CN115510324B CN202211198256.9A CN202211198256A CN115510324B CN 115510324 B CN115510324 B CN 115510324B CN 202211198256 A CN202211198256 A CN 202211198256A CN 115510324 B CN115510324 B CN 115510324B
- Authority
- CN
- China
- Prior art keywords
- tag
- research entity
- feature
- research
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种标签体系的确定方法、装置、电子设备及存储介质,确定方法包括:获取针对目标业务的数据分析需求中的每个数据分析需求相应的对象;利用所述数据分析需求对应的业务属性对相应的对象进行细分类处理,得到每种对象对应的研究实体;根据用于描述每个研究实体的特征信息,并根据每个研究实体的特征信息构建每个研究实体相应的标签体系,以得到所有对象的标签体系。采用本申请提供的技术方案能够满足不同场景下的数据分析需求,提高了标签体系的丰富度,降低了各对象的标签的管理成本和标签体系建设的冗余度。
Description
技术领域
本申请涉及数据处理技术领域,尤其是涉及一种标签体系的确定方法、装置、电子设备及存储介质。
背景技术
标签用于标识某个对象的特性,为了能够更好的描述对象,可以从不同的维度来凸显对象的特点,通过总结和归纳,对某个对象的主要特征进行突出,基于此来凸显出对象的个性和不同点。标签体系,是根据多个标签建立的体系,为了能够对整个企业或者集团中所包含的对象进行***性,规范性的标签梳理,通过标签体系能更好地了解平台里的内容特性、也更了解平台中的用户特征,而更充分的了解,也意味着更好的满足用户需求。
目前,标签体系运用于“个性化”和“精准化”的事项,主要应用场景包括:精细化运营策略的制定、客户关系***CRM、广告推送的方式、个性化推荐***;比如一个短视频,通过在短视频的标签体系中对该短视频打上类似于鬼畜的标签,划分到搞笑-鬼畜视频的分类中,就可以专门针对性地推荐给喜欢看鬼畜的用户。但是,由于是根据短视频推荐等实际场景来建设客户标签体系,意味着有几个场景就要构建几套标签体系,当实际场景变多,场景之间使用的标签重复率越大,标签体系建设就越冗余,标签的管理成本也逐渐增加。因此,如何构建标签体系,以降低标签体系建设的冗余度和管理成本,成为了亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种基于多对象的标签体系的确定方法、确定装置、电子设备及存储介质,能够通过获取数据分析需求的对象,确定每个对象的研究实体和每个研究实体的特征信息,从而得到所有对象的标签体系,满足不同场景下的数据分析需求,提高了标签体系的丰富度,降低了各对象的标签的管理成本和标签体系建设的冗余度。
本申请主要包括以下几个方面:
第一方面,本申请实施例提供了一种标签体系的确定方法,所述确定方法包括:
获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;其中,所述对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系;
针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;
针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;
利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系。
进一步的,所述针对每个研究实体,根据用于描述该研究实体的特征信息构建与该研究实体相应的标签体系的步骤,包括:
针对每个研究实体,基于用于描述该研究实体的多个特征信息,获取该研究实体的每个特征信息对应的特征标签;
针对每个特征标签,基于七问分析法对该特征标签进行分类处理,在预先构建的多个类目中确定该特征标签所属的类目,并将该特征标签挂载在与该研究实体相应的原始标签体系所包括所属的类目下,以得到与该研究实体相应的***标签体系;
针对该研究实体相应的***标签体系中的每个特征标签,将该特征标签按照预设的设计模式进行转换,得到转换后的特征标签,并对转换后的特征标签进行分类处理以得到与该研究实体相应的业务标签体系;
将与该研究实体相应的***标签体系和与该研究实体相应的业务标签体系进行组合,构建与该研究实体相应的标签体系。
进一步的,所述在构建与该研究实体相应的标签体系之后,所述确定方法还包括:
针对任一特征标签,响应于针对该特征标签的第一操作,对该特征标签下的目标特征信息进行分析处理;
或者,
针对任一特征标签,响应于针对该特征标签的第二操作,对该特征标签的所有特征信息进行分析处理;其中,所述第一操作是在该特征标签下获取至少一个但非所有的目标特征信息的操作;所述第二操作是在该特征标签下获取所有的目标特征信息的操作。
进一步的,所述利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系的步骤,包括:
利用构建好的每个研究实体相应的标签体系,将每个研究实体相应的标签体系按照每个研究实体所属的对象进行组合,构建针对所有对象的目标标签体系。
进一步的,所述类目包括以下项中的至少一项:
客户识别标签、客户基础标签、客户时间标签、客户位置标签、客户产品标签、客户事件标签、客户统计标签以及客户评价标签。
进一步的,所述在构建针对所有对象的目标标签体系之后,所述确定方法还包括:
响应于针对第一显示页面中显示的多个对象中的目标对象的第三操作,显示所述目标对象下的多个研究实体;
响应于针对所述多个研究实体中的目标研究实体的第四操作,显示与所述目标研究实体相应的标签体系,以根据用户需求对所述特征标签进行分析;其中,所述标签体系包括所述目标研究实体下的类目和特征标签。
第二方面,本申请实施例还提供了一种标签体系的确定装置,所述确定装置包括:
获取模块,用于获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;其中,所述对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系;
处理模块,用于针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;
构建模块,用于针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;
确定模块,用于利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系。
进一步的,所述构建模块在用于针对每个研究实体,根据用于描述该研究实体的特征信息构建与该研究实体相应的标签体系时,所述构建模块具体用于:
针对每个研究实体,基于用于描述该研究实体的多个特征信息,获取该研究实体的每个特征信息对应的特征标签;
针对每个特征标签,基于七问分析法对该特征标签进行分类处理,在预先构建的多个类目中确定该特征标签所属的类目,并将该特征标签挂载在与该研究实体相应的原始标签体系所包括所属的类目下,以得到与该研究实体相应的***标签体系;
针对该研究实体相应的***标签体系中的每个特征标签,将该特征标签按照预设的设计模式进行转换,得到转换后的特征标签,并对转换后的特征标签进行分类处理以得到与该研究实体相应的业务标签体系;
将与该研究实体相应的***标签体系和与该研究实体相应的业务标签体系进行组合,构建与该研究实体相应的标签体系。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的标签体系的确定方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述的标签体系的确定方法的步骤。
本申请实施例提供的一种标签体系的确定方法、装置、电子设备及存储介质,所述确定方法包括:获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;其中,所述对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系;针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系。
这样,采用本申请提供的技术方案能够通过获取数据分析需求的对象,确定每个对象的研究实体和每个研究实体的特征信息,从而得到所有对象的标签体系,满足不同场景下的数据分析需求,提高了标签体系的丰富度,降低了各对象的标签的管理成本和标签体系建设的冗余度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种标签体系的确定方法的流程图;
图2示出了本申请实施例所提供的另一种标签体系的确定方法的流程图;
图3示出了本申请实施例所提供的一种标签体系的确定装置的结构图之一;
图4示出了本申请实施例所提供的一种标签体系的确定装置的结构图之二;
图5示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“标签体系的确定”,给出以下实施方式,对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。
本申请实施例下述方法、装置、电子设备或计算机可读存储介质可以应用于任何需要确定标签体系的场景,本申请实施例并不对具体的应用场景作限制,任何使用本申请实施例提供的一种标签体系的确定方法、装置、电子设备及存储介质的方案均在本申请保护范围内。
值得注意的是,标签用于标识某个对象的特性,为了能够更好的描述对象,可以从不同的维度来凸显对象的特点,通过总结和归纳,对某个对象的主要特征进行突出,基于此来凸显出对象的个性和不同点。标签体系,是根据多个标签建立的体系,为了能够对整个企业或者集团中所包含的对象进行***性,规范性的标签梳理,通过标签体系能更好地了解平台里的内容特性、也更了解平台中的用户特征,而更充分的了解,也意味着更好的满足用户需求。
目前,标签体系运用于“个性化”和“精准化”的事项,主要应用场景包括:精细化运营策略的制定、客户关系***CRM、广告推送的方式、个性化推荐***;比如一个短视频,通过在短视频的标签体系中对该短视频打上类似于鬼畜的标签,划分到搞笑-鬼畜视频的分类中,就可以专门针对性地推荐给喜欢看鬼畜的用户。但是,由于是根据短视频推荐等实际场景来建设客户标签体系,意味着有几个场景就要构建几套标签体系,当实际场景变多,场景之间使用的标签重复率越大,标签体系建设就越冗余,标签的管理成本也逐渐增加。因此,如何构建标签体系,以降低标签体系建设的冗余度和管理成本,成为了亟待解决的问题。
基于此,本申请提出了一种标签体系的确定方法、装置、电子设备及存储介质,所述确定方法包括:获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;其中,所述对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系;针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系。
这样,采用本申请提供的技术方案能够通过获取数据分析需求的对象,确定每个对象的研究实体和每个研究实体的特征信息,从而得到所有对象的标签体系,满足不同场景下的数据分析需求,提高了标签体系的丰富度,降低了各对象的标签的管理成本和标签体系建设的冗余度。
为便于对本申请进行理解,下面将结合具体实施例对本申请提供的技术方案进行详细说明。
请参阅图1,图1为本申请实施例所提供的一种标签体系的确定方法的流程图,如图1中所示,所述确定方法包括:
S101、获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;
该步骤中,对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系。目标业务可以是银行业务,也可以是保险业务,在此不做限定。进行多对象的标签体系建设前,首先要清楚对哪类对象建设标签体系,也就是获取数据分析需求中每个数据分析需求的对象;对象是客观世界中研究实体的抽象,有实体的对象,也有虚拟的对象。在企业经营过程中可以抽象出非常多的对象,经过对多家银行、多个标签体系建设经验的总结,可把对象分为“人”“物”“关系”三大类。“人”往往具有主动性和智慧,能主动参与社会活动,主动发挥推动作用,往往是关系的发出者。“物”往往是被动的,是关系的接收者。“人”和“物”是实体类的对象,即看得到、摸得着的对象,而“关系”属于一种虚拟对象,是对两两实物实体间的联系的定义,是人和物、或人和人、物和物等在某时某刻发生的某种连接。
示例性的,数据分析需求可以是“分析贷款低风险客群的性别比例”,可以是“分析近三天受欢迎产品的总销量”,也可以是“分析每月签订某几个合约的数量”等,针对“分析贷款低风险客群的性别比例”的数据分析需求,该数据分析需求的对象是“人”;针对“分析近三天受欢迎产品的总销量”的数据分析需求,该数据分析需求的对象是“物”;针对“分析每月签订某几个合约的数量”的数据分析需求,该数据分析需求的对象是“关系”。
S102、针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;
该步骤中,研究实体是对对象的具体描述,可以根据数据分析需求对每种对象进行分类,例如对象为“人”时,研究实体包括:零售客户、对公客户以及企业员工等;对象为“物”时,研究实体包括:产品和仓库等;对象为“关系”时,研究实体包括:事件和合约等,每个研究实体均对应一套标签体系。
S103、针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;
该步骤中,每个对象下的每个研究实体具有多个特征信息,特征信息可以是用于描述研究实体的属性;示例性的,若数据分析需求是“分析贷款低风险客群的性别比例”的,对象为“人”,研究实体是“零售客户”,针对零售客户的多个特征信息包括:工作就业状态是在职或离职、外部逾期标识是逾期或非逾期、逾期金额的具体金额、累计逾期次数的具体次数以及客户性别是男性或女性等等。
需要说明的是,针对每个研究实体,根据用于描述该研究实体的特征信息构建与该研究实体相应的标签体系的步骤请参阅图2,图2为本申请实施例所提供另一种标签体系的确定方法的流程图,如图2中所示,针对每个研究实体,根据用于描述该研究实体的特征信息构建与该研究实体相应的标签体系的步骤,包括:
S201、针对每个研究实体,基于用于描述该研究实体的多个特征信息,获取该研究实体的每个特征信息对应的特征标签;
示例性的,特征信息为工作就业状态是在职或离职时,对应的特征标签是工作就业状态;特征信息为外部逾期标识是逾期或非逾期时,对应的特征标签是外部逾期标识;特征信息为逾期金额的具体金额时,对应的特征标签是逾期金额;特征信息为累计逾期次数的具体次数时,对应的特征标签是累计逾期次数;特征信息为客户性别是男性或女性时,对应的特征标签是客户性别。
S202、针对每个特征标签,基于七问分析法对该特征标签进行分类处理,在预先构建的多个类目中确定该特征标签所属的类目,并将该特征标签挂载在与该研究实体相应的原始标签体系所包括所属的类目下,以得到与该研究实体相应的***标签体系;
该步骤中,类目具有多级,第一级类目为根类目,针对多级类目中的每一级类目,该级类目均从属于该级类目的上一级类目;例如,类目为三级时,第一级类目下具有第二级类目,第二级类目下具有第三级类目,每一级类目的个数不做限制,可以有多个第一级类目,每个第一级类目下具有多个第二级类目,每个第二级类目下具有多个第三级类目,将每个特征标签挂载在所属的每一级类目下,直到挂载到最后一级类目,挂载结束,例如当类目具有三级时,针对每个特征标签,均具有唯一对应的一个第一级类目,该第一级类目下的一个第二级类目以及该第二级类目下的一个第三级类目。第一级类目包括以下项中的至少一项:客户识别标签、客户基础标签、客户时间标签、客户位置标签、客户产品标签、客户事件标签、客户统计标签以及客户评价标签。
这里,基于七问分析法5W2H(Who、When、Where、What、How、How Much、Why)和客户在银行的五大核心业务流程(接触、业务、合约、产品、交易)来提炼特征标签。例如,在银行业务中,首先需要获取银行客户(Who)的个人信息,将其拆分为可用来识别客户的重要识别信息和客户的一些基础信息,并记录客户在什么时间(时间维度When,主要记录客户在银行产生留痕的首末次时间)、什么地点(位置维度Where,主要记录客户在哪些机构、网点渠道产生的行为),做了什么事情(What,进行了何种接触,或办理了什么业务,或签订了什么合约,或购买了什么产品,或进行了什么交易等),如何进行的这件事(How,记录整个事件的发生过程),这件事做得如何(How Much,主要通过一些数值来进行度量),最后通过以上信息去洞察客户行为,来提升风险管理能力(Why,基于以上信息根据算法构建全面、科学的评价体系)。综上,将一级类目分为八类,分别是:客户识别标签、客户基础标签、客户时间标签、客户位置标签、客户产品标签、客户事件标签、客户统计标签、客户评价标签。其中,客户识别标签:客户识别(客户ID-Mapping)信息转化的标签;客户基础标签:客户基本信息、客户身份信息和客户关系等特征;客户时间标签:客户与日期、时间的关系,时间维度用于数据统计与指标、标签派生等;客户位置标签:客户与渠道、位置的关系,位置维度用于数据统计与指标、标签派生等;客户产品标签:客户与产品、服务的关系,业务维度用于数据统计与指标、标签派生等;客户事件标签:客户自身或与金融机构发生业务往来的事件发生过程,记录了人物、时间、位置、事件等;客户统计标签:客户与金融机构发生业务往来的事实结果,记录了业务过程事件的度量统计,基本是数量值表示;客户评价标签:基于客户事件或客户事实所记录的信息描述和信息统计,构建全面的、科学的客户评价特征。
示例性的,将每个第一级类目按照每个特征信息的类型再细分为多个第二级类目,将每个第二级类目按照每个特征信息的类型再细分为多个第三级类目,以此类推,直到最后一级类目;例如,某一个第一级类目为“客户基础标签”,在客户基础标签下的第二级类目包括:基本信息、财富信息以及外部咨询等等;在基本信息下的第三级类目包括:人口统计、工作信息、联系信息以及就学信息等等;某一个第一级类目为“客户统计标签”,在客户统计标签下的第二级类目包括:资产统计、负债统计以及交易统计等等;在负债统计下的第三级类目包括:贷款统计和***统计等等。
例如,有三级类目,在确定好第一级类目,第一级类目下的第二级类目以及第二级类目下的第三级类目后,将特征标签挂载到所属的第一级类目,该第一级类目下的第二级类目,该第二级类目下的第三级类目下,逐层挂载。特征标签是数据资产的载体,是对象的研究实体的属性。要实现对某一对象的完整刻画,就需要将特征标签分类,挂载到对应的类目下。特征标签是对对象的特征信息持续“炼化”的过程,故关键点为持续炼化,逐层挂载。
S203、针对该研究实体相应的***标签体系中的每个特征标签,将该特征标签按照预设的设计模式进行转换,得到转换后的特征标签,并对转换后的特征标签进行分类处理以得到与该研究实体相应的业务标签体系;
该步骤中,通过***标签体系下的特征标签派生出新的标签,用以构建业务标签体系;示例性的,特征标签为“末次营销活动参与日期”,通过预设的设计模式,通过获取到的结束日期以及具体天数(例如3天)可以将“末次营销活动参与日期”转化为“活动参与活跃程度”,即将末次营销活动参与日期到结束日期3天内的客户认定为高活跃活动参与的客户;将“活动参与活跃程度”进行分类处理,挂载到预先构建好的业务标签类目下,用以构建业务标签体系;这里的设计模式,例如结束日期以及具体天数可以是人工在页面上预先手动配置的规则。
S204、将与该研究实体相应的***标签体系和与该研究实体相应的业务标签体系进行组合,构建与该研究实体相应的标签体系。
该步骤中,业务标签体系是根据***标签体系派生出来的,根据实际业务场景需求,基于***标签体系中的特征标签,通过不同的标签设计模式自行派生出新的标签,来满足业务使用场景,通过这些派生出的新的标签构建业务标签体系。这里,每个对象下的每个研究实体下的标签体系均包括***标签体系和业务标签体系,根据每个对象的多个研究实体可以得到每个对象的多个标签体系,根据多个对象,可以得到所有对象的标签体系。
需要说明的是,在构建与该研究实体相应的标签体系之后,确定方法还包括:
a)、针对任一特征标签,响应于针对该特征标签的第一操作,对该特征标签下的目标特征信息进行分析处理;
b)、或者,针对任一特征标签,响应于针对该特征标签的第二操作,对该特征标签的所有特征信息进行分析处理;其中,所述第一操作是在该特征标签下获取至少一个但非所有的目标特征信息的操作;所述第二操作是在该特征标签下获取所有的目标特征信息的操作。
该步骤中,特征标签有不同的特征信息时,则建立该特征标签与多个特征信息的映射关系,即该特征标签为阈值标签;示例性的,当特征标签为性别时,对应的特征信息(阈值标签)包括女性和男性;当特征标签为城市时,对应的特征信息包括北京、天津和大连等等。
示例性的,当响应于特征标签的第一操作(例如,分析某个客群中女性的人数时,第一操作可以是通过鼠标点击或键盘触控的方式选中特征标签下的至少一个但非所有的目标特征信息的操作),则可以通过特征标签(性别)的目标特征信息(女性)对该客群中进行筛选;当响应于特征标签的第二操作(例如分析某个客群中各性别所占的比例时,第二操作可以是通过鼠标点击或键盘触控的方式选中特征标签下的所有目标特征信息的操作),则可以通过特征标签(性别)的每个特征信息(女性和男性)对该客群中进行性别比例的分析。
S104、利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系。
需要说明的是,利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系的步骤,包括:
一、利用构建好的每个研究实体相应的标签体系,将每个研究实体相应的标签体系按照每个研究实体所属的对象进行组合,构建针对所有对象的目标标签体系。
该步骤中,通过上述步骤中的“立对象、定实体、分类目、挂标签、标阈值”,即按照每个对象自顶向下的设计确定标签体系的方法,从而构建一套单对象的标签体系。同时,还支持多对象的标签体系的功能扩充。通过在平台下载规范化后的模板(即,类目、特征标签、特征信息分别对应的模板),获取各标签体系的类目、特征标签、特征信息,实现在平台通过切换标签体系即可展示各标签体系信息,并进行以标签体系为基础的后续应用。
需要说明的是,在构建针对所有对象的目标标签体系之后,确定方法还包括:
1)、响应于针对第一显示页面中显示的多个对象中的目标对象的第三操作,显示所述目标对象下的多个研究实体;
2)、响应于针对所述多个研究实体中的目标研究实体的第四操作,显示与所述目标研究实体相应的标签体系,以根据用户需求对所述特征标签进行分析;其中,所述标签体系包括所述目标研究实体下的类目和特征标签。
示例性的,在第一显示页面的多个对象(例如,人、物和关系)中通过响应于第一显示页面的第三操作(这里的第三操作可以是在第一显示页面显示的多个对象中通过鼠标点击或键盘触控从而选中目标对象的操作),获取目标对象(例如,人)和目标对象下的多个研究实体(例如,零售客户、对公客户、企业员工),将多个研究实体显示在第一显示页面中得到第二显示页面,在第二显示页面中显示有目标对象下的多个研究实体中,响应于针对多个研究实体中的目标研究实体的第四操作(这里的第四操作可以是在第二显示页面显示的多个研究实体中通过鼠标点击或键盘触控等方式从而选中企业员工这个目标研究实体的操作),确定第四操作对应的目标研究实体(企业员工),获取该目标研究实体(企业员工)的标签体系(***标签体系和业务标签体系);若共有二级类目,在***标签体系中获取该***标签体系下的多个第一级类目,获取每个第一级类目下的多个第二级类目以及每个第二级类目下的多个特征标签;在业务标签体系中获取该业务标签体系下的多个第一级类目、每个第一级类目下的多个第二级类目以及每个第二级类目下的多个业务标签;将获取到的多个特征标签或业务标签显示在第一显示页面上以便根据用户需求在多个特征标签中确定至少一个特征标签进行数据的分析。
例如,用户需求是“对企业员工中在岗的员工逾期金额小于等于10000元的人群进行分析”,可以通过在企业员工的标签体系中的***标签体系中获取第一级类目“客户基础标签”下的第二级类目“基本信息”下的第三级类目“工作信息”的特征标签“工作就业状态”的预设阈值“在岗”以及第一级类目“客户统计标签”下的第二级类目“负债统计”下的第三级类目“贷款统计”的特征标签“逾期金额”,获取筛选规则(逾期金额小于等于10000元),这里的筛选规则可以是人为手动在页面上预先配置的;筛选出企业员工中在岗的员工逾期金额小于等于10000元的人群,可以对该人群进行性别比例的分析,也可以对该人群的年龄段进行分析。
这里,通过两种类型的类目树建设方式与管理模式,即***标签体系与业务标签体系,来保证对于***标签的中心化管理和业务标签的分项自治的运营模式,从而实现“让标签快速、灵活地用起来”的目标。本实施例基于5W2H七问分析法(Who、When、Where、What、How、How Much、Why)和客户在银行的五大核心业务流程(接触、业务、合约、产品、交易)来提炼标签,并支持多对象的标签体系的功能扩充,提供多对象的标签体系挂载,打通了各对象之间的关系,满足各对象的标签体系的不同场景业务下的横向可扩展性,提高标签体系的丰富度,降低各对象标签的使用成本和标签体系构建开发的复杂度。
本申请实施例提供的一种标签体系的确定方法,所述确定方法包括:获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;其中,所述对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系;针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系。
这样,采用本申请提供的技术方案能够通过获取数据分析需求的对象,确定每个对象的研究实体和每个研究实体的特征信息,从而得到所有对象的标签体系,满足不同场景下的数据分析需求,提高了标签体系的丰富度,降低了各对象的标签的管理成本和标签体系建设的冗余度。
基于同一申请构思,本申请实施例中还提供了与上述实施例提供一种标签体系的确定方法对应的一种标签体系的确定装置,由于本申请实施例中的装置解决问题的原理与本申请上述实施例一种标签体系的确定方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图3、图4,图3为本申请实施例所提供的一种标签体系的确定装置的结构图之一,图4为本申请实施例所提供的一种标签体系的确定装置的结构图之二。如图3中所示,所述确定装置310包括:
获取模块311,用于获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;其中,所述对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系;
处理模块312,用于针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;
构建模块313,用于针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;
确定模块314,用于利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系。
可选的,所述构建模块313在用于针对每个研究实体,根据用于描述该研究实体的特征信息构建与该研究实体相应的标签体系时,所述构建模块313具体用于:
针对每个研究实体,基于用于描述该研究实体的多个特征信息,获取该研究实体的每个特征信息对应的特征标签;
针对每个特征标签,基于七问分析法对该特征标签进行分类处理,在预先构建的多个类目中确定该特征标签所属的类目,并将该特征标签挂载在与该研究实体相应的原始标签体系所包括所属的类目下,以得到与该研究实体相应的***标签体系;
针对该研究实体相应的***标签体系中的每个特征标签,将该特征标签按照预设的设计模式进行转换,得到转换后的特征标签,并对转换后的特征标签进行分类处理以得到与该研究实体相应的业务标签体系;
将与该研究实体相应的***标签体系和与该研究实体相应的业务标签体系进行组合,构建与该研究实体相应的标签体系。
可选的,如图4所示,所述确定装置310还包括第一应用模块315,所述第一应用模块315用于:
针对任一特征标签,响应于针对该特征标签的第一操作,对该特征标签下的目标特征信息进行分析处理;
或者,
针对任一特征标签,响应于针对该特征标签的第二操作,对该特征标签的所有特征信息进行分析处理;其中,所述第一操作是在该特征标签下获取至少一个但非所有的目标特征信息的操作;所述第二操作是在该特征标签下获取所有的目标特征信息的操作。
可选的,所述确定模块314在用于利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系时,所述确定模块314具体用于:
利用构建好的每个研究实体相应的标签体系,将每个研究实体相应的标签体系按照每个研究实体所属的对象进行组合,构建针对所有对象的目标标签体系。
可选的,如图4所示,所述确定装置310还包括第二应用模块316,所述第二应用模块316用于:
响应于针对第一显示页面中显示的多个对象中的目标对象的第三操作,显示所述目标对象下的多个研究实体;
响应于针对所述多个研究实体中的目标研究实体的第四操作,显示与所述目标研究实体相应的标签体系,以根据用户需求对所述特征标签进行分析;其中,所述标签体系包括所述目标研究实体下的类目和特征标签。
本申请实施例提供的一种标签体系的确定装置,所述确定装置包括:获取模块,用于获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;其中,所述对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系;处理模块,用于针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;构建模块,用于针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;确定模块,用于利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系。
这样,采用本申请提供的技术方案能够通过获取数据分析需求的对象,确定每个对象的研究实体和每个研究实体的特征信息,从而得到所有对象的标签体系,满足不同场景下的数据分析需求,提高了标签体系的丰富度,降低了各对象的标签的管理成本和标签体系建设的冗余度。
请参阅图5,图5为本申请实施例所提供的一种电子设备的结构示意图。如图5中所示,所述电子设备500包括处理器510、存储器520和总线530。
所述存储器520存储有所述处理器510可执行的机器可读指令,当电子设备500运行时,所述处理器510与所述存储器520之间通过总线530通信,所述机器可读指令被所述处理器510执行时,可以执行如上述图1以及图2所示方法实施例中的标签体系的确定方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的标签体系的确定方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种标签体系的确定方法,其特征在于,所述确定方法包括:
获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;其中,所述对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系;
针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;
针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;
利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系;
所述针对每个研究实体,根据用于描述该研究实体的特征信息构建与该研究实体相应的标签体系的步骤,包括:
针对每个研究实体,基于用于描述该研究实体的多个特征信息,获取该研究实体的每个特征信息对应的特征标签;
针对每个特征标签,基于七问分析法对该特征标签进行分类处理,在预先构建的多个类目中确定该特征标签所属的类目,并将该特征标签挂载在与该研究实体相应的原始标签体系所包括所属的类目下,以得到与该研究实体相应的***标签体系;
针对该研究实体相应的***标签体系中的每个特征标签,将该特征标签按照预设的设计模式进行转换,得到转换后的特征标签,并对转换后的特征标签进行分类处理以得到与该研究实体相应的业务标签体系;
将与该研究实体相应的***标签体系和与该研究实体相应的业务标签体系进行组合,构建与该研究实体相应的标签体系。
2.根据权利要求1所述的确定方法,其特征在于,在所述构建与该研究实体相应的标签体系之后,所述确定方法还包括:
针对任一特征标签,响应于针对该特征标签的第一操作,对该特征标签下的目标特征信息进行分析处理;
或者,
针对任一特征标签,响应于针对该特征标签的第二操作,对该特征标签的所有特征信息进行分析处理;其中,所述第一操作是在该特征标签下获取至少一个但非所有的目标特征信息的操作;所述第二操作是在该特征标签下获取所有的目标特征信息的操作。
3.根据权利要求1所述的确定方法,其特征在于,所述利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系的步骤,包括:
利用构建好的每个研究实体相应的标签体系,将每个研究实体相应的标签体系按照每个研究实体所属的对象进行组合,构建针对所有对象的目标标签体系。
4.根据权利要求1所述的确定方法,其特征在于,所述类目包括以下项中的至少一项:
客户识别标签、客户基础标签、客户时间标签、客户位置标签、客户产品标签、客户事件标签、客户统计标签以及客户评价标签。
5.根据权利要求1所述的确定方法,其特征在于,在所述构建针对所有对象的目标标签体系之后,所述确定方法还包括:
响应于针对第一显示页面中显示的多个对象中的目标对象的第三操作,显示所述目标对象下的多个研究实体;
响应于针对所述多个研究实体中的目标研究实体的第四操作,显示与所述目标研究实体相应的标签体系,以根据用户需求对所述特征标签进行分析;其中,所述标签体系包括所述目标研究实体下的类目和特征标签。
6.一种标签体系的确定装置,其特征在于,所述确定装置包括:
获取模块,用于获取针对目标业务的多个数据分析需求中的每个数据分析需求相应的对象;其中,所述对象包括以下中的任意一项:人、物、人和人之间的关系、人和物之间的关系以及物和物之间的关系;
处理模块,用于针对每个数据分析需求,利用该数据分析需求对应的业务属性对相应的对象进行细分类处理,得到该数据分析需求相应的对象对应的多个研究实体;
构建模块,用于针对每个研究实体,根据用于描述该研究实体的多个特征信息构建与该研究实体相应的标签体系;
确定模块,用于利用构建好的每个研究实体相应的标签体系,构建针对所有对象的目标标签体系;
所述构建模块在用于针对每个研究实体,根据用于描述该研究实体的特征信息构建与该研究实体相应的标签体系时,所述构建模块具体用于:
针对每个研究实体,基于用于描述该研究实体的多个特征信息,获取该研究实体的每个特征信息对应的特征标签;
针对每个特征标签,基于七问分析法对该特征标签进行分类处理,在预先构建的多个类目中确定该特征标签所属的类目,并将该特征标签挂载在与该研究实体相应的原始标签体系所包括所属的类目下,以得到与该研究实体相应的***标签体系;
针对该研究实体相应的***标签体系中的每个特征标签,将该特征标签按照预设的设计模式进行转换,得到转换后的特征标签,并对转换后的特征标签进行分类处理以得到与该研究实体相应的业务标签体系;
将与该研究实体相应的***标签体系和与该研究实体相应的业务标签体系进行组合,构建与该研究实体相应的标签体系。
7.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如权利要求1至5任一所述的标签体系的确定方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至5任一所述的标签体系的确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211198256.9A CN115510324B (zh) | 2022-09-29 | 2022-09-29 | 一种标签体系的确定方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211198256.9A CN115510324B (zh) | 2022-09-29 | 2022-09-29 | 一种标签体系的确定方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115510324A CN115510324A (zh) | 2022-12-23 |
CN115510324B true CN115510324B (zh) | 2023-04-28 |
Family
ID=84507644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211198256.9A Active CN115510324B (zh) | 2022-09-29 | 2022-09-29 | 一种标签体系的确定方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115510324B (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106357517B (zh) * | 2016-09-27 | 2020-09-11 | 腾讯科技(北京)有限公司 | 定向标签生成方法及装置 |
CN111382343B (zh) * | 2018-12-27 | 2023-11-28 | 方正国际软件(北京)有限公司 | 一种标签体系生成方法及装置 |
CN111177129B (zh) * | 2019-12-16 | 2023-08-08 | 中国平安财产保险股份有限公司 | 标签体系的构建方法、装置、设备及存储介质 |
CN113313344B (zh) * | 2021-04-13 | 2023-03-31 | 武汉烽火众智数字技术有限责任公司 | 一种融合多模式的标签体系构建方法和*** |
CN114547385A (zh) * | 2022-02-25 | 2022-05-27 | 中国平安人寿保险股份有限公司 | 标签构建方法、装置、电子设备及存储介质 |
CN114995903B (zh) * | 2022-05-30 | 2023-06-27 | 中电金信软件有限公司 | 一种基于预训练语言模型的类别标签识别方法及装置 |
-
2022
- 2022-09-29 CN CN202211198256.9A patent/CN115510324B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN115510324A (zh) | 2022-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Malik | Governing big data: principles and practices | |
US8341101B1 (en) | Determining relationships between data items and individuals, and dynamically calculating a metric score based on groups of characteristics | |
CN111401777B (zh) | 企业风险的评估方法、装置、终端设备及存储介质 | |
US20130297543A1 (en) | Tools and methods for determining relationship values | |
Hardoon et al. | Getting started with business analytics: insightful decision-making | |
US20130204823A1 (en) | Tools and methods for determining relationship values | |
CN108628866A (zh) | 数据融合的方法和装置 | |
CN114510735B (zh) | 基于角色管理的智慧共享财务管理方法及平台 | |
Mumford et al. | Footfall signatures and volumes: Towards a classification of UK centres | |
US8478702B1 (en) | Tools and methods for determining semantic relationship indexes | |
Puri et al. | Survey big data analytics, applications and privacy concerns | |
CN113052653A (zh) | 一种金融产品内容推荐方法、***及计算机可读存储介质 | |
Lee et al. | How are service automation and national ICT development associated with international trade in services? | |
CN115510324B (zh) | 一种标签体系的确定方法、装置、电子设备及存储介质 | |
Shashidhar et al. | Customer segmentation of bank based on data mining–security value based heuristic approach as a replacement to K-means segmentation | |
CN116467525A (zh) | 业务产品的推荐方法、装置、设备和存储介质 | |
Chaorasiya et al. | A survey on big data: techniques and technologies | |
Hunger | Epistemic harvest: The electronic database as discourse and means of data production | |
CN111125514B (zh) | 用户行为分析的方法、装置、电子设备和存储介质 | |
Lawal et al. | Application of data mining and knowledge management for business improvement: An exploratory study | |
Tarka et al. | On the Unstructured Big Data Analytical Methods in Firms: Conceptual Model, Measurement, and Perception | |
Carlsson et al. | What's trending in social media analytics area? A retrospective | |
CN113762994A (zh) | 用户运营管理的方法和装置 | |
CN115600600B (zh) | 多对象标签体系的标签命名方法、装置、电子设备及介质 | |
CN115718825B (zh) | 一种时长标签的确定方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |