CN105975590A - 对象类型的确定方法和装置 - Google Patents

对象类型的确定方法和装置 Download PDF

Info

Publication number
CN105975590A
CN105975590A CN201610298394.2A CN201610298394A CN105975590A CN 105975590 A CN105975590 A CN 105975590A CN 201610298394 A CN201610298394 A CN 201610298394A CN 105975590 A CN105975590 A CN 105975590A
Authority
CN
China
Prior art keywords
data
characteristic dimension
characteristic
type
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610298394.2A
Other languages
English (en)
Inventor
胡斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUXI YAZUO ONLINE TECHNOLOGY DEVELOPMENT Co Ltd
Original Assignee
WUXI YAZUO ONLINE TECHNOLOGY DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUXI YAZUO ONLINE TECHNOLOGY DEVELOPMENT Co Ltd filed Critical WUXI YAZUO ONLINE TECHNOLOGY DEVELOPMENT Co Ltd
Priority to CN201610298394.2A priority Critical patent/CN105975590A/zh
Publication of CN105975590A publication Critical patent/CN105975590A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种对象类型的确定方法和装置。其中,该方法包括:获取对象集合中每个对象在多个特征维度上的特征数据,在对象集合中的对象执行资源操作时,对象的虚拟资源被消耗;基于特征维度上的特征数据确定对应于特征维度的极值数据;基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据;按照类别属性数据所属的数据区间确定每个对象的对象类型。本发明解决了相关技术中确定对象的类型时效率较低的技术问题。

Description

对象类型的确定方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种对象类型的确定方法和装置。
背景技术
随着互联网技术的快速发展,大数据挖掘被广泛地应用于各个领域,通过对大量数据的处理可以得到大量的有价值的信息,或者对领域内的发展趋势进行估计。如在银行领域,对于存款次数多、存款数额大的对象,需要进行重点维护,但是毕竟这类对象为少部分,为了对对象的存储潜力进行挖掘,需要根据对象的各类信息进行数据处理和挖掘,以根据对象的存储潜力进行分类,并重点维护其中存储潜力较大的对象群;再如,在餐饮领域,消费次数多、消费金额较大的对象为优质对象,但是这类对象均是由普通对象转化而来的,因此,也可以对对象的各类信息进行处理和挖掘,以根据对象的消费潜力进行分类,并重点维护其中消费潜力较大的对象群。
目前,在对对象的各类信息进行处理时,需要使用数据挖掘模型(如回归分析模型、决策树模型、贝叶斯分类模型、粗糙集模型、支持向量机模型等),但是,使用这类数据挖掘模型对目标对象的相关属性信息(如对象的类型)进行预测时,需要对模型进行大量训练才能使用,即需要耗费较长的训练时间,且数据挖掘模型的使用较复杂(如流程较多、流程之间的关联性强),从而进一步加长进行对象类型区分的时间,从而影响了整个事件的效率。
针对相关技术中确定对象的类型时效率较低的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种对象类型的确定方法和装置,以至少解决相关技术中确定对象的类型时效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种对象类型的确定方法,该方法包括:获取对象集合中每个对象在多个特征维度上的特征数据,其中,在对象集合中的对象执行资源操作时,对象的虚拟资源被消耗;基于特征维度上的特征数据确定对应于特征维度的极值数据;基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据;按照类别属性数据所属的数据区间确定每个对象的对象类型。
进一步地,基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据包括:基于预设标准化模型对每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据进行标准化处理,得到每个对象在各个特征维度上的标准化数据;从预设数据库中读取每个对象在各个特征维度上的标准化数据对应的权重;基于每个对象在各个特征维度上的标准化数据和对应的权重确定每个对象的类别属性数据。
进一步地,极值数据包括极小值数据和极大值数据,预设标准化模型包括计算标准化数据Bi的标准化计算公式Bi=(D-MIN)/(MAX-MIN),其中,Bi为每个对象在多个特征维度中的第i特征维度上的标准化数据,MIN为第i特征维度上的极小值数据,MAX为第i特征维度上的极大值数据。
进一步地,基于每个对象在各个特征维度上的标准化数据和对应的权重确定每个对象的类别属性数据包括:基于每个对象在各个特征维度上的标准化数据和对应的权重计算每个对象的类别属性数据T,其中,Ki为第i特征维度上的标准化数据Bi对应的权重,N为多个特征维度的维数,i为不大于N的正整数。
进一步地,对象集合的类型包括第一类型、第二类型以及第三类型,为第一类型的对象集合中的对象的资源操作次数不低于第一预设值且资源消耗量不低于第二预设值,为第二类型的对象集合中的对象的资源操作次数低于第一预设值,为第三类型的对象集合中的对象的资源消耗量低于第二预设值,其中,若对象集合的类型为第一类型,则多个特征维度包括多个时间段中各个时间段内的资源操作次数、各个时间段内的资源消耗量、累计资源操作次数以及累计资源消耗量;若对象集合的类型为第二类型,则多个特征维度包括各个时间段内的资源操作次数和累计资源操作次数;若对象集合的类型为第三类型,则多个特征维度包括各个时间段内的资源消耗量和累计资源消耗量。
进一步地,多个时间段包括第一时间段、第二时间段以及第三时间段,第二时间段的长度长于第一时间段且短于第三时间段。
进一步地,按照类别属性数据所属的数据区间确定每个对象的对象类型包括:获取对象集合所属的对象集合类型对应的区间划分数据;按照区间划分数据对对象集合的类别属性数据所在的区间进行划分,得到多个数据区间;将每个对象的类别属性数据所在的数据区间对应的对象类型作为每个对象的对象类型。
根据本发明实施例的另一个方面,提供了一种对象类型的确定装置,该装置包括:获取单元,用于获取对象集合中每个对象在多个特征维度上的特征数据,其中,在对象集合中的对象执行资源操作时,对象的虚拟资源被消耗;第一确定单元,用于基于特征维度上的特征数据确定对应于特征维度的极值数据;第二确定单元,用于基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据;第三确定单元,按照类别属性数据所属的数据区间确定每个对象的对象类型。
进一步地,第二确定单元包括:处理模块,用于基于预设标准化模型对每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据进行标准化处理,得到每个对象在各个特征维度上的标准化数据;读取模块,用于从预设数据库中读取每个对象在各个特征维度上的标准化数据对应的权重;确定模块,用于基于每个对象在各个特征维度上的标准化数据和对应的权重确定每个对象的类别属性数据。
进一步地,极值数据包括极小值数据和极大值数据,预设标准化模型包括计算标准化数据Bi的标准化计算公式Bi=(D-MIN)/(MAX-MIN),其中,Bi为每个对象在多个特征维度中的第i特征维度上的标准化数据,MIN为第i特征维度上的极小值数据,MAX为第i特征维度上的极大值数据。
在本发明实施例中,通过获取对象集合中每个对象在多个特征维度上的特征数据,在对象集合中的对象执行资源操作时,对象的虚拟资源被消耗;基于特征维度上的特征数据确定对应于特征维度的极值数据;基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据;按照类别属性数据所属的数据区间确定每个对象的对象类型,从而解决了相关技术中确定对象的类型时效率较低的技术问题,通过对对象在多个特征维度上的特征数据进行处理,从而可以根据处理得到的类别属性数据快速确定对象类型,而不用进行相关操作(如训练数据挖掘模型),从而节约了处理时间,提升了确定对象的类型的效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的对象类型的确定方法的流程图;以及
图2是根据本发明实施例的对象类型的确定装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种对象类型的确定方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的对象类型的确定方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,获取对象集合中每个对象在多个特征维度上的特征数据,其中,在对象集合中的对象执行资源操作时,对象的虚拟资源被消耗。
步骤S102,基于特征维度上的特征数据确定对应于特征维度的极值数据。
步骤S103,基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据。
步骤S104,按照类别属性数据所属的数据区间确定每个对象的对象类型。
通过上述实施例,获取对象集合中每个对象在多个特征维度上的特征数据,在对象集合中的对象执行资源操作时,对象的虚拟资源被消耗;基于特征维度上的特征数据确定对应于特征维度的极值数据;基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据;按照类别属性数据所属的数据区间确定每个对象的对象类型,从而解决了相关技术中确定对象的类型时效率较低的技术问题,通过对对象在多个特征维度上的特征数据进行处理,从而可以根据处理得到的类别属性数据快速确定类型,而不用进行相关操作(如训练数据挖掘模型),从而节约了处理时间,提升了确定对象的类型的效率。
本申请的上述方法可以应用于银行、餐饮、零售等领域。如,在银行领域,对象集合中的对象可以为存款人,虚拟资源即存款人的财产,资源操作即存款人对财产执行的存款操作,多个特征维度上的特征数据即与存款相关联的多个维度上的数据;再如,在餐饮领域,对象集合中的对象即消费客户、虚拟资源即客户的现金、储值卡、会员卡等资源,资源操作即消费客户使用现金、储值卡、会员卡等进行消费的行为,多个特征维度上的特征数据即与客户消费相关联的多个维度上的数据。
需要说明的是,为了有针对性地对不同类型的客户进行分析,可以先对用户群进行分类,如分为三类(即第一类型、第二类型以及第三类型),分类标准主要根据每个用户(即对象)在一段时间内的资源操作次数(如消费次数或者存款次数等)和资源消耗量(如消费金额或者存款金额等),将资源操作次数(如消费次数)不低于第一预设值(如5次)且资源消耗量(如消费金额)不低于第二预设值(如2000元)的对象放入为第一类型的对象集合中,这一类对象的操作次数和资源消耗量均较高,对行业的贡献率较高,属于价值较高的对象,将资源操作次数低于第一预设值的对象放入为第二类型的对象集合中,将资源消耗量低于第二预设值的对象放入第三类型的对象集合中,第二类和第三类对象属于有潜力成为价值较高的对象,可以通过数据分析寻找出其中概率较高的用户,从而加以引导,以使其成为优质对象。
在步骤S101的技术方案中,可以根据对象集合的类型,获取不同类型的数据,具体如下:若对象集合的类型为第一类型,则多个特征维度包括多个时间段中各个时间段内的资源操作次数、各个时间段内的资源消耗量、累计资源操作次数以及累计资源消耗量;若对象集合的类型为第二类型,则多个特征维度包括各个时间段内的资源操作次数和累计资源操作次数;若对象集合的类型为第三类型,则多个特征维度包括各个时间段内的资源消耗量和累计资源消耗量。
上述的多个时间段包括第一时间段、第二时间段以及第三时间段,第二时间段的长度长于第一时间段且短于第三时间段。
例如,对于餐饮领域,第一时间段可以为30天,第二时间段可以为60天,第三时间段可以为90天,若对象集合的类型为第一类型,则多个特征维度包括30天资源操作次数、30天资源消耗量、90天资源操作次数、90天资源消耗量、180天资源操作次数、180天资源消耗量、累计资源操作次数以及累计资源消耗量;若对象集合的类型为第二类型,多个特征维度包括30天资源操作次数、90天资源操作次数、180天资源操作次数以及累计资源操作次数;若对象集合的类型为第三类型,多个特征维度包括30天资源消耗量、90天资源消耗量、180天资源消耗量以及累计资源消耗量。
在步骤S102的方案中,可以通过冒泡法、排序法等方法确定每个特征维度上的特征数据中的极值数据,极值数据包括极小值数据和极大值数据。
在步骤S103的方案中,基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据可以通过如下方式实现:基于预设标准化模型对每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据进行标准化处理,得到每个对象在各个特征维度上的标准化数据;从预设数据库中读取每个对象在各个特征维度上的标准化数据对应的权重;基于每个对象在各个特征维度上的标准化数据和对应的权重确定每个对象的类别属性数据。
需要说明的是,上述的预设标准化模型包括计算标准化数据Bi的标准化计算公式Bi=(D-MIN)/(MAX-MIN),其中,Bi为每个对象在多个特征维度中的第i特征维度上的标准化数据,MIN为第i特征维度上的极小值数据,MAX为第i特征维度上的极大值数据。
通过对每个维度上的特征数据进行标准化,可以将不同范围的值放大到同一范围以利于计算,如计算客户贡献度(贡献度包括消费金额和消费次的贡献力度),由于消费金额的数值明显大于消费次数,通过对其进行标准化处理,可以将金额和次数均映射到0到1的区间内,从而便于进行计算。
对于餐饮业等领域而言,消费金额越高的客户越有价值,消费次数越高的忠诚度越高,那么一个优质客户应该两者都高,如果在客户只有一个属性高,另一个属性不高时,则难以进行属性界定,即需要超过一个以上的属性作为参考条件时,无法直观的对客户进行排序,为了用一个统一的指标(即类别属性数据)来表示对象的特定属性,基于每个对象在各个特征维度上的标准化数据和对应的权重确定每个对象的类别属性数据可以通过如下方式实现:基于每个对象在各个特征维度上的标准化数据和对应的权重计算每个对象的类别属性数据T,其中,Ki为第i特征维度上的标准化数据Bi对应的权重,N为多个特征维度的维数,i为不大于N的正整数。如对于。通过计算每个对象的类别属性数据,从而可以根据其具体值确定其所属的类型。
需要说明的是,上述的权重可以为固定值,也可以根据每个特征维度的重要性进行确定,还可以根据相关领域从业人员的经验选取适当的经验值。
通过上述实施例,对用户每个维度上的数据进行标准化处理,并根据每个维度的重要性计算出类别属性数据,从而可以根据类别属性数据确定用户的类型,以便于银行或者餐饮企业根据这些数据进行有针对性的改进。
可选地,在步骤S104的技术方案中,按照类别属性数据所属的数据区间确定每个对象的对象类型包括:获取对象集合所属的对象集合类型对应的区间划分数据;按照区间划分数据对对象集合的类别属性数据所在的区间进行划分,得到多个数据区间;将每个对象的类别属性数据所在的数据区间对应的对象类型作为每个对象的对象类型。
对于第一类的用户集合,区间划分数据可以为20%,可以将靠近区间极大值的20%定义为优质客户群,如对于餐饮业,这类客户是企业的主要贡献者,餐饮企业可以针对此类客群,定期主动发起活动,保持客户的忠诚度和消费习惯,再如,对于银行而言,这类客户所占的存款占整个存款的大部分,银行也需要定期对该类客户进行维护。
对于第二类的用户集合,属于低频次客群,可以不考虑消费金额,选取的属性为:30天消费次数、90天消费次数、180天消费次数、累计消费次数,类别属性数据=消费次数的标准值*消费次数的权重+其他关键指标,将类别属性数据从小到大排序,区间划分数据可以为20%至30%,选取数据较小的指定比例(即上述的区间划分数据20%至30%)为低频次客群,该类型的客户通常是指来过一两次的客户,流动性较大,人数占比较多,对企业利润的贡献在50%左右,选取该类型的客户的可以针对性的提高消费次数,变为忠诚客户。其他关键指标的是自定义的指标,在此类客群选取时选择能代表消费次数的数据即可(如两次消费间隔)。
对于第三类的用户集合,属于低额度客群,可以不考虑消费次数,选取的属性为:30天消费总额、90天消费总额、180天消费总额、累计消费总额,类别属性数据=标消费金额的准值*消费金额的权重+其他关键指标,将类别属性数据小到大排序,区间划分数据可以为20%至30%,选取较小的指定比例(即上述的区间划分数据20%至30%)为低金额客群,该类型的客户通常是指来过一两次的客户,流动性较大,占比较多,对企业利润的贡献在50%左右,一个客户可以同时属于低频次且低额度的客群,此时应优先提升消费次数。其他关键指标的意思是自定义的指标,在此类客群选取时选择能代表消费额度的数据即可(如积分消费额,代金券消费额)。
通过上述实施例,对客群进行更多的细分或聚类,将客户指标量化,便于定位核心会员客群,方便营业者理解自身经营状况并找到可提高的增长点。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
本发明实施例还提供了一种对象类型的确定装置。需要说明的是,本发明实施例的对象类型的确定装置可以用于执行本发明实施例所提供的对象类型的确定方法。
图2是根据本发明实施例的对象类型的确定装置的示意图。如图2所示,该装置可以包括:获取单元10、第一确定单元20、第二确定单元30以及第三确定单元40。
获取单元10用于获取对象集合中每个对象在多个特征维度上的特征数据,其中,在对象集合中的对象执行资源操作时,对象的虚拟资源被消耗。
第一确定单元20用于基于特征维度上的特征数据确定对应于特征维度的极值数据。
第二确定单元30用于基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据。
第三确定单元40按照类别属性数据所属的数据区间确定每个对象的对象类型。
通过上述实施例,通过获取单元获取对象集合中每个对象在多个特征维度上的特征数据,在对象集合中的对象执行资源操作时,对象的虚拟资源被消耗;第一确定单元基于特征维度上的特征数据确定对应于特征维度的极值数据;第二确定单元基于每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据确定每个对象的类别属性数据;第三确定单元按照类别属性数据所属的数据区间确定每个对象的对象类型,从而解决了相关技术中确定对象的类型时效率较低的技术问题,通过对对象在多个特征维度上的特征数据进行处理,从而可以根据处理得到的类别属性数据快速确定类型,而不用进行相关操作(如训练数据挖掘模型),从而节约了处理时间,提升了确定对象的类型的效率。
本申请的上述方法可以应用于银行、餐饮、零售等领域。如,在银行领域,对象集合中的对象可以为存款人,虚拟资源即存款人的财产,资源操作即存款人对财产执行的存款操作,多个特征维度上的特征数据即与存款相关联的多个维度上的数据;再如,在餐饮领域,对象集合中的对象即消费客户、虚拟资源即客户的现金、储值卡、会员卡等资源,资源操作即消费客户使用现金、储值卡、会员卡等进行消费的行为,多个特征维度上的特征数据即与客户消费相关联的多个维度上的数据。
可选地,第二确定单元包括:处理模块,用于基于预设标准化模型对每个对象在各个特征维度上的特征数据和对应的特征维度上的极值数据进行标准化处理,得到每个对象在各个特征维度上的标准化数据;读取模块,用于从预设数据库中读取每个对象在各个特征维度上的标准化数据对应的权重;确定模块,用于基于每个对象在各个特征维度上的标准化数据和对应的权重确定每个对象的类别属性数据。
需要说明的是,极值数据包括极小值数据和极大值数据,预设标准化模型包括计算标准化数据Bi的标准化计算公式Bi=(D-MIN)/(MAX-MIN),其中,Bi为每个对象在多个特征维度中的第i特征维度上的标准化数据,MIN为第i特征维度上的极小值数据,MAX为第i特征维度上的极大值数据。
通过对每个维度上的特征数据进行标准化,可以将不同范围的值放大到同一范围以利于计算,如计算客户贡献度(贡献度包括消费金额和消费次的贡献力度),由于消费金额的数值明显大于消费次数,通过对其进行标准化处理,可以将金额和次数均映射到0到1的区间内,从而便于进行计算。
对于餐饮业等领域而言,消费金额越高的客户越有价值,消费次数越高的忠诚度越高,那么一个优质客户应该两者都高,如果在客户只有一个属性高,另一个属性不高时,则难以进行属性界定,即需要超过一个以上的属性作为参考条件时,无法直观的对客户进行排序,为了用一个统一的指标(即类别属性数据)来表示对象的特定属性,基于每个对象在各个特征维度上的标准化数据和对应的权重确定每个对象的类别属性数据可以通过如下方式实现:基于每个对象在各个特征维度上的标准化数据和对应的权重计算每个对象的类别属性数据T,其中,Ki为第i特征维度上的标准化数据Bi对应的权重,N为多个特征维度的维数,i为不大于N的正整数。如对于。通过计算每个对象的类别属性数据,从而可以根据其具体值确定其所属的类型。
需要说明的是,上述的权重可以为固定值,也可以根据每个特征维度的重要性进行确定,还可以根据相关领域从业人员的经验选取适当的经验值。
通过上述实施例,对用户每个维度上的数据进行标准化处理,并根据每个维度的重要性计算出类别属性数据,从而可以根据类别属性数据确定用户的类型,以便于银行或者餐饮企业根据这些数据进行有针对性的改进。
可选地,第三确定单元还用于获取对象集合所属的对象集合类型对应的区间划分数据;按照区间划分数据对对象集合的类别属性数据所在的区间进行划分,得到多个数据区间;将每个对象的类别属性数据所在的数据区间对应的对象类型作为每个对象的对象类型。
通过上述实施例,对客群进行更多的细分或聚类,将客户指标量化,便于定位核心会员客群,方便营业者理解自身经营状况并找到可提高的增长点。
本实施例中所提供的各个模块与方法实施例对应步骤所提供的使用方法相同、应用场景也可以相同。当然,需要注意的是,上述模块涉及的方案可以不限于上述实施例中的内容和场景,且上述模块可以运行在计算机终端或移动终端,可以通过软件或硬件实现。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种对象类型的确定方法,其特征在于,包括:
获取对象集合中每个对象在多个特征维度上的特征数据,其中,在所述对象集合中的对象执行资源操作时,所述对象的虚拟资源被消耗;
基于所述特征维度上的特征数据确定对应于所述特征维度的极值数据;
基于所述每个对象在各个所述特征维度上的特征数据和对应的所述特征维度上的极值数据确定所述每个对象的类别属性数据;
按照所述类别属性数据所属的数据区间确定所述每个对象的对象类型。
2.根据权利要求1所述的方法,其特征在于,基于所述每个对象在各个所述特征维度上的特征数据和对应的所述特征维度上的极值数据确定所述每个对象的类别属性数据包括:
基于预设标准化模型对所述每个对象在各个所述特征维度上的特征数据和对应的所述特征维度上的极值数据进行标准化处理,得到所述每个对象在各个所述特征维度上的标准化数据;
从预设数据库中读取所述每个对象在各个所述特征维度上的标准化数据对应的权重;
基于所述每个对象在各个所述特征维度上的标准化数据和对应的权重确定所述每个对象的类别属性数据。
3.根据权利要求2所述的方法,其特征在于,所述极值数据包括极小值数据和极大值数据,所述预设标准化模型包括计算所述标准化数据Bi的标准化计算公式Bi=(D-MIN)/(MAX-MIN),其中,Bi为所述每个对象在多个所述特征维度中的第i特征维度上的标准化数据,MIN为所述第i特征维度上的极小值数据,MAX为所述第i特征维度上的极大值数据。
4.根据权利要求3所述的方法,其特征在于,基于所述每个对象在各个所述特征维度上的标准化数据和对应的权重确定所述每个对象的类别属性数据包括:
基于所述每个对象在各个所述特征维度上的标准化数据和对应的权重计算所述每个对象的类别属性数据T,其中,Ki为所述第i特征维度上的标准化数据Bi对应的权重,N为多个所述特征维度的维数,i为不大于N的正整数。
5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述对象集合的类型包括第一类型、第二类型以及第三类型,为所述第一类型的所述对象集合中的对象的资源操作次数不低于第一预设值且资源消耗量不低于第二预设值,为所述第二类型的所述对象集合中的对象的资源操作次数低于所述第一预设值,为所述第三类型的所述对象集合中的对象的资源消耗量低于所述第二预设值,其中,
若所述对象集合的类型为所述第一类型,则多个所述特征维度包括多个时间段中各个时间段内的资源操作次数、所述各个时间段内的资源消耗量、累计资源操作次数以及累计资源消耗量;
若所述对象集合的类型为所述第二类型,则多个所述特征维度包括所述各个时间段内的资源操作次数和累计资源操作次数;
若所述对象集合的类型为所述第三类型,则多个所述特征维度包括所述各个时间段内的资源消耗量和累计资源消耗量。
6.根据权利要求5所述的方法,其特征在于,所述多个时间段包括第一时间段、第二时间段以及第三时间段,所述第二时间段的长度长于所述第一时间段且短于所述第三时间段。
7.根据权利要求5所述的方法,其特征在于,按照所述类别属性数据所属的数据区间确定所述每个对象的对象类型包括:
获取所述对象集合所属的对象集合类型对应的区间划分数据;
按照所述区间划分数据对所述对象集合的类别属性数据所在的区间进行划分,得到多个所述数据区间;
将所述每个对象的类别属性数据所在的所述数据区间对应的对象类型作为所述每个对象的对象类型。
8.一种对象类型的确定装置,其特征在于,包括:
获取单元,用于获取对象集合中每个对象在多个特征维度上的特征数据,其中,在所述对象集合中的对象执行资源操作时,所述对象的虚拟资源被消耗;
第一确定单元,用于基于所述特征维度上的特征数据确定对应于所述特征维度的极值数据;
第二确定单元,用于基于所述每个对象在各个所述特征维度上的特征数据和对应的所述特征维度上的极值数据确定所述每个对象的类别属性数据;
第三确定单元,按照所述类别属性数据所属的数据区间确定所述每个对象的对象类型。
9.根据权利要求8所述的装置,其特征在于,所述第二确定单元包括:
处理模块,用于基于预设标准化模型对所述每个对象在各个所述特征维度上的特征数据和对应的所述特征维度上的极值数据进行标准化处理,得到所述每个对象在各个所述特征维度上的标准化数据;
读取模块,用于从预设数据库中读取所述每个对象在各个所述特征维度上的标准化数据对应的权重;
确定模块,用于基于所述每个对象在各个所述特征维度上的标准化数据和对应的权重确定所述每个对象的类别属性数据。
10.根据权利要求9所述的装置,其特征在于,所述极值数据包括极小值数据和极大值数据,所述预设标准化模型包括计算所述标准化数据Bi的标准化计算公式Bi=(D-MIN)/(MAX-MIN),其中,Bi为所述每个对象在多个所述特征维度中的第i特征维度上的标准化数据,MIN为所述第i特征维度上的极小值数据,MAX为所述第i特征维度上的极大值数据。
CN201610298394.2A 2016-05-03 2016-05-03 对象类型的确定方法和装置 Pending CN105975590A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610298394.2A CN105975590A (zh) 2016-05-03 2016-05-03 对象类型的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610298394.2A CN105975590A (zh) 2016-05-03 2016-05-03 对象类型的确定方法和装置

Publications (1)

Publication Number Publication Date
CN105975590A true CN105975590A (zh) 2016-09-28

Family

ID=56991374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610298394.2A Pending CN105975590A (zh) 2016-05-03 2016-05-03 对象类型的确定方法和装置

Country Status (1)

Country Link
CN (1) CN105975590A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110363897A (zh) * 2019-07-25 2019-10-22 新奥(中国)燃气投资有限公司 一种客户热度图生成方法及装置
CN111709296A (zh) * 2020-05-18 2020-09-25 北京奇艺世纪科技有限公司 一种景别识别方法、装置、电子设备及可读存储介质
CN113077292A (zh) * 2021-04-20 2021-07-06 北京沃东天骏信息技术有限公司 一种用户分类方法、装置、存储介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101340463A (zh) * 2008-08-22 2009-01-07 深圳市迅雷网络技术有限公司 一种确定网络资源类型的方法和装置
CN104239324A (zh) * 2013-06-17 2014-12-24 阿里巴巴集团控股有限公司 一种基于用户行为的特征提取、个性化推荐的方法和***
CN104699717A (zh) * 2013-12-10 2015-06-10 ***股份有限公司 数据挖掘方法
CN104699702A (zh) * 2013-12-09 2015-06-10 ***股份有限公司 数据挖掘及分类方法
CN104778173A (zh) * 2014-01-10 2015-07-15 腾讯科技(深圳)有限公司 目标用户确定方法、装置及设备
CN105225135A (zh) * 2015-10-31 2016-01-06 广州华多网络科技有限公司 潜力客户识别方法以及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101340463A (zh) * 2008-08-22 2009-01-07 深圳市迅雷网络技术有限公司 一种确定网络资源类型的方法和装置
CN104239324A (zh) * 2013-06-17 2014-12-24 阿里巴巴集团控股有限公司 一种基于用户行为的特征提取、个性化推荐的方法和***
CN104699702A (zh) * 2013-12-09 2015-06-10 ***股份有限公司 数据挖掘及分类方法
CN104699717A (zh) * 2013-12-10 2015-06-10 ***股份有限公司 数据挖掘方法
CN104778173A (zh) * 2014-01-10 2015-07-15 腾讯科技(深圳)有限公司 目标用户确定方法、装置及设备
CN105225135A (zh) * 2015-10-31 2016-01-06 广州华多网络科技有限公司 潜力客户识别方法以及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110363897A (zh) * 2019-07-25 2019-10-22 新奥(中国)燃气投资有限公司 一种客户热度图生成方法及装置
CN110363897B (zh) * 2019-07-25 2021-04-27 新奥(中国)燃气投资有限公司 一种客户热度图生成方法及装置
CN111709296A (zh) * 2020-05-18 2020-09-25 北京奇艺世纪科技有限公司 一种景别识别方法、装置、电子设备及可读存储介质
CN113077292A (zh) * 2021-04-20 2021-07-06 北京沃东天骏信息技术有限公司 一种用户分类方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
Bijak et al. Does segmentation always improve model performance in credit scoring?
CN110490729B (zh) 一种基于用户画像模型的金融用户分类方法
CN107133865B (zh) 一种信用分的获取、特征向量值的输出方法及其装置
Kao et al. A Bayesian latent variable model with classification and regression tree approach for behavior and credit scoring
Zhang et al. The Bayesian additive classification tree applied to credit risk modelling
Pavlidis et al. Adaptive consumer credit classification
US20080215470A1 (en) Methods and apparatus for use in association with payment card accounts
CN105956122A (zh) 对象属性的确定方法和装置
EP2545479A2 (en) Methods, computer-accessible medium and systems for construction of and inference with networked data, for example, in a financial setting
CN111626766A (zh) 一种融合多个机器学习模型的手机银行营销客户筛选方法
CN106874355A (zh) 同时融入社交关系和用户相似度的协同过滤方法
CN101719147A (zh) 一种基于罗切斯特模型-朴素贝叶斯模型的数据分类***
Djurisic et al. Bank CRM optimization using predictive classification based on the support vector machine method
CN111325248A (zh) 降低贷前业务风险的方法及***
CN105975590A (zh) 对象类型的确定方法和装置
Stewart A profit-based scoring system in consumer credit: making acquisition decisions for credit cards
CN113781139A (zh) 物品推荐方法、物品推荐装置、设备和介质
Hand et al. Selection bias in credit scorecard evaluation
CN106204267A (zh) 一种基于改进k‑means和神经网络聚类的客户细分***
Tsai et al. Two-stage replenishment policies for deteriorating items at Taiwanese convenience stores
Lu et al. A Hybrid Sales Forecasting Scheme by Combining Independent Component Analysis with K‐Means Clustering and Support Vector Regression
Moslehi et al. Analyzing and investigating the use of electronic payment tools in Iran using data mining techniques
Hallam et al. Semiparametric density forecasts of daily financial returns from intraday data
Finlay Towards profitability: A utility approach to the credit scoring problem
Ullah et al. Predicting Default Payment of Credit Card Users: Applying Data Mining Techniques

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Wuxi District of Jiangsu city in Wuxi Province, Zhenze Road No. 18, Wuxi (National) Software Park Dolphin C seat 2, 3 floor

Applicant after: Wuxi private online Polytron Technologies Inc

Address before: Wuxi District of Jiangsu city in Wuxi Province, Zhenze Road No. 18, Wuxi (National) Software Park Dolphin C seat 2, 3 floor

Applicant before: Wuxi Yazuo Online Technology Development Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160928