CN116127363A - 客户分类方法、装置、设备、介质和程序产品 - Google Patents

客户分类方法、装置、设备、介质和程序产品 Download PDF

Info

Publication number
CN116127363A
CN116127363A CN202310150469.2A CN202310150469A CN116127363A CN 116127363 A CN116127363 A CN 116127363A CN 202310150469 A CN202310150469 A CN 202310150469A CN 116127363 A CN116127363 A CN 116127363A
Authority
CN
China
Prior art keywords
index
evaluation
variable
library
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310150469.2A
Other languages
English (en)
Inventor
唐杨
李雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310150469.2A priority Critical patent/CN116127363A/zh
Publication of CN116127363A publication Critical patent/CN116127363A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种客户分类方法,可以应用于金融领域以及人工智能、云平台等技术领域。该客户分类方法包括:获取待分类客户的评价指标集,所述待分类客户的评价指标集包括不同指标类别的评价指标;基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,其中,在所述预设的基础指标库中所述指标变量与所述评价指标呈一对多的对应关系;基于所述不同指标类别的指标变量计算中间分类结果;以及在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出。本公开还提供了一种客户分类装置、设备、存储介质和程序产品。

Description

客户分类方法、装置、设备、介质和程序产品
技术领域
本公开涉及金融领域以及人工智能、云平台等技术领域具体地涉及一种客户分类方法、装置、设备、介质和程序产品。
背景技术
在金融领域中,客户进行业务办理时,后台根据客户相关的有效数据,对该客户进行分类,通过在不同业务场景下对不同的指标类别对应的不同客户采用相应措施,以加强客户管理。
客户相关的有效数据众多,分别存储于不同的***中,且这些数据量过大,如果采用传统的遍历跟踪以搜寻有效数据的方法的话,会导致对***资源消耗过大,并且,会导致分类的及时性不足,对客户识别发生于事后,在高风险事件发生后,才能进行识别和认定。
发明内容
鉴于上述问题,本公开提供了提高客户分类效率和准确度的客户分类方法、装置、设备、介质和程序产品。
根据本公开的第一个方面,提供了一种客户分类方法,包括:获取待分类客户的评价指标集,所述待分类客户的评价指标集包括不同指标类别的评价指标;基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,其中,在所述预设的基础指标库中所述指标变量与所述评价指标呈一对多的对应关系;基于所述不同指标类别的指标变量计算中间分类结果;以及在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出。
根据本公开的实施例,其中,所述评价指标包括第一评价指标,所述基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,包括:建立与所述待分类客户的指标类别一一对应的计算池,所述计算池包括指标计算池和变量池;将所述待分类客户的评价指标和所述预设的基础指标库对应的指标变量,推送至对应的指标类别的所述指标计算池,其中,所述预设的基础指标库的指标变量是随机推送的;计算所述待分类客户的评价指标和所述预设的基础指标库中的对应的评价指标之间的偏移量;挑选所述偏移量预设偏移量区间的所述评价指标,作为所述第一评价指标;以及基于所述第一评价指标获取所述预设的基础指标库中对应的指标变量,以将所述指标变量存入所述变量池中。
根据本公开的实施例,其中,所述指标计算池包括不同优先级,在所述建立与所述待分类客户的指标类别一一对应的计算池后,还包括:分别基于所述变量池和所述指标计算池匹配容器,所述容器包括多个性能由高到低的容器,其中,所述变量池的匹配方法包括:相较于所述指标计算池,优先基于所述容器,按照性能由高到低的顺序匹配所述变量池,所述指标计算池的匹配方法包括:在所述变量池匹配结束后,基于剩余的容器,匹配所述指标计算池和所述容器,其中,所述指标计算池的优先级与所述容器的性能高低呈正相关。
根据本公开的实施例,其中,不同的变量池对应不同的变量池权重,所述基于所述不同指标类别的指标变量计算中间分类结果,包括:基于所述变量池权重和对应的所述指标变量进行计算,得到中间分类结果。
根据本公开的实施例,其中,所述在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出,包括:在所述待分类客户的评价指标完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,将最终的所述中间分类结果作为所述最终分类结果。
根据本公开的实施例,其中,所述在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出,还包括:在所述待分类客户的评价指标未完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,当出现所述中间分类结果处于预设的阈值时,将所述中间分类结果作为所述最终分类结果。
根据本公开的实施例,其中,所述预设的基础指标库的建立方法包括:获取建库数据,所述建库数据包括多个指标类别的评价指标和指标变量,其中,所述评价指标和所述指标变量是多对一的关系;以及按照所述指标类别对评价指标和指标变量进行存储,并建立所述评价指标和所述指标变量的映射关系。
根据本公开的实施例,其中,所述按照所述指标类别对评价指标和指标变量进行存储,并建立所述评价指标和所述指标变量的映射关系,包括:将所述评价指标转化为哈希值,并建立所述哈希值和所述指标变量的映射关系。
根据本公开的实施例,其中,所述计算所述待分类客户的评价指标和所述预设的基础指标库中的对应的评价指标之间的偏移量,包括:计算所述待分类客户的评价指标的哈希值;以及基于所述待分类客户的评价指标的哈希值和所述预设的基础指标库的评价指标的哈希值计算所述偏移量。
根据本公开的实施例,其中,所述基于所述第一评价指标获取所述预设的基础指标库中对应的指标变量,包括:基于所述第一评价指标的哈希值和所述映射关系,获取对应的指标变量。
根据本公开的实施例,其中,所述指标类别至少包括客户信息类别和客户生物特征类别,所述客户生物特征类别至少包括面部特征类别,所述预设的基础指标库至少包括客户信息类别库和客户生物特征库,所述获取建库数据,包括:对于所述面部特征类别,获取面部影像;基于所述面部影像提取面部影像特征;基于所述面部影像特征,通过预设的机器学习模型,输出所述面部影像特征对应的面部影像变量,其中,所述面部影像变量是所述面部特征类别下的所述指标变量。
根据本公开的实施例,其中,所述客户生物特征库是基于云存储数据库建立的。
本公开的第二个方面,提供了一种客户分类装置,包括:指标获取模块,用于获取待分类客户的评价指标集,所述待分类客户的评价指标集包括不同指标类别的评价指标;指标匹配模块,用于基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,其中,在所述预设的基础指标库中所述指标变量与所述评价指标呈一对多的对应关系;中间分类结果计算模块,用于基于所述不同指标类别的指标变量计算中间分类结果;以及最终结果输出模块,用于在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出。
根据本公开的实施例,其中,所述评价指标包括第一评价指标,所述指标匹配模块,用于建立与所述待分类客户的指标类别一一对应的计算池,所述计算池包括指标计算池和变量池;将所述待分类客户的评价指标和所述预设的基础指标库对应的指标变量,推送至对应的指标类别的所述指标计算池,其中,所述预设的基础指标库的指标变量是随机推送的;计算所述待分类客户的评价指标和所述预设的基础指标库中的对应的评价指标之间的偏移量;挑选所述偏移量预设偏移量区间的所述评价指标,作为所述第一评价指标;以及基于所述第一评价指标获取所述预设的基础指标库中对应的指标变量,以将所述指标变量存入所述变量池中。
根据本公开的实施例,其中,所述指标计算池包括不同优先级,所述指标匹配模块,用于分别基于所述变量池和所述指标计算池匹配容器,所述容器包括多个性能由高到低的容器,其中,所述变量池的匹配方法包括:相较于所述指标计算池,优先基于所述容器,按照性能由高到低的顺序匹配所述变量池,所述指标计算池的匹配方法包括:在所述变量池匹配结束后,基于剩余的容器,匹配所述指标计算池和所述容器,其中,所述指标计算池的优先级与所述容器的性能高低呈正相关。
根据本公开的实施例,其中,不同的变量池对应不同的变量池权重,所述中间分类结果计算模块,用于基于所述变量池权重和对应的所述指标变量进行计算,得到中间分类结果。
根据本公开的实施例,其中,所述最终结果输出模块,用于在所述待分类客户的评价指标完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,将最终的所述中间分类结果作为所述最终分类结果。
根据本公开的实施例,其中,所述最终结果输出模块,用于在所述待分类客户的评价指标未完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,当出现所述中间分类结果处于预设的阈值时,将所述中间分类结果作为所述最终分类结果。
根据本公开的实施例,其中,所述装置还包括建库模块,用于获取建库数据,所述建库数据包括多个指标类别的评价指标和指标变量,其中,所述评价指标和所述指标变量是多对一的关系;以及按照所述指标类别对评价指标和指标变量进行存储,并建立所述评价指标和所述指标变量的映射关系。
根据本公开的实施例,其中,所述建库模块,用于将所述评价指标转化为哈希值,并建立所述哈希值和所述指标变量的映射关系。
根据本公开的实施例,其中,所述指标匹配模块,用于计算所述待分类客户的评价指标的哈希值;以及基于所述待分类客户的评价指标的哈希值和所述预设的基础指标库的评价指标的哈希值计算所述偏移量。
根据本公开的实施例,其中,所述指标匹配模块,用于基于所述第一评价指标的哈希值和所述映射关系,获取对应的指标变量。
根据本公开的实施例,其中,所述指标类别至少包括客户信息类别和客户生物特征类别,所述客户生物特征类别至少包括面部特征类别,所述建库模块,用于对于所述面部特征类别,获取面部影像;基于所述面部影像提取面部影像特征;基于所述面部影像特征,通过预设的机器学习模型,输出所述面部影像特征对应的面部影像变量,其中,所述面部影像变量是所述面部特征类别下的所述指标变量。
根据本公开的实施例,其中,所述客户生物特征库是基于云存储数据库建立的。
本公开的第三个方面,提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述客户分类方法。
本公开的第四个方面,还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述客户分类方法。
本公开的第五个方面,还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述客户分类方法。
在本公开的实施例中,通过对获取待分类客户在不同类别下的评价指标后匹配评价指标,无需遍历所有的数据,保证较少的***处理开销,可以加快客户的分类效率,特别在大量客户同时需要进行分类的场景中,能够保证***的稳定性。并且,对各个指标类别下的完成指标的完成匹配,综合各个指标类别下的评价指标,并不需要全量的待分类客户的相关信息,仅部分的待分类客户的相关数据即可实现客户分类,在待分类客户的数据缺失的场景下,仍然可以完成分类,增强了该客户分类方法的适应场景,提高兼容性。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的客户分类的应用场景图;
图2示意性示出了根据本公开实施例的客户分类方法的流程图;
图3示意性示出了根据本公开实施例的指标变量匹配方法的流程图;
图4示意性示出了根据本公开实施例的另一种指标变量匹配方法的流程图;
图5示意性示出了根据本公开实施例的中间分类结果计算方法;
图6示意性示出了根据本公开实施例的预设的基础指标库的建立方法;
图7示意性示出了根据本公开实施例的偏移量计算方法的流程图;
图8示意性示出了根据本公开实施例的指标变量获取方法的流程图;
图9示意性示出了根据本公开实施例的另一种预设的基础指标库的建立方法的流程图;
图10示意性示出了根据本公开实施例的客户分类方法的全架构图;
图11示意性示出了根据本公开实施例的客户分类装置的结构框图;以及
图12示意性示出了根据本公开实施例的适于实现客户分类方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
在对本公开进行详细揭示之前,对本公开中将要用到的关键技术术语进行一一说明,如下所示:
容器:一种服务程序。
哈希分布:哈希分布是基于哈希函数的一种数据分布方法。
并行处理:并行处理集群中,每个节点都有独立的存储***和内存***,数据被划分到各个节点上,每个节点通过网络相互连接,协同计算,作为整体提供数据库服务。MPP的核心优势在于对用户请求的并行执行,将单节点***的所有IO请求和CPU计算等转化为多节点并行执行。
客户相关的有效数据众多,分别存储于不同的***中,且这些数据量过大,如果采用传统的遍历跟踪以搜寻有效数据的方法的话,会导致对***资源消耗过大,并且,会导致分类的及时性不足,对客户识别发生于事后,在高风险事件发生后,才能进行识别和认定。这使得客户的分类成为一件非及时性和充满主动变数(样本量较少时,结果不准确)的事情。
为解决现有技术中存在的技术问题,本公开的实施例提供了一种客户分类方法,该客户分类方法包括:获取待分类客户的评价指标集,所述待分类客户的评价指标集包括不同指标类别的评价指标;基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,其中,在所述预设的基础指标库中所述指标变量与所述评价指标呈一对多的对应关系;基于所述不同指标类别的指标变量计算中间分类结果;以及在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出。
在本公开的实施例中,通过对获取待分类客户在不同类别下的评价指标后匹配评价指标,无需遍历所有的数据,保证较少的***处理开销,可以加快客户的分类效率,特别在大量客户同时需要进行分类的场景中,能够保证***的稳定性。并且,对各个指标类别下的完成指标的完成匹配,综合各个指标类别下的评价指标,并不需要全量的待分类客户的相关信息,仅部分的待分类客户的相关数据即可实现客户分类,在待分类客户的数据缺失的场景下,仍然可以完成分类,增强了该客户分类方法的适应场景,提高兼容性。
图1示意性示出了根据本公开实施例的客户分类的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103、网络104以及服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的客户分类方法一般可以由服务器105执行。相应地,本公开实施例所提供的客户分类装置一般可以设置于服务器105中。本公开实施例所提供的客户分类方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的客户分类装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将基于图1描述的场景,通过图2~图10对公开实施例的客户分类方法进行详细描述。
图2示意性示出了根据本公开实施例的客户分类方法的流程图。
如图2所示,该实施例的客户分类方法包括操作S210~操作S240,该客户分类方法可以由服务器105执行。
在操作S210中,获取待分类客户的评价指标集,所述待分类客户的评价指标集包括不同指标类别的评价指标。
在一个典型的场景中,客户进行业务办理时,后台会对需要办理业务的客户进行分类,进而实现客户管理,辅助业务办理。业务办理的场景各式各样。例如,该业务办理场景可以在线上营销场景下对客户进行画像分类,由此辅助输出营销策略;又例如,该业务办理场景可以在借贷场景下,对客户进行风险分类等,由此辅助输出风控策略;还例如,该业务办理场景可以在现实接待场景下,对客户进行情绪分类,由此辅助输出接待策略。业务办理场景覆盖金融领域的方方面面,在此不再赘述。
因此,在客户进行业务办理的过程前/中/后需要收集客户的相关资料,这些资料用于后台对用户进行分类,这些“相关资料”则称为该待分类用户的评价指标集。对客户的分类而言,所参考的类别维度需要多样化,因此,需要借助不同的指标类别对客户进行综合考察。而对于评价指标集中的评价指标,不同的评价指标属于不同的指标类别。例如,当指标类别为财务指标类别时,在财务指标类别下包括多个不同的财务评价指标,例如,财务评价指标可以是负债率和偿债率等。也就是说,获取到的客户的评价指标集中下属拥有多个指标类别,每个指标类别中又包含多个评价指标。
在操作S220中,基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,其中,在所述预设的基础指标库中所述指标变量与所述评价指标呈一对多的对应关系。
相较于评价指标集中仅有各指标类别的评价指标,预设的基础指标库不仅存储了各指标类别的评价指标,还存储有不同指标类别的评价变量,指标变量是在该指标类别下由多个不同的评价指标汇总得到的变量,该指标变量是由研发人员基于业务自身的规则预先设定的。以借贷场景为例,在财务指标类别下,当评价指标负债率和偿债率分别为0.3和0.2时,对应的财务指标类别的指标变量为0.3(0~1的区间)。进而,在对客户的借贷风险类别分类时,则需要综合财务指标类别、消费指标类别以及背景指标类别等不同的指标变量。所以说,在步骤S220,则是通过待分类客户的评价指标匹配出预设的基础指标库中适用于该业务场景的指标变量。
需要说明的是,在上述操作S210中所获取到的待分类客户的评价指标集中的指标变量相较于预设的基础指标库中的指标变量欠缺一定的完备性。以借贷场景为例,在该场景下,需要对客户的财务指标类别、消费指标类别以及背景指标类别等类别进行匹配,因此,在预设的基础指标库中存储有财务指标类别、消费指标类别以及背景指标类别等完备的指标类别以及不同指标类别下属的评价指标的情况下,出于的数据缺失的原因,该待分类客户仅能获取到财务指标类别和消费指标类别下的评价指标。因此,在进行匹配时,该待分类客户仅能通过财务指标类别和消费指标类别与预设的基础指标库中相应的指标变量数据进行匹配,由此得出各指标类别对应的指标变量。
需要再次说明的是,预设的基础指标库中预存的数据并不涉及该待分类客户。仅是用待分类客户的数据特征匹配以往人去的数据特征。
在操作S230中,基于所述不同指标类别的指标变量计算中间分类结果。
可以理解的是,在后台的分类引擎中,在同一时间段内并非仅计算客户A的数据,可能是同时计算数以万计客户的数据,进而,所获取的指标变量也并不是瞬时间获取到全量的指标变量,再进一步地,最终的分类结果并非瞬时计算出的,而是通过不断迭代中间分类结果最终触发截止条件时完成中间分类结果的迭代。
在操作S240中,在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出。
根据本公开的实施例,其中,所述在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出,包括:在所述待分类客户的评价指标完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,将最终的所述中间分类结果作为所述最终分类结果。
一种截止的条件是,在将所有待分类客户的指标变量匹配完备后,此时,采用通过所有指标变量计算出来的中间分类结果作为最终的分类结果。
根据本公开的实施例,其中,所述在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出,还包括:在所述待分类客户的评价指标未完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,当出现所述中间分类结果处于预设的阈值时,将所述中间分类结果作为所述最终分类结果。
另一种截止的条件是,在待分类客户的指标变量还处于匹配过程中时,通过已经获取到的指标变量计算出来的中间分类结果已经处于预设的范围内时(预设的范围可以是某段双向闭合的区间,也可以是某个单向开放的区间),截止剩余的匹配操作,将处于预设范围内的中间分类结果作为最终结果。例如,在借贷场景下,风险值(即中间分类结果)超过200,则直接将该客户归类为高风险用户,无需继续匹配并计算其他的指标变量。
可以理解的是,在上述操作S210~上述操作S240,相当于通过获取客户的画像信息,在预设的基础指标库中匹配相应的客户画像,进而得到该画像的标签(即分类结果)。需要强调的是,客户的最终的分类结果是需要集合不同的指标数据。例如,待识别客户A通过预设的基础指标库进行匹配,得到了基础数据Z(即某个以往客户的所有指标类别下的评价指标和指标变量)在指标类别1的指标变量、基础数据X在指标类别2的指标变量以及基础数据C在指标类别3的指标变量,进而基于这些指标变量计算分类结果。
在本公开的实施例中,通过对获取待分类客户在不同类别下的评价指标后匹配评价指标,无需遍历所有的数据,保证较少的***处理开销,可以加快客户的分类效率,特别在大量客户同时需要进行分类的场景中,能够保证***的稳定性。并且,对各个指标类别下的完成指标的完成匹配,综合各个指标类别下的评价指标,并不需要全量的待分类客户的相关信息,仅部分的待分类客户的相关数据即可实现客户分类,在待分类客户的数据缺失的场景下,仍然可以完成分类,增强了该客户分类方法的适应场景,提高兼容性。由于对客户进行分类需要保证高效率,但同时,该后台的分类装置又同时服务于多人场景中。因此,可以采用高效的交互式并行计算的方式来实现指标变量的匹配和结果的输出,即通过高效的交互式并行计算方式实现上述操作S220和上述操作S230。
图3示意性示出了根据本公开实施例的指标变量匹配方法的流程图。
如图3所示,该实施例的指标变量匹配方法包括操作S310~操作S350,该操作S310~操作S350至少可以部分执行上述操作S220。
在操作S310中,建立与所述待分类客户的指标类别一对应的计算池,所述计算池包括指标计算池和变量池。
需要强调的是,在本公开的实施例中,存在两种指标类别,一类是待识别客户的指标类别,另一类是预设的基础指标库的指标类别。建立的计算池是与待识别客户的指标类别一一对应的,即在一个指标类别对应一个计算池,当然,一个计算池中包括多个子池,具体的,一个计算池中至少包括指标计算池和变量计算池,其中,对应指标计算池和变量计算池的数量在此不做限定。
在操作S320中,将所述待分类客户的评价指标和所述预设的基础指标库对应的指标变量,推送至对应的指标类别的所述指标计算池,其中,所述预设的基础指标库的指标变量是随机推送的。
需要说明的是,在操作S320这个阶段中,并非主动从预设的基础指标库中获取数据,而是由预设的基础指标库随机推送与待分类客户相对应的评价指标。
在操作S330中,计算所述待分类客户的评价指标和所述预设的基础指标库中的对应的评价指标之间的偏移量。
根据本公开的实施例,其中,所述评价指标包括第一评价指标。
在操作S340中,挑选所述偏移量预设偏移量区间的所述评价指标,作为所述第一评价指标。
偏移量可以表征两数据间的相似度,偏移量受算法影响,预设偏移量区间可以是偏移量大于某个偏移量阈值,也可以是偏移量小于某个偏移量阈值
在操作S350中,基于所述第一评价指标获取所述预设的基础指标库中对应的指标变量,以将所述指标变量存入所述变量池中。
可以理解的是,上述操作S320~操作S350是指,在计算池中通过待分类客户的评价指标不断匹配来自预设的基础指标库推送的多个不同的评价指标,以此计算不同针对指标的偏移量,选出偏移量较小,不会过大影响最终分类结果的评价指标,通过在一个评价类别下完整地匹配到下属的评价指标后,找到这些评价指标对应的指标变量即可。
当然,如果在某个待分类客户的获取到的对应的指标变量达到某些阈值的情况下(该情况下,还未获取到该待分类客户所有的指标变量)。则将计算池的资源向该待分类客户倾斜,优先获取该待分类客户剩余的指标变量,进而实行分类。
图4示意性示出了根据本公开实施例的另一种指标变量匹配方法的流程图。
如图4所示,该实施例的指标变量匹配方法处理上述操作S310~操作S350,还包括操作S410,该操作S410执行于上述操作S310后和上述操作S320前。
根据本公开的实施例,所述指标计算池包括不同优先级。
在操作S410中,分别基于所述变量池和所述指标计算池匹配容器,所述容器包括多个性能由高到低的容器,其中,所述变量池的匹配方法包括:相较于所述指标计算池,优先基于所述容器,按照性能由高到低的顺序匹配所述变量池,所述指标计算池的匹配方法包括:在所述变量池匹配结束后,基于剩余的容器,匹配所述指标计算池和所述容器,其中,所述指标计算池的优先级与所述容器的性能高低呈正相关。
具体的,计算池下属的子池中,指标计算池包括不同优先级。优先级的等级数是由研发人员预先定义,例如,可以将优先级等级设定为优先、次级以及普通,同样的容器也可以定义为高性能容器、中性能容器以及低性能容器。具体的,对于***资源占用分布的方面,各指标计算池和各变量池应当遵循以下匹配原则:变量池始终匹配高性能容器,计算池的优先匹配高性能容器,其次为次级池和普通池,当优先池空闲时次级池可匹配高性能容器,当优先池和次级池均空闲时,普通池也可匹配高性能容器。
图5示意性示出了根据本公开实施例的中间分类结果计算方法。
如图5所示,该实施例的中间分类结果计算方法包括操作S510,该操作S510至少可以部分执行上述操作S230。
根据本公开的实施例,其中,不同的变量池对应不同的变量池权重。
在操作S510中,基于所述变量池权重和对应的所述指标变量进行计算,得到中间分类结果。
具体的,中间分类结果等于不同的指标变量的加权求和,在某个具体的业务场景下,例如,分类结果需要指标变量1、指标变量2以及指标变量3进行加权求和,但是在计算过程中,先得到了指标变量1和指标变量2,但未得到指标变量3时,先行通过指标变量1、指标变量2以及相应的权重计算中间分类结果,在得到指标变量3时,可以进一步通过指标变量3和对应的权重更新中间分类结果。需要强调的是,在本公开的实施例中,通过对变量池赋予权重,使得该分类方法可以通过调整权重,实现不同业务场景下的分类。
图6示意性示出了根据本公开实施例的预设的基础指标库的建立方法。
如图6所示,该实施例的预设的基础指标库的建立方法包括操作S610~操作S620。
在操作S610中,获取建库数据,所述建库数据包括多个指标类别的评价指标和指标变量,其中,所述评价指标和所述指标变量是多对一的关系。
具体的,建库数据可以是基于以往其他客户的指标数据结合相应的指标变量建立的,其中,指标变量是预先设定的,可以由机器学习模型进行输出。以借贷场景为例,建库数据至少包括已违约客户的各指标类别的评价指标和指标变量、未违约客户的各指标类别的评价指标和指标变量,多个同指标类别的评价指标影响一个指标变量。
在操作S620中,按照所述指标类别对评价指标和指标变量进行存储,并建立所述评价指标和所述指标变量的映射关系。
具体的,可以按照不同的指标类别建立不同的库,以借贷场景为例,建立基础风险等级库、基础财务指标库、基础消费指标库以及基础客户背景库,其中,
(1)基础风险等级库包括客户ID、哈希值、行为评分和风险等级。
(2)基础财务指标库包括客户ID、资产负债率指标和资产负债率指标变量。
(3)基础消费指标库包括客户ID、***消费指标和***消费指标变量。
(4)基础客户背景库包括客户ID、客户年龄、影像分层、职业和客户信息指标变量。
根据本公开的实施例,其中,所述按照所述指标类别对评价指标和指标变量进行存储,并建立所述评价指标和所述指标变量的映射关系,包括:将所述评价指标转化为哈希值,并建立所述哈希值和所述指标变量的映射关系。
当然,在数据分布方面,可以采用哈希分布的方式,将使得一个评价指标对应一个哈希值,在之后计算池中进行计算时,推送哈希值进而完成计算即可。例如,指标类别1下属的评价指标的哈希分布取值为O-Z之间,指标类别2下属的评价指标的哈希分布取值为H-N之间,指标类别3下属的评价指标的哈希分布取值为A-G之间。指标类别1、指标类别2以及指标类别3对应的指标变量取值为1-9之间。因此,通过推送并计算查找到哈希值,进而查找哈希分布的映射关系即可找到指标变量。
图7示意性示出了根据本公开实施例的偏移量计算方法的流程图。
如图7所述,该偏移量计算方法包括操作S710~操作S720。该操作S710~操作S720至少可以部分执行上述操作S330。
在操作S710中,计算所述待分类客户的评价指标的哈希值。
在操作S720中,基于所述待分类客户的评价指标的哈希值和所述预设的基础指标库的评价指标的哈希值计算所述偏移量。
图8示意性示出了根据本公开实施例的指标变量获取方法的流程图。
如图8所示,该指标变量获取方法包括操作S810。该操作S810至少可以部分执行上述操作S350。
在操作S810中,基于所述第一评价指标的哈希值和所述映射关系,获取对应的指标变量。
具体,偏移量可以通过计算哈希值之间的汉明距离实现,其中,汉明距离越大,图像之间的相似度越小,因此,取一定范围偏移量中,汉明距离中最大的,或者,在计算过程中当计算到汉明距离大于某个预设阈值的情况下,以该大于预设阈值的汉明距离对应的评价指标(哈希值)作为匹配到的评价指标。进而通过多个匹配好的评价指标获取对应的指标变量。
图9示意性示出了根据本公开实施例的另一种预设的基础指标库的建立方法的流程图。
如图9所示,该预设的基础指标库的建立方法包括操作S910~操作S930。该操作S910~操作S930至少可以部分执行上述操作S610。
根据本公开的实施例,其中,所述指标类别至少包括客户信息类别和客户生物特征类别,所述客户生物特征类别至少包括面部特征类别,所述预设的基础指标库至少包括客户信息类别库和客户生物特征库。
可以理解的是,客户信息类别则是后台能够获取到的客户信息,基于不同的业务场景,所获取的客户信息不同,以借贷场景为例,客户信息包括财务指标信息、消费指标信息以及背景信息等。这些数据通常占用空间量较小,并且数据量相较于客户生物特征类别也少很多,仅是一串字符或数字。对于生物识别特征,通常包括:人脸图像类别、指纹类别、虹膜类别以及声纹类别等。
根据本公开的实施例,其中,所述客户生物特征库是基于云存储数据库建立的。
需要说明的是,在预先进行数据准备的过程中,考虑到生物特征的评价指标数据量较大,存入云端缓解***的存储压力。当然,对于其他的数据量较大的数据同样可以将其放入云存储数据库中。而对于数据量较小的数据,可以将其放入***数据库中,该***数据库用以存储数据量较小的数据,例如,***数据库可以是配置于集中式存储数据库上。
在操作S910中,对于所述面部特征类别,获取面部影像。
在操作S920中,基于所述面部影像提取面部影像特征。
在操作S930中,基于所述面部影像特征,通过预设的机器学习模型,输出所述面部影像特征对应的面部影像变量,其中,所述面部影像变量是所述面部特征类别下的所述指标变量。
其中,预设的机器学习模型是采用面部影像特征作为入模数据,面部影像变量作为标签进行训练。
在一个典型的场景中,客户进行业务办理(该业务办理场景可以是线上营销场景、借贷场景以及现实接待场景(例如,感知情绪))时,由于某些原因,能够获取到的客户相关指标较少。因此,可以通过获取到可知的面部图像进行匹配分类。
可以理解的是,由于是进行面部图像特征的匹配,因此预设的基础指标库中应预存有相应的图像的评价指标。对于这些以往数据可以按照以下方式进行处理:(1)数据清洗和分层(2)影像特征提取(3)建立基础指标库。
对于(1)数据清洗和分层,按照时间段将数据进行分层。例如,对获取的影像按照影像获取距今的时间进行数据清洗和分层,据今2年(含)内的数据为强相关层,2年-5年(含)的数据为次相关层,5年-10年(含)的数据为弱相关层,10年以上的数据予以剔除。
对于(2)影像特征提取,通过深层卷积神经网络对影像进行特征提取,得到面部特征评价指标,并将其与预先设置好的分类进行关联。具体的,评价指标的类别包括:肌肉、纹理、色泽、线条、骨头、结构以及毛发等,相应的,各指标类别下对应的评价指标如下所示:(1)肌肉:薄厚、柔硬以及松紧;(2)纹理:深浅、顺乱以及多少;(3)色泽:斑痣、明暗、统一以及深浅;(4)线条:弯直以及比例;(5)骨头:凹凸、大小以及锐度;(6)结构:对称、形状以及比例;(7)毛发:整齐、方向、密度、粗细、颜色、光泽以及卷直。
对于(3)建立基础指标库,按照分类等级,可以将肌肉、纹理、色泽、线条、骨头、结构以及毛发等指标类别分为7个子库,各子库中的内容均由ID、评价指标以及变量值构成。采用监督的哈希算法对基础组中各层数据进行机器学习,映射得到所有客户所有组的哈希分布,各哈希分不足形成哈希值并确定分类与哈希值之间的对应关系。
其中,云存储中的数据可以按照分池存储的原则,具体表现为:首层为地区层,对应客户ID前四位;第二层为序号层,对应客户ID后五位(从00001到99999);底层为碎片层,对应提取层(指标数据);最终可以将同一客户ID+提取层的所有方位碎片进行打包储存。
图10示意性示出了根据本公开实施例的客户分类方法的全架构图。
如图10所示,***数据库中包含子库1、子库2、子库3、子库4以及子库5(即图10中基础介质库、负债库、客户信息库、消费库、以及资产库),该***数据库是非云的数据库,相应的云数据库是由分层索引的方式进行存储的,包括不同的碎片层、序列层以及地区层。
在进行评价指令的匹配计算过程中,首先由***数据库和云存储数据库推送相应的评价指标,由这些计算池计算两个数据之间的偏离值,在计算出的偏离值符合条件的情况下,主动获取***数据库和云存储数据库中的指标变量,并存入变量池中,进而输出结果。其中,在变量池中计算出的结果符合预设的区间内时,变量池主动请求指标计算池获取该待分类客户的ID下的其他评价指标。
基于上述客户分类方法,本公开还提供了一种客户分类装置。以下将结合图11对该装置进行详细描述。
图11示意性示出了根据本公开实施例的客户分类装置的结构框图。
如图11所示,该实施例的客户分类装置1100包括指标获取模块1110、指标匹配模块1120、中间分类结果计算模块1130和最终结果输出模块1140。
指标获取模块1110用于获取待分类客户的评价指标集,所述待分类客户的评价指标集包括不同指标类别的评价指标。在一实施例中,指标获取模块1110可以用于执行前文描述的操作S210,在此不再赘述。
指标匹配模块1120用于基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,其中,在所述预设的基础指标库中所述指标变量与所述评价指标呈一对多的对应关系。在一实施例中,指标匹配模块1120可以用于执行前文描述的操作S220,在此不再赘述。
中间分类结果计算模块1130用于基于所述不同指标类别的指标变量计算中间分类结果。在一实施例中,中间分类结果计算模块1130可以用于执行前文描述的操作S230,在此不再赘述。
最终结果输出模块1140用于在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出。在一实施例中,最终结果输出模块1140可以用于执行前文描述的操作S240,在此不再赘述。
在本公开的实施例中,通过对获取待分类客户在不同类别下的评价指标后匹配评价指标,无需遍历所有的数据,保证较少的***处理开销,可以加快客户的分类效率,特别在大量客户同时需要进行分类的场景中,能够保证***的稳定性。并且,对各个指标类别下的完成指标的完成匹配,综合各个指标类别下的评价指标,并不需要全量的待分类客户的相关信息,仅部分的待分类客户的相关数据即可实现客户分类,在待分类客户的数据缺失的场景下,仍然可以完成分类,增强了该客户分类方法的适应场景,提高兼容性。根据本公开的实施例,其中,所述评价指标包括第一评价指标,所述指标匹配模块,用于建立与所述待分类客户的指标类别一一对应的计算池,所述计算池包括指标计算池和变量池;将所述待分类客户的评价指标和所述预设的基础指标库对应的指标变量,推送至对应的指标类别的所述指标计算池,其中,所述预设的基础指标库的指标变量是随机推送的;计算所述待分类客户的评价指标和所述预设的基础指标库中的对应的评价指标之间的偏移量;挑选所述偏移量预设偏移量区间的所述评价指标,作为所述第一评价指标;以及基于所述第一评价指标获取所述预设的基础指标库中对应的指标变量,以将所述指标变量存入所述变量池中。
根据本公开的实施例,其中,所述指标计算池包括不同优先级,所述指标匹配模块,用于分别基于所述变量池和所述指标计算池匹配容器,所述容器包括多个性能由高到低的容器,其中,所述变量池的匹配方法包括:相较于所述指标计算池,优先基于所述容器,按照性能由高到低的顺序匹配所述变量池,所述指标计算池的匹配方法包括:在所述变量池匹配结束后,基于剩余的容器,匹配所述指标计算池和所述容器,其中,所述指标计算池的优先级与所述容器的性能高低呈正相关。
根据本公开的实施例,其中,不同的变量池对应不同的变量池权重,所述中间分类结果计算模块,用于基于所述变量池权重和对应的所述指标变量进行计算,得到中间分类结果。
根据本公开的实施例,其中,所述最终结果输出模块,用于在所述待分类客户的评价指标完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,将最终的所述中间分类结果作为所述最终分类结果。
根据本公开的实施例,其中,所述最终结果输出模块,用于在所述待分类客户的评价指标未完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,当出现所述中间分类结果处于预设的阈值时,将所述中间分类结果作为所述最终分类结果。
根据本公开的实施例,其中,所述装置还包括建库模块,用于获取建库数据,所述建库数据包括多个指标类别的评价指标和指标变量,其中,所述评价指标和所述指标变量是多对一的关系;以及按照所述指标类别对评价指标和指标变量进行存储,并建立所述评价指标和所述指标变量的映射关系。
根据本公开的实施例,其中,所述建库模块,用于将所述评价指标转化为哈希值,并建立所述哈希值和所述指标变量的映射关系。
根据本公开的实施例,其中,所述指标匹配模块,用于计算所述待分类客户的评价指标的哈希值;以及基于所述待分类客户的评价指标的哈希值和所述预设的基础指标库的评价指标的哈希值计算所述偏移量。
根据本公开的实施例,其中,所述指标匹配模块,用于基于所述第一评价指标的哈希值和所述映射关系,获取对应的指标变量。
根据本公开的实施例,其中,所述指标类别至少包括客户信息类别和客户生物特征类别,所述客户生物特征类别至少包括面部特征类别,所述建库模块,用于对于所述面部特征类别,获取面部影像;基于所述面部影像提取面部影像特征;基于所述面部影像特征,通过预设的机器学习模型,输出所述面部影像特征对应的面部影像变量,其中,所述面部影像变量是所述面部特征类别下的所述指标变量。
根据本公开的实施例,其中,所述客户生物特征库是基于云存储数据库建立的。
根据本公开的实施例,标获取模块1110、指标匹配模块1120、中间分类结果计算模块1130和最终结果输出模块1140中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,标获取模块1110、指标匹配模块1120、中间分类结果计算模块1130和最终结果输出模块1140中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,标获取模块1110、指标匹配模块1120、中间分类结果计算模块1130和最终结果输出模块1140中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图12示意性示出了根据本公开实施例的适于实现客户分类方法的电子设备的方框图。
如图12所示,根据本公开实施例的电子设备1200包括处理器1201,其可以根据存储在只读存储器(ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(RAM)1203中的程序而执行各种适当的动作和处理。处理器1201例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器1201还可以包括用于缓存用途的板载存储器。处理器1201可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1203中,存储有电子设备1200操作所需的各种程序和数据。处理器1201、ROM 1202以及RAM1203通过总线1204彼此相连。处理器1201通过执行ROM 1202和/或RAM1203中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 1202和RAM 1203以外的一个或多个存储器中。处理器1201也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备1200还可以包括输入/输出(I/O)接口1205,输入/输出(I/O)接口1205也连接至总线1204。电子设备1200还可以包括连接至I/O接口1205的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1202和/或RAM 1203和/或ROM 1202和RAM 1203以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机***中运行时,该程序代码用于使计算机***实现本公开实施例所提供的方法。
在该计算机程序被处理器1201执行时执行本公开实施例的***/装置中限定的上述功能。根据本公开的实施例,上文描述的***、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分1209被下载和安装,和/或从可拆卸介质1211被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被处理器1201执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (16)

1.一种客户分类方法,包括:
获取待分类客户的评价指标集,所述待分类客户的评价指标集包括不同指标类别的评价指标;
基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,其中,在所述预设的基础指标库中所述指标变量与所述评价指标呈一对多的对应关系;
基于所述不同指标类别的指标变量计算中间分类结果;以及
在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出。
2.根据权利要求1所述的方法,其中,所述评价指标包括第一评价指标,
所述基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,包括:
建立与所述待分类客户的指标类别一一对应的计算池,所述计算池包括指标计算池和变量池;
将所述待分类客户的评价指标和所述预设的基础指标库对应的指标变量,推送至对应的指标类别的所述指标计算池,其中,所述预设的基础指标库的指标变量是随机推送的;
计算所述待分类客户的评价指标和所述预设的基础指标库中的对应的评价指标之间的偏移量;
挑选所述偏移量预设偏移量区间的所述评价指标,作为所述第一评价指标;以及
基于所述第一评价指标获取所述预设的基础指标库中对应的指标变量,以将所述指标变量存入所述变量池中。
3.根据权利要求2所述的方法,其中,所述指标计算池包括不同优先级,
在所述建立与所述待分类客户的指标类别一一对应的计算池后,还包括:
分别基于所述变量池和所述指标计算池匹配容器,所述容器包括多个性能由高到低的容器,
其中,所述变量池的匹配方法包括:相较于所述指标计算池,优先基于所述容器,按照性能由高到低的顺序匹配所述变量池,
所述指标计算池的匹配方法包括:在所述变量池匹配结束后,基于剩余的容器,匹配所述指标计算池和所述容器,其中,所述指标计算池的优先级与所述容器的性能高低呈正相关。
4.根据权利要求3所述的方法,其中,不同的变量池对应不同的变量池权重,
所述基于所述不同指标类别的指标变量计算中间分类结果,包括:
基于所述变量池权重和对应的所述指标变量进行计算,得到中间分类结果。
5.根据权利要求2所述的方法,其中,所述在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出,包括:
在所述待分类客户的评价指标完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,将最终的所述中间分类结果作为所述最终分类结果。
6.根据权利要求5所述的方法,其中,所述在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出,还包括:
在所述待分类客户的评价指标未完全匹配到所述预设的基础指标库中的对应的指标变量的情况下,当出现所述中间分类结果处于预设的阈值时,将所述中间分类结果作为所述最终分类结果。
7.根据权利要求2~6任一项所述的方法,其中,所述预设的基础指标库的建立方法包括:
获取建库数据,所述建库数据包括多个指标类别的评价指标和指标变量,其中,所述评价指标和所述指标变量是多对一的关系;以及
按照所述指标类别对评价指标和指标变量进行存储,并建立所述评价指标和所述指标变量的映射关系。
8.根据权利要求7所述的方法,其中,所述按照所述指标类别对评价指标和指标变量进行存储,并建立所述评价指标和所述指标变量的映射关系,包括:
将所述评价指标转化为哈希值,并建立所述哈希值和所述指标变量的映射关系。
9.根据权利要求8所述的方法,其中,所述计算所述待分类客户的评价指标和所述预设的基础指标库中的对应的评价指标之间的偏移量,包括:
计算所述待分类客户的评价指标的哈希值;以及
基于所述待分类客户的评价指标的哈希值和所述预设的基础指标库的评价指标的哈希值计算所述偏移量。
10.根据权利要求9所述的方法,其中,所述基于所述第一评价指标获取所述预设的基础指标库中对应的指标变量,包括:
基于所述第一评价指标的哈希值和所述映射关系,获取对应的指标变量。
11.根据权利要求7所述的方法,其中,所述指标类别至少包括客户信息类别和客户生物特征类别,所述客户生物特征类别至少包括面部特征类别,所述预设的基础指标库至少包括客户信息类别库和客户生物特征库,
所述获取建库数据,包括:
对于所述面部特征类别,获取面部影像;
基于所述面部影像提取面部影像特征;
基于所述面部影像特征,通过预设的机器学习模型,输出所述面部影像特征对应的面部影像变量,其中,所述面部影像变量是所述面部特征类别下的所述指标变量。
12.根据权利要求11所述的方法,其中,所述客户生物特征库是基于云存储数据库建立的。
13.一种客户分类装置,包括:
指标获取模块,用于获取待分类客户的评价指标集,所述待分类客户的评价指标集包括不同指标类别的评价指标;
指标匹配模块,用于基于所述待分类客户的不同指标类别的评价指标,与预设的基础指标库进行匹配,得到不同指标类别的指标变量,其中,在所述预设的基础指标库中所述指标变量与所述评价指标呈一对多的对应关系;
中间分类结果计算模块,用于基于所述不同指标类别的指标变量计算中间分类结果;以及
最终结果输出模块,用于在所述中间分类结果满足预设的分类输出结果时,将所述中间分类结果作为最终分类结果进行输出。
14.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~12中任一项所述的方法。
15.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~12中任一项所述的方法。
16.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~12中任一项所述的方法。
CN202310150469.2A 2023-02-13 2023-02-13 客户分类方法、装置、设备、介质和程序产品 Pending CN116127363A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310150469.2A CN116127363A (zh) 2023-02-13 2023-02-13 客户分类方法、装置、设备、介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310150469.2A CN116127363A (zh) 2023-02-13 2023-02-13 客户分类方法、装置、设备、介质和程序产品

Publications (1)

Publication Number Publication Date
CN116127363A true CN116127363A (zh) 2023-05-16

Family

ID=86308105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310150469.2A Pending CN116127363A (zh) 2023-02-13 2023-02-13 客户分类方法、装置、设备、介质和程序产品

Country Status (1)

Country Link
CN (1) CN116127363A (zh)

Similar Documents

Publication Publication Date Title
CN109919316B (zh) 获取网络表示学习向量的方法、装置和设备及存储介质
WO2022161202A1 (zh) 多媒体资源分类模型训练方法和多媒体资源推荐方法
CN112085205A (zh) 用于自动训练机器学习模型的方法和***
US20150161529A1 (en) Identifying Related Events for Event Ticket Network Systems
CN111667022A (zh) 用户数据处理方法、装置、计算机设备和存储介质
CN114611707A (zh) 结合规则来进行机器学习的方法及***
US20140358694A1 (en) Social media pricing engine
CN109766454A (zh) 一种投资者分类方法、装置、设备及介质
CN114298122B (zh) 数据分类方法、装置、设备、存储介质及计算机程序产品
CN115130711A (zh) 一种数据处理方法、装置、计算机及可读存储介质
CN113706211A (zh) 基于神经网络的广告点击率预测方法及***
WO2023024408A1 (zh) 用户特征向量确定方法、相关设备及介质
CN115222443A (zh) 客户群体划分方法、装置、设备及存储介质
CN116739665A (zh) 信息投放方法、装置、电子设备及存储介质
CN114065051A (zh) 私域平台视频推荐方法、装置、电子设备和介质
CN114330476A (zh) 用于媒体内容识别的模型训练方法及媒体内容识别方法
CN113591881A (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN115131052A (zh) 一种数据处理方法、计算机设备和存储介质
CN116756281A (zh) 知识问答方法、装置、设备和介质
WO2023011062A1 (zh) 信息推送方法、装置、设备、存储介质及计算机程序产品
CN117132323A (zh) 推荐内容的分析方法、装置、设备、介质及程序产品
CN114463590A (zh) 信息处理方法、装置、设备、存储介质及程序产品
CN116127363A (zh) 客户分类方法、装置、设备、介质和程序产品
CN114581177A (zh) 产品推荐方法、装置、设备及存储介质
CN113792163B (zh) 多媒体推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination