CN110782128B - 一种用户职业标签生成方法、装置和电子设备 - Google Patents

一种用户职业标签生成方法、装置和电子设备 Download PDF

Info

Publication number
CN110782128B
CN110782128B CN201910921669.7A CN201910921669A CN110782128B CN 110782128 B CN110782128 B CN 110782128B CN 201910921669 A CN201910921669 A CN 201910921669A CN 110782128 B CN110782128 B CN 110782128B
Authority
CN
China
Prior art keywords
user
occupation
data
current user
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910921669.7A
Other languages
English (en)
Other versions
CN110782128A (zh
Inventor
杨轲
林韦佳
徐友
王黎
金宏桥
郑彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qiyu Information Technology Co Ltd
Original Assignee
Beijing Qiyu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qiyu Information Technology Co Ltd filed Critical Beijing Qiyu Information Technology Co Ltd
Priority to CN201910921669.7A priority Critical patent/CN110782128B/zh
Publication of CN110782128A publication Critical patent/CN110782128A/zh
Application granted granted Critical
Publication of CN110782128B publication Critical patent/CN110782128B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用户职业标签生成方法、装置、电子设备及计算机可读介质,包括:获取用户信息数据,所述用户信息数据至少包括所述用户的关联人对所述用户的标签数据以及所述用户的职业分类信息数据;采用机器学***台避免由于职业信息缺失造成的经济损失。

Description

一种用户职业标签生成方法、装置和电子设备
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种用户职业标签生成方法、装置、电子设备及计算机可读介质。
背景技术
金融平台存在大量信息缺失的用户,用户信息缺失使金融平台对于用户授信额度和用户还款能力的评估出现偏差,不利于金融平台的风险控制。如果用户职业信息缺失,金融平台难以准确估计用户的收入水平,进而难以精准评估用户资质,对用户资质判断失误,将坏客户划分为好客户,则存在放贷难以收回的情况,造成金融平台的经济损失。
现有技术对用户职业的判断准确率不高,用户职业标签在用户标签***的覆盖率也不高。
发明内容
本发明要解决的技术问题是提高对于用户职业判断的准确率。
本发明的一方面提供一种用户职业标签生成方法,其特征在于,包括:获取用户信息数据,所述用户信息数据至少包括所述用户的关联人对所述用户的标签数据以及所述用户的职业分类信息数据;采用机器学习的方法训练所述用户信息数据,构建用户职业分类预测模型;获取当前用户信息数据,所述当前用户信息数据至少包括所述当前用户的关联人对所述当前用户的标签数据;将所述当前用户信息代入所述用户职业预测模型,预测所述当前用户职业分类;基于所述当前用户职业分类,生成所述当前用户职业标签。
根据本发明的一种优选实施方式,所述获取用户信息数据,进一步包括:整合所述用户不同身份标识的关联人对所述用户的标签数据。
根据本发明的一种优选实施方式,还包括:以所述用户为节点,所述用户间的关系为边,整合所述用户不同身份标识,构建所述用户身份标识信息知识图谱;基于所述身份标识信息知识图谱识别所述用户不同身份标识的所有关联人;提取所述所有关联人对所述用户的标签数据。
根据本发明的一种优选实施方式,还包括:所述不同身份标识可包括用户的通讯网号码、身份号码、设备号码、社交账号。
根据本发明的一种优选实施方式,所述获取当前用户信息数据,进一步包括:利用所述用户身份标识信息知识图谱获取所述当前用户信息数据。
根据本发明的一种优选实施方式,还包括:获取所述当前用户至少一个身份标识;使用所述用户身份标识信息知识图谱识别所述当前用户全部身份标识;提取所述当前用户全部身份标识的关联人对所述当前用户的标签数据。
根据本发明的一种优选实施方式,进一步包括:设置职业分类与职业标签的映射关系表;使用所述映射关系表,依据所述当前用户职业分类建立所述当前用户职业标签。
根据本发明的一种优选实施方式,还包括:所述机器学习的方法进一步可包括神经网络模型。
本发明的第二方面提供一种用户职业标签生成装置,其特征在于,包括:数据获取模块,用于获取用户信息数据,所述用户信息数据包括所述用户的关联人对所述用户的标签数据以及所述用户的职业分类信息数据;模型构建模块,用于采用机器学习的方法训练所述用户信息数据,构建用户职业分类预测模型;输入模块,用于获取当前用户信息数据,所述当前用户信息数据包括所述当前用户的关联人对所述当前用户的标签数据;模型使用模块,用于将所述当前用户信息代入所述用户职业预测模型,预测所述当前用户职业分类;标签生成模块,用于基于所述当前用户职业分类,生成所述当前用户职业标签。
根据本发明的一种优选实施方式,所述数据获取模块,进一步包括:数据整合单元,用于整合所述用户不同身份标识的关联人对所述用户的标签数据。
根据本发明的一种优选实施方式,所述数据获取模块,进一步可用于以所述用户为节点,所述用户间的关系为边,整合所述用户不同身份标识,构建所述用户身份标识信息知识图谱;用于基于所述身份标识信息知识图谱识别所述用户不同身份标识的所有关联人;用于提取所述所有关联人对所述用户的标签数据。
根据本发明的一种优选实施方式,还包括:所述不同身份标识可包括用户的通讯网号码、身份号码、设备号码、社交账号。
根据本发明的一种优选实施方式,所述输入模块,进一步包括:用于利用所述用户身份标识信息知识图谱获取所述当前用户信息数据。
根据本发明的一种优选实施方式,所述输入模块,进一步可用于获取所述当前用户至少一个身份标识;使用所述用户身份标识信息知识图谱识别所述当前用户全部身份标识;提取所述当前用户全部身份标识的关联人对所述当前用户的标签数据。
根据本发明的一种优选实施方式,所述用户职业标签生成装置进一步包括:用于设置职业分类与职业标签的映射关系表;使用所述映射关系表,依据所述当前用户职业分类建立所述当前用户职业标签。
根据本发明的一种优选实施方式,还包括:所述机器学习的方法进一步可包括神经网络模型。
本发明的第三方面提供一种电子设备,其中,该电子设备包括:处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行任一项所述的方法。
本发明的第四方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现任一项所述的方法。
本发明的技术方案,具有如下有益效果:
本发明的用户职业标签生成方法,能够收集用户关联人对用户的标签数据,并构建用户职业分类预测模型。通过匹配关键词预测用户的职业,提高对用户职业的判断能力,有利于金融平台避免由于职业信息缺失造成的经济损失。
本发明的用户职业标签生成方法,能够高效预测近千万用户的职业,在增加职业判断准确性的同时,也增长用户标签***中用户职业标签的覆盖率。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是本发明的用户职业标签生成方法流程示意图;
图2是本发明的用户职业标签生成方法的用户身份标识信息知识图谱示意图;
图3是本发明的用户职业标签生成装置的架构示意图;
图4是本发明的用户职业标签生成电子设备的结构框架示意图;
图5是本发明的计算机可读存储介质示意图。
具体实施方式
现在将参考附图更全面地描述本发明的示例性实施例。然而,示例性实施例能够以多种形式实施,且不应被理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例能够使得本发明更加全面和完整,更加便于将发明构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的元件、组件或部分,因而将省略对它们的重复描述。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的特征、结构、特性或其他细节不排除可以以合适的方式结合在一个或更多其他的实施例中。
在对于具体实施例的描述中,本发明描述的特征、结构、特性或其他细节是为了使本领域的技术人员对实施例进行充分理解。但是,并不排除本领域技术人员可以实践本发明的技术方案而没有特定特征、结构、特性或其他细节的一个或更多。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但这不应受这些定语限制。这些定语乃是用以区分一者与另一者。例如,第一器件亦可称为第二器件而不偏离本发明实质的技术方案。
术语“和/或”或者“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
图1是本发明的用户职业标签生成方法流程示意图;如图1所示,本发明的用户职业标签生成方法,包括:
S101:获取用户信息数据,所述用户信息数据至少包括所述用户的关联人对所述用户的标签数据以及所述用户的职业分类信息数据。
其中,所述获取用户信息数据,进一步包括:整合所述用户不同身份标识的关联人对所述用户的标签数据。
其中,还包括:以所述用户为节点,所述用户间的关系为边,整合所述用户不同身份标识,构建所述用户身份标识信息知识图谱;
基于所述身份标识信息知识图谱识别所述用户不同身份标识的所有关联人;
提取所述所有关联人对所述用户的标签数据。
其中,还包括:所述不同身份标识可包括用户的通讯网号码、身份号码、设备号码、社交账号。
S102:采用机器学习的方法训练所述用户信息数据,构建用户职业分类预测模型。
其中,所述机器学习的方法进一步可包括神经网络模型。
神经网络模型包括输入层、隐藏层,输出层,各层神经网络包括至少一个神经元。神经网络模型的数据处理过程为:向输入层神经元输入数据,然后经过激活函数,对数据做某种转换,最终得到一个输出结果。
在本发明中,训练神经网络模型时以用户信息数据作为训练样本。其中,具体应至少包括样本用户的关联人对用户的标签数据和用户的职业分类数据,基于用户的职业分类数据调整模型自身的网络结构,最后达到一定的精度和准确性。
通过用户信息数据对神经网络模型进行训练,训练后的神经网络模型用于构建用户职业分类预测模型。
为提高用户职业分类预测模型在预测用户职业时的准确性,训练样本的样本数量需足够大,并且在用户职业分类预测模型的使用过程中也需对模型进行不定期地训练。
S103:获取当前用户信息数据,所述当前用户信息数据至少包括所述当前用户的关联人对所述当前用户的标签数据。
其中,所述获取当前用户信息数据,进一步包括:利用所述用户身份标识信息知识图谱获取所述当前用户信息数据。
其中,还包括:获取所述当前用户至少一个身份标识;使用所述用户身份标识信息知识图谱识别所述当前用户全部身份标识;提取所述当前用户全部身份标识的关联人对所述当前用户的标签数据。
S104:将所述当前用户信息代入所述用户职业预测模型,预测所述当前用户职业分类。
S105:基于所述当前用户职业分类,生成所述当前用户职业标签。
其中,本发明的方法,进一步包括:设置职业分类与职业标签的映射关系表;使用所述映射关系表,依据所述当前用户职业分类建立所述当前用户职业标签。
作为示例,对本发明的方法作进一步的解释说明。
金融平台的用户职业信息缺失,金融平台为提高对用户职业的判断能力,通过构建用户职业分类预测模型对用户的职业进行预测。
用户职业分类预测模型的输入数据为用户关联人对用户的标签数据,输出数据为用户职业。
构建用户职业分类预测模型的训练数据,可选取在金融平台中职业信息完善的历史用户数据。
为提高用户职业分类预测模型的准确率,需从各种渠道获取更多、更准的关键词,用于与用户的职业进行匹配。
更多、更准的关键词的获取,需整合用户不同身份标识的关联人对用户的标签。
进一步包括:以所述用户为节点,所述用户间的关系为边,整合所述用户不同身份标识,构建所述用户身份标识信息知识图谱。图2是本发明的用户职业标签生成方法的用户身份标识信息知识图谱示意图;如图2所示,整合用户A的设备号码、通讯网号码、社交账号、身份号码以及其他不同身份标识。
要获取到更多、更准的关键词,则需利用用户身份标识信息知识图谱,识别用户所有的联系人,进而提取到关联人对用户的标签数据,获取到更多、更准的关键词。如图2所示,利用用户身份标识信息知识图谱,识别用户的通讯网号码标识,通过通讯网号码标识,识别用户的一度联系人A、 B,进而提取用户的一度联系人A对用户的标签D、E,用户B对用户的标签A、B、C。
对于通过用户身份标识信息知识图谱识别设备号码、社交账号、身份号码以及其他不同身份标识,进而识别用户的关联人,进而提取关联人对用户的标签数据的步骤,与通过通讯网号码提取到关联人对用户的标签数据的步骤类似。
本发明的方法,还能够对同一个用户多个标签同时出现进行统计分析。
获取到大量用户的关联人对用户的标签数据以及用户的职业分类信息数据后,采用机器学习的方法训练该些大量数据,用以构建用户职业分类预测模型。本发明的方法,机器学习的方法进一步可包括神经网络模型。
在构建好用户职业分类预测模型后,金融平台在使用用户职业分类预测模型对当前用户的职业进行预测时,需首先获取当前用户信息数据,当前用户信息数据包括当前用户的关联人对当前用户的标签数据。
当前用户的关联人对当前用户的标签数据的获取,可通过建立的用户身份标识信息知识图谱获取。进一步包括:获取当前用户至少一个身份标识;使用用户身份标识信息知识图谱识别当前用户全部身份标识;提取当前用户全部身份标识的关联人对当前用户的标签数据。
结合图3对当前用户的关联人对当前用户的标签数据的获取作进一步的详细说明。
金融平台,获取当前用户的通讯网号码身份标识,进而通过用户身份标识信息知识图谱,识别身份号码、设备号码、社交账号等身份标识;最后,提取所有关联人对当前用户的标签。
将当前用户信息代入用户职业预测模型后,预测当前用户职业分类。
获取到当前用户职业分类后,设置职业分类与职业标签的映射关系表;使用映射关系表,依据当前用户职业分类建立当前用户职业标签。
通过本发明的方法,能够高效预测近千万用户,在增加预测准确性的同时,用户标签***中的用户职业标签覆盖率增长8%。
本发明的用户职业标签生成方法,能够收集用户关联人对用户的标签数据,并构建用户职业分类预测模型。通过匹配关键词预测用户的职业,提高对用户职业的判断能力,有利于金融平台避免由于职业信息缺失造成的经济损失。
本发明的用户职业标签生成方法,能够高效预测近千万用户的职业,在增加职业判断准确性的同时,也增长用户标签***中用户职业标签的覆盖率。
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、ROM、RAM 等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
图3是本发明的用户职业标签生成装置的架构示意图;如图3所示,本发明的装置300包括:数据获取模块301,模型构建模块302,输入模块303,模型使用模块304,标签生成模块305。
数据获取模块,用于获取用户信息数据,所述用户信息数据至少包括所述用户的关联人对所述用户的标签数据以及所述用户的职业分类信息数据。
模型构建模块,用于采用机器学习的方法训练所述用户信息数据,构建用户职业分类预测模型。
输入模块,用于获取当前用户信息数据,所述当前用户信息数据至少包括所述当前用户的关联人对所述当前用户的标签数据。
模型使用模块,用于将所述当前用户信息代入所述用户职业预测模型,预测所述当前用户职业分类。
标签生成模块,用于基于所述当前用户职业分类,生成所述当前用户职业标签。
本发明的数据获取模块,包括:数据整合单元,用于整合所述用户不同身份标识的关联人对所述用户的标签数据。
本发明的数据获取模块还用于以所述用户为节点,所述用户间的关系为边,整合所述用户不同身份标识,构建所述用户身份标识信息知识图谱;基于所述身份标识信息知识图谱识别所述用户不同身份标识的所有关联人;提取所述所有关联人对所述用户的标签数据。
其中,所述不同身份标识可包括用户的通讯网号码、身份号码、设备号码、社交账号。
其中,所述输入模块,进一步包括:用于利用所述用户身份标识信息知识图谱获取所述当前用户信息数据。
其中,输入模块进一步可用于获取所述当前用户至少一个身份标识;使用所述用户身份标识信息知识图谱识别所述当前用户全部身份标识;提取所述当前用户全部身份标识的关联人对所述当前用户的标签数据。
其中,本发明的用户职业标签生成装置,还可用于设置职业分类与职业标签的映射关系表;使用所述映射关系表,依据所述当前用户职业分类建立所述当前用户职业标签。
本发明的用户职业标签生成装置,还包括:所述机器学习的方法进一步可包括神经网络模型。
下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
图4是本发明的用户职业标签生成电子设备的结构框架示意图。下面参照图4来描述根据本发明该实施例的的电子设备400。图4显示的电子设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400以通用计算设备的形式表现。电子设备400 的组件可以包括但不限于:至少一个处理单元410、至少一个存储单元420、连接不同***组件(包括存储单元420和处理单元410)的总线430、显示单元440等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元410执行,使得所述处理单元410执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元410可以执行如图1所示的步骤。
所述存储单元420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)4201和/或高速缓存存储单元4202,还可以进一步包括只读存储单元(ROM)4203。
所述存储单元420还可以包括具有一组(至少一个)程序模块4205的程序/实用工具4204,这样的程序模块4205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备400也可以与一个或多个外部设备500(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备400 交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口450进行。并且,电子设备400还可以通过网络适配器460与一个或者多个网络(例如局域网(LAN),广域网 (WAN)和/或公共网络,例如因特网)通信。网络适配器460可以通过总线430与电子设备400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是 CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。当所述计算机程序被一个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法,即:获取用户信息数据,所述用户信息数据包括所述用户的关联人对所述用户的标签数据以及所述用户的职业分类信息数据;采用机器学习的方法训练所述用户信息数据,构建用户职业分类预测模型;获取当前用户信息数据,所述当前用户信息数据包括所述当前用户的关联人对所述当前用户的标签数据;将所述当前用户信息代入所述用户职业预测模型,预测所述当前用户职业分类;基于所述当前用户职业分类,生成所述当前用户职业标签物。
所述计算机程序可以存储于一个或多个计算机可读介质上,如图5所示。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM 或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如 Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用户职业标签生成方法,其特征在于,包括:
以用户为节点,所述用户间的关系为边,整合所述用户不同身份标识,构建所述用户身份标识信息知识图谱;基于所述身份标识信息知识图谱识别所述用户不同身份标识的关联人;提取所述关联人对所述用户的标签数据;利用所述用户身份标识信息知识图谱获取用户信息数据;所述用户信息数据至少包括所述用户的关联人对所述用户的标签数据以及所述用户的职业分类信息数据;
以平台中职业信息完善的历史用户信息数据作为训练样本训练神经网络模型,样本至少包括样本用户的关联人对用户的标签数据和职业分类信息数据,基于用户的职业分类信息数据调整神经网络模型自身的网络结构,构建用户职业分类预测模型;
利用所述用户身份标识信息知识图谱获取当前用户信息数据,所述当前用户信息数据至少包括所述当前用户的关联人对所述当前用户的标签数据,对同一个用户多个标签数据同时出现进行统计分析;其中,获取所述当前用户至少一个身份标识,使用所述用户身份标识信息知识图谱识别所述当前用户全部身份标识并提取所述当前用户全部身份标识的关联人对所述当前用户的标签数据;
将所述当前用户信息数据代入所述用户职业分类预测模型,预测所述当前用户职业分类,其中,用户职业分类预测模型中输入数据为用户关联人对用户的标签数据,输出数据为用户职业;
基于所述当前用户职业分类,生成所述当前用户职业标签。
2.如权利要求1所述的方法,其特征在于,还包括:
所述不同身份标识包括用户的通讯网号码、身份号码、设备号码、社交账号。
3.如权利要求1所述的方法,其特征在于,进一步包括:
设置职业分类与职业标签的映射关系表;
使用所述映射关系表,依据所述当前用户职业分类建立所述当前用户职业标签。
4.如权利要求1-3任一项所述的方法,其特征在于,神经网络模型还包括:
输入层、隐藏层、输出层,各层神经网络包括至少一个神经元,向输入层神经元输入数据后经过激活函数对数据做转换,最终得到一个输出结果。
5.一种用户职业标签生成装置,其特征在于,包括:
数据获取模块,包括:用于以用户为节点,所述用户间的关系为边,整合所述用户不同身份标识,构建所述用户身份标识信息知识图谱;基于所述身份标识信息知识图谱识别所述用户不同身份标识的关联人;提取所述关联人对所述用户的标签数据;利用所述用户身份标识信息知识图谱获取用户信息数据;所述用户信息数据至少包括所述用户的关联人对所述用户的标签数据以及所述用户的职业分类信息数据;
模型构建模块,用于采用机器学***台中职业信息完善的历史用户信息数据作为训练样本训练神经网络模型,样本至少包括样本用户的关联人对用户的标签数据和职业分类信息数据,基于用户的职业分类信息数据调整神经网络模型自身的网络结构,构建用户职业分类预测模型;
输入模块,用于利用用户身份标识信息知识图谱获取当前用户信息数据,输入当前用户信息数据,所述当前用户信息数据至少包括所述当前用户的关联人对所述当前用户的标签数据,对同一个用户多个标签数据同时出现进行统计分析;其中,获取所述当前用户至少一个身份标识,使用所述用户身份标识信息知识图谱识别所述当前用户全部身份标识,并提取所述当前用户全部身份标识的关联人对所述当前用户的标签数据;
模型使用模块,用于将所述当前用户信息数据代入所述用户职业分类预测模型,预测所述当前用户职业分类,其中,用户职业分类预测模型中输入数据为用户关联人对用户的标签数据,输出数据为用户职业;
标签生成模块,用于基于所述当前用户职业分类,生成所述当前用户职业标签。
6.如权利要求5所述的装置,其特征在于,还包括:
所述不同身份标识包括用户的通讯网号码、身份号码、设备号码、社交账号。
7.如权利要求5所述的装置,其特征在于,所述用户职业标签生成装置,进一步包括:
用于设置职业分类与职业标签的映射关系表;
使用所述映射关系表,依据所述当前用户职业分类建立所述当前用户职业标签。
8.如权利要求5-7任一项所述的装置,其特征在于,还包括:
所述机器学习的方法进一步包括神经网络模型。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-4中任一项所述的方法。
CN201910921669.7A 2019-09-27 2019-09-27 一种用户职业标签生成方法、装置和电子设备 Active CN110782128B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910921669.7A CN110782128B (zh) 2019-09-27 2019-09-27 一种用户职业标签生成方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910921669.7A CN110782128B (zh) 2019-09-27 2019-09-27 一种用户职业标签生成方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN110782128A CN110782128A (zh) 2020-02-11
CN110782128B true CN110782128B (zh) 2024-03-29

Family

ID=69384600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910921669.7A Active CN110782128B (zh) 2019-09-27 2019-09-27 一种用户职业标签生成方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN110782128B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016855B (zh) * 2020-10-22 2021-09-24 北京淇瑀信息科技有限公司 基于关系网匹配的用户行业识别方法、装置和电子设备
CN115346028A (zh) * 2022-08-17 2022-11-15 支付宝(杭州)信息技术有限公司 虚拟环境主题处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412910A (zh) * 2013-08-02 2013-11-27 北京小米科技有限责任公司 一种建立标签库及搜索用户的方法和装置
CN109002490A (zh) * 2018-06-26 2018-12-14 腾讯科技(深圳)有限公司 用户画像生成方法、装置、服务器及存储介质
CN109816520A (zh) * 2019-01-28 2019-05-28 北京三快在线科技有限公司 职业属性预测方法、装置、设备及存储介质
CN110110213A (zh) * 2018-01-24 2019-08-09 腾讯科技(深圳)有限公司 挖掘用户职业的方法、装置、计算机可读存储介质和终端设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930934B (zh) * 2016-04-27 2018-08-14 第四范式(北京)技术有限公司 展示预测模型的方法、装置及调整预测模型的方法、装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412910A (zh) * 2013-08-02 2013-11-27 北京小米科技有限责任公司 一种建立标签库及搜索用户的方法和装置
CN110110213A (zh) * 2018-01-24 2019-08-09 腾讯科技(深圳)有限公司 挖掘用户职业的方法、装置、计算机可读存储介质和终端设备
CN109002490A (zh) * 2018-06-26 2018-12-14 腾讯科技(深圳)有限公司 用户画像生成方法、装置、服务器及存储介质
CN109816520A (zh) * 2019-01-28 2019-05-28 北京三快在线科技有限公司 职业属性预测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110782128A (zh) 2020-02-11

Similar Documents

Publication Publication Date Title
CN110070391B (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN112015859B (zh) 文本的知识层次抽取方法及装置、计算机设备及可读介质
CN112348660B (zh) 生成风险警示信息的方法、装置及电子设备
CN112507628B (zh) 基于深度双向语言模型的风险预测方法、装置和电子设备
CN110909165A (zh) 数据处理方法、装置、介质及电子设备
US9953029B2 (en) Prediction and optimized prevention of bullying and other counterproductive interactions in live and virtual meeting contexts
US11238132B2 (en) Method and system for using existing models in connection with new model development
CN110335140B (zh) 基于社交关系预测贷款黑中介的方法、装置、电子设备
CN110347840A (zh) 投诉文本类别的预测方法、***、设备和存储介质
CN112348662B (zh) 基于用户职业预测的风险评估方法、装置和电子设备
CN111181757B (zh) 信息安全风险预测方法、装置以及计算设备、存储介质
CN112016855B (zh) 基于关系网匹配的用户行业识别方法、装置和电子设备
CN111178701B (zh) 一种基于特征衍生技术的风险控制方法方法、装置和电子设备
CN111582645B (zh) 基于因子分解机的app风险评估方法、装置和电子设备
CN111179055B (zh) 授信额度调整方法、装置和电子设备
CN110782128B (zh) 一种用户职业标签生成方法、装置和电子设备
CN111178687A (zh) 金融风险分类方法、装置及电子设备
CN111191677B (zh) 用户特征数据生成方法、装置及电子设备
CN111199421B (zh) 一种基于社交关系的用户推荐方法、装置及电子设备
CN114398465A (zh) 互联网服务平台的异常处理方法、装置和计算机设备
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
CN111582649B (zh) 基于用户app独热编码的风险评估方法、装置和电子设备
CN112488865A (zh) 基于金融时间节点的金融风险预测方法、装置和电子设备
CN112749238A (zh) 搜索排序方法、装置、电子设备以及计算机可读存储介质
CN110910905B (zh) 静音点检测方法及装置、存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant