CN113065069B - 一种基于数据画像的双向就业推荐方法和装置 - Google Patents

一种基于数据画像的双向就业推荐方法和装置 Download PDF

Info

Publication number
CN113065069B
CN113065069B CN202110430318.3A CN202110430318A CN113065069B CN 113065069 B CN113065069 B CN 113065069B CN 202110430318 A CN202110430318 A CN 202110430318A CN 113065069 B CN113065069 B CN 113065069B
Authority
CN
China
Prior art keywords
information
user
data
portrait
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110430318.3A
Other languages
English (en)
Other versions
CN113065069A (zh
Inventor
钱进
赵静
于秋波
巫双果
刘坤
杨栋
张龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dareway Software Co ltd
Original Assignee
Dareway Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dareway Software Co ltd filed Critical Dareway Software Co ltd
Priority to CN202110430318.3A priority Critical patent/CN113065069B/zh
Publication of CN113065069A publication Critical patent/CN113065069A/zh
Application granted granted Critical
Publication of CN113065069B publication Critical patent/CN113065069B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于数据推荐领域,提供了一种基于数据画像的双向就业推荐方法和装置。其中,该方法包括获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。

Description

一种基于数据画像的双向就业推荐方法和装置
技术领域
本发明属于数据推荐领域,尤其涉及一种基于数据画像的双向就业推荐方法和装置。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
就业推荐***的出现是为了帮助求职者和企业从海量繁杂的数据中快速而准确地获取所需的内容,主要算法有基于内容的算法和协同过滤算法。基于内容的算法是基于求职者的注册信息进行的推荐;而协同过滤算法是根据求职者的相似群体或者原有的岗位投递获取匹配的岗位信息,而后进行推荐。
本发明人发现,以上的所提的相关算法并没有考虑到以下两个问题:第一个问题,求职者对岗位的要求并不是一成不变的,它会随着时间的变化而变化;当变化发生时,基于原注册信息或原相似群体产生的推荐对于求职者而言就是一些冗余信息。第二个问题,人资的偏好会对求职者能否得到面试邀请产生一定的影响。人是有主观性的生命,这不可避免地将自己的偏好带入到工作中,导致以下的现象产生:即使岗位与求职者双方十分契合,但简历依旧可能过不了人资的筛选。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于数据画像的双向就业推荐方法及***,其通过建立用户和岗位的数据画像,实现用户到岗位、以及岗位到用户双向的精准的个性化推荐,满足用户和企业的双向需求。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于数据画像的双向就业推荐方法。
一种基于数据画像的双向就业推荐方法,包括:
获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;
基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;
根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。
本发明的第二个方面提供一种基于数据画像的双向就业推荐装置。
一种基于数据画像的双向就业推荐装置,其包括:
数据获取模块,其用于获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;
画像刻画模块,其用于基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;
关联模块,其用于根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于数据画像的双向就业推荐方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于数据画像的双向就业推荐方法中的步骤。
与现有技术相比,本发明的有益效果是:
(1)本发明所属内容通过数据画像显示地展现用户和岗位的基本信息和偏好信息,强化了推荐结果的可解释性,降低了用户和岗位匹配度的计算量。
(2)本发明通过分析人资的行为数据,挖掘岗位的偏好,实现对岗位的个性化推荐,降低求职者的投递风险,减少人资筛选简历的时间。
(3)本发明考虑了基本信息和行为信息的占比对推荐结果的影响,通过计算基本信息和行为信息的权值,挖掘数据画像的兴趣偏向。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例的一种基于数据画像的双向就业推荐方法流程图;
图2是本发明实施例的一种基于数据画像的双向就业推荐装置的构成;
图3是本发明实施例的一种基于数据画像的双向就业推荐装置的业务流程构建过程。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
如图1所示,本实施例提供了一种基于数据画像的双向就业推荐方法,其包括:
步骤1:获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息。
在具体实施中,用户数据包括用户的基本信息及用户行为信息。这些信息分为结构信息和非结构信息,其中结构信息包括姓名、年龄、性别、工作年限、薪资、学历,需要对这些进行清洗、去重,并利用注册用户的同属性均值对缺失值进行补充;同时对用户的非结构信息(其中,非结构信息包括自我评价、兴趣爱好、备注等短文本信息)进行分词和去停用词处理,获取关键词。
岗位信息也包括岗位的基本信息及岗位行为信息。这些信息分为结构信息和非结构信息,其中结构信息包括年龄、性别、工作年限、学历的要求以及薪资,需要对这些进行清洗、去重,并同类型岗位的同属性均值对缺失值进行补充;同时对岗位的非结构信息(其中,非结构信息包括岗位描述文本和所属企业的描述文本等)进行分词和去停用词处理,获取关键词。
其中,日志数据包括XML消息日志和行为数据;
暂时保存个人(包括用户和人资)通过浏览、点击、收藏、分享、简历投递(面试邀请)等操作产生的XML消息日志;
统计个人对各个标签的不同操作以及相应的次数、时长,保存为行为数据。
步骤2:基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像。
其中,标签包括年龄、性别、工作年限、薪资、学历、行业类型、企业类型、爱好、品质;
根据不同的标签以及数据源,定义相应的计算任务,每一个计算任务中包含对数据的预处理,计算和整合操作。对于基本标签中的年龄、性别、工作年限、薪资、学历的属性,主要是直接获取用户或岗位的基本信息数据;对于基本标签中的行业类型、企业类型、爱好、品质的属性,主要是利用word2vec和支持向量机对用户或岗位的关键词进行相应的类别预测。对浏览、点击、收藏、分享、简历投递(面试邀请)等操作设置不同的权重;对于以产生的行为标签设置时间权重,该标签出现的时间越久远影响越弱。
步骤3:根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。
在具体实施中,用户和岗位画像的匹配度为用户画像和岗位画像的相似度的e指数的倒数;其中,用户画像和岗位画像的相似度利用欧式距离计算得到。
基本信息及行为信息的权值由基本信息和行为信息的相似度决定。
当基本信息和行为信息的相似度为1时,基本信息及行为信息的权值均为0.5。当基本信息和行为信息的相似度不为1时,如果基本信息包含的信息量多于行为信息包含的信息量,则行为信息的权重为基本信息与行为信息的差值的2范数的平方的e指数的倒数。当基本信息和行为信息的相似度不为1时,如果基本信息包含的信息量多于行为信息包含的信息量,则基本信息的权重为基本信息与行为信息的差值的2范数的平方的e指数的倒数。
具体地,对基本信息和行为信息分别进行归一化处理,而后计算权值,并将其分别与相应的基本信息和行为信息进行相乘,生成偏重不同的数据画像;计算公式如下:
对基本信息b进行归一化处理:
Figure GDA0004017413660000061
对行为信息h进行归一化处理,处理后的行为信息表示为:
Figure GDA0004017413660000062
计算基本信息和行为信息的相似度s:
Figure GDA0004017413660000063
若s=1,表示基本信息和行为信息相同,则wb=wh=0.5;
若s≠1,表示基本信息和行为信息存在包含不同的信息,则考虑基本信息和行为信息的信息量N对数据画像的影响:
如果基本信息包含的信息量多于行为信息的,即Nb>Nh,则
Figure GDA0004017413660000071
Figure GDA0004017413660000072
如果基本信息包含的信息量少于行为信息的,即Nb<Nh,则
Figure GDA0004017413660000073
Figure GDA0004017413660000074
则基本信息为:
Figure GDA0004017413660000075
行为信息为
Figure GDA0004017413660000076
匹配模块1072:用于计算用户和岗位之间的匹配度,生成候选推荐列表;匹配度m的计算公式如下:
利用欧式距离计算用户画像和岗位画像的相似度s:
Figure GDA0004017413660000077
其中,p表示岗位,u表示用户;
则匹配度表示为m=e-s
本实施例的基于数据画像的双向就业推荐方法,通过建立用户和岗位的数据画像,实现了用户到岗位、以及岗位到用户双向的精准的个性化推荐,满足了用户和企业的双向需求。
实施例二
如图2和图3所示,本实施例提供了一种基于数据画像的双向就业推荐装置,其包括:
(1)数据获取模块,其用于获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息。
在本实施例中,数据获取模块包括用户数据模块101、岗位数据模块102,日志模块103。
其中,用户数据模块101:主要负责处理和保存用户的基本信息,用户数据模块101通过用户数据清理模块1011、用户数据存储模块1012共同完成;其中,
用户数据清理模块1011:用于对用户的结构信息(包括姓名、年龄、性别、工作年限、薪资、学历)进行清洗、去重,并利用注册用户的同属性均值对缺失值进行补充;同时对用户的非结构信息(包括自我评价、兴趣爱好、备注等短文本信息)进行分词和去停用词处理,获取关键词;
用户数据存储模块1012:用于保存用户的基本信息(结构信息和关键词)。
岗位数据模块102:主要负责处理和保存岗位的基本信息,岗位数据模块102通过岗位数据清理模块1021、岗位数据存储模块1022共同完成;其中,
岗位数据清理模块1021:用于对岗位的结构信息(包括对年龄、性别、工作年限、学历的要求以及薪资)进行清洗、去重,并同类型岗位的同属性均值对缺失值进行补充,获取岗位基本信息;并对岗位的非结构信息(包括岗位描述文本和所属企业的描述文本等)进行分词和去停用词处理,获取关键词;
岗位数据存储模块1022:用于保存岗位的基本信息(结构信息和关键词)。
日志模块103:主要负责保存和处理XML消息日志,同时统计和保存个人(包括用户和人资)的行为数据,日志模块103通过日志保存模块1031、日志处理模块1032共同完成;其中,
日志保存模块1031:用于暂时保存个人(包括用户和人资)通过浏览、点击、收藏、分享、简历投递(面试邀请)等操作产生的XML消息日志;
日志处理模块1032:用于处理和分析XML消息日志,统计个人对各个标签的不同操作以及相应的次数、时长,保存为行为数据,并将该数据导入用户模块或岗位模块。
(2)画像刻画模块,其用于基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像。
在本实施例中,画像刻画模块包括画像标签模块104,用户模块105,岗位模块106。
画像标签模块104:主要负责定义画像标签的数据模型,定义在不同数据源情况下,相应标签的计算任务,画像标签模块104通过标签定义模块1041、标签计算模块1042共同完成;其中,
标签定义模块1041:用于定义标签的数据模型,以及标签的可解释性含义(如标签名或标签含义解释),所述标签包括年龄、性别、工作年限、薪资、学历、行业类型、企业类型、爱好、品质;
标签计算模块1042:根据不同的标签以及数据源,定义相应的计算任务,每一个计算任务中包含对数据的预处理,计算和整合操作。对于基本标签中的年龄、性别、工作年限、薪资、学历的属性,主要是直接获取用户或岗位的基本信息数据;对于基本标签中的行业类型、企业类型、爱好、品质的属性,主要是利用word2vec和支持向量机对用户或岗位的关键词进行相应的类别预测。对浏览、点击、收藏、分享、简历投递(面试邀请)等操作设置不同的权重;对于以产生的行为标签设置时间权重,该标签出现的时间越久远影响越弱。
用户模块105:主要负责生成用户的基本标签和行为标签,进而获取用户画像,用户模块105由用户基本标签模块1051、用户行为标签模块1052、用户画像模块1053共同完成;其中,
用户基本标签模块1051:用于接收用户数据模块101导入的数据,并根据画像标签模块104导入的标签计算任务,生成用户的基本标签;
用户行为标签模块1052:用于接收日志模块103导入的用户行为数据,并根据画像标签模块104导入的标签计算任务,生成用户的行为标签;
用户画像模块1053:用于保存用户的基本标签和行为标签,即为用户画像。
岗位模块106:主要负责生成岗位的基本标签和行为标签,进而获取岗位画像,岗位模块106通过岗位基本标签模块1061、岗位行为标签模块1062、岗位画像模块1063共同完成;其中,
岗位基本标签模块1061:用于接收岗位数据模块102导入的数据,并根据画像标签模块104导入的标签计算任务,生成岗位的基本标签;
人资行为标签模块1062:用于接收日志模块103导入的人资行为信息,并根据画像标签模块104导入的标签计算任务,生成人资行为标签;
岗位画像模块1063:用于保存岗位的基本标签和人资行为标签,即为岗位画像。
(3)关联模块107,其用于根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。
在本实施例中,关联模块107:主要负责计算基本信息和行为信息的权值,而后计算用户和岗位画像的匹配度,并根据行为标签进行排序,生成推荐列表,关联模块107通过权值模块1071、匹配模块1072、推荐模块1073共同完成;其中,
权值模块1071:用于对基本信息和行为信息分别进行归一化处理,而后计算权值,并将其分别与相应的基本信息和行为信息进行相乘,生成偏重不同的数据画像;计算公式如下:
对基本信息b进行归一化处理:
Figure GDA0004017413660000111
对行为信息h进行归一化处理,处理后的行为信息表示为:
Figure GDA0004017413660000112
计算基本信息和行为信息的相似度s:
Figure GDA0004017413660000113
若s=1,表示基本信息和行为信息相同,则wb=wh=0.5;
若s≠1,表示基本信息和行为信息存在包含不同的信息,则考虑基本信息和行为信息的信息量N对数据画像的影响:
如果基本信息包含的信息量多于行为信息的,即Nb>Nh,则
Figure GDA0004017413660000114
Figure GDA0004017413660000115
如果基本信息包含的信息量少于行为信息的,即Nb<Nh,则
Figure GDA0004017413660000121
则基本信息为:
Figure GDA0004017413660000122
行为信息为
Figure GDA0004017413660000123
匹配模块1072:用于计算用户和岗位之间的匹配度,生成候选推荐列表;匹配度m的计算公式如下:
利用欧式距离计算用户画像和岗位画像的相似度S:
Figure GDA0004017413660000124
其中,p表示岗位,u表示用户;
则匹配度表示为m=e-s
推荐模块1073:根据用户或人资的权值较大的标签对候选推荐列表进行排序,生成推荐列表。
参照图3:基于数据画像的双向就业推荐装置的业务流程构建过程,包括以下步骤:
步骤201,处理和保存用户的信息;经1011用户数据清理模块对用户结构信息和非结构信息的处理,保存到1012用户数据存储模块,并发送到105用户模块用于生成基本标签;根据1031日志保存模块对用户日志的保存,经1032日志处理模块对其的处理和分析,并发送到105用户模块用于生成行为标签。
步骤202,接收101用户数据模块导入的数据,并根据104画像标签模块导入的标签计算任务,经1051用户基本标签模块生成用户的基本标签;接收103日志模块导入的用户行为数据,并104根据画像标签模块导入的标签计算任务,经1052用户行为标签模块生成用户的行为标签;经1053用户画像模块保存用户的基本标签和行为标签(即为用户画像),并发送到107关联模块用于生成推荐列表。
步骤203,处理和保存岗位的信息;经1021岗位数据清理模块对用户结构信息和非结构信息的处理,保存到1022岗位数据存储模块,并发送到106岗位模块用于生成基本标签;根据1031日志保存模块对人资日志的保存,经1032日志处理模块对其的处理和分析,并发送到106岗位模块用于生成行为标签。
步骤204,接收102岗位数据模块导入的用户数据,并根据104画像标签模块导入的标签计算任务,经1061岗位基本标签模块生成岗位的基本标签;接收103日志模块导入的人资行为数据,并104根据画像标签模块导入的标签计算任务,经1062人资行为标签模块生成人资的行为标签;经1063用户画像模块保存用户的基本标签和人资行为标签(即为岗位画像),并发送到107关联模块用于生成推荐列表。
步骤205,接收101用户数据模块导入的用户画像和102岗位数据模块导入的岗位画像,经1071权值模块、1072匹配模块、1073推荐模块生成推荐列表。
此处需要说明的是,本实施例的基于数据画像的双向就业推荐装置中的各个模块,与实施例一的基于数据画像的双向就业推荐方法中的步骤一一对应,其具体实施过程相同,此处不再累述。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于数据画像的双向就业推荐方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于数据画像的双向就业推荐方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于数据画像的双向就业推荐方法,其特征在于,包括:
获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;
基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;
根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表;
基本信息及行为信息的权值由基本信息和行为信息的相似度决定;
当基本信息和行为信息的相似度为1时,基本信息及行为信息的权值均为0.5;当基本信息和行为信息的相似度不为1时,如果基本信息包含的信息量多于行为信息包含的信息量,则行为信息的权重为基本信息与行为信息的差值的2范数的平方的e指数的倒数;当基本信息和行为信息的相似度不为1时,如果基本信息包含的信息量多于行为信息包含的信息量,则基本信息的权重为基本信息与行为信息的差值的2范数的平方的e指数的倒数。
2.如权利要求1所述的基于数据画像的双向就业推荐方法,其特征在于,用户和岗位画像的匹配度为用户画像和岗位画像的相似度的e指数的倒数;其中,用户画像和岗位画像的相似度利用欧式距离计算得到。
3.如权利要求1所述的基于数据画像的双向就业推荐方法,其特征在于,每一个计算任务中包含对数据的预处理,计算和整合操作。
4.一种基于数据画像的双向就业推荐装置,用于执行 如权利要求1所述的基于数据画像的双向就业推荐方法,其特征在于,包括:
数据获取模块,其用于获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;
画像刻画模块,其用于基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;
关联模块,其用于根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一项所述的基于数据画像的双向就业推荐方法中的步骤。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-3中任一项所述的基于数据画像的双向就业推荐方法中的步骤。
CN202110430318.3A 2021-04-21 2021-04-21 一种基于数据画像的双向就业推荐方法和装置 Active CN113065069B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110430318.3A CN113065069B (zh) 2021-04-21 2021-04-21 一种基于数据画像的双向就业推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110430318.3A CN113065069B (zh) 2021-04-21 2021-04-21 一种基于数据画像的双向就业推荐方法和装置

Publications (2)

Publication Number Publication Date
CN113065069A CN113065069A (zh) 2021-07-02
CN113065069B true CN113065069B (zh) 2023-02-28

Family

ID=76567276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110430318.3A Active CN113065069B (zh) 2021-04-21 2021-04-21 一种基于数据画像的双向就业推荐方法和装置

Country Status (1)

Country Link
CN (1) CN113065069B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113868529A (zh) * 2021-09-29 2021-12-31 平安银行股份有限公司 知识推荐方法、装置、电子设备及可读存储介质
CN116431902A (zh) * 2023-03-10 2023-07-14 青软创新科技集团股份有限公司 一种岗位推荐方法、计算设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710851A (zh) * 2018-12-27 2019-05-03 三盟科技股份有限公司 基于互联网模式下多源数据分析的就业推荐方法及***
CN110059923A (zh) * 2019-03-13 2019-07-26 平安科技(深圳)有限公司 岗位画像和简历信息的匹配方法、装置、设备及存储介质
CN110378731A (zh) * 2016-04-29 2019-10-25 腾讯科技(深圳)有限公司 获取用户画像的方法、装置、服务器及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11636409B2 (en) * 2019-07-30 2023-04-25 OLX Global B.V. Real-time recommendation systems and methods
CN112287215A (zh) * 2020-10-23 2021-01-29 山大地纬软件股份有限公司 一种智能就业推荐方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378731A (zh) * 2016-04-29 2019-10-25 腾讯科技(深圳)有限公司 获取用户画像的方法、装置、服务器及存储介质
CN109710851A (zh) * 2018-12-27 2019-05-03 三盟科技股份有限公司 基于互联网模式下多源数据分析的就业推荐方法及***
CN110059923A (zh) * 2019-03-13 2019-07-26 平安科技(深圳)有限公司 岗位画像和简历信息的匹配方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于协同过滤算法的个性化就业推荐***研究;李红卫;《通讯世界》;20200425(第04期);全文 *

Also Published As

Publication number Publication date
CN113065069A (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
CN108804512B (zh) 文本分类模型的生成装置、方法及计算机可读存储介质
CN105608477B (zh) 一种人物画像与职位匹配的方法及***
US20170185835A1 (en) Assisting people with understanding charts
CN107797982A (zh) 用于识别文本类型的方法、装置和设备
CN114648392B (zh) 基于用户画像的产品推荐方法、装置、电子设备及介质
CN113065069B (zh) 一种基于数据画像的双向就业推荐方法和装置
US11023503B2 (en) Suggesting text in an electronic document
CN115002200B (zh) 基于用户画像的消息推送方法、装置、设备及存储介质
CN110795568A (zh) 基于用户信息知识图谱的风险评估方法、装置和电子设备
WO2021155691A1 (zh) 用户画像生成方法、装置、存储介质及设备
US11599927B1 (en) Artificial intelligence system using deep neural networks for pairwise character-level text analysis and recommendations
CN113627797B (zh) 入职员工画像生成方法、装置、计算机设备及存储介质
US11640420B2 (en) System and method for automatic summarization of content with event based analysis
CN113868419B (zh) 基于人工智能的文本分类方法、装置、设备及介质
CN114387061A (zh) 产品推送方法、装置、电子设备及可读存储介质
CN110197188A (zh) 业务场景预测、分类的方法、***、设备和存储介质
US10922633B2 (en) Utilizing econometric and machine learning models to maximize total returns for an entity
CN113886691A (zh) 基于历史数据的智能推荐方法、装置、电子设备及介质
CN112990973A (zh) 线上店铺画像构建方法及***
CN114119136A (zh) 一种产品推荐方法、装置、电子设备和介质
CN114037545A (zh) 客户推荐方法、装置、设备及存储介质
CN110909768B (zh) 一种标注数据获取方法及装置
CN113327132A (zh) 多媒体推荐方法、装置、设备及存储介质
CN112287215A (zh) 一种智能就业推荐方法和装置
CN112818082A (zh) 评价文本推送方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant