CN116823203A - 一种基于ai大语言模型的招聘***及方法 - Google Patents
一种基于ai大语言模型的招聘***及方法 Download PDFInfo
- Publication number
- CN116823203A CN116823203A CN202310873093.8A CN202310873093A CN116823203A CN 116823203 A CN116823203 A CN 116823203A CN 202310873093 A CN202310873093 A CN 202310873093A CN 116823203 A CN116823203 A CN 116823203A
- Authority
- CN
- China
- Prior art keywords
- job
- recruitment
- post
- language model
- current task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007115 recruitment Effects 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000006870 function Effects 0.000 claims abstract description 59
- 239000013598 vector Substances 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 7
- 238000005520 cutting process Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000000903 blocking effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000012216 screening Methods 0.000 abstract description 5
- 230000004044 response Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000009191 jumping Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012821 model calculation Methods 0.000 description 2
- 238000005316 response function Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于AI大语言模型的招聘***及方法,将复杂功能拆分成多个单一功能的组合,使AI大语言模型的功能逻辑更清晰,提高了大语言模型的准确度;AI大语言模型采用需求中断判断和需求执行并行操作,降低了反馈时延。本发明适用于互联网招聘,分别在求职端和招聘端应用了AI大语言模型的文本理解、逻辑推理和文本生成技术与用户进行交互,实现求职和招聘的功能。求职端功能包括了劳动法规咨询、简历生成、岗位搜索、简历投递和自动应答。招聘端功能包括了劳动法规咨询、岗位生成、简历筛选、简历摘要和智能客服。本发明减少了求职和招聘环节中大量的人工工作,缩短了招聘周期,降低了互联网求职操作门槛。
Description
技术领域
本发明属于互联网招聘技术领域,具体涉及一种基于AI大语言模型的招聘***及方法。
背景技术
传统互联网招聘的方法是:招聘者在招聘平台上发布招聘岗位,求职者根据平台上的招聘信息投递简历,招聘者再根据投递过来的简历进行筛选,筛选出候选人后再进行多轮面试,最后完成招聘。在这个招聘流程中,招聘者需要做很多重复性工作,如一些热门岗位一天收到的简历就有上百份,让招聘者阅读几百份简历来筛选合适的人选,即费时又费力,同时在这样大的工作量下,也容易出现遗漏优秀人才的情况。
在传统互联网招聘流程中,求职者找工作要先完成一份简历,再在招聘平台上搜索意向岗位进行投递,然后等待面试机会。这一过程对于受过高等教育的人求职者来说相对容易,但对于部分蓝领求职者相对困难,他们往往无法较好的撰写自己的简历,无法进行岗位搜索,投递等一系列招聘平台的操作,这部分求职者便被传统互联网招聘平台排除在用户群体之外了。
传统的互联网招聘方法,在进入面试流程前,大部分招聘平台都是不提供求职者和招聘者直接交流渠道的,这使求职者无法进一步了解公司和岗位的情况,也无法让招聘者提前了解求职者。鉴于这种情况,有些招聘平台也提供了求职者和招聘者直接交流的渠道,但往往双方交流的很多问题是重复的,如“公司现在什么规模了?”,“公积金交多少比例?”,“双休还是单休?”,“你离职的原因是什么?”,“你多久可以入职?”,“业务忙的时候能不能接受加班?”等问题,会浪费用户很多时间去回复类似这种被重复问到的问题,如果能有一个智能的助手,替用户来回答这些问题,那无疑会节省大量时间和精力。
近几年来人工智能技术快速发展,尤其是强人工智能大语言模型的出现,正在给各行各业带来颠覆性的变化。大语言模型利用了深度学习和自然语言处理等技术,具备了海量的知识储备,在很多专业领域具有更高的效率和准确度。如何基于大语言模型提高了招聘***的效率,降低招聘***操作门槛,成为亟待解决的问题。
发明内容
为解决现有技术的不足,实现提高求职和招聘的效率的目的,本发明采用如下的技术方案:
一种基于AI大语言模型的招聘***,应用于服务器,所述服务器包括AI大语言模型(LLM,Large Language Model),从求职端/招聘端获取的文本信息中提取一组单一求职/招聘功能对应的单一需求,用于构建任务并执行,同时根据实时的求职端/招聘端的文本信息,判断当前任务是否中断,若当前任务执行完成前被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务,输出需求对应的求职/招聘功能实现,并反馈求职端/招聘端。
基于语言模型的功能,通过精简指令,尽可能单一的提取功能对应的需求,逆向的将复杂功能拆分成多个单一功能的组合,虽然文本有可能会被输入语言模型分析多次,增加了一定的算力,但降低了语言模型计算的逻辑复杂度,一定程度上也抵消了所消耗的算力,同时,多次的分析和更清晰的语言模型计算逻辑,提升了模型分析的收益,提高了语言模型的功能实现的准确度。另一方面,基于多轮对话获取的求职或招聘需求,往往可能在中途发生改变,采用需求中断判断和需求执行的并行操作,再基于判断结果确定是否反馈当前需求执行结果,通过消耗部分算力,换取求职端/招聘端反馈时延的降低。
进一步地,将劳动法规基于条例和单块文本量进行切割分块,对每块文本信息向量化;获取求职端/招聘端对劳动法规咨询的文本信息和场景信息,对文本信息向量化后与劳动法规的向量进行相似度比较,得到咨询的文本信息对应的劳动法规文本信息,所述AI大语言模型基于劳动法规文本信息与场景信息,生成求职端/招聘端咨询的解答信息。
由于劳动法规文本内容多,而越长的本文内容的处理,容易造成显存或内存溢出,因此需要对文本进行切割,而基于条例的切割能够保证每个文本块的内容是相对独立的,基于单块文本量的分块能够尽可能让切割的文本内容完整。基于向量的相似度匹配,能够在保持匹配精度的同时,降低文本信息匹配所需的计算量。
进一步地,根据求职端的岗位需求,执行岗位检索任务,并基于岗位分对检索出的岗位进行排序,岗位分公式如下:
score= co_s×co _w+sal_s×sal_w+tm_s×tm_w + rx_s×rx_w
其中,co_s表示岗位所属的单位分、sal_s表示薪酬分、tm_s表示时效分、rx_s表示简历投递分,co_w、sal_w、tm_w和rx_w分别为单位分、薪酬分、时效分、简历投递分的权重;
所述单位分,基于单位属性进行计分;
所述薪酬分,根据岗位在同类岗位中所处薪酬水平计分;
所述时效分,根据岗位发布的时间计分;
所述简历投递分,根据岗位需求简历的满足度计分,满足度=当前岗位简历被投递数量/岗位招聘人数,使得投递量少的岗位有更多机会展现在搜索结果的前面。
还可以引入岗位向量相似度匹配,将岗位信息的关键字段(如单位属性)进行向量化,对已投递的岗位对应的向量,基于向量相似度,调整最终排序。由于公司规模,公司福利,公司法律风险,办公地点交通便利程度内容较多,且相对抽象,统一的分配分值,较难反应不同求职者的需求,因此通过向量比较调整排序,可以弥补这一补足,更接近求职者潜意识的意向,且对求职者来说,各评分项之间可能存在一种相互妥协的关系,这种妥协后得到的配比,无法体现在分值上,且妥协的配比会随求职者浏览的简历发生变化,通过向量化配比影响最终排序,能够很好的适应这种妥协配比的波动,更好的匹配上求职者潜意识中想看到的岗位。从而进一步提高求职者岗位检索的命中率和岗位投递的成功率。
进一步地,对岗位分引入随机性,使用于排序的最终得分score_n服从正态分布:
,
其中,原得分score作为正态分布的均值,σ表示标准差,用于控制随机性。
对直接计算得到的岗位分进行排序,会使一些得分低的岗位一直没机会展示,通过在每次岗位搜索结果的排序中引入随机因素的方法,使得既让原得分高的岗位有更高的概率排前面,也使得得分低的岗位获得展现的机会。
进一步地,获取并基于求职端岗位搜索频次、浏览、投递情况,调节标准差σ;若岗位搜索频次超过频次阈值,且浏览的岗位超过上限阈值,但投递的岗位低于下限阈值,则增大标准差。
由于求职者通常根据搜索的岗位顺序进行浏览、投递,因此,基于一定的搜索和浏览,仍没有投递,说明求职者对排序中的岗位并不中意,此时,通过增加标准差,增大随机性,增加引入的低得分岗位。
进一步地,基于已投递岗位的单位属性、薪酬水平、发布时间、岗位需求简历的满足度,设定并更新一个用户偏好,用于调整公司分、薪酬分、时效分、简历投递分的权重。
基于求职者浏览、投递的潜意识行为,调整权重,提升求职者与岗位的匹配度。有些岗位的低得分或许是基于公司分中公司的规模较小、交通不便利,发布时效较长,投递需求满意度较大所致,但薪酬水平较高,而求职者可能潜意识里也更看中薪酬,则经用户偏好调整的岗位正好能够满足求职者的需求。
进一步地,基于已投递岗位的信息,设定并更新一个用户偏好岗位集,对岗位分引入随机性,对通过引入随机性而提升了排序的岗位,若该岗位在用户偏好岗位集中,则进行岗位排序提升,否则不进行岗位提升。从而使得引入随机性而提升排序的岗位,均为求职者偏好的岗位。
一种基于AI大语言模型的招聘***,应用于客户端,客户端包括求职端和/或招聘端;
发送用户的文本信息,以使服务端的AI大语言模型提取一组单一求职/招聘功能对应的单一需求,用于构建任务并执行,同时根据所述文本信息,持续判断当前任务是否中断,若被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务;
获取服务端输出的所述需求对应的求职/招聘功能实现的结果。
一种基于AI大语言模型的招聘方法,包括如下步骤:
步骤一:从求职端/招聘端获取的文本信息中提取一组单一求职/招聘功能对应的单一需求;
步骤二:基于单一需求,构建任务并执行,同时根据求职端/招聘端的文本信息,持续判断当前任务是否中断,若被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务,输出需求对应的求职/招聘功能实现结果;
步骤三:将功能实现结果反馈求职端/招聘端。
一种基于语言模型的***,应用于服务器:
从客户端获取的文本信息中提取一组单一功能对应的单一需求,用于构建任务并执行,同时根据客户端文本信息,持续判断当前任务是否中断,若被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务,输出需求对应的功能实现的结果,并反馈客户端。
本发明的优势和有益效果在于:
本发明的一种基于AI大语言模型的招聘***及方法,使用AI大语言模型作为整个招聘***的核心构件,通过精简指令,尽可能单一的提取功能对应的需求,降低了语言模型计算的逻辑复杂度,同时,多次的分析和更清晰的语言模型计算逻辑,提升了模型分析的收益,提高了语言模型的功能实现的准确度。采用需求中断判断和需求执行的并行操作,降低求职端/招聘端反馈时延,从而提高了求职和招聘的效率。
附图说明
图1是本发明实施例中***的框图。
图2为本发明实施例中的求职端界面示意图。
图3为本发明实施例中的岗位搜索功能流程图。
图4为本发明实施例中的简历筛选功能流程图。
图5是本发明实施例中方法流程图。
实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
如图1所示,一种基于AI大语言模型的招聘***,包括2个客户端:求职端和招聘端。客户端采用手机App实现,一个求职端界面设计如图2所示,招聘端界面与求职端的类似,包括内容显示界面、文本输入框及其对应的发送按钮,以及语音获取和发送按钮。用户用自然语言以聊天问答的形式和招聘***交互,既可以直接输入文本,也可以发送语音,***则通过语音识别技术,将语音识别转成文本再进行处理。***可以文本的方式返回结果,也可以用TTS(Text To Speech,从文本到语音)技术将文本转成语音后再返回给用户。为叙述方面,下文的阐述中不再每次都要专门涉及文本和语音的转换问题,用户和***的交互的自然语言默认包括语音。
本发明的实施例选用开源大语言模型MOSS作为预训练模型,再使用语料库对该模型进行微调训练,使其更适用本***的求职和招聘场景。微调训练采用LoRA(Low-RankAdaptation of Large Language Models)方法,降低了微调MOSS的硬件要求,缩短了微调时间。微调训练所用语料库是事先准备的求职和招聘相关文本素材,大部分以问答对话的方式呈现,尽可能覆盖到业务场景的各个方面。由于模型参数的数量高达160亿,占用的存储资源和运算资源很庞大,无法部署在终端,故模型部署在云端GPU服务器上。
本发明的实施例采用的关系型数据库采用MySql,向量数据库采用Qdrant。关系型数据库用于存储求职招聘信息,向量数据库存储了劳动法规知识库。
***后台的运行是围绕着与大语言模型的对话进行的,根据上下文场景,***把提示词(包括场景的自然语言描述以及对大语言模型发出的指令)和用户的文本输入大语言模型进行处理,大语言模型返回分析的结果,如有必要,***根据返回的结果调用相应的插件完成具体的功能执行,例如在岗位搜索流程中,大语言从求职者的输入文本中提取出岗位的搜索条件,提供给岗位搜索插件对岗位库进行搜索。
要完成用户的一个任务,往往需要多个回合的对话,具体到每个回合的交互,大语言模型的功能尽可能要单一,比较下面2个大语言模型的指令:“从求职者的输入文本中提取岗位搜索条件,包括岗位名称,工作地点,薪酬信息,并以json格式输出”和“从求职者输入的文本中分析他的需求,如果是岗位搜索需求则从文本中提取岗位搜索条件,包括岗位名称,工作地点,薪酬信息,并以json格式输出,如果是简历生成需求,则提取个人信息,包括姓名,出生年月,籍贯……(省略)”,前者指令简洁明了,要求完成的功能也单一明确,后者把多个单一功能合在一起,逻辑更复杂。实施例采用大语言模型精简指令的方法,把复杂功能拆分成多个单一功能的组合,这样用户输入的文本有可能会被输入大语言模型分析多次,多消耗一些算力,但是收益更明显,后台的功能逻辑更清晰,更进一步,更容易微调训练,提高了大语言模型的准确度。
求职或者招聘的某一个功能实现,往往需要与用户进行多轮对话来完成,而用户并非每次都走完当前流程,有可能中途有其他需求而中断当前流程,这种情况按正常处理步骤是:先判断用户输入了新任务中断了当前任务流程,然后,如果没被用户中断则大语言模型继续按原来流程的指令对用户文本进行分析,否则切入到新的任务流程。由于大语言模型对算力的要求往往很高,每次执行的时间至少需要几秒钟的时间,导致2个步骤先后执行的方式明显地延长了用户交互等待时间。为克服这一缺点,本实现例采用了双步骤异步并发的方法,伪代码如下:
Begin
Cur = Null
While 直到用户退出
把用户文本输入大语言模型进行判断是否用户提出了新任务(异步执行)①
If Cur ≠ Null
把用户文本输入大语言模型进行当前任务的流程操作(异步执行)②
Endif
等待步骤①和②的返回结果
If 根据①返回的结果是用户有新需求
终止当前任务,把新的任务赋给Cur
Else
继续当前任务,展示②执行结果给用户
End
在上述伪代码中,步骤①是分支判断,原本步骤②是要根据步骤①的结果才能判断是否需要执行,现在步骤②被提前到与步骤①一起并发执行,如果步骤②所在分支被命中,则能更快地返回执行结果,缩短了用户等待的时间。
本***求职端的功能包括:劳动法规咨询、简历生成、岗位搜索、简历投递、自动应答。招聘端的功能包括:劳动法规咨询、岗位生成、简历筛选、简历摘要、智能客服。
所述劳动法规咨询功能的实现方法:
首先要建立劳动法规知识库,方法步骤如下:
S1.收集整理相关劳动法规;
S2.根据条例和段落对法规文本进行切割分块;
S3.调用文本转向量插件将每块文本向量化,并将向量及对应的该块文本存入向量数据库,向量作为索引值;
越长的文本大语言模型处理得也越慢,更会造成OOM(显存或内存溢出),故大语言模型不能一次性分析所有的劳动法规,需事先对其切割分块。上述建立劳动法规知识库方法S2步骤中对劳动法规的切割分块方法的规则如下:
1.每块文本不超过2000字;
2.每块文本不超过1章;
3.如果1章超过2000字,则均匀分割该章,同时保证切割在节的边界。
第2条规则保证每个文本块的内容是相对独立的,第3条规则尽可能让切割的文本内容完整。
建立好劳动法规知识库后,就能进行劳动法规的咨询了,方法步骤如下:
S1.用户用自然语言表达劳动法规的咨询需求,并描述场景;
S2.大语言模型识别出用户的需求为劳动法规咨询后,***调用文本转向量插件对描述进行向量化;
S3.用步骤S2得到的向量对劳动法规知识库的向量数据库进行检索,找出文本向量和该向量余弦距离小于指定阈值的文本,表示该文本和用户的描述有较高的相关度。
S4.将步骤S3得到的文本和用户的场景描述一起输入大语言模型分析,得出解答或建议,用自然语言的方式展现给用户。
劳动法规知识库存储的向量数据库采用Qdrant,其也负责文本向量的相似度匹配搜索。求职端和招聘端使用同一个劳动法规知识库进行咨询。
简历生成功能实现的方法步骤如下:
S1.求职者用自然语言表达生成简历的需求;
S2.大语言模型通过语义理解识别出用户生成简历的需求后,查询数据库中个人信息和求职信息是否完整,如完整,则跳转到步骤S4,如不完整,则提示用户需要补充的信息;
S3.用户用自然语言补充自己的个人信息和求职信息,大语言模型解从对话中解析出这些信息,再存储到数据库中,跳转到步骤S2继续检查信息完整度;
S4.从数据库中获取用户完整的个人信息和求职信息,用这些信息作为参数,调用相关简历生成的功能插件生成简历。
简历生成的实现方法中的个人信息是指包括姓名,性别,出生年月,文化程度等需要在求职中需要被公开的个人情况。求职信息是指包括求职岗位,期望工作地,薪资要求等和求职相关的一些条件要求,进一步还包括工作经历,项目经验等描述性信息。生成的简历数据在***中是分字段存储在关系型数据库中,在数据库中表现为一条条的记录。用户可以选择模板生成简历,简历的模板是html格式的,调用简历生成插件把模板中相应字段替换成简历数据的对应字段就能实现简历的生成。简历生成后可进一步调用开源的ApachePOI,转换成常见的文档格式如word,pdf等格式导出。
岗位搜索功能的实现如图3所示,方法步骤如下:
S1.求职者用自然语言表达自己想找工作的需求;
S2.大语言模型判断出求职者的找工作需求后,提示其输入岗位搜索条件;
S3.用户用自然语言描述岗位搜索条件,大语言模型解从描述中解析出搜索条件;
S4.判断搜索条件是否充分,如不充分则提示,并跳转到步骤S3,让求职者进一步描述;
S5.根据大语言模型从求职者描述得到的搜索条件,从岗位库中匹配出若干符合度高的岗位给求职者。
岗位搜索功能实现方法中的岗位信息包括岗位名称,工作地,薪资水平,工作年限要求等字段。S2步骤中判断求职者的找工作需求,为了大语言模型能准确做出判断,设计该功能对应的语料时,尽可能用更多的表达方式,比如“我想找份工作”,“想在杭州找份保安工作”,“杭州,保安工作”,“找份保安工作,地点杭州,薪酬5000以上”等都是表达了找工作的需求。同样的,在设计其他用户需求判断时,也尽可能覆盖各种表达和语气,以期大语言模型在这一功能上达到更好的微调效果。S4步骤中所述的“必要的搜索条件”在本实现中是指岗位名称和工作地,其他的岗位信息字段都是可选的。岗位名称由于叫法不同,仅仅从文本匹配进行搜索容易遗漏,所以需进行同义词替换处理,如搜“清洁工”的岗位,也能搜查出名称为“保洁员”的岗位。
岗位搜索的结果数量往往很多,需要排序并分页展示,排在前面的岗位更容易获得关注和简历投递。岗位排序的依据是岗位分,其计算公式为:
score= co_s×co _w+sal_s×sal_w+tm_s×tm_w + rx_s×rx_w+pref_s×pref_w
岗位总分100分,分数由4部分构成,岗位所属的公司分(co_s),薪酬分(sal_s),时效分(tm_s),简历投递分(rx_s),每一部分满分为100分。co_w、sal_w、tm_w和rx_w分别是上述4个部分的得分权重,权重之和为1。公司分评估的要素有:公司规模,公司福利,公司法律风险,办公地点交通便利程度等,对这些因素综合评价得到公司的打分,这里不再累述。薪酬分是根据该岗位在同类岗位中所处水平来打分,薪酬越高分数越高,可设定达到平均薪酬2倍的得满分,平均薪酬0.5倍则得0分。时效分根据岗位发布的时间来计算,越是新发布的岗位该项得分越高,可设定发布时间在3天内的得满分,超过2个月的得0分。简历投递分是根据岗位需求简历的满足度来决定的,是指当前岗位简历被投递数量÷岗位招聘人数,这个值越大得分越低,可设定该值为0得分为1,该值大于等于10则得分为0,使得投递量少的岗位有更多机会展现在搜索结果的前面。
还可以引入岗位向量相似度匹配,将岗位信息的关键字段(如单位属性)进行向量化,对已投递的岗位对应的向量,基于向量相似度,调整最终排序。由于公司规模,公司福利,公司法律风险,办公地点交通便利程度内容较多,且相对抽象,统一的分配分值,较难反应不同求职者的需求,因此通过向量比较调整排序,可以弥补这一补足,更接近求职者潜意识的意向,且对求职者来说,各评分项之间可能存在一种相互妥协的关系,这种妥协后得到的配比,无法体现在分值上,且妥协的配比会随求职者浏览的简历发生变化,通过向量化配比影响最终排序,能够很好的适应这种妥协配比的波动,更好的匹配上求职者潜意识中想看到的岗位。从而进一步提高求职者岗位检索的命中率和岗位投递的成功率。
直接用上述公式计算得到的岗位分进行排序还会产生一个问题,就是有一些得分低的岗位会一直没机会展示,所以本发明实施例中,将岗位“得分高的排在前面”这一策略改成“得分高的有更大的概率排在前面”。实现这一策略的方法,是将原得分score引入随机性,使得分score_n服从正态分布,其中该正态分布的均值为score,标准差为σ。实现过程中,通过调节σ的大小来控制随机性,σ越大随机性越大。通过这种在每次岗位搜索结果的排序中引入随机因素方法获得score_n,score_n服从一个均值为score的正态分布,然后通过score_n的大小来排序,使得既让得分高的岗位有更高的概率排前面,也使得得分低的岗位获得展现的机会。
获取并基于求职端岗位搜索频次、浏览、投递情况,调节标准差σ;若岗位搜索频次超过频次阈值,且浏览的岗位超过上限阈值,但投递的岗位低于下限阈值,则增大标准差。
由于求职者通常根据搜索的岗位顺序进行浏览、投递,因此,基于一定的搜索和浏览,仍没有投递,说明求职者对排序中的岗位并不中意,此时,通过增加标准差,增大随机性,增加引入的低得分岗位。
基于已投递岗位的单位属性、薪酬水平、发布时间、岗位需求简历的满足度,设定并更新一个用户偏好,用于调整公司分、薪酬分、时效分、简历投递分的权重。
基于求职者浏览、投递的潜意识行为,调整权重,提升求职者与岗位的匹配度。有些岗位的低得分或许是基于公司分中公司的规模较小、交通不便利,发布时效较长,投递需求满意度较大所致,但薪酬水平较高,而求职者可能潜意识里也更看中薪酬,则经用户偏好调整的岗位正好能够满足求职者的需求。
基于已投递岗位的信息,设定并更新一个用户偏好岗位集,对岗位分引入随机性,对通过引入随机性而提升了排序的岗位,若该岗位在用户偏好岗位集中,则进行岗位排序提升,否则不进行岗位提升。从而使得引入随机性而提升排序的岗位,均为求职者偏好的岗位。
自动应答功能实现的方法步骤如下:
S1.用大语言模型判断问题的类型;
S2.如果是预设问题,则给出预设答案,完成本次应答;
S3.如果是个人信息问题,则调用数据库插件查找个人相关信息,给出答案,完成本次应答;
S4.如果问题是无法自动回答的,则把问题转给人工回答。
自动应答功能的实现步骤S1中,模型并不是一次性就能判断输入的问题类型,而是对2个问题类型进行分别甄别判断的,为了节省时间,这2次判断是同时并发输入给大语言模型的。步骤S2中的预设问题和预设答案,指的是求职者经常被问到的一些问题和答案,提前被输入***中。当被问询到某个问题时,大语言模型会判断是否是预设的问题,这个判断方法并不是指问题描述文本完全一致,而是问题含义的相似,如“你离职的原因是什么?”和“你为什么离职?”这两个问题可以认为是一样的,可以用同样的答案来回答。
岗位生成功能实现的方法步骤如下:
S1.用户用自然语言表达生成岗位需求;
S2.大语言模型判断出需求后,要求用户对岗位进行描述;
S3.用户描述岗位信息;
S4.大语言模型判断用户对岗位信息的描述是否完成,不完整则转步骤S3;
S5.岗位描述完成后,大语言模型将其进行重新组织成完整的条理通顺的岗位描述文本;
S6.询问用户是否发布,如得到肯定回答,则调用发布插件,发布岗位。
岗位生成所需字段包括岗位名称,工作地点,薪资,学历要求,岗位能力要求,岗位职责等。通过对话方式,招聘者完善这些字段信息,大语言模型再根据这些信息组成完整的岗位描述文本。对于非描述类的岗位字段处理比较简单,基本上是直接使用,但对于描述性字段如岗位能力要求和岗位职责需要进一步处理,主要因为用户为了方便可能只输入几个带有关键性信息的词,例如“3年Java 多线程 MVC框架”,大语言模型就需要根据这几个词组成通顺的岗位要求描述“3年以上Java开发经验,熟悉多线程编程,精通MVC框架”。为了加强大语言模型在岗位生成方面的能力,我们收集了大量覆盖各个行业的岗位描述文本作为素材对大语言模型MOSS进行了微调训练。我们把岗位文本素材中的句子进行分词,去掉高频词后,留下的低频词即为携带信息量更大的关键词,作为微调训练的输入,把原文作为微调的输出比对目标(Label),这一方法节省了人工提取关键词制作岗位生成语料库的工作量。
简历筛选功能的实现,如图4所示,方法步骤如下:
S1.查找投递指定岗位的简历投递库,如果未处理的简历数为0,则结束退出;
S2.从岗位投递库中取出一份未处理简历;
S3.根据岗位的硬性条件要求,对比当前简历的相关字段,如不符合条件,则把该简历标记为已处理,放弃该简历,跳转到步骤S1;
S4.把岗位描述和简历中描述性字段如教育经历,工作经历,项目经验等输入大语言模型并要求为两者的匹配度打分;
S5.岗位描述和简历中描述性字段的匹配得分大于阈值则通过该简历,否则淘汰该简历,并标记该简历为已处理。返回到步骤S1。
所处简历筛选功能实现中S3步骤的硬性条件,具体指的是可以进行简单逻辑比较的条件,比如学历,工作年限,等字段,通过这些字段可以在关系型数据库中方便地进行搜索到结果。对于无法直接进行比较的描述性信息,通过大语言模型进行理解,进行匹配度打分。
简历摘要功能:自动对简历进行分析和输出摘要。方法步骤如下:
S1.用纯自然语言写出指令文本,该指令文本用于提取简历摘要,进一步,可写上提取摘要时的要求;
S2.抽取简历的各个字段要素,拼接成一段纯文本,将该段纯文本拼接在步骤S1的指令文本后;
S3.把拼接好的文本输入给大语言模型,大语言模型输出该简历的摘要。
输出简历摘要,重点针对简历中文本篇幅比较长的工作经历和项目经验部分,大语言模型对这些文本进行浓缩提炼,突出简历的亮点部分。步骤S1中,提取摘要的指令可附加要求,例如:“只保留最近1份工作经历”、“忽略项目经验”等。
智能客服功能实现的方法步骤如下:
S1.用大语言模型判断问题的类型;
S2.如果是预设问题,则给出预设答案,完成本次应答;
S3.如果是公司或者岗位的相关问题,则调用数据库插件查找公司和岗位信息,给出答案,完成本次应答;
S4.如果问题是无法自动回答的,则把问题转给人工回答。
智能客服功能的实现步骤S1中,模型并不是一次性就能判断输入的问题类型,而是对2个问题类型进行分别甄别判断的,为了节省时间,这2次判断是同时并发输入给大语言模型的。步骤S2中的预设问题和预设答案,指的是招聘者经常被问到的一些问题和答案,提前被输入***中。当被问询到某个问题时,大语言模型会判断是否是预设的问题,这个判断方法并不是指问题描述文本完全一致,而是问题含义的相似,如“公司现在有多少人?”和“公司目前的人员规模如何?”这两个问题可以认为是一样的,可以用同样的答案来回答。
一种基于AI大语言模型的招聘***,应用于客户端,客户端包括求职端和/或招聘端;
发送用户的文本信息,以使服务端的AI大语言模型提取一组单一求职/招聘功能对应的单一需求,用于构建任务并执行,同时根据所述文本信息,持续判断当前任务是否中断,若被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务;
获取服务端输出的所述需求对应的求职/招聘功能实现的结果。
如图5所示,一种基于AI大语言模型的招聘方法,包括如下步骤:
步骤一:从求职端/招聘端获取的文本信息中提取一组单一求职/招聘功能对应的单一需求;
步骤二:基于单一需求,构建任务并执行,同时根据求职端/招聘端的文本信息,持续判断当前任务是否中断,若被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务,输出需求对应的求职/招聘功能实现结果;
步骤三:将功能实现结果反馈求职端/招聘端。
一种基于语言模型的***,应用于服务器,从客户端获取的文本信息中提取一组单一功能对应的单一需求,用于构建任务并执行,同时根据客户端文本信息,持续判断当前任务是否中断,若被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务,输出需求对应的功能实现的结果,并反馈客户端。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。
Claims (10)
1.一种基于AI大语言模型的招聘***,应用于服务器,其特征在于:所述服务器包括AI大语言模型,从求职端/招聘端获取的文本信息中提取一组单一求职/招聘功能对应的单一需求,用于构建任务并执行,同时根据实时的求职端/招聘端的文本信息,判断当前任务是否中断,若当前任务执行完成前被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务,输出需求对应的求职/招聘功能实现,并反馈求职端/招聘端。
2.根据权利要求1所述的一种基于AI大语言模型的招聘***,其特征在于:将劳动法规基于条例和单块文本量进行切割分块,对每块文本信息向量化;获取求职端/招聘端对劳动法规咨询的文本信息和场景信息,对文本信息向量化后与劳动法规的向量进行相似度比较,得到咨询的文本信息对应的劳动法规文本信息,所述AI大语言模型基于劳动法规文本信息与场景信息,生成求职端/招聘端咨询的解答信息。
3.根据权利要求1所述的一种基于AI大语言模型的招聘***,其特征在于:根据求职端的岗位需求,执行岗位检索任务,并基于岗位分对检索出的岗位进行排序,岗位分公式如下:
score= co_s×co_w+sal_s×sal_w+tm_s×tm_w + rx_s×rx_w
其中,co_s表示岗位所属的单位分、sal_s表示薪酬分、tm_s表示时效分、rx_s表示简历投递分,co_w、sal_w、tm_w和rx_w分别为单位分、薪酬分、时效分、简历投递分的权重;
所述单位分,基于单位属性进行计分;
所述薪酬分,根据岗位在同类岗位中所处薪酬水平计分;
所述时效分,根据岗位发布的时间计分;
所述简历投递分,根据岗位需求简历的满足度计分,满足度=当前岗位简历被投递数量/岗位招聘人数。
4.根据权利要求3所述的一种基于AI大语言模型的招聘***,其特征在于:对岗位分引入随机性,使用于排序的最终得分score_n服从正态分布:
,
其中,原得分score作为正态分布的均值,σ表示标准差,用于控制随机性。
5.根据权利要求4所述的一种基于AI大语言模型的招聘***,其特征在于:获取并基于求职端岗位搜索频次、浏览、投递情况,调节标准差σ;若岗位搜索频次超过频次阈值,且浏览的岗位超过上限阈值,但投递的岗位低于下限阈值,则增大标准差。
6.根据权利要求3所述的一种基于AI大语言模型的招聘***,其特征在于:基于已投递岗位的单位属性、薪酬水平、发布时间、岗位需求简历的满足度,设定并更新一个用户偏好,用于调整公司分、薪酬分、时效分、简历投递分的权重。
7.根据权利要求3所述的一种基于AI大语言模型的招聘***,其特征在于:基于已投递岗位的信息,设定并更新一个用户偏好岗位集,对岗位分引入随机性,对通过引入随机性而提升了排序的岗位,若该岗位在用户偏好岗位集中,则进行岗位排序提升,否则不进行岗位提升。
8.一种基于AI大语言模型的招聘***,应用于客户端,其特征在于:客户端包括求职端和/或招聘端;
发送用户的文本信息,以使服务端的AI大语言模型提取一组单一求职/招聘功能对应的单一需求,用于构建任务并执行,同时根据所述文本信息,持续判断当前任务是否中断,若被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务;
获取服务端输出的所述需求对应的求职/招聘功能实现的结果。
9.一种基于AI大语言模型的招聘方法,其特征在于包括如下步骤:
步骤一:从求职端/招聘端获取的文本信息中提取一组单一求职/招聘功能对应的单一需求;
步骤二:基于单一需求,构建任务并执行,同时根据求职端/招聘端的文本信息,持续判断当前任务是否中断,若被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务,输出需求对应的求职/招聘功能实现结果;
步骤三:将功能实现结果反馈求职端/招聘端。
10.一种基于语言模型的***,应用于服务器,其特征在于:
从客户端获取的文本信息中提取一组单一功能对应的单一需求,用于构建任务并执行,同时根据客户端文本信息,持续判断当前任务是否中断,若被新任务中断,则终止当前任务,并将新任务作为当前任务执行,否则,继续执行当前任务,输出需求对应的功能实现的结果,并反馈客户端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310873093.8A CN116823203A (zh) | 2023-07-17 | 2023-07-17 | 一种基于ai大语言模型的招聘***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310873093.8A CN116823203A (zh) | 2023-07-17 | 2023-07-17 | 一种基于ai大语言模型的招聘***及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116823203A true CN116823203A (zh) | 2023-09-29 |
Family
ID=88139140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310873093.8A Pending CN116823203A (zh) | 2023-07-17 | 2023-07-17 | 一种基于ai大语言模型的招聘***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116823203A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117495321A (zh) * | 2023-11-03 | 2024-02-02 | 北京探也智能科技有限公司 | 一种基于大模型的自助式招聘方法以及设备 |
CN117524192A (zh) * | 2023-11-08 | 2024-02-06 | 北京中科深智科技有限公司 | 一种语音识别中说话人停顿处理的方法 |
CN117609618A (zh) * | 2023-11-27 | 2024-02-27 | 北京五八赶集信息技术有限公司 | 职位信息的推荐方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110534108A (zh) * | 2019-09-25 | 2019-12-03 | 北京猎户星空科技有限公司 | 一种语音交互方法及装置 |
CN111080234A (zh) * | 2019-11-25 | 2020-04-28 | 苏州思必驰信息科技有限公司 | 启发式对话招聘方法及*** |
CN113268352A (zh) * | 2021-06-11 | 2021-08-17 | 中科院软件研究所南京软件技术研究院 | 面向通用服务机器人的多指令响应式任务协同管理方法 |
CN113539261A (zh) * | 2021-06-30 | 2021-10-22 | 大众问问(北京)信息科技有限公司 | 人机语音交互方法、装置、计算机设备和存储介质 |
-
2023
- 2023-07-17 CN CN202310873093.8A patent/CN116823203A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110534108A (zh) * | 2019-09-25 | 2019-12-03 | 北京猎户星空科技有限公司 | 一种语音交互方法及装置 |
CN111080234A (zh) * | 2019-11-25 | 2020-04-28 | 苏州思必驰信息科技有限公司 | 启发式对话招聘方法及*** |
CN113268352A (zh) * | 2021-06-11 | 2021-08-17 | 中科院软件研究所南京软件技术研究院 | 面向通用服务机器人的多指令响应式任务协同管理方法 |
CN113539261A (zh) * | 2021-06-30 | 2021-10-22 | 大众问问(北京)信息科技有限公司 | 人机语音交互方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
王伟 等: "《竞赛机器人设计与制作》", 30 November 2022, 武汉大学出版社, pages: 110 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117495321A (zh) * | 2023-11-03 | 2024-02-02 | 北京探也智能科技有限公司 | 一种基于大模型的自助式招聘方法以及设备 |
CN117524192A (zh) * | 2023-11-08 | 2024-02-06 | 北京中科深智科技有限公司 | 一种语音识别中说话人停顿处理的方法 |
CN117609618A (zh) * | 2023-11-27 | 2024-02-27 | 北京五八赶集信息技术有限公司 | 职位信息的推荐方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116823203A (zh) | 一种基于ai大语言模型的招聘***及方法 | |
KR102318103B1 (ko) | 구직자-구인자 매칭의 합격 여부 판단을 위한 기계 학습 방법 및 이를 이용한 추천 장치 | |
US7606700B2 (en) | Adaptive task framework | |
KR102416684B1 (ko) | 인공지능 기반 이력서/구인요청서 작성 지원 시스템 | |
US20070106496A1 (en) | Adaptive task framework | |
CN112765974B (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
CN111311180A (zh) | 简历筛选方法及装置 | |
JP7297458B2 (ja) | 対話コンテンツ作成支援方法 | |
CN116362699A (zh) | 一种岗位匹配报告生成方法 | |
CN114357127A (zh) | 基于机器阅读理解及常用问题解答模型的智能问答方法 | |
KR20200139008A (ko) | 딥러닝 기술을 활용한 법률서비스 이용자의 의도분석 기반 계약서 추천 및 자동완성 서비스 | |
CN109325780A (zh) | 一种面向电子政务领域的智能客服***的交互方法 | |
CN113821605A (zh) | 一种事件抽取方法 | |
CN110929007A (zh) | 一种电力营销知识体系平台及应用方法 | |
CN113723853A (zh) | 岗位胜任力需求数据处理方法及装置 | |
CN113505606B (zh) | 一种培训信息获取方法、装置、电子设备及存储介质 | |
CN117609477B (zh) | 一种基于领域知识的大模型问答方法和装置 | |
WO2005038584A2 (en) | Matching job candidate information | |
Lamba et al. | An integrated system for occupational category classification based on resume and job matching | |
Yoshioka et al. | HUKB at COLIEE2018 information retrieval task | |
CN113495963B (zh) | 网络安全知识图谱的嵌入表示方法及装置 | |
CN115188381B (zh) | 基于点击排序的语音识别结果优化方法及装置 | |
Miura et al. | Interactive Minutes Generation System Based on Hierarchical Discussion Structure | |
Mutiara et al. | The Crowdsourcing Method to Normalize “Bahasa Alay”, a Case of Indonesian Corpus | |
Kukoyi et al. | Voice Information Retrieval In Collaborative Information Seeking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |