CN114254201A

CN114254201A - 一种科技项目评审专家的推荐方法

Info

Publication number: CN114254201A
Application number: CN202111587108.1A
Authority: CN
Inventors: 汪伟; 余鹏; 李重杭; 何维; 艾致衡
Original assignee: Shenzhen Power Supply Bureau Co Ltd
Current assignee: Shenzhen Power Supply Bureau Co Ltd
Priority date: 2021-12-23
Filing date: 2021-12-23
Publication date: 2022-03-29

Abstract

本发明公开一种科技项目评审专家的推荐方法，包括：读取待评审项目的申请书，建立待评审项目组基于向量的知识表示模型；读取基础库中候选专家的数据，根据专家信息特点及专家物元知识表示模型构建方法，建立待评审项目组基于物元的知识表示模型；采用基于知识表示模型的相似度计算方法计算项目组与候选专家的相似度值，并将所述相似度值作为候选专家的第一推荐值；分别计算各候选专家在预设指标上的评分，根据预设的专家评分数学模型计算候选专家的第二推荐值；根据所述第一推荐值和第二推荐值，计算候选专家的推荐指数，得到按推荐指数大小排列候选专家的推荐次序的推荐列表。本发明可以有效提高推荐专家与项目内容的匹配度。

Description

一种科技项目评审专家的推荐方法

技术领域

本发明属于电力***技术领域，具体涉及一种科技项目评审专家的推荐方法。

背景技术

目前，我国对科技项目的扶持政策引导类科技计划及专项等，同时各地政府也分别建立了不同的基金计划来支持科技项目的开展。国家及各地政府对科技活动的大力支持直接导致了科技项目申报、立项数量的增多。

现有技术存在以下缺陷与不足：由于科技项目评审专家确定的方式准确性、科学性不足，导致专家与所评项目内容不匹配的现象很普遍。

发明内容

本发明所要解决的技术问题在于，提供一种科技项目评审专家的推荐方法，以有效提高评审专家与科技项目内容的匹配度。

为解决上述技术问题，本发明提供一种科技项目评审专家的推荐方法，包括：

步骤S1，读取待评审项目的申请书，建立待评审项目组基于向量的知识表示模型；

步骤S2，读取基础库中候选专家的数据，根据专家信息特点及专家物元知识表示模型构建方法，建立待评审项目组基于物元的知识表示模型；

步骤S3，采用基于知识表示模型的相似度计算方法计算项目组与候选专家的相似度值，并将所述相似度值作为候选专家的第一推荐值；

步骤S4，分别计算各候选专家在预设指标上的评分，根据预设的专家评分数学模型计算候选专家的第二推荐值；

步骤S5，根据所述第一推荐值和第二推荐值，计算候选专家的推荐指数，得到按推荐指数大小排列候选专家的推荐次序的推荐列表。

进一步地，所述步骤S1具体包括：读取待评审项目的申请书，首先采用基于词语语义网络的中文关键词算法，计算关键词的关键度并以此筛选关键词；然后根据向量空间模型构建方法将关键度与关键词的映射关系构建向量模型；最后根据科技项目以组为单位进行推荐的特点，对项目模型采取合并策略，建立待评审项目组基于向量的知识表示模型。

进一步地，所述步骤S2具体包括：读取基础库中专家的数据，首先采用基于词语语义网络的中文关键词算法，计算关键词的关键度并以此筛选关键词；然后根据向量空间模型构建方法将关键度与关键词的映射关系构建向量模型；最后根据专家信息特点及专家物元知识表示模型构建方法，建立待评审项目组基于物元的知识表示模型。

进一步地，所述步骤S2还包括：根据每位专家的知识表示模型建立专家数学模型库，通过读取库数据构建专家的知识表示模型。

进一步地，所述步骤S3具体包括：首先采用层次聚类算法分别构建项目组与专家的概念层次模型，然后采用节点最大深度改进的余弦相似度计算方法，计算科技项目组与专家的相似度值，取得得到相似度值大于阈值的前N位候选专家，构成候选专家的初步推荐列表；将得到的相似度值作为候选专家的第一推荐值。

进一步地，所述步骤S4具体包括：根据专家评价分析方法及专家评价原理构建专家评分数学模型，针对科研课题、著作、职称、奖项预设指标，采用层次分析法建立专家评价体系；基于回归分析方法，分别计算各预设指标评分；最后基于专家评价体系及指标评分，构建专家评分数学模型；根据预设的专家评分数学模型计算候选专家的第二推荐值。

进一步地，所述步骤S4还包括：根据专家评分模型建立专家评分模型数学库，通过读取该库数据构建专家评分数学模型。

进一步地，所述步骤S5具体包括：通过下述公式计算候选专家的推荐指数：

S＝S₁×M₁+S₂×M₂

其中，S表示最后的推荐指数，S₁表示第一推荐值，S₂表示第二推荐值； M₁表示第一推荐值的权重，M₂表示第二推荐值的权重。

进一步地，向量空间模型的建立方式是：

其中，t_i(i＝1，2，...，n)为关键词条项，w_i(d)为t_i在d中的权重， key(W_i)为W_i的关键度值；

根据项目与专家信息的不同特点，分别对向量V进行做处理，形成科技项目的知识表示模型和专家的知识表示模型。

进一步地，对科技项目与专家信息采用文本挖掘方法构建知识表示模型。

实施本发明具有如下有益效果：通过设置关键词提取方法、科技项目与专家的知识模型表示、基于知识模型的相似性方法，通过文本挖掘的相关方法分析项目与专家潜在的、重要的关联性，从而有效提高评审专家与待评审项目内容的匹配度；

通过设置基于内容的推荐算法、协同过滤推荐算法、基于知识的推荐算法、基于关联规则的推荐算法和组合推荐算法，通过对比分析了各个算法的优、缺点和适用场合，为在科技项目评审专家推荐***的实现中，选择何种推荐算法以及如何实现提供了充分的理论基础；

通过设置科技项目评审专家推荐模型研究，通过该模型首先根据科技项目组与专家相似性计算法方法，提高科技项目与专家内容的匹配度；然后根据专家评分数学模型加权调整专家推荐指数，使推荐结果更加科学有效。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一种科技项目评审专家的推荐方法的流程示意图。

图2是本发明实施例中协同过滤推荐的主要步骤示意图。

图3是本发明实施例中推荐算法的比较图。

图4是本发明实施例中常用的推荐***模型结构图。

图5是本发明实施例中科技项目评审专家推荐模型结构图。

图6是本发明实施例中科技项目评审专家推荐***的设计流程图。

图7是本发明实施例中Lucene***结构图。

图8是本发明实施例中停用词词库建立示意图。

图9是本发明实施例中关键词提取示意图。

图10是本发明实施例中概念模型构建及相似度计算示意图。

具体实施方式

以下各实施例的说明是参考附图，用以示例本发明可以用以实施的特定实施例。

请参照图1所示，本发明实施例提供一种科技项目评审专家的推荐方法，包括：

具体地，请同时参阅图2-10所示，先介绍几种推荐算法，包括协同过滤推荐算法、基于关联规则的推荐算法、基于内容的推荐算法、基于知识的推荐算法和组合推荐算法。

(一)协同过滤的推荐算法

协同过滤推荐不需考虑商品自身的特征和属性，而是从用户的角度进行推荐的，***通过学习顾客购买商品的记录、浏览商品记录或对商品评分等隐式的数据来获取推荐信息，该算法最大的优点是对推荐对象没有特殊的要求，因此能够处理非结构化的复杂对象，如电影、音乐和其他一般商品，协同过滤推荐通过共享其他人的经验，避免了基于内容推荐中的分析不完全和不精确，由于它不依赖于商品的特征和属性，因此可以挖掘出从表面特征上不同但事实上却有很大相关性的商品作为推荐，从而帮助用户推荐新的感兴趣的商品，能挖掘出用户潜在的但尚未发现的兴趣爱好，更重要的是它可以根据顾客购买商品的记录、浏览商品记录或对商品评分等隐式数据的不断积累，来更新和增加自身的知识体系，为之后做出愈加精确的推荐提供了更多的信息。

(二)基于关联规则的推荐算法

基于关联规则的推荐算法在某些程度上可以将其看成一种推理技术，它不是建立在用户需要和偏好基础上以产生推荐的，而是利用针对特定领域制定特定规则来进行基于关联规则和实例的推理，该方法的推荐是以关联规则为基础，把已经购买的商品作为规则头，推荐对象作为规则体，其产生推荐的实现步骤为：

步骤一：使用关联规则的推荐算法，找出所有满足最小支持度与最小置信度的关联规则，并且存入规则库R中；

步骤二：为每个当前的客户C设置一个候选推荐集合P，并且初始化为空；

步骤三：搜索规则库R，从中找出被客户C支持的所有关联规则集合R，即关联规则左部的所有商品出现在客户C的历史购买行为记录中；

步骤四：将出现在集合R中的任意一项规则右部的商品加入候选推荐集P；

步骤五：从候选推荐集P中删除用户已经购买过的商品；

步骤六：根据关联规则集合R的置信度来对候选推荐集P所有候选项进行从大到小的排序，如果有一个商品出现在多条规则中，那么选择置信度最高的规则最为排序的标准；

步骤七：从候选推荐集P中，选取置信度最高的前N项作为推荐结果返回给客户C；

基于关联规则的推荐可以发现不同商品在销售过程中的彼此相关性，其中在零售行业以及网上书店及电子商务中已经得到了比较成功的应用，它的管理规则就是在一个交易数据库中，统计购买了商品集X的交易中会有多大比例的交易同时去购买商品集Y，其直观的意义就是计算用户在购买某些商品的时候会有多大的倾向去购买另外一些相关的商品。

(三)基于内容的推荐算法

基于内容的推荐算法是指根据用户选择的对象信息，从而推荐其它含有类似属性的对象作为推荐，它是信息过滤技术的延续和发展，是建立在项目的内容文本信息上做出的推荐，而不需要依据用户对项目的评价意见，更多地是通过对用户文本信息进行分词并建立向量空间模型，从关于内容的特征描述的文本信息中得到用户的兴趣资料信息，基于内容推荐算法实现的基本思想是：

首先，对每个用户通过特征提取的方法分析表示用户的文本信息从而得到能够用来描述用户兴趣资料信息的兴趣模型的数据结构；然后，对每个项目通过特征提取的方法分析表示项目的文本信息从而得到能够用来描述项目特征的数据结构；最后，当需要对其中一个用户进行推荐时，只需要将表示该用户的用户兴趣模型的数据结构同所有项目的特征向量矩阵进行比较得到用户与项目之间的相似度，***通过计算得到的相似度值来推荐项目。

协同过滤推荐算法、基于关联规则的推荐算法、基于内容的推荐算法、基于知识的推荐算法和组合推荐算法的对比：

科技项目评审管理中，尚未存在大量有置信度较高的历史评审记录，并且项目信息与专家信息数据库也没有相应的关联规则，相对而言，基于内容推荐的算法更适合，针对基于内容推荐算法不能发现潜在兴趣的缺点及科技项目的特点，本实施例提出一种科技项目评审专家的推荐方法。根据科技项目评审专家推荐模型结构图中显示的，完成科技项目评审专家的推荐主要完成科技项目与专家知识表示模型的构建、专家数学模型库、专家评分数学模型库、已评审项目库等的建立，然后根据它们库信息及相关模型数据运用推荐算法处理产生评审专家推荐列表。

请具体参照图6所示，步骤S1中，读取待评审项目的申请书，首先采用基于词语语义网络的中文关键词算法，计算关键词的关键度并以此筛选关键词；然后根据向量空间模型构建方法将关键度与关键词的映射关系构建向量模型；最后根据科技项目一般以组为单位进行推荐的特点，对项目模型采取合并策略，建立待评审项目组基于向量的知识表示模型。

步骤S2中，读取基础库中专家的数据，首先采用基于词语语义网络的中文关键词算法，计算关键词的关键度并以此筛选关键词；然后根据向量空间模型构建方法将关键度与关键词的映射关系构建向量模型；最后根据专家信息特点及专家物元知识表示模型构建方法，建立待评审项目组基于物元的知识表示模型。为了提高推荐***的运行效率，根据每位专家的知识表示模型建立专家数学模型库，在推荐算法运行过程中，通过读取库数据构建专家的知识表示模型。

步骤S3通过步骤S1与步骤S2构建项目组专家知识表示模型后，采用改进的基于知识表示模型的相似度计算方法计算项目组与专家的相似度值：首先采用层次聚类算法分别构建项目组与专家的概念层次模型，然后采用节点最大深度改进的余弦相似度计算方法，计算科技项目组与专家的相似度值，取得得到相似度值大于阈值的前N位候选专家，构成候选专家的初步推荐列表。可以理解的是，将得到的相似度值作为候选专家的第一推荐值。

步骤S4中，根据专家评价分析方法及专家评价原理构建专家评分数学模型，针对科研课题、著作、职称、奖项等预设指标，采用层次分析法建立专家评价体系；基于回归分析方法，分别计算各预设指标评分；最后基于专家评价体系及指标评分，提出一个专家评分数学模型。为了提高推荐***性能，本发明实施例根据专家评分模型建立专家评分模型数学库，在推荐算法运行过程中，通过读取该库数据构建专家评分数学模型。可以理解的是，根据专家评分数学模型计算候选专家的第二推荐值。作为一种示例，可以对各预设指标评分进行求和，得到第二推荐值。

步骤S5对步骤S3、步骤S4中得到的第一推荐值和第二推荐值进行处理，计算公式为：S＝S₁×M₁+S₂×M₂其中，S表示最后的推荐指数，S₁表示第一推荐值，S₂表示第二推荐值；M₁表示第一推荐值的权重，M₂表示第二推荐值的权重。根据最终推荐指数S，按大小顺序排列候选专家的推荐次序，得到候选专家的推荐列表。

实验结果表明，运用该推荐方法产生的推荐结果具有较高的准确性，并且运用该推荐方法实现的***具有较好的可行性。

本实施例中，科技项目与专家相似性计算方法说明如下：

科技项目与专家主要信息来源是申请书与专家履历等数据库字段，以半结构化的方式存储于数据库中，为了更好的分析项目与专家潜在的、重要的关联性，本发明实施例对科技项目与专家信息采用分词技术、关键词提取、知识表示等文本挖掘方法构建知识表示模型；

分词技术：中文分词的特殊情况，中文词语和英文的单词不同，中文的词与词之间没有明显的分隔符号，中文的词汇构成方式繁多，组成单个词汇的字数也各不相同，而且往往句子中很多个字连起来才可以描述一个意思，而英文都是以词为单位的，词与词之间是用空格来隔开区分很明显，***只要根据空格进行分割即可，因此对于中文字符串的分词处理比英文的处理要来得更加复杂和困难，需要经过一些特殊的中文分词处理方法才能将其进行有效的检索，在目前普遍的实际开发应用中，在使用了Lucene工具包的同时，还会加入一些改进的中文分词工具，在实际的应用中表明，集成了这些工具的Lucene确实收到了比较良好的效果；

从Lucene的结构体制中可以知道，无论是建立索引还是分词，被解析的文本都需要通过分析器，然后将文本解析为Token流输入给查询语句的语法分析逻辑或者索引构建逻辑，其中分词功能又是分析器中不可或缺的最重要的部分， Lucene***构架主要包括以下三个部分：基本封装结构、索引核心和外部接口，其中索引核心是最重要的组成部分；

关键词提取：基于词语语义网络的关键词提取方法：基于中文分词方法，对文本进行预处理；基于词语语义相似性，将科技项目与专家的文本映射成词语网络；根据社会网络的概念，计算词语网络的居间度；根据词语居间度与统计特性计算关键度，并根据关键度筛选关键词构成集合，该算法主要由以下几个模块构成：文本预处理，词语语义网络构建，居间度计算，关键度计算，关键词筛选；

文本挖掘方法：根据科技项目专家人选确定的相关文件的要求，以下信息是知识表示模型构建的主要组成部分：

项目信息：

(1)项目名称，题目是项目信息的一个凝缩点；

(2)关键技术与公关方向，能表明申报项目的具体研究方向；

(3)项目主要研发内容，是申报项目的研究的具体方式、内容、能达到的预期结果的详细描述；

(4)项目主要技术指标、经济指标，反映申报项目计划目标和实际情况；

(5)可行性报告，申报项目所属单位从经济、技术、研发、运营到社会的各种环境、政策、法律等多种角度进行调研、分析、论述，预见各类利害因素及项目的可行性，估计项目风险、经济贡献和社会效益等指标；

专家信息：

(1)熟悉专业，专家所从事的研究专业；

(2)研究方向，专家所研究的具体方向；

(3)专家的简历，专家的个人形象，包括资历与能力的书面表述；

(4)所获得的各种奖项；

(5)期刊发表情况；

(6)课题承担完成情况。

包括科技项目与专家的知识表示：

VSM具有很强的表达和扩展能力，而且作为最简单及有效的知识表示模型，该模型在各个领域得到了较广的运用，包括之后提出的物元模型概念和方法也是基于向量空间模型进行扩展的成果，目前包括文本复制检测、全文检索等很多相关领域都应用到了向量空间模型中的特征项的选取、特征加权策略等技术；

对待评审科技项目和评审专家信息的建模都采用知识表示法，其中，***中向量空间模型建立的基本思想是将一个输入对象的文本信息进行中分词、关键词提取等算法处理后的关键词和关键度值，对关键度值归一化处理后，通过以下我们就可以建立起一个向量空间模型：

V(d)＝{＜t₁，w₁(d)＞，＜t₂，w₂(d)＞，...，＜t_n，w_n(d)＞}，

其中t_i(i＝1，2，...，n)为关键词条项，w_i(d)为t_i在d中的权重， key(W_i)为W_i的关键度值；

根据项目与专家信息的不同特点，分别对向量V进行做处理，形成科技项目的知识表示模型V和专家的知识表示模型V。

基于知识表示模型的相似性度量方法说明如下：

对科技项目组与专家知识表示中的关键词可能存在的与其他关键词之间同义关系、概念上下位关系等，采用知识模型直接查询匹配的方式不能有效地对文档进行相似性检测，为了提高推荐算法的准确度，采用对知识模型的关键词采用层次聚类后再进行相似度计算；

推荐模型主要由三个步骤组成：基于语义相似度对知识表示聚类并构建各项目组概念树模型和专家概念树模型集合；采用节点最大深度匹配改进的余弦相似度方法计算项目组概念树和每个专家概念树之间的相似度值；根据相似度值高低给出项目组评审专家的推荐次序，并输出推荐专家列表。

通过对科技项目组与专家知识表示中的关键词可能存在的与其他关键词之间同义关系、概念上下位关系等，采用知识模型直接查询匹配的方式不能有效地对文档进行相似性检测，为了提高推荐算法的准确度，采用对知识模型的关键词采用层次聚类后再进行相似度计算；推荐模型主要由三个步骤组成：基于语义相似度对知识表示聚类并构建各项目组概念树模型和专家概念树模型集合；采用节点最大深度匹配改进的余弦相似度方法计算项目组概念树和每个专家概念树之间的相似度值；根据相似度值高低给出项目组评审专家的推荐次序，并输出推荐专家列表。

通过上述说明可知，本发明带来的有益效果在于：通过文本挖掘的相关方法分析项目与专家潜在的、重要的关联性，从而有效提高推荐专家与项目内容的匹配度；通过对比分析了各个算法的优、缺点和适用场合，为在科技项目评审专家推荐***的实现中，选择何种推荐算法以及如何实现提供了充分的理论基础；通过该模型首先根据科技项目组与专家相似性计算方法，提高科技项目与专家内容的匹配度；然后根据专家评分数学模型加权调整专家推荐指数，使推荐结果更加科学有效。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种科技项目评审专家的推荐方法，其特征在于，包括：

2.根据权利要求1所述的推荐方法，其特征在于，所述步骤S1具体包括：读取待评审项目的申请书，首先采用基于词语语义网络的中文关键词算法，计算关键词的关键度并以此筛选关键词；然后根据向量空间模型构建方法将关键度与关键词的映射关系构建向量模型；最后根据科技项目以组为单位进行推荐的特点，对项目模型采取合并策略，建立待评审项目组基于向量的知识表示模型。

3.根据权利要求2所述的推荐方法，其特征在于，所述步骤S2具体包括：读取基础库中专家的数据，首先采用基于词语语义网络的中文关键词算法，计算关键词的关键度并以此筛选关键词；然后根据向量空间模型构建方法将关键度与关键词的映射关系构建向量模型；最后根据专家信息特点及专家物元知识表示模型构建方法，建立待评审项目组基于物元的知识表示模型。

4.根据权利要求3所述的推荐方法，其特征在于，所述步骤S2还包括：根据每位专家的知识表示模型建立专家数学模型库，通过读取库数据构建专家的知识表示模型。

5.根据权利要求4所述的推荐方法，其特征在于，所述步骤S3具体包括：首先采用层次聚类算法分别构建项目组与专家的概念层次模型，然后采用节点最大深度改进的余弦相似度计算方法，计算科技项目组与专家的相似度值，取得得到相似度值大于阈值的前N位候选专家，构成候选专家的初步推荐列表；将得到的相似度值作为候选专家的第一推荐值。

6.根据权利要求5所述的推荐方法，其特征在于，所述步骤S4具体包括：根据专家评价分析方法及专家评价原理构建专家评分数学模型，针对科研课题、著作、职称、奖项预设指标，采用层次分析法建立专家评价体系；基于回归分析方法，分别计算各预设指标评分；最后基于专家评价体系及指标评分，构建专家评分数学模型；根据预设的专家评分数学模型计算候选专家的第二推荐值。

7.根据权利要求6所述的推荐方法，其特征在于，所述步骤S4还包括：根据专家评分模型建立专家评分模型数学库，通过读取该库数据构建专家评分数学模型。

8.根据权利要求7所述的推荐方法，其特征在于，所述步骤S5具体包括：通过下述公式计算候选专家的推荐指数：

S＝S₁×M₁+S₂×M₂

其中，S表示最后的推荐指数，S₁表示第一推荐值，S₂表示第二推荐值；M₁表示第一推荐值的权重，M₂表示第二推荐值的权重。

9.根据权利要求1所述的推荐方法，其特征在于，向量空间模型的建立方式是：

V(d)＝{<t₁，w₁(d)>，<t₂，w₂(d)＞，…，＜t_n，w_n(d)>}，

其中，t_i(i＝1，2，...，n)为关键词条项，w_i(d)为t_i在d中的权重，key(W_i)为W_i的关键度值；

10.根据权利要求1所述的推荐方法，其特征在于，对科技项目与专家信息采用文本挖掘方法构建知识表示模型。