CN117093670A

CN117093670A - 一种论文智能推荐专家的实现方法

Info

Publication number: CN117093670A
Application number: CN202310885864.5A
Authority: CN
Inventors: 曲勇; 黄卫卫; 涂奥彬; 尚伟伟
Original assignee: Beijing Zhixinjia Technology Co ltd
Current assignee: Beijing Zhixinjia Technology Co ltd
Priority date: 2023-07-18
Filing date: 2023-07-18
Publication date: 2023-11-21

Abstract

本申请涉及智能推荐领域，公开了一种论文智能推荐专家的实现方法，包括S1、从待评审论文中提取关键信息，并利用自然语言处理技术分析；S2、从专家库中提取专家的关键属性；S3、对论文关键信息和专家关键属性进行分词或关键词提取处理；S4、将关键信息和关键属性转换为向量表示；S5、计算论文和专家之间的余弦相似度；S6、基于相似度的匹配结果推荐适合评审的专家，根据设定的阈值判断是否匹配合适的专家。本发明通过从待评审论文和专家库中提取关键信息，并进行向量表示和相似度计算，从而推荐适合评审的专家；相较于传统方法，本发明通过自动化的关键信息提取、向量表示和相似度计算，可以大大降低人力成本和时间消耗。

Description

一种论文智能推荐专家的实现方法

技术领域

本发明涉及智能推荐技术领域，具体为一种论文智能推荐专家的实现方法。

背景技术

正常来讲在匿名评审的过程中，学生提交一篇论文，学校需要把这篇论文按规则，送到几个不同的专家手里，专家进行匿名评审，评审结束后返回评审的结果。那么在进行送审的过程中，就需要送审人员在庞大的专家库中，找到相对完全适合该论文评审领域的专家进行评审。

现有的技术实现都是通过对标签的搜索进行对专家的筛选，通过论文的一些基本属性为条件，在专家库中进行查找，然后人为的进行判断匹配关系。这种方式，不但耗费大量的人力，在匹配的准确度上还存在很大的差异点，最主要的是需要人为的进行大量的数据判断，而这需要耗费大量的人力和时间资源，同时人为判断匹配关系存在主观性和不一致性的问题，导致匹配结果的不一致性和准确性的降低。

发明内容

针对现有技术的不足，本发明提供了一种论文智能推荐专家的实现方法，解决了传统人工从专家库中查找后判断匹配关系需要耗费大量的人力和时间资源，且存在主观性和不一致性的问题。

为实现以上目的，本发明通过以下技术方案予以实现：一种论文智能推荐专家的实现方法，包括以下步骤：

S1、从待评审论文中提取关键信息，并利用自然语言处理技术分析；

S2、从专家库中提取专家的关键属性；

S3、对论文关键信息和专家关键属性进行分词或关键词提取处理；

S4、将关键信息和关键属性转换为向量表示；

S5、计算论文和专家之间的余弦相似度；

S6、基于相似度的匹配结果推荐适合评审的专家，根据设定的阈值判断是否匹配合适的专家。

优选的，步骤S1中，关键信息的提取包括标题、摘要、关键词的语义分析和情感分析，以及引用文献的分析，以获取更准确的关键信息。

优选的，步骤S2中，关键属性的提取包括专家的学术领域、研究方向、学术成就、合作网络信息。

优选的，步骤S3中，分词或关键词提取处理利用词性标注、词频统计和TF-I DF技术结合领域相关的词库进行处理，以进一步提取更精准的关键词和词组。

优选的，步骤S4中，向量表示采用One-hot编码将关键信息和关键属性转换为二进制向量，并进行标准化处理。

优选的，步骤S5中，余弦相似度的计算基于向量之间的夹角余弦值，综合考虑向量的长度和方向。

优选的，步骤S6中，匹配结果的确定基于设定的阈值判断是否匹配合适的专家，综合考虑匹配度、专家的研究领域和学术影响力因素。

优选的，专家库的构建基于大规模学术数据构建的专家信息数据库，包含专家的学术论文、学术组织成员资格、学术合作网络信息。

优选的，步骤S6推荐的适合评审的专家根据匹配度进行排名，综合考虑匹配度、专家的研究领域、学术影响力因素。

优选的，匹配度排名考虑了专家的知名度、学术影响力、研究成果、合作网络因素，并使用加权算法对这些因素进行综合评估，以得出更准确的匹配结果。

本发明提供了一种论文智能推荐专家的实现方法。具备以下有益效果：

1、本发明通过从待评审论文和专家库中提取关键信息，并进行向量表示和相似度计算，从而推荐适合评审的专家；相较于传统方法人们需要人为地进行标签搜索并手动判断专家的匹配情况，本发明实施例提供的方法通过自动化的关键信息提取、向量表示和相似度计算，可以大大降低人力成本和时间消耗。

2、本发明利用自然语言处理和相似度计算方法，确保匹配过程的客观性和一致性，提供更准确的专家推荐结果，另外通过自然语言处理和关键信息提取方法，自动提取论文和专家的关键信息，减少了人工判断的工作量和难度。

附图说明

图1为本发明的基本流程图；

图2为本发明的算法演示示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例：

请参阅附图1-附图2，本发明实施例提供一种论文智能推荐专家的实现方法，包括以下步骤：

上述步骤中，从待评审论文中提取关键信息，并利用自然语言处理技术进行分析。在这一步骤中，可以提取论文的标题、摘要和关键词，并进行语义分析、情感分析和引用文献分析。语义分析可以利用自然语言处理技术，如词向量模型(例如Word2Vec、GloVe)来理解文本的语义信息。情感分析可以判断论文的情感倾向，例如正面、负面或中性。引用文献分析可以通过提取和分析论文中引用的其他文献，了解论文的背景和相关领域的知识；

除了标题、摘要和关键词，还可以考虑提取其他关键信息，如作者信息、引用文献的引用次数、论文所属领域的重要术语等。

示例：假设待评审论文是一篇关于机器学习在医疗诊断中的应用的论文。通过分析论文的标题、摘要和关键词，关键信息可以包括"机器学习”、“医疗诊断”等相关术语。

S2、从专家库中提取专家的关键属性；

上述步骤中，从专家库中提取专家的关键属性。在这一步骤中，可以提取专家的学术领域、研究方向、学术成就和合作网络信息等关键属性。

除了学术领域、研究方向和学术成就，还可以考虑提取专家的学术经历、荣誉奖项、学术社交媒体活跃度等属性。

示例：从专家库中提取的关键属性可以包括"机器学习”、“医疗图像处理”等学术领域和研究方向，以及发表多篇相关论文、在相关领域有丰富的经验等学术成就。

上述步骤中，对论文关键信息和专家关键属性进行分词或关键词提取处理。在这一步骤中，可以利用词性标注、词频统计和TF-I DF技术等方法对关键信息和关键属性进行分词或关键词提取处理，以得到更精准的关键词和词组。

还可以考虑使用领域相关的词库或知识图谱等资源，以提高分词或关键词提取的准确性和领域特化程度。

示例：通过分词或关键词提取处理，可以得到论文关键信息的关键词机器学习”、“医疗诊断”，以及专家关键属性的关键词机器学习”、“医疗图像处理”。

S4、将关键信息和关键属性转换为向量表示；

上述步骤中，将关键信息和关键属性转换为向量表示。在这一步骤中，可以使用One-hot编码将关键信息和关键属性转换为二进制向量，并进行标准化处理，以便进行后续的相似度计算。

除了One-hot编码，还可以考虑使用词嵌入模型，如Word2Vec、GloVe或BERT等，将关键信息和关键属性转换为低维稠密向量表示。

示例：通过将关键信息和关键属性转换为向量表示，可以得到论文关键信息的向量表示[0,1,1,0]，表示机器学习和医疗诊断是存在的，以及专家关键属性的向量表示[0,1,0,1]，表示机器学习和医疗图像处理是存在的。

S5、计算论文和专家之间的余弦相似度；

上述步骤中，计算论文和专家之间的余弦相似度。在这一步骤中，可以基于向量之间的夹角余弦值计算论文和专家之间的相似度，综合考虑向量的长度和方向。

除了余弦相似度，还可以考虑使用其他相似度度量方法，如欧氏距离、Jaccard相似度等。

示例：通过计算论文和专家之间的余弦相似度，可以得到论文和专家之间的相似度值为0.5，表示它们之间存在一定的相似性。

具体的，上述余弦相似度推荐算法如下：

S6、基于相似度的匹配结果推荐适合评审的专家，根据设定的阈值判断是否匹配合适的专家；

上述步骤中，基于相似度的匹配结果推荐适合评审的专家，根据设定的阈值判断是否匹配合适的专家。在这一步骤中，根据设定的阈值，判断相似度是否达到匹配要求，进而推荐适合评审的专家。

还可以考虑引入其他策略，如专家的可用性、地理位置等因素，来进一步筛选和推荐适合评审的专家。

示例：通过设定阈值为0.4，判断相似度0.5是否达到匹配要求，如果达到，则推荐该专家进行评审。

另外的，除了上述步骤，还可以考虑以下方案：

引入深度学习模型，如卷积神经网络(CNN)或循环神经网络(RNN)，对论文和专家的关键信息进行特征提取和表示学习。

结合社交网络分析和推荐***技术，利用专家合作网络信息和用户反馈信息来提升推荐效果。

融合领域知识图谱或本体表示，以提高对领域特定实体和关系的理解和推荐精度。

示例：假设要基于论文的关键信息推荐适合的期刊编辑，可以类似地进行步骤S1至S6的处理。这样，可以从待评审的论文中提取关键信息，如标题、摘要和关键词，然后与期刊编辑的关键属性进行相似度计算，最终推荐适合的期刊编辑来处理该论文的投稿和评审流程。

总之，本发明实施例提供了一种论文智能推荐专家的实现方法，通过从待评审论文和专家库中提取关键信息，并进行向量表示和相似度计算，从而推荐适合评审的专家；相较于传统方法人们需要人为地进行标签搜索并手动判断专家的匹配情况，本发明实施例提供的方法通过自动化的关键信息提取、向量表示和相似度计算，可以大大降低人力成本和时间消耗；同时利用自然语言处理和相似度计算方法，确保匹配过程的客观性和一致性，提供更准确的专家推荐结果；另外通过自然语言处理和关键信息提取方法，自动提取论文和专家的关键信息，减少了人工判断的工作量和难度。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种论文智能推荐专家的实现方法，其特征在于，包括以下步骤：

S2、从专家库中提取专家的关键属性；

S4、将关键信息和关键属性转换为向量表示；

S5、计算论文和专家之间的余弦相似度；

2.根据权利要求1所述的一种论文智能推荐专家的实现方法，其特征在于，步骤S1中，关键信息的提取包括标题、摘要、关键词的语义分析和情感分析，以及引用文献的分析，以获取更准确的关键信息。

3.根据权利要求1所述的一种论文智能推荐专家的实现方法，其特征在于，步骤S2中，关键属性的提取包括专家的学术领域、研究方向、学术成就、合作网络信息。

4.根据权利要求1所述的一种论文智能推荐专家的实现方法，其特征在于，步骤S3中，分词或关键词提取处理利用词性标注、词频统计和TF-IDF技术结合领域相关的词库进行处理，以进一步提取更精准的关键词和词组。

5.根据权利要求1所述的一种论文智能推荐专家的实现方法，其特征在于，步骤S4中，向量表示采用One-hot编码将关键信息和关键属性转换为二进制向量，并进行标准化处理。

6.根据权利要求1所述的一种论文智能推荐专家的实现方法，其特征在于，步骤S5中，余弦相似度的计算基于向量之间的夹角余弦值，综合考虑向量的长度和方向。

7.根据权利要求1所述的一种论文智能推荐专家的实现方法，其特征在于，步骤S6中，匹配结果的确定基于设定的阈值判断是否匹配合适的专家，综合考虑匹配度、专家的研究领域和学术影响力因素。

8.根据权利要求1所述的一种论文智能推荐专家的实现方法，其特征在于，专家库的构建基于大规模学术数据构建的专家信息数据库，包含专家的学术论文、学术组织成员资格、学术合作网络信息。

9.根据权利要求1所述的一种论文智能推荐专家的实现方法，其特征在于，步骤S6推荐的适合评审的专家根据匹配度进行排名，综合考虑匹配度、专家的研究领域、学术影响力因素。

10.根据权利要求9所述的一种论文智能推荐专家的实现方法，其特征在于，匹配度排名考虑了专家的知名度、学术影响力、研究成果、合作网络因素，并使用加权算法对这些因素进行综合评估，以得出更准确的匹配结果。