CN117093670A - 一种论文智能推荐专家的实现方法 - Google Patents

一种论文智能推荐专家的实现方法 Download PDF

Info

Publication number
CN117093670A
CN117093670A CN202310885864.5A CN202310885864A CN117093670A CN 117093670 A CN117093670 A CN 117093670A CN 202310885864 A CN202310885864 A CN 202310885864A CN 117093670 A CN117093670 A CN 117093670A
Authority
CN
China
Prior art keywords
expert
paper
key information
academic
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310885864.5A
Other languages
English (en)
Inventor
曲勇
黄卫卫
涂奥彬
尚伟伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhixinjia Technology Co ltd
Original Assignee
Beijing Zhixinjia Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhixinjia Technology Co ltd filed Critical Beijing Zhixinjia Technology Co ltd
Priority to CN202310885864.5A priority Critical patent/CN117093670A/zh
Publication of CN117093670A publication Critical patent/CN117093670A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及智能推荐领域,公开了一种论文智能推荐专家的实现方法,包括S1、从待评审论文中提取关键信息,并利用自然语言处理技术分析;S2、从专家库中提取专家的关键属性;S3、对论文关键信息和专家关键属性进行分词或关键词提取处理;S4、将关键信息和关键属性转换为向量表示;S5、计算论文和专家之间的余弦相似度;S6、基于相似度的匹配结果推荐适合评审的专家,根据设定的阈值判断是否匹配合适的专家。本发明通过从待评审论文和专家库中提取关键信息,并进行向量表示和相似度计算,从而推荐适合评审的专家;相较于传统方法,本发明通过自动化的关键信息提取、向量表示和相似度计算,可以大大降低人力成本和时间消耗。

Description

一种论文智能推荐专家的实现方法
技术领域
本发明涉及智能推荐技术领域,具体为一种论文智能推荐专家的实现方法。
背景技术
正常来讲在匿名评审的过程中,学生提交一篇论文,学校需要把这篇论文按规则,送到几个不同的专家手里,专家进行匿名评审,评审结束后返回评审的结果。那么在进行送审的过程中,就需要送审人员在庞大的专家库中,找到相对完全适合该论文评审领域的专家进行评审。
现有的技术实现都是通过对标签的搜索进行对专家的筛选,通过论文的一些基本属性为条件,在专家库中进行查找,然后人为的进行判断匹配关系。这种方式,不但耗费大量的人力,在匹配的准确度上还存在很大的差异点,最主要的是需要人为的进行大量的数据判断,而这需要耗费大量的人力和时间资源,同时人为判断匹配关系存在主观性和不一致性的问题,导致匹配结果的不一致性和准确性的降低。
发明内容
针对现有技术的不足,本发明提供了一种论文智能推荐专家的实现方法,解决了传统人工从专家库中查找后判断匹配关系需要耗费大量的人力和时间资源,且存在主观性和不一致性的问题。
为实现以上目的,本发明通过以下技术方案予以实现:一种论文智能推荐专家的实现方法,包括以下步骤:
S1、从待评审论文中提取关键信息,并利用自然语言处理技术分析;
S2、从专家库中提取专家的关键属性;
S3、对论文关键信息和专家关键属性进行分词或关键词提取处理;
S4、将关键信息和关键属性转换为向量表示;
S5、计算论文和专家之间的余弦相似度;
S6、基于相似度的匹配结果推荐适合评审的专家,根据设定的阈值判断是否匹配合适的专家。
优选的,步骤S1中,关键信息的提取包括标题、摘要、关键词的语义分析和情感分析,以及引用文献的分析,以获取更准确的关键信息。
优选的,步骤S2中,关键属性的提取包括专家的学术领域、研究方向、学术成就、合作网络信息。
优选的,步骤S3中,分词或关键词提取处理利用词性标注、词频统计和TF-I DF技术结合领域相关的词库进行处理,以进一步提取更精准的关键词和词组。
优选的,步骤S4中,向量表示采用One-hot编码将关键信息和关键属性转换为二进制向量,并进行标准化处理。
优选的,步骤S5中,余弦相似度的计算基于向量之间的夹角余弦值,综合考虑向量的长度和方向。
优选的,步骤S6中,匹配结果的确定基于设定的阈值判断是否匹配合适的专家,综合考虑匹配度、专家的研究领域和学术影响力因素。
优选的,专家库的构建基于大规模学术数据构建的专家信息数据库,包含专家的学术论文、学术组织成员资格、学术合作网络信息。
优选的,步骤S6推荐的适合评审的专家根据匹配度进行排名,综合考虑匹配度、专家的研究领域、学术影响力因素。
优选的,匹配度排名考虑了专家的知名度、学术影响力、研究成果、合作网络因素,并使用加权算法对这些因素进行综合评估,以得出更准确的匹配结果。
本发明提供了一种论文智能推荐专家的实现方法。具备以下有益效果:
1、本发明通过从待评审论文和专家库中提取关键信息,并进行向量表示和相似度计算,从而推荐适合评审的专家;相较于传统方法人们需要人为地进行标签搜索并手动判断专家的匹配情况,本发明实施例提供的方法通过自动化的关键信息提取、向量表示和相似度计算,可以大大降低人力成本和时间消耗。
2、本发明利用自然语言处理和相似度计算方法,确保匹配过程的客观性和一致性,提供更准确的专家推荐结果,另外通过自然语言处理和关键信息提取方法,自动提取论文和专家的关键信息,减少了人工判断的工作量和难度。
附图说明
图1为本发明的基本流程图;
图2为本发明的算法演示示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:
请参阅附图1-附图2,本发明实施例提供一种论文智能推荐专家的实现方法,包括以下步骤:
S1、从待评审论文中提取关键信息,并利用自然语言处理技术分析;
上述步骤中,从待评审论文中提取关键信息,并利用自然语言处理技术进行分析。在这一步骤中,可以提取论文的标题、摘要和关键词,并进行语义分析、情感分析和引用文献分析。语义分析可以利用自然语言处理技术,如词向量模型(例如Word2Vec、GloVe)来理解文本的语义信息。情感分析可以判断论文的情感倾向,例如正面、负面或中性。引用文献分析可以通过提取和分析论文中引用的其他文献,了解论文的背景和相关领域的知识;
除了标题、摘要和关键词,还可以考虑提取其他关键信息,如作者信息、引用文献的引用次数、论文所属领域的重要术语等。
示例:假设待评审论文是一篇关于机器学习在医疗诊断中的应用的论文。通过分析论文的标题、摘要和关键词,关键信息可以包括"机器学习”、“医疗诊断”等相关术语。
S2、从专家库中提取专家的关键属性;
上述步骤中,从专家库中提取专家的关键属性。在这一步骤中,可以提取专家的学术领域、研究方向、学术成就和合作网络信息等关键属性。
除了学术领域、研究方向和学术成就,还可以考虑提取专家的学术经历、荣誉奖项、学术社交媒体活跃度等属性。
示例:从专家库中提取的关键属性可以包括"机器学习”、“医疗图像处理”等学术领域和研究方向,以及发表多篇相关论文、在相关领域有丰富的经验等学术成就。
S3、对论文关键信息和专家关键属性进行分词或关键词提取处理;
上述步骤中,对论文关键信息和专家关键属性进行分词或关键词提取处理。在这一步骤中,可以利用词性标注、词频统计和TF-I DF技术等方法对关键信息和关键属性进行分词或关键词提取处理,以得到更精准的关键词和词组。
还可以考虑使用领域相关的词库或知识图谱等资源,以提高分词或关键词提取的准确性和领域特化程度。
示例:通过分词或关键词提取处理,可以得到论文关键信息的关键词机器学习”、“医疗诊断”,以及专家关键属性的关键词机器学习”、“医疗图像处理”。
S4、将关键信息和关键属性转换为向量表示;
上述步骤中,将关键信息和关键属性转换为向量表示。在这一步骤中,可以使用One-hot编码将关键信息和关键属性转换为二进制向量,并进行标准化处理,以便进行后续的相似度计算。
除了One-hot编码,还可以考虑使用词嵌入模型,如Word2Vec、GloVe或BERT等,将关键信息和关键属性转换为低维稠密向量表示。
示例:通过将关键信息和关键属性转换为向量表示,可以得到论文关键信息的向量表示[0,1,1,0],表示机器学习和医疗诊断是存在的,以及专家关键属性的向量表示[0,1,0,1],表示机器学习和医疗图像处理是存在的。
S5、计算论文和专家之间的余弦相似度;
上述步骤中,计算论文和专家之间的余弦相似度。在这一步骤中,可以基于向量之间的夹角余弦值计算论文和专家之间的相似度,综合考虑向量的长度和方向。
除了余弦相似度,还可以考虑使用其他相似度度量方法,如欧氏距离、Jaccard相似度等。
示例:通过计算论文和专家之间的余弦相似度,可以得到论文和专家之间的相似度值为0.5,表示它们之间存在一定的相似性。
具体的,上述余弦相似度推荐算法如下:
S6、基于相似度的匹配结果推荐适合评审的专家,根据设定的阈值判断是否匹配合适的专家;
上述步骤中,基于相似度的匹配结果推荐适合评审的专家,根据设定的阈值判断是否匹配合适的专家。在这一步骤中,根据设定的阈值,判断相似度是否达到匹配要求,进而推荐适合评审的专家。
还可以考虑引入其他策略,如专家的可用性、地理位置等因素,来进一步筛选和推荐适合评审的专家。
示例:通过设定阈值为0.4,判断相似度0.5是否达到匹配要求,如果达到,则推荐该专家进行评审。
另外的,除了上述步骤,还可以考虑以下方案:
引入深度学习模型,如卷积神经网络(CNN)或循环神经网络(RNN),对论文和专家的关键信息进行特征提取和表示学习。
结合社交网络分析和推荐***技术,利用专家合作网络信息和用户反馈信息来提升推荐效果。
融合领域知识图谱或本体表示,以提高对领域特定实体和关系的理解和推荐精度。
示例:假设要基于论文的关键信息推荐适合的期刊编辑,可以类似地进行步骤S1至S6的处理。这样,可以从待评审的论文中提取关键信息,如标题、摘要和关键词,然后与期刊编辑的关键属性进行相似度计算,最终推荐适合的期刊编辑来处理该论文的投稿和评审流程。
总之,本发明实施例提供了一种论文智能推荐专家的实现方法,通过从待评审论文和专家库中提取关键信息,并进行向量表示和相似度计算,从而推荐适合评审的专家;相较于传统方法人们需要人为地进行标签搜索并手动判断专家的匹配情况,本发明实施例提供的方法通过自动化的关键信息提取、向量表示和相似度计算,可以大大降低人力成本和时间消耗;同时利用自然语言处理和相似度计算方法,确保匹配过程的客观性和一致性,提供更准确的专家推荐结果;另外通过自然语言处理和关键信息提取方法,自动提取论文和专家的关键信息,减少了人工判断的工作量和难度。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种论文智能推荐专家的实现方法,其特征在于,包括以下步骤:
S1、从待评审论文中提取关键信息,并利用自然语言处理技术分析;
S2、从专家库中提取专家的关键属性;
S3、对论文关键信息和专家关键属性进行分词或关键词提取处理;
S4、将关键信息和关键属性转换为向量表示;
S5、计算论文和专家之间的余弦相似度;
S6、基于相似度的匹配结果推荐适合评审的专家,根据设定的阈值判断是否匹配合适的专家。
2.根据权利要求1所述的一种论文智能推荐专家的实现方法,其特征在于,步骤S1中,关键信息的提取包括标题、摘要、关键词的语义分析和情感分析,以及引用文献的分析,以获取更准确的关键信息。
3.根据权利要求1所述的一种论文智能推荐专家的实现方法,其特征在于,步骤S2中,关键属性的提取包括专家的学术领域、研究方向、学术成就、合作网络信息。
4.根据权利要求1所述的一种论文智能推荐专家的实现方法,其特征在于,步骤S3中,分词或关键词提取处理利用词性标注、词频统计和TF-IDF技术结合领域相关的词库进行处理,以进一步提取更精准的关键词和词组。
5.根据权利要求1所述的一种论文智能推荐专家的实现方法,其特征在于,步骤S4中,向量表示采用One-hot编码将关键信息和关键属性转换为二进制向量,并进行标准化处理。
6.根据权利要求1所述的一种论文智能推荐专家的实现方法,其特征在于,步骤S5中,余弦相似度的计算基于向量之间的夹角余弦值,综合考虑向量的长度和方向。
7.根据权利要求1所述的一种论文智能推荐专家的实现方法,其特征在于,步骤S6中,匹配结果的确定基于设定的阈值判断是否匹配合适的专家,综合考虑匹配度、专家的研究领域和学术影响力因素。
8.根据权利要求1所述的一种论文智能推荐专家的实现方法,其特征在于,专家库的构建基于大规模学术数据构建的专家信息数据库,包含专家的学术论文、学术组织成员资格、学术合作网络信息。
9.根据权利要求1所述的一种论文智能推荐专家的实现方法,其特征在于,步骤S6推荐的适合评审的专家根据匹配度进行排名,综合考虑匹配度、专家的研究领域、学术影响力因素。
10.根据权利要求9所述的一种论文智能推荐专家的实现方法,其特征在于,匹配度排名考虑了专家的知名度、学术影响力、研究成果、合作网络因素,并使用加权算法对这些因素进行综合评估,以得出更准确的匹配结果。
CN202310885864.5A 2023-07-18 2023-07-18 一种论文智能推荐专家的实现方法 Pending CN117093670A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310885864.5A CN117093670A (zh) 2023-07-18 2023-07-18 一种论文智能推荐专家的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310885864.5A CN117093670A (zh) 2023-07-18 2023-07-18 一种论文智能推荐专家的实现方法

Publications (1)

Publication Number Publication Date
CN117093670A true CN117093670A (zh) 2023-11-21

Family

ID=88772616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310885864.5A Pending CN117093670A (zh) 2023-07-18 2023-07-18 一种论文智能推荐专家的实现方法

Country Status (1)

Country Link
CN (1) CN117093670A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117763238A (zh) * 2024-01-09 2024-03-26 南京理工大学 基于多图神经网络的学位论文评审专家推荐方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631859A (zh) * 2013-10-24 2014-03-12 杭州电子科技大学 一种面向科技项目的评审专家智能推荐方法
CN111143690A (zh) * 2019-12-31 2020-05-12 中国电子科技集团公司信息科学研究院 一种基于关联专家库的专家推荐方法和***
CN112836014A (zh) * 2021-01-29 2021-05-25 苏州科技大学 一种面向多领域跨学科的专家遴选方法
CN113569575A (zh) * 2021-08-10 2021-10-29 云南电网有限责任公司电力科学研究院 一种基于象形-语义双特征空间映射的评审专家推荐方法
CN114254201A (zh) * 2021-12-23 2022-03-29 深圳供电局有限公司 一种科技项目评审专家的推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631859A (zh) * 2013-10-24 2014-03-12 杭州电子科技大学 一种面向科技项目的评审专家智能推荐方法
CN111143690A (zh) * 2019-12-31 2020-05-12 中国电子科技集团公司信息科学研究院 一种基于关联专家库的专家推荐方法和***
CN112836014A (zh) * 2021-01-29 2021-05-25 苏州科技大学 一种面向多领域跨学科的专家遴选方法
CN113569575A (zh) * 2021-08-10 2021-10-29 云南电网有限责任公司电力科学研究院 一种基于象形-语义双特征空间映射的评审专家推荐方法
CN114254201A (zh) * 2021-12-23 2022-03-29 深圳供电局有限公司 一种科技项目评审专家的推荐方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117763238A (zh) * 2024-01-09 2024-03-26 南京理工大学 基于多图神经网络的学位论文评审专家推荐方法
CN117763238B (zh) * 2024-01-09 2024-05-24 南京理工大学 基于多图神经网络的学位论文评审专家推荐方法

Similar Documents

Publication Publication Date Title
CN111737495B (zh) 基于领域自分类的中高端人才智能推荐***及其方法
CN110765257B (zh) 一种知识图谱驱动型的法律智能咨询***
CN110298033B (zh) 关键词语料标注训练提取***
Li et al. News text classification model based on topic model
CN110162591B (zh) 一种面向数字教育资源的实体对齐方法及***
CN105528437B (zh) 一种基于结构化文本知识提取的问答***构建方法
CN112035658B (zh) 基于深度学习的企业舆情监测方法
CN110543564B (zh) 基于主题模型的领域标签获取方法
CN112989802B (zh) 一种弹幕关键词提取方法、装置、设备及介质
Mazoyer et al. A french corpus for event detection on twitter
CN112069312B (zh) 一种基于实体识别的文本分类方法及电子装置
CN113900954B (zh) 一种使用知识图谱的测试用例推荐方法及装置
Liu et al. Open intent discovery through unsupervised semantic clustering and dependency parsing
CN117093670A (zh) 一种论文智能推荐专家的实现方法
CN114661872A (zh) 一种面向初学者的api自适应推荐方法与***
CN115408488A (zh) 用于小说场景文本的分割方法及***
CN112966518B (zh) 一种面向大规模在线学习平台的优质答案识别方法
Rawat et al. Topic modelling of legal documents using NLP and bidirectional encoder representations from transformers
Avasthi et al. Tourist reviews summarization and sentiment analysis based on aspects
CN113641788B (zh) 一种基于无监督的长短影评细粒度观点挖掘方法
CN110019814B (zh) 一种基于数据挖掘与深度学习的新闻信息聚合方法
CN113392323B (zh) 基于多源数据联合学习的商务角色预测方法
CN116257618A (zh) 一种基于细粒度情感分析的多源智能旅游推荐方法
Zhang et al. Non-synchronism in global usage of research methods in library and information science from 1990 to 2019
CN113868387A (zh) 一种基于改进tf-idf加权的word2vec医疗相似问题检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination