CN112632954A - 获取机构技术相似性的方法及装置 - Google Patents

获取机构技术相似性的方法及装置 Download PDF

Info

Publication number
CN112632954A
CN112632954A CN202011596692.2A CN202011596692A CN112632954A CN 112632954 A CN112632954 A CN 112632954A CN 202011596692 A CN202011596692 A CN 202011596692A CN 112632954 A CN112632954 A CN 112632954A
Authority
CN
China
Prior art keywords
similarity
target
technical
acquiring
mechanisms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011596692.2A
Other languages
English (en)
Inventor
蔡超
武学敏
杨万征
程国艮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Global Tone Communication Technology Co ltd
Original Assignee
Global Tone Communication Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Global Tone Communication Technology Co ltd filed Critical Global Tone Communication Technology Co ltd
Priority to CN202011596692.2A priority Critical patent/CN112632954A/zh
Publication of CN112632954A publication Critical patent/CN112632954A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种获取机构技术相似性的方法及装置。其中,方法包括:获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个;根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中一个或多个,获取两个目标机构的技术相似性。本发明实施例提供的获取机构技术相似性的方法及装置,通过两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的至少一个,获取两个目标机构的技术相似性,能通过客观数据全面描述机构的相似性,能更全面、准确、客观地获取机构技术相似性,从而能提高相似机构查找的准确性和全面性。

Description

获取机构技术相似性的方法及装置
技术领域
本发明实施例涉及数据分析技术领域,更具体地,涉及一种获取机构技术相似性的方法及装置。
背景技术
科研机构,包括研究型的公司、学校、研究所等,是科技创新的主体。基于科研合作等方面的需求,需要评价两个机构的技术相似程度。
现有技术不能全面、准确、客观对比机构技术相似性,因此,如何获取机构技术相似性是本领域亟待解决的技术问题。
发明内容
本发明实施例提供一种获取机构技术相似性的方法及装置,用以解决或者至少部分地解决现有技术存在的不能全面、准确、客观地获取机构技术相似性的缺陷。
第一方面,本发明实施例提供一种获取机构技术相似性的方法,包括:
获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个;
根据所述两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个,获取所述两个目标机构的技术相似性;
其中,所述两个目标机构包括第一目标机构和第二目标机构。
优选地,获取所述两个目标机构的专利相似性具体包括:
根据所述两个目标机构的各专利所属的分类,获取所述两个目标机构的技术相似性;
或者,根据所述两个目标机构的各专利的内容,获取所述两个目标机构的技术相似性。
优选地,获取所述两个目标机构的论文相似性具体包括:
根据所述两个目标机构的各论文所属的分类,获取所述两个目标机构的技术相似性;
或者,根据所述两个目标机构的各论文的内容,获取所述两个目标机构的技术相似性。
优选地,获取所述两个目标机构的科研人员相似性具体包括:
根据所述两个目标机构的各科研人员的各科技文献所属的分类,取所述两个目标机构的技术相似性;
或者,根据所述两个目标机构的各科研人员的各科技文献的内容,获取所述两个目标机构的技术相似性。
优选地,获取所述两个目标机构的产品相似性具体包括:
根据所述两个目标机构的各产品的介绍文本的内容,获取所述两个目标机构的技术相似性。
优选地,获取所述两个目标机构的组织结构相似性具体包括:
根据所述两个目标机构的各内设部门所属的分类,获取所述两个目标机构的组织结构相似性。
优选地,所述根据所述两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,获取所述两个目标机构的技术相似性具体包括:
根据所述两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,以及预设的权重,获取所述两个目标机构的技术相似性。
第二方面,本发明实施例提供一种获取机构技术相似性的装置,包括:
维度相似获取模块,用于获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个;
综合相似获取模块,用于根据所述两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,获取所述两个目标机构的技术相似性;
其中,所述两个目标机构包括第一目标机构和第二目标机构。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,执行所述程序时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的获取机构技术相似性的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的获取机构技术相似性的方法的步骤。
本发明实施例提供的获取机构技术相似性的方法及装置,通过两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的至少一个,获取两个目标机构的技术相似性,能通过客观数据全面描述机构的相似性,能更全面、准确、客观地获取机构技术相似性,从而能提高相似机构查找的准确性和全面性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例提供的获取机构技术相似性的方法的流程示意图;
图2为根据本发明实施例提供的获取机构技术相似性的装置的结构示意图;
图3为根据本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明实施例的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明实施例中的具体含义。
图1为根据本发明实施例提供的获取机构技术相似性的方法的流程示意图。如图1所示,该方法包括:步骤S101、获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个。
其中,两个目标机构包括第一目标机构和第二目标机构。
具体地,可以从机构的科研产出文献(包括专利、论文和研究报告等)、科研人员、产品和组织结构等维度进行分析,获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,以进行综合的技术相似性评估。
专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性,均可以作为一个维度。
专利相似性,用于描述两个目标机构已公开的专利之间的相似性。
论文相似性,用于描述两个目标机构已发表的论文之间的相似性。
科研人员相似性,用于描述两个目标机构的科研人员发表的科技文献之间的相似性。
产品相似性,用于描述两个目标机构生产的产品之间的相似性。
组织结构相似性,用于描述两个目标机构的组织结构之间的相似性。
步骤S102、根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个,获取两个目标机构的技术相似性。
具体地,可以对通过步骤S101获得的至少两个维度的相似性进行融合,通过组合计算,获取两个目标机构的技术相似性。
融合的方法,可以包括但不限于获取上述至少两个维度的相似性的最大值、平均值或加权平均值等作为两个目标机构的技术相似性。
可以理解的是,获取两个目标机构的技术相似性之后,若判断获知上述两个目标机构的技术相似性大于预设的相似性阈值,则可以将上述两个目标机构确定为相似机构。相似性阈值可以根据实际情况设置,其取值本发明实施例不进行具体限定。
本发明实施例通过两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的至少一个,获取两个目标机构的技术相似性,能通过客观数据全面描述机构的相似性,能更全面、准确、客观地获取机构技术相似性,从而能提高相似机构查找的准确性和全面性。
基于上述各实施例的内容,获取两个目标机构的专利相似性具体包括:根据两个目标机构的各专利所属的分类,获取两个目标机构的技术相似性;或者,根据两个目标机构的各专利的内容,获取两个目标机构的技术相似性。
具体地,可以根据简化计算方法或内容计算方法,获取两个目标机构的专利相似性。
根据简化计算方法,获取两个目标机构的专利相似性具体包括:
根据每一目标机构的专利所属的分类,获取每一目标机构的专利特征向量;
根据两个目标机构的专利特征向量,获取两个目标机构的专利相似性。
具体地,可以根据各国专利局公开的数据或专利数据搜索引擎等,获取上述两个目标机构公开的专利。
根据专利分类法(例如IPC分类法、FC分类法),每一专利均有其所属的分类。
根据专利分类法获得的专利分类表有k个分类,分别为C1、……、Ck
对于第一目标机构(即机构A)公开的全部专利(机构A公开的全部专利的总数记为PA),将其中属于类C1的专利个数记为PA1,(若A没有专利落在C1类,那么PA1=0),以此类推,得到PA2、……、PAk
对于第一目标机构(即机构B)公开的全部专利(机构B公开的全部专利的总数记为PB),将其中属于类C1的专利个数记为PB1,(若B没有专利落在C1类,那么PB1=0),以此类推,得到PB2、……、PBk
将向量(PA1/PA,……,PAk/PA)和向量(PB1/PB,……,PBk/PB)分别作为两个目标机构的专利特征向量。
可以获取两个目标机构的专利特征向量之间的相似度,作为两个目标机构的专利相似性X1
向量之间的相似度,可以通过计算向量之间的余弦相似度、欧氏距离、汉明距离或马氏距离等获得。
优选地,本发明实施例通过获取两个目标机构的专利特征向量之间的余弦相似度,作为两个目标机构的专利相似性X1
根据内容计算方法,获取两个目标机构的专利相似性具体包括:
获取第一目标机构的每一专利与第二目标机构的每一专利之间的内容相似性;
根据第一目标机构的每一专利与第二目标机构的每一专利之间的内容相似性,获取两个目标机构的专利相似性。
具体地,可以将机构A公开的全部专利记为{pa1、……、pam},机构B公开的全部专利记为{pb1、……、pbn}。其中,m、n分别表示机构A和机构B公开的全部专利的总数。
对于pai和pbj(1≤i≤m,1≤j≤n),可以采用词袋法或者语义空间法等计算文本内容的相似性的方法,获取pai和pbj的文本内容之间的相似性,作为pai和pbj的内容相似度sij,从而可以得到一个m乘n的矩阵S。
根据矩阵S,对矩阵S中的各元素进行线性或非线性处理,可以获取两个目标机构的专利相似性X1
例如,可以根据如下公式计算两个目标机构的专利相似性
Figure BDA0002868121980000081
本发明实施例通过简化计算或者内容计算方法,获取两个目标机构的专利相似性,能更准确地描述机构公开的专利的相似性,从而能基于目标机构的专利相似性,能更全面、准确、客观地获取机构技术相似性。
基于上述各实施例的内容,获取两个目标机构的论文相似性具体包括:根据两个目标机构的各论文所属的分类,获取两个目标机构的技术相似性;或者,根据两个目标机构的各论文的内容,获取两个目标机构的技术相似性。
具体地,可以根据简化计算方法或内容计算方法,获取两个目标机构的论文相似性。
根据简化计算方法,获取两个目标机构的专利相似性具体包括:
根据每一目标机构的论文所属的分类,获取每一目标机构的论文特征向量;
根据两个目标机构的论文特征向量,获取两个目标机构的论文相似性。
具体地,可以根据各期刊公开的数据或论文数据搜索引擎等,获取上述两个目标机构发表的论文。
根据文献分类法(例如中国图书分类法),每一论文均有其所属的分类。
根据论文分类法获得的论文分类表有k个分类,分别为C1、……、Ck
对于第一目标机构(即机构A)公开的全部论文(机构A公开的全部论文的总数记为LA),将其中属于类C1的论文个数记为LA1,(若A没有论文落在C1类,那么LA1=0),以此类推,得到LA2、……、LAk
对于第一目标机构(即机构B)公开的全部论文(机构B公开的全部论文的总数记为LB),将其中属于类C1的论文个数记为LB1,(若B没有论文落在C1类,那么LB1=0),以此类推,得到LB2、……、LBk
将向量(LA1/LA,……,LAk/LA)和向量(LB1/LB,……,LBk/LB)分别作为两个目标机构的论文特征向量。
可以获取两个目标机构的论文特征向量之间的相似度,作为两个目标机构的论文相似性X2
向量之间的相似度,可以通过计算向量之间的余弦相似度、欧氏距离、汉明距离或马氏距离等获得。
优选地,本发明实施例通过获取两个目标机构的论文特征向量之间的余弦相似度,作为两个目标机构的论文相似性X2
根据内容计算方法,获取两个目标机构的论文相似性具体包括:
获取第一目标机构的每一论文与第二目标机构的每一论文之间的内容相似性;
根据第一目标机构的每一论文与第二目标机构的每一论文之间的内容相似性,获取两个目标机构的论文相似性。
具体地,
可以将机构A发表的全部论文记为{la1、……、lam},机构B发表的全部论文记为{lb1、……、lbn}。其中,m、n分别表示机构A和机构B发表的全部论文的总数。
对于lai和lbj(1≤i≤m,1≤j≤n),可以采用词袋法或者语义空间法等计算文本内容的相似性的方法,获取lai和lbj的文本内容之间的相似性,作为lai和lbj的内容相似度sij,从而可以得到一个m乘n的矩阵S。
根据矩阵S,对矩阵S中的各元素进行线性或非线性处理,可以获取两个目标机构的论文相似性X2
例如,可以根据如下公式计算两个目标机构的论文相似性
Figure BDA0002868121980000101
本发明实施例通过简化计算或者内容计算方法,获取两个目标机构的论文相似性,能更准确地描述机构公开的论文的相似性,从而能基于目标机构的论文相似性,能更全面、准确、客观地获取机构技术相似性。
基于上述各实施例的内容,获取两个目标机构的科研人员相似性具体包括:根据两个目标机构的各科研人员的各科技文献所属的分类,取两个目标机构的技术相似性;或者,根据两个目标机构的各科研人员的各科技文献的内容,获取两个目标机构的技术相似性。
具体地,可以获取第一目标机构每一科研人员的科技文献与第二目标机构的每一科研人员的科技文献之间的相似性。
可以预先获取两个目标机构的科研人员的名单。
可以根据网络***息和/或相关科技文献服务商提供的数据,获取每一目标机构每一科研人员的科技文献。
科研人员的科技文献,可以包括但不限于该科研人员发表或公开的论文、专利、标准、报告、图书和其他科技相关作品。
科研人员的科技文献,可以不限于该科研人员在当前目标机构发表或公开的科技文献。
对于机构A的每一科研人员U和机构B的每一科研人员V,可以将科研人员视为一个机构,根据上述简化计算或者内容计算方法,获取机构A的每一科研人员U的科技文献与机构B的每一科研人员V的科技文献之间的相似性。
机构A的每一科研人员U的科技文献与机构B的每一科研人员V的科技文献之间的相似性,可以视为科研人员U与科研人员V的技术相似性。
根据第一目标机构每一科研人员的科技文献与第二目标机构的每一科研人员的科技文献之间的相似性,获取两个目标机构的科研人员相似性。
根据第一目标机构每一科研人员的科技文献与第二目标机构的每一科研人员的科技文献之间的相似性,可以构造一个矩阵,矩阵中的元素表示第一目标机构的一个科研人员的科技文献与第二目标机构的一个科研人员的科技文献之间的相似性。
根据该矩阵,对该矩阵中的各元素进行线性或非线性处理,可以获取两个目标机构的科研人员相似性X3
本发明实施例根据两个目标机构的科研人员两两的科技文献之间的相似性,获取两个目标机构的科研人员相似性,能更准确地描述机构的科研人员的相似性,从而能基于目标机构的科研人员相似性,能更全面、准确、客观地获取机构技术相似性。
基于上述各实施例的内容,获取两个目标机构的产品相似性具体包括:根据两个目标机构的各产品的介绍文本的内容,获取两个目标机构的技术相似性。
具体地,可以根据内容计算方法,获取两个目标机构的产品相似性。
首先,获取第一目标机构的每一产品的介绍文本与第二目标机构的每一介绍文本之间的内容相似性。
可以根据网络***息,获取目标机构的各主要产品及该产品的介绍文本。
对于机构A的每一主要产品Y和机构B的每一主要产品Z,可以采用词袋法或者语义空间法等计算文本内容的相似性的方法,获取产品Y和产品Z的介绍文本之间的相似性,作为产品Y和产品Z的相似度,从而可以得到一个矩阵。
然后,根据第一目标机构的每一产品的介绍文本与第二目标机构的每一介绍文本之间的内容相似性,可以获取两个目标机构的产品相似性。
具体地,根据该矩阵,对该矩阵中的各元素进行线性或非线性处理,可以获取两个目标机构的产品相似性X4
本发明实施例通过内容计算方法,获取两个目标机构的产品相似性,能更准确地描述机构生产的产品的相似性,从而能基于目标机构的产品相似性,能更全面、准确、客观地获取机构技术相似性。
基于上述各实施例的内容,获取两个目标机构的组织结构相似性具体包括:根据两个目标机构的各内设部门所属的分类,获取两个目标机构的组织结构相似性。
具体地,可以根据简化计算方法,获取两个目标机构的组织结构相似性。
首先,根据每一目标机构的内设部门所属的分类,获取每一目标机构的组织结构特征向量。
可以根据网络***息等途径,获取上述两个目标机构内设部门的信息。
可以根据机构内常设部门的名称列表,合并类似的部分,形成一个机构分类表。
根据上述机构分类表获得有k个部门类,分别为C1、……、Ck
对于第一目标机构(即机构A),若存在属于部门类C1的内设部门,记QA1=1,否则,记QA1=0,以此类推,得到QA2、……、QAk
对于第二目标机构(即机构B),若存在属于部门类C1的内设部门,记QB1=1,否则,记QB1=0,以此类推,得到QB2、……、QBk
将向量(QA1,……,QAk)和向量(QB1,……,QBk)分别作为两个目标机构的组织结构特征向量。
然后,根据两个目标机构的组织结构特征向量,可以获取两个目标机构的组织结构相似性。
具体地,可以获取两个目标机构的组织结构特征向量之间的相似度,作为两个目标机构的组织结构相似性X5
向量之间的相似度,可以通过计算向量之间的余弦相似度、欧氏距离、汉明距离或马氏距离等获得。
优选地,本发明实施例通过获取两个目标机构的组织结构特征向量之间的余弦相似度,作为两个目标机构的组织结构相似性X5
本发明实施例通过简化计算,获取两个目标机构的组织结构相似性,能更准确地描述机构的组织结构的相似性,从而能基于目标机构的组织结构相似性,能更全面、准确、客观地获取机构技术相似性。
基于上述各实施例的内容,根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,获取两个目标机构的技术相似性具体包括:根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,以及预设的权重,获取两个目标机构的技术相似性。
具体地,可以预先为每一维度的相似度设置对应的权重,通过步骤S101获得至少两个维度的相似性之后,可以根据上述至少两个维度的相似性及其对应的权重,进行加权求和或加权平均,获取两个目标机构的技术相似性。
每一维度的相似度对应的权重,可以根据实际情况预先设置。
需要说明的是,可以根据人的经验进行设置,也可以根据人工标注的机构的技术相似性样本,采用回归的办法获取。
标注的样本样式如下:sim(A,B)=0.8。样本的相似度数值(即技术相似性),可以是经验值。
若采用专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性等五个维度进行融合,则机构A和机构B的技术相似性sim(A,B)的计算公式为
sim(A,B)=α1*X12*X23*X34*X45*X5
其中,X1、X2、X3、X4、X5分别表示机构A和机构B的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性;α1、α2、α3、α4、α5分别表示X1、X2、X3、X4、X5对应的权重。
本发明实施例根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,以及预设的权重,获取两个目标机构的技术相似性,能通过客观数据全面描述机构的相似性,能更全面、准确、客观地获取机构技术相似性,从而能提高相似机构查找的准确性和全面性。
图2为根据本发明实施例提供的获取机构技术相似性的装置的结构示意图。基于上述各实施例的内容,如图2所示,该装置包括维度相似获取模块201和综合相似获取模块202,其中:
维度相似获取模块201,用于获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个;
综合相似获取模块202,用于根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个,获取两个目标机构的技术相似性;
其中,两个目标机构包括第一目标机构和第二目标机构。
具体地,维度相似获取模块201和综合相似获取模块202电连接。
维度相似获取模块201可以从机构的科研产出文献(包括专利、论文和研究报告等)、科研人员、产品和组织结构等维度进行分析,获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少一个,以进行综合的技术相似性评估。
综合相似获取模块202可以对通过维度相似获取模块201获得的至少两个维度的相似性进行融合,通过组合计算,获取两个目标机构的技术相似性。
融合的方法,可以包括但不限于获取上述至少两个维度的相似性的最大值、平均值或加权平均值等作为两个目标机构的技术相似性。
需要说明的是,维度相似获取模块201可以包括专利子模块、论文子模块、科研人员子模块、产品子模块和组织结构子模块中的至少两个。
专利子模块可以包括第一简化计算单元,用于根据每一目标机构的专利所属的分类,获取每一目标机构的专利特征向量;根据两个目标机构的专利特征向量,获取两个目标机构的专利相似性。
专利子模块还可以包括第一内容计算单元,用于获取第一目标机构的每一专利与第二目标机构的每一专利之间的内容相似性;根据第一目标机构的每一专利与第二目标机构的每一专利之间的内容相似性,获取两个目标机构的专利相似性。
论文子模块可以包括第二简化计算单元,用于根据每一目标机构的论文所属的分类,获取每一目标机构的论文特征向量;根据两个目标机构的论文特征向量,获取两个目标机构的论文相似性。
论文子模块还可以包括第二内容计算单元,用于获取第一目标机构的每一论文与第二目标机构的每一论文之间的内容相似性;根据第一目标机构的每一论文与第二目标机构的每一论文之间的内容相似性,获取两个目标机构的论文相似性。
科研人员子模块,用于获取第一目标机构每一科研人员的科技文献与第二目标机构的每一科研人员的科技文献之间的相似性;根据第一目标机构每一科研人员的科技文献与第二目标机构的每一科研人员的科技文献之间的相似性,获取两个目标机构的科研人员相似性。
产品子模块,用于获取第一目标机构的每一产品的介绍文本与第二目标机构的每一介绍文本之间的内容相似性;根据第一目标机构的每一产品的介绍文本与第二目标机构的每一介绍文本之间的内容相似性,获取两个目标机构的产品相似性。
组织结构子模块,用于根据每一目标机构的内设部门所属的分类,获取每一目标机构的组织结构特征向量;根据两个目标机构的组织结构特征向量,获取两个目标机构的组织结构相似性。
综合相似获取模块202,具体用于根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,以及预设的权重,获取两个目标机构的技术相似性。
本发明实施例提供的获取机构技术相似性的装置,用于执行本发明上述各实施例提供的获取机构技术相似性的方法,该获取机构技术相似性的装置包括的各模块实现相应功能的具体方法和流程详见上述获取机构技术相似性的方法的实施例,此处不再赘述。
该获取机构技术相似性的装置用于前述各实施例的获取机构技术相似性的方法。因此,在前述各实施例中的获取机构技术相似性的方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
本发明实施例通过两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的至少两个,获取两个目标机构的技术相似性,能通过客观数据全面描述机构的相似性,能更全面、准确、客观地获取机构技术相似性,从而能提高相似机构查找的准确性和全面性。
图3为根据本发明实施例提供的电子设备的实体结构示意图。基于上述实施例的内容,如图3所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302和总线303;其中,处理器301和存储器302通过总线303完成相互间的通信;处理器301用于调用存储在存储器302中并可在处理器301上运行的计算机程序指令,以执行上述各方法实施例所提供的获取机构技术相似性的方法,例如包括:获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个;根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个,获取两个目标机构的技术相似性;其中,两个目标机构包括第一目标机构和第二目标机构。
本发明另一实施例公开一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的获取机构技术相似性的方法,例如包括:获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个;根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个,获取两个目标机构的技术相似性;其中,两个目标机构包括第一目标机构和第二目标机构。
此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明另一实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的获取机构技术相似性的方法,例如包括:获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个;根据两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个,获取两个目标机构的技术相似性;其中,两个目标机构包括第一目标机构和第二目标机构。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行上述各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种获取机构技术相似性的方法,其特征在于,包括:
获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个;
根据所述两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中的一个或多个,获取所述两个目标机构的技术相似性;
其中,所述两个目标机构包括第一目标机构和第二目标机构。
2.根据权利要求1所述的获取机构技术相似性的方法,其特征在于,获取所述两个目标机构的专利相似性具体包括:
根据所述两个目标机构的各专利所属的分类,获取所述两个目标机构的技术相似性;
或者,根据所述两个目标机构的各专利的内容,获取所述两个目标机构的技术相似性。
3.根据权利要求1所述的获取机构技术相似性的方法,其特征在于,获取所述两个目标机构的论文相似性具体包括:
根据所述两个目标机构的各论文所属的分类,获取所述两个目标机构的技术相似性;
或者,根据所述两个目标机构的各论文的内容,获取所述两个目标机构的技术相似性。
4.根据权利要求1所述的获取机构技术相似性的方法,其特征在于,获取所述两个目标机构的科研人员相似性具体包括:
根据所述两个目标机构的各科研人员的各科技文献所属的分类,取所述两个目标机构的技术相似性;
或者,根据所述两个目标机构的各科研人员的各科技文献的内容,获取所述两个目标机构的技术相似性。
5.根据权利要求1所述的获取机构技术相似性的方法,其特征在于,获取所述两个目标机构的产品相似性具体包括:
根据所述两个目标机构的各产品的介绍文本的内容,获取所述两个目标机构的技术相似性。
6.根据权利要求1所述的获取机构技术相似性的方法,其特征在于,获取所述两个目标机构的组织结构相似性具体包括:
根据所述两个目标机构的各内设部门所属的分类,获取所述两个目标机构的组织结构相似性。
7.根据权利要求1至6任一所述的获取机构技术相似性的方法,其特征在于,所述根据所述两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,获取所述两个目标机构的技术相似性具体包括:
根据所述两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,以及预设的权重,获取所述两个目标机构的技术相似性。
8.一种获取机构技术相似性的装置,其特征在于,包括:
维度相似获取模块,用于获取两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个;
综合相似获取模块,用于根据所述两个目标机构的专利相似性、论文相似性、科研人员相似性、产品相似性和组织结构相似性中至少两个,获取所述两个目标机构的技术相似性;
其中,所述两个目标机构包括第一目标机构和第二目标机构。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的获取机构技术相似性的方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的获取机构技术相似性的方法的步骤。
CN202011596692.2A 2020-12-29 2020-12-29 获取机构技术相似性的方法及装置 Pending CN112632954A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011596692.2A CN112632954A (zh) 2020-12-29 2020-12-29 获取机构技术相似性的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011596692.2A CN112632954A (zh) 2020-12-29 2020-12-29 获取机构技术相似性的方法及装置

Publications (1)

Publication Number Publication Date
CN112632954A true CN112632954A (zh) 2021-04-09

Family

ID=75286328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011596692.2A Pending CN112632954A (zh) 2020-12-29 2020-12-29 获取机构技术相似性的方法及装置

Country Status (1)

Country Link
CN (1) CN112632954A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312895A (zh) * 2021-05-20 2021-08-27 北京邮电大学 自治***as的组织机构映射方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060294060A1 (en) * 2003-09-30 2006-12-28 Hiroaki Masuyama Similarity calculation device and similarity calculation program
US20130031018A1 (en) * 2010-03-29 2013-01-31 Harald Jellum Method and arrangement for monitoring companies
CN103823880A (zh) * 2014-03-03 2014-05-28 国家认证认可监督管理委员会信息中心 一种基于属性加权计算检测机构相似度的方法
CN107908626A (zh) * 2016-12-30 2018-04-13 上海壹账通金融科技有限公司 公司相似度的计算方法及装置
CN111428152A (zh) * 2020-04-26 2020-07-17 中国烟草总公司郑州烟草研究院 一种科研人员相似社区的构建方法及装置
CN111597309A (zh) * 2020-05-25 2020-08-28 深圳市小满科技有限公司 相似企业推荐方法、装置、电子设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060294060A1 (en) * 2003-09-30 2006-12-28 Hiroaki Masuyama Similarity calculation device and similarity calculation program
US20130031018A1 (en) * 2010-03-29 2013-01-31 Harald Jellum Method and arrangement for monitoring companies
CN103823880A (zh) * 2014-03-03 2014-05-28 国家认证认可监督管理委员会信息中心 一种基于属性加权计算检测机构相似度的方法
CN107908626A (zh) * 2016-12-30 2018-04-13 上海壹账通金融科技有限公司 公司相似度的计算方法及装置
CN111428152A (zh) * 2020-04-26 2020-07-17 中国烟草总公司郑州烟草研究院 一种科研人员相似社区的构建方法及装置
CN111597309A (zh) * 2020-05-25 2020-08-28 深圳市小满科技有限公司 相似企业推荐方法、装置、电子设备及介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
卢向南等: "网络企业管理", vol. 1, 31 December 2001, 高等教育出版社, pages: 88 *
蔡虹等: "我国与主要创新型国家(地区)技术相似度的测算分析", 西安交通大学学报(社会科学版), vol. 29, no. 5, pages 1 - 6 *
谭龙等: "基于相似性指数的创新相似性模型构建及应用", 情报探索, no. 8, pages 9 - 15 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312895A (zh) * 2021-05-20 2021-08-27 北京邮电大学 自治***as的组织机构映射方法、装置及电子设备

Similar Documents

Publication Publication Date Title
Kilkenny et al. Data quality:“Garbage in–garbage out”
KR101658794B1 (ko) 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램
JP5952835B2 (ja) 撮像プロトコルの更新及び/又はリコメンダ
Saez Martin et al. An international analysis of the quality of open government data portals
US10438347B2 (en) Automated quality control of diagnostic radiology
Jho Challenges for e-governance: protests from civil society on the protection of privacy in e-government in Korea
JPWO2016125310A1 (ja) データ分析システムおよびデータ分析方法並びにデータ分析プログラム
Farrell Identifying mislabelled samples: machine learning models exceed human performance
US20210174968A1 (en) Visualization of Social Determinants of Health
Boye Can you stay home today? Parents’ occupations, relative resources and division of care leave for sick children
CN110752027B (zh) 电子病历数据推送方法、装置、计算机设备和存储介质
Riedl et al. Interlaboratory reproducibility of blood morphology using the digital microscope
CN112632954A (zh) 获取机构技术相似性的方法及装置
Göransson Registered nurse-led emergency department triage: organisation, allocation of acuity ratings and triage decision making
Aliverti Introduction: Special issue on ‘Policing, migration and national identity’
Campbell et al. The credibility of health economic models for health policy decision-making: the case of population screening for abdominal aortic aneurysm
Brady et al. Machine-learning algorithms to code public health spending accounts
Goswami et al. An effective machine learning framework for data elements extraction from the literature of anxiety outcome measures to build systematic review
CN116469505A (zh) 数据处理方法、装置、计算机设备及可读存储介质
Robert et al. Empirical derivation of correction factors for human spiral ganglion cell nucleus and nucleolus count units
JP6597421B2 (ja) プログラム、情報処理装置及び情報処理方法
Meaney et al. A Comparative Evaluation Of Transformer Models For De-Identification Of Clinical Text Data
Silva et al. Sampling bias in ethnobotanical studies on medicinal plants conducted in local markets
CN110310208B (zh) 项目赔审申请处理方法及装置
Maronpot A monograph on histomorphologic evaluation of lymphoid organs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination