CN106844665B - 一种基于引用关系分布式表达的论文推荐方法 - Google Patents
一种基于引用关系分布式表达的论文推荐方法 Download PDFInfo
- Publication number
- CN106844665B CN106844665B CN201710051673.3A CN201710051673A CN106844665B CN 106844665 B CN106844665 B CN 106844665B CN 201710051673 A CN201710051673 A CN 201710051673A CN 106844665 B CN106844665 B CN 106844665B
- Authority
- CN
- China
- Prior art keywords
- paper
- matrix
- papers
- node
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 93
- 239000013598 vector Substances 0.000 claims abstract description 56
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 19
- 238000011478 gradient descent method Methods 0.000 claims description 13
- 238000012546 transfer Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 abstract 1
- 238000001914 filtration Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/382—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using citations
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于引用关系分布式表达的论文推荐方法。利用分布式向量来表达论文在权重引用网络当中的上下文,然后利用该向量计算论文之间的相似度,达到论文推荐的目的。之前的基于引用的论文推荐的方法,都局限于使用论文引用和被引用的论文集合的重合度,对于重合度为0的论文之间无法计算相似度。本发明通过论文之间的权重引用网络,充分利用了论文之间“间接引用”的信息,再使用矩阵分解方法,获得表达论文在引用网络中的位置的分布式向量,使用其内积作为论文之间的相似度表达。该分布式表达可以用来作为学术推荐***的一种基准特征,能够妥善的解决现有模型存在的问题,并且能够进一步的提高相似度度量的正确性。
Description
技术领域
本发明涉及推荐技术领域,特别是涉及一种基于引用关系分布式表达的论文推荐方法。
背景技术
学术推荐***作为学术服务的重要一环,已经被引入到很多学术搜索引擎***当中,比如CiteSeerX,Google Scholar,PubMed等等。通过学术推荐***,研究者会被推荐与其现有研究论文相关的其他论文,研究者可以检查他们引用资料的完整性,节省搜寻相关工作的人力,快速接触到自己领域的新论文。
推荐***的本质就是为特定的用户猜测感兴趣的特定的物品并推送。根据推荐基于信息的不同,主要分为基于内容的推荐,基于协同过滤的推荐,社会化推荐和混合模型推荐。在论文的推荐***当中,存在着一种特殊的基于引用的推荐。论文的引用表示该论文对于前人所做过的工作的***的调研和追索,包括对其研究课题的整个历史、现状和发展趋势的一个总体的资料集合。引用支持论据有助于增加学术论文的可信度。两篇论文的引用的相似度越高,这两篇论文在课题上,内容上的相似性就越高。随着科研水平的提高,论文的数量与论文之间的引用数量也逐年呈指数式的增长,如何利用论文的引用信息来获得论文推荐的信息,成为一个令学术推荐***研究者们愈加重视的课题。
现有的基于论文引用信息来提供推荐信息的工作,其中的代表模型有传统的引用预测模型与协同过滤模型,都局限于使用论文引用和被引用的论文集合的重合度,对于重合度为0的论文之间无法计算相似度。同时忽略了论文之间“间接引用”的可用信息。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提供一种基于引用关系分布式表达的论文推荐方法。该方法利用论文之间的引用网络,以及分布式向量表达论文在引用网络中的位置,使用内积作为论文之间的相似度表达,达到论文推荐的目的。
为解决上述技术问题,本发明的技术方案如下:
一种基于引用关系分布式表达的论文推荐方法,包括以下步骤:
步骤1:基于所有待研究论文生成ID字典,即为每篇论文赋予一个唯一的索引键,同时利用论文的相互引用关系生成论文引用网络,并建立论文引用权重矩阵M,权重矩阵M是基于论文索引标识构建的n行n列的矩阵;
步骤2:使用最小化代价函数的方法,对权重矩阵M做矩阵分解,将矩阵 M拟合成W*T的形式,其中W是n行m列的矩阵,T是m行n列的矩阵;其中m<n,以达到降维的作用;用随机梯度下降法求出W和T矩阵;其中W的行向量与T的列向量等价地包含了每篇论文的分布式向量的表达,且互为对偶;使用W的行向量来作为分布式向量,其中第i行表示论文索引键i所代表的论文的分布式向量的表达;
步骤3:通过分布式向量之间的内积,计算出两篇论文之间的基于引用的相似度值;
步骤4:对候选论文按照计算出的相似度从大到小排序,得到作为论文推荐的排序列表。
优选的,步骤1中:获取所有待研究论文集合S,生成对应的ID字典,即为每篇论文赋予一个唯一的索引键,索引键用于标识论文,索引键值包括论文的元信息,如论文名称、作者、发表期刊,年份等。
优选的,步骤1中:使用论文引用的解析器迭代读取各篇论文的引用,与对应在集合S的其他论文建立一致性关联,并且建立无向图,其中每个节点代表论文,节点之间的连线代表两篇论文之间存在引用关系;该无向图即为建立的论文引用网络。
优选的,其中步骤1,由论文引用网络建立n行n列的连接矩阵L,其中Lij为连接矩阵L中的第i行第j列的元素,Lij表示论文i和论文j之间是否存在引用关系,由论文引用网络中对应两点i和j是否存在连线能够得出,当论文在引用网络中对应的两点i和j相互连接时,Lij=1,表示论文i和论文j之间存在引用关系,Lij=0 表示论文i和论文j之间不存在引用关系;根据该连接矩阵L生成转移矩阵A;其中转移矩阵A中第i行第j列的元素Aij基于下式确定:
其中Aij表示从节点i随机移动转移到节点j的概率值,n’表示所有待研究论文的数量;矩阵A建立起了有直接引用关系的论文的信息,在此基础上继续构建,获得间接引用的论文之间的联系,例如在论文a和论文b共同引用论文c、共同被论文d引用、论文a引用论文c,论文c引用论文b的情况下,构建论文a和论文b之间的引用关系,以丰富论文引用权重矩阵的信息;
A的t次幂At矩阵的值代表从节点i出发随机移动,在第t步到达节点j的概率,设讨论的步长范围为w时,那么计算生成矩阵其矩阵B中的元素Bij代表从节点i出发随机移动,在w步之内到达节点j的期望次数,其中, w为正整数;
优选的,其中步骤2,使用SGD随机梯度下降法最小化代价函数其中表示矩阵W的第j列,是矩阵W第i行向量的转置,是一个列向量;通过最优化该代价函数,能够使W*T拟合矩阵M; f(i,j)表示学习权重函数,表示所有节点间的关系对结果的影响程度不同,设为: f(i,j)=Mij。;SGD随机梯度下降法是对于J中的加和项的每一项进行迭代,计算梯度,迭代最小化代价函数;采用SGD随机梯度下降法求解该最小化代价函数的无约束最优化问题,得到解
W=[w0,w1,w2,…,wn-1]T。
优选的,其中步骤3:正则化矩阵W中各个节点的分布式向量,再采用公式S(i,j)=wi·wj计算节点i和节点j的相似度S(i,j)的,根据向量夹角计算公式当向量长度正则化为1时,wi·wj的结果越大,在节点i和j的分布式向量之间的角度就越小,两个节点对应的论文就会越相似,反之亦然。
与现有技术相比,本发明技术方案的有益效果是:本发明通过论文引用关系构建论文权重引用网络与对应矩阵表示,从而保留了论文之间“间接引用”的信息。然后,利用矩阵分解方法来获得表达论文在论文权重引用网络的上下文的分布式向量,然后利用该向量计算论文之间的相似度,达到论文推荐的目的。
附图说明
图1为基于引用关系分布式表达的论文推荐方法的流程图。
图2为发明实施例中已生成论文引用网络的简单示意图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明基于引用关系分布式表达的论文推荐方法的流程图。如图1所示,新推荐方法的设计如下:
S1:以所有待研究论文生成ID字典,生成论文引用网络。
对S1进一步说明:在上述技术方案中,步骤1中论文引用网络建立方式如下:生成所有待研究论文集合S之后,生成对应的ID字典。使用论文引用的解析器迭代读取各篇论文的引用,与对应在集合S的其他论文建立一致性关联。并且建立无向图,该无向图的表示方式为数据库的两两连接表形式。其中每个节点代表论文,节点之间的连线代表两篇论文之间存在引用关系。该无向图为建立的论文引用网络。
S2:建立论文引用权重矩阵;该权重表达了论文引用网络的全部内容。
对S2进一步说明:首先由论文引用网络建立连接矩阵L,其中连接矩阵L中的元素Lij表示论文i和论文j之间是否存在引用关系,Lij=0或1,1表示论文i和论文j之间存在引用关系,0表示论文i和论文j之间不存在引用关系。然后根据该连接矩阵生成转移矩阵A其中转移矩阵A中第i行第j列的元素Aij基于下式确定:
其中Aij表示从节点i随机移动转移到节点j的概率值,n’表示所有待研究论文的数量。矩阵A建立起了有直接引用关系的论文的信息,在此基础上继续构建,获得间接引用的论文之间的联系,例如在论文a和论文b共同引用论文c、共同被论文d引用、论文a引用论文c,论文c引用论文b的情况下,构建论文a和论文b之间的引用关系,以丰富论文引用权重矩阵的信息;
其中,A的t次幂At矩阵的值代表从节点i出发随机移动,在第t步到达节点j的概率,设用于讨论的步长范围为w时的情况,那么计算生成矩阵其矩阵B中的元素Bij代表从节点i出发随机移动,在w步之内到达节点j的期望次数,其中,w为正整数;
构造论文引用权重矩阵M中的元素α为常量,且α+min(log(Bij))>0,即调整M中有值的各项,使之大于0,Mij表示节点i对节点j的权重,Mij越高,表示论文之间的联系愈紧密,权重矩阵M是基于论文索引标识构建的n行n列的矩阵。
S3:通过对矩阵M做矩阵分解,用随机梯度下降法求出W矩阵,使得 M=W*T成立;其中W是n行m列的矩阵,T是m行n列的矩阵;其中m<n,以达到降维的作用;用随机梯度下降法求出W和T矩阵;其中W的行向量与T 的列向量等价地包含了每篇论文的分布式向量的表达,且互为对偶;使用W的行向量作为分布式向量,其中第i行表示论文索引键i所代表的论文的分布式向量的表达。
对S3进一步说明:使用SGD随机梯度下降法最小化代价函数
其中表示矩阵W的第j列,是矩阵W第i行向量的转置,是一个列向量;通过最优化该代价函数,能够使W*T拟合矩阵M; f(i,j)表示学习权重函数,表示所有节点间的关系对结果的影响程度不同,设为: f(i,j)=Mij。;SGD随机梯度下降法是对于J中的加和项的每一项进行迭代,计算梯度,迭代最小化代价函数;采用SGD随机梯度下降法求解该最小化代价函数的无约束最优化问题,得到解
W=[w0,w1,w2,…,wn-1]T。
S4:通过W的行向量之间的内积,可以计算出两篇论文之间的基于引用的相似度值。
对S4进一步说明:首先正则化矩阵W中各个节点的分布式向量,再采用公式S(i,j)=wi·wj计算节点i和节点j的相似度S(i,j)的,根据向量夹角计算公式当向量长度正则化为1时,wi·wj的结果越大,在节点i和j的分布式向量之间的角度就越小,两个节点对应的论文就会越相似,反之亦然。
S5:对候选论文按照计算出的相似度从大到小排序,可以作为论文推荐的排序列表。
构造论文引用权重矩阵的简单实例如下:假设已生成论文引用网络如下,如图2;其中Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ分别代表论文的标号。节点之间的连接代表两篇论文之间存在引用关系。由此,可以构建连接矩阵L为:
按照连接矩阵建立起来的转移概率矩阵A为:
然后计算论文引用权重矩阵B可以让间接连接的节点之间的引用权重大于0。B的每个行向量都代表对应的论文在引用网络中与其他论文的相互引用的情况,其中包括了直接引用的部分,以及间接引用的部分。当两个论文的对应行向量的内积越相似,就说明这两篇论文的引用情况越相似,其内容就越可能相似。接下来通过二次代价函数最小化的方式,将原矩阵拟合成M=W*T的形式。从而对原论文引用权重矩阵M进行降维处理,获得矩阵W,其中每一行包括论文对应的分布式向量Wi,其维度为m<n。计算分布式向量之间Wi的内积,能够近似的表达了论文之间的引用相似度,乃至于内容相似度。
在本实施例中,构造论文引用权重矩阵的实例如下:提取了PubMed医学数据库中的252673篇论文,建立起对应的ID字典。使用引用提取工具对各篇论文进行迭代,抽取了9379146条引用条目,通过对比引用与论文的标题,发表日期,作者等元信息。建立起了引用和论文的一致性关联。基于此关联,构建连接矩阵 L,生成论文引用网络。按照详细步骤给出的计算方法,通过连接矩阵L计算转移概率矩阵A,然后计算引入了间接引用信息的转移矩阵通过B 得到论文引用权重矩阵M。M中间接连接的节点之间的引用权重大于0,每个行向量都代表对应的论文在引用网络中与其他论文的相互引用的情况,其中包括了直接引用的部分,以及间接引用的部分。当两个论文的对应行向量的内积越相似,就说明这两篇论文的引用情况越相似,其内容就越可能相似。接下来通过二次代价函数最小化的方式,将原矩阵拟合成M=W*T的形式。从而对原论文引用权重矩阵M进行降维处理,获得维度m=500的分布式向量Wi,Wi对应于W中的每一行。分布式向量的内积,能够近似的表达了论文之间的引用相似度,乃至于内容相似度。至此,给出任意一篇论文,都可以通过对比该论文的分布式向量与其他论文分布式向量的内积的大小,按照从高到低进行排序,推荐根据引用关系最为相似的论文序列。
本发明实施例中,利用论文之间的引用网络,利用分布式向量表达论文在引用网络中的位置,使用内积作为论文之间的相似度表达,能够妥善的解决现有的基于论文引用信息的模型对于重合度为0的论文之间无法计算相似度的问题。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (6)
1.一种基于引用关系分布式表达的论文推荐方法,其特征在于,包括以下步骤:
步骤1:基于所有待研究论文生成ID字典,即为每篇论文赋予一个唯一的索引键,同时利用论文的相互引用关系生成论文引用网络,并建立论文引用权重矩阵M,权重矩阵M是基于论文索引标识构建的n行n列的矩阵;
步骤2:使用最小化代价函数的方法,对权重矩阵M做矩阵分解,将矩阵M拟合成W*T的形式,其中W是n行m列的矩阵,T是m行n列的矩阵;其中m<n,以达到降维的作用;用随机梯度下降法求出W和T矩阵;其中W的行向量与T的列向量等价地包含了每篇论文的分布式向量的表达,且互为对偶;使用W的行向量来作为分布式向量,其中第i行表示论文索引键i所代表的论文的分布式向量的表达;
步骤3:通过分布式向量之间的内积,计算出两篇论文之间的基于引用的相似度值;
步骤4:对候选论文按照计算出的相似度从大到小排序,得到作为论文推荐的排序列表。
2.如权利要求1所述的方法,其特征在于,步骤1中:获取所有待研究论文集合S,生成对应的ID字典,即为每篇论文赋予一个唯一的索引键,索引键用于标识论文,索引键值包括论文的元信息。
3.如权利要求2所述的方法,其特征在于,步骤1中:使用论文引用的解析器迭代读取各篇论文的引用,与对应在集合S的其他论文建立一致性关联,并且建立无向图,其中每个节点代表论文,节点之间的连线代表两篇论文之间存在引用关系;该无向图即为建立的论文引用网络。
4.如权利要求1或3所述的方法,其特征在于,其中步骤1,由论文引用网络建立n行n列的连接矩阵L,其中Lij为连接矩阵L中的第i行第j列的元素,Lij表示论文i和论文j之间是否存在引用关系,由论文引用网络中对应两点i和j是否存在连线能够得出,当论文在引用网络中对应的两点i和j相互连接时,Lij=1,表示论文i和论文j之间存在引用关系,Lij=0表示论文i和论文j之间不存在引用关系;根据该连接矩阵L生成转移矩阵A;其中转移矩阵A中第i行第j列的元素Aij基于下式确定:
其中Aij表示从节点i随机移动转移到节点j的概率值,n’表示所有待研究论文的数量;矩阵A建立起了有直接引用关系的论文的信息,在此基础上继续构建,获得间接引用的论文之间的联系;
A的t次幂At矩阵的值代表从节点i出发随机移动,在第t步到达节点j的概率,设讨论的步长范围为w时,那么计算生成矩阵其矩阵B中的元素Bij代表从节点i出发随机移动,在w步之内到达节点j的期望次数,其中w为正整数;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710051673.3A CN106844665B (zh) | 2017-01-20 | 2017-01-20 | 一种基于引用关系分布式表达的论文推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710051673.3A CN106844665B (zh) | 2017-01-20 | 2017-01-20 | 一种基于引用关系分布式表达的论文推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106844665A CN106844665A (zh) | 2017-06-13 |
CN106844665B true CN106844665B (zh) | 2020-05-08 |
Family
ID=59120941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710051673.3A Active CN106844665B (zh) | 2017-01-20 | 2017-01-20 | 一种基于引用关系分布式表达的论文推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106844665B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108171401A (zh) * | 2017-12-11 | 2018-06-15 | 中国科学院大学 | 一种科研人员的推荐方法及*** |
CN108052485B (zh) * | 2017-12-15 | 2021-05-07 | 东软集团股份有限公司 | 向量相似度的分布式计算方法和装置,存储介质和节点 |
CN108763328B (zh) * | 2018-05-08 | 2019-05-14 | 北京市科学技术情报研究所 | 一种基于黄金引用算法的论文推荐方法 |
CN108846019B (zh) * | 2018-05-08 | 2019-05-21 | 北京市科学技术情报研究所 | 一种基于黄金引用算法的论文排序方法 |
CN108763367B (zh) * | 2018-05-17 | 2020-07-10 | 南京大学 | 一种基于深度对齐矩阵分解模型进行学术论文推荐的方法 |
CN110209922B (zh) * | 2018-06-12 | 2023-11-10 | 中国科学院自动化研究所 | 对象推荐方法、装置、存储介质及计算机设备 |
CN109255122B (zh) * | 2018-08-06 | 2023-07-11 | 浙江工业大学 | 一种对论文引用关系分类标记的方法 |
CN109376218B (zh) * | 2018-09-14 | 2020-12-11 | 大连理工大学 | 一种基于级联的论文影响力评估方法 |
CN110688474B (zh) * | 2019-09-03 | 2023-03-14 | 西北工业大学 | 基于深度学习与链接预测的嵌入表示获得及引文推荐方法 |
CN113158041B (zh) * | 2021-04-19 | 2022-07-29 | 电子科技大学 | 一种基于多属性特征的文章推荐方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440329A (zh) * | 2013-09-04 | 2013-12-11 | 北京邮电大学 | 权威作者和高质量论文推荐***和推荐方法 |
CN103559262A (zh) * | 2013-11-04 | 2014-02-05 | 北京邮电大学 | 基于社区的作者及其学术论文推荐***和推荐方法 |
-
2017
- 2017-01-20 CN CN201710051673.3A patent/CN106844665B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440329A (zh) * | 2013-09-04 | 2013-12-11 | 北京邮电大学 | 权威作者和高质量论文推荐***和推荐方法 |
CN103559262A (zh) * | 2013-11-04 | 2014-02-05 | 北京邮电大学 | 基于社区的作者及其学术论文推荐***和推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106844665A (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106844665B (zh) | 一种基于引用关系分布式表达的论文推荐方法 | |
Kim et al. | Latent multi-group membership graph model | |
CN108681557B (zh) | 基于自扩充表示和相似双向约束的短文本主题发现方法及*** | |
CN106980648A (zh) | 一种基于概率矩阵分解结合相似度的个性化推荐方法 | |
Makiyama et al. | Text Mining Applied to SQL Queries: A Case Study for the SDSS SkyServer. | |
Kong et al. | Entity matching across multiple heterogeneous data sources | |
CN104050302A (zh) | 一种基于图谱模型的话题探测*** | |
Noel et al. | Applicability of Latent Dirichlet Allocation to multi-disk search | |
CN107609469A (zh) | 社会网络关联用户挖掘方法及*** | |
de Araujo et al. | Tensorcast: Forecasting with context using coupled tensors (best paper award) | |
Shi et al. | Consistent and powerful graph-based change-point test for high-dimensional data | |
Brochier et al. | Impact of the query set on the evaluation of expert finding systems | |
Zhang et al. | Multi-type co-clustering of general heterogeneous information networks via nonnegative matrix tri-factorization | |
Ebrahimi et al. | Developing a prediction model for author collaboration in bioinformatics research using graph mining techniques and big data applications | |
Dendek et al. | Evaluation of features for author name disambiguation using linear support vector machines | |
Saha et al. | A large scale study of SVM based methods for abstract screening in systematic reviews | |
CN110262906B (zh) | 接口标签推荐方法、装置、存储介质和电子设备 | |
Rizun et al. | The method of a two-level text-meaning similarity approximation of the customers’ opinions | |
Padmanabhan et al. | Multi-label classification from multiple noisy sources using topic models | |
US8886651B1 (en) | Thematic clustering | |
Wang et al. | Dynamic relational topic model for social network analysis with noisy links | |
López-Iñesta et al. | Classification similarity learning using feature-based and distance-based representations: A comparative study | |
Froud et al. | Agglomerative hierarchical clustering techniques for arabic documents | |
Cherman et al. | Active learning algorithms for multi-label data | |
Sakaji et al. | Verification of Data Similarity using Metadata on a Data Exchange Platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |