CN106201465B - 面向开源社区的软件项目个性化推荐方法 - Google Patents
面向开源社区的软件项目个性化推荐方法 Download PDFInfo
- Publication number
- CN106201465B CN106201465B CN201610486067.XA CN201610486067A CN106201465B CN 106201465 B CN106201465 B CN 106201465B CN 201610486067 A CN201610486067 A CN 201610486067A CN 106201465 B CN106201465 B CN 106201465B
- Authority
- CN
- China
- Prior art keywords
- user
- item
- items
- project
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/10—Requirements analysis; Specification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及面向开源社区的软件项目个性化推荐方法。本发明对项目内容进行TF‑IDF特征抽取,结合用户对已知项目评价,推荐结合用户个性和项目需求的相似项目,并针对用户个性,通过ALS协同过滤计算候选推荐结果,使用词频‑逆文本频率计算每个项目特征,按其相似性计算候选推荐结果,将两者推荐结果线性组合,进行过滤和排名,产生推荐结果。本发明克服了过去推荐技术不能完全体现项目特征,粒度不细,准确率不高等缺陷。本发明从用户对已知项目评分和项目内容角度推荐出针对用户个性和项目内容的相似项目,准确地推荐出了与用户所在开发的项目类似的项目内容,实现了个性化推荐功能,为用户参考或重用提供便利,提高了开发人员搜索项目的效率。
Description
技术领域
本发明属于软件维护推荐领域,特别涉及面向开源社区的软件项目个性化推荐方法。
背景技术
由于软件项目众多,根据目前最大的开源软件社区--Github统计,截止到2016年,Github已经有超过1400万注册用户和3500万代码仓库。而截至2014年,Github上就有68个仓库stars数超过了10000个,有10个仓库的forks数超过了8000数,forks数大于1的仓库有944872个。可见软件的分布式开发方式已成趋势,开发者个性不同,对项目的需求不一,若没有良好的推荐机制,会出现严重的人力资源浪费等问题。根据用户个性和项目需要推荐相似项目的推荐任务急需要解决。
在本发明作出之前,目前的投入使用的推荐技术并不成熟,对于一些热门项目,开源社区只将项目按用户关注度进行排名,并没有考虑到开发者的针对性。而对于一些冷门项目,只将项目按语言,开发者进行分类,之后便直接投放在互联网中。这就使一些有价值的项目没有受关注的机会,因为参与人员较少,无法继续开发,这就造成了大量有价值的项目流失。而在研究领域,大多技术只是对项目描述做语义分析,以此作为基于项目内容推荐的依据,但这一做法并不能完全体现项目特征。一些项目的描述文件只有寥寥几句,要想真正了解项目,还需要分析项目代码。也有的技术可以根据开发者所擅长的语言做个性化推荐。但这一做法粒度不细,在同一语言中,也会分很多种开发方向。同时,若开发者擅长一个开发方向,也很可能会这一开发方向的多种语言。而这种粗粒度的推荐不仅准确率不高,而且还会给开发者留下不信任的印象,进一步加重了人力资源的浪费。因此,不仅要结合项目源代码分析出项目特征,还要根据开发者的行为分析出开发者的隐藏个性,结合两者,将合适的项目推荐出来。
发明内容
本发明的目的就在于克服上述缺陷,研制面向开源社区的软件项目个性化推荐方法。
本发明的技术方案是:
面向开源社区的软件项目个性化推荐方法,其主要技术特征在于如下步骤:(1).提取用户行为的特征向量,针对软件协作开发领域中用户产生的标记——star,跟踪——watch,复制——fork和用户正在开发项目的行为进行提取,并对用户的上述行为赋予权重,分别为1-标记、3-跟踪、5-复制、7-正在开发,统一标示并组成用户特征向量;
(2).软件项目的内容进行分类过滤处理,由于软件项目中包含许多类型的文件,例如:源代码文件、二进制文件、项目介绍文档,需要分类过滤,针对二进制文件,通过连续的ASCII码提取出文字;针对项目介绍文档,通过分词技术提取出单词;针对源代码文件,通过分词先提炼出单词,再将一些停用词过滤,得到每个项目的所有单词;
(3).以步骤2中的过滤结果为输入,进行非结构化的特征处理,即使用词频-逆文档频率TF-IDF方法提取每个项目的关键词作为项目的特征向量,TF-IDF是处理自然语言的一种常用方法,词频TF表现了一个单词在一个项目中出现的频繁程度,每个项目的长短有别,需要对词频标准化,逆文档频率IDF表现了一个单词在一个项目中的重要程度,反应了项目的特性,TF×IDF得出各个单词对每个项目的重要性;
(4).根据已有数据进行ALS协同过滤的推荐,以步骤1中用户对项目的评分矩阵作为ALS协同过滤的输入,根据用户对已经评价过的几个项目预测用户对每个项目的需求程度,即通过矩阵分解的方法,将用户-项目评分矩阵X转化为用户-隐因子A与隐因子-项目矩阵B,通过交替最小二乘法ALS完成两个矩阵的填充,同时尽量满足用户-项目评分矩阵X,再由A×B得到用户-项目评分的预测矩阵X′;
(5).根据已有数据进行基于项目内容的推荐,即以步骤1所提供的用户数据和步骤3所提供的项目特征作为内容推荐模型的输入,根据用户目前对每一特征的需求程度来判断新项目的需求程度,并将项目中的关键词权重作为项目的特征,在通过项目特征向量通过余弦相似度计算出项目间的相似度,公式为pi表示项目P1的单词表所组成的向量;给用户推荐和他历史上需求的项目内容相似的项目,计算公式为quj=∑i∈N(u)∩S(j,k)wjirui,N(u)是用户需求项目的集合,Sj,k是和项目j最相似的K个项目的集合,rui是用户u对项目i的评价,同步骤1;
(6).将步骤4和步骤5的结果做线性组合操作,并结合项目内容推荐的准确性和ALS推荐所体现的个性化的要求,采用公式lui=0.618×pui+0.382×qui,得出最终的用户评分;
(7).对步骤6的结果进行过滤和排名,即根据每个项目的得分进行排名,同时滤去用户已知项目,产生Top10推荐;
(8).对步骤7的Top10项目进行解释,即根据步骤3中这些项目自身的TF-IDF信息中的前几位结果给项目打上标签,作为最终推荐结果;例如向用户U1推荐项目P1,而单词w1,w3,w6在P1中最具代表性,则将单词w1,w3,w6作为P1的标签。
一种面向开源社区的软件项目个性化推荐技术,主要用于对项目内容进行TF-IDF特征抽取,结合用户对已知项目的评价,能够给用户推荐出与用户最感兴趣的项目内容相似、准确的,并符合用户个性,能力,可参与开发的项目。
技术方案:本发明的方法是在推荐相关项目时,一方面针对用户个性,通过ALS协同过滤计算候选推荐结果。另一方面,使用词频-逆文本频率计算每个项目特征,按项目特征的相似性计算候选推荐结果。接着将两者推荐结果线性组合,进行过滤和排名,产生推荐结果。最后按词频-逆文本频率作为标签为推荐结果做出合理解释。
词频-逆文本频率(Term Frequency-Inverse Document Frequency,简称TF-IDF)是一种用于资讯检索与文本挖掘的常用加权技术。该模型可以对项目中出现的所有单词做出重要性评价。更全面的反应一个项目的特征。我们将单词组成向量,通过余弦相似性可以计算出项目之间的相似度。
ALS(Alternating Least Squares)协同过滤是一种通过矩阵来预测一个用户对一个项目的评分的推荐技术。该模型可以将用户-项目矩阵通过机器学习,分解为用户-隐属性、隐属性-项目两个矩阵。我们根据ALS可以预测出用户对其还不了解的项目评分。再结合之前的项目相似的结果,将两结果线性结合,即可做出用户个性和项目需要的推荐。
本发明的优点和效果在于从用户对已知项目评分和项目内容角度推荐出针对用户个性和项目内容的相似项目。此方法不仅更准确地推荐出了与用户所在开发的项目类似的项目内容,而且利用用户对已知项目的评分矩阵实现了个性化推荐功能,为用户接下来的参考或重用提供便利,更有效提高了开发人员搜索项目的效率。主要由如下一些优点:
(1)覆盖率和准确率。目前的软件推荐方式只能根据项目介绍文档提取关键词,存在着不全面和不准确两个问题。此方法通过TF-IDF模型能够根据项目各类文件提取项目特征并进行项目相似度的计算。为用户提供准确丰富的推荐信息。
(2)易用性。整套算法静默式的完成,只对用户的行为进行特征提取。随后就可以利用ALS算法预测用户对每一项目的评价。降低了软件开发的门槛,使没有多少项目开发经验的开发人员也能搜索到对自己有帮助的项目。
(3)高效和可拓展性。整套算法除了步骤7,步骤8,其他步骤都可以并行实现,针对拥有大量用户和项目实例的场合,此算法仍然有可靠推荐效果。
(4)可解释性。通过对每个项目的TF-IDF关键词提取,可以对推荐结果以标签形式进行解释。也方便用户快速判断和选择自己所需要进一步了解的项目。
(5)个性化。ALS协同过滤模型分析了用户行为矩阵,一定程度上反应了用户的个性化行为,而推荐的结果自然就考虑到用户个性化因素。
附图说明
图1——本发明的流程示意图。
图2——本发明的文件过滤流程图
图3——本发明的TF-IDF特征提取原理图
图4——本发明的ALS协同过滤原理图
图5——本发明的基于项目内容原理图
具体实施方式
本发明的技术思路是:
对项目内容进行TF-IDF特征抽取,结合用户对已知项目的评价,给用户推荐结合用户个性和项目需求的相似项目。在推荐相关项目时,一方面针对用户个性,通过ALS协同过滤计算候选推荐结果。另一方面,使用词频-逆文本频率计算每个项目特征,按项目特征的相似性计算候选推荐结果。接着将两者推荐结果线性组合,进行过滤和排名,产生推荐结果。最后按词频-逆文本频率作为标签为推荐结果做出合理解释。如图1所示。
词频-逆文本频率(Term Frequency-Inverse Document Frequency,简称TF-IDF)是一种用于资讯检索与文本挖掘的常用加权技术。该模型可以对项目中出现的所有单词做出重要性评价。更全面的反应一个项目的特征。我们将单词组成向量,通过余弦相似性可以计算出项目之间的相似度。
ALS(Alternating Least Squares)协同过滤是一种通过矩阵来预测一个用户对一个项目的评分的推荐技术。该模型可以将用户-项目矩阵通过机器学习,分解为用户-隐属性、隐属性-项目两个矩阵。我们根据ALS可以预测出用户对其还不了解的项目评分。再结合之前的项目相似的结果,将两结果线性结合,即可做出用户个性和项目需要的推荐。
本发明具体说明如下。
步骤(1).提取用户行为的特征向量。针对软件协作开发领域中用户产生的标记——star,跟踪——watch,复制——fork和用户正在开发项目的行为进行提取,并对用户的上述行为赋予权重,分别为1——标记、3——跟踪、5——复制、7——正在开发。统一标示并组成用户特征向量。统一标示并组成用户特征向量。如下表所示。rij表示用户i对项目j的评价。
User id | Project name | Behavior | Behavior weight |
U1 | P1 | Watch | r<sub>11</sub> |
U2 | P2 | Star | r<sub>12</sub> |
…… | …… | …… | …… |
Un | P2 | Fork | r<sub>n2</sub> |
步骤(2).软件项目的内容进行分类过滤处理。如图2所示。由于软件项目中包含许多类型的文件,例如:源代码文件、二进制文件、项目介绍文档等。所以需要分类过滤,针对二进制文件,通过连续的ASCII码提取出文字;针对项目介绍文档,通过切词技术提取数单词;针对源代码文件,通过单词切片技术先提炼出单词,再将一些停用词过滤。得到每个项目的所有单词。过滤流程过滤后结果如下表。
Project name | Words |
P1 | P1Word1,P1Word2,…,P1Wordm |
…… | …… |
Pn | PkWord1,PkWord2,….,PkWordm |
步骤(3).以步骤(2)中的过滤结果为输入,进行非结构化的特征处理,处理流程如图3所示。即使用TF-IDF(Term Frequency-Inverse Document Frequency)方法提取每个项目的关键词作为项目的特征向量。TF-IDF是处理自然语言的一种常用方法。词频(TF)表现了一个单词在一个项目中出现的频繁程度。考虑到每个项目的长短有别,需要对词频标准化。逆文档频率(IDF)表现了一个单词在一个项目中的重要程度,反应了项目的特性。TF×IDF得出各个单词对每个项目的重要性。如下表所示。dij表示项目i上单词j的重要性。通过步骤2、步骤3的转化,项目内容的特征可以用单词的TF-IDF向量准确概括。最大程度的保证了项目特征信息的不丢失。保证了步骤5的基于项目内容推荐的准确性。也为推荐内容的解释做准备。
Word1 | Word2 | …… | Word m | |
P1 | d<sub>11</sub> | d<sub>12</sub> | …… | d<sub>1m</sub> |
…… | …… | …… | …… | …… |
P n | d<sub>n1</sub> | d<sub>n2</sub> | …… | d<sub>nm</sub> |
步骤(4).根据已有数据进行ALS协同过滤的推荐。以步骤(1)中用户对项目的评分矩阵作为ALS协同过滤的输入,根据用户对已经评价过的几个项目预测用户对每个项目的需求程度。ALS协同过滤原理如图4所示。即通过矩阵分解的方法,将用户-项目评分矩阵X转化为用户-隐因子A与隐因子-项目矩阵B。通过交替最小二乘法(ALS)完成两个矩阵的填充,同时尽量满足用户-项目评分矩阵(X)。再由A×B得到用户-项目评分的预测矩阵X′。如下表所示。puj表示个用户u对项目j的评价。ALS推荐算法中主要体现了用户隐藏的个性化需求。
P1 | P2 | …… | Pm | |
U1 | p<sub>11</sub> | p<sub>12</sub> | …… | p<sub>1m</sub> |
U2 | p<sub>21</sub> | p<sub>22</sub> | …… | p<sub>2m</sub> |
…… | …… | …… | …… | …… |
Un | p<sub>n1</sub> | p<sub>n2</sub> | …… | p<sub>nm</sub> |
步骤(5).根据已有数据进行基于项目内容的推荐。如图5所示,以步骤(1)所提供的用户数据和步骤(3)所提供的项目特征作为项目内容的输入,根据用户目前对每一特征的需求程度来判断新项目的需求程度。将项目中的关键词权重作为项目的特征,在通过项目特征向量通过余弦相似度计算出项目间的相似度,公式为pi表示项目P1的单词表所组成的向量。此步骤完全考虑了项目内容的相似性,保证了用户推荐到的项目是用户所需要的。
P1 | P2 | …… | Pn | |
P1 | 1 | w<sub>12</sub> | …… | w<sub>1n</sub> |
P2 | w<sub>21</sub> | 1 | …… | w<sub>2n</sub> |
…… | …… | …… | …… | …… |
Pn | w<sub>n1</sub> | w<sub>n2</sub> | …… | 1 |
给用户推荐和他历史上需求的项目内容相似的项目,计算公式为quj=∑i∈N(u)∩S(j,k)wjirui,N(u)是用户需求项目的集合,Sj,k是和项目j最相似的K个项目的集合,rui是用户u对项目i的评价,同步骤1)。
P1 | P2 | …… | Pm | |
U1 | q<sub>11</sub> | q<sub>12</sub> | …… | q<sub>1m</sub> |
U2 | q<sub>21</sub> | q<sub>22</sub> | …… | q<sub>2m</sub> |
…… | …… | …… | …… | …… |
Un | q<sub>n1</sub> | q<sub>n2</sub> | …… | q<sub>nm</sub> |
步骤(6).将步骤(4)和步骤(5)的结果做线性组合操作。结合基于项目内容推荐的准确性和ALS推荐所体现的个性化要求,采用公式lui=0.618×pui+0.382×qui,得出最终的用户评分。
P1 | P2 | …… | Pm | |
U1 | l<sub>11</sub> | l<sub>12</sub> | …… | l<sub>1m</sub> |
U2 | l<sub>21</sub> | l<sub>22</sub> | …… | l<sub>2m</sub> |
…… | …… | …… | …… | …… |
Un | l<sub>n1</sub> | l<sub>n2</sub> | …… | l<sub>nm</sub> |
步骤(7).对步骤(6)的结果进行过滤和排名。即根据每个项目的得分进行排名,同时滤去用户已知项目,产生Top10推荐。
User | Top10 |
U1 | P1,P5,…,P7 |
U2 | P3,P8,…,P23 |
…… | …… |
U3 | P4,P3,…P2 |
步骤(8).对步骤(7)的Top10项目进行推荐结果的解释。即根据步骤(3)中这些项目自身的TF-IDF信息中的前几位结果给项目打上标签。作为最终推荐结果。用户例如向用户U1推荐项目P1,而单词w1,w3,w6在P1中最具代表性,则将单词w1,w3,w6作为P1的标签。
User | Top10 |
U1 | P1(w1,w3,w6),P5(…),…,P7(…) |
U2 | P3(…),P8(…),…,P23(…) |
…… | …… |
U3 | P4(…),P3(…),…P2(…) |
Claims (1)
1.面向开源社区的软件项目个性化推荐方法,其特征在于如下步骤:
(1).提取用户行为的特征向量,针对软件协作开发领域中用户产生的标记——star,跟踪——watch,复制——fork和用户正在开发项目的行为进行提取,并对用户的上述行为赋予权重,分别为1-标记、3-跟踪、5-复制、7-正在开发,统一标示并组成用户特征向量;
(2).软件项目的内容进行分类过滤处理,由于软件项目中包含许多类型的文件,需要分类过滤,针对二进制文件,通过连续的ASCII码提取出文字;针对项目介绍文档,通过分词技术提取出单词;针对源代码文件,通过分词先提炼出单词,再将一些停用词过滤,得到每个项目的所有单词;
(3).以步骤(2)中的过滤结果为输入,进行非结构化的特征处理,即使用词频-逆文档频率TF-IDF方法提取每个项目的关键词作为项目的特征向量,TF-IDF是处理自然语言的一种常用方法,词频TF表现了一个单词在一个项目中出现的频繁程度,每个项目的长短有别,需要对词频标准化,逆文档频率IDF表现了一个单词在一个项目中的重要程度,反应了项目的特性,TF×IDF得出各个单词对每个项目的重要性;
(4).进行ALS协同过滤的推荐,以用户对项目的评分矩阵作为ALS协同过滤的输入,根据用户已经评价过的几个项目预测用户对每个项目的需求程度,即通过矩阵分解的方法,将用户-项目评分矩阵X转化为用户-隐因子矩阵A与隐因子-项目矩阵B,通过交替最小二乘法ALS完成两个矩阵的填充,同时尽量满足用户-项目评分矩阵X,再由A×B得到用户-项目评分的预测矩阵X′;
(5).根据已有数据进行基于项目内容的推荐,即以步骤(1)所提供的用户数据和步骤(3)所提供的项目特征作为内容推荐模型的输入,根据用户目前对每一特征的需求程度来判断新项目的需求程度,并将项目中的关键词权重作为项目的特征,再通过项目特征向量利用余弦相似度计算出项目间的相似度,公式为
,其中,Wij表示待推荐项目j与历史项目i的相似度,pi表示项目i的单词表所组成的向量,pj表示项目j的单词表所组成的向量;给用户推荐和他历史上需求的项目内容相似的项目,计算公式为quj=∑j∈N(u)∩S(i,k)wijrui,其中,quj表示用户u对项目j的需求度,N(u)是用户需求项目的集合,S(i,k)是和项目i最相似的K个项目的集合,rui是用户u对项目i的评价;
(6).将步骤(4)和步骤(5)的结果做线性组合操作,并结合项目内容推荐的准确性和ALS推荐所体现的个性化的要求,采用公式luj=0.618×puj+0.382×quj,得出最终的用户评分,puj表示用户u关于项目j的预测评分;
(7).对步骤(6)的结果进行过滤和排名,即根据每个项目的得分进行排名,同时滤去用户已知项目,产生Top10推荐;
(8).对步骤(7)的Top10项目进行解释,即根据步骤(3)中这些项目自身的TF-IDF信息中的前几位结果给项目打上标签,作为最终推荐结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610486067.XA CN106201465B (zh) | 2016-06-23 | 2016-06-23 | 面向开源社区的软件项目个性化推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610486067.XA CN106201465B (zh) | 2016-06-23 | 2016-06-23 | 面向开源社区的软件项目个性化推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106201465A CN106201465A (zh) | 2016-12-07 |
CN106201465B true CN106201465B (zh) | 2020-08-21 |
Family
ID=57462193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610486067.XA Active CN106201465B (zh) | 2016-06-23 | 2016-06-23 | 面向开源社区的软件项目个性化推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106201465B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107247699A (zh) * | 2017-04-20 | 2017-10-13 | 中国农业大学 | 一种游戏设计要素的提取方法及装置 |
CN109033103A (zh) * | 2017-06-09 | 2018-12-18 | 华为技术有限公司 | 内容推荐方法和*** |
CN107423919A (zh) * | 2017-08-23 | 2017-12-01 | 太仓苏易信息科技有限公司 | 一种用于多人协同作业的虚拟推演算法 |
CN107808278B (zh) * | 2017-10-11 | 2021-09-24 | 河海大学 | 一种基于稀疏自编码器的Github开源项目推荐方法 |
CN110020121A (zh) * | 2017-10-16 | 2019-07-16 | 上海交通大学 | 基于迁移学习的软件众包项目推荐方法及*** |
CN108073710B (zh) * | 2017-12-21 | 2022-04-01 | 儒安物联科技集团有限公司 | 基于动态网络图挖掘的Github开源代码库推荐*** |
CN108255957A (zh) * | 2017-12-21 | 2018-07-06 | 杭州传送门网络科技有限公司 | 一种基于创投领域精准数据化推荐匹配方法 |
CN110119419A (zh) * | 2018-01-26 | 2019-08-13 | 南京大学 | 一种基于Star信息和README文档的开源社区相似仓库推荐方法 |
CN109189372B (zh) * | 2018-08-22 | 2023-12-05 | 中国平安人寿保险股份有限公司 | 保险产品的开发脚本生成方法及终端设备 |
CN109299473B (zh) * | 2018-11-15 | 2024-01-09 | 扬州大学 | 一种基于开发者画像的软件工程任务推荐方法 |
CN109816015B (zh) * | 2019-01-22 | 2021-01-08 | 北京科技大学 | 一种基于材料数据的推荐方法及*** |
CN109920524B (zh) * | 2019-02-22 | 2021-01-08 | 浙江树人学院(浙江树人大学) | 一种多处方药剂师分配方法 |
CN110134390B (zh) * | 2019-03-30 | 2022-11-25 | 杭州电子科技大学 | 一种基于用户相似度的可编程控制器图编程控件的智能推送功能的实现方法 |
CN110163476A (zh) * | 2019-04-15 | 2019-08-23 | 重庆金融资产交易所有限责任公司 | 项目智能推荐方法、电子装置及存储介质 |
CN110880013A (zh) * | 2019-08-02 | 2020-03-13 | 华为技术有限公司 | 识别文本的方法及装置 |
CN111078227B (zh) * | 2019-12-13 | 2021-08-31 | 中国科学院信息工程研究所 | 一种基于代码特征的二进制代码与源代码相似性分析方法与装置 |
CN111581509A (zh) * | 2020-04-30 | 2020-08-25 | 中国工商银行股份有限公司 | 信息处理方法、装置、电子设备和介质 |
CN111857691B (zh) * | 2020-07-28 | 2021-07-23 | 北京航空航天大学 | 一种软件体系结构恢复方法和装置 |
CN112667252A (zh) * | 2020-12-30 | 2021-04-16 | 瀚云科技有限公司 | 数据处理方法和装置、服务器及存储介质 |
CN113312027A (zh) * | 2021-02-19 | 2021-08-27 | 西安智周深鉴信息科技集团有限公司 | 工业***开发方法、电子设备及存储介质 |
CN117688249B (zh) * | 2024-02-02 | 2024-04-19 | 上海银行股份有限公司 | 一种基于数据分析的投行智能匹配平台 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102841929A (zh) * | 2012-07-19 | 2012-12-26 | 南京邮电大学 | 一种综合用户和项目评分及特征因素的推荐方法 |
CN103345517A (zh) * | 2013-07-10 | 2013-10-09 | 北京邮电大学 | 模拟tf-idf相似性计算的协同过滤推荐算法 |
CN103577579A (zh) * | 2013-11-08 | 2014-02-12 | 南方电网科学研究院有限责任公司 | 基于用户潜在需求的资源推荐方法及*** |
US20140121985A1 (en) * | 2012-07-30 | 2014-05-01 | Khalid Sayood | Classification of nucleotide sequences by latent semantic analysis |
CN104156436A (zh) * | 2014-08-13 | 2014-11-19 | 福州大学 | 一种社交云媒体协同过滤推荐方法 |
CN104899273A (zh) * | 2015-05-27 | 2015-09-09 | 东南大学 | 一种基于话题和相对熵的网页个性化推荐方法 |
-
2016
- 2016-06-23 CN CN201610486067.XA patent/CN106201465B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102841929A (zh) * | 2012-07-19 | 2012-12-26 | 南京邮电大学 | 一种综合用户和项目评分及特征因素的推荐方法 |
US20140121985A1 (en) * | 2012-07-30 | 2014-05-01 | Khalid Sayood | Classification of nucleotide sequences by latent semantic analysis |
CN103345517A (zh) * | 2013-07-10 | 2013-10-09 | 北京邮电大学 | 模拟tf-idf相似性计算的协同过滤推荐算法 |
CN103577579A (zh) * | 2013-11-08 | 2014-02-12 | 南方电网科学研究院有限责任公司 | 基于用户潜在需求的资源推荐方法及*** |
CN104156436A (zh) * | 2014-08-13 | 2014-11-19 | 福州大学 | 一种社交云媒体协同过滤推荐方法 |
CN104899273A (zh) * | 2015-05-27 | 2015-09-09 | 东南大学 | 一种基于话题和相对熵的网页个性化推荐方法 |
Non-Patent Citations (2)
Title |
---|
基于协同过滤技术的个性化推荐***研究;史玉珍,郑浩;《电子设计工程》;20120630;第20卷(第11期);全文 * |
基于改进协同过滤的移动个性化推荐服务研究;吕果,李法运;《情报探索》;20140228(第192期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN106201465A (zh) | 2016-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106201465B (zh) | 面向开源社区的软件项目个性化推荐方法 | |
Sharif et al. | Sentiment analysis of Bengali texts on online restaurant reviews using multinomial Naïve Bayes | |
Bramsen et al. | Extracting social power relationships from natural language | |
Xu et al. | Hierarchical emotion classification and emotion component analysis on Chinese micro-blog posts | |
Halibas et al. | Application of text classification and clustering of Twitter data for business analytics | |
Win et al. | Target oriented tweets monitoring system during natural disasters | |
CN103123633A (zh) | 评价参数的生成方法以及基于评价参数的信息搜索方法 | |
Kaur | Incorporating sentimental analysis into development of a hybrid classification model: A comprehensive study | |
Vainshtein et al. | A hybrid approach for automatic model recommendation | |
Cantini et al. | Learning sentence-to-hashtags semantic mapping for hashtag recommendation on microblogs | |
CN112395421B (zh) | 课程标签的生成方法、装置、计算机设备及介质 | |
Archchitha et al. | Opinion spam detection in online reviews using neural networks | |
Safrin et al. | Sentiment analysis on online product review | |
CN115017303A (zh) | 基于新闻文本进行企业风险评估的方法、计算设备和介质 | |
Schofield et al. | Identifying hate speech in social media | |
Nazare et al. | Sentiment analysis in Twitter | |
Gaye et al. | Sentiment classification for employees reviews using regression vector-stochastic gradient descent classifier (RV-SGDC) | |
Al Mostakim et al. | Bangla content categorization using text based supervised learning methods | |
Mahadevan et al. | Review rating prediction using combined latent topics and associated sentiments: an empirical review | |
Syn et al. | Using latent semantic analysis to identify quality in use (qu) indicators from user reviews | |
Jeevanandam Jotheeswaran | Sentiment analysis: a survey of current research and techniques | |
Aljamel et al. | Domain-specific relation extraction: Using distant supervision machine learning | |
Al Qadi et al. | A scalable shallow learning approach for tagging arabic news articles | |
Feng et al. | A learning approach to discovering web page semantic structures | |
Mugambi | Sentiment analysis for hate speech detection on social media: TF-IDF weighted N-Grams based approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |