CN105159932B - 一种数据检索引擎和排序***和方法 - Google Patents

一种数据检索引擎和排序***和方法 Download PDF

Info

Publication number
CN105159932B
CN105159932B CN201510478159.9A CN201510478159A CN105159932B CN 105159932 B CN105159932 B CN 105159932B CN 201510478159 A CN201510478159 A CN 201510478159A CN 105159932 B CN105159932 B CN 105159932B
Authority
CN
China
Prior art keywords
user
document
factor
correlation
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510478159.9A
Other languages
English (en)
Other versions
CN105159932A (zh
Inventor
李文超
金泰木
王腾飞
张士存
段浩伟
曹志伟
柳少华
孙华
董丽
王振中
林霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CRRC Qingdao Sifang Co Ltd
Original Assignee
CRRC Qingdao Sifang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CRRC Qingdao Sifang Co Ltd filed Critical CRRC Qingdao Sifang Co Ltd
Priority to CN201510478159.9A priority Critical patent/CN105159932B/zh
Publication of CN105159932A publication Critical patent/CN105159932A/zh
Application granted granted Critical
Publication of CN105159932B publication Critical patent/CN105159932B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种数据检索引擎和排序***和方法,包括用户管理模块,用于管理用户信息;数据库,用于分类储存文档并响应用户请求;相关度计算模块,用于检索结果的计算和排序;所述相关度计算模块包括用户行为统计子模块,用于统计用户偏好关键词、用户对文档评论和应用行为;排序相关度计算子模块,用于计算排序相关度并按排序相关度将检索结果进行排列。本发明对检索词匹配到的数据集合进一步进行查询相关度RC、需求相关度DC和数据质量相关度QC的分析计算,使检索出的数据集合符合用户偏好、用户对文档评论和应用行为,提高了检索结果与用户需求的相关度,节约了用户查询时间。

Description

一种数据检索引擎和排序***和方法
技术领域
本发明涉及一种检索引擎,特别涉及一种数据检索引擎和排序***和方法。
背景技术
现有的搜索引擎进行数据检索的过程中,大部分采用关键词输入方式进行检索,检索结果按照关键词匹配程度进行排序,不同的用户输入相同的关键词得到的搜索结果往往是一样的,对检索结果的排序方式没有考虑用户个性化需求和数据质量因素。从大量的返回信息中寻找自己需要的信息,会浪费用户很长的时间和精力。
发明内容
本发明主要目的在于解决上述问题和不足,提供一种基于用户行为信息提高数据相关度,提高检索准确度的一种数据检索引擎和排序***。
本发明的另一个主要目的在于提供一种数据检索和排序方法。
为实现上述目的,本发明的技术方案是:
一种数据检索引擎和排序***,包括:
用户管理模块,用于管理用户信息;
数据库,用于分类储存文档并响应用户请求;
相关度计算模块,用于检索结果的计算和排序;
所述相关度计算模块包括用户行为统计子模块,用于统计用户偏好关键词、用户对文档评论和应用行为;
排序相关度计算子模块,用于计算排序相关度并按排序相关度将检索结果进行排列。
进一步,根据权利要求1所述的一种数据检索和排序***,其特征在于:所述排序相关度由查询相关度RC、需求相关度DC和数据质量相关度QC决定。
进一步,所述查询相关度RC采用TF-IDF方法计算,
其中,i为检索词;
TFi(d)为检索词i在文档d中出现的频率;
N为所有文档的数目;
DF为含有检索词i的文档数目。
进一步,所述需求相关度DC由偏好关键词相似度KeySim与行为偏好分类相似度ClassSim相加得到;
所述偏好关键词相似度由每个文档索引形成的文档主题向量DSV和用户偏好关键词表形成的用户偏好向量UPV进行余弦相似度计算,
DSV(a1,w1;a2,w2;...;am,wm)
UPV(b1,w1;b2,w2;...;bn,wn)
所述行为偏好分类相似度由用户对文档应用行为决定,
其中,df(ta)、df(tb)、df(tc)、df(td)为文档所属分类被用户浏览、下载、收藏、推荐次数。
进一步,所述数据质量相关度QC由用户对文档应用因子、用户对文档评论数量因子、用户对文档评分因子相加得到,
其中,FDi和FD分别代表该文档被下载的次数和全部文档中被下载最多的文档的下载次数;FLi和FL分别代表该文档被浏览的次数和全部文档中被浏览最多的文档的浏览次数;FFi和FF分别代表该文档被收藏的次数和全部文档中被收藏最多的文档的收藏次数;FRi和FR分别代表该文档被推荐的次数和全部文档中被推荐最多的文档的推荐次数;CMi和CM分别代表该文档被评论的次数和全部文档中被评论最多的文档的评论次数;Score代表该文档评分因子。
进一步,所述文档评分因子Score由用户评分能力US和用户对文档的评分ej加权计算得到,
其中,j为评分个数;
所述用户评分能力US由静态因子USS、动态因子UDS和专业领域因子MMS加权计算后相加得到,
进一步,所述静态因子USS由用户的年龄、技术职称、学历的转换值SS计算得到,
进一步,所述动态因子UDS由用户每月登陆***次数的活跃程度AD决定,
其中,fri为每月用户登录次数。
进一步,若用户所属专业领域与用户评分的文档所述领域为同领域时,则具有专业领域因子MMS,即γ为0.1;
若用户所属专业领域与用户评分的文档所述领域为不同领域时,则不具有专业领域因子MMS,即γ为0。
本发明的另一个技术方案是:
一种数据检索和排序方法,包括如下步骤:
步骤1、用户输入检索词i;
步骤2、将检索词i与数据库中文档进行匹配,得到匹配数据集合;
步骤3、根据查询相关度RC、需求相关度DC和数据质量相关度QC,对匹配数据集合中的文档进行排序相关度RankC计算,
RankC=log(RC+QC+DC) (9);
步骤4、根据排序相关度RankC将检索结果进行排序。
综上内容,本发明所述的一种数据检索引擎和排序***和方法,对检索词匹配到的数据集合进一步进行查询相关度RC、需求相关度DC和数据质量相关度QC的分析计算,使检索出的数据集合符合用户偏好、用户对文档评论和应用行为,提高了检索结果与用户需求的相关度,节约了用户查询时间。
附图说明
图1是本发明方法的流程图;
图2是本发明***的框架图;
图3是本发明用户评分能力US示意图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
如图2所示,一种数据检索引擎和排序***,包括用户管理模块、数据库和相关度计算模块。
用户管理模块,用于管理用户信息,主要记录用户年龄、技术职称、学历、所属技术领域、用户偏好关键词表等数据。
数据库,主要用于储存文档数据,并对文档进行分类管理,响应用户针对各类文档的应用请求。
相关度计算模块,主要用于实现检索结果的计算和排序,包括用户行为统计子模块和排序相关度计算子模块。
用户行为统计子模块,主要用于记录用户对文档应用行为记录(浏览、下载、收藏、推荐)、用户对文档评论和评分记录、用户登录次数记录等。
排序相关度计算子模块,主要用于计算排序相关度并按排序相关度将检索结果进行排列。
排序相关度RankC由查询相关度RC、需求相关度DC和数据质量相关度QC决定,公式如下:
RankC=log(RC+QC+DC) (9)
用户输入检索词i后,***将检索词i与数据库中文档进行匹配,得到匹配数据集合,查询相关度RC采用TF-IDF方法计算,公式如下:
TFi(d)为检索词i在文档d中出现的频率,N为所有文档的数目,DF为含有检索词i的文档数目。该函数的提出是基于这样一个假设:对区别文档有意义的词语应该是那些在文档中出现频率足够高,但在整个文档集合的其他文档中出现频率足够少的词语。
需求相关度DC由偏好关键词相似度KeySim与行为偏好分类相似度ClassSim相加得到。
偏好关键词相似度KeySim由每个文档索引形成的文档主题向量DSV和用户偏好关键词表形成的用户偏好向量UPV进行余弦相似度计算。用户偏好关键词表取自数据检索和排序***用户管理模块中保存的用户自行定义的兴趣标签词,公式如下:
DSV(a1,w1;a2,w2;...;am,wm)
UPV(b1,w1;b2,w2;...;bn,wn)
行为偏好分类相似度ClassSim由用户对文档应用行为决定,根据用户对文档应用行为,包括浏览、下载、收藏、推荐,计算行为偏好分类相似度ClassSim。用户对文档应用行为记录取自***的相关度计算模块中的用户行为统计子模块,公式如下:
其中,df(ta)、df(tb)、df(tc)、df(td)为文档所属分类被用户浏览、下载、收藏、推荐次数。
数据质量相关度QC由用户对文档应用因子、用户对文档评论数量因子、用户对文档评分因子相加得到,公式如下:
其中,FDi和FD分别代表该文档被下载的次数和全部文档中被下载最多的文档的下载次数;FLi和FL分别代表该文档被浏览的次数和全部文档中被浏览最多的文档的浏览次数;FFi和FF分别代表该文档被收藏的次数和全部文档中被收藏最多的文档的收藏次数;FRi和FR分别代表该文档被推荐的次数和全部文档中被推荐最多的文档的推荐次数;CMi和CM分别代表该文档被评论的次数和全部文档中被评论最多的文档的评论次数;Score代表该文档评分因子。
由上述定义可知,同理,
用户对文档应用因子对下载、浏览行为进行合并处理,对二者的算术平均数赋以一个权值α,对收藏、推荐行为进行合并处理,对二者的算术平均数赋以权值1-α。通常意义上,0.1≦α≦0.4。即,用户的下载及浏览行为对于数据质量的影响要低于收藏和推荐行为对数据质量的影响。用户对文档应用行为记录取自数据检索和排序***相关度计算模块中的用户行为统计子模块。
由上述定义可知,
用户对文档评论数量因子对评论行为单独赋以权值β。通常意义上,1≦β≦2。用户对文档评论数量记录取自数据检索和排序***相关度计算模块中的用户行为统计子模块。
文档评分因子Score由用户评分能力US和用户对文档的评分ej加权计算得到,公式如下:
其中,j为评分个数,1≦ej≦5,用户评分能力US作为权重,权重越高,用户对数据评价越可信。
用户评分能力US会影响其对数据评分的可信度,分析与用户评分能力相关联的核心因素,如年龄、技术职称、专业领域等,计算用户评分能力US。用户评分能力US由静态因子USS、动态因子UDS和专业领域因子MMS加权计算后相加得到,公式如下:
η、和γ是用来调节用户评价能力计算结果的算子。本实施例中,0.6≦η≦0.8,γ为0或者0.1。
静态因子USS由用户的年龄、技术职称、学历的转换值SS计算得到,公式如下:
其中转换值SS在[0,1]之间。
下表是静态因子USS转换值SS示意表:
动态因子UDS指的是用户评价能力动态得分,动态因素指用户随时间会不断发生变化的因素,由用户每月登陆***次数的活跃程度AD决定,公式如下:
初始时定义活跃程度为1,fri为每月用户登录次数。用户活跃程度与评分能力正相关,因为活跃用户在应用数据的过程中能提高评分能力。
专业领域因子MMS指的是用户专业领域匹配度得分,若用户所属专业领域与用户评分的文档所述领域为同领域时,则具有专业领域因子MMS,即γ为0.1;
若用户所属专业领域与用户评分的文档所述领域为不同领域时,则不具有专业领域因子MMS,即γ为0。
一种数据检索和排序方法,包括如下步骤:
步骤1、用户输入检索词i。
步骤2、将检索词i与数据库中文档进行匹配,得到匹配数据集合。
步骤3、根据匹配数据集合中的文档索引与检索词匹配程度,使用公式(1)计算查询相关度RC;
将用户偏好关键词对匹配数据集合中的文档索引进行匹配,根据文档索引与用户偏好关键词匹配程度,使用公式(2)、(3)计算需求相关度DC;
基于用户行为信息对匹配数据集合中的文档数据质量进行自动评价,使用公式(4)、(5)、(6)、(7)、(8)计算数据质量相关度QC;
根据查询相关度RC、需求相关度DC和数据质量相关度QC,使用公式(9)对匹配数据集合中的文档进行排序相关度RankC计算。
步骤4、根据排序相关度RankC将检索结果进行排序,排序遵循降序排序,排序相关度RankC数值高的排名在前,将检索结果返回给用户。
如上所述,结合附图所给出的方案内容,可以衍生出类似的技术方案。但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (3)

1.一种数据检索引擎和排序***,其特征在于,包括:
用户管理模块,用于管理用户信息,记录用户年龄、技术职称、学历、所属技术领域、用户偏好关键词表数据;
数据库,用于分类储存文档并响应用户请求;
相关度计算模块,用于检索结果的计算和排序;
所述相关度计算模块包括用户行为统计子模块和排序相关度计算子模块;
所述用户行为统计子模块,用于统计用户偏好关键词、用户对文档应用行为记录、用户对文档评论和评分记录、用户登录次数记录,所述文档应用行为记录包括浏览次数、下载次数、收藏次数、推荐次数;
所述排序相关度计算子模块,用于计算排序相关度并按排序相关度将检索结果进行排列;
所述排序相关度RankC由查询相关度RC、需求相关度DC和数据质量相关度QC决定,公式如下:
RankC=log(RC+QC+DC) (9)
所述查询相关度RC采用TF-IDF方法计算;
所述需求相关度DC由偏好关键词相似度KeySim与行为偏好分类相似度ClassSim相加得到;
所述数据质量相关度QC由用户对文档应用因子、用户对文档评论数量因子、用户对文档评分因子相加得到;
所述偏好关键词相似度由每个文档索引形成的文档主题向量DSV和用户偏好关键词表形成的用户偏好向量UPV进行余弦相似度计算,用户偏好关键词表取自数据检索和排序***用户管理模块中保存的用户自行定义的兴趣标签词,
DSV(a1,w1;a2,w2;...;am,wm)
UPV(b1,w1;b2,w2;...;bn,wn)
所述行为偏好分类相似度由用户对文档应用行为决定,用户对文档应用行为记录取自***的相关度计算模块中的用户行为统计子模块,
其中,df(ta)、df(tb)、df(tc)、df(td)为文档所属分类被用户浏览、下载、收藏、推荐次数;
所述数据质量相关度QC由用户对文档应用因子、用户对文档评论数量因子、用户对文档评分因子相加得到,
其中,FDi和FD分别代表该文档被下载的次数和全部文档中被下载最多的文档的下载次数;FLi和FL分别代表该文档被浏览的次数和全部文档中被浏览最多的文档的浏览次数;FFi和FF分别代表该文档被收藏的次数和全部文档中被收藏最多的文档的收藏次数;FRi和FR分别代表该文档被推荐的次数和全部文档中被推荐最多的文档的推荐次数;CMi和CM分别代表该文档被评论的次数和全部文档中被评论最多的文档的评论次数;Score代表该文档评分因子;
用户对文档应用因子对下载、浏览行为进行合并处理,对二者的算术平均数赋以一个权值α,对收藏、推荐行为进行合并处理,对二者的算术平均数赋以权值1-α;
用户对文档评论数量因子对评论行为单独赋以权值β;
所述文档评分因子Score由用户评分能力US和用户对文档的评分ej加权计算得到,
其中,j为评分个数;
所述用户评分能力US由静态因子USS、动态因子UDS和专业领域因子MMS加权计算后相加得到,
所述静态因子USS由用户的年龄、技术职称、学历的转换值SS计算得到,
所述动态因子UDS由用户每月登陆***次数的活跃程度AD决定,
其中,fri为每月用户登录次数;
若用户所属专业领域与用户评分的文档所述领域为同领域时,则具有专业领域因子MMS,即γ为0.1;
若用户所属专业领域与用户评分的文档所述领域为不同领域时,则不具有专业领域因子MMS,即γ为0。
2.根据权利要求1所述的一种数据检索引擎和排序***,其特征在于:所述TF-IDF方法:
其中,i为检索词;
TFi(d)为检索词i在文档d中出现的频率;
N为所有文档的数目;
DF为含有检索词i的文档数目。
3.一种如权利要求1所述***的检索和排序方法,其特征在于,包括如下步骤:
步骤1、用户输入检索词i;
步骤2、将检索词i与数据库中文档进行匹配,得到匹配数据集合;
步骤3、根据查询相关度RC、需求相关度DC和数据质量相关度QC,对匹配数据集合中的文档进行排序相关度RankC计算,
RankC=log(RC+QC+DC) (9);
所述查询相关度RC采用TF-IDF方法计算;
所述需求相关度DC由偏好关键词相似度KeySim与行为偏好分类相似度ClassSim相加得到;
所述数据质量相关度QC由用户对文档应用因子、用户对文档评论数量因子、用户对文档评分因子相加得到;
所述偏好关键词相似度由每个文档索引形成的文档主题向量DSV和用户偏好关键词表形成的用户偏好向量UPV进行余弦相似度计算,用户偏好关键词表取自数据检索和排序***用户管理模块中保存的用户自行定义的兴趣标签词,
DSV(a1,w1;a2,w2;...;am,wm)
UPV(b1,w1;b2,w2;...;bn,wn)
所述行为偏好分类相似度由用户对文档应用行为决定,用户对文档应用行为记录取自***的相关度计算模块中的用户行为统计子模块,
其中,df(ta)、df(tb)、df(tc)、df(td)为文档所属分类被用户浏览次数、下载次数、收藏次数、推荐次数;
所述数据质量相关度QC由用户对文档应用因子、用户对文档评论数量因子、用户对文档评分因子相加得到,
其中,FDi和FD分别代表该文档被下载的次数和全部文档中被下载最多的文档的下载次数;FLi和FL分别代表该文档被浏览的次数和全部文档中被浏览最多的文档的浏览次数;FFi和FF分别代表该文档被收藏的次数和全部文档中被收藏最多的文档的收藏次数;FRi和FR分别代表该文档被推荐的次数和全部文档中被推荐最多的文档的推荐次数;CMi和CM分别代表该文档被评论的次数和全部文档中被评论最多的文档的评论次数;Score代表该文档评分因子;
用户对文档应用因子对下载、浏览行为进行合并处理,对二者的算术平均数赋以一个权值α,对收藏、推荐行为进行合并处理,对二者的算术平均数赋以权值1-α;
用户对文档评论数量因子对评论行为单独赋以权值β;
所述文档评分因子Score由用户评分能力US和用户对文档的评分ej加权计算得到,
其中,j为评分个数;
所述用户评分能力US由静态因子USS、动态因子UDS和专业领域因子MMS加权计算后相加得到,
所述静态因子USS由用户的年龄、技术职称、学历的转换值SS计算得到,
所述动态因子UDS由用户每月登陆***次数的活跃程度AD决定,
其中,fri为每月用户登录次数;
若用户所属专业领域与用户评分的文档所述领域为同领域时,则具有专业领域因子MMS,即γ为0.1;
若用户所属专业领域与用户评分的文档所述领域为不同领域时,则不具有专业领域因子MMS,即γ为0;
步骤4、根据排序相关度RankC将检索结果进行排序。
CN201510478159.9A 2015-08-07 2015-08-07 一种数据检索引擎和排序***和方法 Active CN105159932B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510478159.9A CN105159932B (zh) 2015-08-07 2015-08-07 一种数据检索引擎和排序***和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510478159.9A CN105159932B (zh) 2015-08-07 2015-08-07 一种数据检索引擎和排序***和方法

Publications (2)

Publication Number Publication Date
CN105159932A CN105159932A (zh) 2015-12-16
CN105159932B true CN105159932B (zh) 2019-06-21

Family

ID=54800789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510478159.9A Active CN105159932B (zh) 2015-08-07 2015-08-07 一种数据检索引擎和排序***和方法

Country Status (1)

Country Link
CN (1) CN105159932B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468790B (zh) * 2015-12-30 2019-10-29 北京奇艺世纪科技有限公司 一种评论信息检索方法和装置
CN107092616B (zh) * 2016-11-02 2020-08-28 北京星选科技有限公司 一种对象排序方法及装置
CN106997344A (zh) * 2017-03-31 2017-08-01 成都数联铭品科技有限公司 关键词抽取***
CN107133290B (zh) * 2017-04-19 2019-10-29 中国人民解放军国防科学技术大学 一种个性化信息检索方法与装置
CN107273476A (zh) * 2017-06-08 2017-10-20 广州优视网络科技有限公司 一种文章搜索方法、装置及服务器
CN107229738B (zh) * 2017-06-18 2020-04-03 杭州电子科技大学 一种基于文档评分模型和相关度的学术论文搜索排序方法
CN108133016A (zh) * 2017-12-22 2018-06-08 大连景竣科技有限公司 一种办公用文档定位***及方法
CN109144954B (zh) * 2018-09-18 2021-03-16 北京字节跳动网络技术有限公司 编辑文档的资源推荐方法、装置及电子设备
CN111125086B (zh) * 2018-10-31 2023-02-24 北京国双科技有限公司 获取数据资源的方法、装置、存储介质及处理器
CN111783448B (zh) * 2020-06-23 2024-03-15 北京百度网讯科技有限公司 文档动态调整方法、装置、设备和可读存储介质
CN112100213B (zh) * 2020-09-07 2022-10-21 中国人民解放军海军工程大学 船舶设备技术数据搜索排序方法
CN112632383A (zh) * 2020-12-26 2021-04-09 中国农业银行股份有限公司 一种信息推荐方法及装置
CN116932859A (zh) * 2023-08-10 2023-10-24 苏州阿基米德网络科技有限公司 一种医疗设备文档的搜索和浏览方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101169797A (zh) * 2007-11-30 2008-04-30 朱廷劭 一种对搜索结果优化的方法
CN101359331A (zh) * 2008-05-04 2009-02-04 索意互动(北京)信息技术有限公司 对搜索结果重新排序的方法和***
CN103309900A (zh) * 2012-03-06 2013-09-18 祁勇 一种个性化多维度的文档排序方法和***
CN103778260A (zh) * 2014-03-03 2014-05-07 哈尔滨工业大学 一种个性化微博信息推荐***和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101169797A (zh) * 2007-11-30 2008-04-30 朱廷劭 一种对搜索结果优化的方法
CN101359331A (zh) * 2008-05-04 2009-02-04 索意互动(北京)信息技术有限公司 对搜索结果重新排序的方法和***
CN103309900A (zh) * 2012-03-06 2013-09-18 祁勇 一种个性化多维度的文档排序方法和***
CN103778260A (zh) * 2014-03-03 2014-05-07 哈尔滨工业大学 一种个性化微博信息推荐***和方法

Also Published As

Publication number Publication date
CN105159932A (zh) 2015-12-16

Similar Documents

Publication Publication Date Title
CN105159932B (zh) 一种数据检索引擎和排序***和方法
CN105224699B (zh) 一种新闻推荐方法及装置
KR101536520B1 (ko) 토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버
Liu et al. Integrating expert profile, reputation and link analysis for expert finding in question-answering websites
Zhao et al. Topical keyphrase extraction from twitter
CN101408886B (zh) 通过分析文档的段落来选择该文档的标签
US8990241B2 (en) System and method for recommending queries related to trending topics based on a received query
CN103714084B (zh) 推荐信息的方法和装置
US8356044B2 (en) System and method for providing default hierarchical training for social indexing
CN103559206B (zh) 一种信息推荐方法及***
Li et al. A two-dimensional click model for query auto-completion
CN107862022B (zh) 文化资源推荐***
US20090094020A1 (en) Recommending Terms To Specify Ontology Space
CN106339502A (zh) 一种基于用户行为数据分片聚类的建模推荐方法
EP2159715A2 (en) System and method for providing a topic-directed search
CN104866554B (zh) 一种基于社会化标注的个性化搜索方法及***
KR20150036117A (ko) 쿼리 확장
CN107895303B (zh) 一种基于ocean模型的个性化推荐的方法
US20150317390A1 (en) Computer-implemented systems and methods for taxonomy development
Shani et al. Mining recommendations from the web
CN103761286B (zh) 一种基于用户兴趣的服务资源检索方法
CN105512300B (zh) 信息过滤方法及***
CN110019763B (zh) 文本过滤方法、***、设备及计算机可读存储介质
CN106202498A (zh) 一种基于分类语料库‑关键词词频‑记录关联的网络行为习惯量化方法
Watanabe et al. A paper recommendation mechanism for the research support system papits

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Jihongtan town Chengyang District Shandong city Qingdao province Jinhong road 266111 No. 88

Applicant after: CRRC QINGDAO SIFANG CO., LTD.

Address before: Jihongtan town Chengyang District Shandong city Qingdao province Jinhong road 266111 No. 88

Applicant before: CSR Qingdao Sifang Locomotive and Rolling Stock Co., Ltd.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant