CN105718467B - 检索算法评估推荐方法和*** - Google Patents

检索算法评估推荐方法和*** Download PDF

Info

Publication number
CN105718467B
CN105718467B CN201410724760.7A CN201410724760A CN105718467B CN 105718467 B CN105718467 B CN 105718467B CN 201410724760 A CN201410724760 A CN 201410724760A CN 105718467 B CN105718467 B CN 105718467B
Authority
CN
China
Prior art keywords
list
retrieval
records
algorithm
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410724760.7A
Other languages
English (en)
Other versions
CN105718467A (zh
Inventor
方宁
张侦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING SUNING ELECTRONIC INFORMATION TECHNOLOGY Co.,Ltd.
Shenzhen yunwangwandian Technology Co.,Ltd.
Original Assignee
Suning Cloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Cloud Computing Co Ltd filed Critical Suning Cloud Computing Co Ltd
Priority to CN201410724760.7A priority Critical patent/CN105718467B/zh
Publication of CN105718467A publication Critical patent/CN105718467A/zh
Application granted granted Critical
Publication of CN105718467B publication Critical patent/CN105718467B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种检索算法评估推荐方法和***,属于互联网技术领域。该方法包括步骤:S1、根据检索背景信息确定评估条件;S2、根据评估条件对每个检索算法进行评估;S3、获取最优检索算法进行检索计算,得出检索结果。本发明的技术方案通过评估各检索算法,而推出最优检索算法,以使用户获得较佳检索体验。

Description

检索算法评估推荐方法和***
技术领域
本发明涉及互联网技术领域,特别涉及一种检索算法评估推荐方法和***。
背景技术
目前评估互联网的数据挖掘算法的标准是基于召回率和精度,或是两者的结合。召回率(Recall Rate,也叫查全率)是检索出的记录数和记录库中所有的相关记录数的比率,衡量的是检索***的查全率;精度是检索出的相关记录数与检索出的记录总数的比率,衡量的是检索***的查准率。对于有序队列的评估涉及排序准确度平均排序得分或是加权的平均排序得分,这种评估方式比较复杂,不准确。
发明内容
针对现有技术的上述缺陷,本发明所要解决的技术问题是如何推出最优检索算法,以使用户获得较佳检索体验。
为实现上述目的,一方面,本发明提供一种检索算法评估推荐方法,该方法包括如下步骤:
S1、根据检索背景信息确定评估条件;
S2、根据评估条件对每个检索算法进行评估;
S3、获取最优检索算法进行检索计算,并得出检索结果。
优选地,在步骤S2中,根据检索条件统计一定时间内的结果排名,,而得出真实结果,根据各检索结果算法分别得出检索结果,将各检索算法的检索结果与真实结果进行比对,分析出检索结果与真实结果最接近的检索算法。
优选地,在步骤S2中,根据一检索结果获得第一列表,根据真实结果获得第二列表,第一列表包括若干条记录,第二列表包括若干条记录,对比第一列表和第二列表,根据仅存在于第一列表中的记录、仅存在于第二列表中的记录及同时存在与第一列表和第二列表中的记录,分析出检索结果与真实结果最接近的检索算法。
优选地,在步骤S2中,所述预测得分RS计算公式为:
将第二列表中未于第一列表中出现的记录追加至第一列表,而获得第三列表;
定义预测得分RS,根据预测得分RS获得最优检索算法,所述的检测得分RS计算公式为:
Figure BDA0000623699120000021
其中,k为第二列表的记录个数;m为第三列表的记录个数;hj为第三列表中第j个记录的得分,tj为同时存在于第一列表和第二列表的记录的得分;fj为存在于第一列表而不存在于第二列表的记录的得分;ij为不存在于第一列表而存在于第二列表的记录的得分。
优选地,所述tj等于对应记录在第一列表和第二列表排序位置的差值的绝对值乘以一系数,所述系数根据评估条件确认。
优选地,所述fj=A(m+1),所述ij=B(m+1),其中A、B分别根据评估条件确认。
另一方面,本发明提供一种检索算法评估推荐***,该***包括:
确定模块,用于根据检索背景信息确定评估条件;
评估模块,用于根据评估条件对每个检索算法进行评估;
推荐模块,用于获取最优检索算法进行检索计算,并得出检索结果。
优选地,所述评估模块,根据检索条件统计一定时间内的结果排名,而得出真实结果,根据各检索结果算法分别得出检索结果,
根据一检索结果获得第一列表,根据真实结果获得第二列表,第一列表包括若干条记录,第二列表包括若干条记录,对比第一列表和第二列表,根据仅存在于第一列表中的记录、仅存在于第二列表中的记录及同时存在与第一列表和第二列表中的记录,分析出检索结果与真实结果最接近的检索算法。
优选地,所述评估模块,将第二列表中未于第一列表中出现的记录追加至第一列表,而获得第三列表;定义预测得分RS,根据预测得分RS获得最优检索算法,所述的检测得分RS计算公式为:
Figure BDA0000623699120000031
其中,k为第二列表的记录个数;m为第三列表的记录个数;hj为第三列表中第j个记录的得分;tj为同时存在于第一列表和第二列表的记录的得分;fj为存在于第一列表而不存在于第二列表的记录的得分;ij为不存在于第一列表而存在于第二列表的记录的得分。
优选地,所述tj等于对应记录在第一列表和第二列表排序位置的差值的绝对值乘以一系数,所述系数根据评估条件确认;所述fj=A(m+1),所述ij=B(m+1),其中A、B分别根据评估条件确认。
本发明提供了一种以预测有序队列为输出的挖掘算法的评估方法和***,本发明的应用场景可以用在评估商品的推荐和预测等互联网领域,或是其他有类似度量需要的非互联网领域;本技术方案用一个数值的大小综合评估预测算法的优劣,而推出最优检索算法,以使用户获得较佳检索体验;同时减小服务器的访问量。
附图说明
图1是本发明的实施例一中的检索算法评估推荐方法的流程示意图;
图2是本发明实施例二中的检索算法评估推荐***的结构示意图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。
图1是本发明的实施例一中的检索算法评估推荐方法的流程示意图,如图1所示,该检索算法评估推荐方法包括步骤:
S1、根据检索背景信息确定评估条件;
S2、根据评估条件对每个检索算法进行评估;
S3、获取最优检索算法进行检索计算,并得出检索结果。
优选地,在步骤S2中,根据检索条件统计一定时间内的结果排名,,而得出真实结果,根据各检索结果算法分别得出检索结果,将各检索算法的检索结果与真实结果进行比对,分析出检索结果与真实结果最接近的检索算法。
优选地,在步骤S2中,根据一检索结果获得第一列表,根据真实结果获得第二列表,第一列表包括若干条记录,第二列表包括若干条记录,对比第一列表和第二列表,根据仅存在于第一列表中的记录、仅存在于第二列表中的记录及同时存在与第一列表和第二列表中的记录,分析出检索结果与真实结果最接近的检索算法。
优选地,在步骤S2中,根据一检索结果获得第一列表,根据真实结果获得第二列表,第一列表包括若干条记录,第二列表包括若干条记录,对比第一列表和第二列表,根据仅存在于第一列表中的记录、仅存在于第二列表中的记录及同时存在与第一列表和第二列表中的记录,分析出检索结果与真实结果最接近的检索算法。
优选地,tj等于对应记录在第一列表和第二列表排序位置的差值的绝对值乘以一系数,系数根据评估条件确认。
优选地,fj=A(m+1),ij=B(m+1),其中A、B分别根据评估条件确认。
本领域相关技术人员应能理解,与本发明的方法相对应的,本发明还同时包括一种检索算法评估推荐***,与上述方法步骤一一对应地,如图2所示,该***包括:确定模块201,用于根据检索背景信息确定评估条件;评估模块202,用于根据评估条件对每个检索算法进行评估;推荐模块203,用于获取最优检索算法进行检索计算,并得出检索结果。
优选地,评估模块202,根据检索条件统计一定时间内的结果排名,而得出真实结果,根据检索条件统计一定时间内的结果排名,而得出真实结果,根据各检索结果算法分别得出检索结果,
根据一检索结果获得第一列表,根据真实结果获得第二列表,第一列表包括若干条记录,第二列表包括若干条记录,对比第一列表和第二列表,根据仅存在于第一列表中的记录、仅存在于第二列表中的记录及同时存在与第一列表和第二列表中的记录,分析出检索结果与真实结果最接近的检索算法。
优选地,评估模块202将第二列表中未于第一列表中出现的记录追加至第一列表,而获得第三列表;定义预测得分RS,根据预测得分RS获得最优检索算法,所述的检测得分RS计算公式为:
Figure BDA0000623699120000051
其中,k为第二列表的记录个数;m为第三列表的记录个数;hj为第三列表中第j个记录的得分;tj为同时存在于第一列表和第二列表的记录的得分;fj为存在于第一列表而不存在于第二列表的记录的得分;ij为不存在于第一列表而存在于第二列表的记录的得分;tj等于对应记录在第一列表和第二列表排序位置的差值的绝对值乘以一系数,所述系数根据评估条件确认;所述fj=A(m+1),所述ij=B(m+1),其中A、B分别根据评估条件确认。
其中,RS的值越小越好,若预测结果完全正确的话,RS的值为0;k为真实的商品队列中商品的数目;m为预测队列和真实队列中的所有的商品;hj是第j个商品的排序得分,分三种情况如下:正确预测的记为tj,错误预测的记为fj,没有被预测到的记为ij;tj表示第j个商品是同时出现在两个队列中的预测正确的商品,它等于该商品在预测队列中的排序位置与该商品在真实队列中的排序位置的差值的绝对值;fj表示第j个商品不在真实队列中,但在预测队列中出现,fj=A(m+1);ij表示第j个商品不在预测队列中,但在真实队列中出现,ij=B(m+1)。根据评估条件,确定系数A、B。
若A=1;B=1;
假定,真实的商品队列为T=(B,D,C,E),预测的商品队列为P=(A,B,C);对于队列T和P,那么k=4;m=5(商品A,B,C,D,E);h1=6(商品A被误判);h2=1(商品B在P中位置为2,在T中的位置为1);h3=0(商品C在T中位置为3,在P中位置为3);h4=6(商品D没有被预测出来);h5=6(商品E没有被预测出来);RS=19/4=4.75。
假定,真实的商品队列为T=(D,F,E),预测的商品队列为P=(E,C,F);那么k=3;m=4(商品E,C,F,D);h1=2(商品E在P中位置为1,在T中位置为3);h2=5(商品C被误判);h3=1(商品F在P中位置为3,在T中位置为2);h4=4(商品D没有被预测出来);RS=12/3=4。
最后,推出较佳的检索方法,以提供检索推荐。本发明的应用场景可以用在评估商品的推荐和预测等互联网领域,或是其他有类似度量需要的非互联网领域。本技术方案用一个数值的大小综合评估预测算法的优劣,而推出最优检索算法,以使用户获得较佳检索体验;同时减小服务器的访问量。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (4)

1.一种检索算法评估推荐方法,其特征在于,所述方法包括如下步骤:
S1、根据检索背景信息确定评估条件;
S2、根据评估条件对每个检索算法进行评估;
在步骤S2中,根据检索条件统计一定时间内的结果排名,而得出真实结果,根据各检索算法分别得出检索结果,将各检索算法的检索结果与真实结果进行比对,分析出检索结果与真实结果最接近的检索算法;
具体包括:根据一检索结果获得第一列表,根据真实结果获得第二列表,第一列表包括若干条记录,第二列表包括若干条记录,对比第一列表和第二列表,根据仅存在于第一列表中的记录、仅存在于第二列表中的记录及同时存在与第一列表和第二列表中的记录,分析出检索结果与真实结果最接近的检索算法;
进一步地:将第二列表中未于第一列表中出现的记录追加至第一列表,而获得第三列表;
定义预测得分RS,根据预测得分RS获得最优检索算法,所述预测得分RS计算公式为:
Figure FDA0002435383830000011
其中,k为第二列表的记录个数;m为第三列表的记录个数;hj为第三列表中第j个记录的得分,tj为同时存在于第一列表和第二列表的记录的得分;fj为存在于第一列表而不存在于第二列表的记录的得分;ij为不存在于第一列表而存在于第二列表的记录的得分;所述tj等于对应记录在第一列表和第二列表排序位置的差值的绝对值乘以一系数,所述系数根据评估条件确认;
S3、获取最优检索算法进行检索计算,并得出检索结果。
2.根据权利要求1所述的检索算法评估推荐方法,其特征在于,
所述fj=A(m+1),所述ij=B(m+1),其中A、B分别根据评估条件确认。
3.一种检索算法评估推荐***,其特征在于,包括:
确定模块,用于根据检索背景信息确定评估条件;
评估模块,用于根据评估条件对每个检索算法进行评估;
所述评估模块,根据检索条件统计一定时间内的结果排名,而得出真实结果,根据各检索算法分别得出检索结果,
根据一检索结果获得第一列表,根据真实结果获得第二列表,第一列表包括若干条记录,第二列表包括若干条记录,对比第一列表和第二列表,根据仅存在于第一列表中的记录、仅存在于第二列表中的记录及同时存在与第一列表和第二列表中的记录,分析出检索结果与真实结果最接近的检索算法;
进一步地:将第二列表中未于第一列表中出现的记录追加至第一列表,而获得第三列表;定义预测得分RS,根据预测得分RS获得最优检索算法,所述预测得分RS计算公式为:
Figure FDA0002435383830000021
其中,k为第二列表的记录个数;m为第三列表的记录个数;hj为第三列表中第j个记录的得分;tj为同时存在于第一列表和第二列表的记录的得分;fj为存在于第一列表而不存在于第二列表的记录的得分;ij为不存在于第一列表而存在于第二列表的记录的得分;所述tj等于对应记录在第一列表和第二列表排序位置的差值的绝对值乘以一系数,所述系数根据评估条件确认;
推荐模块,用于获取最优检索算法进行检索计算,并得出检索结果。
4.根据权利要求3所述的检索算法评估推荐***,其特征在于,所述fj=A(m+1),所述ij=B(m+1),其中A、B分别根据评估条件确认。
CN201410724760.7A 2014-12-03 2014-12-03 检索算法评估推荐方法和*** Active CN105718467B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410724760.7A CN105718467B (zh) 2014-12-03 2014-12-03 检索算法评估推荐方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410724760.7A CN105718467B (zh) 2014-12-03 2014-12-03 检索算法评估推荐方法和***

Publications (2)

Publication Number Publication Date
CN105718467A CN105718467A (zh) 2016-06-29
CN105718467B true CN105718467B (zh) 2020-07-21

Family

ID=56145599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410724760.7A Active CN105718467B (zh) 2014-12-03 2014-12-03 检索算法评估推荐方法和***

Country Status (1)

Country Link
CN (1) CN105718467B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109005431B (zh) * 2018-09-18 2019-11-12 北京腾信创新网络营销技术股份有限公司 一种视频评估推荐***

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4504441B2 (ja) * 2008-06-27 2010-07-14 株式会社トヨタIt開発センター 経路探索装置および経路探索方法
US20140324899A1 (en) * 2013-04-24 2014-10-30 Kitchology Inc. Enhanced food information management and presentation on a selective dynamic basis and associated services
CN102999589B (zh) * 2012-11-15 2017-04-19 Tcl集团股份有限公司 一种推荐排序的方法及***
CN103853789A (zh) * 2012-12-06 2014-06-11 深圳市点行天下科技有限公司 一种用于向用户推荐信息的方法和设备
CN103593411A (zh) * 2013-10-23 2014-02-19 江苏大学 一种测试搜索引擎评价指标的综合性能的方法和测试装置

Also Published As

Publication number Publication date
CN105718467A (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
Sadaka et al. Predicting mortality of patients with sepsis: a comparison of APACHE II and APACHE III scoring systems
Yin et al. Optimal linear combinations of multiple diagnostic biomarkers based on Youden index
CN104899246B (zh) 基于模糊机制用户评分邻域信息的协同过滤推荐方法
RU2017107022A (ru) Обнаружение отдаленного контента
CN110008247B (zh) 异常来源确定方法、装置、设备及计算机可读存储介质
US20220084102A1 (en) Commodity recommendation method, server, shopping cart and shopping system
Olewuezi Note on the comparison of some outlier labeling techniques
US20200219022A1 (en) Method and apparatus for determining similarity between user and merchant, and electronic device
US20170330206A1 (en) Motion line processing system and motion line processing method
CN112487283A (zh) 训练模型的方法、装置、电子设备及可读存储介质
CN109649915A (zh) 一种智能货柜货物识别方法和装置
Partington et al. Optimizing data collection for public health decisions: a data mining approach
Coucke et al. Comparison of different approaches to evaluate External Quality Assessment Data
CN111126119A (zh) 基于人脸识别的到店用户行为统计方法和装置
CN102779131A (zh) 基于用户间多相似度的协同过滤推荐方法
CN118094118A (zh) 数据集质量评估方法、***、电子设备及存储介质
CN105718467B (zh) 检索算法评估推荐方法和***
JP6904331B2 (ja) 要因分析装置、要因分析方法、およびプログラム
JP6164993B2 (ja) 評価システム、評価プログラム及び評価方法
KR101879829B1 (ko) 클릭 로그 데이터를 이용하여 이상 사용자를 검출하는 방법 및 장치
CN106096029B (zh) 一种基于用户双向关系的推荐方法
Ohkubo et al. Anomaly detection in high-dimensional data with the Mahalanobis–Taguchi system
CN108681947B (zh) 基于物品的时间关联度和覆盖度的协同过滤推荐方法
Supola et al. The role of secondary assists in basketball–an analysis of its characteristics and effect on scoring
KR20140079639A (ko) 협업 필터링을 위한 emd 기반 유사 사용자 선별 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200608

Address after: No. 1-1 Suning Avenue, Xuzhuang Software Park, Xuanwu District, Nanjing City, Jiangsu Province, 210000

Applicant after: Suning Cloud Computing Co.,Ltd.

Address before: 210042 Jiangsu, Xuanwu District, Nanjing, Nanjing Road, No. 1, building No. 15

Applicant before: SUNING COMMERCE GROUP Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210506

Address after: 518001 unit 3510-130, Luohu business center, 2028 Shennan East Road, Chengdong community, Dongmen street, Luohu District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen yunwangwandian Technology Co.,Ltd.

Patentee after: NANJING SUNING ELECTRONIC INFORMATION TECHNOLOGY Co.,Ltd.

Address before: No.1-1 Suning Avenue, Xuzhuang Software Park, Xuanwu District, Nanjing, Jiangsu Province, 210000

Patentee before: Suning Cloud Computing Co.,Ltd.

TR01 Transfer of patent right