CN102279895A - 一种基于蚁群算法的搜索引擎排序方法 - Google Patents

一种基于蚁群算法的搜索引擎排序方法 Download PDF

Info

Publication number
CN102279895A
CN102279895A CN2011102794558A CN201110279455A CN102279895A CN 102279895 A CN102279895 A CN 102279895A CN 2011102794558 A CN2011102794558 A CN 2011102794558A CN 201110279455 A CN201110279455 A CN 201110279455A CN 102279895 A CN102279895 A CN 102279895A
Authority
CN
China
Prior art keywords
pages
result
webpage
search
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102794558A
Other languages
English (en)
Inventor
许力波
周延泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN2011102794558A priority Critical patent/CN102279895A/zh
Publication of CN102279895A publication Critical patent/CN102279895A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

在PageRank算法的基础上应用蚁群算法的主要思想,对网页按关键字检索后被点击的次数进行统计,根据其在初始排序结果中的位置对网页进行分类,通过给定的函数变换对按照以上两个因素统计分析所得的结果进行运算,将其作为网页与关键字关联度的一个评判依据。从而对网页的权值(PR值)进行迭代修正,并返回一个新的排序结果。通过实验表明,此方法在使得返回结果中相关度较高的网页通过人们的自主选择获得了不同程度的加权,使得其在返回结果中的排名得到提升,更容易被检索到,提高了查准率。

Description

一种基于蚁群算法的搜索引擎排序方法
所属技术领域:
本发明属于网页排序技术类,是一种搜索引擎排序方法。本发明采用一定的技术手段,可以提高搜索引擎排序结果的满意度,改善搜索***性能。 
背景技术:
目前的搜索引擎返回结果过多,用户很难从中快速筛选出真正需要的信息。如果搜索引擎只返回相关度高的网页,既可以很大程度地节省用户时间,又可以减轻网络流量。斯坦福大学的Sergey Brin等人提出的PageRank算法在Google搜索引擎得到了成功的应用,开启了链接分析技术的研究热潮。PageRank算法的初始描绘是这样的:如果一个网页的链入网页的排序值总和高,则这个网页的排序值高。PageRank算法单纯从链接分析的角度入手进行网页排序,忽略了用户的查询意图,难以取得更好的排序效果。 
蚁群算法是Dorigo M等人提出的,蚂蚁个体之间是通过一种称之为信息素的物质进行信息传递的。在运动过程中,蚂蚁能够在它所经过的路径上留下这种信息素,而且能够感知信息度的浓度,并以此指导自己的运动方向,倾向于朝着信息浓度高的方向移动。 
发明内容:
本发明的目的是提供一种计算搜索引擎网页排序的新算法,提高用户搜索意图结果的查准率。 
为达到上述发明目的,通过如下措施来实现。 
一种基于蚁群算法的搜索引擎排序方法,其特征是给定某一查询词的条件下,在搜索完成后,对其所显示网页进行点击,真正被用户需求的网页被大部分用户点击,定义每个显示结果页面中的网页予以不同的信息素值,越靠后的网页,若被点击到所获得的权值较高。统计用户点击网页的次数,乘以该网页的信息素值,所得值加上该网页原始的Pagerank值,得到该网页的最终排序值,从而达到对网页排序算法的改进,得到用户查询到目标网页的最短路径,提升了用户真正感兴趣的网页名次,从而使用户可以更快地找到自己所需的结果。 
本发明的优点效果为:通过能够链接到目标网页的全部路径上的网页进行加权,也就是这些网页的信息熵赋予较高的值,使得最终目标网络的排序值较大,能够排到搜索结果的前面,形成用户查询到目标网页的最短路径,达到较佳的搜索效果。 
附图说明:
附图是本发明原理图。 
具体实施方式:
下面对本发明作进一步描述: 
一种基于蚁群算法的搜索引擎排序方法,首先用原始的PageRank算法计算出网页的权值,然后用关键字查询并返回推荐结果,用Fi对首次返回的排序结果按次序命名;然后通过用户的主观判断对相应网页进行点击,并将此关键字在搜索到的集合中建立点击次数属性用于改进结果。运行一段时间后,用改进后的排序算法来计算网页的权值并重新排序。其特征是在保证召回率和查准率的前提下为提高用户搜索意图,从网页相对于关键字的点击率出发,通过蚁群算法的信息熵概念将用户的群体选择加入到网页权值计算中去,提高相关网页的查准率。 

Claims (3)

1.一种基于蚁群算法的搜索引擎排序方法,其特征在于:搜索结果的网页被点击的次数,真正被用户需求的网页会被大部分用户点击,其相应的信息度就会越来越高。
2.如权利要求1所述的一种基于蚁群算法的搜索引擎排序方法,其特征在于:网页在搜索结果中的排名越靠后,其被点击到后包含的信息熵就越高。
3.如权利要求1所述的一种基于蚁群算法的搜索引擎排序方法,其特征是在通过用户的主观判断对相关网页进行点击,并将此关键字在搜索到的集合中建立点击次数属性用于改进最终排序结果。
CN2011102794558A 2011-09-20 2011-09-20 一种基于蚁群算法的搜索引擎排序方法 Pending CN102279895A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102794558A CN102279895A (zh) 2011-09-20 2011-09-20 一种基于蚁群算法的搜索引擎排序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102794558A CN102279895A (zh) 2011-09-20 2011-09-20 一种基于蚁群算法的搜索引擎排序方法

Publications (1)

Publication Number Publication Date
CN102279895A true CN102279895A (zh) 2011-12-14

Family

ID=45105337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102794558A Pending CN102279895A (zh) 2011-09-20 2011-09-20 一种基于蚁群算法的搜索引擎排序方法

Country Status (1)

Country Link
CN (1) CN102279895A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103002520A (zh) * 2012-06-06 2013-03-27 北京邮电大学 多模终端选择能够保证服务质量的目标网络的方法
CN105683966A (zh) * 2016-01-30 2016-06-15 深圳市博信诺达经贸咨询有限公司 基于大数据的搜索方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103002520A (zh) * 2012-06-06 2013-03-27 北京邮电大学 多模终端选择能够保证服务质量的目标网络的方法
CN103002520B (zh) * 2012-06-06 2015-05-20 北京邮电大学 多模终端选择能够保证服务质量的目标网络的方法
CN105683966A (zh) * 2016-01-30 2016-06-15 深圳市博信诺达经贸咨询有限公司 基于大数据的搜索方法及***

Similar Documents

Publication Publication Date Title
Chandramouli et al. Streamrec: a real-time recommender system
US9317550B2 (en) Query expansion
CN101321190B (zh) 一种异构网络中的推荐方法及推荐***
EP2902923A1 (en) Search engine ranking method based on user participation
CN104077324B (zh) 一种地图搜索方法及***
CN105335415A (zh) 基于输入预测的搜索方法和输入法***
Zhong et al. Time-aware service recommendation for mashup creation in an evolving service ecosystem
CN109241341A (zh) 一种基于知识图谱的影视择优推荐***和方法
CN103365910B (zh) 一种信息检索的方法和***
CN103778227A (zh) 从检索图像中筛选有用图像的方法
CN103744954B (zh) 一种词关联网模型的构建方法及其构建器
CN106375369A (zh) 基于用户行为分析的移动Web业务推荐方法及协同推荐***
CN104636407B (zh) 参数取值训练及搜索请求处理方法和装置
CN103150369A (zh) 作弊网页识别方法及装置
CN106980646A (zh) 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法
CN103577464B (zh) 一种搜索引擎坏例的挖掘方法和装置
TW201543394A (zh) 點擊率預估模型建立方法、裝置及資訊提供方法、系統
CN103425650A (zh) 推荐搜索方法和***
CN111782956A (zh) 一种基于用户行为和关键词分类的搜索方法
CN102750380B (zh) 一种结合差异特征分布与链接特征的网页排序方法
CN102306182A (zh) 基于概念语义背景图挖掘用户兴趣的方法
Tian A kind of algorithm for page ranking based on classified tree in search engine
CN103150336A (zh) 一种基于用户聚类的sky line在线计算方法
CN107977452A (zh) 一种基于大数据的信息检索***及方法
CN102279895A (zh) 一种基于蚁群算法的搜索引擎排序方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
DD01 Delivery of document by public notice

Addressee: Zhou Yanquan

Document name: Notification of Publication of the Application for Invention

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111214