CN106960039B - 基于整子多Agent的社会化搜索引擎*** - Google Patents
基于整子多Agent的社会化搜索引擎*** Download PDFInfo
- Publication number
- CN106960039B CN106960039B CN201710190053.8A CN201710190053A CN106960039B CN 106960039 B CN106960039 B CN 106960039B CN 201710190053 A CN201710190053 A CN 201710190053A CN 106960039 B CN106960039 B CN 106960039B
- Authority
- CN
- China
- Prior art keywords
- module
- agent
- holon
- data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005065 mining Methods 0.000 claims abstract description 73
- 238000004140 cleaning Methods 0.000 claims abstract description 48
- 238000005457 optimization Methods 0.000 claims abstract description 46
- 239000003795 chemical substances by application Substances 0.000 claims description 173
- 238000004891 communication Methods 0.000 claims description 64
- 238000004458 analytical method Methods 0.000 claims description 30
- 239000012459 cleaning agent Substances 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 238000012423 maintenance Methods 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 239000003599 detergent Substances 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 7
- 206010063385 Intellectualisation Diseases 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 17
- 238000000034 method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 2
- 238000013481 data capture Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于整子多Agent的社会化搜索引擎***,包括数据获取与清洗父Holon模块、知识挖掘父Holon模块、搜索优化父Holon模块、搜索缓存库、用户信息库及用户知识库。数据获取与清洗父Holon模块获取并清洗数据;知识挖掘父Holon模块挖掘社交数据中隐含的社交知识;搜索优化父Holon模块为用户提供个性化的查询结果以及智能化的信息推荐功能。本发明采用整子多Agent技术,充分利用整子多Agent技术的感知性、协作性、可扩展性等特征设计社会化搜索引擎***,具有个性化、智能化程度高、可扩展性好的优点。
Description
技术领域
本发明属于通信技术领域,更进一步涉及信息检索技术领域中的一种基于整子多Agent的社会化搜索引擎***。本发明主要用于优化全文搜索引擎的检索结果,同时向用户提供多样化的信息推荐功能,使得检索过程变得更加个性化、智能化。
背景技术
当前,随着互联网技术的飞速发展,搜索引擎成为互联网上信息检索的重要工具。社会化搜索(social search)旨在利用社交网络的优势弥补传统搜索引擎的不足,重视群体协作在信息检索中发挥的能动作用,通过用户间的相互联系优化搜索结果,提供高质量与高相关性的搜索服务。但目前的社会化搜索引擎存在以下三个方面的问题:缺乏对用户兴趣、社团关系、影响力多维度知识的深度挖掘,导致个性化服务水平较低;现有社会化搜索引擎***缺乏感知性、协作性、可扩展性,导致***智能化程度低;缺乏用户感兴趣内容的推荐功能。
大连理工大学在其申请的专利文献“一种基于社会化标注的个性化搜索方法及***”(专利申请号:2015102465031,公布号CN 104866554 A)中公开了一种利用社会化标注优化搜索结果的方法及***。该***包含网页文档处理模块、相关向量提取模块、用户相似度计算模块、相似用户选取模块、用户对文档的个性化标签向量的计算模块、用户的扩展属性向量计算模块以及文档打分与排序模块。该***利用用户公开的标签信息深度挖掘用户的兴趣偏好,即从网页用户的标注信息出发,利用用户主动公开的信息进行个性化搜索优化,避免了隐私泄露和冷启动问题,较好的提升了检索准确度。此外,用户的扩展属性向量计算模块根据用户浏览过的网页类别信息及标签信息寻找高相似度用户,并利用这些相似用户的信息形成目标用户的扩展属性,对用户的兴趣描述更加全面有效。但是,该***仍然存在的不足之处是:首先,完全基于标注信息挖掘的用户兴趣比较片面;其次,相似用户选取模块将所有相似度值相同的用户赋予了同样的权重,缺乏多维度的个性化优化策略;最后,该***缺乏智能化的推荐功能,不能向用户推荐可能感兴趣的内容或用户。
北京网智天元科技有限公司在其申请的专利文献“一种社会化的搜索引擎方法和***”(专利申请号:2012104411846,公布号CN 102930029 A)中公开了一种利用微博用户数据优化搜索结果的社会化搜索方法及***。该***由信息抓取模块、信息抽取模块、专家数据库以及查询请求处理模块组成。信息抓取模块负责从微博中抽取用户基本资料信息,建立专家信息库。然后查询请求处理模块根据用户输入的查询词在专家信息库中找到与之相关的专家,接着依据用户的自主选择将该查询词转发给一个或多个被选专家,对此请求进行实时追踪,及时抓取专家返回的结果,最后对查询结果进行处理,并返回给当前用户。该***更多的考虑了人的因素,通过帮助用户找到与查询词最为相关的专家,实现人到人之间的信息获取模式,从而提高搜索引擎的查全率和查准率。该***仍然存在的不足之处是:首先,在考虑专家影响力时,仅考虑了用户的关注数、粉丝数以及发布的博文数,却忽略了评论数和转发数对专家影响力的影响;其次,在寻找相关专家时,仅依靠专家的专业度进行排序,却忽略了当前用户与专家间的社会关联;最后,该***只能针对社交网络中的用户搜索结果进行个性化优化,却不能对全文搜索引擎的结果做优化,***缺乏可扩展性、自主性、感知性和智能化等特征。
发明内容
本发明的目的在于克服上述已有技术的不足,提供一种基于整子多Agent的社会化搜索引擎***。本发明利用用户社交网络数据,深度分析用户兴趣、社团关系以及影响力,并基于这些社交知识优化全文搜索引擎返回的检索结果,同时向用户推荐感兴趣的信息。此外,整子多Agent***架构还能够提高社会化搜索引擎***的感知性、协作性和可扩展性,为用户提供更加个性化、智能化的检索体验。
本发明的具体思路是:利用智能Agent技术实现社会化搜索引擎***,基于整子结构设计智能Agent间的组织模式,利用整子多Agent的感知性、协作性、可扩展性等特征实现用户兴趣的挖掘、社团关系的划分以及用户影响力的评估,对全文搜索引擎的搜索结果进行重排序,为用户提供多样化的信息推荐。
为实现上述目的,本发明提供的基于整子多Agent的社会化搜索引擎***,包括数据获取与清洗父Holon模块、用户信息库、搜索缓存库、知识挖掘父Holon模块、用户知识库及搜索优化父Holon模块,其中,各模块的功能如下:
数据获取与清洗父Holon模块包括一个数据中心Agent和多个数据获取与清洗子Holon模块。数据中心Agent用于根据数据获取与清洗子Holon模块的负载信息,在资源短缺时生成数据获取与清洗子Holon模块,在资源过剩时销毁多余的数据获取与清洗子Holon模块以实现负载均衡。数据获取与清洗子Holon模块用于将搜索引擎检索结果数据存储到搜索缓存库中,将清洗后的社交网络数据存储到用户信息库中。
用户信息库,用于存储数据获取与清洗父Holon模块清洗后的社交网络数据,为知识挖掘父Holon模块提供知识挖掘所需数据。
搜索缓存库,用于存储全文搜索引擎工具的检索结果,作为搜索优化父Holon模块所需检索结果的数据来源。
知识挖掘父Holon模块包括一个挖掘中心Agent、多个知识挖掘子Holon模块。挖掘中心Agent用于根据知识挖掘子Holon模块的负载信息,在资源短缺时生成知识挖掘子Holon模块,在资源过剩时销毁多余的知识挖掘子Holon模块以实现负载均衡。知识挖掘子Holon模块用于挖掘社交网络数据中隐含的用户兴趣知识、社团知识、影响力知识共三类社交知识,并将获取的社交知识存储至用户知识库中。
用户知识库,用于存储知识挖掘父Holon模块挖掘出的社交知识,作为搜索优化父Holon模块优化搜索结果所需的知识来源。
搜索优化父Holon模块包括一个优化中心Agent、多个搜索优化子Holon模块。优化中心Agent用于根据搜索优化子Holon模块的负载信息,在资源短缺时生成搜索优化子Holon模块,在资源过剩时销毁多余的搜索优化子Holon模块以实现负载均衡。搜索优化子Holon模块用于利用用户知识库中的社交知识优化搜索缓存库中的检索结果,并向用户推荐感兴趣的信息。
本发明与现有技术相比具有如下优点:
第一,本发明包含的知识挖掘父Holon模块合理利用在线社交网络数据,通过离线挖掘社交网络数据,深度挖掘用户兴趣知识、社团知识和影响力知识,克服了现有技术仅基于用户标注或浏览历史记录获取用户兴趣,导致个性化服务水平较低的问题,使得本发明能够准确的根据用户兴趣返回更加个性化的检索结果。
第二,本发明采用整子多Agent技术,充分利用整子多Agent技术的感知性、协作性、可扩展性等特征设计社会化搜索引擎***,克服了现有社会化搜索引擎***中缺乏感知性、协作性、可扩展性而导致***智能化程度低的问题。使得本发明在运行过程能够主动感知用户的社交知识变化,实时更新用户的社交知识,使得用户能够快速找到自己所需信息,提高了社会化搜索引擎的感知性、协作性、可扩展性。
第三,本发明的搜索优化父Holon模块利用知识挖掘父Holon模块挖掘出的社交知识,实现了基于社交知识的相关查询词、社团用户的推荐功能,克服了现有技术中缺乏用户感兴趣信息推荐的问题,使得本发明在运行过程中基于群体智慧,充分利用社交知识分析当前用户感兴趣的内容,提升了用户的搜索体验。
附图说明
图1为本发明的结构示意图;
图2为本发明的数据获取与清洗父Holon模块的结构示意图;
图3为本发明的知识挖掘父Holon模块的结构示意图;
图4为本发明的搜索优化父Holon模块的结构示意图。
具体实施方式
下面结合附图对本发明做进一步的详细描述。
参照附图1,本发明包括数据获取与清洗父Holon模块、用户信息库、搜索缓存库、知识挖掘父Holon模块、用户知识库及搜索优化父Holon模块。本发明通过这三类Holon模块相互协作,利用社交网络数据充分挖掘用户兴趣、用户社团关系、用户影响力,优化全文搜索引擎工具的检索结果,提供多样化的信息推荐,最终实现更加个性化、智能化的社会化搜索引擎***。其中,数据获取与清洗父Holon模块包括一个数据中心Agent和多个数据获取与清洗子Holon模块。数据中心Agent用于实现负载均衡时动态生成或销毁数据获取与清洗子Holon模块。数据获取与清洗子Holon模块用于获取并清洗数据。用户信息库,用于存储社交网络数据。搜索缓存库,用于存储全文搜索引擎工具的检索结果。知识挖掘父Holon模块包括一个挖掘中心Agent、多个知识挖掘子Holon模块。挖掘中心Agent用于实现负载均衡时动态生成或销毁知识挖掘子Holon模块。知识挖掘子Holon模块用于挖掘用户的社交知识,并将获取的社交知识存储至用户知识库中。用户知识库,用于存储知识挖掘父Holon模块挖掘出的社交知识。搜索优化父Holon模块包括一个优化中心Agent、多个搜索优化子Holon模块。优化中心Agent用于实现负载均衡时动态生成或销毁搜索优化子Holon模块。搜索优化子Holon模块用于优化搜索缓存库中的检索结果,并向用户推荐感兴趣的信息。
参照附图2,数据中心Agent包含Holon管理器、负载状态库、负载监视器和通信模块。Holon管理器,用于从负载状态库中读取数据获取与清洗子Holon模块的负载信息,在资源短缺时生成数据获取与清洗子Holon模块,在资源过剩时销毁多余的数据获取与清洗子Holon模块。负载状态库,用于存放数据获取与清洗子Holon模块的任务负载信息。负载监视器,用于监视数据获取与清洗子Holon模块的任务负载情况。通信模块,用于实现数据获取与清洗父Holon模块与数据获取与清洗子Holon模块的信息交流功能。数据获取与清洗子Holon模块包括一个数据中心子Agent、多个数据获取与清洗Agent。数据中心子Agent包含负载监视器、Agent管理器和通信模块。负载监视器,用于监控数据获取与清洗Agent的任务负载情况。Agent管理器,用于根据负载监视器感知到的负载情况,在资源短缺时生成数据获取与清洗Agent,在资源过剩时销毁多余的数据获取与清洗Agent,以实现负载均衡。所述的通信模块,用于实现数据获取与清洗子Holon模块和数据获取与清洗Agent的信息交流功能。数据获取与清洗Agent包括通信模块、数据类型感知器、数据更新模块、数据抓取模块、数据清洗模块和数据缓存库。通信模块,用于实现数据获取与清洗Agent与数据中心子Agent的信息交流功能。数据类型感知器,用于感知获取的数据类型,并将感知的结果传递给数据更新模块和数据抓取模块。数据更新模块,接收数据类型感知器传递的结果,将搜索引擎检索结果数据存储到搜索缓存库中;数据更新模块接收数据清洗模块清洗后的社交网络数据,并存储到用户信息库中。数据抓取模块,接收数据类型感知器传递的结果,将社交网络数据存储到数据缓存库中。数据清洗模块,用于清洗数据缓存库中的社交网络数据,并将清洗后的数据提交给数据更新模块。数据缓存库,用于存储数据抓取模块传递来的数据。
参照附图3,挖掘中心Agent包含Holon管理器、负载状态库、负载监视器和通信模块。Holon管理器,用于从负载状态库中读取知识挖掘子Holon模块的负载信息,在资源短缺时生成知识挖掘子Holon模块,在资源过剩时销毁多余的知识挖掘子Holon模块。负载状态库,用于存放知识挖掘子Holon模块的任务负载信息。负载监视器,用于监视知识挖掘子Holon模块的任务负载情况。通信模块,用于实现知识挖掘父Holon模块与知识挖掘子Holon模块的信息交流功能。知识挖掘子Holon模块包括挖掘中心子Agent、用户Agent、兴趣挖掘Agent、社团划分Agent及影响力分析Agent。挖掘中心子Agent包含负载监视器、Agent管理器和通信模块。负载监视器,用于监控兴趣挖掘Agent、社团划分Agent、影响力分析Agent的任务负载情况。Agent管理器,根据负载监视器感知到的负载情况,在资源短缺时生成各Agent,在资源过剩时销毁各Agent,以实现负载均衡。通信模块,用于实现知识挖掘子Holon模块与兴趣挖掘Agent、社团划分Agent和影响力分析Agent的信息交流功能。用户Agent包括通信模块、数据变化感知器以及数据更新模块。通信模块,用于实现用户Agent与兴趣挖掘Agent、社团划分Agent和影响力分析Agent的信息交流功能。数据变化感知器,用于感知用户信息库中的数据变化,并及时通知兴趣挖掘Agent、影响力分析Agent、社团划分Agent。数据更新模块,用于更新用户知识库。兴趣挖掘Agent包括通信模块、兴趣推理机模块。通信模块,用于实现兴趣挖掘Agent与用户Agent、社团划分Agent和影响力分析Agent的信息交流功能。兴趣推理机模块,利用贝叶斯公式分析用户信息库中的社交网络数据,得出用户对每个兴趣项的兴趣度,实现用户兴趣的维护和更新,并将结果通过通信模块交由用户Agent。社团划分Agent包括通信模块、用户相似度计算模块、用户相似度知识库、用户相似度社团推理机和用户兴趣社团推理机。通信模块,用于实现社团划分Agent与用户Agent、兴趣挖掘Agent和影响力分析Agent的信息交流功能。用户相似度计算模块,用于利用社交网络数据中用户的基本信息计算用户之间的相似度,并将结果传递给用户相似度知识库。用户相似度知识库,用于存储相似度计算模块传递过来的数据。用户相似度社团推理机,利用相似度知识库中的数据进行用户社团划分。用户兴趣社团推理机,利用兴趣挖掘Agent的分析结果,从用户兴趣维度实现用户社团关系划分,并将结果通过通信模块交由用户Agent。影响力分析Agent包括通信模块、领域分类器模块和细粒度影响力推理机。通信模块,用于实现影响力分析Agent与用户Agent、兴趣挖掘Agent和社团划分Agent的信息交流功能。领域分类器模块,用于利用用户信息库中的社交网络数据,识别用户所属的所有领域信息。细粒度影响力推理机,用于挖掘用户在不同领域的影响力值,实现用户影响力的维护和更新,并将结果通过通信模块交由用户Agent。
参照附图4,优化中心Agent包含Holon管理器、负载状态库、负载监视器和通信模块。Holon管理器,用于从负载状态库中读取搜索优化子Holon模块的负载信息,在资源短缺时生成搜索优化子Holon模块,在资源过剩时销毁多余的搜索优化子Holon模块。负载状态库,用于存放搜索优化子Holon模块的任务负载信息。负载监视器,用于监视搜索优化子Holon模块的任务负载情况。通信模块,用于实现搜索优化父Holon模块与搜索优化子Holon模块的信息交流功能。搜索优化子Holon模块包括优化中心子Agent、结果排序Agent以及信息推荐Agent。优化中心子Agent包括负载监视器、Agent管理器和通信模块。负载监视器,用于监控结果排序Agent、信息推荐Agent的任务负载情况。Agent管理器,根据负载监视器感知到的负载情况,在资源短缺时生成各Agent,在资源过剩时销毁各Agent,以实现负载均衡。通信模块,用于实现搜索优化子Holon模块与结果排序Agent和信息推荐Agent的信息交流功能。结果排序Agent包括通信模块、检索结果分析器、结果分析知识库、结果排序器。通信模块,用于实现优化中心子Agent与结果排序Agent的信息交流功能。检索结果分析器,用于分析搜索缓存库中的检索结果,并将分析结果交由结果分析知识库。结果分析知识库,用于存储检索结果分析器传递来的数据。结果排序器,用于利用用户知识库中的社交知识,对结果分析知识库中的检索结果进行个性化重排序。信息推荐Agent包括通信模块、社团用户推荐器模块和相关查询词推荐器模块。通信模块,用于实现优化中心子Agent与信息推荐Agent的信息交流功能。社团用户推荐器模块,用于根据影响力值将社团中用户进行降序排列,并向用户推荐前5位的用户。相关查询词推荐器模块,用于比较社团用户推荐器模块产生的推荐用户近3天的查询词与当前用户输入查询词的相似程度,得到相似度矩阵,将相似度值排在前5名的查询词推荐给当前用户。
Claims (7)
1.一种基于整子多Agent的社会化搜索引擎***,包括数据获取与清洗父Holon模块、用户信息库、搜索缓存库、知识挖掘父Holon模块、用户知识库及搜索优化父Holon模块,其中:
所述的数据获取与清洗父Holon模块包括一个数据中心Agent和多个数据获取与清洗子Holon模块;所述的数据中心Agent用于实现负载均衡时动态生成或销毁数据获取与清洗子Holon模块;所述的数据获取与清洗子Holon模块用于将搜索引擎检索结果数据存储到搜索缓存库中,将清洗后的社交网络数据存储到用户信息库中;
所述的用户信息库,用于存储数据获取与清洗父Holon模块清洗后的社交网络数据,为知识挖掘父Holon模块提供知识挖掘所需数据;
所述的搜索缓存库,用于存储全文搜索引擎工具的检索结果,作为搜索优化父Holon模块所需检索结果的数据来源;
所述的知识挖掘父Holon模块包括一个挖掘中心Agent、多个知识挖掘子Holon模块;所述的挖掘中心Agent用于实现负载均衡时动态生成或销毁知识挖掘子Holon模块;所述的知识挖掘子Holon模块用于分析用户信息库中存储的社交网络数据,挖掘用户的兴趣知识、社团知识、影响力知识共三类社交知识,并将获取的社交知识存储至用户知识库中;
所述的用户知识库,用于存储知识挖掘父Holon模块挖掘出的社交知识,作为搜索优化父Holon模块优化搜索结果所需的知识来源;
所述的搜索优化父Holon模块包括一个优化中心Agent、多个搜索优化子Holon模块;所述的优化中心Agent用于实现负载均衡时动态生成或销毁搜索优化子Holon模块;所述的搜索优化子Holon模块用于优化搜索缓存库中的检索结果,并向用户推荐感兴趣的信息。
2.根据权利要求1所述的基于整子多Agent的社会化搜索引擎***,其特征在于,所述的数据中心Agent包含Holon管理器、负载状态库、负载监视器和通信模块,其中:
所述的Holon管理器,用于从负载状态库中读取数据获取与清洗子Holon模块的负载信息,在资源短缺时生成数据获取与清洗子Holon模块,在资源过剩时销毁多余的数据获取与清洗子Holon模块;
所述的负载状态库,用于存储数据获取与清洗子Holon模块的任务负载信息;
所述的负载监视器,用于监视数据获取与清洗子Holon模块的任务负载情况;
所述的通信模块,用于实现数据获取与清洗父Holon模块与数据获取与清洗子Holon模块的信息交流功能。
3.根据权利要求1所述的基于整子多Agent的社会化搜索引擎***,其特征在于,所述的数据获取与清洗子Holon模块包括一个数据中心子Agent、多个数据获取与清洗Agent,其中:
所述的数据中心子Agent包含负载监视器、Agent管理器和通信模块;所述的负载监视器,用于监控数据获取与清洗Agent的任务负载情况;所述的Agent管理器,用于根据负载监视器感知到的负载情况,在资源短缺时生成数据获取与清洗Agent,在资源过剩时销毁多余的数据获取与清洗Agent,以实现负载均衡;所述的通信模块,用于实现数据获取与清洗子Holon模块和数据获取与清洗Agent的信息交流功能;
所述的数据获取与清洗Agent包括通信模块、数据类型感知器、数据更新模块、数据抓取模块、数据清洗模块和数据缓存库;所述的通信模块,用于实现数据获取与清洗Agent与数据中心子Agent的信息交流功能;所述的数据类型感知器用于感知获取的数据类型,并将感知的结果传递给数据更新模块和数据抓取模块;所述的数据更新模块,接收数据类型感知器传递的结果,将搜索引擎检索结果数据存储到搜索缓存库中;数据更新模块接收数据清洗模块清洗后的社交网络数据,并存储到用户信息库中;所述的数据抓取模块,接收数据类型感知器传递的结果,将社交网络数据存储到数据缓存库中;所述的数据清洗模块用于清洗数据缓存库中的社交网络数据,并将清洗后的数据提交给数据更新模块;所述的数据缓存库用于存储数据抓取模块传递来的数据。
4.根据权利要求1所述的基于整子多Agent的社会化搜索引擎***,其特征在于,所述的挖掘中心Agent包含Holon管理器、负载状态库、负载监视器和通信模块,其中:
所述的Holon管理器,用于从负载状态库中读取知识挖掘子Holon模块的负载信息,在资源短缺时生成知识挖掘子Holon模块,在资源过剩时销毁多余的知识挖掘子Holon模块;
所述的负载状态库,用于存放知识挖掘子Holon模块的任务负载信息;
所述的负载监视器,用于监视知识挖掘子Holon模块的任务负载情况;
所述的通信模块,用于实现知识挖掘父Holon模块与知识挖掘子Holon模块的信息交流功能。
5.根据权利要求1所述的基于整子多Agent的社会化搜索引擎***,其特征在于,所述的知识挖掘子Holon模块包括挖掘中心子Agent、兴趣挖掘Agent、社团划分Agent、影响力分析Agent及用户Agent,其中:
所述的挖掘中心子Agent,包含负载监视器、Agent管理器和通信模块;所述的负载监视器,用于监控兴趣挖掘Agent、社团划分Agent、影响力分析Agent的任务负载情况;所述的Agent管理器,根据负载监视器感知到的负载情况,在资源短缺时生成各Agent,在资源过剩时销毁各Agent,以实现负载均衡;所述的通信模块用于实现知识挖掘子Holon模块与兴趣挖掘Agent、社团划分Agent和影响力分析Agent的信息交流功能;
所述的兴趣挖掘Agent包括通信模块、兴趣推理机模块;所述的通信模块,用于实现兴趣挖掘Agent与用户Agent、社团划分Agent和影响力分析Agent的信息交流功能;所述的兴趣推理机模块,利用贝叶斯公式分析用户信息库中的社交网络数据,得出用户对每个兴趣项的兴趣度,实现用户兴趣的维护和更新,并将结果通过通信模块交由用户Agent;
所述的社团划分Agent包括通信模块、用户相似度计算模块、用户相似度知识库、用户相似度社团推理机和用户兴趣社团推理机;所述的通信模块,用于实现社团划分Agent与用户Agent、兴趣挖掘Agent和影响力分析Agent的信息交流功能;所述的用户相似度计算模块用于利用社交网络数据中用户的基本信息计算用户之间的相似度,并将结果传递给用户相似度知识库;所述的用户相似度知识库用于存储相似度计算模块传递过来的数据;所述的用户相似度社团推理机,利用相似度知识库中的数据进行用户社团划分;所述的用户兴趣社团推理机,利用兴趣挖掘Agent的分析结果,从用户兴趣维度实现用户社团关系划分,并将结果通过通信模块交由用户Agent;
所述的影响力分析Agent包括通信模块、领域分类器模块和细粒度影响力推理机;所述的通信模块,用于实现影响力分析Agent与用户Agent、兴趣挖掘Agent和社团划分Agent的信息交流功能;所述的领域分类器模块,用于利用用户信息库中的社交网络数据,识别用户所属的所有领域信息;所述的细粒度影响力推理机,用于挖掘用户在不同领域的影响力值,实现用户影响力的维护和更新,并将结果通过通信模块交由用户Agent;
所述的用户Agent包括通信模块、数据变化感知器以及数据更新模块;所述的通信模块,用于实现用户Agent与兴趣挖掘Agent、社团划分Agent和影响力分析Agent的信息交流功能;所述的数据变化感知器,用于感知用户信息库中的数据变化,并及时通知兴趣挖掘Agent、影响力分析Agent、社团划分Agent;所述的数据更新模块,用于更新用户知识库。
6.根据权利要求1所述的基于整子多Agent的社会化搜索引擎***,其特征在于,所述的优化中心Agent包含Holon管理器、负载状态库、负载监视器和通信模块,其中:
所述的Holon管理器,用于从负载状态库中读取搜索优化子Holon模块的负载信息,在资源短缺时生成搜索优化子Holon模块,在资源过剩时销毁多余的搜索优化子Holon模块;
所述的负载状态库,用于存放搜索优化子Holon模块的任务负载信息;
所述的负载监视器,用于监视搜索优化子Holon模块的任务负载情况;
所述的通信模块,用于实现搜索优化父Holon模块与搜索优化子Holon模块的信息交流功能。
7.根据权利要求1所述的基于整子多Agent的社会化搜索引擎***,其特征在于,所述的搜索优化子Holon模块包括优化中心子Agent、结果排序Agent以及信息推荐Agent,其中:
所述的优化中心子Agent包括负载监视器、Agent管理器和通信模块;所述的负载监视器,用于监控结果排序Agent、信息推荐Agent的任务负载情况;所述的Agent管理器,根据负载监视器感知到的负载情况,在资源短缺时生成各Agent,在资源过剩时销毁各Agent,以实现负载均衡;所述的通信模块用于实现搜索优化子Holon模块与结果排序Agent和信息推荐Agent的信息交流功能;
所述的结果排序Agent包括通信模块、检索结果分析器、结果分析知识库、结果排序器;所述的通信模块,用于实现优化中心子Agent与结果排序Agent的信息交流功能;所述的检索结果分析器用于分析搜索缓存库中的检索结果,并将分析结果交由结果分析知识库;所述的结果分析知识库用于存储检索结果分析器传递来的数据;所述的结果排序器,利用用户知识库中的社交知识,对结果分析知识库中的检索结果进行个性化重排序;
所述的信息推荐Agent包括通信模块、社团用户推荐器模块和相关查询词推荐器模块;所述的通信模块,用于实现优化中心子Agent与信息推荐Agent的信息交流功能;所述的社团用户推荐器模块,用于根据影响力值将社团中用户进行降序排列,并向用户推荐前5位的用户;所述的相关查询词推荐器模块,用于比较社团用户推荐器模块产生的推荐用户近3天的查询词与当前用户输入查询词的相似程度,得到相似度矩阵,将相似度值排在前5名的查询词推荐给当前用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710190053.8A CN106960039B (zh) | 2017-03-28 | 2017-03-28 | 基于整子多Agent的社会化搜索引擎*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710190053.8A CN106960039B (zh) | 2017-03-28 | 2017-03-28 | 基于整子多Agent的社会化搜索引擎*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106960039A CN106960039A (zh) | 2017-07-18 |
CN106960039B true CN106960039B (zh) | 2019-12-10 |
Family
ID=59471185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710190053.8A Active CN106960039B (zh) | 2017-03-28 | 2017-03-28 | 基于整子多Agent的社会化搜索引擎*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106960039B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110609834B (zh) * | 2018-05-29 | 2023-04-18 | 西安电子科技大学 | 基于Agent的多源异构政务数据抽取*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012138611A2 (en) * | 2011-04-08 | 2012-10-11 | Zalila-Wenkstern Rym | Customizable interfacing agents, systems, and methods |
CN103034672A (zh) * | 2011-09-29 | 2013-04-10 | 云壤(北京)信息技术有限公司 | 社会化搜索***及搜索方法 |
CN104462373A (zh) * | 2014-12-09 | 2015-03-25 | 南京大学 | 一种基于多Agent的个性化推荐引擎实现方法 |
CN102902800B (zh) * | 2012-10-12 | 2015-06-03 | 西安电子科技大学 | 基于Agent的智能元搜索引擎*** |
CN104866554A (zh) * | 2015-05-15 | 2015-08-26 | 大连理工大学 | 一种基于社会化标注的个性化搜索方法及*** |
-
2017
- 2017-03-28 CN CN201710190053.8A patent/CN106960039B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012138611A2 (en) * | 2011-04-08 | 2012-10-11 | Zalila-Wenkstern Rym | Customizable interfacing agents, systems, and methods |
CN103034672A (zh) * | 2011-09-29 | 2013-04-10 | 云壤(北京)信息技术有限公司 | 社会化搜索***及搜索方法 |
CN102902800B (zh) * | 2012-10-12 | 2015-06-03 | 西安电子科技大学 | 基于Agent的智能元搜索引擎*** |
CN104462373A (zh) * | 2014-12-09 | 2015-03-25 | 南京大学 | 一种基于多Agent的个性化推荐引擎实现方法 |
CN104866554A (zh) * | 2015-05-15 | 2015-08-26 | 大连理工大学 | 一种基于社会化标注的个性化搜索方法及*** |
Non-Patent Citations (3)
Title |
---|
Improving Search In Social Networks by Agent Based Mining;Anıl G¨ursel 等;《Proceedings of the Twenty-First International Joint Conference on Artificial Intelligence》;20091231;2034-2039 * |
The impactofdiversityonperformanceofholonicmulti-agentsystems;Ahmad Esmaeili 等;《Engineering ApplicationsofArtificial Intelligence55》;20161231;186–201 * |
社交网络相关机制应用于搜索引擎的研究综述;费洪晓 等;《计算技术与自动化》;20140331;第33卷(第1期);1-9 * |
Also Published As
Publication number | Publication date |
---|---|
CN106960039A (zh) | 2017-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chu et al. | A hybrid recommendation system considering visual information for predicting favorite restaurants | |
Aligon et al. | A collaborative filtering approach for recommending OLAP sessions | |
CN105512183B (zh) | 一种基于用户自主选择的个性化推荐方法和*** | |
CN103324657B (zh) | 采用语义和使用情况统计的多维查询扩展 | |
US10600011B2 (en) | Methods and systems for improving engagement with a recommendation engine that recommends items, peers, and services | |
CN104933100A (zh) | 关键词推荐方法和装置 | |
CN103838833A (zh) | 基于相关词语语义分析的全文检索*** | |
CN103646092A (zh) | 基于用户参与的搜索引擎排序方法 | |
US20030212663A1 (en) | Neural network feedback for enhancing text search | |
CN110175895A (zh) | 一种物品推荐方法及装置 | |
CN102930041A (zh) | 一种基于用户行为信息的检索结果实时更新方法及其*** | |
CN115130008A (zh) | 一种基于机器学习模型算法的搜索排序方法 | |
Zheng | Multi level recommendation system of college online learning resources based on multi intelligence algorithm | |
CN106960039B (zh) | 基于整子多Agent的社会化搜索引擎*** | |
Antonellis et al. | Algorithms for clustering clickstream data | |
Bhujbal et al. | News aggregation using web scraping news portals | |
Kaur | Web content classification: a survey | |
CN111353085A (zh) | 一种基于特征模型的云挖掘分析网络舆情方法 | |
CN117540087A (zh) | 一种个性化新闻数据推荐的方法、***及储存介质 | |
CN115563189A (zh) | 一种基于数据挖掘技术的海量数据查询方法 | |
Thakur et al. | Query based personalization in semantic web mining | |
Veningston et al. | Enhancing personalized web search re-ranking algorithm by incorporating user profile | |
Alzua-Sorzabal et al. | Using MWD: A business intelligence system for tourism destination web | |
Cai et al. | Learning search popularity for personalized query completion in information retrieval | |
Khelghati | Deep web content monitoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |