CN116127190A - 一种数字地球资源推荐***及方法 - Google Patents

一种数字地球资源推荐***及方法 Download PDF

Info

Publication number
CN116127190A
CN116127190A CN202211731819.6A CN202211731819A CN116127190A CN 116127190 A CN116127190 A CN 116127190A CN 202211731819 A CN202211731819 A CN 202211731819A CN 116127190 A CN116127190 A CN 116127190A
Authority
CN
China
Prior art keywords
user
value
resource
service
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211731819.6A
Other languages
English (en)
Other versions
CN116127190B (zh
Inventor
朱利鲁
付琨
张卫东
王洋
苏晓露
黄凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Aerospace Information Research Institute
Original Assignee
Suzhou Aerospace Information Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Aerospace Information Research Institute filed Critical Suzhou Aerospace Information Research Institute
Publication of CN116127190A publication Critical patent/CN116127190A/zh
Application granted granted Critical
Publication of CN116127190B publication Critical patent/CN116127190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种数字地球资源推荐***及方法,从专业属性、行为属性、趋势属性等方面构建用户行为信息模型,建立由用户活跃度、***熟悉度、用户可信度构成的用户信息价值评价模型;融合了地球领域知识、业务特点、动态应用价值,建立了地球空间数据和应用服务资源的价值评价方法,提高了价值评价的准确性;设计了多种支持科学发现的服务策略,并与深度协同过滤技术相结合,提出了信息融合、价值评价、知识发现为一体的数字地球资源主动服务方法,提升了资源推荐的准确度。本发明能够帮助用户更好的探索与理解地球资源的运行与发展趋势,提高了地球“远见卓识”能力。

Description

一种数字地球资源推荐***及方法
技术领域
本发明涉及数字地球技术,具体涉及一种数字地球资源推荐***及方法。
背景技术
随着新一代数字地球科学平台采用云计算技术作为底层资源支撑,***应用规模不断扩大,越来越多的数据信息、服务信息、用户信息等不断涌入地球平台,使得信息资源管理和服务面临较大挑战。这些海量多源、动态随机的信息资源由于种类繁多、数量庞大,通过事件、时间等进行交织,不仅增加了信息分析、信息评价的复杂性,使得高价值的信息资源难以被发现,同时也加大了用户用于信息过滤,信息检索排序的时间开销,降低用户体验。因此,设计一种面向多源地球资源的推荐方法,帮助用户从海量的空间数据、服务等资源中发现潜在价值,具有重要的科学研究和现实意义。一方面,能够优化资源管理粒度,填补服务缺项,实现地球***降本增效。另一方面,能够为用户持续发现信息潜在价值,提升地球***数智化水平。
新一代数字地球作为多学科交叉融合的科学平台,大多数的地球资源在不同运行环境与专题场景中的应用目标与性能表现均存在差距,传统的用户关键词检索或者逐条浏览进行资源发现的方式不仅变得相当费时,而且也无助于发现新的需求数据与服务信息。早先订阅式的数字地球推荐方法虽然一定程度上能够缓解平台信息资源发现与服务的时效问题,但是基于内容的订阅方法也限制了搜索范围,无法获取到价值更高的相似性或相关性资源推荐。现如今部分学者针对地理信息服务质量和地理信息知识服务展开了研究,希望通过深度的质量模型或融合推荐算法来进一步提高GIS服务体验。但是这些方法由于缺乏对地球专业领域的信息分析和知识融合,在高价值地球数据、专题产品、模型服务发现的准确性、新奇性方面仍然面临挑战。综上所述,目前在相关领域内缺少面向数字地球资源智能推荐方法,即通过多种支持科学发现的服务策略与深度协同过滤技术相结合,提升地球平台资源利用效率和用户体验。
发明内容
本发明的目的在于提出一种数字地球资源推荐***及方法。
实现本发明目的的技术解决方案为:一种数字地球资源推荐***,包括:
地球用户信息价值评价模块,对平台用户进行归纳整理,分析提取有价值的信息。首先分析地球科学平台用户的一般类型与访问规律,从专业属性、行为属性、趋势属性等方面构建用户行为信息模型。然后根据地球平台的运行模式细粒度的分析用户成分,通过行为轨迹与领域经验计算用户相关性。最后,结合数字地球科学平台用户访问的特点,从用户活跃度、***熟悉度、用户可信度三个方面介绍地球用户信息价值评价方法。
地球数据与服务价值评价模块,从数字地球科学平台中数据资源和服务资源的特点、成本核算方式和应用过程产生的价值三个方面出发,建立数字地球科学平台资源价值层次体系。地球数据价值评价方面考虑原始数据、专题产品(后统称为地球空间数据)的显性价值和隐性价值,地球服务价值评价方面考虑数字地球应用服务所处理数据的应用价值,以及应用服务自身的服务性能和运维成本。
地球***主动式服务模块,提供了三种不同类型的资源科学发现策略,包括:用户兴趣价值资源策略、专家价值资源策略和领域价值资源策略;然后,将三种策略融合到深度协同过滤网络,采用主动服务技术,对地球大数据科学平台中的资源信息根据数据标签、用户画像和用户行为等信息进行推荐,满足多样化的资源需求。
进一步地,地球用户信息价值评价模块主要包括地球用户行为信息模型、地球用户划分、地球用户等级评价三个模块。
地球用户行为信息模型,是面向科研院所、政府机构和社会大众等不同类型的数字地球科学平台用户,根据不同用户对数字地球科学平台的一般访问规律,对用户的行为信息进行建模。
首先,从专业、行为、趋势等三个方面对地球用户的使用信息建模。其中,专业属性用于描述用户在地球平台的专业性和领域性,包括用户标识、用户性别、年龄称谓、地理区域、用户职业、研究方向等专业信息,以及用户所属领域和子领域等领域信息;行为属性信息用于描述用户与数字地球科学平台之间的交互行为,包括登录频率、注册时长等登录信息,以及上传频率、下载频率、浏览频率、评价频率、收藏频率等操作信息;趋势属性是对从行为轨迹中挖掘出的用户潜在兴趣和价值的描述,包括用户长期兴趣、用户短期兴趣等兴趣模式,以及用户活跃度、***熟悉度、用户可信度等贡献价值。
接着,根据用户的注册信息、操作记录等信息,从专业、行为、趋势等方面对定义好的用户行为信息模型进行填充。专业属性填充时,利用用户注册时填写的性别、年龄称谓、用户职业、教育背景等信息进行标记,也可利用从用户的访问请求中的IP地址推断用户所属区域;行为属性填充时,从实时采集、记录的用户的操作行为等交互数据中,分析用户检索、浏览、收藏数据的类别和数量,以及评分、评论服务信息的类别和数量等;趋势属性填充时,采用行为轨迹分析、挖掘的方式捕获用户的长短期兴趣,采用统计分析的方式获取用户活跃度、***熟悉度、用户可信度等。
最后,基于知识图谱实现用户行为信息模型的表达,将用户专业属性、行为属性和趋势属性与虚拟用户融合后进行可视化表达。
地球用户划分模块,通过分析用户群体行为数据提取用户关键属性,根据分组标签、分组粒度等对已建立的用户行为信息模型进行相似性判别和划分。分组标签表示对用户分组的依据,比如使用“用户领域”划分领域用户组,使用“短期兴趣”或“长期兴趣”标签划分兴趣用户组。分组粒度用于控制具有多少个相同标签的用户才可划分到一个分组,决定了分组成员间的相似程度。分组粒度越大,划分得到的用户群组数量越多,同一用户群组内成员的相似度越高;反之分组粒度越小,划分得到的用户群组数量越少,同一用户群组内成员的相似度也越低。
地球用户等级评价模块,结合数字地球科学平台用户访问的特点,从用户活跃度、***熟悉度、用户可信度三个方面建立地球用户信息价值评价方法,全面识别和衡量用户的贡献度和相对重要程度。
用户活跃度定义为用户对***的记忆强度,使用用户在数字地球平台的***登录频率和***登录时长等信息进行表示,能够反映用户登录数字地球科学平台的频繁程度。用户登录的天数越多,登录时长越长,用户活跃程度也就越大。用户活跃度表示如下。
Figure BDA0004031844010000031
其中,D表示用户注册***日期至今的总天数,Ω表示用户登录日期的集合,|Ω|表示用户登录***总天数(***登录频率),Tj表示用户在日期j的***登录总时长。
***熟悉度定义为用户对***的交互频率,即对数据和服务资源的上传、下载、浏览、评价等操作的频率,能够反映用户对数字地球科学平台的交互情况。***熟悉度可以通过资源更新率和资源使用率来量化。其中,资源更新率可表示为用户对资源的更新次数占平台中资源的总更新次数的比率;资源使用率可表示为用户对资源的使用次数占平台中资源的总使用次数的比率。***熟悉度则表示为用户对资源更新率和资源使用率的加权求和的结果,具体如下。
Figure BDA0004031844010000041
其中,DUR1(ui)表示资源更新率,即用户对地球空间数据、应用服务的更新次数占所有用户更新总次数的比率;DUR2(ui)表示资源使用率,即用户对地球空间数据,以及应用服务的使用次数占所有用户使用总次数的比率;Gi表示用户ui所属用户群组,|Gi|表示群组成员数量;αi为权重系数,用于权衡资源更新率和资源使用率两种因素。
用户可信度评价,从用户行为异常率、交互资源价值以及群组占有率三个方面来对用户在***中的可信任程度进行量化。其中,用户行为异常率可表示为用户异常行为数占全体用户异常行为总数的比率;交互资源价值可表示为用户历史交互数据的平均价值;群组占有率表示为用户所属群组数占数字地球科学平台中全部群组数的比率。
用户可信度定义为用户在数字地球科学平台中的可信任程度,从用户行为异常率、交互资源价值以及群组占有率三个方面来进行分析。一是根据用户的历史交互数据进行行为分析,进而发现用户异常行为,异常行为发生概率越高的用户可信程度越低;二是分析用户历史使用的数据、服务资源的价值,其频繁使用的高价值资源越多,表明用户价值定位越高可信度也越高;三是分析用户的群组占有率,用户所属群组越多,表明用户兴趣越广泛,带动性越强。因此,从用户行为异常率、交互资源价值,以及群组占有率三个方面来量化用户可信度,具体如下。
Figure BDA0004031844010000042
其中,BH(ui)表示用户行为异常率,通过用户异常行为数占全体用户异常行为总数的比率来量化;RV(ui)表示交互资源价值,通过用户历史交互数据的平均价值来量化;NG(ui)表示群组占有率,表示为用户所属群组数量占数字地球科学平台全部群组数量的比率;βi(1≤i≤3)用于权衡用户可信度评价的三个维度。
对UA(ui)、SF(ui)、UC(ui)进行归一化处理,再分别将他们划分为K个分段,定义各分段的价值等级如图3所示。则用户综合价值等级(User Value Level,UVL)可以表示为UA、SF、UC各分段价值等级的累加和,具体如下。
UVL(ui)=UA′(ui)+SF′(ui)+UC′(ui),#(4)
其中,UA′(ui),SF′(ui),UC′(ui)分别表示UA、SF、UC各个分段的价值等级。图3中的分段数和分段等级可以根据具体业务场景而定。
进一步地,地球数据与服务价值评价模块主要包括地球数据价值评价和地球服务价值评价两模块。
地球数据价值评价模块,通过分析数字地球科学平台中用户对数据的使用情况,并从中提取显性评价信息和隐性评价信息,对数据的价值进行评价。
数据的显性价值评价,是对数字地球科学平台中用户对各类数据的使用过程中产生的显性评分数据进行统计分析,将分析结果输入到贝叶斯平均评分模型中计算显性评价结果。我们认为不同等级的用户评分对数据价值的影响程度不同,因此在利用贝叶斯平均评分模型进行评分时,根据用户价值等级生成权重,对地球空间数据的历史评分数据进行加权处理,以改进贝叶斯平均评分模型的准确性。改进贝叶斯平均评分模型的输出结果作为地球空间数据的显性价值评价结果,具体如下。
Figure BDA0004031844010000051
其中,R(i,j)表示用户i对地球空间数据j的评分,N为参与评分的用户总数。Ravg表示与地球空间数据j相同领域内所有数据评分的均值,M为预设的评分用户数。考虑到不同用户评分贡献的差异性,我们融合用户价值等级对地球空间数据的历史评分数据进行加权处理,以改进贝叶斯平均评分模型的准确性,加权系数如下
Figure BDA0004031844010000052
其中,Uj表示对数据j做出评价的用户集合,UVL(i)表示用户的价值等级。
数据的隐性价值评价,是从用户对数据的点击、浏览、收藏等行为中提取隐性的评价信息,再进一步计算价值评分,以此弥补显性评价信息稀疏的不足。对于一个数据,假设用户对其使用次数为n,其所属领域中所有数据的平均使用次数为
Figure BDA0004031844010000061
则该数据的隐性价值评价方法为:当用户收藏了该数据且使用次数超过平均水平(即
Figure BDA0004031844010000062
)时,将该数据赋值为最高评分;当用户未收藏数据且使用次数低于平均水平(即
Figure BDA0004031844010000063
)时,将
Figure BDA0004031844010000064
作为系数,与平均评分值相乘后作为隐性价值评分;否则,令隐性价值评分的取值为同领域所有数据评分均值。
地球服务价值评价模块,通过分析应用服务的领域特征、访问性能和运行健康状态,包括应用价值评价、运维成本和服务性能评价、服务价值融合等三个部分。
应用价值评价,主要是指应用服务所承载地球空间数据的数据价值,其取值为服务承载的所有数据的价值评分的均值。假设模型服务所承载地球空间数据的分组为DG={DG1,DG2,…,DGM},每组数据的价值分别为DVL={DVL1,DVL2,…,DVLM},则应用价值可以表示如下。
Figure BDA0004031844010000065
运维成本和服务性能评价,主要涉及运维成本评价和服务性能评价。运维性能评价用应用服务承载数据所需的存储空间来表示,存储空间占用越大造成的存储、计算、网络等资源的开销也就越大,提高了服务的运维成本。服务性能评价,用应用服务的响应延时、吞吐量、SLA违反率、服务错误率等来表示,响应时间越长、吞吐量越低、SLA违反率和服务错误率越高,则应用服务性能越差,影响用户体验。使用TOPSIS多准则决策方法来实现运维成本和服务性能评价,并利用熵权法对TOPSIS多准则决策中的决策因素进行赋权,提高评价准确性。构建决策评价向量如下
FS(j)=(Qj,RTj,THj,SLAj,ERRj),#(8)
其中,Qj表示服务j承载的数据所占用的存储空间大小;RTj表示服务在并发访问下的平均响应时间;THj表示服务吞吐量即单位时间内成功处理的服务请求数量;SLAj表示服务等级协议违反率,表示为服务响应违反时间RTj-δ与服务平均响应时间RTj的比值,δ为服务等级协议中规定的响应时间阈值;ERRj表示服务错误概率,即并发访问下服务错误请求数占总请求数的比例。除TH为正向指标外,其余四个均为负向指标,将TOPSIS方法的最优评价向量A+和最劣评价向量A-分别表示如下
A+=(min(Q),min(RT),max(TH),min(SLA)),#(9)
A-=(max(Q),max(RT),min(TH),max(SLA)),#(10)
其中,Q={Q1,Q2,…,Qj,…QN}是由所有待比较应用服务实际存储空间Qj构成的集合,min(Q)为取集合元素的最小值,其他符号如RT、TH等的定义与Q类似。
计算待评价应用服务决策评价向量与最优、最劣评价向量A+和A-的距离,进而确定应用服务运维成本和服务性能相对优劣的评价值,具体如下。
Figure BDA0004031844010000071
其中,
Figure BDA0004031844010000072
Figure BDA0004031844010000073
分别表示应用服务与最优、最劣评价向量之间的距离,ngjl为服务实例j评价向量的元素值,1≤l≤L为评价的维度,
Figure BDA0004031844010000074
Figure BDA0004031844010000075
分别为最优最劣评价向量的元素值,wl为评价维度的权重系数。
服务价值融合中,综合应用价值、运维成本和服务性能等多维度的评价结果,可以得到应用服务的综合价值,具体如下。
SVL(j)=β·AV(j)+(1-β)·RI(j),#(12)
其中,AV(j)为服务j的应用价值评价结果,RI(j)为服务j的运维成本和服务性能评价结果。权重系数β用于均衡二者在服务的综合价值中的贡献程度。
地球***主动式服务模块,包括支持资源科学发现策略和资源主动推荐模块两部分。
资源科学发现策略,在用户信息价值评价、数据与服务信息价值评价的基础上,结合领域特点、应用场景、服务模式等定义数字地球科学平台中资源推荐的规则,包括用户兴趣价值资源策略、专家价值资源策略、领域价值资源策略。
用户兴趣价值资源策略是通过分析用户行为轨迹,捕获用户兴趣模式并划分用户兴趣群组,对同一个兴趣群组中所有用户的历史交互数据进行组合,在其中优选与当前用户历史行为轨迹不相交的、排名靠前的K个数据作为用户兴趣数据,帮助用户“发现当前研究趋势”。此处与用户历史行为轨迹不相交,指的是从推荐结果中去除与当前用户的历史行为轨迹的重复部分,以保证推荐结果的新奇性。
专家价值资源策略,分析专家用户的行为数据(如下载、评价、收藏等),根据专家用户使用数据频率的排名对其所在的群组进行推荐,帮助非专家用户“追寻专家轨迹”,拓展用户的兴趣领域。将用户所属的兴趣群组中用户价值最大的群组成员视作专家用户,专家价值资源策略就是对该专家用户的历史交互数据集合并进行价值排序,选取集合中与当前用户历史行为轨迹不相交的、排名靠前的K个数据作为推荐数据。
领域价值资源策略,利用不同领域类型的用户、资源间的交叉关联,将相关领域内价值排名靠前的资源推荐给当前用户,帮助用户“总结专业领域研究程度”。对相似邻域中的资源进行组合,选取与当前用户历史行为轨迹不相交的、价值排名靠前的K个数据作为推荐数据。定义领域相似度来表示不同领域之间的关联强度,用于判断相似邻域,通过对不同领域之间地球空间数据、应用服务的交叉访问情况,以及跨领域用户交互情况进行分析和量化来得到。跨领域交叉访问的数据和服务越多、跨领域交互的用户越多,则认为领域相似度越大、领域之间的关联性越强。于是,领域相似度可表示为
Figure BDA0004031844010000081
其中,Dl、Dk分别表示领域l和领域k的资源集合,DlUDk和Dl∩Dk分别表示l和k的资源集合的并集和交集,Dl∩Dk即为跨领域交叉访问的资源集合;Ul、Uk分别表示领域l和领域k的用户集合,UlUUk和Ul∩Uk分别表示l和k的用户集合的并集和交集,Ul∩Uk即为跨领域交互的用户集合;ρ表示权重系数,用于均衡资源价值、用户价值两种因素在领域相似度计算中的贡献。
资源主动推荐模块,在信息资源分类、用户分组、信息价值评价结果的建立数字地球科学平台主动服务框架,使用“注意力”机制将支持科学发现的服务策略与深度协同过滤技术融合,采用主动服务技术,对数字地球科学平台中的资源根据数据标签、用户画像和用户行为等进行推荐。
进一步地,资源主动推荐模块包括数字地球主动服务框架、特征空间建模、价值资源策略融合、资源信息推荐四个模块。
数字地球主动服务框架,包括稀疏输入层、稠密嵌入层、策略融合层、连接层、深度协同过滤层、输出层,结构如图4所示。其中,稀疏输入层通过融合用户、地球空间数据、应用服务属性信息实现特征空间建模,包括用户特征域、待评价资源特征域、兴趣价值资源特征域、专家价值资源特征域、领域价值资源特征域五个部分。稠密嵌入层通过将高维稀疏的输入层特征向量映射为低维稠密的嵌入向量,降低神经网络计算的复杂性。策略融合层通过设计注意力激活单元实现三种基于信息价值评价的资源策略的融合,包括用户兴趣价值资源策略(兴趣性)、专家价值资源策略(价值性)、领域价值资源策略(新奇性)。注意力激活单元用于计算用户投给待评价资源在兴趣性、价值性、新奇性特征方面的注意力权重,进而构建加权注意力的资源嵌入向量。连接层通过拼接用户嵌入向量和加权注意力的资源嵌入向量,为深度协同过滤层提供数据输入。深度协同过滤层通过多层神经网络组成的塔式结构实现用户、地球空间数据和应用服务特征的深度融合与交互。输出层通过Sigmoid激活函数将深度协同过滤层特征交互的结果映射为用户对地球空间资源的预测评价值(可以为评分、点击率等)。
特征空间建模模块,定义包含用户特征、候选资源特征、兴趣价值资源特征、专家价值资源特征以及领域价值资源特征等五个特征域的特征空间FS,表示为
FS=(USF,CDSF,IDSF,EDSF,DDSF),#(14)
其中,USF表示用户特征域,包括用户标识、用户性别、年龄称谓、地理区域等基本特征,以及用户领域、用户子领域等领域特征;CDSF表示候选资源特征域,包括数据特征和服务特征,数据特征根据地球空间数据的元信息如卫星标识、传感器标识、拍摄时间、生产时间、参照系等进行编码,反映地球空间数据的领域特点;服务特征主要通过服务响应时间、服务吞吐量、服务错误率、SLA违反率等指标来表示,反应应用服务的访问性能;IDSF表示兴趣价值资源特征域,是使用“兴趣价值资源策略”召回的用户兴趣范围内的高价值资源特征的序列;EDSF表示专家价值资源特征域,是使用“专家价值资源策略”召回的用户所属群组内专家用户的高价值资源特征的序列;DDSF表示领域价值资源特征域,是使用“领域价值资源策略”召回的用户相似领域内关联用户的高价值资源特征的序列。
价值资源服务策略融合模块,利用注意力权重对候选资源在适用性、价值性、新奇性方面进行综合表征,进而确定三种策略召回的资源在推荐时的综合排名。注意力权重是实现三种资源策略融合的关键,可以在一个小型的神经网络构成的激活单元中计算。激活单元的输入层是两个嵌入向量,通过元素减操作后,与原嵌入向量连接后输入到全连接层,最后通过单神经元输出层输出注意力权重。利用激活单元学习候选资源的特征与用户注意力特征之间的相似性大小,从而反应候选资源对当前用户关注点的“响应”情况。
资源信息推荐模块,稠密嵌入层的资源嵌入向量通过注意力激活单元进行策略融合后,与当前用户的嵌入向量在连接层进行向量拼接,作为深度协同过滤神经网络NeuralCF的输入。利用深度协同过滤网络对当前用户与候选资源的特征进行深层交互,并将交互结果通过输出层的Sigmoid函数映射为用户对资源的评价值(如评分或点击率),根据评价值从大到小进行资源排序推荐。
一种数字地球资源推荐方法,基于所述的数字地球资源的推荐***,实现数字地球资源的推荐。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,基于所述的数字地球资源的推荐***,实现数字地球资源的推荐。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,基于所述的数字地球资源的推荐***,实现数字地球资源的推荐。
本发明与现有技术相比,其显著优点为:1)改善了数字地球信息服务质量,通过对用户、数据与服务的实际应用指标的建模分析,降低了云中动态环境与领域知识对多源信息评价的影响;2)提出了针对性的地球资源发现策略,从不同视角进一步表征信息价值评价结果,满足不同领域、不同群体的地球资源需求;3)创新性地提出了地球主动服务方法,与传统订阅服务相比,利用深度协同过滤技术融合资源发现策略,提升了资源推荐的准确性与前瞻性;4)基于以上手段,本发明提出了一种数字地球资源推荐方法及***,能够帮助用户更好的探索与理解地球资源的运行与发展趋势,提高了地球“远见卓识”能力。
附图说明
图1是一种数字地球资源推荐方法及***结构图。
图2是地球用户信息价值评价体系。
图3是地球用户价值等级映射。
图4是地球数据与服务价值评价体系。
图5是数字地球主动服务框架结构图。
图6是主动服务与信息过滤融合示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本发明提出一种数字地球资源推荐方法及***,设计了从专业属性、行为属性、趋势属性等方面构建用户行为信息模型,建立由用户活跃度、***熟悉度、用户可信度构成的用户信息价值评价模型;融合了地球领域知识、业务特点、动态应用价值,建立了地球空间数据和应用服务资源的价值评价方法,提高了价值评价的准确性;设计了多种支持科学发现的服务策略,并与深度协同过滤技术相结合,提出了信息融合、价值评价、知识发现为一体的数字地球资源主动服务方法,提升了资源推荐的准确度。
一种数字地球资源推荐***包括地球用户信息价值评价、地球数据与服务价值评价和地球***主动式服务三部分,整体结构如图1所示。
所述地球用户信息价值评价,是根据数字地球科学平台的领域信息、业务特点等提出多源信息价值评价方法,通过对数据流转和用户行为轨迹的分析,实现用户信息价值评价。包括地球用户行为信息模型、地球用户划分、地球用户等级评价等三个部分,具体实施步骤如下:
(1)地球用户行为信息模型
地球用户行为信息模型,是面向科研院所、政府机构和社会大众等不同类型的数字地球科学平台用户,根据不同用户对数字地球科学平台的一般访问规律,对用户的行为信息进行建模。
首先,从专业、行为、趋势等三个方面对地球用户的使用信息建模。其中,专业属性用于描述用户在地球平台的专业性和领域性,包括用户标识、用户性别、年龄称谓、地理区域、用户职业、研究方向等专业信息,以及用户所属领域和子领域等领域信息;行为属性信息用于描述用户与数字地球科学平台之间的交互行为,包括登录频率、注册时长等登录信息,以及上传频率、下载频率、浏览频率、评价频率、收藏频率等操作信息;趋势属性是对从行为轨迹中挖掘出的用户潜在兴趣和价值的描述,包括用户长期兴趣、用户短期兴趣等兴趣模式,以及用户活跃度、***熟悉度、用户可信度等贡献价值。
接着,根据用户的注册信息、操作记录等信息,从专业、行为、趋势等方面对定义好的用户行为信息模型进行填充。专业属性填充时,利用用户注册时填写的性别、年龄称谓、用户职业、教育背景等信息进行标记,也可利用从用户的访问请求中的IP地址推断用户所属区域;行为属性填充时,从实时采集、记录的用户的操作行为等交互数据中,分析用户检索、浏览、收藏数据的类别和数量,以及评分、评论服务信息的类别和数量等;趋势属性填充时,采用行为轨迹分析、挖掘的方式捕获用户的长短期兴趣,采用统计分析的方式获取用户活跃度、***熟悉度、用户可信度等。
最后,基于知识图谱实现用户行为信息模型的表达,将用户专业属性、行为属性和趋势属性与虚拟用户融合后进行可视化表达。
(2)地球用户划分
地球用户划分,通过分析用户群体行为数据提取用户关键属性,根据分组标签、分组粒度等对已建立的用户行为信息模型进行相似性判别和划分。分组标签表示对用户分组的依据,比如使用“用户领域”划分领域用户组,使用“短期兴趣”或“长期兴趣”标签划分兴趣用户组。分组粒度用于控制具有多少个相同标签的用户才可划分到一个分组,决定了分组成员间的相似程度。分组粒度越大,划分得到的用户群组数量越多,同一用户群组内成员的相似度越高;反之分组粒度越小,划分得到的用户群组数量越少,同一用户群组内成员的相似度也越低。。
(3)地球用户等级评价
地球用户等级评价,是结合数字地球科学平台用户访问的特点,从用户活跃度、***熟悉度、用户可信度三个方面建立地球用户信息价值评价方法,全面识别和衡量用户的贡献度和相对重要程度。
用户活跃度定义为用户对***的记忆强度,使用用户在数字地球平台的***登录频率和***登录时长等信息进行表示,能够反映用户登录数字地球科学平台的频繁程度。用户登录的天数越多,登录时长越长,用户活跃程度也就越大。用户活跃度表示如下。
Figure BDA0004031844010000121
其中,D表示用户注册***日期至今的总天数,Ω表示用户登录日期的集合,|Ω|表示用户登录***总天数(***登录频率),Tj表示用户在日期j的***登录总时长。
***熟悉度定义为用户对***的交互频率,即对数据和服务资源的上传、下载、浏览、评价等操作的频率,能够反映用户对数字地球科学平台的交互情况。***熟悉度可以通过资源更新率和资源使用率来量化。其中,资源更新率可表示为用户对资源的更新次数占平台中资源的总更新次数的比率;资源使用率可表示为用户对资源的使用次数占平台中资源的总使用次数的比率。***熟悉度则表示为用户对资源更新率和资源使用率的加权求和的结果,具体如下。
Figure BDA0004031844010000131
其中,DUR1(ui)表示资源更新率,即用户对地球空间数据、应用服务的更新次数占所有用户更新总次数的比率;DUR2(ui)表示资源使用率,即用户对地球空间数据,以及应用服务的使用次数占所有用户使用总次数的比率;Gi表示用户ui所属用户群组,|Gi|表示群组成员数量;αi为权重系数,用于权衡资源更新率和资源使用率两种因素。
用户可信度定义为用户在数字地球科学平台中的可信任程度,从用户行为异常率、交互资源价值以及群组占有率三个方面来进行分析。一是根据用户的历史交互数据进行行为分析,进而发现用户异常行为,异常行为发生概率越高的用户可信程度越低;二是分析用户历史使用的数据、服务资源的价值,其频繁使用的高价值资源越多,表明用户价值定位越高可信度也越高;三是分析用户的群组占有率,用户所属群组越多,表明用户兴趣越广泛,带动性越强。因此,我们从用户行为异常率、交互资源价值,以及群组占有率三个方面来量化用户可信度,具体如下。
Figure BDA0004031844010000132
其中,BH(ui)表示用户行为异常率,通过用户异常行为数占全体用户异常行为总数的比率来量化;RV(ui)表示交互资源价值,通过用户历史交互数据的平均价值来量化;NG(ui)表示群组占有率,表示为用户所属群组数量占数字地球科学平台全部群组数量的比率;βi(1≤i≤3)用于权衡用户可信度评价的三个维度。
对UA(ui)、SF(ui)、UC(ui)进行归一化处理,再分别将他们划分为K个分段,定义各分段的价值等级如图3所示。则用户综合价值等级(User Value Level,UVL)可以表示为UA、SF、UC各分段价值等级的累加和,具体如下。
UVL(ui)=UA′(ui)+SF′(ui)+UC′(ui),#(18)
其中,UA(ui)、SF(ui)、UC(ui)分别表示UA、SF、UC各个分段的价值等级。图3中的分段数和分段等级可以根据具体业务场景而定。
所述地球数据与服务信息价值评价,是从数字地球科学平台中数据和服务资源的特点、成本核算方式和应用过程产生的价值三个方面出发,建立数字地球科学平台数据与服务价值评价体系。数据价值评价方面考虑地球空间数据的显性价值和隐性价值,服务价值评价方面考虑应用服务所处理数据的应用价值,以及应用服务自身的服务性能和运维成本。包括数据价值评价和服务价值评价两部分。具体实施步骤如下:
(1)地球数据价值评价
地球数据价值评价,通过分析数字地球科学平台中用户对数据的使用情况,并从中提取显性评价信息和隐性评价信息,对数据的价值进行评价。数据价值评价包括显性价值评价、隐性价值、数据价值融合等三个部分。
数据的显性价值评价,是对数字地球科学平台中用户对各类数据的使用过程中产生的显性评分数据进行统计分析,将分析结果输入到贝叶斯平均评分模型中计算显性评价结果。需要注意的是,考虑到不同等级的用户评分对数据价值的影响程度不同,因此在利用贝叶斯平均评分模型进行评分时,需要根据用户价值等级生成权重,对地球空间数据的历史评分数据进行加权处理。通过对数字地球科学平台所有用户使用地球空间数据过程中产生的显性评分数据进行统计分析,通过改进贝叶斯平均评分模型实现地球空间数据的显性价值评价结果,具体如下。
Figure BDA0004031844010000141
其中,R(i,j)表示用户i对地球空间数据j的评分,N为参与评分的用户总数。Ravg表示与地球空间数据j相同领域内所有数据评分的均值,M为预设的评分用户数。考虑到不同用户评分贡献的差异性,我们融合用户价值等级对地球空间数据的历史评分数据进行加权处理,以改进贝叶斯平均评分模型的准确性,加权系数如下。
Figure BDA0004031844010000142
其中,Uj表示评分过数据j的全体用户的集合,UVL(i)表示用户i的价值等级。
数据的隐性价值评价,是从用户对数据的点击、浏览、收藏等行为中提取隐性的评价信息,再进一步计算价值评分,以此弥补显性评价信息稀疏的不足。对于一个数据,假设用户对其使用次数为n,其所属领域中所有数据的平均使用次数为
Figure BDA0004031844010000151
则该数据的隐性价值评价方法为:当用户收藏了该数据且
Figure BDA0004031844010000152
时,将该数据赋值为最高评分;当用户虽未收藏数据,但是
Figure BDA0004031844010000153
时,将
Figure BDA0004031844010000154
作为系数,与平均评分值相乘后作为隐性价值评分;否则,令隐性价值评分的取值为同领域所有数据评分均值。
(2)地球服务价值评价
地球服务价值评价,通过分析应用服务的领域特征、访问性能和运行健康状态,从应用价值、运维成本、服务性能等方面对服务进行评价。服务价值评价,包括应用价值评价、运维成本和服务性能评价、服务价值融合等三个部分。
应用价值评价,主要是指应用服务所承载地球空间数据的数据价值,可表示为其承载数据的价值评分的均值。假设模型服务所承载地球空间数据的分组为DG={DG1,DG2,…,DGM},每组数据的价值分别为DVL={DVL1,DVL2,…,DVLM},则应用价值可以表示如下。
Figure BDA0004031844010000155
运维成本和服务性能评价中,运维性能评价通过服务承载数据所需的存储空间来表示,存储空间占用越大造成的存储、计算、网络等资源的开销也就越大,提高了服务的运维成本;服务性能评价,用应用服务的响应延时、吞吐量、SLA违反率、服务错误率等来表示,响应时间越长、吞吐量越低、SLA违反率和服务错误率越高,则应用服务性能越差,影响用户体验。使用TOPSIS多准则决策方法来实现运维成本和服务性能评价,并利用熵权法对TOPSIS多准则决策中的决策因素进行赋权,提高评价准确性。构建决策评价向量如下
FS(j)=(Qj,RTj,THj,SLAj,ERRj),#(22)
其中,Qj表示服务j承载的数据所占用的存储空间大小;RTj表示服务在并发访问下的平均响应时间;THj表示服务吞吐量即单位时间内成功处理的服务请求数量;SLAj表示服务等级协议违反率,表示为服务响应违反时间RTj-δ与服务平均响应时间RTj的比值,δ为服务等级协议中规定的响应时间阈值;ERRj表示服务错误概率,即并发访问下服务错误请求数占总请求数的比例。除TH为正向指标外,其余四个均为负向指标,将TOPSIS方法的最优评价向量A+和最劣评价向量A-分别表示如下
A+=(min(Q),min(RT),max(TH),min(SLA)),#(23)
A-=(max(Q),max(RT),min(TH),max(SLA)),#(24)
其中,Q={Q1,Q2,…,Qj,…QN}是由所有待比较应用服务实际存储空间Qj构成的集合,min(Q)为取集合元素的最小值,其他符号如RT、TH等的定义与Q类似。计算待评价的应用服务决策评价向量与最优、最劣评价向量A+和A-的距离,进而确定应用服务运维成本和服务性能的评价结果,具体如下。
Figure BDA0004031844010000161
其中,
Figure BDA0004031844010000162
Figure BDA0004031844010000163
分别表示应用服务与最优、最劣评价向量之间的距离,ngjl为服务实例j评价向量的元素值,1≤l≤L为评价的维度,
Figure BDA0004031844010000164
Figure BDA0004031844010000165
分别为最优最劣评价向量的元素值,wl为评价维度的权重系数。
服务价值融合中,综合应用价值、运维成本和服务性能等多维度的评价结果,可以得到应用服务的综合价值,具体如下。
SVL(j)=β·AV(j)+(1-β)·RI(j),#(26)
其中,AV(j)为服务j的应用价值评价结果,RI(j)为服务j的运维成本和服务性能评价结果。权重系数β用于均衡二者在服务的综合价值中的贡献程度。
所述地球***主动式服务,提供了三种不同类型的资源策略支持用户科学行为发现,并将三种策略融合到深度协同过滤网络,采用主动服务技术,对地球大数据科学平台中的资源信息根据数据标签、用户画像和用户行为等信息进行推荐。地球***主动式服务包括支持资源科学发现策略和资源主动推荐方法两部分。具体实施步骤如下:
(1)资源科学发现策略
资源科学发现策略,在用户信息价值评价、数据与服务信息价值评价的基础上,结合领域特点、应用场景、服务模式等定义数字地球科学平台中资源推荐的规则,包括用户兴趣价值资源策略、专家价值资源策略、领域价值资源策略。
用户兴趣价值资源策略是通过分析用户行为轨迹,捕获用户兴趣模式并划分用户兴趣群组,将同一个兴趣群组中所有用户的历史行为数据组合,在其中优选与当前用户历史行为轨迹不相交的、价值排名前K的数据作为用户兴趣数据。该策略能够支持用户“发现当前研究趋势”。此处与用户历史行为轨迹不相交,指的是从推荐结果中去除与当前用户的历史行为轨迹的重复部分。
专家价值资源策略,分析专家用户的行为数据(如下载、评价、收藏等),根据专家用户使用数据频率的排名对其所在的群组进行推荐,帮助非专家用户“追寻专家轨迹”,拓展用户的兴趣领域。将用户所属的兴趣群组中用户价值最大的群组成员视作专家用户,专家价值资源策略就是对该专家用户的历史交互数据集合并进行价值排序,选取集合中与当前用户历史行为轨迹不相交的、排名靠前的K个数据作为推荐数据。
领域价值资源策略,利用不同领域类型的用户、资源间的交叉关联,将相关领域内价值排名靠前的资源推荐给当前用户,支持用户“总结专业领域研究程度”。对相似邻域中的资源进行组合,选取与当前用户历史行为轨迹不相交的、价值排名靠前的K个数据作为推荐数据。定义领域相似度来表示不同领域之间的关联强度,用于判断相似邻域,通过对不同领域之间地球空间数据、应用服务的交叉访问情况,以及跨领域用户交互情况进行分析和量化来得到。跨领域交叉访问的数据和服务越多、跨领域交互的用户越多,则认为领域相似度越大、领域之间的关联性越强。于是,领域相似度可表示为
Figure BDA0004031844010000171
其中,Dl、Dk分别表示领域l和领域k的资源集合,DlUDk和Dl∩Dk分别表示l和k的资源集合的并集和交集,Dl∩Dk即为跨领域交叉访问的资源集合;Ul、Uk分别表示领域l和领域k的用户集合,UlUUk和Ul∩Uk分别表示l和k的用户集合的并集和交集,Ul∩Uk即为跨领域交互的用户集合;ρ表示权重系数,用于均衡资源价值、用户价值两种因素在领域相似度计算中的贡献。
资源主动推荐方法,在信息资源分类、用户分组、信息价值评价结果的建立数字地球科学平台主动服务框架,使用“注意力”机制将支持科学发现的服务策略与深度协同过滤技术融合,采用主动服务技术,对数字地球科学平台中的资源根据数据标签、用户画像和用户行为等进行推荐。
(2)地球资源主动推荐方法
地球资源主动推荐方法,在信息资源分类、用户分组、信息价值评价结果的建立数字地球科学平台主动服务框架,使用“注意力”机制将支持科学发现的服务策略与深度协同过滤技术融合,采用主动服务技术,对数字地球科学平台中的资源根据数据标签、用户画像和用户行为等进行推荐。资源主动推荐方法包括数字地球主动服务框架、特征空间建模、价值资源策略融合、资源信息推荐等四个部分。
数字地球主动服务框架,包括稀疏输入层、稠密嵌入层、策略融合层、连接层、深度协同过滤层、输出层,结构如图4所示。其中,稀疏输入层通过融合用户、地球空间数据、应用服务属性信息实现特征空间建模,包括用户特征域、待评价资源特征域、兴趣价值资源特征域、专家价值资源特征域、领域价值资源特征域五个部分。稠密嵌入层通过将高维稀疏的输入层特征向量映射为低维稠密的嵌入向量,降低神经网络计算的复杂性。策略融合层通过设计注意力激活单元实现三种基于信息价值评价的资源策略的融合,包括用户兴趣价值资源策略(兴趣性)、专家价值资源策略(价值性)、领域价值资源策略(新奇性)。注意力激活单元用于计算用户投给待评价资源在兴趣性、价值性、新奇性特征方面的注意力权重,进而构建加权注意力的资源嵌入向量。连接层通过拼接用户嵌入向量和加权注意力的资源嵌入向量,为深度协同过滤层提供数据输入。深度协同过滤层通过多层神经网络组成的塔式结构实现用户、地球空间数据和应用服务特征的深度融合与交互。输出层通过Sigmoid激活函数将深度协同过滤层特征交互的结果映射为用户对地球空间资源的预测评价值(可以为评分、点击率等)。
特征空间建模,定义包含用户特征、候选资源特征、兴趣价值资源特征、专家价值资源特征以及领域价值资源特征等五个特征域的特征空间FS,表示为FS=(USF,CDSF,IDSF,EDSF,DDSF),#(28)其中,USF表示用户特征域,包括用户标识、用户性别、年龄称谓、地理区域等基本特征,以及用户领域、用户子领域等领域特征;CDSF表示候选资源特征域,包括数据特征和服务特征,数据特征根据地球空间数据的元信息如卫星标识、传感器标识、拍摄时间、生产时间、参照系等进行编码,反映地球空间数据的领域特点;服务特征主要通过服务响应时间、服务吞吐量、服务错误率、SLA违反率等指标来表示,反应应用服务的访问性能;IDSF表示兴趣价值资源特征域,是使用“兴趣价值资源策略”召回的用户兴趣范围内的高价值资源特征的序列;EDSF表示专家价值资源特征域,是使用“专家价值资源策略”召回的用户所属群组内专家用户的高价值资源特征的序列;DDSF表示领域价值资源特征域,是使用“领域价值资源策略”召回的用户相似领域内关联用户的高价值资源特征的序列。
价值资源服务策略融合,利用注意力权重对候选资源在适用性、价值性、新奇性方面进行综合表征,进而确定三种策略召回的资源在推荐时的综合排名。注意力权重是实现三种资源策略融合的关键,可以在一个小型的神经网络构成的激活单元中计算。激活单元的输入层是两个嵌入向量,通过元素减操作后,与原嵌入向量连接后输入到全连接层,最后通过单神经元输出层输出注意力权重。利用激活单元学习候选资源的特征与用户注意力特征之间的相似性大小,从而反应候选资源对当前用户关注点的“响应”情况。
资源信息推荐,稠密嵌入层的资源嵌入向量通过注意力激活单元进行策略融合后,与当前用户的嵌入向量在连接层进行向量拼接,作为深度协同过滤神经网络NeuralCF的输入。利用深度协同过滤网络对当前用户与候选资源的特征进行深层交互,并将交互结果通过输出层的Sigmoid函数映射为用户对资源的评价值(如评分或点击率),根据评价值从大到小进行资源排序推荐。
本发明提供了针对目前推荐***面临的共性问题的资源推荐方式,如冷启动推荐问题、多样性和新奇性推荐问题以及推荐信息的过滤问题等。
(1)针对冷启动推荐问题的资源推荐
冷启动推荐问题包括用户冷启动和数据冷启动两种,用户冷启动指没有***交互记录的用户的资源推荐问题,数据冷启动则指新上线的数据资源和服务资源的推荐问题。这两类问题由于不存在用户与资源间的历史交互记录,因此无法使用传统的协同过滤等技术进行主动推荐。在本发明中,我们针对用户冷启动推荐问题,利用用户注册时提供的领域、子领域信息,使用“专家价值数据服务策略”和“领域价值数据服务策略”进行数据和服务召回,依据NeuralCF的评价结果进行排序推荐;针对数据冷启动推荐问题,我们参考隐性价值评价方式为数据赋予同领域数据评价的均值结果,然后使用“领域价值数据服务策略”进行召回,使得这类数据能够被推荐给用户。
(2)针对多样性和新奇性问题的资源推荐
多样性是指推荐的资源来源广泛、类型多样,能够完全覆盖用户的兴趣范围;新奇性是指推荐的结果与用户的历史浏览不重复,能使用户“眼前一亮”,进而帮助用户挖掘、拓展兴趣领域。在本发明中,我们针对多样性推荐问题,提供了三种策略从不同的角度进行数据召回,保证推荐资源的多样性,既能支持用户“发现当前研究趋势”,又能支持用户“追寻专家轨迹”,还能帮助用户“总结专业领域研究程度”;针对新奇性推荐问题,在进行数据和服务召回时进行了去重复操作,避免与当前用户操作历史重复,通过跨领域的价值数据和服务召回,保证推荐的新奇性,能够满足用户潜在的兴趣拓展需求。
(3)针对推荐信息的过滤问题的资源推荐
实际应用场景中,为了尽可能发挥用户的主观能动性,进一步改善推荐效果,主动推荐还应与传统的信息过滤方法相结合。在本发明中,我们在主动服务排序的基础上,还增加了两种信息过滤方法支持用户交互:领域过滤和策略过滤。领域过滤能够按照相同领域、相关领域、无关领域等条件对推荐的资源信息进行过滤,用户可以选择查看其关注的推荐结果;策略过滤能够按照用户对于兴趣价值、专家价值、领域价值三种策略的选择,分别提供三种主动服务策略下的推荐结果。信息过滤方法并不改变推荐算法排序结果,只是对结果进行了有效分类,分类中数据和服务的排序结果应与原始排序结果保持一致,如图6所示。
本发明还提供了一种数字地球资源推荐方法,基于所述的数字地球资源的推荐***,实现数字地球资源的推荐。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,基于所述的数字地球资源的推荐***,实现数字地球资源的推荐。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,基于所述的数字地球资源的推荐***,实现数字地球资源的推荐。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (8)

1.一种数字地球资源推荐***,其特征在于,包括:
地球用户信息价值评价模块,首先分析地球科学平台用户的类型与访问规律,从专业属性、行为属性、趋势属性三个方面构建用户行为信息模型;然后根据地球平台的运行模式细粒度的分析用户成分,通过行为轨迹与领域经验计算用户相关性;最后,结合数字地球科学平台用户访问的特点,从用户活跃度、***熟悉度、用户可信度三个方面进行地球用户信息价值评价;
地球数据与服务价值评价模块,从数字地球科学平台中数据资源和服务资源的特点、成本核算方式和应用过程产生的价值三个方面出发,建立数字地球科学平台资源价值层次体系,地球数据价值评价方面考虑原始数据、地球空间数据的显性价值和隐性价值,地球服务价值评价方面考虑数字地球应用服务所处理数据的应用价值,以及应用服务自身的服务性能和运维成本;
地球***主动式服务模块,提供了三种不同类型的资源科学发现策略,包括:用户兴趣价值资源策略、专家价值资源策略和领域价值资源策略;然后,将三种策略融合到深度协同过滤网络,采用主动服务技术,对地球大数据科学平台中的资源信息根据数据标签、用户画像和用户行为进行推荐,满足多样化的资源需求。
2.根据权利要求1所述的数字地球资源推荐***,其特征在于,地球用户信息价值评价模块包括地球用户行为信息模型模块、地球用户划分模块、地球用户等级评价模块三个部分,其中:
地球用户行为信息模型模块,面向不同类型的数字地球科学平台用户,根据不同用户对数字地球科学平台的访问规律,对用户的行为信息进行建模;
首先,从专业、行为、趋势三个方面对地球用户的使用信息建模,其中,专业属性用于描述用户在地球平台的专业性和领域性,包括用户标识、用户性别、年龄称谓、地理区域、用户职业、研究方向,以及用户所属领域和子领域;行为属性信息用于描述用户与数字地球科学平台之间的交互行为,包括登录频率、注册时长,以及上传频率、下载频率、浏览频率、评价频率、收藏频率;趋势属性是对从行为轨迹中挖掘出的用户潜在兴趣和价值的描述,包括用户长期兴趣、用户短期兴趣,以及用户活跃度、***熟悉度、用户可信度;
接着,根据用户的注册信息、操作记录,从专业、行为、趋势三个方面对定义好的用户行为信息模型进行填充,专业属性填充时,利用用户注册时填写的性别、年龄称谓、用户职业、教育背景进行标记,利用从用户的访问请求中的IP地址推断用户所属区域;行为属性填充时,从实时采集、记录的用户的操作行为中,分析用户检索、浏览、收藏数据的类别和数量,以及评分、评论服务信息的类别和数量;趋势属性填充时,采用行为轨迹分析、挖掘的方式捕获用户的长短期兴趣,采用统计分析的方式获取用户活跃度、***熟悉度、用户可信度;
最后,基于知识图谱实现用户行为信息模型的表达,将用户专业属性、行为属性和趋势属性与虚拟用户融合后进行可视化表达;
地球用户划分模块,通过分析用户群体行为数据提取用户关键属性,根据分组标签、分组粒度对已建立的用户行为信息模型进行相似性判别和划分,分组标签表示对用户分组的依据,使用“用户领域”划分领域用户组,使用“短期兴趣”或“长期兴趣”标签划分兴趣用户组;分组粒度用于控制具有多少个相同标签的用户划分到一个分组,决定了分组成员间的相似程度,分组粒度越大,划分得到的用户群组数量越多,同一用户群组内成员的相似度越高;反之分组粒度越小,划分得到的用户群组数量越少,同一用户群组内成员的相似度也越低;
地球用户等级评价模块,是结合数字地球科学平台用户访问的特点,从用户活跃度、***熟悉度、用户可信度三个方面建立地球用户信息价值评价方法,全面识别和衡量用户的贡献度和相对重要程度;
用户活跃度定义为用户对***的记忆强度,使用用户在数字地球平台的***登录频率和***登录时长进行表示,能够反映用户登录数字地球科学平台的频繁程度,用户登录的天数越多,登录时长越长,用户活跃程度也就越大,用户活跃度UA(ui)表示如下:
Figure FDA0004031842000000021
其中,D表示用户注册***日期至今的总天数,Ω表示用户登录日期的集合,|Ω|表示用户登录***总天数,Tj表示用户ui在日期j的***登录总时长;
***熟悉度定义为用户对***的交互频率,即对数据和服务资源的上传、下载、浏览、评价的频率,能够反映用户对数字地球科学平台的交互情况,***熟悉度通过资源更新率和资源使用率来量化,其中,资源更新率表示为用户对资源的更新次数占平台中资源的总更新次数的比率;资源使用率表示为用户对资源的使用次数占平台中资源的总使用次数的比率;***熟悉度SF(ui)表示为用户对资源更新率和资源使用率的加权求和的结果,具体如下:
Figure FDA0004031842000000031
其中,DUR1(ui)表示资源更新率,即用户对地球空间数据、应用服务的更新次数占所有用户更新总次数的比率;DUR2(ui)表示资源使用率,即用户对地球空间数据,以及应用服务的使用次数占所有用户使用总次数的比率;Gi表示用户ui所属用户群组,|Gi|表示群组成员数量;αi为权重系数,用于权衡资源更新率和资源使用率两种因素;
用户可信度定义为用户在数字地球科学平台中的可信任程度,从用户行为异常率、交互资源价值以及群组占有率三个方面来进行分析,一是根据用户的历史交互数据进行行为分析,进而发现用户异常行为,异常行为发生概率越高的用户可信程度越低;二是分析用户历史使用的数据、服务资源的价值,其频繁使用的高价值资源越多,表明用户价值定位越高可信度也越高;三是分析用户的群组占有率,用户所属群组越多,表明用户兴趣越广泛,带动性越强,用户可信度UC(ui)具体表示如下:
Figure FDA0004031842000000032
其中,BH(ui)表示用户行为异常率,通过用户异常行为数占全体用户异常行为总数的比率来量化;RV(ui)表示交互资源价值,通过用户历史交互数据的平均价值来量化;NG(ui)表示群组占有率,表示为用户所属群组数量占数字地球科学平台全部群组数量的比率;βi(1≤i≤3)用于权衡用户可信度评价的三个维度;
对UA(ui)、SF(ui)、UC(ui)进行归一化处理,再分别将他们划分为K个分段,定义各分段的价值等级,则用户综合价值等级UVL表示为UA、SF、UC各分段价值等级的累加和,具体如下:
UVL(ui)=UA′(ui)+SF′(ui)+UC′(ui),#(4)
其中,UA'(ui),SF'(ui),UC'(ui)分别表示UA、SF、UC各个分段的价值等级,分段数和分段等级根据具体业务场景而定。
3.根据权利要求1所述的数字地球资源推荐***,其特征在于,地球数据与服务价值评价模块包括地球数据价值评价模块和地球服务价值评价模块两部分,其中:
地球数据价值评价模块,通过分析数字地球科学平台中用户对数据的使用情况,并从中提取显性评价信息和隐性评价信息,对数据的价值进行评价;
数据的显性价值评价,是对数字地球科学平台中用户对各类数据的使用过程中产生的显性评分数据进行统计分析,将分析结果输入到贝叶斯平均评分模型中计算显性评价结果,不同等级的用户评分对数据价值的影响程度不同,在利用贝叶斯平均评分模型进行评分时,根据用户价值等级生成权重,对地球空间数据的历史评分数据进行加权处理,以改进贝叶斯平均评分模型的准确性,改进贝叶斯平均评分模型的输出结果作为地球空间数据的显性价值评价结果,具体如下:
Figure FDA0004031842000000041
其中,R(i,j)表示用户i对地球空间数据j的评分,N为参与评分的用户总数,Ravg表示与地球空间数据j相同领域内所有数据评分的均值,M为预设的评分用户数,考虑到不同用户评分贡献的差异性,融合用户价值等级对地球空间数据的历史评分数据进行加权处理,以改进贝叶斯平均评分模型的准确性,加权系数如下:
Figure FDA0004031842000000042
其中,Uj表示对数据j做出评价的用户集合,UVL(i)表示用户的价值等级;
数据的隐性价值评价,是从用户对数据的点击、浏览、收藏行为中提取隐性的评价信息,再进一步计算价值评分,以此弥补显性评价信息稀疏的不足,对于一个数据,假设用户对其使用次数为n,其所属领域中所有数据的平均使用次数为
Figure FDA0004031842000000043
则该数据的隐性价值评价方法为:当用户收藏了该数据且使用次数超过平均水平,即
Figure FDA0004031842000000044
时,将该数据赋值为最高评分;当用户未收藏数据且使用次数低于平均水平,即
Figure FDA0004031842000000045
时,将
Figure FDA0004031842000000046
作为系数,与平均评分值相乘后作为隐性价值评分;否则,令隐性价值评分的取值为同领域所有数据评分均值;
地球服务价值评价模块,通过分析应用服务的领域特征、访问性能和运行健康状态,包括应用价值评价、运维成本和服务性能评价、服务价值融合三个部分;
应用价值评价,主要是指应用服务所承载地球空间数据的数据价值,其取值为服务承载的所有数据的价值评分的均值,假设模型服务所承载地球空间数据的分组为DG={DG1,DG2,…,DGM},每组数据的价值分别为DVL={DVL1,DVL2,…,DVLM},则应用价值表示如下:
Figure FDA0004031842000000051
运维成本和服务性能评价,主要涉及运维成本评价和服务性能评价,运维性能评价用应用服务承载数据所需的存储空间来表示,存储空间占用越大造成的存储、计算、网络资源的开销也就越大,提高了服务的运维成本;服务性能评价,用应用服务的响应延时、吞吐量、SLA违反率、服务错误率来表示,响应时间越长、吞吐量越低、SLA违反率和服务错误率越高,则应用服务性能越差,影响用户体验;使用TOPSIS多准则决策方法来实现运维成本和服务性能评价,并利用熵权法对TOPSIS多准则决策中的决策因素进行赋权,提高评价准确性,构建决策评价向量如下:
FS(j)=(Qj,RTj,THj,SLAj,ERRj),#(8)
其中,Qj表示服务j承载的数据所占用的存储空间大小;RTj表示服务在并发访问下的平均响应时间;THj表示服务吞吐量即单位时间内成功处理的服务请求数量;SLAj表示服务等级协议违反率,表示为服务响应违反时间RTj-δ与服务平均响应时间RTj的比值,δ为服务等级协议中规定的响应时间阈值;ERRj表示服务错误概率,即并发访问下服务错误请求数占总请求数的比例,除TH为正向指标外,其余四个均为负向指标,将TOPSIS方法的最优评价向量A+和最劣评价向量A-分别表示如下:
A+=(min(Q),min(RT),max(TH),min(SLA)),#(9)
A-=(max(Q),max(RT),min(TH),max(SLA)),#(10)
其中,Q={Q1,Q2,…,Qj,…QN}是由所有待比较应用服务实际存储空间Qj构成的集合,min(Q)为取集合元素的最小值,其他符号RT、TH、SLA的定义与Q类似;
计算待评价应用服务决策评价向量与最优、最劣评价向量A+和A-的距离,进而确定应用服务运维成本和服务性能相对优劣的评价值RI(j),具体如下:
Figure FDA0004031842000000052
其中,
Figure FDA0004031842000000053
Figure FDA0004031842000000054
分别表示应用服务与最优、最劣评价向量之间的距离,ngjl为服务实例j评价向量的元素值,1≤l≤L为评价的维度,
Figure FDA0004031842000000055
Figure FDA0004031842000000056
分别为最优最劣评价向量的元素值,wl为评价维度的权重系数;
服务价值融合中,综合应用价值、运维成本和服务性能等多维度的评价结果,得到应用服务的综合价值SVL(j),具体如下:
SVL(j)=β·AV(j)+(1-β)·RI(j),#(12)
其中,AV(j)为服务j的应用价值评价结果,RI(j)为服务j的运维成本和服务性能评价结果,权重系数β用于均衡二者在服务的综合价值中的贡献程度。
4.根据权利要求1所述的数字地球资源推荐***,其特征在于,地球***主动式服务模块,包括支持资源科学发现策略和资源主动推荐模块两部分,其中:
资源科学发现策略,在用户信息价值评价、数据与服务信息价值评价的基础上,结合领域特点、应用场景、服务模式定义数字地球科学平台中资源推荐的规则,包括用户兴趣价值资源策略、专家价值资源策略、领域价值资源策略;
用户兴趣价值资源策略是通过分析用户行为轨迹,捕获用户兴趣模式并划分用户兴趣群组,对同一个兴趣群组中所有用户的历史交互数据进行组合,在其中优选与当前用户历史行为轨迹不相交的、排名靠前的K个数据作为用户兴趣数据,帮助用户“发现当前研究趋势”,此处与用户历史行为轨迹不相交,指的是从推荐结果中去除与当前用户的历史行为轨迹的重复部分,以保证推荐结果的新奇性;
专家价值资源策略,分析专家用户的行为数据,根据专家用户使用数据频率的排名对其所在的群组进行推荐,帮助非专家用户“追寻专家轨迹”,拓展用户的兴趣领域,将用户所属的兴趣群组中用户价值最大的群组成员视作专家用户,专家价值资源策略就是对该专家用户的历史交互数据集合并进行价值排序,选取集合中与当前用户历史行为轨迹不相交的、排名靠前的K个数据作为推荐数据;
领域价值资源策略,利用不同领域类型的用户、资源间的交叉关联,将相关领域内价值排名靠前的资源推荐给当前用户,帮助用户“总结专业领域研究程度”,对相似邻域中的资源进行组合,选取与当前用户历史行为轨迹不相交的、价值排名靠前的K个数据作为推荐数据,定义领域相似度来表示不同领域之间的关联强度,用于判断相似邻域,通过对不同领域之间地球空间数据、应用服务的交叉访问情况,以及跨领域用户交互情况进行分析和量化来得到,跨领域交叉访问的数据和服务越多、跨领域交互的用户越多,则认为领域相似度越大、领域之间的关联性越强,于是,领域相似度表示为:
Figure FDA0004031842000000071
其中,Dl、Dk分别表示领域l和领域k的资源集合,Dl∪Dk和Dl∩Dk分别表示l和k的资源集合的并集和交集,Dl∩Dk即为跨领域交叉访问的资源集合;Ul、Uk分别表示领域l和领域k的用户集合,Ul∪Uk和Ul∩Uk分别表示l和k的用户集合的并集和交集,Ul∩Uk即为跨领域交互的用户集合;ρ表示权重系数,用于均衡资源价值、用户价值两种因素在领域相似度计算中的贡献;
资源主动推荐模块,在信息资源分类、用户分组、信息价值评价结果的建立数字地球科学平台主动服务框架,使用“注意力”机制将支持科学发现的服务策略与深度协同过滤技术融合,采用主动服务技术,对数字地球科学平台中的资源根据数据标签、用户画像和用户行为进行推荐。
5.根据权利要求4所述的数字地球资源推荐***,其特征在于,资源主动推荐模块包括数字地球主动服务框架、特征空间建模模块、价值资源策略融合模块、资源信息推荐模块四个部分,其中:
数字地球主动服务框架,包括稀疏输入层、稠密嵌入层、策略融合层、连接层、深度协同过滤层、输出层,其中,稀疏输入层通过融合用户、地球空间数据、应用服务属性信息实现特征空间建模,包括用户特征域、待评价资源特征域、兴趣价值资源特征域、专家价值资源特征域、领域价值资源特征域五个部分;稠密嵌入层通过将高维稀疏的输入层特征向量映射为低维稠密的嵌入向量,降低神经网络计算的复杂性;策略融合层通过设计注意力激活单元实现三种基于信息价值评价的资源策略的融合,包括用户兴趣价值资源策略、专家价值资源策略、领域价值资源策略;注意力激活单元用于计算用户投给待评价资源在兴趣性、价值性、新奇性特征方面的注意力权重,进而构建加权注意力的资源嵌入向量;连接层通过拼接用户嵌入向量和加权注意力的资源嵌入向量,为深度协同过滤层提供数据输入;深度协同过滤层通过多层神经网络组成的塔式结构实现用户、地球空间数据和应用服务特征的深度融合与交互;输出层通过Sigmoid激活函数将深度协同过滤层特征交互的结果映射为用户对地球空间资源的预测评价值;
特征空间建模模块,定义包含用户特征、候选资源特征、兴趣价值资源特征、专家价值资源特征以及领域价值资源特征五个特征域的特征空间FS,表示为FS=(USF,CDSF,IDSF,EDSF,DDSF),#(14)
其中,USF表示用户特征域,包括用户标识、用户性别、年龄称谓、地理区域等基本特征,以及用户领域、用户子领域等领域特征;CDSF表示候选资源特征域,包括数据特征和服务特征,数据特征根据地球空间数据的元信息如卫星标识、传感器标识、拍摄时间、生产时间、参照系等进行编码,反映地球空间数据的领域特点;服务特征主要通过服务响应时间、服务吞吐量、服务错误率、SLA违反率等指标来表示,反应应用服务的访问性能;IDSF表示兴趣价值资源特征域,是使用“兴趣价值资源策略”召回的用户兴趣范围内的高价值资源特征的序列;EDSF表示专家价值资源特征域,是使用“专家价值资源策略”召回的用户所属群组内专家用户的高价值资源特征的序列;DDSF表示领域价值资源特征域,是使用“领域价值资源策略”召回的用户相似领域内关联用户的高价值资源特征的序列;
价值资源服务策略融合模块,利用注意力权重对候选资源在适用性、价值性、新奇性方面进行综合表征,进而确定三种策略召回的资源在推荐时的综合排名;注意力权重是实现三种资源策略融合的关键,在一个小型的神经网络构成的激活单元中计算;激活单元的输入层是两个嵌入向量,通过元素减操作后,与原嵌入向量连接后输入到全连接层,最后通过单神经元输出层输出注意力权重;利用激活单元学习候选资源的特征与用户注意力特征之间的相似性大小,从而反应候选资源对当前用户关注点的“响应”情况;
资源信息推荐模块,稠密嵌入层的资源嵌入向量通过注意力激活单元进行策略融合后,与当前用户的嵌入向量在连接层进行向量拼接,作为深度协同过滤神经网络Neural CF的输入,利用深度协同过滤网络对当前用户与候选资源的特征进行深层交互,并将交互结果通过输出层的Sigmoid函数映射为用户对资源的评价值,根据评价值从大到小进行资源排序推荐。
6.一种数字地球资源推荐方法,其特征在于,基于权利要求1-5任一项所述的数字地球资源推荐***,实现数字地球资源推荐。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,基于权利要求1-5任一项所述的数字地球资源推荐***,实现数字地球资源推荐。
8.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,基于权利要求1-5任一项所述的数字地球资源推荐***,实现数字地球资源推荐。
CN202211731819.6A 2022-08-29 2022-12-30 一种数字地球资源推荐***及方法 Active CN116127190B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2022110382473 2022-08-29
CN202211038247.3A CN115442242A (zh) 2022-08-29 2022-08-29 一种基于重要性排序的工作流编排***及其方法

Publications (2)

Publication Number Publication Date
CN116127190A true CN116127190A (zh) 2023-05-16
CN116127190B CN116127190B (zh) 2023-07-28

Family

ID=84245199

Family Applications (5)

Application Number Title Priority Date Filing Date
CN202211038247.3A Pending CN115442242A (zh) 2022-08-29 2022-08-29 一种基于重要性排序的工作流编排***及其方法
CN202211625573.4A Active CN115858168B (zh) 2022-08-29 2022-12-16 一种基于重要性排序的地球应用模型编排***及其方法
CN202211731819.6A Active CN116127190B (zh) 2022-08-29 2022-12-30 一种数字地球资源推荐***及方法
CN202211729747.1A Pending CN116186133A (zh) 2022-08-29 2022-12-30 一种融合正排与倒排索引的电子文档管理方法
CN202310035450.3A Pending CN116542326A (zh) 2022-08-29 2023-01-10 一种基于时序卷积的知识表示方法及***

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202211038247.3A Pending CN115442242A (zh) 2022-08-29 2022-08-29 一种基于重要性排序的工作流编排***及其方法
CN202211625573.4A Active CN115858168B (zh) 2022-08-29 2022-12-16 一种基于重要性排序的地球应用模型编排***及其方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202211729747.1A Pending CN116186133A (zh) 2022-08-29 2022-12-30 一种融合正排与倒排索引的电子文档管理方法
CN202310035450.3A Pending CN116542326A (zh) 2022-08-29 2023-01-10 一种基于时序卷积的知识表示方法及***

Country Status (1)

Country Link
CN (5) CN115442242A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117370424A (zh) * 2023-12-07 2024-01-09 深圳市易图资讯股份有限公司 经济信息分析的移动应用评论数据分析挖掘方法及***

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117421487B (zh) * 2023-12-19 2024-03-08 西安康奈网络科技有限公司 一种基于人工智能的多种网络信息筛分管理***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079009A (zh) * 2019-12-11 2020-04-28 中国地质大学(武汉) 一种用于政务地图服务的用户兴趣检测方法及***

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110078516A1 (en) * 2009-09-28 2011-03-31 International Business Machines Corporation Method and a system for performing a two-phase commit protocol
CN109684537A (zh) * 2018-10-29 2019-04-26 昆明理工大学 一种面向业务流程的知识资源智能推送***及其推送方法
US11537446B2 (en) * 2019-08-14 2022-12-27 Microsoft Technology Licensing, Llc Orchestration and scheduling of services
CN110795219B (zh) * 2019-10-24 2022-03-18 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 适用于多种计算框架的资源调度方法及***
CN111752723B (zh) * 2020-06-06 2021-05-04 中国科学院电子学研究所苏州研究院 一种可视化的多源服务管理***及其实现方法
CN112463363B (zh) * 2020-11-06 2022-08-26 苏州浪潮智能科技有限公司 一种资源编排方法、装置、设备及存储介质
CN114138486B (zh) * 2021-12-02 2024-03-26 中国人民解放军国防科技大学 面向云边异构环境的容器化微服务编排方法、***及介质
CN114422582B (zh) * 2022-01-20 2023-05-16 中国科学院软件研究所 一种面向科技资源的服务动态组合方法及装置
CN114638021B (zh) * 2022-03-18 2024-06-14 北京邮电大学 物联网轻量级区块链***安全性评价方法
CN114756170B (zh) * 2022-04-02 2023-03-24 苏州空天信息研究院 一种面向容器应用的存储隔离***及其方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079009A (zh) * 2019-12-11 2020-04-28 中国地质大学(武汉) 一种用于政务地图服务的用户兴趣检测方法及***

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
周永章;陈烁;张旗;肖凡;王树功;刘艳鹏;焦守涛;: "大数据与数学地球科学研究进展――大数据与数学地球科学专题代序", 岩石学报, no. 02, pages 3 - 11 *
朱利鲁等: "时空大数据资源集成框架设计与应用", 计算机应用与软件, no. 3, pages 22 - 37 *
李颖;王洋;陈亚夫;凤丽洲;: "基于GIS的数据仓库管理***开发与实现", 辽宁工程技术大学学报(自然科学版), no. 03, pages 101 - 103 *
杨雅萍;姜侯;孙九林;: "科学数据共享实践:以国家地球***科学数据中心为例", 地球信息科学学报, no. 06, pages 186 - 197 *
杨雅萍;王?;白燕;乐夏芳;杜佳;柏永青;孙九林;: "国家地球***科学数据中心发展与实践", 农业大数据学报, no. 04, pages 7 - 15 *
王末;王卷乐;赫运涛;: "地学数据共享网用户Web行为预测及数据推荐方法", 地球信息科学学报, no. 05, pages 19 - 28 *
王末;郑晓欢;王卷乐;柏永青;: "基于混合过滤的地学数据个性化推荐方法设计与实现", 地理研究, no. 04, pages 170 - 180 *
郑忠刚;付琨;徐崇彦;巫震宇;周长飞;: "遥感数据用户需求融合处理技术", 国防科技大学学报, no. 02, pages 118 - 126 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117370424A (zh) * 2023-12-07 2024-01-09 深圳市易图资讯股份有限公司 经济信息分析的移动应用评论数据分析挖掘方法及***
CN117370424B (zh) * 2023-12-07 2024-02-13 深圳市易图资讯股份有限公司 经济信息分析的移动应用评论数据分析挖掘方法及***

Also Published As

Publication number Publication date
CN115858168B (zh) 2023-10-13
CN115442242A (zh) 2022-12-06
CN116542326A (zh) 2023-08-04
CN116127190B (zh) 2023-07-28
CN115858168A (zh) 2023-03-28
CN116186133A (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN111177575B (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN110462604B (zh) 基于设备使用关联互联网设备的数据处理***和方法
Gasparetti et al. Community detection in social recommender systems: a survey
CN116127190B (zh) 一种数字地球资源推荐***及方法
Li et al. A survey on personalized news recommendation technology
Deng et al. A user identification algorithm based on user behavior analysis in social networks
Sojahrood et al. A POI group recommendation method in location-based social networks based on user influence
Lu et al. GLR: A graph-based latent representation model for successive POI recommendation
CN113190670A (zh) 一种基于大数据平台的信息展示方法及***
CN115408618B (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
Chen et al. A temporal recommendation mechanism based on signed network of user interest changes
Wang et al. ST-SAGE: A spatial-temporal sparse additive generative model for spatial item recommendation
CN114692007A (zh) 表示信息的确定方法、装置、设备及存储介质
Shilin User Model‐Based Personalized Recommendation Algorithm for News Media Education Resources
Bunga et al. From implicit preferences to ratings: Video games recommendation based on collaborative filtering
Firouzkouhi et al. Generalized fuzzy hypergraph for link prediction and identification of influencers in dynamic social media networks
CN113256024B (zh) 一种融合群体行为的用户行为预测方法
Jyoti et al. A review on recommendation system and web usage data mining using k-nearest neighbor (knn) method
Leung et al. Theoretical and practical data science and analytics: challenges and solutions
Khazaei et al. Detecting privacy preferences from online social footprints: A literature review
Jing et al. A multi-dimensional city data embedding model for improving predictive analytics and urban operations
Shan [Retracted] Multisensor Cross‐Media Data Mining Method Assisted by Expert System
Miao et al. Analysis on Time‐Series Data from Movie Using MF‐DCCA Method and Recurrent Neural Network Model Under the Internet of Things
Wu et al. An intelligent network user behavior analysis system based on collaborative Markov model and distributed data processing
CN116680486B (zh) 基于时空注意力机制的用户兴趣预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant