CN113254789A - 一种推送气象服务内容的方法及装置 - Google Patents

一种推送气象服务内容的方法及装置 Download PDF

Info

Publication number
CN113254789A
CN113254789A CN202110731097.3A CN202110731097A CN113254789A CN 113254789 A CN113254789 A CN 113254789A CN 202110731097 A CN202110731097 A CN 202110731097A CN 113254789 A CN113254789 A CN 113254789A
Authority
CN
China
Prior art keywords
content
vector
positive feedback
candidate
meteorological
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110731097.3A
Other languages
English (en)
Other versions
CN113254789B (zh
Inventor
匡秋明
郑江平
刘进
彭敏
王一鹤
张耿
于廷照
胡骏楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Public Meteorological Service Center Of China Meteorological Administration National Early Warning Information Release Center
Original Assignee
Public Meteorological Service Center Of China Meteorological Administration National Early Warning Information Release Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Public Meteorological Service Center Of China Meteorological Administration National Early Warning Information Release Center filed Critical Public Meteorological Service Center Of China Meteorological Administration National Early Warning Information Release Center
Priority to CN202110731097.3A priority Critical patent/CN113254789B/zh
Publication of CN113254789A publication Critical patent/CN113254789A/zh
Application granted granted Critical
Publication of CN113254789B publication Critical patent/CN113254789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种推送气象服务内容的方法及装置,方法包括:获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集;基于正反馈内容集以及内容相似度矩阵,计算目标用户对气象服务内容的感兴趣程度,生成候选气象服务内容推送集;对目标用户的正反馈内容集以及候选气象服务内容推送集分别进行词提取,基于提取的词、气象知识词典,构建词向量、实体向量和实体上下文向量,并拼接得到向量拼接矩阵;将内容对应的向量拼接矩阵输入图卷积神经网络,得到内容向量;基于各内容向量,获取正反馈气象服务内容的权重分值,并获取候选气象服务内容的推送分值;获取排序靠前的多个候选气象服务内容进行推送。可以提高推送的准确性。

Description

一种推送气象服务内容的方法及装置
技术领域
本发明涉及气象服务技术领域,具体而言,涉及一种推送气象服务内容的方法及装置。
背景技术
互联网络的出现和普及给用户带来了大量的信息,满足了用户对信息分享、获取、查询的需求。但随着互联网络的迅速发展,网上信息量大幅增长,使得用户在面对海量信息时,很难从中获得对自己真正有用的信息,降低了信息的使用效率。例如,人们在外出旅游时,需要了解相关的地质气象服务内容,但目前获取气象服务内容的方法,需要用户在网上进行搜索,而对于搜索得到的海量内容,用户需要从中选取有用的内容进行浏览,花费的时间较长,使得用户的浏览效率较低,推送的准确性较低;而对于目前在节假日向用户推送的气象服务内容,多是关于著名景点的天气预报内容,很难满足用户的个性化需求,推送的气象服务内容较多被忽略,使得推送效率不高。
发明内容
有鉴于此,本发明的目的在于提供推送气象服务内容的方法及装置,以提高推送的准确性、满足用户的个性化需求。
第一方面,本发明实施例提供了推送气象服务内容的方法,包括:
获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集;
基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,基于计算的感兴趣程度,生成候选气象服务内容推送集;
对目标用户的正反馈内容集以及候选气象服务内容推送集分别进行词提取,基于提取的词以及预先设置的气象知识词典,构建词向量,基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量;
将实体向量和实体上下文向量映射到词向量的空间中,拼接词向量、映射的实体向量和实体上下文向量,得到向量拼接矩阵;
针对每一内容,将该内容对应的向量拼接矩阵输入图卷积神经网络,得到内容向量;
基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,以及,基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值;
按照推送分值进行排序,获取排序靠前的多个候选气象服务内容进行推送。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集,包括:
获取目标用户浏览过的气象服务内容;
若气象服务内容与所述目标用户预设的感兴趣气象服务分类相匹配,将该气象服务内容置于正反馈内容集;
若气象服务内容与所述目标用户预设的气象服务分类不相匹配,若对气象服务内容的评分超过预设的评分阈值,将该气象服务内容置于正反馈内容集;
若对气象服务内容没有评分,若对该气象服务内容的浏览时长超过预设的时长阈值,将该气象服务内容置于正反馈内容集。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,构建所述内容相似度矩阵,包括:
获取用户对浏览过的气象服务内容具有正反馈的正反馈气象服务内容集;
基于各正反馈气象服务内容集,利用协同过滤推荐算法生成内容相似度矩阵。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述基于各正反馈气象服务内容集,利用协同过滤推荐算法生成内容相似度矩阵,包括:
对各用户的正反馈气象服务内容集进行合并以及内容去重处理,得到内容去重集,基于内容去重集构建正反馈内容矩阵,该正反馈内容矩阵的行列分别是内容去重集包含的内容,行数与列数均等于内容去重集包含的内容条数;
依据各用户的正反馈气象服务内容集,编辑正反馈内容矩阵的行列值;
对编辑的正反馈内容矩阵的行列值进行归一化,得到内容相似度矩阵。
结合第一方面、第一方面的第一种可能的实施方式至第三种可能的实施方式中的任一种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,包括:
针对内容相似度矩阵中的目标气象服务内容,获取与该目标气象服务内容相似的相似内容集;
获取相似内容集与正反馈内容集的并集,得到内容并集;
针对内容并集中的每一并集内容,从内容相似度矩阵中,获取该并集内容与目标气象服务内容之间的并集相似度,以及,获取目标用户对该并集内容的并集评分;
计算并集相似度与并集评分的乘积,得到该并集内容的并集感兴趣程度;
对各并集内容的并集感兴趣程度进行求和,得到目标用户对目标气象服务内容的感兴趣程度。
结合第一方面、第一方面的第一种可能的实施方式至第三种可能的实施方式中的任一种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述基于提取的词以及预先设置的气象知识词典,构建词向量,包括:
针对提取的每条词,依据预先设置的气象知识词典,将该提取的词的词向量值设置为1,其它词的词向量值设置为0,得到该提取的词的词向量。
结合第一方面、第一方面的第一种可能的实施方式至第三种可能的实施方式中的任一种可能的实施方式,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量,包括:
针对提取的每个词,判断该提取的词是否为山洪地质灾害气象知识图谱中的实体,若是,依据山洪地质灾害气象知识图谱中该提取的词对应的初始实体,以及山洪地质灾害气象知识图谱中与该初始实体有关系的其他实体,构建包含第一实体、关系、第二实体的三元组的子图谱,其中,第一实体为初始实体;
针对子图谱中的每一三元组,设置第一实体向量、关系向量、第二实体向量,利用平移嵌入算法对第一实体向量、关系向量、第二实体向量进行赋值,直至第一实体向量值与关系向量值的和值与第二实体向量值的差值在预先设置的向量值误差阈值内,得到子图谱向量集;
从子图谱向量集中,提取初始实体对应的向量,得到实体向量;
计算子图谱向量集中与初始实体相连的各实体向量的平均值,得到实体上下文向量。
结合第一方面、第一方面的第一种可能的实施方式至第三种可能的实施方式中的任一种可能的实施方式,本发明实施例提供了第一方面的第七种可能的实施方式,其中,所述基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,包括:
提取正反馈内容集中一正反馈气象服务内容的内容向量,将该内容向量分别与候选气象服务内容推送集中每一候选气象服务内容的内容向量进行组合;
针对每一组合的组合向量,将该组合向量输入预先设置的注意力网络,利用归一化函数对注意力网络的输出进行归一化,得到该组合向量的权重值;
对各组合向量的权重值进行均值计算,得到提取的正反馈气象服务内容对应的权重分值。
结合第一方面的第七种可能的实施方式,本发明实施例提供了第一方面的第八种可能的实施方式,其中,所述基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值,包括:
针对候选气象服务内容推送集的每一候选气象服务内容,将该候选气象服务内容的内容向量分别与正反馈内容集的每一正反馈气象服务内容的内容向量进行组合,得到候选组合向量;
针对每一候选组合向量,将该候选组合向量输入预先设置的注意力网络,利用归一化函数对注意力网络的输出进行归一化,得到该候选组合向量的分值;
获取候选组合向量中正反馈气象服务内容对应的组合向量的权重值,计算该候选组合向量的分值与获取的权重值的乘积,得到该候选组合向量的加权值;
对各候选组合向量的加权值进行加权平均,得到候选气象服务内容的推送分值。
第二方面,本发明实施例还提供了一种推送气象服务内容的装置,包括:
内容获取模块,用于获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集;
候选内容生成模块,用于基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,基于计算的感兴趣程度,生成候选气象服务内容推送集;
向量构建模块,用于对目标用户的正反馈内容集以及候选气象服务内容推送集分别进行词提取,基于提取的词以及预先设置的气象知识词典,构建词向量,基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量;
向量拼接模块,用于将实体向量和实体上下文向量映射到词向量的空间中,拼接词向量、映射的实体向量和实体上下文向量,得到向量拼接矩阵;
内容向量获取模块,用于针对每一内容,将该内容对应的向量拼接矩阵输入图卷积神经网络,得到内容向量;
推送分值计算模块,用于基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,以及,基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值;
内容推送模块,用于按照推送分值进行排序,获取排序靠前的多个候选气象服务内容进行推送。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的方法的步骤。
本发明实施例提供的推送气象服务内容的方法及装置,通过获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集;基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,基于计算的感兴趣程度,生成候选气象服务内容推送集;对目标用户的正反馈内容集以及候选气象服务内容推送集分别进行词提取,基于提取的词以及预先设置的气象知识词典,构建词向量,基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量;将实体向量和实体上下文向量映射到词向量的空间中,拼接词向量、映射的实体向量和实体上下文向量,得到向量拼接矩阵;针对每一内容,将该内容对应的向量拼接矩阵输入图卷积神经网络,得到内容向量;基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,以及,基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值;按照推送分值进行排序,获取排序靠前的多个候选气象服务内容进行推送。这样,通过获取用户浏览的气象服务内容,结合协同过滤推荐算法和基于山洪地质灾害气象知识图谱的特征学习,得到推送的气象服务内容,可以提升推送的气象服务内容的聚焦性,从而提升推送准确性以及推送效率。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例所提供的推送气象服务内容的方法流程示意图;
图2示出了本发明实施例所提供的基于各正反馈气象服务内容集,利用协同过滤推荐算法生成内容相似度矩阵的示意图;
图3示出了本发明实施例所提供的推送气象服务内容的装置结构示意图;
图4为本申请实施例提供的一种计算机设备400的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前通过网上搜索获取气象服务内容的方法,由于用户对气象服务内容知晓较少,在输入的气象服务关键词较少的情况下,搜索会得到海量气象服务内容,用户从中选取有用的气象服务内容花费的时间长,浏览效率较低;而对于目前在节假日向用户推送的气象服务内容,很难满足用户的个性化需求,常导致推送的气象服务内容被忽略,使得推送效率不高。本发明实施例中,通过获取用户浏览的气象服务内容,结合协同过滤推荐算法和基于山洪地质灾害气象知识图谱的特征学习,提出基于山洪地质灾害气象知识图谱的气象服务内容推送方法,实现气象服务内容的推送,以提升推送的气象服务内容的聚焦性,提升推送准确性以及推送效率。
本发明实施例提供了一种推送气象服务内容的方法及装置,下面通过实施例进行描述。
图1示出了本发明实施例所提供的推送气象服务内容的方法流程示意图。如图1所示,该方法包括:
步骤101,获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集;
本发明实施例中,作为一可选实施例,获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集,包括:
获取目标用户浏览过的气象服务内容;
若气象服务内容与所述目标用户预设的感兴趣气象服务分类相匹配,将该气象服务内容置于正反馈内容集;
若气象服务内容与所述目标用户预设的气象服务分类不相匹配,若对气象服务内容的评分超过预设的评分阈值,将该气象服务内容置于正反馈内容集;
若对气象服务内容没有评分,若对该气象服务内容的浏览时长超过预设的时长阈值,将该气象服务内容置于正反馈内容集。
本发明实施例中,通过收集和记录用户浏览气象服务内容的历史行为,获取用户浏览气象服务内容的评分、浏览时长等,结合用户设置的感兴趣气象服务分类,对该用户浏览过的气象服务内容进行正反馈内容选取。作为一可选实施例,感兴趣气象服务分类包括但不限于:滑坡、泥石流、崩塌,地面塌陷等,评分信息是用户对浏览的气象服务内容的评分。
本发明实施例中,为了便于区分,正反馈内容集中的气象服务内容称之为正反馈气象服务内容。
本发明实施例中,若没有获取到目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集,作为另一可选实施例,该方法还包括:
采集包含目标用户的属性信息、和∕或,偏好信息的用户显式偏好信息,基于用户显式偏好信息获取推送内容。
本发明实施例中,作为一可选实施例,属性信息包括但不限于:用户地理位置信息、家庭身份信息等;偏好信息为目标用户设置的感兴趣气象服务内容分类信息。其中,家庭身份信息可以是孩子、家长等。例如,对于家庭身份信息是孩子的目标用户,考虑到孩子的阅读能力,选择内容简单易懂、通俗生动的气象服务内容进行推送。
步骤102,基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,基于计算的感兴趣程度,生成候选气象服务内容推送集;
本发明实施例中,构建内容相似度矩阵,包括:
获取用户对浏览过的气象服务内容具有正反馈的正反馈气象服务内容集;
基于各正反馈气象服务内容集,利用协同过滤推荐算法生成内容相似度矩阵。
本发明实施例中,每一用户对应一正反馈气象服务内容集,通过采集海量用户的正反馈气象服务内容集构建内容相似度矩阵。
本发明实施例中,采用基于内容(物品)的协同过滤推荐算法生成内容相似度矩阵,协同过滤推荐算法认为,若喜欢内容A的用户中,大多数用户也喜欢内容B,则认为内容A和内容B具有很高的内容相似度。因而,作为一可选实施例,基于各正反馈气象服务内容集,利用协同过滤推荐算法生成内容相似度矩阵,包括:
对各用户的正反馈气象服务内容集进行合并以及内容去重处理,得到内容去重集,基于内容去重集构建正反馈内容矩阵,该正反馈内容矩阵的行列分别是内容去重集包含的内容,行数与列数均等于内容去重集包含的内容条数;
依据各用户的正反馈气象服务内容集,编辑正反馈内容矩阵的行列值;
对编辑的正反馈内容矩阵的行列值进行归一化,得到内容相似度矩阵。
图2示出了本发明实施例所提供的基于各正反馈气象服务内容集,利用协同过滤推荐算法生成内容相似度矩阵的示意图。如图2所示,本发明实施例中,假设用户数为5,第一个用户的第一正反馈气象服务内容集包含:内容a、内容b、内容d;第二个用户的第二正反馈气象服务内容集包含:内容b、内容c、内容e;第三个用户的第三正反馈气象服务内容集包含:内容c、内容d;第四个用户的第四正反馈气象服务内容集包含:内容b、内容c、内容d;第五个用户的第五正反馈气象服务内容集包含:内容a、内容d;则内容去重集包含:内容a、内容b、内容c、内容d、内容e,将内容两两配对构建正反馈内容矩阵,构建的正反馈内容矩阵为5x5的矩阵,分别依据各用户的正反馈气象服务内容集,对正反馈内容矩阵进行赋值,即每一正反馈内容集对应一内容子矩阵,各内容子矩阵均为5x5的矩阵。例如,对于第一个用户,第一内容子矩阵中,第一行第二列、第一行第四列、第二行第一列、第二行第四列、第四行第一列、第四行第二列的行列值均为1,其他行列值为0;对于第二个用户,第二内容子矩阵中,第二行第三列、第二行第五列、第三行第二列、第三行第五列、第五行第二列、第五行第三列的行列值均为1,其他行列值为0;对于第三个用户,第三内容子矩阵中,第三行第四列、第四行第三列的行列值均为1,其他行列值为0;对于第四个用户,第四内容子矩阵中,第二行第三列、第二行第四列、第三行第二列、第三行第四列、第四行第二列、第四行第三列的行列值均为1,其他行列值为0;对于第五个用户,第五内容子矩阵中,第一行第四列、第四行第一列的行列值均为1,其他行列值为0。将第一内容子矩阵、第二内容子矩阵、第三内容子矩阵、第四内容子矩阵以及第五内容子矩阵进行求和,得到正反馈内容矩阵,正反馈内容矩阵中,行列C[i][j]表示同时喜欢内容i和内容j的用户数。对正反馈内容矩阵进行归一化处理,得到内容相似度矩阵。
本发明实施例中,作为一可选实施例,利用下式对正反馈内容矩阵进行归一化处理:
Figure F_210519171612060_060232001
式中,
W ij 为内容i与内容j之间的相似度,即内容相似度矩阵中,第i行第j列的归一化值;
N(i)为正反馈内容矩阵中,内容i对应的用户数;
N(j)为正反馈内容矩阵中,内容j对应的用户数。
本发明实施例中,
Figure F_210519171612122_122732002
为内容i和内容j对应的用户数,即正反馈内容矩阵中,第i行第j列的用户数。
本发明实施例中,作为另一可选实施例,利用下式对正反馈内容矩阵进行归一化处理:
Figure F_210519171612200_200857003
本发明实施例中,利用该公式,可以减轻热门内容会和很多内容相似的可能性。
本发明实施例中,作为另一可选实施例,后续中,可以对内容相似度矩阵进行更新,例如,在获取到新的用户,或者,用户的正反馈气象服务内容集发生变化,依据上述方式实时更新内容相似度矩阵。
本发明实施例中,作为一可选实施例,基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,包括:
针对内容相似度矩阵中的目标气象服务内容,获取与该目标气象服务内容相似的相似内容集;
获取相似内容集与正反馈内容集的并集,得到内容并集;
针对内容并集中的每一并集内容,从内容相似度矩阵中,获取该并集内容与目标气象服务内容之间的并集相似度,以及,获取目标用户对该并集内容的并集评分;
计算并集相似度与并集评分的乘积,得到该并集内容的并集感兴趣程度;
对各并集内容的并集感兴趣程度进行求和,得到目标用户对目标气象服务内容的感兴趣程度。
本发明实施例中,目标气象服务内容可以是从内容相似度矩阵中随机选取的内容,作为一可选实施例,利用如下公式计算目标用户对内容(气象服务内容)的感兴趣程度:
Figure F_210519171612278_278982004
式中,
p uj 为目标用户u对内容j的感兴趣程度;
R(u)为目标用户u的正反馈内容集;
S(j,K)为与内容j最相似的K个内容的相似内容集;
r ui 为目标用户u对内容i的评分。
本发明实施例中,相似内容集可通过内容相似度矩阵得到,可以是从中选取与目标气象服务内容的相似度较大的多个内容。
本发明实施例中,作为一可选实施例,对于一内容j,假设和内容j最相似的K个内容的内容集为S(j,K),与用户喜欢的内容集N(u)有交集,则对于交集中的每个内容i,将内容i与内容j的相似度W ij ,与该用户对内容i的评分r ui 相乘,然后累加,即可得到用户u对内容j的感兴趣程度P uj
本发明实施例中,可以对各用户对内容的评分进行归一化处理,以使评分的尺度一致。作为一可选实施例,与用户历史上感兴趣的内容越相似的内容,越有可能在用户的推送列表中获得比较高的排名。
本发明实施例中,按照计算的感兴趣程度从大至小的顺序,选取排序前预定数的气象服务内容,生成候选气象服务内容推送集。例如,设定候选参数M,从计算的各气象服务内容对应的感兴趣程度中,选出感兴趣程度较高的M项气象服务内容,得到候选气象服务内容推送集。作为一可选实施例,M取40。
本发明实施例中,为了便于区分,候选气象服务内容推送集中的气象服务内容称之为候选气象服务内容。
步骤103,对目标用户的正反馈内容集以及候选气象服务内容推送集分别进行词提取,基于提取的词以及预先设置的气象知识词典,构建词向量,基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量;
本发明实施例中,预先采集相关的气象服务内容,对采集的气象服务内容进行词提取,去除重复词,构建包含有V个词的气象知识词典。
本发明实施例中,对目标用户的正反馈内容集以及候选气象服务内容推送集依序进行词提取,从而提取出各内容(正反馈气象服务内容、候选气象服务内容)对应的关键词。其中,若提取的词相重复,不进行重复词去除处理。
本发明实施例中,作为一可选实施例,基于提取的词以及预先设置的气象知识词典,构建词向量,包括:
针对提取的每条词,依据预先设置的气象知识词典,将该提取的词的词向量值设置为1,其它词的词向量值设置为0,得到该提取的词的词向量。
本发明实施例中,根据气象知识词典,对于正反馈内容集和候选气象服务内容推送集中的每条内容,进行词提取,在V维气象知识词典中,将该词对应的编码值(词向量值)设置为1,其他词的编码值均为0,得到该提取的词的词向量,从而为提取的每个词产生一个V维的独热编码(one-hot)向量。
本发明实施例中,作为一可选实施例,基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量,包括:
针对提取的每个词,判断该提取的词是否为山洪地质灾害气象知识图谱中的实体,若是,依据山洪地质灾害气象知识图谱中该提取的词对应的初始实体,以及山洪地质灾害气象知识图谱中与该初始实体有关系的其他实体,构建包含第一实体、关系、第二实体的三元组的子图谱,其中,第一实体为初始实体;
针对子图谱中的每一三元组,设置第一实体向量、关系向量、第二实体向量,利用平移嵌入算法对第一实体向量、关系向量、第二实体向量进行赋值,直至第一实体向量值与关系向量值的和值与第二实体向量值的差值在预先设置的向量值误差阈值内,得到子图谱向量集;
从子图谱向量集中,提取初始实体对应的向量,得到实体向量;
计算子图谱向量集中与初始实体相连的各实体向量的平均值,得到实体上下文向量。
本发明实施例中,基于从各内容(正反馈内容集以及候选气象服务内容推送集中的内容)中提取的词、气象知识词典以及山洪地质灾害气象知识图谱中定义的关系与实体,构建子图谱。若提取的词为山洪地质灾害气象知识图谱中的实体,则每一提取的词对应一子图谱,对于提取的词相同的情形,对应的子图谱相同。子图谱中,包含若干个三元组(实体,关系,实体)。然后,采用平移嵌入(TransE,Translating Embedding)算法进行特征学***均差达到要求,此时,初始实体对应的向量为提取的词对应的实体向量。
本发明实施例中,若提取的词不是山洪地质灾害气象知识图谱中的实体,则用相同维度的0向量构建该提取的词的向量。
本发明实施例中,利用实体的上下文,可以进一步描述实体,从而提升后续推送的精准性。具体来说,利用上述子图谱向量集中各实体的实体向量,将与初始实体相连的各实体的实体向量的平均值作为该初始实体的实体上下文向量。
本发明实施例中,对于提取的词不是山洪地质灾害气象知识图谱中的实体,则用相同维度的0向量表示实体上下文向量。
步骤104,将实体向量和实体上下文向量映射到词向量的空间中,拼接词向量、映射的实体向量和实体上下文向量,得到向量拼接矩阵;
本发明实施例中,将实体向量和实体上下文向量映射到词向量的空间中,以对实体向量和实体上下文向量进行降维处理,使得实体向量、实体上下文向量与词向量的维度相同,然后,将词向量、经映射处理的实体向量和实体上下文向量进行拼接,得到向量拼接矩阵。
本发明实施例中,对于每一提取的词,将该提取的词对应的词向量、进行映射处理的实体向量和实体上下文向量进行拼接,得到该提取的词对应的向量拼接矩阵。
步骤105,针对每一内容,将该内容对应的向量拼接矩阵输入图卷积神经网络,得到内容向量;
本发明实施例中,内容包括正反馈气象服务内容以及候选气象服务内容。将向量拼接矩阵在图卷积神经网络的框架下进行融合,得到内容向量。
步骤106,基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,以及,基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值;
本发明实施例中,作为一可选实施例,基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,包括:
提取正反馈内容集中一正反馈气象服务内容的内容向量,将该内容向量分别与候选气象服务内容推送集中每一候选气象服务内容的内容向量进行组合;
针对每一组合的组合向量,将该组合向量输入预先设置的注意力网络,利用归一化函数对注意力网络的输出进行归一化,得到该组合向量的权重值;
对各组合向量的权重值进行均值计算,得到提取的正反馈气象服务内容对应的权重分值。
本发明实施例中,遍历正反馈内容集中的正反馈气象服务内容,对于从正反馈内容集中提取的某一正反馈气象服务内容,依据候选气象服务内容推送集中包含的各候选气象服务内容,将该提取的正反馈气象服务内容对应的内容向量和候选气象服务内容推送集中的一候选气象服务内容对应的内容向量输入注意力网络,通过softmax函数进行归一化,得到一权重值(组合向量的权重值),依据相同方法,遍历候选气象服务内容推送集中的每一候选气象服务内容,分别计算该提取的气象服务内容的内容向量和候选气象服务内容推送集中遍历的候选气象服务内容的内容向量的权重值,对所有得到的权重值进行平均值计算,可以得到该提取的正反馈气象服务内容的权重分值。如此循环,可得到正反馈内容集中每一正反馈气象服务内容对应的权重分值。例如,若正反馈内容集包含40条正反馈气象服务内容,分别为第一气象服务内容(对应第一内容向量)至第四十气象服务内容(对应第四十内容向量),候选气象服务内容推送集包含50条候选气象服务内容,分别为第四十一气象服务内容(对应第四十一内容向量)至第九十气象服务内容(对应第九十内容向量),以第一气象服务内容为例,将第一内容向量分别与第四十一内容向量、第四十二内容向量、…、第九十内容向量进行拼接组合,得到组合向量、第二组合向量、…、第五十组合向量,将第一组合向量输入预先训练好的注意力网络,经过归一化,得到第一组合向量的权重值,将第二组合向量输入预先训练好的注意力网络,经过归一化,得到第二组合向量的权重值,…,直至得到第五十组合向量的权重值;将第一组合向量的权重值至第五十组合向量的权重值进行加权平均,得到第一气象服务内容(第一内容向量)对应的权重分值。
本发明实施例中,作为一可选实施例,基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值,包括:
针对候选气象服务内容推送集的每一候选气象服务内容,将该候选气象服务内容的内容向量分别与正反馈内容集的每一正反馈气象服务内容的内容向量进行组合,得到候选组合向量;
针对每一候选组合向量,将该候选组合向量输入预先设置的注意力网络,利用归一化函数对注意力网络的输出进行归一化,得到该候选组合向量的分值;
获取候选组合向量中正反馈气象服务内容对应的组合向量的权重值,计算该候选组合向量的分值与获取的权重值的乘积,得到该候选组合向量的加权值;
对各候选组合向量的加权值进行加权平均,得到候选气象服务内容的推送分值。
本发明实施例中,如上所述,对于包含40条正反馈气象服务内容的正反馈内容集以及包含50条候选气象服务内容的候选气象服务内容推送集,以第四十一气象服务内容为例,将第四十一内容向量分别与第一内容向量、第二内容向量、…、第四十内容向量进行拼接组合,得到第一候选组合向量、第二候选组合向量、…、第四十候选组合向量,将第一候选组合向量输入预先训练好的注意力网络,经过归一化,得到第一候选组合向量的分值,将第二候选组合向量输入预先训练好的注意力网络,经过归一化,得到第二候选组合向量的分值,…,直至得到第四十候选组合向量的分值;将第一候选组合向量的分值与第一内容向量的权重分值相乘,得到第一候选组合向量的加权值,将第一候选组合向量的加权值至第四十候选组合向量的加权值进行加权平均,得到第四十一气象服务内容的推送分值。
步骤107,按照推送分值进行排序,获取排序靠前的多个候选气象服务内容进行推送。
本发明实施例中,设定推送参数N,为用户推送分数最高的N项。作为一可选实施例,N取20。例如,依据候选气象服务内容的推送分值,从高至低进行排序,最终推送20个推送分值较高的候选气象服务内容。
本发明实施例中,作为一可选实施例,该方法还包括:
获取目标用户的属性信息,基于属性信息对排序靠前的多个候选气象服务内容进行筛选,向目标用户推送筛选的候选气象服务内容。
本发明实施例中,在进行候选气象服务内容推送时,获取目标用户的家庭身份信息、和∕或,此时目标用户的地理位置信息,基于家庭身份信息、和∕或,此时目标用户的地理位置信息,对排序靠前的多个候选气象服务内容进行再过滤,以进一步提升推送的候选气象服务内容的精准性。
本发明实施例中,在具有1.5万个实体、6万条关系数据的山洪地质灾害气象服务内容图谱上进行测试,该图谱的内容主要包括山洪地质灾害相关的气象知识、灾害记录、应对措施等,其中,数据来源于百度百科与中文***。100位招募的实验人员根据自身喜好浏览10条内容,通过上述的10条用户行为记录,在0.2秒内为每个实验人员产生20条推送。实验结果显示,实验人员对推送内容的综合满意度约为92%。
本发明实施例中,通过目标用户历史浏览行为获取、候选气象服务内容推送集构建、基于山洪地质灾害气象知识图谱的特征学习,从而得到推送的气象服务内容。其中,采用协同过滤推荐算法构建候选气象服务内容推送集,协同过滤推荐算法能处理非结构化的复杂对象,且处理速度较快,而基于山洪地质灾害气象知识图谱的特征学习使用深度知识感知网络(DKN,Deep Knowledge-aware Network)算法,该DKN算法可以利用构建好的山洪地质灾害气象知识图谱进行用户兴趣挖掘,并能有效解决稀疏性和冷启动问题,增强推送效果,并可以减轻由于引入山洪地质灾害气象知识图谱带来的计算负担,这样,通过协同过滤推荐算法结合山洪地质灾害气象知识图谱,能够有效提高推送准确率,为用户提供更加个性化的推送,推送内容的相关性更强,更加吸引用户,实现良好的推送效果。
图3示出了本发明实施例所提供的推送气象服务内容的装置结构示意图。如图3所示,该装置包括:
内容获取模块301,用于获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集;
本发明实施例中,作为一可选实施例,内容获取模块301包括:
内容获取单元(图中未示出),用于获取目标用户浏览过的气象服务内容;
第一匹配单元,若气象服务内容与所述目标用户预设的感兴趣气象服务分类相匹配,将该气象服务内容置于正反馈内容集;
第二匹配单元,若气象服务内容与所述目标用户预设的气象服务分类不相匹配,若对气象服务内容的评分超过预设的评分阈值,将该气象服务内容置于正反馈内容集;
时长匹配单元,若对气象服务内容没有评分,若对该气象服务内容的浏览时长超过预设的时长阈值,将该气象服务内容置于正反馈内容集。
候选内容生成模块302,用于基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,基于计算的感兴趣程度,生成候选气象服务内容推送集;
本发明实施例中,作为一可选实施例,候选内容生成模块302包括:
相似获取单元,用于针对内容相似度矩阵中的目标气象服务内容,获取与该目标气象服务内容相似的相似内容集;
并集处理单元,用于获取相似内容集与正反馈内容集的并集,得到内容并集;
评分获取单元,用于针对内容并集中的每一并集内容,从内容相似度矩阵中,获取该并集内容与目标气象服务内容之间的并集相似度,以及,获取目标用户对该并集内容的并集评分;
乘积单元,用于计算并集相似度与并集评分的乘积,得到该并集内容的并集感兴趣程度;
求和单元,用于对各并集内容的并集感兴趣程度进行求和,得到目标用户对目标气象服务内容的感兴趣程度。
本发明实施例中,作为一可选实施例,利用下式对正反馈内容矩阵进行归一化处理:
Figure F_210519171612482_482107005
本发明实施例中,作为另一可选实施例,利用下式对正反馈内容矩阵进行归一化处理:
Figure F_210519171612544_544607006
利用如下公式计算目标用户对内容(气象服务内容)的感兴趣程度:
Figure F_210519171612622_622732007
向量构建模块303,用于对目标用户的正反馈内容集以及候选气象服务内容推送集分别进行词提取,基于提取的词以及预先设置的气象知识词典,构建词向量,基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量;
本发明实施例中,作为一可选实施例,基于提取的词以及预先设置的气象知识词典,构建词向量,包括:
针对提取的每条词,依据预先设置的气象知识词典,将该提取的词的词向量值设置为1,其它词的词向量值设置为0,得到该提取的词的词向量。
本发明实施例中,作为一可选实施例,向量构建模块303,具体用于:
针对提取的每个词,判断该提取的词是否为山洪地质灾害气象知识图谱中的实体,若是,依据山洪地质灾害气象知识图谱中该提取的词对应的初始实体,以及山洪地质灾害气象知识图谱中与该初始实体有关系的其他实体,构建包含第一实体、关系、第二实体的三元组的子图谱,其中,第一实体为初始实体;
针对子图谱中的每一三元组,设置第一实体向量、关系向量、第二实体向量,利用平移嵌入算法对第一实体向量、关系向量、第二实体向量进行赋值,直至第一实体向量值与关系向量值的和值与第二实体向量值的差值在预先设置的向量值误差阈值内,得到子图谱向量集;
从子图谱向量集中,提取初始实体对应的向量,得到实体向量;
计算子图谱向量集中与初始实体相连的各实体向量的平均值,得到实体上下文向量。
向量拼接模块304,用于将实体向量和实体上下文向量映射到词向量的空间中,拼接词向量、映射的实体向量和实体上下文向量,得到向量拼接矩阵;
本发明实施例中,对实体向量和实体上下文向量进行降维处理。
内容向量获取模块305,用于针对每一内容,将该内容对应的向量拼接矩阵输入图卷积神经网络,得到内容向量;
本发明实施例中,内容包括正反馈气象服务内容以及候选气象服务内容。将向量拼接矩阵在图卷积神经网络的框架下进行融合,得到内容向量。
推送分值计算模块306,用于基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,以及,基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值;
本发明实施例中,作为一可选实施例,推送分值计算模块306,具体用于:
提取正反馈内容集中一正反馈气象服务内容的内容向量,将该内容向量分别与候选气象服务内容推送集中每一候选气象服务内容的内容向量进行组合;
针对每一组合的组合向量,将该组合向量输入预先设置的注意力网络,利用归一化函数对注意力网络的输出进行归一化,得到该组合向量的权重值;
对各组合向量的权重值进行均值计算,得到提取的正反馈气象服务内容对应的权重分值。
本发明实施例中,作为另一可选实施例,推送分值计算模块306,具体还用于:
针对候选气象服务内容推送集的每一候选气象服务内容,将该候选气象服务内容的内容向量分别与正反馈内容集的每一正反馈气象服务内容的内容向量进行组合,得到候选组合向量;
针对每一候选组合向量,将该候选组合向量输入预先设置的注意力网络,利用归一化函数对注意力网络的输出进行归一化,得到该候选组合向量的分值;
获取候选组合向量中正反馈气象服务内容对应的组合向量的权重值,计算该候选组合向量的分值与获取的权重值的乘积,得到该候选组合向量的加权值;
对各候选组合向量的加权值进行加权平均,得到候选气象服务内容的推送分值。
内容推送模块307,用于按照推送分值进行排序,获取排序靠前的多个候选气象服务内容进行推送。
本发明实施例中,作为一可选实施例,该装置还包括:
内容相似度矩阵构建模块(图中未示出),用于获取用户对浏览过的气象服务内容具有正反馈的正反馈气象服务内容集;基于各正反馈气象服务内容集,利用协同过滤推荐算法生成内容相似度矩阵。
本发明实施例中,作为一可选实施例,内容相似度矩阵构建模块包括:
内容收集单元,用于获取用户对浏览过的气象服务内容具有正反馈的正反馈气象服务内容集;
矩阵构建单元,用于对各用户的正反馈气象服务内容集进行合并以及内容去重处理,得到内容去重集,基于内容去重集构建正反馈内容矩阵,该正反馈内容矩阵的行列分别是内容去重集包含的内容,行数与列数均等于内容去重集包含的内容条数;
编辑单元,用于依据各用户的正反馈气象服务内容集,编辑正反馈内容矩阵的行列值;
归一单元,用于对编辑的正反馈内容矩阵的行列值进行归一化,得到内容相似度矩阵。
本发明实施例中,作为另一可选实施例,该装置还包括:
属性信息匹配模块,用于获取目标用户的属性信息,基于属性信息对排序靠前的多个候选气象服务内容进行筛选,向目标用户推送筛选的候选气象服务内容。
本发明实施例中,在进行候选气象服务内容推送时,获取目标用户的家庭身份信息、和∕或,此时目标用户的地理位置信息,基于家庭身份信息、和∕或,此时目标用户的地理位置信息,对排序靠前的多个候选气象服务内容进行再过滤,以进一步提升推送的候选气象服务内容的精准性。
如图4所示,本申请一实施例提供了一种计算机设备400,用于执行图1中的推送气象服务内容的方法,该设备包括存储器401、处理器402及存储在该存储器401上并可在该处理器402上运行的计算机程序,其中,上述处理器402执行上述计算机程序时实现上述推送气象服务内容的方法的步骤。
具体地,上述存储器401和处理器402能够为通用的存储器和处理器,这里不做具体限定,当处理器402运行存储器401存储的计算机程序时,能够执行上述推送气象服务内容的方法。
对应于图1中的推送气象服务内容的方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述推送气象服务内容的方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述推送气象服务内容的方法。
在本申请所提供的实施例中,应该理解到,所揭露***和方法,可以通过其它的方式实现。以上所描述的***实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,***或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory ,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种推送气象服务内容的方法,其特征在于,包括:
获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集;
基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,基于计算的感兴趣程度,生成候选气象服务内容推送集;
对目标用户的正反馈内容集以及候选气象服务内容推送集分别进行词提取,基于提取的词以及预先设置的气象知识词典,构建词向量,基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量;
将实体向量和实体上下文向量映射到词向量的空间中,拼接词向量、映射的实体向量和实体上下文向量,得到向量拼接矩阵;
针对每一内容,将该内容对应的向量拼接矩阵输入图卷积神经网络,得到内容向量;
基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,以及,基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值;
按照推送分值进行排序,获取排序靠前的多个候选气象服务内容进行推送。
2.根据权利要求1所述的方法,其特征在于,所述获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集,包括:
获取目标用户浏览过的气象服务内容;
若气象服务内容与所述目标用户预设的感兴趣气象服务分类相匹配,将该气象服务内容置于正反馈内容集;
若气象服务内容与所述目标用户预设的气象服务分类不相匹配,若对气象服务内容的评分超过预设的评分阈值,将该气象服务内容置于正反馈内容集;
若对气象服务内容没有评分,若对该气象服务内容的浏览时长超过预设的时长阈值,将该气象服务内容置于正反馈内容集。
3.根据权利要求1所述的方法,其特征在于,构建所述内容相似度矩阵,包括:
获取用户对浏览过的气象服务内容具有正反馈的正反馈气象服务内容集;
基于各正反馈气象服务内容集,利用协同过滤推荐算法生成内容相似度矩阵。
4.根据权利要求3所述的方法,其特征在于,所述基于各正反馈气象服务内容集,利用协同过滤推荐算法生成内容相似度矩阵,包括:
对各用户的正反馈气象服务内容集进行合并以及内容去重处理,得到内容去重集,基于内容去重集构建正反馈内容矩阵,该正反馈内容矩阵的行列分别是内容去重集包含的内容,行数与列数均等于内容去重集包含的内容条数;
依据各用户的正反馈气象服务内容集,编辑正反馈内容矩阵的行列值;
对编辑的正反馈内容矩阵的行列值进行归一化,得到内容相似度矩阵。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,包括:
针对内容相似度矩阵中的目标气象服务内容,获取与该目标气象服务内容相似的相似内容集;
获取相似内容集与正反馈内容集的并集,得到内容并集;
针对内容并集中的每一并集内容,从内容相似度矩阵中,获取该并集内容与目标气象服务内容之间的并集相似度,以及,获取目标用户对该并集内容的并集评分;
计算并集相似度与并集评分的乘积,得到该并集内容的并集感兴趣程度;
对各并集内容的并集感兴趣程度进行求和,得到目标用户对目标气象服务内容的感兴趣程度。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述基于提取的词以及预先设置的气象知识词典,构建词向量,包括:
针对提取的每条词,依据预先设置的气象知识词典,将该提取的词的词向量值设置为1,其它词的词向量值设置为0,得到该提取的词的词向量。
7.根据权利要求1至4任一项所述的方法,其特征在于,所述基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量,包括:
针对提取的每个词,判断该提取的词是否为山洪地质灾害气象知识图谱中的实体,若是,依据山洪地质灾害气象知识图谱中该提取的词对应的初始实体,以及山洪地质灾害气象知识图谱中与该初始实体有关系的其他实体,构建包含第一实体、关系、第二实体的三元组的子图谱,其中,第一实体为初始实体;
针对子图谱中的每一三元组,设置第一实体向量、关系向量、第二实体向量,利用平移嵌入算法对第一实体向量、关系向量、第二实体向量进行赋值,直至第一实体向量值与关系向量值的和值与第二实体向量值的差值在预先设置的向量值误差阈值内,得到子图谱向量集;
从子图谱向量集中,提取初始实体对应的向量,得到实体向量;
计算子图谱向量集中与初始实体相连的各实体向量的平均值,得到实体上下文向量。
8.根据权利要求1至4任一项所述的方法,其特征在于,所述基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,包括:
提取正反馈内容集中一正反馈气象服务内容的内容向量,将该内容向量分别与候选气象服务内容推送集中每一候选气象服务内容的内容向量进行组合;
针对每一组合的组合向量,将该组合向量输入预先设置的注意力网络,利用归一化函数对注意力网络的输出进行归一化,得到该组合向量的权重值;
对各组合向量的权重值进行均值计算,得到提取的正反馈气象服务内容对应的权重分值。
9.根据权利要求8所述的方法,其特征在于,所述基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值,包括:
针对候选气象服务内容推送集的每一候选气象服务内容,将该候选气象服务内容的内容向量分别与正反馈内容集的每一正反馈气象服务内容的内容向量进行组合,得到候选组合向量;
针对每一候选组合向量,将该候选组合向量输入预先设置的注意力网络,利用归一化函数对注意力网络的输出进行归一化,得到该候选组合向量的分值;
获取候选组合向量中正反馈气象服务内容对应的组合向量的权重值,计算该候选组合向量的分值与获取的权重值的乘积,得到该候选组合向量的加权值;
对各候选组合向量的加权值进行加权平均,得到候选气象服务内容的推送分值。
10.一种推送气象服务内容的装置,其特征在于,包括:
内容获取模块,用于获取目标用户对浏览过的气象服务内容具有正反馈的正反馈内容集;
候选内容生成模块,用于基于正反馈内容集以及预先构建的内容相似度矩阵,计算目标用户对内容相似度矩阵中的气象服务内容的感兴趣程度,基于计算的感兴趣程度,生成候选气象服务内容推送集;
向量构建模块,用于对目标用户的正反馈内容集以及候选气象服务内容推送集分别进行词提取,基于提取的词以及预先设置的气象知识词典,构建词向量,基于提取的词以及预先设置的山洪地质灾害气象知识图谱,构建提取的词对应的实体向量和实体上下文向量;
向量拼接模块,用于将实体向量和实体上下文向量映射到词向量的空间中,拼接词向量、映射的实体向量和实体上下文向量,得到向量拼接矩阵;
内容向量获取模块,用于针对每一内容,将该内容对应的向量拼接矩阵输入图卷积神经网络,得到内容向量;
推送分值计算模块,用于基于正反馈内容集的内容向量以及候选气象服务内容推送集的内容向量,获取正反馈内容集中每一正反馈气象服务内容的权重分值,以及,基于正反馈内容集的内容向量、候选气象服务内容推送集的内容向量以及权重分值,获取候选气象服务内容推送集中每一候选气象服务内容的推送分值;
内容推送模块,用于按照推送分值进行排序,获取排序靠前的多个候选气象服务内容进行推送。
CN202110731097.3A 2021-06-30 2021-06-30 一种推送气象服务内容的方法及装置 Active CN113254789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110731097.3A CN113254789B (zh) 2021-06-30 2021-06-30 一种推送气象服务内容的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110731097.3A CN113254789B (zh) 2021-06-30 2021-06-30 一种推送气象服务内容的方法及装置

Publications (2)

Publication Number Publication Date
CN113254789A true CN113254789A (zh) 2021-08-13
CN113254789B CN113254789B (zh) 2021-09-17

Family

ID=77190210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110731097.3A Active CN113254789B (zh) 2021-06-30 2021-06-30 一种推送气象服务内容的方法及装置

Country Status (1)

Country Link
CN (1) CN113254789B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113887613A (zh) * 2021-09-29 2022-01-04 平安银行股份有限公司 基于注意力机制的深度学习方法、装置、设备及存储介质
CN116578781A (zh) * 2023-04-28 2023-08-11 北京天译科技有限公司 应用神经网络算法的气象服务推送方法及服务器

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611785A (zh) * 2011-01-20 2012-07-25 北京邮电大学 面向手机的移动用户个性化新闻主动推荐服务***及方法
EP2518679A1 (en) * 2011-04-26 2012-10-31 YooChoose GmbH Method and system fo recommending geo-tagged items
CN103064924A (zh) * 2012-12-17 2013-04-24 浙江鸿程计算机***有限公司 一种基于地理标注照片挖掘的旅游地点情境化推荐方法
CN108664564A (zh) * 2018-04-13 2018-10-16 东华大学 一种基于物品内容特征的改进协同过滤推荐方法
CN108874914A (zh) * 2018-05-29 2018-11-23 吉林大学 一种基于图卷积与神经协同过滤的信息推荐方法
CN109635200A (zh) * 2018-12-18 2019-04-16 南京邮电大学 一种基于mmtd和用户的协同过滤推荐算法
CN110191171A (zh) * 2019-05-27 2019-08-30 北京气象在线科技有限公司 气象信息传播方法
CN110490717A (zh) * 2019-09-05 2019-11-22 齐鲁工业大学 基于用户会话及图卷积神经网络的商品推荐方法及***
CN110580314A (zh) * 2019-07-16 2019-12-17 华南师范大学 基于图卷积神经网络和动态权重的课程推荐方法和***
CN112417294A (zh) * 2020-12-03 2021-02-26 广州瀚信通信科技股份有限公司 一种基于神经网络挖掘模型的业务智能推荐方法
CN112559764A (zh) * 2020-12-10 2021-03-26 北京中视广信科技有限公司 一种基于领域知识图谱的内容推荐方法
CN112612973A (zh) * 2020-12-31 2021-04-06 重庆邮电大学 结合知识图谱的个性化智能服装搭配推荐方法
CN112667346A (zh) * 2021-03-16 2021-04-16 深圳市火乐科技发展有限公司 天气数据展示方法、装置、电子设备及存储介质
CN112883175A (zh) * 2021-02-10 2021-06-01 武汉大学 结合预训练模型及模板生成的气象服务交互方法及***
CN112927801A (zh) * 2021-01-24 2021-06-08 武汉东湖大数据交易中心股份有限公司 一种基于穿衣气象指数的健康预测模型的构建方法及装置
CN112966091A (zh) * 2019-12-12 2021-06-15 复旦大学 一种融合实体信息与热度的知识图谱推荐***

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611785A (zh) * 2011-01-20 2012-07-25 北京邮电大学 面向手机的移动用户个性化新闻主动推荐服务***及方法
EP2518679A1 (en) * 2011-04-26 2012-10-31 YooChoose GmbH Method and system fo recommending geo-tagged items
CN103064924A (zh) * 2012-12-17 2013-04-24 浙江鸿程计算机***有限公司 一种基于地理标注照片挖掘的旅游地点情境化推荐方法
CN108664564A (zh) * 2018-04-13 2018-10-16 东华大学 一种基于物品内容特征的改进协同过滤推荐方法
CN108874914A (zh) * 2018-05-29 2018-11-23 吉林大学 一种基于图卷积与神经协同过滤的信息推荐方法
CN109635200A (zh) * 2018-12-18 2019-04-16 南京邮电大学 一种基于mmtd和用户的协同过滤推荐算法
CN110191171A (zh) * 2019-05-27 2019-08-30 北京气象在线科技有限公司 气象信息传播方法
CN110580314A (zh) * 2019-07-16 2019-12-17 华南师范大学 基于图卷积神经网络和动态权重的课程推荐方法和***
CN110490717A (zh) * 2019-09-05 2019-11-22 齐鲁工业大学 基于用户会话及图卷积神经网络的商品推荐方法及***
CN112966091A (zh) * 2019-12-12 2021-06-15 复旦大学 一种融合实体信息与热度的知识图谱推荐***
CN112417294A (zh) * 2020-12-03 2021-02-26 广州瀚信通信科技股份有限公司 一种基于神经网络挖掘模型的业务智能推荐方法
CN112559764A (zh) * 2020-12-10 2021-03-26 北京中视广信科技有限公司 一种基于领域知识图谱的内容推荐方法
CN112612973A (zh) * 2020-12-31 2021-04-06 重庆邮电大学 结合知识图谱的个性化智能服装搭配推荐方法
CN112927801A (zh) * 2021-01-24 2021-06-08 武汉东湖大数据交易中心股份有限公司 一种基于穿衣气象指数的健康预测模型的构建方法及装置
CN112883175A (zh) * 2021-02-10 2021-06-01 武汉大学 结合预训练模型及模板生成的气象服务交互方法及***
CN112667346A (zh) * 2021-03-16 2021-04-16 深圳市火乐科技发展有限公司 天气数据展示方法、装置、电子设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
WANG TONGXUAN等: ""Integrating knowledge graph into deep neural network-based recommender system"", 《2019 4TH IEEE INTERNATIONAL CONFERENCE ON CYBERNETICS (CYBCONF)》 *
常亮 等: ""知识图谱的推荐***综述"", 《智能***学报》 *
梅钰 等: ""气象文本推荐研究"", 《计算机应用与软件》 *
陈曦 等: ""融合知识图谱和协同过滤的学生成绩预测方法"", 《计算机应用》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113887613A (zh) * 2021-09-29 2022-01-04 平安银行股份有限公司 基于注意力机制的深度学习方法、装置、设备及存储介质
CN116578781A (zh) * 2023-04-28 2023-08-11 北京天译科技有限公司 应用神经网络算法的气象服务推送方法及服务器
CN116578781B (zh) * 2023-04-28 2023-10-24 北京天译科技有限公司 应用神经网络算法的气象服务推送方法及服务器

Also Published As

Publication number Publication date
CN113254789B (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
CN107944986B (zh) 一种o2o商品推荐方法、***及设备
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN110750640B (zh) 基于神经网络模型的文本数据分类方法、装置及存储介质
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
CN113254789B (zh) 一种推送气象服务内容的方法及装置
CN111259173B (zh) 一种搜索信息推荐方法及装置
CN106096609B (zh) 一种基于ocr的商品查询关键字自动生成方法
CN112966091B (zh) 一种融合实体信息与热度的知识图谱推荐***
CN101223525A (zh) 关系网络
CN109918563A (zh) 一种基于公开数据的图书推荐的方法
CN111353044B (zh) 一种基于评论的情感分析方法及***
KR101224312B1 (ko) 소셜 네트워킹 서비스 사용자를 위한 친구 추천 방법, 이를 위한 기록 매체 및 이를 이용하는 소셜 네트워킹 서비스 및 서버
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
Islam et al. Review analysis of ride-sharing applications using machine learning approaches: Bangladesh perspective
Kang et al. A hybrid approach for paper recommendation
US10521727B2 (en) System, method, and storage medium for generating hypotheses in data sets
CN115641179A (zh) 信息推送方法、装置及电子设备
Singgalen Comparative analysis of decision tree and support vector machine algorithm in sentiment classification for birds of paradise content
Wang et al. Understanding the spatial dimension of natural language by measuring the spatial semantic similarity of words through a scalable geospatial context window
CN115409630B (zh) 一种基于混合推荐算法的保险产品精准推荐方法
CN114153965A (zh) 一种结合内容和图谱的舆情事件推荐方法、***及终端
CN109711651B (zh) 一种带修正向量的隐含因子模型威客任务推荐方法
CN113763084A (zh) 产品推荐的处理方法、装置、设备及存储介质
CN111611455A (zh) 一种微博热点话题下基于用户情感行为特征的用户群体划分方法
Pratama et al. Tourism recommendation system using weighted hybrid method in Bali Island

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant