CN113421172B - 一种政策信息推送方法及装置 - Google Patents

一种政策信息推送方法及装置 Download PDF

Info

Publication number
CN113421172B
CN113421172B CN202110776594.5A CN202110776594A CN113421172B CN 113421172 B CN113421172 B CN 113421172B CN 202110776594 A CN202110776594 A CN 202110776594A CN 113421172 B CN113421172 B CN 113421172B
Authority
CN
China
Prior art keywords
policy
enterprise
portrait
calculating
scoring matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110776594.5A
Other languages
English (en)
Other versions
CN113421172A (zh
Inventor
张美跃
周业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hengruitong Fujian Information Technology Co ltd
Original Assignee
Hengruitong Fujian Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hengruitong Fujian Information Technology Co ltd filed Critical Hengruitong Fujian Information Technology Co ltd
Priority to CN202110776594.5A priority Critical patent/CN113421172B/zh
Publication of CN113421172A publication Critical patent/CN113421172A/zh
Application granted granted Critical
Publication of CN113421172B publication Critical patent/CN113421172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供的一种政策信息推送方法及装置,通过根据政策数据生成政策画像,并根据所述政策画像计算得到相似矩阵;获取企业数据计算评分矩阵,并根据所述评分矩阵生成相应的企业画像;根据所述相似矩阵和企业画像进行政策信息推送,通过自动生成的政策画像和企业画像,无需人工介入,减少人工成本,提高了政策推送的准确性,通过相似矩阵得到热门推荐集合,保证了当前推荐的内容符合时下热点方向,且不会遗漏热点政策,全面性高,基于用户与基于物品的协同过滤模型计算得到企业的政策推荐集合,能更好反映企业的兴趣点所在,通过评分矩阵,克服了传统点击率预估中只依赖点击事件的问题,从而能够更好契合政策推荐的场景。

Description

一种政策信息推送方法及装置
技术领域
本发明涉及计算机应用技术领域,特别涉及一种政策信息推送方法及装置。
背景技术
政策信息服务作为云产业园项目各类园区服务中关键的一环,为园区入驻企业提供政策信息的检索、推送、匹配与订阅等便捷服务。在已有的政策信息服务中,通常通过园区的平台管理员根据以往的专家经验,手工设定政策分类标签库。当有新企业入驻园区时,企业管理员根据企业的经营范围在政策分类标签库中选择感兴趣的政策标签。当有新的惠企政策下发的时候,同样由平台管理员对新的惠企政策使用政策分类标签库进行政策的分类。平台通过匹配企业兴趣标签与政策的分类标签,对企业进行相关惠企政策的推送,企业根据推送的信息进行相应的政策申报。通过惠企政策的推送,保证入驻企业可以实时获取最新的,适宜的政策信息,增加了企业获取政策信息的渠道,并通过惠企政策获得相应的税收减免、人才优惠等各类补助,减少企业经营上的资金压力,保证企业的良性发展,然而传统的政策推送存在如下缺点:
缺点1:新政策下发的时候需要人工进行政策标签的分类与标注,加大了平台管理员的工作量,且政策的标签分类以经验为主,在准确性上也无法保证。
缺点2:入驻园区的企业在进行政策订阅的时候通过手工设置兴趣标签的形式进行订阅,无法挖掘企业实际的兴趣点。
缺点3:针对企业政策进行匹配的过程中,简单使用同类标签进行企业与政策的匹配,匹配效果不理想。
缺点4:每一年政策的关注点变化是比较大的,固定的企业兴趣标签无法挖掘当下的热点政策。
因此,需要一种政策信息推送方法及装置,能够提高政策推送的准确性和全面性。
发明内容
(一)要解决的技术问题
为了解决现有技术的上述问题,本发明提供一种政策信息推送方法及装置,能够提高政策推送的准确性和全面性。
(二)技术方案
为了达到上述目的,本发明采用的一种技术方案为:
一种政策信息推送方法,包括步骤:
S1、根据政策数据生成政策画像,并根据所述政策画像计算得到相似矩阵;
S2、获取企业数据计算评分矩阵,并根据所述评分矩阵生成相应的企业画像;
S3、根据所述相似矩阵和企业画像进行政策信息推送。
为了达到上述目的,本发明采用的另一种技术方案为:
一种政策信息推送装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
S1、根据政策数据生成政策画像,并根据所述政策画像计算得到相似矩阵;
S2、获取企业数据计算评分矩阵,并根据所述评分矩阵生成相应的企业画像;
S3、根据所述相似矩阵和企业画像进行政策信息推送。
(三)有益效果
本发明的有益效果在于:通过根据政策数据生成政策画像,并根据所述政策画像计算得到相似矩阵;获取企业数据计算评分矩阵,并根据所述评分矩阵生成相应的企业画像;根据所述相似矩阵和企业画像进行政策信息推送,通过自动生成的政策画像和企业画像,无需人工介入,减少人工成本,提高了政策推送的准确性,通过相似矩阵得到热门推荐集合,保证了当前推荐的内容符合时下热点方向,且不会遗漏热点政策,全面性高,基于用户与基于物品的协同过滤模型计算得到企业的政策推荐集合,能更好反映企业的兴趣点所在,通过评分矩阵,克服了传统点击率预估中只依赖点击事件的问题,从而能够更好契合政策推荐的场景。
附图说明
图1为本发明实施例的政策信息推送方法流程图;
图2为本发明实施例的政策信息推送装置的整体结构示意图;
图3为本发明实施例的时间衰减函数。
【附图标记说明】
1:政策信息推送装置;
2:存储器;
3:处理器。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
请参照图1,一种政策信息推送方法,包括步骤:
S1、根据政策数据生成政策画像,并根据所述政策画像计算得到相似矩阵;
步骤S1具体为:
S11、对政策数据进行分词,并采用textrank与tfidf分别计算每个政策的关键词,得到基础向量模型和tifidf计算后产生的中间模型;
S12、将textrank与tfidf中均出现的关键词作为政策的主题词,并将关键词和主题词构建得到动态政策画像;
S13、根据所述中间模型通过word2vec模型对所述政策数据中的国标行业、政策类别、区域和实施部门进行训练,得到训练好的word2vec模型;
S14、根据所述动态政策画像和训练好的word2vec模型计算得到每个政策的词向量模型,并将词向量模型的平均词向量作为政策向量;
S15、两两计算所有政策向量的欧几里得距离作为不同政策间相似性,得到政策相似矩阵。
S2、获取企业数据计算评分矩阵,并根据所述评分矩阵生成相应的企业画像;
步骤S2中计算评分矩阵具体为:
根据企业数据中的政策点击、政策阅读、政策附件下载和政策申请数据计算评分矩阵。
步骤S2中根据所述评分矩阵生成企业画像具体为:
根据所述评分矩阵通过基于用户与基于物品的协同过滤模型计算得到企业的政策推荐集合;
根据所述政策推荐集合和动态政策画像,关联计算得到每个企业已推荐政策结合的关键词和主题词,并将其作为企业画像。
S3、根据所述相似矩阵和企业画像进行政策信息推送。
步骤S3具体为:
S31、根据所述评分矩阵计算得到热门推荐集合;
S32、根据所述政策推荐集合、热门推荐集合以及通过时间倒序获取最新的政策信息集合进行合并,得到合并后的推荐集合;
S33、将所述合并后的推荐集合、相似矩阵和企业画像进行政策信息推送。
实施例二
本实施例和实施例一的区别在于,本实施例将结合具体的应用场景进一步说明本发明上述政策信息推送方法是如何实现的:
1、大数据基础平台搭建步骤,主要采用Cloudera的CDP平台进行大数据集群的部署,集群包括三台服务器,主要部署的产品服务有Hadoop、Hive、Hbase、Spark、Sqoop以及Kafka。大数据集群作为基础服务平台,主要为后续的各类数据处理、模型训练提供底层。
2、企业行为数据埋点设计与采集步骤,企业画像中的动态画像需要进行数据的采集,采集主要包括以下几类事件:政策点击、政策阅读、政策附件下载、政策申请和政策推荐数据。采集的数据存入大数据集群Hive中,为后续分析做准备
3、根据政策数据生成政策画像,并根据所述政策画像计算得到相似矩阵,具体为:
3.1、对政策数据进行分词,并采用textrank与tfidf分别计算每个政策的关键词,得到基础向量模型和tifidf计算后产生的中间模型,tifidf计算后产生的中间模型存储在HDFS中;
3.2、将textrank与tfidf中均出现的关键词作为政策的主题词,并将关键词和主题词构建得到动态政策画像,动态政策画像存储于Hive中;
3.3、根据所述中间模型通过word2vec模型对所述政策数据中的国标行业、政策类别、区域和实施部门进行训练,得到训练好的word2vec模型;
3.4、根据所述动态政策画像和训练好的word2vec模型计算得到每个政策的词向量模型,并将词向量模型的平均词向量作为政策向量;
3.5、两两计算所有政策向量的欧几里得距离作为不同政策间相似性,得到政策相似矩阵,并保留每个政策相似性最高的20个存储在Hbase中。
4、获取企业数据计算评分矩阵,并根据所述评分矩阵生成相应的企业画像;
步骤4中计算评分矩阵具体为:
根据企业数据中的政策点击、政策阅读、政策附件下载和政策申请数据计算评分矩阵。
具体地,由于没有历史数据进行监督训练无法进行关键特征与权重的选取,这里采用专家经验进行设置,政策点击事件为1分,政策阅读(阅读时间大于阙值)事件为2分,下载事件为4分,申请事件为8分,每篇政策保留最后一次该事件的操作时间。考虑到距离当下越早的事件得分应该月底,这里增加一个关于日期的时间衰减函数1/(log(t+1)+1),t为当前日期与事件日期的差值,将计算得出的分数乘以该衰减函数得到最终的企业-政策评分矩阵,并存储在Hbase中。整体评分公式为:时间衰减函数*(是否有下载*下载事件权重+是否有点击*点击事件权重+是否有申请*申请事件权重+是否有阅读*阅读事件权重)。时间衰减函数如图3,横轴为日期差,纵轴为衰减系数,可以看出当天不衰减,当间隔日期增加后基本也保留在0.4-0.5之间。
步骤4中根据所述评分矩阵生成企业画像具体为:
根据所述评分矩阵通过基于用户与基于物品的协同过滤模型计算得到企业的政策推荐集合,并保留20个存储在Hbase中;
根据所述政策推荐集合和动态政策画像,关联计算得到每个企业已推荐政策结合的关键词和主题词,并将其作为企业画像存储在Hbase中。
5、根据所述相似矩阵和企业画像进行政策信息推送。
步骤5具体为:
5.1、根据所述评分矩阵计算得到热门推荐集合,取总得分最高的30个政策信息作为当前热门政策存储至Redis中;
5.2、根据所述政策推荐集合、热门推荐集合以及通过时间倒序获取最新的政策信息集合进行合并,得到合并后的推荐集合;
5.3、将所述合并后的推荐集合、相似矩阵和企业画像进行政策信息推送。
实施例三
请参照图2,一种政策信息推送装置1,包括存储器2、处理器3及存储在存储器2上并可在处理器3上运行的计算机程序,所述处理器3执行所述程序时实现实施例一中的各个步骤。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (4)

1.一种政策信息推送方法,其特征在于,包括步骤:
S1、根据政策数据生成政策画像,并根据所述政策画像计算得到相似矩阵;
S2、获取企业数据计算评分矩阵,并根据所述评分矩阵生成相应的企业画像;
S3、根据所述相似矩阵和企业画像进行政策信息推送;
步骤S1具体为:
S11、对政策数据进行分词,并采用textrank与tfidf分别计算每个政策的关键词,得到基础向量模型和tifidf计算后产生的中间模型;
S12、将textrank与tfidf中均出现的关键词作为政策的主题词,并将关键词和主题词构建得到动态政策画像;
S13、根据所述中间模型通过word2vec模型对所述政策数据中的国标行业、政策类别、区域和实施部门进行训练,得到训练好的word2vec模型;
S14、根据所述动态政策画像和训练好的word2vec模型计算得到每个政策的词向量模型,并将词向量模型的平均词向量作为政策向量;
S15、两两计算所有政策向量的欧几里得距离作为不同政策间相似性,得到政策相似矩阵;
步骤S2中计算评分矩阵具体为:
根据企业数据中的政策点击、政策阅读、政策附件下载和政策申请数据计算评分矩阵;
步骤S2中根据所述评分矩阵生成企业画像具体为:
根据所述评分矩阵通过基于用户与基于物品的协同过滤模型计算得到企业的政策推荐集合;
根据所述政策推荐集合和动态政策画像,关联计算得到每个企业已推荐政策结合的关键词和主题词,并将其作为企业画像。
2.根据权利要求1所述的政策信息推送方法,其特征在于,步骤S3具体为:
S31、根据所述评分矩阵计算得到热门推荐集合;
S32、根据所述政策推荐集合、热门推荐集合以及通过时间倒序获取最新的政策信息集合进行合并,得到合并后的推荐集合;
S33、将所述合并后的推荐集合、相似矩阵和企业画像进行政策信息推送。
3.一种政策信息推送装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
S1、根据政策数据生成政策画像,并根据所述政策画像计算得到相似矩阵;
S2、获取企业数据计算评分矩阵,并根据所述评分矩阵生成相应的企业画像;
S3、根据所述相似矩阵和企业画像进行政策信息推送;
步骤S1具体为:
S11、对政策数据进行分词,并采用textrank与tfidf分别计算每个政策的关键词,得到基础向量模型和tifidf计算后产生的中间模型;
S12、将textrank与tfidf中均出现的关键词作为政策的主题词,并将关键词和主题词构建得到动态政策画像;
S13、根据所述中间模型通过word2vec模型对所述政策数据中的国标行业、政策类别、区域和实施部门进行训练,得到训练好的word2vec模型;
S14、根据所述动态政策画像和训练好的word2vec模型计算得到每个政策的词向量模型,并将词向量模型的平均词向量作为政策向量;
S15、两两计算所有政策向量的欧几里得距离作为不同政策间相似性,得到政策相似矩阵;步骤S2中计算评分矩阵具体为:
根据企业数据中的政策点击、政策阅读、政策附件下载和政策申请数据计算评分矩阵;
步骤S2中根据所述评分矩阵生成企业画像具体为:
根据所述评分矩阵通过基于用户与基于物品的协同过滤模型计算得到企业的政策推荐集合;
根据所述政策推荐集合和动态政策画像,关联计算得到每个企业已推荐政策结合的关键词和主题词,并将其作为企业画像。
4.根据权利要求3所述的政策信息推送装置,其特征在于,步骤S3具体为:
S31、根据所述评分矩阵计算得到热门推荐集合;
S32、根据所述政策推荐集合、热门推荐集合以及通过时间倒序获取最新的政策信息集合进行合并,得到合并后的推荐集合;
S33、将所述合并后的推荐集合、相似矩阵和企业画像进行政策信息推送。
CN202110776594.5A 2021-07-09 2021-07-09 一种政策信息推送方法及装置 Active CN113421172B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110776594.5A CN113421172B (zh) 2021-07-09 2021-07-09 一种政策信息推送方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110776594.5A CN113421172B (zh) 2021-07-09 2021-07-09 一种政策信息推送方法及装置

Publications (2)

Publication Number Publication Date
CN113421172A CN113421172A (zh) 2021-09-21
CN113421172B true CN113421172B (zh) 2022-04-05

Family

ID=77720720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110776594.5A Active CN113421172B (zh) 2021-07-09 2021-07-09 一种政策信息推送方法及装置

Country Status (1)

Country Link
CN (1) CN113421172B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116842272B (zh) * 2023-08-29 2023-11-03 四川邕合科技有限公司 政策信息推送方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532431A (zh) * 2019-07-23 2019-12-03 平安科技(深圳)有限公司 短视频关键词提取方法、装置及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197211A (zh) * 2017-12-28 2018-06-22 百度在线网络技术(北京)有限公司 一种信息推荐方法、装置、服务器和存储介质
CN109447762B (zh) * 2018-11-12 2022-06-10 深圳市喂车科技有限公司 商品推荐方法及其装置、服务器、商品推荐***
CN111815421B (zh) * 2019-04-09 2024-03-01 百度在线网络技术(北京)有限公司 税务政策处理方法、装置、终端设备及存储介质
CN111899075A (zh) * 2020-08-11 2020-11-06 恒瑞通(福建)信息技术有限公司 一种基于用户行为的个性化商品推荐方法及装置
CN112184525B (zh) * 2020-09-28 2021-11-26 上海市浦东新区行政服务中心(上海市浦东新区市民中心) 通过自然语义分析实现智能匹配推荐的***及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532431A (zh) * 2019-07-23 2019-12-03 平安科技(深圳)有限公司 短视频关键词提取方法、装置及存储介质

Also Published As

Publication number Publication date
CN113421172A (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN107229708B (zh) 一种个性化出行服务大数据应用***及方法
CN102483745B (zh) 共同选择图像分类
CN103886067B (zh) 使用标签隐含主题进行图书推荐的方法
WO2016054908A1 (zh) 基于物联网大数据平台的智能用户画像方法及装置
CN105160545B (zh) 投放信息样式确定方法及装置
CN108446964B (zh) 一种基于移动流量dpi数据的用户推荐方法
WO2020254890A1 (en) Cognitive video and audio search aggregation
EP3989158A1 (en) Method, apparatus and device for video similarity detection
CN109389423A (zh) 一种基于大数据融合商业的营销使用方法
CN108549909B (zh) 基于众包的对象分类方法及对象分类***
CN113657087B (zh) 信息的匹配方法及装置
CN108804577B (zh) 一种资讯标签兴趣度的预估方法
CN105183739B (zh) 图像处理方法
CN114936301B (zh) 智能家居建材数据的管理方法、装置、设备及存储介质
US20230004595A1 (en) Image retrieval method, image retrieval devices, image retrieval system and image display system
CN110688565A (zh) 基于多维霍克斯过程和注意力机制的下一个物品推荐方法
CN113421172B (zh) 一种政策信息推送方法及装置
CN112989213A (zh) 内容推荐方法、装置、***、电子设备及存储介质
CN110110218A (zh) 一种身份关联方法及终端
CN112330426A (zh) 一种产品推荐方法、装置及存储介质
CN115439770A (zh) 一种内容召回方法、装置、设备及存储介质
CN109146606A (zh) 一种品牌推荐方法、电子设备、存储介质及***
CN112182414A (zh) 文章推荐方法、装置及电子设备
CN116823410A (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
CN112115354A (zh) 信息处理方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant