CN115659008B - 大数据信息反馈的信息推送***、方法、电子设备及介质 - Google Patents
大数据信息反馈的信息推送***、方法、电子设备及介质 Download PDFInfo
- Publication number
- CN115659008B CN115659008B CN202211179493.0A CN202211179493A CN115659008B CN 115659008 B CN115659008 B CN 115659008B CN 202211179493 A CN202211179493 A CN 202211179493A CN 115659008 B CN115659008 B CN 115659008B
- Authority
- CN
- China
- Prior art keywords
- message
- interest
- keywords
- user
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013528 artificial neural network Methods 0.000 claims abstract description 25
- 238000004458 analytical method Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 98
- 230000006399 behavior Effects 0.000 claims description 68
- 230000015654 memory Effects 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 10
- 230000006403 short-term memory Effects 0.000 claims description 5
- 230000007787 long-term memory Effects 0.000 claims description 4
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 229940004975 interceptor Drugs 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术,揭露一种大数据信息反馈的信息推送***、方法、电子设备及介质。该***中包括画像生成模块、意图识别模块、关键词提取模块、消息推送模块及智能分析模块,可根据用户的基本属性特征生成用户画像,并确定用户在业务页面的操作意图;提取用户的兴趣特征的兴趣关键词,计算兴趣关键词与消息库中各消息的消息关键词的相似度,选取相似度大于阈值时,将消息关键词对应的消息推送至用户;同时,根据基本行为特征和消息关键词输入信息推送预测神经网络中,根据预测关键词对基本属性特征进行更新。本发明可以提高进行信息推送时的准确性。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种大数据信息反馈的信息推送***、方法、电子设备及介质。
背景技术
随着互联网的蓬勃发展,大部分智能终端的应用程序都提供了消息推送功能,如新闻客户端的热点新闻推荐、产品促销信息等。现有的信息推送方案中是通过人工标记列表规则获取信息推送的特点,从而基于这些特点为向用户终端推送符合其喜好的业务。
但现有的信息推送方案通过人工标记方式得到的用户喜好兴趣画像往往不太精准,容易导致后续信息推送过程中,用户对推送信息兴趣缺乏,用户兴趣与推送信息匹配度较低,导致进行信息推送时的准确性较低。
发明内容
本发明提供一种大数据信息反馈的信息推送***、方法、电子设备及计算机可读存储介质,其主要目的在于解决进行信息推送时的准确性较低的问题。
为实现上述目的,本发明提供的大数据信息反馈的信息推送***,其特征在于,所述***包括画像生成模块、意图识别模块、关键词提取模块、消息推送模块及智能分析模块,其中,
所述画像生成模块,用于获取目标用户的基本属性特征,根据所述基本属性特征生成用户画像,其中所述根据所述基本属性特征生成用户画像,具体用于:
对所述属性特征进行核心语义提取,得到属性特征语义;
利用如下特征频率公式的计算所述属性特征语义的属性特征频率:
其中,f为所述属性特征频率,kw(kit)为所述属性特征语义kt在第i篇属性文档中出现的次数,dw(kt)为出现所述属性特征语义kt的属性文档数,N为属性文档的全部数量,log为对数函数;
选取所述属性特征频率最高的预设数量的属性特征语义为用户标签;
根据所述用户标签生成所述目标用户的用户画像;
所述意图识别模块,用于提取所述用户画像的基本行为特征,根据所述基本行为特征确定所述目标用户在预设业务页面的页面操作意图;
所述关键词提取模块,用于根据所述页面操作意图生成所述目标用户在业务页面的兴趣特征,提取所述兴趣特征的兴趣关键词;
所述消息推送模块,用于计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度,并将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户;
所述智能分析模块,用于将所述基本行为特征和所述消息关键词输入至预设的信息推送预测神经网络中,得到信息推送预测数据,提取所述信息推送预测数据中的预测关键词,按照所述预测关键词对所述目标用户进行分类,并根据所述分类结果对所述基本属性特征进行更新。
可选地,所述根据所述基本行为特征确定所述目标用户在预设业务页面的页面操作意图时,具体用于:
根据所述基本行为特征确定所述目标用户在业务页面的操作区域;
利用如下的时长公式计算所述目标用户在每个所述操作区域的浏览时长:
其中,T(ωk)为第k个所述操作区域的所述浏览时长,Size(ωi)为第i个所述操作区域的页面大小,Speed(ωi)为对第i个所述操作区域的浏览速度,ωi为紧跟操作区域ωk的下一个操作区域,为第k个所述操作区域的请求时长;
根据所述浏览时长确定所述目标用户的页面操作意图。
可选地,所述提取所述兴趣特征的兴趣关键词时,具体用于:
对所述兴趣特征进行类别划分,得到兴趣特征类别;
对所述兴趣特征类别进行向量转换,得到兴趣向量;
利用如下的权重算法计算所述兴趣向量的兴趣权重:
其中,w(k,t)表示所述兴趣向量t在所述兴趣特征类别k中的兴趣权重,表示所述兴趣向量,kh(k,t)表示所述兴趣特征类别在所述兴趣特征中的频率,N为所述兴趣向量中兴趣特征类别的数量,nk为所述兴趣向量中包含兴趣特征类别k的数量,log为对数函数;
选取所述兴趣权重最大的兴趣向量为所述兴趣关键词。
可选地,所述计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度时,具体用于:
对所述兴趣关键词进行向量转换,得到第一向量;
对所述消息关键词进行向量转换,得到第二向量;
利用如下的相似度公式逐一计算所述第一向量与所述第二向量的相似度:
其中,S(S1,S2)为所述第一向量与所述第二向量的相似度,T1i为所述第一向量中第i个特征项的权值,T2i为所述第二向量中第i个特征项的权值,n为特征项的数量。
可选地,所述将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户时,具体用于:
获取消息推送的推送请求;
将所述相似度大于预设阈值的消息关键词对应的消息推送封装成消息数据包;
根据所述推送请求将所述消息数据包推送至所述目标用户。
可选地,所述将所述基本行为特征和所述消息关键词输入至预设的信息推送预测神经网络中,得到信息推送预测数据时,具体用于:
将所述基本行为特征向量化,得到行为向量,将所述消息关键词向量化,得到消息向量;
将所述行为向量及所述消息向量进行叠加,得到叠加向量;
将所述叠加向量输入至所述信息推送预测神经网络的长短期记忆网络中;
在所述长短期记忆网络中提取信息推送特征值、时间标记值;
将所述信息推送特征值及所述时间标记值输入至所述信息推送预测神经网络的全连接网络中,输出所述信息推送预测数据。
可选地,所述根据所述分类结果对所述基本属性特征进行更新时,具体用于:
利用预设的层次分析法确定所述分类结果的分类权重;
选取所述分类权重最大的分类结果对应的预测关键词对所述基本属性特征进行更新。
为了解决上述问题,本发明还提供一种大数据信息反馈的信息推送***的运行方法,所述方法包括:
获取目标用户的基本属性特征,根据所述基本属性特征生成用户画像;
提取所述用户画像的基本行为特征,根据所述基本行为特征确定所述目标用户在预设业务页面的页面操作意图;
根据所述页面操作意图生成所述目标用户在业务页面的兴趣特征,提取所述兴趣特征的兴趣关键词;
计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度,并将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户;
将所述基本行为特征和所述消息关键词输入至预设的信息推送预测神经网络中,得到信息推送预测数据,提取所述信息推送预测数据中的预测关键词,按照所述预测关键词对所述目标用户进行分类,并根据所述分类结果对所述基本属性特征进行更新。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的大数据信息反馈的信息推送***的运行方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的大数据信息反馈的信息推送***的运行方法。
本发明实施例通过用户的基本属性特征生成用户画像,根据用户画像可以更简单方便了解用户的属性特征和行为特征;进而根据行为特征可以确定用户在业务页面的页面操作意图,实现对用户兴趣特征的掌握;进一步计算兴趣特征的兴趣关键词和消息库中各消息的消息关键词的相似度,从而选取相似度大于阈值的消息关键词对应的消息推送至用户,使对用户进行信息推送的消息能满足用户对于信息的需求,提高用户在业务页面获取相关信息的效率;将行为特征和消息关键词输入至信息推送预测神经网络中,可以得到信息推送预测数据,提取信息推送预测数据的预测关键词,根据预测关键词对用户进行分类,可以实现在信息推送时根据分类结果的不同,可以向用户推送不同的消息,提高用户在业务页面的体验感;根据分类结果对基本属性特征进行更新,便于用户对感兴趣的业务页面发生变化时,可以准确的分析出用户的兴趣,进而可以更准确的分析出用户的意图,从而提高用户推送信息的准确性。因此本发明提出的大数据信息反馈的信息推送***、方法,可以解决进行信息推送时的准确性较低的问题。
附图说明
图1为本发明一实施例提供的大数据信息反馈的信息推送***的功能模块图;
图2为本发明一实施例提供的大数据信息反馈的信息推送***的运行方法的流程示意图;
图3为本发明一实施例提供的实现所述大数据信息反馈的信息推送***的运行方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
实际上,大数据信息反馈的信息推送***所部署的服务端设备可能是由一台或多台设备构成的。上述大数据信息反馈的信息推送***可以实现为:业务实例、虚拟机、硬件设备。比如,该大数据信息反馈的信息推送***可以实现为部署在云节点中的一个或多个设备上的一种业务实例。简单来说,该大数据信息反馈的信息推送***可以理解为是部署在云节点上的一种软件,用于为各用户端提供大数据信息反馈的信息推送***。或者,该大数据信息反馈的信息推送***也可以实现为部署在云节点中的一个或多个设备上的一种虚拟机。该虚拟机中安装有用于管理各用户端的应用软件。或者,该大数据信息反馈的信息推送***还可以实现为由众多相同或不同类型的硬件设备构成的服务端,设置一个或多个硬件设备用于为各用户端提供大数据信息反馈的信息推送***。
在实现形式上,大数据信息反馈的信息推送***和用户端相互适应。即大数据信息反馈的信息推送***作为安装于云服务平台的应用,则用户端作为与该应用建立通信连接的客户端;或实现大数据信息反馈的信息推送***作为网站实现,则用户端作为网页实现;再或实现大数据信息反馈的信息推送***作为云服务平台实现,则用户端作为即时通信应用中的小程序实现。
参照图1所示,是本发明一实施例提供的大数据信息反馈的信息推送***的功能模块图。
本发明所述大数据信息反馈的信息推送***100可以设置于云端服务器中,在实现形式上,可以作为一个或多个服务设备,也可以作为一应用安装于云端(例如移动服务运营方的服务器、服务器集群等)上,或者也可以开发为网站。根据实现的功能,所述大数据信息反馈的信息推送***100可以包括画像生成模块101、意图识别模块102、关键词提取模块103、消息推送模块104及智能分析模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
本发明实施例中,大数据信息反馈的信息推送***中,上述各个模块均可独立实现,且与其他模块调用。这里的调用可以理解为,某一模块可以连接另一类型的多个模块,并为其连接的多个模块提供相应服务。比如,分享评测模块可以调用同一信息采集模块,以获取该信息采集模块采集的信息基于上述特性,本发明实施例提供的大数据信息反馈的信息推送***中,无需修改程序代码,即可通过增加模块、并直接调用的形式来调整大数据信息反馈的信息推送***架构的适用范围,实现集群式水平拓展,以便达到快捷灵活拓展大数据信息反馈的信息推送***的目的。实际应用中,上述模块可以设置在同一设备或不同设备中,也可以是设置在虚拟设备中,例如云端服务器中的服务实例。
下面结合具体实施例,分别针对大数据信息反馈的信息推送***的各个组成部分以及具体工作流程进行说明:
所述画像生成模块101,用于获取目标用户的基本属性特征,根据所述基本属性特征生成用户画像。
本发明实施例中,所述基本属性特征包括目标用户的姓名、性别、年龄、职业、教育、住址、兴趣爱好等所述目标用户的相关数据信息特征。
详细地,可利用具有数据抓取功能的计算机语句(如java语句、python语句等)从预先确定的存储区域抓取存储的基本属性特征,所述存储区域包括但不限于数据库、区块链节点、网络缓存。
进一步地,为了实现对目标用户进行信息的推送,可对获取的所述基本属性特征进行分析,以根据所述基本属性特征生成与所述目标用户相对应的用户画像。
本发明实施例中,所述画像生成模块101在根据所述基本属性特征生成用户画像时,具体用于:
对所述属性特征进行核心语义提取,得到属性特征语义;
利用如下特征频率公式的计算所述属性特征语义的属性特征频率:
其中,f为所述属性特征频率,kw(kit)为所述属性特征语义kt在第i篇属性文档中出现的次数,dw(kt)为出现所述属性特征语义kt的属性文档数,N为属性文档的全部数量,log为对数函数;
选取所述属性特征频率最高的预设数量的属性特征语义为用户标签;
根据所述用户标签生成所述目标用户的用户画像。
详细地,可预先构建的语义分析模型对所述目标信息进行核心语义提取,得到信息语义。其中所述语义分析模型包括但不限于NLP(Natural Language Processing,自然语言处理)模型、HMM(Hidden Markov Model,隐马尔科夫模型)。
例如,利用预先构建的语义分析模型对所述属性特征语义进行卷积、池化等操作,以提取该属性特征语义的低维特征表达,再将提取到的低维特表达征映射至预先构建的高维空间,得到该低维特征的高维特征表达,利用预设的激活函数对所述高维特征表达进行选择性地输出,得到属性特征语义。
具体地,根据所述特征频率公式计算所述属性特征语义的属性特征频率,根据属性特征频率归纳出用户的特征喜好。通常,一个词在历史数据中的出现次数,或在历史数据中使用该词的比例等均能体现用户的特征喜好程度,因此,基于所述特征频率公式计算属性特征频率,来选择能够代表目标用户的属性特征语义,即一个属性特征语义在属性文档中出现的频率越高,则此属性特征语义就能更接近用户的喜好,构建的用户画像更贴近用户自身。
进一步地,所述用户画像是以不同的数据维度对用户进行刻画,实际上通过不同的数据来源分析后给用户打上相应的能够让人理解的语义标签,通过标签来组成一个用户实体,因此生成用户画像的实质就是用户信息的标签化,标签化是对用户特征的符号表示。例如,基于用户的性别属性特征可以给用户打标签分为男人、女人;基于用户的职业属性特征可以给用户打标签分为学生、老师、白领等;基于用户的价值属性特征可以给用户打标签分为高价值、中价值及低价值用户。因此,标签是某一种用户特征的符号表示,用户画像可以用标签的集合来表示。
所述意图识别模块102,用于提取所述用户画像的基本行为特征,根据所述基本行为特征确定所述用户在预设业务页面的页面操作意图。
本发明实施例中,所述基本行为特征是用户一种动态画像,例如用户在旅游软件查询关于旅游的信息,则在预先构建的用户画像中会包括目标用户的基本行为特征,如基本消费行为特征包括吃、住、行、购物消费等,其中“吃”所涵盖的口味、环境、交通、服务、价格等基本行为特征。
详细地,可利用爬虫网络方法在相关网站或者手机软件的互联网消费记录和使用记录中提取所述用户画像的基本行为特征。
本发明实施例中,所述意图识别模块102在根据所述基本行为特征确定所述目标用户在预设业务页面的页面操作意图时,具体用于:
根据所述基本行为特征确定所述目标用户在业务页面的操作区域;
利用如下的时长公式计算所述目标用户在每个所述操作区域的浏览时长:
其中,T(ωk)为第k个所述操作区域的所述浏览时长,Size(ωi)为第i个所述操作区域的页面大小,Speed(ωi)为对第i个所述操作区域的浏览速度,ωi为紧跟操作区域ωk的下一个操作区域,为第k个所述操作区域的请求时长;
根据所述浏览时长确定所述目标用户的页面操作意图。
详细地,根据所述基本行为特征可以得知目标用户在业务页面可能进行的操作区域,例如,当用户的基本行为特征为浏览旅游业务页面,则目标用户在业务的操作区域为车票区域、景点区域、酒店区域、餐厅区域等。
具体地,所述时长公式中操作区域的浏览时长与很多因素有关,如用户的操作速度、用户的浏览速度、当前网络的传输延迟、服务器的相应延迟等,因此在计算目标用户在每个所述操作区域的浏览时长时,将每个操作区域的浏览时长定义为访问两次操作区域的时间差。可以保证更加准确的计算用户在操作区域的浏览时长。浏览速度表示单位时间内当前用户浏览的字节数,用户在操作区域的浏览速度越快,表示用户对此操作区域越不感兴趣。
进一步地,当用户在操作区域的浏览时间越长,表示用户对此操作区域就越感兴趣,用户的页面操作意图就在此操作区域中,如用户在旅游业务页面中的景点区域的浏览时长最长,则表示用户的页面操作意图主要是想获取相关景点的信息。
示例性地,当用户在浏览旅游软件的业务页面时,根据用户的消费行为提取用户的基本消费行为特征,确定与旅游相关的吃、住、行、游玩、购物及娱乐六大类,即用户会在旅游业务页面对车票区域、景点区域、酒店区域、餐厅区域等进行浏览,以获取相关旅游信息,但是用户在餐厅区域浏览的时间最长,则表示用户的页面操作意图是想要找到餐厅,因此会基于大数据获取到用户的口味指数对用户进行餐厅推荐,其中用户的口味指数是根据数据抓取到用户在历史点餐记录中相对频率较高的口味。
所述关键词提取模块103,用于根据所述页面操作意图生成所述目标用户在业务页面的兴趣特征,提取所述兴趣特征的兴趣关键词。
本发明其中一个实际应用场景中,用户对网页的兴趣度与其在该网页上的浏览行为密切相关,用户的很多浏览行为暗示出用户的喜好与兴趣,如查询、浏览页面、标记书签、反馈信息等。用户访问页面时的停留时间、访问次数、保存等动作同样表现用户的兴趣,即根据用户在业务页面的页面操作意图,可获知用户在页面中的对哪个操作区域感兴趣。
本发明实施例中,所述兴趣特征为目标用户在业务页面的浏览行为,即用户的浏览行为反映了用户的兴趣,用户对业务页面中的操作区域的浏览时间越长、频率越高,用户对此操作区域就越感兴趣。如当所述页面操作意图是想获取关于景点的相关信息,则可以确定目标用户在业务页面的兴趣特征是想对于景点区域进行浏览,即用户的兴趣特征是对于景点区域的浏览行为。
本发明实施例中,所述兴趣关键词是指能体现用户对于某一方面的兴趣,如用户的兴趣特征为对旅游业务页面中的景点进行浏览,则兴趣关键词为景点,就会给用户推荐相关景点信息,或用户的兴趣特征为对教育业务页面中的书籍进行浏览,则兴趣关键词为书籍,就会给用户推荐相关书籍信息。
本发明实施例中,所述关键词提取模块103在提取所述兴趣特征的兴趣关键词时,具体用于:
对所述兴趣特征进行类别划分,得到兴趣特征类别;
对所述兴趣特征类别进行向量转换,得到兴趣向量;
利用如下的权重算法计算所述兴趣向量的兴趣权重:
其中,w(k,t)表示所述兴趣向量t在所述兴趣特征类别k中的兴趣权重,表示所述兴趣向量,kh(k,t)表示所述兴趣特征类别在所述兴趣特征中的频率,N为所述兴趣向量中兴趣特征类别的数量,nk为所述兴趣向量中包含兴趣特征类别k的数量,log为对数函数;
选取所述兴趣权重最大的兴趣向量为所述兴趣关键词。
详细地,所述兴趣特征的类别包括景点、书籍、足球、食品等,将所述兴趣特征进行类别划分,可得到T={t1,t2,...,tn}的兴趣特征类别集合,可根据兴趣特征类别进一步计算每一个兴趣特征类别的兴趣权重,便于根据兴趣权重提取兴趣关键词。
具体地,可通过预设的向量转换模型对所述兴趣特征类别进行向量转换,得到兴趣向量,所述向量转换模型包括但不限于word2vec模型、Bert模型。
进一步地,所述兴趣向量中每个兴趣特征类别都对应一个兴趣权重,选取兴趣权重最大的兴趣特征类别为兴趣关键词,例如,所述兴趣特征类别为{景点,书籍,足球,食品},则经过向量转换,所述兴趣特征类别对应的兴趣向量为{t1,t2,t3,t4},则利用权重算法计算得到兴趣向量对应的兴趣权重为{0.635,0.634,0.521,0.472},则根据兴趣权重得知景点对应的兴趣权重为最大值,则所述兴趣特征的兴趣关键词为景点,即会给用户推荐景点的相关信息。
所述消息推送模块104,用于计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度,并将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户。
本发明实施例中,计算所述兴趣关键词与预设的的消息库中各消息的消息关键词的相似度,根据所述相似度可以判断用户对哪一类别的信息感兴趣,进而将消息库中与兴趣关键词相对应的消息推送至目标用户。
本发明实施例中,所述消息推送模块104在计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度时,具体用于:
对所述兴趣关键词进行向量转换,得到第一向量;
对所述消息关键词进行向量转换,得到第二向量;
利用如下的相似度公式逐一计算所述第一向量与所述第二向量的相似度:
其中,S(S1,S2)为所述第一向量与所述第二向量的相似度,T1i为所述第一向量中第i个特征项的权值,T2i为所述第二向量中第i个特征项的权值,n为特征项的数量。
详细地,可通过预设的向量转换模型对所述兴趣特征类别进行向量转换,得到兴趣向量,所述向量转换模型包括但不限于word2vec模型、Bert模型。其中,所述第一向量为兴趣关键词对应的特征向量,所述第二向量为消息库中各消息的消息关键词对应的特征向量,即所述第二向量是各消息关键词对应的特征向量的集合。
具体地,将所述兴趣关键词对应的第一向量与消息库中各消息的消息关键词对应的第二向量逐一计算相似度,进一步根据相似度将消息关键词对应的消推送至目标用户。
本发明实施例中,所述消息推送模块104在将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户时,具体用于:
获取消息推送的推送请求;
将所述相似度大于预设阈值的消息关键词对应的消息推送封装成消息数据包;
根据所述推送请求将所述消息数据包推送至所述目标用户。
详细地,可利用具有请求获取功能的***(如Interceptor)获取消息推送的推送请求,其中所述推送请求包括发送方相关的消息标识和接收方相关的消息标识,如接收方的名称和设备类型。
具体地,将消息封装成消息数据包是利用网络在不同设备之间传输时,可以可靠和准确地将消息发送至目标用户。
示例性地,当所述兴趣关键词为景点时,消息库中各消息的消息关键词为教育、书籍、读书,景点,景点门票,景点地址,景点环境等,则计算出兴趣关键词与消息库中各消息的消息关键词的相似度,则相似度大于预设的阈值的消息关键词为景点,景点门票,景点地址,景点环境,则会把景点,景点门票,景点地址,景点环境对应的相关消息推送至目标用户。
所述智能分析模块105,用于将所述基本行为特征和所述消息关键词输入至预设的信息推送预测神经网络中,得到信息推送预测数据,提取所述信息推送预测数据中的预测关键词,按照所述预测关键词对所述目标用户进行分类,并根据所述分类结果对所述基本属性特征进行更新。
本发明实施例中,利用人工智能技术较强的扩展性,通过用户消息推荐的历史行为特征和消息关键词方法集成到人工智能预测***中,得到对于用户的消息推送预测结果,提高对目标用户进行消息推送的准确性。
本发明实施例中,所述智能分析模块105在将所述基本行为特征和所述消息关键词输入至预设的信息推送预测神经网络中,得到信息推送预测数据时,具体用于:
将所述基本行为特征向量化,得到行为向量,将所述消息关键词向量化,得到消息向量;
将所述行为向量及所述消息向量进行叠加,得到叠加向量;
将所述叠加向量输入至所述信息推送预测神经网络的长短期记忆网络中;
在所述长短期记忆网络中提取信息推送特征值、时间标记值;
将所述信息推送特征值及所述时间标记值输入至所述信息推送预测神经网络的全连接网络中,输出所述信息推送预测数据。
详细地,所述信息推送预测神经网络是卷积神经网络变化形式的一种,属于深度学习的代表算法之一。在搭建神经网络架构过程中,通过训练大量的历史用户行为特征和消息关键词来学习不同神经网络结构中的权值和偏移值,从而实现对输入至的特征分类。
具体地,在信息推送时,会因为用户浏览的时间变化而影响预测用户兴趣的准确性,因此,采用长短期神经网络(long short term memory networks,LSTM)模块进行模型的预测训练。将叠加向量输入至LSTM层,随后在LSTM层提取信息推送中消息具有较长时间依赖性的特征,将提取后的信息推送特征值、时间标记值进行合并之后输入至全连接网络中,以获得合并后的特征值的进一步表示,即得到所述信息推送预测数据。
本发明实施例中,所述预测关键词是基于目标用户的行为特征和相关的消息关键词预测出可能感兴趣的消息。
详细地,所述提取所述信息推送预测数据中的预测关键词与所述关键词提取模块103提取所述兴趣特征的兴趣关键词的步骤一致,在此不再赘述。
本发明实施例中,根据所述预测关键词对所述目标用户进行分类,即将目标用户中具有相同兴趣的用户分在一起,例如所述预测关键词为体育信息、教育信息、旅游信息,则将目标用户中对体育信息感兴趣的用户分在一类,将目标用户中对教育信息感兴趣的用户分在一类,将目标用户中对旅游信息感兴趣的用户分在一类。
本发明实施例中,用户画像定义并初始化后,随着信息生命周期的更替和用户兴趣的转移,为了准确追踪用户实时兴趣,获得较为较为精确的推荐结果,用户的基本属性特征中的兴趣爱好需不断地进行完善和持续更新才能追踪和无限接近用户的真实兴趣,便于提高对用户进行信息推荐时的准确性。
本发明实施例中,所述智能分析模块105在根据所述分类结果对所述基本属性特征进行更新时,具体用于:
利用预设的层次分析法确定所述分类结果的分类权重;
选取所述分类权重最大的分类结果对应的预测关键词对所述基本属性特征进行更新。
详细地,利用层次分析法确定分类结果的分类权重,因此可利用所述层次分析法构建所述分类结果层次化模型;根据所述层次化模型确定所述分类结果的特征矩阵;计算所述特征矩阵的权重向量;对所述权重向量进行归一化处理,得到所述分类结果的分类权重。其中层次分析法,简称AHP,是指将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法,是一种层次权重决策分析方法。
具体地,通过分类权重的大小,可得到待更新的消息关键词,甚至未更新的基本属性特征,将未出现在用户基本属性特征中的关键词添加至基本属性特征中,将已经存在用户基本属性特征中的关键词根据分类结果的分类权重大小更新用户基本属性特征。
示例性地,当目标用户的初始基本属性特征中的兴趣爱好为旅游,在进行对目标用户推送信息数据进行预测时,会随着时间用户的兴趣爱好可能会发生变化,即根据预测关键词将目标用户分在体育、读书的兴趣类别,分别确定目标用户在体育兴趣类别的分类权重为0.3、在读书的兴趣类别的分类权重为0.6,在旅游的兴趣类别的分类权重为0.5,则会选取读书属性添加至用户基本属性特征中,以实现在对目标用户进行信息推送时,会推送旅游和读书相关的信息,提高对用户进行信息推荐时的准确性。
本发明实施例通过用户的基本属性特征生成用户画像,根据用户画像可以更简单方便了解用户的属性特征和行为特征;进而根据行为特征可以确定用户在业务页面的页面操作意图,实现对用户兴趣特征的掌握;进一步计算兴趣特征的兴趣关键词和消息库中各消息的消息关键词的相似度,从而选取相似度大于阈值的消息关键词对应的消息推送至用户,使对用户进行信息推送的消息能满足用户对于信息的需求,提高用户在业务页面获取相关信息的效率;将行为特征和消息关键词输入至信息推送预测神经网络中,可以得到信息推送预测数据,提取信息推送预测数据的预测关键词,根据预测关键词对用户进行分类,可以实现在信息推送时根据分类结果的不同,可以向用户推送不同的消息,提高用户在业务页面的体验感;根据分类结果对基本属性特征进行更新,便于用户对感兴趣的业务页面发生变化时,可以准确的分析出用户的兴趣,进而可以更准确的分析出用户的意图,从而提高用户推送信息的准确性。因此本发明提出的大数据信息反馈的信息推送***、方法,可以解决进行信息推送时的准确性较低的问题。
参照图2所示,为本发明一实施例提供的大数据信息反馈的信息推送***的运行方法的流程示意图。在本实施例中,所述大数据信息反馈的信息推送***的运行方法包括:
S1、获取目标用户的基本属性特征,根据所述基本属性特征生成用户画像;
S2、提取所述用户画像的基本行为特征,根据所述基本行为特征确定所述目标用户在预设业务页面的页面操作意图;
S3、根据所述页面操作意图生成所述目标用户在业务页面的兴趣特征,提取所述兴趣特征的兴趣关键词;
S4、计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度,并将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户;
S5、将所述基本行为特征和所述消息关键词输入至预设的信息推送预测神经网络中,得到信息推送预测数据,提取所述信息推送预测数据中的预测关键词,按照所述预测关键词对所述目标用户进行分类,并根据所述分类结果对所述基本属性特征进行更新。
本发明实施例通过用户的基本属性特征生成用户画像,根据用户画像可以更简单方便了解用户的属性特征和行为特征;进而根据行为特征可以确定用户在业务页面的页面操作意图,实现对用户兴趣特征的掌握;进一步计算兴趣特征的兴趣关键词和消息库中各消息的消息关键词的相似度,从而选取相似度大于阈值的消息关键词对应的消息推送至用户,使对用户进行信息推送的消息能满足用户对于信息的需求,提高用户在业务页面获取相关信息的效率;将行为特征和消息关键词输入至信息推送预测神经网络中,可以得到信息推送预测数据,提取信息推送预测数据的预测关键词,根据预测关键词对用户进行分类,可以实现在信息推送时根据分类结果的不同,可以向用户推送不同的消息,提高用户在业务页面的体验感;根据分类结果对基本属性特征进行更新,便于用户对感兴趣的业务页面发生变化时,可以准确的分析出用户的兴趣,进而可以更准确的分析出用户的意图,从而提高用户推送信息的准确性。因此本发明提出的大数据信息反馈的信息推送***、方法,可以解决进行信息推送时的准确性较低的问题。
如图3所示,是本发明一实施例提供的实现大数据信息反馈的信息推送***的运行方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如大数据信息反馈的信息推送***程序。
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing Unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行大数据信息反馈的信息推送方法及人工智能分析方法程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如大数据信息反馈的信息推送***程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线12可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
所述通信接口13用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的大数据信息反馈的信息推送***程序是多个指令的组合,在所述处理器10中运行时,可以实现:
获取目标用户的基本属性特征,根据所述基本属性特征生成用户画像;
提取所述用户画像的基本行为特征,根据所述基本行为特征确定所述目标用户在预设业务页面的页面操作意图;
根据所述页面操作意图生成所述目标用户在业务页面的兴趣特征,提取所述兴趣特征的兴趣关键词;
计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度,并将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户;
将所述基本行为特征和所述消息关键词输入至预设的信息推送预测神经网络中,得到信息推送预测数据,提取所述信息推送预测数据中的预测关键词,按照所述预测关键词对所述目标用户进行分类,并根据所述分类结果对所述基本属性特征进行更新。
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取目标用户的基本属性特征,根据所述基本属性特征生成用户画像;
提取所述用户画像的基本行为特征,根据所述基本行为特征确定所述目标用户在预设业务页面的页面操作意图;
根据所述页面操作意图生成所述目标用户在业务页面的兴趣特征,提取所述兴趣特征的兴趣关键词;
计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度,并将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户;
将所述基本行为特征和所述消息关键词输入至预设的信息推送预测神经网络中,得到信息推送预测数据,提取所述信息推送预测数据中的预测关键词,按照所述预测关键词对所述目标用户进行分类,并根据所述分类结果对所述基本属性特征进行更新。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,***和方法,可以通过其它的方式实现。例如,以上所描述的***实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或***也可以由一个单元或***通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (7)
1.一种大数据信息反馈的信息推送***,其特征在于,所述***包括画像生成模块、意图识别模块、关键词提取模块、消息推送模块及智能分析模块,其中,
所述画像生成模块,用于获取目标用户的基本属性特征,根据所述基本属性特征生成用户画像,其中所述根据所述基本属性特征生成用户画像,具体用于:
对所述属性特征进行核心语义提取,得到属性特征语义;
利用如下特征频率公式的计算所述属性特征语义的属性特征频率:
其中,为所述属性特征频率,/>为所述属性特征语义/>在第/>篇属性文档中出现的次数,/>为出现所述属性特征语义/>的属性文档数,/>为属性文档的全部数量,/>为对数函数;
选取所述属性特征频率最高的预设数量的属性特征语义为用户标签;
根据所述用户标签生成所述目标用户的用户画像;
所述意图识别模块,用于提取所述用户画像的基本行为特征,根据所述基本行为特征确定所述目标用户在业务页面的操作区域,利用如下的时长公式计算所述目标用户在每个所述操作区域的浏览时长:
其中,为第/>个所述操作区域的所述浏览时长,/>为第/>个所述操作区域的页面大小,/>为对第/>个所述操作区域的浏览速度,/>为紧跟操作区域/>的下一个操作区域, />为第/>个所述操作区域的请求时长;
根据所述浏览时长确定所述目标用户的页面操作意图;
所述关键词提取模块,用于根据所述页面操作意图生成所述目标用户在业务页面的兴趣特征,提取所述兴趣特征的兴趣关键词;
所述消息推送模块,用于计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度,并将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户;
所述智能分析模块,用于将所述基本行为特征和所述消息关键词输入至预设的信息推送预测神经网络中,得到信息推送预测数据,具体包括:将所述基本行为特征向量化,得到行为向量,将所述消息关键词向量化,得到消息向量;将所述行为向量及所述消息向量进行叠加,得到叠加向量;将所述叠加向量输入至所述信息推送预测神经网络的长短期记忆网络中;在所述长短期记忆网络中提取信息推送特征值、时间标记值;将所述信息推送特征值及所述时间标记值输入至所述信息推送预测神经网络的全连接网络中,输出所述信息推送预测数据;提取所述信息推送预测数据中的预测关键词,按照所述预测关键词对所述目标用户进行分类,利用预设的层次分析法确定分类结果的分类权重,选取所述分类权重最大的分类结果对应的预测关键词对所述基本属性特征进行更新,其中,通过所述分类权重的大小,可得到待更新的消息关键词,甚至未更新的基本属性特征,将未出现在用户基本属性特征中的关键词添加至基本属性特征中,将已经存在用户基本属性特征中的关键词根据分类结果的分类权重大小更新用户基本属性特征。
2.如权利要求1所述的大数据信息反馈的信息推送***,其特征在于,所述提取所述兴趣特征的兴趣关键词时,具体用于:
对所述兴趣特征进行类别划分,得到兴趣特征类别;
对所述兴趣特征类别进行向量转换,得到兴趣向量;
利用如下的权重算法计算所述兴趣向量的兴趣权重:
其中,表示所述兴趣向量/>在所述兴趣特征类别/>中的兴趣权重,/>表示所述兴趣向量,/>表示所述兴趣特征类别在所述兴趣特征中的频率,/>为所述兴趣向量中兴趣特征类别的数量,/>为所述兴趣向量中包含兴趣特征类别/>的数量,/>为对数函数;
选取所述兴趣权重最大的兴趣向量为所述兴趣关键词。
3.如权利要求1所述的大数据信息反馈的信息推送***,其特征在于,所述计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度时,具体用于:
对所述兴趣关键词进行向量转换,得到第一向量;
对所述消息关键词进行向量转换,得到第二向量;
利用如下的相似度公式逐一计算所述第一向量与所述第二向量的相似度:
其中,为所述第一向量与所述第二向量的相似度,/>为所述第一向量中第/>个特征项的权值,/>为所述第二向量中第/>个特征项的权值,/>为特征项的数量。
4.如权利要求1所述的大数据信息反馈的信息推送***,其特征在于,所述将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户时,具体用于:
获取消息推送的推送请求;
将所述相似度大于预设阈值的消息关键词对应的消息推送封装成消息数据包;
根据所述推送请求将所述消息数据包推送至所述目标用户。
5.一种大数据信息反馈的信息推送***的运行方法,其特征在于,所述方法适用于大数据信息反馈的信息推送***,所述方法包括:
获取目标用户的基本属性特征,根据所述基本属性特征生成用户画像,其中所述根据所述基本属性特征生成用户画像,具体用于:
对所述属性特征进行核心语义提取,得到属性特征语义;
利用如下特征频率公式的计算所述属性特征语义的属性特征频率:
其中,为所述属性特征频率,/>为所述属性特征语义/>在第/>篇属性文档中出现的次数,/>为出现所述属性特征语义/>的属性文档数,/>为属性文档的全部数量,/>为对数函数;
选取所述属性特征频率最高的预设数量的属性特征语义为用户标签;
根据所述用户标签生成所述目标用户的用户画像;
提取所述用户画像的基本行为特征,根据所述基本行为特征确定所述目标用户在业务页面的操作区域,利用如下的时长公式计算所述目标用户在每个所述操作区域的浏览时长:
其中,为第/>个所述操作区域的所述浏览时长,/>为第/>个所述操作区域的页面大小,/>为对第/>个所述操作区域的浏览速度,/>为紧跟操作区域/>的下一个操作区域, />为第/>个所述操作区域的请求时长;
根据所述浏览时长确定所述目标用户的页面操作意图;
根据所述页面操作意图生成所述目标用户在业务页面的兴趣特征,提取所述兴趣特征的兴趣关键词;
计算所述兴趣关键词与预设的消息库中各消息的消息关键词的相似度,并将所述相似度大于预设阈值的消息关键词对应的消息推送至所述目标用户;
将所述基本行为特征和所述消息关键词输入至预设的信息推送预测网络中,得到信息推送预测数据,具体包括:将所述基本行为特征向量化,得到行为向量,将所述消息关键词向量化,得到消息向量;将所述行为向量及所述消息向量进行叠加,得到叠加向量;将所述叠加向量输入至所述信息推送预测神经网络的长短期记忆网络中;在所述长短期记忆网络中提取信息推送特征值、时间标记值;将所述信息推送特征值及所述时间标记值输入至所述信息推送预测神经网络的全连接网络中,输出所述信息推送预测数据;提取所述信息推送预测数据中的预测关键词,按照所述预测关键词对所述目标用户进行分类,利用预设的层次分析法确定分类结果的分类权重,选取所述分类权重最大的分类结果对应的预测关键词对所述基本属性特征进行更新,其中,通过所述分类权重的大小,可得到待更新的消息关键词,甚至未更新的基本属性特征,将未出现在用户基本属性特征中的关键词添加至基本属性特征中,将已经存在用户基本属性特征中的关键词根据分类结果的分类权重大小更新用户基本属性特征。
6.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求5所述的大数据信息反馈的信息推送***的运行方法。
7.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求5所述的大数据信息反馈的信息推送***的运行方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211179493.0A CN115659008B (zh) | 2022-09-27 | 2022-09-27 | 大数据信息反馈的信息推送***、方法、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211179493.0A CN115659008B (zh) | 2022-09-27 | 2022-09-27 | 大数据信息反馈的信息推送***、方法、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115659008A CN115659008A (zh) | 2023-01-31 |
CN115659008B true CN115659008B (zh) | 2023-11-17 |
Family
ID=84985666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211179493.0A Active CN115659008B (zh) | 2022-09-27 | 2022-09-27 | 大数据信息反馈的信息推送***、方法、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115659008B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116319395B (zh) * | 2023-03-21 | 2023-10-31 | 苏州利博特信息科技有限公司 | 一种基于大数据的计算机信息处理***及方法 |
CN117253624B (zh) * | 2023-11-02 | 2024-03-05 | 银川童宜棠互联网医院有限公司 | 一种基于人工智能的医学健康知识普及方法、装置及介质 |
CN117541275B (zh) * | 2024-01-09 | 2024-06-07 | 深圳市微购科技有限公司 | 一种基于云技术的智能终端商品销售管理*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105243143A (zh) * | 2015-10-14 | 2016-01-13 | 湖南大学 | 基于即时语音内容检测的推荐方法及*** |
CN107908789A (zh) * | 2017-12-12 | 2018-04-13 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
CN108154395A (zh) * | 2017-12-26 | 2018-06-12 | 上海新炬网络技术有限公司 | 一种基于大数据的客户网络行为画像方法 |
CN111597437A (zh) * | 2020-04-18 | 2020-08-28 | 北京奇保信安科技有限公司 | 一种基于兴趣点的消息推送方法、装置和电子设备 |
CN113901320A (zh) * | 2021-10-19 | 2022-01-07 | 平安科技(深圳)有限公司 | 场景服务推荐方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180052842A1 (en) * | 2016-08-16 | 2018-02-22 | Ebay Inc. | Intelligent online personal assistant with natural language understanding |
-
2022
- 2022-09-27 CN CN202211179493.0A patent/CN115659008B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105243143A (zh) * | 2015-10-14 | 2016-01-13 | 湖南大学 | 基于即时语音内容检测的推荐方法及*** |
CN107908789A (zh) * | 2017-12-12 | 2018-04-13 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
CN108154395A (zh) * | 2017-12-26 | 2018-06-12 | 上海新炬网络技术有限公司 | 一种基于大数据的客户网络行为画像方法 |
CN111597437A (zh) * | 2020-04-18 | 2020-08-28 | 北京奇保信安科技有限公司 | 一种基于兴趣点的消息推送方法、装置和电子设备 |
CN113901320A (zh) * | 2021-10-19 | 2022-01-07 | 平安科技(深圳)有限公司 | 场景服务推荐方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115659008A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111444428B (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN115659008B (zh) | 大数据信息反馈的信息推送***、方法、电子设备及介质 | |
CN110009401A (zh) | 基于用户画像的广告投放方法、装置和存储介质 | |
US7580926B2 (en) | Method and apparatus for representing text using search engine, document collection, and hierarchal taxonomy | |
CN111444395B (zh) | 获取实体间关系表达的方法、***和设备、广告召回*** | |
CN107862553A (zh) | 广告实时推荐方法、装置、终端设备及存储介质 | |
CN114238573B (zh) | 基于文本对抗样例的信息推送方法及装置 | |
CN115002200B (zh) | 基于用户画像的消息推送方法、装置、设备及存储介质 | |
WO2009155375A2 (en) | System and method for aggregating and summarizing product/topic sentiment | |
US20130035996A1 (en) | Social advertising technology (so-ad-tec) system and method for advertising for and in documents, and other systems and methods for accessing, structuring, and evaluating documents | |
CN113254711B (zh) | 一种互动图像的显示方法、装置、计算机设备和存储介质 | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN107526718A (zh) | 用于生成文本的方法和装置 | |
CN113592605B (zh) | 基于相似产品的产品推荐方法、装置、设备及存储介质 | |
CN116362684A (zh) | 一种基于图书馆集群的图书管理方法、装置、设备及存储介质 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN116205700A (zh) | 目标产品的推荐方法、装置、计算机设备和存储介质 | |
CN115222433A (zh) | 一种信息推荐方法、装置及存储介质 | |
CN114358807A (zh) | 基于可预测用户特征属性的用户画像方法及*** | |
CN117194780A (zh) | 生成式人工智能的旅游行程定制方法、装置及设备 | |
CN116738044A (zh) | 基于个性化实现高校图书馆的图书推荐方法、装置及设备 | |
CN112035740B (zh) | 项目使用时长预测方法、装置、设备及存储介质 | |
CN114298118B (zh) | 一种基于深度学习的数据处理方法、相关设备及存储介质 | |
CN114881712A (zh) | 智能广告投放方法、装置、设备及存储介质 | |
CN116484085A (zh) | 一种信息投放方法、装置、设备及存储介质、程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |