CN110688476A - 一种基于人工智能的文本推荐方法及装置 - Google Patents
一种基于人工智能的文本推荐方法及装置 Download PDFInfo
- Publication number
- CN110688476A CN110688476A CN201910901147.0A CN201910901147A CN110688476A CN 110688476 A CN110688476 A CN 110688476A CN 201910901147 A CN201910901147 A CN 201910901147A CN 110688476 A CN110688476 A CN 110688476A
- Authority
- CN
- China
- Prior art keywords
- text
- recommended
- standard
- user
- target user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 46
- 238000012216 screening Methods 0.000 claims abstract description 26
- 238000012163 sequencing technique Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 81
- 238000012545 processing Methods 0.000 claims description 42
- 230000004927 fusion Effects 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000015654 memory Effects 0.000 description 19
- 238000001914 filtration Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 9
- 238000003058 natural language processing Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000008707 rearrangement Effects 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于人工智能的文本推荐方法、装置、电子设备及存储介质;方法包括:针对目标用户进行文本推荐的请求,从目标用户的历史浏览文本集中确定标准文本;根据标准文本,对待推荐文本集进行召回处理,确定对应标准文本的待推荐文本;获取目标用户针对标准文本的用户兴趣;对用户兴趣及标准文本进行融合,得到融入用户兴趣的融合文本;根据融入目标用户兴趣的融合文本及待推荐文本,得到待推荐文本与标准文本之间的相似度;基于待推荐文本与标准文本的相似度,对待推荐文本进行排序,得到与标准文本对应的推荐文本,并进行筛选,得到用于响应请求的推荐文本。通过本发明,根据用户的个体差异,向用户推荐符合用户兴趣的文本。
Description
技术领域
本发明涉及人工智能的自然语言处理技术,尤其涉及一种基于人工智能的文本推荐方法、装置、电子设备及存储介质。
背景技术
自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向,能实现人与计算机之间用自然语言进行有效通信。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,该领域将涉及自然语言,即人们日常使用的语言,所以它与语言学有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
文本推荐***是自然语言处理领域的重要应用之一,可以自动联系用户和物品,该文本推荐***能够在信息过载的环境中帮助用户发现可能令他们感兴趣的信息,也能将信息推送给对它们感兴趣的用户。
虽然,文本推荐***可以向用户推荐用户可能感兴趣的文本。但是,文本推荐***是根据历史浏览文本统一向用户推荐相同的文本,导致推荐的文本不准确,用户体验感不好。
发明内容
本发明实施例提供一种基于人工智能的文本推荐方法、装置、电子设备及存储介质,能够根据用户的个体差异,向用户推荐符合用户兴趣的文本,提高用户体验感。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种基于人工智能的文本推荐方法,所述方法包括:
针对目标用户进行文本推荐的请求,从所述目标用户的历史浏览文本集中确定至少一个标准文本;
根据所述标准文本,对待推荐文本集进行召回处理,确定对应所述标准文本的至少一个待推荐文本;
获取所述目标用户针对标准文本的用户兴趣;
对所述用户兴趣、以及所述标准文本进行融合,得到融入用户兴趣的融合文本;
根据所述融入目标用户兴趣的融合文本、以及所述待推荐文本,得到所述待推荐文本与所述标准文本之间的相似度;
基于所述待推荐文本与所述标准文本的相似度,对所述至少一个待推荐文本进行排序,得到与所述标准文本对应的推荐文本;
对至少一个标准文本对应的推荐文本进行筛选,得到用于响应所述请求的推荐文本。
上述技术方案中,所述对至少一个标准文本对应的推荐文本进行筛选,得到用于响应所述请求的推荐文本,包括:
根据至少一个标准文本对应的推荐文本,对所述历史浏览文本集进行检索,当所述推荐文本为历史浏览文本,过滤所述推荐文本,得到用于响应所述请求的推荐文本。
本发明实施例提供一种基于人工智能的文本推荐装置,所述装置包括:
确定模块,用于针对目标用户进行文本推荐的请求,从所述目标用户的历史浏览文本集中确定至少一个标准文本;
召回模块,用于根据所述标准文本,对待推荐文本集进行召回处理,确定对应所述标准文本的至少一个待推荐文本;
第一处理模块,用于获取所述目标用户针对标准文本的用户兴趣;
融合模块,用于对所述用户兴趣、以及所述标准文本进行融合,得到融入用户兴趣的融合文本;
第二处理模块,用于根据所述融入目标用户兴趣的融合文本、以及所述待推荐文本,得到所述待推荐文本与所述标准文本之间的相似度;
第三处理模块,用于基于所述待推荐文本与所述标准文本的相似度,对所述至少一个待推荐文本进行排序,得到与所述标准文本对应的推荐文本;
筛选模块,用于对至少一个标准文本对应的推荐文本进行筛选,得到用于响应所述请求的推荐文本。
上述技术方案中,所述确定模块还用于执行以下之一:
对所述目标用户的历史浏览文本集进行筛选,确定设定的时间段内的历史浏览文本为标准文本;
对所述目标用户的历史浏览文本进行筛选,当所述历史浏览文本被所述目标用户使用的时间大于时间阈值,确定所述历史浏览文本为所述标准文本;
对所述目标用户的历史浏览文本进行筛选,当所述历史浏览文本被样本用户使用的频率大于使用频率阈值,确定所述历史浏览文本为所述标准文本。
上述技术方案中,所述召回模块还用于对所述标准文本进行分词处理,得到所述标准文本中的关键词;
根据所述标准文本中的关键词对待推荐文本集进行检索,确定对应所述标准文本的至少一个待推荐文本。
上述技术方案中,所述第一处理模块还用于根据所述目标用户的历史浏览文本集中的历史浏览文本、以及所述标准文本,确定所述历史浏览文本与所述标准文本的相似度;
根据至少一个历史浏览文本与所述标准文本的相似度,确定所述目标用户针对标准文本的用户兴趣。
上述技术方案中,所述第一处理模块还用于对至少一个历史浏览文本与所述标准文本的相似度进行求和,得到相似度总和;
确定所述历史浏览文本与所述标准文本的相似度,并确定所述相似度与所述相似度总和的第一比值;
对所述历史浏览文本、以及所述第一比值进行加权求和,得到所述目标用户针对标准文本的用户兴趣。
上述技术方案中,所述用户兴趣为用户兴趣向量,所述待推荐文本为待推荐文本向量,所述标准文本为标准文本向量;
所述融合模块还用于对所述用户兴趣向量与所述标准文本向量进行求和,得到对应的和向量,确定所述对应的和向量为融入目标用户兴趣的融合文本;
所述第二处理模块还用于将所述对应的和向量、以及所述待推荐文本向量之间的相似度,确定为所述待推荐文本与所述标准文本之间的相似度。
上述技术方案中,所述第三处理模块还用于获取所述标准文本的权重;
根据权重与推荐文本数量的正比关系、以及所述标准文本的权重,得到所述标准文本对应的推荐文本数量;
基于所述待推荐文本与所述标准文本的相似度,对所述至少一个待推荐文本进行降序排序,得到与所述推荐文本数量对应的推荐文本。
上述技术方案中,所述第三处理模块还用于对所述至少一个标准文本被所述目标用户使用的时间进行求和,得到时间总和;
对所述标准文本被所述目标用户使用的时间与所述时间总和进行比值,得到所述标准文本的权重。
上述技术方案中,所述筛选模块还用于根据至少一个标准文本对应的推荐文本,对所述历史浏览文本集进行检索,当所述推荐文本为历史浏览文本,过滤所述推荐文本,得到用于响应所述请求的推荐文本。
上述技术方案中,所述装置还包括:
获取模块,用于针对目标用户进行文本推荐的请求,从区块链网络中获取所述目标用户的历史浏览文本集。
本发明实施例提供一种基于人工智能的文本推荐装置,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本发明实施例提供的基于人工智能的文本推荐方法。
本发明实施例提供一种存储介质,存储有可执行指令,用于引起处理器执行时,实现本发明实施例提供的基于人工智能的文本推荐方法。
本发明实施例具有以下有益效果:
1、从目标用户的历史浏览文本集中确定出标准文本,以便后续根据该标准文本确定出目标用户可能感兴趣的推荐文本,提高推荐文本的准确性;
2、在标准文本中融入目标用户针对标准文本的用户兴趣,从而能够根据用户兴趣的个体差异,向用户推荐符合用户兴趣的文本,提高用户体验感。
附图说明
图1A是本发明实施例提供的基于人工智能的文本推荐方法的一个可选的应用场景10示意图;
图1B是本发明实施例提供的基于人工智能的文本推荐方法的一个可选的应用模式100示意图;
图2是本发明实施例提供的基于人工智能的文本推荐设备500的结构示意图;
图3A-3C是本发明实施例提供的基于人工智能的文本推荐方法的流程示意图;
图4-5是本发明实施例提供的终端显示界面示意图;
图6是本发明实施例提供的推荐文本的结果示意图;
图7为本发明实施例提供的推荐方法改进前后的对比图;
图8为本发明实施例提供的新闻推荐***进行个性化推荐流程图;
图9为本发明实施例提供的推荐方法改进前后的对比图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)目标用户:当前使用文本推荐***的用户、即当前用户,例如用户A 在使用文本推荐***看新闻,则用户A为目标用户。
2)采样用户:不同于目标用户的其他用户,例如,用户A在使用文本推荐***看新闻,则当前相对于用户A,其他用户为用户A的采样用户。
3)分词:将连续的字序列按照一定的规范重新组合成词序列的过程。通过让计算机模拟人对句子的理解,达到识别词的效果。
4)召回(Recall):从文档库中检索出相关文档,例如为用户粗选一批待推荐的商品。
5)用户兴趣:用户在使用文本推荐***时,所表现的行为倾向性。文本推荐***会根据用户的一系列行为表现来确实用户的兴趣。
6)用户画像:又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像在各领域得到了广泛的应用,在实际操作的过程中,往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来,作为实际用户的虚拟代表。
7)word2vec:用来产生词向量的相关模型。将所有的词向量化,使得词与词之间可以定量地度量它们之间的关系,从而挖掘词之间的联系。
8)区块链(Blockchain):由区块(Block)形成的加密的、链式的交易的存储结构。
9)区块链网络(Blockchain Network):通过共识的方式将新区块纳入区块链的一系列的节点的集合。
本发明实施例提供了一种基于人工智能的文本推荐方法、装置、电子设备及存储介质,能够根据用户的个体差异,向用户推荐符合用户兴趣的文本,提高用户体验感。下面说明本发明实施例提供的基于人工智能的文本推荐设备的示例性应用,本发明实施例提供的基于人工智能的文本推荐设备可以是服务器,例如部署在云端的服务器,根据针对目标用户进行文本推荐的请求,向目标用户提供符合用户兴趣的文本;也可是笔记本电脑,平板电脑,台式计算机,移动设备(例如,移动电话,个人数字助理)等各种类型的用户终端,例如手持终端,根据针对目标用户进行文本推荐的请求,获得符合目标用户兴趣的文本,并显示在手持终端的显示界面上,以实现手持终端与用户的交互过程。
参见图1A,图1A是本发明实施例提供的基于人工智能的文本推荐方法的一个可选的应用场景10示意图,终端200通过网络300连接服务器100,网络 300可以是广域网或者局域网,又或者是二者的组合。
终端200可以被用来获取针对目标用户进行文本推荐的请求,例如,当目标用户打开新闻应用后,终端自动获取针对目标用户进行文本推荐的请求。
在一些实施例中,终端200本地执行本发明实施例提供的基于人工智能的文本推荐方法来完成根据针对目标用户进行文本推荐的请求,得到符合目标用户兴趣的文本,例如,在终端200上安装新闻应用(Application,APP),如新闻推送APP,用户在打开新闻推送APP后或者用户点击新闻推送APP上的推荐按钮后,终端200自动生成针对目标用户进行文本推荐的请求,并进行一系列的处理,获得用于响应推荐请求的推荐文本,并将该推荐文本显示在终端20 0的显示界面210上。
终端200也可以通过网络300向服务器100发送针对目标用户进行文本推荐的请求,并调用服务器100提供的文本推荐功能,服务器100通过本发明实施例提供的基于人工智能的文本推荐方法获得用于响应推荐请求的推荐文本,例如,在终端200上安装新闻推送APP,用户在打开新闻推送APP后或者用户点击新闻推送APP上的推荐按钮后,终端200自动生成针对目标用户进行文本推荐的请求,并通过网络300向服务器100发送针对目标用户进行文本推荐的请求,服务器100根据针对目标用户进行文本推荐的请求,进行一系列的处理,获得用于响应推荐请求的推荐文本,并返回该推荐文本至新闻推送APP,将推荐文本显示在终端200的显示界面上。
参见图1B,图1B是本发明实施例提供的基于人工智能的文本推荐方法的一个可选的应用模式100示意图,包括区块链网络400(示例性示出了共识节点410-1至共识节点410-3)、认证中心500、业务主体600和业务主体700,下面分别进行说明。
区块链网络400的类型是灵活多样的,例如可以为公有链、私有链或联盟链中的任意一种。以公有链为例,任何业务主体的电子设备例如终端设备200 和服务器300,都可以在不需要授权的情况下接入区块链网络400;以联盟链为例,业务主体在获得授权后其下辖的电子设备(例如终端设备200/服务器300) 可以接入区块链网络400,此时,成为区块链网络400中的客户端节点。
在一些实施例中,客户端节点可以只作为区块链网络400的观察者,即提供支持业务主体发起交易(例如,用于上链存储数据或查询链上数据)功能,对于区块链网络400的共识节点410的功能,例如排序功能、共识服务和账本功能等,客户端节点可以缺省或者有选择性(例如,取决于业务主体的具体业务需求)地实施。从而,可以将业务主体的数据和业务处理逻辑最大程度迁移到区块链网络400中,通过区块链网络400实现数据和业务处理过程的可信和可追溯。
区块链网络400中的共识节点接收来自不同业务主体(例如图1B中示出的业务主体700和业务主体700)的客户端节点提交的交易,执行交易以更新账本或者查询账本,执行交易的各种中间结果或最终结果可以返回业务主体的客户端节点中显示。
例如,客户端节点610/710可以订阅区块链网络400中感兴趣的事件,例如区块链网络400中特定的组织/通道中发生的交易,由共识节点410推送相应的交易通知到客户端节点610/710,从而触发客户端节点610/710中相应的业务逻辑。
下面以多个业务主体接入区块链网络以实现文本推荐的管理为例,说明区块链网络的示例性应用。
参见图1B,管理环节涉及的多个业务主体,如客户端节点610可以为图1 A中终端设备200对应的客户端节点,客户端节点710可以为图1A中服务器1 00对应的客户端节点,客户端节点610从认证中心500进行登记注册获得各自的数字证书,数字证书中包括业务主体600的公钥、以及认证中心500对业务主体600的公钥和身份信息签署的数字签名,用来与业务主体600针对交易的数字签名一起附加到交易中,并被发送到区块链网络,以供区块链网络从交易中取出数字证书和签名,验证消息的可靠性(即是否未经篡改)和发送消息的业务主体的身份信息,区块链网络会根据身份进行验证,例如是否具有发起交易的权限。业务主体下辖的电子设备(例如终端或者服务器)运行的客户端都可以向区块链网络200请求接入而成为客户端节点。
客户端节点610用于将目标用户的历史文本集存储至区块链网络400中,还可以将文本推荐处理的逻辑存储至区块链网络400中。客户端节点610根据目标用户的历史文本集生成对应更新操作的交易,在交易中指定了实现更新操作需要调用的智能合约、以及向智能合约传递的参数,交易还携带了客户端节点610的数字证书、签署的数字签名(例如,使用客户端节点610的数字证书中的私钥,对交易的摘要进行加密得到),并将交易广播到区块链网络400中的共识节点410。
区块链网络400中的共识节点410中接收到交易时,对交易携带的数字证书和数字签名进行验证,验证成功后,根据交易中携带的业务主体600的身份,确认业务主体600是否是具有交易权限,数字签名和权限验证中的任何一个验证判断都将导致交易失败。验证成功后签署节点自己的数字签名(例如,使用节点410-1的私钥对交易的摘要进行加密得到),并继续在区块链网络400中广播。
区块链网络400中的共识节点410接收到验证成功的交易后,将交易填充到新的区块中,并进行广播。区块链网络400中的共识节点410广播的新区块时,会对新区块进行共识过程,如果共识成功,则将新区块追加到自身所存储的区块链的尾部,并根据交易的结果更新状态数据库,执行新区块中的交易。
业务主体700的业务人员在客户端节点710中登录,客户端节点710根据针对目标用户进行文本推荐的请求生成对应的交易,根据交易中指定需要调用的智能合约、以及向智能合约传递的参数,交易还携带了客户端节点710的数字证书、签署的数字签名(例如,使用客户端节点710的数字证书中的私钥,对交易的摘要进行加密得到),并将交易广播到区块链网络400中的共识节点4 10。
区块链网络400中的共识节点410中接收到交易,对交易进行验证、区块填充及共识一致后,将填充的新区块追加到自身所存储的区块链的尾部,并根据交易的结果更新状态数据库,执行新区块中的交易:对于提交的查询目标用户的历史浏览文本集的交易,从状态数据库中查询目标用户的历史浏览文本集对应的键值对,并返回交易结果。
值得说明的是,还可以通过区块链网络中的智能合约收集待推荐文本集,在图2中示例性地示出了将待推荐文本集直接上链的过程,但在另一些实施例中,对于待推荐文本集的数据量较大的情况,客户端节点410可将待推荐文本集的哈希上链,将待推荐文本集存储于分布式文件***或数据库。客户端节点 510从分布式文件***或数据库获取到待推荐文本集后,可结合区块链网络20 0中对应的哈希进行校验,从而减少上链操作的工作量。
继续说明本发明实施例提供的基于人工智能的文本推荐设备的结构,基于人工智能的文本推荐设备可以是各种终端,例如手机、电脑等,也可以是如图 1示出的服务器100。
参见图2,图2是本发明实施例提供的基于人工智能的文本推荐设备500 的结构示意图,图2所示的基于人工智能的文本推荐设备500包括:至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。基于人工智能的文本推荐设备500中的各个组件通过总线***540耦合在一起。可理解,总线***540用于实现这些组件之间的连接通信。总线***540除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线***540。
处理器510可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口530包括使得能够呈现媒体内容的一个或多个输出装置531,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口530还包括一个或多个输入装置532,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器550包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Onl y Memory),易失性存储器可以是随机存取存储器(RAM,Random Access M emory)。本发明实施例描述的存储器550旨在包括任意适合类型的存储器。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。
在一些实施例中,存储器550能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作***551,包括用于处理各种基本***服务和执行硬件相关任务的***程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块552,用于经由一个或多个(有线或无线)网络接口520到达其他计算设备,示例性的网络接口520包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
显示模块553,用于经由一个或多个与用户接口530相关联的输出装置53 1(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作***设备和显示内容和信息的用户接口);
输入处理模块554,用于对一个或多个来自一个或多个输入装置532之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本发明实施例提供的基于人工智能的文本推荐装置可以采用软硬件结合的方式实现,作为示例,本发明实施例提供的基于人工智能的文本推荐装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的基于人工智能的文本推荐方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific In tegrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable LogicDevice)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
在另一些实施例中,本发明实施例提供的基于人工智能的文本推荐装置可以采用软件方式实现,图2示出了存储在存储器550中的基于人工智能的文本推荐装置555,其可以是程序和插件等形式的软件,并包括一系列的模块,包括确定模块5551、召回模块5552、第一处理模块5553、融合模块5554、第二处理模块5555、第三处理模块5556以及筛选模块5557;其中,确定模块5551、召回模块5552、第一处理模块5553、融合模块5554、第二处理模块5555、第三处理模块5556以及筛选模块5557用于实现本发明实施例提供的基于人工智能的文本推荐方法。
下面结合本发明实施例提供的终端的示例性应用和实施,说明本发明实施例提供的基于人工智能的文本推荐方法。参见图3A,图3A是本发明实施例提供的基于人工智能的文本推荐方法的流程示意图,结合图3A示出的步骤进行说明。
在步骤101中,针对目标用户进行文本推荐的请求,从目标用户的历史浏览文本集中确定至少一个标准文本。
历史浏览文本集可以是目标用户过去浏览过的所有文本的集合;历史浏览文本集还可以是目标用户在预设时间段内浏览过的文本的集合,例如,历史浏览文本集是目标用户在前一天浏览过的文本的集合;历史浏览文本集还可以是目标用户在距离当前时间的预设时间段内浏览过的文本的集合,例如,历史浏览文本集是目标用户距离当前时间的5个小时内浏览过的文本的集合。
目标用户可以在打开终端上某文本推荐应用后,终端自动生成针对目标用户进行文本推荐的请求,并从目标用户已经浏览过的历史浏览文本集中确定出至少一个标准文本,以便后续根据该标准文本进行文本推荐,其中,该标准文本为历史浏览文本集中一个文本。例如,目标用户打开终端上的新闻推送APP 后,终端自动生成针对目标用户进行新闻推荐的请求,并从目标用户浏览过的新闻中确定至少一个新闻作为标准文本,以便后续根据该标准文本推荐新闻给目标用户。
在一些实施例中,用户还可以在终端预先设置时间间隔,例如该时间间隔可以是1分钟,也可以是5分钟。每隔预先设置的时间间隔,终端可以自动生成针对目标用户进行文本推荐的请求,并从目标用户已经浏览过的历史浏览文本集中确定出至少一个标准文本,以便后续根据该标准文本进行文本推荐。
在一些实施例中,终端将用户实时浏览过的文本加入历史浏览文本集,并自动生成针对目标用户进行文本推荐的请求,从目标用户已经浏览过的历史浏览文本集中确定出至少一个标准文本,以便后续根据该标准文本进行文本推荐。或者,当用户浏览过预设数量的文本后,终端自动生成针对目标用户进行文本推荐的请求,从而进行文本推荐,例如将用户实时浏览过的文本加入历史浏览文本集,当用户浏览过5篇新闻后,终端自动生成针对目标用户进行文本推荐的请求,并进行文本推荐。
另外,目标用户还可以在打开终端上某文本推荐应用后,点击某文本推荐应用上的推荐按钮,终端自动生成针对目标用户进行文本推荐的请求,并从目标用户已经浏览过的历史浏览文本集中确定出至少一个标准文本,以便后续根据该标准文本进行文本推荐。如图4所示,目标用户打开终端上的新闻推送A PP后,点击新闻推送APP上的“推荐”按钮401,从而终端自动生成针对目标用户进行新闻推荐的请求,并从目标用户浏览过的新闻中确定至少一个新闻作为标准文本,以便后续根据该标准文本推荐新闻给目标用户。如图5所示,目标用户打开终端上的文章搜索APP后,点击文章搜索APP上的“推荐”按钮5 01,从而终端自动生成针对目标用户进行文章推荐的请求,并从目标用户浏览过的文章中确定至少一个文章作为标准文本,以便后续根据该标准文本推荐文章给目标用户。
在一些实施例中,从目标用户的历史浏览文本集中确定至少一个标准文本,包括以下之一:对目标用户的历史浏览文本集进行筛选,确定设定的时间段内的历史浏览文本为标准文本;对目标用户的历史浏览文本进行筛选,当历史浏览文本被目标用户使用的时间大于时间阈值,确定历史浏览文本为标准文本;对目标用户的历史浏览文本进行筛选,当历史浏览文本被样本用户使用的频率大于使用频率阈值,确定历史浏览文本为标准文本。
终端针对目标用户进行文本推荐的请求,可以对目标用户浏览过的历史浏览文本集进行筛选,从而确定在设定的时间段内的历史浏览文本为标准文本,以便后续根据该标准文本进行文本推荐。其中,设定的时间段是根据用户的需求进行设定的,例如该设定的时间段可以是半个小时,终端对目标用户浏览过的历史浏览文本集进行筛选,确定在半个小时内用户已经浏览过的历史浏览文本为标准文本。
终端针对目标用户进行文本推荐的请求,还可以对目标用户浏览过的历史浏览文本集进行筛选,当历史浏览文本被目标用户使用的时间大于时间阈值,确定历史浏览文本为标准文本,以便后续根据该标准文本进行文本推荐。其中,时间阈值是根据用户的需求进行设定的,例如该时间阈值可以是5分钟,终端对目标用户浏览过的历史浏览文本集进行筛选,当目标用户浏览某历史浏览文本用了10分钟,则历史浏览文本被目标用户使用的时间大于时间阈值,确定该历史浏览文本为标准文本。
终端针对目标用户进行文本推荐的请求,还可以对目标用户浏览过的历史浏览文本集进行筛选,当历史浏览文本被样本用户使用的频率大于使用频率阈值,确定历史浏览文本为标准文本,以便后续根据该标准文本进行文本推荐。其中,频率阈值是根据用户的需求进行设定的,例如该频率阈值可以是10次,终端对目标用户浏览过的历史浏览文本集进行筛选,当有15个样本用户浏览过某历史浏览文本,则历史浏览文本被样本用户使用的频率大于使用频率阈值,确定该历史浏览文本为标准文本。
在步骤102中,根据标准文本,对待推荐文本集进行召回处理,确定对应标准文本的至少一个待推荐文本。
在终端获得了至少一个标准文本后,还可以根据标准文本对待推荐文本集进行召回处理,确定对应标准文本的至少一个待推荐文本,其中,该待推荐文本集包括用户浏览过的文本(历史浏览文本)和用户没有浏览过的文本。
在一些实施例中,根据标准文本,对待推荐文本集进行召回处理,确定对应标准文本的至少一个待推荐文本,包括:对标准文本进行分词处理,得到标准文本中的关键词;根据标准文本中的关键词对待推荐文本集进行检索,确定对应标准文本的至少一个待推荐文本。
在终端获得了标准文本后,可以对该标准文本进行分词处理,从而得到标准文本中的关键词,并根据标准文本中的关键词对待推荐文本集进行检索,当待推荐文本集中的待推荐文本包含关键词,或者包括N个关键词时,则确定该待推荐文本为对应标准文本的待推荐文本。其中,N为整数,可以根据用户需求进行设定。
在步骤103中,获取目标用户针对标准文本的用户兴趣。
终端在获得标准文本后,还可以获取目标用户针对标准文本的用户兴趣,以便后续在标准文本中融入用户兴趣,从而考虑到每个用户的个体特征,进行差异化推荐。
参见图3B,图3B是本发明实施例提供的一个可选的流程示意图,在一些实施例中,图3A示出步骤103可以通过图3B示出的步骤1031至步骤1032实现。
在步骤1031中,根据目标用户的历史浏览文本集中的历史浏览文本、以及标准文本,确定历史浏览文本与标准文本的相似度。
这里,历史浏览文本为历史浏览文本向量,标准文本为标准文本向量,根据历史浏览文本向量、以及标准文本向量进行相似度的计算,从而得到历史浏览文本与标准文本的相似度。其中,相似度可以是余弦相似度,也可以是欧式距离。余弦相似度为向量空间中两个向量夹角的余弦值,作为衡量两个个体间差异的大小,而欧式距离是向量空间中两个向量的绝对距离。本发明实施例以余弦相似度为例,根据目标用户的历史浏览文本集中的历史浏览文本、以及标准文本,确定历史浏览文本与标准文本的余弦相似度,以便获得历史浏览文本与标准文本的相似程度。
在步骤1032中,根据至少一个历史浏览文本与标准文本的相似度,确定目标用户针对标准文本的用户兴趣。
终端依次获得历史浏览文本与标准文本的相似度后,可以根据至少一个历史浏览文本与标准文本的相似度,获得目标用户针对标准文本的用户兴趣。可以对历史浏览文本与标准文本进行加权求和,从而得到目标用户针对标准文本的用户兴趣。
在一些实施例中,根据至少一个历史浏览文本与标准文本的相似度,确定目标用户针对标准文本的用户兴趣,包括:对至少一个历史浏览文本与标准文本的相似度进行求和,得到相似度总和;确定历史浏览文本与标准文本的相似度,并确定相似度与相似度总和的第一比值;对历史浏览文本、以及第一比值进行加权求和,得到目标用户针对标准文本的用户兴趣。
首先,可以对至少一个历史浏览文本与标准文本的相似度进行求和,得到相似度总和。然后,将历史浏览文本与标准文本的相似度与相似度总和进行比值,从而得到第一比值。最后,对历史浏览文本、以及第一比值进行加权求和,从而得到目标用户针对标准文本的用户兴趣、即获得用户对文本的偏好。
在步骤104中,对用户兴趣、以及标准文本进行融合,得到融入用户兴趣的融合文本。
为了根据用户的个体差异,向用户推荐符合用户兴趣的文本,可以在标准文本中融入用户兴趣,得到融入用户兴趣的融合文本,从而考虑到用户之间对文本的不同偏好。
在一些实施例中,用户兴趣为用户兴趣向量,待推荐文本为待推荐文本向量,标准文本为标准文本向量;对用户兴趣、以及标准文本进行融合,得到融入目标用户兴趣的融合文本,包括:对用户兴趣向量与标准文本向量进行求和,得到对应的和向量,确定对应的和向量为融入目标用户兴趣的融合文本。
为了向用户推荐符合用户兴趣的文本,可以通过将用户兴趣向量与标准文本向量进行求和,从而在标准文本中融入用户兴趣。
在步骤105中,根据融入目标用户兴趣的融合文本、以及待推荐文本,得到待推荐文本与标准文本之间的相似度。
这里,融合文本为融合文本向量,待推荐文本为待推荐文本向量,根据融合文本向量、以及待推荐文本向量进行相似度的计算,从而得到待推荐文本与标准文本之间的相似度。本发明实施例以余弦相似度为例,根据融合文本、以及待推荐文,确定待推荐文本与标准文本之间的余弦相似度,以便获得待推荐文本与标准文本之间的相似程度。
在一些实施例中,用户兴趣为用户兴趣向量,待推荐文本为待推荐文本向量,标准文本为标准文本向量;根据融入目标用户兴趣的融合文本、以及待推荐文本,得到待推荐文本与标准文本之间的相似度,包括:将对应的和向量、以及待推荐文本向量之间的相似度,确定为待推荐文本与标准文本之间的相似度。
在终端对用户兴趣向量与标准文本向量进行求和,得到对应的和向量后,可以计算对应的和向量、以及待推荐文本向量之间的相似度,从而将该相似度确定为待推荐文本与标准文本之间的相似度。其中,该相似度可以是余弦相似度。
在步骤106中,基于待推荐文本与标准文本的相似度,对至少一个待推荐文本进行排序,得到与标准文本对应的推荐文本。
在终端获得了待推荐文本与标准文本的相似度后,可以基于待推荐文本与标准文本的相似度,对至少一个待推荐文本进行降序排序,从而获得前N个与标准文本对应的推荐文本。其中,N为整数,可以根据用户需求进行设定。
参见图3C,图3C是本发明实施例提供的一个可选的流程示意图,在一些实施例中,图3C示出步骤106可以通过图3C示出的步骤1061至步骤1063实现。
在步骤1061中,获取标准文本的权重。
不同的标准文本可以对应不同数量的推荐文本。为了区分标准文本对应的推荐文本数量,可以通过标准文本的权重来衡量。
在一些实施例中,获取标准文本的权重,包括:对至少一个标准文本被目标用户使用的时间进行求和,得到时间总和;对标准文本被目标用户使用的时间与时间总和进行比值,得到标准文本的权重。
为了获得标准文本的权重,可以先统计所有标准文本被目标用户使用的时间进行求和,得到时间总和,然后对该标准文本被目标用户使用的时间与时间总和进行比值,从而得到标准文本的权重。例如时间总和为2小时,该标准文本被目标用户使用的时间为0.5小时,则该标准文本的权重为0.25。
在一些实施例中,还可以先获取设定时间段内,某标准文本被样本用户使用的频率,并获取该设定时间段内,样本用户使用标准文本的次数,然后,对标准文本被样本用户使用的频率、与样本用户使用标准文本的次数进行比值,从而得到标准文本的权重。
在步骤1062中,根据权重与推荐文本数量的正比关系、以及标准文本的权重,得到标准文本对应的推荐文本数量。
该正比关系可以是用户预先设置在终端中,该正比关系可以是权重与推荐文本数量的对应关系,在获得标准文本的权重后,还可以获取权重与推荐文本数量的正比关系,从而根据权重与推荐文本数量的正比关系、以及标准文本的权重,得到标准文本对应的推荐文本数量。因此,当标准文本的权重越大,标准文本对应的推荐文本数量越多,说明目标用户比较偏好该标准文本类的文本。
在步骤1063中,基于待推荐文本与标准文本的相似度,对至少一个待推荐文本进行降序排序,得到与推荐文本数量对应的推荐文本。
终端获得标准文本对应的推荐文本数量N后,基于待推荐文本与标准文本的相似度,对至少一个待推荐文本进行降序排序,得到前N个推荐文本。
在步骤107中,对至少一个标准文本对应的推荐文本进行筛选,得到用于响应请求的推荐文本。
终端在得到与标准文本对应的推荐文本后,还可以对推荐文本进行筛选,从而得到最终响应于针对目标用户进行文本推荐的请求的推荐文本。
在一些实施例中,对至少一个标准文本对应的推荐文本进行筛选,得到用于响应请求的推荐文本,包括:根据至少一个标准文本对应的推荐文本,对历史浏览文本集进行检索,当推荐文本为历史浏览文本,过滤推荐文本,得到用于响应请求的推荐文本。
当根据至少一个标准文本对应的推荐文本,对历史浏览文本集进行检索的过程中,确定某推荐文本已经是目标用户浏览过的文本,则过滤该文本,避免重复推荐。如图4所示,目标用户打开终端上的新闻推送APP后,点击新闻推送APP上的“推荐”按钮,从而终端自动生成针对目标用户进行新闻推荐的请求,并经过一系列处理,得到用于响应请求的推荐新闻,并在终端的显示界面上进行显示,如图6所示。
至此已经结合本发明实施例提供的终端的示例性应用和实施,说明本发明实施例提供的基于人工智能的文本推荐方法,下面继续说明本发明实施例提供的基于人工智能的文本推荐装置555中各个模块配合实现基于人工智能的文本推荐的方案。
确定模块5551,用于针对目标用户进行文本推荐的请求,从所述目标用户的历史浏览文本集中确定至少一个标准文本;
召回模块5552,用于根据所述标准文本,对待推荐文本集进行召回处理,确定对应所述标准文本的至少一个待推荐文本;
第一处理模块5553,用于获取所述目标用户针对标准文本的用户兴趣;
融合模块5554,用于对所述用户兴趣、以及所述标准文本进行融合,得到融入用户兴趣的融合文本;
第二处理模块5555,用于根据所述融入目标用户兴趣的融合文本、以及所述待推荐文本,得到所述待推荐文本与所述标准文本之间的相似度;
第三处理模块5556,用于基于所述待推荐文本与所述标准文本的相似度,对所述至少一个待推荐文本进行排序,得到与所述标准文本对应的推荐文本;
筛选模块5557,用于对至少一个标准文本对应的推荐文本进行筛选,得到用于响应所述请求的推荐文本。
在一些实施例中,所述确定模块5551还用于执行以下之一:
对所述目标用户的历史浏览文本集进行筛选,确定设定的时间段内的历史浏览文本为标准文本;
对所述目标用户的历史浏览文本进行筛选,当所述历史浏览文本被所述目标用户使用的时间大于时间阈值,确定所述历史浏览文本为所述标准文本;
对所述目标用户的历史浏览文本进行筛选,当所述历史浏览文本被样本用户使用的频率大于使用频率阈值,确定所述历史浏览文本为所述标准文本。
在一些实施例中,所述召回模块5552还用于对所述标准文本进行分词处理,得到所述标准文本中的关键词;根据所述标准文本中的关键词对待推荐文本集进行检索,确定对应所述标准文本的至少一个待推荐文本。
在一些实施例中,所述第一处理模块5553还用于根据所述目标用户的历史浏览文本集中的历史浏览文本、以及所述标准文本,确定所述历史浏览文本与所述标准文本的相似度;根据至少一个历史浏览文本与所述标准文本的相似度,确定所述目标用户针对标准文本的用户兴趣。
在一些实施例中,所述第一处理模块5553还用于对至少一个历史浏览文本与所述标准文本的相似度进行求和,得到相似度总和;确定所述历史浏览文本与所述标准文本的相似度,并确定所述相似度与所述相似度总和的第一比值;对所述历史浏览文本、以及所述第一比值进行加权求和,得到所述目标用户针对标准文本的用户兴趣。
在一些实施例中,所述用户兴趣为用户兴趣向量,所述待推荐文本为待推荐文本向量,所述标准文本为标准文本向量;所述融合模块5554还用于对所述用户兴趣向量与所述标准文本向量进行求和,得到对应的和向量,确定所述对应的和向量为融入目标用户兴趣的融合文本;所述第二处理模块5555还用于将所述对应的和向量、以及所述待推荐文本向量之间的相似度,确定为所述待推荐文本与所述标准文本之间的相似度。
在一些实施例中,所述第三处理模块5556还用于获取所述标准文本的权重;根据权重与推荐文本数量的正比关系、以及所述标准文本的权重,得到所述标准文本对应的推荐文本数量;基于所述待推荐文本与所述标准文本的相似度,对所述至少一个待推荐文本进行降序排序,得到与所述推荐文本数量对应的推荐文本。
在一些实施例中,所述第三处理模块5556还用于对所述至少一个标准文本被所述目标用户使用的时间进行求和,得到时间总和;对所述标准文本被所述目标用户使用的时间与所述时间总和进行比值,得到所述标准文本的权重。
在一些实施例中,所述筛选模块5557还用于根据至少一个标准文本对应的推荐文本,对所述历史浏览文本集进行检索,当所述推荐文本为历史浏览文本,过滤所述推荐文本,得到用于响应所述请求的推荐文本。
在一些实施例中,所述基于人工智能的文本推荐装置555还包括:
获取模块5558,用于针对目标用户进行文本推荐的请求,从区块链网络中获取所述目标用户的历史浏览文本集。
本发明实施例还提供一种存储有可执行指令的存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本发明实施例提供的基于人工智能的文本推荐方法,例如,如图3A至图3C示出的基于人工智能的文本推荐方法。
在一些实施例中,存储介质可以是FRAM、ROM、PROM、EPROM、EE PROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件***中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(H TML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
下面,将说明本发明实施例在一个实际的应用场景中的示例性应用。
新闻个性化推荐,是根据用户的兴趣特点和阅读行为,向用户推荐他们感兴趣的新闻。用户的点击序列对于用户兴趣的挖掘是一个很重要的信息,它既反应了用户的兴趣分布,又隐含了文章之间的关联关系。
基于物品嵌入(item embedding)的协同过滤推荐算法是一种行之有效的推荐算法。首先,将文章集(待推荐文本集)映射到同一向量空间上,每篇文章都有一个唯一的向量表示;然后,计算文章集中两两文章之间的相似度,即嵌入(embedding)向量的余弦相似度,例如cos(A,B),cos(A,C),cos(A,D)等。得出每篇文章对应的相似文章集,比如文章A(标准文本)的相似文章集top sim set={B,F,T,E,P};最后,根据用户过去浏览过的历史文章,推荐和历史文章相似的文章集合。
但是,这种基于item embedding的协同过滤推荐算法存在一些问题:
在为不同的用户读过的同一篇历史文章进行文章推荐时,推荐出的相似文章集都是相同的,并不会考虑到用户之间的差异。比如用户U1和用户U2都阅读过文章A,那么给用户U1和用户U2推荐的文章中都会包含文章A的相似文章集top sim set={B,F,T,E,P}。
然而,不同的用户之间是存在差异的,有不同的兴趣倾向。即使用户U1 和用户U2都阅读过文章A,但是,用户U1和用户U2对于文章A的关注点也是有差别的,目前基于itemembedding协同过滤推荐算法并不能考虑到这种差异,而是统一的为用户U1和用户U2推荐文章A的top sim set={B,F,T,E,P},从而会造成推荐的文章不准确。
为了解决上述问题,本发明实施例提出了一种引入注意力机制的item embedding协同过滤推荐算法(基于人工智能的文本推荐方法):首先,将文章集映射到同一向量空间上,每篇文章都有一个唯一的向量表示;其次,为用户推荐与历史阅读过的文章的相似文章集时,例如,用户U1阅读过文章A,在计算历史阅读文章A的相似文章集时,引入注意力机制,将用户U1的兴趣向量引入其中,从而考虑到不同用户之间的个体差异,以及不同用户对于同一篇阅读文章的关注点差异。即引入用户的兴趣向量,计算文章集中两两文章之间的相似度,例如cos(U1+A,B),cos(U1+A,C),cos(U1+A,D),进而为用户U1推荐符合其历史兴趣的、与历史阅读文章A相似的文章集。其中,U1向量是根据该用户的历史阅读文章,注意(attention)到当前要推荐的文章,从而获得用户向量表示。
因此,通过注意力机制,将用户的兴趣向量引入到相似度计算当中后,就引入了用户的个体差异,以及对于同一篇阅读文章的关注点差异,使得推荐的文章集更能贴切用户的真实兴趣。
本发明实施例提出的基于人工智能的文本推荐方法可以应用于新闻的推荐***中,在为用户推荐与历史阅读过的文章相似的文章集时,不是只计算两两文章之间的相似度,而是在计算历史阅读文章A的相似文章集时,引入注意力机制,将当前用户的兴趣向量引入其中,考虑不同用户之间的个体差异,以及不同用户对于同一篇阅读文章的关注点差异。如图7所示,传统推荐方法中,只要用户U1、用户U2和用户U3都阅读过文章A,用户U1、用户U2和用户 U3关于文章A的相似文章计算相同,则向用户U1、用户U2和用户U3推荐的关于文章A的相关文章集相同。而本发明推荐方法中引入注意力机制,用户 U1、用户U2和用户U3关于文章A的相似文章计算不同,在关于文章A的相似文章的计算过程中,引入用户的兴趣向量,则向用户U1、用户U2和用户U 3推荐的关于文章A的相关文章集不同。
因此,通过注意力机制,将用户的兴趣向量引入到相似计算当中后,就引入了用户的个体差异,以及对于同一篇阅读文章的关注点差异,使得推荐的文章集更能贴切用户的真实兴趣。
这里,新闻推荐***通常包含四个模块:用户画像模块(第一处理模块),召回模块,点击通过率(Click-Through-Rate,CTR)预估模块(融合模块、第二处理模块、第三处理模块),重排模块(筛选模块)。如图8所示,图8为本发明实施例提供的新闻推荐***进行个性化推荐流程图,新闻推荐***接到接入层的请求后,先调用画像服务模块,获取到用户的画像(用户兴趣),然后将用户的画像传入到召回模块,召回模块从文章池筛选好粗排的文章(待推荐文章)后输出给CTR预估模块,CTR预估模块对召回的文章进行精排序,最后取精排后的前K个文章至重排模块,重排模块进行最后的过滤(去除用户已经浏览过的文章)和多样性排序,最终输出文章给用户进行文章推荐。
新闻个性化推荐是根据用户的兴趣特点和阅读行为,向用户推荐他们感兴趣的新闻。用户的点击序列对于用户兴趣的挖掘是一个很重要的信息,它既反应了用户的兴趣分布,又隐含了文章之间的关联关系。
基于item embedding的协同过滤推荐算法是通过以下步骤实现文章推荐:
首先,将用户在一个时间段(section)内的点击文章,按照点击时间的先后顺序进行排列,并作为训练样本,输入到word2vec或者其他模型中进行训练,得到文章的向量表示;
然后,计算文章集内两两文章之间的余弦相似度,得出每篇文章对应的相似文章集,比如文章A的相似文章集top sim set={B,F,T,E,P};
最后,针对用户最近浏览过的文章来计算前K个相似的文章,生成文章集,从而推荐给用户。
但是,基于item embedding的协同过滤推荐算法存在一些问题:不能考虑到用户之间存在差异的,有不同的兴趣倾向,而是统一的为用户推荐文章A的相似文章集top simset={B,F,T,E,P},从而造成推荐的不精准。
为了解决上述问题,本发明实施例可以在计算文章A的相似文章集时,引入用户的兴趣向量,计算cos(U1+A,B),cos(U1+A,C),cos(U1+A,D),从而为用户U1推荐符合其历史兴趣的、与其历史阅读文章A相似的文章集。如图9所示,图9为本发明实施例提供的推荐方法改进前后的对比图,其中U1向量是根据该用户的历史阅读文章,attention到当前要推荐的阅读文章,即用户向量表示。
对于用户U1历史阅读过的文章A,J,F,G,…。现要针对文章A,为其推荐相关的文章集,当引入注意力机制后,针对当前要推荐的文章A的用户U 1A的兴趣向量计算如下公式(1)所示:
U1A=J*(exp(cos(J,A))/S)+F*(exp(cos(F,A))/S)+G*(exp(cos(G,A))/S)+...(1)
其中,S=sum(exp(cos(J,A)),exp(cos(F,A)),exp(cos(G,A)),...),A表示文章A向量、 F表示文章F向量、G表示文章G向量,cos(.)表示余弦相似度计算。
对本发明实施例引入注意力机制的item embedding协同过滤推荐算法进行举例说明:
如果有用户U1和用户U2,用户U1偏向于娱乐爱好,用户U2偏向于体育爱好,用户U1和用户U2同时阅读过文章A;
文章A:小明兵乓球比赛惜败。
与文章A向量相似的文章包括如下:
文章B:小明与小红分手多日,近况如何?
文章C:小明已盘算退役?上综艺、开200家茶饮店、还去参观了XX公司。
文章D:小明参与综艺《CC生活》。
文章E:小明4:5惜败业余选手,积极推广国球与粉丝互动。
文章F:小明惜败,对手一细节值得尊重。
传统的item embedding协同过滤推荐算法会为用户U1和用户U2同时推荐B、C、D、E、F文章集。
经过本发明改进,引入用户的兴趣向量后,为用户U1和用户U2推荐的文章集不同:由于用户U1偏向于娱乐爱好,引入用户向量后,将会推荐文章集B、 C、D;由于用户U2偏向于体育爱好,引入用户向量后,将会推荐文章集E、F。
因此,通过注意力机制将用户的兴趣向量引入到相似计算中后,就引入了用户的个体差异,以及对于同一篇阅读文章的关注点差异,使得推荐的文章集更能贴切用户的真实兴趣。
综上所述,本发明实施例通过在标准文本中融入用户兴趣,具有以下有益效果:
1、从目标用户的历史浏览文本集中确定出标准文本,以便后续根据该标准文本确定出目标用户可能感兴趣的推荐文本,提高推荐文本的准确性;
2、在标准文本中融入目标用户针对标准文本的用户兴趣,从而能够根据用户兴趣的个体差异,向用户推荐符合用户兴趣的文本,提高用户体验感。
以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。
Claims (10)
1.一种基于人工智能的文本推荐方法,其特征在于,所述方法包括:
针对目标用户进行文本推荐的请求,从所述目标用户的历史浏览文本集中确定至少一个标准文本;
根据所述标准文本,对待推荐文本集进行召回处理,确定对应所述标准文本的至少一个待推荐文本;
获取所述目标用户针对标准文本的用户兴趣;
对所述用户兴趣、以及所述标准文本进行融合,得到融入用户兴趣的融合文本;
根据所述融入目标用户兴趣的融合文本、以及所述待推荐文本,得到所述待推荐文本与所述标准文本之间的相似度;
基于所述待推荐文本与所述标准文本的相似度,对所述至少一个待推荐文本进行排序,得到与所述标准文本对应的推荐文本;
对至少一个标准文本对应的推荐文本进行筛选,得到用于响应所述请求的推荐文本。
2.根据权利要求1所述的方法,其特征在于,所述从所述目标用户的历史浏览文本集中确定至少一个标准文本,包括以下之一:
对所述目标用户的历史浏览文本集进行筛选,确定设定的时间段内的历史浏览文本为标准文本;
对所述目标用户的历史浏览文本进行筛选,当所述历史浏览文本被所述目标用户使用的时间大于时间阈值,确定所述历史浏览文本为所述标准文本;
对所述目标用户的历史浏览文本进行筛选,当所述历史浏览文本被样本用户使用的频率大于使用频率阈值,确定所述历史浏览文本为所述标准文本。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述标准文本,对待推荐文本集进行召回处理,确定对应所述标准文本的至少一个待推荐文本,包括:
对所述标准文本进行分词处理,得到所述标准文本中的关键词;
根据所述标准文本中的关键词对待推荐文本集进行检索,确定对应所述标准文本的至少一个待推荐文本。
4.根据权利要求1或2所述的方法,其特征在于,所述获取所述目标用户针对标准文本的用户兴趣,包括:
根据所述目标用户的历史浏览文本集中的历史浏览文本、以及所述标准文本,确定所述历史浏览文本与所述标准文本的相似度;
根据至少一个历史浏览文本与所述标准文本的相似度,确定所述目标用户针对标准文本的用户兴趣。
5.根据权利要求4所述的方法,其特征在于,所述根据至少一个历史浏览文本与所述标准文本的相似度,确定所述目标用户针对标准文本的用户兴趣,包括:
对至少一个历史浏览文本与所述标准文本的相似度进行求和,得到相似度总和;
确定所述历史浏览文本与所述标准文本的相似度,并确定所述相似度与所述相似度总和的第一比值;
对所述历史浏览文本、以及所述第一比值进行加权求和,得到所述目标用户针对标准文本的用户兴趣。
6.根据权利要求1或2所述的方法,其特征在于,
所述用户兴趣为用户兴趣向量,所述待推荐文本为待推荐文本向量,所述标准文本为标准文本向量;
所述对所述用户兴趣、以及所述标准文本进行融合,得到融入目标用户兴趣的融合文本,包括:
对所述用户兴趣向量与所述标准文本向量进行求和,得到对应的和向量,确定所述对应的和向量为融入目标用户兴趣的融合文本;
所述根据所述融入目标用户兴趣的融合文本、以及所述待推荐文本,得到所述待推荐文本与所述标准文本之间的相似度,包括:
将所述对应的和向量、以及所述待推荐文本向量之间的相似度,确定为所述待推荐文本与所述标准文本之间的相似度。
7.根据权利要求1或2所述的方法,其特征在于,所述基于所述待推荐文本与所述标准文本的相似度,对所述至少一个待推荐文本进行排序,得到与所述标准文本对应的推荐文本,包括:
获取所述标准文本的权重;
根据权重与推荐文本数量的正比关系、以及所述标准文本的权重,得到所述标准文本对应的推荐文本数量;
基于所述待推荐文本与所述标准文本的相似度,对所述至少一个待推荐文本进行降序排序,得到与所述推荐文本数量对应的推荐文本。
8.根据权利要求7所述的方法,其特征在于,所述获取所述标准文本的权重,包括:
对所述至少一个标准文本被所述目标用户使用的时间进行求和,得到时间总和;
对所述标准文本被所述目标用户使用的时间与所述时间总和进行比值,得到所述标准文本的权重。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对目标用户进行文本推荐的请求,从区块链网络中获取所述目标用户的历史浏览文本集。
10.一种基于人工智能的文本推荐装置,其特征在于,所述装置包括:
确定模块,用于针对目标用户进行文本推荐的请求,从所述目标用户的历史浏览文本集中确定至少一个标准文本;
召回模块,用于根据所述标准文本,对待推荐文本集进行召回处理,确定对应所述标准文本的至少一个待推荐文本;
第一处理模块,用于获取所述目标用户针对标准文本的用户兴趣;
融合模块,用于对所述用户兴趣、以及所述标准文本进行融合,得到融入用户兴趣的融合文本;
第二处理模块,用于根据所述融入目标用户兴趣的融合文本、以及所述待推荐文本,得到所述待推荐文本与所述标准文本之间的相似度;
第三处理模块,用于基于所述待推荐文本与所述标准文本的相似度,对所述至少一个待推荐文本进行排序,得到与所述标准文本对应的推荐文本;
筛选模块,用于对至少一个标准文本对应的推荐文本进行筛选,得到用于响应所述请求的推荐文本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910901147.0A CN110688476B (zh) | 2019-09-23 | 2019-09-23 | 一种基于人工智能的文本推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910901147.0A CN110688476B (zh) | 2019-09-23 | 2019-09-23 | 一种基于人工智能的文本推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110688476A true CN110688476A (zh) | 2020-01-14 |
CN110688476B CN110688476B (zh) | 2024-06-25 |
Family
ID=69110079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910901147.0A Active CN110688476B (zh) | 2019-09-23 | 2019-09-23 | 一种基于人工智能的文本推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110688476B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310056A (zh) * | 2020-03-11 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置、设备及存储介质 |
CN111310436A (zh) * | 2020-02-11 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的文本处理方法、装置及电子设备 |
CN111475721A (zh) * | 2020-03-31 | 2020-07-31 | 百度在线网络技术(北京)有限公司 | 信息推送方法、装置、设备及存储介质 |
CN111563198A (zh) * | 2020-04-16 | 2020-08-21 | 百度在线网络技术(北京)有限公司 | 一种物料召回方法、装置、设备及存储介质 |
CN111859147A (zh) * | 2020-07-31 | 2020-10-30 | 中国工商银行股份有限公司 | 对象推荐方法、对象推荐装置和电子设备 |
CN112101008A (zh) * | 2020-09-27 | 2020-12-18 | 北京百度网讯科技有限公司 | 一种文本热度确定方法、装置、电子设备和存储介质 |
CN112559899A (zh) * | 2021-02-25 | 2021-03-26 | 北京睿企信息科技有限公司 | 一种用户画像生成方法 |
CN113051475A (zh) * | 2021-03-25 | 2021-06-29 | 平安银行股份有限公司 | 内容推荐方法、装置、电子设备及可读存储介质 |
CN113420203A (zh) * | 2021-05-18 | 2021-09-21 | 北京达佳互联信息技术有限公司 | 对象推荐方法、装置、电子设备及存储介质 |
CN113536785A (zh) * | 2021-06-15 | 2021-10-22 | 合肥讯飞数码科技有限公司 | 一种文本推荐方法、智能终端及计算机可读存储介质 |
CN114780844A (zh) * | 2022-04-21 | 2022-07-22 | 杭州樱熊网络科技有限公司 | 基于用户习惯的小说推荐方法及*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106815297A (zh) * | 2016-12-09 | 2017-06-09 | 宁波大学 | 一种学术资源推荐服务***与方法 |
CN107562939A (zh) * | 2017-09-21 | 2018-01-09 | 深圳市傲天科技股份有限公司 | 垂直领域新闻推荐方法、装置及可读储存介质 |
US20180068371A1 (en) * | 2016-09-08 | 2018-03-08 | Adobe Systems Incorporated | Learning Vector-Space Representations of Items for Recommendations using Word Embedding Models |
US20180253496A1 (en) * | 2017-02-28 | 2018-09-06 | Laserlike Inc. | Interest embedding vectors |
CN108920649A (zh) * | 2018-06-29 | 2018-11-30 | 北京百度网讯科技有限公司 | 一种信息推荐方法、装置、设备和介质 |
CN110046304A (zh) * | 2019-04-18 | 2019-07-23 | 腾讯科技(深圳)有限公司 | 一种用户推荐方法和装置 |
-
2019
- 2019-09-23 CN CN201910901147.0A patent/CN110688476B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180068371A1 (en) * | 2016-09-08 | 2018-03-08 | Adobe Systems Incorporated | Learning Vector-Space Representations of Items for Recommendations using Word Embedding Models |
CN106815297A (zh) * | 2016-12-09 | 2017-06-09 | 宁波大学 | 一种学术资源推荐服务***与方法 |
US20180253496A1 (en) * | 2017-02-28 | 2018-09-06 | Laserlike Inc. | Interest embedding vectors |
CN107562939A (zh) * | 2017-09-21 | 2018-01-09 | 深圳市傲天科技股份有限公司 | 垂直领域新闻推荐方法、装置及可读储存介质 |
CN108920649A (zh) * | 2018-06-29 | 2018-11-30 | 北京百度网讯科技有限公司 | 一种信息推荐方法、装置、设备和介质 |
CN110046304A (zh) * | 2019-04-18 | 2019-07-23 | 腾讯科技(深圳)有限公司 | 一种用户推荐方法和装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310436B (zh) * | 2020-02-11 | 2022-02-15 | 腾讯科技(深圳)有限公司 | 基于人工智能的文本处理方法、装置及电子设备 |
CN111310436A (zh) * | 2020-02-11 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的文本处理方法、装置及电子设备 |
CN111310056A (zh) * | 2020-03-11 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置、设备及存储介质 |
CN111310056B (zh) * | 2020-03-11 | 2023-04-14 | 深圳市雅阅科技有限公司 | 基于人工智能的信息推荐方法、装置、设备及存储介质 |
CN111475721A (zh) * | 2020-03-31 | 2020-07-31 | 百度在线网络技术(北京)有限公司 | 信息推送方法、装置、设备及存储介质 |
CN111475721B (zh) * | 2020-03-31 | 2023-12-29 | 百度在线网络技术(北京)有限公司 | 信息推送方法、装置、设备及存储介质 |
CN111563198A (zh) * | 2020-04-16 | 2020-08-21 | 百度在线网络技术(北京)有限公司 | 一种物料召回方法、装置、设备及存储介质 |
CN111859147A (zh) * | 2020-07-31 | 2020-10-30 | 中国工商银行股份有限公司 | 对象推荐方法、对象推荐装置和电子设备 |
CN111859147B (zh) * | 2020-07-31 | 2023-08-22 | 中国工商银行股份有限公司 | 对象推荐方法、对象推荐装置和电子设备 |
CN112101008A (zh) * | 2020-09-27 | 2020-12-18 | 北京百度网讯科技有限公司 | 一种文本热度确定方法、装置、电子设备和存储介质 |
CN112559899A (zh) * | 2021-02-25 | 2021-03-26 | 北京睿企信息科技有限公司 | 一种用户画像生成方法 |
CN113051475A (zh) * | 2021-03-25 | 2021-06-29 | 平安银行股份有限公司 | 内容推荐方法、装置、电子设备及可读存储介质 |
CN113051475B (zh) * | 2021-03-25 | 2023-05-23 | 平安银行股份有限公司 | 内容推荐方法、装置、电子设备及可读存储介质 |
CN113420203A (zh) * | 2021-05-18 | 2021-09-21 | 北京达佳互联信息技术有限公司 | 对象推荐方法、装置、电子设备及存储介质 |
CN113420203B (zh) * | 2021-05-18 | 2024-05-24 | 北京达佳互联信息技术有限公司 | 对象推荐方法、装置、电子设备及存储介质 |
CN113536785A (zh) * | 2021-06-15 | 2021-10-22 | 合肥讯飞数码科技有限公司 | 一种文本推荐方法、智能终端及计算机可读存储介质 |
CN114780844A (zh) * | 2022-04-21 | 2022-07-22 | 杭州樱熊网络科技有限公司 | 基于用户习惯的小说推荐方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN110688476B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110688476B (zh) | 一种基于人工智能的文本推荐方法及装置 | |
CN111680221B (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
CN110139162B (zh) | 媒体内容的共享方法和装置、存储介质、电子装置 | |
Li et al. | Understanding the long-term evolution of mobile app usage | |
US20110082848A1 (en) | Systems, methods and computer program products for search results management | |
CN110020188A (zh) | 基于隐式交互和简档数据的全局向量推荐 | |
CN110597962B (zh) | 搜索结果展示方法、装置、介质及电子设备 | |
CN111818370B (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
CN110825956A (zh) | 一种信息流推荐方法、装置、计算机设备及存储介质 | |
CN107209905A (zh) | 针对个性化和任务完成服务而对应用去主题归类 | |
CN106104522B (zh) | 用于加强任意用户内容的方法、***和计算机存储设备 | |
US20160162583A1 (en) | Apparatus and method for searching information using graphical user interface | |
CN113536098A (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
CN111967914A (zh) | 基于用户画像的推荐方法、装置、计算机设备和存储介质 | |
US10474670B1 (en) | Category predictions with browse node probabilities | |
Wang et al. | CROWN: a context-aware recommender for web news | |
CN111159570A (zh) | 一种信息推荐方法及服务器 | |
CN112868003A (zh) | 使用用户互动度的基于实体的搜索*** | |
US20140122384A1 (en) | System and method for visually tracking a learned process | |
KR20180000166A (ko) | 관심사 및 콘텐츠를 제공하는 방법 및 시스템 | |
CN116089745A (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
US10387934B1 (en) | Method medium and system for category prediction for a changed shopping mission | |
US10248983B1 (en) | Customized item descriptions based on skill level | |
Atta | The effect of usability and information quality on decision support information system (DSS) | |
CN111399731B (zh) | 图片的操作意图处理方法、推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |