具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。
请参见图1,为本说明书实施例的新闻推荐的场景示意图。终端100位于用户侧,与网络侧的服务器200通信。终端100中的客户端101可以是基于互联网实现业务的APP或网站,为用户提供新闻浏览或交易的界面并将用户相关操作数据提供给网络侧进行处理;服务器200中的新闻推荐控制装置201利用收集到的用户相关操作信息,为用户进行有针对性的新闻推荐。
第一方面,本说明书实施例提供一种新闻推荐方法,请参考图2,包括步骤S201-S206。
S201:获取目标用户针对新闻操作的行为偏好特征。
在各类基于互联网的APP中,用户可针对兴趣点对各类咨询或新闻或工具进行诸多操作。例如,在新闻头条等新闻类APP中,用户会浏览并点击感兴趣的新闻;在金融产品APP中,用户可能会浏览有关某款理财产品的咨询或产品介绍等内容,或者进行理财产品购买等操作。
如图1所示的应用场景,在服务器侧获取到终端提供的有关用户针对新闻操作的操作信息,服务器可对历史一段时间内有关目标用户的操作信息进行分析和特征提取,从而获取到目标用户的行为偏好特征。行为偏好特征是指具有一定时序关系且反映用户针对感兴趣的新闻类型的操作信息的特征。
在一种可选方式中,通过以下方式得到行为偏好特征:
(1)记录用户针对新闻操作的用户行为特征;
例如,在金融类APP中,用户行为特征包括但不限于点击、浏览、加自选、购买、赎回等操作的行为特征。
(2)根据用户行为特征,通过傅立叶变换或长短期记忆网络构造出行为偏好特征。
为了分析用户行为特征的时序特性,可通过例如傅立叶变换或长短期记忆网络等方式,构造出体验特征中时序关系的行为偏好特征。
S202:根据新闻知识库,确定出用户行为特征对应的用户兴趣子领域标签。
由于用户的行为偏好特征可以体现出用户针对感兴趣的新闻的操作,因此可以根据对行为偏好特征的分析,确定出用户感兴趣的新闻类型以及该类型下新闻的各个领域关键字。
新闻知识库可以是预先通过学习等方式建立的存储有各个新闻类型以及各新闻类型下新闻子领域信息的一个数据库。
在一种可选方式中,通过以下方式确定目标用户的用户兴趣子领域标签:
(1)根据用户行为偏好特征,从新闻知识库中确定出用户偏好的新闻类型以及该新闻类型下的新闻子领域信息;
(2)根据用户偏好的新闻类型以及该新闻类型下的新闻子领域信息,统计并筛选出用户兴趣子领域标签。
仍以金融类APP中金融类新闻为例,可通过用户的行为偏好,筛选出用户感兴趣的金融类新闻的各个子领域,例如确定出的用户兴趣子领域标签包括:某公司、医疗行业、电池、营业收入、财务报表等。当然,新闻类型还可以包括时政新闻、娱乐新闻、体育新闻等类型。
S203:召回行为偏好特征对应的多条新闻。
具体的,可从互联网或服务器获取行为偏好特征对应的多条新闻。例如,目标用户的行为偏好特征表明该用户对某个理财产品感兴趣,则可召回有关该理财产品的相关新闻(理财产品介绍、历史收入、用户评价等)。
S204:针对召回的多条新闻,对用户兴趣子领域标签中各个子领域对应的新闻进行正负面分析,得到各个子领域对应新闻的正负面分值。
在一种可选方式中,通过以下方式得到新闻的正负面分值:
(1)获取用户兴趣子领域标签中各个子领域对应的新闻文本;
(2)针对新闻文本,通过句法分析或深度学习网络,得到新闻的正负面分值。
例如,通过前序步骤确定出目标用户的用户兴趣子领域标签包括某公司及医疗行业,则从召回的新闻中选取出涉及该公司以及医疗行业的相关新闻;然后获取新闻文本;针对新闻文本,利用句法分析或深度学习网络的方式,确定出新闻文本中包括的正面或负面的关键词,例如如果新闻文本中包括“盈利”等词汇或语义,则确定包括正面关键词;反之,如果包括“亏损”等词汇或语义,则确定包括负面关键词。
S205:根据新闻的正负面分值,对新闻进行排序和过滤操作。
在一种可选方式中,通过以下方式实现对新闻的排序和过滤操作:
(1)对于具有正分值的新闻,按照分值顺序对新闻进行排序;并且,对于正分值差值小于预置的最低差值阈值的两条新闻,任意删除一条新闻;
(2)对于具有负分值的新闻,按照分值顺序对新闻进行排序;并且,对于负分值差值小于预置的最低差值阈值的两条新闻,任意删除一条新闻。
例如,针对目标用户得到了共计10条正分值的新闻和5条负分值的新闻。对于正分值的新闻,首先按照分值从高至低(也可以从低至高)进行新闻排序;然后,对每两条相邻的新闻的分值进行比较,如果有两条新闻分值过于接近,差值小于最低差值阈值(例如差值小于2分),则从这两条新闻中删除一条新闻,通过新闻过滤操作去除冗余。
S206:向目标用户展示携带有用户兴趣子领域标签及正负面分值的新闻流。
在对新闻进行排序和过滤后,保留下来的新闻即是向用户推荐的新闻。为了向目标用户有针对性及引导性的推荐,在展示新闻流时,在每条新闻上携带有子领域标签以及该条新闻的正负面分值。这种“子领域标签”及“正负面分值”的形式,可以理解为向用户展示新闻的同时给出展示“理由”,以吸引用户点击新闻进行查阅,从而提高新闻推荐有效率。
可见,本发明实施例通过向用户展示感兴趣的新闻,实现对目标用户进行有针对性的推荐;同时通过新闻正负面分值,实现对目标用户有引导性的新闻推荐。
参见图3,为本说明书实施例第一方面提供的新闻推荐方法实例示意图。该实例以金融类新闻对本发明实施例进行示意性说明。
首先,根据用户加自选/购买产品等行为以及金融知识库,确定出用户感兴趣的金融新闻的用户兴趣子领域标签(步骤1-3);然后,依据用户加自选/购买产品等行为,从互联网等途径召回多条新闻(步骤4);继而,对召回的新闻进行逐条的正负面分析(步骤5);然后,基于新闻子领域以及正负面分值对新闻进行排序和过滤(步骤6);最后,对新闻基于新闻子领域以及正负面分值(理由标签)进行展示。
在本发明实施例中,可以将“新闻子领域”以及“正负面分值”组合得到的标签理解为一种“理由标签”。该理由标签不是给出例如股价上升/下降的简单判断,而是根据用户行为偏好和新闻内容涉及的金融子领域标签,结合新闻中对这个子领域的正负面判断。比如,某篇新闻是关于一家上市公司的财报,并且认为这家公司的财报状况不佳,那么生成的理由标签可能即使“财报_负面值”,依据这样的理由标签,在对召回的新闻进行排序时,就可以根据用户是不是对财报这个子领域感兴趣(通过用户历史行为学习到子领域标签),结合正负面判断的分值,对新闻进行排序。最终在展示页面上,用户通过这样的理由标签,来判断这篇新闻是不是他感兴趣的文章。
第二方面,基于同一发明构思,本说明书实施例提供一种新闻推荐装置,请参考图4,包括:
特征确定单元401,用于获取目标用户针对新闻操作的行为偏好特征;
领域确定单元402,用于根据新闻知识库,确定出所述行为偏好特征对应的用户兴趣子领域标签;
新闻召回单元403,用于召回所述行为偏好特征对应的多条新闻;
正负面分析单元404,用于针对召回的多条新闻,对所述用户兴趣子领域标签中各个子领域对应的新闻进行正负面分析,得到各个子领域对应新闻的正负面分值;
新闻排序过滤单元405,用于根据所述新闻的正负面分值,对所述新闻进行排序和过滤操作;
新闻展示单元406,用于向所述目标用户展示携带有用户兴趣子领域标签及正负面分值的新闻流。
在一种可选方式中,所述特征确定单元401具体用于:记录用户针对新闻操作的用户行为特征;根据所述用户行为特征,通过傅立叶变换或长短期记忆网络构造出所述行为偏好特征。
在一种可选方式中,所述领域确定单元402具体用于:根据所述用户行为偏好特征,从所述根据新闻知识库确定出用户偏好的新闻类型以及该新闻类型下的新闻子领域信息;根据用户偏好的新闻类型以及该新闻类型下的新闻子领域信息,统计并筛选出所述用户兴趣子领域标签。
在一种可选方式中,所述正负面分析单元403具体用于:获取所述用户兴趣子领域标签中各个子领域对应的新闻文本;针对所述新闻文本,通过句法分析或深度学习网络,得到所述新闻的正负面分值。
在一种可选方式中,所述新闻排序过滤单元405具体用于:
对于具有正分值的新闻,按照分值顺序对新闻进行排序;并且,对于正分值差值小于预置的最低差值阈值的两条新闻,任意删除一条新闻;
对于具有负分值的新闻,按照分值顺序对新闻进行排序;并且,对于负分值差值小于预置的最低差值阈值的两条新闻,任意删除一条新闻。
第三方面,基于与前述实施例中新闻推荐方法同样的发明构思,本发明还提供一种服务器,如图5所示,包括存储器504、处理器502及存储在存储器504上并可在处理器502上运行的计算机程序,所述处理器502执行所述程序时实现前文所述新闻推荐方法的任一方法的步骤。
其中,在图5中,总线架构(用总线500来代表),总线500可以包括任意数量的互联的总线和桥,总线500将包括由处理器502代表的一个或多个处理器和存储器504代表的存储器的各种电路链接在一起。总线500还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口506在总线500和接收器501和发送器503之间提供接口。接收器501和发送器503可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器502负责管理总线500和通常的处理,而存储器504可以被用于存储处理器502在执行操作时所使用的数据。
第四方面,基于与前述实施例中新闻推荐方法的发明构思,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述新闻推荐方法的任一方法的步骤。
本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。