CN111666522A - 信息处理方法、装置、设备和存储介质 - Google Patents

信息处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111666522A
CN111666522A CN202010527041.1A CN202010527041A CN111666522A CN 111666522 A CN111666522 A CN 111666522A CN 202010527041 A CN202010527041 A CN 202010527041A CN 111666522 A CN111666522 A CN 111666522A
Authority
CN
China
Prior art keywords
information
recommended
historical
browsing
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010527041.1A
Other languages
English (en)
Inventor
张发恩
王一川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Innovation Wisdom Shanghai Technology Co ltd
AInnovation Shanghai Technology Co Ltd
Original Assignee
Innovation Wisdom Shanghai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Innovation Wisdom Shanghai Technology Co ltd filed Critical Innovation Wisdom Shanghai Technology Co ltd
Priority to CN202010527041.1A priority Critical patent/CN111666522A/zh
Publication of CN111666522A publication Critical patent/CN111666522A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种信息处理方法、装置、设备和存储介质,方法包括:获取在已过去的预设时间段内目标用户浏览信息的历史浏览记录,和待推荐信息集;识别所述历史浏览记录的历史主题分布信息,并识别所述待推荐信息集的待推荐主题分布信息;根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息。本申请实现了根据目标用户对信息的历史浏览记录和待推荐信息集的主题分布信息,从待推荐信息集中选取合适的目标推荐信息,提高了信息推荐的有效性。

Description

信息处理方法、装置、设备和存储介质
技术领域
本申请涉及信息处理技术领域,具体而言,涉及一种信息处理方法、装置、设备和存储介质。
背景技术
互联网规模和信息资源的迅猛增长带来了信息过载的问题,如何获取所需信息日益困难。以“信息推送”为服务模式的信息推荐***,是当前解决信息过载问题的主要手段。信息推荐(Information Recommendation)是指***向用户推荐用户可能感兴趣但又无法获取的有用信息,它的实现主要依靠推荐***。
随着互联网信息服务的发展,用户迫切需求更加准确的信息推荐服务,如何提高信息推荐的准确率成为亟待解决的问题。
发明内容
本申请实施例的目的在于提供一种信息处理方法、装置、设备和存储介质,用以实现根据目标用户对信息的历史浏览记录和待推荐信息集的主题分布信息,从待推荐信息集中选取合适的目标推荐信息。
本申请实施例历史方面提供了一种信息处理方法,包括:获取在已过去的预设时间段内目标用户浏览信息的历史浏览记录,和待推荐信息集;识别所述历史浏览记录的历史主题分布信息,并识别所述待推荐信息集的待推荐主题分布信息;根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息。
于一实施例中,所述识别所述历史浏览记录的历史主题分布信息,包括:解析所述历史浏览记录,得到所述目标用户的浏览信息内容和浏览状态信息;将所述浏览信息内容和所述浏览状态信息转换成文本,生成历史浏览文本信息;将所述历史浏览文本信息输入至预设识别模型,输出所述历史主题分布信息。
于一实施例中,所述识别所述待推荐信息集的待推荐主题分布信息,包括:解析所述待推荐信息集,得到每条信息内容和所述每条信息内容被浏览时的状态信息;将所述每条信息内容和所述每条信息内容被浏览时的状态信息转换成文本,生成待推荐文本信息;将所述待推荐文本信息输入至预设识别模型,输出所述待推荐主题分布信息。
于一实施例中,建立所述预设识别模型的步骤包括:获取不同用户对多个样本信息的浏览记录数据集;解析所述记录数据集,从中提取每个所述样本信息的内容和每个所述样本信息被浏览时的状态信息;将每个所述样本信息的内容和每个所述样本信息被浏览时的状态信息转换成文本,生成样本文本信息;藉由所述样本文本信息训练主题模型,生成所述预设识别模型。
于一实施例中,所述根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息,包括:计算所述历史主题分布信息和所述待推荐主题分布信息的相似度;将所述待推荐信息集中的每条信息按照所述相似度由大到小排序,从所述待推荐信息集中选取所述相似度排在前预设名次的至少一条信息作为目标推荐信息。
于一实施例中,在所述根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息之后,还包括:将所述目标推荐信息推送至所述目标用户的终端。
于一实施例中,在所述将所述目标推荐信息推送至所述目标用户的终端之前,还包括:剔除所述目标推荐信息中已被所述目标用户浏览过的信息。
本申请实施例待推荐方面提供了一种信息处理装置,包括:获取模块,用于获取在已过去的预设时间段内目标用户浏览信息的历史浏览记录,和待推荐信息集;识别模块,用于识别所述历史浏览记录的历史主题分布信息,并识别所述待推荐信息集的待推荐主题分布信息;选取模块,用于根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息。
于一实施例中,所述识别模块用于:解析所述历史浏览记录,得到所述目标用户的浏览信息内容和浏览状态信息;将所述浏览信息内容和所述浏览状态信息转换成文本,生成历史浏览文本信息;将所述历史浏览文本信息输入至预设识别模型,输出所述历史主题分布信息。
于一实施例中,所述识别模块用于:解析所述待推荐信息集,得到每条信息内容和所述每条信息内容被浏览时的状态信息;将所述每条信息内容和所述每条信息内容被浏览时的状态信息转换成文本,生成待推荐文本信息;将所述待推荐文本信息输入至预设识别模型,输出所述待推荐主题分布信息。
于一实施例中,还包括建立模块,用于:获取不同用户对多个样本信息的浏览记录数据集;解析所述记录数据集,从中提取每个所述样本信息的内容和每个所述样本信息被浏览时的状态信息;将每个所述样本信息的内容和每个所述样本信息被浏览时的状态信息转换成文本,生成样本文本信息;藉由所述样本文本信息训练主题模型,生成所述预设识别模型。
于一实施例中,所述选取模块用于:计算所述历史主题分布信息和所述待推荐主题分布信息的相似度;将所述待推荐信息集中的每条信息按照所述相似度由大到小排序,从所述待推荐信息集中选取所述相似度排在前预设名次的至少一条信息作为目标推荐信息。
于一实施例中,还包括:推送模块,用于在所述根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息之后,将所述目标推荐信息推送至所述目标用户的终端。
于一实施例中,还包括:剔除模块,用于在所述将所述目标推荐信息推送至所述目标用户的终端之前,剔除所述目标推荐信息中已被所述目标用户浏览过的信息。
本申请实施例第三方面提供了一种电子设备,包括:存储器,用以存储计算机程序;处理器,用以执行本申请实施例历史方面及其任一实施例的方法,以从待推荐信息集中确定对应于目标用户的目标推荐信息。
本申请实施例第四方面提供了一种非暂态电子设备可读存储介质,包括:程序,当其藉由电子设备运行时,使得所述电子设备执行本申请实施例第一方面及其任一实施例的方法。
本申请提供的信息处理方法、装置、设备和存储介质,通过对在已过去的预设时间段内目标用户浏览信息的历史浏览记录进行主题识别,得到对应的历史主题分布信息,并对待推荐信息集进行主题识别,得到待推荐主题分布信息,然后根据历史主题分布信息和待推荐主题分布信息,从待推荐信息集中确定对应于目标用户的目标推荐信息,综合考虑目标用户的浏览历史,确定更加准确的目标推荐信息。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例的电子设备的结构示意图;
图2为本申请一实施例的信息处理方法的流程示意图;
图3为本申请一实施例的信息处理方法的流程示意图;
图4为本申请一实施例的信息处理装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。在本申请的描述中,术语“历史”、“待推荐”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
如图1所示,本实施例提供一种电子设备1,包括:至少一个处理器11和存储器12,图1中以一个处理器为例。处理器11和存储器12通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行,以使电子设备1可执行下述的实施例中方法的全部或部分流程,以从待推荐信息集中确定对应于目标用户的目标推荐信息。
于一实施例中,电子设备1可以是手机、笔记本电脑、台式计算机等设备。
请参看图2,其为本申请一实施例的信息处理方法,该方法可由图1所示的电子设备1来执行,并可应用于信息推送的场景中,以实现根据目标用户浏览信息的历史浏览记录和待推荐信息集的主题分部信息,从待推荐信息集中确定对应于目标用户的目标推荐信息。该方法包括如下步骤:
步骤201:获取在已过去的预设时间段内目标用户浏览信息的历史浏览记录,和待推荐信息集。
在本步骤中,在信息推送的场景中,目标用户可以是通过终端登录某个信息页面的账户,用户登录后,可以浏览相关信息。比如目标用户A登录新闻网站B,在新闻网站B内浏览新闻信息。预设时间段是相对于当前时刻已经过去的时间段,可以基于实际场景而定,假设预设时间段为10秒,则历史浏览记录就是该目标用户A最近10秒内的浏览信息的历史记录。被浏览的信息可以是文本、短视频、图像等信息。待推荐信息集可以是某个信息平台要推送给用户的信息集合,该集合中可以包括多种信息内容,其中信息可以是文本、视频和图像等形式。
于一实施例中,历史浏览记录也可以是目标用户最近浏览的预设条数的信息记录。
步骤202:识别历史浏览记录的历史主题分布信息,并识别待推荐信息集的待推荐主题分布信息。
在本步骤中,同一个目标用户的历史浏览记录中,会存在具有该目标用户浏览喜好的主题信息,通过对历史浏览记录进行主题识别,从中得到目标用户关注的主题分布信息,即历史主题分部信息。同时,对待推荐信息集中的每个信息进行主题识别,得到对应的主题分部信息,即待推荐主题分部信息。
步骤203:根据历史主题分布信息和待推荐主题分布信息,从待推荐信息集中选取目标推荐信息。
在本步骤中,同时考虑历史主题分布信息和待推荐主题分布信息的关联性,从待推荐信息集中选出目标用户感兴趣的信息作为目标推荐信息。进而实现信息推送的准确性,避免浪费资源。
上述信息处理方法,通过对在已过去的预设时间段内目标用户浏览信息的历史浏览记录进行主题识别,得到对应的历史主题分布信息,并对待推荐信息集进行主题识别,得到待推荐主题分布信息,然后根据历史主题分布信息和待推荐主题分布信息,从待推荐信息集中确定对应于目标用户的目标推荐信息,综合考虑目标用户的浏览历史,确定更加准确的目标推荐信息。
请参看图3,其为本申请一实施例的信息处理方法,该方法可由图1所示的电子设备1来执行,并可应用于信息推送的场景中,以实现根据目标用户浏览信息的历史浏览记录和待推荐信息集的主题分部信息,从待推荐信息集中确定对应于目标用户的目标推荐信息。该方法包括如下步骤:
步骤301:获取不同用户对多个样本信息的浏览记录数据集。
在本步骤中,可以首先基于大数据建立用于主题识别的预设识别模型。具体的,可以通过大数据获取大量不同用户浏览信息的记录。比如某个地区所有用户浏览新闻信息的浏览记录数据集合。样本信息可以是新闻、影视剧、书籍等信息。
步骤302:解析记录数据集,从中提取每个样本信息的内容和每个样本信息被浏览时的状态信息。
在本步骤中,记录数据集是历史数据,比如基于不同用户在信息平台的点击历史数据,包括被点击浏览的文本标题、短视频、图像等资源,其中包含不同用户的浏览的样本信息的内容和每个样本信息被浏览时的状态信息。状态信息可以是用户浏览样本信息时所处的时间信息和/或位置信息。
步骤303:将每个样本信息的内容和每个样本信息被浏览时的状态信息转换成文本,生成样本文本信息。
在本步骤中,可以从被点击浏览的文本标题、短视频、图像等资源中,提取文本描述,并对文本描述进行分词,并将用户浏览样本信息时所处状态信息转化为文本数据,比如时间信息可以对应转换为“上午、下午、傍晚、晚上”,地点信息可以对应转化为:北京、上海等城市名称。然后将分词后的数据和状态信息转化来的文本数据融合为同一个文本,作为样本文本信息。
步骤304:藉由样本文本信息训练主题模型,生成预设识别模型。
在本步骤中,将步骤303中得到的样本文本信息,输入至主题模型(Topic Model,是以非监督学习的方式对文集的隐含语义结构进行聚类的统计模型)进行训练,最终生成可以识别信息的主题分布信息的预设识别模型。
步骤305:获取在已过去的预设时间段内目标用户浏览信息的历史浏览记录,和待推荐信息集。详细参见上述实施例中对步骤201的描述。
步骤306:解析历史浏览记录,得到目标用户的浏览信息内容和浏览状态信息。
在本步骤中,可以对目标用户最近预设条数(比如最近10条)的历史浏览记录进行数据解析,历史浏览记录中包含目标用户的浏览信息的内容和每个信息被浏览时的状态信息,可以从解析结果中提取上述浏览信息的内容和每个信息被浏览时的状态信息。状态信息可以是目标用户浏览信息时所处的时间信息和/或位置信息。
步骤307:将浏览信息内容和浏览状态信息转换成文本,生成历史浏览文本信息。
在本步骤中,浏览信息内容可以是文本、短视频、图像等形式,可以从中浏览信息内容中提取文本描述部分,然后对文本描述部分进行分词处理,记录分词后的结果数据。并将目标用户点击浏览信息内容时所处的状态信息转化为文本数据,比如:时间信息可以对应转换为上午、下午、傍晚、晚上,位置信息可以对应转化为:北京、上海等城市名称。然后将浏览信息内容的分词结果数据和该浏览信息对应的状态信息转化后的文本数据,融合成为同一个文本,作为历史浏览文本信息。
步骤308:将历史浏览文本信息输入至预设识别模型,输出历史主题分布信息。
在本步骤中,使用步骤304中的预设识别模型对历史浏览文本信息进行识别,可以得到目标用户的历史浏览记录对应的主题分布向量,以此作为历史主题分布信息。
步骤309:解析待推荐信息集,得到每条信息内容和每条信息内容被浏览时的状态信息。
在本步骤中,对于待推荐信息集,其中的每条信息可能已被某个用户浏览过,也可能是全新未被浏览的信息,待推荐信息集中会记录每条待推荐信息被浏览的数据,包含被浏览的待推荐信息的内容和该待推荐信息被浏览时的状态信息,状态信息可以是时间信息和/或位置信息。通过对待推荐信息集进行数据解析,可以从中得到其中每条信息内容和每条信息内容被浏览时的状态信息。
步骤310:将每条信息内容和每条信息内容被浏览时的状态信息转换成文本,生成待推荐文本信息。
在本步骤中,待推荐信息内容可以是文本、短视频、图像等形式,可以从中待推荐信息内容中提取文本描述部分,然后对文本描述部分进行分词处理,记录分词后的结果数据。并将待推荐信息内容被浏览时所处的状态信息转化为文本数据,比如:时间信息可以对应转换为上午、下午、傍晚、晚上,位置信息可以对应转化为:北京、上海等城市名称。如果没有用户浏览过该待推荐信息,则该待推荐信息对应的状态信息为空。最后将待推荐信息内容的分词结果数据和该待推荐信息对应的状态信息转化后的文本数据,融合成为同一个文本,以此作为待推荐文本信息。
步骤311:将待推荐文本信息输入至预设识别模型,输出待推荐主题分布信息。
在本步骤中,使用步骤304中的预设识别模型对待推荐文本信息进行主题识别,可以得到待推荐文本信息对应的主题分布向量,以此作为待推荐主题分布信息。
于一实施例中,步骤306至步骤308与步骤309至步骤311的执行顺序可以调换,即可以先识别历史主题分布信息,也可以先识别待推荐主题分布信息,也可以二者同时进行。
步骤312:计算历史主题分布信息和待推荐主题分布信息的相似度。
在本步骤中,在信息推荐场景中,选取目标用户感兴趣的信息进行有目的的推送,降低无效推送,提高信息资源利用率。与目标用户的历史浏览记录相似的待推荐信息很可能是目标用户感兴趣的信息,因此可以通过计算历史主题分布信息和待推荐主题分布信息的相似度,来确定目标用户是否有对待推荐信息感兴趣。于一实施例中相似度可以是余弦相似度。
步骤313:将待推荐信息集中的每条信息按照相似度由大到小排序,从待推荐信息集中选取相似度排在前预设名次的至少一条信息作为目标推荐信息。
在本步骤中,待推荐信息集中可以包含多条待推荐信息,每一条待推荐信息对应的主题分部信息与目标用户的历史浏览记录的相似度有可能不一样,可以按照相似度从大到小,将所有待推荐信息进行排序,从中选取相似度较大的几条待推荐信息作为目标推荐信息。
步骤314:剔除目标推荐信息中已被目标用户浏览过的信息。
在本步骤中,对于选出来的目标推荐信息可以包含多条信息,其中可能包括目标用户已经看过的信息,为了进一步提高信息推荐准确率,从中剔除掉已被目标用户浏览过的信息,剩余的信息组成最终的目标推荐信息。
步骤315:将目标推荐信息推送至目标用户的终端。
在本步骤中,将步骤314中得到的最终的目标推荐信息发送至目标用户对应的终端,以供目标用户通过终端查阅目标推荐信息。
请参看图4,其为本申请一实施例的信息处理装置400,该装置可应用于图1所示的电子设备1,并可应用于信息推送的场景中,以实现根据目标用户浏览信息的历史浏览记录和待推荐信息集的主题分部信息,从待推荐信息集中确定对应于目标用户的目标推荐信息。该装置包括:获取模块401、识别模块402和选取模块403,各个模块的原理关系如下:
获取模块401,用于获取在已过去的预设时间段内目标用户浏览信息的历史浏览记录,和待推荐信息集。详细参见上述实施例中对步骤201的描述。
识别模块402,用于识别历史浏览记录的历史主题分布信息,并识别待推荐信息集的待推荐主题分布信息。详细参见上述实施例中对步骤202的描述。
选取模块403,用于根据历史主题分布信息和待推荐主题分布信息,从待推荐信息集中选取目标推荐信息。详细参见上述实施例中对步骤203的描述。
于一实施例中,识别模块402用于:解析历史浏览记录,得到目标用户的浏览信息内容和浏览状态信息。将浏览信息内容和浏览状态信息转换成文本,生成历史浏览文本信息。将历史浏览文本信息输入至预设识别模型,输出历史主题分布信息。详细参见上述实施例中对步骤306至步骤308的描述。
于一实施例中,识别模块402用于:解析待推荐信息集,得到每条信息内容和每条信息内容被浏览时的状态信息。将每条信息内容和每条信息内容被浏览时的状态信息转换成文本,生成待推荐文本信息。将待推荐文本信息输入至预设识别模型,输出待推荐主题分布信息。详细参见上述实施例中对步骤309至步骤311的描述。
于一实施例中,还包括建立模块404,用于:获取不同用户对多个样本信息的浏览记录数据集。解析记录数据集,从中提取每个样本信息的内容和每个样本信息被浏览时的状态信息。将每个样本信息的内容和每个样本信息被浏览时的状态信息转换成文本,生成样本文本信息。藉由样本文本信息训练主题模型,生成预设识别模型。详细参见上述实施例中对步骤301至步骤304的描述。
于一实施例中,选取模块403用于:计算历史主题分布信息和待推荐主题分布信息的相似度。将待推荐信息集中的每条信息按照相似度由大到小排序,从待推荐信息集中选取相似度排在前预设名次的至少一条信息作为目标推荐信息。详细参见上述实施例中对步骤312至步骤313的描述。
于一实施例中,还包括:剔除模块405,用于在将目标推荐信息推送至目标用户的终端之前,剔除目标推荐信息中已被目标用户浏览过的信息。详细参见上述实施例中对步骤314的描述。
于一实施例中,还包括:推送模块406,用于在根据历史主题分布信息和待推荐主题分布信息,从待推荐信息集中选取目标推荐信息之后,将目标推荐信息推送至目标用户的终端。详细参见上述实施例中对步骤315的描述。
上述信息处理装置400的详细描述,请参见上述实施例中相关方法步骤的描述。
本发明实施例还提供了一种非暂态电子设备可读存储介质,包括:程序,当其在电子设备上运行时,使得电子设备可执行上述实施例中方法的全部或部分流程。其中,存储介质可为磁盘、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccess Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等。存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (16)

1.一种信息处理方法,其特征在于,包括:
获取在已过去的预设时间段内目标用户浏览信息的历史浏览记录,和待推荐信息集;
识别所述历史浏览记录的历史主题分布信息,并识别所述待推荐信息集的待推荐主题分布信息;
根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述识别所述历史浏览记录的历史主题分布信息,包括:
解析所述历史浏览记录,得到所述目标用户的浏览信息内容和浏览状态信息;
将所述浏览信息内容和所述浏览状态信息转换成文本,生成历史浏览文本信息;
将所述历史浏览文本信息输入至预设识别模型,输出所述历史主题分布信息。
3.根据权利要求1所述的方法,其特征在于,所述识别所述待推荐信息集的待推荐主题分布信息,包括:
解析所述待推荐信息集,得到每条信息内容和所述每条信息内容被浏览时的状态信息;
将所述每条信息内容和所述每条信息内容被浏览时的状态信息转换成文本,生成待推荐文本信息;
将所述待推荐文本信息输入至预设识别模型,输出所述待推荐主题分布信息。
4.根据权利要求2或3所述的方法,其特征在于,建立所述预设识别模型的步骤包括:
获取不同用户对多个样本信息的浏览记录数据集;
解析所述记录数据集,从中提取每个所述样本信息的内容和每个所述样本信息被浏览时的状态信息;
将每个所述样本信息的内容和每个所述样本信息被浏览时的状态信息转换成文本,生成样本文本信息;
藉由所述样本文本信息训练主题模型,生成所述预设识别模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息,包括:
计算所述历史主题分布信息和所述待推荐主题分布信息的相似度;
将所述待推荐信息集中的每条信息按照所述相似度由大到小排序,从所述待推荐信息集中选取所述相似度排在前预设名次的至少一条信息作为目标推荐信息。
6.根据权利要求1所述的方法,其特征在于,在所述根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息之后,还包括:
将所述目标推荐信息推送至所述目标用户的终端。
7.根据权利要求6所述的方法,其特征在于,在所述将所述目标推荐信息推送至所述目标用户的终端之前,还包括:
剔除所述目标推荐信息中已被所述目标用户浏览过的信息。
8.一种信息处理装置,其特征在于,包括:
获取模块,用于获取在已过去的预设时间段内目标用户浏览信息的历史浏览记录,和待推荐信息集;
识别模块,用于识别所述历史浏览记录的历史主题分布信息,并识别所述待推荐信息集的待推荐主题分布信息;
选取模块,用于根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息。
9.根据权利要求8所述的装置,其特征在于,所述识别模块用于:
解析所述历史浏览记录,得到所述目标用户的浏览信息内容和浏览状态信息;
将所述浏览信息内容和所述浏览状态信息转换成文本,生成历史浏览文本信息;
将所述历史浏览文本信息输入至预设识别模型,输出所述历史主题分布信息。
10.根据权利要求8所述的装置,其特征在于,所述识别模块用于:
解析所述待推荐信息集,得到每条信息内容和所述每条信息内容被浏览时的状态信息;
将所述每条信息内容和所述每条信息内容被浏览时的状态信息转换成文本,生成待推荐文本信息;
将所述待推荐文本信息输入至预设识别模型,输出所述待推荐主题分布信息。
11.根据权利要求9或10所述的装置,其特征在于,还包括建立模块,用于:
获取不同用户对多个样本信息的浏览记录数据集;
解析所述记录数据集,从中提取每个所述样本信息的内容和每个所述样本信息被浏览时的状态信息;
将每个所述样本信息的内容和每个所述样本信息被浏览时的状态信息转换成文本,生成样本文本信息;
藉由所述样本文本信息训练主题模型,生成所述预设识别模型。
12.根据权利要求8所述的装置,其特征在于,所述选取模块用于:
计算所述历史主题分布信息和所述待推荐主题分布信息的相似度;
将所述待推荐信息集中的每条信息按照所述相似度由大到小排序,从所述待推荐信息集中选取所述相似度排在前预设名次的至少一条信息作为目标推荐信息。
13.根据权利要求8所述的装置,其特征在于,还包括:
推送模块,用于在所述根据所述历史主题分布信息和所述待推荐主题分布信息,从所述待推荐信息集中选取目标推荐信息之后,将所述目标推荐信息推送至所述目标用户的终端。
14.根据权利要求13所述的装置,其特征在于,还包括:
剔除模块,用于在所述将所述目标推荐信息推送至所述目标用户的终端之前,剔除所述目标推荐信息中已被所述目标用户浏览过的信息。
15.一种电子设备,其特征在于,包括:
存储器,用以存储计算机程序;
处理器,用以执行如权利要求1至7中任一项所述的方法,以从待推荐信息集中确定对应于目标用户的目标推荐信息。
16.一种非暂态电子设备可读存储介质,其特征在于,包括:程序,当其藉由电子设备运行时,使得所述电子设备执行权利要求1至8中任一项所述的方法。
CN202010527041.1A 2020-06-10 2020-06-10 信息处理方法、装置、设备和存储介质 Pending CN111666522A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010527041.1A CN111666522A (zh) 2020-06-10 2020-06-10 信息处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010527041.1A CN111666522A (zh) 2020-06-10 2020-06-10 信息处理方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN111666522A true CN111666522A (zh) 2020-09-15

Family

ID=72387146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010527041.1A Pending CN111666522A (zh) 2020-06-10 2020-06-10 信息处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111666522A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113570411A (zh) * 2021-07-22 2021-10-29 深圳市雷鸟网络传媒有限公司 一种推广信息展示方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104216965A (zh) * 2014-08-21 2014-12-17 北京金山安全软件有限公司 信息推荐方法和装置
CN104679743A (zh) * 2013-11-26 2015-06-03 阿里巴巴集团控股有限公司 一种确定用户的偏好模式的方法及装置
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
CN109460514A (zh) * 2018-11-02 2019-03-12 北京京东尚科信息技术有限公司 用于推送信息的方法和装置
CN110781391A (zh) * 2019-10-22 2020-02-11 腾讯科技(深圳)有限公司 一种信息推荐方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679743A (zh) * 2013-11-26 2015-06-03 阿里巴巴集团控股有限公司 一种确定用户的偏好模式的方法及装置
CN104216965A (zh) * 2014-08-21 2014-12-17 北京金山安全软件有限公司 信息推荐方法和装置
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
CN109460514A (zh) * 2018-11-02 2019-03-12 北京京东尚科信息技术有限公司 用于推送信息的方法和装置
CN110781391A (zh) * 2019-10-22 2020-02-11 腾讯科技(深圳)有限公司 一种信息推荐方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113570411A (zh) * 2021-07-22 2021-10-29 深圳市雷鸟网络传媒有限公司 一种推广信息展示方法、装置、电子设备和存储介质
CN113570411B (zh) * 2021-07-22 2024-06-07 深圳市雷鸟网络传媒有限公司 一种推广信息展示方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US10795939B2 (en) Query method and apparatus
Jeon et al. A framework to predict the quality of answers with non-textual features
CN108319630B (zh) 信息处理方法、装置、存储介质和计算机设备
CN110888990B (zh) 文本推荐方法、装置、设备及介质
JP5353148B2 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
CN106383887B (zh) 一种环保新闻数据采集和推荐展示的方法及***
US7860878B2 (en) Prioritizing media assets for publication
US20090319449A1 (en) Providing context for web articles
CN107015961B (zh) 一种文本相似性比对方法
CN108334489B (zh) 文本核心词识别方法和装置
US20110246462A1 (en) Method and System for Prompting Changes of Electronic Document Content
JP2010073114A6 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
US11423096B2 (en) Method and apparatus for outputting information
CN101118560A (zh) 关键词输出设备和关键词输出方法
CN110290199B (zh) 内容推送方法、装置及设备
CN111314732A (zh) 确定视频标签的方法、服务器及存储介质
JP7395377B2 (ja) コンテンツ検索方法、装置、機器、および記憶媒体
CN111538903B (zh) 搜索推荐词确定方法、装置、电子设备及计算机可读介质
CN111708909A (zh) 视频标签的添加方法及装置、电子设备、计算机可读存储介质
CN114330329A (zh) 一种业务内容搜索方法、装置、电子设备及存储介质
CN110750707A (zh) 关键词推荐方法、装置和电子设备
CN110750708A (zh) 关键词推荐方法、装置和电子设备
CN111666522A (zh) 信息处理方法、装置、设备和存储介质
WO2019231635A1 (en) Method and apparatus for generating digest for broadcasting
CN110147488B (zh) 页面内容的处理方法、处理装置、计算设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination