CN106960030B - 基于人工智能的推送信息方法及装置 - Google Patents

基于人工智能的推送信息方法及装置 Download PDF

Info

Publication number
CN106960030B
CN106960030B CN201710169869.2A CN201710169869A CN106960030B CN 106960030 B CN106960030 B CN 106960030B CN 201710169869 A CN201710169869 A CN 201710169869A CN 106960030 B CN106960030 B CN 106960030B
Authority
CN
China
Prior art keywords
information
tag
pushed
keyword
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710169869.2A
Other languages
English (en)
Other versions
CN106960030A (zh
Inventor
刘志慧
闭玮
曹宇慧
周古月
何径舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710169869.2A priority Critical patent/CN106960030B/zh
Publication of CN106960030A publication Critical patent/CN106960030A/zh
Application granted granted Critical
Publication of CN106960030B publication Critical patent/CN106960030B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了基于人工智能的推送信息方法及装置。该方法的一具体实施方式包括:获取用户的标签信息,该标签信息包括至少一个标签和与各个标签分别对应的标签关键词集合;对于该至少一个标签中的每个标签,从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含该查询用关键词的信息作为拟推送信息以生成拟推送信息组,确定该标签信息与该拟推送信息组中的每条信息的相似度;合并所生成的各个拟推送信息组以生成拟推送信息集合;基于该标签信息与该拟推送信息集合中的每条信息的相似度,在该拟推送信息集合中选取拟推送信息作为待推送信息,并将该待推送信息推送至该用户的用户终端。该实施方式实现了富于针对性的信息推送。

Description

基于人工智能的推送信息方法及装置
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及基于人工智能的推送信息方法及装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。
随着网络信息技术的发展,人们不得不花费大量的时间,登录各大门户网站(门户网站通常指通向某类综合性互联网信息资源并提供有关信息服务的应用***),或者使用搜索引擎自行搜索海量的信息。由于门户网站和搜索引擎服务较为通用的性质,已经不能满足人们不同背景、不同目的和不同时期的查询。因此,人们希望网络更加智能化,能够根据用户自身的喜好推荐用户真正需要的信息(例如用户经常关注的某类新闻)。
发明内容
本申请的目的在于提出一种改进的基于人工智能的推送信息方法及装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种基于人工智能的推送信息方法,该方法包括:获取用户的标签信息,其中,上述标签信息包括至少一个标签和与上述至少一个标签中的各个标签分别对应的标签关键词集合;对于上述至少一个标签中的每个标签,从与该标签对应的标 签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含上述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,确定上述标签信息与上述拟推送信息组中的每条拟推送信息的相似度;合并所生成的各个拟推送信息组以生成拟推送信息集合;基于上述标签信息与上述拟推送信息集合中的每条拟推送信息的相似度,在上述拟推送信息集合中选取拟推送信息作为待推送信息,并将上述待推送信息推送至上述用户的用户终端。
在一些实施例中,上述在预存信息集合中匹配出包含上述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,包括:在预先建立的、与上述查询用关键词所在的标签关键词集合所属的标签相关联的标识信息列表中查找出与上述查询用关键词匹配的目标标识信息,将上述目标标识信息所包含的标识集合中的各个标识分别指示的信息作为拟推送信息以生成上述拟推送信息组,其中,上述标识信息列表中的每条标识信息包括关键词标识和与上述关键词标识对应的标识集合,上述与上述关键词标识对应的标识集合中的每个标识是上述预存信息集合中的、包含上述关键词标识所指示的关键词的预存信息的标识。
在一些实施例中,上述预存信息集合中的每条预存信息包括多个标签和与上述多个标签中的各个标签分别对应的关键词集合,上述多个标签包括上述至少一个标签;以及上述确定上述标签信息与上述拟推送信息组中的每条拟推送信息的相似度,包括:对于上述拟推送信息组中的每条拟推送信息,确定上述标签信息和该条拟推送信息分别包含的所属标签相同的标签关键词集合和关键词集合的匹配度,将所确定的各个匹配度相加所得的数值作为上述标签信息与该条拟推送信息的相似度。
在一些实施例中,与上述至少一个标签中的每个标签分别对应的标签关键词集合中的每个关键词设置有权重值,对于上述预存信息集合中的每条预存信息,该条预存信息所包含的与上述多个标签中的各个标签分别对应的关键词集合中的每个关键词设置有权重值;以及上述确定上述标签信息和上述该条拟推送信息分别包含的所属标签相同 的标签关键词集合和关键词集合的匹配度,包括:基于权重值,确定上述标签信息和上述该条拟推送信息分别包含的所属标签相同的标签关键词集合和关键词集合的匹配度。
在一些实施例中,上述获取用户的标签信息,包括:在预置标签信息集合中获取上述标签信息,其中,上述预置标签信息集合中的每条标签信息包括至少一个标签和与至少一个标签中的各个标签分别对应的标签关键词集合。
在一些实施例中,上述获取用户的标签信息,还包括:接收上述用户输入的查询信息;对上述查询信息进行解析,提取出关键词组;对上述关键词组中的关键词进行聚类,生成包含上述至少一个标签和与上述至少一个标签中的各个标签分别对应的标签关键词集合的上述标签信息。
在一些实施例中,上述基于上述标签信息与上述拟推送信息集合中的每条拟推送信息的相似度,在上述拟推送信息集合中选取拟推送信息作为待推送信息,包括:按照与上述标签信息的相似度由高到低的顺序对上述拟推送信息集合中的拟推送信息进行排序,将排序后的前预定数目条拟推送信息作为上述待推送信息。
在一些实施例中,上述基于上述标签信息与上述拟推送信息集合中的每条拟推送信息的相似度,在上述拟推送信息集合中选取拟推送信息作为待推送信息,还包括:将上述拟推送信息集合中的、与上述标签信息的相似度高于预定值的拟推送信息作为上述待推送信息。
第二方面,本申请实施例提供了一种基于人工智能的推送信息装置,该装置包括:获取单元,配置用于获取用户的标签信息,其中,上述标签信息包括至少一个标签和与上述至少一个标签中的各个标签分别对应的标签关键词集合;确定单元,配置用于对于上述至少一个标签中的每个标签,从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含上述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,确定上述标签信息与上述拟推送信息组中的每条拟推送信息的相似度;生成单元,配置用于合并所生成的各个拟推送信息组以生成拟推送信息集合; 推送单元,配置用于基于上述标签信息与上述拟推送信息集合中的每条拟推送信息的相似度,在上述拟推送信息集合中选取拟推送信息作为待推送信息,并将上述待推送信息推送至上述用户的用户终端。
在一些实施例中,上述确定单元包括:生成子单元,配置用于在预先建立的、与上述查询用关键词所在的标签关键词集合所属的标签相关联的标识信息列表中查找出与上述查询用关键词匹配的目标标识信息,将上述目标标识信息所包含的标识集合中的各个标识分别指示的信息作为拟推送信息以生成上述拟推送信息组,其中,上述标识信息列表中的每条标识信息包括关键词标识和与上述关键词标识对应的标识集合,上述与上述关键词标识对应的标识集合中的每个标识是上述预存信息集合中的、包含上述关键词标识所指示的关键词的预存信息的标识。
在一些实施例中,上述预存信息集合中的每条预存信息包括多个标签和与上述多个标签中的各个标签分别对应的关键词集合,上述多个标签包括上述至少一个标签;以及上述确定单元包括:确定子单元,配置用于对于上述拟推送信息组中的每条拟推送信息,确定上述标签信息和该条拟推送信息分别包含的所属标签相同的标签关键词集合和关键词集合的匹配度,将所确定的各个匹配度相加所得的数值作为上述标签信息与该条拟推送信息的相似度。
在一些实施例中,与上述至少一个标签中的每个标签分别对应的标签关键词集合中的每个关键词设置有权重值,对于上述预存信息集合中的每条预存信息,该条预存信息所包含的与上述多个标签中的各个标签分别对应的关键词集合中的每个关键词设置有权重值;以及上述确定子单元包括:确定模块,配置用于基于权重值,确定上述标签信息和上述该条拟推送信息分别包含的所属标签相同的标签关键词集合和关键词集合的匹配度。
在一些实施例中,上述获取单元包括:获取子单元,配置用于在预置标签信息集合中获取上述标签信息,其中,上述预置标签信息集合中的每条标签信息包括至少一个标签和与至少一个标签中的各个标签分别对应的标签关键词集合。
在一些实施例中,上述获取单元还包括:接收子单元,配置用于接收上述用户输入的查询信息;提取子单元,配置用于对上述查询信息进行解析,提取出关键词组;处理子单元,配置用于对上述关键词组中的关键词进行聚类,生成包含上述至少一个标签和与上述至少一个标签中的各个标签分别对应的标签关键词集合的上述标签信息。
在一些实施例中,上述推送单元包括:第一确定子单元,配置用于按照与上述标签信息的相似度由高到低的顺序对上述拟推送信息集合中的拟推送信息进行排序,将排序后的前预定数目条拟推送信息作为上述待推送信息。
在一些实施例中,上述推送单元还包括:第二确定子单元,配置用于将上述拟推送信息集合中的、与上述标签信息的相似度高于预定值的拟推送信息作为上述待推送信息。
第三方面,本申请实施例提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,上述程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本申请实施例提供的基于人工智能的推送信息方法及装置,通过获取用户的标签信息以便得到该标签信息所包含的至少一个标签和与该至少一个标签中的各个标签分别对应的标签关键词集合。而后,对于该至少一个标签中的每个标签,通过从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含该查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,以便确定该标签信息与该拟推送信息组中的每条拟推送信息的相似度。之后,通过合并所生成的各个拟推送信息组以生成拟推送信息集合。最后,通过基于该标签信息与该拟推送信息集合中的每条拟推送信息的相似度,在该拟推送信息集合中选取拟推送信息作为待推送信息,并将该待推送信息推送至该用户的用户终端。从而通过人工 智能有效地利用了上述标签信息,实现了富于针对性的信息推送。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性***架构图;
图2是根据本申请的基于人工智能的推送信息方法的一个实施例的流程图;
图3是与图2所示的实施例对应的一个应用场景的示意图;
图4是根据本申请的基于人工智能的推送信息方法的又一个实施例的流程图;
图5是根据本申请的基于人工智能的推送信息装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的服务器的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的基于人工智能的推送信息方法或基于人工智能的推送信息装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103通过网络104可以接收服务器105推送的信息。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如获取持有终端设备101、102、103的用户的标签信息,并对该标签信息进行分析等处理,并将处理结果(例如基于该标签信息所确定的用户感兴趣的新闻)反馈给终端设备。
需要说明的是,本申请实施例所提供的基于人工智能的推送信息方法一般由终端设备101、102、103执行,相应地,基于人工智能的推送信息装置一般设置于终端设备101、102、103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的基于人工智能的推送信息方法的一个实施例的流程200。该基于人工智能的推送信息方法,包括以下步骤:
步骤201,获取用户的标签信息。
在本实施例中,基于人工智能的推送信息方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式获取用户的标签信息。其中,该标签信息可以包括至少一个标签和与该至少一个标签中的各个标签分别对应的标签关键词集合。这里,上述至少一个标签可以是与上述用户经常关注的网页(例如新闻类网页)的网页内容相关联的标签,与上述至少一个标签中的各个标签分别对应的标签关键词集合可以是从上述网页内容中提取出的标签关键词集合。这里,上述用户经常关注的网页,可以是上述用户经常访问的网页,或上述用户曾经打开过的、停留时间超出预定时长的网页。
作为示例,假定上述用户经常关注的网页为新闻类网页,上述至少一个标签可以包括以下至少一项:新闻主题、新闻内容、新闻发生地点、新闻关键字等。与标签“新闻主题”对应的标签关键词集合可以是从上述新闻类网页的网页内容中的标题和/或摘要中提取出的、用于表征上述网页内容的核心思想的各个关键词的集合。与标签“新闻内容”对应的标签关键词集合可以是从上述网页内容的标题、正文和meta标签中提取出的各个关键词的集合。这里,meta标签是HTML(HyperText Markup Language,超文本标记语言)中的head(head标签用于定义网页文档的头部,它是所有头部元素的容器)区的一个辅助性标签,meta标签位于文档的头部,不包含任何内容。meta标签的不同属性有不同的参数值,这些不同的参数值实现了不同的网页功能。与标签“新闻发生地点”对应的标签关键词集合可以是从上述网页内容中提取出的用于表征新闻发生的国家、省份、城市、地区等的各个关键词的集合。与标签“新闻关键字”对应的标签关键词集合可以是从上述网页内容中提取出的用于表征上述网页内容的类别的各关键词的集合,例如与标签“新闻关键字”对应的标签关键词集合可以包括“娱乐”、“音乐”、“比赛”等关键词。
在本实施例的一些可选的实现方式中,上述电子设备可以在预置标签信息集合中获取上述标签信息。其中,上述预置标签信息集合中的每条标签信息可以包括至少一个标签和与该至少一个标签中的各个标签分别对应的标签关键词集合。这里,上述预置标签信息集合可以预先存储在上述电子设备本地,也可以预先存储在与上述电子设备远程通信连接的服务器中。
在本实施例的一些可选的实现方式中,上述电子设备还可以接收上述用户输入的查询信息。上述电子设备可以对上述查询信息进行解析以提取出关键词组,之后上述电子设备可以对该关键词组中的关键词进行聚类,生成包含上述至少一个标签和与上述至少一个标签中的各个标签分别对应的标签关键词集合的上述标签信息。这里,上述电子设备可以对上述查询信息进行切词,从切出的各词中提取出关键词组。例如从切出的各词中选取出词性为名词、动词或形容词的词以组 成上述关键词组。作为示例,假定上述查询信息为“英国经常有沙尘暴吗”,则对“英国经常有沙尘暴吗”进行切词,可切出以下各个词:英国、经常、有、沙尘暴、吗,上述电子设备可以从切出的各个词中选取出词性为名词的“英国”和“沙尘暴”组成上述关键词组。
步骤202,对于至少一个标签中的每个标签,从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,确定标签信息与拟推送信息组中的每条拟推送信息的相似度。
在本实施例中,上述电子设备在获取到上述标签信息后,对于上述至少一个标签中的每个标签,上述电子设备可以从与该标签对应的标签关键词集合中提取出查询用关键词,上述电子设备可以在预存信息集合中匹配出包含上述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,上述电子设备可以确定上述标签信息与上述拟推送信息组中的每条拟推送信息的相似度。其中,上述预存信息集合中的每条预存信息可以是网页片段,该网页片段可以是一则新闻,该则新闻可以是以下任意一项分类的新闻:娱乐、健康、军事、互联网科技、美食、医疗等。上述预存信息集合可以预先存储在上述电子设备本地,也可以预先存储在与上述电子设备远程通信连接的服务器中。
在本实施例中,与上述至少一个标签中的各个标签分别对应的标签关键词集合中的每个关键词可以预先设置有搜索次数,该搜索次数可以是上述用户对该关键词进行搜索的搜索次数,也可以是不同的用户对该关键词进行搜索的搜索次数的平均值。对于上述至少一个标签中的每个标签,上述电子设备可以从与该标签对应的标签关键词集合中提取出搜索次数超出搜索次数阈值的关键词作为上述查询用关键词。上述电子设备可以读取上述预存信息集合中的每条预存信息以选取出包含上述查询用关键词的预存信息作为拟推送信息以生成上述拟推送信息组。对于上述拟推送信息组中的每条拟推送信息,上述电子设备可以将该条拟推送信息所包含的与上述至少一个标签中的各个标 签分别对应的标签关键词集合中的各个关键词的数目和与上述至少一个标签中的各个标签分别对应的标签关键词集合中的各个关键词的总数目的比值作为该条拟推送信息与上述标签信息的相似度。作为示例,假定上述至少一个标签包括两个标签,即标签A和标签B。与标签A对应的标签关键词集合包括2个关键词,即关键词A1和A2。与标签B对应的标签关键词集合包括3个关键词,即关键词B1、B2和B3。若该条拟推送信息包括关键词A1和B1,则该条拟推送信息与上述标签信息的相似度可以为2与5的比值,例如0.4。
在本实施例的一些可选的实现方式中,与上述至少一个标签中的各个标签分别对应的标签关键词集合中的每个关键词可以设置有权重值。对于上述至少一个标签中的每个标签,上述电子设备可以从与该标签对应的标签关键词集合中提取出权重值大于权重值阈值的关键词作为上述查询用关键词。
在本实施例的一些可选的实现方式中,对于上述至少一个标签中的每个标签,从与该标签对应的标签关键词集合中提取出上述查询用关键词后,上述电子设备可以通过执行以下步骤在上述预存信息集合中匹配出包含上述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组:在预先建立的、与上述查询用关键词所在的标签关键词集合所属的标签相关联的标识信息列表中查找出与上述查询用关键词匹配的目标标识信息,将该目标标识信息所包含的标识集合中的各个标识分别指示的信息作为拟推送信息以生成上述拟推送信息组。其中,上述标识信息列表中的每条标识信息包括关键词标识和与该关键词标识对应的标识集合,该标识集合中的每个标识是上述预存信息集合中的、包含该关键词标识所指示的关键词的预存信息的标识。这里,上述标识信息列表可以预先存储在上述电子设备本地,也可以存储在与上述电子设备远程通信连接的服务器中。
在本实施例的一些可选的实现方式中,上述预存信息集合中的每条预存信息可以包括多个标签和与该多个标签中的各个标签分别对应的关键词集合,该多个标签可以包括上述至少一个标签。对于上述至少一个标签中的每个标签,上述电子设备从与该标签对应的标签关键 词集合中提取出上述查询用关键词,并在上述在预存信息集合中匹配出包含上述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组后,对于该拟推送信息组中的每条拟推送信息,上述电子设备可以确定上述标签信息和该条拟推送信息分别包含的所属标签相同的标签关键词集合和关键词集合的匹配度,将所确定的各个匹配度相加所得的数值作为上述标签信息与该条拟推送信息的相似度。作为示例,与上述至少一个标签中的某个标签A对应的标签关键词集合为A1,A1包括5个关键词。对于上述拟推送信息组中的某条拟推送信息,该条拟推送信息所包含的所属标签为A的关键词集合为A2,A2包括10个关键词,若关键词集合A2包含标签关键词集合A1中的1个关键词,则标签关键词集合A1和关键词集合A2的匹配度可以为1与5的比值,例如0.2。
在本实施例的一些可选的实现方式中,上述预存信息集合中的每条预存信息包含的多个标签和与该多个标签中的各个标签分别对应的关键词集合可以是上述电子设备预先建立的。这里,可以采用人为预先设置多个标签。假定上述预存信息集合中的各条预存信息为新闻类信息,上述多个标签可以包括“新闻内容”、“新闻主题”、“新闻发生地点”、“新闻关键字”、“新闻发生时间”等。对于上述预存信息集合中的每条预存信息,上述电子设备可以对该条预存信息进行切词,根据切出的词出现的频次、位置和是否是停用词等对切出的词设置权重值。停用词大致分为两类。一类是人类语言中包含的功能词,这些功能词极其普遍,与其他词相比,功能词没有什么实际含义,比如“是”、“在”、“哪个”、“这个”等。另一类词包括词汇词,比如“需要”、“希望”、“应该”等,这些词应用十分广泛,但是对这样的词搜索引擎无法保证能够给出真正相关的搜索结果,难以帮助缩小搜索范围,同时还会降低搜索的效率,所以通常会把这些词从问题中移去,从而提高搜索性能。
对于上述预存信息集合中的每条预存信息,上述电子设备可以基于上述多个标签中的每个标签,从该预存信息中提取出与该标签相关的、权重值高于阈值的关键词归入与该标签对应的标签关键词集合。 这里,以标签“新闻内容”为例,上述电子设备可以从该条预存信息的标题、正文和meta标签中切出的各词中选取出权重值高于上述阈值的关键词归入与标签“新闻内容”对应的标签关键词集合中。可选地,对于标签“新闻主题”,上述电子设备可以采用PLSA(Probability Latent Semantic Analysis,概率潜在语义分析)算法在该条预存信息中提取出与标签“新闻主题”相关联的关键词归入与标签“新闻主题”对应的标签关键词集合。PLSA是基于双模式和共现的数据分析方法延伸的经典的统计学方法。PLSA应用于信息检索,过滤,自然语言处理,文本的机器学习或者其他相关领域。
这里,新闻的类别可以包括娱乐、健康、军事、互联网科技、美食、医疗等,上述电子设备本地或与上述电子设备远程通信连接的服务器可以存储有与每一类别对应的类别关键词集合。对于上述预存信息集合中的每条预存信息,对于标签“新闻关键字”,上述电子设备可以基于该条预存信息的类别获取到与该类别对应的类别关键词集合,然后在从该条预存信息的标题和正文中切出的各个词中选取出包含在该类别关键词集合中的词归入与标签“新闻关键字”对应的标签关键词集合。
对于上述多个标签中的每个标签,上述电子设备还可以预先建立与该标签对应的数据表,上述电子设备可以将上述预存信息集合中的各条预存信息所包含的所属标签为该标签的关键词集合存储至该数据表。上述电子设备还可以预先建立与该标签对应的标识信息列表。上述电子设备可以将该数据表中所存储的各个关键词集合中的每个关键词的关键词标识和上述预存信息集合中的、包含该关键词的预存信息的标识的标识集合相关联地存储至该标识信息列表。
在本实施例的一些可选的实现方式中,上述电子设备还可以实时或周期性地更新上述预存信息集合、上述数据表、上述标识信息列表。
步骤203,合并所生成的各个拟推送信息组以生成拟推送信息集合。
在本实施例中,上述电子设备可以将步骤202所生成的各个拟推送信息组进行合并以生成拟推送信息集合。这里,拟推送信息集合中 所包含的各条拟推送信息可以互不相同。
步骤204,基于标签信息与拟推送信息集合中的每条拟推送信息的相似度,在拟推送信息集合中选取拟推送信息作为待推送信息,并将待推送信息推送至用户的用户终端。
在本实施例中,上述电子设备可以基于上述用户的标签信息与上述拟推送信息集合中的每条拟推送信息的相似度,在拟推送信息集合中选取拟推送信息作为待推送信息,并将该待推送信息推送至上述用户的用户终端(例如图1所示的终端设备101、102、103)。这里,上述电子设备可以将上述拟推送信息集合中的、与上述用户的标签信息的相似度最高的拟推送信息作为上述待推送信息。
在本实施例的一些可选的实现方式中,上述电子设备可以按照与上述用户的标签信息的相似度由高到低的顺序,对上述拟推送信息集合中的拟推送信息进行排序,将排序后的前预定数目条拟推送信息作为上述待推送信息。这里,上述预定数目可以是人为预先设置的,也可以是上述电子设备自动设置的,上述预定数目是可以根据实际需要进行调整的,本实施例不对此方面内容做任何限定。
在本实施例的一些可选的实现方式中,上述电子设备还可以将上述拟推送信息集合中的、与上述用户的标签信息的相似度高于预定值的拟推送信息作为上述待推送信息。这里,上述预定值可以是人为预先设置的,也可以是上述电子设备自动设置的,上述预定值是可以根据实际需要进行调整的,本实施例不对此方面内容做任何限定。
继续参见图3,图3是与图2所示实施例对应的应用场景的一个示意图。在图3的应用场景中,服务器301获取到用户302的标签信息303,标签信息303包括标签3031、3032,以及与标签3031、3032分别对应的标签关键词集合3033、3034。对于标签3031,假定服务器301从与标签3031对应的标签关键词集合3033中提取出查询用关键词30331,所生成的与标签3031相关联的拟推送信息组3035包括2条拟推送信息30351、30352,拟推送信息30351、30352包含查询用关键词30331,拟推送信息30351与标签信息303的相似度为0.9,拟推送信息30352与标签信息303的相似度为0.8。对于标签3032, 假定服务器301从与标签3032对应的标签关键词集合3034中提取出查询用关键词30341,所生成的与标签3032相关联的拟推送信息组3036包括2条拟推送信息30361、30362,拟推送信息30361、30362包含查询用关键词30341,拟推送信息30361与标签信息303的相似度为0.9,拟推送信息30362与标签信息303的相似度为0.4。假定拟推送信息30351和拟推送信息30361为同一条拟推送信息,则上述服务器合并拟推送信息组3035和拟推送信息组3036所生成的拟推送信息集合304可以包括拟推送信息30351、30352、30362。服务器301可以将拟推送信息集合304中的、与标签信息303的相似度最高的拟推送信息30351作为待推送信息,推送至用户302的用户终端305。
本申请实施例提供的方法,通过获取用户的标签信息以便得到该标签信息所包含的至少一个标签和与该至少一个标签中的各个标签分别对应的标签关键词集合。而后,对于该至少一个标签中的每个标签,通过从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含该查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,以便确定该标签信息与该拟推送信息组中的每条拟推送信息的相似度。之后,通过合并所生成的各个拟推送信息组以生成拟推送信息集合。最后,通过基于该标签信息与该拟推送信息集合中的每条拟推送信息的相似度,在该拟推送信息集合中选取拟推送信息作为待推送信息,并将该待推送信息推送至该用户的用户终端。从而通过人工智能有效地利用了上述标签信息,实现了富于针对性的信息推送。
进一步参考图4,其示出了根据本申请的基于人工智能的推送信息方法的又一个实施例的流程400。该流程400包括以下步骤:
步骤401,获取用户的标签信息。
在本实施例中,基于人工智能的推送信息方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式获取用户的标签信息。其中,该标签信息可以包括至少一个标签和与该至少一个标签中的各个标签分别对应的标签关键词集合,该标签关键词集合中的每个关键词可以设置有权重值。这里,上述至 少一个标签可以是与上述用户经常关注的网页(例如新闻类网页)的网页内容相关联的标签,与上述至少一个标签中的各个标签分别对应的标签关键词集合可以是从上述网页内容中提取出的标签关键词集合。这里,上述用户经常关注的网页,可以是上述用户经常访问的网页,或上述用户曾经打开过的、停留时间超出预定时长的网页。
步骤402,对于至少一个标签中的每个标签,从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组。
在本实施例中,上述电子设备在获取到上述标签信息后,对于上述至少一个标签中的每个标签,上述电子设备可以从与该标签对应的标签关键词集合中提取出查询用关键词,上述电子设备可以在预存信息集合中匹配出包含上述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,上述电子设备可以确定上述标签信息与上述拟推送信息组中的每条拟推送信息的相似度。其中,上述预存信息集合中的每条预存信息可以是网页片段,该网页片段可以是一则新闻,该则新闻可以是以下任意类别的新闻:娱乐、健康、军事、互联网科技、美食、医疗等。需要指出的是,上述预存信息集合可以预先存储在上述电子设备本地,也可以预先存储在与上述电子设备远程通信连接的服务器中。
在本实施例中,上述预存信息集合中的每条预存信息可以包括多个标签和与该多个标签中的各个标签分别对应的关键词集合,该关键词集合中的每个关键词可以设置有权重值。上述多个标签可以包括上述至少一个标签。这里,步骤402的具体处理及其所带来的技术效果可参考上述步骤202的相关说明,在此不再赘述。
步骤403,对于至少一个标签中的每个标签,对于与该标签相关联的拟推送信息组中的每条拟推送信息,基于权重值,确定标签信息和该条拟推送信息分别包含的所属标签相同的标签关键词集合和关键词集合的匹配度,将所确定的各个匹配度相加所得的数值作为标签信息与该条拟推送信息的相似度。
在本实施例中,对于上述至少一个标签中的每个标签,对于与该标签相关联的拟推送信息组中的每条拟推送信息,上述电子设备可以基于权重值,确定上述标签信息和该条拟推送信息分别包含的所属标签相同的标签关键词集合和关键词集合的匹配度,将所确定的各个匹配度相加所得的数值作为上述标签信息与该条拟推送信息的相似度。作为示例,假定上述标签信息包括与标签A对应的标签关键词集合A1,该条拟推送信息包括与标签A对应的关键词集合A2,上述电子设备可以将标签关键词集合A1映射为第一向量,该第一向量包括标签关键词集合A1中的各个关键词的权重值。上述电子设备可以将关键词集合A2映射为第二向量,该第二向量包括关键词集合A2中的各个关键词的权重值。上述电子设备可以采用余弦相似度算法计算上述第一向量和上述第二向量的相似度,并将计算出的相似度确定为标签关键词集合A1和关键词集合A2的匹配度。需要指出的是,余弦相似度,又称为余弦相似性。通过计算两个向量的夹角余弦值来评估它们的相似度。余弦相似度算法通常是将向量根据坐标值,绘制到向量空间中。如最常见的二维空间。求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向更加吻合,则越相似。余弦相似度算法最常见的应用就是计算文本相似度。将两个文本根据它们的特征词,建立两个向量,计算这两个向量的余弦值,就可以知道两个文本在统计学方法中他们的相似度情况。
可选地,上述电子设备还可以采用Jaccard系数算法来计算上述第一向量和上述第二向量的相似度,以将该相似度确定为与上述第一向量对应的标签关键词集合A1和与上述第二向量对应的关键词集合A2的匹配度。这里,Jaccard系数又称为Jaccard相似系数,用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。若给定两个集合A、B,Jaccard系数定义为A与B交集的大小和A与B并集的大小的比值。
需要指出的是,由于余弦相似度算法和Jaccard系数算法是目前广泛研究和应用的公知技术,在此不再赘述。
步骤404,合并所生成的各个拟推送信息组以生成拟推送信息集合。
在本实施例中,上述电子设备可以将所生成的各个拟推送信息组进行合并以生成拟推送信息集合。这里,拟推送信息集合中所包含的各条拟推送信息可以互不相同。
步骤405,基于标签信息与拟推送信息集合中的每条拟推送信息的相似度,在拟推送信息集合中选取拟推送信息作为待推送信息,并将待推送信息推送至用户的用户终端。
在本实施例中,上述电子设备可以基于上述用户的标签信息与上述拟推送信息集合中的每条拟推送信息的相似度,在拟推送信息集合中选取拟推送信息作为待推送信息,并将该待推送信息推送至上述用户的用户终端(例如图1所示的终端设备101、102、103)。这里,上述电子设备可以将上述拟推送信息集合中的、与上述用户的标签信息的相似度最高的拟推送信息作为上述待推送信息。
从图4中可以看出,与图2对应的实施例相比,本实施例中的基于人工智能的推送信息方法的流程400突出了步骤403。由此,本实施例描述的方案可以实现更全面的拟推送信息的选取和更有效的信息推送。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种基于人工智能的推送信息装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例所示的基于人工智能的推送信息装置500包括:获取单元501、确定单元502、生成单元503和推送单元504。其中,获取单元501配置用于获取用户的标签信息,其中,上述标签信息包括至少一个标签和与上述至少一个标签中的各个标签分别对应的标签关键词集合;确定单元502配置用于对于上述至少一个标签中的每个标签,从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含上述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,确定上述标签信 息与上述拟推送信息组中的每条拟推送信息的相似度;生成单元503配置用于合并所生成的各个拟推送信息组以生成拟推送信息集合;而推送单元504配置用于基于上述标签信息与上述拟推送信息集合中的每条拟推送信息的相似度,在上述拟推送信息集合中选取拟推送信息作为待推送信息,并将上述待推送信息推送至上述用户的用户终端。
在本实施例中,基于人工智能的推送信息装置500中:获取单元501、确定单元502、生成单元503和推送单元504的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201、步骤202、步骤203和步骤204的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,上述确定单元502可以包括:生成子单元(图中未示出),配置用于在预先建立的、与上述查询用关键词所在的标签关键词集合所属的标签相关联的标识信息列表中查找出与上述查询用关键词匹配的目标标识信息,将上述目标标识信息所包含的标识集合中的各个标识分别指示的信息作为拟推送信息以生成上述拟推送信息组,其中,上述标识信息列表中的每条标识信息包括关键词标识和与上述关键词标识对应的标识集合,上述与上述关键词标识对应的标识集合中的每个标识是上述预存信息集合中的、包含上述关键词标识所指示的关键词的预存信息的标识。
在本实施例的一些可选的实现方式中,上述预存信息集合中的每条预存信息包括多个标签和与上述多个标签中的各个标签分别对应的关键词集合,上述多个标签包括上述至少一个标签;以及上述确定单元502可以包括:确定子单元(图中未示出),配置用于对于上述拟推送信息组中的每条拟推送信息,确定上述标签信息和该条拟推送信息分别包含的所属标签相同的标签关键词集合和关键词集合的匹配度,将所确定的各个匹配度相加所得的数值作为上述标签信息与该条拟推送信息的相似度。
在本实施例的一些可选的实现方式中,与上述至少一个标签中的每个标签分别对应的标签关键词集合中的每个关键词设置有权重值,对于上述预存信息集合中的每条预存信息,该条预存信息所包含的与上述多个标签中的各个标签分别对应的关键词集合中的每个关键词设 置有权重值;以及上述确定子单元可以包括:确定模块(图中未示出),配置用于基于权重值,确定上述标签信息和上述该条拟推送信息分别包含的所属标签相同的标签关键词集合和关键词集合的匹配度。
在本实施例的一些可选的实现方式中,上述获取单元501可以包括:获取子单元(图中未示出),配置用于在预置标签信息集合中获取上述标签信息,其中,上述预置标签信息集合中的每条标签信息包括至少一个标签和与至少一个标签中的各个标签分别对应的标签关键词集合。
在本实施例的一些可选的实现方式中,上述获取单元501还可以包括:接收子单元(图中未示出),配置用于接收上述用户输入的查询信息;提取子单元(图中未示出),配置用于对上述查询信息进行解析,提取出关键词组;处理子单元(图中未示出),配置用于对上述关键词组中的关键词进行聚类,生成包含上述至少一个标签和与上述至少一个标签中的各个标签分别对应的标签关键词集合的上述标签信息。
在本实施例的一些可选的实现方式中,上述推送单元504可以包括:第一确定子单元(图中未示出),配置用于按照与上述标签信息的相似度由高到低的顺序对上述拟推送信息集合中的拟推送信息进行排序,将排序后的前预定数目条拟推送信息作为上述待推送信息。
在本实施例的一些可选的实现方式中,上述推送单元504还可以包括:第二确定子单元(图中未示出),配置用于将上述拟推送信息集合中的、与上述标签信息的相似度高于预定值的拟推送信息作为上述待推送信息。
本申请实施例提供的基于人工智能的推送信息装置,通过获取用户的标签信息以便得到该标签信息所包含的至少一个标签和与该至少一个标签中的各个标签分别对应的标签关键词集合。而后,对于该至少一个标签中的每个标签,通过从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含该查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,以便确定该标签信息与该拟推送信息组中的每条拟推送信息的相似度。之后,通过合并所生成的各个拟推送信息组以生成拟推送信息集 合。最后,通过基于该标签信息与该拟推送信息集合中的每条拟推送信息的相似度,在该拟推送信息集合中选取拟推送信息作为待推送信息,并将该待推送信息推送至该用户的用户终端。从而通过人工智能有效地利用了上述标签信息,实现了富于针对性的信息推送。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机***600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有***600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的***中限定的上述功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算 机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理 器中,例如,可以描述为:一种处理器包括获取单元、确定单元、生成单元和推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取用户的标签信息的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的服务器中所包含的;也可以是单独存在,而未装配入该服务器中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该服务器执行时,使得该服务器包括:获取用户的标签信息,其中,上述标签信息包括至少一个标签和与上述至少一个标签中的各个标签分别对应的标签关键词集合;对于上述至少一个标签中的每个标签,从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含上述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,确定上述标签信息与上述拟推送信息组中的每条拟推送信息的相似度;合并所生成的各个拟推送信息组以生成拟推送信息集合;基于上述标签信息与上述拟推送信息集合中的每条拟推送信息的相似度,在上述拟推送信息集合中选取拟推送信息作为待推送信息,并将上述待推送信息推送至上述用户的用户终端。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (16)

1.一种基于人工智能的推送信息方法,其特征在于,所述方法包括:
获取用户的标签信息,其中,所述标签信息包括至少一个标签和与所述至少一个标签中的各个标签分别对应的标签关键词集合;
对于所述至少一个标签中的每个标签,从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含所述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,所述预存信息集合中的每条预存信息包括多个标签和与所述多个标签中的各个标签分别对应的关键词集合,所述多个标签包括所述至少一个标签,确定所述标签信息与所述拟推送信息组中的每条拟推送信息的相似度,包括:对于所述拟推送信息组中的每条拟推送信息,确定所述标签信息包括的标签关键词集合和该条拟推送信息包含的关键词集合中所属标签相同的标签关键词集合和关键词集合的匹配度,将所确定的各个匹配度相加所得的数值作为所述标签信息与该条拟推送信息的相似度;
合并所生成的各个拟推送信息组以生成拟推送信息集合;
基于所述标签信息与所述拟推送信息集合中的每条拟推送信息的相似度,在所述拟推送信息集合中选取拟推送信息作为待推送信息,并将所述待推送信息推送至所述用户的用户终端。
2.根据权利要求1所述的方法,其特征在于,所述在预存信息集合中匹配出包含所述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,包括:
在预先建立的、与所述查询用关键词所在的标签关键词集合所属的标签相关联的标识信息列表中查找出与所述查询用关键词匹配的目标标识信息,将所述目标标识信息所包含的标识集合中的各个标识分别指示的信息作为拟推送信息以生成所述拟推送信息组,其中,所述标识信息列表中的每条标识信息包括关键词标识和与所述关键词标识对应的标识集合,所述与所述关键词标识对应的标识集合中的每个标识是所述预存信息集合中的、包含所述关键词标识所指示的关键词的预存信息的标识。
3.根据权利要求1所述的方法,其特征在于,与所述至少一个标签中的每个标签分别对应的标签关键词集合中的每个关键词设置有权重值,对于所述预存信息集合中的每条预存信息,该条预存信息所包含的与所述多个标签中的各个标签分别对应的关键词集合中的每个关键词设置有权重值;以及
所述确定所述标签信息包括的标签关键词集合和该条拟推送信息包含的关键词集合中所属标签相同的标签关键词集合和关键词集合的匹配度,包括:
基于权重值,确定所述标签信息包括的标签关键词集合和所述该条拟推送信息包含的关键词集合中所属标签相同的标签关键词集合和关键词集合的匹配度。
4.根据权利要求1所述的方法,其特征在于,所述获取用户的标签信息,包括:
在预置标签信息集合中获取所述标签信息,其中,所述预置标签信息集合中的每条标签信息包括至少一个标签和与至少一个标签中的各个标签分别对应的标签关键词集合。
5.根据权利要求1所述的方法,其特征在于,所述获取用户的标签信息,还包括:
接收所述用户输入的查询信息;
对所述查询信息进行解析,提取出关键词组;
对所述关键词组中的关键词进行聚类,生成包含所述至少一个标签和与所述至少一个标签中的各个标签分别对应的标签关键词集合的所述标签信息。
6.根据权利要求1-5之一所述的方法,其特征在于,所述基于所述标签信息与所述拟推送信息集合中的每条拟推送信息的相似度,在所述拟推送信息集合中选取拟推送信息作为待推送信息,包括:
按照与所述标签信息的相似度由高到低的顺序对所述拟推送信息集合中的拟推送信息进行排序,将排序后的前预定数目条拟推送信息作为所述待推送信息。
7.根据权利要求1-5之一所述的方法,其特征在于,所述基于所述标签信息与所述拟推送信息集合中的每条拟推送信息的相似度,在所述拟推送信息集合中选取拟推送信息作为待推送信息,还包括:
将所述拟推送信息集合中的、与所述标签信息的相似度高于预定值的拟推送信息作为所述待推送信息。
8.一种基于人工智能的推送信息装置,其特征在于,所述装置包括:
获取单元,配置用于获取用户的标签信息,其中,所述标签信息包括至少一个标签和与所述至少一个标签中的各个标签分别对应的标签关键词集合;
确定单元,配置用于对于所述至少一个标签中的每个标签,从与该标签对应的标签关键词集合中提取出查询用关键词,在预存信息集合中匹配出包含所述查询用关键词的预存信息作为拟推送信息以生成与该标签相关联的拟推送信息组,所述预存信息集合中的每条预存信息包括多个标签和与所述多个标签中的各个标签分别对应的关键词集合,所述多个标签包括所述至少一个标签,确定所述标签信息与所述拟推送信息组中的每条拟推送信息的相似度;
所述确定单元包括:
确定子单元,配置用于对于所述拟推送信息组中的每条拟推送信息,确定所述标签信息包括的标签关键词集合和该条拟推送信息包含的关键词集合中所属标签相同的标签关键词集合和关键词集合的匹配度,将所确定的各个匹配度相加所得的数值作为所述标签信息与该条拟推送信息的相似度;
生成单元,配置用于合并所生成的各个拟推送信息组以生成拟推送信息集合;
推送单元,配置用于基于所述标签信息与所述拟推送信息集合中的每条拟推送信息的相似度,在所述拟推送信息集合中选取拟推送信息作为待推送信息,并将所述待推送信息推送至所述用户的用户终端。
9.根据权利要求8所述的装置,其特征在于,所述确定单元包括:
生成子单元,配置用于在预先建立的、与所述查询用关键词所在的标签关键词集合所属的标签相关联的标识信息列表中查找出与所述查询用关键词匹配的目标标识信息,将所述目标标识信息所包含的标识集合中的各个标识分别指示的信息作为拟推送信息以生成所述拟推送信息组,其中,所述标识信息列表中的每条标识信息包括关键词标识和与所述关键词标识对应的标识集合,所述与所述关键词标识对应的标识集合中的每个标识是所述预存信息集合中的、包含所述关键词标识所指示的关键词的预存信息的标识。
10.根据权利要求8所述的装置,其特征在于,与所述至少一个标签中的每个标签分别对应的标签关键词集合中的每个关键词设置有权重值,对于所述预存信息集合中的每条预存信息,该条预存信息所包含的与所述多个标签中的各个标签分别对应的关键词集合中的每个关键词设置有权重值;以及
所述确定子单元包括:
确定模块,配置用于基于权重值,确定所述标签信息包括的标签关键词集合和所述该条拟推送信息包含的关键词集合中所属标签相同的标签关键词集合和关键词集合的匹配度。
11.根据权利要求8所述的装置,其特征在于,所述获取单元包括:
获取子单元,配置用于在预置标签信息集合中获取所述标签信息,其中,所述预置标签信息集合中的每条标签信息包括至少一个标签和与至少一个标签中的各个标签分别对应的标签关键词集合。
12.根据权利要求8所述的装置,其特征在于,所述获取单元还包括:
接收子单元,配置用于接收所述用户输入的查询信息;
提取子单元,配置用于对所述查询信息进行解析,提取出关键词组;
处理子单元,配置用于对所述关键词组中的关键词进行聚类,生成包含所述至少一个标签和与所述至少一个标签中的各个标签分别对应的标签关键词集合的所述标签信息。
13.根据权利要求8-12之一所述的装置,其特征在于,所述推送单元包括:
第一确定子单元,配置用于按照与所述标签信息的相似度由高到低的顺序对所述拟推送信息集合中的拟推送信息进行排序,将排序后的前预定数目条拟推送信息作为所述待推送信息。
14.根据权利要求8-12之一所述的装置,其特征在于,所述推送单元还包括:
第二确定子单元,配置用于将所述拟推送信息集合中的、与所述标签信息的相似度高于预定值的拟推送信息作为所述待推送信息。
15.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201710169869.2A 2017-03-21 2017-03-21 基于人工智能的推送信息方法及装置 Active CN106960030B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710169869.2A CN106960030B (zh) 2017-03-21 2017-03-21 基于人工智能的推送信息方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710169869.2A CN106960030B (zh) 2017-03-21 2017-03-21 基于人工智能的推送信息方法及装置

Publications (2)

Publication Number Publication Date
CN106960030A CN106960030A (zh) 2017-07-18
CN106960030B true CN106960030B (zh) 2020-11-10

Family

ID=59471475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710169869.2A Active CN106960030B (zh) 2017-03-21 2017-03-21 基于人工智能的推送信息方法及装置

Country Status (1)

Country Link
CN (1) CN106960030B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107579969B (zh) * 2017-08-31 2020-12-01 江西博瑞彤芸科技有限公司 一种用户信息采集方法
CN107818183B (zh) * 2017-12-05 2021-07-13 云南大学 一种基于特征相似性度量的三阶段组合党建视频推荐方法
CN107992604B (zh) * 2017-12-14 2020-08-28 北京搜狗科技发展有限公司 一种任务条目的分发方法及相关装置
CN108268660A (zh) * 2018-02-08 2018-07-10 深圳市口袋网络科技有限公司 一种客户数据推荐方法、服务器及存储介质
CN110618844A (zh) * 2018-06-19 2019-12-27 优视科技有限公司 在应用界面显示标识信息的方法、装置、存储介质和终端
CN109165344A (zh) * 2018-08-06 2019-01-08 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN109245996B (zh) * 2018-09-18 2023-04-07 平安科技(深圳)有限公司 邮件推送方法、装置、计算机设备和存储介质
CN109067643B (zh) * 2018-09-26 2022-07-29 中国平安财产保险股份有限公司 基于关键字的回复方法、装置、计算机设备及存储介质
CN109992719B (zh) * 2019-04-02 2021-06-25 北京字节跳动网络技术有限公司 用于确定推送优先级信息的方法和装置
CN110113410B (zh) * 2019-04-30 2021-12-07 秒针信息技术有限公司 一种信息推送的管理方法、装置、电子设备及存储介质
CN110321544B (zh) * 2019-07-08 2023-07-25 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN110781421B (zh) * 2019-08-13 2023-10-17 腾讯科技(深圳)有限公司 一种虚拟资源展示的方法以及相关装置
CN111177700A (zh) * 2019-12-31 2020-05-19 北京明略软件***有限公司 行级权限的控制方法及装置
CN115250369A (zh) * 2021-08-23 2022-10-28 上海禾万企业发展有限公司 一种基于线上教育智能化视频推送方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106259A (zh) * 2013-01-25 2013-05-15 西北工业大学 一种基于情境的移动网页内容推荐方法
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
CN104166648A (zh) * 2013-05-16 2014-11-26 百度在线网络技术(北京)有限公司 基于标签的推荐数据挖掘方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8082247B2 (en) * 2009-07-30 2011-12-20 Microsoft Corporation Best-bet recommendations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106259A (zh) * 2013-01-25 2013-05-15 西北工业大学 一种基于情境的移动网页内容推荐方法
CN104166648A (zh) * 2013-05-16 2014-11-26 百度在线网络技术(北京)有限公司 基于标签的推荐数据挖掘方法及装置
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置

Also Published As

Publication number Publication date
CN106960030A (zh) 2017-07-18

Similar Documents

Publication Publication Date Title
CN106960030B (zh) 基于人工智能的推送信息方法及装置
CN108153901B (zh) 基于知识图谱的信息推送方法和装置
CN107256267B (zh) 查询方法和装置
CN107491547B (zh) 基于人工智能的搜索方法和装置
CN107679039B (zh) 用于确定语句意图的方法和装置
CN107491534B (zh) 信息处理方法和装置
CN107220352B (zh) 基于人工智能构建评论图谱的方法和装置
CN107220386B (zh) 信息推送方法和装置
CN107832414B (zh) 用于推送信息的方法和装置
CN107463704B (zh) 基于人工智能的搜索方法和装置
CN107346336B (zh) 基于人工智能的信息处理方法和装置
CN107241260B (zh) 基于人工智能的新闻推送的方法和装置
CN108572990B (zh) 信息推送方法和装置
CN107526718B (zh) 用于生成文本的方法和装置
CN110069698B (zh) 信息推送方法和装置
US10579655B2 (en) Method and apparatus for compressing topic model
US8661035B2 (en) Content management system and method
CN112100396B (zh) 一种数据处理方法和装置
CN107862058B (zh) 用于生成信息的方法和装置
CN111522927A (zh) 基于知识图谱的实体查询方法和装置
CN111737997A (zh) 一种文本相似度确定方法、设备及储存介质
CN110245357B (zh) 主实体识别方法和装置
CN111813993A (zh) 视频内容的拓展方法、装置、终端设备及存储介质
CN114298007A (zh) 一种文本相似度确定方法、装置、设备及介质
CN109902152B (zh) 用于检索信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant