CN111625680A

CN111625680A - 确定搜索结果的方法及装置

Info

Publication number: CN111625680A
Application number: CN202010413744.1A
Authority: CN
Inventors: 杨云龙
Original assignee: Qingdao Jukanyun Technology Co ltd
Current assignee: Qingdao Jukanyun Technology Co ltd
Priority date: 2020-05-15
Filing date: 2020-05-15
Publication date: 2020-09-04
Anticipated expiration: 2040-05-15
Also published as: CN111625680B

Abstract

本申请公开了一种确定搜索结果的方法及装置，属于数据处理领域。在本申请中，服务器可以获取目标用户的搜索文本，并根据搜索文本确定目标用户的用户意图，该用户意图用于指示目标用户基于搜索文本需要查询的媒资的信息，之后，可以根据用户意图获取搜索结果。这样，在根据搜索文本无法获取到搜索结果时，根据用户意图可以确定出目标用户基于搜索文本所需要查询的媒资，从而提高了基于语音方式搜索视频的准确率，进一步提高了用户对搜索视频的点击率。

Description

确定搜索结果的方法及装置

技术领域

本申请涉及数据处理领域，特别涉及一种确定搜索结果的方法及装置。

背景技术

目前，显示设备可以通过麦克风采集用户的一段语音，然后将该语音转换为搜索文本，并将该搜索文本发送给服务器。服务器可以根据搜索文本获取搜索结果，并向显示设备返回该搜索结果。然而，通常用户输入的语音较短，且缺乏有效的上下文信息，这样，根据搜索文本可能无法获取到搜索结果，此时，用户则无法选择观看视频。

相关技术中，当根据搜索文本无法获取到搜索结果时，服务器会向显示设备返回默认搜索结果。该默认搜索结果可以为热门搜索结果，或者为随机生成的搜索结果。

然而，由于默认搜索结果并不一定适合每一个用户，导致搜索结果可能并不是用户想要的搜索结果，因此，降低了基于语音方式搜索视频的准确率，从而降低了用户对搜索视频的点击率。

发明内容

本申请实施例提供了一种确定搜索结果的方法、装置及存储介质，可以解决基于语音方式搜索视频的准确率低，以及用户对搜索视频的点击率低的问题。

所述技术方案如下：

一方面，提供了一种确定搜索结果的方法，所述方法包括：

获取目标用户的搜索文本；

根据所述搜索文本确定所述目标用户的用户意图，所述用户意图用于指示所述目标用户基于所述搜索文本需要查询的媒资的信息；

根据所述用户意图获取搜索结果。

另一方面，提供了一种服务器，所述服务器包括：

第一获取模块，用于获取目标用户的搜索文本；

确定模块，用于根据所述搜索文本确定所述目标用户的用户意图，所述用户意图用于指示所述目标用户基于所述搜索文本需要查询的媒资的信息；

第二获取模块，用于根据所述用户意图获取搜索结果。

另一方面，提供了一种服务器，所述服务器包括处理器和显示器：

所述处理器用于：

获取目标用户的搜索文本；

根据所述用户意图获取搜索结果。

另一方面，提供了一种计算机可读存储介质，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现前述提供的确定搜索结果的方法的步骤。

本申请实施例提供的技术方案带来的有益效果至少包括：

在本申请实施例中，可以根据目标用户的搜索文本，确定目标用户的用户意图，进而根据确定的用户意图获取搜索结果。由此可见，本申请实施例不是直接根据搜索文本来确定搜索结果，而是根据搜索文本对应的用户意图来确定搜索结果，且用户意图用于指示目标用户基于搜索文本所需要查询的媒资的信息，这样，在根据搜索文本无法获取到搜索结果时，根据用户意图可以确定出目标用户基于搜索文本所需要查询的媒资，从而提高了基于语音方式搜索视频的准确率，进一步提高了用户对搜索视频的点击率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种确定搜索结果的方法所涉及的***架构图；

图2是本申请实施例提供的一种确定搜索结果的方法流程图；

图3是本申请实施例提供的第三学习模型的原理示意图；

图4是本申请实施例提供的另一种确定搜索结果的方法流程图；

图5是本申请实施例提供的一种服务器的结构示意图；

图6是本申请实施例提供的另一种服务器的结构示意图。

具体实施方式

为使本申请示例性实施例的目的、技术方案和优点更加清楚，下面将结合本申请示例性实施例中的附图，对本申请示例性实施例中的技术方案进行清楚、完整地描述，显然，所描述的示例性实施例仅是本申请一部分实施例，而不是全部的实施例。

基于本申请中示出的示例性实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。此外，虽然本申请中公开内容按照示范性一个或几个实例来介绍，但应理解，可以就这些公开内容的各个方面也可以单独构成一个完整技术方案。

应当理解，本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的那些组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

本申请中使用的术语“模块”，是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

在对本申请实施例进行详细的解释说明之前，先对本申请实施例涉及的应用场景予以介绍。

当前，用户可以通过麦克风在终端中输入一段语音，以搜索感兴趣的视频，在这种情况下，终端可以采集到用户输入的这段语音，然后将该语音转换为搜索文本，并将该搜索文本发送给服务器。服务器接收到搜索文本后，可以根据搜索文本获取搜索结果。本申请实施例提供的确定搜索结果的方法，即可以用于在上述场景中，服务器接收到终端发送的目标用户的搜索文本后，可以根据搜索文本确定目标用户的用户意图，且用户意图用于指示目标用户基于搜索文本需要查询的媒资的信息，之后，可以根据用户意图获取搜索结果，从而提高了基于语音方式搜索视频的效率。

接下来对本申请实施例提供的确定搜索结果的方法所涉及的***架构进行介绍。

图1是本申请实施例提供的一种确定搜索结果的方法所涉及的***架构图。如图1所示，该***包括终端101和服务器102。终端101和服务器102之间通过无线或有线方式连接以进行通信。

其中，终端101上可以安装有麦克风，终端101可以基于该麦克风采集用户的语音，并将语音转换为搜索文本，将搜索文本发送至服务器102。之后，终端101可以接收服务器102基于搜索文本返回的搜索结果，并显示搜索结果。

服务器102可以接收终端101发送的搜索文本，并确定搜索文本的用户意图。之后，可以确定用户意图对应的多个候选媒资，并确定该多个候选媒资中各个候选媒资的推荐分数。然后可以根据多个候选媒资的推荐分数，将多个候选媒资进行排序，并将排序后的候选媒资作为搜索结果。之后，服务器101可以将搜索结果发送至终端101。

在本申请实施例中，终端101可以为智能电视等设备，图1中仅仅是以智能电视举例进行说明，并不构成对本申请实施例的限定。服务器102可以是用于确定搜索结果的一台服务器或者一个服务器集群。

接下来对本申请实施例提供的确定搜索结果的方法进行介绍。

图2是本申请实施例提供的一种确定搜索结果的方法的流程图。该方法应用于服务器中，该服务器可以为图1中所示的服务器102。如图2所示，该方法包括以下步骤：

步骤201：服务器获取目标用户的搜索文本。

在一些可能的情况下，终端上安装有麦克风，这样，终端可以通过麦克风采集目标用户输入的语音，之后，可以将该语音转换为搜索文本，并将搜索文本发送至服务器。

示例性地，终端通过麦克风采集到目标用户输入的语音后，可以将该语音发送至转换服务器中，转换服务器可以将该语音转换为搜索文本，并将搜索文本发送至终端。终端可以接收到搜索文本，并将搜索文本发送至服务器中。

在另一些可能的情况下，终端可以显示搜索页面，该搜索页面包括搜索栏，用户可以通过遥控器、键盘等控制设备在该搜索栏中输入搜索文本。终端接收到用户输入的搜索文本之后，可以将搜索文本发送至服务器。

在终端将目标用户的搜索文本发送至服务器之后，服务器可以接收到终端发送的目标用户的搜索文本。

步骤202：服务器根据搜索文本确定目标用户的用户意图。

其中，用户意图用于指示目标用户基于搜索文本需要查询的媒资的信息。

服务器可以根据搜索文本确定粗粒度用户意图，在粗粒度用户意图不为无明确意图的情况下，可以基于搜索文本确定一个或多个细粒度用户意图。之后，可以根据该一个或多个细粒度用户意图获取搜索结果。

其中，粗粒度用户意图用于指示基于搜索文本查询媒资的可行性，任一细粒度用户意图用于指示待查询的媒资所属的一个类别，无明确意图用于指示搜索文本中不存在用于指示实体的文本。

需要说明的是，服务器先确定搜索文本的粗粒度用户意图，进而在粗粒度用户意图为不是无明确意图时，也即是，搜索文本中存在用于指示实体的文本时，进一步确定搜索文本的细粒度用户意图，从而可以更加准确的确定目标用户基于搜索文本需要查询的媒资的信息。这样，在搜索文本中存在用于指示实体的文本时，根据细粒度用户意图可以更加准确的获取到搜索结果。

其中，粗粒度用户意图可以包括：有结果的意图、错误的意图和无明确意图，该有结果的意图是指搜索文本中存在用于指示实体的文本，且指示的各个实体之间不存在相互矛盾的实体，该错误的意图是指在搜索文本中存在用于指示实体的文本，而指示的各个实体之间存在相互矛盾的实体，该无明确意图是指搜索文本中不存在用于指示实体的文本。

示例性地，假设搜索文本为“我想看赵本山的小品”，由于搜索文本中存在用于指示实体的文本，且指示的各个实体之间不存在相互矛盾的实体，因此搜索文本“我想看赵本山的小品”为有结果的意图。假设搜索文本为“我要看电视剧小猪佩奇”，该搜索文本中存在用于指示实体的文本，而小猪佩奇为动漫，并非电视剧，也即是，搜索文本指示的各个实体之间存在相互矛盾的实体，因此搜索文本“我要看电视剧小猪佩奇”为错误的意图。假设搜索文本为“你在干嘛”，由于搜索文本中不存在用于指示实体的文本，因此该搜索文本为无明确意图。

细粒度用户意图可以包括：电影、电视剧、动漫、综艺、导演、演员和奖项等。示例性地，继续前述举例，由于搜索文本“我想看赵本山的小品”为有结果的意图，因此可以进一步确定该搜索文本的细粒度用户意图为“演员：赵本山；类型：小品”。由于搜索文本“我要看电视剧小猪佩奇”为错误的意图，因此可以进一步确定该搜索文本的细粒度用户意图为“标题：小猪佩奇；类型：电视剧”。

作为一种示例，服务器可以基于第一学习模型根据搜索文本确定粗粒度用户意图，第一学习模型是通过多个历史搜索文本与多个历史搜索文本对应的粗粒度用户意图训练得到的。服务器还可以基于第二学习模型根据搜索文本确定一个或多个细粒度用户意图，第二学习模型是通过多个历史搜索文本与多个历史搜索文本对应的粗细粒度用户意图训练得到的。

服务器可以将接收到的搜索文本输入第一学习模型中，第一学习模型可以输出该搜索文本对应的粗粒度用户意图，也即是该搜索文本为有结果的意图、错误的意图或无明确意图。如果第一学习模型输出的该搜索文本的粗粒度用户意图为无明确意图时，服务器可以向终端返回无法查找到搜索结果。如果第一学习模型输出的该搜索文本的粗粒度用户意图不为无明确意图时，服务器可以进一步将该搜索文本输入第二学习模型中，第二学习模型可以输出该搜索文本对应的一个或多个细粒度用户意图，之后，服务器可以根据第二学习模型输出的该一个或多个细粒度用户意图在资源库中查找搜索结果。

需要说明的是，在训练第一学习模型时，服务器可以获取多个历史搜索文本，并根据该多个历史搜索文本是否可以查找到搜索结果，将该多个历史搜索文本进行分类，并给可以查找到搜索结果的多个历史搜索文本添加“有结果的意图”的标注。之后，服务器可以确定无法查找到搜索结果的多个历史搜索文本是否包含有效信息，给包含有效信息的历史搜索文本添加“错误的意图”的标注，给不包含有效信息的历史搜索文本添加“无明确意图”的标注，也即是在每个历史搜索文本上标注了对应的粗粒度用户意图，则可以将标注了粗粒度用户意图的该多个历史搜索文本作为训练第一学习模型的数据库，对第一学习模型进行训练。

在训练第二学习模型时，服务器可以获取多个历史搜索文本，且该多个历史搜索文本的粗粒度用户意图不为“无明确意图”。其中，服务器可以直接从前述用于训练第一学习模型的多个历史搜索文本中获取标注不为“无明确意图”的多个历史搜索文本，也可以重新获取多个历史搜索文本，并从中筛选出可以查找到搜索结果，或者，包含有效信息的多个搜索文本，本申请实施例在此不做限定。之后，服务器可以确定每个历史搜索文本中包含的演员、标题、类型、导演等有效信息，进而将获取的有效信息作为标注添加在对应的历史搜索文本上，也即是在每个历史搜索文本上标注了对应的细粒度用户意图，则可以将标注了细粒度用户意图的该多个历史搜索文本作为训练第二学习模型的数据库，对第一学习模型进行训练。

可选地，在一些实施例中，第一学习模型和第二学习模型可以为同一学习模型，也即是第四学习模型。第四学习模型是通过多个历史搜索文本与多个历史搜索文本对应的粗粒度用户意图和细粒度用户意图同时训练得到的，也即是，给多个历史搜索文本同时标注粗粒度用户意图和细粒度用户意图，之后，将标注了粗粒度用户意图和细粒度用户意图的多个历史搜索文本作为训练该学习模型的数据库，对该学习模型进行训练。在这种情况下，服务器可以将接收到的搜索文本输入第四学习模型中，第四学习模型可以输出搜索文本对应的粗粒度用户意图以及细粒度用户意图。

示例性地，可以对BERT(Bidirectional Encoder Representation fromTransformers，基于转换器的双向编码器表示)神经网络模型进行训练，得到第四学习模型。比如，可以同时对BERT神经网络模型通过标注有粗粒度用户意图和细粒度用户意图的数据进行训练，构建一个第四学习模型。第四学习模型相较于第一学习模型和第二学习模型，具有以下优点：1、由于同一搜索文本的粗粒度用户意图和细粒度用户意图之间存在相应的语义关联，因此一个模型能够减少两个模型的识别带来的错误传播，从而可以建立数据之间的联系。例如“我要看快乐大本营”该搜索文本即是有结果的意图，也是细粒度的综艺类型的意图。分别通过粗粒度用户意图和细粒度用户意图训练两个模型会割裂了其中的层次关系；2、一个模型的参数和复杂度要低于两个模型，在实际使用的时候能更好的响应用户的请求；3、由于网络链路上存在时间和网络时延，因此，单个模型可以更好的实现。

其中，BERT神经网络模型是一个基于预训练词向量的表示模型，可以获取到句子级别的深层语义表示，例如：句子关系匹配，情感分类，实体识别等。因此可以通过训练后的BERT神经网络模型不仅能有效识别出搜索文本的粗粒度用户意图，还可以进一步确定细粒度用户意图。

可选地，前述通过学习模型确定搜素文本的用户意图是一种可能的实现方式，还可以通过其他的实现方式来确定搜索文本的用户意图，本申请实施例在此不做限定。

步骤203：服务器根据用户意图获取搜索结果。

示例地，当服务器确定出搜索文本对应的一个或多个细粒度用户意图之后，可以获取与一个或多个细粒度用户意图中各个细粒度用户意图对应的多个候选媒资，并根据目标用户的历史查询特征和用户场景特征，确定任一细粒度用户意图对应的多个候选媒资中各个候选媒资的关联分数。之后，服务器可以根据各个细粒度用户意图对应的多个候选媒资的关联分数，确定搜索结果。其中，目标用户的历史查询特征用于指示目标用户在当前时间之前查询的媒资的属性，目标用户的用户场景特征用于指示目标用户本身的属性，关联分数用于指示相应候选媒资与搜索文本之间的相关性。

上述获取与一个或多个细粒度用户意图中各个细粒度用户意图对应的多个候选媒资的实现方式可以为：服务器可以根据该一个或多个细粒度用户意图中的每个细粒度用户意图在资源库中进行查找，获取与该细粒度用户意图匹配的多个媒资，并将该多个媒资作为该细粒度用户意图对应的多个候选媒资，这样，可以确定该一个或多个细粒度用户意图中各个细粒度用户意图对应的多个候选媒资。

示例性地，假设一个或多个细粒度用户意图中的一个细粒度用户意图为“演员：赵本山”，服务器则可以根据该细粒度用户意图从资源库中查找演员为赵本山的多个媒资，并将该多个媒资作为细粒度用户意图“演员：赵本山”对应的多个候选媒资。

服务器确定每个细粒度用户意图对应的多个候选媒资之后，可以根据目标用户的历史查询特征和用户场景特征，确定每个细粒度用户意图对应的多个候选媒资中各个候选媒资的关联分数。

为了后续便于说明，在此先对历史查询特征和用户场景特征进行解释说明。

其中，获取目标用户的用户场景特征和历史场景特征可以提供更好的用户体验。例如，老年人在搜索电影的时候，更倾向于搜索年代较老的影片；而年轻人在搜索电影的时候，更倾向于搜索现在比较火的影片等；并且不同层级的消费者对影片的需求也是不同的，会员用户更倾向观看付费影片；而非会员用户就比较难接受搜索结果中包含大量的付费影片。因此，本申请实施例可以结合目标用户的用户场景特征和历史场景特征来确定搜索结果，以使确定的搜索结果更能体现目标用户的需求。

上述历史查询特征可以包括历史搜索文本与该历史搜索文本对应的点击媒资，用户场景特征可以包括获取搜索文本的时间、目标用户的当前所处的位置信息、以及目标用户的用户信息中的一个或多个，用户信息包括年龄和/或性别。

示例地，服务器可以从转换服务器中获取目标用户输入的语音的声纹信息，该声纹信息包括目标用户的年龄和性别，这样，服务器可以从目标用户的声纹信息中获取目标用户的年龄和性别，并将目标用户的年龄和性别作为用户信息。

又示例地，当目标用户在终端中进行了注册且输入了资料信息时，服务器可以直接从终端中获取存储的目标用户的资料信息，并将该资料信息作为用户信息，该资料信息可以包括目标用户标识、年龄、性别、职业以及喜好的媒体资源的类型，在这种情况下，用户信息还包括目标用户的喜好。

此时，服务器还可以获取目标用户的当前所处的位置信息，当前所处的位置信息可以包括经纬度信息。服务器还可以确定获取搜索文本的时间。之后，服务器可以将获取搜索文本的时间、目标用户的当前所处的位置信息、以及目标用户的用户信息作为目标用户的用户场景特征。

需要说明的是，上述用户信息在一定程度上可以指示用户可能感兴趣的视频类型。根据位置信息可以确定目标用户所属的地区，由于不同地区的用户的购买和消费水平差异很大，因此，可以根据目标用户所属地区的购买和消费水平，调整搜索结果中付费视频的数量。根据获取搜索文本的时间可以确定用户当前可能观看的视频类型，例如：早上7点左右倾向于观看每天的新闻，晚上8点左右倾向于观看热播的电视剧、电影等，而晚间10点以后倾向于观看时长较短的视频。正是基于这些因素，可以将目标用户当前所处的位置信息、目标用户的用户信息、目标用户输入搜索文本的时间等信息作为该目标用户的用户场景特征，以便于后续基于用户场景特征确定的搜索结果会更加准确，从而可以提升用户体验，以及视频的点击率。

可选的，用户场景特征还可以包括终端软件版本、终端牌照等信息。由于终端牌照和终端软件版本对终端可以播放的视频播放有所限制，因此根据终端软件版本和终端牌照可以确定终端可以播放的视频类型。例如，一些终端可以播放3k、4d视频，而一些终端无法支持播放3k、4d等视频，这样，如果搜索结果中包括3k、4d等视频时，会导致不支持播放该类视频的终端无法播放的情况。所以通过终端软件版本和终端牌照等信息，可以有效避免此类情况的发生。正是基于上述考量，在本申请实施例中，可以将终端软件版本、终端牌照等信息也作为用户场景特征中的信息，以便于后续基于用户场景特征确定的搜索结果会更加准确，从而可以提升用户体验，以及视频的点击率。

作为一种示例，对于一个或多个细粒度用户意图中的目标细粒度用户意图，服务器可以基于第三学习模型根据目标用户的历史查询特征和用户场景特征、以及搜索文本，确定目标细粒度用户意图对应的多个候选媒资中各个候选媒资的关联分数。其中，第三学习模型是通过多个历史搜索文本、与多个历史搜索文本对应的点击媒资、与多个历史搜索文本对应的用户场景特征和历史查询特征训练得到的，与任一历史搜索文本对应的点击媒资用于指示基于任一历史搜索文本的搜索结果查看的媒资。

需要说明的是，第三学习模型中包括第一模块、第二模块和第三模块。其中，第一模块用于根据历史查询特征，确定历史查询特征向量。第二模块可以根据多个历史搜索文本、与多个历史搜索文本对应的点击媒资中的每个历史搜索文本和该历史搜索文本对应的点击媒资，生成一个向量，进而根据多个向量确定历史查询特征向量。

第二模块用于根据多个历史搜索文本，与多个搜索文本对应的用户场景特征确定用户场景特征向量。第二模块可以根据每个历史搜索文本和该历史搜索文本对应的用户场景特征中的一个特征，生成一个向量，例如，可以根据历史搜索文本和该历史搜索文本对应的用户信息生成一个向量，进而根据多个向量确定用户场景特征向量。

第三模块用于根据搜索文本，与该搜索文本对应的用户场景特征向量，以及该搜索文本对应的多个候选媒资，分别计算每个候选媒资的第一得分，第三模块还用于根据搜索文本，与该搜索文本对应的历史查询特征向量，以及该搜索文本对应的多个候选媒资，分别计算每个候选媒资的第二得分，之后，可以根据每个候选媒资的第一得分和第二得分得到每个候选媒资的关联分数。

示例性地，可以将每个候选媒资的第一得分和第二得分的平均值，作为每个候选媒资的关联分数，可选地，还可以将每个候选媒资的第一得分和第二得分中较低的得分，作为每个候选媒资的关联分数。

需要说明的是，第三学习模型中处理的向量均为同维向量，也即是，历史查询特征向量和用户场景特征向量的维度相同。并且，第三学习模型还可以将搜索文本、各个候选媒资均转化为与历史查询特征向量和用户场景特征向量维度相同的向量，基于此，可以通过计算向量之间的相似度，来得到第一得分和第二得分。

如图3所示，服务器可以将目标用户的搜索文本，目标用户的各个细粒度用户意图对应的多个候选媒资、目标用户的用户场景特征和历史查询特征输入第三学习模型中，第三学习模型可以将目标用户的搜索文本和目标用户的用户场景特征中的一个特征输入一个GRU(Gate Recurrent Unit，循环神经网络)中，从而通过该GRU生成一个向量，并根据目标用户的搜索文本与用户场景特征中的不同特征分别得到的多个向量，生成用户场景特征向量。第三学习模型还可以将每个历史搜索文本和该历史搜索文本对应的点击媒资分别输入不同的GRU中，从而生成多个向量，并根据该多个向量，生成历史查询特征向量。之后，可以根据目标用户的搜索文本、目标用户的用户场景特征向量，以及该搜索文本对应的多个候选媒资，分别计算每个候选媒资的第一得分，以及该搜索文本，与该搜索文本对应的历史查询特征向量，以及该搜索文本对应的多个候选媒资，分别计算每个候选媒资的第二得分，进而根据每个候选媒资的第一得分和第二得分得到每个候选媒资的关联分数，之后，第三学习模型可以输出该多个候选媒资中各个候选媒资的关联分数。

在一些实施例中，服务器可以根据各个候选媒资的关联分数将多个候选媒资进行排序，并将排序后的候选媒资作为搜索结果。

在另一些实施例中，第二学习模型还可以输出搜索文本的一个或多个细粒度用户意图中，每个细粒度用户意图的意图权重，意图权重用于指示相应细粒度用户意图在多个细粒度用户意图中的重要程度。在这种情况下，服务器可以确定目标用户的搜索文本对应的各个细粒度用户意图的意图权重，之后，可以根据各个细粒度用户意图的意图权重，以及各个细粒度用户意图对应的多个候选媒资的关联分数，确定任一候选媒资的推荐分数，并根据推荐分数对各个候选媒资进行排序，将排序后的候选媒资作为搜索结果。其中，任一细粒度用户意图的权重用于指示目标用户需要搜索的媒资的意图为相应细粒度用户意图的概率，且一个搜索文本对应的一个或多个细粒度用户意图的意图权重之和为1。

需要说明的是，在粗粒度用户意图为有结果意图的情况下，各个细粒度用户意图的意图权重相同，有结果意图指示的各个实体之间不存在相互矛盾的实体。在粗粒度用户意图为错误意图的情况下，各个细粒度用户意图的意图权重不相同，错误意图指示的各个实体之间存在相互矛盾的实体。

在粗粒度用户意图为有结果意图的情况下，说明搜索文本指示的各个实体之间不存在相互矛盾的实体实，也即是，根据确定的一个或多个细粒度用户意图可以查找到搜索结果，在这种情况下，各个细粒度用户意图的意图权重相同。

示例性地，继续以搜索文本为“我想看赵本山的小品”进行举例，该搜索文本的细粒度用户意图为“演员：赵本山；类型：小品”，由于赵本山确实是小品演员，也即是搜索文本中包括的实体均符合客观事实，因此，根据演员：赵本山；类型：小品，可以查找到搜索结果，在这种情况下，“演员：赵本山”该细粒度用户意图的意图权重为0.5，“类型：小品”该细粒度用户意图的意图权重也为0.5。

在粗粒度用户意图为错误意图的情况下，说明搜索文本指示的各个实体之间存在相互矛盾的实体，也即是，根据确定的一个或多个细粒度用户意图中的各个细粒度用户意图分别可以查找到搜索结果，然而根据该一个或多个细粒度用户意图却无法查找到搜索结果，在这种情况下，各个细粒度用户意图的意图权重不相同。

作为一种示例，可以根据一个或多个细粒度用户意图中的各个细粒度用户意图在资源库中对应的媒资的数目，来确定各个细粒度用户意图的意图权重。假设搜索文本S的细粒度用户意图集合为x＝{x₁、x₂、x₃…x_k}，则细粒度用户意图x_i的意图权重可以通过下述公式(1)计算得到：

其中，m_i表示细粒度用户意图xi在资源库中对应的媒资的数目，k为细粒度用户意图的总数，且所有细粒度意图的权重总和为1。

示例性地，搜索文本为“我想看刘德华主演的电视剧”，该搜索文本的细粒度用户意图为“演员：刘德华；类型：电视剧”，假设细粒度用户意图x1“类型：电视剧”在资源库中对应的媒资的数目为1000部，细粒度用户意图x2“演员：刘德华”在资源库中对应的媒资的数目为50部。则细粒度用户意图x1的意图权重可以通过下述公式(2)确定为0.03，细粒度用户意图x2的意图权重为0.97。

可选地，在训练上述第二学习模型时，对于训练数据中任一细粒度用户意图，在计算得到的意图权重之后，由于意图权重为是连续的值，在训练模型时存在难以拟合等问题，因此，可以将计算得到的意图权重均匀分配到0-10这10个离散值上。例如，以0.1为间隔，意图权重在0-0.1(包含0.1，不包含0)之间的，可以分配在数值0上，意图权重在0.1-0.2(包含0.2，不包含0.1)之间的，可以分配在数值1上，以此类推，将连续性变量的意图权重转换成分为10类的问题，从而便于第二学习模型的训练。

服务器可以将候选媒资的关联分数，与该候选媒资所属的细粒度用户意图的意图权重相乘，从而得到确定该候选媒资的推荐分数。之后，可以根据推荐分数对各个候选媒资进行排序，并将排序后的候选媒资作为搜索结果。

作为一种示例，以下内容将本申请实施例提供的确定搜索结果的方法，应用于终端中来进行完整的说明。

如图4所示，终端采集到的目标用户通过麦克风输入的语音后，可以将该语音转换为搜索文本，并将搜索文本发送至服务器。服务器可以接收到搜索文本，并调用第一学习模型确定搜索文本的粗粒度用户意图，当粗粒度用户意图为“无明确意图”时，服务器可以向***端返回消息，该消息用于指示未查找到搜索结果。当粗粒度用户意图不为“无明确意图”时，服务器可以调用第二学习模型确定搜索文本的一个或多个细粒度用户意图，可选地，每个细粒度用户意图可以对应有意图权重。在确定一个或多个细粒度用户意图后，服务器可以根据各个细粒度用户意图从资源库中查找匹配的媒资，从而确定多个候选媒资。

在确定多个候选媒资后，服务器可以获取目标用户的用户场景特征，并调用第三学习模型，以根据搜索文本、多个候选媒资以及用户场景特征确定每个候选媒资的关联分数。之后，服务器可以根据每个候选媒资的关联分数，以及每个候选媒资所属的细粒度用户意图的意图权重，确定每个候选媒资的推荐分数，进而根据推荐分数将多个候选媒资进行排序，并将排序后的多个候选媒资作为搜索结果。之后，服务器可以将搜索结果返回至***端，***端接收到搜索结果后，可以将搜索结果返回至终端。

关于图4的详细实现方式可以参考上述步骤201至步骤203的实现方式，在此不再赘述。

参见图5，本申请实施例提供了一种服务器500，该服务器500包括：

第一获取模块501，用于获取目标用户的搜索文本；

确定模块502，用于根据搜索文本确定目标用户的用户意图，用户意图用于指示目标用户基于搜索文本需要查询的媒资的信息；

第二获取模块503，用于根据用户意图获取搜索结果。

可选地，确定模块502包括：

第一确定子模块，用于根据搜索文本确定粗粒度用户意图，粗粒度用户意图用于指示基于搜索文本查询媒资的可行性；

第二确定子模块，用于在粗粒度用户意图不为无明确意图的情况下，基于搜索文本确定一个或多个细粒度用户意图，任一细粒度用户意图用于指示待查询的媒资所属的一个类别，无明确意图用于指示搜索文本中不存在用于指示实体的文本；

所述第二获取模块503具体用于：

根据一个或多个细粒度用户意图获取搜索结果。

可选地，第一确定子模块具体用于：

基于第一学习模型根据搜索文本确定粗粒度用户意图，第一学习模型是通过多个历史搜索文本与多个历史搜索文本对应的粗粒度用户意图训练得到的。

可选地，第二确定子模块具体用于：

可选地，第二获取模块503包括：

获取子模块，用于获取与一个或多个细粒度用户意图中各个细粒度用户意图对应的多个候选媒资；

第三确定子模块，用于根据目标用户的历史查询特征和用户场景特征，确定任一细粒度用户意图对应的多个候选媒资中各个候选媒资的关联分数，目标用户的历史查询特征用于指示目标用户在当前时间之前查询的媒资的属性，目标用户的用户场景特征用于指示所述目标用户本身的属性，关联分数用于指示相应候选媒资与搜索文本之间的相关性；

第四确定子模块，用于根据各个细粒度用户意图对应的多个候选媒资的关联分数，确定搜索结果。

可选地，第三确定子模块具体用于：

对于一个或多个细粒度用户意图中的目标细粒度用户意图，基于第三学习模型根据目标用户的历史查询特征和用户场景特征、以及搜索文本，确定目标细粒度用户意图对应的多个候选媒资中各个候选媒资的关联分数；

其中，第三学习模型是通过多个历史搜索文本、与多个历史搜索文本对应的点击媒资、以及与多个历史搜索文本对应的用户场景特征和历史查询特征训练得到的，与任一历史搜索文本对应的点击媒资用于指示基于任一历史搜索文本的搜索结果查看的媒资。

可选地，目标用户的用户场景特征包括获取搜索文本的时间、目标用户的当前所处的位置信息、以及目标用户的用户信息中的一个或多个，用户信息包括年龄和/或性别。

可选地，第四确定子模块具体用于：

确定各个细粒度用户意图的意图权重，任一细粒度用户意图的权重用于指示相应细粒度用户意图在所述一个或多个细粒度用户意图中的重要程度；

根据各个细粒度用户意图的意图权重，以及各个细粒度用户意图对应的多个候选媒资的关联分数，确定任一候选媒资的推荐分数；

根据推荐分数对各个候选媒资进行排序，将排序后的候选媒资作为搜索结果。

可选地，在粗粒度用户意图为有结果意图的情况下，各个细粒度用户意图的意图权重相同，有结果意图用于指示基于搜索文本指示的各个实体之间不存在相互矛盾的实体；

在粗粒度用户意图为错误意图的情况下，各个细粒度用户意图的意图权重不相同，错误意图指示的各个实体之间存在相互矛盾的实体。

综上所述，在本申请实施例中，可以根据目标用户的搜索文本，确定目标用户的用户意图，进而根据确定的用户意图获取搜索结果。由此可见，本申请实施例不是直接根据搜索文本来确定搜索结果，而是根据搜索文本对应的用户意图来确定搜索结果，且用户意图用于指示目标用户基于搜索文本所需要查询的媒资的信息，这样，在根据搜索文本无法获取到搜索结果时，根据用户意图可以确定出目标用户基于搜索文本所需要查询的媒资，从而提高了基于语音方式搜索视频的准确率，进一步提高了用户对搜索视频的点击率。

需要说明的是：上述实施例提供的确定搜索结果的装置在确定搜索结果时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的确定搜索结果的装置与确定搜索结果的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图6示出了本申请一个示例性实施例是本申请实施例提供的一种用于确定搜索结果的服务器600的结构示意图。上述图2所示的实施例中的服务器的功能即可以通过图6中所示的服务器来实现。该服务器可以是后台服务器集群中的服务器。具体来讲：

服务器600包括中央处理单元(CPU)601、包括随机存取存储器(RAM)602和只读存储器(ROM)603的***存储器604，以及连接***存储器604和中央处理单元601的***总线605。服务器600还包括帮助计算机内的各个器件之间传输信息的基本输入/输出***(I/O***)606，和用于存储操作***613、应用程序614和其他程序模块615的大容量存储设备607。

基本输入/输出***606包括有用于显示信息的显示器608和用于用户输入信息的诸如鼠标、键盘之类的输入设备609。其中显示器608和输入设备609都通过连接到***总线605的输入输出控制器610连接到中央处理单元601。基本输入/输出***606还可以包括输入输出控制器610以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器610还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备607通过连接到***总线605的大容量存储控制器(未示出)连接到中央处理单元601。大容量存储设备607及其相关联的计算机可读介质为服务器600提供非易失性存储。也就是说，大容量存储设备607可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。

不失一般性，计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术，CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的***存储器604和大容量存储设备607可以统称为存储器。

根据本申请的各种实施例，服务器600还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器600可以通过连接在***总线605上的网络接口单元611连接到网络612，或者说，也可以使用网络接口单元611来连接到其他类型的网络或远程计算机***(未示出)。

上述存储器还包括一个或者一个以上的程序，一个或者一个以上程序存储于存储器中，被配置由CPU执行。所述一个或者一个以上程序包含用于进行本申请实施例提供的确定搜索结果的方法指令。

本申请实施例还提供了一种非临时性计算机可读存储介质，当所述存储介质中的指令由服务器的处理器执行时，使得服务器能够执行上述图2所示实施例提供的确定搜索结果的方法。

本申请实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述图2所示实施例提供的确定搜索结果的方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种确定搜索结果的方法，其特征在于，所述方法包括：

获取目标用户的搜索文本；

根据所述用户意图获取搜索结果。

2.根据权利要求1所述的方法，其特征在于，所述根据所述搜索文本确定所述目标用户的用户意图，包括：

根据所述搜索文本确定粗粒度用户意图，所述粗粒度用户意图用于指示基于所述搜索文本查询媒资的可行性；

在所述粗粒度用户意图不为无明确意图的情况下，基于所述搜索文本确定一个或多个细粒度用户意图，任一细粒度用户意图用于指示待查询的媒资所属的一个类别，所述无明确意图用于指示所述搜索文本中不存在用于指示实体的文本；

所述根据所述用户意图获取搜索结果，包括：

根据所述一个或多个细粒度用户意图获取所述搜索结果。

3.根据权利要求2所述的方法，其特征在于，所述根据所述搜索文本确定粗粒度用户意图，包括：

基于第一学习模型根据所述搜索文本确定粗粒度用户意图，所述第一学习模型是通过多个历史搜索文本与所述多个历史搜索文本对应的粗粒度用户意图训练得到的。

4.根据权利要求2所述的方法，其特征在于，所述基于所述搜索文本确定一个或多个细粒度用户意图，包括：

基于第二学习模型根据所述搜索文本确定一个或多个细粒度用户意图，所述第二学习模型是通过多个历史搜索文本与所述多个历史搜索文本对应的细粒度用户意图训练得到的。

5.根据权利要求2至4任一所述的方法，其特征在于，所述根据所述一个或多个细粒度用户意图获取所述搜索结果，包括：

获取与所述一个或多个细粒度用户意图中各个细粒度用户意图对应的多个候选媒资；

根据所述目标用户的历史查询特征和用户场景特征，确定任一细粒度用户意图对应的多个候选媒资中各个候选媒资的关联分数，所述目标用户的历史查询特征用于指示所述目标用户在当前时间之前查询的媒资的属性，所述目标用户的用户场景特征用于指示所述目标用户本身的属性，所述关联分数用于指示相应候选媒资与所述搜索文本之间的相关性；

根据所述各个细粒度用户意图对应的多个候选媒资的关联分数，确定所述搜索结果。

6.根据权利要求5所述的方法，其特征在于，所述根据所述目标用户的历史查询特征和用户场景特征，确定任一细粒度用户意图对应的多个候选媒资中各个候选媒资的关联分数，包括：

对于所述一个或多个细粒度用户意图中的目标细粒度用户意图，基于第三学习模型根据所述目标用户的历史查询特征和用户场景特征、以及所述搜索文本，确定所述目标细粒度用户意图对应的多个候选媒资中各个候选媒资的关联分数；

其中，所述第三学习模型是通过多个历史搜索文本、与所述多个历史搜索文本对应的点击媒资、以及与所述多个历史搜索文本对应的用户场景特征和历史查询特征训练得到的，所述与任一历史搜索文本对应的点击媒资用于指示基于所述任一历史搜索文本的搜索结果查看的媒资。

7.根据权利要求5所述的方法，其特征在于，所述目标用户的用户场景特征包括获取所述搜索文本的时间、所述目标用户的当前所处的位置信息、以及所述目标用户的用户信息中的一个或多个，所述用户信息包括年龄和/或性别。

8.根据权利要求5所述的方法，其特征在于，所述根据所述各个细粒度用户意图对应的多个候选媒资的关联分数，确定所述搜索结果，包括：

确定所述各个细粒度用户意图的意图权重，任一细粒度用户意图的意图权重用于指示相应细粒度用户意图在所述一个或多个细粒度用户意图中的重要程度；

根据各个细粒度用户意图的意图权重，以及所述各个细粒度用户意图对应的多个候选媒资的关联分数，确定任一候选媒资的推荐分数；

根据所述推荐分数对各个候选媒资进行排序，将排序后的候选媒资作为所述搜索结果。

9.根据权利要求8所述的方法，其特征在于，在所述粗粒度用户意图为有结果意图的情况下，所述各个细粒度用户意图的意图权重相同，所述有结果意图用于指示基于所述搜索文本指示的各个实体之间不存在相互矛盾的实体；

在所述粗粒度用户意图为错误意图的情况下，所述各个细粒度用户意图的意图权重不相同，所述错误意图用于指示所述搜索文本指示的各个实体之间存在相互矛盾的实体。

10.一种服务器，其特征在于，所述服务器包括：

第一获取模块，用于获取目标用户的搜索文本；

第二获取模块，用于根据所述用户意图获取搜索结果。