CN111367492A

CN111367492A - 网页页面展示方法及装置、存储介质

Info

Publication number: CN111367492A
Application number: CN202010144256.5A
Authority: CN
Inventors: 梁宇轩
Original assignee: Shenzhen Tencent Information Technology Co Ltd
Current assignee: Shenzhen Tencent Information Technology Co Ltd
Priority date: 2020-03-04
Filing date: 2020-03-04
Publication date: 2020-07-03
Anticipated expiration: 2040-03-04
Also published as: CN111367492B

Abstract

本申请提供一种网页页面展示方法及装置、存储介质，属于人工智能领域，该方法包括：终端向服务器发送第一语音，服务器从活动场景库中确定与该第一语音匹配的目标活动场景，该目标活动场景包括多个目标元素以及与该多个目标元素对应的多个目标动作，对于该多个目标动作中的每个目标动作，服务器从动作模型库中确定与该目标动作匹配的目标动作模型，得到多个目标动作模型，服务器向终端发送该多个目标元素、该多个目标动作和该多个目标动作模型，终端根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面。本申请有助于提高网页页面展示方式的灵活性。

Description

网页页面展示方法及装置、存储介质

技术领域

本申请涉及人工智能领域，特别涉及一种网页页面展示方法及装置、存储介质。

背景技术

随着互联网与信息技术的发展，网络运营活动(例如广告、抽奖活动)日益普及，网络运营活动通常展示在网页页面中。

目前，用户通常通过键盘和/或鼠标触发终端展示网页页面。但是这样的网页页面展示方式的灵活性较差。

发明内容

本申请提供一种网页页面展示方法及装置、存储介质，有助于提高网页页面展示方式的灵活性。所述技术方案如下：

第一方面，提供一种网页页面展示方法，所述方法包括：

接收终端发送的第一语音；

从活动场景库中确定与所述第一语音匹配的目标活动场景，所述目标活动场景包括多个目标元素以及与所述多个目标元素对应的多个目标动作；

对于所述多个目标动作中的每个目标动作，从动作模型库中确定与所述目标动作匹配的目标动作模型，得到多个目标动作模型；

向所述终端发送所述多个目标元素、所述多个目标动作和所述多个目标动作模型，以便于所述终端根据所述多个目标元素、所述多个目标动作和所述多个目标动作模型展示所述目标活动场景对应的网页页面。

第二方面，提供一种网页页面展示方法，所述方法包括：

向服务器发送第一语音；

接收所述服务器发送的多个目标元素、多个目标动作和多个目标动作模型，所述多个目标元素和所述多个目标动作属于与所述第一语音匹配的目标活动场景，所述多个目标动作模型与所述多个目标动作匹配；

根据所述多个目标元素、所述多个目标动作和所述多个目标动作模型展示所述目标活动场景对应的网页页面。

第三方面，提供一种网页页面展示装置，所述装置包括：

接收模块，用于接收终端发送的第一语音；

第一确定模块，用于从活动场景库中确定与所述第一语音匹配的目标活动场景，所述目标活动场景包括多个目标元素以及与所述多个目标元素对应的多个目标动作；

第二确定模块，用于对于所述多个目标动作中的每个目标动作，从动作模型库中确定与所述目标动作匹配的目标动作模型，得到多个目标动作模型；

发送模块，用于向所述终端发送所述多个目标元素、所述多个目标动作和所述多个目标动作模型，以便于所述终端根据所述多个目标元素、所述多个目标动作和所述多个目标动作模型展示所述目标活动场景对应的网页页面。

第四方面，提供一种网页页面展示装置，所述装置包括：

发送模块，用于向服务器发送第一语音；

接收模块，用于接收所述服务器发送的多个目标元素、多个目标动作和多个目标动作模型，所述多个目标元素和所述多个目标动作属于与所述第一语音匹配的目标活动场景，所述多个目标动作模型与所述多个目标动作匹配；

展示模块，用于根据所述多个目标元素、所述多个目标动作和所述多个目标动作模型展示所述目标活动场景对应的网页页面。

第五方面，提供一种网页页面展示装置，所述装置包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述第一方面所述的方法。

第六方面，提供一种网页页面展示装置，所述装置包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述第二方面所述的方法。

第七方面，提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述各个方面所述的方法。

第八方面，提供一种网页页面展示***，包括服务器和终端；

在一种实现方式中，所述服务器包括上述第三方面所述的网页页面展示装置，所述终端包括上述第四方面所述的网页页面展示装置；

在另一种实现方式中，所述服务器包括上述第五方面所述的网页页面展示装置，所述终端包括上述第六方面所述的网页页面展示装置。

本申请提供的技术方案带来的有益效果是：

本申请提供一种网页页面展示方法及装置、存储介质，终端向服务器发送第一语音后，服务器从活动场景库中确定与该第一语音匹配的目标活动场景，该目标活动场景包括多个目标元素以及与该多个目标元素对应的多个目标动作，对于该多个目标动作中的每个目标动作，服务器从动作模型库中确定与该目标动作匹配的目标动作模型，得到多个目标动作模型，并向终端发送该多个目标元素、该多个目标动作和该多个目标动作模型，终端根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面。由于终端基于语音展示网页页面，相比于通过键盘和/或鼠标触发终端展示网页页面的方式，有助于提高网页页面展示方式的灵活性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本申请。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请各个实施例所涉及的一种实施环境的示意图；

图2是本申请实施例提供的一种音频API的示意图；

图3是本申请实施例提供的一种终端和服务器的交互示意图；

图4是本申请实施例提供的一种网页页面展示方法的方法流程图；

图5是本申请实施例提供的另一种网页页面展示方法的方法流程图；

图6是本申请实施例提供的一种分析第一语音的方法流程图；

图7是本申请实施例提供的一种网页页面展示方法的示意图；

图8是本申请实施例提供的一种网页页面展示装置的框图；

图9是本申请实施例提供的另一种网页页面展示装置的框图；

图10是本申请实施例提供的再一种网页页面展示装置的框图；

图11是本申请实施例提供的又一种网页页面展示装置的框图；

图12是本申请实施例提供的还一种网页页面展示装置的框图；

图13是本申请实施例提供的一种网页页面展示装置的结构示意图；

图14是本申请实施例提供的另一种网页页面展示装置的结构示意图。

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

具体实施方式

为了使本申请的原理、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

请参考图1，其示出了本申请各个实施例所涉及的一种实施环境的示意图，参见图1，该实施环境包括：终端110和服务器120。终端110与服务器120可以通过有线网络或无线网络通信连接，该无线网络可以包括但不限于：无线保真(英文：Wireless Fidelity；简称：WIFI)网络、蓝牙网络、红外网络、紫蜂(英文：Zigbee)网络或数据网络等，该有线网络可以是通用串行总线(英文：Universal Serial Bus；简称：USB)网络。

终端110可以是具备网页页面展示功能的电子设备，例如终端110可以是智能手机、平板电脑、笔记本电脑或台式电脑等。可选地，终端110中可以安装有浏览器，终端110可以通过浏览器展示网页页面，该网页页面可以是H5网页页面。在本申请实施例中，终端110可以支持各种类型的浏览器，例如，终端110可以支持IE(中文：网络探路者；英文：InternetExplorer)浏览器、Edge浏览器、Firefox(英文：火狐)浏览器、Chrome浏览器、Safari浏览器、Opera(中文：欧朋)浏览器、IOS Safari浏览器、Opera mini浏览器、Android浏览器以及Chrome for Android浏览器等。服务器120可以是一台服务器，或者由若干台服务器组成的服务器集群，或者是一个云计算服务中心。如图1所示，本申请实施例以终端110是台式电脑，服务器120是一台服务器为例进行说明。

在本申请实施例中，终端110可以采集语音，该语音可以是用户的语音，为了便于描述，本申请实施例将终端110采集的语音称为第一语音，终端110采集到第一语音后，可以向服务器120发送该第一语音，服务器120接收到该第一语音后，可以从活动场景库中确定与该第一语音匹配的目标活动场景，该目标活动场景包括多个目标元素以及与该多个目标元素对应的多个目标动作，对于该多个目标动作中的每个目标动作，服务器120可以从动作模型库中确定与该目标动作匹配的目标动作模型，得到多个目标动作模型，之后，服务器120将该多个目标元素、该多个目标动作和该多个目标动作模型发送给终端110，终端110根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面。这样一来，由于终端110可以基于语音展示网页页面，因此有助于提高网页页面展示方式的灵活性。

本申请实施例可以适用于用户触发终端展示运营活动的网页页面，例如，在用户浏览网页的过程中，终端在网页页面中显示(可以是弹窗显示)运营活动信息，用户就可以通过语音触发终端展示该运营活动的网页页面。示例地，运营活动可以是手机A的抽奖活动，第一语音可以是“我要抽奖，想抽中手机A”，与该第一语音匹配的目标活动场景可以是手机A的抽奖活动场景，目标元素可以是该抽奖活动场景的网页元素(例如动画、虚拟对象等，虚拟对象可以是虚拟人物)，目标动作模型可以是目标元素执行目标动作(例如抽奖动作)所依据的模型，终端110可以根据多个目标元素、与该多个目标元素对应的多个目标动作以及与该多个目标动作匹配的多个目标动作模型，展示手机A的抽奖活动场景对应的网页页面，也即是展示手机A的抽奖网页页面。

可选地，该终端110可以具有语音采集组件，终端110可以通过该语音采集组件采集第一语音。其中，该语音采集组件可拔插的与终端110通信连接，或者该语音采集组件内置在终端110中，本申请实施例对此不作限定。可选地，该语音采集组件可以是麦克风，该麦克风可以通过音频应用程序接口(英文：Application Programming Interface；简称：API)与终端110通信。示例地，请参考图2，其示出了本申请实施例提供的一种音频API的示意图，如图2所示，该音频API包括音频节点以及分别与音频节点连接的麦克风节点、滤波节点、数据处理节点、音量设置节点和音频缓冲节点，音频节点用于实现麦克风节点、滤波节点、数据处理节点、音量设置节点和音频缓冲节点彼此之间互通，麦克风节点用于连接麦克风，滤波节点用于对麦克风采集的语音进行滤波，音量设置节点用于设置麦克风采集的语音的音量，音频缓冲节点用于对麦克风采集的语音进行缓冲，数据处理节点用于对麦克风采集的语音进行处理以便于播放。

可选地，终端110和服务器120在进行上述通信之前可以建立通信连接，在通信完成之后可以断开通信连接，其中，该通信连接可以是基于上述各种通信网络的套字节(英文：socket)连接，其中，socket是一种独立于协议的网络编程接口。示例地，请参考图3，其示出了本申请实施例提供的一种终端110和服务器120的交互示意图，如图3所示，服务器120倾听套字节并等待接收连接请求，终端110可以创建套字节连接并向服务器120发送连接请求，服务器120接收到终端110发送的连接请求后创建套字节连接，至此终端110与服务器120之间的套字节连接建立成功。之后，终端110与服务器120基于该套字节连接进行数据流(该数据流可以是第一语音的数据流、目标元素的数据流、目标动作的数据流以及目标动作模型的数据流)的传输，在数据流传输完成之后，终端110和服务器120各自关闭套字节连接。

请参考图4，其示出了本申请实施例提供的一种网页页面展示方法的方法流程图，该网页页面展示方法可以用于图1所示实施环境，参见图4，该方法可以包括如下步骤：

步骤401、终端向服务器发送第一语音。

步骤402、服务器接收终端发送的该第一语音。

步骤403、服务器从活动场景库中确定与该第一语音匹配的目标活动场景，该目标活动场景包括多个目标元素以及与该多个目标元素对应的多个目标动作。

其中，目标活动场景例如可以是抽奖活动场景、某活动的广告场景、某游戏场景、投票活动场景等，目标元素例如可以是目标活动场景中的动画、虚拟对象等，且目标元素可以是平面元素或三维(英文：three dimensional；简称：3D)元素，每个目标元素对应的目标动作可以是该目标元素所执行的动作。

步骤404、服务器对于该多个目标动作中的每个目标动作，从动作模型库中确定与该目标动作匹配的目标动作模型，得到多个目标动作模型。

其中，目标动作模型可以是目标元素执行目标动作所依据的模型，该目标动作模型中可以包括模型参数，目标元素根据目标动作模型中的模型参数执行目标动作。

步骤405、服务器向终端发送该多个目标元素、该多个目标动作和该多个目标动作模型。

步骤406、终端接收服务器发送的该多个目标元素、该多个目标动作和该多个目标动作模型。

步骤407、终端根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面。

可选地，多个目标元素与多个目标动作一一对应，多个目标动作模型与多个目标动作匹配，终端可以将每个目标元素对应的目标动作输入相应的目标动作模型，使该目标元素根据该目标动作模型的输出执行目标动作，从而展示目标活动场景对应的网页页面。容易理解，目标活动场景对应的网页页面中还可以包括静态元素(例如图片、文字等)，终端可以根据目标活动场景对应的网页页面的资源文件展示该静态元素。

综上所述，本申请实施例提供的网页页面展示方法，终端向服务器发送第一语音后，服务器从活动场景库中确定与该第一语音匹配的目标活动场景，该目标活动场景包括多个目标元素以及与该多个目标元素对应的多个目标动作，对于该多个目标动作中的每个目标动作，服务器从动作模型库中确定与该目标动作匹配的目标动作模型，得到多个目标动作模型，并向终端发送该多个目标元素、该多个目标动作和该多个目标动作模型，终端根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面。由于终端基于语音展示网页页面，相比于通过键盘和/或鼠标触发终端展示网页页面的方式，有助于提高网页页面展示方式的灵活性。

请参考图5，其示出了本申请实施例提供的另一种网页页面展示方法的方法流程图，该网页页面展示方法可以用于图1所示实施环境，参见图5，该方法可以包括如下步骤：

步骤501、终端采集第一语音。

可选地，终端可以具有语音采集组件，终端可以通过语音采集组件采集第一语音，该第一语音可以是用户的语音。示例地，语音采集组件可以是麦克风，终端可以调用麦克风的音频API，来通过麦克风采集第一语音。

可选地，终端可以安装有浏览器，在采集第一语音之前，终端可以通过浏览器显示一网页页面，用户可以根据该网页页面中的内容说话，从而终端采集的第一语音可以与该网页页面中的内容相关。其中，该网页页面例如可以是游戏页面、新闻页面、视频页面或某产品的介绍页面等任意的网页页面，该网页页面中可以包括运营活动信息，该运营活动信息例如抽奖信息、广告信息、投票信息或游戏推送信息等等，用户可以根据运营活动信息说话。

示例地，该网页页面中显示有手机A的抽奖信息“手机A当前正在火热抽奖，邀请您参与抽奖”，该第一语音例如可以是“我要抽奖，想抽中手机A”；再示例地，该网页页面中显示有广告信息“购买与明星B同款商品X”，该第一语音例如可以是“去购买商品X”；又示例地，该网页页面中显示有投票信息“yy正在参与xx投票，进入投票界面为其投票”，该第一语音例如可以是“去参加投票”；又示例地，该网页页面中显示有游戏推送信息“您的好友在游戏C中战绩显赫，去挑战他”，该第一语音例如可以是“去玩游戏C”。需要说明的是，此处所列举的运营活动信息仅仅是示例性的，实际应用中，运营活动信息还可以包括图片等，且图片可以是动态图片或静态图片，本申请实施例对此不作限定。

步骤502、终端向服务器发送该第一语音。

可选地，终端可以通过与服务器之间的套字节连接，向服务器发送该第一语音。

步骤503、服务器接收终端发送的该第一语音。

可选地，服务器可以通过与终端之间的套字节连接，接收终端发送的该第一语音。

步骤504、服务器对该第一语音进行分析得到该第一语音的关键句。

可选地，服务器可以具有语音索引分析单元，服务器通过该语音索引分析单元对该第一语音进行分析得到该第一语音的关键句。

示例地，请参考图6，其示出了本申请实施例提供的一种服务器分析第一语音的方法流程图，参见图6，该方法可以包括：

子步骤5041、将第一语音拆分成多个语音片段。

可选地，该多个语音片段的长度(也即是时长)可以相等，服务器可以根据第一语音的长度，将该第一语音平均拆分为长度相等的多个语音片段。或者，服务器可以根据该第一语音的语义将该第一语音拆分成多个语音片段，将同一个词语放在同一语音片段中，例如，将“手机”这个词语中的“手”和“机”放在同一语音片段中，本申请实施例对此不作限定。

子步骤5042、对该多个语音片段进行识别，得到多个文字片段。

可选地，对于每个语音片段，服务器可以基于至少一个语音识别平台对该语音片段进行识别，由于不同语音识别平台采用的语音识别技术存在差异，因此，基于至少一个语音识别平台对该语音片段进行识别可以得到至少一个文字片段，从而对该多个语音片段进行识别可以得到多个文字片段。

示例地，服务器对第一语音进行拆分可以得到语音片段1～6(也即是语音片段1、语音片段2、语音片段3、语音片段4、语音片段5和语音片段6)，以服务器基于一个语音识别平台对语音片段进行识别为例，则服务器对语音片段1～6进行识别可以得到文字片段1～6(也即是文字片段1、文字片段2、文字片段3、文字片段4、文字片段5和文字片段6)。

子步骤5043、对该多个文字片段进行处理得到关键句。

可选地，服务器可以从该多个文字片段中确定属于目标类别的至少一个目标文字片段，将该至少一个目标文字片段处理为关键句，其中，该目标类别为目标活动场景的类别。可选地，服务器可以根据语法规则对该至少一个目标文字片段进行排布得到关键句。

可选地，服务器可以具有贝叶斯分类器，该贝叶斯分类器用于计算特征属于目标类别的概率，对于该多个文字片段中的每个文字片段，服务器可以将该文字片段输入该贝叶斯分类器，通过该贝叶斯分类器计算出该文字片段属于目标类别的概率，根据多个文字片段中的每个文字片段属于目标类别的概率，从该多个文字片段中确定属于目标类别的至少一个目标文字片段。可选地，服务器可以将该多个文字片段中，属于目标类别的概率大于预设概率值的文字片段确定为属于目标类别的目标文字片段。

或者，可选地，服务器可以具有场景分类模型，对于该多个文字片段中的每个文字片段，服务器可以通过该场景分类模型对该文字片段进行分类得到该文字片段的类别，根据该多个文字片段的类别，从该多个文字片段中确定属于目标类别的目标文字片段。其中，场景分类模型可以是服务器通过机器学习算法训练得到的，或者是其他设备通过机器学习算法训练得到且移植到服务器中的。可选地，该场景分类模型是服务器通过机器学习算法训练得到的，服务器在通过该场景分类模型对文字片段进行分类之前，可以先训练该场景分类模型。

可选地，服务器训练场景分类模型的过程可以包括：服务器获取训练样本集，该训练样本集中包括属于不同场景的多个样本文字片段以及每个样本文字片段的标记类别(对样本文字片段进行标记得到的类别，可以是人工标记或机器标记)，对于每个样本文字片段，服务器将该样本文字片段输入初始分类模型，将该初始分类模型的输出类别确定为该样本文字片段的预测类别，如果该样本文字片段的预测类别与该样本文字片段的标记类别不同，服务器修正该初始分类模型的模型参数得到修正分类模型，将该样本文字片段输入该修正分类模型，将该修正分类模型的输出类别确定为该样本文字片段的预测类别，如果该样本文字片段的预测类别与该样本文字片段的标记类别不同，服务器修正该修正分类模型的模型参数，直至该样本文字片段的预测类别与该样本文字片段的标记类别相同，依次类推，直至该多个样本文字片段中每个样本文字片段的预测类别与标记类别相同，将该多个样本文字片段中每个样本文字片段的预测类别与标记类别相同时相应的分类模型确定为场景分类模型。

步骤505、服务器根据该第一语音的关键句，从活动场景库中确定与该第一语音匹配的目标活动场景，该目标活动场景包括多个目标元素以及与该多个目标元素对应的多个目标动作。

可选地，服务器中可以具有活动场景库，该活动场景库中可以包括多种不同的活动场景，每个活动场景可以对应至少一个关键句，服务器可以从活动场景库中确定与第一语音的关键句匹配的活动场景，将与该关键句匹配的活动场景确定为与该第一语音匹配的目标活动场景。其中，活动场景库中的每个活动场景可以包括多个元素以及与该多个元素对应的多个动作，例如，每个活动场景可以包括元素与动作的映射关系，该目标活动场景可以包括多个目标元素以及与该多个目标元素对应的多个目标动作。

可选地，目标活动场景例如可以是抽奖活动场景、某活动的广告场景、某游戏场景、投票活动场景等，目标元素例如可以是目标活动场景中的动画、虚拟对象等，且目标元素可以是平面元素或3D元素等，每个目标元素对应的目标动作可以是该目标元素所执行的动作。

示例地，第一语音可以是“我要抽奖，想抽中手机A”，与该第一语音匹配的目标活动场景可以是手机A的抽奖活动场景；再示例地，第一语音可以是“去购买商品X”，与该第一语音匹配的目标活动场景可以是商品X的购买场景；又示例地，该第一语音可以是“去参加投票”，与该第一语音匹配的目标活动场景可以是xx的投票活动场景；又示例地，该第一语音可以是“去玩游戏C”，与该第一语音匹配的目标活动场景可以是游戏C的游戏场景。

步骤506、服务器对于该多个目标动作中的每个目标动作，从动作模型库中确定与该目标动作匹配的目标动作模型，得到多个目标动作模型。

可选地，服务器中可以具有动作模型库，该动作模型库中可以包括多个动作模型，每个动作模型可以包括模型参数，且每个动作模型可以对应一个动作，每个动作模型用于与该动作对应的元素执行该动作。对于该多个目标动作中的每个目标动作，服务器可以从该动作模型库中确定与该目标动作匹配(也即是对应)的目标动作模型，从而得到多个目标动作模型，每个目标动作模型用于相应的目标动作对应的目标元素执行该目标动作。

步骤507、服务器根据该第一语音的关键句，从活动语音库中确定与该第一语音匹配的第二语音。

可选地，服务器可以具有活动语音库，该活动语音库中可以包括多种不同的活动语音，每个活动语音可以对应至少一个关键句，服务器可以从活动语音库中确定与第一语音的关键句匹配的活动语音，将与该关键句匹配的活动语音确定为与该第一语音匹配的第二语音。

示例地，第一语音可以是“我要抽奖，想抽中手机A”，与该第一语音匹配的第二语音可以是“开始抽奖”；再示例地，第一语音可以是“去购买商品X”，与该第一语音匹配的第二语音可以是“欢迎购买商品X”；又示例地，该第一语音可以是“去参加投票”，与该第一语音匹配的第二语音可以是“欢迎为yy投票”；又示例地，该第一语音可以是“去玩游戏C”，与该第一语音匹配的第二语音可以是游戏C的开始音乐。

步骤508、服务器将该第二语音与该目标活动场景匹配。

服务器确定与该第一语音匹配的第二语音后，可以将第二语音与该目标活动场景匹配，以将第二语音与该目标活动场景关联。

可选地，服务器可以检测第二语音与目标活动场景是否匹配，如果第二语音与目标活动场景匹配，服务器将第二语音与目标活动场景绑定，如果第二语音与目标活动场景不匹配，服务器可以重新执行步骤507和步骤508，直至确定出与目标活动场景匹配的第二语音。

示例地，第一语音可以是“我要抽奖，想抽中手机A”，与该第一语音匹配的目标活动场景可以是手机A的抽奖活动场景，如果第二语音是“开始抽奖”，则第二语音可以与目标活动场景匹配，如果第二语音是“去购买商品X”，则第二语音与目标活动场景不匹配。再示例地，第一语音可以是“去购买商品X”，与该第一语音匹配的目标活动场景可以是商品X的购买场景，如果第二语音是“欢迎购买商品X”，则第二语音可以与目标活动场景匹配，如果第二语音是“欢迎为yy投票”，则第二语音与目标活动场景不匹配。

步骤509、服务器向终端发送该多个目标元素、该多个目标动作、该多个目标动作模型和该第二语音。

可选地，服务器可以通过与终端之间的socket连接向终端发送该多个目标元素、该多个目标动作、该多个目标动作模型和该第二语音。

可选地，该多个目标元素、该多个目标动作和该多个目标动作模型三者可以一一对应，服务器可以向终端发送该多个目标元素、该多个目标动作和该多个目标动作模型的对应关系。可选地，服务器可以同时向终端发送该对应关系和第二语音，也可以分次向终端发送该对应关系和第二语音，本申请实施例对此不作限定。

本领域技术人员可以理解，服务器向终端发送目标元素、目标动作和目标动作模型指的是服务器向终端发送目标元素的数据、目标动作的数据和目标动作模型的数据。

步骤510、终端接收服务器发送的该多个目标元素、该多个目标动作、该多个目标动作模型和该第二语音。

可选地，终端可以通过与服务器之间的socket连接接收服务器发送的该多个目标元素、该多个目标动作、该多个目标动作模型和该第二语音。

可选地，该多个目标元素、该多个目标动作和该多个目标动作模型三者可以一一对应，终端可以接收服务器发送的该多个目标元素、该多个目标动作和该多个目标动作模型的对应关系。

本领域技术人员可以理解，对应于步骤509，终端接收服务器发送的目标元素、目标动作和目标动作模型指的是终端接收服务器发送的目标元素的数据、目标动作的数据和目标动作模型的数据。

步骤511、终端根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面，并在展示该目标活动场景对应的网页页面的过程中播放该第二语音。

可选地，该多个目标元素、该多个目标动作和该多个目标动作模型三者可以一一对应，终端可以将每个目标元素对应的目标动作输入相应的目标动作模型，使该目标元素根据该目标动作模型的输出执行该目标动作，从而展示目标活动场景对应的网页页面，该网页页面可以是动态页面。可选地，终端可以通过多个线程同时根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面，多个线程与该多个目标元素可以一一对应，每个线程将相应的目标元素对应的目标动作输入相应的目标动作模型，使该目标元素根据该目标动作模型的输出执行该目标动作。可选地，终端在展示目标活动场景对应的网页页面的过程中可以播放第二语音，这样终端可以同时向用户提供视觉和听觉上的网页展示氛围。容易理解，目标活动场景对应的网页页面中还可以包括静态元素(例如图片、文字等)，终端可以根据目标活动场景对应的网页页面的资源文件展示静态元素，本申请实施例对此不作限定。

示例地，终端在展示手机A的抽奖活动场景对应的网页页面(也即是手机A的抽奖页面)的过程中可以播放第二语音“开始抽奖”；再示例地，终端在展示商品X的购买场景对应的网页页面(也即是商品X的购买页面)的过程中可以播放第二语音“欢迎购买商品X”；又示例地，终端在展示xx的投票活动场景对应的网页页面(也即是xx的投票活动页面)的过程中可以播放第二语音“欢迎为yy投票”；又示例地，终端在展示游戏C的游戏场景对应的网页页面(也即是游戏C的游戏页面)的过程中可以播放游戏C的开始音乐。

需要说明的是，本申请实施例提供的网页页面展示方法仅仅是示例性的，终端在展示目标活动场景对应的网页页面时，除了播放第二语音外，还可以根据目标活动场景的内容进行震动(例如网页页面震动，或者当终端为手机等移动终端时，终端的机体震动)等，以向用户提供视觉、听觉和触觉上的网页展示氛围，提高活动体验的参与度，提升语音与运营活动的互动性。

综上所述，本申请实施例提供的网页页面展示方法，终端向服务器发送第一语音后，服务器从活动场景库中确定与该第一语音匹配的目标活动场景，该目标活动场景包括多个目标元素以及与该多个目标元素对应的多个目标动作，对于该多个目标动作中的每个目标动作，服务器从动作模型库中确定与该目标动作匹配的目标动作模型，得到多个目标动作模型，并向终端发送该多个目标元素、该多个目标动作和该多个目标动作模型，终端根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面。由于终端基于语音展示网页页面，相比于通过键盘和/或鼠标触发终端展示网页页面的方式，有助于提高网页页面展示方式的灵活性，且能够体现用户与终端交互的趣味性，提高运营活动页面被触发的概率。

本申请实施例提供的网页页面展示方法步骤的先后顺序可以进行适当调整，步骤也可以根据情况进行相应增减，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化的方法，都应涵盖在本申请的保护范围之内，因此不再赘述。

请参考图7，其示出了本申请实施例提供的一种网页页面展示方法的示意图，如图7所示，该网页页面展示方法在执行时，终端的浏览器首先展示一网页页面，用户可以根据该网页页面中的内容说话，终端打开麦克风采集第一语音(也即是用户的语音)后将第一语音发送给服务器，服务器分析该第一语音得到该第一语音的关键句，根据该第一语音的关键句分析活动场景，确定出与该第一语音匹配的目标活动场景(目标活动场景包括多个目标元素和与目标元素对应的多个目标动作)后匹配动作模型，确定出与每个目标动作匹配的目标动作模型，将多个目标元素、多个目标动作和多个目标动作模型发送给终端，终端通过多个线程根据该多个目标元素触发该多个目标动作模型执行该多个目标动作，从而展示目标场景对应的网页页面。如图7所示，服务器分析该第一语音得到该第一语音的关键句后，还可以根据该关键句确定与第一语音匹配的第二语音，将第二语音与目标过程场景匹配后，将第二语音发送给终端，终端在展示目标场景对应的网页页面的过程中，可以触发语音模型播放该第二语音。

下述为本申请装置实施例，可以用于执行本申请装置实施例。对于本申请装置实施例中未披露的细节，请参照本申请装置实施例。

请参考图8，其示出了本申请实施例提供的一种网页页面展示装置800的框图，该网页页面展示装置800可以为服务器中的程序组件，参见图8，该网页页面展示装置800可以包括但不限于：

接收模块810，用于接收终端发送的第一语音；

第一确定模块820，用于从活动场景库中确定与该第一语音匹配的目标活动场景，该目标活动场景包括多个目标元素以及与该多个目标元素对应的多个目标动作；

第二确定模块830，用于对于该多个目标动作中的每个目标动作，从动作模型库中确定与该目标动作匹配的目标动作模型，得到多个目标动作模型；

第一发送模块840，用于向终端发送该多个目标元素、该多个目标动作和该多个目标动作模型，以便于终端根据该多个目标元素、该多个目标动作和该多个目标动作模型展示该目标活动场景对应的网页页面。

可选地，请参考图9，其示出了本申请实施例提供的另一种网页页面展示装置800的框图，参见图9，在图8的基础上，该装置800还包括：

第三确定模块850，用于从活动语音库中确定与该第一语音匹配的第二语音；

匹配模块860，用于将该第二语音与该目标活动场景匹配；

第二发送模块870，用于向终端发送该第二语音，以便于终端展示该目标活动场景对应的网页页面的过程中播放该第二语音。

可选地，请参考图10，其示出了本申请实施例提供的再一种网页页面展示装置800的框图，参见图10，在图9的基础上，该装置800还包括：

分析模块880，用于对第一语音进行分析得到该第一语音的关键句；

第一确定模块820，用于：

从活动场景库中确定与该关键句匹配的活动场景；

将与该关键句匹配的活动场景确定为与第一语音匹配的目标活动场景；

第三确定模块850，用于：

从活动语音库中确定与该关键句匹配的活动语音；

将与该关键句匹配的活动语音确定为与第一语音匹配的第二语音。

可选地，分析模块880，用于：

将第一语音拆分成多个语音片段；

对该多个语音片段进行识别，得到多个文字片段；

对该多个文字片段进行处理得到该关键句。

可选地，分析模块880，用于：

从该多个文字片段中确定属于目标类别的至少一个目标文字片段，该目标类别为该目标活动场景的类别；

将该至少一个目标文字片段处理为该关键句。

综上所述，本申请实施例提供的网页页面展示装置，服务器接收终端发送的第一语音后，从活动场景库中确定与该第一语音匹配的目标活动场景，该目标活动场景包括多个目标元素以及与该多个目标元素对应的多个目标动作，对于该多个目标动作中的每个目标动作，服务器从动作模型库中确定与该目标动作匹配的目标动作模型，得到多个目标动作模型，并向终端发送该多个目标元素、该多个目标动作和该多个目标动作模型，终端根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面。由于终端基于语音展示网页页面，相比于通过键盘和/或鼠标触发终端展示网页页面的方式，有助于提高网页页面展示方式的灵活性。

请参考图11，其示出了本申请实施例提供的一种网页页面展示装置1100的框图，该网页页面展示装置1100可以为终端中的程序组件，参见图11，该网页页面展示装置1100可以包括但不限于：

发送模块1110，用于向服务器发送第一语音；

第一接收模块1120，用于接收服务器发送的多个目标元素、多个目标动作和多个目标动作模型，该多个目标元素和该多个目标动作属于与第一语音匹配的目标活动场景，该多个目标动作模型与该多个目标动作匹配；

展示模块1130，用于根据该多个目标元素、该多个目标动作和该多个目标动作模型展示该目标活动场景对应的网页页面。

可选地，请参考图12，其示出了本申请实施例提供的另一种网页页面展示装置1100的框图，参见图12，该装置1100还包括：

第二接收模块1140，用于接收服务器发送的第二语音，该第二语音与第一语音匹配，且该第二语音与目标活动场景匹配；

播放模块1150，用于在展示目标活动场景对应的网页页面的过程中播放该第二语音。

综上所述，本申请实施例提供的网页页面展示装置，终端向服务器发送第一语音后，接收服务器发送的多个目标元素、多个目标动作和多个目标动作模型，该多个目标元素和该多个目标动作属于与第一语音匹配的目标活动场景，该多个目标动作模型与该多个目标动作匹配，根据该多个目标元素、该多个目标动作和该多个目标动作模型展示目标活动场景对应的网页页面。由于终端基于语音展示网页页面，相比于通过键盘和/或鼠标触发终端展示网页页面的方式，有助于提高网页页面展示方式的灵活性。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

请参考图13，其示出了本申请实施例提供的一种网页页面展示装置1300的结构示意图。该装置1300例如可以是：智能手机、平板电脑、笔记本电脑或台式电脑等终端。该装置1300还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，该装置1300包括有：处理器1301和存储器1302。

处理器1301可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1301可以采用数字信号处理(英文：Digital Signal Processing；简称：DSP)、现场可编程门阵列(英文：Field－Programmable Gate Array；简称：FPGA)、可编程逻辑阵列(英文：Programmable Logic Array；简称：PLA)中的至少一种硬件形式来实现。处理器1301也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1301可以在集成有图像处理器(英文：Graphics Processing Unit；简称：GPU)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1301还可以包括人工智能(英文：Artificial Intelligence；简称：AI)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1302可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1302还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1302中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1301执行以实现本申请实施例提供的方法。

在一些实施例中，该装置1300还可选包括有：***设备接口1303和至少一个***设备。处理器1301、存储器1302和***设备接口1303之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1303相连。***设备可以包括：射频电路1304、显示屏1305、摄像头组件1306、音频电路1307、定位组件1308或电源1309中的至少一种。

***设备接口1303可被用于将I/O相关的至少一个***设备连接到处理器1301和存储器1302。在一些实施例中，处理器1301、存储器1302和***设备接口1303被集成在同一芯片或电路板上；在一些其他实施例中，处理器1301、存储器1302和***设备接口1303中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1304用于接收和发射射频(英文：Radio Frequency；简称：RF)信号，也称电磁信号。射频电路1304通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1304将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1304包括：天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1304可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi网络。在一些实施例中，射频电路1304还可以包括近距离无线通信(英文：Near Field Communication；简称：NFC)有关的电路，本申请对此不加以限定。

显示屏1305用于显示用户界面(英文：User Interface；简称：UI)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1305是触摸显示屏时，显示屏1305还具有采集在显示屏1305的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1301进行处理。此时，显示屏1305还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1305可以为一个，设置在该装置1300的前面板；在另一些实施例中，显示屏1305可以为至少两个，分别设置在该装置1300的不同表面或呈折叠设计；在再一些实施例中，显示屏1305可以是柔性显示屏，设置在该装置1300的弯曲表面上或折叠面上。甚至，显示屏1305还可以设置成非矩形的不规则图形，也即异形屏。显示屏1305可以采用液晶显示屏(英文：Liquid Crystal Display；简称：LCD)、有机发光二极管(英文：Organic Light-Emitting Diode；简称：OLED)等材质制备。

摄像头组件1306用于采集图像或视频。可选地，摄像头组件1306包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头或长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及虚拟现实(英文：Virtual Reality；简称：VR)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1306还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1307可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1301进行处理，或者输入至射频电路1304以实现语音通信，麦克风可以通过音频API与处理器1301以及射频电路1304通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在该装置1300的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1301或射频电路1304的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1307还可以包括耳机插孔。

定位组件1308用于定位该装置1300的当前地理位置，以实现导航或基于位置的服务(英文：Location Based Service；简称：LBS)。定位组件1308可以是基于美国的全球定位***(英文：Global Positioning System；简称：GPS)、中国的北斗***、俄罗斯的格雷纳斯***或欧盟的伽利略***的定位组件。

电源1309用于为该装置1300中的各个组件进行供电。电源1309可以是交流电、直流电、一次性电池或可充电电池。当电源1309包括可充电电池时，可充电电池可以支持有线充电或无线充电。可充电电池还可以用于支持快充技术。

在一些实施例中，该装置1300还包括有一个或多个传感器1310。该一个或多个传感器1310包括但不限于：加速度传感器1311、陀螺仪传感器1312、压力传感器1313、指纹传感器1314、光学传感器1315以及接近传感器1316。

加速度传感器1311可以检测以装置1300建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1311可以用于检测重力加速度在三个坐标轴上的分量。处理器1301可以根据加速度传感器1311采集的重力加速度信号，控制显示屏1305以横向视图或纵向视图进行用户界面的显示。加速度传感器1311还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1312可以检测该装置1300的机体方向及转动角度，陀螺仪传感器1312可以与加速度传感器1311协同采集用户对该装置1300的3D动作。处理器1301根据陀螺仪传感器1312采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1313可以设置在该装置1300的侧边框和/或显示屏1305的下层。当压力传感器1313设置在该装置1300的侧边框时，可以检测用户对该装置1300的握持信号，由处理器1301根据压力传感器1313采集的握持信号进行左右手识别或快捷操作。当压力传感器1313设置在显示屏1305的下层时，由处理器1301根据用户对显示屏1305的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1314用于采集用户的指纹，由处理器1301根据指纹传感器1314采集到的指纹识别用户的身份，或者，由指纹传感器1314根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1301授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1314可以被设置在该装置1300的正面、背面或侧面。当该装置1300上设置有物理按键或厂商Logo时，指纹传感器1314可以与物理按键或厂商Logo集成在一起。

光学传感器1315用于采集环境光强度。在一个实施例中，处理器1301可以根据光学传感器1315采集的环境光强度，控制显示屏1305的显示亮度。具体地，当环境光强度较高时，调高显示屏1305的显示亮度；当环境光强度较低时，调低显示屏1305的显示亮度。在另一个实施例中，处理器1301还可以根据光学传感器1315采集的环境光强度，动态调整摄像头组件1306的拍摄参数。

接近传感器1316，也称距离传感器，通常设置在该装置1300的前面板。接近传感器1316用于采集用户与该装置1300的正面之间的距离。在一个实施例中，当接近传感器1316检测到用户与该装置1300的正面之间的距离逐渐变小时，由处理器1301控制显示屏1305从亮屏状态切换为息屏状态；当接近传感器1316检测到用户与该装置1300的正面之间的距离逐渐变大时，由处理器1301控制显示屏1305从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图13中示出的结构并不构成对该装置1300的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

请参考图14，其示出了本申请实施例提供的一种网页页面展示装置1400的结构示意图，该装置1400可以为服务器。示例地，如图14所示，该装置1400包括中央处理单元(英文：Central Processing Unit；简称：CPU)1401、包括随机存取存储器(英文：Random-Access Memory；简称：RAM)1402和只读存储器(英文：Read-Only Memory；简称：ROM)1403的***存储器1404，以及连接***存储器1404和中央处理单元1401的***总线1405。装置1400还包括帮助计算机内的各个器件之间传输信息的基本输入/输出(英文：Input/Output；简称：I/O)***1406，和用于存储操作***1413、应用程序1414和其他程序模块1415的大容量存储设备1407。

基本输入/输出***1406包括有用于显示信息的显示器1408和用于用户输入信息的诸如鼠标、键盘之类的输入设备1409。其中显示器1408和输入设备1409都通过连接到***总线1405的输入输出控制器1410连接到中央处理单元1401。基本输入/输出***1406还可以包括输入输出控制器1410以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入/输出控制器1410还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备1407通过连接到***总线1405的大容量存储控制器(未示出)连接到中央处理单元1401。大容量存储设备1407及其相关联的计算机可读介质为装置1400提供非易失性存储。也就是说，大容量存储设备1407可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。

不失一般性，计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(英文：Erasable Programmable Read Only Memory；简称：EPROM)、带电可擦除可编程只读存储器(英文：Electrically Erasable ProgrammableRead Only Memor；简称：EEPROM)、闪存或其他固态存储其技术，紧凑型光盘只读储存器(英文：Compact Disc Read-Only Memory；简称：CD-ROM)、数字通用光盘(英文：DigitalVersatile Disc；简称：DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的***存储器1404和大容量存储设备1407可以统称为存储器。

根据本申请的各种实施例，装置1400还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即装置1400可以通过连接在***总线1405上的网络接口单元1411连接到网络1412，或者说，也可以使用网络接口单元1411来连接到其他类型的网络或远程计算机***(未示出)。

上述存储器还包括一个或者一个以上的程序，一个或者一个以上程序存储于存储器中，被配置由CPU执行，以实现本申请实施例提供的方法。

本申请实施例提供一种网页页面展示***，该***可以包括终端和服务器，在一种可能的实现方式中，终端可以包括图11或图12所示的装置1100，服务器可以包括图8至图10任一所示的装置800；在另一种可能的实现方式中，终端可以为图13所示的装置1300，服务器可以为图14所示的装置1400。

本申请实施例中还提供了一种计算机可读存储介质，该计算机可读存储介质中可以存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行行以实现图4至图6所示的方法。

在本申请中，术语“第一”、“第二”、“第三”、“第四”、“第五”、“第六”、“第七”和“第八”等类似描述仅用于描述目的，而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上，除非另有明确的限定。术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。术语“A或B的至少一种”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A或B的至少一种，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。同理，“A、B或C的至少一种”表示可以存在七种关系，可以表示：单独存在A，单独存在B，单独存在C，同时存在A和B，同时存在A和C，同时存在C和B，同时存在A、B和C这七种情况。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种网页页面展示方法，其特征在于，所述方法包括：

接收终端发送的第一语音；

2.根据权利要求1所述的方法，其特征在于，在接收终端发送的第一语音之后，所述方法还包括：

从活动语音库中确定与所述第一语音匹配的第二语音；

将所述第二语音与所述目标活动场景匹配；

向所述终端发送所述第二语音，以便于所述终端展示所述目标活动场景对应的网页页面的过程中播放所述第二语音。

3.根据权利要求2所述的方法，其特征在于，

在接收终端发送的第一语音之后，所述方法还包括：

对所述第一语音进行分析得到所述第一语音的关键句；

所述从活动场景库中确定与所述第一语音匹配的目标活动场景，包括：

从所述活动场景库中确定与所述关键句匹配的活动场景；

将与所述关键句匹配的活动场景确定为与所述第一语音匹配的目标活动场景；

所述从活动语音库中确定与所述第一语音匹配的第二语音，包括：

从所述活动语音库中确定与所述关键句匹配的活动语音；

将与所述关键句匹配的活动语音确定为与所述第一语音匹配的第二语音。

4.根据权利要求3所述的方法，其特征在于，所述对所述第一语音进行分析得到所述第一语音的关键句，包括：

将所述第一语音拆分成多个语音片段；

对所述多个语音片段进行识别，得到多个文字片段；

对所述多个文字片段进行处理得到所述关键句。

5.根据权利要求4所述的方法，其特征在于，所述对所述多个文字片段进行处理得到所述关键句，包括：

从所述多个文字片段中确定属于目标类别的至少一个目标文字片段，所述目标类别为所述目标活动场景的类别；

将所述至少一个目标文字片段处理为所述关键句。

6.一种网页页面展示方法，其特征在于，所述方法包括：

向服务器发送第一语音；

7.根据权利要求6所述的方法，其特征在于，在向服务器发送第一语音之后，所述方法还包括：

接收所述服务器发送的第二语音，所述第二语音与所述第一语音匹配，且所述第二语音与所述目标活动场景匹配；

在展示所述目标活动场景对应的网页页面的过程中播放所述第二语音。

8.一种网页页面展示装置，其特征在于，包括用于执行权利要求1至7任一所述的方法的各个模块。

9.一种网页页面展示装置，其特征在于，所述装置包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现权利要求1至7任一所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现权利要求1至7任一所述的方法。