CN112632445A

CN112632445A - 网页播放方法、装置、设备及存储介质

Info

Publication number: CN112632445A
Application number: CN202011599602.5A
Authority: CN
Inventors: 刘佳泽; 庞冠钦; 罗忠岚
Original assignee: Guangzhou Kugou Computer Technology Co Ltd
Current assignee: Guangzhou Kugou Computer Technology Co Ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2021-04-09

Abstract

本申请公开了一种网页播放方法、装置、设备及存储介质，属于计算机技术领域。所述方法包括：响应于复制操作，在剪贴板中存储复制操作复制的文本；响应于打开应用程序上的网页朗读界面，根据剪贴板中的文本获取目标网页；响应网页朗读界面上触发的网页朗读操作，提取目标网页中的文字信息；播放文字信息对应的语音。对于未提供语音的网页，同样能够实现播放出网页对应的语音。提供了一种灵活播放网页对应的语音的方式。

Description

网页播放方法、装置、设备及存储介质

技术领域

本申请涉及计算机技术领域，特别涉及一种网页播放方法、装置、设备及存储介质。

背景技术

网页作为信息的载体，是用户通过电子设备获取信息的重要途径之一。

目前，为便于用户获取网页中的信息，网页的提供方会预先将网页中的文字信息转换为对应的语音。用户在通过电子设备浏览此类网页时，电子设备能够获取网页对应的语音，并播放该语音。

对于不同的网页，由于网页提供方未提供语音，电子设备会无法播放出网页对应的语音。播放网页对应的语音的方式较单一。

发明内容

本申请提供了一种网页播放方法、装置、设备及存储介质，提供了一种灵活播放网页对应的语音的方式。所述技术方案如下：

根据本申请的一方面，提供了一种网页播放方法，所述方法包括：

响应于复制操作，在剪贴板中存储所述复制操作复制的文本；

响应于打开应用程序上的网页朗读界面，根据所述剪贴板中的所述文本获取目标网页；

响应于所述网页朗读界面上触发的网页朗读操作，提取所述目标网页中的文字信息；

播放所述文字信息对应的语音。

根据本申请的另一方面，提供了一种网页播放装置，所述装置包括：

存储模块，用于响应于复制操作，在剪贴板中存储所述复制操作复制的文本；

获取模块，用于响应于打开应用程序上的网页朗读界面，根据所述剪贴板中的所述文本获取目标网页；

提取模块，用于响应于所述网页朗读界面上触发的网页朗读操作，提取所述目标网页中的文字信息；

播放模块，用于播放所述文字信息对应的语音。

可选地，所述获取模块，用于：

响应于打开所述网页朗读界面，获取所述剪贴板中的所述文本；

识别所述文本中的第一目标网址；

根据所述第一目标网址获取所述目标网页。

可选地，所述获取模块，用于：

通过正则表达式过滤所述文本，得到所述第一目标网址，所述正则表达式是根据网址的字符组成规则建立的。

可选地，所述装置还包括：

显示模块，用于响应于获取到所述目标网页，显示网页播放控件；

所述提取模块，用于：

响应于在所述网页播放控件上触发的所述网页朗读操作，提取所述目标网页中的所述文字信息。

可选地，所述网页朗读界面中显示有第一形态的网页播放控件。所述显示模块，用于：

响应于获取到所述目标网页，显示第二形态的所述网页播放控件；

所述提取模块，用于：

响应于在第二形态的所述网页播放控件上触发的所述网页朗读操作，提取所述目标网页中的所述文字信息。

可选地，所述装置还包括：

所述获取模块，用于响应于打开所述网页朗读界面且未能从所述剪贴板中获取到所述目标网页，获取网页访问记录；

第一确定模块，用于将所述网页访问记录中在目标时间段内访问次数最多的网址确定为第二目标网址；

所述获取模块，用于根据所述第二目标网址获取所述目标网页。

可选地，所述装置还包括：

所述获取模块，用于响应于打开所述网页朗读界面且未能从所述剪贴板中获取到所述目标网页，获取用户操作信息，所述用户操作信息包括所述网页访问信息、所述网页收藏信息、所述网页评论信息以及所述网页分享信息中的至少一种；

第二确定模块，用于根据所述用户操作信息和预选用户帐号的操作信息，通过基于用户的协同过滤算法确定所述用户操作信息对应的用户帐号和所述预选用户帐号之间的相似度；

第三确定模块，用于将所述相似度高于目标值的所述预选用户帐号确定为相似用户帐号；

所述获取模块，用于获取所述相似用户帐号的喜爱网页中所述用户帐号未访问过的网页，作为所述目标网页。

可选地，所述装置还包括：

所述获取模块，用于获取语音配置，所述语音配置包括声音类型、语速、语调以及音量中的至少一种；

生成模块，用于根据所述语音配置以及所述文字信息，基于语音合成引擎生成所述语音。

可选地，所述获取模块，用于：

确定所述目标网页的类型，所述类型用于反映所述目标网页对应的行业领域；

获取与所述类型匹配的语音配置。

可选地，所述播放模块，包括：

显示子模块，用于显示至少一首预选背景音乐；

获取子模块，用于响应于对所述预选背景音乐的选择操作，获取目标背景音乐；

所述播放模块，用于在播放所述语音的过程中，播放所述目标背景音乐。

可选地，所述提取模块，用于：

通过基于启发式规则的网页抽取算法从所述目标网页中提取所述文字信息。

可选地，所述显示模块，用于响应于对第一形态的所述网页播放控件的触发操作，显示网址输入界面；

所述获取模块，用于响应于在所述网址输入界面中键入操作，获取所述键入操作输入的网页网址对应的输入网页；

所述获取模块，用于根据所述输入网页获取所述目标网页。

根据本申请的另一方面，提供了一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的网页播放方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的网页播放方法。

根据本申请的另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该电子设备执行上述方面的各种可选实现方式中提供的网页播放方法。

本申请提供的技术方案带来的有益效果至少包括：

通过根据复制操作复制的文本获取目标网页，当接收到网页朗读界面上触发的网页朗读操作，提取获取到的目标网页中的文字信息，并播放该文字信息对应的语音。对于未提供语音的网页，同样能够实现播放出网页对应的语音。提供了一种灵活播放网页对应的语音的方式。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的播放网页的实现过程的界面示意图；

图2是本申请实施例提供的一种网页播放方法的流程示意图；

图3是本申请实施例提供的另一种网页播放方法的流程示意图；

图4是本申请实施例提供的又一种网页播放方法的流程示意图；

图5是本申请实施例提供的再一种网页播放方法的流程示意图；

图6是本申请实施例提供的一种网页播放装置的结构示意图；

图7是本申请实施例提供的另一种网页播放装置的结构示意图；

图8是本申请实施例提供的又一种网页播放装置的结构示意图；

图9是本申请实施例提供的再一种网页播放装置的结构示意图；

图10是本申请实施例提供的还一种网页播放装置的结构示意图；

图11是本申请实施例提供的一种播放模块的结构示意图；

图12是本申请实施例提供的一种终端的结构示意图。

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

图1是本申请实施例提供的播放网页的实现过程的界面示意图。如图1所示，在客户端的网页朗读界面101中，显示有第一形态的网页播放控件102，该网页播放控件102为按钮。该网页朗读界面101中还显示有不同文字信息对应的语音读物，以及各语音读物对应的播放次数，以及触发播放指定文字的文字朗读按钮。客户端在显示该第一形态的网页播放控件102的过程中，会根据复制操作在剪贴板中存储的文本获取目标网页。可选地，客户端还能够根据网页访问记录以及用户操作信息获取目标网页。当客户端获取到目标网页后，会显示第二形态的网页播放控件103，该第二形态相较于第一形态进行了线条加粗，用于提示用户点击该控件能够播放目标网页中的文字信息。当客户端检测到对该第二形态的网页播放控件103的触发操作后，会提取目标网页中的文字信息，并根据目标网页的类型获取与该类型匹配的语音配置。该触发操作指对第二形态的网页播放控件103的单击操作。该语音配置包括声音类型、语速、语调以及音量中的至少一种。客户端根据该语音配置以及文字信息，能够基于语音合成(Text To Speech，TTS)生成语音并播放该语音。可选地，在播放语音时，客户端还能够在网页朗读界面101中显示该语音的播放信息104。该播放信息104包括客户端从目标网页中提取到的文字信息、播放/暂停按钮以及语音的播放进度控件。

根据复制操作复制的文本获取目标网页，当检测到对第二形态的网页播放控件的触发操作，提取获取到的目标网页中的文字信息，根据该文字信息生成语音并播放该语音。对于未提供语音的网页，同样能够实现播放出网页对应的语音。提供了一种灵活播放网页对应的语音的方式。

图2是本申请实施例提供的一种网页播放方法的流程示意图。该方法可以用于电子设备或电子设备上的客户端。如图2所示，该方法包括：

步骤201、响应于复制操作，在剪贴板中存储复制操作复制的文本。

该复制操作指电子设备检测到的，通过对鼠标的单击、长按选中并复制文本，以及通过触摸屏上的单击、双击和长按选中并复制文本的操作。该剪贴板为客户端中的剪贴板、客户端所在的电子设备安装的输入法中的剪贴板或者该电子设备***的剪贴板。该文本包括复制的汉字、字母、数字、符号以及不同语言下的文字等。例如为“打开，www.1357.bcd”。

步骤202、响应于打开应用程序上的网页朗读界面，根据剪贴板中的文本获取目标网页。

该网页朗读界面用于触发应用程序获取该目标网页。该应用程序为客户端。该客户端包括歌曲客户端、视频点播客户端、社交客户端、K歌客户端、短视频客户端以及直播客户端。当客户端显示该网页朗读界面时，会根据剪贴板中的文本获取该目标网页。

可选地。该网页朗读界面中显示有第一形态的网页播放控件。当客户端显示该第一形态的网页播放控件时，会根据剪贴板中的文本获取目标网页。例如客户端对剪贴板中最新存储的一条文本进行识别，从而得到目标网址，并根据该目标网址获取目标网页。可选地，客户端还能够根据网页访问记录以及用户操作信息获取目标网页。网页播放控件用于触发客户端播放网页对应的语音。可选地，该第一形态的网页播放控件为按钮、文字或图标。

步骤203、响应于网页朗读界面上触发的网页朗读操作，提取目标网页中的文字信息。

该目标网页指包括文字信息的任一网页。客户端通过所在的电子设备，根据目标网页的网址获取到该目标网页。客户端通过向对应的服务器发送目标网页的网址，从服务器获取到该目标网页。或者，服务器直接向客户端发送该目标网页。

该网页朗读操作用于触发客户端提取目标网页中的文字信息并播放出对应的语音。可选地，当客户端获取到目标网页，会在网页朗读界面中显示网页播放控件。或者，当客户端获取到目标网页，会将网页朗读界面中显示的第一形态的网页播放控件切换显示为第二形态的网页播放控件。该第二形态与第一形态不同。网页播放控件的第二形态相较于第一形态，用于突出显示该网页播放控件，从而对用户进行提醒。可选地，该第二形态是通过对第一形态进行加粗显示、高亮显示、闪烁显示、摇动显示以及增加提示元素显示得到的。

可选地，该网页朗读操作是通过对网页播放控件的触控操作触发的。该触控操作包括单击操作、双击操作、长按操作以及滑动操作等。该触控操作还包括客户端通过所在的电子设备检测到指定的语音指令，例如该语音指令为“开始播放网页”。该目标网页中的文字信息，包括目标网页中的汉字、字母、不同语言下的文字以及标点符号。

可选地，客户端通过基于启发式规则的网页抽取算法提取网页中的文字信息。通过基于启发式规则的网页抽取算法提取文字信息指通过机器学习模型识别网页中的文字信息，从而提取出文字信息。该机器学习模型基于启发式规则的网页抽取算法，该机器学习模型是通过网页样本进行无监督训练得到的。该网页样本中包括至少一个包括文字信息的网页。客户端还能够通过正则表达式提取网页中的文字信息以及通过层叠样式表(Cascading Style Sheets，CSS)选择器提取网页中的文字信息。

步骤204、播放文字信息对应的语音。

客户端根据提取到的目标网页中的文字信息，基于TTS生成该文字信息对应的语音，从而实现播放该语音。并且，客户端能够支持将不同语言下的文字转化为对应的语言下的语音。可选地，客户端还能够根据用户设置的语音配置生成该语音，该语音配置包括声音类型、语速、语调以及音量中的至少一种。在播放语音时，客户端还能够根据用户设置的背景音乐，同步播放语音与该背景音乐。

综上所述，本申请实施例提供的网页播放方法，根据复制操作复制的文本获取目标网页，当接收到网页朗读界面上触发的网页朗读操作，提取获取到的目标网页中的文字信息，并播放该文字信息对应的语音。对于未提供语音的网页，同样能够实现播放出网页对应的语音。提供了一种灵活播放网页对应的语音的方式。

图3是本申请实施例提供的另一种网页播放方法的流程示意图。该方法可以用于电子设备或电子设备上的客户端。如图3所示，该方法包括：

步骤301、响应于复制操作，在剪贴板中存储复制操作复制的文本。

该复制操作指电子设备检测到的，通过对鼠标的单击、长按选中并复制文本，以及通过触摸屏上的单击、双击和长按选中并复制文本的操作。该剪贴板为客户端中的剪贴板、客户端所在的电子设备安装的输入法中的剪贴板或者该电子设备***的剪贴板。该文本包括复制的汉字、字母、数字、符号以及不同语言下的文字等。

步骤302、响应于打开应用程序上的网页朗读界面，根据剪贴板中的文本获取目标网页。

该网页朗读界面用于触发应用程序获取该目标网页。该应用程序为客户端。可选地，该网页朗读界面中显示有第一形态的网页播放控件。该第一形态的网页播放控件为按钮、文字或图标。当客户端显示该第一形态的网页播放控件时，会根据复制操作获取目标网页。

可选地，客户端打开应用程序上的网页朗读界面，即在显示第一形态的网页播放控件的过程中，客户端获取剪贴板中存储的复制操作复制的文本。并识别该文本中的第一目标网址。之后根据该第一目标网址获取目标网页。可选地，客户端通过正则表达式过滤该文本，得到第一目标网址。其中，该正则表达式是根据网址的字符组成规则建立的。当客户端通过剪贴板获取到多个第一目标网址时，客户端根据最新的第一目标网址获取该目标网页。或者，客户端会在显示第一形态的网页播放控件的用户界面中显示获取到的多个第一目标网址，并根据用户的选择操作指向的第一目标网址获取该目标网页。

可选地，当客户端获取的剪贴板中存储的复制操作复制的文本中，不包括第一目标网址时，客户端还能够将该复制的文本作为关键词，根据该关键词在搜索网页中进行搜索，将与该关键词匹配度最高的网页的地址确定为第一目标网址。

步骤303、响应于网页朗读界面上触发的网页朗读操作，提取目标网页中的文字信息。

该目标网页指包括文字信息的任一网页。该网页朗读操作用于触发客户端提取目标网页中的文字信息并播放出对应的语音。可选地，当客户端获取到目标网页，会在网页朗读界面中显示网页播放控件。或者，当客户端获取到目标网页，会将网页朗读界面中显示的第一形态的网页播放控件切换显示为第二形态的网页播放控件。该第二形态与第一形态不同。网页播放控件的第二形态相较于第一形态，用于突出显示该网页播放控件，从而对用户进行提醒。可选地，该第二形态是通过对第一形态进行加粗显示、高亮显示、闪烁显示、摇动显示以及增加提示元素显示得到的。客户端在显示第二形态的网页播放控件时，还能够播放提示音从而进一步对用户进行提示。示例地，继续参照图1，第二形态的网页播放控件103相较于第一形态的网页播放控件102，进行了加粗显示，并且还增加了提示元素的显示。

可选地，客户端通过基于启发式规则的网页抽取算法从目标网页中提取文字信息。对于不同的网页，虽然在设计布局上存在差异，但仍满足一定规律。基于启发式规则的网页抽取算法能够通过利用这些规律，将网页对应的文档对象模型(Document ObjectModel，DOM)树以及其中的节点(Node)作为特征提取的基本单元，从而对网页进行分析，进而能够准确提取网页中的各类文字信息。可选地，该启发式规则包括发布时间规则、来源规则、正文规则以及标题规则中的至少一种规则。该发布时间规则用于提取网页的发布时间对应的文字信息，是根据反映时间的关键字以及日期确定的。例如关键字为“发布时间”、“时间”以及“提问时间”。该来源规则用于提取网页的来源对应的文字信息，是根据反映网页来源的关键字以及网页中的指定节点(Node)确定的。例如该指定节点包括前一个或者后一个节点是发布时间的节点，前一个或者后一个节点是标题的节点。该正文规则用于提取网页的正文对应的文字信息，是根据第一文本长度以及指定信息确定的。例如节点中文本的第一文本长度超过第一预设值则为包括正文的节点。该指定信息包括反映段落的标签<p>以及换行标签<br>。该标题规则用于提取网页的标题对应的文字信息，是根据第二文本长度以及指定信息确定的。例如节点中文本的第二文本长度超过第二预设值且小于第三预设值(标题的文本长度有限)，则为包括标题的节点。该指定信息包括反映字体加粗的标签<strong>以及反映段落的H1、H2、H3标签等。网页抽取算法指对输入的网页中的各节点进行特征提取，并根据提取的特征将节点分类，从而提取出网页中的指定文字信息。例如只提取网页的正文的文字信息。具体地，客户端通过机器学习模型从目标网页中提取文字信息，该机器学习模型基于该基于启发式规则的网页抽取算法。该机器学习模型是通过网页样本进行无监督训练得到的。该网页样本中包括至少一个包括文字信息的网页。客户端还能够通过正则表达式提取网页中的文字信息以及通过CSS选择器提取网页中的文字信息。通过正则表达式提取文字信息指通过正则表达式在网页的源代码中进行字符串级别的检索，从而提取出文字信息。该正则表达式是基于自然语言的字符组成规则建立的。通过CSS选择器提取文字信息指通过网页对应的DOM筛选文字信息在网页中对应的元素，从而提取出文字信息。

步骤304、获取语音配置。

该语音配置包括声音类型、语速、语调以及音量中的至少一种。该声音配置是客户端预先建立的。客户端通过不同的语音配置，能够生成不同风格的语音。客户端能够确定目标网页的类型，并获取与类型匹配的语音配置。其中，目标网页的类型用于反映目标网页对应的行业领域。例如，客户端根据网页所包括的关键字确定网页的类型。对于科研类网页，客户端获取严肃风格的语音配置，对于娱乐类网页，客户端获取活泼风格的语音配置，对于时尚类网页，客户端获取女性风格的语音配置。

可选地，客户端还能够显示不同的语音配置，并根据用户的选择操作获取对应的语音配置，从而根据该对应的语音配置生成语音。或者，客户端根据用户上次选择的语音配置，再次根据该语音配置生成语音。

步骤305、根据语音配置以及文字信息，基于语音合成引擎生成语音。

该语音合成引擎基于TTS，能够基于语音配置，将文字信息转化为对应的语音。客户端通过语音合成引擎，能够对文字信息进行语言处理，即模拟人对自然语言的理解过程，对该文字信息进行文本规整、词的切分、语法分析和语义分析。之后根据语音配置进行韵律处理，即确定文字信息所对应的生成的语音中每个音段的特征，如音高、音长、音调和音强等，使合成语音能正确且自然地表达语意。最后根据之前的处理结果生成该语音。

步骤306、播放文字信息对应的语音。

客户端在提取目标网页中的文字信息并生成语音后，自动播放该语音。在客户端播放该语音时，还能够显示至少一首预选背景音乐。该背景音乐是客户端中预置的。响应于对预选背景音乐的选择操作，客户端获取目标背景音乐，之后在播放语音的过程中，播放目标背景音乐。

另外，通过剪贴板获取目标网页，简化了用户实现播放网页对应的语音的操作步骤。通过网页访问记录以及用户操作信息获取目标网页，能够实现主动为用户播放用户感兴趣的网页对应的语音，提升了用户体验。根据语音配置生成文字信息对应的语音，能够实现根据用户的需求或网页的类型生成不同风格的语音，在播放语音的过程中还能够同步播放用户选择的背景音乐，提升了用户体验。

图4是本申请实施例提供的又一种网页播放方法的流程示意图。该方法可以用于电子设备或电子设备上的客户端。如图4所示，该方法包括：

步骤401、响应于打开网页朗读界面且未能从剪贴板中获取到目标网页，根据网页访问记录获取目标网页。

该网页朗读界面用于触发应用程序获取该目标网页。该应用程序为客户端。客户端未能从剪贴板中获取到目标网页，包括剪贴板中存储的文本中不包括网址的字符，以及剪贴板中未存储文本。此时客户端能够根据网页访问记录获取目标网页。该网页访问记录是客户端根据所在的电子设备中，具有网页访问功能的客户端获取到的。可选地，该网页朗读界面中显示有第一形态的网页播放控件。客户端在显示第一形态的网页播放控件的过程中，会获取该网页访问记录，之后将网页访问记录中在目标时间段内访问次数最多的网址确定为第二目标网址，并根据第二目标网址获取目标网页。其中，该目标时间段是客户端设置的，例如为最近的一天、最近的一周或最近的一个月。或者，该目标时间段是根据当前时间确定的，例如当前时间为11:00，则该目标时间段为近一月的每日的10:00至12:00。

步骤402、响应于网页朗读界面上触发的网页朗读操作，提取目标网页中的文字信息。

可选地，客户端通过基于启发式规则的网页抽取算法从目标网页中提取文字信息。具体地，客户端通过机器学习模型从目标网页中提取文字信息，该机器学习模型基于该基于启发式规则的网页抽取算法。该机器学习模型是通过网页样本进行无监督训练得到的。该网页样本中包括至少一个包括文字信息的网页。基于启发式规则的网页抽取算法能够利用网页的设计布局规律，将网页对应的DOM树以及其中的节点作为特征提取的基本单元，从而对网页进行分析，进而能够准确提取网页中的各类文字信息。客户端还能够通过正则表达式提取网页中的文字信息以及通过CSS选择器提取网页中的文字信息。通过正则表达式提取文字信息指通过正则表达式在网页的源代码中进行字符串级别的检索，从而提取出文字信息。该正则表达式是基于自然语言的字符组成规则建立的。通过CSS选择器提取文字信息指通过网页对应的DOM筛选文字信息在网页中对应的元素，从而提取出文字信息。

步骤403、获取语音配置。

步骤404、根据语音配置以及文字信息，基于语音合成引擎生成语音。

步骤405、播放文字信息对应的语音。

综上所述，本申请实施例提供的网页播放方法，根据网页访问记录获取目标网页，当接收到网页朗读界面上触发的网页朗读操作，提取获取到的目标网页中的文字信息，并播放该文字信息对应的语音。对于未提供语音的网页，同样能够实现播放出网页对应的语音。提供了一种灵活播放网页对应的语音的方式。

另外，通过网页访问记录获取目标网页，能够实现主动为用户播放用户感兴趣的网页对应的语音，提升了用户体验。根据语音配置生成文字信息对应的语音，能够实现根据用户的需求或网页的类型生成不同风格的语音，在播放语音的过程中还能够同步播放用户选择的背景音乐，提升了用户体验。

图5是本申请实施例提供的再一种网页播放方法的流程示意图。该方法可以用于电子设备或电子设备上的客户端。如图5所示，该方法包括：

步骤501、响应于打开网页朗读界面且未能从剪贴板中获取到目标网页，根据用户操作信息获取目标网页。

该网页朗读界面用于触发应用程序获取该目标网页。该应用程序为客户端。客户端未能从剪贴板中获取到目标网页，包括剪贴板中存储的文本中不包括网址的字符，以及剪贴板中未存储文本。此时客户端能够根据用户操作信息获取目标网页。客户端未能从剪贴板中获取到目标网页，还能够根据网页访问记录获取目标网页。在客户端未能从剪贴板中获取到目标网页时，客户端随机确定上述一种方式获取目标网页。或者，客户端通过两种方式分别获取第一目标网页和第二目标网页，根据用户的选择操作确定出目标网页。可选地，该网页朗读界面中显示有第一形态的网页播放控件。在显示第一形态的网页播放控件的过程中，客户端还能够获取用户操作信息。该用户操作信息包括网页访问信息、网页收藏信息、网页评论信息以及网页分享信息中的至少一种。该用户操作信息是客户端根据所在的电子设备中，具有网页访问功能的客户端获取到的。客户端根据用户操作信息和预选用户帐号的操作信息，通过基于用户的协同过滤算法(User-base CollaborativeFiltering，User-base CF)确定用户操作信息对应的用户帐号和预选用户帐号之间的相似度。并将相似度高于目标值的预选用户帐号确定为相似用户帐号。之后获取相似用户帐号的喜爱网页中用户帐号未访问过的网页，作为目标网页。其中，该用户帐号是使用该客户端的用户的帐号。预选用户帐号的操作信息是客户端对应的服务器从该服务器对应的其他客户端中获取，并发送至该客户端的。该目标值是客户端确定的，例如相似度为0至1之间的数字，该目标值为0.8，即与用户帐号的相似度高于0.8的预选用户帐号会被客户端确定为相似用户帐号。当客户端确定出多个相似用户帐号时，根据与用户帐号相似度最高的相似用户帐号的喜爱网页确定该目标网页。该喜爱网页指相似用户帐号进行点赞、喜爱、转发、收藏或每日访问的网页。

步骤502、响应于网页朗读界面上触发的网页朗读操作，提取目标网页中的文字信息。

步骤503、获取语音配置。

步骤504、根据语音配置以及文字信息，基于语音合成引擎生成语音。

步骤505、播放文字信息对应的语音。

综上所述，本申请实施例提供的网页播放方法，根据用户操作信息获取目标网页，当接收到网页朗读界面上触发的网页朗读操作，提取获取到的目标网页中的文字信息，并播放该文字信息对应的语音。对于未提供语音的网页，同样能够实现播放出网页对应的语音。提供了一种灵活播放网页对应的语音的方式。

另外，通过用户操作信息获取目标网页，能够实现主动为用户播放用户感兴趣的网页对应的语音，提升了用户体验。根据语音配置生成文字信息对应的语音，能够实现根据用户的需求或网页的类型生成不同风格的语音，在播放语音的过程中还能够同步播放用户选择的背景音乐，提升了用户体验。

需要说明的是，上述实施例中根据剪贴板中存储的复制操作复制的文本获取目标网页的步骤，根据网页访问记录获取目标网页的步骤以及根据用户操作信息获取目标网页的步骤可以自由组合实施，也可以单独实施，本申请实施例对此不作限定。

并且，客户端还能够根据用户输入的网址获取该目标网页。可选地，网页朗读界面中显示有第一形态的网页播放控件。响应于对第一形态的网页播放控件的触发操作，客户端能够显示网址输入界面。该网址输入界面用于使用客户端的用户输入网址。响应于在该网址输入界面中键入操作，客户端获取键入操作输入的网页网址对应的输入网页，并根据输入网页获取目标网页。

需要说明的是，本申请实施例提供的方法步骤的先后顺序可以进行适当调整，步骤也可以根据情况进行相应增减，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化的方法，都应涵盖在本申请的保护范围之内，因此不再赘述。

图6是本申请实施例提供的一种网页播放装置的结构示意图。该装置可以用于电子设备或电子设备上的客户端。如图6所示，该装置60包括：

存储模块601，用于响应于复制操作，在剪贴板中存储所述复制操作复制的文本；

获取模块602，用于响应于打开应用程序上的网页朗读界面，根据剪贴板中的文本获取目标网页。

提取模块603，用于响应于所述网页朗读界面上触发的网页朗读操作，提取所述目标网页中的文字信息。

播放模块604，用于播放文字信息对应的语音。

可选地，获取模块602，用于：

响应于打开所述网页朗读界面，获取剪贴板中的文本。识别文本中的第一目标网址。根据第一目标网址获取目标网页。

可选地，获取模块602，用于：

通过正则表达式过滤文本，得到第一目标网址，正则表达式是根据网址的字符组成规则建立的。

可选地，如图7所示，装置60还包括：

显示模块605，用于响应于获取到所述目标网页，显示网页播放控件。

提取模块603，用于响应于在网页播放控件上触发的网页朗读操作，提取目标网页中的文字信息。

可选地，所述网页朗读界面中显示有第一形态的网页播放控件。显示模块605，用于响应于获取到所述目标网页，显示第二形态的所述网页播放控件。提取模块603，用于响应于在第二形态的网页播放控件上触发的网页朗读操作，提取目标网页中的文字信息。

可选地，如图8所示，装置60还包括：

获取模块602，用于响应于打开所述网页朗读界面且未能从剪贴板中获取到目标网页，获取网页访问记录。

第一确定模块606，用于将网页访问记录中在目标时间段内访问次数最多的网址确定为第二目标网址。

获取模块602，用于根据第二目标网址获取目标网页。

可选地，如图9所示，装置60还包括：

获取模块602，用于响应于打开所述网页朗读界面且未能从剪贴板中获取到目标网页，获取用户操作信息，用户操作信息包括网页访问信息、网页收藏信息、网页评论信息以及网页分享信息中的至少一种。

第二确定模块607，用于根据用户操作信息和预选用户帐号的操作信息，通过基于用户的协同过滤算法确定用户操作信息对应的用户帐号和预选用户帐号之间的相似度。

第三确定模块608，用于将相似度高于目标值的预选用户帐号确定为相似用户帐号。

获取模块602，用于获取相似用户帐号的喜爱网页中用户帐号未访问过的网页，作为目标网页。

可选地，如图10所示，装置60还包括：

获取模块602，用于获取语音配置，语音配置包括声音类型、语速、语调以及音量中的至少一种。

生成模块609，用于根据语音配置以及文字信息，基于语音合成引擎生成语音。

可选地，获取模块602，用于：

确定目标网页的类型，类型用于反映目标网页对应的行业领域。获取与类型匹配的语音配置。

可选地，如图11所示，播放模块604，包括：

显示子模块6041，用于显示至少一首预选背景音乐。

获取子模块6042，用于响应于对预选背景音乐的选择操作，获取目标背景音乐。

播放模块604，用于在播放语音的过程中，播放目标背景音乐。

可选地，提取模块603，用于：

通过基于启发式规则的网页抽取算法从目标网页中提取文字信息。

可选地，显示模块605，用于响应于对第一形态的网页播放控件的触发操作，显示网址输入界面。

获取模块602，用于响应于在网址输入界面中键入操作，获取键入操作输入的网页网址对应的输入网页。

获取模块602，用于根据输入网页获取目标网页。

需要说明的是：上述实施例提供的网页播放装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的网页播放装置与网页播放方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本申请的实施例还提供了一种电子设备，该电子设备包括：处理器和存储器，存储器中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的网页播放方法。

可选地，该电子设备为终端。示例地，图12是本申请实施例提供的一种终端的结构示意图。

通常，终端1200包括有：处理器1201和存储器1202。

处理器1201可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1201可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1201可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1201还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1202可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1202中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1201所执行以实现本申请中方法实施例提供的网页播放方法。

在一些实施例中，终端1200还可选包括有：***设备接口1203和至少一个***设备。处理器1201、存储器1202和***设备接口1203之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1203相连。具体地，***设备包括：射频电路1204、显示屏1205、摄像头组件1206、音频电路1207、定位组件1208和电源1209中的至少一种。

***设备接口1203可被用于将I/O(Input/Output，输入/输出)相关的至少一个***设备连接到处理器1201和存储器1202。在一些实施例中，处理器1201、存储器1202和***设备接口1203被集成在同一芯片或电路板上；在一些其他实施例中，处理器1201、存储器1202和***设备接口1203中的任意一个或两个可以在单独的芯片或电路板上实现，本申请实施例对此不加以限定。

射频电路1204用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1204通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1204将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1204包括：天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1204可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1204还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1205用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1205是触摸显示屏时，显示屏1205还具有采集在显示屏1205的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1201进行处理。此时，显示屏1205还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1205可以为一个，设置终端1200的前面板；在另一些实施例中，显示屏1205可以为至少两个，分别设置在终端1200的不同表面或呈折叠设计；在再一些实施例中，显示屏1205可以是柔性显示屏，设置在终端1200的弯曲表面上或折叠面上。甚至，显示屏1205还可以设置成非矩形的不规则图形，也即异形屏。显示屏1205可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件1206用于采集图像或视频。可选地，摄像头组件1206包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端1200的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1206还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1207可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1201进行处理，或者输入至射频电路1204以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1200的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1201或射频电路1204的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1207还可以包括耳机插孔。

定位组件1208用于定位终端1200的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件1208可以是基于美国的GPS(GlobalPositioning System，全球定位***)、中国的北斗***或俄罗斯的伽利略***的定位组件。

电源1209用于为终端1200中的各个组件进行供电。电源1209可以是交流电、直流电、一次性电池或可充电电池。当电源1209包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端1200还包括有一个或多个传感器1210。该一个或多个传感器1210包括但不限于：加速度传感器1211、陀螺仪传感器1212、压力传感器1213、指纹传感器1214、光学传感器1215以及接近传感器1216。

加速度传感器1211可以检测以终端1200建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1211可以用于检测重力加速度在三个坐标轴上的分量。处理器1201可以根据加速度传感器1211采集的重力加速度信号，控制触摸显示屏1205以横向视图或纵向视图进行用户界面的显示。加速度传感器1211还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1212可以检测终端1200的机体方向及转动角度，陀螺仪传感器1212可以与加速度传感器1211协同采集用户对终端1200的3D动作。处理器1201根据陀螺仪传感器1212采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1213可以设置在终端1200的侧边框和/或触摸显示屏1205的下层。当压力传感器1213设置在终端1200的侧边框时，可以检测用户对终端1200的握持信号，由处理器1201根据压力传感器1213采集的握持信号进行左右手识别或快捷操作。当压力传感器1213设置在触摸显示屏1205的下层时，由处理器1201根据用户对触摸显示屏1205的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1214用于采集用户的指纹，由处理器1201根据指纹传感器1214采集到的指纹识别用户的身份，或者，由指纹传感器1214根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1201授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1214可以被设置终端1200的正面、背面或侧面。当终端1200上设置有物理按键或厂商Logo时，指纹传感器1214可以与物理按键或厂商Logo集成在一起。

光学传感器1215用于采集环境光强度。在一个实施例中，处理器1201可以根据光学传感器1215采集的环境光强度，控制触摸显示屏1205的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏1205的显示亮度；当环境光强度较低时，调低触摸显示屏1205的显示亮度。在另一个实施例中，处理器1201还可以根据光学传感器1215采集的环境光强度，动态调整摄像头组件1206的拍摄参数。

接近传感器1216，也称距离传感器，通常设置在终端1200的前面板。接近传感器1216用于采集用户与终端1200的正面之间的距离。在一个实施例中，当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变小时，由处理器1201控制触摸显示屏1205从亮屏状态切换为息屏状态；当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变大时，由处理器1201控制触摸显示屏1205从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图12中示出的结构并不构成对终端1200的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本申请实施例中还提供了一种计算机可读存储介质，该可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，当该至少一条指令、至少一段程序、代码集或指令集由电子设备的处理器加载并执行时，实现上述各方法实施例提供的网页播放方法。

本申请还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该电子设备执行上述各方法实施例提供的网页播放方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的可读存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同切换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种网页播放方法，其特征在于，所述方法包括：

播放所述文字信息对应的语音。

2.根据权利要求1所述的方法，其特征在于，所述响应于打开应用程序上的网页朗读界面，根据所述剪贴板中的所述文本获取目标网页，包括：

识别所述文本中的第一目标网址；

根据所述第一目标网址获取所述目标网页。

3.根据权利要求2所述的方法，其特征在于，所述识别所述文本中的第一目标网址，包括：

4.根据权利要求1至3任一所述的方法，其特征在于，所述网页朗读界面中显示有第一形态的网页播放控件；

在所述响应于打开应用程序上的网页朗读界面，根据所述剪贴板中的所述文本获取目标网页之后，所述方法还包括：

所述响应于所述网页朗读界面上触发的网页朗读操作，提取所述目标网页中的文字信息，包括：

5.根据权利要求1至3任一所述的方法，其特征在于，在所述响应于所述网页朗读界面上触发的网页朗读操作，提取所述目标网页中的文字信息之前，所述方法还包括：

响应于打开所述网页朗读界面且未能从所述剪贴板中获取到所述目标网页，获取网页访问记录；

将所述网页访问记录中在目标时间段内访问次数最多的网址确定为第二目标网址；

根据所述第二目标网址获取所述目标网页。

6.根据权利要求1至3任一所述的方法，其特征在于，在所述响应于所述网页朗读界面上触发的网页朗读操作，提取所述目标网页中的文字信息之前，所述方法还包括：

响应于打开所述网页朗读界面且未能从所述剪贴板中获取到所述目标网页，获取用户操作信息，所述用户操作信息包括所述网页访问信息、所述网页收藏信息、所述网页评论信息以及所述网页分享信息中的至少一种；

根据所述用户操作信息和预选用户帐号的操作信息，通过基于用户的协同过滤算法确定所述用户操作信息对应的用户帐号和所述预选用户帐号之间的相似度；

将所述相似度高于目标值的所述预选用户帐号确定为相似用户帐号；

获取所述相似用户帐号的喜爱网页中所述用户帐号未访问过的网页，作为所述目标网页。

7.根据权利要求1至3任一所述的方法，其特征在于，在所述响应于所述网页朗读界面上触发的网页朗读操作，提取所述目标网页中的文字信息之后，所述方法还包括：

显示至少一首预选背景音乐；

响应于对所述预选背景音乐的选择操作，获取目标背景音乐；

在播放所述语音的过程中，播放所述目标背景音乐。

8.一种网页播放装置，其特征在于，所述装置包括：

第一获取模块，用于响应于打开应用程序上的网页朗读界面，根据所述剪贴板中的所述文本获取目标网页；

播放模块，用于播放所述文字信息对应的语音。

9.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的网页播放方法。

10.一种计算机可读存储介质，其特征在于，所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一所述的网页播放方法。