CN113360127A

CN113360127A - 音频播放方法以及电子设备

Info

Publication number: CN113360127A
Application number: CN202110605173.6A
Authority: CN
Inventors: 杨丽娟
Original assignee: Futuo Network Technology Shenzhen Co ltd
Current assignee: Futuo Network Technology Shenzhen Co ltd
Priority date: 2021-05-31
Filing date: 2021-05-31
Publication date: 2021-09-07
Anticipated expiration: 2041-05-31
Also published as: CN113360127B

Abstract

本申请实施例提供了一种音频播放方法以及电子设备。该方法包括：接收用户在第一文本的显示界面输入的音频播放指令，该音频播放指令携带有第一语言信息，该第一语言信息用于指示播放该第一文本使用的语言，并根据该第一语言信息，获取该第一文本的音频文件，再播放该第一文本的音频文件。解决了现有技术中仅显示文本导致的信息传递的便利性较差的问题。

Description

音频播放方法以及电子设备

技术领域

本申请实施例涉及数据处理技术领域，并且更具体地，涉及音频播放方法以及电子设备。

背景技术

随着互联网技术的不断发展，手机、电脑等终端设备能够获取咨询信息的文本，并将咨询信息的文本进行显示，使用户通过终端设备来进行文本的浏览以获取咨询信息。然而，仅通过文本进行咨询信息的传递，导致咨询信息传递的便利性较差。

发明内容

本申请实施例提供了一种音频播放方法以及电子设备，能够提高咨询信息传递的便利性。

第一方面，提供一种音频播放方法，包括：

接收用户在第一文本的显示界面输入的音频播放指令，该音频播放指令携带有第一语言信息，该第一语言信息用于指示播放该第一文本使用的语言；根据该第一语言信息，获取该第一文本的音频文件；播放该第一文本的音频文件。

第二方面，提供一种电子设备，包括：

接收单元，用于接收用户在第一文本的显示界面输入的音频播放指令，该音频播放指令携带有第一语言信息，该第一语言信息用于指示播放该第一文本使用的语言；处理单元，用于根据该第一语言信息，获取该第一文本的音频文件；音频播放单元，用于播放该第一文本的音频文件。

第三方面，提供一种电子设备，包括：处理器和存储器，该存储器用于存储计算机程序，该处理器用于调用并运行该存储器中存储的计算机程序，执行如第一方面或其各实现方式中的方法。

第四方面，提供一种计算机可读存储介质，用于存储计算机程序，计算机程序使得计算机执行如第一方面或其各实现方式中的方法。

第五方面，提供一种计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行如第一方面或其各实现方式中的方法。

第六方面，提供一种计算机程序，计算机程序使得计算机执行如第一方面或其各实现方式中的方法。

本申请实施例中，电子设备可以根据用户在第一文本的显示界面输入的音频播放指令，获取第一文本对应的音频文件，并进行音频播放，解决了现有技术中仅显示文本导致的信息传递的便利性较差的问题；

进一步地，电子设备可以根据音频播放指令中携带的第一语言信息，获取与第一语言信息对应的第一文本的音频文件，能够根据用户的需求按照用户所需的语言播放第一文本的音频文件，提高了用户体验。

附图说明

图1为本申请实施例提供的一种音频播放方法的场景示意图；

图2为本申请实施例提供的一种音频播放方法的流程示意图；

图3a为本申请实施例提供的一种第一文本的显示界面的示意图；

图3b为本申请实施例提供的一种音频播放界面的示意图；

图4为本申请实施例提供的另一种音频播放方法的流程示意图；

图5为本申请实施例提供的一种播放倍速控制界面的示意图；

图6为本申请实施例提供的另一种第一文本的显示界面的示意图；

图7示出了根据本申请实施例的电子设备的示意性框图；

图8为本申请实施例提供的一种电子设备示意性结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。针对本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的执行主体为电子设备，该电子设备可以是任一终端设备，例如可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。该电子设备还可以是服务器，该服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，当电子设备为服务器时，可以通过所连接的终端接收用户的操作并生成指令，再由服务器根据终端的指令执行数据处理，本申请在此不做限制。

为了便于理解本申请实施例，首先对本申请实施例的应用场景进行介绍。结合图1所示，图1为本申请实施例提供的一种音频播放方法的场景示意图。如图1所示，电子设备向用户显示第一文本的显示界面，以供用户浏览获取信息，第一文本可以是新闻、小说、资讯信息等内容，用户向电子设备发送音频播放指令，该音频播放指令可以是用户在浏览第一文本的显示界面时发送的，例如可以是对第一文本的显示界面中输入的，或者可以是通过语音输入的等，电子设备可以根据该音频播放指令，获取第一文本对应的音频文件，并进行音频播放。解决了现有技术中仅显示文本导致的信息传递的便利性较差的问题。

下面将对本申请实施例技术方案进行详细阐述：

图2为本申请实施例提供的一种音频播放方法200的流程示意图。本实施例的执行主体可以是上述电子设备，如图2所示，该方法包括：

S201：接收用户在第一文本的显示界面输入的音频播放指令，该音频播放指令携带有第一语言信息，该第一语言信息用于指示播放该第一文本使用的语言；

S202：根据该第一语言信息，获取该第一文本的音频文件；

S203：播放该第一文本的音频文件。

示例性的，上述S201中，用户可以通过在第一文本的显示界面中显示的音频播放控件进行选中操作，向电子设备发送音频播放指令。可选的，该音频播放控件可以是第一文本的音频播放浮窗，可选的，第一文本的音频播放浮窗中可以显示有第一文本的摘要、第一文本的音频文件的播放时长等。

需要说明的是，音频播放指令中携带的第一语言信息可以是默认的语言信息，例如默认的语言信息为普通话、粤语或英语中的一种；或者第一语言信息可以是用户在输入音频播放指令之前选择的语言信息、或者第一语言信息可以是用户上一次输入音频播放指令所携带的语言信息。

在一些实施例中，上述S202可以包括以下两种可能的实现方式：方式一、从数据库中读取第一文本的至少一个音频文件，并从至少一个音频文件中确定第一语言信息对应的音频文件；方式二、根据第一语言信息，生成第一文本的音频文件。

针对上述方式一、电子设备从数据库中读取第一文本的至少一个音频文件，应理解，每个音频文件对应一种语言信息，进而，电子设备从至少一个音频文件中确定与第一语言信息对应的音频文件。需要说明的是，该数据库可以是电子设备的本地数据库，或者可以是服务器端的数据库。当为服务器端的数据库时，电子设备向服务器发送音频获取请求，请求获取服务器查找第一文本对应的至少一个音频文件，并接收服务器发送的至少一个音频文件，再从服务器发送的至少一个音频文件中确定第一语言信息对应的音频文件。

针对上述方式二、作为一种示例，电子设备按照第一语言信息，获取第一语言信息对应的第一文本的文本信息，例如，第一语言信息指示的语言为英文，则获取第一文本的文本信息为英文表达的文本信息，进而将第一文本的文本信息转化为第一文本的音频文件，示例性的，可以将第一文本的文本信息输入预先训练得到的音频转换模型，得到第一文本的音频文件，可选的，音频转换模型可以是基于从文本到语音(TextToSpeech，TTS)算法的模型。

示例性的，在上述方式二中，电子设备按照第一语言信息获取第一语言信息对应的第一文本的文本信息，可以包括：电子设备可以对第一文本的源语言，即第一文本在电子设备中所显示的语言，与第一语言信息指示的语音是否相同进行判断，在第一文本的源语言与第一语言信息指示的语言是否相同的情况下，可以直接获取第一文本的文本信息；在第一文本的源语言与第一语言信息指示的语言不同的情况下，需要根据第一语言信息对第一文本进行翻译得到对应的文本信息。

为了使翻译得到的文本信息更加准确，本实施例中，通过文本翻译模型中与第一语言信息对应的行业分类器对第一文本进行行业分类，得到目标行业类别，并通过文本翻译模型根据目标行业类别对第一文本进行标注，得到行业标注后的第一文本，再通过文本翻译模型对行业标注后的第一文本进行翻译得到第一文本的文本信息。

当本申请实施例应用于资讯传播领域时，所传递的资讯信息是多元化的，而在不同的行业中所使用的翻译语言具有差异性，因此，首先对第一文本进行行业识别，并将识别得到的行业类别标注于第一文本，进而文本翻译模型可以根据所标注的行业类别对第一文本进行翻译，提高了翻译的准确性，进而使翻译得到的第一文本的文本信息更加准确。

针对上述方式二、作为另一种示例，电子设备将第一文本和第一语言信息发送至服务器，服务器根据接收到的第一文本和第一语言信息，生成第一文本的音频文件。

在一些实施例中，音频播放方法200还包括：显示第一文本的音频播放浮窗，并响应于用户对第一文本的音频播放浮窗的选中操作，打开第一文本的音频播放界面。

结合图3a所示，第一文本的音频播放浮窗可以显示于第一文本的显示界面中，当用户对第一文本的音频播放浮窗进行选中操作时，也即用户点击第一文本的音频播放浮窗时，在第一文本的显示界面的上方显示第一文本的音频播放界面，例如图3b所示。

结合图3b所示，音频播放界面中可以包括以下至少一项：第一文本的摘要和/或缩略图、至少一个播放控制控件、播放列表控件、播放倍速控件、播放语言控件。

可选的，至少一个播放控制控件可以包括上一首控件、下一首控件、播放/暂停控件中的至少一种。

可选的，音频播放界面中还可以包括进度条和/或播放列表控件。其中，进度条可以不断展示最新的播放进度。

在一些实施例中，用户可以拖动进度条以改变音频文件的播放位置，电子设备在用户选中进度条中的进度节点时，可以将进度条以及进度节点放大，防止用户在操作进度节点时手指对进度条遮挡而难以调整至准确位置的问题，提高了用户体验。

可选的，第一文本的音频播放界面打开时可同时播放第一文本的音频文件，此时，用户对第一文本的音频播放浮窗的选中操作即为上述实施例中用户输入音频播放指令的过程；或者，第一文本的音频播放界面打开时，不播放第一文本对应的音频文件，当用户在第一文本的音频播放界面点击播放控制控件时，获取第一文本的音频文件并播放该音频文件。

可选的，在第一文本的音频文件正在播放的情况下，播放控制控件显示为“暂停”控件，在第一文本的音频文件停止播放的情况下，播放控制空间显示为“播放”控件。应理解，用户点击“暂停”控件后，第一文本的音频文件暂停播放，用户点击“播放”控件后，第一文本的音频文件开始播放。

在一些实施例中，电子设备响应于用户对播放语言控件的选中操作，将第一文本的第一语言信息切换为第二语言信息，并根据第二语言信息，更新第一文本的音频文件，再播放更新后的第一文本的音频文件。实现语言语种的快速切换。

可选的，电子设备获取第二语言信息的音频文件后，可以从头播放该第二语言信息对应的音频文件，或者可以根据切换时第一语言信息对应的音频文件的暂停位置，确定第二语言信息对应的音频文件的对应的播放位置，并从该播放位置开始播放第二语言信息对应的音频文件。

示例性的，若电子设备获取的第一文本对应的至少一个音频文件只有一个时，用户点击播放语言控件后，电子设备显示提示语“无其他语言”；若电子设备获取的第一文本对应的至少一个音频文件有多个时，在用户每次点击后对多个语言信息对应的音频文件进行循环切换，例如按照“普通话、粤语、英语”的顺序循环。

例如，结合图4所示，电子设备在用户点击播放语言控件后，确定第一文本对应的音频文件的数量是否大于1，若不大于1，则提示“无其他语言”，若大于1，则确定当前音频文件是否为普通话，若当前音频文件为普通话，则确定至少一个音频文件中是否存在粤语对应的音频文件，若至少一个音频文件中存在粤语对应的音频文件，则播放粤语对应的音频文件，若至少一个音频文件中不存在粤语对应的音频文件，则确定至少一个音频文件中是否存在英语对应的音频文件，若至少一个音频文件中存在英语对应的音频文件则播放该英语对应的音频文件，若至少一个音频文件中不存在英语对应的音频文件，则结束该流程。若当前音频文件不是普通话，则确定当前音频文件是否为粤语，若当前音频文件也不是粤语则确定当前音频文件是否为英语，进一步地，再确定至少一个音频文件中是否存在循环顺序中下一中语言对应的音频文件，具体过程与当前音频文件为普通话时的过程类似，此处不再赘述。

可选的，播放语言控件在音频播放界面中可以显示为当前音频文件对应的语言，例如当前播放的音频文件为普通话，则播放语言控件显示为“普”，当前播放的音频文件为英语，则播放语言控件显示为“英”。

可选的，音频文本为暂停播放状态时，播放语言控件在音频播放界面中可以显示为之前播放音频文件对应的语言信息。

在一些实施例中，电子设备响应于用户对第一文本的摘要和/或缩略图的选中操作，切换至第一文本的显示界面。

在一些实施例中，电子设备响应于用户对第一文本的摘要和/或缩略图的滑动操作，切换至第二文本的显示界面，并播放第二文本的音频文件，第二文本为文本列表中与第一文本相邻的文本。

例如，当用户在第一文本的摘要和/或缩略图的显示区域将摘要和/或缩略图向右滑动后，电子设备将第一文本的显示界面切换至文本列表中第一文本之前的文本的显示界面；当用户在第一文本的摘要和/或缩略图的显示区域将摘要和/或缩略图向左滑动后，电子设备将第一文本的显示界面切换至文本列表中第一文本之后的文本的显示界面。

示例性的，用户对第一文本的上一首控件的选中操作与用户对第一文本的摘要和/或缩略图的向右滑动操作，可以实现相同的切换效果；类似的，用于对第一文本的下一首控件的选中操作与用户对第一文本的摘要和/或缩略图的向左滑动操作，可以实现相同的切换效果。

在一些实施例中，电子设备响应于用户对播放列表控件的选中操作，显示播放列表。可选的，播放列表中包括多个文本信息。

进一步地，电子设备可以响应于用户在播放列表选中的任一文本信息，获取该文本信息对应的音频文件，并播放该文本信息对应的音频文件。

可选的，用户可以在播放列表中进行滑动，以浏览播放列表中的全部文本信息，电子设备随着用户的滑动将播放列表进行滑动显示。可选的，播放列表支持上下位自动刷新功能。可选的，播放列表滑动至顶部后，若继续滑动则收起播放列表。

可选的，电子设备部署有滑动速度监听模块，支持用户在播放列表中的慢速滑动和快速滑动，达到快速滑动时自动收起播放列表的效果。

在一些实施例中，电子设备响应于用户对播放倍速控件的选中操作，打开播放倍速控制界面，并接收用户在播放倍速控制界面对任一播放倍速控件的选中操作，再按照播放倍速控件所指示的播放倍速，播放第一文本的音频文件。

结合图5所示，示例性的，电子设备显示的播放倍速控制界面显示于音频播放界面的上方，且音频播放界面处于不可操作状态，播放倍速控制界面处于可操作状态，播放倍速控制界面中包括多个倍速选项，例如“0.5x、0.75x、1.0x、1.25x、1.5x、2.0x”，分别为0.5倍速、0.75倍速、1倍速、1.25倍速、1.5倍速和2.0倍速。用户可以在播放倍速控制界面中左右滑动，将所需的播放倍速控件放于激活区域，实现对播放倍速控件的选中。

可选的，播放倍速控制界面可以为倍速选择器，倍速选择器支持左右滑动切换倍速，也支持上下滑动手势，收起倍速选择器。上下手势与播放列表实现效果一致。

因此，本申请实施例中，电子设备可以根据用户在第一文本的显示界面输入的音频播放指令，获取第一文本对应的音频文件，并进行音频播放，解决了现有技术中仅显示文本导致的信息传递的便利性较差的问题。

图6为本申请实施例提供的另一种第一文本的显示界面的示意图。本实施例可结合于上述图3a、图3b或图5中，图6以结合图3a为例，在上述图3a、图3b或图5所述的任一实施例的基础上，本实施例中的第一文本的显示界面还包括至少一个目标物的文本信息，该至少一个目标物是通过识别第一文本确定的，与第一文本具有关联关系。

可选的，至少一个目标物的文本信息可以显示于第一文本的显示界面中的任意位置，例如第一文本的正文的上方或者下方。

以金融领域为例，假设第一文本为关于进出口汇率的资讯信息，则至少一个目标物可以是第一货币与第二货币的兑换信息，至少一个目标物的文本信息可以是第一货币与第二货币兑换的价格以及兑换汇率的涨幅；仍以金融领域为例，结合图6所示，假设第一文本为包含股票A、股票B和股票C的资讯信息，则至少一个目标物可以包括股票A、股票B和股票C，至少一个目标物的文本信息可以包括每个股票的价格以及涨幅。

上述方案通过识别第一文本能够向用户展示具有关联关系的目标物，示例性的，可以在用户对任一目标物进行选中操作时，打开该目标物的详情界面。

本实施例为了增加信息传递的便利性，对上述方案中的至少一个目标物进行音频播放，并接收用户输入的语音数据，根据用户的语音数据进入任一目标物的详情界面，提高了信息传递的便利性并提高了用户体验。

下面对本实施例进行说明：

示例性的，电子设备对第一文本进行识别，得到至少一个目标物，并按照第一语言信息，获取至少一个目标物的音频信息，再播放至少一个目标物的音频信息。

需要说明的是，至少一个目标物的音频信息可以单独播放，例如在完成第一文本的音频文件的播放后播放该至少一个目标物的音频信息，或者可以将至少一个目标物的音频信息拼接在第一文本的音频文件中进行播放。

示例性的，至少一个目标物的音频信息可以包括音频模板和基于至少一个目标物的文本信息转化得到的信息，例如“是否前往股票行情界面，以下为相关股票信息：股票A价格为xx涨幅为xx，股票B价格为xx涨幅为xx……请选择。”

一般来说，播放至少一个目标物的音频信息的语言与播放第一文本的音频文件的语言相同，即通过第一语言信息播放至少一个目标物的音频信息，示例性的，在至少一个目标物的文本信息的语言与第一语言信息指示的语言不同时，先将至少一个目标物的文本信息翻译为第一语言信息指示的语言，再将至少一个目标物的文本信息转化为音频信息。

本实施例中，对如何识别第一文本，得到至少一个目标物提供以下可能的实现方式：

一、通过正则表达式，从第一文本中提取至少一个目标物。示例性的，正则表达式中预设有待匹配目标物列表，通过正则表达式能够从第一文本中筛选待匹配目标物列表中的待匹配目标物，以得到至少一个目标物。

二、通过预先训练的目标物匹配模型，对第一文本进行语义识别得到第一语义向量，并将第一语义向量与预设的待匹配目标物列表中的每个待匹配目标物进行匹配，得到第一匹配结果，第一匹配结果用于指示与第一文本匹配的至少一个目标物。示例性的，通过目标物匹配模型能够确定第一语义向量与每个待匹配目标物的相似度，得到相似度高于预设相似度的至少一个目标物。

上述方式一更适用于第一文本中直接出现的对目标物的表述，例如第一文本中提及了某一股票的名称，则可以直接与待匹配目标物列表中的股票的名称进行匹配。

上述方式二更适用于根据第一文本的描述内容理解出相关的目标物。

进一步地，可以结合上述方式一和方式二更加全面的确定与第一文本具有关联关系的至少一个目标物。

本实施例中，电子设备在播放至少一个目标物的音频信息后，可以接收用户输入的语音数据，并根据语音数据，生成界面切换指令，该界面切换指令携带有至少一个目标物中任一目标物的标识，电子设备响应于该界面切换指令，根据该目标物的标识，显示该目标物的详情界面。

可选的，电子设备可以在播放至少一个目标物的音频信息后的等待时长内，等待用户输入语音数据，以便于确定用户是否需要跳转至任一目标物的详情界面。

可选的，可以设置等待语音数据的输入时长，例如输入时长可以为5秒。

示例性的，本实施例对如何根据语音数据，生成界面切换指令，提供如下可能的实现方式：将语音数据转化为文本数据，并对文本数据进行分词处理，得到分词集合，再针对至少一个目标物中的每个目标物，确定分词集合中每个分词与该目标物的相似度，并将每个分词对应的相似度相加，得到文本数据与目标物的相似度，最后比较每个目标物与文本数据的相似度，相似度最高的目标物即为用于期望了解详情的目标物，进而，根据最高相似度对应的目标物的标识，生成所述界面切换指令。

本实施例中，能够根据第一文本信息，识别得到至少一个目标物，并对至少一个目标物的音频信息进行播放，而不仅是将至少一个目标物的文本信息进行显示，提高了信息传递的便利性；进一步地，在播放至少一个目标物的音频信息后，接收用户输入的语音数据，并根据用户的语音数据生成界面切换指令，以切换至用户期望的目标物的详情界面，提高了用户操作的便利性，以及信息获取的便利性。

在一些实施例中，电子设备包括统一建模语言(Unified Modeling Language，UML)类图。下面对各个类(接口)的大致功能进行说明：

“语音语音播报事件处理类”主要是承担事件相应，例如展示语音播报主页面、主页面点击事件的业务逻辑，如播放/暂停、上/下一首、切换语言、点击标题/缩略图、倍速、播放列表加载更多、进度条进度更新等业务逻辑。

“语音播报主界面”主要是包装了“基本信息视域(view)”、“工具栏view”、“工具栏响应后弹出的view”。

“基本信息view”展示了语音标题(或者摘要)、缩略图、进度条、播放、暂停、上一首、下一首、触感反馈、播放动画等。

“工具栏view”展示了播放列表按钮、倍速按钮、语音切换按钮，以及相关的交互。

“工具栏响应后弹出的view”该页面展示播放列表和倍速选择器中的其中一个，具体展示哪一个由工具栏选中事件决定。

上文结合图3至图5，详细描述了本申请的方法实施例，下文结合图7至图8，详细描述本申请的装置实施例，应理解，装置实施例与方法实施例相互对应，类似的描述可以参照方法实施例。

图7示出了根据本申请实施例的电子设备600的示意性框图。如图7所示，该电子设备600包括：

接收单元610，用于接收用户在第一文本的显示界面输入的音频播放指令，该音频播放指令携带有第一语言信息，该第一语言信息用于指示播放该第一文本使用的语言；

处理单元620，用于根据该第一语言信息，获取该第一文本的音频文件；

音频播放单元630，用于播放该第一文本的音频文件。

在一些实施例中，处理单元620具体用于：

从数据库中读取该第一文本的至少一个音频文件，并从该至少一个音频文件中确定该第一语言信息对应的音频文件；或者，

根据该第一语言信息，生成该第一文本的音频文件。

在一些实施例中，处理单元620具体用于：从该第一文本的显示界面获取该第一文本的文本信息；根据该第一文本的文本信息，按照该第一语言信息生成该第一文本的音频文件；或者，将该第一文本的文本信息和该第一语言信息发送至服务器，并接收该服务器发送的该第一文本的音频文件。

在一些实施例中，电子设备600还包括：显示单元640；该显示单元640用于：显示该第一文本的音频播放浮窗；响应于用户对该第一文本的音频播放浮窗的选中操作，打开该第一文本的音频播放界面。

可选的，该音频播放界面包括以下至少一项：该第一文本的摘要和/或缩略图、至少一个播放控制控件、播放列表控件、播放倍速控件、播放语言控件。

在一些实施例中，电子设备600还包括：音频切换单元650；该音频切换单元650用于：响应于用户对该播放语言控件的选中操作，将该第一文本的第一语言信息切换为第二语言信息；根据该第二语言信息，更新该第一文本的音频文件；播放更新后的该第一文本的音频文件。

在一些实施例中，显示单元640还用于：响应于用户对该第一文本的摘要和/或缩略图的选中操作，切换至该第一文本的显示界面。

在一些实施例中，显示单元640还用于：响应于用户对该第一文本的摘要和/或缩略图的滑动操作，切换至第二文本的显示界面，并播放该第二文本的音频文件，该第二文本为文本列表中与该第一文本相邻的文本。

在一些实施例中，显示单元640还用于：响应于用户对该播放倍速控件的选中操作，打开播放倍速控制界面；接收单元610还用于：接收用户在该播放倍速控制界面对任一播放倍速控件的选中操作；音频播放单元630还用于：按照该播放倍速控件所指示的播放倍速，播放该第一文本的音频文件。

上述实施例提供的电子设备，可以执行上述方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图8为本申请实施例提供的一种电子设备700示意性结构图。如图8所示的终端设备包括处理器710，处理器710可以从存储器中调用并运行计算机程序，以实现本申请实施例中的方法。

可选地，如图8所示，电子设备700还可以包括存储器720。其中，处理器710可以从存储器720中调用并运行计算机程序，以实现本申请实施例中的方法。

其中，存储器720可以是独立于处理器710的一个单独的器件，也可以集成在处理器710中。

可选地，如图8所示，电子设备700还可以包括收发器730，处理器710可以控制该收发器730与其他设备进行通信，具体地，可以向其他设备发送信息或数据，或接收其他设备发送的信息或数据。

其中，收发器730可以包括发射机和接收机。收发器730还可以进一步包括天线，天线的数量可以为一个或多个。

可选地，该电子设备700可以实现本申请实施例的各个方法中终端设备对应的相应流程，为了简洁，在此不再赘述。

应理解，本申请实施例的处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

可以理解，本申请实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM，DR RAM)。应注意，本文描述的***和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

应理解，上述存储器为示例性但不是限制性说明，例如，本申请实施例中的存储器还可以是静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(dynamic RAM，DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synch link DRAM，SLDRAM)以及直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)等等。也就是说，本申请实施例中的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

本申请实施例还提供了一种计算机可读存储介质，用于存储计算机程序。

可选的，该计算机可读存储介质可应用于本申请实施例中的终端设备或服务器，并且该计算机程序使得计算机执行本申请实施例的各个方法中由的相应流程，为了简洁，在此不再赘述。

本申请实施例还提供了一种计算机程序产品，包括计算机程序指令。

可选的，该计算机程序产品可应用于本申请实施例中的终端设备或服务器，并且该计算机程序指令使得计算机执行本申请实施例的各个方法中的相应流程，为了简洁，在此不再赘述。

本申请实施例还提供了一种计算机程序。

可选的，该计算机程序可应用于本申请实施例中的终端设备或服务器，当该计算机程序在计算机上运行时，使得计算机执行本申请实施例的各个方法中的相应流程，为了简洁，在此不再赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。针对这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种音频播放方法，其特征在于，包括：

接收用户在第一文本的显示界面输入的音频播放指令，所述音频播放指令携带有第一语言信息，所述第一语言信息用于指示播放所述第一文本使用的语言；

根据所述第一语言信息，获取所述第一文本的音频文件；

播放所述第一文本的音频文件。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一语言信息，获取所述第一文本的音频文件，包括：

从数据库中读取所述第一文本的至少一个音频文件，并从所述至少一个音频文件中确定所述第一语言信息对应的音频文件；或者，

根据所述第一语言信息，生成所述第一文本的音频文件。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一语言信息，生成所述第一文本的音频文件，包括：

按照所述第一语言信息，获取所述第一文本的文本信息；将所述第一文本的文本信息转化为所述第一文本的音频文件；或者，

将所述第一文本和所述第一语言信息发送至服务器，并接收所述服务器发送的所述第一文本的音频文件。

4.根据权利要求3所述的方法，其特征在于，所述按照所述第一语言信息，获取所述第一文本的文本信息，包括：

在所述第一文本的源语言与所述第一语言信息指示的语言不同的情况下，通过文本翻译模型中与所述第一语言信息对应的行业分类器，对所述第一文本进行行业分类，得到目标行业类别；

通过所述文本翻译模型根据所述目标行业类别对所述第一文本进行行业标注，得到行业标注后的第一文本；

通过所述文本翻译模型对所述行业标注后的第一文本进行翻译，得到所述第一文本的文本信息。

5.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：

显示所述第一文本的音频播放浮窗；

响应于用户对所述第一文本的音频播放浮窗的选中操作，打开所述第一文本的音频播放界面。

6.根据权利要求1至4任一项所述的方法，其特征在于，所述音频播放界面包括以下至少一项：所述第一文本的摘要和/或缩略图、至少一个播放控制控件、播放列表控件、播放倍速控件、播放语言控件。

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

响应于用户对所述播放语言控件的选中操作，将所述第一文本的第一语言信息切换为第二语言信息；

根据所述第二语言信息，更新所述第一文本的音频文件；

播放更新后的所述第一文本的音频文件。

8.根据权利要求6所述的方法，其特征在于，所述方法还包括：

响应于用户对所述音频播放界面中的第一文本的摘要和/或缩略图的滑动操作，切换至第二文本的显示界面，并播放所述第二文本的音频文件，所述第二文本为文本列表中与所述第一文本相邻的文本。

9.根据权利要求6所述的方法，其特征在于，所述方法还包括：

响应于用户对所述播放倍速控件的选中操作，打开播放倍速控制界面；

接收用户在所述播放倍速控制界面对任一播放倍速控件的选中操作；

按照所述播放倍速控件所指示的播放倍速，播放所述第一文本的音频文件。

10.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：

对所述第一文本进行识别，得到至少一个目标物；

按照所述第一语言信息，获取所述至少一个目标物的音频信息；

播放所述至少一个目标物的音频信息。

11.根据权利要求10所述的方法，其特征在于，所述对所述第一文本进行识别，得到至少一个目标物，包括：

通过正则表达式，从所述第一文本中提取至少一个目标物；和/或，

通过预先训练的目标物匹配模型，对所述第一文本进行语义识别得到第一语义向量，并将所述第一语义向量与预设的待匹配目标物列表中的每个待匹配目标物进行匹配，得到第一匹配结果，所述第一匹配结果用于指示与所述第一文本匹配的至少一个目标物。

12.根据权利要求10所述的方法，其特征在于，在所述播放所述至少一个目标物的音频信息之后，所述方法还包括：

接收用户输入的语音数据；

根据所述语音数据，生成界面切换指令，所述界面切换指令携带有所述至少一个目标物中任一目标物的标识；

响应于所述界面切换指令，根据所述目标物的标识，显示所述目标物的详情界面。

13.根据权利要求12所述的方法，其特征在于，所述根据所述语音数据，生成界面切换指令，包括：

将所述语音数据转化为文本数据；

对所述文本数据进行分词处理，得到分词集合；

针对所述至少一个目标物中的每个目标物，确定分词集合中每个分词与所述目标物的相似度，并将每个分词对应的相似度相加，得到所述文本数据与所述目标物的相似度；

根据最高相似度对应的目标物的标识，生成所述界面切换指令。

14.一种电子设备，其特征在于，包括：

接收单元，用于接收用户在第一文本的显示界面输入的音频播放指令，所述音频播放指令携带有第一语言信息，所述第一语言信息用于指示播放所述第一文本使用的语言；

处理单元，用于根据所述第一语言信息，获取所述第一文本的音频文件；

音频播放单元，用于播放所述第一文本的音频文件。