CN105869447A

CN105869447A - 有声读物的生成方法及装置

Info

Publication number: CN105869447A
Application number: CN201610192366.2A
Authority: CN
Inventors: 吴建国; 刘超华; 张珩; 沈韡; 丁磊; 代红桥
Original assignee: Intelligent Technology (beijing) Co Ltd; LeTV Holding Beijing Co Ltd
Current assignee: Intelligent Technology (beijing) Co Ltd; LeTV Holding Beijing Co Ltd
Priority date: 2016-03-30
Filing date: 2016-03-30
Publication date: 2016-08-17

Abstract

本发明提供的一种有声读物的生成方法及装置，涉及信息处理技术领域，解决了现有有声读物生成效率低及生成灵活性差等问题，本发明的主要技术方案为：获取待生成有声读物的背景图片、读物语音；接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点；根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上；根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。本发明主要用于生成有声读物。

Description

有声读物的生成方法及装置

技术领域

本发明实施例涉及信息处理技术领域，尤其涉及一种有声读物的生成方法及装置。

背景技术

随着知识、信息获取方式的多元化，尤其是在新兴的数字化媒介不断冲击传统的纸质报刊书籍下，社会阅读习惯也在一定程度上发生着改变，有声读物在此场景下应运而生。其中，有声读物即为有声音的书，如有声新闻，有声小说，儿童有声读物等，有声读物与数字化和传统出版都有交叉和区别，具有其独特的优势，通过有声读物可以满足不同用户的阅读需求。

目前，有声读物是通过视频软件做出有声读物的背景视频及字幕，然后为该有声读物录入对应的声音得到的。然而通过视频软件做有声读物的背景视频及字幕需要花费大量的时间及精力，且该有声读物的背景视频及字幕只能应用到该有声读物上，因此现有的有声读物的生成效率低，灵活性较差。

发明内容

本发明实施例提供了一种有声读物的生成方法及装置，用以解决现有技术中有声读物的生成效率低及生成灵活性差的问题。

针对现有技术存在的问题，本发明实施例提供了一种有声读物的生成方法，包括：

获取待生成有声读物的背景图片、读物语音；

接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点；

根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上；

根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。

具体的，所述获取待生成有声读物的背景图片、读物语音包括：

获取待生成有声读物的背景音乐，所述背景音乐和所述读物语音的播放时长相等；

具体的，所述根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物包括：

根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。

进一步地，所述获取待生成有声读物的背景音乐之后，所述方法还包括：

提取所述读物语音中的属性标签，每个属性标签均对应有所述读物语音中的播放时间范围，所述属性标签包括但不仅限于场景属性标签，氛围属性标签，人物属性标签。

进一步地，所述提取所述读物语音中的属性标签之后，所述方法还包括：

若所述属性标签为场景属性标签，则从场景语音库中获取对应的场景背景音；

若所述属性标签为氛围属性标签，则从氛围语音库中获取对应的氛围背景音；

若所述属性标签为人物属性标签，则从人物语音库中获取对应的人物属性。

将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。

将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。

本发明实施例提供了一种有声读物的生成装置，包括：

获取单元，用于获取待生成有声读物的背景图片、读物语音；

接收单元，用于接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点；

调整单元，用于根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上；

生成单元，用于根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。

所述获取单元，还用于获取待生成有声读物的背景音乐，所述背景音乐和所述读物语音的播放时长相等；

所述生成单元，具体用于根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。

进一步地，所述装置还包括：

提取单元，用于提取所述读物语音中的属性标签，每个属性标签均对应有所述读物语音中的播放时间范围，所述属性标签包括但不仅限于场景属性标签，氛围属性标签，人物属性标签。

所述获取单元，还用于若所述属性标签为场景属性标签，则从场景语音库中获取对应的场景背景音；

所述获取单元，还用于若所述属性标签为氛围属性标签，则从氛围语音库中获取对应的氛围背景音；

所述获取单元，还用于若所述属性标签为人物属性标签，则从人物语音库中获取对应的人物属性。

进一步地，所述装置还包括：

替换单元，用于将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。

魔音单元，用于将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。

本发明实施例提供的一种有声读物的生成方法及装置，首先获取待生成有声读物的背景图片、读物语音，然后接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点，再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上，最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和录制的读物语音制作的有声读物相比，本发明实施例当中的有声读物的背景视频是通过多张图片生成的，因此通过本发明实施例可对背景视频进行灵活的获取及配置，从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题，进而提高了有声读物的生成效率，及有声读物生成的灵活性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种有声读物的生成方法流程图；

图2为本发明实施例提供的另一种有声读物的生成方法流程图；

图3为本发明实施例提供的一种有声读物的生成装置结构示意图；

图4为本发明实施例提供的另一种有声读物的生成装置结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种有声读物的生成方法，如图1所示，所述方法包括：

101、获取待生成有声读物的背景图片、读物语音。

其中，所述背景图片可以是拍摄的照片，也可以是从网络当中下载的图片，还可以是通过软件绘制的图片等，本发明实施例不做具体限定。所述读物语音是用户录制的语音，也可以通过网络下载的语音，本发明实施例不做具体限定。

例如，若用户要生成的有声读物为童话故事“小红帽”，则可用通过拍摄“小红帽”连环画的方式得到有声读物的背景图片，至于读物语音则可以通过录制用户读的“小红帽”故事的语音得到。

102、接收调整背景图片显示顺序指令。

其中，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点。在本发明实施例中，待调整背景图片对应的读物时间点是用户进行设置的，用户可以根据其录制的读物语音播放顺序，从背景图片中选择与其播放顺序对应的图片，以此达到生成的有声读物中背景图片和读物语音的匹配。例如，用户录制的“白雪公主”读物语音中的前1-3分钟描述的是白雪公主儿时的样子，4-6分钟讲述的是其继母的到来，7-8分钟讲述的是继母喂白雪公主吃毒苹果，则依据读物语音中故事情节的描述，为1-3分钟分配白雪公主儿时的图片，为4-6分钟分配继母到来的图片，为7-8分钟分配继母喂白雪公主吃毒苹果图片，以此完成读物语音与背景图片的匹配。

103、根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上。

需要说明的是，若未接收到调整背景图片显示顺序指令，则背景图片的显示顺序即为上传背景图片的顺序，且每个的背景图片的显示时长相同。例如，读物语音的时长为10分钟，背景图片为5张，若为调整背景图片的显示顺序即其对应的播放时长，则每个背景图片的显示时长为2分钟，背景图片的显示顺序为上传图片的顺序。

104、根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。

在本发明实施例中，调整后的背景图片可以通过幻灯片的方式进行播放，在播放幻灯片背景图片的同时配置对应的读物语音，以此生成所述有声读物。在本发明实施例中，由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的，因此通过本发明实施例可对背景视频进行灵活的获取及配置，从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题，进而提高了有声读物的生成效率，及有声读物生成的灵活性。

本发明实施例提供的一种有声读物的生成方法，首先获取待生成有声读物的背景图片、读物语音，然后接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点，再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上，最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和录制的读物语音制作的有声读物相比，由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的，因此通过本发明实施例可对背景视频进行灵活的获取及配置，从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题，进而提高了有声读物的生成效率，及有声读物生成的灵活性。

本发明实施例提供了另一种有声读物的生成方法，如图2所示，所述方法包括：

201、获取待生成有声读物的背景图片、读物语音、背景音乐。

其中，所述背景音乐和所述读物语音的播放时长相等，所述背景音乐可以是用户制作的，也可以是网络下载的，还可以是录制的，本发明实施例不做具体限定。需要说明的是，若背景音乐和读物语音的播放时长不想等，则可以通过截取背景音乐的方式，使得背景音乐的时长和读物语音相同。

在本发明实施例中，在步骤201之后，所述方法还包括：提取所述读物语音中的属性标签，每个属性标签均对应有所述读物语音中的播放时间范围，所述属性标签包括但不仅限于场景属性标签，氛围属性标签，人物属性标签。在本发明实施例中，提取读物语音中的属性标签具体的过程可以为：首先识别出读物语音对应的文字和与各个文字分别对应的时间点，然后将读物语音对应的文字和预置属性标签库中的属性标签进行匹配，其中预置属性标签库中的属性标签是根据实际需求进行设定，如场景属性标签，氛围属性标签，人物属性标签等，本发明实施例不做具体限定。若读物语音对应的文字中存在某段文字描述与预置属性标签库中的属性标签匹配，则获取这段文字在读物语音中对应的播放时间段。

例如，对“小红帽”读物语音进行语音识别后，获取到读物语音中前1-5分钟的文字描述大概意思为小红帽走在林间小路上，所处环境微风徐徐鸟语花香，则根据预置属性标签库提取读物语音中1-5分钟的属性标签为场景属性标签，该场景属性标签具体可以为与其语境对应的林间中各种声音的标签；获取到读物语音中6-10分钟的文字描述大概意思为小红帽与假扮奶奶的大灰狼对话，则根据预置属性标签库提取读物语音中6-10分钟为人物属性标签，其中人物属性标签具体为动物标签和小女孩标签。

在本发明实施例中，所述提取所述读物语音中的属性标签之后，所述方法还包括：若所述属性标签为场景属性标签，则从场景语音库中获取对应的场景背景音；若所述属性标签为氛围属性标签，则从氛围语音库中获取对应的氛围背景音；若所述属性标签为人物属性标签，则从人物语音库中获取对应的人物属性。其中，场景语音库、氛围语音库和人物语音库均是预先配置好的，所述场景语音库中包括各种类型的场景背景音，如雨天场景、比赛场景、夏天场景等；所述氛围语音库中包括各种类型的氛围背景音，如欢快的背景音、哀伤的背景音、阴森的背景音等；所述人物语音库中包括各种类型的人物，如儿童的声音，老人的声音，女人的声音，动物的声音等，本发明实施例不做具体限定。

对于本发明实施例，在各类语音库中获取对应的语音之后，所述方法还包括：将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。在本发明实施例中，将读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性，可以增加有声读物阅读的生动性及趣味性。如在可将“小红帽”读物语音中，小红帽的对话魔音成小女孩的声音，大灰狼的对话魔音成包含狼特性的声音。

202、接收调整背景图片显示顺序指令。

其中，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点。在本发明实施例中，待调整背景图片对应的读物时间点是用户进行设置的，用户可以根据其录制的读物语音播放顺序，从背景图片中选择与其播放顺序对应的图片，以此达到生成的有声读物中背景图片和读物语音的匹配。

203、根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上。

需要说明的是，若未接收到调整背景图片显示顺序指令，则背景图片的显示顺序即为上传背景图片的顺序，且每个的背景图片的显示时长相同。例如，读物语音的时长为20分钟，背景图片为10张，若为调整背景图片的显示顺序即其对应的播放时长，则每个背景图片的显示时长为2分钟，背景图片的显示顺序为上传图片的顺序。

204、根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。

对于本发明实施例，根据读物语音中的故事情节，将获取的场景背景音和氛围背景音对应***到背景音乐中，另外还将读物语音中包含人物特性的对话魔音成相应的人物，从而通过本发明实施例生成的有声读物可增加阅读的趣味性及生动性。

本发明实施例提供的另一种有声读物的生成方法，首先获取待生成有声读物的背景图片、读物语音，然后接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点，再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上，最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和录制的读物语音制作的有声读物相比，由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的，因此通过本发明实施例可对背景视频进行灵活的获取及配置，从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题，进而提高了有声读物的生成效率，及有声读物生成的灵活性。

进一步地，作为图1所述方法的具体实现，本发明实施例提供了一种有声读物的生成装置，如图3所示，所述装置包括：获取单元31、接收单元32、调整单元33、生成单元34。

获取单元31，用于获取待生成有声读物的背景图片、读物语音；其中，所述背景图片可以是拍摄的照片，也可以是从网络当中下载的图片，还可以是通过软件绘制的图片等，本发明实施例不做具体限定。所述读物语音是用户录制的语音，也可以通过网络下载的语音，本发明实施例不做具体限定。

接收单元32，用于接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点；在本发明实施例中，待调整背景图片对应的读物时间点是用户进行设置的，用户可以根据其录制的读物语音播放顺序，从背景图片中选择与其播放顺序对应的图片，以此达到生成的有声读物中背景图片和读物语音的匹配。

调整单元33，用于根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上；需要说明的是，若未接收到调整背景图片显示顺序指令，则背景图片的显示顺序即为上传背景图片的顺序，且每个的背景图片的显示时长相同

生成单元34，用于根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。在本发明实施例中，调整后的背景图片可以通过幻灯片的方式进行播放，在播放幻灯片背景图片的同时配置对应的读物语音，以此生成所述有声读物。在本发明实施例中，由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的，因此通过本发明实施例可对背景视频进行灵活的获取及配置，从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题，进而提高了有声读物的生成效率，及有声读物生成的灵活性。

需要说明的是，本发明实施例提供的一种有声读物的生成装置所涉及各功能单元的其他相应描述，可以参考图1中的对应描述，在此不再赘述。本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。

本发明实施例提供的一种有声读物的生成装置，首先获取待生成有声读物的背景图片、读物语音，然后接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点，再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上，最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和读物语音制作的有声读物相比，由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的，因此通过本发明实施例可对背景视频进行灵活的获取及配置，从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题，进而提高了有声读物的生成效率，及有声读物生成的灵活性。

进一步地，作为图2所述方法的具体实现，本发明实施例提供了另一种有声读物的生成装置，如图4所示，所述装置包括：获取单元41、接收单元42、调整单元43、生成单元44。

获取单元41，用于获取待生成有声读物的背景图片、读物语音；其中，所述背景图片可以是拍摄的照片，也可以是从网络当中下载的图片，还可以是通过软件绘制的图片等，本发明实施例不做具体限定。所述读物语音是用户录制的语音，也可以通过网络下载的语音，本发明实施例不做具体限定。

接收单元42，用于接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点；在本发明实施例中，待调整背景图片对应的读物时间点是用户进行设置的，用户可以根据其录制的读物语音播放顺序，从背景图片中选择与其播放顺序对应的图片，以此达到生成的有声读物中背景图片和读物语音的匹配。

调整单元43，用于根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上；需要说明的是，若未接收到调整背景图片显示顺序指令，则背景图片的显示顺序即为上传背景图片的顺序，且每个的背景图片的显示时长相同

生成单元44，用于根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。在本发明实施例中，调整后的背景图片可以通过幻灯片的方式进行播放，在播放幻灯片背景图片的同时配置对应的读物语音，以此生成所述有声读物。在本发明实施例中，由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的，因此通过本发明实施例可对背景视频进行灵活的获取及配置，从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题，进而提高了有声读物的生成效率，及有声读物生成的灵活性。

所述获取单元41，还用于获取待生成有声读物的背景音乐，所述背景音乐和所述读物语音的播放时长相等；所述背景音乐可以是用户制作的，也可以是网络下载的，还可以是录制的，本发明实施例不做具体限定。需要说明的是，若背景音乐和读物语音的播放时长不想等，则可以通过截取背景音乐的方式，使得背景音乐的时长和读物语音相同。

所述生成单元44，具体用于根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。

进一步地，所述装置还包括：

提取单元45，用于提取所述读物语音中的属性标签，每个属性标签均对应有所述读物语音中的播放时间范围，所述属性标签包括但不仅限于场景属性标签，氛围属性标签，人物属性标签。在本发明实施例中，提取读物语音中的属性标签具体的过程可以为：首先识别出读物语音对应的文字和与各个文字分别对应的时间点，然后将读物语音对应的文字和预置属性标签库中的属性标签进行匹配，其中预置属性标签库中的属性标签是根据实际需求进行设定，如场景属性标签，氛围属性标签，人物属性标签等，本发明实施例不做具体限定。若读物语音对应的文字中存在某段文字描述与预置属性标签库中的属性标签匹配，则获取这段文字在读物语音中对应的播放时间段。

所述获取单元41，还用于若所述属性标签为场景属性标签，则从场景语音库中获取对应的场景背景音；

所述获取单元41，还用于若所述属性标签为氛围属性标签，则从氛围语音库中获取对应的氛围背景音；

所述获取单元41，还用于若所述属性标签为人物属性标签，则从人物语音库中获取对应的人物属性。其中，场景语音库、氛围语音库和人物语音库均是预先配置好的，所述场景语音库中包括各种类型的场景背景音，如雨天场景、比赛场景、夏天场景等；所述氛围语音库中包括各种类型的氛围背景音，如欢快的背景音、哀伤的背景音、阴森的背景音等；所述人物语音库中包括各种类型的人物，如儿童的声音，老人的声音，女人的声音，动物的声音等，本发明实施例不做具体限定。

进一步地，所述装置还包括：

替换单元46，用于将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。

魔音单元47，用于将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。在本发明实施例中，将读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性，可以增加有声读物阅读的生动性及趣味性。

需要说明的是，本发明实施例提供的另一种有声读物的生成装置所涉及各功能单元的其他相应描述，可以参考图2中的对应描述，在此不再赘述。本发明实施例中可以通过硬件处理器来实现相关功能模块。

本发明实施例提供的另一种有声读物的生成装置，首先获取待生成有声读物的背景图片、读物语音，然后接收调整背景图片显示顺序指令，所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点，再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上，最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和录制的读物语音制作的有声读物相比，由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的，因此通过本发明实施例可对背景视频进行灵活的获取及配置，从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题，进而提高了有声读物的生成效率，及有声读物生成的灵活性。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种有声读物的生成方法，其特征在于，包括：

获取待生成有声读物的背景图片、读物语音；

2.根据权利要求1所述的方法，其特征在于，所述获取待生成有声读物的背景图片、读物语音包括：

所述根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物包括：

3.根据权利要求2所述的方法，其特征在于，所述获取待生成有声读物的背景音乐之后，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述提取所述读物语音中的属性标签之后，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述获取待生成有声读物的背景音乐之后，所述方法还包括：

6.根据权利要求4所述的方法，其特征在于，所述方法还包括：

7.一种有声读物的生成装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

10.根据权利要求9所述的装置，其特征在于，

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

12.根据权利要求10所述的装置，其特征在于，所述装置还包括：