CN105869447A - 有声读物的生成方法及装置 - Google Patents

有声读物的生成方法及装置 Download PDF

Info

Publication number
CN105869447A
CN105869447A CN201610192366.2A CN201610192366A CN105869447A CN 105869447 A CN105869447 A CN 105869447A CN 201610192366 A CN201610192366 A CN 201610192366A CN 105869447 A CN105869447 A CN 105869447A
Authority
CN
China
Prior art keywords
background
reading matter
voice
sound
talking book
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610192366.2A
Other languages
English (en)
Inventor
吴建国
刘超华
张珩
沈韡
丁磊
代红桥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intelligent Technology (beijing) Co Ltd
LeTV Holding Beijing Co Ltd
Original Assignee
Intelligent Technology (beijing) Co Ltd
LeTV Holding Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intelligent Technology (beijing) Co Ltd, LeTV Holding Beijing Co Ltd filed Critical Intelligent Technology (beijing) Co Ltd
Priority to CN201610192366.2A priority Critical patent/CN105869447A/zh
Publication of CN105869447A publication Critical patent/CN105869447A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/062Combinations of audio and printed presentations, e.g. magnetically striped cards, talking books, magnetic tapes with printed texts thereon

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明提供的一种有声读物的生成方法及装置,涉及信息处理技术领域,解决了现有有声读物生成效率低及生成灵活性差等问题,本发明的主要技术方案为:获取待生成有声读物的背景图片、读物语音;接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点;根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上;根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。本发明主要用于生成有声读物。

Description

有声读物的生成方法及装置
技术领域
本发明实施例涉及信息处理技术领域,尤其涉及一种有声读物的生成方法及装置。
背景技术
随着知识、信息获取方式的多元化,尤其是在新兴的数字化媒介不断冲击传统的纸质报刊书籍下,社会阅读习惯也在一定程度上发生着改变,有声读物在此场景下应运而生。其中,有声读物即为有声音的书,如有声新闻,有声小说,儿童有声读物等,有声读物与数字化和传统出版都有交叉和区别,具有其独特的优势,通过有声读物可以满足不同用户的阅读需求。
目前,有声读物是通过视频软件做出有声读物的背景视频及字幕,然后为该有声读物录入对应的声音得到的。然而通过视频软件做有声读物的背景视频及字幕需要花费大量的时间及精力,且该有声读物的背景视频及字幕只能应用到该有声读物上,因此现有的有声读物的生成效率低,灵活性较差。
发明内容
本发明实施例提供了一种有声读物的生成方法及装置,用以解决现有技术中有声读物的生成效率低及生成灵活性差的问题。
针对现有技术存在的问题,本发明实施例提供了一种有声读物的生成方法,包括:
获取待生成有声读物的背景图片、读物语音;
接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点;
根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上;
根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。
具体的,所述获取待生成有声读物的背景图片、读物语音包括:
获取待生成有声读物的背景音乐,所述背景音乐和所述读物语音的播放时长相等;
具体的,所述根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物包括:
根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。
进一步地,所述获取待生成有声读物的背景音乐之后,所述方法还包括:
提取所述读物语音中的属性标签,每个属性标签均对应有所述读物语音中的播放时间范围,所述属性标签包括但不仅限于场景属性标签,氛围属性标签,人物属性标签。
进一步地,所述提取所述读物语音中的属性标签之后,所述方法还包括:
若所述属性标签为场景属性标签,则从场景语音库中获取对应的场景背景音;
若所述属性标签为氛围属性标签,则从氛围语音库中获取对应的氛围背景音;
若所述属性标签为人物属性标签,则从人物语音库中获取对应的人物属性。
进一步地,所述获取待生成有声读物的背景音乐之后,所述方法还包括:
将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。
将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。
本发明实施例提供了一种有声读物的生成装置,包括:
获取单元,用于获取待生成有声读物的背景图片、读物语音;
接收单元,用于接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点;
调整单元,用于根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上;
生成单元,用于根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。
所述获取单元,还用于获取待生成有声读物的背景音乐,所述背景音乐和所述读物语音的播放时长相等;
所述生成单元,具体用于根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。
进一步地,所述装置还包括:
提取单元,用于提取所述读物语音中的属性标签,每个属性标签均对应有所述读物语音中的播放时间范围,所述属性标签包括但不仅限于场景属性标签,氛围属性标签,人物属性标签。
所述获取单元,还用于若所述属性标签为场景属性标签,则从场景语音库中获取对应的场景背景音;
所述获取单元,还用于若所述属性标签为氛围属性标签,则从氛围语音库中获取对应的氛围背景音;
所述获取单元,还用于若所述属性标签为人物属性标签,则从人物语音库中获取对应的人物属性。
进一步地,所述装置还包括:
替换单元,用于将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。
魔音单元,用于将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。
本发明实施例提供的一种有声读物的生成方法及装置,首先获取待生成有声读物的背景图片、读物语音,然后接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点,再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上,最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和录制的读物语音制作的有声读物相比,本发明实施例当中的有声读物的背景视频是通过多张图片生成的,因此通过本发明实施例可对背景视频进行灵活的获取及配置,从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题,进而提高了有声读物的生成效率,及有声读物生成的灵活性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种有声读物的生成方法流程图;
图2为本发明实施例提供的另一种有声读物的生成方法流程图;
图3为本发明实施例提供的一种有声读物的生成装置结构示意图;
图4为本发明实施例提供的另一种有声读物的生成装置结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种有声读物的生成方法,如图1所示,所述方法包括:
101、获取待生成有声读物的背景图片、读物语音。
其中,所述背景图片可以是拍摄的照片,也可以是从网络当中下载的图片,还可以是通过软件绘制的图片等,本发明实施例不做具体限定。所述读物语音是用户录制的语音,也可以通过网络下载的语音,本发明实施例不做具体限定。
例如,若用户要生成的有声读物为童话故事“小红帽”,则可用通过拍摄“小红帽”连环画的方式得到有声读物的背景图片,至于读物语音则可以通过录制用户读的“小红帽”故事的语音得到。
102、接收调整背景图片显示顺序指令。
其中,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点。在本发明实施例中,待调整背景图片对应的读物时间点是用户进行设置的,用户可以根据其录制的读物语音播放顺序,从背景图片中选择与其播放顺序对应的图片,以此达到生成的有声读物中背景图片和读物语音的匹配。例如,用户录制的“白雪公主”读物语音中的前1-3分钟描述的是白雪公主儿时的样子,4-6分钟讲述的是其继母的到来,7-8分钟讲述的是继母喂白雪公主吃毒苹果,则依据读物语音中故事情节的描述,为1-3分钟分配白雪公主儿时的图片,为4-6分钟分配继母到来的图片,为7-8分钟分配继母喂白雪公主吃毒苹果图片,以此完成读物语音与背景图片的匹配。
103、根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上。
需要说明的是,若未接收到调整背景图片显示顺序指令,则背景图片的显示顺序即为上传背景图片的顺序,且每个的背景图片的显示时长相同。例如,读物语音的时长为10分钟,背景图片为5张,若为调整背景图片的显示顺序即其对应的播放时长,则每个背景图片的显示时长为2分钟,背景图片的显示顺序为上传图片的顺序。
104、根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。
在本发明实施例中,调整后的背景图片可以通过幻灯片的方式进行播放,在播放幻灯片背景图片的同时配置对应的读物语音,以此生成所述有声读物。在本发明实施例中,由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的,因此通过本发明实施例可对背景视频进行灵活的获取及配置,从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题,进而提高了有声读物的生成效率,及有声读物生成的灵活性。
本发明实施例提供的一种有声读物的生成方法,首先获取待生成有声读物的背景图片、读物语音,然后接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点,再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上,最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和录制的读物语音制作的有声读物相比,由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的,因此通过本发明实施例可对背景视频进行灵活的获取及配置,从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题,进而提高了有声读物的生成效率,及有声读物生成的灵活性。
本发明实施例提供了另一种有声读物的生成方法,如图2所示,所述方法包括:
201、获取待生成有声读物的背景图片、读物语音、背景音乐。
其中,所述背景音乐和所述读物语音的播放时长相等,所述背景音乐可以是用户制作的,也可以是网络下载的,还可以是录制的,本发明实施例不做具体限定。需要说明的是,若背景音乐和读物语音的播放时长不想等,则可以通过截取背景音乐的方式,使得背景音乐的时长和读物语音相同。
在本发明实施例中,在步骤201之后,所述方法还包括:提取所述读物语音中的属性标签,每个属性标签均对应有所述读物语音中的播放时间范围,所述属性标签包括但不仅限于场景属性标签,氛围属性标签,人物属性标签。在本发明实施例中,提取读物语音中的属性标签具体的过程可以为:首先识别出读物语音对应的文字和与各个文字分别对应的时间点,然后将读物语音对应的文字和预置属性标签库中的属性标签进行匹配,其中预置属性标签库中的属性标签是根据实际需求进行设定,如场景属性标签,氛围属性标签,人物属性标签等,本发明实施例不做具体限定。若读物语音对应的文字中存在某段文字描述与预置属性标签库中的属性标签匹配,则获取这段文字在读物语音中对应的播放时间段。
例如,对“小红帽”读物语音进行语音识别后,获取到读物语音中前1-5分钟的文字描述大概意思为小红帽走在林间小路上,所处环境微风徐徐鸟语花香,则根据预置属性标签库提取读物语音中1-5分钟的属性标签为场景属性标签,该场景属性标签具体可以为与其语境对应的林间中各种声音的标签;获取到读物语音中6-10分钟的文字描述大概意思为小红帽与假扮奶奶的大灰狼对话,则根据预置属性标签库提取读物语音中6-10分钟为人物属性标签,其中人物属性标签具体为动物标签和小女孩标签。
在本发明实施例中,所述提取所述读物语音中的属性标签之后,所述方法还包括:若所述属性标签为场景属性标签,则从场景语音库中获取对应的场景背景音;若所述属性标签为氛围属性标签,则从氛围语音库中获取对应的氛围背景音;若所述属性标签为人物属性标签,则从人物语音库中获取对应的人物属性。其中,场景语音库、氛围语音库和人物语音库均是预先配置好的,所述场景语音库中包括各种类型的场景背景音,如雨天场景、比赛场景、夏天场景等;所述氛围语音库中包括各种类型的氛围背景音,如欢快的背景音、哀伤的背景音、阴森的背景音等;所述人物语音库中包括各种类型的人物,如儿童的声音,老人的声音,女人的声音,动物的声音等,本发明实施例不做具体限定。
对于本发明实施例,在各类语音库中获取对应的语音之后,所述方法还包括:将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。在本发明实施例中,将读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性,可以增加有声读物阅读的生动性及趣味性。如在可将“小红帽”读物语音中,小红帽的对话魔音成小女孩的声音,大灰狼的对话魔音成包含狼特性的声音。
202、接收调整背景图片显示顺序指令。
其中,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点。在本发明实施例中,待调整背景图片对应的读物时间点是用户进行设置的,用户可以根据其录制的读物语音播放顺序,从背景图片中选择与其播放顺序对应的图片,以此达到生成的有声读物中背景图片和读物语音的匹配。
203、根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上。
需要说明的是,若未接收到调整背景图片显示顺序指令,则背景图片的显示顺序即为上传背景图片的顺序,且每个的背景图片的显示时长相同。例如,读物语音的时长为20分钟,背景图片为10张,若为调整背景图片的显示顺序即其对应的播放时长,则每个背景图片的显示时长为2分钟,背景图片的显示顺序为上传图片的顺序。
204、根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。
在本发明实施例中,调整后的背景图片可以通过幻灯片的方式进行播放,在播放幻灯片背景图片的同时配置对应的读物语音,以此生成所述有声读物。在本发明实施例中,由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的,因此通过本发明实施例可对背景视频进行灵活的获取及配置,从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题,进而提高了有声读物的生成效率,及有声读物生成的灵活性。
对于本发明实施例,根据读物语音中的故事情节,将获取的场景背景音和氛围背景音对应***到背景音乐中,另外还将读物语音中包含人物特性的对话魔音成相应的人物,从而通过本发明实施例生成的有声读物可增加阅读的趣味性及生动性。
本发明实施例提供的另一种有声读物的生成方法,首先获取待生成有声读物的背景图片、读物语音,然后接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点,再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上,最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和录制的读物语音制作的有声读物相比,由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的,因此通过本发明实施例可对背景视频进行灵活的获取及配置,从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题,进而提高了有声读物的生成效率,及有声读物生成的灵活性。
进一步地,作为图1所述方法的具体实现,本发明实施例提供了一种有声读物的生成装置,如图3所示,所述装置包括:获取单元31、接收单元32、调整单元33、生成单元34。
获取单元31,用于获取待生成有声读物的背景图片、读物语音;其中,所述背景图片可以是拍摄的照片,也可以是从网络当中下载的图片,还可以是通过软件绘制的图片等,本发明实施例不做具体限定。所述读物语音是用户录制的语音,也可以通过网络下载的语音,本发明实施例不做具体限定。
接收单元32,用于接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点;在本发明实施例中,待调整背景图片对应的读物时间点是用户进行设置的,用户可以根据其录制的读物语音播放顺序,从背景图片中选择与其播放顺序对应的图片,以此达到生成的有声读物中背景图片和读物语音的匹配。
调整单元33,用于根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上;需要说明的是,若未接收到调整背景图片显示顺序指令,则背景图片的显示顺序即为上传背景图片的顺序,且每个的背景图片的显示时长相同
生成单元34,用于根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。在本发明实施例中,调整后的背景图片可以通过幻灯片的方式进行播放,在播放幻灯片背景图片的同时配置对应的读物语音,以此生成所述有声读物。在本发明实施例中,由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的,因此通过本发明实施例可对背景视频进行灵活的获取及配置,从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题,进而提高了有声读物的生成效率,及有声读物生成的灵活性。
需要说明的是,本发明实施例提供的一种有声读物的生成装置所涉及各功能单元的其他相应描述,可以参考图1中的对应描述,在此不再赘述。本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
本发明实施例提供的一种有声读物的生成装置,首先获取待生成有声读物的背景图片、读物语音,然后接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点,再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上,最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和读物语音制作的有声读物相比,由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的,因此通过本发明实施例可对背景视频进行灵活的获取及配置,从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题,进而提高了有声读物的生成效率,及有声读物生成的灵活性。
进一步地,作为图2所述方法的具体实现,本发明实施例提供了另一种有声读物的生成装置,如图4所示,所述装置包括:获取单元41、接收单元42、调整单元43、生成单元44。
获取单元41,用于获取待生成有声读物的背景图片、读物语音;其中,所述背景图片可以是拍摄的照片,也可以是从网络当中下载的图片,还可以是通过软件绘制的图片等,本发明实施例不做具体限定。所述读物语音是用户录制的语音,也可以通过网络下载的语音,本发明实施例不做具体限定。
接收单元42,用于接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点;在本发明实施例中,待调整背景图片对应的读物时间点是用户进行设置的,用户可以根据其录制的读物语音播放顺序,从背景图片中选择与其播放顺序对应的图片,以此达到生成的有声读物中背景图片和读物语音的匹配。
调整单元43,用于根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上;需要说明的是,若未接收到调整背景图片显示顺序指令,则背景图片的显示顺序即为上传背景图片的顺序,且每个的背景图片的显示时长相同
生成单元44,用于根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。在本发明实施例中,调整后的背景图片可以通过幻灯片的方式进行播放,在播放幻灯片背景图片的同时配置对应的读物语音,以此生成所述有声读物。在本发明实施例中,由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的,因此通过本发明实施例可对背景视频进行灵活的获取及配置,从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题,进而提高了有声读物的生成效率,及有声读物生成的灵活性。
所述获取单元41,还用于获取待生成有声读物的背景音乐,所述背景音乐和所述读物语音的播放时长相等;所述背景音乐可以是用户制作的,也可以是网络下载的,还可以是录制的,本发明实施例不做具体限定。需要说明的是,若背景音乐和读物语音的播放时长不想等,则可以通过截取背景音乐的方式,使得背景音乐的时长和读物语音相同。
所述生成单元44,具体用于根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。
进一步地,所述装置还包括:
提取单元45,用于提取所述读物语音中的属性标签,每个属性标签均对应有所述读物语音中的播放时间范围,所述属性标签包括但不仅限于场景属性标签,氛围属性标签,人物属性标签。在本发明实施例中,提取读物语音中的属性标签具体的过程可以为:首先识别出读物语音对应的文字和与各个文字分别对应的时间点,然后将读物语音对应的文字和预置属性标签库中的属性标签进行匹配,其中预置属性标签库中的属性标签是根据实际需求进行设定,如场景属性标签,氛围属性标签,人物属性标签等,本发明实施例不做具体限定。若读物语音对应的文字中存在某段文字描述与预置属性标签库中的属性标签匹配,则获取这段文字在读物语音中对应的播放时间段。
所述获取单元41,还用于若所述属性标签为场景属性标签,则从场景语音库中获取对应的场景背景音;
所述获取单元41,还用于若所述属性标签为氛围属性标签,则从氛围语音库中获取对应的氛围背景音;
所述获取单元41,还用于若所述属性标签为人物属性标签,则从人物语音库中获取对应的人物属性。其中,场景语音库、氛围语音库和人物语音库均是预先配置好的,所述场景语音库中包括各种类型的场景背景音,如雨天场景、比赛场景、夏天场景等;所述氛围语音库中包括各种类型的氛围背景音,如欢快的背景音、哀伤的背景音、阴森的背景音等;所述人物语音库中包括各种类型的人物,如儿童的声音,老人的声音,女人的声音,动物的声音等,本发明实施例不做具体限定。
进一步地,所述装置还包括:
替换单元46,用于将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。
魔音单元47,用于将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。在本发明实施例中,将读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性,可以增加有声读物阅读的生动性及趣味性。
需要说明的是,本发明实施例提供的另一种有声读物的生成装置所涉及各功能单元的其他相应描述,可以参考图2中的对应描述,在此不再赘述。本发明实施例中可以通过硬件处理器来实现相关功能模块。
本发明实施例提供的另一种有声读物的生成装置,首先获取待生成有声读物的背景图片、读物语音,然后接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点,再根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上,最后根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。与目前通过视频软件做出有声读物的背景视频和录制的读物语音制作的有声读物相比,由于本发明实施例当中的有声读物的背景视频是通过多张图片生成的,因此通过本发明实施例可对背景视频进行灵活的获取及配置,从而通过本发明实施例解决了现有技术中制作有声读物背景视频困难的问题,进而提高了有声读物的生成效率,及有声读物生成的灵活性。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种有声读物的生成方法,其特征在于,包括:
获取待生成有声读物的背景图片、读物语音;
接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点;
根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上;
根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。
2.根据权利要求1所述的方法,其特征在于,所述获取待生成有声读物的背景图片、读物语音包括:
获取待生成有声读物的背景音乐,所述背景音乐和所述读物语音的播放时长相等;
所述根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物包括:
根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。
3.根据权利要求2所述的方法,其特征在于,所述获取待生成有声读物的背景音乐之后,所述方法还包括:
提取所述读物语音中的属性标签,每个属性标签均对应有所述读物语音中的播放时间范围,所述属性标签包括但不仅限于场景属性标签,氛围属性标签,人物属性标签。
4.根据权利要求3所述的方法,其特征在于,所述提取所述读物语音中的属性标签之后,所述方法还包括:
若所述属性标签为场景属性标签,则从场景语音库中获取对应的场景背景音;
若所述属性标签为氛围属性标签,则从氛围语音库中获取对应的氛围背景音;
若所述属性标签为人物属性标签,则从人物语音库中获取对应的人物属性。
5.根据权利要求4所述的方法,其特征在于,所述获取待生成有声读物的背景音乐之后,所述方法还包括:
将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。
7.一种有声读物的生成装置,其特征在于,包括:
获取单元,用于获取待生成有声读物的背景图片、读物语音;
接收单元,用于接收调整背景图片显示顺序指令,所述指令中包括待调整背景图片和与所述待调整背景图片对应的读物语音时间点;
调整单元,用于根据所述指令将所述待调整背景图片的顺序调整到对应的读物语音时间点上;
生成单元,用于根据所述调整后的背景图片顺序和所述读物语音生成所述有声读物。
8.根据权利要求7所述的装置,其特征在于,
所述获取单元,还用于获取待生成有声读物的背景音乐,所述背景音乐和所述读物语音的播放时长相等;
所述生成单元,具体用于根据所述调整后的背景图片顺序、所述背景音乐和所述读物语音生成所述有声读物。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
提取单元,用于提取所述读物语音中的属性标签,每个属性标签均对应有所述读物语音中的播放时间范围,所述属性标签包括但不仅限于场景属性标签,氛围属性标签,人物属性标签。
10.根据权利要求9所述的装置,其特征在于,
所述获取单元,还用于若所述属性标签为场景属性标签,则从场景语音库中获取对应的场景背景音;
所述获取单元,还用于若所述属性标签为氛围属性标签,则从氛围语音库中获取对应的氛围背景音;
所述获取单元,还用于若所述属性标签为人物属性标签,则从人物语音库中获取对应的人物属性。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
替换单元,用于将所述背景音乐中与所述播放时间范围对应的背景音替换成对应的场景背景音或氛围背景音。
12.根据权利要求10所述的装置,其特征在于,所述装置还包括:
魔音单元,用于将所述读物语音中与所述播放时间范围对应的语音魔音成对应的人物属性。
CN201610192366.2A 2016-03-30 2016-03-30 有声读物的生成方法及装置 Pending CN105869447A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610192366.2A CN105869447A (zh) 2016-03-30 2016-03-30 有声读物的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610192366.2A CN105869447A (zh) 2016-03-30 2016-03-30 有声读物的生成方法及装置

Publications (1)

Publication Number Publication Date
CN105869447A true CN105869447A (zh) 2016-08-17

Family

ID=56626604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610192366.2A Pending CN105869447A (zh) 2016-03-30 2016-03-30 有声读物的生成方法及装置

Country Status (1)

Country Link
CN (1) CN105869447A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844679A (zh) * 2017-01-24 2017-06-13 广州朗锐数字传媒科技有限公司 一种有声书插图展示***及方法
CN109036388A (zh) * 2018-07-25 2018-12-18 李智彤 一种基于对话设备的智能语音交互方法
CN111968424A (zh) * 2020-08-27 2020-11-20 北京大米科技有限公司 交互式学习方法、装置、***及计算机存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177611A (zh) * 2011-12-23 2013-06-26 李云峰 一种在电纸书上实现多媒体课件的方法
CN104021152A (zh) * 2014-05-19 2014-09-03 广州酷狗计算机科技有限公司 基于音频文件播放的图片显示方法和装置
CN104144280A (zh) * 2013-05-08 2014-11-12 上海恺达广告有限公司 电子贺卡的语音动作动画同步控制及装置
CN104952471A (zh) * 2015-06-16 2015-09-30 深圳新创客电子科技有限公司 一种媒体文件合成方法、装置和设备
CN105096932A (zh) * 2015-07-14 2015-11-25 百度在线网络技术(北京)有限公司 有声读物的语音合成方法和装置
CN105205844A (zh) * 2015-08-27 2015-12-30 林彬 互动式电子动画书的制作方法、装置及移动终端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177611A (zh) * 2011-12-23 2013-06-26 李云峰 一种在电纸书上实现多媒体课件的方法
CN104144280A (zh) * 2013-05-08 2014-11-12 上海恺达广告有限公司 电子贺卡的语音动作动画同步控制及装置
CN104021152A (zh) * 2014-05-19 2014-09-03 广州酷狗计算机科技有限公司 基于音频文件播放的图片显示方法和装置
CN104952471A (zh) * 2015-06-16 2015-09-30 深圳新创客电子科技有限公司 一种媒体文件合成方法、装置和设备
CN105096932A (zh) * 2015-07-14 2015-11-25 百度在线网络技术(北京)有限公司 有声读物的语音合成方法和装置
CN105205844A (zh) * 2015-08-27 2015-12-30 林彬 互动式电子动画书的制作方法、装置及移动终端

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844679A (zh) * 2017-01-24 2017-06-13 广州朗锐数字传媒科技有限公司 一种有声书插图展示***及方法
CN106844679B (zh) * 2017-01-24 2021-01-22 广州朗锐数字传媒科技有限公司 一种有声书插图展示***及方法
CN109036388A (zh) * 2018-07-25 2018-12-18 李智彤 一种基于对话设备的智能语音交互方法
CN111968424A (zh) * 2020-08-27 2020-11-20 北京大米科技有限公司 交互式学习方法、装置、***及计算机存储介质

Similar Documents

Publication Publication Date Title
CN111741326B (zh) 视频合成方法、装置、设备及存储介质
CN108108996B (zh) 视频中的广告投放方法、装置、计算机设备及可读介质
CN109691124B (zh) 用于自动生成视频亮点的方法和***
CN109754783B (zh) 用于确定音频语句的边界的方法和装置
CN105096932A (zh) 有声读物的语音合成方法和装置
CN108536655A (zh) 一种基于手持智能终端的场景化朗读音频制作方法及***
CN109147800A (zh) 应答方法和装置
CN106851401A (zh) 一种自动添加字幕的方法及***
JP2019211747A (ja) 音声接続合成の処理方法及び装置、コンピュータ設備及び読取り可能な媒体
CN108256835A (zh) 电子红包的实现方法、装置及服务器
US20170177175A1 (en) System and method for editing and generating multimedia contents according to digital playbooks
CN105869447A (zh) 有声读物的生成方法及装置
CN109979430A (zh) 一种机器人讲故事的方法、装置、机器人及存储介质
CN109496295A (zh) 多媒体内容生成方法、装置和设备/终端/服务器
Stenport Lukas Moodysson’s Show me love
CN103544978A (zh) 一种多媒体文件制作、播放方法及智能终端
Grothaus Trust No One: Inside the World of Deepfakes
Tohline A supercut of supercuts: aesthetics, histories, databases
CN104036227A (zh) 一种生成电子乐谱的方法和移动终端
CN110797001A (zh) 电子书语音音频的生成方法、装置及可读存储介质
CN108040289A (zh) 一种视频播放的方法及装置
CN109587543B (zh) 音频同步方法和装置及存储介质
CN107680598A (zh) 基于好友声纹通讯录的信息交互方法、装置及其设备
CN111221987A (zh) 混合音频标记方法和装置
US20180330167A1 (en) Personalized Augmented Reality

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160817

WD01 Invention patent application deemed withdrawn after publication