CN103514614A - 生成图像的方法及电子设备 - Google Patents
生成图像的方法及电子设备 Download PDFInfo
- Publication number
- CN103514614A CN103514614A CN201210226805.9A CN201210226805A CN103514614A CN 103514614 A CN103514614 A CN 103514614A CN 201210226805 A CN201210226805 A CN 201210226805A CN 103514614 A CN103514614 A CN 103514614A
- Authority
- CN
- China
- Prior art keywords
- object information
- descriptor
- information
- image
- view data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种生成图像的方法及电子设备,所述生成图像的方法通过输入单元接收用户的输入操作,并生成相应的描述信息,解析所述描述信息得到其中的对象信息,获取对象信息对应的图像数据,依据所述图像数据生成图像,并展示给用户,实现了语言信息直接生成多媒体类型图像的过程,使得听众或读者能够更直观地看到所述语言信息所描述的场景。而且,本申请提供的所述生成图像的方法及电子设备可以直接依据用户输入的描述信息生成可视化的图像等场景画面,使用便捷。
Description
技术领域
本申请涉及电子设备技术领域,特别是涉及生成图像的方法及电子设备。
背景技术
很多情况用户需要描述一个特定场景,比如讲故事、小说或陈述一件事情的时候,通常用户使用语音或文字来描述场景,而听众或读者需要机遇自身的认知和想象在大脑中虚构出相应的场景,这对于听众和读者不够直观,也不适合于认知经验较差的幼儿或有认知功能障碍的人。因此,更加直观地使用图像或视频等可视化内容构建一个特定场景成为迫切的需求。
发明内容
为解决上述技术问题,本申请实施例提供一种生成图像的方法及电子设备,以实现通过图像或视频等可视化内容构建一个特定可视化场景,技术方案如下:
本申请提供一种生成图像的方法,应用于电子设备,所述电子设备具备一显示单元和一输入单元,所述方法包括:
接收操作者通过输入单元输入的用于生成图像的描述信息;
解析所述描述信息,得到所述描述信息中的对象信息;
依据所述对象信息,获取所述对象信息对应的图像数据;
依据所述图像数据生成图像;
通过所述显示单元显示所述图像。
优选的,所述解析所述描述信息,得到所述描述信息中的对象信息具体为:解析所述描述信息获得至少两个对象信息。
优选的,依据所述图像数据生成图像具体包括:
获得所述至少两个对象信息之间的逻辑关系信息,所述逻辑关系信息至少包括:所述至少两个对象信息的显示位置、显示比例和/或所述至少两个对象信息的逻辑位置关系;
依据所述对象信息对应的图像数据以及所述逻辑关系信息生成图像。
优选的,所述获得至少两个对象信息之间的逻辑关系信息具体为:
依据所述至少两个对象信息获得所述至少两个对象信息对应的对象参数;
比较所述至少两个对象信息对应的对象参数,获得所述至少两个对象信息的逻辑关系信息。
优选的,所述获得至少两个对象信息之间的逻辑关系信息具体为:
搜索获得包含所述至少两个对象信息对应的图像数据,所述图像数据具有所述至少两个对象信息之间的逻辑关系信息。
优选的,所述获得至少两个对象信息之间的逻辑关系信息具体为:
从所述描述信息中获得所述至少两个对象信息间的逻辑关系信息。
优选的,依据所述对象信息获取所述对象信息对应的图像数据,具体为:
从多媒体信息数据库中搜索出与所述对象信息相对应的图像数据,且依据所述描述信息的更新来更换所述图像数据。
优选的,在依据所述对象信息,获取所述对象信息对应的图像数据之后,还包括:依据所述对象信息获取所述对象信息对应的音频数据。
优选的,所述描述信息包括:语音信息和/或文本信息。
优选的,所述描述信息为语音信息时,所述解析所述描述信息,得到所述描述信息中的对象信息,具体为:
识别所述语音信息,得到所述语音信息对应的文本信息;
分析所述文本信息,得到所述描述信息对应的对象信息。
优选的,所述描述信息为文本信息时,所述解析所述描述信息,得到所述描述信息中的对象信息,具体为:
分析所述文本信息,得到所述描述信息中的对象信息。
本申请还提供一种电子设备,包括:
输入单元,用于接收操作者输入的用于生成图像的描述信息;
解析单元,用于解析所述描述信息,得到所述描述信息中的对象信息;
第一获取单元,用于获取所述对象信息对应的图像数据;
图像生成单元,用于依据所述图像数据生成图像;
显示单元,用于显示所述图像生成单元生成的图像。
优选的,所述解析单元具体用于解析所述描述信息获得至少两个对象信息。
优选的,所述图像生成单元具体包括:
第二获取单元,获得所述至少两个对象信息之间的逻辑关系信息,所述逻辑关系信息至少包括:所述至少两个对象信息的显示位置、显示比例和/或所述至少两个对象信息的逻辑位置关系;
生成单元,依据所述对象信息对应的图像数据以及所述逻辑关系信息生成图像。
优选的,所述第二获取单元具体用于:
依据所述至少两个对象信息获得所述至少两个对象信息对应的对象参数;
比较所述至少两个对象信息对应的对象参数,获得所述至少两个对象信息的逻辑关系信息。
优选的,所述第二获取单元具体用于:搜索获得所述至少两个对象信息对应的图像信息,所述图像信息包含所述至少两个对象信息之间的逻辑关系信息。
优选的,所述第二获取单元具体用于:
从所述描述信息中获得所述至少两个对象信息间的逻辑关系信息。
优选的,所述第一获取单元具体用于:从多媒体信息数据库中搜索出与所述对象信息相对应的图像数据,且依据所述描述信息的更新来更换所述图像数据。
优选的,所述描述信息为语音信息,所述解析单元具体包括:
识别单元,用于识别所述语音信息,得到所述语音信息对应的文本信息;
分析单元,用于分析所述文本信息,得到所述描述信息对应的对象信息。
优选的,所述描述信息为文本信息,所述解析单元具体包括:
分析单元,用于分析所述文本信息,得到所述描述信息对应的对象信息。
优选的,上述的电子设备还包括:
第三获取单元,用于依据所述对象信息获取所述对象信息对应的音频数据;
输出单元,用于输出所述第三获取单元获得的音频数据。
由以上本申请实施例提供的技术方案可见,所述生成图像的方法及电子设备,所述生成图像的方法通过输入单元接收用户的输入操作,并生成相应的描述信息,解析所述描述信息得到其中的对象信息,获取对象信息对应的图像数据,依据所述图像数据生成图像,并展示给用户,实现了语言信息直接生成多媒体类型图像的过程,使得听众或读者能够更直观地看到所述语言信息所描述的场景。而且,本申请提供的所述生成图像的方法及电子设备可以直接依据用户输入的描述信息生成可视化的图像等场景画面,使用便捷。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一种生成图像的方法的流程示意图;
图2为本申请实施例另一种生成图像的方法的流程示意图;
图3为本申请实施例另一种生成图像的方法的流程示意图;
图4为本申请实施例另一种生成图像的方法的流程示意图;
图5为本申请实施例另一种生成图像的方法的流程示意图;
图6为本申请实施例一种电子设备的结构示意图;
图7为本申请实施例另一种电子设备的结构示意图;
图8为本申请实施例另一种电子设备的结构示意图;
图9为本申请实施例另一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
请参见图1,示出了一种生成图像的方法流程示意图,所述方法应用于电子设备,所述电子设备具备一显示单元和一输入单元,所述方法包括以下步骤:
101,接收操作者通过输入单元输入的用于生成图像的描述信息;
所述描述信息具体可以为语音信息和/或文本信息,所述输入单元具体可以为麦克等音频输入单元,或者,输入单元可以为文本输入单元,具体可以为触摸感应单元或键盘。
102,解析所述描述信息,得到所述描述信息中的对象信息;
该步骤具体是识别所述描述信息的语义,即根据描述信息的具体内容确定出具体描述的对象是什么,一般描述信息中的名词即为对象信息,比如,描述对象具体为“喜羊羊在森林里遇见灰太狼”时,描述信息中的名词分别为:喜羊羊、灰太狼、森林,确定出所述描述信息中的对象信息具体为:喜羊羊、灰太狼、森林。再如,当所述描述信息具体为“月明星稀”时,该描述信息中的名词为:月、星,进行语义识别后确定出该描述信息所描述的对象信息是“月亮”和“星星”。
103,依据所述对象信息,获取所述对象信息对应的图像数据;
具体的,从本地或网络服务器的对媒体信息数据库中搜索获得所述对象信息对应的图像数据。
具体的搜索过程可以分为以下几种情况:
一、依据描述信息的信息内容分为以下两种情况
1)、根据所述对象信息确定出搜索对象,并逐一搜索所述搜索对象对应的图像数据。
比如,对象信息具体为太阳时,此时,确定出的搜索对象即为太阳,直接从对媒体数据库中搜索获得太阳的图像数据。
2)、根据所述对象信息确定出搜索对象,依据所述搜索对象及所述描述信息中所述对象信息对应的辅助信息搜索获得所述图像数据,其中,所述辅助信息为所述描述信息中对所述对象信息进一步修饰说明的信息。辅助信息可以从电子设备内部采集获得也可以通过外部采集获得。
比如,所述描述信息为:一个外国人,对应的对象信息为描述信息中的名词“人”,而“外国”为“人”的定语,此时,外国即为对象信息“人”的辅助信息。具体的搜索过程如下:
首先,获得当前电子设备的使用信息,所述使用信息包括电子设备的地理位置信息(通过外部采集)、默认使用语言(通过内部采集)等信息,根据所述当前电子设备的使用信息确定出“外国”的比较基础,比如,当所述当前电子设备的使用的地理位置为中国,此时,辅助信息“外国”即为欧洲、美国等除中国外的其他国家。再如,当所述当前电子设备的默认使用语言为中文时,则辅助信息“外国”即为除中国外的其他国家。
然后,根据辅助信息最终搜索获得描述信息“外国人”所对应的准确的图像数据,具体可以为美国人或法国人。
二、根据电子设备接收所述描述信息的过程分为以下两种情况
3)、所述描述信息为语音信息,且在输入语音信息的同时进行所述搜索过程。
比如,用户输入的语音信息“一片海”,此时,搜索获得海所对应的图像数据,用户继续输入语音信息“一艘船”,此时,搜索获得船的图像数据,而且,将船和海洋的图像数据合成一幅船在海上(海水遮挡住船体的下半部分)的图像数据,并呈现给用户,即边输入语音信息,边显示搜索得到的图像数据,此过程依据描述信息的不断更增多,来调整最终显示的图像中各个对象信息对应的图像数据的逻辑显示关系。
4)、所述描述信息为语音信息,并在完成所述语音信息的输入过程后进行所述搜索过程。
比如,用户输入一条完整的语音类型的描述信息“一艘停泊在海边的船”,该描述信息对应的对象信息为:船、海边,此时,同时搜索多个对象(船和海边)对应的图像数据,获得一艘船停泊在海边的画面,此过程可以直接获得所述对象信息间的逻辑关系。
104,依据所述图像数据生成图像;
可以分析所述对象信息,从而获得多个对象信息之间的逻辑关系,所述逻辑关系至少包括各个对象信息的显示位置、显示比例和/或各个对象信息间的逻辑位置关系。
然后,依据所述对象信息之间的逻辑关系信息合成所述图像数据。
105,通过所述显示单元显示所述图像。
生成所述图像后,可以通过显示单元显示给用户,让用户直观地看到抽象的描述信息对应的图像。
本实施例提供的生成图像的方法,通过输入单元输入描述信息,解析所述描述信息得到其中的对象信息,获取对象信息对应的图像数据,依据所述图像数据生成图像,并展示给用户,实现了利用描述信息生成图像的过程,使得听众或读者能够更直观地看到所描述的场景。
请参见图2,示出了本申请另一种生成图像的方法流程图,所述方法应用于电子设备,所述电子设备具备一显示单元和一输入单元,所述方法包括以下步骤:
201,接收操作者通过输入单元输入的用于生成图像的描述信息;
具体的,所述描述信息具体可以为语音信息和/或文本信息。
202,解析所述描述信息获得至少两个对象信息;
具体的,当所述描述信息为语音信息时,需要将语音信息解析为文本信息,然后再解析所述文本信息,获得至少两个对象信息。
比如,所述文本类型的描述信息为“月明星稀的夜晚”,解析该描述信息得到描述对象的对象信息至少包括:月亮、星星这两个对象信息。
203,依据所述对象信息,获取所述对象信息对应的图像数据;
具体的,可以从本地或网络服务器中的多媒体数据库中搜索得到步骤202获得的对象信息对应的图像数据,当然也可以获得所述对象信息对应的音频数据。比如,描述信息具体为“喜羊羊和灰太狼”时,即可搜索获得动画歌曲“喜羊羊与灰太狼”的音频数据。
而且,在获取所述对象信息对应的图像数据的过程中,可以根据所述描述信息的更新来更换获得的所述图像数据。
仍以步骤202中的实例进行说明,该步骤可以从网络数据库中搜索出“月亮”对应的图像数据,以及“星星”对应的图像数据。
204,获得所述至少两个对象信息之间的逻辑关系信息,所述逻辑关系信息至少包括:所述至少两个对象信息的显示位置、显示比例和/或所述至少两个对象信息的逻辑位置关系;
具体的,分析所述对象信息之间的逻辑关系,得到对象信息之间的逻辑关系信息,所述逻辑关系信息包括:至少两个对象信息的显示位置、对象信息的显示比例和/或两个对象的逻辑位置关系。
仍以步骤202中的实例为例,获得的对象信息为“月亮”和“星星”,经过分析所述对象信息可知,“月亮”和“星星”此两个对象信息应该在图像的上半部,而且,对比两个对象信息可以确定两个对象信息的显示比例,即月亮的显示大小应该大于星星的显示大小。
可以根据所述对象信息的具体内容确定其在后续生成的图像中的显示位置,比如,所述描述信息为“太阳当空照”时,确定出的对象信息为:太阳,此时,可以确定出对象信息“太阳”位于描述信息对应的图像的上半部分。
205,依据所述对象信息对应的图像数据以及所述逻辑关系信息生成图像;
依据步骤204得到的对象信息的显示位置、显示比例等逻辑关系信息,将步骤202获得的对象信息对应的图像信息合成图像或视频。
206,通过所述显示单元显示所述图像。
本实施例提供的生成图像的方法,接收用户输入的描述信息,解析所述描述信息获得至少两个对象信息,搜索所述对象信息对应的图像数据,然后分析所述至少两个对象信息之间的逻辑关系得到对象信息对应的逻辑关系信息,根据所述对象信息的逻辑关系信息及对应的图像数据合成图像,并将生成的图像显示给用户,从而实现了依据描述信息生成直观的、可视的图像,而且,该方法能够依据对象信息之间的逻辑关系信息生成符合描述对象的正常显示状态的图像,使得听众或读者能够更直观地看到所描述的场景。
请参见图3,示出了另一种生成图像的方法流程图,该方法应用于电子设备,所述电子设备具备一显示单元和一输入单元,所述方法包括以下步骤:
301,接收操作者通过输入单元输入的用于生成图像的描述信息;
所述描述信息具体可以为语音信息和/或文本信息。
302,解析所述描述信息,得到至少两个对象信息;
具体的,当所述描述信息为语音信息时,需要将语音信息解析为文本信息,然后再解析所述文本信息,获得至少两个对象信息。
下面以一具体实例进行说明,所述描述信息具体为:“球员踢球”,且该描述信息为音频数据,解析该描述信息,获得“球员”(或者“人类”)和“球”两个对象信息,进而根据描述信息中两个对象信息之间的相互关系“踢”,进而确定出所述对象信息“球”具体为“足球”,最终获得“人类”和“足球”两个对象信息。
303,依据所述对象信息,获取所述对象信息对应的图像数据;
304,依据所述至少两个对象信息,获得所述至少两个对象信息对应的对象参数;
具体实施时,可以从网络服务器中搜索两个对象信息的对象参数,比如,通过搜索可以获得亚洲“人类”的平均身高参数、“足球”的直径。
305,比较所述对象参数,获得所述至少两个对象信息的逻辑关系信息;
通过比较亚洲“人类”的平均身高参数与“足球”的直径参数,可以确定出亚洲“人类”与“足球”的显示比例。比如,从网络数据库中搜索获得所述亚洲球员的平均175cm,足球的直径约为21.6cm,从而计算出所述球员与足球的显示比例约为8.1:1。
此外,还可以根据对象信息自身的特点,可以确定出对象信息对应的图像数据在图像中的显示位置,比如,“球员”应该位于图像的下半部分;
所述对象信息的显示位置、显示比例等生成所述对象信息的逻辑关系信息。
306,依据所述对象信息对应的图像数据以及所述逻辑关系信息生成图像;
依据步骤305中获得的对象信息的逻辑关系信息(比如,对象信息的显示位置、显示比例等),将对象信息对应的图像数据合成与所述描述信息相对应的图像。
307,通过显示单元显示所述图像。
本实施例提供的生成图像的方法,通过分析所述描述信息获得至少两个对象信息,获取所述对象信息的对象参数并进行比较可以获得所述至少两个对象信息的逻辑关系信息,根据对象信息的逻辑关系信息将对象信息对应的图像数据合成描述信息对应的图像,使得听众或读者能够更直观地看到所描述的场景。
请参见图4,示出了另一种生成图像的方法流程示意图,所述方法应用于电子设备,所述电子设备具备一显示单元和一输入单元,所述方法具体包括以下步骤:
401,接收操作者通过输入单元输入的用于生成图像的描述信息;
402,解析所述描述信息,得到至少两个对象信息;
403,依据所述对象信息,获得所述对象信息对应的图像数据;
404,直接搜索获得包含所述至少两个对象信息对应的图像数据,所述图像数据具有所述至少两个对象信息之间的逻辑关系信息;
具体的,从网络服务器或本地的多媒体数据库中直接搜索获得具有对象信息之间的逻辑关系信息的图像数据。
以一个具体的实例进行说明,比如,所述描述信息为“天上白云飘”,获得的对象信息具体为“蓝天”和“白云”,从多媒体数据库中直接搜索“蓝天白云”即可获得描述信息“天上白云飘”所对应的图像数据,该图像数据已经具有“蓝天”和“白云”此两个对象信息的显示位置等逻辑关系信息。
405,依据所述图像数据生成图像;
依据步骤404中获得的图像数据合成所述描述信息对应的图像,具体的,仍以上述例子进行说明,描述信息中仅包含“蓝天”和“白云”两个对象信息,则步骤404中获得的图像数据可直接作为所述描述信息对应的图像。
406,通过显示单元显示所述图像。
本实施例提供的生成图像的方法,直接搜索获得描述信息获得的对象信息对应的图像数据,该图像数据中包含所述对象信息的逻辑关系信息,即直接根据所述描述信息中的对象信息生成图像。
请参见图5,示出了另一种生成图像的方法流程示意图,所述方法适用于电子设备,所述电子设备具备一显示单元和一输入单元,所述方法包括以下步骤:
501,接收操作者通过输入单元输入的用于生成图像的描述信息;
502,解析所述描述信息,得到至少两个对象信息;
503,依据所述对象信息,获得所述对象信息对应的图像数据;
504,从所述描述信息中获得所述至少两个对象信息间的逻辑关系信息;
具体的,确定出所述描述信息中的对象信息后,再依据所述描述信息中的所述对象信息之间的相互关系,确定所述至少两个对象信息的逻辑关系信息。
具体的,比如,所述描述信息具体为“小朋友藏在假山后,露出头”,该描述信息中的对象信息为“小朋友”和“假山”而描述信息中的“藏”和“露出头”直接体现了两个对象信息间的逻辑位置关系为遮挡关系,即“假山”遮挡“小朋友”的身体。
505,依据所述对象信息对应的图像数据以及所述逻辑关系信息生成图像;
依据步骤503获得的对象信息对应的图像数据,以及步骤505获得的对象信息间的逻辑关系信息,合成所述描述信息对应的图像。
具体的,仍以步骤504中的实例进行说明,依据所述对象信息“小朋友”和“假山”之间的逻辑关系信息(遮挡关系),从而将“小朋友”对应的图像数据和“假山”对应的图像数据,合成最终的图像。
506,通过所述显示单元显示所述图像。
本实施例提供的生成图像的方法,直接从描述信息中获得对象信息间的逻辑关系信息,从而依据所述对象信息的逻辑关系信息及对应的图像数据合成图像,并将生成的图像显示给用户,从而实现了依据描述信息生成直观的、可视的图像,而且,该方法能够依据对象信息之间的逻辑关系信息生成符合描述对象的正常显示状态的图像,使得听众或读者能够更直观地看到所描述的场景。
相应于上述的生成图像的方法实施例,本申请还提供了一种电子设备。
请参见图6,示出了本申请实施例的一种电子设备的结构示意图,所述电子设备包括:输入单元610、解析单元620、第一获取单元630、图像生成单元640、显示单元650。
所述输入单元610,用于接收操作者输入的用于生成图像的输入操作,并生成对应的描述信息;
所述描述信息可以为语音信息和/或文本信息,具体的,所述输入单元可以为音频输入单元(比如,麦克)或文本输入单元(比如,触摸感应单元、键盘等)。
所述解析单元620,用于解析所述描述信息,得到所述描述信息中的对象信息;
所述第一获取单元630,用于获取所述对象信息对应的图像数据;
具体的,从本地或网络服务器的对媒体信息数据库中搜索获得所述对象信息对应的图像数据。
所述图像生成单元640,用于依据所述图像数据生成图像;
可以分析所述对象信息,从而获得多个对象信息之间的逻辑关系,所述逻辑关系至少包括各个对象信息的显示位置、显示比例和/或各个对象信息间的逻辑位置关系。然后,依据所述对象信息之间的逻辑关系信息合成所述图像数据。
所述显示单元650,用于显示所述图像生成单元生成的图像。
生成所述图像后,可以通过显示单元显示给用户,让用户直观地看到抽象的描述信息对应的图像。
本实施例提供的电子设备,通过输入单元接收用户的输入操作,并生成对应的描述信息,利用解析单元解析所述描述信息得到其中的对象信息,通过第一获取单元获取对象信息对应的图像数据,图像生成单元依据所述图像数据生成图像,并通过显示将所述图像展示给用户,实现了利用描述信息生成图像的过程,使得听众或读者能够更直观地看到所描述的场景。
请参见图7,示出了另一种电子设备的结构示意图,该电子设备主要包括:输入单元710、解析单元720、第一获取单元730、图像生成单元740、显示单元750,其中,所述图像生成单元740具体包括:第二获取单元741、生成单元742。
所述输入单元710,用于接收操作者输入的用于生成图像的输入操作,并生成对应的描述信息;
所述解析单元720,用于解析所述描述信息,得到至少两个对象信息;
所述第一获取单元730,用于获取所述对象信息对应的图像数据;
具体的,从本地或网络服务器的对媒体信息数据库中搜索获得所述对象信息对应的图像数据。
所述第一获取单元还可以根据所述描述信息的更新来更换获得的所述图像数据。
所述第二获取单元741,获得所述至少两个对象信息之间的逻辑关系信息,所述逻辑关系信息至少包括:所述至少两个对象信息的显示位置、显示比例和/或所述至少两个对象信息的逻辑位置关系;
具体的,所述第二获取单元741的功能可以分为以下三种情况:
1)依据所述至少两个对象信息获得所述至少两个对象信息对应的对象参数;
比较所述至少两个对象信息对应的对象参数,获得所述至少两个对象信息的逻辑关系信息。
2)直接搜索获得所述至少两个对象信息之间的逻辑关系信息。
3)从所述描述信息中获得所述至少两个对象信息间的逻辑关系信息。
所述生成单元742,依据所述对象信息对应的图像数据以及所述逻辑关系信息生成图像。
所述显示单元750,用于显示所述图像生成单元生成的图像。
生成所述图像后,可以通过显示单元显示给用户,让用户直观地看到抽象的描述信息对应的图像。
本实施例提供的电子设备,通过第二获取单元获得对象信息间的逻辑关系信息,然后依据所述图像数据以及所述逻辑关系信息生成所述描述信息对应的图像,并通过显示将所述图像展示给用户,实现了利用描述信息生成图像的过程,使得听众或读者能够更直观地看到所描述的场景。
请参见图8,示出了另一种电子设备的结构示意图,该电子设备主要包括:输入单元810、解析单元820、第一获取单元830、图像生成单元840、显示单元850,其中,所述解析单元820包括:识别单元821、分析单元822。
所述输入单元810,用于接收操作者输入的用于生成图像的输入操作,并生成对应的描述信息,所述描述信息具体为语音信息;
本实施例中,所述输入单元具体为音频输入单元,用于接收用户输入的音频数据,生成相应的音频数据类型的描述信息。
所述识别单元821,用于识别所述语音信息,得到所述语音信息对应的文本信息;
具体的,所述识别单元,将所述语音信息进行语音文本化,得到对应的文本信息。
所述分析单元822,用于分析所述文本信息,得到所述描述信息对应的对象信息;
所述第一获取单元830,用于获取所述对象信息对应的图像数据;
所述图像生成单元840,用于依据所述图像数据生成图像;
所述显示单元850,用于显示所述图像生成单元生成的图像。
本实施例提供的电子设备能够将用户输入的语音类型的描述信息进行文本化,得到文本类型的描述信息,对描述信息进行解析得到对应的对象信息,获取所述对象信息对应的图像数据,并依据所述图像数据生成所述描述信息对应的图像,最终通过显示单元将所述图像展示给用户,从而实现了利用描述信息生成图像的过程,使得听众或读者能够更直观地看到所描述的场景。
请参见图9,示出了另一种电子设备,的结构示意图,该电子设备主要包括:输入单元910、解析单元920、第一获取单元930、图像生成单元940、显示单元950,第三获取单元960和输出单元970。
所述输入单元910,用于接收操作者输入的用于生成图像的输入操作,并生成对应的描述信息;
所述解析单元920,用于解析所述描述信息,得到至少两个对象信息;
所述第一获取单元930,用于获取所述对象信息对应的图像数据;
具体的,比如,描述信息具体为“喜羊羊和灰太狼”时,即可搜索获得动画歌曲“喜羊羊与灰太狼”的音频数据。
所述图像生成单元940,用于依据所述图像数据生成图像;
所述显示单元950,用于显示所述图像生成单元生成的图像;
所述第三获取单元960,用于依据所述对象信息获取所述对象信息对应的音频数据;
所述输出单元970,用于输出所述第三获取单元获得的音频数据。
本实施例提供的电子设备,在生成描述信息对应的图像的同时,还可以生成与描述信息对应的音频数据,从而实现了利用描述信息生成图像的过程,使得听众或读者能够更直观地看到所描述的场景,而且增加了音频数据,使得听众或读者对描述的场景描述更具真实感。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (21)
1.一种生成图像的方法,应用于电子设备,所述电子设备具备一显示单元和一输入单元,其特征在于,所述方法包括:
接收操作者通过输入单元输入的用于生成图像的描述信息;
解析所述描述信息,得到所述描述信息中的对象信息;
依据所述对象信息,获取所述对象信息对应的图像数据;
依据所述图像数据生成图像;
通过所述显示单元显示所述图像。
2.根据权利要求1所述的方法,其特征在于,所述解析所述描述信息,得到所述描述信息中的对象信息具体为:解析所述描述信息获得至少两个对象信息。
3.根据权利要求2所述的方法,其特征在于,依据所述图像数据生成图像具体包括:
获得所述至少两个对象信息之间的逻辑关系信息,所述逻辑关系信息至少包括:所述至少两个对象信息的显示位置、显示比例和/或所述至少两个对象信息的逻辑位置关系;
依据所述对象信息对应的图像数据以及所述逻辑关系信息生成图像。
4.根据权利要求3所述的方法,其特征在于,所述获得至少两个对象信息之间的逻辑关系信息具体为:
依据所述至少两个对象信息获得所述至少两个对象信息对应的对象参数;
比较所述至少两个对象信息对应的对象参数,获得所述至少两个对象信息的逻辑关系信息。
5.根据权利要求3所述的方法,其特征在于,所述获得至少两个对象信息之间的逻辑关系信息具体为:
搜索获得包含所述至少两个对象信息对应的图像数据,所述图像数据具有所述至少两个对象信息之间的逻辑关系信息。
6.根据权利要求3所述的方法,其特征在于,所述获得至少两个对象信息之间的逻辑关系信息具体为:
从所述描述信息中获得所述至少两个对象信息间的逻辑关系信息。
7.根据权利要求1所述的方法,其特征在于,依据所述对象信息获取所述对象信息对应的图像数据,具体为:
从多媒体信息数据库中搜索出与所述对象信息相对应的图像数据,且依据所述描述信息的更新来更换所述图像数据。
8.根据权利要求1所述的方法,其特征在于,在依据所述对象信息,获取所述对象信息对应的图像数据之后,还包括:依据所述对象信息获取所述对象信息对应的音频数据。
9.根据权利要求1所述的方法,其特征在于,所述描述信息包括:语音信息和/或文本信息。
10.根据权利要求9所述的方法,其特征在于,所述描述信息为语音信息时,所述解析所述描述信息,得到所述描述信息中的对象信息,具体为:
识别所述语音信息,得到所述语音信息对应的文本信息;
分析所述文本信息,得到所述描述信息对应的对象信息。
11.根据权利要求9所述的方法,其特征在于,所述描述信息为文本信息时,所述解析所述描述信息,得到所述描述信息中的对象信息,具体为:
分析所述文本信息,得到所述描述信息中的对象信息。
12.一种电子设备,其特征在于,包括:
输入单元,用于接收操作者输入的用于生成图像的描述信息;
解析单元,用于解析所述描述信息,得到所述描述信息中的对象信息;
第一获取单元,用于获取所述对象信息对应的图像数据;
图像生成单元,用于依据所述图像数据生成图像;
显示单元,用于显示所述图像生成单元生成的图像。
13.根据权利要求12所述的电子设备,其特征在于,所述解析单元具体用于解析所述描述信息获得至少两个对象信息。
14.根据权利要求13所述的电子设备,其特征在于,所述图像生成单元具体包括:
第二获取单元,获得所述至少两个对象信息之间的逻辑关系信息,所述逻辑关系信息至少包括:所述至少两个对象信息的显示位置、显示比例和/或所述至少两个对象信息的逻辑位置关系;
生成单元,依据所述对象信息对应的图像数据以及所述逻辑关系信息生成图像。
15.根据权利要求14所述的电子设备,其特征在于,所述第二获取单元具体用于:
依据所述至少两个对象信息获得所述至少两个对象信息对应的对象参数;
比较所述至少两个对象信息对应的对象参数,获得所述至少两个对象信息的逻辑关系信息。
16.根据权利要求14所述的电子设备,其特征在于,所述第二获取单元具体用于:通过搜索获得所述至少两个对象信息对应的图像数据,所述图像数据中包含所述至少两个对象信息之间的逻辑关系信息。
17.根据权利要求14所述的电子设备,其特征在于,所述第二获取单元具体用于:
从所述描述信息中获得所述至少两个对象信息间的逻辑关系信息。
18.根据权利要求12所述的电子设备,其特征在于,所述第一获取单元具体用于:从多媒体信息数据库中搜索出与所述对象信息相对应的图像数据,且依据所述描述信息的更新来更换所述图像数据。
19.根据权利要求12所述的电子设备,所述描述信息为语音信息,其特征在于,所述解析单元具体包括:
识别单元,用于识别所述语音信息,得到所述语音信息对应的文本信息;
分析单元,用于分析所述文本信息,得到所述描述信息对应的对象信息。
20.根据权利要求12所述的电子设备,所述描述信息为文本信息,其特征在于,所述解析单元具体包括:
分析单元,用于分析所述文本信息,得到所述描述信息对应的对象信息。
21.根据权利要求12所述的电子设备,其特征在于,还包括:
第三获取单元,用于依据所述对象信息获取所述对象信息对应的音频数据;
输出单元,用于输出所述第三获取单元获得的音频数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210226805.9A CN103514614A (zh) | 2012-06-29 | 2012-06-29 | 生成图像的方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210226805.9A CN103514614A (zh) | 2012-06-29 | 2012-06-29 | 生成图像的方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103514614A true CN103514614A (zh) | 2014-01-15 |
Family
ID=49897292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210226805.9A Pending CN103514614A (zh) | 2012-06-29 | 2012-06-29 | 生成图像的方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103514614A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104866275A (zh) * | 2015-03-25 | 2015-08-26 | 百度在线网络技术(北京)有限公司 | 一种用于获取图像信息的方法和装置 |
WO2021068189A1 (en) * | 2019-10-11 | 2021-04-15 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for image generation |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050159958A1 (en) * | 2004-01-19 | 2005-07-21 | Nec Corporation | Image processing apparatus, method and program |
CN101441650A (zh) * | 2007-09-25 | 2009-05-27 | 株式会社东芝 | 影像输出装置、方法和*** |
CN101582254A (zh) * | 2008-05-13 | 2009-11-18 | 深圳华为通信技术有限公司 | 一种图像呈现方法及装置 |
CN101950302A (zh) * | 2010-09-29 | 2011-01-19 | 李晓耕 | 基于移动设备的海量音乐库管理方法 |
CN102084386A (zh) * | 2008-03-24 | 2011-06-01 | 姜旻秀 | 利用数字内容关联元信息的关键字广告方法及其关联*** |
CN102110304A (zh) * | 2011-03-29 | 2011-06-29 | 华南理工大学 | 一种基于素材引擎的漫画自动生成方法 |
CN102187369A (zh) * | 2008-10-15 | 2011-09-14 | 诺基亚公司 | 用于生成图像的方法和设备 |
-
2012
- 2012-06-29 CN CN201210226805.9A patent/CN103514614A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050159958A1 (en) * | 2004-01-19 | 2005-07-21 | Nec Corporation | Image processing apparatus, method and program |
CN101441650A (zh) * | 2007-09-25 | 2009-05-27 | 株式会社东芝 | 影像输出装置、方法和*** |
CN102084386A (zh) * | 2008-03-24 | 2011-06-01 | 姜旻秀 | 利用数字内容关联元信息的关键字广告方法及其关联*** |
CN101582254A (zh) * | 2008-05-13 | 2009-11-18 | 深圳华为通信技术有限公司 | 一种图像呈现方法及装置 |
CN102187369A (zh) * | 2008-10-15 | 2011-09-14 | 诺基亚公司 | 用于生成图像的方法和设备 |
CN101950302A (zh) * | 2010-09-29 | 2011-01-19 | 李晓耕 | 基于移动设备的海量音乐库管理方法 |
CN102110304A (zh) * | 2011-03-29 | 2011-06-29 | 华南理工大学 | 一种基于素材引擎的漫画自动生成方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104866275A (zh) * | 2015-03-25 | 2015-08-26 | 百度在线网络技术(北京)有限公司 | 一种用于获取图像信息的方法和装置 |
WO2021068189A1 (en) * | 2019-10-11 | 2021-04-15 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for image generation |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11003906B2 (en) | Schemes for retrieving and associating content items with real-world objects using augmented reality and object recognition | |
CN110110104B (zh) | 一种自动生成虚拟三维空间内房屋讲解的方法及装置 | |
CN109688463A (zh) | 一种剪辑视频生成方法、装置、终端设备及存储介质 | |
CN104540275B (zh) | 一种调节现场照明装置的方法、设备及*** | |
CN107436921B (zh) | 视频数据处理方法、装置、设备及存储介质 | |
CN106355153A (zh) | 一种基于增强现实的虚拟对象显示方法、装置以及*** | |
CN103620545A (zh) | 媒体集合的分级、可缩放呈现 | |
CN109191940B (zh) | 一种基于智能设备的交互方法及智能设备 | |
US20170337222A1 (en) | Image searching method and apparatus, an apparatus and non-volatile computer storage medium | |
WO2016014373A1 (en) | Identifying presentation styles of educational videos | |
US10127824B2 (en) | System and methods to create multi-faceted index instructional videos | |
CN103945140A (zh) | 视频字幕的生成方法及*** | |
KR101543287B1 (ko) | 현실 객체의 물리적 동작-증강 현실 상호작용형 전자책 시스템 및 구현 방법 | |
CN103514614A (zh) | 生成图像的方法及电子设备 | |
US20190273863A1 (en) | Interactive Data Visualization Environment | |
CN105892800A (zh) | 一种智能终端的消息呈现方法、装置及智能终端 | |
CN108877311A (zh) | 一种基于增强现实技术的英语学习*** | |
CN104715009B (zh) | 位置搜索获得场景知识的方法及*** | |
CN109151599B (zh) | 视频处理方法和装置 | |
WO2020234939A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN106340307A (zh) | 显示音频信息的方法和装置 | |
US20150149170A1 (en) | Note prompt system and method used for intelligent glasses | |
FENG et al. | A study of blind people based on morphological recognition color-graphic research | |
Pisnyi et al. | AR Intelligent Real-time Method for Cultural Heritage Object Recognition | |
Cordeiro et al. | Soundscape-Sensing in Social Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140115 |