CN116363260A - 图像生成方法、装置及电子设备 - Google Patents

图像生成方法、装置及电子设备 Download PDF

Info

Publication number
CN116363260A
CN116363260A CN202310343529.2A CN202310343529A CN116363260A CN 116363260 A CN116363260 A CN 116363260A CN 202310343529 A CN202310343529 A CN 202310343529A CN 116363260 A CN116363260 A CN 116363260A
Authority
CN
China
Prior art keywords
image
superposition
generated
interface
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310343529.2A
Other languages
English (en)
Other versions
CN116363260B (zh
Inventor
曹溪语
陈璇
辛永正
张久金
苏文嗣
王展鹏
李国豪
李伟
佘俏俏
刘红星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202310343529.2A priority Critical patent/CN116363260B/zh
Publication of CN116363260A publication Critical patent/CN116363260A/zh
Application granted granted Critical
Publication of CN116363260B publication Critical patent/CN116363260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本公开提供了图像生成方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、计算机视觉技术领域。具体实现方案为:获取图像叠加请求,图像叠加请求包括:基础图像;根据图像叠加请求,显示图像叠加界面,图像叠加界面中包括设置区域,设置区域用于设置基础图像、叠加图像以及叠加参数;根据对象在设置区域中的操作,确定对象所设置的叠加图像以及叠加参数;在接收到图像生成请求的情况下,根据基础图像、叠加图像以及叠加参数,进行图像生成处理,得到生成图像,对使用者的要求较低,不需要使用者具备制图基础以及图像的设计能力,且使用简单,提高了图像生成效率。

Description

图像生成方法、装置及电子设备
技术领域
本公开涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、计算机视觉技术领域,尤其涉及一种图像生成方法、装置及电子设备。
背景技术
目前,进行图像生成的方式主要为,使用绘图软件进行图像的绘制。进行图像编辑修改的方式主要为,使用图像编辑软件进行图像的编辑处理。
其中,绘图软件和图像编辑软件,要求使用者具备制图基础以及图像的设计能力,对使用者的要求过高,且使用复杂,导致图像生成或者编辑修改的效率差。
发明内容
本公开提供了一种图像生成方法、装置及电子设备。
根据本公开的一方面,提供了一种图像生成方法,所述方法包括:获取图像叠加请求,所述图像叠加请求包括:基础图像;根据所述图像叠加请求,显示图像叠加界面,所述图像叠加界面中包括设置区域,所述设置区域用于设置所述基础图像、叠加图像以及叠加参数;根据对象在所述设置区域中的操作,确定所述对象所设置的叠加图像以及叠加参数;在接收到图像生成请求的情况下,根据所述基础图像、所述叠加图像以及所述叠加参数,进行图像生成处理,得到生成图像。
根据本公开的另一方面,提供了一种图像生成装置,所述装置包括:获取模块,用于获取图像叠加请求,所述图像叠加请求包括:基础图像;第一显示模块,用于根据所述图像叠加请求,显示图像叠加界面,所述图像叠加界面中包括设置区域,所述设置区域用于设置所述基础图像、叠加图像以及叠加参数;第一确定模块,用于根据对象在所述设置区域中的操作,确定所述对象所设置的叠加图像以及叠加参数;第一生成模块,用于在接收到图像生成请求的情况下,根据所述基础图像、所述叠加图像以及所述叠加参数,进行图像生成处理,得到生成图像。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开上述提出的图像生成方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行本公开上述提出的图像生成方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开上述提出的图像生成方法的步骤。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是图像编辑界面的示意图;
图3是图像叠加界面的示意图;
图4是图像库中图像的选择示意图;
图5是图像创建界面的示意图;
图6是以第一历史生成图像为基础图像的图像叠加界面;
图7是以第一历史生成图像为基础图像,且设置有叠加图像的图像叠加界面的示意图;
图8是生成图像生成过程中图像叠加界面的示意图;
图9是生成图像生成完成后图像叠加界面的示意图;
图10是根据本公开第二实施例的示意图;
图11是根据本公开第三实施例的示意图;
图12是根据本公开第四实施例的示意图;
图13是用来实现本公开实施例的图像生成方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
目前,进行图像生成的方式主要为,使用绘图软件进行图像的绘制。进行图像编辑修改的方式主要为,使用图像编辑软件进行图像的编辑处理。
其中,绘图软件和图像编辑软件,要求使用者具备制图基础以及图像的设计能力,对使用者的要求过高,且使用复杂,导致图像生成或者编辑修改的效率差。
针对上述问题,本公开提出一种图像生成方法、装置及电子设备。
图1是根据本公开第一实施例的示意图,需要说明的是,本公开实施例的图像生成方法可应用于图像生成装置,该装置可被配置于电子设备中,以使该电子设备可以执行图像生成功能。以下实施例中以执行主体为电子设备为例进行说明。
其中,电子设备可以为任一具有计算能力的设备,例如可以为个人电脑(PersonalComputer,简称PC)、移动终端、服务器等,移动终端例如可以为车载设备、手机、平板电脑、个人数字助理、穿戴式设备、智能音箱等具有各种操作***、触摸屏和/或显示屏的硬件设备。
如图1所示,该图像生成方法可以包括如下步骤:
步骤101,获取图像叠加请求,图像叠加请求包括:基础图像。
在本公开实施例中,基础图像,可以为原始图像,或者历史图像生成任务中的历史生成图像。其中,在基础图像为原始图像的情况下,电子设备可以基于原始图像以及其他图像来生成图像,生成图像时可以考虑原始图像中的至少一个元素。其中,在基础图像为历史生成图像的情况下,电子设备可以基于历史生成图像以及其他图像来生成图像,生成图像时可以考虑历史生成图像中的至少一个元素。
其中,元素,例如,风格、颜色、主体等。其中,风格例如,清新、文艺、水墨、光影等,可以根据实际需要进行设定。其中,主体例如,动物、植物、人物、物体等。
其中,基础图像可以为原始图像或者历史生成图像,使得对象可以根据需求灵活选择不同的图像进行图像生成,提高图像生成的灵活性,且基于历史生成图像进行图像生成,可以实现对原始图像的连续编辑或者连续生成,提高图像生成效率。
在本公开实施例中,一种示例中,电子设备获取图像叠加请求的过程例如可以为,显示图像编辑界面,图像编辑界面包括图像叠加控件;在检测到针对图像叠加控件的选中操作的情况下,显示图像叠加界面;根据对象在图像叠加界面的设置区域中的操作,确定对象设置有基础图像的情况下,确定获取到图像叠加请求。
其中,图像编辑界面的示意图,可以如图2所示,在图2中,图像编辑界面,为对象选中图像处理界面中图像编辑控件(例如,AI编辑)后显示的界面。在图2中,图像编辑界面中包括图像叠加控件(图片叠加)和涂抹编辑控件(涂抹编辑)。
其中,图像叠加界面的示意图,可以如图3所示,在图3中,设置区域,如图3中左侧的列表所示。设置区域中包括:基础图设置子区域、叠加图设置子区域、描述文本设置子区域、尺寸信息设置子区域、数量信息设置子区域、图像生成控件(立即生成)等。
其中,在图3中,对象在图像叠加界面的设置区域中的操作,例如,基础图像选择操作、叠加图像选择操作、描述文本输入操作、尺寸信息选择操作、数量信息选择操作等。
其中,电子设备显示图像编辑界面;在检测到针对图像叠加控件的选中操作的情况下,显示图像叠加界面,以进行基础图像选择,从而触发图像叠加功能,给对象提供一种触发图像叠加功能的方式,提高图像叠加功能的触发效率。
在本公开实施例中,电子设备根据对象在图像叠加界面的设置区域中的操作,确定对象设置有基础图像的方式例如可以为,在检测到设置区域中对象的基础图像选择操作的情况下,显示本地图像库以及生成图像库;本地图像库中包括本地的原始图像;生成图像库中包括历史生成图像;将本地图像库或者生成图像库中对象选中的图像,作为基础图像。
其中,图像库中图像的选择示意图,可以如图4所示,在图4中,选中“上传本地照片”控件后,可以显示本地图像库中的原始图像;选中“一格样片”控件后,可以显示样例图像。选中“我的作品”控件后,可以显示生成图像库中的生成图像。
其中,电子设备提供多种图像库,每种图像库中包括多个图像,方便对象选择基础图像,从而触发图像叠加功能,能够提高基础图像选择的灵活性,进而提高图像生成效率。
在本公开实施例中,另一种示例中,电子设备获取图像叠加请求的过程例如可以为,显示图像处理界面,图像处理界面包括图像编辑控件、图像创作控件以及图像生成任务列表;图像生成任务列表中包括至少一个历史图像生成任务;在检测到针对图像生成任务列表中第一历史图像生成任务的选中操作的情况下,显示图像创建界面,并在图像创建界面中显示第一历史图像生成任务中的第一历史生成图像;在检测到针对第一历史生成图像周边的编辑本图像控件的选中操作的情况下,确定获取到以第一历史生成图像为基础图像的图像叠加请求。
其中,图像创建界面的示意图,可以如图5所示,在图5中,图像生成任务列表,如图5中右侧的列表所示。右侧列表中显示有图像生成任务列表中各个历史图像生成任务中的历史生成图像。在图5中,图像创建界面中显示有图像生成任务列表第一个历史图像生成任务中的历史生成图像。
在图5中的显示的第一历史生成图像下方,显示有“编辑本图片”控件,即,编辑本图像控件,电子设备在检测到针对该编辑本图像控件的选中操作后,确定获取到以第一历史生成图像为基础图像的图像叠加请求,进而显示以第一历史生成图像为基础图像的图像叠加界面,如图6所示。在图6中,显示的基础图像,即图5中显示的第一历史生成图像。
其中,电子设备在检测到针对第一历史生成图像周边的编辑本图像控件的选中操作的情况下,确定获取到以第一历史生成图像为基础图像的图像叠加请求;触发图像叠加功能,显示以第一历史生成图像为基础图像的图像编辑界面,给对象提供另一种触发图像叠加功能的方式,提高图像叠加功能的触发效率。
在该示例中,在图6中的图像叠加界面的设置区域中,显示生成第一历史生成图像时用到的第一历史叠加参数,例如,尺寸信息为1:1,数量信息为1等,方便对象在第一历史叠加参数的基础上进行叠加参数调整,避免重复设置叠加参数,也方便第一历史叠加参数的复用,进一步提高图像生成效率。
步骤102,根据图像叠加请求,显示图像叠加界面,图像叠加界面中包括设置区域,设置区域用于设置基础图像、叠加图像以及叠加参数。
步骤103,根据对象在设置区域中的操作,确定对象所设置的叠加图像以及叠加参数。
步骤104,在接收到图像生成请求的情况下,根据基础图像、叠加图像以及叠加参数,进行图像生成处理,得到生成图像。
在本公开实施例中,叠加图像的数量为一个或者多个。其中,叠加参数可以包括以下至少一种:用于描述生成图像的描述文本、基础图像的影响权重、叠加图像的影响权重、描述文本的影响权重、生成图像的尺寸信息、生成图像的图像数量。
其中,在图6中的图像叠加界面设置叠加图像以及调整第一历史叠加参数后的图像叠加界面的示意图,可以如图7所示,图7为以第一历史生成图像为基础图像,且设置有叠加图像的图像叠加界面的示意图。
在图7中,相对于图6,尺寸信息和数量信息未做调整,新增了描述文本“机械狗”,并新增了一个叠加图像,即机器人图像。
其中,电子设备在检测到设置区域中对象的叠加图像选择操作的情况下,也可以显示本地图像库以及生成图像库,方便对象选择叠加图像。
其中,生成图像生成过程中图像叠加界面的示意图,可以如图8所示。生成图像生成完成后图像叠加界面的示意图,可以如图9所示。在图9中,生成图像生成完成后,设置区域可以处于锁定状态,并显示“再次编辑”控件,即再次编辑控件,方便对设置区域中的基础图像、叠加图像或者叠加参数进行调整,以再次生成图像。
其中,一个或者多个叠加图像的设置,以及多种叠加参数的设置,使得对象可以根据需求,选择合适的叠加图像以及叠加参数,能够提高叠加图像以及叠加参数选择的灵活性,进而提高图像生成效率。
在本公开实施例中,为了方便对象查看生成图像,以及后续以生成图像为基础图像进行图像生成处理,在步骤104之后,电子设备还可以执行以下过程:根据基础图像、叠加图像、叠加参数以及生成图像,对图像生成任务列表进行更新处理。
本公开实施例的图像生成方法,通过获取图像叠加请求,图像叠加请求包括:基础图像;根据图像叠加请求,显示图像叠加界面,图像叠加界面中包括设置区域,设置区域用于设置基础图像、叠加图像以及叠加参数;根据对象在设置区域中的操作,确定对象所设置的叠加图像以及叠加参数;在接收到图像生成请求的情况下,根据基础图像、叠加图像以及叠加参数,进行图像生成处理,得到生成图像,对使用者的要求较低,不需要使用者具备制图基础以及图像的设计能力,且使用简单,提高了图像生成效率。
其中,若生成图像不符合对象的需求,可以对生成图像时所采用的基础图像、叠加图像以及叠加参数等进行调整,使得重新生成的生成图像符合对象的需求,提高图像生成效率。如图10所示,图10是根据本公开第二实施例的示意图,图10所示实施例可以包括以下步骤:
步骤1001,获取图像叠加请求,图像叠加请求包括:基础图像。
步骤1002,根据图像叠加请求,显示图像叠加界面,图像叠加界面中包括设置区域,设置区域用于设置基础图像、叠加图像以及叠加参数。
步骤1003,根据对象在设置区域中的操作,确定对象所设置的叠加图像以及叠加参数。
步骤1004,在接收到图像生成请求的情况下,根据基础图像、叠加图像以及叠加参数,进行图像生成处理,得到生成图像。
步骤1005,显示生成图像,锁定图像叠加界面的设置区域,并在图像叠加界面中显示再次编辑控件。
在本公开实施例中,如图9所示,在图9中,显示生成图像,即,生成的机器狗图像。在图9中,设置区域处于锁定状态,即,不可编辑状态,避免对设置区域中基础图像、叠加图像或者叠加参数调整后,与生成图像时所采用的图像以及叠加参数不一致的情况。再次编辑控件的提供,在生成图像不满足对象的需求时,方便对基础图像、叠加图像或者叠加参数中的至少一种调整,再次进行图像生成处理。
步骤1006,在检测到针对再次编辑控件的选中操作的情况下,确定接收到针对生成图像的再次编辑请求。
步骤1007,解锁图像叠加界面中的设置区域。
在本公开实施例中,电子设备在检测到针对再次编辑控件的选中操作的情况下,表示生成图像不符合对象的需求,需要对设置区域中的基础图像、叠加图像以及叠加参数中的至少一种进行调整,因此,电子设备可以解锁图像叠加界面中的设置区域,即,设置区域处于可编辑状态,方便对象调整。
步骤1008,根据对象在设置区域中的操作,对设置区域中的基础图像、叠加图像以及叠加参数中的至少一种进行调整。
步骤1009,在接收到图像生成请求的情况下,根据调整后的基础图像、调整后的叠加图像以及调整后的叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
在本公开实施例中,图像叠加界面中可以显示有图像生成控件,例如,图9中的“立即生成”控件。电子设备在检测到对象针对该控件的选中操作时,确定接收到图像生成请求。
在本公开实施例中,一种示例中,根据对象在设置区域中的操作,对设置区域中的基础图像进行调整,对应的,电子设备执行步骤1009的过程例如可以为,在接收到图像生成请求的情况下,根据调整后的基础图像、叠加图像以及叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
另一种示例中,根据对象在设置区域中的操作,对设置区域中的基础图像和叠加图像进行调整,对应的,电子设备执行步骤1009的过程例如可以为,在接收到图像生成请求的情况下,根据调整后的基础图像、调整后的叠加图像以及叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
另一种示例中,根据对象在设置区域中的操作,对设置区域中的叠加参数进行调整,对应的,电子设备执行步骤1009的过程例如可以为,在接收到图像生成请求的情况下,根据基础图像、叠加图像以及调整后的叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
其中,需要说明的是,作为步骤1008至步骤1009的替换方案,步骤1007之后,电子设备还可以执行以下过程:在接收到图像生成请求的情况下,根据设置区域中的基础图像、叠加图像以及叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
其中,在该替换方案中,电子设备不对基础图像、叠加图像以及叠加参数做调整,基于设置区域中显示的基础图像、叠加图像以及叠加参数,重新进行图像生成处理,得到新的生成图像。其中,该新的生成图像与步骤1005中的生成图像,可能不同,可能满足对象的需求。
其中,需要说明的是,步骤1001至步骤1004的详细内容,可以参考图1所示实施例中的步骤101至步骤104,此处不再进行详细说明。
本公开实施例的图像生成方法,通过获取图像叠加请求,图像叠加请求包括:基础图像;根据图像叠加请求,显示图像叠加界面,图像叠加界面中包括设置区域,设置区域用于设置基础图像、叠加图像以及叠加参数;根据对象在设置区域中的操作,确定对象所设置的叠加图像以及叠加参数;在接收到图像生成请求的情况下,根据基础图像、叠加图像以及叠加参数,进行图像生成处理,得到生成图像;显示生成图像,锁定图像叠加界面的设置区域,并在图像叠加界面中显示再次编辑控件;在检测到针对再次编辑控件的选中操作的情况下,确定接收到针对生成图像的再次编辑请求;解锁图像叠加界面中的设置区域;根据对象在设置区域中的操作,对设置区域中的基础图像、叠加图像以及叠加参数中的至少一种进行调整;在接收到图像生成请求的情况下,根据调整后的基础图像、调整后的叠加图像以及调整后的叠加参数,进行图像生成处理,得到再次编辑后的生成图;对使用者的要求较低,不需要使用者具备制图基础以及图像的设计能力,且使用简单,能够为使用者提供图像连续编辑或者连续生成功能,提高了图像生成效率。
其中,若生成图像不符合对象的需求,缺少对象需求的元素,对象希望继续对生成图像进行编辑处理,即,将生成图像作为基础图像再次进行图像生成处理,使得重新生成的生成图像符合对象的需求,提高图像生成效率。如图11所示,图11是根据本公开第三实施例的示意图,图11所示实施例可以包括以下步骤:
步骤1101,获取图像叠加请求,图像叠加请求包括:基础图像。
步骤1102,根据图像叠加请求,显示图像叠加界面,图像叠加界面中包括设置区域,设置区域用于设置基础图像、叠加图像以及叠加参数。
步骤1103,根据对象在设置区域中的操作,确定对象所设置的叠加图像以及叠加参数。
步骤1104,在接收到图像生成请求的情况下,根据基础图像、叠加图像以及叠加参数,进行图像生成处理,得到生成图像。
在本公开实施例中,电子设备进行图像生成处理的过程例如可以为,将基础图像、叠加图像以及叠加参数,输入图像生成模型,获取图像生成模型输出的生成图像。
其中,在叠加参数包括:用于描述生成图像的描述文本、基础图像的影响权重、叠加图像的影响权重、描述文本的影响权重的情况下,图像生成模型根据基础图像、叠加图像以及叠加参数进行图像生成的过程为,对基础图像以及叠加图像进行图像特征提取处理,得到基础图像的图像特征以及叠加图像的图像特征;对描述文本进行文本特征提取处理,得到描述文本的文本特征;按照影响权重,对多个图像特征以及文本特征进行加权拼接处理,得到拼接特征;根据拼接特征,对噪声图像特征进行去噪处理以及解码处理,得到生成图像。
其中,将基础图像、叠加图像以及叠加参数,输入图像生成模型,获取图像生成模型输出的生成图像,由于图像生成模型的准确度较高,因此,能够生成准确度较高的生成图像,且生成速度快,进一步提高图像生成效率。
步骤1105,显示生成图像,在生成图像周边显示编辑本图像控件,用于指示以生成图像为基础图像重新生成图像。
在本公开实施例中,如图9所示,在图9中,显示生成图像,即,生成的机器狗图像。在图9中,生成图像下方显示有编辑本图像控件,即,“编辑本图片”控件,在生成图像不满足对象的需求,例如缺少元素或者元素需要调整时,方便以生成图像为基础图像,进一步进行图像生成处理。
步骤1106,在检测到针对编辑本图像控件的选中操作的情况下,确定接收到以生成图像为基础图像的图像叠加请求。
步骤1107,根据图像叠加请求,显示图像叠加界面,图像叠加界面的设置区域中显示作为基础图像的生成图像、生成所述生成图像时用到的叠加参数。
在本公开实施例中,可选的,该图像叠加界面的设置区域中也可以显示生成所述生成图像时用到的叠加图像,方便参考。
步骤1108,根据对象在设置区域中的操作,设置叠加图像,或者,设置叠加图像以及进行叠加参数调整。
在本公开实施例中,一种示例中,电子设备可以根据对象在设置区域中的操作,设置叠加图像,复用生成所述生成图像时的叠加参数。另一种示例中,电子设备可以根据对象在设置区域中的操作,设置叠加图像,并对图像叠加界面中显示的叠加参数进行调整处理。
步骤1109,在接收到图像生成请求的情况下,根据作为基础图像的生成图像、设置的叠加图像以及调整后的叠加参数,进行图像生成处理,得到新的生成图像。
其中,需要说明的是,步骤1101至步骤1104的详细内容,可以参考图1所示实施例中的步骤101至步骤104,此处不再进行详细说明。
本公开实施例的图像生成方法,通过获取图像叠加请求,图像叠加请求包括:基础图像;根据图像叠加请求,显示图像叠加界面,图像叠加界面中包括设置区域,设置区域用于设置基础图像、叠加图像以及叠加参数;根据对象在设置区域中的操作,确定对象所设置的叠加图像以及叠加参数;在接收到图像生成请求的情况下,根据基础图像、叠加图像以及叠加参数,进行图像生成处理,得到生成图像;显示生成图像,在生成图像周边显示编辑本图像控件,用于指示以生成图像为基础图像重新生成图像;在检测到针对编辑本图像控件的选中操作的情况下,确定接收到以生成图像为基础图像的图像叠加请求;根据图像叠加请求,显示图像叠加界面,图像叠加界面的设置区域中显示作为基础图像的生成图像、生成所述生成图像时用到的叠加参数;根据对象在设置区域中的操作,设置叠加图像,或者,设置叠加图像以及进行叠加参数调整;在接收到图像生成请求的情况下,根据作为基础图像的生成图像、设置的叠加图像以及调整后的叠加参数,进行图像生成处理,得到新的生成图像,对使用者的要求较低,不需要使用者具备制图基础以及图像的设计能力,且使用简单,能够为使用者提供图像连续编辑或者连续生成功能,提高了图像生成效率。
为了实现上述实施例,本公开还提供一种图像生成装置。如图12所示,图12是根据本公开第四实施例的示意图。该图像生成装置120,可以包括:获取模块1201、第一显示模块1202、第一确定模块1203和第一生成模块1204。
其中,获取模块1201,用于获取图像叠加请求,所述图像叠加请求包括:基础图像;
第一显示模块1202,用于根据所述图像叠加请求,显示图像叠加界面,所述图像叠加界面中包括设置区域,所述设置区域用于设置所述基础图像、叠加图像以及叠加参数;
第一确定模块1203,用于根据对象在所述设置区域中的操作,确定所述对象所设置的叠加图像以及叠加参数;
第一生成模块1204,用于在接收到图像生成请求的情况下,根据所述基础图像、所述叠加图像以及所述叠加参数,进行图像生成处理,得到生成图像。
作为本公开实施例的一种可能实现方式,所述基础图像,为原始图像,或者历史图像生成任务中的历史生成图像。
作为本公开实施例的一种可能实现方式,所述获取模块1201具体用于,显示图像编辑界面,所述图像编辑界面包括图像叠加控件;在检测到针对所述图像叠加控件的选中操作的情况下,显示所述图像叠加界面;根据所述对象在所述图像叠加界面的设置区域中的操作,确定所述对象设置有基础图像的情况下,确定获取到所述图像叠加请求。
作为本公开实施例的一种可能实现方式,根据所述对象在所述图像叠加界面的设置区域中的操作,确定所述对象设置有基础图像的方式,包括:在检测到所述设置区域中所述对象的基础图像选择操作的情况下,显示本地图像库以及生成图像库;所述本地图像库中包括本地的原始图像;所述生成图像库中包括历史生成图像;将所述本地图像库或者所述生成图像库中所述对象选中的图像,作为所述基础图像。
作为本公开实施例的一种可能实现方式,所述获取模块1201具体用于,显示图像处理界面,所述图像处理界面包括图像编辑控件、图像创作控件以及图像生成任务列表;所述图像生成任务列表中包括至少一个历史图像生成任务;在检测到针对所述图像生成任务列表中第一历史图像生成任务的选中操作的情况下,显示图像创建界面,并在所述图像创建界面中显示所述第一历史图像生成任务中的第一历史生成图像;在检测到针对所述第一历史生成图像周边的编辑本图像控件的选中操作的情况下,确定获取到以所述第一历史生成图像为基础图像的图像叠加请求。
作为本公开实施例的一种可能实现方式,所述图像叠加界面的所述设置区域中,显示生成所述第一历史生成图像时用到的第一历史叠加参数。
作为本公开实施例的一种可能实现方式,所述装置还包括:第二显示模块和第三显示模块;所述第二显示模块,用于显示所述生成图像,在所述生成图像周边显示编辑本图像控件,用于指示以所述生成图像为基础图像重新生成图像;所述第三显示模块,用于锁定所述图像叠加界面的所述设置区域,并在所述图像叠加界面中显示再次编辑控件。
作为本公开实施例的一种可能实现方式,所述装置还包括:第二确定模块、第一解锁模块、第一调整模块和第二生成模块;所述第二确定模块,用于在检测到针对所述再次编辑控件的选中操作的情况下,确定接收到针对所述生成图像的再次编辑请求;所述第一解锁模块,用于解锁所述图像叠加界面中的所述设置区域;所述第一调整模块,用于根据所述对象在所述设置区域中的操作,对所述设置区域中的基础图像、叠加图像以及叠加参数中的至少一种进行调整;所述第二生成模块,用于在接收到图像生成请求的情况下,根据调整后的基础图像、调整后的叠加图像以及调整后的叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
作为本公开实施例的一种可能实现方式,所述装置还包括:第三确定模块、第二解锁模块和第三生成模块;所述第三确定模块,用于在检测到针对所述再次编辑控件的选中操作的情况下,确定接收到针对所述生成图像的再次编辑请求;所述第二解锁模块,用于解锁所述图像叠加界面中的所述设置区域;所述第三生成模块,用于在接收到图像生成请求的情况下,根据所述设置区域中的所述基础图像、所述叠加图像以及所述叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
作为本公开实施例的一种可能实现方式,所述装置还包括:第四确定模块、第四显示模块、第二调整模块和第四生成模块;所述第四确定模块,用于在检测到针对所述编辑本图像控件的选中操作的情况下,确定接收到以所述生成图像为基础图像的图像叠加请求;所述第四显示模块,用于根据所述图像叠加请求,显示图像叠加界面,所述图像叠加界面的设置区域中显示作为基础图像的所述生成图像、生成所述生成图像时用到的叠加参数;所述第二调整模块,用于根据所述对象在所述设置区域中的操作,设置叠加图像,或者,设置叠加图像以及进行叠加参数调整;所述第四生成模块,用于在接收到图像生成请求的情况下,根据作为基础图像的所述生成图像、设置的叠加图像以及调整后的叠加参数,进行图像生成处理,得到新的生成图像。
作为本公开实施例的一种可能实现方式,所述装置还包括:更新模块,用于根据所述基础图像、所述叠加图像、所述叠加参数以及所述生成图像,对图像生成任务列表进行更新处理。
作为本公开实施例的一种可能实现方式,所述叠加参数包括以下至少一种:用于描述所述生成图像的描述文本、所述基础图像的影响权重、所述叠加图像的影响权重、所述描述文本的影响权重、所述生成图像的尺寸信息、所述生成图像的图像数量。
作为本公开实施例的一种可能实现方式,所述叠加图像的数量为一个或者多个。
作为本公开实施例的一种可能实现方式,所述第一生成模块具体用于,将所述基础图像、所述叠加图像以及所述叠加参数,输入图像生成模型,获取所述图像生成模型输出的所述生成图像。
作为本公开实施例的一种可能实现方式,所述叠加参数包括:用于描述所述生成图像的描述文本、所述基础图像的影响权重、所述叠加图像的影响权重、所述描述文本的影响权重;所述图像生成模型根据所述基础图像、所述叠加图像以及所述叠加参数进行图像生成的过程为,对所述基础图像以及所述叠加图像进行图像特征提取处理,得到所述基础图像的图像特征以及所述叠加图像的图像特征;对所述描述文本进行文本特征提取处理,得到所述描述文本的文本特征;按照所述影响权重,对多个所述图像特征以及所述文本特征进行加权拼接处理,得到拼接特征;根据所述拼接特征,对噪声图像特征进行去噪处理以及解码处理,得到所述生成图像。
本公开实施例的图像生成装置,通过获取图像叠加请求,图像叠加请求包括:基础图像;根据图像叠加请求,显示图像叠加界面,图像叠加界面中包括设置区域,设置区域用于设置基础图像、叠加图像以及叠加参数;根据对象在设置区域中的操作,确定对象所设置的叠加图像以及叠加参数;在接收到图像生成请求的情况下,根据基础图像、叠加图像以及叠加参数,进行图像生成处理,得到生成图像,对使用者的要求较低,不需要使用者具备制图基础以及图像的设计能力,且使用简单,提高了图像生成效率。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均在征得用户同意的前提下进行,并且均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图13示出了可以用来实施本公开的实施例的示例电子设备1300的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图13所示,设备1300包括计算单元1301,其可以根据存储在只读存储器(ROM)1302中的计算机程序或者从存储单元1308加载到随机访问存储器(RAM)1303中的计算机程序,来执行各种适当的动作和处理。在RAM 1303中,还可存储设备1300操作所需的各种程序和数据。计算单元1301、ROM 1302以及RAM 1303通过总线1304彼此相连。输入/输出(I/O)接口1305也连接至总线1304。
设备1300中的多个部件连接至I/O接口1305,包括:输入单元1306,例如键盘、鼠标等;输出单元1307,例如各种类型的显示器、扬声器等;存储单元1308,例如磁盘、光盘等;以及通信单元1309,例如网卡、调制解调器、无线通信收发机等。通信单元1309允许设备1300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1301的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1301执行上文所描述的各个方法和处理,例如图像生成方法。例如,在一些实施例中,图像生成方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1308。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1302和/或通信单元1309而被载入和/或安装到设备1300上。当计算机程序加载到RAM 1303并由计算单元1301执行时,可以执行上文描述的图像生成方法的一个或多个步骤。备选地,在其他实施例中,计算单元1301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像生成方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (33)

1.一种图像生成方法,所述方法包括:
获取图像叠加请求,所述图像叠加请求包括:基础图像;
根据所述图像叠加请求,显示图像叠加界面,所述图像叠加界面中包括设置区域,所述设置区域用于设置所述基础图像、叠加图像以及叠加参数;
根据对象在所述设置区域中的操作,确定所述对象所设置的叠加图像以及叠加参数;
在接收到图像生成请求的情况下,根据所述基础图像、所述叠加图像以及所述叠加参数,进行图像生成处理,得到生成图像。
2.根据权利要求1所述的方法,其中,所述基础图像,为原始图像,或者历史图像生成任务中的历史生成图像。
3.根据权利要求1或2所述的方法,其中,所述获取图像叠加请求,包括:
显示图像编辑界面,所述图像编辑界面包括图像叠加控件;
在检测到针对所述图像叠加控件的选中操作的情况下,显示所述图像叠加界面;
根据所述对象在所述图像叠加界面的设置区域中的操作,确定所述对象设置有基础图像的情况下,确定获取到所述图像叠加请求。
4.根据权利要求3所述的方法,其中,根据所述对象在所述图像叠加界面的设置区域中的操作,确定所述对象设置有基础图像的方式,包括:
在检测到所述设置区域中所述对象的基础图像选择操作的情况下,显示本地图像库以及生成图像库;所述本地图像库中包括本地的原始图像;所述生成图像库中包括历史生成图像;
将所述本地图像库或者所述生成图像库中所述对象选中的图像,作为所述基础图像。
5.根据权利要求1或2所述的方法,其中,所述获取图像叠加请求,包括:
显示图像处理界面,所述图像处理界面包括图像编辑控件、图像创作控件以及图像生成任务列表;所述图像生成任务列表中包括至少一个历史图像生成任务;
在检测到针对所述图像生成任务列表中第一历史图像生成任务的选中操作的情况下,显示图像创建界面,并在所述图像创建界面中显示所述第一历史图像生成任务中的第一历史生成图像;
在检测到针对所述第一历史生成图像周边的编辑本图像控件的选中操作的情况下,确定获取到以所述第一历史生成图像为基础图像的图像叠加请求。
6.根据权利要求5所述的方法,其中,所述图像叠加界面的所述设置区域中,显示生成所述第一历史生成图像时用到的第一历史叠加参数。
7.根据权利要求1所述的方法,其中,所述方法还包括:
显示所述生成图像,在所述生成图像周边显示编辑本图像控件,用于指示以所述生成图像为基础图像重新生成图像;
锁定所述图像叠加界面的所述设置区域,并在所述图像叠加界面中显示再次编辑控件。
8.根据权利要求7所述的方法,其中,所述方法还包括:
在检测到针对所述再次编辑控件的选中操作的情况下,确定接收到针对所述生成图像的再次编辑请求;
解锁所述图像叠加界面中的所述设置区域;
根据所述对象在所述设置区域中的操作,对所述设置区域中的基础图像、叠加图像以及叠加参数中的至少一种进行调整;
在接收到图像生成请求的情况下,根据调整后的基础图像、调整后的叠加图像以及调整后的叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
9.根据权利要求7所述的方法,其中,所述方法还包括:
在检测到针对所述再次编辑控件的选中操作的情况下,确定接收到针对所述生成图像的再次编辑请求;
解锁所述图像叠加界面中的所述设置区域;
在接收到图像生成请求的情况下,根据所述设置区域中的所述基础图像、所述叠加图像以及所述叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
10.根据权利要求7所述的方法,其中,所述方法还包括:
在检测到针对所述编辑本图像控件的选中操作的情况下,确定接收到以所述生成图像为基础图像的图像叠加请求;
根据所述图像叠加请求,显示图像叠加界面,所述图像叠加界面的设置区域中显示作为基础图像的所述生成图像、生成所述生成图像时用到的叠加参数;
根据所述对象在所述设置区域中的操作,设置叠加图像,或者,设置叠加图像以及进行叠加参数调整;
在接收到图像生成请求的情况下,根据作为基础图像的所述生成图像、设置的叠加图像以及调整后的叠加参数,进行图像生成处理,得到新的生成图像。
11.根据权利要求1所述的方法,其中,所述方法还包括:
根据所述基础图像、所述叠加图像、所述叠加参数以及所述生成图像,对图像生成任务列表进行更新处理。
12.根据权利要求1所述的方法,其中,所述叠加参数包括以下至少一种:
用于描述所述生成图像的描述文本、所述基础图像的影响权重、所述叠加图像的影响权重、所述描述文本的影响权重、所述生成图像的尺寸信息、所述生成图像的图像数量。
13.根据权利要求1所述的方法,其中,所述叠加图像的数量为一个或者多个。
14.根据权利要求1所述的方法,其中,所述根据所述基础图像、所述叠加图像以及所述叠加参数,进行图像生成处理,得到生成图像,包括:
将所述基础图像、所述叠加图像以及所述叠加参数,输入图像生成模型,获取所述图像生成模型输出的所述生成图像。
15.根据权利要求14所述的方法,其中,所述叠加参数包括:用于描述所述生成图像的描述文本、所述基础图像的影响权重、所述叠加图像的影响权重、所述描述文本的影响权重;
所述图像生成模型根据所述基础图像、所述叠加图像以及所述叠加参数进行图像生成的过程为,
对所述基础图像以及所述叠加图像进行图像特征提取处理,得到所述基础图像的图像特征以及所述叠加图像的图像特征;
对所述描述文本进行文本特征提取处理,得到所述描述文本的文本特征;
按照所述影响权重,对多个所述图像特征以及所述文本特征进行加权拼接处理,得到拼接特征;
根据所述拼接特征,对噪声图像特征进行去噪处理以及解码处理,得到所述生成图像。
16.一种图像生成装置,所述装置包括:
获取模块,用于获取图像叠加请求,所述图像叠加请求包括:基础图像;
第一显示模块,用于根据所述图像叠加请求,显示图像叠加界面,所述图像叠加界面中包括设置区域,所述设置区域用于设置所述基础图像、叠加图像以及叠加参数;
第一确定模块,用于根据对象在所述设置区域中的操作,确定所述对象所设置的叠加图像以及叠加参数;
第一生成模块,用于在接收到图像生成请求的情况下,根据所述基础图像、所述叠加图像以及所述叠加参数,进行图像生成处理,得到生成图像。
17.根据权利要求16所述的装置,其中,所述基础图像,为原始图像,或者历史图像生成任务中的历史生成图像。
18.根据权利要求16或17所述的装置,其中,所述获取模块具体用于,
显示图像编辑界面,所述图像编辑界面包括图像叠加控件;
在检测到针对所述图像叠加控件的选中操作的情况下,显示所述图像叠加界面;
根据所述对象在所述图像叠加界面的设置区域中的操作,确定所述对象设置有基础图像的情况下,确定获取到所述图像叠加请求。
19.根据权利要求18所述的装置,其中,根据所述对象在所述图像叠加界面的设置区域中的操作,确定所述对象设置有基础图像的方式,包括:
在检测到所述设置区域中所述对象的基础图像选择操作的情况下,显示本地图像库以及生成图像库;所述本地图像库中包括本地的原始图像;所述生成图像库中包括历史生成图像;
将所述本地图像库或者所述生成图像库中所述对象选中的图像,作为所述基础图像。
20.根据权利要求16或17所述的装置,其中,所述获取模块具体用于,
显示图像处理界面,所述图像处理界面包括图像编辑控件、图像创作控件以及图像生成任务列表;所述图像生成任务列表中包括至少一个历史图像生成任务;
在检测到针对所述图像生成任务列表中第一历史图像生成任务的选中操作的情况下,显示图像创建界面,并在所述图像创建界面中显示所述第一历史图像生成任务中的第一历史生成图像;
在检测到针对所述第一历史生成图像周边的编辑本图像控件的选中操作的情况下,确定获取到以所述第一历史生成图像为基础图像的图像叠加请求。
21.根据权利要求20所述的装置,其中,所述图像叠加界面的所述设置区域中,显示生成所述第一历史生成图像时用到的第一历史叠加参数。
22.根据权利要求16所述的装置,其中,所述装置还包括:第二显示模块和第三显示模块;
所述第二显示模块,用于显示所述生成图像,在所述生成图像周边显示编辑本图像控件,用于指示以所述生成图像为基础图像重新生成图像;
所述第三显示模块,用于锁定所述图像叠加界面的所述设置区域,并在所述图像叠加界面中显示再次编辑控件。
23.根据权利要求22所述的装置,其中,所述装置还包括:第二确定模块、第一解锁模块、第一调整模块和第二生成模块;
所述第二确定模块,用于在检测到针对所述再次编辑控件的选中操作的情况下,确定接收到针对所述生成图像的再次编辑请求;
所述第一解锁模块,用于解锁所述图像叠加界面中的所述设置区域;
所述第一调整模块,用于根据所述对象在所述设置区域中的操作,对所述设置区域中的基础图像、叠加图像以及叠加参数中的至少一种进行调整;
所述第二生成模块,用于在接收到图像生成请求的情况下,根据调整后的基础图像、调整后的叠加图像以及调整后的叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
24.根据权利要求22所述的装置,其中,所述装置还包括:第三确定模块、第二解锁模块和第三生成模块;
所述第三确定模块,用于在检测到针对所述再次编辑控件的选中操作的情况下,确定接收到针对所述生成图像的再次编辑请求;
所述第二解锁模块,用于解锁所述图像叠加界面中的所述设置区域;
所述第三生成模块,用于在接收到图像生成请求的情况下,根据所述设置区域中的所述基础图像、所述叠加图像以及所述叠加参数,进行图像生成处理,得到再次编辑后的生成图像。
25.根据权利要求22所述的装置,其中,所述装置还包括:第四确定模块、第四显示模块、第二调整模块和第四生成模块;
所述第四确定模块,用于在检测到针对所述编辑本图像控件的选中操作的情况下,确定接收到以所述生成图像为基础图像的图像叠加请求;
所述第四显示模块,用于根据所述图像叠加请求,显示图像叠加界面,所述图像叠加界面的设置区域中显示作为基础图像的所述生成图像、生成所述生成图像时用到的叠加参数;
所述第二调整模块,用于根据所述对象在所述设置区域中的操作,设置叠加图像,或者,设置叠加图像以及进行叠加参数调整;
所述第四生成模块,用于在接收到图像生成请求的情况下,根据作为基础图像的所述生成图像、设置的叠加图像以及调整后的叠加参数,进行图像生成处理,得到新的生成图像。
26.根据权利要求16所述的装置,其中,所述装置还包括:更新模块,用于根据所述基础图像、所述叠加图像、所述叠加参数以及所述生成图像,对图像生成任务列表进行更新处理。
27.根据权利要求16所述的装置,其中,所述叠加参数包括以下至少一种:
用于描述所述生成图像的描述文本、所述基础图像的影响权重、所述叠加图像的影响权重、所述描述文本的影响权重、所述生成图像的尺寸信息、所述生成图像的图像数量。
28.根据权利要求16所述的装置,其中,所述叠加图像的数量为一个或者多个。
29.根据权利要求16所述的装置,其中,所述第一生成模块具体用于,
将所述基础图像、所述叠加图像以及所述叠加参数,输入图像生成模型,获取所述图像生成模型输出的所述生成图像。
30.根据权利要求29所述的装置,其中,所述叠加参数包括:用于描述所述生成图像的描述文本、所述基础图像的影响权重、所述叠加图像的影响权重、所述描述文本的影响权重;
所述图像生成模型根据所述基础图像、所述叠加图像以及所述叠加参数进行图像生成的过程为,
对所述基础图像以及所述叠加图像进行图像特征提取处理,得到所述基础图像的图像特征以及所述叠加图像的图像特征;
对所述描述文本进行文本特征提取处理,得到所述描述文本的文本特征;
按照所述影响权重,对多个所述图像特征以及所述文本特征进行加权拼接处理,得到拼接特征;
根据所述拼接特征,对噪声图像特征进行去噪处理以及解码处理,得到所述生成图像。
31.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至15中任一项所述的方法。
32.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至15中任一项所述的方法。
33.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至15中任一项所述的方法。
CN202310343529.2A 2023-03-31 2023-03-31 图像生成方法、装置及电子设备 Active CN116363260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310343529.2A CN116363260B (zh) 2023-03-31 2023-03-31 图像生成方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310343529.2A CN116363260B (zh) 2023-03-31 2023-03-31 图像生成方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN116363260A true CN116363260A (zh) 2023-06-30
CN116363260B CN116363260B (zh) 2024-05-17

Family

ID=86936336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310343529.2A Active CN116363260B (zh) 2023-03-31 2023-03-31 图像生成方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116363260B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243119A (zh) * 2015-09-29 2016-01-13 百度在线网络技术(北京)有限公司 确定图像的待叠加区域、叠加图像、图片呈现方法和装置
CN106899878A (zh) * 2017-03-21 2017-06-27 电子科技大学 一种基于omap芯片的透明度可调的视频图像叠加方法及***
CN110365907A (zh) * 2019-07-26 2019-10-22 维沃移动通信有限公司 一种拍照方法、装置及电子设备
CN113822784A (zh) * 2021-07-06 2021-12-21 腾讯科技(深圳)有限公司 图像处理方法以及装置
CN115408562A (zh) * 2021-05-26 2022-11-29 阿里巴巴新加坡控股有限公司 目标对象的搜索方法和图像的搜索方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243119A (zh) * 2015-09-29 2016-01-13 百度在线网络技术(北京)有限公司 确定图像的待叠加区域、叠加图像、图片呈现方法和装置
US20180197302A1 (en) * 2015-09-29 2018-07-12 Baidu Online Network Technology (Beijing) Co. Ltd. Method and apparatus for determining to-be-superimposed area of image, superimposing image and presenting picture
CN106899878A (zh) * 2017-03-21 2017-06-27 电子科技大学 一种基于omap芯片的透明度可调的视频图像叠加方法及***
CN110365907A (zh) * 2019-07-26 2019-10-22 维沃移动通信有限公司 一种拍照方法、装置及电子设备
CN115408562A (zh) * 2021-05-26 2022-11-29 阿里巴巴新加坡控股有限公司 目标对象的搜索方法和图像的搜索方法
CN113822784A (zh) * 2021-07-06 2021-12-21 腾讯科技(深圳)有限公司 图像处理方法以及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DAVID A. LATTANZI等: "A Prototype Imaging and Visualization System for Robotic Infrastructure Inspection", STRUCTURES CONGRESS 2013, 10 May 2013 (2013-05-10), pages 1 - 12 *
赵维娜等: "机载视频叠加单元的设计与实现", 电子设计工程, vol. 22, no. 21, pages 145 - 148 *

Also Published As

Publication number Publication date
CN116363260B (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
CN114792355B (zh) 虚拟形象生成方法、装置、电子设备和存储介质
CN112802037A (zh) 人像提取方法、装置、电子设备及存储介质
US20230005171A1 (en) Visual positioning method, related apparatus and computer program product
CN113923474B (zh) 视频帧处理方法、装置、电子设备以及存储介质
CN113780297B (zh) 图像处理方法、装置、设备以及存储介质
CN113657518A (zh) 训练方法、目标图像检测方法、装置、电子设备以及介质
CN113344213A (zh) 知识蒸馏方法、装置、电子设备及计算机可读存储介质
CN116205819B (zh) 字符图像生成方法、深度学习模型的训练方法和装置
CN116363260B (zh) 图像生成方法、装置及电子设备
CN112990046B (zh) 差异信息获取方法、相关装置及计算机程序产品
CN114445682A (zh) 训练模型的方法、装置、电子设备、存储介质及产品
CN115082298A (zh) 图像生成方法、装置、电子设备以及存储介质
CN114119990A (zh) 用于图像特征点匹配的方法、装置及计算机程序产品
CN114358198A (zh) 实例分割方法、装置及电子设备
CN113379750A (zh) 语义分割模型的半监督学习方法、相关装置及产品
CN113361535A (zh) 图像分割模型训练、图像分割方法及相关装置
CN112991451A (zh) 图像识别方法、相关装置及计算机程序产品
CN114791996B (zh) 信息处理方法、装置、***、电子设备及存储介质
CN113900734B (zh) 一种应用程序文件配置方法、装置、设备及存储介质
CN116071422B (zh) 面向元宇宙场景的虚拟设备亮度调节方法、装置
CN114494818B (zh) 图像处理方法、模型训练方法、相关装置及电子设备
CN116543075B (zh) 图像生成方法、装置、电子设备及存储介质
CN114051110B (zh) 视频生成方法、装置、电子设备和存储介质
CN116824609B (zh) 文档版式检测方法、装置和电子设备
CN111797933B (zh) 模板匹配的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant