CN108491825A - 信息生成方法和装置 - Google Patents

信息生成方法和装置 Download PDF

Info

Publication number
CN108491825A
CN108491825A CN201810296449.5A CN201810296449A CN108491825A CN 108491825 A CN108491825 A CN 108491825A CN 201810296449 A CN201810296449 A CN 201810296449A CN 108491825 A CN108491825 A CN 108491825A
Authority
CN
China
Prior art keywords
image
article
foreground
goods categories
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810296449.5A
Other languages
English (en)
Inventor
包英泽
周仁义
覃曾攀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810296449.5A priority Critical patent/CN108491825A/zh
Publication of CN108491825A publication Critical patent/CN108491825A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了信息生成方法和装置。该方法的一具体实施方式包括:获取存放有物品的目标货架的第一图像;将第一图像与预先存储的第二图像进行比较,基于比较结果,从第一图像中提取与第二图像不同的图像区域作为前景图像,其中,第二图像为未存放物品的目标货架的图像;对前景图像进行分析,确定前景图像中呈现的物品的物品类别;基于所确定的物品类别,生成前景图像中呈现的物品的物品信息。该实施方式可以清晰的呈现目标货架上的物品,提高工作人员的工作效率。

Description

信息生成方法和装置
技术领域
本申请实施例涉及计算机技术领域,具体涉及信息生成方法和装置。
背景技术
随着人工智能技术的发展,人工智能技术在多个方面为用户带来了许多便利。将人工技术应用于便利超市等可以提高工作人员的工作效率,同时提高顾客体验。
现有的便利超市中,通常是工作人员按照货物类别将物品放置于指定的货架上以供顾客对货物进行挑选。
发明内容
本申请实施例提出了信息生成方法和装置。
第一方面,本申请实施例提供了一种信息生成方法,该方法包括:获取存放有物品的目标货架的第一图像;将第一图像与预先存储的第二图像进行比较,基于比较结果,从第一图像中提取与第二图像不同的图像区域作为前景图像,其中,第二图像为未存放物品的目标货架的图像;对前景图像进行分析,确定前景图像中呈现的物品的物品类别;基于所确定的物品类别,生成前景图像中呈现的物品的物品信息。
在一些实施例中,将深度图像与预先存储的第二深度图像进行比较,基于比较结果,从第一深度图像中提取与第二深度图像不同的区域作为前景图像,包括:分别对第一图像以及第二图像进行图像分割,得到分割后的第一图像以及分割后的第二图像;将分割后的第一图像与分割后的第二图像进行比较,确定分割后的第一图像中与分割后的第二图像不同的色值区域;从第一图像中提取不同的色值区域对应的图像;确定提取后的图像为前景图像。
在一些实施例中,对前景图像进行分析,确定前景图像中呈现的物品的物品类别,包括:将前景图像输入至预先训练的分类模型中,得到分类结果,其中,分类结果包括前景图像中呈现的物品分别属于预设的物品类别集合中的物品类别的概率,分类模型用于表征图像与分类结果之间的对应关系;基于所得到的分类结果,确定前景图像中呈现的物品的物品类别。
在一些实施例中,分类模型通过以步骤训练得到:获取训练样本集合,训练样本包括样本物品图像以及样本物品图像的标注信息,其中,标注信息包括样本物品图像中呈现的物品的类别;将训练样本集合中的每个训练样本的样本物品图像分别输入至初始分类模型,得到预测结果,其中,预测结果包括样本物品图像中呈现的物品属于预设物品类别的概率;基于所得到的预测结果以及与所得到的预测结果对应的样本物品图像的标注信息,对初始分类模型进行调整,直至初始分类模型达到预设的优化目标;将达到预设的优化目标的初始分类模型确定为分类模型。
在一些实施例中,基于所确定的物品类别,生成前景图像中的物品的物品信息,包括:确定预先存储的、与所确定的物品类别对应的物品的物品标识和体积信息;基于所确定的物品类别、与所确定的物品类别对应的物品的物品标识和体积信息,生成前景图像中呈现的物品的物品信息。
第二方面,本申请实施例提供了一种信息生成的装置,该装置包括:获取单元,配置用于获取存放有物品的目标货架的第一图像;提取单元,配置用于将第一图像与预先存储的第二图像进行比较,基于比较结果,从第一图像中提取与第二图像不同的图像区域作为前景图像,其中,第二图像为未存放物品的目标货架的图像;确定单元,配置用于对前景图像进行分析,确定前景图像中呈现的物品的物品类别;生成单元,配置用于基于所确定的物品类别,生成前景图像中呈现的物品的物品信息。
在一些实施例中,提取单元进一步配置用于:分别对第一图像以及第二图像进行图像分割,得到分割后的第一图像以及分割后的第二图像;将分割后的第一图像与分割后的第二图像进行比较,确定分割后的第一图像中与分割后的第二图像不同的色值区域;从第一图像中提取不同的色值区域对应的图像;确定提取后的图像为前景图像。
在一些实施例中,确定单元进一步配置用于:将前景图像输入至预先训练的分类模型中,得到分类结果,其中,分类结果包括前景图像中呈现的物品分别属于预设的物品类别集合中的物品类别的概率,分类模型用于表征图像与分类结果之间的对应关系;基于所得到的分类结果,确定前景图像中呈现的物品的物品类别。
在一些实施例中,分类模型通过以步骤训练得到:获取训练样本集合,训练样本包括样本物品图像以及样本物品图像的标注信息,其中,标注信息包括样本物品图像中呈现的物品的类别;将训练样本集合中的每个训练样本的样本物品图像分别输入至初始分类模型,得到预测结果,其中,预测结果包括样本物品图像中呈现的物品属于预设物品类别的概率;基于所得到的预测结果以及与所得到的预测结果对应的样本物品图像的标注信息,对初始分类模型进行调整,直至初始分类模型达到预设的优化目标;将达到预设的优化目标的初始分类模型确定为分类模型。
在一些实施例中,生成单元进一步配置用于:确定预先存储的、与所确定的物品类别对应的物品的物品标识和体积信息;基于所确定的物品类别、与所确定的物品类别对应的物品的物品标识和体积信息,生成前景图像中呈现的物品的物品信息。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本申请实施例提供的信息生成方法和装置,通过将存放有物品的目标货架的第一图像与未存放物品的目标货架的第二图像进行比较,根据比较结果,从第一图像中提取出与第二图像不同的区域,也即是第一图像中所呈现的物品的图像区域作为前景图像,然后对该前景图像进行分析,得到前景图像中呈现的物品的物品类别,最后根据所确定的物品类别,生成前景图像中呈现的物品的物品信息,从而使得目标货架上的物品可以清晰的呈现,提高工作人员的工作效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性***架构图;
图2是根据本申请的信息生成方法的一个实施例的流程图;
图3是根据本申请的信息生成方法的应用场景的一个示意图;
图4是根据本申请的信息生成方法的又一个实施例的流程图;
图5是根据本申请的信息生成的装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的电子设备的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的信息生成方法或信息生成的装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102,网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102通过网络103与服务器104交互,以接收或发送消息等。
终端设备101、102可以是硬件,也可以是软件。当终端设备101、102为硬件时,可以是支持图像拍摄功能或视频拍摄功能的各种电子设备,包括但不限于照相机、摄像机、摄像头等等。当终端设备101、102为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
服务器104可以是提供各种服务的服务器,例如对终端设备101、102上传的图像进行处理的图像处理服务器。图像处理服务器可以对接收到的目标货架的图像进行分析等处理,并生成处理结果(例如目标货架上呈现的物品的物品信息)。
需要说明的是,服务器104可以是硬件,也可以是软件。当服务器104为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器104为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本申请实施例所提供的信息生成方法一般由服务器104执行;当服务器104具有拍照功能时,也可以不需要终端设备101、102;当终端设备101、102具有数据分析计算能力时,也可以不需要服务器101。相应地,信息生成装置可以设置于服务器104中或终端设备101、102中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。在服务器104本地存储有待识别图像的情况下,***架构100可以不设置终端设备101、102。
继续参考图2,其示出了根据本申请的信息生成方法的一个实施例的流程200。该信息生成方法包括以下步骤:
步骤201,获取存放有物品的目标货架的第一图像。
在本实施例中,信息生成方法的执行主体(例如图1所示的服务器104)可以从本地或者与其通信连接的终端设备(例如图1所示的终端设备101、102)获取存放有物品的目标货架的第一图像。其中,终端设备可以是支持图像拍摄功能的各种电子设备,包括但不限于照相机、摄像机、摄像头等。在这里,该目标货架的第一图像通常包括彩色图像(RGB图像)、深度图像(Depth图像)等。该目标货架例如可以包括但不限于位于超市内的货架、位于零售商铺内的货架等。该目标货架所存放物品可以包括同一类别的物品,可以包括多个类别的物品。在这里,该类别例如可以包括苹果、香蕉、汽水等等。
步骤202,将第一图像与预先存储的第二图像进行比较,基于比较结果,从第一图像中提取与第二图像不同的图像区域作为前景图像。
在本实施例中,上述执行主体中可以预先存储有第二图像。该第二图像为未存放物品的上述目标货架的图像。在这里,上述电子设备在获取第一图像的时,可以在预设角度下获取。通过对电子设备设置预设角度获取第一图像,可以使得目标货架在第一图像中的位置与目标货架在第二图像中的位置相同。
在本实施例中,根据步骤201所获取到的第一图像,上述执行主体可以将该第一图像与预先存储的第二图像进行比较。在这里,由于上述目标货架在第一图像中位置与上述目标货架在第二图像中的位置相同。因此,在目标货架的周围环境没有发生改变的情况下,上述第一图像与第二图像之间有区别的图像区域即为上述第一图像中的物品图像的图像区域。上述执行主体可以根据比较结果,从第一图像中提取与第二图像不同的图像区域作为前景图像。该前景图像也即为第一图像中呈现的物品的图像。
在本实施例中,上述执行主体可以利用位图(Bitmap)图像处理方法从第一图像中提取与第二图像不同的图像区域。以该方法为例,上述执行主体可以分别根据预先设置的扫描行数以及每行的像素数目对第一图像与第二图像中的像素进行逐行扫描,并将扫描的像素存储在像素列表中,得到基于第一图像的像素列表以及第二图像的像素列表。然后,上述执行主体可以对该两个像素列表进行比较,并记录第一图像与第二图像中不同的像素点。最后,从第一图像中提取与第二图像不同的像素点组成的图像作为前景图像。
步骤203,对前景图像进行分析,确定前景图像中呈现的物品的物品类别。
在本实施例中,根据步骤202所提取的前景图像,上述执行主体可以对前景图像进行分析,从而确定前景图像中呈现的物品的物品类别。
在本实施例中,上述对前景图像进行分析的方法例如可以包括对所获取到的前景图像进行图像识别。在这里,可以利用现有的基于形状特征的识别技术、基于色彩特征的识别技术或者基于纹理特征的识别技术等对前景图像识别。以形状特征的识别技术为例,上述执行主体可以首先确定前景图像中所呈现的物品的形状特征(例如面积、周长等),基于形状特征提取物品的形状特征向量。然后,将所提取的形状特征向量与预先存储的物品的形状特征向量集合进行相似度计算,根据计算结果,将相似度大于预设阈值的形状特征向量集合中的形状特征向量对应的物品的类别作为前景图像中所呈现的物品的物品类别。
步骤204,基于所确定的物品类别,生成前景图像中呈现的物品的物品信息。
在本实施例中,根据步骤203所确定的物品类别,上述执行主体可以将该物品类别作为前景图像中呈现的物品的物品信息
在本实施例的一些可选的实现方式中,上述执行主体基于预先设置的物品类别与物品标识之间的对应关系,根据所确定的物品类别,进一步确定与该物品类别关联的物品的物品标识以及物品的体积信息。在这里,该物品标识可以用于唯一确定该物品。通过物品标识,可以确定前景图像中同一类别的物品的数目,也可以确定物品的体积。
通过所确定的前景图像中呈现的物品的物品标识以及物品的体积,上述执行主体可以生成前景图像中呈现的物品的物品类别、物品标识以及物品体积信息的物品信息。通过生成上述物品信息,使得目标货架中所存储的物品信息可以更加清晰、具体的呈现。从而,工作人员可以根据目标货架上的物品的体积、数目来为目标货架分配物品。同时,在某些应用场景中,当一些物品没有摆放在其类别下的货架上时,工作人员通过此方法查询每个货架上的物品信息,从而将物品放置其所属的类别的货架中。从而使得每个货架可以更加有效的管理,提高了工作人员的工作效率。
继续参见图3,图3是根据本申请的信息生成方法的应用场景的一个示意图。在图3的应用场景中。摄像机301将获取到的存放有物品的“货架a”302的第一图像发送至服务器303。服务器303可以将该第一图像与预先存储的未存放物品的“货架a”的第二图像进行比较,根据比较结果,从第一图像中提取出与第二图像不同的图像区域作为前景图像304。接着,服务器303可以对前景图像304进行各种分析,例如图像特征提取等分析方法,确定前景图像304中呈现的物品的物品类别305为“苹果”、“桃子”。最后,服务器303可以根据确定的物品的类别,统计每一个类别的物品的数目,生成前景图像中呈现的物品的物品信息306“货架a存放有苹果2个、桃子2个”。
本申请实施例提供的信息生成方法,通过将存放有物品的目标货架的第一图像与未存放物品的目标货架的第二图像进行比较,根据比较结果,从第一图像中提取出与第二图像不同的区域,也即是第一图像中所呈现的物品的图像区域作为前景图像,然后对该前景图像进行分析,得到前景图像中呈现的物品的物品类别,最后根据所确定的物品类别,生成前景图像中呈现的物品的物品信息,从而使得目标货架上的物品可以清晰的呈现,提高工作人员的工作效率。
进一步参考图4,其示出了根据本申请的信息生成方法的又一个实施例的流程400。该信息生成方法的流程400,包括以下步骤:
步骤401,获取存放有物品的目标货架的第一图像。
在本实施例中,信息生成方法的执行主体(例如图1所示的服务器104)可以从本地或者与其通信连接的终端设备(例如图1所示的终端设备101、102)获取存放有物品的目标货架的第一图像。其中,终端设备可以是支持图像拍摄功能的各种电子设备,包括但不限于照相机、摄像机、摄像头等。在这里,该目标货架的第一图像通常包括彩色图像(RGB图像)、深度图像(Depth图像)等。该目标货架所存放物品可以包括同一类别的物品,可以包括多个类别的物品。
步骤402,分别对第一图像以及第二图像进行图像分割,得到分割后的第一图像以及分割后的第二图像。
在本实施例中,上述执行主体中预先存储有第二图像。该第二图像为上述目标货架未存放物品的图像。当上述执行主体根据步骤401获取到第一图像后,可以对第一图像以及第二图像进行图像分割,从而得到分割后的第一图像以及分割后的第二图像。在这里,由于位于货架上的物品与货架以及货架周围的环境具有不同的边缘、景深等。因此,在对第一图像分割时,通常可以将货架上的物品分割成单独的对象。通常,分割后的第一图像以及分割后的第二图像中的每个分割出的对象均为单一颜色的图像。也即是说,分割后的第一图像中被分割出的多个对象中每一个对象均由相同的色值表示。同理,分割后的第二图像也如此。
在这里,进行图像分割的方法例如可以包括现有的基于阈值的分割方法、基于边缘的分割方法、基于区域的分割方法、基于小波变换的分割方法、基于小波变换的分割方法等。以阈值分割方法为例,首先将上述第一图像以及第二图像转换为灰度图。然后,分别确定第一图像以及第二图像的直方图。从而,上述各图像的直方图确定各图像的最佳分割阈值(例如当直方图呈明显双峰时,可以选择两个峰值的中点作为最佳阈值)。最后,利用确定的阈值对第一图像以及第二图像进行分割。
步骤403,将分割后的第一图像与分割后的第二图像进行比较,确定分割后的第一图像中与分割后的第二图像不同的色值区域。
在本实施例中,基于步骤402所确定的分割后的第一图像以及分割后的第二图像,上述执行主体可以将分割后的第一图像与第二图像进行比较。由于第一图像与第二图像中均包括目标货架,在目标货架周围的环境不变的情况下,上述分割后的第一图像与分割后的第二图像不同的部分也即为第一图像中呈现的物品的部分。上述执行主体可以将分割后的第一图像中各对象的色值与分割后的第二图像中各对象的色值一一进行比较,从分割后的第一图像中确定出与分割后的第二图像具有不同色值的对象区域。
步骤404,从第一图像中提取不同的色值区域对应的图像。
在本实施例中,根据步骤403所确定的分割后的第一图像与分割后的第二图像不同的色值区域,上述执行主体可以从第一图像中提取出该不同的色值区域对应的图像。
步骤405,确定提取后的图像为前景图像。
在本实施例中,上述执行主体可以将提取后的图像作为前景图像。
步骤406,将前景图像输入至预先训练的分类模型中,得到分类结果。
在本实施例中,上述执行主体可以将步骤405得到的前景图像输入至预先训练的分类模型中,从而得到分类结果。在这里,该分类结果包括前景图像中呈现的物品分别属于预设的物品类别集合中的物品类别的概率。物品类别包括物品的名称、物品所属的品类等。例如,物品名称可以包括苹果、橘子、牛奶等。物品所属的品类例如可以包括水果、饮品等。在这里,该分类模型可以用于表征图像与分类结果之间的对应关系。
需要指出的是,分类模型可以是技术人员基于对大量的物品图像和分类结果的统计而预先制定的、存储有多个物品图像与分类结果的对应关系的对应关系表。
上述分类模型还可以通过对预设的初始分类模型进行训练,从而得到分类模型。在这里,该初始分类模型例如可以包括人工神经网络(例如卷积神经网络、循环神经网络等)。该人工神经网路可以具有现有的各种神经网络结构(例如DenseBox、VGGNet、ResNet、SegNet等)。上述分类模型可以是技术人员基于现有的人工神经网络进行有监督地训练而得到的。具体的,在本实施例中,上述分类模型可以通过如下步骤训练得到:
首先,获取训练样本集合。在这里,训练样本可以包括样本物品图像以及与样本物品图像对应的标注信息。其中,该标注信息包括样本物品图像中呈现的物品的类别。
然后,将训练样本集合中的至少一个训练样本的样本物品图像分别输入至初始分类模型,得到至少一个样本物品图像中的每个样本物品图像对应的多个概率值,该多个概率值用于表征样本物品图像中呈现的物品属于预设物品类别的概率。然后,将该多个概率值中最大的概率值对应的物品类别与对应的标注的物品类别进行比较,以确定初始分类模型是否达到预设的优化目标。预设的优化目标可以是初始分类模型的识别准确率达到预设阈值。作为示例,当上述最大概率值对应的物品类别与该样本物品图像的标注信息相同时,可以进一步确定该最大概率值是否达到预设阈值。在该最大概率值达到预设阈值时,可以确定初始分类模型是否达到预设的优化目标。如果初始分类模型达到预设的优化目标,则将上述初始分类模型确定为训练完成的分类模型。如果初始分类模型未达到预设的优化目标,可以利用反向传播算法以及梯度下降算法对初始分类模型的参数进行调整,直至调整后的初始分类模型达到预设的优化目标。
步骤407,基于所得到的分类结果,确定前景图像中呈现的物品的物品类别。
在本实施例中,上述执行主体可以基于所得到的分类结果,从分类结果中选择概率值最大的类别作为上述前景图像中的物品的物品类别。
步骤408,基于所确定的物品类别,生成前景图像中呈现的物品的物品信息。
在本实施例中,根据步骤407所确定的物品类别,上述执行主体可以将该物品类别作为前景图像中呈现的物品的物品信息
从图4中可以看出,与图2所示的实施例不同的是,本实施例通过图像分割将前景图像从第一图像中提取出来,同时采用分类模型对前景图像中呈现的物品进行分类,从而进一步提高了前景提取的精度以及对物品分类的精度。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种信息生成装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的信息生成的装置500可以包括:获取单元501、提取单元502、确定单元503和生成单元504。其中,获取单元501,配置用于获取存放有物品的目标货架的第一图像;提取单元502,配置用于将第一图像与预先存储的第二图像进行比较,基于比较结果,从第一图像中提取与第二图像不同的图像区域作为前景图像,其中,第二图像为未存放物品的目标货架的图像;确定单元503,配置用于对前景图像进行分析,确定前景图像中呈现的物品的物品类别;生成单元504,配置用于基于所确定的物品类别,生成前景图像中呈现的物品的物品信息。
在本实施例中,信息生成装置500中:获取单元501、提取单元502、确定单元503和生成单元504的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201、步骤202、步骤203和步骤204的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,提取单元502进一步配置用于:分别对第一图像以及第二图像进行图像分割,得到分割后的第一图像以及分割后的第二图像;将分割后的第一图像与分割后的第二图像进行比较,确定分割后的第一图像中与分割后的第二图像不同的色值区域;从第一图像中提取不同的色值区域对应的图像;确定提取后的图像为前景图像。
在一些实施例中,确定单元503进一步配置用于:将前景图像输入至预先训练的分类模型中,得到分类结果,其中,分类结果包括前景图像中呈现的物品分别属于预设的物品类别集合中的物品类别的概率,分类模型用于表征图像与分类结果之间的对应关系;基于所得到的分类结果,确定前景图像中呈现的物品的物品类别。
在一些实施例中,分类模型通过以步骤训练得到:获取训练样本集合,训练样本包括样本物品图像以及样本物品图像的标注信息,其中,标注信息包括样本物品图像中呈现的物品的类别;将训练样本集合中的每个训练样本的样本物品图像分别输入至初始分类模型,得到预测结果,其中,预测结果包括样本物品图像中呈现的物品属于预设物品类别的概率;基于所得到的预测结果以及与所得到的预测结果对应的样本物品图像的标注信息,对初始分类模型进行调整,直至初始分类模型达到预设的优化目标;将达到预设的优化目标的初始分类模型确定为分类模型。
在本实施例的一些可选的实现方式中,生成单元504进一步配置用于:确定预先存储的、与所确定的物品类别对应的物品的物品标识和体积信息;基于所确定的物品类别、与所确定的物品类别对应的物品的物品标识和体积信息,生成前景图像中呈现的物品的物品信息。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备(例如图1所示的终端设备或服务器)的计算机***600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有***600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向目标的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、提取单元、确定单元和生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取存放有物品的目标货架的第一图像的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取存放有物品的目标货架的第一图像;将第一图像与预先存储的第二图像进行比较,基于比较结果,从第一图像中提取与第二图像不同的图像区域作为前景图像,其中,第二图像为未存放物品的目标货架的图像;对前景图像进行分析,确定前景图像中呈现的物品的物品类别;基于所确定的物品类别,生成前景图像中呈现的物品的物品信息。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种信息生成方法,包括:
获取存放有物品的目标货架的第一图像;
将所述第一图像与预先存储的第二图像进行比较,基于比较结果,从所述第一图像中提取与所述第二图像不同的图像区域作为前景图像,其中,所述第二图像为未存放物品的所述目标货架的图像;
对所述前景图像进行分析,确定所述前景图像中呈现的物品的物品类别;
基于所确定的物品类别,生成所述前景图像中呈现的物品的物品信息。
2.根据权利要求1所述的方法,其中,所述将所述深度图像与预先存储的第二深度图像进行比较,基于比较结果,从所述第一深度图像中提取与所述第二深度图像不同的区域作为前景图像,包括:
分别对所述第一图像以及所述第二图像进行图像分割,得到分割后的第一图像以及分割后的第二图像;
将所述分割后的第一图像与所述分割后的第二图像进行比较,确定所述分割后的第一图像中与所述分割后的第二图像不同的色值区域;
从所述第一图像中提取所述不同的色值区域对应的图像;
确定提取后的图像为所述前景图像。
3.根据权利要求1所述的方法,其中,所述对所述前景图像进行分析,确定所述前景图像中呈现的物品的物品类别,包括:
将所述前景图像输入至预先训练的分类模型中,得到分类结果,其中,分类结果包括所述前景图像中呈现的物品分别属于预设的物品类别集合中的物品类别的概率,所述分类模型用于表征图像与分类结果之间的对应关系;
基于所得到的分类结果,确定所述前景图像中呈现的物品的物品类别。
4.根据权利要求3所述的方法,其中,所述分类模型通过以步骤训练得到:
获取训练样本集合,训练样本包括样本物品图像以及样本物品图像的标注信息,其中,标注信息包括样本物品图像中呈现的物品的类别;
将所述训练样本集合中的每个训练样本的样本物品图像分别输入至初始分类模型,得到预测结果,其中,预测结果包括样本物品图像中呈现的物品属于预设物品类别的概率;
基于所得到的预测结果以及与所得到的预测结果对应的样本物品图像的标注信息,对所述初始分类模型进行调整,直至所述初始分类模型达到预设的优化目标;
将达到预设的优化目标的初始分类模型确定为所述分类模型。
5.根据权利要求1所述的方法,其中,所述基于所确定的物品类别,生成所述前景图像中的物品的物品信息,包括:
确定预先存储的、与所确定的物品类别对应的物品的物品标识和体积信息;
基于所确定的物品类别、与所确定的物品类别对应的物品的物品标识和体积信息,生成所述前景图像中呈现的物品的物品信息。
6.一种信息生成装置,包括:
获取单元,配置用于获取存放有物品的目标货架的第一图像;
提取单元,配置用于将所述第一图像与预先存储的第二图像进行比较,基于比较结果,从所述第一图像中提取与所述第二图像不同的图像区域作为前景图像,其中,所述第二图像为未存放物品的所述目标货架的图像;
确定单元,配置用于对所述前景图像进行分析,确定所述前景图像中呈现的物品的物品类别;
生成单元,配置用于基于所确定的物品类别,生成所述前景图像中呈现的物品的物品信息。
7.根据权利要求6所述的装置,其中,所述提取单元进一步配置用于:
分别对所述第一图像以及所述第二图像进行图像分割,得到分割后的第一图像以及分割后的第二图像;
将所述分割后的第一图像与所述分割后的第二图像进行比较,确定所述分割后的第一图像中与所述分割后的第二图像不同的色值区域;
从所述第一图像中提取所述不同的色值区域对应的图像;
确定提取后的图像为所述前景图像。
8.根据权利要求6所述的装置,其中,所述确定单元进一步配置用于:
将所述前景图像输入至预先训练的分类模型中,得到分类结果,其中,分类结果包括所述前景图像中呈现的物品分别属于预设的物品类别集合中的物品类别的概率,所述分类模型用于表征图像与分类结果之间的对应关系;
基于所得到的分类结果,确定所述前景图像中呈现的物品的物品类别。
9.根据权利要求8所述的装置,其中,所述分类模型通过以步骤训练得到:
获取训练样本集合,训练样本包括样本物品图像以及样本物品图像的标注信息,其中,标注信息包括样本物品图像中呈现的物品的类别;
将所述训练样本集合中的每个训练样本的样本物品图像分别输入至初始分类模型,得到预测结果,其中,预测结果包括样本物品图像中呈现的物品属于预设物品类别的概率;
基于所得到的预测结果以及与所得到的预测结果对应的样本物品图像的标注信息,对所述初始分类模型进行调整,直至所述初始分类模型达到预设的优化目标;
将达到预设的优化目标的初始分类模型确定为所述分类模型。
10.根据权利要求6所述的装置,其中,所述生成单元进一步配置用于:
确定预先存储的、与所确定的物品类别对应的物品的物品标识和体积信息;
基于所确定的物品类别、与所确定的物品类别对应的物品的物品标识和体积信息,生成所述前景图像中呈现的物品的物品信息。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201810296449.5A 2018-03-30 2018-03-30 信息生成方法和装置 Pending CN108491825A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810296449.5A CN108491825A (zh) 2018-03-30 2018-03-30 信息生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810296449.5A CN108491825A (zh) 2018-03-30 2018-03-30 信息生成方法和装置

Publications (1)

Publication Number Publication Date
CN108491825A true CN108491825A (zh) 2018-09-04

Family

ID=63318115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810296449.5A Pending CN108491825A (zh) 2018-03-30 2018-03-30 信息生成方法和装置

Country Status (1)

Country Link
CN (1) CN108491825A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344752A (zh) * 2018-09-20 2019-02-15 北京字节跳动网络技术有限公司 用于处理嘴部图像的方法和装置
CN109977824A (zh) * 2019-03-15 2019-07-05 百度在线网络技术(北京)有限公司 物品取放识别方法、装置及设备
CN110443191A (zh) * 2019-08-01 2019-11-12 北京百度网讯科技有限公司 用于识别物品的方法和装置
CN110889419A (zh) * 2018-09-07 2020-03-17 杭州海康威视数字技术股份有限公司 一种货架分析方法、装置、***及电子设备
CN111311603A (zh) * 2018-12-12 2020-06-19 北京京东尚科信息技术有限公司 用于输出目标物体数目信息的方法和装置
CN111523545A (zh) * 2020-05-06 2020-08-11 青岛联合创智科技有限公司 一种结合深度信息的物品查找方法
CN112001662A (zh) * 2020-09-14 2020-11-27 支付宝(杭州)信息技术有限公司 一种商户图像的风险检验方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188743A (zh) * 2007-09-17 2008-05-28 深圳先进技术研究院 一种基于视频的智能数人***及其处理方法
JP2014041425A (ja) * 2012-08-21 2014-03-06 Toshiba Corp 画像処理装置、画像処理方法および画像処理プログラム
CN105095848A (zh) * 2014-12-01 2015-11-25 北京云识图信息技术有限公司 目标识别的方法及***
CN105184313A (zh) * 2015-08-24 2015-12-23 小米科技有限责任公司 分类模型构建方法及装置
CN106250921A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 图片处理方法及装置
CN107403128A (zh) * 2016-05-20 2017-11-28 株式会社理光 一种物品识别方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188743A (zh) * 2007-09-17 2008-05-28 深圳先进技术研究院 一种基于视频的智能数人***及其处理方法
JP2014041425A (ja) * 2012-08-21 2014-03-06 Toshiba Corp 画像処理装置、画像処理方法および画像処理プログラム
CN105095848A (zh) * 2014-12-01 2015-11-25 北京云识图信息技术有限公司 目标识别的方法及***
CN105184313A (zh) * 2015-08-24 2015-12-23 小米科技有限责任公司 分类模型构建方法及装置
CN107403128A (zh) * 2016-05-20 2017-11-28 株式会社理光 一种物品识别方法及装置
CN106250921A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 图片处理方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王喜富,沈喜生主编: "《现代物流信息化技术》", 31 January 2015 *
赵坚勇编著: "《应用电视技术》", 31 December 2013, 西安:西安电子科技大学出版社 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889419A (zh) * 2018-09-07 2020-03-17 杭州海康威视数字技术股份有限公司 一种货架分析方法、装置、***及电子设备
CN110889419B (zh) * 2018-09-07 2023-04-07 杭州海康威视数字技术股份有限公司 一种货架分析方法、装置、***及电子设备
CN109344752A (zh) * 2018-09-20 2019-02-15 北京字节跳动网络技术有限公司 用于处理嘴部图像的方法和装置
US11941529B2 (en) 2018-09-20 2024-03-26 Beijing Bytedance Network Technology Co., Ltd. Method and apparatus for processing mouth image
CN111311603A (zh) * 2018-12-12 2020-06-19 北京京东尚科信息技术有限公司 用于输出目标物体数目信息的方法和装置
CN109977824A (zh) * 2019-03-15 2019-07-05 百度在线网络技术(北京)有限公司 物品取放识别方法、装置及设备
CN110443191A (zh) * 2019-08-01 2019-11-12 北京百度网讯科技有限公司 用于识别物品的方法和装置
US11610328B2 (en) 2019-08-01 2023-03-21 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for identifying item
CN111523545A (zh) * 2020-05-06 2020-08-11 青岛联合创智科技有限公司 一种结合深度信息的物品查找方法
CN112001662A (zh) * 2020-09-14 2020-11-27 支付宝(杭州)信息技术有限公司 一种商户图像的风险检验方法、装置及设备

Similar Documents

Publication Publication Date Title
CN108491825A (zh) 信息生成方法和装置
US20210256320A1 (en) Machine learning artificialintelligence system for identifying vehicles
CN108510472B (zh) 用于处理图像的方法和装置
CN108038880B (zh) 用于处理图像的方法和装置
CN105144239B (zh) 图像处理装置、图像处理方法
CN109191453A (zh) 用于生成图像类别检测模型的方法和装置
CN110458107A (zh) 用于图像识别的方法和装置
CN107679466B (zh) 信息输出方法和装置
CN109308490A (zh) 用于生成信息的方法和装置
CN108564102A (zh) 图像聚类结果评价方法和装置
CN108229485A (zh) 用于测试用户界面的方法和装置
CN109034069A (zh) 用于生成信息的方法和装置
CN108494778A (zh) 身份认证方法和装置
CN108345387A (zh) 用于输出信息的方法和装置
CN109934242A (zh) 图片识别方法和装置
CN113361603A (zh) 训练方法、类别识别方法、装置、电子设备以及存储介质
CN110443824A (zh) 用于生成信息的方法和装置
CN109344752A (zh) 用于处理嘴部图像的方法和装置
CN109829397A (zh) 一种基于图像聚类的视频标注方法、***以及电子设备
CN109947989A (zh) 用于处理视频的方法和装置
CN108133197B (zh) 用于生成信息的方法和装置
CN109086834A (zh) 字符识别方法、装置、电子设备及存储介质
CN108960110A (zh) 用于生成信息的方法和装置
CN109389182A (zh) 用于生成信息的方法和装置
CN109389096A (zh) 检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180904

RJ01 Rejection of invention patent application after publication