CN113537196B - 图片识别方法、装置、计算机设备及计算机可读存储介质 - Google Patents

图片识别方法、装置、计算机设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113537196B
CN113537196B CN202110834165.9A CN202110834165A CN113537196B CN 113537196 B CN113537196 B CN 113537196B CN 202110834165 A CN202110834165 A CN 202110834165A CN 113537196 B CN113537196 B CN 113537196B
Authority
CN
China
Prior art keywords
picture
sample
sub
identified
pixel point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110834165.9A
Other languages
English (en)
Other versions
CN113537196A (zh
Inventor
吴垒
闵伟
施杰
马付才
孙抗
何良台
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rajax Network Technology Co Ltd
Original Assignee
Rajax Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rajax Network Technology Co Ltd filed Critical Rajax Network Technology Co Ltd
Priority to CN202110834165.9A priority Critical patent/CN113537196B/zh
Publication of CN113537196A publication Critical patent/CN113537196A/zh
Application granted granted Critical
Publication of CN113537196B publication Critical patent/CN113537196B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图片识别方法、装置、计算机设备及计算机可读存储介质,涉及互联网技术领域,利用背景建模的方式对待识别图片进行预处理,将待识别图片的前景与背景分离,并将背景去除,仅保留与目标实体对象相关的前景图片进行识别,避免背景的变化影响对象的识别过程,减轻识别模型的识别压力,简化图片识别过程,提高识别精度。所述方法包括:当检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,对承载区域进行图片采集,得到待识别图片;获取待识别图片的前景图片;对前景图片进行识别,确定待识别图片包括的目标实体对象;确定目标实体对象的对象名称,将对象名称添加至待处理订单中。

Description

图片识别方法、装置、计算机设备及计算机可读存储介质
技术领域
本申请涉及互联网技术领域,特别是涉及一种图片识别方法、装置、计算机设备及计算机可读存储介质。
背景技术
随着互联网技术的不断进步,零售行业的不断发展,一些线下店铺会使用自助式结账机、智能秤等智能识别设备辅助结账,进而提升商品的结算速率。智能识别设备上配备有摄像头,用户将想要购买的商品放在称重秤等区域中,由摄像头对该区域进行拍照回传,使得智能识别设备通过对回传的图片进行识别便能够自动确定用户具体想要购买哪种商品,为用户生成订单进行结算,实现对整个结账流程的辅助,减少用户排队时间。
相关技术中,为了实现图片的自动识别,需要事先采集大量的样本商品图片,对样本商品图片进行特征提取,基于提取到的图片特征训练图片识别模型。这样,在辅助结账时,智能识别设备将摄像头传回的为区域拍摄的图片输入到图片识别模型中进行识别,根据图片识别模型中输出的识别结果确定图片中包括哪种商品,按照商品为用户生成订单。
在实现本申请的过程中,申请人发现相关技术至少存在以下问题:
智能识别设备实际应用时所处的环境复杂,光线可能会发生明显变化,使得摄像头在不同的轮次中为放置有商品的区域拍摄的图片的背景、色彩、亮度等存在较大差异,这种差异会严重影响图片识别模型的识别精度,需要不断堆砌样本数据来提升图片识别模型的识别能力,图片的识别难度较大。
发明内容
有鉴于此,本申请提供了一种图片识别方法、装置、计算机设备及计算机可读存储介质,主要目的在于解决智能识别设备实际应用时所处的环境复杂,光线可能会发生明显变化,使得摄像头在不同的轮次中为放置有商品的区域拍摄的图片的背景、色彩、亮度等存在较大差异,这种差异会严重影响图片识别模型的识别精度,需要不断堆砌样本数据来提升图片识别模型的识别能力,图片的识别难度较大的问题。
依据本申请第一方面,提供了一种图片识别方法,该方法包括:
当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,对所述承载区域进行图片采集,得到待识别图片;
获取所述待识别图片的前景图片,所述前景图片是在所述待识别图片中将背景像素模型覆盖的目标像素点剔除后得到的,所述背景像素模型包括对多个样本背景图片进行像素点特征训练得到的用于指示所述承载区域的像素点特征分布的多个子模型,所述多个样本背景图片是对未放置有任何实体对象的所述承载区域进行图片采集得到的;
对所述前景图片进行识别,确定所述待识别图片包括的所述目标实体对象;
确定所述目标实体对象的对象名称,将所述对象名称添加至待处理订单中。
可选地,所述当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,对所述承载区域进行图片采集,得到待识别图片之前,所述方法还包括:
获取所述多个样本背景图片;
对所述多个样本背景图片进行像素点解析,得到多个样本像素点;
基于所述多个样本像素点,构建所述多个子模型;
将所述多个子模型混合,得到所述背景像素模型。
可选地,所述基于所述多个样本像素点,构建所述多个子模型,包括:
确定第一样本像素点,为所述第一样本像素点构建第一子模型,所述第一样本像素点是所述多个样本像素点中任一样本像素点;
在所述多个样本像素点中确定第二样本像素点,所述第二样本像素点是所述多个样本像素点中除所述第一样本像素点外的任一样本像素点;
根据所述第一子模型的方差,计算所述第一子模型的标准差;
计算所述第二样本像素点的像素值与所述第一子模型的数据均值的第一差值;
将所述第一差值与所述第一子模型的标准差进行比对,基于比对结果,确定所述第二样本像素点对应的第二子模型;
继续在所述多个样本像素点中确定第三样本像素点,并分别计算所述第三样本像素点与所述第一子模型的第二差值、所述第二子模型的第三差值,将所述第二差值与所述第一子模型的标准差进行比对,将所述第三差值与所述第二子模型的标准差进行比对,确定所述第三样本像素点对应的第三子模型,直至遍历所述多个样本像素点,得到所述多个子模型。
可选地,所述为所述第一样本像素点构建第一子模型,包括:
读取所述第一样本像素点对应的红绿蓝通道RGB值作为所述第一样本像素点的三维坐标点,提取所述三维坐标点的所述数据均值和数据方差;
将所述数据均值作为中心参数,利用所述数据方差对所述中心参数进行模型构建,得到所述第一子模型。
可选地,所述基于比对结果,确定所述第二样本像素点对应的第二子模型,包括:
若所述比对结果指示所述第一差值不大于所述第一子模型的标准差,则将所述第二样本像素点加入所述第一子模型,更新所述第一子模型的数据均值,并将更新后的所述第一子模型作为所述第二样本像素点对应的所述第二子模型;
若所述比对结果指示所述第一差值大于所述第一子模型的标准差,则重新执行子模型的构建过程,为所述第二样本像素点构建所述第二子模型。
可选地,所述方法还包括:
当接收到新的样本背景图片时,将所述新的样本背景图片按照采集时间的先后顺序进行排列,得到样本时序队列;
依次对所述样本时序队列中的样本背景图片进行像素点解析以及差值的计算和比对;
根据比对结果对所述背景像素模型进行更新。
可选地,所述当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,对所述承载区域进行图片采集,得到待识别图片,包括:
持续检测所述承载区域的重量、采集所述承载区域表面的图片;
当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,调用图片采集组件;
基于所述图片采集组件对所述承载区域进行图片采集,得到所述待识别图片。
可选地,所述获取所述待识别图片的前景图片,包括:
将所述待识别图片的多个待识别像素点与所述承载区域的背景像素模型进行比对,在所述多个待识别像素点中确定目标像素点,并在所述待识别图片中将所述目标像素点剔除,得到所述前景图片;或,
查询缓存的与所述待识别图片关联的所述前景图片,其中,所述前景图片是由服务器进行目标像素点的确定和剔除后返回的。
可选地,所述将所述待识别图片的多个待识别像素点与所述承载区域的背景像素模型进行比对,在所述多个待识别像素点中确定目标像素点,包括:
对所述待识别图片进行像素点解析,得到所述多个待识别像素点;
对于所述多个待识别像素点中每个待识别像素点,计算所述待识别像素点与所述多个子模型中每个子模型的数据均值之间的差值,得到多个差值;
若所述多个差值中存在指定差值,则将所述待识别像素点作为所述目标像素点,所述指定差值不大于产生所述指定差值的子模型的标准差;
若所述多个差值中不存在所述指定差值,则保留所述待识别像素点,并继续计算其他待识别像素点的多个差值以及进行差值的比对,所述其他待识别像素点是所述多个待识别像素点中除保留的所述待识别像素点外的待识别像素点。
可选地,所述确定所述目标实体对象的对象名称,将所述对象名称添加至待处理订单中之后,所述方法还包括:
当检测到订单生成请求时,获取所述订单生成请求在所述待处理订单中选中的至少一个目标对象名称;
分别确定所述至少一个目标对象名称关联的目标对象参数,得到至少一个目标对象参数,所述目标对象参数至少为对象重量、对象规格、对象价格中的一种或一种以上;
按照所述至少一个目标对象名称与所述至少一个目标对象参数之间的关联关系,对所述至少一个目标对象名称和所述至少一个目标对象参数进行整理,得到待支付订单。
可选地,所述方法还包括:
当检测到请求展示所述待支付订单时,将所述待支付订单进行展示,在展示后的所述待支付订单上提供支付入口,并在所述支付入口被触发时跳转至支付页面;
当检测到请求打印所述待支付订单时,调用打印组件,控制所述打印组件输出实体的所述待支付订单。
依据本申请第二方面,提供了一种图片识别装置,该装置包括:
采集模块,用于当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,对所述承载区域进行图片采集,得到待识别图片;
第一获取模块,用于获取所述待识别图片的前景图片,所述前景图片是在所述待识别图片中将背景像素模型覆盖的目标像素点剔除后得到的,所述背景像素模型包括对多个样本背景图片进行像素点特征训练得到的用于指示所述承载区域的像素点特征分布的多个子模型,所述多个样本背景图片是对未放置有任何实体对象的所述承载区域进行图片采集得到的;
识别模块,用于对所述前景图片进行识别,确定所述待识别图片包括的所述目标实体对象;
添加模块,用于确定所述目标实体对象的对象名称,将所述对象名称添加至待处理订单中。
可选地,所述装置还包括:
第二获取模块,用于获取所述多个样本背景图片;
解析模块,用于对所述多个样本背景图片进行像素点解析,得到多个样本像素点;
构建模块,用于基于所述多个样本像素点,构建所述多个子模型;
混合模块,用于将所述多个子模型混合,得到所述背景像素模型。
可选地,所述构建模块,用于确定第一样本像素点,为所述第一样本像素点构建第一子模型,所述第一样本像素点是所述多个样本像素点中任一样本像素点;在所述多个样本像素点中确定第二样本像素点,所述第二样本像素点是所述多个样本像素点中除所述第一样本像素点外的任一样本像素点;根据所述第一子模型的方差,计算所述第一子模型的标准差;计算所述第二样本像素点的像素值与所述第一子模型的数据均值的第一差值;将所述第一差值与所述第一子模型的标准差进行比对,基于比对结果,确定所述第二样本像素点对应的第二子模型;继续在所述多个样本像素点中确定第三样本像素点,并分别计算所述第三样本像素点与所述第一子模型的第二差值、所述第二子模型的第三差值,将所述第二差值与所述第一子模型的标准差进行比对,将所述第三差值与所述第二子模型的标准差进行比对,确定所述第三样本像素点对应的第三子模型,直至遍历所述多个样本像素点,得到所述多个子模型。
可选地,所述构建模块,用于读取所述第一样本像素点对应的红绿蓝通道RGB值作为所述第一样本像素点的三维坐标点,提取所述三维坐标点的所述数据均值和数据方差;将所述数据均值作为中心参数,利用所述数据方差对所述中心参数进行模型构建,得到所述第一子模型。
可选地,所述构建模块,用于若所述比对结果指示所述第一差值不大于所述第一子模型的标准差,则将所述第二样本像素点加入所述第一子模型,更新所述第一子模型的数据均值,并将更新后的所述第一子模型作为所述第二样本像素点对应的所述第二子模型;若所述比对结果指示所述第一差值大于所述第一子模型的标准差,则重新执行子模型的构建过程,为所述第二样本像素点构建所述第二子模型。
可选地,所述装置还包括:
排列模块,用于当接收到新的样本背景图片时,将所述新的样本背景图片按照采集时间的先后顺序进行排列,得到样本时序队列;
所述构建模块,还用于依次对所述样本时序队列中的样本背景图片进行像素点解析以及差值的计算和比对;
所述构建模块,还用于根据比对结果对所述背景像素模型进行更新。
可选地,所述采集模块,用于持续检测所述承载区域的重量、采集所述承载区域表面的图片;当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,调用图片采集组件;基于所述图片采集组件对所述承载区域进行图片采集,得到所述待识别图片。
可选地,所述第一获取模块,用于将所述待识别图片的多个待识别像素点与所述承载区域的背景像素模型进行比对,在所述多个待识别像素点中确定目标像素点,并在所述待识别图片中将所述目标像素点剔除,得到所述前景图片;或,查询缓存的与所述待识别图片关联的所述前景图片,其中,所述前景图片是由服务器进行目标像素点的确定和剔除后返回的。
可选地,所述第一获取模块,用于对所述待识别图片进行像素点解析,得到所述多个待识别像素点;对于所述多个待识别像素点中每个待识别像素点,计算所述待识别像素点与所述多个子模型中每个子模型的数据均值之间的差值,得到多个差值;若所述多个差值中存在指定差值,则将所述待识别像素点作为所述目标像素点,所述指定差值不大于产生所述指定差值的子模型的标准差;若所述多个差值中不存在所述指定差值,则保留所述待识别像素点,并继续计算其他待识别像素点的多个差值以及进行差值的比对,所述其他待识别像素点是所述多个待识别像素点中除保留的所述待识别像素点外的待识别像素点。
可选地,所述装置还包括:
第三获取模块,用于当检测到订单生成请求时,获取所述订单生成请求在所述待处理订单中选中的至少一个目标对象名称;
确定模块,用于分别确定所述至少一个目标对象名称关联的目标对象参数,得到至少一个目标对象参数,所述目标对象参数至少为对象重量、对象规格、对象价格中的一种或一种以上;
整理模块,用于按照所述至少一个目标对象名称与所述至少一个目标对象参数之间的关联关系,对所述至少一个目标对象名称和所述至少一个目标对象参数进行整理,得到待支付订单。
可选地,所述装置还包括:
展示模块,用于当检测到请求展示所述待支付订单时,将所述待支付订单进行展示,在展示后的所述待支付订单上提供支付入口,并在所述支付入口被触发时跳转至支付页面;
打印模块,用于当检测到请求打印所述待支付订单时,调用打印组件,控制所述打印组件输出实体的所述待支付订单。
依据本申请第三方面,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任一项所述方法的步骤。
依据本申请第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的方法的步骤。
借由上述技术方案,本申请提供的一种图片识别方法、装置、计算机设备及可读存储介质,本申请当检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,对承载区域进行图片采集,得到待识别图片,获取对待识别图片进行像素点剔除处理后的前景图片,对前景图片进行识别,从而确定待识别图片包括的目标实体对象,并确定目标实体对象的对象名称,将对象名称添加至待处理订单中,利用背景建模的方式对待识别图片进行预处理,将待识别图片的前景与背景分离,并将背景去除,仅保留与目标实体对象相关的前景图片进行识别,避免背景的变化影响对象的识别过程,减轻识别模型的识别压力,简化图片识别过程,提高识别精度。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例提供的一种图片识别方法流程示意图;
图2示出了本申请实施例提供的一种图片识别方法流程示意图;
图3A示出了本申请实施例提供的一种图片识别装置的结构示意图;
图3B示出了本申请实施例提供的一种图片识别装置的结构示意图;
图3C示出了本申请实施例提供的一种图片识别装置的结构示意图;
图3D示出了本申请实施例提供的一种图片识别装置的结构示意图;
图3E示出了本申请实施例提供的一种图片识别装置的结构示意图;
图4示出了本申请实施例提供的一种计算机设备的装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
本申请实施例提供了一种图片识别方法,如图1所示,该方法包括:
101、当检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,对承载区域进行图片采集,得到待识别图片。
102、获取待识别图片的前景图片,前景图片是在待识别图片中将背景像素模型覆盖的目标像素点剔除后得到的,背景像素模型包括对多个样本背景图片进行像素点特征训练得到的用于指示承载区域的像素点特征分布的多个子模型,多个样本背景图片是对未放置有任何实体对象的承载区域进行图片采集得到的。
103、对前景图片进行识别,确定待识别图片包括的目标实体对象。
104、确定目标实体对象的对象名称,将对象名称添加至待处理订单中。
本申请实施例提供的方法,当检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,对承载区域进行图片采集,得到待识别图片,获取对待识别图片进行像素点剔除处理后的前景图片,对前景图片进行识别,从而确定待识别图片包括的目标实体对象,并确定目标实体对象的对象名称,将对象名称添加至待处理订单中,利用背景建模的方式对待识别图片进行预处理,将待识别图片的前景与背景分离,并将背景去除,仅保留与目标实体对象相关的前景图片进行识别,避免背景的变化影响对象的识别过程,减轻识别模型的识别压力,简化图片识别过程,提高识别精度。
本申请实施例提供了一种图片识别方法,如图2所示,该方法包括:
201、基于多个样本背景图片,建立背景像素模型。
随着互联网技术的不断进步,零售行业的不断发展,一些线下店铺会使用自助式结账机、智能秤等智能识别设备辅助结账,进而提升商品的结算速率。智能识别设备上配备有摄像头,用户将想要购买的商品放在称重秤等区域中,由摄像头对该区域进行拍照回传,使得智能识别设备通过对回传的图片进行识别便能够自动确定用户具体想要购买哪种商品,为用户生成订单进行结算,实现对整个结账流程的辅助,减少用户的排队时间。其中,为了实现图片的自动识别,需要实现采集大量的样本商品图片,对样本商品图片进行特征提取,基于提取到的图片特征训练图片识别模型。这样,在辅助结账时,智能识别设备将摄像头传回的为区域拍摄的图片输入到图片识别模型中进行识别,根据图片识别模型中输出的识别结果确定图片中包括哪种商品,按照商品为用户生成订单。但是,申请人认识到,智能识别设备实际应用时所处的环境复杂,光线可能会发生明显变化,使得摄像头在不同的轮次中为放置有商品的区域摆设的图片的背景、色彩、亮度等存在较大差异,这种差异会严重影响图片识别模型的识别精度,需要不断堆砌样本数据来提升图片识别模型的识别能力,图片识别难度较大。
因此,本申请提出一种图片识别方法,当检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,对承载区域进行图片采集,得到待识别图片,获取对待识别图片进行像素点剔除处理后的前景图片,对前景图片进行识别,从而确定待识别图片包括的目标实体对象,并确定目标实体对象的对象名称,将对象名称添加至待处理订单中,利用背景建模的方式对待识别图片进行预处理,将待识别图片的前景与背景分离,并将背景去除,仅保留与目标实体对象相关的前景图片进行识别,避免背景的变化影响对象的识别过程,减轻识别模型的识别压力,简化图片识别过程,提高识别精度。
在本申请实施例中,为了实现图片的采集,可在智能识别设备上配备摄像头,基于摄像头对用户放置在承载区域内的商品进行拍照上传,以便智能识别设备对摄像头回传的商品照片进行处理和识别,或由智能识别设备将商品图片传回服务器,由服务器对商品图片进行处理和识别,从而确定图片中包括哪种商品,按照商品为用户生成订单进而辅助用户结账。其中,智能识别设备可以是自助式结账机、智能秤等设备,本申请对智能识别设备的种类和大小不进行具体限定。承载区域是指智能识别设备配备的摄像头可以拍摄到的区域,例如称重秤等区域,也就是说用户在该区域内放置想要购买的商品,摄像头便可以清晰、完整的拍摄到该商品。进一步地,承载区域是可以具备称重功能的,这样在后续可以将图像识别与称重***结合起来,使得对象识别的结果更加准确。
在具体应用场景中,当需要进行图片的识别时,摄像头拍摄出的待识别图片会因为线下环境复杂、光线变化明显,出现图片背景差异较大等情况,承载区域的部分区域很可能会被识别认定为商品的部分区域,从而进而导致***的对象识别精度下降,难以真正确定用户想要购买的商品,需要用户重新放置商品并由摄像头重新拍照上传。所以,为了使图片识别的过程可以适应多种复杂的实施场景,提高实际应用的实时性,本申请利用多张不同环境下获取的承载区域的样本背景图片来建立背景像素模型,以便后续能够利用背景像素模型,在待识别图片中将不属于商品构成部分的背景提取,使得在进行图片识别时,只需识别包括商品的前景图片,提高图片识别的准确率。具体构建背景像素模型的过程如下:
首先,获取多个样本背景图片。其中,多个样本背景图片是对未放置有任何实体对象的承载区域进行图片采集得到的,也就是利用智能识别设备配备的摄像头对未放置有任何商品、货物等对象的承载区域进行拍摄得到的。
随后,由智能识别设备所接入的服务平台搭载的服务器对多个样本背景图片进行像素点解析,得到多个样本像素点,并基于多个样本像素点,构建多个子模型。其中,多个子模型是通过对多张样本背景图片中每一张样本背景图片的每一个像素点建立子模型而得到的,能够指示多样样本背景图片中像素点特征的分布情况,目的在于细化模型的构建,使承载区域的特征更加清晰明朗,从而减轻噪声和背景差异带来的影响。具体得到多个子模型的过程如下:
先确定第一样本像素点,为第一样本像素点构建第一子模型。其中,第一样本像素点是多个样本像素点中任一样本像素点。在构建第一子模型时,需要读取第一样本像素点对应的RGB(RGB color mode,红绿蓝色彩模式)通道值作为第一样本像素点的三维坐标点。例如,A像素点的RGB通道值为,R:159、G:167、B:167,则A像素点的三维坐标点即为X:159、Y:167、Z:167。接着,提取该三维坐标点的数据均值和数据方差,将数据均值作为中心参数,进而利用数据方差对所述中心参数进行模型构建,得到第一子模型。需要说明的是,数据均值和数据方差可以在三维坐标点的坐标点属性中提取。
完成了第一子模型的构建后,继续在多个样本像素点中确定第二样本像素点,第二样本像素点为多个样本像素点中除第一样本像素点外的任一样本像素点。根据第一子模型的方差,计算第一子模型的标准差,并计算第二样本像素点的像素值与第一子模型的数据均值的第一差值。例如,为像素点A1建立第一子模型,获取第一子模型的数据方差为25,数据均值为40,像素点A2的像素值为42,则可以计算得出第一子模型的标准差为5,第一差值为2。接下来,将第一差值与第一子模型的标准差进行比对,基于比对结果,确定第二样本像素点对应的第二子模型。其中,若比对结果指示第一差值不大于第一子模型的标准差,则需要将第二样本像素点加入第一子模型,更新第一子模型的数据均值,并将更新后的第一子模型作为第二样本像素点对应的第二子模型。若比对结果指示第一差值大于第一子模型的标准差,则重新执行子模型的构建过程,为第二样本像素点构建第二子模型。例如,若第二样本像素点A2的像素值为42,为像素点A1建立第一子模型数据均值为40,将像素值与第一子模型均值的第一差值2与第一子模型的标准差5进行对比,得出第一差值不大于第一子模型的均值,则将像素点A2加入第一子模型,更新第一子模型的数据均值。若像素点A2的像素值为47,则将第一差值7与第一子模型的标准差5进行对比,得出第一差值大于第一子模型的均值,则重新执行子模型的构建过程为像素点A2建立第二子模型。
继续在多个样本像素点中确定第三样本像素点,并分别计算第三样本像素点与第一子模型的第二差值、第二子模型的第三差值,例如,确定第三样本像素点A3,计算像素点A3与像素点A1建立的第一子模型之间的第二差值、像素点A3与像素点A2建立的第二子模型之间的第三差值。将第二差值与第一子模型的标准差进行比对,将第三差值与第二子模型的标准差进行比对,确定第三样本像素点对应的第三子模型,直至遍历多个样本像素点,得到多个子模型。
实际上述内容描述的过程也就是将每一个像素点与当前已经构建的子模型进行对比,查看是否与已经建立完成的子模型匹配。如果匹配,则表示这个像素点的像素点特征与已经构建的子模型指示的像素点特征是匹配的,该像素点也应归纳在该子模型上,所以采用该像素点更新该子模型的参数。相反,如果不匹配,则表示目前构建的子模型中并没有当前像素点能够融入的,因此,需要为该像素点建立新的子模型。通过这种方式,不仅能够为承载区域的像素点进行特征的训练,而且还能够保证训练得到的多个子模型覆盖到承载区域的每一个像素点,保证后续背景提取的准确性。
最后,通过上述过程得到了多个子模型后,将多个子模型混合,便得到背景像素模型。需要说明的是,实际应用的过程中,多个子模型可以是高斯模型,基于高斯概率密度函数精确的量化承载区域的像素点特征分布,并通过对多个高斯模型进行混合得到混合高斯模型作为背景像素模型。
在实际应用过程中,由于后续还会不断采集承载区域的样本背景图片,且新采集的样本背景图片相较于之前的样本背景图片来说,更符合当前的实施环境,准确性更高。因此,为了提高背景像素模型的准确性,将之前的样本背景图片带来的影响降低,当接收到新的样本背景图片时,将新的样本背景图片按照采集时间的先后顺序进行排列,得到样本时序队列。例如,获取三张样本背景图片信息中携带的采集时间,第一样本背景图片的采集时间为8:20、第二样本背景图片的采集时间为7:50、第三样本背景图片的采集时间为14:30。按照采集时间顺序将第二样本背景图片放在第一位、将第一样本背景图片放在第二位、将第三样本背景图片放在第三位,形成样本时序队列。接着,依次对样本时序队列中的样本背景图片进行像素点解析以及差值的计算和比对,最终根据比对结果对背景像素模型进行更新,保证更新后的背景像素模型与当下的实际情况相匹配。
202、当检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,对承载区域进行图片采集,得到待识别图片。
在本申请实施例中,为了可以辅助用户自助结账,保证图片识别的实时性,在需要进行对象识别时,智能识别设备会利用配备的摄像头采集待识别图片,以便后续对待识别图片进行像素剔除以及识别。
其中,由于对象都具有一定的重量,而且放在摄像头下会对承载区域造成一定程度的遮挡,因此,智能识别设备在检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,开始对承载区域进行图片采集,得到待识别图片。具体地,智能识别设备持续检测承载区域的重量、采集承载区域表面的图片。当检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,调用图片采集组件,基于图片采集组件对承载区域进行图片采集,得到待识别图片。
需要说明的是,实际应用的过程中,考虑到有些对象较轻、较小,智能识别设备可能检测不到重量或者未能识别到遮挡区域,因此,智能识别设备上还设置有采集按键。当智能识别设备检测到该采集按键被触发后,智能识别设备确定接收到图片识别请求,开始响应图片识别请求,调用图片采集组件对承载区域进行图片采集,得到待识别图片。
例如,假设用户选中的目标实体对象为黄瓜,用户将黄瓜放置在承载区域内,触发智能识别设备上“开始结账”的按键或者按钮,智能识别设备便利用摄像头拍摄承载区域中黄瓜的图片作为待识别图片。再例如,用户将黄瓜放置在承载区域内,智能识别设备自动识别到黄瓜的重量,或自动识别到黄瓜放置在承载区域中形成了遮挡区域,则智能识别设备开始响应图片识别请求,利用摄像头拍摄承载区域中黄瓜的图片作为待识别图片。
203、获取待识别图片的前景图片。
在本申请实施例中,由于已经在上述步骤201中为承载区域建立了背景像素模型,因此,在采集到待识别图片后,是可以利用该背景像素模型将待识别图片中指示承载区域的像素点剔除掉,仅剩下与目标实体对象相关的像素点构成前景图片,并对前景图片进行识别,从而利用背景像素点的剔除操作,将背景对图片识别过程的影响消除。其中,前景图片是在待识别图片中将背景像素模型覆盖的目标像素点剔除后得到的,因为背景像素模型指示了承载区域的像素点特征,所以,将背景像素模型覆盖在待识别图片中覆盖的的目标像素点剔除后可以使得待识别图片中仅剩下目标实体对象,也即得到前景图片。
在获取前景图片时,智能识别设备需要将待识别图片的多个待识别像素点中每个待识别像素点与背景像素模型进行对比,在多个待识别像素点中确定目标像素点,并在待识别图片中将目标像素点剔除,得到前景图片。确定目标像素点时,先对待识别图片进行像素点解析,得到多个待识别像素点。接着,对于多个待识别像素点中每个待识别像素点,计算待识别像素点与多个子模型中每个子模型的数据均值之间的差值,得到多个差值,若多个差值中存在指定差值,该指定差值不大于产生该指定差值的子模型的标准差,则表示当前的待识别像素点是应当归纳在产生指定差值的子模型中的,该待识别像素点的像素点特征与该子模型匹配,属于构成承载区域的像素点,因此,将待识别像素点作为目标像素点。而若多个差值中不存在指定差值,则表示多个子模型中不存在与当前待识别像素点匹配的子模型,该待识别像素点不属于构成承载区域的像素点,实际上属于构成目标实体对象的像素点,不能作为目标像素点,因此,保留当前的待识别像素点,并继续计算其他待识别像素点的多个差值以及进行差值的比对,其他待识别像素点是多个待识别像素点中除保留的待识别像素点外的待识别像素点,直至遍历全部的待识别像素点。例如,解析得到待识别像素点B1,将待识别像素点与背景像素模型中的每个子模型进行对比。其中,子模型甲的标准差为4、子模型乙的标准差为3、子模型丙的标准差为5,计算得到像素点B1与子模型甲之间的差值为9、与子模型乙之间的差值为5、与子模型丙之间的差值为1。由于像素点B1与子模型丙之间的差值1小于该子模型丙的标准差5,因此,可以确定像素点B1的像素点特征与子模型丙匹配,像素点B1属于构成承载区域的像素点,将像素点B1作为目标像素点。
实际上,上述的计算过程也就是计算待识别像素点与背景像素模型中每个子模型之间的距离,如果二者之间的距离满足预设条件,则该待识别像素点是组成背景的像素点,确定该待识别像素点作为目标像素点,以便后续剔除。相反,如果二者之间的距离不满足预设条件,则该待识别像素点不是组成背景的像素点,属于组成前景(也即目标实体对象)的像素点,所以保留该像素点。
需要说明的是,上面的过程是智能识别设备在采集到待识别图片后便开始进行的像素点剔除操作,并得到了前景图片。而在实际应用的过程中,智能识别设备也可将采集到的待识别图片传回至服务器,由服务器执行上述像素点剔除的操作,得到前景图片,由服务器将前景图片与待识别图片关联并缓存,以使得智能识别设备通过查询便可以获取到该前景图片,而无需在前端进行图片的处理操作,减轻智能识别设备的工作压力,保证智能识别设备的运行速率。
204、对前景图片进行识别,确定待识别图片包括的目标实体对象。
在本申请实施例中,获取到前景图片后,对前景图片进行识别,确定待识别图片包括的目标实体对象。其中,在对前景图片进行识别时,可以采用基于样本商品图片训练的商品识别模型进行训练,从而确定用户希望购买哪种商品。例如,用户在秤盘上放置了一个黄瓜后智能识别设备开始响应图片识别请求,智能识别设备调用摄像头对秤盘进行拍摄,将拍摄得到的待识别图片中的与秤盘相关的像素点去除,仅保留目标实体对象黄瓜的像素点,得到前景图片。最终对仅包含黄瓜的前景图片进行识别。
205、确定目标实体对象的对象名称,将对象名称添加至待处理订单中。
在本申请实施例中,识别到目标实体对象后,由于用户将目标实体对象放置在承载区域的目的是购买目标实体对象,因此,为了后续能够正常的为用户输出订单进行支付,智能识别设备会确定目标实体对象的对象名称,将对象名称添加至待处理订单中。其中,待处理订单用于存储当前用户在历史过程中放置在承载区域上被识别的全部实体对象的对象名称,以便后续用户确定了待处理订单后可以直接为用户生成待支付订单,供用户进行支付购买。
进一步地,后续随着用户继续向承载区域上放置实体对象,智能识别设备会持续进行图像的识别并获取对象名称,持续向待处理订单中增加对象名称。实际应用中,智能识别设备会在待处理订单上提供诸如“确认下单”、“确认购买”等订单确认按键,用户在完成实体对象的录入后可以触发该确认按键,以便智能识别设备开始生成待支付订单。具体地,当检测到订单生成请求(也即用户触发了待处理订单上的订单确认按键)时,获取订单生成请求在待处理订单中选中的至少一个目标对象名称。考虑到有些已经录入的实体对象被用户舍弃,用户不想继续购买该对象,因此,智能识别设备会以用户选中的目标对象名称为准进行处理。随后,智能识别设备分别确定至少一个目标对象名称关联的目标对象参数,得到至少一个目标对象参数。其中,目标对象参数至少为对象重量、对象规格、对象价格中的一种或一种以上。接着,智能识别设备按照至少一个目标对象名称与至少一个目标对象参数之间的关联关系,对至少一个目标对象名称和至少一个目标对象参数进行整理,得到待支付订单。
生成待支付订单后,智能识别设备有两种处理待支付订单的方式,一种方式是直接展示,也即当检测到请求展示待支付订单时,将待支付订单进行展示,在展示后的待支付订单上提供支付入口,并在支付入口被触发时跳转至支付页面。另一种方式是进行打印,也即当检测到请求打印待支付订单时,调用打印组件,控制打印组件输出实体的待支付订单,以便用户手持实体的待支付订单去到收费处进行支付,或者工作人员将实体的待支付订单贴在用户购买的实体对象上。需要说明的是,此处输出的实体的待支付订单也可以是RFID(Radio Frequency Identification,射频识别)形式的实体电子封签,以便工作人员采用该电子封签对用户购买的实体对象进行封装,在实现自动结账的同时,还能够保证实体对象的安全,避免实体对象丢失或者被其他人员误领,实现了对相关人员线下行为的监督。
本申请实施例提供的方法,当检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,对承载区域进行图片采集,得到待识别图片,获取对待识别图片进行像素点剔除处理后的前景图片,对前景图片进行识别,从而确定待识别图片包括的目标实体对象,并确定目标实体对象的对象名称,将对象名称添加至待处理订单中,利用背景建模的方式对待识别图片进行预处理,将待识别图片的前景与背景分离,并将背景去除,仅保留与目标实体对象相关的前景图片进行识别,避免背景的变化影响对象的识别过程,减轻识别模型的识别压力,简化图片识别过程,提高识别精度。
进一步地,作为图1所述方法的具体实现,本申请实施例提供了一种图片识别装置,如图3A所示,所述装置包括:采集模块301、第一获取模块302、识别模块303和添加模块304。
该采集模块301,用于当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,对所述承载区域进行图片采集,得到待识别图片;
该第一获取模块302,用于获取所述待识别图片的前景图片,所述前景图片是在所述待识别图片中将背景像素模型覆盖的目标像素点剔除后得到的,所述背景像素模型包括对多个样本背景图片进行像素点特征训练得到的用于指示所述承载区域的像素点特征分布的多个子模型,所述多个样本背景图片是对未放置有任何实体对象的所述承载区域进行图片采集得到的;
该识别模块303,用于对所述前景图片进行识别,确定所述待识别图片包括的所述目标实体对象;
该添加模块304,用于确定所述目标实体对象的对象名称,将所述对象名称添加至待处理订单中。
在具体的应用场景中,如图3B所示,所述装置还包括:第二获取模块305、解析模块306、构建模块307、混合模块308。
第二获取模块305,用于获取所述多个样本背景图片;
解析模块306,用于对所述多个样本背景图片进行像素点解析,得到多个样本像素点;
构建模块307,用于基于所述多个样本像素点,构建所述多个子模型;
混合模块308,用于将所述多个子模型混合,得到所述背景像素模型。
在具体的应用场景中,所述构建模块307,用于确定第一样本像素点,为所述第一样本像素点构建第一子模型,所述第一样本像素点是所述多个样本像素点中任一样本像素点;在所述多个样本像素点中确定第二样本像素点,所述第二样本像素点是所述多个样本像素点中除所述第一样本像素点外的任一样本像素点;根据所述第一子模型的方差,计算所述第一子模型的标准差;计算所述第二样本像素点的像素值与所述第一子模型的数据均值的第一差值;将所述第一差值与所述第一子模型的标准差进行比对,基于比对结果,确定所述第二样本像素点对应的第二子模型;继续在所述多个样本像素点中确定第三样本像素点,并分别计算所述第三样本像素点与所述第一子模型的第二差值、所述第二子模型的第三差值,将所述第二差值与所述第一子模型的标准差进行比对,将所述第三差值与所述第二子模型的标准差进行比对,确定所述第三样本像素点对应的第三子模型,直至遍历所述多个样本像素点,得到所述多个子模型。
在具体的应用场景中,所述构建模块307,用于读取所述第一样本像素点对应的红绿蓝通道RGB值作为所述第一样本像素点的三维坐标点,提取所述三维坐标点的所述数据均值和数据方差;将所述数据均值作为中心参数,利用所述数据方差对所述中心参数进行模型构建,得到所述第一子模型。
在具体的应用场景中,所述构建模块307,用于若所述比对结果指示所述第一差值不大于所述第一子模型的标准差,则将所述第二样本像素点加入所述第一子模型,更新所述第一子模型的数据均值,并将更新后的所述第一子模型作为所述第二样本像素点对应的所述第二子模型;若所述比对结果指示所述第一差值大于所述第一子模型的标准差,则重新执行子模型的构建过程,为所述第二样本像素点构建所述第二子模型。
在具体的应用场景中,如图3C所示,所述装置还包括:排列模块309。
排列模块309,用于当接收到新的样本背景图片时,将所述新的样本背景图片按照采集时间的先后顺序进行排列,得到样本时序队列;
所述构建模块307,还用于依次对所述样本时序队列中的样本背景图片进行像素点解析以及差值的计算和比对;
所述构建模块307,还用于根据比对结果对所述背景像素模型进行更新。
在具体的应用场景中,所述采集模块301,用于持续检测所述承载区域的重量、采集所述承载区域表面的图片;当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,调用图片采集组件;基于所述图片采集组件对所述承载区域进行图片采集,得到所述待识别图片。
在具体的应用场景中,该第一获取模块302,用于将所述待识别图片的多个待识别像素点与所述承载区域的背景像素模型进行比对,在所述多个待识别像素点中确定目标像素点,并在所述待识别图片中将所述目标像素点剔除,得到所述前景图片;或,查询缓存的与所述待识别图片关联的所述前景图片,其中,所述前景图片是由服务器进行目标像素点的确定和剔除后返回的。
在具体的应用场景中,所述第一获取模块302,用于对所述待识别图片进行像素点解析,得到所述多个待识别像素点;对于所述多个待识别像素点中每个待识别像素点,计算所述待识别像素点与所述多个子模型中每个子模型的数据均值之间的差值,得到多个差值;若所述多个差值中存在指定差值,则将所述待识别像素点作为所述目标像素点,所述指定差值不大于产生所述指定差值的子模型的标准差;若所述多个差值中不存在所述指定差值,则保留所述待识别像素点,并继续计算其他待识别像素点的多个差值以及进行差值的比对,所述其他待识别像素点是所述多个待识别像素点中除保留的所述待识别像素点外的待识别像素点。
在具体的应用场景中,如图3D所示,所述装置还包括:第三获取模块310,确定模块311和整理模块312。
该第三获取模块310,用于当检测到订单生成请求时,获取所述订单生成请求在所述待处理订单中选中的至少一个目标对象名称;
该确定模块311,用于分别确定所述至少一个目标对象名称关联的目标对象参数,得到至少一个目标对象参数,所述目标对象参数至少为对象重量、对象规格、对象价格中的一种或一种以上;
该整理模块312,用于按照所述至少一个目标对象名称与所述至少一个目标对象参数之间的关联关系,对所述至少一个目标对象名称和所述至少一个目标对象参数进行整理,得到待支付订单。
在具体的应用场景中,如图3E所示,该装置还包括:展示模块313和打印模块314。
该展示模块313,用于当检测到请求展示所述待支付订单时,将所述待支付订单进行展示,在展示后的所述待支付订单上提供支付入口,并在所述支付入口被触发时跳转至支付页面;
该打印模块314,用于当检测到请求打印所述待支付订单时,调用打印组件,控制所述打印组件输出实体的所述待支付订单。
本申请实施例提供的装置,当检测到承载区域承载的重量发生变化或承载区域中形成遮挡区域时,对承载区域进行图片采集,得到待识别图片,获取对待识别图片进行像素点剔除处理后的前景图片,对前景图片进行识别,从而确定待识别图片包括的目标实体对象,并确定目标实体对象的对象名称,将对象名称添加至待处理订单中,利用背景建模的方式对待识别图片进行预处理,将待识别图片的前景与背景分离,并将背景去除,仅保留与目标实体对象相关的前景图片进行识别,避免背景的变化影响对象的识别过程,减轻识别模型的识别压力,简化图片识别过程,提高识别精度。
需要说明的是,本申请实施例提供的一种图片识别装置所涉及各功能单元的其他相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
在示例性实施例中,参见图4,还提供了一种设备,该设备包括通信总线、处理器、存储器和通信接口,还可以包括输入输出接口和显示设备,其中,各个功能单元之间可以通过总线完成相互间的通信。该存储器存储有计算机程序,处理器,用于执行存储器上所存放的程序,执行上述实施例中的图片识别方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的图片识别方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (24)

1.一种图片识别方法,其特征在于,包括:
当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,对所述承载区域进行图片采集,得到待识别图片;
获取所述待识别图片的前景图片,所述前景图片是在所述待识别图片中将背景像素模型覆盖的目标像素点剔除后得到的,所述背景像素模型包括对多个样本背景图片进行像素点特征训练得到的用于指示所述承载区域的像素点特征分布的多个子模型,所述多个样本背景图片是对未放置有任何实体对象的所述承载区域进行图片采集得到的,其中,在所述样本背景图片中选取任一样本像素点,基于所述样本像素点的三维坐标点的数据均值和数据方差,构建所述样本像素点的子模型;
对所述前景图片进行识别,确定所述待识别图片包括的所述目标实体对象;
确定所述目标实体对象的对象名称,将所述对象名称添加至待处理订单中。
2.根据权利要求1所述的方法,其特征在于,所述当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,对所述承载区域进行图片采集,得到待识别图片之前,所述方法还包括:
获取所述多个样本背景图片;
对所述多个样本背景图片进行像素点解析,得到多个样本像素点;
基于所述多个样本像素点,构建所述多个子模型;
将所述多个子模型混合,得到所述背景像素模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个样本像素点,构建所述多个子模型,包括:
确定第一样本像素点,为所述第一样本像素点构建第一子模型,所述第一样本像素点是所述多个样本像素点中任一样本像素点;
在所述多个样本像素点中确定第二样本像素点,所述第二样本像素点是所述多个样本像素点中除所述第一样本像素点外的任一样本像素点;
根据所述第一子模型的方差,计算所述第一子模型的标准差;
计算所述第二样本像素点的像素值与所述第一子模型的数据均值的第一差值;
将所述第一差值与所述第一子模型的标准差进行比对,基于比对结果,确定所述第二样本像素点对应的第二子模型;
继续在所述多个样本像素点中确定第三样本像素点,并分别计算所述第三样本像素点与所述第一子模型的第二差值、所述第二子模型的第三差值,将所述第二差值与所述第一子模型的标准差进行比对,将所述第三差值与所述第二子模型的标准差进行比对,确定所述第三样本像素点对应的第三子模型,直至遍历所述多个样本像素点,得到所述多个子模型,其中,所述多个子模型是高斯模型。
4.根据权利要求3所述的方法,其特征在于,所述为所述第一样本像素点构建第一子模型,包括:
读取所述第一样本像素点对应的红绿蓝通道RGB值作为所述第一样本像素点的三维坐标点,提取所述三维坐标点的所述数据均值和数据方差;
将所述数据均值作为中心参数,利用所述数据方差对所述中心参数进行模型构建,得到所述第一子模型。
5.根据权利要求3所述的方法,其特征在于,所述基于比对结果,确定所述第二样本像素点对应的第二子模型,包括:
若所述比对结果指示所述第一差值不大于所述第一子模型的标准差,则将所述第二样本像素点加入所述第一子模型,更新所述第一子模型的数据均值,并将更新后的所述第一子模型作为所述第二样本像素点对应的所述第二子模型;
若所述比对结果指示所述第一差值大于所述第一子模型的标准差,则重新执行子模型的构建过程,为所述第二样本像素点构建所述第二子模型。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当接收到新的样本背景图片时,将所述新的样本背景图片按照采集时间的先后顺序进行排列,得到样本时序队列;
依次对所述样本时序队列中的样本背景图片进行像素点解析以及差值的计算和比对;
根据比对结果对所述背景像素模型进行更新。
7.根据权利要求1所述的方法,其特征在于,所述当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,对所述承载区域进行图片采集,得到待识别图片,包括:
持续检测所述承载区域的重量、采集所述承载区域表面的图片;
当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,调用图片采集组件;
基于所述图片采集组件对所述承载区域进行图片采集,得到所述待识别图片。
8.根据权利要求1所述的方法,其特征在于,所述获取所述待识别图片的前景图片,包括:
将所述待识别图片的多个待识别像素点与所述承载区域的背景像素模型进行比对,在所述多个待识别像素点中确定目标像素点,并在所述待识别图片中将所述目标像素点剔除,得到所述前景图片;或,
查询缓存的与所述待识别图片关联的所述前景图片,其中,所述前景图片是由服务器进行目标像素点的确定和剔除后返回的。
9.根据权利要求8所述的方法,其特征在于,所述将所述待识别图片的多个待识别像素点与所述承载区域的背景像素模型进行比对,在所述多个待识别像素点中确定目标像素点,包括:
对所述待识别图片进行像素点解析,得到所述多个待识别像素点;
对于所述多个待识别像素点中每个待识别像素点,计算所述待识别像素点与所述多个子模型中每个子模型的数据均值之间的差值,得到多个差值;
若所述多个差值中存在指定差值,则将所述待识别像素点作为所述目标像素点,所述指定差值不大于产生所述指定差值的子模型的标准差;
若所述多个差值中不存在所述指定差值,则保留所述待识别像素点,并继续计算其他待识别像素点的多个差值以及进行差值的比对,所述其他待识别像素点是所述多个待识别像素点中除保留的所述待识别像素点外的待识别像素点。
10.根据权利要求1所述的方法,其特征在于,所述确定所述目标实体对象的对象名称,将所述对象名称添加至待处理订单中之后,所述方法还包括:
当检测到订单生成请求时,获取所述订单生成请求在所述待处理订单中选中的至少一个目标对象名称;
分别确定所述至少一个目标对象名称关联的目标对象参数,得到至少一个目标对象参数,所述目标对象参数至少为对象重量、对象规格、对象价格中的一种或一种以上;
按照所述至少一个目标对象名称与所述至少一个目标对象参数之间的关联关系,对所述至少一个目标对象名称和所述至少一个目标对象参数进行整理,得到待支付订单。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
当检测到请求展示所述待支付订单时,将所述待支付订单进行展示,在展示后的所述待支付订单上提供支付入口,并在所述支付入口被触发时跳转至支付页面;
当检测到请求打印所述待支付订单时,调用打印组件,控制所述打印组件输出实体的所述待支付订单。
12.一种图片识别装置,其特征在于,包括:
采集模块,用于当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,对所述承载区域进行图片采集,得到待识别图片;
第一获取模块,用于获取所述待识别图片的前景图片,所述前景图片是在所述待识别图片中将背景像素模型覆盖的目标像素点剔除后得到的,所述背景像素模型包括对多个样本背景图片进行像素点特征训练得到的用于指示所述承载区域的像素点特征分布的多个子模型,所述多个样本背景图片是对未放置有任何实体对象的所述承载区域进行图片采集得到的,其中,在所述样本背景图片中选取任一样本像素点,基于所述样本像素点的三维坐标点的数据均值和数据方差,构建所述样本像素点的子模型;
识别模块,用于对所述前景图片进行识别,确定所述待识别图片包括的所述目标实体对象;
添加模块,用于确定所述目标实体对象的对象名称,将所述对象名称添加至待处理订单中。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取所述多个样本背景图片;
解析模块,用于对所述多个样本背景图片进行像素点解析,得到多个样本像素点;
构建模块,用于基于所述多个样本像素点,构建所述多个子模型;
混合模块,用于将所述多个子模型混合,得到所述背景像素模型。
14.根据权利要求13所述的装置,其特征在于,所述构建模块,用于确定第一样本像素点,为所述第一样本像素点构建第一子模型,所述第一样本像素点是所述多个样本像素点中任一样本像素点;在所述多个样本像素点中确定第二样本像素点,所述第二样本像素点是所述多个样本像素点中除所述第一样本像素点外的任一样本像素点;根据所述第一子模型的方差,计算所述第一子模型的标准差;计算所述第二样本像素点的像素值与所述第一子模型的数据均值的第一差值;将所述第一差值与所述第一子模型的标准差进行比对,基于比对结果,确定所述第二样本像素点对应的第二子模型;继续在所述多个样本像素点中确定第三样本像素点,并分别计算所述第三样本像素点与所述第一子模型的第二差值、所述第二子模型的第三差值,将所述第二差值与所述第一子模型的标准差进行比对,将所述第三差值与所述第二子模型的标准差进行比对,确定所述第三样本像素点对应的第三子模型,直至遍历所述多个样本像素点,得到所述多个子模型,其中,所述多个子模型是高斯模型。
15.根据权利要求14所述的装置,其特征在于,所述构建模块,用于读取所述第一样本像素点对应的红绿蓝通道RGB值作为所述第一样本像素点的三维坐标点,提取所述三维坐标点的所述数据均值和数据方差;将所述数据均值作为中心参数,利用所述数据方差对所述中心参数进行模型构建,得到所述第一子模型。
16.根据权利要求14所述的装置,其特征在于,所述构建模块,用于若所述比对结果指示所述第一差值不大于所述第一子模型的标准差,则将所述第二样本像素点加入所述第一子模型,更新所述第一子模型的数据均值,并将更新后的所述第一子模型作为所述第二样本像素点对应的所述第二子模型;若所述比对结果指示所述第一差值大于所述第一子模型的标准差,则重新执行子模型的构建过程,为所述第二样本像素点构建所述第二子模型。
17.根据权利要求14所述的装置,其特征在于,所述装置还包括:
排列模块,用于当接收到新的样本背景图片时,将所述新的样本背景图片按照采集时间的先后顺序进行排列,得到样本时序队列;
所述构建模块,还用于依次对所述样本时序队列中的样本背景图片进行像素点解析以及差值的计算和比对;
所述构建模块,还用于根据比对结果对所述背景像素模型进行更新。
18.根据权利要求12所述的装置,其特征在于,所述采集模块,用于持续检测所述承载区域的重量、采集所述承载区域表面的图片;当检测到承载区域承载的重量发生变化或所述承载区域中形成遮挡区域时,调用图片采集组件;基于所述图片采集组件对所述承载区域进行图片采集,得到所述待识别图片。
19.根据权利要求12所述的装置,其特征在于,所述第一获取模块,用于将所述待识别图片的多个待识别像素点与所述承载区域的背景像素模型进行比对,在所述多个待识别像素点中确定目标像素点,并在所述待识别图片中将所述目标像素点剔除,得到所述前景图片;或,查询缓存的与所述待识别图片关联的所述前景图片,其中,所述前景图片是由服务器进行目标像素点的确定和剔除后返回的。
20.根据权利要求19所述的装置,其特征在于,所述第一获取模块,用于对所述待识别图片进行像素点解析,得到所述多个待识别像素点;对于所述多个待识别像素点中每个待识别像素点,计算所述待识别像素点与所述多个子模型中每个子模型的数据均值之间的差值,得到多个差值;若所述多个差值中存在指定差值,则将所述待识别像素点作为所述目标像素点,所述指定差值不大于产生所述指定差值的子模型的标准差;若所述多个差值中不存在所述指定差值,则保留所述待识别像素点,并继续计算其他待识别像素点的多个差值以及进行差值的比对,所述其他待识别像素点是所述多个待识别像素点中除保留的所述待识别像素点外的待识别像素点。
21.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第三获取模块,用于当检测到订单生成请求时,获取所述订单生成请求在所述待处理订单中选中的至少一个目标对象名称;
确定模块,用于分别确定所述至少一个目标对象名称关联的目标对象参数,得到至少一个目标对象参数,所述目标对象参数至少为对象重量、对象规格、对象价格中的一种或一种以上;
整理模块,用于按照所述至少一个目标对象名称与所述至少一个目标对象参数之间的关联关系,对所述至少一个目标对象名称和所述至少一个目标对象参数进行整理,得到待支付订单。
22.根据权利要求21所述的装置,其特征在于,所述装置还包括:
展示模块,用于当检测到请求展示所述待支付订单时,将所述待支付订单进行展示,在展示后的所述待支付订单上提供支付入口,并在所述支付入口被触发时跳转至支付页面;
打印模块,用于当检测到请求打印所述待支付订单时,调用打印组件,控制所述打印组件输出实体的所述待支付订单。
23.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述方法的步骤。
24.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
CN202110834165.9A 2021-07-21 2021-07-21 图片识别方法、装置、计算机设备及计算机可读存储介质 Active CN113537196B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110834165.9A CN113537196B (zh) 2021-07-21 2021-07-21 图片识别方法、装置、计算机设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110834165.9A CN113537196B (zh) 2021-07-21 2021-07-21 图片识别方法、装置、计算机设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113537196A CN113537196A (zh) 2021-10-22
CN113537196B true CN113537196B (zh) 2023-04-07

Family

ID=78120600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110834165.9A Active CN113537196B (zh) 2021-07-21 2021-07-21 图片识别方法、装置、计算机设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113537196B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117542031A (zh) * 2024-01-10 2024-02-09 成都阿加犀智能科技有限公司 一种基于智能购物车的商品识别方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125433A (zh) * 2014-07-30 2014-10-29 西安冉科信息技术有限公司 基于多球机联动结构的视频运动目标监控方法
CN105956539A (zh) * 2016-04-27 2016-09-21 武汉大学 一种基于背景建模和双目视觉的人体身高测量方法
CN106650617A (zh) * 2016-11-10 2017-05-10 江苏新通达电子科技股份有限公司 一种基于概率潜在语义分析的行人异常识别方法
CN111582332A (zh) * 2020-04-23 2020-08-25 浙江大学 一种高速铁路接触网吊弦部件的图片识别方法
CN113128604A (zh) * 2021-04-23 2021-07-16 北京奇艺世纪科技有限公司 页面元素的识别方法、装置、电子设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5500906A (en) * 1994-01-14 1996-03-19 Cognex Corporation Locating curvilinear objects using feathered fiducials
CN101794442B (zh) * 2010-01-25 2011-11-09 哈尔滨工业大学 一种从可见光图像中提取光照不敏感信息的标定方法
EP3246874B1 (en) * 2016-05-16 2018-03-14 Axis AB Method and apparatus for updating a background model used for background subtraction of an image
WO2018137226A1 (zh) * 2017-01-25 2018-08-02 深圳市汇顶科技股份有限公司 指纹提取方法及装置
CN108961316B (zh) * 2017-05-23 2022-05-31 华为技术有限公司 图像处理方法、装置及服务器
CN107563745A (zh) * 2017-09-19 2018-01-09 成都猫道科技有限公司 果蔬类商品自助称重与结账装置、***及使用方法
CN110516514B (zh) * 2018-05-22 2022-09-30 杭州海康威视数字技术股份有限公司 一种目标检测模型的建模方法和装置
CN111768553A (zh) * 2019-04-02 2020-10-13 珠海格力电器股份有限公司 一种自动售货柜的售货方法及自动售货柜
CN110232359B (zh) * 2019-06-17 2021-10-01 ***通信集团江苏有限公司 滞留物检测方法、装置、设备及计算机存储介质
CN111640267B (zh) * 2020-04-16 2021-12-24 浙江口碑网络技术有限公司 一种自助结算方法、装置、存储介质及计算机设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125433A (zh) * 2014-07-30 2014-10-29 西安冉科信息技术有限公司 基于多球机联动结构的视频运动目标监控方法
CN105956539A (zh) * 2016-04-27 2016-09-21 武汉大学 一种基于背景建模和双目视觉的人体身高测量方法
CN106650617A (zh) * 2016-11-10 2017-05-10 江苏新通达电子科技股份有限公司 一种基于概率潜在语义分析的行人异常识别方法
CN111582332A (zh) * 2020-04-23 2020-08-25 浙江大学 一种高速铁路接触网吊弦部件的图片识别方法
CN113128604A (zh) * 2021-04-23 2021-07-16 北京奇艺世纪科技有限公司 页面元素的识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113537196A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN108229322B (zh) 基于视频的人脸识别方法、装置、电子设备及存储介质
CN108921645B (zh) 一种商品购买判定方法、装置和用户终端
EP3910608A1 (en) Article identification method and system, and electronic device
KR102358607B1 (ko) 인공지능 감정 시스템, 인공지능 감정 방법 및 기록 매체
US20190019207A1 (en) Apparatus and method for store analysis
CN110033293B (zh) 获取用户信息的方法、装置及***
CN112464697B (zh) 基于视觉和重力感应的商品与顾客的匹配方法和装置
CN111242097A (zh) 一种人脸识别方法、装置、计算机可读介质及电子设备
CN114898249B (zh) 用于购物车内商品数量确认的方法、***及存储介质
US20160180315A1 (en) Information processing apparatus using object recognition, and commodity identification method by the same
CN111553302B (zh) 关键帧选取方法、装置、设备及计算机可读存储介质
CN113537196B (zh) 图片识别方法、装置、计算机设备及计算机可读存储介质
CN114374760A (zh) 图像测试方法、装置、计算机设备及计算机可读存储介质
CN112749596A (zh) 异常画面检测方法、装置、电子设备和存储介质
JP7337557B2 (ja) 情報処理装置、システム、情報処理方法及びプログラム
CN111754491A (zh) 一种图片清晰度判定方法及装置
CN114758384A (zh) 人脸检测方法、装置、设备及存储介质
CN114648720A (zh) 神经网络训练方法、图像检测方法、装置、设备及介质
CN116343198B (zh) 一种基于多模型的菜品识别方法及设备
JP2001101405A (ja) 画像認識方法及び画像認識装置
CN111797922A (zh) 文本图像分类方法及装置
CN110490065A (zh) 人脸识别方法及装置、存储介质、计算机设备
CN115620271B (zh) 图像处理、模型训练方法和装置
CN109857880B (zh) 一种基于模型的数据处理方法、装置及电子设备
JP6801677B2 (ja) 情報処理装置、制御方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant