CN113111826A - 目标物体检测方法、装置、可读存储介质及电子设备 - Google Patents

目标物体检测方法、装置、可读存储介质及电子设备 Download PDF

Info

Publication number
CN113111826A
CN113111826A CN202110438624.1A CN202110438624A CN113111826A CN 113111826 A CN113111826 A CN 113111826A CN 202110438624 A CN202110438624 A CN 202110438624A CN 113111826 A CN113111826 A CN 113111826A
Authority
CN
China
Prior art keywords
target object
information
target
stacking
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110438624.1A
Other languages
English (en)
Inventor
郭溪溪
王信
张文彩
贾忠良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Fangjianghu Technology Co Ltd
Original Assignee
Beijing Fangjianghu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Fangjianghu Technology Co Ltd filed Critical Beijing Fangjianghu Technology Co Ltd
Priority to CN202110438624.1A priority Critical patent/CN113111826A/zh
Publication of CN113111826A publication Critical patent/CN113111826A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例公开了一种目标物体检测方法、装置、计算机可读存储介质及电子设备,其中,该方法包括:获取对存放有目标物体的场地拍摄的场地图像;将场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息息和至少一个目标物体个体检测信息分别对应的目标物体类别信息;基于至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量;基于数量,生成用于向目标用户终端推送的推送信息。本公开实施例可以降低对目标物体的数量进行监控时对人的依赖,提高对目标物体的数量监控的效率。

Description

目标物体检测方法、装置、可读存储介质及电子设备
技术领域
本公开涉及计算机技术领域,尤其是一种目标物体检测方法、装置、计算机可读存储介质及电子设备。
背景技术
目前,在对一些场地进行建设、维护、施工等操作时,需要使用一些必要的物品,这些物品的剩余数量、已用数量、可用天数等往往需要较准确地估计。
例如,在室内装修工地的场景下,需要装修辅料的支撑,对辅料种类的识别和数量的有效监控对于工地管理至关重要。常见的装修工地的辅料通常包括:防水涂料,瓷砖胶,粉刷石膏,耐水腻子,墙固,地固,快粘粉等。辅料进入工地之后通常码放在指定区域内。当前装修工地施工对于辅料的管理多通过工长去现场查看或通过监控摄像头查看当前工地的辅料使用情况。
发明内容
本公开的实施例提供了一种目标物体检测方法、装置、计算机可读存储介质及电子设备。
本公开的实施例提供了一种目标物体检测方法,该方法包括:获取对存放有目标物体的场地拍摄的场地图像;将场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和至少一个目标物体个体检测信息分别对应的目标物体类别信息;基于至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量;基于数量,生成用于向目标用户终端推送的推送信息。
在一些实施例中,基于数量,生成用于向目标用户终端推送的推送信息,包括:确定同一目标物体类别信息对应的目标物体的单位时间消耗量;基于单位时间消耗量和对应的目标物体当前的数量,确定同一目标物体类别信息对应的目标物体的可用时间;生成包含可用时间的推送信息。
在一些实施例中,基于数量,生成用于向目标用户终端推送的推送信息,包括:确定同一目标物体类别信息对应的目标物体当前的数量是否满足预设待补充条件;如果满足预设待补充条件,生成用于提醒目标用户同一目标物体类别信息对应的目标物体需要补充的推送信息。
在一些实施例中,目标物体为生产资料;在如果满足预设待补充条件,生成用于提醒目标用户同一目标物体类别信息对应的目标物体需要补充的推送信息之后,方法还包括:接收目标用户终端的反馈信息;如果反馈信息表征不补充反馈信息对应的生产资料,根据反馈信息对应的生产资料的应用环节以及反馈信息对应的生产资料的数量确定应用环节的剩余工期并推送。
在一些实施例中,目标物体检测模型包括第一子模型、第二子模型和第三子模型;将场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和至少一个目标物体个体检测信息分别对应的目标物体类别信,包括:将场地图像输入第一子模型,得到表征目标物体的码放区域的区域掩膜信息;基于区域掩膜信息,从场地图像中提取目标物体区域图像;将目标物体区域图像输入第二子模型,得到至少一个目标物体码放堆掩膜信息和至少一个目标物体码放堆掩膜信息分别对应的目标物体类别信息;基于至少一个目标物体码放堆掩膜信息,从目标物体区域图像中提取至少一个目标物体码放堆图像;将至少一个目标物体码放堆图像分别输入第三子模型,得到至少一个目标物体个体掩膜信息作为目标物体个体检测信息,以及得到至少一个目标物体个体掩膜信息分别对应的目标物体类别信息。
在一些实施例中,基于至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量,包括:基于至少一个目标物体码放堆掩膜信息,确定表征位于外层的目标物体码放堆的至少一个第一目标物体码放堆掩膜信息和表征位于内层的目标物体码放堆的至少一个第二目标物体码放堆掩膜信息;基于至少一个第一目标物体码放堆掩膜信息、至少一个第二目标物体码放堆掩膜信息和至少一个目标物体个体掩膜信息,确定各个目标物体类别信息分别对应的位于外层的目标物体的第一数量和位于内层的目标物体的第二数量;基于第一数量和第二数量,确定同一目标物体类别信息对应的目标物体当前的数量。
在一些实施例中,第一子模型基于如下步骤训练得到:获取训练样本集合,其中,训练样本集合中的训练样本包括样本场地图像和对应的用于表征样本场地图像中的目标物体的码放区域的标注区域掩膜信息;将训练样本集合中的训练样本包括的样本场地图像作为预设的第一初始模型的输入,将输入的样本场地图像对应的标注区域掩膜信息作为第一初始模型的期望输出,训练得到第一子模型。
在一些实施例中,第二子模型基于如下步骤训练得到:获取从样本场地图像中截取样本目标物体区域图像和对应的用于表征至少一个目标物体码放堆所在位置的标注目标物体码放堆掩膜信息和标注目标物体类别信息;将样本目标物体区域图像作为预设的第二初始模型的输入,将输入的样本目标物体区域图像对应的标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型。
在一些实施例中,标注目标物体码放堆掩膜信息包括表征目标物体码放堆位于外层的第一标注目标物体码放堆掩膜信息和表征目标物体码放堆位于内层的第二标注目标物体码放堆掩膜信息;将输入的样本目标物体区域图像对应的标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型,包括:将输入的样本目标物体区域图像对应的第一标注目标物体码放堆掩膜信息、第二标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型。
在一些实施例中,第三子模型基于如下步骤训练得到:获取从样本目标物体区域图像中截取的至少一个样本目标物体码放堆图像和至少一个样本目标物体码放堆图像分别对应的用于表征目标物体的个体所在位置的标注目标物体个体掩膜信息和标注目标物体类别信息;将样本目标物体码放堆图像作为预设的第三初始模型的输入,将输入的样本目标物体码放堆图像对应的标注目标物体个体掩膜信息和标注目标物体类别信息作为第三初始模型的期望输出,训练得到第三子模型。
根据本公开实施例的另一个方面,提供了一种目标物体检测装置,该装置包括:获取模块,用于获取对存放有目标物体的场地拍摄的场地图像;检测模块,用于将场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和至少一个目标物体个体检测信息分别对应的目标物体类别信息;确定模块,用于基于至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量;生成模块,用于基于数量,生成用于向目标用户终端推送的推送信息。
在一些实施例中,生成模块包括:第一确定单元,用于确定同一目标物体类别信息对应的目标物体的单位时间消耗量;第二确定单元,用于基于单位时间消耗量和对应的目标物体当前的数量,确定同一目标物体类别信息对应的目标物体的可用时间;第一生成单元,用于生成包含可用时间的推送信息。
在一些实施例中,生成模块包括:第三确定单元,用于确定同一目标物体类别信息对应的目标物体当前的数量是否满足预设待补充条件;第二生成单元,用于如果满足预设待补充条件,生成用于提醒目标用户同一目标物体类别信息对应的目标物体需要补充的推送信息。
在一些实施例中,目标物体为生产资料;该装置还包括:接收模块,用于接收目标用户终端的反馈信息;推送模块,用于如果反馈信息表征不补充反馈信息对应的生产资料,根据反馈信息对应的生产资料的应用环节以及反馈信息对应的生产资料的数量确定应用环节的剩余工期并推送。
在一些实施例中,目标物体检测模型包括第一子模型、第二子模型和第三子模型;检测模块包括:第一检测单元,用于将场地图像输入第一子模型,得到表征目标物体的码放区域的区域掩膜信息;第一提取单元,用于基于区域掩膜信息,从场地图像中提取目标物体区域图像;第二检测单元,用于将目标物体区域图像输入第二子模型,得到至少一个目标物体码放堆掩膜信息和至少一个目标物体码放堆掩膜信息分别对应的目标物体类别信息;第二提取单元,用于基于至少一个目标物体码放堆掩膜信息,从目标物体区域图像中提取至少一个目标物体码放堆图像;第三检测单元,用于将至少一个目标物体码放堆图像分别输入第三子模型,得到至少一个目标物体个体掩膜信息作为目标物体个体检测信息,以及得到至少一个目标物体个体掩膜信息分别对应的目标物体类别信息。
在一些实施例中,确定模块包括:第四确定单元,用于基于至少一个目标物体码放堆掩膜信息,确定表征位于外层的目标物体码放堆的至少一个第一目标物体码放堆掩膜信息和表征位于内层的目标物体码放堆的至少一个第二目标物体码放堆掩膜信息;第五确定单元,用于基于至少一个第一目标物体码放堆掩膜信息、至少一个第二目标物体码放堆掩膜信息和至少一个目标物体个体掩膜信息,确定各个目标物体类别信息分别对应的位于外层的目标物体的第一数量和位于内层的目标物体的第二数量;第六确定单元,用于基于第一数量和第二数量,确定同一目标物体类别信息对应的目标物体当前的数量。
在一些实施例中,第一子模型基于如下步骤训练得到:获取训练样本集合,其中,训练样本集合中的训练样本包括样本场地图像和对应的用于表征样本场地图像中的目标物体的码放区域的标注区域掩膜信息;将训练样本集合中的训练样本包括的样本场地图像作为预设的第一初始模型的输入,将输入的样本场地图像对应的标注区域掩膜信息作为第一初始模型的期望输出,训练得到第一子模型。
在一些实施例中,第二子模型基于如下步骤训练得到:获取从样本场地图像中截取样本目标物体区域图像和对应的用于表征至少一个目标物体码放堆所在位置的标注目标物体码放堆掩膜信息和标注目标物体类别信息;将样本目标物体区域图像作为预设的第二初始模型的输入,将输入的样本目标物体区域图像对应的标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型。
在一些实施例中,标注目标物体码放堆掩膜信息包括表征目标物体码放堆位于外层的第一标注目标物体码放堆掩膜信息和表征目标物体码放堆位于内层的第二标注目标物体码放堆掩膜信息;将输入的样本目标物体区域图像对应的标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型,包括:将输入的样本目标物体区域图像对应的第一标注目标物体码放堆掩膜信息、第二标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型。
在一些实施例中,第三子模型基于如下步骤训练得到:获取从样本目标物体区域图像中截取的至少一个样本目标物体码放堆图像和至少一个样本目标物体码放堆图像分别对应的用于表征目标物体的个体所在位置的标注目标物体个体掩膜信息和标注目标物体类别信息;将样本目标物体码放堆图像作为预设的第三初始模型的输入,将输入的样本目标物体码放堆图像对应的标注目标物体个体掩膜信息和标注目标物体类别信息作为第三初始模型的期望输出,训练得到第三子模型。
根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序用于执行上述目标物体检测方法。
根据本公开实施例的另一个方面,提供了一种电子设备,电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令,并执行指令以实现上述目标物体检测方法。
基于本公开上述实施例提供的目标物体检测方法、装置、计算机可读存储介质及电子设备,通过对存放目标物体的场地拍摄图像,将场地图像输入目标物体检测模型,得到目标物体个体检测信息和对应的目标物体类别信息,然后基于目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量,最后根据数量生成推送信息。实现了利用电子设备实时自动监控各类目标物体的数量,使用户及时得知目标物体的使用情况,从而可以降低对目标物体的数量进行监控时对人的依赖,提高对目标物体的数量监控的效率。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开所适用的***图。
图2是本公开一示例性实施例提供的目标物体检测方法的流程示意图。
图3是本公开另一示例性实施例提供的目标物体检测方法的流程示意图。
图4是本公开另一示例性实施例提供的目标物体检测方法的流程示意图。
图5是本公开另一示例性实施例提供的目标物体检测方法的流程示意图。
图6是本公开的实施例的提取目标物体区域图像的示意图。
图7是本公开的实施例的提取目标物体码放堆图像的示意图。
图8是本公开的实施例的确定目标物体个体掩膜信息的示意图。
图9是本公开的实施例的目标检测模型的结构示意图。
图10是本公开另一示例性实施例提供的目标物体检测方法的流程示意图。
图11是本公开一示例性实施例提供的目标物体检测装置的结构示意图。
图12是本公开另一示例性实施例提供的目标物体检测装置的结构示意图。
图13是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机***、服务器等电子设备,其可与众多其它通用或专用计算***环境或配置一起操作。适于与终端设备、计算机***、服务器等电子设备一起使用的众所周知的终端设备、计算***、环境和/或配置的例子包括但不限于:个人计算机***、服务器计算机***、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的***、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机***、大型计算机***和包括上述任何***的分布式云计算技术环境,等等。
终端设备、计算机***、服务器等电子设备可以在由计算机***执行的计算机***可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机***/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算***存储介质上。
申请概述
在对一些场地进行施工、建设、装修等场景下,对于目标物体的管理多通过相关人员去现场查看或通过监控摄像头查看当前目标物体的使用情况。例如在室内装修工地的场景下,一个工长一般情况下同时管理着多个工地,存在着对辅料监管查看不及时,漏检等情况。而这种在线或者线下人眼查看与统计也非常浪费时间。因此,现有的辅料感知统计效率非常低,也存在着数据资源无法有效利用的情况。
示例性***
图1示出了可以应用本公开的实施例的目标物体检测方法或目标物体检测装置的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、网络102、服务器103和摄像头104。网络102用于在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。终端设备101上可以安装有各种通讯客户端应用,例如监控类应用、网页浏览器应用、即时通信工具等。
终端设备101可以是各种电子设备,包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。
摄像头104用于对存放由目标物体的场地进行拍摄,得到场地图像,并通过有线或无线传输方式将场地图像发送至终端设备101或服务器102。
服务器103可以是提供各种服务的服务器,例如对终端设备101或摄像头104上传的图像进行目标物体检测的后台图像处理服务器。后台图像处理服务器可以对接收到的图像进行处理,得到处理结果(例如目标物体的数量、类别等)并将处理结果反馈给终端设备101。
需要说明的是,本公开的实施例所提供的目标物体检测方法可以由服务器103执行,也可以由终端设备101执行,相应地,目标物体检测装置可以设置于服务器103中,也可以设置于终端设备101中。
应该理解,图1中的终端设备、网络、服务器和摄像头的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络、服务器和摄像头。
示例性方法
图2是本公开一示例性实施例提供的目标物体检测方法的流程示意图。本实施例可应用在电子设备(如图1所示的终端设备101或服务器103)上,如图2所示,该方法包括如下步骤:
步骤201,获取对存放有目标物体的场地拍摄的场地图像。
在本实施例中,电子设备可以获取对存放有目标物体的场地拍摄的场地图像。其中,场地图像可以是由图1所示的摄像头104对各种场地拍摄的图像。目标物体可以是预先指定的特定类别的物体。作为示例,场地可以是室内装修工地,目标物体可以是装修用的辅料,例如防水涂料,瓷砖胶,粉刷石膏,耐水腻子,墙固,地固,快粘粉等。
步骤202,将场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和至少一个目标物体个体检测信息分别对应的目标物体类别信息。
在本实施例中,电子设备可以将场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和至少一个目标物体个体检测信息分别对应的目标物体类别信息。其中,目标物体个体检测信息用于表征目标物体的个体在场地图像中的位置,基于目标物体个体检测信息,可以在场地图像中生成覆盖目标物体图像的标记。目标物体类别信息用于表征目标物体的类别,目标物体类别信息的形式可以包括但不限于数字、文字、符号等形式。
目标物体检测模型用于表征场地图像和目标物体个体检测信息和目标物体类别信息的对应关系。通常目标物体检测模型可以对输入的场地图像进行解析,得到图像特征信息,图像特征信息可以用于表征场地图像中的线条形状、纹理、颜色等特征,然后再基于图像特征信息,从场地图像中确定目标物体所在的区域并对该区域分类,得到目标物体个体检测信息和目标物体类别信息。目标物体检测模型可以是基于预设的训练样本集合,利用机器学习方法训练得到的。具体地,电子设备可以利用机器学习方法,将训练样本集合中的训练样本包括的样本场地图像作为输入,将与输入的样本场地图像对应的目标物体个体检测信息和目标物体类别信息作为期望输出,对初始模型(例如包括resnet网络、yolact++网络、分类器等)进行训练,针对每次训练输入的场地图像,可以得到实际输出。其中,实际输出是初始模型实际输出的数据,用于表征目标物体和目标物体的类别。然后,电子设备可以采用梯度下降法和反向传播法,基于实际输出和期望输出,调整初始模型的参数,将每次调整参数后得到的模型作为下次训练的初始模型,并在满足预设的训练结束条件(例如训练次数达到预设次数、基于预设的损失函数得到的损失值收敛)的情况下,结束训练,从而训练得到目标物体检测模型。
步骤203,基于至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量。
在本实施例中,电子设备可以基于至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量。具体地,电子设备可以根据上述至少一个目标物体个体检测信息的排列规则,确定目标物体码放的堆数,再确定每堆包括的目标物体的数量,进而计算出同一目标物体类别信息对应的目标物体当前的数量。
步骤204,基于数量,生成用于向目标用户终端推送的推送信息。
在本实施例中,电子设备可以基于同一目标物体类别信息对应的目标物体当前的数量,生成用于向目标用户终端推送的推送信息。其中,目标用户终端可以是预先设定的用于接收上述推送信息的终端,例如可以是负责场地施工的工长使用的手机终端。
在一些可选的实现方式中,如图3所示,步骤204可以如下执行:
步骤2041,确定同一目标物体类别信息对应的目标物体的单位时间消耗量。
其中,单位时间可以是设置的任意时间周期,例如一天、一星期等。单位时间消耗量可以根据每一类目标物体的历史数量确定。例如,对于某一类目标物体,可以提取前天的剩余数量和昨天的剩余数量,两者相减即为单位时间消耗量。或者可以根据过去N天中每天的剩余数量,对每天的消耗量取平均得到单位时间消耗量。
步骤2042,基于单位时间消耗量和对应的目标物体当前的数量,确定同一目标物体类别信息对应的目标物体的可用时间。
例如,将某一类目标物体当前的数量除以单位时间消耗量,得到该类目标物体的可用时间。
步骤2043,生成包含可用时间的推送信息。
本实现方式通过生成同一目标物体类别信息对应的目标物体的可用时间,向目标用户推送该可用时间,可以使目标用户及时得知某一类目标物体剩余的可用时间,提醒目标用户合理安排目标物体的使用情况,无需人工推算,从而提高了对目标物体的使用情况进行监控的效率。
在一些可选的实现方式中,如图4所示,步骤204还可以包括如下步骤:
步骤2044,确定同一目标物体类别信息对应的目标物体当前的数量是否满足预设待补充条件。
其中,同一目标物体类别信息对应的目标物体对应一个预设待补充条件。预设待补充条件是表示目标物体需要补充的条件。作为示例,可以针对每一类目标物体设置相应的数量阈值,从而可以判断每一类目标物体的数量是否小于等于对应的预设数量阈值,如果小于等于预设数量阈值,确定满足预设待补充条件。或者,利用上述实现方式确定的单位时间消耗量,确定某一类目标物体当前数量小于等于其对应的单位时间消耗量,或者小于等于单位时间消耗量与预设倍数的乘积,确定满足预设待补充条件。
步骤2045,如果满足所述预设待补充条件,生成用于提醒目标用户同一目标物体类别信息对应的目标物体需要补充的推送信息。
本实现方式通过在某一类目标物体的数量不足时生成相应的推送信息,可以使目标用户根据推送信息及时得知当前应该对目标物体进行补充,无需由人工对各个场地进行查看,提高了对目标物体的使用情况进行监控的效率。
在一些可选的实现方式中,所述目标物体为生产资料;在步骤2045之后,电子设备还可以执行如下步骤:
首先,接收所述目标用户终端的反馈信息。
其中,反馈信息是目标用户终端接收到上述步骤2045发送的推送信息后,目标用户对推送信息所做的反馈操作生成的信息。例如,目标用户为工地的工长,接收到某种生产资料需要补充的推送信息后,确认该生成资料因施工已经完成或即将完成不需要再补充,通过点击按钮、发送文字等方式进行反馈,生成反馈信息,目标用户终端将反馈信息发送给上述电子设备。
然后,如果所述反馈信息表征不补充所述反馈信息对应的生产资料,根据所述反馈信息对应的生产资料的应用环节以及所述反馈信息对应的生产资料的数量确定所述应用环节的剩余工期并推送。
其中,剩余工期的推送对象可以包括上述目标用户终端,也可以包括预先建立对应关系的其他终端设备,例如在室内装修的场景下,推送的对象可以是业主的终端、工人的终端、业务员的终端等。
作为示例,某种生产资料为地板胶,该生产资料的应用环节为铺设地板,若反馈信息表示施工已完成不需补充地板胶,则确定剩余工期为0,将剩余工期推送到上述推送对象;若反馈信息表示施工未完成且不需补充地板胶,则根据地板胶当前的数量和地板胶对应的单位时间消耗量确定剩余工期,并将剩余工期推送到上述推送对象。
该实现方式根据接收自目标用户终端的反馈信息,在反馈信息表示不补充生产资料时,推送生产资料的应用环节的剩余工期,可以使相关人员及时获得生产资料的使用情况和相应的工期状态,从而进一步提高了对生产资料的管理的效率。
本公开的上述实施例提供的方法,通过对存放目标物体的场地拍摄图像,将场地图像输入目标物体检测模型,得到目标物体个体检测信息和对应的目标物体类别信息,然后基于目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量,最后根据数量生成推送信息。实现了利用电子设备实时自动监控各类目标物体的数量,使用户及时得知目标物体的使用情况,从而可以降低对目标物体的数量进行监控时对人的依赖,提高对目标物体的数量监控的效率。
进一步参考图5,示出了目标物体检测方法的又一个实施例的流程示意图。在本实施例中,目标物体检测模型包括第一子模型、第二子模型和第三子模型。如图5所示,在上述图2所示实施例的基础上,步骤202可以包括如下步骤:
步骤2021,将场地图像输入第一子模型,得到表征目标物体的码放区域的区域掩膜信息。
其中,第一子模型用于表征场地图像和区域掩膜信息的对应关系。根据区域掩膜信息,可以在场地图像上生成覆盖所有目标物体的一个标记。如图6所示,场地图像601包括多个目标物体码放在一起的影像,区域掩膜信息6011覆盖了目标物体。
步骤2022,基于区域掩膜信息,从场地图像中提取目标物体区域图像。
具体地,电子设备可以根据区域掩膜信息覆盖的区域,从场地图像中截取出目标物体区域图像。如图6所示,将包含区域掩膜信息覆盖的区域的最小外接矩形从场地图像601中提取出来,得到目标物体区域图像602。
步骤2023,将目标物体区域图像输入第二子模型,得到至少一个目标物体码放堆掩膜信息和至少一个目标物体码放堆掩膜信息分别对应的目标物体类别信息。
其中,第二子模型用于表征目标物体区域图像与目标物体码放堆掩膜信息和目标物体类别信息的对应关系。根据目标物体码放堆掩膜信息,可以在目标物体区域图像上生成覆盖各个目标物体码放堆的标记。如图7所示,目标物体区域图像701包括多个目标物体码放堆的影像,目标物体码放堆掩膜信息7011-7014分别覆盖了位于外层的目标物体码放堆,目标物体码放堆掩膜信息7015-7016分别覆盖了位于内层的目标物体码放堆。目标物体码放堆掩膜信息7011-7013对应的目标物体类别信息表示目标物体的类别为类别一(例如石膏粉),目标物体码放堆掩膜信息7014-7015对应的目标物体类别信息表示目标物体的类别为类别二(例如瓷砖胶)。
步骤2024,基于至少一个目标物体码放堆掩膜信息,从目标物体区域图像中提取至少一个目标物体码放堆图像。
具体地,电子设备可以根据目标物体码放堆掩膜信息覆盖的区域,从目标物体区域图像中截取出至少一个目标物体码放堆图像。如图7所示,将包含区域掩膜信息7011-7014覆盖的区域的最小外接矩形分别从目标物体区域图像701中提取出来,得到目标物体码放堆图像702-705。
步骤2025,将至少一个目标物体码放堆图像分别输入第三子模型,得到至少一个目标物体个体掩膜信息作为目标物体个体检测信息,以及得到至少一个目标物体个体掩膜信息分别对应的目标物体类别信息。
其中,第三子模型用于表征目标物体码放堆图像与目标物体个体掩膜信息和目标物体类别信息的对应关系。根据目标物体个体掩膜信息,可以在目标物体码放堆图像上生成覆盖各个目标物体的标记。如图8所示,其中一个目标物体码放堆图像801包括多个目标物体的影像,目标物体个体掩膜信息8011-8014分别覆盖了各个目标物体,且分别对应的目标物体类别信息表示目标物体的类别为类别一(例如石膏粉)。
在本实施例中,上述第一子模型、第二子模型、第三子模型的结构可以相同,例如,可以采用yolact++模型的结构配置第一子模型、第二子模型、第三子模型。
作为示例,模型结构可以如图9所示,模型包括残差网络(如ResNet101)901,将图像输入残差网络901,得到特征图后输入特征金字塔(FeaturePyramid)网络902得到新的特征图,该特征图被分别送入两个分支,其中一个分支为protonet网络903,该分支为一个4层的全连接网络,用来生成S*S*K个大小的基于全图的特征信息,其中,S*S为特征图的大小,K为特征图的通道数,是一个超参数。另一个分支首先送入卷积层904得到新的特征图,再分别对该特征图进行了类别预测(由905执行)、每个掩膜信息的分数预测(由906执行)、bbox(bounding box)实例的坐标框回归(由907执行)、和protonet系数预测(由908执行)。图中的非极大值抑制(NMS)模块911通过对候选框进行置信度由大到小的排列,从置信度最高的候选框开始,计算所有剩余候选框与该候选框的重叠度,当重叠度大于0.7时删除。再从剩余的候选框中选出置信度最高的候选框重复上述动作,直到所有候选框遍历完为止,得到最终的bbox。
通过将预测的系数与protonet输出的特征图相乘得到每个实例的掩膜信息,通过对bbox和掩膜信息的分数设置阈值得到每个实例的个数和位置信息。具体地,bbox和掩膜信息的分数的取值范围在[0,1],分值越大表示bbox和掩膜信息准确性越高。通过设定一个阈值,可以删除小于阈值的bbox和掩膜信息(由909执行)。
最后,在protonet得到的掩膜信息上进行截取(crop,由910执行)得到每个实例的掩膜信息912。
上述图5对应实施例提供的方法,通过在目标物体检测模型设置第一子模型、第二子模型和第三子模型,可以分别对场地图像、目标物体区域图像、目标物体码放堆图像渐进地进行检测,每个子模型具有相应的检测针对性,从而有助于提高检测出各类目标物体的准确性。
在一些可选的实现方式中,基于上述图5对应实施例,如图10所示,步骤203可以如下执行:
步骤2031,基于至少一个目标物体码放堆掩膜信息,确定表征位于外层的目标物体码放堆的至少一个第一目标物体码放堆掩膜信息和表征位于内层的目标物体码放堆的至少一个第二目标物体码放堆掩膜信息。
其中,位于外层的目标物体码放堆是在场景图像中完整显示的目标物体码放堆。位于外层的目标物体码放堆是在场景图像中部分显示的目标物体码放堆。如图7所示,目标物体码放堆掩膜信息7011-7014为第一目标物体码放堆掩膜信息,目标物体码放堆掩膜信息7015-7016为第二目标物体码放堆掩膜信息。
步骤2032,基于至少一个第一目标物体码放堆掩膜信息、至少一个第二目标物体码放堆掩膜信息和至少一个目标物体个体掩膜信息,确定各个目标物体类别信息分别对应的位于外层的目标物体的第一数量和位于内层的目标物体的第二数量。
其中,针对某个目标物体类别,第一数量可以通过对第一目标物体码放堆掩膜信息包括的目标物体个体掩膜信息进行计数得到,第二数量可以根据第一目标物体码放堆掩膜信息包括的个体掩膜信息的层数得到。例如,第二数量=层数×第二目标物体码放堆掩膜信息的数量。
步骤2033,基于第一数量和第二数量,确定同一目标物体类别信息对应的目标物体当前的数量。
具体地,可以将每个目标物体类别信息对应的第一数量和第二数量相加,得到同一目标物体类别信息对应的目标物体当前的数量。
本实现方式通过对目标物体码放堆掩膜信息进行内外层划分,分别统计位于外层的目标物体的数量和位于内层的目标物体的数量,可以对被遮挡的目标物体的数量进行估计,提高确定目标物体的数量的准确性。
在一些可选的实现方式中,上述第一子模型基于如下步骤训练得到:
首先,获取训练样本集合。
其中,训练样本集合中的训练样本包括样本场地图像和对应的用于表征样本场地图像中的目标物体的码放区域的标注区域掩膜信息。
然后,将训练样本集合中的训练样本包括的样本场地图像作为预设的第一初始模型的输入,将输入的样本场地图像对应的标注区域掩膜信息作为第一初始模型的期望输出,训练得到第一子模型。
具体地,电子设备可以利用机器学习方法,将训练样本集合中的训练样本包括的样本场地图像作为输入,将与输入的样本场地图像对应的标注区域掩膜信息作为期望输出,对第一初始模型(例如图9所示的模型结构)进行训练,针对每次训练输入的场地图像,可以得到实际输出。其中,实际输出是第一初始模型实际输出的数据,用于表征目标物体所在的区域。然后,电子设备可以采用梯度下降法和反向传播法,基于实际输出和期望输出,调整第一初始模型的参数,将每次调整参数后得到的模型作为下次训练的初始模型,并在满足预设的训练结束条件(例如训练次数达到预设次数、基于预设的损失函数得到的损失值收敛)的情况下,结束训练,从而训练得到第一子模型。
在一些可选的实现方式中,第二子模型基于如下步骤训练得到:
首先,获取从样本场地图像中截取样本目标物体区域图像和对应的用于表征至少一个目标物体码放堆所在位置的标注目标物体码放堆掩膜信息和标注目标物体类别信息。
然后,将样本目标物体区域图像作为预设的第二初始模型的输入,将输入的样本目标物体区域图像对应的标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型。
其中,第二初始模型的结构可以与第一初始模型的结构相同,训练方法与上述第一子模型的训练方法基本相同,这里不再赘述。
在一些可选的实现方式中,上述标注目标物体码放堆掩膜信息包括表征目标物体码放堆位于外层的第一标注目标物体码放堆掩膜信息和表征目标物体码放堆位于内层的第二标注目标物体码放堆掩膜信息。
电子设备可以将输入的样本目标物体区域图像对应的第一标注目标物体码放堆掩膜信息、第二标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型。
训练完成的第二子模型可以检测出表示目标物***于码放的外层的第一目标物体码放堆掩膜信息和对应的目标物体类别信息,以及表示目标物***于码放的内层的第二目标物体码放堆掩膜信息和对应的目标物体类别信息。
本实现方式通过对位于内层的目标物体码放堆和位于外层的目标物体码放堆分别进行标注,可以使训练得到的第二子模型检测出位于外层和内层的目标物体码放堆,进而提高检测目标物体码放堆的全面性和准确性。
在一些可选的实现方式中,第三子模型基于如下步骤训练得到:
首先,获取从样本目标物体区域图像中截取的至少一个样本目标物体码放堆图像和至少一个样本目标物体码放堆图像分别对应的用于表征目标物体的个体所在位置的标注目标物体个体掩膜信息和标注目标物体类别信息。
然后,将样本目标物体码放堆图像作为预设的第三初始模型的输入,将输入的样本目标物体码放堆图像对应的标注目标物体个体掩膜信息和标注目标物体类别信息作为第三初始模型的期望输出,训练得到第三子模型。
其中,第三初始模型的结构可以与第一初始模型和第二初始模型的结构相同,训练方法与上述第一子模型和第二初始模型的训练方法基本相同,这里不再赘述。
上述训练第一子模型、第二子模型、第三子模型的方法,通过获取大量的样本场地图像作为训练样本,并对样本场地图像、样本目标物体区域图像、样本目标物体码放堆图像分别进行标注,可以使训练后的第一子模型、第二子模型、第三子模型准确地对目标物体的影像进行分割,从而提高从场地图像中确定目标物体的数量的准确性。
示例性装置
图11是本公开一示例性实施例提供的目标物体检测装置的结构示意图。本实施例可应用在电子设备上,如图11所示,目标物体检测装置包括:获取模块1101,用于获取对存放有目标物体的场地拍摄的场地图像;检测模块1102,用于将场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和至少一个目标物体个体检测信息分别对应的目标物体类别信息;确定模块1103,用于基于至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量;生成模块1104,用于基于数量,生成用于向目标用户终端推送的推送信息。
在本实施例中,获取模块1101可以获取对存放有目标物体的场地拍摄的场地图像。其中,场地图像可以是由图1所示的摄像头104对各种场地拍摄的图像。目标物体可以是预先指定的特定类别的物体。作为示例,场地可以是室内装修工地,目标物体可以是装修用的辅料,例如防水涂料,瓷砖胶,粉刷石膏,耐水腻子,墙固,地固,快粘粉等。
在本实施例中,检测模块1102可以将场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和至少一个目标物体个体检测信息分别对应的目标物体类别信息。其中,目标物体个体检测信息用于表征目标物体的个体在场地图像中的位置,基于目标物体个体检测信息,可以在场地图像中生成覆盖目标物体图像的标记。目标物体类别信息用于表征目标物体的类别,目标物体类别信息的形式可以包括但不限于数字、文字、符号等形式。
在本实施例中,确定模块1103可以基于至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量。具体地,确定模块1103可以根据上述至少一个目标物体个体检测信息的排列规则,确定目标物体码放的堆数,再确定每堆包括的目标物体的数量,进而计算出同一目标物体类别信息对应的目标物体当前的数量。
在本实施例中,生成模块1104可以基于同一目标物体类别信息对应的目标物体当前的数量,生成用于向目标用户终端推送的推送信息。其中,目标用户终端可以是预先设定的用于接收上述推送信息的终端,例如可以是负责场地施工的工长使用的手机终端。
参照图12,图12是本公开另一示例性实施例提供的目标物体检测装置的结构示意图。
在一些可选的实现方式中,生成模块1104包括:第一确定单元11041,用于确定同一目标物体类别信息对应的目标物体的单位时间消耗量;第二确定单元11042,用于基于单位时间消耗量和对应的目标物体当前的数量,确定同一目标物体类别信息对应的目标物体的可用时间;第一生成单元11043,用于生成包含可用时间的推送信息。
在一些可选的实现方式中,生成模块1104包括:第三确定单元11044,用于确定同一目标物体类别信息对应的目标物体当前的数量是否满足预设待补充条件;第二生成单元11045,用于如果满足预设待补充条件,生成用于提醒目标用户同一目标物体类别信息对应的目标物体需要补充的推送信息。
在一些可选的实现方式中,目标物体为生产资料;该装置还包括:接收模块1105,用于接收目标用户终端的反馈信息;推送模块1106,用于如果反馈信息表征不补充反馈信息对应的生产资料,根据反馈信息对应的生产资料的应用环节以及反馈信息对应的生产资料的数量确定应用环节的剩余工期并推送。
在一些可选的实现方式中,目标物体检测模型包括第一子模型、第二子模型和第三子模型;检测模块1102包括:第一检测单元11021,用于将场地图像输入第一子模型,得到表征目标物体的码放区域的区域掩膜信息;第一提取单元11022,用于基于区域掩膜信息,从场地图像中提取目标物体区域图像;第二检测单元11023,用于将目标物体区域图像输入第二子模型,得到至少一个目标物体码放堆掩膜信息和至少一个目标物体码放堆掩膜信息分别对应的目标物体类别信息;第二提取单元11024,用于基于至少一个目标物体码放堆掩膜信息,从目标物体区域图像中提取至少一个目标物体码放堆图像;第三检测单元11025,用于将至少一个目标物体码放堆图像分别输入第三子模型,得到至少一个目标物体个体掩膜信息作为目标物体个体检测信息,以及得到至少一个目标物体个体掩膜信息分别对应的目标物体类别信息。
在一些可选的实现方式中,确定模块1103包括:第四确定单元11031,用于基于至少一个目标物体码放堆掩膜信息,确定表征位于外层的目标物体码放堆的至少一个第一目标物体码放堆掩膜信息和表征位于内层的目标物体码放堆的至少一个第二目标物体码放堆掩膜信息;第五确定单元11032,用于基于至少一个第一目标物体码放堆掩膜信息、至少一个第二目标物体码放堆掩膜信息和至少一个目标物体个体掩膜信息,确定各个目标物体类别信息分别对应的位于外层的目标物体的第一数量和位于内层的目标物体的第二数量;第六确定单元11033,用于基于第一数量和第二数量,确定同一目标物体类别信息对应的目标物体当前的数量。
在一些可选的实现方式中,第一子模型基于如下步骤训练得到:获取训练样本集合,其中,训练样本集合中的训练样本包括样本场地图像和对应的用于表征样本场地图像中的目标物体的码放区域的标注区域掩膜信息;将训练样本集合中的训练样本包括的样本场地图像作为预设的第一初始模型的输入,将输入的样本场地图像对应的标注区域掩膜信息作为第一初始模型的期望输出,训练得到第一子模型。
在一些可选的实现方式中,第二子模型基于如下步骤训练得到:获取从样本场地图像中截取样本目标物体区域图像和对应的用于表征至少一个目标物体码放堆所在位置的标注目标物体码放堆掩膜信息和标注目标物体类别信息;将样本目标物体区域图像作为预设的第二初始模型的输入,将输入的样本目标物体区域图像对应的标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型。
在一些可选的实现方式中,标注目标物体码放堆掩膜信息包括表征目标物体码放堆位于外层的第一标注目标物体码放堆掩膜信息和表征目标物体码放堆位于内层的第二标注目标物体码放堆掩膜信息;将输入的样本目标物体区域图像对应的标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型,包括:将输入的样本目标物体区域图像对应的第一标注目标物体码放堆掩膜信息、第二标注目标物体码放堆掩膜信息和标注目标物体类别信息作为第二初始模型的期望输出,训练得到第二子模型。
在一些可选的实现方式中,第三子模型基于如下步骤训练得到:获取从样本目标物体区域图像中截取的至少一个样本目标物体码放堆图像和至少一个样本目标物体码放堆图像分别对应的用于表征目标物体的个体所在位置的标注目标物体个体掩膜信息和标注目标物体类别信息;将样本目标物体码放堆图像作为预设的第三初始模型的输入,将输入的样本目标物体码放堆图像对应的标注目标物体个体掩膜信息和标注目标物体类别信息作为第三初始模型的期望输出,训练得到第三子模型。
本公开上述实施例提供的目标物体检测装置,通过对存放目标物体的场地拍摄图像,将场地图像输入目标物体检测模型,得到目标物体个体掩膜信息和对应的目标物体类别信息,然后基于目标物体个体掩膜信息,确定同一目标物体类别信息对应的目标物体当前的数量,最后根据数量生成推送信息。实现了利用电子设备实时自动监控各类目标物体的数量,使用户及时得知目标物体的使用情况,从而可以降低对目标物体的数量进行监控时对人的依赖,提高对目标物体的数量监控的效率。
示例性电子设备
下面,参考图13来描述根据本公开实施例的电子设备。该电子设备可以是如图1所示的终端设备101和服务器103中的任一个或两者、或与它们独立的单机设备,该单机设备可以与终端设备101和服务器103进行通信,以从它们接收所采集到的输入信号。
图13图示了根据本公开实施例的电子设备的框图。
如图13所示,电子设备1300包括一个或多个处理器1301和存储器1302。
处理器1301可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备1300中的其他组件以执行期望的功能。
存储器1302可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器1301可以运行程序指令,以实现上文的本公开的各个实施例的目标物体检测方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如场地图像、掩膜信息等各种内容。
在一个示例中,电子设备1300还可以包括:输入装置1303和输出装置1304,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
例如,在该电子设备是终端设备101或服务器103时,该输入装置1303可以是摄像头、鼠标、键盘设备,用于输入图像。在该电子设备是单机设备时,该输入装置1303可以是通信网络连接器,用于从终端设备101和服务器103接收所输入的图像。
该输出装置1304可以向外部输出各种信息,包括生成的推送信息。该输出设备1304可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图13中仅示出了该电子设备1300中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备1300还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的目标物体检测方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的目标物体检测方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于***实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种目标物体检测方法,包括:.
获取对存放有目标物体的场地拍摄的场地图像;
将所述场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和所述至少一个目标物体个体检测信息分别对应的目标物体类别信息;
基于所述至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的所述目标物体当前的数量;
基于所述数量,生成用于向目标用户终端推送的推送信息。
2.根据权利要求1所述的方法,其中,所述基于所述数量,生成用于向目标用户终端推送的推送信息,包括:
确定同一目标物体类别信息对应的目标物体的单位时间消耗量;
基于所述单位时间消耗量和对应的目标物体当前的数量,确定所述同一目标物体类别信息对应的目标物体的可用时间;
生成包含所述可用时间的推送信息。
3.根据权利要求1或2所述的方法,其中,所述基于所述数量,生成用于向目标用户终端推送的推送信息,包括:
确定同一目标物体类别信息对应的目标物体当前的数量是否满足预设待补充条件;
如果满足所述预设待补充条件,生成用于提醒所述目标用户所述同一目标物体类别信息对应的目标物体需要补充的推送信息。
4.根据权利要求3所述的方法,其中,所述目标物体为生产资料;
在所述如果满足所述预设待补充条件,生成用于提醒所述目标用户所述同一目标物体类别信息对应的目标物体需要补充的推送信息之后,所述方法还包括:
接收所述目标用户终端的反馈信息;
如果所述反馈信息表征不补充所述反馈信息对应的生产资料,根据所述反馈信息对应的生产资料的应用环节以及所述反馈信息对应的生产资料的数量确定所述应用环节的剩余工期并推送。
5.根据权利要求1所述的方法,其中,所述目标物体检测模型包括第一子模型、第二子模型和第三子模型;
所述将所述场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和所述至少一个目标物体个体检测信息分别对应的目标物体类别信息,包括:
将所述场地图像输入所述第一子模型,得到表征所述目标物体的码放区域的区域掩膜信息;
基于所述区域掩膜信息,从所述场地图像中提取目标物体区域图像;
将所述目标物体区域图像输入所述第二子模型,得到至少一个目标物体码放堆掩膜信息和所述至少一个目标物体码放堆掩膜信息分别对应的目标物体类别信息;
基于所述至少一个目标物体码放堆掩膜信息,从所述目标物体区域图像中提取至少一个目标物体码放堆图像;
将所述至少一个目标物体码放堆图像分别输入所述第三子模型,得到至少一个目标物体个体掩膜信息作为目标物体个体检测信息,以及得到所述至少一个目标物体个体掩膜信息分别对应的目标物体类别信息。
6.根据权利要求5所述的方法,其中,所述基于所述至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的所述目标物体当前的数量,包括:
基于所述至少一个目标物体码放堆掩膜信息,确定表征位于外层的目标物体码放堆的至少一个第一目标物体码放堆掩膜信息和表征位于内层的目标物体码放堆的至少一个第二目标物体码放堆掩膜信息;
基于所述至少一个第一目标物体码放堆掩膜信息、所述至少一个第二目标物体码放堆掩膜信息和所述至少一个目标物体个体掩膜信息,确定各个目标物体类别信息分别对应的位于外层的目标物体的第一数量和位于内层的目标物体的第二数量;
基于所述第一数量和所述第二数量,确定同一目标物体类别信息对应的目标物体当前的数量。
7.根据权利要求5所述的方法,其中,所述第一子模型基于如下步骤训练得到:
获取训练样本集合,其中,所述训练样本集合中的训练样本包括样本场地图像和对应的用于表征样本场地图像中的目标物体的码放区域的标注区域掩膜信息;
将所述训练样本集合中的训练样本包括的样本场地图像作为预设的第一初始模型的输入,将输入的样本场地图像对应的标注区域掩膜信息作为所述第一初始模型的期望输出,训练得到所述第一子模型。
8.一种目标物体检测装置,包括:
获取模块,用于获取对存放有目标物体的场地拍摄的场地图像;
检测模块,用于将所述场地图像输入预先训练的目标物体检测模型,得到至少一个目标物体个体检测信息和所述至少一个目标物体个体检测信息分别对应的目标物体类别信息;
确定模块,用于基于所述至少一个目标物体个体检测信息,确定同一目标物体类别信息对应的目标物体当前的数量;
生成模块,用于基于所述数量,生成用于向目标用户终端推送的推送信息。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7任一所述的方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-7任一所述的方法。
CN202110438624.1A 2021-04-22 2021-04-22 目标物体检测方法、装置、可读存储介质及电子设备 Pending CN113111826A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110438624.1A CN113111826A (zh) 2021-04-22 2021-04-22 目标物体检测方法、装置、可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110438624.1A CN113111826A (zh) 2021-04-22 2021-04-22 目标物体检测方法、装置、可读存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN113111826A true CN113111826A (zh) 2021-07-13

Family

ID=76719676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110438624.1A Pending CN113111826A (zh) 2021-04-22 2021-04-22 目标物体检测方法、装置、可读存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113111826A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105551064A (zh) * 2015-12-08 2016-05-04 济南中维世纪科技有限公司 一种基于图像特征估计堆料体积变化率的方法
KR20170139903A (ko) * 2016-06-10 2017-12-20 박희정 인테리어 서비스 방법 및 인테리어 서비스 시스템
CN107507031A (zh) * 2017-08-24 2017-12-22 温州大学瓯江学院 一种建材资金预算***
CN108052881A (zh) * 2017-11-30 2018-05-18 华中科技大学 一种实时检测施工现场图像中多类实体对象的方法及设备
CN110688945A (zh) * 2019-09-26 2020-01-14 成都睿云物联科技有限公司 整洁度检测方法、装置、计算机设备和存储介质
KR20200082816A (ko) * 2018-12-31 2020-07-08 서울시립대학교 산학협력단 간접작업항목 도출을 이용하는 건축물량산출장치 및 건축물량산출방법, 그리고 이를 이용하는 시스템
CN111414503A (zh) * 2020-05-08 2020-07-14 刘克建 基于区块链与cim的木材堆积检测***
CN112015314A (zh) * 2020-08-21 2020-12-01 北京五八信息技术有限公司 信息展示方法、装置、电子设备和介质
CN112258452A (zh) * 2020-09-23 2021-01-22 洛伦兹(北京)科技有限公司 堆叠物体的物体数量检测方法、装置及***
CN112348835A (zh) * 2020-11-30 2021-02-09 广联达科技股份有限公司 一种物料数量的检测方法、装置、电子设备及存储介质
US20210049011A1 (en) * 2019-08-14 2021-02-18 Jerry D. Harthcock Universal floating-point instruction set architecture for computing directly with decimal character sequences and binary formats in any combination

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105551064A (zh) * 2015-12-08 2016-05-04 济南中维世纪科技有限公司 一种基于图像特征估计堆料体积变化率的方法
KR20170139903A (ko) * 2016-06-10 2017-12-20 박희정 인테리어 서비스 방법 및 인테리어 서비스 시스템
CN107507031A (zh) * 2017-08-24 2017-12-22 温州大学瓯江学院 一种建材资金预算***
CN108052881A (zh) * 2017-11-30 2018-05-18 华中科技大学 一种实时检测施工现场图像中多类实体对象的方法及设备
KR20200082816A (ko) * 2018-12-31 2020-07-08 서울시립대학교 산학협력단 간접작업항목 도출을 이용하는 건축물량산출장치 및 건축물량산출방법, 그리고 이를 이용하는 시스템
US20210049011A1 (en) * 2019-08-14 2021-02-18 Jerry D. Harthcock Universal floating-point instruction set architecture for computing directly with decimal character sequences and binary formats in any combination
CN110688945A (zh) * 2019-09-26 2020-01-14 成都睿云物联科技有限公司 整洁度检测方法、装置、计算机设备和存储介质
CN111414503A (zh) * 2020-05-08 2020-07-14 刘克建 基于区块链与cim的木材堆积检测***
CN112015314A (zh) * 2020-08-21 2020-12-01 北京五八信息技术有限公司 信息展示方法、装置、电子设备和介质
CN112258452A (zh) * 2020-09-23 2021-01-22 洛伦兹(北京)科技有限公司 堆叠物体的物体数量检测方法、装置及***
CN112348835A (zh) * 2020-11-30 2021-02-09 广联达科技股份有限公司 一种物料数量的检测方法、装置、电子设备及存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BELTRAN, J等: "Towards Autonomous Driving:a Multi-Modal 360° Perception Proposal", 《23RD IEEE INTERNATIONAL CONFERENCE ON INTELLIGENT TRANSPORTATION SYSTEMS(ITSC)》, pages 1 - 6 *
DANIEL BOLYA等: "YOLACT:Real-time instance segmentation", 《2019 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION(ICCV)》, pages 1 - 10 *
唐涛: "水利水电工程", 30 August 2020, 中国建材工业出版社, pages: 327 - 328 *
柳本立;屈建军;宁堆虎;俎瑞平;: "不同排列形式堆积体风蚀率测算", 水土保持学报, no. 01, pages 62 - 66 *
王志丹;: "基于小数据的钢筋检测方法的研究", 邮电设计技术, no. 02, pages 44 - 49 *
王文发;许淳;: "基于BIM的住宅施工质量可视化动态监测仿真", 计算机仿真, no. 04, pages 409 - 412 *

Similar Documents

Publication Publication Date Title
US11557009B2 (en) System and method for generating financial assessments based on construction site images
US20230394405A1 (en) Controlling image acquisition robots in construction sites
US20230368094A1 (en) Generating and Presenting Scripts Related to Construction Sites
US10572853B2 (en) Inventory control system
CN111012261A (zh) 基于场景识别的清扫方法、***、扫地设备及存储介质
CN111009002B (zh) 点云配准检测方法、装置以及电子设备、存储介质
US20220121785A1 (en) System and Method for Automated Material Take-Off
CN111179461A (zh) 基于bim模型的巡检记录生成方法、设备及存储介质
CN114140528A (zh) 数据标注方法、装置、计算机设备及存储介质
WO2022247414A1 (zh) 空间几何信息估计模型的生成方法和装置
JP2008225704A (ja) 作業評価装置、作業評価方法、および、制御プログラム
US11062523B2 (en) Creation authoring point tool utility to recreate equipment
CN115690496A (zh) 基于YOLOv5的实时区域入侵检测方法
CN111444570A (zh) 一种施工误差信息的获取方法及装置
CN113111826A (zh) 目标物体检测方法、装置、可读存储介质及电子设备
JP2021005229A (ja) 安全管理装置、安全管理方法及び安全管理プログラム
CN113128414A (zh) 人员跟踪方法、装置、计算机可读存储介质及电子设备
CN111027413A (zh) 远距离多工位物体检测方法、***及存储介质
US20240095620A1 (en) Measurement application
KR102603541B1 (ko) Bim을 이용한 건축설계 방법
CN116152487A (zh) 一种基于深度IoU网络的目标检测方法、装置、设备及介质
CN114677605A (zh) 失物检测方法、装置、设备和存储介质
WO2023114398A1 (en) Computer vision systems and methods for segmenting and classifying building components, contents, materials, and attributes
CN115056246A (zh) 一种机器人远程位置显示方法、装置和电子设备
CN117372866A (zh) 处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination