CN113643136B - 信息处理方法、***和装置 - Google Patents

信息处理方法、***和装置 Download PDF

Info

Publication number
CN113643136B
CN113643136B CN202111020380.1A CN202111020380A CN113643136B CN 113643136 B CN113643136 B CN 113643136B CN 202111020380 A CN202111020380 A CN 202111020380A CN 113643136 B CN113643136 B CN 113643136B
Authority
CN
China
Prior art keywords
picture
picture data
prediction model
scene type
management platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111020380.1A
Other languages
English (en)
Other versions
CN113643136A (zh
Inventor
谢庆喜
孔德凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong Technology Information Technology Co Ltd
Original Assignee
Jingdong Technology Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong Technology Information Technology Co Ltd filed Critical Jingdong Technology Information Technology Co Ltd
Priority to CN202111020380.1A priority Critical patent/CN113643136B/zh
Publication of CN113643136A publication Critical patent/CN113643136A/zh
Application granted granted Critical
Publication of CN113643136B publication Critical patent/CN113643136B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Image Analysis (AREA)

Abstract

本公开的实施例公开了信息处理方法、***和装置。该方法的一具体实施方式包括:接收图片管理平台发送的图片数据和图片数据对应的场景类型;响应于不存在场景类型对应的图片预测模型,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型;存储图片预测模型以及图片预测模型与场景类型之间的对应关系。实现一种基于机器学习的针对多场景的信息处理方法、***和设备。

Description

信息处理方法、***和装置
技术领域
本公开的实施例涉及计算机技术领域,具体涉及数据处理技术领域,尤其涉及信息处理方法、***和装置。
背景技术
中国是全球最大的商品期货交易市场和第一大农产品期货交易市场。上市品种数量接近80个,包括农副产品如活猪、活牛等,金属产品如钢筋、钢管等,能源产品如原油、橡胶等,因此期货交易市场的稳定性将会直接影响到国家的经济体系。为保证大宗商品交易的正常进行,在商品期货交易中,需要及时、准确地确定物品的实际储存情况,需要一种针对不同物品的盘点***来实现。
发明内容
本公开的实施例提出了信息处理方法、***和装置。
第一方面,本公开的实施例提供了一种信息处理方法,包括:接收图片管理平台发送的图片数据和图片数据对应的场景类型;响应于不存在场景类型对应的图片预测模型,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型;存储图片预测模型以及图片预测模型与场景类型之间的对应关系。
在一些实施例中,方法还包括:响应于存在场景类型对应的图片预测模型,将图片数据输入至图片预测模型,生成与输入的图片数据对应的标注结果图以及标注结果图中的目标区域的数量。
在一些实施例中,方法还包括:将图片数据、与图片数据对应的标注结果图、与标注结果对应的目标区域的数量发送至图片管理平台。
在一些实施例中,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型,包括:将图片数据作为输入、图片数据中被标注为目标联通区域的blob图作为输出,训练得到场景类型对应的图片预测模型。
在一些实施例中,图片预测模型的网络结构基于深度残差网络和特征图金字塔网络而构建;深度残差网络为resnet-50,特征图金字塔网络为递归FPN。
在一些实施例中,方法还包括:发送模型训练结果对应的提示信息至图片管理平台。
第二方面,本公开的实施例提供了一种信息处理***,包括:模型管理平台,其中,模型管理平台用于执行上述任意一项的信息处理方法。
在一些实施例中,***还包括:图片管理平台;图片管理平台,用于接收图片采集装置发送的视频流,获取视频流中的图片数据;根据图片采集装置的配置信息,确定图片数据对应的场景类型;将图片数据和场景类型发送至模型管理平台。
在一些实施例中,图片管理平台,还用于接收模型管理平台发送的图片数据、与图片数据对应的标注结果图和标注结果对应的目标区域的数量;将接收到的图片数据、标注结果图、目标区域的数量发送至终端。
在一些实施例中,图片管理平台,还用于对接入的各图片采集装置进行场景类型的配置;对各图片采集装置的场景类型进行管理。
第三方面,本公开的实施例提供了一种信息处理装置,包括:接收单元,被配置成接收图片管理平台发送的图片数据和图片数据对应的场景类型;训练单元,被配置成响应于不存在场景类型对应的图片预测模型,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型;存储单元,被配置成存储图片预测模型以及图片预测模型与场景类型之间的对应关系。
在一些实施例中,装置还包括:生成单元,被配置成响应于存在场景类型对应的图片预测模型,将图片数据输入至图片预测模型,生成与输入的图片数据对应的标注结果图以及标注结果图中的目标区域的数量。
在一些实施例中,装置还包括:发送单元,被配置成将图片数据、与图片数据对应的标注结果图、与标注结果对应的目标区域的数量发送至图片管理平台。
在一些实施例中,训练单元进一步被配置成将图片数据作为输入、图片数据中被标注为目标联通区域的blob图作为输出,训练得到场景类型对应的图片预测模型。
在一些实施例中,装置中的图片预测模型的网络结构基于深度残差网络和特征图金字塔网络而构建;深度残差网络为resnet-50,特征图金字塔网络为递归FPN。
在一些实施例中,装置还包括:第二发送单元,被配置成发送模型训练结果对应的提示信息至图片管理平台。
第四方面,本公开的实施例提供了一种终端设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第五方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的实施例提供的信息处理方法、***和装置,通过接收图片管理平台发送的图片数据和图片数据对应的场景类型,响应于不存在场景类型对应的图片预测模型,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型,存储图片预测模型以及图片预测模型与场景类型之间的对应关系。实现一种基于机器学习的针对多场景的信息处理方法、***和设备,进一步实现基于机器学习的多场景的智能盘点方法、***和装置。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一些实施例可以应用于其中的示例性***架构图;
图2是根据本公开的信息处理方法的一个实施例的流程图;
图3是根据本公开的信息处理方法的一个应用场景的示意图;
图4是根据本公开的信息处理方法的又一个实施例的流程图;
图5是根据本公开的信息处理***的一个实施例的结构示意图;
图6是根据本公开的信息处理装置的一个实施例的结构示意图;
图7是适于用来实现本公开的实施例的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的实施例的信息处理方法或信息处理装置的示例性***架构100。
如图1所示,***架构100可以包括图片采集装置101、图片管理平台102,模型管理平台103和终端设备104。
模型管理平台103利用接口协议与上述图片管理平台102通信连接,上述模型管理平台103可以是提供图片预测和模型训练的服务器或电子设备,例如,对上述图片管理平台102发送的图片数据和图片数据对应的场景类型进行判断,根据判断结果进行模型训练和/或图片预测,并将模型训练的结果和/或图片预测的结果返回至上述图片管理平台102。
图片管理平台102分别与上述图片采集装置101、模型管理平台103和终端设备104通信连接,上述图片管理平台可以是对图片、图片预测结果、图片采集装置的场景类型进行管理的服务器或电子设备,例如接收图片采集装置101发送的视频流,获取视频流中的图片数据,并根据图片采集装置101的场景配置信息,确定图片数据对应的场景类型,将图片数据和场景类型发送至模型管理平台103,接收模型管理平台103返回的图片预测结果和图片数据,将图片预测结果和图片数据整合后发送给终端设备104。图片管理平台102上存储有与图片、图片预测结果、图片采集装置的场景类型对应的配置文件或管理文档。
图片采集装置101利用各种接口协议与图片管理平台102通信连接,其中,接口协议至少可以包括:软件开发工具包SDK、开放式网络视频接口ONVIF、GB/T28181和实时流传输协议RTSP,图片采集装置101可以包括:各种品牌的主流摄像头、AI边缘摄像头和其他边缘摄像头等,图片采集装置101可以设置于各种主流相机和个性化AI相机中。
终端设备104可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。
上述***架构100中的各个设备之间可以通过网络实现通信连接,上述网络可以是在上述图片采集装置101、图片管理平台102,模型管理平台103和终端设备104之间提供通信链路的介质,可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
需要说明的是,本申请实施例所提供的信息处理方法一般由模型管理平台103执行,相应地,信息处理装置一般设置于模型管理平台103中。
应该理解,图1中的图片采集装置、图片管理平台,模型管理平台和终端设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的图片采集装置、图片管理平台,模型管理平台以及终端设备。
继续参考图2,示出了根据本公开的信息处理方法的一个实施例的流程200。该信息处理方法,包括以下步骤:
步骤201,接收图片管理平台发送的图片数据和图片数据对应的场景类型。
在本实施例中,执行主体(例如图1所示的模型管理平台)可以实时或按一定时间周期接收图片管理平台发送的图片数据和图片数据对应的场景类型。其中,图片是指由图形、图像等构成的平面媒体。场景类型可以根据物品的品种进行划分,比如金属钢筋、金属钢管、农副产品-猪、农副产品-牛、能源产品-原油、橡胶等,还可以根据物品所处位置的不同进行划分,比如生产间、测试间、仓库货架等,还可以根据所处的不同时间点进行划分。场景类型可以根据各种应用场景或应用场景的不同状态进行划分。这里,图片数据的个数可以为一个,也可以为多个,图片数据的格式可以为各种图片格式,比如bmp格式、png格式、gif格式、JPEG格式、AI格式、PSD格式等,对于图片数据的数量和图片数据的格式不做进一步限定。
步骤202,响应于不存在场景类型对应的图片预测模型,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型。
在本实施例中,上述执行主体可以在接收到步骤201中的图片数据和场景类型后,判断模型库中是否存在场景类型对应的图片预测模型,当判断不存在时,进一步判断图片数据是否符合模型训练的数据要求,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,利用机器学习技术训练得到场景类型对应的图片预测模型。
在本实施例的一些可选的实现方式中,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型,包括:将图片数据作为输入、图片数据中被标注为目标联通区域的blob图作为输出,训练得到场景类型对应的图片预测模型。通过对图像进行blob分析,将异常的联通区域作为目标联通区域,实现一种模型预测方法。
在本实施例的一些可选的实现方式中,图片预测模型的网络结构基于深度残差网络和特征图金字塔网络而构建;深度残差网络为resnet-50,特征图金字塔网络为递归FPN。作为示例,特征图金字塔网络的特征融合过程可以为:将resnet layer5下采样32倍的特征图进行2倍的上采样后与resnet layer4下采样16倍的特征图进行融合,得到第一融合特征图,所述第一融合特征图为基于原图16倍下采样后的特征图;将第一融合特征图进行2倍的上采样后与resnet layer3下采样8倍的特征图进行融合,得到第二融合特征图,所述第二特征图为基于原图8倍下采样后的特征图;将第二融合特征图进行8倍上采样,得到原图对应的结果图。通过特征提取和特征融合相结合,利用FPN进行多尺度的特征融合,使得提取的信息更加丰富,同时对小目标也能获得足够的特征信息,实现一种更加精细化的模型训练方法。
对图片预测模型进行进一步说明,在图片预测模型训练过程中,可以在特征提取阶段引入attention机制,达到模型对重点信息的学习,利用Attention机制的设计可以加强,盘点算法对覆盖范围的学习,从而能达到自动识别的效果。预测过程可以从单点监督扩展到多点监督,实现算法的监督学习。例如,通过将单点监督的标注信息,扩展到一个3*3的核内,达到增加多点监督的优化梯度的效果,核的大小可以根据不同场景进行设计,当摄像头覆盖范围较大时,目标物体相对较小时可以使用3*3的核,扩充到9个点,当摄像头覆盖范围较小时,目标物体相对较大可以使用5*5的核,扩充到25个点,或者更大的核,实现更有效的监督,多点监督可以实现当猪只扎堆,猪身体部分被遮挡的情况下,仍然能精准的进行盘点。
在本实施例的一些可选的实现方式中,方法还包括:当判定图片数据不符合模型训练的数据要求时,停止执行。实现快速地信息处理。
步骤203,存储图片预测模型以及图片预测模型与场景类型之间的对应关系。
在本实施例中,当上述执行主体确认步骤202中的图片预测模型已训练完成后,可以存储图片预测模型以及图片预测模型与场景类型之间的对应关系至模板库中。
在本实施例的一些可选的实现方式中,方法还包括:发送模型训练结果对应的提示信息至图片管理平台。在模型训练完成后,同步该场景的图片预测模型至图片管理平台,以使下次调用时,可以直接进行模型的前项运算,计算对应图片的盘点数量。
需要说明的是,技术人员可以根据实际需求,自行设定上述图片预测模型的模型结构,本公开的实施例对此不做限定。
继续参见图3,图3是根据本实施例的信息处理方法的一个应用场景的示意图300。本实施例的信息处理方法运行于电子设备301中。首先电子设备301接收图片管理平台发送的图片数据和图片数据对应的场景类型302,然后电子设备301响应于不存在场景类型对应的图片预测模型,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型303,最后电子设备301存储图片预测模型以及图片预测模型与场景类型之间的对应关系304。
本公开的实施例提供的信息处理方法,通过接收图片管理平台发送的图片数据和图片数据对应的场景类型,响应于不存在场景类型对应的图片预测模型,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型,存储图片预测模型以及图片预测模型与场景类型之间的对应关系。实现一种基于机器学习的针对多场景的信息处理方法,进一步实现基于机器学习的多场景的智能盘点方法。解决了现有技术的人工盘点耗时长、误差大、人力成本高的问题。
进一步参考图4,其示出了信息处理方法的又一个实施例的流程。该信息处理方法的流程400,包括以下步骤:
步骤401,接收图片管理平台发送的图片数据和图片数据对应的场景类型。
步骤402,响应于存在场景类型对应的图片预测模型,将图片数据输入至图片预测模型,生成与输入的图片数据对应的标注结果图以及标注结果图中的目标区域的数量。
在本实施例中,当执行主体判定存在场景类型对应的图片预测模型时,将图片数据输入至图片预测模型,生成与输入的图片数据对应的标注结果图以及标注结果图中的目标区域的数量。图片预测模型可以是通过历史数据预先训练得到的。图片预测模型采用端到端的网络模型结构,输入与输出的尺寸一致。
步骤403,将图片数据、与图片数据对应的标注结果图、与标注结果对应的目标区域的数量发送至图片管理平台。
在本实施例中,执行主体将图片数据和生成的与图片数据对应的标注结果图以及与标注结果对应的目标区域的数量发送至图片管理平台。
在本实施例中,步骤401的具体操作与图2所示的实施例中的步骤201的操作基本相同,在此不再赘述。
从图4中可以看出,与图2对应的实施例相比,本实施例中的信息处理的流程400通过响应于存在场景类型对应的图片预测模型,将图片数据输入至图片预测模型,生成与输入的图片数据对应的标注结果图以及标注结果图中的目标区域的数量,将图片数据、与图片数据对应的标注结果图、与标注结果对应的目标区域的数量发送至图片管理平台,实现了针对不同场景的数据盘点方法,使得在多个场景下都具备有效性,无论是针对灵活好动的生猪盘点、还是针对钢筋、钢管等密集度高的盘点,都能得到很好的预测效果。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“响应于”可以被解释成为“在……时”或“当……时”。
进一步参考图5,本公开提供了一种信息处理***,如图5所示,***包括:模型管理平台501和图片管理平台502,其中,模型管理平台用于执行上述所示的信息处理方法。图片管理平台,用于接收图片采集装置发送的视频流,获取视频流中的图片数据;根据图片采集装置的配置信息,确定图片数据对应的场景类型;将图片数据和场景类型发送至模型管理平台。
在***中,图片管理平台,还用于接收模型管理平台发送的图片数据、与图片数据对应的标注结果图和标注结果对应的目标区域的数量;将接收到的图片数据、标注结果图、目标区域的数量发送至终端,以使终端将图片数据、标注结果图、目标区域的数量展示于用户,使用户可以查看结果图和原始图。
在***中,图片管理平台,还用于对接入的各图片采集装置进行场景类型的配置;对各图片采集装置的场景类型进行管理。***可以对采集装置进行不同场景的配置,以采集针对不同场景的图片。通过管理场景类型,使***的预测更加简单、快捷。
从图5中可以看出,该信息处理***实现一种基于人工智能+物联网的多场景图片预测***,通过自动的货物变动识别,能够帮助大宗商品期货交易的各方准确及时的知道货物存储情况,及时对突发情况作出处理,保证期货交易的顺利进行。
进一步参考图6,作为对上述图2~图4所示方法的实现,本公开提供了一种信息处理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的信息处理装置600包括:接收单元601、预测单元602和存储单元603。其中,接收单元,被配置成接收图片管理平台发送的图片数据和图片数据对应的场景类型;训练单元,被配置成响应于不存在场景类型对应的图片预测模型,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型;存储单元,被配置成存储图片预测模型以及图片预测模型与场景类型之间的对应关系。
在本实施例中,信息处理装置600的接收单元601、预测单元602和存储单元603的具体处理及其所带来的技术效果可分别参考图2对应的实施例中的步骤201到步骤203的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,装置还包括:生成单元,被配置成响应于存在场景类型对应的图片预测模型,将图片数据输入至图片预测模型,生成与输入的图片数据对应的标注结果图以及标注结果图中的目标区域的数量。
在本实施例的一些可选的实现方式中,装置还包括:发送单元,被配置成将图片数据、与图片数据对应的标注结果图、与标注结果对应的目标区域的数量发送至图片管理平台。
在本实施例的一些可选的实现方式中,训练单元进一步被配置成将图片数据作为输入、图片数据中被标注为目标联通区域的blob图作为输出,训练得到场景类型对应的图片预测模型。
在本实施例的一些可选的实现方式中,装置中的图片预测模型的网络结构基于深度残差网络和特征图金字塔网络而构建;深度残差网络为resnet-50,特征图金字塔网络为递归FPN。
在本实施例的一些可选的实现方式中,装置还包括:第二发送单元,被配置成发送模型训练结果对应的提示信息至图片管理平台。
下面参考图7,其示出了适于用来实现本公开的实施例的电子设备700的结构示意图。本公开的实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700可以包括处理装置(例如中央处理器、图形处理器等)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储装置708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有电子设备700操作所需的各种程序和数据。处理装置701、ROM702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
通常,以下装置可以连接至I/O接口705:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置706;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置707;包括例如磁带、硬盘等的存储装置708;以及通信装置709。通信装置709可以允许电子设备700与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备700,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图7中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置709从网络上被下载和安装,或者从存储装置708被安装,或者从ROM 702被安装。在该计算机程序被处理装置701执行时,执行本公开的实施例的方法中限定的上述功能。
需要说明的是,本公开的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收图片管理平台发送的图片数据和图片数据对应的场景类型;响应于不存在场景类型对应的图片预测模型,当判定图片数据符合模型训练的数据要求时,将图片数据作为输入、图片数据中被标注为目标区域的标注结果图作为输出,训练得到场景类型对应的图片预测模型;存储图片预测模型以及图片预测模型与场景类型之间的对应关系。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括接收单元、训练单元和存储单元。这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,接收单元还可以被描述为“接收图片管理平台发送的图片数据和图片数据对应的场景类型的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (16)

1.一种信息处理方法,包括:
接收图片管理平台发送的图片数据和所述图片数据对应的场景类型;
响应于不存在所述场景类型对应的图片预测模型,当判定所述图片数据符合模型训练的数据要求时,将所述图片数据作为输入、所述图片数据中被标注为目标区域的标注结果图作为输出,训练得到所述场景类型对应的图片预测模型;
存储所述图片预测模型以及所述图片预测模型与所述场景类型之间的对应关系;
其中,所述将所述图片数据作为输入、所述图片数据中被标注为目标区域的标注结果图作为输出,训练得到所述场景类型对应的图片预测模型,包括:将所述图片数据作为输入、所述图片数据中被标注为目标联通区域的blob图作为输出,训练得到所述场景类型对应的图片预测模型;
其中,所述图片预测模型采用端到端的网络模型结构,且输入与输出的尺寸一致;所述图片预测模型基于多点监督的标注信息进行训练,且多点监督对应的核的大小根据场景类型确定。
2.根据权利要求1所述的方法,还包括:
响应于存在所述场景类型对应的图片预测模型,将所述图片数据输入至所述图片预测模型,生成与输入的所述图片数据对应的标注结果图以及所述标注结果图中的目标区域的数量。
3.根据权利要求2所述的方法,还包括:
将所述图片数据、与所述图片数据对应的标注结果图、与所述标注结果对应的目标区域的数量发送至所述图片管理平台。
4.根据权利要求1所述的方法,其中,所述图片预测模型的网络结构基于深度残差网络和特征图金字塔网络而构建;所述深度残差网络为resnet-50,所述特征图金字塔网络为递归FPN。
5.根据权利要求1所述的方法,还包括:
发送所述模型训练结果对应的提示信息至所述图片管理平台。
6.一种信息处理***,包括:模型管理平台,其中,所述模型管理平台用于执行如权利要求1-5任意一项的信息处理方法。
7.根据权利要求6所述的***,所述***还包括:图片管理平台;
所述图片管理平台,用于接收图片采集装置发送的视频流,获取所述视频流中的图片数据;根据所述图片采集装置的配置信息,确定所述图片数据对应的场景类型;将所述图片数据和所述场景类型发送至所述模型管理平台。
8.根据权利要求7所述的***,其中,所述图片管理平台,还用于接收所述模型管理平台发送的图片数据、与所述图片数据对应的标注结果图和所述标注结果对应的目标区域的数量;将接收到的所述图片数据、所述标注结果图、所述目标区域的数量发送至终端。
9.根据权利要求7所述的***,其中,所述图片管理平台,还用于对接入的各所述图片采集装置进行场景类型的配置;对各所述图片采集装置的场景类型进行管理。
10.一种信息处理装置,包括:
接收单元,被配置成接收图片管理平台发送的图片数据和所述图片数据对应的场景类型;
训练单元,被配置成响应于不存在所述场景类型对应的图片预测模型,当判定所述图片数据符合模型训练的数据要求时,将所述图片数据作为输入、所述图片数据中被标注为目标区域的标注结果图作为输出,训练得到所述场景类型对应的图片预测模型;
存储单元,被配置成存储所述图片预测模型以及所述图片预测模型与所述场景类型之间的对应关系;
其中,所述训练单元进一步被配置成将所述图片数据作为输入、所述图片数据中被标注为目标联通区域的blob图作为输出,训练得到所述场景类型对应的图片预测模型;
其中,所述图片预测模型采用端到端的网络模型结构,且输入与输出的尺寸一致;所述图片预测模型基于多点监督的标注信息进行训练,且多点监督对应的核的大小根据场景类型确定。
11.根据权利要求10所述的装置,还包括:
生成单元,被配置成响应于存在所述场景类型对应的图片预测模型,将所述图片数据输入至所述图片预测模型,生成与输入的所述图片数据对应的标注结果图以及所述标注结果图中的目标区域的数量。
12.根据权利要求11所述的装置,还包括:
第一发送单元,被配置成将所述图片数据、与所述图片数据对应的标注结果图、与所述标注结果对应的目标区域的数量发送至所述图片管理平台。
13.根据权利要求10所述的装置,其中,所述图片预测模型的网络结构基于深度残差网络和特征图金字塔网络而构建;所述深度残差网络为resnet-50,所述特征图金字塔网络为递归FPN。
14.根据权利要求10所述的装置,还包括:
第二发送单元,被配置成发送所述模型训练结果对应的提示信息至所述图片管理平台。
15.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
16.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN202111020380.1A 2021-09-01 2021-09-01 信息处理方法、***和装置 Active CN113643136B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111020380.1A CN113643136B (zh) 2021-09-01 2021-09-01 信息处理方法、***和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111020380.1A CN113643136B (zh) 2021-09-01 2021-09-01 信息处理方法、***和装置

Publications (2)

Publication Number Publication Date
CN113643136A CN113643136A (zh) 2021-11-12
CN113643136B true CN113643136B (zh) 2024-06-18

Family

ID=78424783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111020380.1A Active CN113643136B (zh) 2021-09-01 2021-09-01 信息处理方法、***和装置

Country Status (1)

Country Link
CN (1) CN113643136B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734162A (zh) * 2018-04-12 2018-11-02 上海扩博智能技术有限公司 商品图像中目标识别方法、***、设备及存储介质
CN110619423A (zh) * 2019-08-06 2019-12-27 平安科技(深圳)有限公司 多任务预测方法、装置、电子设备及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018176195A1 (zh) * 2017-03-27 2018-10-04 中国科学院深圳先进技术研究院 一种室内场景的分类方法及装置
CN108549893B (zh) * 2018-04-04 2020-03-31 华中科技大学 一种任意形状的场景文本端到端识别方法
CN110443969B (zh) * 2018-05-03 2021-06-04 中移(苏州)软件技术有限公司 一种火点检测方法、装置、电子设备及存储介质
CN109002842A (zh) * 2018-06-27 2018-12-14 北京字节跳动网络技术有限公司 图像识别方法和装置
US10304193B1 (en) * 2018-08-17 2019-05-28 12 Sigma Technologies Image segmentation and object detection using fully convolutional neural network
CN109919244B (zh) * 2019-03-18 2021-09-07 北京字节跳动网络技术有限公司 用于生成场景识别模型的方法和装置
CN111723746A (zh) * 2020-06-22 2020-09-29 江苏云从曦和人工智能有限公司 场景识别模型生成方法、***、平台、设备及介质
CN111767371B (zh) * 2020-06-28 2024-03-12 微医云(杭州)控股有限公司 一种智能问答方法、装置、设备及介质
CN112001884A (zh) * 2020-07-14 2020-11-27 浙江大华技术股份有限公司 数量统计模型的训练方法、计数方法、设备及存储介质
CN111968081B (zh) * 2020-07-30 2023-11-21 中国农业大学 鱼群自动计数方法、装置、电子设备及存储介质
CN112183303A (zh) * 2020-09-24 2021-01-05 南方电网数字电网研究院有限公司 变电设备图像分类方法、装置、计算机设备和介质
CN112862849B (zh) * 2021-01-27 2022-12-27 四川农业大学 一种基于图像分割和全卷积神经网络的田间稻穗计数方法
CN113192065A (zh) * 2021-05-28 2021-07-30 广东电网有限责任公司 输电线路图像的处理方法、便携式设备及用户终端

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734162A (zh) * 2018-04-12 2018-11-02 上海扩博智能技术有限公司 商品图像中目标识别方法、***、设备及存储介质
CN110619423A (zh) * 2019-08-06 2019-12-27 平安科技(深圳)有限公司 多任务预测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113643136A (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
CN108710885B (zh) 目标对象的检测方法和装置
CN110321958B (zh) 神经网络模型的训练方法、视频相似度确定方法
CN109740018B (zh) 用于生成视频标签模型的方法和装置
EP3637310A1 (en) Method and apparatus for generating vehicle damage information
CN109947989B (zh) 用于处理视频的方法和装置
CN110059623B (zh) 用于生成信息的方法和装置
CN111737573A (zh) 资源推荐方法、装置、设备及存储介质
CN112668588B (zh) 车位信息生成方法、装置、设备和计算机可读介质
CN110399847B (zh) 关键帧提取方法、装置及电子设备
CN113112497B (zh) 一种基于零样本学习的工业外观缺陷检测方法、电子设备及存储介质
CN111597465A (zh) 展示方法、装置和电子设备
CN114898177B (zh) 缺陷图像生成方法、模型训练方法、设备、介质及产品
CN112712036A (zh) 交通标志识别方法、装置、电子设备及计算机存储介质
CN110555861B (zh) 光流计算方法、装置及电子设备
CN110287817B (zh) 目标识别及目标识别模型的训练方法、装置和电子设备
CN109816023B (zh) 用于生成图片标签模型的方法和装置
CN111310595B (zh) 用于生成信息的方法和装置
CN113643136B (zh) 信息处理方法、***和装置
CN110414625B (zh) 确定相似数据的方法、装置、电子设备及存储介质
CN113255819B (zh) 用于识别信息的方法和装置
US11610328B2 (en) Method and apparatus for identifying item
CN116704593A (zh) 预测模型训练方法、装置、电子设备和计算机可读介质
CN110263743B (zh) 用于识别图像的方法和装置
CN113920397A (zh) 用于训练图像分类模型和用于图像分类的方法、装置
CN111488928B (zh) 用于获取样本的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant