CN115756256A - 信息标注的方法、***、电子设备以及存储介质 - Google Patents

信息标注的方法、***、电子设备以及存储介质 Download PDF

Info

Publication number
CN115756256A
CN115756256A CN202211386165.8A CN202211386165A CN115756256A CN 115756256 A CN115756256 A CN 115756256A CN 202211386165 A CN202211386165 A CN 202211386165A CN 115756256 A CN115756256 A CN 115756256A
Authority
CN
China
Prior art keywords
picture
annotation
electronic device
annotated
electronic equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211386165.8A
Other languages
English (en)
Inventor
李方
张振鹏
宋震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202211386165.8A priority Critical patent/CN115756256A/zh
Publication of CN115756256A publication Critical patent/CN115756256A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本公开提供了信息标注的方法、***、电子设备以及存储介质,涉及计算机视觉、深度学习、信息标注和图像处理等人工智能技术领域。具体实施方式包括:开始与所述第一电子设备的视频通话;响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以所述截屏图像为背景的待标注画面;向所述第一电子设备发送包括待标注画面的屏幕共享信息流,以使所述第一电子设备显示所述待标注画面;响应于检测到标注操作,将标注操作对应的标注数据加入所述待标注画面。本公开可以对需要援助的现场人员提供实时和准确的标注。

Description

信息标注的方法、***、电子设备以及存储介质
技术领域
本公开涉及计算机技术领域,具体涉及包括计算机视觉、深度学习、信息标注和图像处理等人工智能技术领域,尤其涉及信息标注的方法和装置。
背景技术
无论在工业的维修场景中,还是在日常生活中,都可能出现问题无法独自处理,需要远程向其他人求援的情况。
以维修场景为例,维修现场的人员在施工现场采集现场视频,远程专家在办公室可以根据采集的现场视频,给出对策。
发明内容
提供了一种信息标注的方法、***、电子设备以及存储介质。
根据第一方面,提供了一种信息标注的***,用于包括第一电子设备和目标电子设备的标注***,目标电子设备被配置用于:开始与第一电子设备的视频通话,其中,目标电子设备在视频通话过程中显示第一电子设备的拍摄图像;响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以截屏图像为背景的待标注画面;向第一电子设备发送包括待标注画面的屏幕共享信息流,以使第一电子设备显示待标注画面;响应于检测到标注操作,将标注操作对应的标注数据加入待标注画面,其中,标注数据包括标注轨迹。
根据第二方面,提供了一种信息标注的方法,用于目标电子设备,包括:开始与第一电子设备的视频通话,其中,目标电子设备在视频通话过程中显示第一电子设备的拍摄图像;响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以截屏图像为背景的待标注画面;向第一电子设备发送包括待标注画面的屏幕共享信息流,以使第一电子设备显示待标注画面;响应于检测到标注操作,将标注操作对应的标注数据加入待标注画面,其中,标注数据包括标注轨迹。
根据第三方面,提供了一种信息标注的方法,用于第一电子设备,包括:向所述目标电子设备发送视频通话请求,响应于所述目标电子设备接通视频通话,开始与所述目标电子设备的视频通话,其中,所述目标电子设备响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以所述截屏图像为背景的待标注画面;响应于接收到所述目标电子设备发送的包括待标注画面的屏幕共享信息流,显示所述待标注画面,其中,所述目标电子设备响应于检测到标注操作,将标注操作对应的标注数据加入所述待标注画面。
根据第四方面,提供了一种信息标注的装置,用于目标电子设备,包括:开始单元,被配置成开始与第一电子设备的视频通话,其中,目标电子设备在视频通话过程中显示第一电子设备的拍摄图像;显示单元,被配置成响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以截屏图像为背景的待标注画面;发送单元,被配置成向第一电子设备发送包括待标注画面的屏幕共享信息流,以使第一电子设备显示待标注画面;加入单元,被配置成响应于检测到标注操作,将标注操作对应的标注数据加入待标注画面,其中,标注数据包括标注轨迹。
根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行信息标注的方法中任一实施例的方法。
根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行根据信息标注的方法中任一实施例的方法。
根据第七方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据信息标注的方法中任一实施例的方法。
根据本公开的方案,可以对需要援助的现场人员提供实时和准确的标注。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开一些实施例可以应用于其中的示例性***架构图;
图2是根据本公开的信息标注的方法的一个实施例的流程图;
图3是根据本公开的信息标注的***的一个实施例的示意图;
图4是根据本公开的信息标注的方法的又一个实施例的流程图;
图5是用来实现本公开实施例的信息标注的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的信息标注的方法或信息标注的装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102,网络104和服务器103。网络104用以在终端设备101、102和服务器103之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102通过网络104与服务器103交互,以接收或发送消息等。终端设备101、102上可以安装有各种通讯客户端应用,例如视频类应用、直播应用、即时通信工具、邮箱客户端、社交平台软件等。
这里的终端设备101、102可以是硬件,也可以是软件。当终端设备101、102为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、增强现实眼镜、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。举例来说,终端设备101、102可以包括目标电子设备和第一电子设备。
服务器103可以是提供各种服务的服务器,例如对终端设备101、102提供支持的后台服务器。后台服务器可以对接收到的视频通话请求等数据进行分析等处理,并将处理结果(例如待标注画面)反馈给终端设备。当服务器103中的每个电子设备可以是为终端设备101、102提供视频通话服务或屏幕共享服务的电子设备。
需要说明的是,本公开实施例所提供的信息标注的方法可以由终端设备101、102执行,相应地,信息标注的装置可以设置于终端设备101、102中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开的用于目标电子设备的信息标注方法包括以下步骤。
步骤201,开始与第一电子设备的视频通话,其中,目标电子设备在视频通话过程中显示第一电子设备的拍摄图像。
在本实施例中,信息标注的方法运行于其上的执行主体(例如图1所示的终端设备)可以在接收到第一电子设备的视频通话请求的情况下,如果检测到用户的接通操作,则与第一电子设备进行视频通话。这样,在视频通话的场景中,目标电子设备就可以显示第一电子设备的拍摄图像。
目标电子设备可以响应于接收到第一电子设备的视频通话请求,若检测到接通操作,就开始与第一电子设备之间的视频通话。或者,目标电子设备可以响应于检测到本设备用户的视频通话拨打操作,向第一电子设备发送视频通话请求,并在接收到第一电子设备的通话视频流之后,开始与第一电子设备之间的视频通话。
视频通话可以实现通话双方的音频通话和视频共享。这里的视频共享可以指接通的双方都观看其中一方的拍摄图像所组成的拍摄视频,或者,在一些情况下,也可以观看对方的拍摄视频。
在工业的远程维修场景中,目标电子设备的用户指可以对第一电子设备的用户提供援助的人员比如专家。或者,在生活场景中,目标电子设备的用户可以指对第一电子设备提供援助的朋友或老师等。
在实践中,第一电子设备可以是各种终端设备,比如手机或者增强现实设备例如AR眼镜。
步骤202,响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以截屏图像为背景的待标注画面。
在本实施例中,目标电子设备可以在检测到用户的标注发起操作的情况下,对当前显示的拍摄图像进行截屏。目标电子设备可以在截屏后,生成并显示待标注画面,该待标注画面的背景是上述截屏图像。第一电子设备的用户可以对待标注画面进行画写,以实现标注。这里的截屏也可以指“冻屏操作”。
目标电子设备可以直接打开能够接收画写的页面或者通过比如控件来实现生成以截屏图像为背景的待标注画面。比如,如果通过控件来实现,控件可以是指定画布控件也即canvas控件。此外,在一些情况下,目标电子设备也可以通过程序或软件,实现生成待标注画面。
步骤203,向第一电子设备发送包括待标注画面的屏幕共享信息流,以使第一电子设备显示待标注画面。
在本实施例中,目标电子设备可以向第一电子设备发送屏幕共享信息流,这样,不仅目标电子设备可以显示出待标注画面,第一电子设备也可以通过接收到的屏幕共享信息流,显示该信息流中的待标注画面。具体地,目标电子设备通过发送屏幕共享信息流,就可以实现目标电子设备与第一电子设备之间的屏幕共享,让第一电子设备显示目标电子设备屏幕所显示的至少部分画面。
在实践中,目标电子设备可以在各种实际发送屏幕共享信息流。比如,目标电子设备可以弹出对话框,询问用户是否选择对生成的待标注画面进行标注。如果用户选择是,则可以发送屏幕共享信息流。或者,目标电子设备在得到截屏图像的情况下,即可以发送屏幕共享信息流。
步骤204,响应于检测到标注操作,将标注操作对应的标注数据加入待标注画面。
在本实施例中,目标电子设备可以在检测到用户的标注操作的情况下,将标注操作对应的标注数据,加入到待标注画面中。标注数据可以包括用户的标注操作产生的轨迹也即标注轨迹,比如画写操作产生的画写轨迹。这样,待标注画面中就可以显示出轨迹。继而,在能够显示待标注画面的第一电子设备的屏幕上,就能够显示该轨迹。此外,标注操作还可以包括***图片等,相应地,标注数据还可以包括所***的图片等。
在实践中,轨迹可以包括箭头、圆圈、弧形线条、字符(比如数字、文字、字母)等等。
本公开的上述实施例提供的方法可以通过视频通话和屏幕共享,让提供标注的目标电子设备的用户能够看到第一电子设备的现场实际情况,从而根据实际情况对现场的问题给出准确、实时的判断,有助于进行准确的标注。并且,提供标注的用户通过观看现场情况,可以在恰当的时机进行标注发起操作以得到利于标注的准确截屏画面。
在本公开任一实施例的一些可选的实现方式中,上述方法还可以包括:响应于检测到标注结束操作,断开视频通话,停止向第一电子设备发送包括待标注画面的屏幕共享信息流。
在本实施例中,在检测到标注结束操作的情况下,目标电子设备可以断开视频通话,并且,停止向第一电子设备发送包括待标注画面的屏幕共享信息流。
在实践中,断开视频通话可以指在本设备直接断开视频通话连接,或者,向其它电子设备(比如视频通话服务器或第一电子设备)发送请求,让该其它电子设备断开通话连接。
在本公开任一实施例的一些可选的实现方式中,上述显示以所述截屏图像为背景的待标注画面,可以包括:打开新的页面,在页面中加入画写功能控件,将截屏图像确定为画写功能控件的背景,得到修改后页面;根据修改后页面,确定待标注画面。
在这些实现方式中,目标电子设备可以在专家端屏幕共享的页面中,打开新的页面,并在页面中加入画写功能控件。画写功能控件指存在画布功能的控件,可以用来接收绘画、写字等用户的输入操作,并留下轨迹。上述目标电子设备可以将截屏图像作为控件的背景。
目标电子设备可以采用各种方式,根据修改后页面,确定待标注画面。比如,目标电子设备也可以直接将修改后的页面,确定为待标注画面。或者,目标电子设备可以对修改后的页面,进行进一步处理,比如将页面中,画写功能控件所覆盖的局部,确定为待标注画面。
这些实现方式可以通过在屏幕上打开新页面,并在页面上添加具有画写功能的控件,从而可以不借助第三方画图软件实现画写的记录。并且,以截屏图像为控件背景,用户可以有针对性地对截屏的现场照片进行涂鸦。
在本公开任一实施例的一些可选的实现方式中,上述方法可以包括:在向第一电子设备发送包括待标注画面的屏幕共享信息流之后,停止显示拍摄画面。
在这些可选的实现方式中,目标电子设备在向第一电子设备发送包括待标注画面的屏幕共享信息流之后,可以停止显示拍摄画面。从而专注显示待标注画面。
在实践中,目标电子设备还可以在发送屏幕共享信息流之后,并确认对第一电子设备进行了屏幕共享,比如接收到第一电子设备返回的确认消息,就可以停止显示拍摄画面。
这些实现方式可以在屏幕共享的过程中,隐藏第一电子设备的拍摄画面,从而可以增加目标电子设备的操作面积。
在本公开任一实施例的一些可选的实现方式中,上述方法可以包括:响应于检测到标注结束操作,显示标注的标签输入区域;接收输入的标签,响应于检测到标签输入完成操作,将标注数据和标签,发送给标注确定模型的训练设备,其中,标签包括标注名称。
具体地,在目标电子设备的用户标注结束之后,目标电子设备可以采集提供援助的用户输入的标签,并且可以将包括标签和标注数据,发送给标注确定模型的训练设备。这样,该训练设备就可以利用标注相关信息训练标注确定模型。标注名称指标注框内的对象的名称。输入完成操作可以是各种特定的操作,比如对于屏幕上指定的虚拟按键或者目标电子设备上指定的实体按键的操作。
在实践中,标签输入区域可以是对话框,标注部件名称即是部件这个硬件的名称。
标签输入区域还可以用于接收目标电子设备的备注。备注内容可以包括问题部件对应的操作步骤信息。上述目标电子设备可以存储该备注内容,或者将备注内容发送给其它电子设备比如存储模型库的服务器。
这些可选的情况下,目标电子设备可以将实际援助场景中标注的数据作为训练样本,从而可以提高训练的准确度,有助于提高训练后的标注确定模型的准确度。
具体地,标注确定模型的训练步骤可以包括:获取标注数据对应的拍摄图像和标注框坐标信息;利用拍摄图像、标注框坐标信息和标签,训练初始标注确定模型,得到标注确定模型。
标注确定模型可以是各种电子设备训练得到的,比如上述的训练设备,或者其它可以训练模型的电子设备比如服务器等。初始标注确定模型指有待于训练的标注确定模型。
训练标注确定模型的电子设备可以利用拍摄图像、标注框坐标信息和标签,对初始标注确定模型进行训练,从而实现利用援助现场的实际数据,得到准确的标注确定模型。
如图3所示,本公开还提供了一种信息标注的***,用于包括第一电子设备和目标电子设备的标注***,所述目标电子设备被配置用于:开始与所述第一电子设备的视频通话,其中,所述目标电子设备在视频通话过程中显示所述第一电子设备的拍摄图像;响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以所述截屏图像为背景的待标注画面;向所述第一电子设备发送包括待标注画面的屏幕共享信息流,以使所述第一电子设备显示所述待标注画面;响应于检测到标注操作,将标注操作对应的标注数据加入所述待标注画面。
在本公开任一实施例的一些可选的实现方式中,所述目标电子设备进一步被配置用于按照如下方式执行所述显示以所述截屏图像为背景的待标注画面:打开新的页面,在所述页面中加入画写功能控件,将所述截屏图像确定为所述画写功能控件的背景,得到修改后页面;根据所述修改后页面,确定所述待标注画面。
在本公开任一实施例的一些可选的实现方式中,所述目标电子设备还被配置用于:在所述向所述第一电子设备发送包括待标注画面的屏幕共享信息流之后,停止显示所述拍摄画面。
这些实现方式可以在屏幕共享的过程中,隐藏第一电子设备的拍摄画面,从而可以增加目标电子设备的操作面积。
在本公开任一实施例的一些可选的实现方式中,所述目标电子设备还被配置用于:响应于检测到标注结束操作,显示标注的标签输入区域;接收输入的标签,响应于检测到标签输入完成操作,将所述标注数据和所述标签,发送给所述标注确定模型的训练设备,其中,所述标签包括标注部件名称。
这些可选的情况下,目标电子设备可以将实际援助场景中标注的数据作为训练样本,从而可以提高训练的准确度,有助于提高训练后的标注确定模型的准确度。
在本公开任一实施例的一些可选的实现方式中,所述标注确定模型的训练步骤包括:获取标注数据对应的拍摄图像和标注框坐标信息;利用所述拍摄图像、标注框坐标信息和所述标签,训练初始标注确定模型,得到所述标注确定模型。
训练标注确定模型的电子设备可以利用拍摄图像、标注框坐标信息和标签,对初始标注确定模型进行训练,从而实现利用援助现场的实际数据,得到准确的标注确定模型。
在本公开任一实施例的一些可选的实现方式中,第一电子设备还被配置用于:响应于检测到标注结束操作,断开视频通话,停止向所述第一电子设备发送包括待标注画面的屏幕共享信息流
在本公开任一实施例的一些可选的实现方式中,第一电子设备还被配置用于:响应于接收到目标电子设备发送的待标注画面的屏幕共享信息流,停止显示拍摄画面。
在这些实现方式中,在视频通话之初,第一电子设备也会显示第一电子设备的实时拍摄图像,也即第一电子设备和目标电子设备都可以显示第一电子设备的实时拍摄图像。
在实践中,在开始屏幕共享之后,第一电子设备的用户和目标电子设备的用户,也可以通过语音进行通话。
一旦开始屏幕共享,第一电子设备和目标电子设备中的至少一个,会停止显示拍摄画面。第一电子设备通过停止显示拍摄画面,可以利用更大的屏幕面积,显示目标电子设备的用户所标注的内容。
在本公开任一实施例的一些可选的实现方式中,第一电子设备为待援助现场的现场人员设备,拍摄图像呈现有问题部件;第一电子设备被配置用于:响应于模型库中不存在问题部件对应的模型,则向目标电子设备发送视频通话请求,其中,模型库中存在多个用于确定标注数据的模型,每个模型存在对应的问题部件。
在这些实现方式中,问题部件指表现异常的部件,可以是需要维修的部件本身,比如地铁的刹车操纵杆。或者,问题部件也可以是出故障后表现出异常的部件,比如故障指示灯。
模型库中可以存在多个模型,每个模型都用于确定标注数据。每个模型都存在所对应的问题部件。不同的模型所对应的问题部件可以不同。第一电子设备或者其它电子设备可以判断模型库中是否存在问题部件对应的模型,并在不存在的情况下,发送视频通话请求。
这里的模型可以是能够识别图像中对象的神经网络模型,比如机器学习模型或者卷积神经网络等。
模型库所在的服务器可以首先判断模型库中是否存在问题部件对应的模型,然后将判断结果反馈给第一电子设备。或者,模型库所在的服务器可以将模型标识列表发送给第一电子设备,让第一电子设备自行判断。
在实践中,第一电子设备可以是各种终端,比如手机、电脑、智能增强显示眼镜等。
这些实现方式可以在模型库中模型不能够对现场人员提供标注数据的情况下,发送视频通话请求,从而实现利用视频通话,邀请目标电子设备的用户进行标注援助。
在这些实现方式的一些可选的应用场景中,第一电子设备还被配置用于:响应于模型库中存在问题部件对应的模型,则确定模型库中的、问题部件对应的标注确定模型;将至少一个拍摄图像输入标注确定模型,得到从标注确定模型输出的标注框坐标信息。
在这些可选的应用场景中,第一电子设备可以向模型服务器发送模型请求,该服务器可以将模型库中与问题部件对应的模型,发送给第一电子设备。具体地,模型请求中可以包括问题部件的名称或其它标识,服务器继而可以据此确定与问题部件对应的模型。第一电子设备可以将拍摄图像输入标注确定模型,并得到从该模型输出的标注框坐标信息。
第一电子设备可以下载该标注确定模型。之后,第一电子设备可以将拍摄图像输入该标注确定模型,从而得到标注框坐标信息。具体的下载过程包括第一电子设备收到该服务器反馈的存在模型的消息后,发送请求下载信息,模型服务器接收到该信息后查找到问题部件对应的标注确定模型,并发送给第一电子设备,以使第一电子设备实现下载。
标注框即指示部件位置的包围框,坐标信息可以准确地指示出该框。
第一电子设备可以将一个拍摄图像输入模型得到标注框坐标信息,或者,将至少一个拍摄图像分别输入模型,并基于输出的各个坐标信息确定标注框坐标信息,比如对各个坐标信息求平均值,并将平均值作为标注框坐标信息。
在实践中,从标注确定模型还可以输出上述问题部件也即标注框坐标信息指示的位置的问题部件的标签。
这些应用场景可以在存在问题部件对应的模型的情况下,优先选择利用模型提供援助,从而可以有助于节约提供援助的人力。并且,通过标注确定模型,可以精确地标注出问题部件的位置。
可选地,第一电子设备还被配置用于:确定并显示问题部件对应的操作步骤信息。
在这些可选的应用场景中,第一电子设备可以采用各种方式确定问题部件对应的操作步骤信息。比如,第一电子设备可以获取问题部件与操作步骤信息的对应关系。或者获模型库中模型与操作步骤信息的对应关系,而模型与问题部件存在对应关系,这样,第一电子设备就可以由问题部件确定出操作步骤信息。
操作步骤信息指操作步骤流程,或箭头等指示操作步骤的流程的信息,比如顺时针扭转三下,按下,长按5秒等。这里的箭头可以指示操作方向等。
这些可选的应用场景可以在显示标注框信息的基础上,提供辅助现场人员操作的操作步骤信息,从而有助于让现场人员得到更准确的援助。
在一些情况下,第一电子设备还被配置用于:确定标注框坐标信息指示的标注框;生成并显示包含标注框的待标注画面,显示操作步骤信息。
这样,第一电子设备屏幕上的待标注画面就可以呈现出标注框,此外,还可以呈现出操作步骤信息,从而让呈现给现场人员的信息更加全面和准确。
可选地,第一电子设备还被配置用于:在将至少一个拍摄图像输入标注确定模型之前,从模型库所在的电子设备中,下载标注确定模型。
可选地,第一电子设备还被配置用于:采集问题现场语音;响应于确定语音的语音识别结果指示预设的问题部件,调用确定标注确定模型的方法。
第一电子设备可以采集现场的语音,并在确定该语音的语音识别结果指示预设的问题部件的情况下,调用确定标注确定模型的方法。也即,第一电子设备一旦自动识别出语音指示了问题部件,可以执行利用模型确定标注的步骤。
此外,第一电子设备上可以保存有人工智能标注开关,如果该开关开启,一旦用户触发第一电子设备的人工智能标注(比如手动触发或者语音触发),就可以执行利用模型确定标注的步骤,或者执行该步骤:采集问题现场语音,确定语音的语音识别结果是否指示预设的问题部件。此外,用户可以通过语音,指示结束人工智能标注过程。
这些实现方式可以通过语音,调起模型的标注过程,从而减少现场用户的手动操作。
本申请还提供了一种信息标注的方法,用于第一电子设备,可以包括:向所述目标电子设备发送视频通话请求,响应于所述目标电子设备接通视频通话,开始与所述目标电子设备的视频通话,其中,所述目标电子设备响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以所述截屏图像为背景的待标注画面;响应于接收到所述目标电子设备发送的包括待标注画面的屏幕共享信息流,显示所述待标注画面,其中,所述目标电子设备响应于检测到标注操作,将标注操作对应的标注数据加入所述待标注画面。
在本实施例的一些可选的实现方式中,所述方法还包括:响应于接收到所述目标电子设备发送的待标注画面的屏幕共享信息流,停止显示所述拍摄画面。
在本实施例的一些可选的实现方式中,所述第一电子设备为待援助现场的现场人员设备,所述拍摄图像呈现有问题部件;所述方法还包括:响应于模型库中不存在所述问题部件对应的模型,则向所述目标电子设备发送视频通话请求,其中,模型库中存在多个用于确定标注数据的模型,每个模型存在对应的问题部件。
在本实施例的一些可选的实现方式中,所述方法还包括:响应于所述模型库中存在所述问题部件对应的模型,则确定所述模型库中的、所述问题部件对应的标注确定模型;将至少一个所述拍摄图像输入所述标注确定模型,得到从所述标注确定模型输出的标注框坐标信息。
在本实施例的一些可选的实现方式中,所述方法还包括:确定并显示所述问题部件对应的操作步骤信息。
在本实施例的一些可选的实现方式中,所述方法还包括:确定所述标注框坐标信息指示的标注框;生成并显示包含所述标注框的所述待标注画面,显示所述操作步骤信息。
在本实施例的一些可选的实现方式中,所述方法还包括:采集问题现场语音;响应于确定所述语音的语音识别结果指示预设的问题部件,调用确定标注确定模型的方法。
如图4所示,图中示出了信息标注方法的一个流程示意图。图中示出了现场人员设备可以通过拍摄图像确定问题部件。并判断模型库中是否存在问题部件对应的模型。如果存在,则通过模型解决现场人员的问题。如果不存在,则远程联系专家来解决问题。
具体地,在通过模型的解决方式中,现场人员设备获取问题部件在拍摄图像中的位置,也即标注框坐标信息。之后,现场人员设备可以展示标注框坐标信息对应的操作动作文本。
在通过专家的解决方式中,现场人员设备可以呼叫专家的设备,并与专家设备接通视频通话。之后,专家的设备可以发送屏幕共享信息流给现场人员设备。这样,现场人员就可以看到专家在专家设备上标注的标注数据。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质、一种路侧设备、一种云控平台和一种计算机程序产品。
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如信息标注的方法。例如,在一些实施例中,信息标注的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的信息标注的方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行信息标注的方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (27)

1.一种信息标注的方法,用于目标电子设备,包括:
开始与第一电子设备的视频通话,其中,所述目标电子设备在视频通话过程中显示所述第一电子设备的拍摄图像;
响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以所述截屏图像为背景的待标注画面;
向所述第一电子设备发送包括待标注画面的屏幕共享信息流,以使所述第一电子设备显示所述待标注画面;
响应于检测到标注操作,将标注操作对应的标注数据加入所述待标注画面。
2.根据权利要求1所述的方法,其中,所述显示以所述截屏图像为背景的待标注画面,包括:
打开新的页面,在所述页面中加入画写功能控件,将所述截屏图像确定为所述画写功能控件的背景,得到修改后页面;
根据所述修改后页面,确定所述待标注画面。
3.根据权利要求1或2所述的方法,其中,所述方法还包括:
在所述向所述第一电子设备发送包括待标注画面的屏幕共享信息流之后,停止显示所述拍摄画面。
4.根据权利要求1或2所述的方法,其中,所述方法还包括:
响应于检测到标注结束操作,显示标注的标签输入区域;
接收输入的标签,响应于检测到标签输入完成操作,将所述标注数据和所述标签,发送给所述标注确定模型的训练设备,其中,所述标签包括标注部件名称。
5.根据权利要求4所述的方法,其中,所述标注确定模型的训练步骤包括:
获取标注数据对应的拍摄图像和标注框坐标信息;
利用所述拍摄图像、标注框坐标信息和所述标签,训练初始标注确定模型,得到所述标注确定模型。
6.根据权利要求4所述的方法,其中,所述方法还包括:
响应于检测到标注结束操作,断开视频通话,停止向所述第一电子设备发送包括待标注画面的屏幕共享信息流。
7.一种信息标注的方法,用于第一电子设备,包括:
向所述目标电子设备发送视频通话请求,响应于所述目标电子设备接通视频通话,开始与所述目标电子设备的视频通话,其中,所述目标电子设备响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以所述截屏图像为背景的待标注画面;
响应于接收到所述目标电子设备发送的包括待标注画面的屏幕共享信息流,显示所述待标注画面,其中,所述目标电子设备响应于检测到标注操作,将标注操作对应的标注数据加入所述待标注画面。
8.根据权利要求7所述的方法,其中,所述方法还包括:
响应于接收到所述目标电子设备发送的待标注画面的屏幕共享信息流,停止显示所述拍摄画面。
9.根据权利要求7所述的方法,其中,所述第一电子设备为待援助现场的现场人员设备,所述拍摄图像呈现有问题部件;
所述方法还包括:
响应于模型库中不存在所述问题部件对应的模型,则向所述目标电子设备发送视频通话请求,其中,模型库中存在多个用于确定标注数据的模型,每个模型存在对应的问题部件。
10.根据权利要求9所述的方法,其中,所述方法还包括:
响应于所述模型库中存在所述问题部件对应的模型,则确定所述模型库中的、所述问题部件对应的标注确定模型;
将至少一个所述拍摄图像输入所述标注确定模型,得到从所述标注确定模型输出的标注框坐标信息。
11.根据权利要求9所述的方法,其中,所述方法还包括:
确定并显示所述问题部件对应的操作步骤信息。
12.根据权利要求11所述的方法,其中,所述方法还包括:
确定所述标注框坐标信息指示的标注框;
生成并显示包含所述标注框的所述待标注画面,显示所述操作步骤信息。
13.根据权利要求10所述的方法,其中,所述方法还包括:
采集问题现场语音;
响应于确定所述语音的语音识别结果指示预设的问题部件,调用确定标注确定模型的方法。
14.一种信息标注的***,用于包括第一电子设备和目标电子设备的标注***,所述目标电子设备被配置用于:
开始与所述第一电子设备的视频通话,其中,所述目标电子设备在视频通话过程中显示所述第一电子设备的拍摄图像;
响应于检测到标注发起操作,对当前显示的拍摄图像进行截屏,得到截屏图像,显示以所述截屏图像为背景的待标注画面;
向所述第一电子设备发送包括待标注画面的屏幕共享信息流,以使所述第一电子设备显示所述待标注画面;
响应于检测到标注操作,将标注操作对应的标注数据加入所述待标注画面。
15.根据权利要求14所述的***,其中,所述目标电子设备进一步被配置用于按照如下方式执行所述显示以所述截屏图像为背景的待标注画面:
打开新的页面,在所述页面中加入画写功能控件,将所述截屏图像确定为所述画写功能控件的背景,得到修改后页面;
根据所述修改后页面,确定所述待标注画面。
16.根据权利要求14或15所述的***,其中,所述目标电子设备还被配置用于:
在所述向所述第一电子设备发送包括待标注画面的屏幕共享信息流之后,停止显示所述拍摄画面。
17.根据权利要求14或15所述的***,其中,所述第一电子设备还被配置用于:
响应于接收到所述目标电子设备发送的待标注画面的屏幕共享信息流,停止显示所述拍摄画面。
18.根据权利要求14所述的***,其中,所述第一电子设备为待援助现场的现场人员设备,所述拍摄图像呈现有问题部件;
所述第一电子设备被配置用于:
响应于模型库中不存在所述问题部件对应的模型,则向所述目标电子设备发送视频通话请求,其中,模型库中存在多个用于确定标注数据的模型,每个模型存在对应的问题部件。
19.根据权利要求18所述的***,其中,所述第一电子设备还被配置用于:
响应于所述模型库中存在所述问题部件对应的模型,则确定所述模型库中的、所述问题部件对应的标注确定模型;
将至少一个所述拍摄图像输入所述标注确定模型,得到从所述标注确定模型输出的标注框坐标信息。
20.根据权利要求19所述的***,其中,所述第一电子设备还被配置用于:
确定并显示所述问题部件对应的操作步骤信息。
21.根据权利要求20所述的***,其中,所述第一电子设备还被配置用于:
确定所述标注框坐标信息指示的标注框;
生成并显示包含所述标注框的所述待标注画面,显示所述操作步骤信息。
22.根据权利要求14或19所述的***,其中,所述目标电子设备还被配置用于:
响应于检测到标注结束操作,显示标注的标签输入区域;
接收输入的标签,响应于检测到标签输入完成操作,将所述标注数据和所述标签,发送给所述标注确定模型的训练设备,其中,所述标签包括标注部件名称。
23.根据权利要求22所述的***,其中,所述标注确定模型的训练步骤包括:
获取标注数据对应的拍摄图像和标注框坐标信息;
利用所述拍摄图像、标注框坐标信息和所述标签,训练初始标注确定模型,得到所述标注确定模型。
24.根据权利要求14所述的***,其中,所述目标电子设备还被配置用于:
响应于检测到标注结束操作,断开视频通话,停止向所述第一电子设备发送包括待标注画面的屏幕共享信息流。
25.根据权利要求19所述的***,其中,所述第一电子设备还被配置用于:
采集问题现场语音;
响应于确定所述语音的语音识别结果指示预设的问题部件,调用确定标注确定模型的方法。
26.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-13所述的方法。
27.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-13所述的方法。
CN202211386165.8A 2022-11-07 2022-11-07 信息标注的方法、***、电子设备以及存储介质 Pending CN115756256A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211386165.8A CN115756256A (zh) 2022-11-07 2022-11-07 信息标注的方法、***、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211386165.8A CN115756256A (zh) 2022-11-07 2022-11-07 信息标注的方法、***、电子设备以及存储介质

Publications (1)

Publication Number Publication Date
CN115756256A true CN115756256A (zh) 2023-03-07

Family

ID=85357083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211386165.8A Pending CN115756256A (zh) 2022-11-07 2022-11-07 信息标注的方法、***、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN115756256A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117218320A (zh) * 2023-11-08 2023-12-12 济南大学 基于混合现实的空间标注方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117218320A (zh) * 2023-11-08 2023-12-12 济南大学 基于混合现实的空间标注方法
CN117218320B (zh) * 2023-11-08 2024-02-27 济南大学 基于混合现实的空间标注方法

Similar Documents

Publication Publication Date Title
US10984226B2 (en) Method and apparatus for inputting emoticon
CN108830235B (zh) 用于生成信息的方法和装置
WO2020000879A1 (zh) 图像识别方法和装置
US11023716B2 (en) Method and device for generating stickers
US20210174493A1 (en) Damage identification result optimization method and apparatus
CN109034069B (zh) 用于生成信息的方法和装置
US11461995B2 (en) Method and apparatus for inspecting burrs of electrode slice
KR102002024B1 (ko) 객체 라벨링 처리 방법 및 객체 관리 서버
CN113378835B (zh) 标注模型训练、样本标注方法及相关装置
US11210563B2 (en) Method and apparatus for processing image
US11151364B2 (en) Video image overlay of an event performance
US11935293B2 (en) Augmented reality support platform
CN114449327B (zh) 视频片段的分享方法、装置、电子设备及可读存储介质
CN113361468A (zh) 一种业务质检方法、装置、设备及存储介质
CN115756256A (zh) 信息标注的方法、***、电子设备以及存储介质
CN116150339A (zh) 对话方法、装置、设备及存储介质
CN110008926B (zh) 用于识别年龄的方法和装置
CN114171063A (zh) 一种实时话务客户情绪分析辅助方法及***
CN113627301A (zh) 实时视频信息提取方法、装置和***
CN113591580A (zh) 图像标注方法、装置、电子设备和存储介质
CN113221846A (zh) 图像识别方法、装置、设备、存储介质以及程序产品
CN113127058A (zh) 数据标注方法、相关装置及计算机程序产品
CN114117207A (zh) 预防诈骗的***、方法、电子设备及存储介质
CN108875638B (zh) 人脸匹配测试方法和、装置和***
CN113780706A (zh) 一种基于视觉增强的现场运维作业方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination