CN113127058B - 数据标注方法、相关装置及计算机程序产品 - Google Patents
数据标注方法、相关装置及计算机程序产品 Download PDFInfo
- Publication number
- CN113127058B CN113127058B CN202110465098.8A CN202110465098A CN113127058B CN 113127058 B CN113127058 B CN 113127058B CN 202110465098 A CN202110465098 A CN 202110465098A CN 113127058 B CN113127058 B CN 113127058B
- Authority
- CN
- China
- Prior art keywords
- labeling
- algorithm
- data
- original
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 273
- 238000004590 computer program Methods 0.000 title abstract description 16
- 230000006870 function Effects 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000004048 modification Effects 0.000 claims abstract description 24
- 238000012986 modification Methods 0.000 claims abstract description 24
- 238000007781 pre-processing Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/72—Code refactoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
- G06F8/38—Creation or generation of source code for implementing user interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/73—Program documentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/10—Interfaces, programming languages or software development kits, e.g. for simulating neural networks
- G06N3/105—Shells for specifying net layout
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
本公开提供了数据标注方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及数据标注、深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取与待标注数据对应的原始标注算法后,从中提取用于标记原始标注算法的代码段中与预设功能对应的代码的可修改部分的锚点,获取所述待标注数据对应的标注需求、确定与该标注需求对应的目标锚点,以及基于标注需求对该目标锚点的实现参数进行调整、生成目标标注算法,最终利用该目标标注算法对该待标注数据进行处理,得到标注结果。该实施方式可以通过呈现原始算法中的锚点向用户呈现该原始算法中可调整的部分,便于用户进行针对性修改,以提升原始算法的泛用性和配置效率。
Description
技术领域
本公开涉及数据处理技术领域,具体涉及数据标注、深度学习等人工智能技术领域,尤其涉及数据标注方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
人工智能产业在现代社会越来越受到重视,但在该产业中,样本数据的数据标注工作仍然属于劳动密集型产业,仍需要依赖人工实现,长期处于粗放的状态中。
现有技术中,往往会采用与数据标注相关的识别算法对数据进行预处理、预标注,以便于用户根据预处理、预标注的结果进行标注,以实现提升人工数据标注的效率。
发明内容
本公开实施例提出了一种数据标注方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
第一方面,本公开实施例提出了一种数据标注方法,包括:获取与待标注数据对应的原始标注算法,并提取该原始标注算法中的锚点,该锚点用于标记该原始标注算法的代码段中与预设功能对应的代码的可修改部分;获取该待标注数据对应的标注需求,并确定与该标注需求对应的目标锚点;基于该标注需求对该目标锚点的实现参数进行调整,生成目标标注算法;利用该目标标注算法对该待标注数据进行处理,得到标注结果。
第二方面,本公开实施例提出了一种数据标注装置,包括:原始标注算法及锚点提取单元,该原始标注算法及锚点提取单元中包括被配置成获取与待标注数据对应的原始标注算法的原始标注算法提取子单元,以及被配置成提取该原始标注算法中的锚点的锚点提取子单元,其中,该锚点用于标记该原始标注算法的代码段中与预设功能对应的代码的可修改部分;目标锚点确定单元,被配置成获取该待标注数据对应的标注需求,并确定与该标注需求对应的目标锚点;标注算法生成单元,被配置成基于该标注需求对该目标锚点的实现参数进行调整,生成目标标注算法;标注结果生成单元,被配置成利用该目标标注算法对该待标注数据进行处理,得到标注结果。
第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的数据标注方法。
第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的数据标注方法。
第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的数据标注方法。
本公开实施例提供的数据标注方法、装置、电子设备、计算机可读存储介质及计算机程序产品,获取与待标注数据对应的原始标注算法后,从中提取用于标记原始标注算法的代码段中与预设功能对应的代码的可修改部分的锚点,获取该待标注数据对应的标注需求、确定与该标注需求对应的目标锚点,以及基于标注需求对该目标锚点的实现参数进行调整、生成目标标注算法,最终利用该目标标注算法对该待标注数据进行处理,得到标注结果。
本公开可以预先对原始算法进行功能、代码的解析,确定原始算法各部分功能以及功能所对应代码的可修改部分,针对各可修改部分添加相应的锚点,后续在获取到待标注数据后,可以根据待标注数据确定对应的原始标记算法,并根据待标注数据的标注需求确定对应的目标锚点,以及根据该标注需求的实现参数对目标锚点对应的内容进行修改,得到可适配该标注需求的目标标注算法,以提升原始标注算法针对不同待标注数据、应用场景下的泛用性和针对不同待标注数据下的算法配置效率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开可以应用于其中的示例性***架构;
图2为本公开实施例提供的一种数据标注方法的流程图;
图3为本公开实施例提供的另一种数据标注方法的流程图;
图4为本公开实施例提供的在一应用场景下的数据标注方法的效果示意图;
图5为本公开实施例提供的一种数据标注装置的结构框图;
图6为本公开实施例提供的一种适用于执行数据标注方法的电子设备的结构示意图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
此外,本公开涉及的技术方案中,所涉及的用户个人信息的获取(例如待标注数据为包含用户面部信息的人脸图像时)、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
图1示出了可以应用本公开的数据标注方法、装置、电子设备及计算机可读存储介质的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用,例如数据标注类应用、模型训练类应用、即时通讯类应用等。
终端设备101、102、103和服务器105可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等;当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器;服务器为软件时,可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。
服务器105通过内置的各种应用可以提供各种服务,以可以提供针对用户上传的待标注数据进行标注的数据标注类应用为例,服务器105在运行该数据标注类应用时可实现如下效果:首先,通过网络104从终端设备101、102、103中接收待标注数据后,获取与该待标注数据对应的原始标注算法,并提取该原始标注算法中的锚点,其中,该锚点用于标记该原始标注算法的代码段中与预设功能对应的代码的壳修改部分;然后,服务器105,获取该待标注数据对应的标注需求,并确定与该标注需求对应的目标锚点;进一步的,服务器105基于该标注需求对该目标锚点的实现参数进行调整,生成目标标注算法;服务器105最终利用该目标标注算法对该待标注数据进行处理,得到标注结果。
需要指出的是,待标注数据除可以从终端设备101、102、103通过网络104获取到之外,也可以通过各种方式预先存储在服务器105本地。因此,当服务器105检测到本地已经存储有这些数据时(例如开始处理之前留存的数据标注待处理任务),可选择直接从本地获取这些数据,在此种情况下,示例性***架构100也可以不包括终端设备101、102、103和网络104。
由于数据标注过程需要占用较多的运算资源和较强的运算能力,因此本公开后续各实施例所提供的数据标注方法一般由拥有较强运算能力、较多运算资源的服务器105来执行,相应地,数据标注装置一般也设置于服务器105中。但同时也需要指出的是,在终端设备101、102、103也具有满足要求的运算能力和运算资源时,终端设备101、102、103也可以通过其上安装的数据标注类应用完成上述本交由服务器105做的各项运算,进而输出与服务器105同样的结果。尤其是在同时存在多种具有不同运算能力的终端设备的情况下,但数据标注类应用判断所在的终端设备拥有较强的运算能力和剩余较多的运算资源时,可以让终端设备来执行上述运算,从而适当减轻服务器105的运算压力,相应的,数据标注装置也可以设置于终端设备101、102、103中。在此种情况下,示例性***架构100也可以不包括服务器105和网络104。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
请参考图2,图2为本公开实施例提供的一种数据标注方法的流程图,其中流程200包括以下步骤:
步骤201,获取与待标注数据对应的原始标注算法,并提取原始标注算法中的锚点。
在本实施例中,由数据标注方法的执行主体(例如图1所示的服务器105)在确定待标注数据后,获取与该待标注数据对应的原始标注算法,并确定该原始标注算法中的锚点,其中,该锚点用于标记该原始标注算法的代码段中与预设功能对应的代码的可修改部分。
通常,原始标注算法与待标注数据的类型和标注目的有关,例如在待标注数据为图片数据时,标注目的可以为对图像数据中特定的内容进行标注、分割(如人脸、车辆等),此时原始标注算法可以为语义分割神经网络,在待标注数据为音频信息时,标注目的可以为生成音频信息的特征向量,以便于后续对音频信息进行分类处理,此时原始标注算法可以为卷积神经网络,以实现根据卷积神经网络生成音频信息的标签向量,完成对音频信息的标注。
需要指出的是,待标注数据可以由上述执行主体直接从本地的存储设备获取,也可以从非本地的存储设备(例如图1所示的终端设备101、102、103)中获取。本地的存储设备可以是设置在上述执行主体内的一个数据存储模块,例如服务器硬盘,在此种情况下,待标注数据可以在本地快速读取到;非本地的存储设备还可以为其它任何被设置用于存储数据的电子设备,例如一些用户终端等,在此情况下,上述执行主体可以通过向该电子设备发送获取命令来获取所需的待标注数据。
此处,为了更好的实现数据标注,与待标注数据的原始标注算法通常保存在上述执行主体的本地,以便于上述执行主体可以根据标注数据的内容进行快速调取、适配原始标注算法。
进一步的,为了便于对原始标注算法的解析以及对得到的锚点进行更新、配置,原始标注算法中的锚点通常由上述执行在获取到原始标注算法后,在执行主体本地进行相应的解析,以确定原始标注算法中存在的锚点,在实践中,对于原始标注算法中存在锚点的解析、标记工作也可以由非上述执行主体来执行,在完成对原始标记算法中锚点的标记后,将相关的标记信息对应原始标注算法反馈给上述执行主体,以扩展锚点来源。
步骤202,获取待标注数据对应的标注需求,并确定与标注需求对应的目标锚点。
在本实施例中,在基于上述步骤201中确定与待标注数据对应的原始标注算法以及该原始算法中的锚点后,根据该待标注数据对应的标注需求,确定原始标注算法中与该标注需求对应实现功能的目标锚点。
其中,标注需求可以为确定图像中的特定对象、确定图像的特征信息、确定人脸图像中五官位置信息、从音频片段中提取特定信息等标注目的。
在实践中,通常由上述执行主体将步骤201中确定的原始标注算法中的锚点后,根据该锚点对应的功能进行标记后反馈给待标注数据的提供方,以便于该提供方根据自身的标记需求选择对应的功能标记、目标锚点。
步骤203,基于标注需求对目标锚点的实现参数进行调整,生成目标标注算法。
在本实施例中,在确定有目标锚点后,根据标注需求所对应的内容对该目标锚点对应的代码部分的实现参数进行相应调整,例如待标注数据为图像时,需调整的参数可能为识别范围尺寸、识别内容精度、数据并发量等内容,以便于目标锚点对应的代码可以适配待标注数据的标注需求,进而得到可用于满足该标注需求的目标标注算法。
步骤204,利用目标标注算法对待标注数据进行处理,得到标注结果。
在本实施例中,在基于上述步骤203中获取到经过调整后的目标标注算法后,利用该目标标注算法对待标注数据进行处理,以完成满足标注需求的数据标注工作,并得到最终的标注结果。
本公开实施例提供的数据标注方法,可以预先对原始算法进行功能、代码的解析,确定原始算法各部分功能以及功能所对应代码的可修改部分,针对各可修改部分添加相应的锚点,后续在获取到待标注数据后,可以根据待标注数据确定对应的原始标记算法,并根据待标注数据的标注需求确定对应的目标锚点,以及根据该标注需求的实现参数对目标锚点对应的内容进行修改,得到可适配该标注需求的目标标注算法,以提升原始标注算法针对不同待标注数据、应用场景下的泛用性和针对不同待标注数据下的算法配置效率。
在本实施例的一些可选的实现方式中,该基于该标注需求对该目标锚点的实现参数进行调整,包括:获取该目标锚点对应的可修改代码,并生成该可修改代码的提示信息,该提示信息用于提示该可修改代码中各部分功能;呈现该可修改代码和该提示信息;接收与该可修改代码对应的参数修改信息,并根据该参数修改信息对该可修改代码进行调整。
具体的,在获取与标注需求对应的目标锚点后,提取处该目标锚点对应的可修改代码,并生成该修改代码的提示信息,提示信息用于提示该可修改代码中各部分功能,例如该提示信息可用以指示该可修改代码可实现的对应功能以及代码中各字符、参数对应的含义,以及对代码修改后可以产生的效果,并呈现与该目标锚点对应的可修改代码和提示信息,以便于用户根据该可修改代码和对应的提示信息配置、生成与可修改代码对应的参数修改信息,上述执行主体在接收到与可修改代码对应的参数修改信息后,根据参数修改信息对可修改代码进行调整,通过提示信息的方式帮助期望实现数据标注功能的用户进行功能和参数配置上的调整,以提升得到目标标注算法的效率和质量。
请参考图3,图3为本公开实施例提供的另一种数据标注方法的流程图,其中流程300包括以下步骤:
步骤301,解析待标注数据所属的类型信息。
在本实施例中,在获取到待标注数据后,对该待标注数据该的类型进行解析,以实现与该待标注数据对应的类型信息,该类型信息包括以下至少一种:图像类型数据、音频类型数据和文本类型数据。
步骤302,根据类型信息从预设的算法数据库中提取原始标注算法,并提取原始标注算法中的锚点。
在本实施例中,获取上述步骤301中确定的待标注数据的类型信息,根据该类型信息从预先的算法数据库中提取出于该类型信息对应的算法,算法数据库中可以预先根据数据的类型、标注需求的不同设置有对应的标注算法,以便于后续在获取到待标注数据的类型、标注需求等内容时,快速的进行算法匹配。
进一步的,算法数据库中的标注算法可以基于上述执行主体的运营方进行自设,也可以根据历史数据中不同的标注数据、标注需求所对应的目标标注算法进行匹配存储,以便于在后续接收到相同、相似度超过阈值条件的标注数据、标注需求时,确定近似的目标标注算法,提高效率,也通过其他用户上传的方式对算法数据库中标注的标志算法进行补充、更新,以丰富算法数据库有中存储有的标注算法数量和质量,提升算法数据库的使用价值。
在此基础上,在构建算法数据库时,还可以对应的根据标注算法所使用的场景、待标注数据类型、处理能力、并发量、可实现的标注功能等内容为算法数据库中的标注算法添加对应的标注信息,以便于在通过用户指示或根据用户上传的待标注数据参数、标注需求的内容进行自主选择、相关匹配对应的原始标注算法,提升用户体验。
步骤303,获取该待标注数据对应的标注需求,并确定与该标注需求对应的目标锚点。
步骤304,基于该标注需求对该目标锚点的实现参数进行调整,生成目标标注算法。
步骤305,利用该目标标注算法对该待标注数据进行处理,得到标注结果。
以上步骤303-305与如图2所示的步骤202-204一致,相同部分内容请参见上一实施例的相应部分,此处不再进行赘述。
本实施例在上述图2对应实施例的基础上,进一步的利用构建算法数据库的方式存储多个标注算法后,根据待标注数据的类型信息确定对应的初始标注算法,以提升数据标注方法应对多种类待标注数据、多方面标注需求时的标注处理能力。
在本实施例的一些可选的实现方式中,该根据该类型信息从预设的算法数据库中提取该原始标注算法,包括:呈现与该类型信息对应的推荐算法;响应于接收到针对该推荐算法的选择信息,将该选择信息确定的推荐算法确定为该原始标注算法。
具体的,在获取到待标注数据的类型信息后,在从预设的算法数据库中提取与该类型信息对应的原始标注算法时,可以从该算法数据库中同时提取出一个或者多个与该待标注数据的类型信息对应的推荐算法,以便于用户根据自身实际的需求选择合适的原始标注算法,在接收到针对推荐算法的选择信息后,确定该选择信息对应的推荐算法为原始标注算法,以便于为用户提供更能贴合实际需求的原始标注算法,提升获取到的原始标注算法的质量。
在上述任一实施例的基础上,在该生成目标标注算法之后,还包括:响应于获取到针对该待标注数据的预处理指示,对该待标注数据按照该预处理指示进行相应的预处理操作,该预处理操作包括:去重、纠偏、色度调整中的至少一项。
具体的,在获取到目标标注算法之后,若接收到针对待标注数据的预处理指示,则根据该预处理指示,对待标注数据针对目标标注算法进行适配性的处理,预处理操作包括:去重、纠偏、色度调整中的至少一项,以通过预处理的方式对待标注数据针对目标标注算法进行适应的处理,以便于目标标注算法可以更好的对待标注数据进行标注,得到优质的标注结果。
在实践中,对于待标注数据的预处理方式还可以根据待标注数据的类型进行相应设置,例如待标注数据为图片数据时,对应的预处理方式可以包括:元素闭合、切帧中至少一项。
进一步的,为了提升数据标注的效率,尤其在如上述图3所对应的实施例中基于算法数据库中获取原始标注算法,以及在用户针对相同类型的待标注数据有相同的标注需求时,该数据标注方法在得到标注结果之后,还包括:根据该标注需求生成该目标标注算法的功能标签;基于该功能标签生成记录有与不同标注需求对应的各目标标注算法和各目标标注算法中相对于该原始算法修改信息的关系表单。
具体的,在获取待标注数据对应标注需求的标注结果后,根据本次使用的标注数据、以及该标注数据对应的标注需求生成获取到的目标标注算法的功能标签,后续根据该目标功能标签生成记录有标注需求对应的目标标注算法,以及该目标标注算法相对于原始算法的修改信息的关系表单,以便于根据该表单获取到与标注需求对应的目标标注算法和该目标标注算法针对原始标注算法的修改部分进行重复配置,提升后续针对相同的标注需求进行调取,以及构建算法数据库的效率。
进一步的为了方便用户的使用,该关系表单中还可以包括待标注数据的内容、待标注数据的类型,以提供更多的参考信息,便于帮助后续基于该关系表单中的内容进行目标标注算法获取、配置。
为加深理解,本公开还结合一个具体应用场景,给出了一种具体的实现方案,在该场景下,以提供数据标注方法的执行主体,在接收到用户上传的图像形式的待标注数据后,进行相应的处理,以得到标注结果的过程,具体如下:
接收到用户上传的待标注数据后,对该标注数据的类型进行解析,例如本应用场景下,确定该待标注数据该的类型信息为“图片”。
获取与该标注数据对应的语义分割神经网络作为原始标注算法,并提取该原始标注算法中的锚点。
获取该待标注数据对应的“从图像中标注出人脸图像”的标注需求,并确定与该标注需求对应的目标锚点。
获取该目标锚点对应的可修改代码并进行呈现,呈现该可修改代码,该呈现出的效果可以参考图4所示,其中算法配置信息框中呈现有与目标锚点对应的可修改代码内容。
用户直接通过图4所示的界面对算法配置部分的内容进行相应修改,以完成对可修改代码的配置,本申请的执行主体在接收到对应的修改内容(参数修改信息)后,对可修改代码进行相应的调整,进一步的还可以相同的方式对目标标注算法的并发量、识别时间进行相应的调整,以生成最终目标标注算法。
在得到目标标注算法后,利用该目标标注算法对待标注数据进行处理,得到最终的标注结果。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了一种数据标注装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的数据标注装置500可以包括:原始标注算法及锚点提取单元501、目标锚点确定单元502、标注算法生成单元503和标注结果生成单元504。其中,原始标注算法及锚点提取单元501,该原始标注算法及锚点提取单元中包括被配置成获取与待标注数据对应的原始标注算法的原始标注算法提取子单元,以及被配置成提取该原始标注算法中的锚点的锚点提取子单元,其中,该锚点用于标记该原始标注算法的代码段中与预设功能对应的代码的可修改部分;目标锚点确定单元502,被配置成获取该待标注数据对应的标注需求,并确定与该标注需求对应的目标锚点;标注算法生成单元503,被配置成基于该标注需求对该目标锚点的实现参数进行调整,生成目标标注算法;标注结果生成单元504,被配置成利用该目标标注算法对该待标注数据进行处理,得到标注结果。
在本实施例中,数据标注装置500中:原始标注算法及锚点提取单元501、目标锚点确定单元502、标注算法生成单元503和标注结果生成单元504的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-204的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,该原始标注算法提取子单元包括:类型解析模块,被配置成解析该待标注数据所属的类型信息,该类型信息包括以下至少一种:图像类型数据、音频类型数据和文本类型数据;原始标注算法提取模块,被配置成根据该类型信息从预设的算法数据库中提取该原始标注算法。
在本实施例的一些可选的实现方式中,该原始标注算法提取模块包括:推荐算法呈现子模块,被配置成呈现与该类型信息对应的推荐算法;原始标注算法确定子模块,被配置成响应于接收到针对该推荐算法的选择信息,将该选择信息确定的推荐算法确定为该原始标注算法。
在本实施例的一些可选的实现方式中,该标注算法生成单元503包括:提示信息生成子单元,被配置成获取该目标锚点对应的可修改代码,并生成该可修改代码的提示信息,该提示信息用于提示该可修改代码中各部分功能;可修改内容呈现子单元,被配置成呈现该可修改代码和该提示信息;代码调整子单元,被配置成接收与该可修改代码对应的参数修改信息,并根据该参数修改信息对该可修改代码进行调整;以及该标注算法生成单元进一步被配置成,根据对该原始标注算法中可修改代码进行调整后的结果生成该目标标注算法。
在本实施例的一些可选的实现方式中,该数据标注装置还包括:数据预处理单元,被配置成响应于获取到针对该待标注数据的预处理指示,对该待标注数据按照该预处理指示进行相应的预处理操作,该预处理操作包括:去重、纠偏、色度调整中的至少一项。
在本实施例的一些可选的实现方式中,该数据标注装置还包括:功能标签生成单元,被配置成根据该标注需求生成该目标标注算法的功能标签;关系表单生成单元,被配置成基于该功能标签生成记录有与不同标注需求对应的各目标标注算法和各目标标注算法中相对于该原始算法修改信息的关系表单。
本实施例作为对应于上述方法实施例的装置实施例存在,本实施例提供的数据标注装置,可以预先对原始算法进行功能、代码的解析,确定原始算法各部分功能以及功能所对应代码的可修改部分,针对各可修改部分添加相应的锚点,后续在获取到待标注数据后,可以根据待标注数据确定对应的原始标记算法,并根据待标注数据的标注需求确定对应的目标锚点,以及根据该标注需求的实现参数对目标锚点对应的内容进行修改,得到可适配该标注需求的目标标注算法,以提升原始标注算法针对不同待标注数据、应用场景下的泛用性和针对不同待标注数据下的算法配置效率。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如数据标注方法。例如,在一些实施例中,数据标注方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的数据标注方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据标注方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPS,Virtual Private Server)服务中存在的管理难度大,业务扩展性弱的缺陷。服务器也可以分为分布式***的服务器,或者是结合了区块链的服务器。
根据本公开实施例的技术方案,可以预先对原始算法进行功能、代码的解析,确定原始算法各部分功能以及功能所对应代码的可修改部分,针对各可修改部分添加相应的锚点,后续在获取到待标注数据后,可以根据待标注数据确定对应的原始标记算法,并根据待标注数据的标注需求确定对应的目标锚点,以及根据该标注需求的实现参数对目标锚点对应的内容进行修改,得到可适配该标注需求的目标标注算法,以提升原始标注算法针对不同待标注数据、应用场景下的泛用性和针对不同待标注数据下的算法配置效率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开提供的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (12)
1.一种数据标注方法,包括:
获取与待标注数据对应的原始标注算法,并提取所述原始标注算法中的锚点,所述锚点用于标记所述原始标注算法的代码段中与预设功能对应的代码的可修改部分,所述待标注数据所属的类型信息包括以下至少一种:图像类型数据、音频类型数据和文本类型数据;
获取所述待标注数据对应的标注需求,并确定与所述标注需求对应的目标锚点;
基于所述标注需求对所述目标锚点的实现参数进行调整,生成目标标注算法;
利用所述目标标注算法对所述待标注数据进行处理,得到标注结果;
其中,所述基于所述标注需求对所述目标锚点的实现参数进行调整,包括:
获取所述目标锚点对应的可修改代码,并生成所述可修改代码的提示信息,所述提示信息用于提示所述可修改代码中各部分功能;
呈现所述可修改代码和所述提示信息;
接收与所述可修改代码对应的参数修改信息,并根据所述参数修改信息对所述可修改代码进行调整。
2.根据权利要求1所述的方法,其中,所述获取与待标注数据对应的原始标注算法,包括:
解析所述待标注数据所属的类型信息;
根据所述类型信息从预设的算法数据库中提取所述原始标注算法。
3.根据权利要求2所述的方法,其中,所述根据所述类型信息从预设的算法数据库中提取所述原始标注算法,包括:
呈现与所述类型信息对应的推荐算法;
响应于接收到针对所述推荐算法的选择信息,将所述选择信息确定的推荐算法确定为所述原始标注算法。
4.根据权利要求1所述的方法,在所述生成目标标注算法之后,还包括:
响应于获取到针对所述待标注数据的预处理指示,对所述待标注数据按照所述预处理指示进行相应的预处理操作,所述预处理操作包括:去重、纠偏、色度调整中的至少一项。
5.根据权利要求1-4中任一项所述的方法,还包括:
根据所述标注需求生成所述目标标注算法的功能标签;
基于所述功能标签生成记录有与不同标注需求对应的各目标标注算法和各目标标注算法中相对于所述原始标注算法修改信息的关系表单。
6.一种数据标注装置,包括:
原始标注算法及锚点提取单元,所述原始标注算法及锚点提取单元中包括被配置成获取与待标注数据对应的原始标注算法的原始标注算法提取子单元,以及被配置成提取所述原始标注算法中的锚点的锚点提取子单元,其中,所述锚点用于标记所述原始标注算法的代码段中与预设功能对应的代码的可修改部分,所述待标注数据所属的类型信息包括以下至少一种:图像类型数据、音频类型数据和文本类型数据;
目标锚点确定单元,被配置成获取所述待标注数据对应的标注需求,并确定与所述标注需求对应的目标锚点;
标注算法生成单元,被配置成基于所述标注需求对所述目标锚点的实现参数进行调整,生成目标标注算法;
标注结果生成单元,被配置成利用所述目标标注算法对所述待标注数据进行处理,得到标注结果;
其中,所述标注算法生成单元包括:
提示信息生成子单元,被配置成获取所述目标锚点对应的可修改代码,并生成所述可修改代码的提示信息,所述提示信息用于提示所述可修改代码中各部分功能;
可修改内容呈现子单元,被配置成呈现所述可修改代码和所述提示信息;
代码调整子单元,被配置成接收与所述可修改代码对应的参数修改信息,并根据所述参数修改信息对所述可修改代码进行调整;以及
所述标注算法生成单元进一步被配置成,根据对所述原始标注算法中可修改代码进行调整后的结果生成所述目标标注算法。
7.根据权利要求6所述的装置,其中,所述原始标注算法提取子单元包括:
类型解析模块,被配置成解析所述待标注数据所属的类型信息;
原始标注算法提取模块,被配置成根据所述类型信息从预设的算法数据库中提取所述原始标注算法。
8.根据权利要求7所述的装置,其中,所述原始标注算法提取模块包括:
推荐算法呈现子模块,被配置成呈现与所述类型信息对应的推荐算法;
原始标注算法确定子模块,被配置成响应于接收到针对所述推荐算法的选择信息,将所述选择信息确定的推荐算法确定为所述原始标注算法。
9.根据权利要求6所述的装置,还包括:
数据预处理单元,被配置成响应于获取到针对所述待标注数据的预处理指示,对所述待标注数据按照所述预处理指示进行相应的预处理操作,所述预处理操作包括:去重、纠偏、色度调整中的至少一项。
10.根据权利要求6-9中任一项所述的装置,还包括:
功能标签生成单元,被配置成根据所述标注需求生成所述目标标注算法的功能标签;
关系表单生成单元,被配置成基于所述功能标签生成记录有与不同标注需求对应的各目标标注算法和各目标标注算法中相对于所述原始标注算法修改信息的关系表单。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的数据标注方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的数据标注方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110465098.8A CN113127058B (zh) | 2021-04-28 | 2021-04-28 | 数据标注方法、相关装置及计算机程序产品 |
US17/646,847 US20220129423A1 (en) | 2021-04-28 | 2022-01-03 | Method for annotating data, related apparatus and computer program product |
EP22150572.0A EP4047474A1 (en) | 2021-04-28 | 2022-01-07 | Method for annotating data, related apparatus and computer program product |
JP2022004875A JP2022068146A (ja) | 2021-04-28 | 2022-01-17 | データ注釈方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
KR1020220007046A KR20220024227A (ko) | 2021-04-28 | 2022-01-18 | 데이터 주석화 방법, 관련 장치 및 컴퓨터 프로그램 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110465098.8A CN113127058B (zh) | 2021-04-28 | 2021-04-28 | 数据标注方法、相关装置及计算机程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113127058A CN113127058A (zh) | 2021-07-16 |
CN113127058B true CN113127058B (zh) | 2024-01-16 |
Family
ID=76781178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110465098.8A Active CN113127058B (zh) | 2021-04-28 | 2021-04-28 | 数据标注方法、相关装置及计算机程序产品 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220129423A1 (zh) |
EP (1) | EP4047474A1 (zh) |
JP (1) | JP2022068146A (zh) |
KR (1) | KR20220024227A (zh) |
CN (1) | CN113127058B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116955342B (zh) * | 2023-09-20 | 2023-12-15 | 彩讯科技股份有限公司 | 业务数据一致率校验方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015165412A1 (en) * | 2014-04-29 | 2015-11-05 | Tencent Technology (Shenzhen) Company Limited | Method for modifying webpage and apparatus for modifying webpage |
EP3432144A1 (en) * | 2017-07-20 | 2019-01-23 | Fujitsu Limited | A computer-implemented method and system for automatically recommending a code modification |
CN109542373A (zh) * | 2017-09-21 | 2019-03-29 | 霍尼韦尔国际公司 | 将低分辨率数据的特征应用到对应的高分辨率数据 |
CN110276443A (zh) * | 2019-05-29 | 2019-09-24 | 平安科技(深圳)有限公司 | 模型转换一致性验证及分析方法、装置及存储介质 |
CN112307477A (zh) * | 2020-11-10 | 2021-02-02 | 深圳市欢太科技有限公司 | 代码检测方法、装置、存储介质以及终端 |
CN112579727A (zh) * | 2020-12-16 | 2021-03-30 | 北京百度网讯科技有限公司 | 文档内容的提取方法、装置、电子设备及存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7788253B2 (en) * | 2006-12-28 | 2010-08-31 | International Business Machines Corporation | Global anchor text processing |
US8612931B2 (en) * | 2010-07-14 | 2013-12-17 | International Business Machines Corporation | Interactive blueprinting for packaged applications |
US9451001B2 (en) * | 2013-01-31 | 2016-09-20 | Art Research And Technology, L.L.C. | Social networking with video annotation |
US10133568B2 (en) * | 2016-08-31 | 2018-11-20 | International Business Machines Corporation | Embedding code anchors in software documentation |
US10534595B1 (en) * | 2017-06-30 | 2020-01-14 | Palantir Technologies Inc. | Techniques for configuring and validating a data pipeline deployment |
US10572760B1 (en) * | 2017-11-13 | 2020-02-25 | Amazon Technologies, Inc. | Image text localization |
CN108875577A (zh) * | 2018-05-11 | 2018-11-23 | 深圳市易成自动驾驶技术有限公司 | 目标检测方法、装置及计算机可读存储介质 |
JP7002404B2 (ja) * | 2018-05-15 | 2022-01-20 | 株式会社日立製作所 | データから潜在因子を発見するニューラルネットワーク |
JP7119630B2 (ja) * | 2018-06-20 | 2022-08-17 | 日本電信電話株式会社 | 情報処理装置、情報交換システム、情報処理方法および情報処理プログラム |
US20220058801A1 (en) * | 2018-12-17 | 2022-02-24 | Georgia State University Research Foundation, Inc. | Predicting DCIS Recurrence Risk Using a Machine Learning-Based High-Content Image Analysis Approach |
US11573993B2 (en) * | 2019-03-15 | 2023-02-07 | Ricoh Company, Ltd. | Generating a meeting review document that includes links to the one or more documents reviewed |
CN111985601A (zh) * | 2019-05-21 | 2020-11-24 | 富士通株式会社 | 用于增量学习的数据识别方法 |
US11687830B2 (en) * | 2019-05-31 | 2023-06-27 | Apple Inc. | Integration of learning models into a software development system |
US11082755B2 (en) * | 2019-09-18 | 2021-08-03 | Adam Kunsberg | Beat based editing |
CN111598006B (zh) * | 2020-05-18 | 2023-05-26 | 阿波罗智联(北京)科技有限公司 | 用于标注对象的方法和装置 |
-
2021
- 2021-04-28 CN CN202110465098.8A patent/CN113127058B/zh active Active
-
2022
- 2022-01-03 US US17/646,847 patent/US20220129423A1/en not_active Abandoned
- 2022-01-07 EP EP22150572.0A patent/EP4047474A1/en active Pending
- 2022-01-17 JP JP2022004875A patent/JP2022068146A/ja active Pending
- 2022-01-18 KR KR1020220007046A patent/KR20220024227A/ko not_active Application Discontinuation
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015165412A1 (en) * | 2014-04-29 | 2015-11-05 | Tencent Technology (Shenzhen) Company Limited | Method for modifying webpage and apparatus for modifying webpage |
EP3432144A1 (en) * | 2017-07-20 | 2019-01-23 | Fujitsu Limited | A computer-implemented method and system for automatically recommending a code modification |
CN109542373A (zh) * | 2017-09-21 | 2019-03-29 | 霍尼韦尔国际公司 | 将低分辨率数据的特征应用到对应的高分辨率数据 |
CN110276443A (zh) * | 2019-05-29 | 2019-09-24 | 平安科技(深圳)有限公司 | 模型转换一致性验证及分析方法、装置及存储介质 |
CN112307477A (zh) * | 2020-11-10 | 2021-02-02 | 深圳市欢太科技有限公司 | 代码检测方法、装置、存储介质以及终端 |
CN112579727A (zh) * | 2020-12-16 | 2021-03-30 | 北京百度网讯科技有限公司 | 文档内容的提取方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20220129423A1 (en) | 2022-04-28 |
EP4047474A1 (en) | 2022-08-24 |
JP2022068146A (ja) | 2022-05-09 |
CN113127058A (zh) | 2021-07-16 |
KR20220024227A (ko) | 2022-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3872652B1 (en) | Method and apparatus for processing video, electronic device, medium and product | |
CN113657395B (zh) | 文本识别方法、视觉特征提取模型的训练方法及装置 | |
CN113378855A (zh) | 用于处理多任务的方法、相关装置及计算机程序产品 | |
US20220319141A1 (en) | Method for processing image, device and storage medium | |
CN112528641A (zh) | 建立信息抽取模型的方法、装置、电子设备和可读存储介质 | |
CN114495102A (zh) | 文本识别方法、文本识别网络的训练方法及装置 | |
CN113127058B (zh) | 数据标注方法、相关装置及计算机程序产品 | |
CN114186681A (zh) | 用于生成模型簇的方法、装置及计算机程序产品 | |
CN113836462A (zh) | 页面描述文件的生成方法、装置、设备及存储介质 | |
US11822587B2 (en) | Server and method for classifying entities of a query | |
CN115376137B (zh) | 一种光学字符识别处理、文本识别模型训练方法及装置 | |
CN114329164B (zh) | 用于处理数据的方法、装置、设备、介质和产品 | |
US11610396B2 (en) | Logo picture processing method, apparatus, device and medium | |
CN114880498A (zh) | 事件信息展示方法及装置、设备和介质 | |
CN115080770A (zh) | 多媒体数据处理方法、装置、电子设备及可读存储介质 | |
CN114549695A (zh) | 图像生成方法、装置、电子设备及可读存储介质 | |
CN114445682A (zh) | 训练模型的方法、装置、电子设备、存储介质及产品 | |
CN113656642B (zh) | 封面图像生成方法、装置、设备、存储介质和程序产品 | |
CN115131709B (zh) | 视频类别预测方法、视频类别预测模型的训练方法及装置 | |
CN113378835B (zh) | 标注模型训练、样本标注方法及相关装置 | |
CN114374885B (zh) | 视频关键片段确定方法、装置、电子设备及可读存储介质 | |
CN113641933B (zh) | 异常网页识别方法、异常站点识别方法及装置 | |
CN117079321A (zh) | 一种人脸属性的识别方法、装置、电子设备及存储介质 | |
CN113205101A (zh) | 数据挖掘方法、装置、电子设备及计算机可读存储介质 | |
CN114120042A (zh) | 图像识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |