CN117456416B

CN117456416B - 智能生成素材标签的方法及***

Info

Publication number: CN117456416B
Application number: CN202311454740.8A
Authority: CN
Inventors: 顾昌胜; 侯冬雯; 赵充
Original assignee: Beijing Biscuit Technology Co ltd
Current assignee: Beijing Biscuit Technology Co ltd
Priority date: 2023-11-03
Filing date: 2023-11-03
Publication date: 2024-06-07
Anticipated expiration: 2043-11-03
Also published as: CN117456416A

Abstract

本发明实施例公开了一种智能生成素材标签的方法及***，获取一定数量的素材数据，对素材数据进行预处理得到预处理数据；基于预处理数据构建训练集；构建定制标签识别模型，其中，定制标签识别模型基于识别任务需求关联通用标签识别模型；将训练集输入定制标签识别模型进行训练，得到训练好的定制标签识别模型；将待识别素材数据输入通用标签识别模型，得到待识别素材数据的通用标签；将待识别素材数据输入训练好的定制标签识别模型，得到待识别素材数据的定制标签；基于通用标签和定制标签推理得到待识别素材数据的最终标签。该智能生成素材标签的方法解决现有技术中无法基于标签生成需求准确生成素材标签的问题。

Description

智能生成素材标签的方法及***

技术领域

本发明涉及计算机技术领域，具体涉及一种智能生成素材标签的方法、***、电子设备及存储介质。

背景技术

标签是描述物品和用户喜好的关键词，用来描述物品的一种客观属性和用户兴趣，是连接用户和物品的桥梁，用户在上传图片、视频等媒体素材时，AI大模型会为素材自动提取一些通用标签，用于检索，常见的AI大模型有风格、建筑、人物、商品和车辆等识别模型，这些AI大模型基于通用大数据训练，能识别出的标签，但是识别出的标签过于泛化，无法准确表达用户素材信息，不利于素材管理与传播，仍然需要大量的人力介入成本。

对于多租户的SaaS平台，不同用户的素材有独有的行业属性，传统方式是直接在应用层为不同企业定制不同的服务接口，当租户增长时，定制的代码数量会急速膨胀，最终难以支撑维护。且传统方式中单纯选择某一厂商的技术难以覆盖到任何领域，难以给用户输出优的方案，也难以适应于各种部署环境。

因此，亟需一种能够基于标签生成需求智能生成素材标签的方法。

发明内容

本发明实施例的目的在于提供一种智能生成素材标签的方法、***、电子设备及存储介质，用以解决现有技术中无法将同一个税所属月份的报税文件基于报税方式进行分类后再进行报税汇总的问题。

为实现上述目的，本发明实施例提供一种智能生成素材标签的方法，所述方法具体包括：

获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据；

基于所述预处理数据构建训练集；

构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型；

将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型；

将待识别素材数据输入所述通用标签识别模型，得到所述待识别素材数据的通用标签；

将待识别素材数据输入训练好的定制标签识别模型，得到所述待识别素材数据的定制标签；

基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签。

在上述技术方案的基础上，本发明还可以做如下改进：

进一步地，所述获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据，包括：

判断所述素材数据是否为视频数据，若是，将所述视频数据按照镜头划分为多个子视频；

从所述子视频中确定至少一个视频帧作为所述子视频的关键帧；

基于所述关键帧构建训练集。

进一步地，所述构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型，包括：

基于行业标识对所述通用标签识别模型进行分类；

确定所述识别任务对应的行业标识和平台标识；

基于所述行业标识、平台标识和识别任务确定待关联的通用标签识别模型，其中，所述通用标签识别模型的数量至少为一个。

进一步地，所述构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型，还包括：

获取待关联的通用标签识别模型对应的ur l调用地址；

基于所述ur l调用地址将所述定制标签识别模型与所述待关联的通用标签识别模型进行关联。

进一步地，所述将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型，包括：

将所述预处理数据划分为训练集、验证集和测试集；

基于所述训练集训练所述定制标签识别模型；

基于所述验证集对训练后的所述定制标签识别模型进行性能评估，得到满足性能条件的定制标签识别模型；

基于所述测试集评估满足性能条件的所述定制标签识别模型的识别结果，得到所述定制标签识别模型所对应的评价指数。

进一步地，所述将待识别素材数据输入所述通用标签识别模型，得到所述待识别素材数据的通用标签，包括：

基于所述通用标签识别模型对所述待识别素材数据进行文字识别、场景识别和风格识别，并得到识别结果；

对所述识别结果进行提取得到所述待识别素材数据的通用标签。

进一步地，所述基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签，包括：

将所述通用标签和所述定制标签输入自然语言处理模型，通过所述自然语言处理模型从用户自有标签体系数据库中推理匹配出用户自有标签；

基于所述用户自有标签、所述通用标签和所述定制标签得到最终标签。

一种智能生成素材标签的***，包括：

预处理模块，用于获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据；

第一构建模块，用于基于所述预处理数据构建训练集；

第二构建模块，用于构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型；

训练模块，用于将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型；

推理模块，用于基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签。

一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如所述方法的步骤。

一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述方法的步骤。

本发明实施例具有如下优点：

本发明中智能生成素材标签的方法，获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据；基于所述预处理数据构建训练集；构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型；将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型；将待识别素材数据输入所述通用标签识别模型，得到所述待识别素材数据的通用标签；将待识别素材数据输入训练好的定制标签识别模型，得到所述待识别素材数据的定制标签；基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签，解决了现有技术中无法基于标签生成需求准确生成素材标签的问题。

附图说明

为了更清楚地说明本发明的实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图引申获得其它的实施附图。

本说明书所绘示的结构、比例、大小等，均仅用以配合说明书所揭示的内容，以供熟悉此技术的人士了解与阅读，并非用以限定本发明可实施的限定条件，故不具技术上的实质意义，任何结构的修饰、比例关系的改变或大小的调整，在不影响本发明所能产生的功效及所能达成的目的下，均应仍落在本发明所揭示的技术内容能涵盖的范围内。

图1为本发明智能生成素材标签的方法的流程图；

图2为本发明智能生成素材标签的***的第一架构图；

图3为本发明提供的电子设备实体结构示意图。

其中附图标记为：

预处理模块10，第一构建模块20，第二构建模块30，训练模块40，推理模块50，电子设备60，处理器601，存储器602，总线603。

具体实施方式

以下由特定的具体实施例说明本发明的实施方式，熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例

图1为本发明智能生成素材标签的方法实施例流程图，如图1所示，本发明实施例提供的一种智能生成素材标签的方法包括以下步骤：

S101，获取一定数量的素材数据，对素材数据进行预处理得到预处理数据；

具体的，判断所述素材数据是否为视频数据，若是，将所述视频数据按照镜头划分为多个子视频；

基于所述关键帧构建训练集。

S102，基于预处理数据构建训练集；

S103，构建定制标签识别模型，其中，定制标签识别模型基于识别任务需求关联通用标签识别模型；

具体的，基于行业标识对所述通用标签识别模型进行分类；

确定所述识别任务对应的行业标识和平台标识；

获取待关联的通用标签识别模型对应的url调用地址；

基于所述url调用地址将所述定制标签识别模型与所述待关联的通用标签识别模型进行关联。

通用提取模块采用通用标签识别模型，通用标签识别模型装载核心被抽象设计为一个通用底座，理论上可以将各云平台的主流大模型，以及市面上的开源模型接入集成到通用提取模块。这点使得标签可以使用到任意云平台以及开源社区不同领域最优的大模型，可解决定制识别的前置识别问题与泛化场景。

增加所属行业标识这用于标识通用标签识别模型的行业，例如商品，汽车。进一步的细分行业标识用于区分具体场景，例如:IP形象，商品大类，车辆品牌。平台标识用于表示不同云平台，例如：阿里云、百度云、华为云和开源平台。

为阿里云、百度云、华为云和开源平台等等，在标签识别***中设计一个通用抽象接口；

所有平台通用标签识别模型必须均遵循抽象层的定义，来实现最终的接入。具体包含输入、输出数据格式、输出的成功和错误码等等。

模型层基于通用标签识别模型数据结构设计进行存储，主流云平台提供的一般是一个API服务，开源平台提供的是一个模型文件，模型文件可以部署为一个API服务。这样模型层可以统一为对外提供服务url调用地址，根据抽象层的实现将这些模型进行装载配置。

通用标签识别模型数据因为是泛化场景，所以是允许跨企业共享的，每个企业用户可创建关联多条大模型的配置条目，用于实现不同特定场景的识别需求。

一种实施例：在一个车型识别场景中，通过通用的汽车行业大模型，可以识别出画面中是否包含汽车，车辆所在画面的位置，车辆的大体车型，如：suv、mpv、轿车和卡车，但是，通用标签识别模型没有办法获取这些车辆是什么系列、年份、型号、动力及特点。

通过定制标签识别模型识别出车辆的系列、年份、型号、动力及特点，例如:可以通过车企业品牌A的型号a的数据训练可以识别出车辆a。

S104，将训练集输入定制标签识别模型进行训练，得到训练好的定制标签识别模型。

具体的，将所述预处理数据划分为训练集、验证集和测试集；

基于所述训练集训练所述定制标签识别模型；

基于所述验证集对训练好的所述定制标签识别模型进行性能评估，得到满足性能条件的定制标签识别模型；基于所述测试集评估满足性能条件的所述定制标签识别模型的识别结果，得到所述定制标签识别模型所对应的评价指数。对定制标签识别模型进行性能评估，得到是百分制分数(即最高分为100分，最低分为0分)，基于百分制分数确定打分大于设定数值的定制标签识别模型，例如，打分大于90分的定制标签识别模型为满足性能条件的定制标签识别模型；

满足性能条件的定制标签识别模型进行评价指数计算，得到定制标签识别模型的评价指数，计算获得每个评价指数对应的评价值，所述评价值用于表示所述定制标签识别模型在所述评价指数上的能力值。

S105，将待识别素材数据输入通用标签识别模型，得到待识别素材数据的通用标签；

具体的，基于所述通用标签识别模型对所述待识别素材数据进行文字识别、场景识别和风格识别，并得到识别结果；

S106，将待识别素材数据输入训练好的定制标签识别模型，得到待识别素材数据的定制标签；

具体的，定制化提取模块采用混合模型，可应用于不同的提取任务，如分类，目标检测等，同时定化提取模块的与通用模块的区别是其支持定制训练，用户可以提自已的数据，根据用户数据训练专属模型，这点上与传统方式不同的是，定制化提取模块依然提供的是一个通用底座，这个底坐允许将各云平台训练生成的模型AP I服务，以及开源大模型训练得到的离线模型装载集成进来。另一个重要的特点是允许前置时混合通用提取模块，例如车俩识别时，先会基于车辆检测判断车俩位置以及坐标，再基于车企品牌大模型，最终基于多个前置大模型结合定制标签识别模型，输出给用户一个准确的品牌、车型标签。

定制标签识别模型数据结构设计:数据结构上复用通用大模型数据结构，仅增加标识区分定制与通用。

定制标签识别模型复用通用标签识别模型层的定义；

标签识别模型的主流云平台训练输出的同样也是一个AP I服务，开源平台提供的是一个模型文件，模型文件可以部署为一个AP I服务。模型层可以根据抽象层的实现将这些模型进行装载配置。

定制标签识别模型与通用标签识别模型不同的是定制标签识别模型为单个企业用户独有，不支持共享，这里通过企业标识做数据隔离。在一个定制识别的任务中可以关联多个通用识别任务，这里通过定义工作事件流来实现。例如:定制识别检测前，定制识别检测开始，定制识别检测后，允许多个通用标签识别模型可以按照顺序应用。

聚合识别结果集，根据加载的用户自有标签体系数据库，经过自然语义处理推理匹配出用户自有标签。例如，车辆标签识别场景，已经得到了一个辆的品牌与型号时，联动加载该企业自有数据库，加载对有的车型所有数据，经过NLP处理，可以进一步得到车辆的动力信息和配置信息等等车辆特点信息。

采用最小粒度化插件化设计，如通用提取模块与定制提取模块为独立设计，各自可以灵活组合，配置独立工作。例如在车型识别中，通用标签识别模型可以选择百度云的车辆识别，阿里云的车辆品牌识别，定制标签识别模型可以是开源模型Resnet，也可以是百度的EasyD l，阿里云的Pa i。由于在***接入层面规范统一了各平台接口，在平台服务上层提供抽象层，使得可以兼容主流平台模型的对接。

S107，基于通用标签和定制标签推理得到待识别素材数据的最终标签；

具体的，将所述通用标签和所述定制标签输入自然语言处理模型，通过所述自然语言处理模型从用户自有标签体系数据库中推理匹配出用户自有标签；

该智能生成素材标签的方法，获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据；基于所述预处理数据构建训练集；构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型；将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型；将待识别素材数据输入所述通用标签识别模型，得到所述待识别素材数据的通用标签；将待识别素材数据输入训练好的定制标签识别模型，得到所述待识别素材数据的定制标签；基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签。解决了现有技术中无法基于标签生成需求准确生成素材标签的问题。

该智能生成素材标签的方法，降低人工成本：将通用标签识别模型与定制标签识别模型结合，可以有效提升标签的多样性与素材的贴合能力，可以有效降低人工干预成本提高准确性：定制标签识别模型混的合能力使得定制标签识别模型在垂直细分场景提取能力更精准，如：车辆年代型号，商品系列、型号与IP属性等；

该智能生成素材标签的方法较灵活，且具有可扩展性：基于插件化对SaaS平台不同行业用户均可以定制插拨，满足了各种行业场景下用户定制化诉求，更好的检索与传播效果；使用本智能标签服务***提取的标签，使得素材更容易被检索，提取到有价值的标签也更利于营销传播。

图2为本发明智能生成素材标签的***实施例架构图；如图2所示，本发明实施例提供的一种智能生成素材标签的***，包括以下步骤：

预处理模块10，用于获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据；

所述预处理模块10还用于：

基于所述关键帧构建训练集。

第一构建模块20，用于基于所述预处理数据构建训练集；

第二构建模块30，用于构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型；

所述第二构建模块30还用于：

基于行业标识对所述通用标签识别模型进行分类；

确定所述识别任务对应的行业标识和平台标识；

获取待关联的通用标签识别模型对应的ur l调用地址；

训练模块40，用于将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型；

所述训练模块40还用于：

将所述预处理数据划分为训练集、验证集和测试集；

基于所述训练集训练所述定制标签识别模型；

推理模块50，用于基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签。

所述推理模块50还用于：

本发明的一种智能生成素材标签的***，通过预处理模块10获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据；通过第一构建模块20基于所述预处理数据构建训练集；通过第二构建模块30构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型；通过训练模块40将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型；将待识别素材数据输入所述通用标签识别模型，得到所述待识别素材数据的通用标签；将待识别素材数据输入训练好的定制标签识别模型，得到所述待识别素材数据的定制标签；通过推理模块50基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签。该智能生成素材标签的方法解决现有技术中无法基于标签生成需求准确生成素材标签的问题。

图3为本发明实施例提供的电子设备实体结构示意图，如图3所示，电子设备60包括：处理器601(processor)、存储器602(memory)和总线603；

其中，处理器601、存储器602通过总线603完成相互间的通信；

处理器601用于调用存储器602中的程序指令，以执行上述各方法实施例所提供的方法，例如包括：获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据；基于所述预处理数据构建训练集；构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型；将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型；将待识别素材数据输入所述通用标签识别模型，得到所述待识别素材数据的通用标签；将待识别素材数据输入训练好的定制标签识别模型，得到所述待识别素材数据的定制标签；基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签。

本实施例提供一种非暂态计算机可读存储介质，非暂态计算机可读存储介质存储计算机指令，计算机指令使计算机执行上述各方法实施例所提供的方法，例如包括：获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据；基于所述预处理数据构建训练集；构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型；将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型；将待识别素材数据输入所述通用标签识别模型，得到所述待识别素材数据的通用标签；将待识别素材数据输入训练好的定制标签识别模型，得到所述待识别素材数据的定制标签；基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的存储介质。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各实施例或者实施例的某些部分的方法。

虽然，上文中已经用一般性说明及具体实施例对本发明作了详尽的描述，但在本发明基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

Claims

1.一种智能生成素材标签的方法，其特征在于，所述方法具体包括：

获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据，其中，所述素材数据包括视频数据；

基于所述预处理数据构建训练集；

构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型，包括：

基于行业标识对所述通用标签识别模型进行分类；

确定所述识别任务对应的行业标识和平台标识；

基于所述行业标识、平台标识和识别任务确定待关联的通用标签识别模型，其中，所述通用标签识别模型的数量至少为一个；

获取待关联的通用标签识别模型对应的url调用地址；

基于所述url调用地址将所述定制标签识别模型与所述待关联的通用标签识别模型进行关联；

基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签，包括：

2.根据权利要求1所述智能生成素材标签的方法，其特征在于，所述获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据，包括：

基于所述关键帧构建训练集。

3.根据权利要求1所述智能生成素材标签的方法，其特征在于，所述将所述训练集输入所述定制标签识别模型进行训练，得到训练好的定制标签识别模型，包括：

将所述预处理数据划分为训练集、验证集和测试集；

基于所述训练集训练所述定制标签识别模型；

4.根据权利要求1所述智能生成素材标签的方法，其特征在于，所述将待识别素材数据输入所述通用标签识别模型，得到所述待识别素材数据的通用标签，包括：

5.一种智能生成素材标签的***，其特征在于，包括：

预处理模块，用于获取一定数量的素材数据，对所述素材数据进行预处理得到预处理数据，其中，所述素材数据包括视频数据；

第一构建模块，用于基于所述预处理数据构建训练集；

第二构建模块，用于构建定制标签识别模型，其中，所述定制标签识别模型基于识别任务需求关联通用标签识别模型，包括：

基于行业标识对所述通用标签识别模型进行分类；

确定所述识别任务对应的行业标识和平台标识；

获取待关联的通用标签识别模型对应的url调用地址；

推理模块，用于基于所述通用标签和所述定制标签推理得到所述待识别素材数据的最终标签，包括：

6.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4中的任一项所述的方法的步骤。

7.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4中的任一项所述的方法的步骤。