CN118171149A - 标签分类方法、装置、设备、存储介质和计算机程序产品 - Google Patents

标签分类方法、装置、设备、存储介质和计算机程序产品 Download PDF

Info

Publication number
CN118171149A
CN118171149A CN202410598945.1A CN202410598945A CN118171149A CN 118171149 A CN118171149 A CN 118171149A CN 202410598945 A CN202410598945 A CN 202410598945A CN 118171149 A CN118171149 A CN 118171149A
Authority
CN
China
Prior art keywords
tag
content
label
decoding
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410598945.1A
Other languages
English (en)
Inventor
陈世哲
杨煜霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202410598945.1A priority Critical patent/CN118171149A/zh
Publication of CN118171149A publication Critical patent/CN118171149A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种标签分类方法、装置、设备、存储介质和计算机程序产品。方法涉及人工智能技术,方法包括:利用内容特征编码网络,对样本内容进行内容特征编码,得到样本内容的内容编码特征;利用文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络;根据内容特征编码网络、文本特征提取网络和满足训练结束条件的解码网络,构建得到标签分类模型,标签分类模型用于对获取的待分类内容进行标签分类。这样,提高了标签分类效率。

Description

标签分类方法、装置、设备、存储介质和计算机程序产品
技术领域
本申请涉及计算机技术领域,特别是涉及一种标签分类方法、装置、设备、存储介质和计算机程序产品。
背景技术
随着信息时代的到来,各大内容平台每天都新增海量的UGC(User GeneratedContent,用户生成内容),这些内容形式各异,包括短视频、中视频、纯文本帖子以及图文帖子等不同类型介质。
在相关技术中,通常利用AI(Artificial Intelligence,人工智能)的能力,构建分类模型,并通过分类模型为海量的UGC内容进行标签分类。随着时代的发展和信息的快速更迭,会有很多新热词出现,从而会频繁出现新增标签。然而,相关技术中,在出现新增标签的情况下,为了保证UGC分类的准确性,通常是根据属于这些新增标签的训练样本重新对分类模型进行模型训练,再将重新训练得到的分类模型应用到大量生成的UGC,也就是说,原分类模型不适于新增标签上,这样,极大地增加了标签分类的时间成本,降低了标签分类效率。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高标签分类效率的标签分类方法、装置、设备、存储介质和计算机程序产品。
本申请提供了一种标签分类方法。所述方法包括:
获取样本内容和预设标签集合;
利用内容特征编码网络,对所述样本内容进行内容特征编码,得到所述样本内容的内容编码特征;
利用文本特征提取网络,分别对所述预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
基于对所述内容编码特征与各所述标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络;
根据所述内容特征编码网络、所述文本特征提取网络和所述满足训练结束条件的解码网络,构建得到标签分类模型,所述标签分类模型用于对获取的待分类内容进行标签分类。
本申请还提供了一种标签分类装置。所述装置包括:
第一获取模块,用于获取样本内容和预设标签集合;
第一编码模块,用于利用内容特征编码网络,对所述样本内容进行内容特征编码,得到所述样本内容的内容编码特征;
第一提取模块,用于利用文本特征提取网络,分别对所述预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
训练模块,用于基于对所述内容编码特征与各所述标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络;
构建模块,用于根据所述内容特征编码网络、所述文本特征提取网络和所述满足训练结束条件的解码网络,构建得到标签分类模型,所述标签分类模型用于对获取的待分类内容进行标签分类。
在一些实施例中,所述内容特征编码网络包括多个特征编码器,所述样本内容包括多个模态的内容;所述第一编码模块,用于获取所述多个特征编码器,每个特征编码器与一种模态对应;通过所述多个特征编码器,分别对所述样本内容的相应模态的内容进行特征提取,得到所述样本内容对应相应模态的内容编码特征。
在一些实施例中,所述装置还包括生成模块,所述生成模块,用于在所述样本内容包括文本模态的内容、且不包括其它模态的内容的情况下,基于所述文本模态的内容生成其它模态的内容,得到所述样本内容所包括的多个模态的内容,其中,所述其它模态的内容包括图像模态的内容、视频模态的内容和音频模态的内容中的至少一种。
在一些实施例中,所述装置还包括筛选模块,所述第一获取模块,还用于获取验证样本与各个模态对应的候选特征编码器,每个候选特征编码器与一种模态对应;所述第一编码模块,还用于通过与各个模态对应的候选特征编码器,分别对所述验证样本的相应模态的内容进行特征提取,得到所述验证样本对应相应模态的单模态内容编码特征;所述训练模块,还用于对于每个单模态内容编码特征,分别基于所述单模态内容编码特征与各预设标签的标签文本特征进行解码得到相应的解码特征,根据各所述解码特征对解码网络进行训练,得到多个解码网络;所述构建模块,还用于根据所述内容特征编码网络、所述文本特征提取网络和所述解码网络,构建得到多个标签分类模型;所述筛选模块,用于根据所述多个标签分类模型的预测准确率,从与各个模态对应的候选特征编码器中筛选出多个特征编码器。
在一些实施例中,所述装置还包括标签描述文本获取模块,所述标签描述文本获取模块,用于对于所述预设标签集合中的每个预设标签,基于预先存储的标签与标签描述文本的对应关系,根据所述预设标签,查询所述预设标签对应的标签描述文本。
在一些实施例中,所述标签描述文本获取模块,还用于对于所述预设标签集合中的每个预设标签,根据所述预设标签,生成用于模型调用的提示文本;根据所述提示文本调用大语言模型,通过所述大语言模型生成所述预设标签所对应的标签描述文本。
在一些实施例中,所述第一提取模块,用于对于每个预设标签所对应的标签描述文本,获取所述标签描述文本对应的词序列;利用文本特征提取网络,对所述词序列进行文本特征提取,得到所述预设标签的标签文本特征。
在一些实施例中,所述训练模块,用于将所述内容编码特征与各所述标签文本特征输入所述标签分类模型中基于交叉注意力的解码网络,通过所述解码网络输出各预设标签对应的解码特征;将各预设标签对应的解码特征输入单标签分类任务或多标签预测任务,根据任务预测结果更新所述解码网络的网络参数,得到满足训练结束条件的解码网络。
在一些实施例中,所述训练模块,用于将所述内容编码特征作为键值、将各所述标签文本特征均作为查询值,输入所述标签分类模型中基于交叉注意力的解码网络,通过所述解码网络对所述键值与各所述查询值进行交互分析,得到各预设标签对应的解码特征。
在一些实施例中,所述训练模块,用于获取对所述样本内容标注的标签,对所述样本内容标注的标签属于所述预设标签集合;根据对所述样本内容标注的标签,确定所述样本内容对应各预设标签的标签标注数据;基于对所述内容编码特征与各所述标签文本特征进行解码得到的解码特征,计算所述样本内容对应各预设标签的标签预测概率;根据所述标签标注数据与所述标签预测概率,构建模型损失,并以最小化所述模型损失为训练目标,对解码网络的网络参数进行更新,得到满足训练结束条件的解码网络。
在一些实施例中,所述装置还包括标签分类模块,所述标签分类模块,用于在所述预设标签集合中出现新增标签的情况下,获取新增标签所对应的标签描述文本;利用构建好的所述标签分类模型和包括所述新增标签的预设标签集合中各个标签对应的标签描述文本,对待分类内容进行标签分类,得到标签分类结果,所述新增标签是所述标签分类模型的训练过程中未出现过的标签。
本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述标签分类方法的步骤。
本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述标签分类方法的步骤。
本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述标签分类方法的步骤。
上述标签分类方法、装置、设备、存储介质和计算机程序产品,通过利用内容特征编码网络,对样本内容进行内容特征编码,得到样本内容的内容编码特征。利用文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络。也就是说,解码网络本质上学习了预设标签的标签描述文本与样本内容间的匹配关系,基于该匹配关系来反映该样本内容是否与该预设标签相关。根据内容特征编码网络、文本特征提取网络和满足训练结束条件的解码网络,构建得到标签分类模型,标签分类模型用于对获取的待分类内容进行标签分类。这样,一旦出现了新增标签,该解码网络仍然可以利用学习到的匹配关系,直接识别出新增标签是否与待识别内容相关,不需要重新训练解码网络,也就无需重新对标签分类模型进行训练,简化了标签分类的过程,提高了标签分类效率。
本申请提供了一种标签分类方法。所述方法包括:
获取待分类内容和构建好的标签分类模型;
利用所述标签分类模型中的内容特征编码网络,对所述待分类内容进行内容特征编码,得到内容编码特征;
利用所述标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
利用所述标签分类模型中的解码网络,对所述内容编码特征与所述各预设标签的标签文本特征进行解码,得到解码特征,并基于所述解码特征确定出所述待分类内容的标签。
本申请还提供了一种标签分类装置。所述装置包括:
第二获取模块,用于获取待分类内容和构建好的标签分类模型;
第二编码模块,用于利用所述标签分类模型中的内容特征编码网络,对所述待分类内容进行内容特征编码,得到内容编码特征;
第二提取模块,用于利用所述标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
确定模块,用于利用所述标签分类模型中的解码网络,对所述内容编码特征与所述各预设标签的标签文本特征进行解码,得到解码特征,并基于所述解码特征确定出所述待分类内容的标签。
在一些实施例中,所述第二获取模块,还用于在所述预设标签集合中出现新增标签的情况下,获取新增标签所对应的标签描述文本,所述新增标签是所述标签分类模型的训练过程中未出现过的标签;所述第二提取模块,还用于对所述新增标签所对应的标签描述文本进行文本特征提取,得到所述新增标签对应的标签文本特征;所述确定模块,还用于通过所述标签分类模型中的解码网络,对所述内容编码特征与所述各预设标签的标签文本特征、所述新增标签的标签文本特征进行解码,得到解码特征,并基于所述解码特征确定出所述待分类内容的标签。
本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述标签分类方法的步骤。
本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述标签分类方法的步骤。
本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述标签分类方法的步骤。
上述标签分类方法、装置、设备、存储介质和计算机程序产品,通过利用标签分类模型中的内容特征编码网络,对待分类内容进行内容特征编码,得到内容编码特征。利用标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。利用标签分类模型中的解码网络,对内容编码特征与各预设标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签。这样,一旦出现了新增标签,该解码网络仍然可以利用学习到的匹配关系,直接识别出新增标签是否与待识别内容相关,不需要重新训练解码网络,也就无需重新对标签分类模型进行训练,简化了标签分类的过程,提高了标签分类效率。
附图说明
图1为一个实施例中标签分类方法的应用环境图;
图2为一个实施例中标签分类方法的流程示意图;
图3为一个实施例中特征编码器获取流程示意图;
图4为一个实施例中标签分类模型框架的示意图;
图5为一个实施例中解码网络训练步骤的流程示意图;
图6为另一个实施例中解码网络训练步骤的流程示意图;
图7为另一个实施例中标签分类方法的流程示意图;
图8为另一个实施例中标签分类方法的应用环境图;
图9为另一个实施例中标签分类模型框架的示意图;
图10为一个实施例中标签分类装置的结构框图;
图11为另一个实施例中标签分类装置的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
首先,先对相关名词进行简单介绍:
Transformer:是一种适合处理序列数据的网络结构模型,采用了全注意力结构代替传统的循环神经网络或卷积神经网络。核心思想是将输入序列中的每个元素与其他元素之间的关系建模为一个注意力权重矩阵,并通过自注意力机制计算每个元素的表示。这种结构在捕捉序列中的长距离依赖关系方面具有很强的能力,从而在自然语言处理任务中取得了很好的表现,其应用非常广泛,包括机器翻译、文本摘要、问答***等任务。它首次引入了自注意力机制,并在很多方面超越了传统的序列到序列(Seq2Seq)模型,如LSTM(LongShort-Term Memory,长短期记忆网络)和GRU(Gated Recurrent Unit,门控循环单元)等。同时也催生了许多基于自注意力机制的变体模型,如BERT(Bidirectional EncoderRepresentations from Transformers,双向变换器模型)、GPT(Generative Pre-trainedTransformer,预训练生成式转换器)等,这些模型在自然语言处理任务中取得了显著的进展。
UGC(User-Generated Content):用户生产的内容。
OCR(Optical Character Recognition,光学字符识别):一种从图像中检测和识别文字内容的技术。
ASR(Automatic Speech Recognition,自动语音识别):一种将人的语音转换为文本的技术。
大语言模型(Large Language Model,LLM)是一种基于深度学习的自然语言处理技术,通过训练大量的语料库数据,能够预测和生成文本。大语言模型一般采用循环神经网络(RNN)或变种,如长短时记忆网络(LSTM)和门控循环单元(GRU),以捕捉文本序列中的上下文信息,从而实现自然语言文本的生成、语言模型评估、文本分类、情感分析等任务。在自然语言处理领域,大语言模型已经被广泛应用,例如语音识别、机器翻译、自动摘要、对话***、智能问答等。
本申请实施例提供的标签分类方法,涉及人工智能(Artificial Intelligence,AI)技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互***、机电一体化等技术。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本申请实施例具体涉及机器学习技术。
在相关技术中,通常利用人工智能技术,构建分类模型并进行模型训练,并基于训练好的分类模型完成对UGC内容的标签分类。其中,由于UGC内容的多样性,通常涉及到不同的标签分类任务,例如,单标签分类任务(single-label任务,即在定义好的标签中选择一个正确的标签来标记一个样本)和多标签分类任务(multi-label任务,即在定义好的标签中选择多个正确的标签来标签一个样本)。在对单标签分类任务对应的分类模型进行训练时,在获取了样本内容的编码特征后,在该编码特征之上接全连接层,得到相应的预测结果,根据预测结果和已知标签,构建相应的损失函数进行模型训练。在对多标签分类任务对应的分类模型进行训练时,也是先获取样本内容的编码特征,在该编码特征之上接一个全连接层(每个神经元对应一个具体的标签),以预测每个标签是否存在,并通过相应的损失函数进行模型训练。
对比两种标签分类任务各自的模型训练过程,可以知晓,均需要结合已知的标签进行训练,分类体系相对固定,不能频繁变更。因此,一旦出现新增标签,已训练好的模型无法扩展到新增标签上,需要基于新增标签重新对分类模型进行训练,再基于重新训练得到的分类模型进行标签分类,极大地增加了标签分类的时间成本,降低了标签分类效率。
基于此,本申请实施例提供了一种标签分类方法,通过利用内容特征编码网络,对样本内容进行内容特征编码,得到样本内容的内容编码特征。利用文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络。也就是说,解码网络本质上学习了预设标签的标签描述文本与样本内容间的匹配关系,基于该匹配关系来反映该样本内容是否与该预设标签相关。根据内容特征编码网络、文本特征提取网络和满足训练结束条件的解码网络,构建得到标签分类模型,标签分类模型用于对获取的待分类内容进行标签分类。这样,一旦出现了新增标签,该解码网络仍然可以利用学习到的匹配关系,直接识别出新增标签是否与待识别内容相关,不需要重新训练解码网络,也就无需重新对标签分类模型进行训练,简化了标签分类的过程,提高了标签分类效率。
本申请实施例提供的标签分类方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储***可以存储服务器104需要处理的数据。数据存储***可以集成在服务器104上,也可以放在云上或其他服务器上。终端102和服务器104均可单独执行该标签分类方法,终端102和服务器104也可协同执行该标签分类方法。
在一些实施例中,本申请实施例提供的标签分类方法可以由服务器104执行。服务器104获取样本内容和预设标签集合;服务器104利用内容特征编码网络,对样本内容进行内容特征编码,得到样本内容的内容编码特征;服务器104利用文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;服务器104基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络;根据内容特征编码网络、文本特征提取网络和满足训练结束条件的解码网络,构建得到标签分类模型,标签分类模型用于对获取的待分类内容进行标签分类。
可选地,服务器104可以将构建好的标签分类模型发送至终端102,终端102部署该标签分类模型,并根据该标签分类模型对待分类内容进行标签分类。或者,终端102将待分类内容发送至服务器104,服务器104直接调用构建好的标签分类模型对该待分类内容进行标签分类。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种标签分类方法,以该方法应用于计算机设备(可以是图1中的服务器104,也可以是终端102)为例进行说明,包括以下步骤:
步骤S202,获取样本内容和预设标签集合。
其中,样本内容是作为模型训练所使用的训练样本数据,样本内容可以是任意形式的,包括但不限于文本、图像、音频或视频中的至少一种形式。示例性地,在文章推送的业务场景中,样本内容可以文本内容,即该样本内容仅包含文章;该样本内容还可以是图文内容,即该样本内容除了文章本身,还包括图文内容的文章标题、图文内容中***的图片、视频、音频等各种模态的相关数据。在产品推广的业务场景中,样本内容可以是推广文本,即该样本内容仅包含文章;该样本内容还可以是推广信息,即该样本内容除了推广内容本身,还可以包括推广信息的标题、所附视频、所附音频等各种模态的相关数据。
预设标签集合包含多个预设标签,预设标签集合是业务方为业务场景设置的标签集合,预设标签集合中可以根据实际情况和业务场景,随时新增一些标签。标签是用来标志产品、分类内容,便于查找、定位、搜索和推送内容。
可选地,计算机设备获取目标业务场景相关的样本内容和预设标签集合。
此外,为实现模型训练,计算机设备还可以获取样本内容对应的标注信息,标注信息为该样本内容标注的标签,为样本内容标注的标签可以是一个或多个。也就是说,本申请训练好的标签分类模型可用于单标签分类任务,也可用于多标签分类任务。
步骤S204,利用内容特征编码网络,对样本内容进行内容特征编码,得到样本内容的内容编码特征。
其中,内容特征编码网络是用于提取相应模态特征的人工神经网络,内容特征编码网络是事先训练完成的编码网络,用于提取关于样本内容的特征。内容特征编码网络作为标签分类模型中一部分,用于对样本内容进行内容特征编码,得到样本内容的内容编码特征。
由于一个样本内容所包括的各种模态相关的数据包括但不限于文本、图像、音频中的至少一种形式,也就是说,样本内容包含至少一个模态。因此,还可以利用内容特征编码网络分别对样本内容中每个模态的特征进行特征提取,得到相应模态的内容编码特征。
在一些实施例中,内容特征编码网络包括多个特征编码器,样本内容包括多个模态的内容;利用内容特征编码网络,对样本内容进行内容特征编码,得到样本内容的内容编码特征,包括:获取多个特征编码器,每个特征编码器与一种模态对应;通过多个特征编码器,分别对样本内容的相应模态的内容进行特征提取,得到样本内容对应相应模态的内容编码特征。
其中,内容特征编码网络包括多个事先训练完成的特征编码器,每个特征编码器与一种模态对应,即,每个特征编码器用于对相应模态进行特征提取。
可选地,计算机设备将样本内容输入至内容特征编码网络中的各特征编码器,对于每个特征编码器,计算机设备通过该特征编码器,对该样本内容进行相应模态的特征提取,得到相应模态的内容编码特征。
示例性地,一个样本内容包含图像、文本、音频。
对于图像模态,可利用CNN(Convolutional Neural Network,卷积神经网络)或ViT(Vision Transformer,视觉变换器)等模型进行图像模态的特征提取。
对于音频模态,可利用VGGish模型(基于VGG模型(一个深度卷积神经网络模型)的结构训练得到)进行音频模态的特征提取。
对于文本模态,可以是样本内容的文章标题、视频ASR、OCR等文本,可利用BERT模型进行文本模态的特征提取。
在本实施例中,通过内容特征编码网络中的多个特征编码器,能够准确识别样本内容中的各模态,以准确提取各模态各自的特征,得到样本内容对应相应模态的内容编码特征。这样,根据各个模态各自对应的内容编码特征,能够更全面获取样本内容的细节信息,确保解码网络训练的准确性,确保标签分类的有效性。
在一些实施例中,方法还包括:在样本内容包括文本模态的内容、且不包括其它模态的内容的情况下,基于文本模态的内容生成其它模态的内容,得到样本内容所包括的多个模态的内容,其中,其它模态的内容包括图像模态的内容、视频模态的内容和音频模态的内容中的至少一种。
示例性地,在样本内容包括文本模态的内容、且不包括其他模态的内容的情况下,计算机设备获取至少一种模态生成模型,每个模态生成模型所生成的模态各自不同,且每个模态生成模型是用于将文本模态的内容生成对应的其他模态的内容。对于每个模态生成模型,计算机设备利用该模态生成模型,基于文本模态的内容,生成相应的其他模态的内容。例如,模态生成模型可以是文本生成图像的模态生成模型、文本生成视频的模态生成模型、文本生成音频模态的模态生成模型等。
在本实施例中,在确定了样本内容仅包含文本模态的内容的情况下,利用文本模态的内容生成与之紧密相关的其他模态的内容,从而,能够获取到更多模态的细节信息,能够有效提升标签分类的准确性。
在一些实施例中,如图3所示,为一个实施例中特征编码器获取流程示意图。获取多个特征编码器,包括:
步骤S302,获取验证样本与各个模态对应的候选特征编码器,每个候选特征编码器与一种模态对应。
其中,验证样本是用于验证与预设标签集合相关联的特征编码器的样本,该验证样本包含多个模态的内容。
步骤S304,通过与各个模态对应的候选特征编码器,分别对验证样本的相应模态的内容进行特征提取,得到验证样本对应相应模态的单模态内容编码特征。
其中,每个模态的单模态内容编码特征是指该模态的内容编码特征,反映的是单个模态的内容的特征。
示例性地,对于每个候选特征编码器,计算机设备通过该候选特征编码器对该验证样本进行相应模态的内容的特征提取,得到相应模态的单模态内容编码特征。
例如,存在M个候选特征编码器,每个候选特征编码器对应一种模态,利用M个候选特征编码器分别对同一验证样本进行相应模态的内容的特征提取,得到M个单模态内容编码特征。M为大于1的正整数。
步骤S306,对于每个单模态内容编码特征,分别基于单模态内容编码特征与各预设标签的标签文本特征进行解码得到相应的解码特征,根据各解码特征对解码网络进行训练,得到多个解码网络。
示例性地,对于每个单模态内容特征编码,将该单模态内容特征编码和各标签文本特征输入基于交叉注意力的解码网络,通过解码网络输出各预设标签对应的解码特征。将各预设标签对应的解码特征输入单标签分类任务或多标签预测任务,根据任务预测结果更新该解码网络的网络参数,得到对应的满足训练结束条件的解码网络。
需要说明的是,每个单模态内容编码特征对应一种模态,可以理解的是,每个模态对应一个解码网络,例如,M个单模态内容编码特征各自对应一个解码网络。
示例性地,将该单模态内容特征编码和各标签文本特征输入基于交叉注意力的解码网络,通过解码网络输出各预设标签对应的解码特征,包括:将单模态内容编码特征作为键值、将各标签文本特征均作为查询值,输入标签分类模型中基于交叉注意力的解码网络,通过解码网络对键值与各查询值进行交互分析,得到各预设标签对应的解码特征。
需要说明的是,步骤S306提及的预设标签、标签文本特征、解码特征和解码网络的定义可参照下文。
步骤S308,根据内容特征编码网络、文本特征提取网络和解码网络,构建得到多个标签分类模型。
示例性地,对于每个候选特征编码器,根据内容编码网络、文本特征提取网络和相应的解码网络,构建对应模态的标签分类模型。
例如,对于候选特征编码器1,对应模态为模态1,对应的解码网络为解码网络1,基于内容编码网络、文本特征提取网络和解码网络1构建标签分类模型1。对于候选特征编码器2,对应模态为模态2,对应的解码网络为解码网络2,基于内容编码网络、文本特征提取网络和解码网络2构建标签分类模型2。对于候选特征编码器3,对应模态为模态3,对应的解码网络为解码网络3,基于内容编码网络、文本特征提取网络和解码网络3构建标签分类模型3。…。对于候选特征编码器M,对应模态为模态M,对应的解码网络为解码网络M,基于内容编码网络、文本特征提取网络和解码网络M构建标签分类模型M。
步骤S310,根据多个标签分类模型的预测准确率,从与各个模态对应的候选特征编码器中筛选出多个特征编码器。
可选地,计算机设备获取目标数量的测试样本,该测试样本包括多个模态的内容。
对于每个标签分类模型,计算机设备将每个测试样本和预设标签集合中每个预设标签的标签描述文本均输入到对应的标签分类模型,得到测试结果。
计算机设备校验每个测试样本对应的标注信息和测试结果是否一致。标注信息为预先对该测试样本的标签进行标注的信息。从目标数量的测试结果中,确定出与标注信息一致的测试结果的数量,将该数量与该目标数量的比值,作为该标签分类模型的预测准确率。
计算机设备将大于或等于准确率阈值的标签分类模型所对应的候选特征编码器,作为特征编码器,去除小于准确率阈值的标签分类模型所对应的候选特征编码器。
需要说明的是,预测准确率越高,则说明对应的模态与预设标签集合的标签描述文本越相关;预测准确率越低,则说明对应的模态与预设标签集合的标签描述文本越无关。
在本实施例中,根据验证样本和各模态各自对应的候选特征编码器,分别确定该验证样本对应的各模态的单模态内容编码特征。利用单模态内容编码特征和预设标签集合的预设标签的标签文本特征对相应模态的解码网络进行训练,能够确定出与各模态对应的标签分类模型。这样,基于各标签分类模型的预测准确率能够预估出与该预设标签集合相关性高的模态,从而,筛选出与预设标签集合相关性高的多个特征编码器,这样,能够确保后续标签分类的有效性和准确性。
步骤S206,利用文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。
其中,文本特征提取网络是用于提取标签的文本特征的神经网络,文本特征提取网络是事先训练完成的网络。该文本特征提取网络作为标签分类模型中的一部分,用于对预设标签集合中每个预设标签对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。
标签描述文本是用于描述/解释预设标签的文本,示例性地,在视频推荐的业务场景中,预设标签:趣闻实验,对应的标签描述文本:趣味小实验、挑战类内容无科学性质实验内容,有一定趣味性即可(正常科学实验不适用此标签)。
可选地,计算机设备获取预设标签集合中各预设标签各自对应的标签描述文本。计算机设备获取训练完成的文本特征提取网络,将各标签描述文本输入至该文本特征提取网络,通过文本特征提取网络,分别提取各标签描述文本各自的文本特征,得到各预设标签的标签文本特征。
在一些实施例中,方法还包括:对于预设标签集合中的每个预设标签,基于预先存储的标签与标签描述文本的对应关系,根据预设标签,查询预设标签对应的标签描述文本。
其中,在一些业务场景中,业务方预先定义了对应标签的标签描述文本,并将标签与对应的标签描述文本间关联,得到对应关系,并存储在本地。
示例性地,在视频推荐的业务场景中,对应关系见表1:
表1:标签与标签描述文本的对应关系
上述表1中还记录了每个预设标签的标签类型,例如,预设标签的名称为医疗前沿技术,属于“新闻+生活”类型(一级标签类型)下的“看点-医疗类+看点-健康知识”类型(二级标签类型)。又例如,预设标签为趣闻实验,属于“生活”类型(一级标签类型)下的“看点-趣味”类型(二级标签类型)。
示例性地,计算机设备从预先存储的各业务场景各自对应的对应关系中,获取预设标签集合所属目标业务场景的对应关系。对于该预设标签集合中的每个预设标签,若查询到该对应关系中包含该预设标签,则根据该对应关系,确定与该预设标签对应的标签描述文本。
在本实施例中,根据预先存储的标签与标签描述文本的对应关系,能够准确查询出预设标签对应的标签描述文本,提高了标签描述文本确定的准确性。
在一些实施例中,方法还包括:对于预设标签集合中的每个预设标签,根据预设标签,生成用于模型调用的提示文本;根据提示文本调用大语言模型,通过大语言模型生成预设标签所对应的标签描述文本。
其中,提示文本是用于让大语言模型了解需求,并以此生成相应的答复文本。示例性地,预设标签为趣味实验,生成对应的提示文本:“请描述趣味实验,并生成标签描述文本”。
本申请实施例中,大语言模型用于生成预设标签的标签描述文本。
可选地,对于预设标签中的每个预设标签,计算机设备根据预设标签的名称,生成相应的提示文本。计算机设备调用大语言模型,生成对应的标签描述文本并输出。
需要说明的是,有的预设标签存在多种含义,即有的预设标签的名称存在一词多义,因此,为确保大语言模型生成的标签描述文本是符合目标业务场景的,计算机设备根据预设标签的名称和预设标签所属类型,生成相应的提示文本,并通过调用大语言模型,准确生成与目标业务场景匹配的、与该预设标签对应的标签描述文本。
例如,预设标签为“苹果”,在水果推荐的业务场景中,该预设标签的标签描述文本应该是属于水果的苹果的描述文本。因此,提示文本为“请描述苹果这种水果,并生成描述文本”,这样,大语言模型能够针对性地生成标签描述文本。
在本实施例中,对于预设标签集合中的每个预设标签,根据预设标签,生成用于模型调用的提示文本。这样,能够便于大语言模型根据该提示文本,生成匹配的标签描述文本。尤其是在业务方未提供标签描述文本的情况下,也无需业务方提供,可自动生成,提高了标签描述文本生成的效率。
在另一些实施例中,方法还包括:获取知识图谱,并从知识图谱中查询预设标签集合中各预设标签各自对应的标签描述文本。
在本实施例中,通过调用知识图谱,利用知识图谱中各实体的属性信息和实体间的关系,及时查询出各预设标签的标签描述文本。尤其在业务方未提供标签描述文本的情况下,无需业务方提供,可自动确定标签描述文本,提高标签描述文本生成的效率。
需要说明的是,在一些业务场景中,相应的预设标签集合中包括常见的预设标签、以及业务场景专用的预设标签。对于常见的预设标签,无需业务方进行定义,为确保标签描述文本确定的效率,可直接基于常见的预设标签的名称,或者基于场景的预设标签的名称和该预设标签所属类型,生成相应的提示文本,调用知识图谱或大语言模型,确定对应的标签描述文本。对于难以理解或者业务场景专用的预设标签,为确保标签描述文本的准确性,需要业务方自行标注出难以理解或者业务场景专用的预设标签的标签描述文本,并建立对应关系,并根据该对应关系来确定。
为此,在另一些实施例中,方法还包括:对于预设标签集合中的每个预设标签,获取预先存储的标签与标签描述文本的对应关系,若从该对应关系中查询到该预设标签,则根据该对应关系,查询出对应的标签描述文本。若从该对应关系中查询不到该预设标签,则根据该预设标签的名称和类型,调用知识图谱或大语言模型,生成对应的标签描述文本。
这样,能够兼顾标签描述文本确定的效率和准确性。
在一些实施例中,利用文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征,包括:对于每个预设标签所对应的标签描述文本,获取标签描述文本对应的词序列;利用文本特征提取网络,对词序列进行文本特征提取,得到预设标签的标签文本特征。
其中,词序列是对标签描述文本中的词进行排序得到的序列。
可选地,对于每个预设标签所对应的标签描述文本,计算机设备去除该标签描述文本中无效词后进行分词处理,确定该标签描述文本的各个词,并按各个词在所述标签描述文本中的顺序,拼接各个词,得到词序列。
计算机设备将各预设标签各自对应的词序列,均输入至文本特征提取网络中,通过文本特征提取网络分别提取各词序列各自对应的标签文本特征。
上述提及的分词处理,其实质是进行文本Token(文本中的单词或子词,是进行文本特征提取时使用的基本单元)化,得到标签描述文本中的至少一个Token(词)。按各Token在标签描述文本中的顺序,依次拼接,得到词序列,再在词序列之前添加“[CLS]”标记,该标记表征分类,将添加后的词序列输入到BERT中,取[CLS]对应的表示作为标签描述文本的标签文本特征,记为q(大小为1×d)。假设有C个预设标签,则获取到C个标签文本特征,分别为q1、q2、…、qC
在本实施例中,通过无需训练的文本特征提取网络,迅速且准确的提取出每个标签描述文本的标签文本特征,提高了标签文本特征提取的效率。
步骤S208,基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络。
其中,解码的实质是特征融合,也即是,将每个标签文本特征均与内容编码特征进行特征融合,得到每个标签文本特征对应的解码特征。
示例性地,若样本内容1存在一个内容编码特征,对于C个预设标签各自对应的标签文本特征,即q1、q2、…、qC。对于标签文本特征qx(x的取值范围为[1,C]),对应的解码特征是通过融合标签文本特征qx和该内容编码特征得到的,最终,对于样本内容1而言,获取到C个解码特征logit。
示例性地,若样本内容1存在M个内容编码特征,对于C个预设标签各自对应的标签文本特征,即q1、q2、…、qC。对于标签文本特征qx(x的取值范围为[1,C]),对应的解码特征是通过融合标签文本特征qx和M个内容编码特征得到的。最终,对于样本内容1而言,获取到C个解码特征logit。
解码网络是进行特征融合的人工神经网络,该解码网络是待训练的网络。解码网络作为标签分类模型中一部分,用于将内容编码特征和每个标签文本特征进行特征融合,得到每个标签文本特征对应的解码特征。解码网络的本质是用于挖掘输入的样本内容与每个标签描述文本之间的匹配关系,即样本内容是否与标签描述文本所描述的预设标签相匹配,且,解码网络不涉及到自注意力机制,因此,新增了标签或者减少了标签对训练好的解码网络无影响,在新增了标签的情况下,训练好的解码网络的这种挖掘能力可“延续”到新增标签上,从而可扩展到零样本新增标签的分类。示例性地,解码网络可以是基于Transformer中的解码部分构建的网络,也可以是多层感知机,也可以是low-rankbilinear pooling(多模态低秩双线性池化),具体不作限定。
训练结束条件可以是训练次数达到预设次数,也可以是解码网络对应的损失函数达到最小值,具体不作限定。
可选地,对于每个预设标签对应的标签文本特征,计算机设备通过解码网络对内容编码特征和标签文本特征进行解码,得到对应的解码特征。根据各个标签文本特征各自对应的解码特征,确定该样本内容对应各预设标签的标签预测概率,根据该标签预测概率,确定模型损失,以最小化模型损失为目标对解码网络进行训练,得到满足训练结束条件的解码网络。
步骤S210,根据内容特征编码网络、文本特征提取网络和满足训练结束条件的解码网络,构建得到标签分类模型,标签分类模型用于对获取的待分类内容进行标签分类。
其中,标签分类模型包含内容特征编码网络、文本特征提取网络和解码网络。
示例性地,如图4所示,为一个实施例中标签分类模型框架的示意图。结合图4,对训练阶段(模型构建阶段)和推理(实际应用)阶段进行说明。
在训练阶段,需要对解码网络进行训练,直至得到训练结束的解码网络,基于训练结束的解码网络、训练完成的内容特征编码网络、训练完成的文本特征提取网络,构建标签分类模型。具体地,输入内容为样本内容,将样本内容和预设标签集合中每个预设标签分别输入至训练完成的内容特征编码网络、训练完成的文本特征提取网络,分别得到内容编码特征和标签文本特征,并送入待训练的解码网络进行训练,直至得到训练结束的解码网络。
在推理阶段,输入内容为待分类内容,将待分类内容和预设标签集合中每个预设标签分别输入至训练完成的内容特征编码网络、训练完成的文本特征提取网络,分别得到内容编码特征和标签文本特征,并送入训练完成的解码网络中,输出预测标签。
需要说明的是,由于内容的多样性,通常涉及到不同的标签识别任务,例如前文提及的单标签分类任务和多标签分类任务。而相关技术中,单标签识别任务和多标签识别任务各自实现的方式不统一,既各自所使用的模型不一,导致标签分类***结构复杂,无法提高标签分类的效率。
而本申请中,采用的是图4的模型框架,该模型框架是通用的框架,也就是说,通过将相应标签分类任务的样本内容输入至图4的模型框架,能够构建出用于相应标签分类任务的模型。
可见,该模型框架适用于不同的标签分类任务,统一了多个标签分类任务的实现方式。
上述标签分类方法中,通过利用内容特征编码网络,对样本内容进行内容特征编码,得到样本内容的内容编码特征。利用文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络。也就是说,解码网络本质上学习了预设标签的标签描述文本与样本内容间的匹配关系,基于该匹配关系来反映该样本内容是否与该预设标签相关。根据内容特征编码网络、文本特征提取网络和满足训练结束条件的解码网络,构建得到标签分类模型,标签分类模型用于对获取的待分类内容进行标签分类。这样,一旦出现了新增标签,该解码网络仍然可以利用学习到的匹配关系,直接识别出新增标签是否与待识别内容相关,不需要重新训练解码网络,也就无需重新对标签分类模型进行训练,简化了标签分类的过程,提高了标签分类效率。
在一些实施例中,如图5所示,为一个实施例中解码网络训练步骤的流程示意图。基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络,包括:
步骤S502,将内容编码特征与各标签文本特征输入标签分类模型中基于交叉注意力的解码网络,通过解码网络输出各预设标签对应的解码特征。
其中,解码网络是基于多头交叉注意力机制构建的。
可选地,获取标签分类模型中基于交叉注意力的解码网络,并将内容编码特征与各标签文本特征输入该解码网络。对于每个标签文本特征,通过该解码网络的多头交叉注意力机制,融合内容编码特征和该标签文本特征,得到对应的解码特征。
在一些实施例中,将内容编码特征与各标签文本特征输入标签分类模型中基于交叉注意力的解码网络,通过解码网络输出各预设标签对应的解码特征,包括:将内容编码特征作为键值、将各标签文本特征均作为查询值,输入标签分类模型中基于交叉注意力的解码网络,通过解码网络对键值与各查询值进行交互分析,得到各预设标签对应的解码特征。
其中,键值和查询值分别对应交叉注意机制中的Key、Query。
交互分析是计算模态编码特征和标签文本特征之间的注意力权重,并基于注意力权重融合这两种特征,以提取出更丰富的信息生成更准确的表示,即解码特征。
可选地,对于每个预设标签的标签文本特征,计算机设备将每个内容编码特征均视为交叉注意机制中的键值,将该标签文本特征视为交叉注意机制中的查询值和内容值(Value),并利用交叉注意机制,进行多次交互分析,得到该预设标签对应的解码特征。
示例性地,在获取到样本内容中多个模态对应的内容编码特征后,将多个内容编码特征作为多个键值,对于每个查询值,计算机设备从多个键值中获取未进行交互分析的键值,将获取到的键值作为当次交互分析所使用的当次键值;
若当次交互分析为首次交互分析,则计算机设备对当次键值和该查询值进行首次交互分析,得到首次交互分析对应的中间解码特征;
若当次交互分析不为首次交互分析,则计算机设备获取前次交互分析得到的前次中间解码特征,并对前次中间解码特征和当次键值进行当次交互分析,得到当次交互分析对应的中间解码特征;
根据末次交互分析得到的末次中间解码特征,确定作为标签文本特征对应的解码特征。
举例说明:
步骤1:若当次交互分析为首次交互分析,则将当次内容编码特征作为当次内容值和当次键值,将当次键值、当次内容值和查询值,输入至解码网络中的多头交叉注意力机制网络层,得到输出的结果。计算机设备将输出的结果,输入至前馈神经网络层,输出当次交互分析对应的中间解码特征。其中,多头交叉注意力机制网络层是基于多头交叉注意力机制构建的,多头交叉注意力机制网络层和前馈神经网络层分别为解码网络中一部分。
步骤2:若当次交互分析不为首次交互分析,则将当次内容编码特征作为当次内容值和当次键值,将当次键值、当次内容值和前次中间解码特征,输入至解码网络中的多头交叉注意力机制网络层,将输出的结果,输入至前馈神经网络层,输出当次交互分析对应的中间解码特征。
如,针对查询值q1,对于每次交互分析m,当次键值为,参考下述公式(1)-(2),确定每次交互分析对应的中间解码特征。
(1)
(2)
上述公式中m的取值范围为[1,M]。MultiHeadAttn(.)为进行多头注意力的函数,为前次交互分析m-1得到的中间解码特征,/>为当次交互分析m的多头注意力结果。FFN(.)为解码网络中的前馈神经网络层。对于首次交互分析,对应的/>为查询值q1
其中,多头注意力函数的计算可下面参考式公式(3)-(5):
(3)
(4)
(5)
上述公式(3)中Q、K、V分别为查询值、键值、内容值。MultiHeadAttn(Q,K,V)为多头 交叉注意力机制的结果。Concat为连接层,headi为第i头,i的取值范围为[1,h]。Attention (.)为第i头的注意力机制的结果。softmax(.)为激活函数。T为转置处理。为()的 大小。均为可学习参数。
需要说明的是,前文步骤S306中提及的将单模态内容编码特征作为键值、将各标签文本特征均作为查询值,输入标签分类模型中基于交叉注意力的解码网络的过程,具体可以是:对于每个查询值,将单模态内容编码特征作为内容值和键值,将键值、内容值和该查询值,输入至解码网络中的多头交叉注意力机制网络层,得到输出的结果。计算机设备将输出的结果,输入至前馈神经网络层,输出该查询值对应的解码特征。其中,多头交叉注意力机制网络层的原理参考前述公式(1)-(5)。
在一个具体的示例中,解码网络中包含多个相同结构的解码块(decoder block)。每个解码块包括多头交叉注意力机制网络层和前馈神经网络层。下面说明任意一个预设标签对应的解码特征的确定过程:
对于首个解码块,执行上述步骤1-步骤2,将首个解码块中末次交互分析得到的中间解码特征,作为首个解码块的输出结果。
对于非首个解码块的当前解码块,将前个解码块的输出结果、多个键值输入至当前解码块,将前个解码块的输出结果视为步骤1中查询值,采用步骤1-步骤2类似的过程,得到当前解码块的输出结果。
根据末个解码块的输出结果J和待学习网络参数W的乘积,作为视为该预设标签对应的解码特征。例如,该预设标签对应的解码特征logit=J×W。其中,J大小为C×d,C为预设标签的总数量,d为维数;W的大小为d×1。
在本实施例中,通过将内容编码特征作为键值、将各标签文本特征均作为查询值,利用交叉注意力机制,实现将内容编码特征与每个标签文本特征进行特征融合,得到准确的解码特征,从而,确保了解码网络训练的有效性。
步骤S504,将各预设标签对应的解码特征输入单标签分类任务或多标签预测任务,根据任务预测结果更新解码网络的网络参数,得到满足训练结束条件的解码网络。
示例性地,计算机设备获取各预设标签各自对应的解码特征,根据各解码特征,输入至单标签分类任务的激活函数层(如,softmax层),或多标签分类任务的激活函数层(如,sigmoid层),将相应激活函数层的输出作为任务预测结果。计算机设备根据任务预测结果,构建模型损失,以最小化模型损失为目标,更新解码网络的网络参数,得到满足训练结束条件的解码网络。
示例性地,解码网络的网络参数如前文提及的各解码块中的、/>、/>、/>、W。
例如,若样本内容均为单标签样本内容(进行单标签分类任务的样本内容,被标注的标签的数量为1个),则将各解码特征输入至单标签分类任务的激活函数层,得到任务预测结果,根据任务预测结果,构建模型损失(单标签损失)。
或者,若样本内容均为多标签样本内容(进行多标签分类任务的样本内容,被标注的标签的数量为多个),则将各解码特征输入至多标签分类任务的激活函数层,得到任务预测结果,根据任务预测结果,构建模型损失(单标签损失)。
又或者,若样本内容包含单标签样本内容和多标签样本内容,则将单标签样本任务对应的各解码特征输入单标签分类任务的激活函数层,得到任务预测结果,以构建单标签损失,将多标签样本任务对应的各解码特征输入多标签分类任务的激活函数层,得到任务预测结果,以构建多标签损失,叠加单标签损失和多标签损失,得到模型损失。
在本实施例中,通过基于交叉注意力的解码网络,实现将内容编码特征与每个标签文本特征进行特征融合,得到准确的解码特征。再通过将各预设标签对应的解码特征输入单标签分类任务或多标签分类任务,得到任务预测结果,根据任务预测结果及时调整网络参数,确保解码网络学习到样本内容与标签描述文本间的匹配关系。
在一些实施例中,如图6所示,为另一个实施例中解码网络训练步骤的流程示意图。基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络,包括:
步骤S602,获取对样本内容标注的标签,对样本内容标注的标签属于预设标签集合。
其中,对样本内容标注的标签可以是业务方预先进行标注的。可以知晓的是,该标签是预先存在的,是预设标签集合中的某个预设标签,该标签不是新增标签。
示例性地,计算机设备获取样本内容,还获取样本内容对应的标注信息,标注信息为该样本内容标注的标签,为样本内容标注的标签可以是一个或多个。
步骤S604,根据对样本内容标注的标签,确定样本内容对应各预设标签的标签标注数据。
示例性地,计算机设备将对样本内容标注的标签的标签标注数据设为1,将其他预设标签的标签标注数据的0。
例如,对于样本内容1,若对样本内容1标注的标签为预设标签1,则设置该预设标签1的标签标注数据为1,预设标签集合中预设标签2、…、预设标签C的标签标注数据均为0。
对于样本内容2,若对样本内容2标注的标签为预设标签2和预设标签3,则设置预设标签2和预设标签3的标签标注数据均为1,预设标签集合中的预设标签1、预设标签4、预设标签5、…、预设标签C的标签标注数据均为0。
步骤S606,基于对内容编码特征与各标签文本特征进行解码得到的解码特征,计算样本内容对应各预设标签的标签预测概率。
其中,预设标签的标签预测概率反映样本内容与该预设标签的匹配程度。标签预测概率越大,则匹配程度越高。
可选地,计算机设备将目标标签分类任务相关的解码特征输入至目标标签分类任务,得到样本内容对应各预设标签的标签预测概率。其中,解码特征是基于内容编码特征与各标签文本特征进行解码的。
示例性地,若样本内容为单标签样本内容(为该样本内容标注的标签的数量为1个),则将对应的解码特征输入至softmax层,输出该样本内容对应各预设标签的标签预测概率。
若样本内容为多标签样本内容(为该样本内容标注的标签的数量为多个),则将对应的解码特征输入sigmoid层,输出该样本内容对应各预设标签的标签预测概率。
步骤S608,根据标签标注数据与标签预测概率,构建模型损失,并以最小化模型损失为训练目标,对解码网络的网络参数进行更新,得到满足训练结束条件的解码网络。
示例性地,若样本内容均为单标签样本内容,模型损失为单标签损失,如,单标签损失为一元交叉熵损失。
若样本内容均为多标签内容,模型损失为多标签损失,如,多标签损失为BCE损失(Binary Cross Entropy loss,二元交叉熵损失),采用公式(6)得到多损失标签
(6)
上述公式(6)中N为当前批次的样本内容的数量,为第n个样本内容、第c个预设标签的标注数据,/>为第n个样本内容、第c个预设标签的标签预测概率。
若样本内容包括单标签内容和多标签内容,模型损失为单标签损失和多标签损失之和。此时,训练不同标签分类任务时共享网络参数。
在本实施例中,根据对样本内容标注的标签,确定出该样本内容对应的各预设标签的标签标注数据,并根据该样本内容对应的各预设标签的标签预测概率和标签标注数据,构建模型损失。根据模型损失反映标签预测概率与标签标注数据的差异,并调整网络参数,以确保解码网络能学习预设标签的标签描述文本与样本内容间的匹配关系。这样,在实际推理时,一旦出现了新增标签,该解码网络仍然可以利用学习到的匹配关系,直接识别出新增标签是否与待识别内容相关,无需重新对标签分类模型进行训练,提高了标签分类效率。
在一些实施例中,方法还包括:在预设标签集合中出现新增标签的情况下,获取新增标签所对应的标签描述文本;利用构建好的标签分类模型和包括新增标签的预设标签集合中各个标签对应的标签描述文本,对待分类内容进行标签分类,得到标签分类结果,新增标签是标签分类模型的训练过程中未出现过的标签。
其中,新增标签也可视为是开集标签,即,在标签分类模型的训练过程中(即,解码网络的训练过程),预设标签集合中没有出现的标签。
可选地,在预设标签集合中出现新增标签的情况下,计算机设备利用新增标签的名称,调用大语言模型或知识图谱,确定该新增标签所对应的标签描述文本。计算机设备将新增标签添加到预设标签集合中,将添加后的预设标签集合中每个标签(新增标签或者预设标签)的标签描述文本、待分类内容,输入到构建好的标签分类模型中,得到待分类内容的标签分类结果。
示例性地,利用构建好的标签分类模型中内容特征编码网络对待分类内容进行内容特征编码,得到待分类内容的内容编码特征。利用构建好的标签分类模型中文本特征提取网络,分别提取每个标签对应的标签文本特征。利用构建好的标签分类模型中解码网络,根据该内容编码特征与各标签文本特征得到解码特征,基于解码特征,确定待分类内容的标签。
在相关技术中,对于标签分类任务,还存在另一种分类方式,即基于检索进行分类。以视频推荐场景进行说明,检索通常采用v2v2t(video-to-video-to-tag,视频到视频到标签)的方法,基于训练好的编码器对视频提取特征,将人工标注的数据处理成<视频特征,标签列表>的形式写到检索库中,对于需要打标签的视频,首先利用同一个训练好的编码器提取特征,在检索库中搜索特征相似的相似视频,将top-K个相似视频的对应的标签列表作为候选标签,经过聚合模块(如投票)得到最终标签分类结果。
虽然,在出现新增标签的情况下,该方法无需重新训练。但是,该方法仍需获取新增标签的样本,并将新增标签的样本整理到检索库中,基于整理后的检索库完成标签分类。
而本实施例中,新增标签出现后,无需获取新增标签的样本,也无需预先建立检索库,仅需要获取新增标签的标签文本特征,然后,将各标签(预设标签或新增标签)的标签文本特征和待分类内容的内容编码特征输入至编码网络即可,流程更为简便,人力和时间成本更低。
在本实施例中,一旦出现新增标签,则仅需要额外获取新增标签的标签描述文本,并利用构建好的标签分类模型,根据包括新增标签的预设标签集合中各标签的标签描述文本,对待分类内容进行标签分类,可直接确定待分类内容的标签分类结果。这实现了零样本支持新增标签的识别,无需重新训练模型,提高了标签分类的效率。
在一些实施例中,如图7所示,提供了一种标签分类方法,以该方法应用于计算机设备(可以是图1中的服务器104,也可以是图1中的终端102)为例进行说明,包括以下步骤:
步骤S702,获取待分类内容和构建好的标签分类模型。
其中,待分类内容为待进行标签分类的内容。构建好的标签分类模型包括训练完成的内容特征编码网络、训练完成的文本特征提取网络和训练完成的解码网络。训练完成的解码网络的训练过程见上文。
步骤S704,利用标签分类模型中的内容特征编码网络,对待分类内容进行内容特征编码,得到内容编码特征。
可选地,计算机设备获取内容特征编码网络中的多个特征编码器,每个特征编码器与一种模态对应。计算机设备通过多个特征编码器,分别对待分类内容的相应模态的内容进行特征提取,得到待分类内容对应相应模态的内容编码特征。
若待分类内容包含文本模态的内容、且不包括其它模态的内容的情况下,基于文本模态的内容生成其它模态的内容,得到待分类内容所包括的多个模态的内容,并通过多个特征编码器,分别对待分类内容的相应模态的内容进行特征提取,得到待分类内容对应相应模态的内容编码特征。
步骤S706,利用标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。
可选地,对于预设标签集合中的每个预设标签,计算机设备基于预先存储的标签与标签描述文本的对应关系,根据预设标签,查询预设标签对应的标签描述文本。
可选地,对于预设标签集合中的每个预设标签,根据预设标签,生成用于模型调用的提示文本;根据提示文本调用大语言模型,通过大语言模型生成预设标签所对应的标签描述文本。
可选地,对于每个预设标签所对应的标签描述文本,计算机设备获取标签描述文本对应的词序列;计算机设备利用文本特征提取网络,对词序列进行文本特征提取,得到预设标签的标签文本特征。
步骤S708,利用标签分类模型中的解码网络,对内容编码特征与各预设标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签。
可选地,计算机设备将内容编码特征与各标签文本特征输入标签分类模型中基于交叉注意力的解码网络,通过解码网络输出各预设标签对应的解码特征,计算机设备根据各预设标签对应的解码特征确定各预设标签各自的得分。计算机设备将高于预设得分的预设标签确定为待分类内容的标签。
示例性地,将内容编码特征与各标签文本特征输入标签分类模型中基于交叉注意力的解码网络,通过解码网络输出各预设标签对应的解码特征,包括:将内容编码特征作为键值、将各标签文本特征均作为查询值,输入标签分类模型中基于交叉注意力的解码网络,通过解码网络对键值与各查询值进行交互分析,得到各预设标签对应的解码特征。计算机设备基于解码特征,确定待分类内容属于各预设标签的得分,根据得分,确定待分类内容的标签。
上述标签分类方法中,通过利用标签分类模型中的内容特征编码网络,对待分类内容进行内容特征编码,得到内容编码特征。利用标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。利用标签分类模型中的解码网络,对内容编码特征与各预设标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签。这样,一旦出现了新增标签,该解码网络仍然可以利用学习到的匹配关系,直接识别出新增标签是否与待识别内容相关,不需要重新训练解码网络,也就无需重新对标签分类模型进行训练,简化了标签分类的过程,提高了标签分类效率。
在一些实施例中,方法还包括:在预设标签集合中出现新增标签的情况下,获取新增标签所对应的标签描述文本,新增标签是标签分类模型的训练过程中未出现过的标签;对新增标签所对应的标签描述文本进行文本特征提取,得到新增标签对应的标签文本特征。
其中,新增标签也可视为是开集标签,即,在标签分类模型的训练过程中(即,解码网络的训练过程),预设标签集合中没有出现的标签。
可选地,在解码网络训练完成后,在实际推理阶段中,若预设标签集合中出现新增标签,计算机设备根据新增标签的名称,或者根据新增标签的名称和所属类型,调用大语言模型或知识图谱,确定该新增标签所对应的标签描述文本。计算机设备通过标签分类模型中的文本特征提取网络,对新增标签所对应的标签描述文本进行文本特征提取,得到新增标签对应的标签文本特征。
在一些实施例中,在确定了新增标签的标签文本特征之后,利用标签分类模型中的解码网络,对内容编码特征与各预设标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签,包括:通过标签分类模型中的解码网络,对内容编码特征与各预设标签的标签文本特征、新增标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签。
可选地,计算机设备将内容编码特征、各预设标签的标签文本特征、以及新增标签的标签文本特征,输入标签分类模型中基于交叉注意力的解码网络,通过解码网络输出各预设标签对应的解码特征、以及新增标签对应的解码特征。计算机设备根据各预设标签对应的解码特征、新增标签对应的解码特征,确定各预设标签各自的得分、以及新增标签的得分。计算机设备将高于预设得分的标签(预设标签或新增标签)确定为待分类内容的标签。
示例性地,将内容编码特征作为键值、将各标签文本特征均作为查询值,输入标签分类模型中基于交叉注意力的解码网络,通过解码网络对键值与各查询值进行交互分析,得到各预设标签对应的解码特征和新增标签的解码特征。
在本实施例中,在推理阶段,一旦出现新增标签,则仅需要额外获取新增标签的标签文本特征,并直接将新增标签、预设标签的各自的标签文本特征和待分类内容的内容编码特征一起输入到解码网络即可,实现了零样本支持新增标签的识别,无需重新训练模型,提高了标签分类的效率。
本申请还提供一种应用场景,该应用场景应用上述的标签分类方法。具体地,该标签分类方法在该应用场景的应用例如:在视频推送的业务场景中,为了确保多标签分类任务或单标签分类任务的标签分类效率,可以利用本申请实施例提供的标签分类方法。该业务场景下,样本内容为样本视频,具体步骤如下:计算机设备获取样本视频和与该业务场景对应的预设标签集合;利用内容特征编码网络,对样本视频进行内容特征编码,得到样本视频的内容编码特征;利用文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络;根据内容特征编码网络、文本特征提取网络和满足训练结束条件的解码网络,构建得到标签分类模型,标签分类模型用于对获取的待分类视频进行标签分类。
当然并不局限于此,本申请提供的标签分类方法还可以应用在其他应用场景中,例如,在新闻推荐的业务场景(样本内容为样本文章)等等。
上述应用场景仅为示意性的说明,可以理解,本申请各实施例所提供的标签分类方法的应用不局限于上述场景。
在一个具体的实施例中,如图8所示,为另一个实施例中标签分类方法的应用环境图。以视频推送的业务场景进行举例。内容生产方将生成的待分类视频发送至内容处理链路进行内容处理。在内容处理链路中,可以采用人工打标和机器打标的人机协同方式确定待分类视频的标签,并将该待分类视频和标签发送至下游的内容分发方,内容分发方根据该标签,对待分类视频进行相应的视频推荐。
其中,机器打标的方式是采用构建好的标签分类模型确定标签的。如图9所示,为另一个实施例中标签分类模型框架的示意图。
其中,标签分类模型包含内容特征编码网络、文本特征提取网络和解码网络。内容特征编码网络包括多个特征编码器,如,图9中包括特征编码器1、特征编码器2、…、特征编码器M。
在训练阶段,获取训练完成的内容特征编码网络和文本特征提取网络,并获取待训练的解码网络。输入内容为样本内容,输入的标签为预设标签集合中的预设标签。具体过程见下述S1-S7:
S1:计算机设备获取样本内容和预设标签集合,其中该样本内容包括多个模态的内容。
S2:计算机设备确定训练完成的内容特征编码网络中多个特征编码器,每个特征编码器与一种模态对应。通过多个特征编码器,分别对样本内容的相应模态的内容进行特征提取,得到样本内容对应相应模态的内容编码特征。
可选地,在样本内容包括文本模态的内容、且不包括其它模态的内容的情况下,基于文本模态的内容生成其它模态的内容,得到样本内容所包括的多个模态的内容,其中,其它模态的内容包括图像模态的内容、视频模态的内容和音频模态的内容中的至少一种。
上述多个特征编码器的确定步骤包括:获取验证样本与各个模态对应的候选特征编码器,每个候选特征编码器与一种模态对应;通过与各个模态对应的候选特征编码器,分别对验证样本的相应模态的内容进行特征提取,得到验证样本对应相应模态的单模态内容编码特征;对于每个单模态内容编码特征,分别基于单模态内容编码特征与各预设标签的标签文本特征进行解码得到相应的解码特征,根据各解码特征对解码网络进行训练,得到多个解码网络;根据内容特征编码网络、文本特征提取网络和解码网络,构建得到多个标签分类模型;根据多个标签分类模型的预测准确率,从与各个模态对应的候选特征编码器中筛选出多个特征编码器。
S3:对于预设标签集合中的每个预设标签,计算机设备通过预先存储的标签与标签描述文本的对应关系,或者,大语言模型(LLM),或者,知识图谱(KG),确定该预设标签的标签描述文本。
可选地,计算机设备基于预先存储的标签与标签描述文本的对应关系,根据预设标签,查询预设标签对应的标签描述文本。
可选地,计算机设备根据预设标签,生成用于模型调用的提示文本;根据提示文本调用大语言模型,通过大语言模型生成预设标签所对应的标签描述文本。
可选地,计算机设备获取知识图谱,并根据该预设标签,从知识图谱中查询对应的标签描述文本。
S4:对于每个预设标签所对应的标签描述文本,计算机设备获取标签描述文本对应的词序列;利用训练完成的文本特征提取网络,对词序列进行文本特征提取,得到预设标签的标签文本特征。
S5:计算机设备将内容编码特征与各标签文本特征输入标签分类模型中基于交叉注意力的解码网络,通过解码网络输出各预设标签对应的解码特征。
可选地,将多个内容编码特征作为多个键值、将各标签文本特征均作为查询值,输入标签分类模型中基于交叉注意力的解码网络,通过解码网络对多个键值与各查询值进行交互分析,得到各预设标签对应的解码特征。
S6:计算机设备获取对样本内容标注的标签,对样本内容标注的标签属于预设标签集合;根据对样本内容标注的标签,确定样本内容对应各预设标签的标签标注数据;计算机设备将各预设标签对应的解码特征输入单标签分类任务或多标签预测任务,根据任务预测结果确定该样本内容对应各预设标签的标签预测概率。根据标签标注数据与标签预测概率,构建模型损失,并以最小化模型损失为训练目标,对解码网络的网络参数进行更新,得到满足训练结束条件的解码网络。
S7:计算机设备根据训练完成的内容特征编码网络、训练完成的文本特征提取网络和满足训练结束条件的解码网络,构建得到标签分类模型,标签分类模型用于对获取的待分类内容进行标签分类。
在推理阶段,利用构建的标签分类模型不仅能够支持单标签分类任务和多标签分类任务(对应下述S8-S9),还支持零样本学习(对应下述S10-S11):
S8:计算机设备获取待分类内容和构建好的标签分类模型。
S9:计算机设备利用标签分类模型中的内容特征编码网络,对待分类内容分别进行不同模态的内容特征编码,得到多个内容编码特征。利用标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。利用标签分类模型中的解码网络,对多个内容编码特征与各预设标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签。
S10:在预设标签集合中出现新增标签的情况下,获取新增标签所对应的标签描述文本,新增标签是标签分类模型的训练过程中未出现过的标签;利用标签分类模型中的文本特征提取网络,对新增标签所对应的标签描述文本进行文本特征提取,得到新增标签对应的标签文本特征。
S11:通过标签分类模型中的解码网络,对多个内容编码特征与各预设标签的标签文本特征、新增标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签。
在本实施例中,利用标签分类模型中的内容特征编码网络,对待分类内容分别进行不同模态的内容特征编码,得到多个内容编码特征。这样,能够更全面获取待分类内容的细节信息,确保后续标签分类的准确性。利用标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征。利用标签分类模型中的解码网络,对内容编码特征与各预设标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签。这样,一旦出现了新增标签,该解码网络仍然可以利用学习到的匹配关系,直接识别出新增标签是否与待识别内容相关,不需要重新训练解码网络,也就无需重新对标签分类模型进行训练,简化了标签分类的过程,提高了标签分类效率。此外,本申请实施例还统一了多个标签分类任务的实现方式,精简了标签分类模型的架构。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的标签分类方法的标签分类装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个标签分类装置实施例中的具体限定可以参见上文中对于标签分类方法的限定,在此不再赘述。
在一个实施例中,如图10所示,提供了一种标签分类装置1000,包括:第一获取模块1002、第一编码模块1004、第一提取模块1006、训练模块1008和构建模块1010,其中:
第一获取模块1002,用于获取样本内容和预设标签集合;
第一编码模块1004,用于利用内容特征编码网络,对样本内容进行内容特征编码,得到样本内容的内容编码特征;
第一提取模块1006,用于利用文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
训练模块1008,用于基于对内容编码特征与各标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络;
构建模块1010,用于根据内容特征编码网络、文本特征提取网络和满足训练结束条件的解码网络,构建得到标签分类模型,标签分类模型用于对获取的待分类内容进行标签分类。
在一些实施例中,内容特征编码网络包括多个特征编码器,样本内容包括多个模态的内容;第一编码模块1004,用于获取多个特征编码器,每个特征编码器与一种模态对应;通过多个特征编码器,分别对样本内容的相应模态的内容进行特征提取,得到样本内容对应相应模态的内容编码特征。
在一些实施例中,装置还包括生成模块,生成模块,用于在样本内容包括文本模态的内容、且不包括其它模态的内容的情况下,基于文本模态的内容生成其它模态的内容,得到样本内容所包括的多个模态的内容,其中,其它模态的内容包括图像模态的内容、视频模态的内容和音频模态的内容中的至少一种。
在一些实施例中,装置还包括筛选模块,第一获取模块1002,还用于获取验证样本与各个模态对应的候选特征编码器,每个候选特征编码器与一种模态对应;第一编码模块1004,还用于通过与各个模态对应的候选特征编码器,分别对验证样本的相应模态的内容进行特征提取,得到验证样本对应相应模态的单模态内容编码特征;训练模块1008,还用于对于每个单模态内容编码特征,分别基于单模态内容编码特征与各预设标签的标签文本特征进行解码得到相应的解码特征,根据各解码特征对解码网络进行训练,得到多个解码网络;构建模块1010,还用于根据内容特征编码网络、文本特征提取网络和解码网络,构建得到多个标签分类模型;筛选模块,用于根据多个标签分类模型的预测准确率,从与各个模态对应的候选特征编码器中筛选出多个特征编码器。
在一些实施例中,装置还包括标签描述文本获取模块,标签描述文本获取模块,用于对于预设标签集合中的每个预设标签,基于预先存储的标签与标签描述文本的对应关系,根据预设标签,查询预设标签对应的标签描述文本。
在一些实施例中,标签描述文本获取模块,还用于对于预设标签集合中的每个预设标签,根据预设标签,生成用于模型调用的提示文本;根据提示文本调用大语言模型,通过大语言模型生成预设标签所对应的标签描述文本。
在一些实施例中,第一提取模块1006,用于对于每个预设标签所对应的标签描述文本,获取标签描述文本对应的词序列;利用文本特征提取网络,对词序列进行文本特征提取,得到预设标签的标签文本特征。
在一些实施例中,训练模块1008,用于将内容编码特征与各标签文本特征输入标签分类模型中基于交叉注意力的解码网络,通过解码网络输出各预设标签对应的解码特征;将各预设标签对应的解码特征输入单标签分类任务或多标签预测任务,根据任务预测结果更新解码网络的网络参数,得到满足训练结束条件的解码网络。
在一些实施例中,训练模块1008,用于将内容编码特征作为键值、将各标签文本特征均作为查询值,输入标签分类模型中基于交叉注意力的解码网络,通过解码网络对键值与各查询值进行交互分析,得到各预设标签对应的解码特征。
在一些实施例中,训练模块1008,用于获取对样本内容标注的标签,对样本内容标注的标签属于预设标签集合;根据对样本内容标注的标签,确定样本内容对应各预设标签的标签标注数据;基于对内容编码特征与各标签文本特征进行解码得到的解码特征,计算样本内容对应各预设标签的标签预测概率;根据标签标注数据与标签预测概率,构建模型损失,并以最小化模型损失为训练目标,对解码网络的网络参数进行更新,得到满足训练结束条件的解码网络。
在一些实施例中,装置还包括标签分类模块,该标签分类模块,用于在预设标签集合中出现新增标签的情况下,获取新增标签所对应的标签描述文本;利用构建好的标签分类模型和包括新增标签的预设标签集合中各个标签对应的标签描述文本,对待分类内容进行标签分类,得到标签分类结果,新增标签是标签分类模型的训练过程中未出现过的标签。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的标签分类方法的标签分类装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个标签分类装置实施例中的具体限定可以参见上文中对于标签分类方法的限定,在此不再赘述。
在一个实施例中,如图11所示,提供了一种标签分类装置1100,包括:第二获取模块1102、第二编码模块1104、第二提取模块1106和确定模块1108,其中:
第二获取模块1102,用于获取待分类内容和构建好的标签分类模型;
第二编码模块1104,用于利用标签分类模型中的内容特征编码网络,对待分类内容进行内容特征编码,得到内容编码特征;
第二提取模块1106,用于利用标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
确定模块1108,用于利用标签分类模型中的解码网络,对内容编码特征与各预设标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签。
在一些实施例中,第二获取模块1102,还用于在预设标签集合中出现新增标签的情况下,获取新增标签所对应的标签描述文本,新增标签是标签分类模型的训练过程中未出现过的标签;第二提取模块1106,还用于对新增标签所对应的标签描述文本进行文本特征提取,得到新增标签对应的标签文本特征;确定模块,还用于通过标签分类模型中的解码网络,对内容编码特征与各预设标签的标签文本特征、新增标签的标签文本特征进行解码,得到解码特征,并基于解码特征确定出待分类内容的标签。
上述标签分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,也可以终端,其内部结构图可以如图12所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过***总线连接,通信接口通过输入/输出接口连接到***总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述标签分类方法。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (18)

1.一种标签分类方法,其特征在于,所述方法包括:
获取样本内容和预设标签集合;
利用内容特征编码网络,对所述样本内容进行内容特征编码,得到所述样本内容的内容编码特征;
利用文本特征提取网络,分别对所述预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
基于对所述内容编码特征与各所述标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络;
根据所述内容特征编码网络、所述文本特征提取网络和所述满足训练结束条件的解码网络,构建得到标签分类模型,所述标签分类模型用于对获取的待分类内容进行标签分类。
2.根据权利要求1所述的方法,其特征在于,所述内容特征编码网络包括多个特征编码器,所述样本内容包括多个模态的内容;
所述利用内容特征编码网络,对所述样本内容进行内容特征编码,得到所述样本内容的内容编码特征,包括:
获取所述多个特征编码器,每个特征编码器与一种模态对应;
通过所述多个特征编码器,分别对所述样本内容的相应模态的内容进行特征提取,得到所述样本内容对应相应模态的内容编码特征。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在所述样本内容包括文本模态的内容、且不包括其它模态的内容的情况下,基于所述文本模态的内容生成其它模态的内容,得到所述样本内容所包括的多个模态的内容,其中,所述其它模态的内容包括图像模态的内容、视频模态的内容和音频模态的内容中的至少一种。
4.根据权利要求2所述的方法,其特征在于,所述获取所述多个特征编码器,包括:
获取验证样本与各个模态对应的候选特征编码器,每个候选特征编码器与一种模态对应;
通过与各个模态对应的候选特征编码器,分别对所述验证样本的相应模态的内容进行特征提取,得到所述验证样本对应相应模态的单模态内容编码特征;
对于每个单模态内容编码特征,分别基于所述单模态内容编码特征与各预设标签的标签文本特征进行解码得到相应的解码特征,根据各所述解码特征对解码网络进行训练,得到多个解码网络;
根据所述内容特征编码网络、所述文本特征提取网络和所述解码网络,构建得到多个标签分类模型;
根据所述多个标签分类模型的预测准确率,从与各个模态对应的候选特征编码器中筛选出多个特征编码器。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对于所述预设标签集合中的每个预设标签,基于预先存储的标签与标签描述文本的对应关系,根据所述预设标签,查询所述预设标签对应的标签描述文本。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对于所述预设标签集合中的每个预设标签,根据所述预设标签,生成用于模型调用的提示文本;
根据所述提示文本调用大语言模型,通过所述大语言模型生成所述预设标签所对应的标签描述文本。
7.根据权利要求1所述的方法,其特征在于,所述利用文本特征提取网络,分别对所述预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征,包括:
对于每个预设标签所对应的标签描述文本,获取所述标签描述文本对应的词序列;
利用文本特征提取网络,对所述词序列进行文本特征提取,得到所述预设标签的标签文本特征。
8.根据权利要求1所述的方法,其特征在于,所述基于对所述内容编码特征与各所述标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络,包括:
将所述内容编码特征与各所述标签文本特征输入所述标签分类模型中基于交叉注意力的解码网络,通过所述解码网络输出各预设标签对应的解码特征;
将各预设标签对应的解码特征输入单标签分类任务或多标签预测任务,根据任务预测结果更新所述解码网络的网络参数,得到满足训练结束条件的解码网络。
9.根据权利要求8所述的方法,其特征在于,所述将所述内容编码特征与各所述标签文本特征输入所述标签分类模型中基于交叉注意力的解码网络,通过所述解码网络输出各预设标签对应的解码特征,包括:
将所述内容编码特征作为键值、将各所述标签文本特征均作为查询值,输入所述标签分类模型中基于交叉注意力的解码网络,通过所述解码网络对所述键值与各所述查询值进行交互分析,得到各预设标签对应的解码特征。
10.根据权利要求1所述的方法,其特征在于,所述基于对所述内容编码特征与各所述标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络,包括:
获取对所述样本内容标注的标签,对所述样本内容标注的标签属于所述预设标签集合;
根据对所述样本内容标注的标签,确定所述样本内容对应各预设标签的标签标注数据;
基于对所述内容编码特征与各所述标签文本特征进行解码得到的解码特征,计算所述样本内容对应各预设标签的标签预测概率;
根据所述标签标注数据与所述标签预测概率,构建模型损失,并以最小化所述模型损失为训练目标,对解码网络的网络参数进行更新,得到满足训练结束条件的解码网络。
11.根据权利要求1至10中任一项所述的方法,其特征在于,所述方法还包括:
在所述预设标签集合中出现新增标签的情况下,获取新增标签所对应的标签描述文本;
利用构建好的所述标签分类模型和包括所述新增标签的预设标签集合中各个标签对应的标签描述文本,对待分类内容进行标签分类,得到标签分类结果,所述新增标签是所述标签分类模型的训练过程中未出现过的标签。
12.一种标签分类方法,其特征在于,所述方法包括:
获取待分类内容和构建好的标签分类模型;
利用所述标签分类模型中的内容特征编码网络,对所述待分类内容进行内容特征编码,得到内容编码特征;
利用所述标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
利用所述标签分类模型中的解码网络,对所述内容编码特征与所述各预设标签的标签文本特征进行解码,得到解码特征,并基于所述解码特征确定出所述待分类内容的标签。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括:
在所述预设标签集合中出现新增标签的情况下,获取新增标签所对应的标签描述文本,所述新增标签是所述标签分类模型的训练过程中未出现过的标签;
对所述新增标签所对应的标签描述文本进行文本特征提取,得到所述新增标签对应的标签文本特征;
所述利用所述标签分类模型中的解码网络,对所述内容编码特征与所述各预设标签的标签文本特征进行解码,得到解码特征,并基于所述解码特征确定出所述待分类内容的标签,包括:
通过所述标签分类模型中的解码网络,对所述内容编码特征与所述各预设标签的标签文本特征、所述新增标签的标签文本特征进行解码,得到解码特征,并基于所述解码特征确定出所述待分类内容的标签。
14.一种标签分类装置,其特征在于,所述装置包括:
第一获取模块,用于获取样本内容和预设标签集合;
第一编码模块,用于利用内容特征编码网络,对所述样本内容进行内容特征编码,得到所述样本内容的内容编码特征;
第一提取模块,用于利用文本特征提取网络,分别对所述预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
训练模块,用于基于对所述内容编码特征与各所述标签文本特征进行解码得到的解码特征,对解码网络进行训练,得到满足训练结束条件的解码网络;
构建模块,用于根据所述内容特征编码网络、所述文本特征提取网络和所述满足训练结束条件的解码网络,构建得到标签分类模型,所述标签分类模型用于对获取的待分类内容进行标签分类。
15.一种标签分类装置,其特征在于,所述装置包括:
第二获取模块,用于获取待分类内容和构建好的标签分类模型;
第二编码模块,用于利用所述标签分类模型中的内容特征编码网络,对所述待分类内容进行内容特征编码,得到内容编码特征;
第二提取模块,用于利用所述标签分类模型中的文本特征提取网络,分别对预设标签集合中各预设标签所对应的标签描述文本进行文本特征提取,得到各预设标签的标签文本特征;
确定模块,用于利用所述标签分类模型中的解码网络,对所述内容编码特征与所述各预设标签的标签文本特征进行解码,得到解码特征,并基于所述解码特征确定出所述待分类内容的标签。
16.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。
18.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。
CN202410598945.1A 2024-05-15 2024-05-15 标签分类方法、装置、设备、存储介质和计算机程序产品 Pending CN118171149A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410598945.1A CN118171149A (zh) 2024-05-15 2024-05-15 标签分类方法、装置、设备、存储介质和计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410598945.1A CN118171149A (zh) 2024-05-15 2024-05-15 标签分类方法、装置、设备、存储介质和计算机程序产品

Publications (1)

Publication Number Publication Date
CN118171149A true CN118171149A (zh) 2024-06-11

Family

ID=91359221

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410598945.1A Pending CN118171149A (zh) 2024-05-15 2024-05-15 标签分类方法、装置、设备、存储介质和计算机程序产品

Country Status (1)

Country Link
CN (1) CN118171149A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362684A (zh) * 2019-06-27 2019-10-22 腾讯科技(深圳)有限公司 一种文本分类方法、装置及计算机设备
CN113204659A (zh) * 2021-03-26 2021-08-03 北京达佳互联信息技术有限公司 多媒体资源的标签分类方法、装置、电子设备及存储介质
WO2023134073A1 (zh) * 2022-01-11 2023-07-20 平安科技(深圳)有限公司 基于人工智能的图像描述生成方法、装置、设备及介质
CN117453917A (zh) * 2023-10-31 2024-01-26 成都知道创宇信息技术有限公司 模型训练方法、装置、存储介质及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362684A (zh) * 2019-06-27 2019-10-22 腾讯科技(深圳)有限公司 一种文本分类方法、装置及计算机设备
CN113204659A (zh) * 2021-03-26 2021-08-03 北京达佳互联信息技术有限公司 多媒体资源的标签分类方法、装置、电子设备及存储介质
WO2023134073A1 (zh) * 2022-01-11 2023-07-20 平安科技(深圳)有限公司 基于人工智能的图像描述生成方法、装置、设备及介质
CN117453917A (zh) * 2023-10-31 2024-01-26 成都知道创宇信息技术有限公司 模型训练方法、装置、存储介质及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈文实;刘心惠;鲁明羽;: "基于编码解码器与深度主题特征抽取的多标签文本分类", 南京师大学报(自然科学版), no. 04, 30 April 2019 (2019-04-30) *

Similar Documents

Publication Publication Date Title
CN111694924B (zh) 一种事件抽取方法和***
CN113569001A (zh) 文本处理方法、装置、计算机设备及计算机可读存储介质
CN113626589B (zh) 一种基于混合注意力机制的多标签文本分类方法
CN114896388A (zh) 一种基于混合注意力的层级多标签文本分类方法
CN113157886B (zh) 一种自动问答生成方法、***、终端及可读存储介质
CN116450796A (zh) 一种智能问答模型构建方法及设备
CN111506732A (zh) 一种文本多层次标签分类方法
CN112948601A (zh) 一种基于受控语义嵌入的跨模态哈希检索方法
CN115982403A (zh) 一种多模态哈希检索方法及装置
CN114691864A (zh) 文本分类模型训练方法及装置、文本分类方法及装置
CN113516198A (zh) 一种基于记忆网络和图神经网络的文化资源文本分类方法
Bucher et al. Semantic bottleneck for computer vision tasks
CN115130591A (zh) 一种基于交叉监督的多模态数据分类方法及装置
CN116662565A (zh) 基于对比学习预训练的异质信息网络关键词生成方法
CN116303977A (zh) 一种基于特征分类的问答方法及***
CN117217277A (zh) 语言模型的预训练方法、装置、设备、存储介质及产品
CN116975340A (zh) 信息检索方法、装置、设备、程序产品及存储介质
CN117558270B (zh) 语音识别方法、装置、关键词检测模型的训练方法和装置
CN114329181A (zh) 一种题目推荐方法、装置及电子设备
CN113240033A (zh) 一种基于场景图高阶语义结构的视觉关系检测方法及装置
CN112732862A (zh) 一种基于神经网络的双向多段落阅读零样本实体链接方法和装置
CN111666375A (zh) 文本相似度的匹配方法、电子设备和计算机可读介质
CN116662566A (zh) 一种基于对比学习机制的异质信息网络链路预测方法
CN116561272A (zh) 开放域视觉语言问答方法、装置、电子设备及存储介质
CN117216617A (zh) 文本分类模型训练方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination