CN114281936A - 分类方法、装置、计算机设备及存储介质 - Google Patents

分类方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114281936A
CN114281936A CN202111136661.3A CN202111136661A CN114281936A CN 114281936 A CN114281936 A CN 114281936A CN 202111136661 A CN202111136661 A CN 202111136661A CN 114281936 A CN114281936 A CN 114281936A
Authority
CN
China
Prior art keywords
category
categories
text information
text
semantic features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111136661.3A
Other languages
English (en)
Inventor
黄剑辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202111136661.3A priority Critical patent/CN114281936A/zh
Publication of CN114281936A publication Critical patent/CN114281936A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种分类方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取多种第一类别的类别语义特征,对待分类的文本信息进行语义提取,得到文本信息的文本语义特征,以及分别获取文本语义特征与每种类别语义特征之间的相似度;基于多种第一类别对应的相似度,从多种第一类别中,确定文本信息所属的第一目标类别。本申请实施例提供的方法,能够对任意的文本信息进行分类,如用于描述视频的文本信息,引入了用于表示类别的类别信息,以每种类别信息的类别语义特征表征每种类别,将每种类别的类别语义特征与文本信息的文本语义特征进行相似度匹配,以相似度来确定文本信息所属的类别,提升了分类准确性。

Description

分类方法、装置、计算机设备及存储介质
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种分类方法、装置、计算机设备及存储介质。
背景技术
随着计算机技术的发展,互联网中的文本信息越来越丰富,对文本信息进行分类是非常重要的。相关技术中,通常基于样本文本信息及对应的类别标签,对分类模型进行训练,后续基于该分类模型,直接对任一文本信息进行分类,即可得到该文本信息所属的类别,但这种分类方式的准确性欠佳。
发明内容
本申请实施例提供了一种分类方法、装置、计算机设备及存储介质,能够提高分类准确性。所述技术方案如下:
一方面,提供了一种分类方法,所述方法包括:
获取多种第一类别的类别语义特征,所述类别语义特征是对所述第一类别的类别信息进行语义提取得到的;
对待分类的文本信息进行语义提取,得到所述文本信息的文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度;
基于多种所述第一类别对应的相似度,从多种所述第一类别中,确定所述文本信息所属的第一目标类别。
另一方面,提供了一种分类装置,所述装置包括:
获取模块,用于获取多种第一类别的类别语义特征,所述类别语义特征是对所述第一类别的类别信息进行语义提取得到的;
所述获取模块,还用于对待分类的文本信息进行语义提取,得到所述文本信息的文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度;
确定模块,用于基于多种所述第一类别对应的相似度,从多种所述第一类别中,确定所述文本信息所属的第一目标类别。
在一种可能实现方式中,每种所述第一类别为一种第二类别的子类别,至少两种所述第一类别所属的第二类别不同;所述装置还包括:
分类模块,用于基于多种所述第二类别,对所述文本语义特征进行分类,得到多种所述第二类别对应的类别标签,所述第二类别对应的类别标签指示所述文本信息属于所述第二类别的可能性;
所述确定模块,还用于基于多种所述第二类别对应的类别标签,从多种所述第二类别中,确定所述文本信息所属的第二目标类别。
在另一种可能实现方式中,每种所述第一类别为一种第二类别的子类别,所述确定模块,还用于将所述第一目标类别所属的第二类别,确定为所述文本信息所属的第二目标类别。
在另一种可能实现方式中,所述获取模块,用于基于分类模型,获取多种所述第一类别的类别语义特征;基于所述分类模型,对所述文本信息进行语义提取,得到所述文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度。
在另一种可能实现方式中,所述分类模型包括第一分类子模型及第二分类子模型;所述获取模块,包括:
获取单元,用于基于所述第一分类子模型,获取多种所述第一类别的类别语义特征;
提取单元,用于基于所述第二分类子模型,对所述文本信息进行语义提取,得到所述文本语义特征;
所述获取单元,还用于基于所述第一分类子模型,分别获取所述文本语义特征与每种所述类别语义特征之间的相似度。
在另一种可能实现方式中,每种所述第一类别为一种第二类别的子类别,至少两种所述第一类别所属的第二类别不同;所述装置还包括:
分类模块,用于基于所述第二分类子模型,对所述文本语义特征进行分类,得到多种所述第二类别对应的类别标签,所述第二类别对应的类别标签指示所述文本信息属于所述第二类别的可能性;
所述确定模块,用于基于多种所述第二类别对应的类别标签,从多种所述第二类别中,确定所述文本信息所属的第二目标类别。
在另一种可能实现方式中,所述装置还包括:
所述获取模块,还用于获取样本文本信息及对应的第一样本标签,所述第一样本标签指示所述样本文本信息所属的第一类别;
所述获取模块,还用于基于所述分类模型,获取多种所述第一类别的样本类别语义特征;
提取模块,用于基于所述分类模型,对所述样本文本信息进行语义提取,得到所述样本文本信息的样本文本语义特征,以及分别获取所述样本文本语义特征与每种所述样本类别语义特征之间的预测相似度;
训练模块,用于基于所述第一样本标签及多种所述第一类别对应的预测相似度,对所述分类模型进行训练。
在另一种可能实现方式中,每种所述第一类别为一种第二类别的子类别,至少两种所述第一类别所属的第二类别不同,所述获取模块,还用于获取所述样本文本信息对应的第二样本标签,所述第二样本标签指示所述样本文本信息所属的第二类别;
所述训练模块,包括:
分类单元,用于基于所述分类模型,对所述样本文本语义特征进行分类,得到多种所述第二类别对应的预测类别标签,所述第二类别对应的预测类别标签指示预测到所述样本文本信息属于所述第二类别的可能性;
训练单元,用于基于所述第一样本标签、多种所述第一类别对应的预测相似度、所述第二样本标签及多种所述第二类别对应的预测类别标签,对所述分类模型进行训练。
在另一种可能实现方式中,所述训练单元,用于基于所述第一样本标签及多种所述第一类别对应的预测相似度,确定第一损失值;基于所述第二样本标签及多种所述第二类别对应的预测类别标签,确定第二损失值;对所述第一损失值及第二损失值进行加权融合,得到第一损失和值;基于所述第一损失和值,对所述分类模型进行训练。
在另一种可能实现方式中,所述训练单元,用于基于所述第一样本标签及多种所述第一类别对应的预测相似度,确定所述样本文本信息所属的第一类别对应的目标预测相似度;基于所述第二样本标签及多种所述第二类别对应的预测类别标签,确定所述样本文本信息所属的第二类别对应的目标预测类别标签;基于所述第一样本标签、多种所述第一类别对应的预测相似度、所述第二样本标签、多种所述第二类别对应的预测类别标签、所述目标预测相似度及所述目标预测类别标签,对所述分类模型进行训练。
在另一种可能实现方式中,所述训练单元,用于基于所述第一样本标签及多种所述第一类别对应的预测相似度,确定第一损失值;基于所述第二样本标签及多种所述第二类别对应的预测类别标签,确定第二损失值;基于所述目标预测相似度及所述目标预测类别标签,确定第三损失值;对所述第一损失值、所述第二损失值及所述第三损失值进行加权融合,得到第二损失和值;基于所述第二损失和值,对所述分类模型进行训练。
在另一种可能实现方式中,所述文本信息用于描述多媒体资源,所述确定模块,还用于将所述文本信息所属的第一目标类别,确定为所述多媒体资源所属的类别。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的分类方法所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如上述方面所述的分类方法所执行的操作。
再一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述方面所述的分类方法所执行的操作。
本申请实施例提供的技术方案带来的有益效果至少包括:
本申请实施例提供的方法、装置、计算机设备及存储介质,在对文本信息进行分类时,引入了用于表示类别的类别信息,以每种类别信息的类别语义特征表征每种类别,将每种类别的类别语义特征与文本信息的文本语义特征进行相似度匹配,以得到的相似度来确定文本信息所属的类别,即在对文本信息进行分类过程中,丰富了分类时所用到的类别信息,并采用一种相似度匹配的方式进行分类,从而提升了分类准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的结构示意图;
图2是本申请实施例提供的一种分类方法的流程图;
图3是本申请实施例提供的一种分类方法的流程图;
图4是本申请实施例提供的一种获取文本信息的文本语义特征的流程图;
图5是本申请实施例提供的一种分类方法的流程图;
图6是本申请实施例提供的一种分类模型的结构示意图;
图7是本申请实施例提供的一种分类方法的流程图;
图8是本申请实施例提供的一种分类装置的结构示意图;
图9是本申请实施例提供的一种分类装置的结构示意图;
图10是本申请实施例提供的一种终端的结构示意图;
图11是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请所使用的术语“第一”、“第二”、“第三”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,可以将第一类别称为第二类别,且类似地,可将第二类别称为第一类别。
本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”,至少一个包括一个、两个或两个以上,多个包括两个或两个以上,而每个是指对应的多个中的每一个,任一是指多个中的任意一个。举例来说,多个第一类别包括3个第一类别,而每个是指这3个第一类别中的每一个第一类别,任一是指这3个第一类别中的任意一个第一类别,能够是第一个第一类别,或者,是第二个第一类别,或者,是第三个第一类别。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
本申请实施例提供的方案,基于人工智能的自然语言处理及机器学习,能够训练分类模型,利用训练后的分类模型,实现对文本信息的分类。
在一些实施例中,本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备能够组成区块链***。
本申请实施例提供的分类方法,能够由计算机设备执行。可选地,该计算机设备为终端或服务器。可选地,该服务器是独立的物理服务器,或者,是多个物理服务器构成的服务器集群或者分布式***,或者,是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电及车载终端等,但并不局限于此。
在一种可能实现方式中,该计算机设备提供为服务器。图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境包括终端101和服务器102。终端101和服务器102之间通过无线或者有线网络连接。
在一种可能实现方式中,该服务器102提供文本信息分享服务,该服务器102用于对文本信息进行分类,按照文本信息所属的类别,对文本信息进行分类管理。
终端101通过与服务器102交互,向服务器102发送信息查看请求,服务器102向终端101发送多个文本信息及每个文本信息所属的类别,终端101接收到该多种文本信息及每个文本信息所属的类别,按照多个文本信息所属的类别进行分类展示。
在一种可能实现方式中,终端101上安装由服务器102提供服务的目标应用,终端101能够通过该目标应用实现例如数据传输、消息交互等功能。可选地,目标应用为终端101操作***中的目标应用,或者为第三方提供的目标应用。例如,目标应用为视频分享应用,该视频分享应用具有视频分享的功能,当然,该视频分享应用还能够具有其他功能,例如,点评功能、购物功能、导航功能、游戏功能等。
服务器102用于对目标应用中多媒体资源的文本信息进行分类,确定每个文本信息所属的类别,将每个文本信息所属的类别确定为对应的多媒体资源所属的类别,基于多媒体资源所属的类别,对多媒体资源进行分类管理。终端101用于基于用户标识登录目标应用,通过目标应用向服务器102发送资源获取请求,服务器102接收该资源获取请求,基于该资源获取请求,向终端101发送多个多媒体资源及每个多媒体资源所属的类别,终端101接收多个多媒体资源及每个多媒体资源所属的类别,基于该目标应用及多个多媒体资源所属的类别,对多个多媒体资源进行分类展示。
图2是本申请实施例提供的一种分类方法的流程图,由计算机设备执行,如图2所示,该方法包括:
201、计算机设备获取多种第一类别的类别语义特征,类别语义特征是对第一类别的类别信息进行语义提取得到的。
其中,每种第一类别的类别信息用于描述对应的第一类别。例如,该类别信息为第一类别的类别名称,或者,为该第一类别的简介。每种第一类别的类别语义特征用于表征对应的类别信息,每种第一类别的类别信息用于描述对应的第一类别,则每种类别语义特征能够表征对应的第一类别。
202、计算机设备对待分类的文本信息进行语义提取,得到文本信息的文本语义特征,以及分别获取文本语义特征与每种类别语义特征之间的相似度。
其中,该文本信息为待分类的任意文本信息。例如,该文本信息是用于描述多媒体资源的信息,如该多媒体资源为视频,该文本信息包括该视频的标题或简介。再例如,该文本信息包括新闻所包含的内容。文本语义特征用于表征该文本信息,该文本语义特征能够表示出该文本信息所表达的含义。
文本语义特征与每种类别语义特征之间的相似度,表示出该文本语义特征与每种类别语义特征之间的相似程度,也能够表示出该文本信息属于每种类别语义特征对应的第一类别的可能性。对于任一种类别语义特征,该文本语义特征与该类别语义特征之间的相似度越大,则该文本信息属于该类别语义特征对应的第一类别的可能性越大;该文本语义特征与该类别语义特征之间的相似度越小,则该文本信息属于该类别语义特征对应的第一类别的可能性越小。
203、计算机设备基于多种第一类别对应的相似度,从多种第一类别中,确定文本信息所属的第一目标类别。
其中,该第一目标类别为多种第一类别中包含的类别。基于多种第一类别对应的相似度,从多种第一类别中,选取该文本信息所属的第一目标类别,该第一目标类别对应的相似度,大于多种第一类别中除第一目标类别外的其他第一类别对应的相似度。
本申请实施例提供的方法,在对文本信息进行分类时,引入了用于表示类别的类别信息,以每种类别信息的类别语义特征表征每种类别,将每种类别的类别语义特征与文本信息的文本语义特征进行相似度匹配,以得到的相似度来确定文本信息所属的类别,即在对文本信息进行分类过程中,丰富了分类时所用到的类别信息,并采用一种相似度匹配的方式进行分类,从而提升了分类准确性。
在图2所示实施例的基础上,划分了属于不同粒度级的类别,每种第一类别属于一种第二类别的子类别,在对文本信息进行分类时,还能够确定文本信息在不同粒度级上所属的类别,分类过程详见下述实施例。
图3是本申请实施例提供的一种分类方法的流程图,由计算机设备执行,如图3所示,该方法包括:
301、计算机设备获取多种第一类别的类别语义特征,类别语义特征是对第一类别的类别信息进行语义提取得到的。
在本申请实施例中,每种第一类别对应有类别信息,该类别信息用于描述对应的第一类别,不同的第一类别的类别信息不同。对每种第一类别的信息进行语义提取,得到每种第一类别的类别语义特征,即不同的第一类别的类别语义特征不同。该类别语义特征能够以任意的形式表示,例如,该类别语义特征以特征向量的形式表示,每种第一类别的类别语义特征的向量维度为d,该向量维度d的取值为200-500。
在一种可能实现方式中,多种第一类别的类别语义特征是在对文本信息分类时,基于多种第一类别的类别信息获取到的,则该步骤301包括:计算机设备获取多种第一类别的类别信息,分别对每种第一类别的类别信息进行语义提取,得到每种第一类别的类别语义特征。
在本申请实施例中,每次在对文本信息进行分类时,计算机设备获取多种第一类别的类别信息,并再获取每种第一类别的类别语义特征,以便后续基于多种类别语义特征对文本信息进行分类。
在一种可能实现方式中,该多种第一类别的类别语义特征是在对文本信息分类之前,基于多种第一类别的类别信息获取到的,则该步骤301包括:计算机设备从特征库中获取多种第一类别的类别语义特征。
在本申请实施例中,特征库用于存储第一类别的类别语义特征。在对文本信息进行分类之前,基于多种第一类别的类别信息,获取每种第一类别的类别语义特征,将多种第一类别的类别语义特征存储在该特征库中,以便后续在对任一文本信息进行分类时,直接从该特征库中获取多种类别语义特征即可,无需每次在对多种第一类别的类别信息进行语义提取。
302、计算机设备对待分类的文本信息进行语义提取,得到文本信息的文本语义特征。
其中,该文本语义特征能够以任意的形式表示,例如,该文本语义特征以特征向量的形式表示,如该文本语义特征为m维度的特征向量。
在一种可能实现方式中,采用分词处理的方式获取该文本信息的文本语义特征,也即是,该步骤302包括:计算机设备对该文本信息进行分词,得到该文本信息包含的多个词语,对该多个词语进行语义提取,得到每个词语的词语特征,基于该多个词语的词语特征,对每个词语的词语特征进行更新,将更新后的多个词语的词语特征,构成该文本信息的文本语义特征。
在本申请实施例中,采用分词处理的方式来获取每个词语的词语特征,并基于多个词语的词语特征,对每个词语的词语特征进行更新,以增强多个词语的词语特征之间的关联,从而保证由更新后的多个词语的词语特征构成的文本语义特征的准确性。
在一种可能实现方式中,采用逐字符进行特征提取的方式来获取文本信息的文本语义特征,也即是,该步骤302包括:计算机设备按照该文本信息包含的多个字符的排列顺序,对每个字符进行语义提取,得到每个字符的字符特征,基于该多个字符的字符特征,对每个字符特征进行更新,将更新后的每个字符的字符特征,构成该文本信息的文本语义特征。
在本申请实施例中,采用逐字符特征提取的方式,获取每个字符的字符特征,并基于多个字符的字符特征,对每个字符的字符特征进行更新,以增强多个字符的字符特征之间的关联,从而保证由更新后的多个字符的字符特征构成的文本语义特征的准确性。按照逐字符进行特征提取的方式来获取文本信息的文本语义特征,如图4所示,文本信息401包括起始字符、文本字符及终止字符,该起始字符指示文本信息的起始位置,该终止字符包括文本信息的终止位置,先获取每个字符的字符特征,之后,基于多个字符的字符特征,对每个字符的字符特征进行更新,以使更新后的每个字符的字符特征中融入了其他字符的字符特征,之后,将多个字符更新后的字符特征构成该文本信息401的文本语义特征402。
303、计算机设备获取文本语义特征与每种类别语义特征之间的相似度。
在本申请实施例中,在获取到文本信息的文本语义特征及每种第一类别的类别语义特征后,基于该文本语义特征及每种类别语义特征,即可分别获取该文本语义特征与每种类别语义特征之间的相似度。
在一种可能实现方式中,文本语义特征与类别语义特征均以特征向量的形式表示,该文本语义特征即为文本语义特征向量,该类别语义特征即为类别语义特征向量,则该步骤303包括以下两种方式:
第一种方式:计算机设备分别获取文本语义特征向量与每种类别语义特征向量的乘积,将多种类别语义特征向量对应的乘积,分别确定为文本语义特征向量与每种类别语义特征向量之间的相似度。
其中,对于任一种类别语义特征向量,将该文本语义特征向量与类别语义特征向量的数量积,确定为该文本语义特征向量与该类别语义特征向量之间的相似度,按照上述方式,获取文本语义特征向量与每种类别语义特征向量的数量积,即可得到文本语义特征向量与每种类别语义特征向量之间的相似度。
第二种方式:将多种类别语义特征向量构成特征矩阵,确定该文本语义特征向量与该特征矩阵的第一乘积,以及该文本语义特征向量的模和该特征矩阵的模,确定该文本语义特征向量的模与该特征矩阵的模的第二乘积,确定第一乘积与第二乘积之间的比值,将该比值中每个维度的数值,确定为对应的类别语义特征向量所对应的相似度。
其中,该比值包括多个维度的数值,该比值能够以向量的形式表示。该多个维度的数量与该多种类别语义特征向量的数量相同,即该多个维度的数量即为该多个第一类别的数量。在将多种类别语义特征向量构成特征矩阵后,按照该多种类别语义特征向量在特征矩阵中的位置,将比值中每个维度的数值,确定为对应的类别语义特征向量与文本语义特征向量之间的相似度,即可得到每种类别语义特征向量与文本语义特征向量之间的相似度。
可选地,该文本语义特征向量、特征矩阵及第一乘积与第二乘积之间的比值,满足以下关系:
Figure BDA0003282646870000121
其中,L1emb用于表示文本语义特征向量,f12-cls-emb用于表示特征矩阵,||L1emb||用于表示文本语义特征向量的模,||f12clsemb||用于表示特征矩阵的模,L1emb*f12-cls-emb用于表示第一乘积,||L1emb||*||f12clsemb||用于表示第二乘积,Logits用于表示第一乘积与第二乘积之间的比值。
304、计算机设备基于多种第一类别对应的相似度,从多种第一类别中,确定文本信息所属的第一目标类别。
在确定多种第一类别对应的相似度后,即确定了该文本信息属于每种第一类别的可能性。基于多种第一类别对应的相似度,即可从该多种第一类别中选取出该文本信息所属的第一目标类别,该第一目标类别对应的相似度,大于多种第一类别中除第一目标类别外的其他第一类别对应的相似度。
在一种可能实现方式中,该步骤304包括:基于多种第一类别对应的相似度,从多种第一类别中选取相似度最大的至少一种第一类别,确定为该文本信息所属的第一目标类别。
由于任一第一类别对应的相似度越大,表示该文本信息属于该第一类别的可能性越大,多种第一类别中相似度最大的至少一种第一类别,即为该文本信息属于该至少一种第一类别的可能性越大,因此,将该至少一种第一类别确定为文本信息所属的第一目标类别。
305、计算机设备基于多种第二类别,对文本语义特征进行分类,得到多种第二类别对应的类别标签。
在本申请实施例中,每种第一类别为一种第二类别的子类别,至少两种第一类别所属的第二类别不同,即该多种第一所属的第二类别包括多种。第一类别与第二类别粒度级不同,第二类别为粗粒度类别,第一类别为细粒度类别。例如,任一第二类别为游戏,属于该第二类别的多种第一类别包括小游戏、端游、手游等。再例如,任一第二类别为舞蹈,属于该第二类别的多种第一类别包括广场舞、交际舞、街舞等。任一种第二类别对应的类别标签指示文本信息属于该第二类别的可能性,该类别标签能够以任意的形式表示,例如,该类别标签以数值的形式表示,该数值相当于文本信息属于第二类别的概率。
由于该文本语义特征能够表征该文本信息,能够体现出该文本信息所表达的含义,因此,基于该多种第二类别,对该文本语义特征进行分类,以确定该文本语义特征属于每种第二类别的可能性,即得到该多种第二类别对应的类别标签。
在一种可能实现方式中,该步骤305包括:计算机设备基于多种第二类别,对该文本语义特征进行特征变换,得到类别标签特征。
其中,该类别标签特征包括多个维度的类别标签,每个维度与一种第二类别对应,该多个维度的数量与该多种第二类别的数量相等。基于该类别标签向量包含的多个维度的类别标签,即可确定每种第二类别对应的类别标签。
例如,该文本语义特征以向量的形式表示,该文本语义特征也即是文本语义特征向量,该类别标签特征也以向量的形式表示,该类别标签特征也即是类别标签特征向量,通过对文本语义特征向量进行特征变换,得到该类别标签特征向量,该类别标签特征向量中每个维度的值即为一种第二类别对应的类别标签。
306、计算机设备基于多种第二类别对应的类别标签,从多种第二类别中,确定文本信息所属的第二目标类别。
其中,第二目标类别为多种第二类别中包含的类别。在确定多种第二类别对应的类别标签后,即可确定该文本信息属于每种第二类别的可能性,基于该多种第二类别对应的类别标签,从该多种第二类别中确定该文本信息所属的第二目标类别,该文本信息属于该第二目标类别的可能性,大该文本信息属于多种第二类别中除第二目标类别外的其他第二类别的可能性。
在一种可能实现方式中,该步骤306包括:基于多种第二类别对应的类别标签,从多种第二类别中选取可能性最大的至少一个第二类别,确定为文本信息所属的第二目标类别。
由于任一第二类别对应类别标签所指示的可能度越大,表示该文本信息属于该第二类别的可能性越大,因此,将多种第二类别中可能性最大的至少一种第二类别,确定为文本信息所属的第二目标类别。
在一种可能实现方式中,第一目标类别为第二目标类别的子类别。
例如,该文本信息为视频的视频标题,该文本信息所属的第一目标类别和第二目标类别如表1所示。
表1
视频标题 第二目标类别 第一目标类别
视频标题1 游戏 小游戏
视频标题2 舞蹈 广场舞
视频标题3 游戏 手游
视频标题4 科技 手机
需要说明的是,本申请实施例仅是以先执行步骤303-304,再执行步骤305-306为例进行说明的,而在另一实施例中,在步骤302之后,能够先执行步骤305-306,再执行步骤303-304,或者,在执行步骤303-304的情况下,同步执行步骤305-306,本申请对执行步骤的顺序不做限定。
需要说明的是,本申请实施例是以对文本信息的文本语义特征进行分类的方式,来确定文本信息所属的第二目标类别的,而在另一实施例中,无需执行步骤305-306,能够采取其他方式确定文本信息所属的第二目标类别。
在一种可能实现方式中,确定文本信息所属的第二目标类别的过程包括:将第一目标类别所属的第二类别,确定为文本信息所属的第二目标类别。
在本申请实施例中,每种第一类别为一种第二类别的子类别,文本信息属于第一目标类别,则该第一目标类别所属的第二类别也是该文本信息所属的类别,因此,将该第一目标类别所属的第二类别确定为文本信息所属的第二目标类别。
可选地,确定该第一目标类别所属的第二类别的过程包括:基于该第一目标类别,查询第一类别与第二类别之间的从属关系,确定该第一目标类别所属的第二类别。
其中,第一类别与第二类别之间的从属关系包括多种第一类别及每种第一类别所属的第二类别。该第一目标类别为一种第一类别,基于该第一目标类别,查询该从属关系,即可确定该第一目标类别所属的第二类别。
需要说明的是,本申请实施例中的文本信息为待分类的任意文本信息,在一种可能实现方式中,该文本信息用于描述多媒体资源,也即是,该文本信息为多媒体资源的文本信息,则在步骤306之后,该方法还包括:将文本信息所属的第一目标类别和第二目标类别,确定为多媒体资源所属的类别。
本申请实施例通过对多媒体资源的文本信息进行分类,以此来确定多媒体资源的类别,实现了一种对多媒体资源分类的方式,由于该文本信息能够代表多媒体资源包含的内容,因此,基于该文本信息对多媒体资源进行分类,也保证了分类的准确性。
本申请实施例提供的方法,在对文本信息进行分类时,引入了用于表示类别的类别信息,以每种类别信息的类别语义特征表征每种类别,将每种类别的类别语义特征与文本信息的文本语义特征进行相似度匹配,以得到的相似度来确定文本信息所属的类别,即在对文本信息进行分类过程中,丰富了分类时所用到的类别信息,并采用一种相似度匹配的方式进行分类,从而提升了分类准确性。
并且,划分了属于不同粒度级的类别,通过确定文本信息在多种粒度级上所属的类别,以丰富文本信息所属的类别,从而保证分类的准确性。
在图2所示实施例的基础上,划分了属于不同粒度级的类别,每种第一类别属于一种第二类别的子类别,还能够基于分类模型来确定文本信息在不同粒度级上所属的类别,分类过程详见下述实施例。
图5是本申请实施例提供的一种分类方法的流程图,由计算机设备执行,如图5所示,该方法包括:
501、计算机设备基于分类模型中的第二分类子模型,对文本信息进行语义提取,得到文本语义特征。
在本申请实施例中,分类模型用于对文本信息进行分类,该分类模型对应有多种第一类别及多种第二类别,每种第一类别为一种第二类别的子类别,至少两种第一类别所属的第二类别不同。该分类模型包括第一分类子模型及第二分类子模型,该第一分类子模型用于将文本信息划分至第一类别,该第二分类子模型用于将文本信息划分至第二类别。
在一种可能实现方式中,该第一分类子模型包括第一编码层及第一归一化层,第二分类子模型包括第二编码层及第二归一化层。
其中,第一编码层和第二编码层均能够为任意的编码器,例如,第一编码器为CNN(Convolutional Neural Networks,卷积神经网络)、LSTM(Long Short TermMemory,长短期记忆网络)、LSTMAttention(Long Short TermMemoryAttention,注意力机制的长短期记忆网络)等,第二编码器为BERT(Bidirectional Encoder Representations fromTransformers,双向编码器网络)。第一归一化层和第二归一化层用于对特征进行转化,第一归一化层和第二归一化层能够为任意的网络,例如,第一归一化层和第二归一化层均为Softmax(逻辑回归)。
在一种可能实现方式中,该步骤501包括:基于该第二分类子模型中的第二编码层,对该文本信息进行语义提取,得到该文本语义特征。
可选地,该文本信息及该文本语义特征满足以下关系:
embed=Bert(text)
其中,embed用于表示文本语义特征,Bert(·)用于表示第二编码层,text用于表示文本信息。
该步骤501与上述步骤302同理,在此不再赘述。
502、计算机设备基于第二分类子模型,对文本语义特征进行分类,得到多种第二类别对应的类别标签,第二类别对应的类别标签指示文本信息属于第二类别的可能性。
在一种可能实现方式中,该第二分类子模型包括第二归一化层,该步骤502包括:基于该第二分类子模型中的第二归一化层,对该文本语义特征进行分类,得到多种第二类别对应的类别标签。
可选地,多种第二类别对应的类别标签构成类别标签向量,则类别标签向量及文本语义特征,满足以下关系:
Logits1=Classify1(embed)
其中,Logits1用于表示类别标签向量,Classify1(·)用于表示第二归一化层,embed用于表示文本语义特征。
该步骤502与上述步骤305同理在此不再赘述。
503、计算机设备基于多种第二类别对应的类别标签,从多种第二类别中,确定文本信息所属的第二目标类别。
在一种可能实现方式中,该步骤503包括:计算机设备基于第二分类子模型及多种第二类别对应的类别标签,从多种第二类别中,确定文本信息所属的第二目标类别。
需要说明的是,本申请实施例中,基于第二分类子模型得到多种第二类别对应的类别标签后,还能够基于该第二分类子模型,从多种第二类别中确定文本信息所属的第二目标类别。而在另一实施例中,能够无需基于该第二分类子模型,能够采取其他方式,基于多种第二类别对应的类别标签,从多种第二类别中,确定文本信息所属的第二目标类别,本申请对此不作限定。
该步骤503与上述步骤306同理,在此不再赘述。
504、计算机设备基于分类模型中的第一分类子模型,获取多种第一类别的类别语义特征。
在一种可能实现方式中,该步骤504包括:计算机设备获取多种第一类别的类别信息,基于第一分类子模型,分别对每种第一类别的类别信息进行语义提取,得到每种第一类别的类别语义特征。
在一种可能实现方式中,第一分类子模型包括多种第一类别的类别语义特征。
该步骤504与上述步骤301同理,在此不再赘述。
505、计算机设备基于第一分类子模型,分别获取文本语义特征与每种类别语义特征之间的相似度。
其中,该文本语义特征是基于第二分类子模型提取到的。在本申请实施例中,基于第二分类子模型获取到文本信息的文本语义特征后,基于该第二分类子模型对该文本语义特征进行分类,还能够将该文本特征传输至第一分类子模型,基于该第一分类子模型获取文本语义特征与每种类别语义特征之间的相似度。
该步骤505与上述步骤303同理,在此不再赘述。
506、计算机设备基于多种第一类别对应的相似度,从多种第一类别中,确定文本信息所属的第一目标类别。
在一种可能实现方式中,该步骤506包括:计算机设备基于该第一分类子模型及多种第一类别对应的相似度,从多种第一类别中,确定文本信息所属的第一目标类别。
需要说明的是,本申请实施例中,基于第一分类子模型得到多种第一类别对应的相似度后,还能够基于该第一分类子模型,从多种第一类别中确定文本信息所属的第一目标类别。而在另一实施例中,能够无需基于该第一分类子模型,能够采取其他方式,基于多种第一类别对应的相似度,从多种第一类别中,确定文本信息所属的第一目标类别,本申请对此不作限定。
该步骤506与上述步骤304同理,在此不再赘述。
需要说明的是,本申请实施例是以先执行步骤501-503,再执行步骤504-505为例进行说明的,在另一实施例中,能够先执行步骤504,再执行步骤501,之后执行步骤505,及步骤502-503,本申请对执行步骤的顺序不做限定。
需要说明的是,本申请实施例是以分类模型包括第一分类子模型及第二分类子模型为例进行说明的,而在另一实施例中,能够无需区分第一分类子模型及第二分类子模型,将分类模型代替上述的第一分类子模型和第二分类子模型,直接基于分类模型,按照上述步骤501-505来获取文本信息所属的第一目标类别和第二目标类别。
需要说明的是,本申请实施例是基于第一分类子模型及第二分类子模型,对文本信息进行分类,确定文本信息在不同粒度级上所属的类别的,而在另一实施例中,无需执行上述步骤502-503,且能够无需区分第一分类子模型及第二分类子模型,将分类模型代替上述的第一分类子模型和第二分类子模型,直接基于分类模型,按照上述步骤501、504-506,确定文本信息所属的第一目标类别。
需要说明的是,本申请实施例是分别确定文本信息所属的第一目标类别及第二目标类别的,而在另一实施例中,在确定文本信息所属的第二目标类别后,确定该第二目标类别对应的多个子类别,即确定该第二目标类别对应的多个第一类别,之后按照步骤504-506,从该第二目标类别对应的多个第一类别中,确定文本信息所属的第一目标类别,此过程无需涉及其他第二类别的子类别。
本申请实施例提供的方法,在对文本信息进行分类时,引入了用于表示类别的类别信息,以每种类别信息的类别语义特征表征每种类别,将每种类别的类别语义特征与文本信息的文本语义特征进行相似度匹配,以得到的相似度来确定文本信息所属的类别,即在对文本信息进行分类过程中,丰富了分类时所用到的类别信息,并采用一种相似度匹配的方式进行分类,从而提升了分类准确性。
并且,提供了一种基于相似度匹配机制的层次分类模型,基于该分类模型对文本信息进行分类,得到文本信息在多种不同粒度级上所属的类别,从而保证了分类的准确性。
基于上述图5所示的实施例,本申请提供了一种分类模型的结构示意图,如图6所示,该分类模型包括第一分类子模型601及第二分类子模型602,该第一分类子模型601包括第一编码层、匹配层及第一归一化层,第二分类子模型602包括第二编码层及第二归一化层,基于该分类模型对文本信息进行分类的过程如图5所示;
基于第二编码层对文本信息进行语义提取,得到该文本信息的文本语义特征,基于该第二归一化层,对该文本语义特征进行分类,得到每种第二类别对应的类别标签,基于多种第二类别对应的类别标签,确定该文本信息所属的第二目标类别。
基于第一编码层,对每种第一类别的类别信息进行语义提取,得到每种第一类别的类别语义特征;基于匹配层、每种第一类别的类别语义特征及文本语义特征,获取该文本语义特征与每种类别语义特征之间的相似度,基于第二归一化层,多种第一类别对应的相似度进行归一化处理,得到文本信息属于每种第一类别的概率,基于多种第一类别对应的概率,从多种第一类别中确定文本信息所属的第一目标类别。
基于上述图3或图6所示的实施例,应用于视频分类场景下,提供了一种视频分类的流程,该流程包括:
步骤1、获取多个视频的文本信息,该文本信息包括视频标题。
由于视频标题最能代表视频所包含的内容,因此,按照视频的文本信息对视频进行分类。
步骤2、按照上述图3或图6所示的实施例,对每个视频的文本信息进行分类,得到每个视频的文本信息所属的类别。
步骤3、将每个视频的文本信息所属的类别,确定为每个视频所属的类别,基于多个视频所属的类别,对该多个视频进行分类存储。
基于上述图3或图6所示的实施例,应用于电商场景下,提供了一种物品分类的流程,该流程包括:
步骤1、商家通过商家终端安装的电商应用,向电商服务器发送待上架物品的物品信息。
其中,该电商服务器为该电商应用提供服务。物品的物品信息包括物品的图像及物品的文本信息,该文本信息包括物品的标题及简介。
步骤2、电商服务器接收该物品信息,基于上述图3或图6所示的实施例,确定该物品的文本信息所属的类别,将该类别确定为该物品信息所属的类别,按照该类别,对该物品信息进行分类存储。
步骤3、用户通过用户终端安装的电商应用查看任一类别的物品时,向电商服务器发送物品获取请求,该物品获取请求携带类别,电商服务器接收该物品获取请求,查询属于物品获取请求携带的类别的物品信息,向该用户终端发送查询到的物品信息。
步骤4、用户终端接收电商服务器发送的物品信息,显示属于该类别的物品信息供用户查询。
需要说明的是,本申请仅是以视频分类场景及电商场景为例来进行说明的,而在另一实施例中,本申请所提供的分类方法,还能够应用于其他多种场景,如搜索场景、医疗场景等。在搜索场景下,基于本申请实施例提供的方法,能够实现对搜索内容的分类;在医疗场景下,基于本申请实施例提供的方法,能够实现对病历进行分类,实现对病历分类管理。
在图5所示实施例的基础上,基于分类模型获取文本信息所属的第一目标类别和第二目标类别之前,还需要对分类模型进行训练,训练分类模型的过程详见下述实施例。
图7是本申请实施例提供的一种分类方法的流程图,由计算机设备执行,如图7所示,该方法包括:
701、计算机设备获取样本文本信息及对应的第一样本标签和第二样本标签,第一样本标签指示样本文本信息所属的第一类别,第二样本标签指示样本文本信息所属的第二类别。
其中,该样本文本信息为任意的文本信息。第一样本标签指示样本文本信息所属的第一类别,第二样本标签指示样本文本信息所属的第二类别。例如,该样本文本信息用于描述游戏的内容,第一样本标签指示该样本文本信息属于游戏类别,第二样本标签指示样本文本信息属于该游戏类别的子类别,即小游戏类别。
702、计算机设备基于分类模型,获取多种第一类别的样本类别语义特征。
其中,该样本类别语义特征用于表示该第一类别,该分类模型为待训练的分类模型,基于该分类模型获取到的样本类别语义特征可能不准确。
在一种可能实现方式中,该步骤702包括:计算机设备获取多种第一类别的类别信息,基于分类模型,分别对每种第一类别的类别信息进行语义提取,得到每种第一类别的样本类别语义特征。
该步骤702与上述步骤301同理,在此不再赘述。
703、计算机设备基于分类模型,对样本文本信息进行语义提取,得到样本文本信息的样本文本语义特征,以及分别获取样本文本语义特征与每种样本类别语义特征之间的预测相似度。
其中,该预测相似度是基于该分类模型得到的,该分类模型为待训练的模型,该预测相似度能够反映出分类模型的准确性。
该步骤703与上述步骤302-303同理,在此不再赘述。
704、计算机设备基于分类模型,对样本文本语义特征进行分类,得到多种第二类别对应的预测类别标签,第二类别对应的预测类别标签指示预测到样本文本信息属于第二类别的可能性。
其中,预测类别标签是基于分类模型得到的,该分类模型为待训练的模型,该预测类别标签能够反映出分类模型的准确性。
该步骤704与上述步骤305同理,在此不再赘述。
705、计算机设备基于第一样本标签、多种第一类别对应的预测相似度、第二样本标签及多种第二类别对应的预测类别标签,对分类模型进行训练。
由于第一样本标签指示该样本文本信息所属的第一类别,多种第一类别对应的预测相似度是基于分类模型得到的,基于该第一样本标签及多种第一类别对应的预测相似度能够反映出该分类模型的准确性。由于第二样本标签指示该样本文本信息所属的第二类别,多种第二类别对应的预测相似度是基于分类模型得到的,基于该第二样本标签及多种第二类别对应的预测类别标签能够反映出该分类模型的准确性。因此,基于第一样本标签、多种第一类别对应的预测相似度、第二样本标签及多种第二类别对应的预测类别标签,对分类模型进行训练,以提升分类模型的准确性。
在一种可能实现方式中,该步骤705包括:基于第一样本标签及多种第一类别对应的预测相似度,确定第一损失值,基于第二样本标签及多种第二类别对应的预测类别标签,确定第二损失值,对第一损失值及第二损失值进行加权融合,得到第一损失和值,基于第一损失和值,对分类模型进行训练。
其中,第一损失值能够反映出样本文本信息真实所属的第一类别,与基于模型预测到样本文本信息所属的第一类别之间的差异。第二损失值能够反映出样本文本信息真实所属的第二类别,与基于模型预测到样本文本信息所属的第二类别之间的差异。该第一损失值及第二损失值均能够反映出分类模型的准确度,通过对第一损失值及第二损失值进行加权融合,以调整不同损失对分类模型的影响程度,基于加权融合得到的第一损失和值,对分类模型进行训练,以提升分类模型的准确性。
可选地,确定第一损失值的过程包括:基于该第一样本标签,确定每种第一类别对应的真实相似度,基于多种第一类别对应的真实相似度及多种第一类别对应的预测相似度之间的差异,确定第一损失值。
对于任一种第一类别对应的真实相似度和预测相似度,该真实相似度与该预测相似度之间的差异,能够反映出分类模型的准确性,基于多种第一类别对应的真实相似度及多种第一类别对应的预测相似度之间的差异,确定第一损失值,以便后续基于该第一损失值提升分类模型的准确性。
例如,基于该第一样本标签,确定样本文本信息所属的第一类别的真实相似度为1,其他的第一类别的真实相似度为0。
可选地,多种第一类别对应的真实相似度、多种第一类别对应的预测相似度及第一损失值,满足以下关系:
Figure BDA0003282646870000221
其中,Losscls1为第一损失值,i用于表示多种第一类别的序号,n用于表示多种第一类别的总数目,yi用于表示第i中第一类别对应的真实相似度,ai用于表示第i中第一类别对应的预测相似度。
可选地,确定第二损失值的过程包括:基于第二样本标签,确定每种第二类别对应的真实类别标签,基于多种第二类别对应的真实类别标签及多种第二类别对应的预测类别标签之间的差异,确定第二损失值。
其中,真实类别标签及预测类别标签均能够以任意形式表示,例如,真实类别标签及预测类别标签均以数值形式标识,基于第二样本标签,确定样本文本信息所属的第二类别的真实类别标签为1,其他的第二类别的真实类别标签为0。
对于任一种第二类别对应的真实类别标签和预测类别标签,该真实类别标签与该预测类别标签之间的差异,能够反映出分类模型的准确性,基于多种第二类别对应的真实类别标签及多种第二类别对应的预测类别标签之间的差异,确定第二损失值,以便后续基于该第二损失值提升分类模型的准确性。
可选地,多种第二类别对应的真实类别标签、多种第二类别对应的预测类别标签及第二损失值,满足以下关系:
Figure BDA0003282646870000231
其中,Losscls2为第二损失值,j用于表示多种第二类别的序号,m用于表示多种第二类别的总数目,yj用于表示第j中第二类别对应的真实类别标签,aj用于表示第j中第二类别对应的预测类别标签。
在一种可能实现方式中,该步骤705包括:基于第一样本标签及多种第一类别对应的预测相似度,确定样本文本信息所属的第一类别对应的目标预测相似度,基于第二样本标签及多种第二类别对应的预测类别标签,确定样本文本信息所属的第二类别对应的目标预测类别标签,基于第一样本标签、多种第一类别对应的预测相似度、第二样本标签、多种第二类别对应的预测类别标签、目标预测相似度及目标预测类别标签,对分类模型进行训练。
由于第一样本标签指示样本文本信息所属的第一类别,第二样本标签指示样本文本信息所属的第二类别,在得到多种第一类别对应的预测相似度及多种第二类别对应的预测类别标签后,基于该第一样本标签及多种第一类别对应的预测相似度,即可从多种第一类别对应的预测相似度中,确定出样本文本信息所属的第一类别对应的目标预测相似度,基于第二样本标签及多种第二类别对应的预测类别标签,即可从多种第二类别对应的预测类别标签中,确定出样本文本信息所属的第二类别对应的目标预测类别标签。
在本申请实施例中,对于任一文本信息,该文本信息属于第二类别的概率大于该文本信息属于该第二类别的子类别的第一类别,因此,基于目标预测相似度及目标预测类别标签,来训练分类模型,实现了以不同粒度级的类别上下级关系的约束,来提升分类模型的准确性的方式,从而保证了分类模型的准确性。
可选地,基于第一样本标签、多种第一类别对应的预测相似度、第二样本标签、多种第二类别对应的预测类别标签、目标预测相似度及目标预测类别标签,对分类模型进行训练,包括:基于第一样本标签及多种第一类别对应的预测相似度,确定第一损失值,基于第二样本标签及多种第二类别对应的预测类别标签,确定第二损失值,基于目标预测相似度及目标预测类别标签,确定第三损失值,对第一损失值、第二损失值及第三损失值进行加权融合,得到第二损失和值,基于第二损失和值,对分类模型进行训练。
其中,第三损失值表示样本文本信息在不同粒度级上所属的类别的预测值之间的差异,能够反映出分类模型的准确度。
由于该第一损失值、第二损失值及第三损失值均能够反映出分类模型的准确度,通过对第一损失值、第二损失值及第三损失值进行加权融合,以调整不同损失对分类模型的影响程度,基于加权融合得到的第二损失和值,对分类模型进行训练,以提升分类模型的准确性。
可选地,确定第三损失值的方式包括:目标预测相似度与目标预测类别标签之间的差异,确定第三损失值。
可选地,目标预测相似度、目标预测类别标签及第三损失值,满足以下关系:
Figure BDA0003282646870000241
其中,Lossh为第三损失值,i用于表示多种第一类别的序号,n用于表示多种第一类别的总数目,L2_Score用于表示目标预测相似度,L1_Score用于表示目标预测类别标签,λ为调和超参数,调和超参数λ为常数。
可选地,第一损失值、第二损失值、第三损失值及第二损失和值,满足以下关系:
Loss=λ1Losscls12Losscls2aLossh
其中,Loss为第二损失和值,Losscls1为第一损失值,Losscls2为第二损失值,Lossh为第三损失值,λ1、λ2及λ3分别为第一损失值、第二损失值及第三损失值的调和差参数,均为常数。
需要说明的是,本申请实施例是以对分类模型的一次迭代训练为例,对分类模型的训练过程进行说明的,而在另一实施例中,能够按照上述步骤701-705,对分类模型进行多次迭代。在一种可能实现方式中,在迭代轮次大于轮次阈值的情况下,停止训练分类模型;或者,在当前迭代轮次的损失和值小于损失阈值,停止训练分类模型。其中,轮次阈值及损失阈值均为任意的数值。
需要说明的是,本申请实施例是基于第一样本标签、多种第一类别对应的预测相似度、第二样本标签及多种第二类别对应的预测类别标签,对分类模型进行训练的,而在另一实施例中,无需执行步骤701、704-705,能够采取其他方式,获取样本文本信息及对应的第一样本标签,基于第一样本标签及多种第一类别对应的预测相似度,对分类模型进行训练。
本申请实施例提供的方法,提供了一种基于似度匹配机制的层次分类模型,该分类模型能够对文本信息实现不同粒度级类别的分类,通过引入用于表示类别的样本类别语义特征,并结合基于分类模型进行多个粒度级分类的方式,对分类模型进行训练,丰富了训练分类模型的信息,提升了分类模型的准确性。
并且,由于文本信息属于上层粒度级的类别的概率大于该文本信息属于下层粒度级的类别的概率,即文本信息在不同粒度级上所属的类别之间具有约束关系,因此,在训练分类模型时,引入了不同粒度级类别之间的上下层约束关系,以此来提升分类模型的准确性。
图8是本申请实施例提供的一种分类装置的结构示意图,如图8所示,该装置包括:
获取模块801,用于获取多种第一类别的类别语义特征,类别语义特征是对第一类别的类别信息进行语义提取得到的;
获取模块801,还用于对待分类的文本信息进行语义提取,得到文本信息的文本语义特征,以及分别获取文本语义特征与每种类别语义特征之间的相似度;
确定模块802,用于基于多种第一类别对应的相似度,从多种第一类别中,确定文本信息所属的第一目标类别。
在一种可能实现方式中,每种第一类别为一种第二类别的子类别,至少两种第一类别所属的第二类别不同;如图9所示,装置还包括:
分类模块803,用于基于多种第二类别,对文本语义特征进行分类,得到多种第二类别对应的类别标签,第二类别对应的类别标签指示文本信息属于第二类别的可能性;
确定模块802,还用于基于多种第二类别对应的类别标签,从多种第二类别中,确定文本信息所属的第二目标类别。
在另一种可能实现方式中,每种第一类别为一种第二类别的子类别,确定模块802,还用于将第一目标类别所属的第二类别,确定为文本信息所属的第二目标类别。
在另一种可能实现方式中,获取模块801,用于基于分类模型,获取多种第一类别的类别语义特征;基于分类模型,对文本信息进行语义提取,得到文本语义特征,以及分别获取文本语义特征与每种类别语义特征之间的相似度。
在另一种可能实现方式中,分类模型包括第一分类子模型及第二分类子模型;如图9所示,获取模块801,包括:
获取单元8011,用于基于第一分类子模型,获取多种第一类别的类别语义特征;
提取单元8012,用于基于第二分类子模型,对文本信息进行语义提取,得到文本语义特征;
获取单元8011,还用于基于第一分类子模型,分别获取文本语义特征与每种类别语义特征之间的相似度。
在另一种可能实现方式中,每种第一类别为一种第二类别的子类别,至少两种第一类别所属的第二类别不同;如图9所示,装置还包括:
分类模块803,用于基于第二分类子模型,对文本语义特征进行分类,得到多种第二类别对应的类别标签,第二类别对应的类别标签指示文本信息属于第二类别的可能性;
确定模块802,用于基于多种第二类别对应的类别标签,从多种第二类别中,确定文本信息所属的第二目标类别。
在另一种可能实现方式中,如图9所示,装置还包括:
获取模块801,还用于获取样本文本信息及对应的第一样本标签,第一样本标签指示样本文本信息所属的第一类别;
获取模块801,还用于基于分类模型,获取多种第一类别的样本类别语义特征;
提取模块804,用于基于分类模型,对样本文本信息进行语义提取,得到样本文本信息的样本文本语义特征,以及分别获取样本文本语义特征与每种样本类别语义特征之间的预测相似度;
训练模块805,用于基于第一样本标签及多种第一类别对应的预测相似度,对分类模型进行训练。
在另一种可能实现方式中,每种第一类别为一种第二类别的子类别,至少两种第一类别所属的第二类别不同,获取模块801,还用于获取样本文本信息对应的第二样本标签,第二样本标签指示样本文本信息所属的第二类别;
如图9所示,训练模块805,包括:
分类单元8051,用于基于分类模型,对样本文本语义特征进行分类,得到多种第二类别对应的预测类别标签,第二类别对应的预测类别标签指示预测到样本文本信息属于第二类别的可能性;
训练单元8052,用于基于第一样本标签、多种第一类别对应的预测相似度、第二样本标签及多种第二类别对应的预测类别标签,对分类模型进行训练。
在另一种可能实现方式中,训练单元8052,用于基于第一样本标签及多种第一类别对应的预测相似度,确定第一损失值;基于第二样本标签及多种第二类别对应的预测类别标签,确定第二损失值;对第一损失值及第二损失值进行加权融合,得到第一损失和值;基于第一损失和值,对分类模型进行训练。
在另一种可能实现方式中,训练单元8052,用于基于第一样本标签及多种第一类别对应的预测相似度,确定样本文本信息所属的第一类别对应的目标预测相似度;基于第二样本标签及多种第二类别对应的预测类别标签,确定样本文本信息所属的第二类别对应的目标预测类别标签;基于第一样本标签、多种第一类别对应的预测相似度、第二样本标签、多种第二类别对应的预测类别标签、目标预测相似度及目标预测类别标签,对分类模型进行训练。
在另一种可能实现方式中,训练单元8052,用于基于第一样本标签及多种第一类别对应的预测相似度,确定第一损失值;基于第二样本标签及多种第二类别对应的预测类别标签,确定第二损失值;基于目标预测相似度及目标预测类别标签,确定第三损失值;对第一损失值、第二损失值及第三损失值进行加权融合,得到第二损失和值;基于第二损失和值,对分类模型进行训练。
在另一种可能实现方式中,文本信息用于描述多媒体资源,确定模块802,还用于将文本信息所属的第一目标类别,确定为多媒体资源所属的类别。
需要说明的是:上述实施例提供的分类装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的分类装置与分类方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的分类方法所执行的操作。
可选地,计算机设备提供为终端。图10示出了本申请一个示例性实施例提供的终端1000的结构框图。该终端1000可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1000还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
终端1000包括有:处理器1001和存储器1002。
处理器1001可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1001可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1001可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1001还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1002可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1002中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器1001所执行以实现本申请中方法实施例提供的分类方法。
在一些实施例中,终端1000还可选包括有:***设备接口1003和至少一个***设备。处理器1001、存储器1002和***设备接口1003之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1003相连。具体地,***设备包括:射频电路1004、显示屏1005、摄像头组件1006、音频电路1007、定位组件1008和电源1009中的至少一种。
***设备接口1003可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器1001和存储器1002。在一些实施例中,处理器1001、存储器1002和***设备接口1003被集成在同一芯片或电路板上;在一些其他实施例中,处理器1001、存储器1002和***设备接口1003中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1004用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1004将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1004包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1004可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1004还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1005用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1005是触摸显示屏时,显示屏1005还具有采集在显示屏1005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1001进行处理。此时,显示屏1005还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1005可以为一个,设置在终端1000的前面板;在另一些实施例中,显示屏1005可以为至少两个,分别设置在终端1000的不同表面或呈折叠设计;在另一些实施例中,显示屏1005可以是柔性显示屏,设置在终端1000的弯曲表面上或折叠面上。甚至,显示屏1005还可以设置成非矩形的不规则图形,也即异形屏。显示屏1005可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
摄像头组件1006用于采集图像或视频。可选地,摄像头组件1006包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1006还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1001进行处理,或者输入至射频电路1004以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1000的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1001或射频电路1004的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1007还可以包括耳机插孔。
定位组件1008用于定位终端1000的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1008可以是基于美国的GPS(GlobalPositioning System,全球定位***)、中国的北斗***或俄罗斯的伽利略***的定位组件。
电源1009用于为终端1000中的各个组件进行供电。电源1009可以是交流电、直流电、一次性电池或可充电电池。当电源1009包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1000还包括有一个或多个传感器1010。该一个或多个传感器1010包括但不限于:加速度传感器1011、陀螺仪传感器1012、压力传感器1013、指纹传感器1014、光学传感器1015以及接近传感器1016。
加速度传感器1011可以检测以终端1000建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1011可以用于检测重力加速度在三个坐标轴上的分量。处理器1001可以根据加速度传感器1011采集的重力加速度信号,控制显示屏1005以横向视图或纵向视图进行用户界面的显示。加速度传感器1011还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1012可以检测终端1000的机体方向及转动角度,陀螺仪传感器1012可以与加速度传感器1011协同采集用户对终端1000的3D动作。处理器1001根据陀螺仪传感器1012采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1013可以设置在终端1000的侧边框和/或显示屏1005的下层。当压力传感器1013设置在终端1000的侧边框时,可以检测用户对终端1000的握持信号,由处理器1001根据压力传感器1013采集的握持信号进行左右手识别或快捷操作。当压力传感器1013设置在显示屏1005的下层时,由处理器1001根据用户对显示屏1005的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1014用于采集用户的指纹,由处理器1001根据指纹传感器1014采集到的指纹识别用户的身份,或者,由指纹传感器1014根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1001授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1014可以被设置在终端1000的正面、背面或侧面。当终端1000上设置有物理按键或厂商Logo时,指纹传感器1014可以与物理按键或厂商Logo集成在一起。
光学传感器1015用于采集环境光强度。在一个实施例中,处理器1001可以根据光学传感器1015采集的环境光强度,控制显示屏1005的显示亮度。具体地,当环境光强度较高时,调高显示屏1005的显示亮度;当环境光强度较低时,调低显示屏1005的显示亮度。在另一个实施例中,处理器1001还可以根据光学传感器1015采集的环境光强度,动态调整摄像头组件1006的拍摄参数。
接近传感器1016,也称距离传感器,设置在终端1000的前面板。接近传感器1016用于采集用户与终端1000的正面之间的距离。在一个实施例中,当接近传感器1016检测到用户与终端1000的正面之间的距离逐渐变小时,由处理器1001控制显示屏1005从亮屏状态切换为息屏状态;当接近传感器1016检测到用户与终端1000的正面之间的距离逐渐变大时,由处理器1001控制显示屏1005从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图10中示出的结构并不构成对终端1000的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
可选地,计算机设备提供为服务器。图11是本申请实施例提供的一种服务器的结构示意图,该服务器1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)1101和一个或一个以上的存储器1102,其中,存储器1102中存储有至少一条计算机程序,至少一条计算机程序由处理器1101加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的分类方法所执行的操作。
本申请实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述实施例的分类方法所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请实施例的可选实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (16)

1.一种分类方法,其特征在于,所述方法包括:
获取多种第一类别的类别语义特征,所述类别语义特征是对所述第一类别的类别信息进行语义提取得到的;
对待分类的文本信息进行语义提取,得到所述文本信息的文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度;
基于多种所述第一类别对应的相似度,从多种所述第一类别中,确定所述文本信息所属的第一目标类别。
2.根据权利要求1所述的方法,其特征在于,每种所述第一类别为一种第二类别的子类别,至少两种所述第一类别所属的第二类别不同;所述对待分类的文本信息进行语义提取,得到所述文本信息的文本语义特征之后,所述方法还包括:
基于多种所述第二类别,对所述文本语义特征进行分类,得到多种所述第二类别对应的类别标签,所述第二类别对应的类别标签指示所述文本信息属于所述第二类别的可能性;
基于多种所述第二类别对应的类别标签,从多种所述第二类别中,确定所述文本信息所属的第二目标类别。
3.根据权利要求1所述的方法,其特征在于,每种所述第一类别为一种第二类别的子类别,所述基于多种所述第一类别对应的相似度,从多种所述第一类别中,确定所述文本信息所属的第一目标类别之后,所述方法还包括:
将所述第一目标类别所属的第二类别,确定为所述文本信息所属的第二目标类别。
4.根据权利要求1所述的方法,其特征在于,所述获取多种第一类别的类别语义特征,包括:
基于分类模型,获取多种所述第一类别的类别语义特征;
所述对待分类的文本信息进行语义提取,得到所述文本信息的文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度,包括:
基于所述分类模型,对所述文本信息进行语义提取,得到所述文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度。
5.根据权利要求4所述的方法,其特征在于,所述分类模型包括第一分类子模型及第二分类子模型;所述基于分类模型,获取多种所述第一类别的类别语义特征,包括:
基于所述第一分类子模型,获取多种所述第一类别的类别语义特征;
所述基于所述分类模型,对所述文本信息进行语义提取,得到所述文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度,包括:
基于所述第二分类子模型,对所述文本信息进行语义提取,得到所述文本语义特征;
基于所述第一分类子模型,分别获取所述文本语义特征与每种所述类别语义特征之间的相似度。
6.根据权利要求5所述的方法,其特征在于,每种所述第一类别为一种第二类别的子类别,至少两种所述第一类别所属的第二类别不同;所述基于所述第二分类子模型,对所述文本信息进行语义提取,得到所述文本语义特征之后,所述方法还包括:
基于所述第二分类子模型,对所述文本语义特征进行分类,得到多种所述第二类别对应的类别标签,所述第二类别对应的类别标签指示所述文本信息属于所述第二类别的可能性;
基于多种所述第二类别对应的类别标签,从多种所述第二类别中,确定所述文本信息所属的第二目标类别。
7.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取样本文本信息及对应的第一样本标签,所述第一样本标签指示所述样本文本信息所属的第一类别;
基于所述分类模型,获取多种所述第一类别的样本类别语义特征;
基于所述分类模型,对所述样本文本信息进行语义提取,得到所述样本文本信息的样本文本语义特征,以及分别获取所述样本文本语义特征与每种所述样本类别语义特征之间的预测相似度;
基于所述第一样本标签及多种所述第一类别对应的预测相似度,对所述分类模型进行训练。
8.根据权利要求7所述的方法,其特征在于,每种所述第一类别为一种第二类别的子类别,至少两种所述第一类别所属的第二类别不同,所述方法还包括:
获取所述样本文本信息对应的第二样本标签,所述第二样本标签指示所述样本文本信息所属的第二类别;
所述基于所述第一样本标签及多种所述第一类别对应的预测相似度,对所述分类模型进行训练,包括:
基于所述分类模型,对所述样本文本语义特征进行分类,得到多种所述第二类别对应的预测类别标签,所述第二类别对应的预测类别标签指示预测到所述样本文本信息属于所述第二类别的可能性;
基于所述第一样本标签、多种所述第一类别对应的预测相似度、所述第二样本标签及多种所述第二类别对应的预测类别标签,对所述分类模型进行训练。
9.根据权利要求8所述的方法,其特征在于,所述基于所述第一样本标签、多种所述第一类别对应的预测相似度、所述第二样本标签及多种所述第二类别对应的预测类别标签,对所述分类模型进行训练,包括:
基于所述第一样本标签及多种所述第一类别对应的预测相似度,确定第一损失值;
基于所述第二样本标签及多种所述第二类别对应的预测类别标签,确定第二损失值;
对所述第一损失值及所述第二损失值进行加权融合,得到第一损失和值;
基于所述第一损失和值,对所述分类模型进行训练。
10.根据权利要求8所述的方法,其特征在于,所述基于所述第一样本标签、多种所述第一类别对应的预测相似度、所述第二样本标签及多种所述第二类别对应的预测类别标签,对所述分类模型进行训练,包括:
基于所述第一样本标签及多种所述第一类别对应的预测相似度,确定所述样本文本信息所属的第一类别对应的目标预测相似度;
基于所述第二样本标签及多种所述第二类别对应的预测类别标签,确定所述样本文本信息所属的第二类别对应的目标预测类别标签;
基于所述第一样本标签、多种所述第一类别对应的预测相似度、所述第二样本标签、多种所述第二类别对应的预测类别标签、所述目标预测相似度及所述目标预测类别标签,对所述分类模型进行训练。
11.根据权利要求10所述的方法,其特征在于,所述基于所述第一样本标签、多种所述第一类别对应的预测相似度、所述第二样本标签、多种所述第二类别对应的预测类别标签、所述目标预测相似度及所述目标预测类别标签,对所述分类模型进行训练,包括:
基于所述第一样本标签及多种所述第一类别对应的预测相似度,确定第一损失值;
基于所述第二样本标签及多种所述第二类别对应的预测类别标签,确定第二损失值;
基于所述目标预测相似度及所述目标预测类别标签,确定第三损失值;
对所述第一损失值、所述第二损失值及所述第三损失值进行加权融合,得到第二损失和值;
基于所述第二损失和值,对所述分类模型进行训练。
12.根据权利要求1-11任一项所述的方法,其特征在于,所述文本信息用于描述多媒体资源,所述基于多种所述第一类别对应的相似度,从多种所述第一类别中,确定所述文本信息所属的第一目标类别之后,所述方法还包括:
将所述文本信息所属的第一目标类别,确定为所述多媒体资源所属的类别。
13.一种分类装置,其特征在于,所述装置包括:
获取模块,用于获取多种第一类别的类别语义特征,所述类别语义特征是对所述第一类别的类别信息进行语义提取得到的;
所述获取模块,还用于对待分类的文本信息进行语义提取,得到所述文本信息的文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度;
确定模块,用于基于多种所述第一类别对应的相似度,从多种所述第一类别中,确定所述文本信息所属的第一目标类别。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如权利要求1至12任一权利要求所述的分类方法所执行的操作。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至12任一权利要求所述的分类方法所执行的操作。
16.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至12任一权利要求所述的分类方法所执行的操作。
CN202111136661.3A 2021-09-27 2021-09-27 分类方法、装置、计算机设备及存储介质 Pending CN114281936A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111136661.3A CN114281936A (zh) 2021-09-27 2021-09-27 分类方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111136661.3A CN114281936A (zh) 2021-09-27 2021-09-27 分类方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114281936A true CN114281936A (zh) 2022-04-05

Family

ID=80868564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111136661.3A Pending CN114281936A (zh) 2021-09-27 2021-09-27 分类方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114281936A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658903A (zh) * 2022-11-01 2023-01-31 百度在线网络技术(北京)有限公司 文本分类方法、模型训练方法、相关装置及电子设备
CN116975295A (zh) * 2023-09-21 2023-10-31 腾讯科技(深圳)有限公司 一种文本分类方法、装置及相关产品

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658903A (zh) * 2022-11-01 2023-01-31 百度在线网络技术(北京)有限公司 文本分类方法、模型训练方法、相关装置及电子设备
CN115658903B (zh) * 2022-11-01 2023-09-05 百度在线网络技术(北京)有限公司 文本分类方法、模型训练方法、相关装置及电子设备
CN116975295A (zh) * 2023-09-21 2023-10-31 腾讯科技(深圳)有限公司 一种文本分类方法、装置及相关产品
CN116975295B (zh) * 2023-09-21 2024-01-30 腾讯科技(深圳)有限公司 一种文本分类方法、装置及相关产品

Similar Documents

Publication Publication Date Title
CN111652678B (zh) 物品信息显示方法、装置、终端、服务器及可读存储介质
CN111897996B (zh) 话题标签推荐方法、装置、设备及存储介质
CN112069414A (zh) 推荐模型训练方法、装置、计算机设备及存储介质
CN112163428A (zh) 语义标签的获取方法、装置、节点设备及存储介质
CN110162604B (zh) 语句生成方法、装置、设备及存储介质
CN113515942A (zh) 文本处理方法、装置、计算机设备及存储介质
CN111737573A (zh) 资源推荐方法、装置、设备及存储介质
CN111104980B (zh) 确定分类结果的方法、装置、设备及存储介质
CN112749728A (zh) 学生模型训练方法、装置、计算机设备及存储介质
CN112989767B (zh) 医学词语标注方法、医学词语映射方法、装置及设备
CN111581958A (zh) 对话状态确定方法、装置、计算机设备及存储介质
CN114281936A (zh) 分类方法、装置、计算机设备及存储介质
CN110942046A (zh) 图像检索方法、装置、设备及存储介质
CN111209377A (zh) 基于深度学习的文本处理方法、装置、设备及介质
CN113569042A (zh) 文本信息分类方法、装置、计算机设备及存储介质
CN113987326B (zh) 资源推荐方法、装置、计算机设备及介质
CN113269279B (zh) 一种多媒体内容分类方法和相关装置
CN112561084B (zh) 特征提取方法、装置、计算机设备及存储介质
CN111931075B (zh) 一种内容推荐方法、装置、计算机设备及存储介质
CN112287070A (zh) 词语的上下位关系确定方法、装置、计算机设备及介质
CN113486260B (zh) 互动信息的生成方法、装置、计算机设备及存储介质
CN112988984B (zh) 特征获取方法、装置、计算机设备及存储介质
CN112070586B (zh) 基于语义识别的物品推荐方法、装置、计算机设备及介质
CN114827702B (zh) 视频推送方法、视频播放方法、装置、设备以及介质
CN114328815A (zh) 文本映射模型的处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination