CN111177454B

CN111177454B - 一种音频节目分类的修正方法

Info

Publication number: CN111177454B
Application number: CN201911269615.3A
Authority: CN
Inventors: 杜春河; 丁宁
Original assignee: Guangzhou Lizhi Network Technology Co ltd
Current assignee: Guangzhou Lizhi Network Technology Co ltd
Priority date: 2019-12-11
Filing date: 2019-12-11
Publication date: 2023-05-30
Anticipated expiration: 2039-12-11
Also published as: CN111177454A

Abstract

本发明公开了一种音频节目分类的修正方法，包括：建立fasttext分类模型；通过fasttext分类模型对未分类的新音频节目进行第一次分类；判断新音频节目通过fasttext分类模型得出的第一次分类是否正确；若第一次分类不正确，则进行重新分类。可修正音频节目的分类信息，提高音频节目分类的正确率。

Description

一种音频节目分类的修正方法

技术领域

本发明涉及一种音频节目分类的修正方法。

背景技术

在音频推荐场景中，音频分类技术是一项十分重要的技术。传统对音频分类的方法有两种，一种是人工审核分类，另一种是利用音频的文本信息及机器学习技术进行机器分类。虽然人工分类有准确率高的优点，但是由于它成本过高，效率也低，所以机器分类技术是较常使用的方法。

但使用机器分类技术易出现分类错误的情况，若不及时修正，音频分类错误，也会错误的将其推送给对其不感兴趣的用户。推荐错误会导致用户使用的好感度降低。

发明内容

本发明旨在至少在一定程度上解决现有相关技术中存在的问题之一，为此，本发明的目的在于提出一种音频节目分类的修正方法，可修正音频分类信息。

上述目的是通过如下技术方案来实现的：

一种音频节目分类的修正方法，包括：建立fasttext分类模型；通过fasttext分类模型对未分类的新音频节目进行第一次分类；判断新音频节目通过fasttext分类模型得出的第一次分类是否正确；若第一次分类不正确，则进行重新分类。

作为本发明的进一步改进，判断新音频节目通过fasttext分类模型得出的第一次分类是否正确的步骤具体为：收集收听新音频节目的用户；对收听新音频节目用户进行用户权重分类；根据用户权重分类对音频节目进行第二次分类；若第二次分类与第一次分类不同，则第一次分类不正确。

作为本发明的进一步改进，对收听新音频节目用户进行用户权重分类的步骤具体为：收集收听新音频节目的用户曾经收听的音频节目；对用户曾经收听的音频节目通过fasttext分类模型进行分类；根据对曾经收听的音频节目的分类，计算得出用户每个分类的权重；将用户每个音频节目分类的权重标记为用户权重分类。

作为本发明的进一步改进，根据用户各类音频节目的权重分类对音频节目进行第二次分类的步骤具体为：将若干用户权重分类信息传递给新音频节目；对所有用户的同一音频节目分类进行加权平均；比较每个音频节目分类的加权平均数的大小；将加权平均数最大的音频节目分类标记为新音频节目的第二次分类。

作为本发明的进一步改进，建立fasttext分类模型步骤具体为：收集音频节目，对音频节目进行人工分类；利用已进行人工分类的音频节目，训练fasttext分类模型。

与现有技术相比，本发明的至少包括以下有益效果：

1.本发明提出一种音频节目分类的修正方法，通过fasttext分类模型对音频节目进行分类后可修正音频节目的分类信息，提高音频节目分类的正确率，利于将音频推荐给适合的用户，增加用户体验感。

附图说明

图1是本发明一种音频节目分类的修正方法的流程图。

具体实施方式

以下实施例对本发明进行说明，但本发明并不受这些实施例所限制。对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换，而不脱离本发明方案的精神，其均应涵盖在本发明请求保护的技术方案范围当中。

参见附图1示出本发明的一种音频节目分类的修正方法，包括：建立fasttext分类模型S1；通过fasttext分类模型对未分类的新音频节目进行第一次分类S2；判断新音频节目通过fasttext分类模型得出的第一次分类是否正确S3；若第一次分类不正确，则进行重新分类S4。

建立fasttext分类模型步骤具体为：收集音频节目，对音频节目进行人工分类；利用已进行人工分类的音频节目，训练fasttext分类模型。建立fasttext分类模型并对模型进行训练。

判断新音频节目通过fasttext分类模型得出的第一次分类是否正确的步骤具体为：收集收听新音频节目的用户；对收听新音频节目用户进行用户权重分类；根据用户权重分类对音频节目进行第二次分类；若第二次分类与第一次分类不同，则第一次分类不正确，则将音频节目的分类改为第二次分类。若第二次分类与第一次分类相同，则第一次分类正确，维持第一次分类不变。

对收听新音频节目用户进行用户权重分类的步骤具体为：收集收听新音频节目的用户曾经收听的音频节目；对用户曾经收听的音频节目通过fasttext分类模型进行分类，若用户曾经收听的音频节目较少，也可选择使用人工分类对用户曾经收听的音频节目进行分类；根据对曾经收听的音频节目的分类，计算得出用户每个分类的权重；将用户每个音频节目分类的权重标记为用户权重分类。若一个用户曾经收听过100个节目，将其收听过的100个节目通过fasttext分类模型进行分类，其中分别有90个历史类节目和10个旅游类节目，则计算初用户历史类节目的权重为0.9，旅游类节目的权重为0.1，用户分类为历史和旅游，用户权重分类为0.9和0.1。

根据用户各类音频节目的权重分类对音频节目进行第二次分类的步骤具体为：将若干用户权重分类信息传递给新音频节目；对所有用户的同一音频节目分类进行加权平均；比较每个音频节目分类的加权平均数的大小；将加权平均数最大的音频节目分类标记为新音频节目的第二次分类。

若收听新音频节目总共有两个用户，其中第一个用户分类为历史和旅游，其权重分类为0.9和0.1；第二个用户分类为历史和旅游，其权重分类为0.8和0.2。则对用户的同一音频节目分类进行加权平均得出，历史和旅游的权重分别为(0.9+0.8)/2和(0.1+0.2)/2，即历史和旅游的权重分别为0.85和0.15。将加权平均数最大的音频分类标记为新音频节目的第二次分类,即此新音频节目的第二分类为历史。

若收听新音频节目总共有两个用户，其中第一个用户分类为历史和旅游，其权重分类为0.9和0.1；第二个用户分类为历史、旅游和科学，其权重分类为0.7、0.2和0.1。则对用户的同一音频节目分类进行加权平均得出，历史、旅游和科学的权重分别为(0.9+0.7)/2、(0.1+0.2)/2和(0+0.1)/2,即历史、旅游和科学的权重分别为0.8、0.15、0.05。将加权平均数最大的音频分类标记为新音频节目的第二次分类,即此新音频节目的第二分类为历史。

通过fasttext分类模型对音频节目进行分类，其正确率高，但也会存在失误。通过对音频节目分类信息进行修正，可进一步提高音频节目分类的正确率。

上述优选实施方式应视为本申请方案实施方式的举例说明，凡与本申请方案雷同、近似或以此为基础作出的技术推演、替换、改进等，均应视为本专利的保护范围。

Claims

1.一种音频节目分类的修正方法，其特征在于，包括：

建立fasttext分类模型；

通过fasttext分类模型对未分类的新音频节目进行第一次分类；

收集收听新音频节目的用户；

收集收听新音频节目的用户曾经收听的音频节目；对用户曾经收听的音频节目通过fasttext分类模型进行分类；根据对用户曾经收听的音频节目的分类，计算得出用户每个分类的权重；将用户每个音频节目分类的权重标记为用户权重分类；

将若干用户权重分类信息传递给新音频节目；对所有用户的同一音频节目分类进行加权平均；比较每个音频节目分类的加权平均数的大小；将加权平均数最大的音频节目分类标记为新音频节目的第二次分类；

若第二次分类与第一次分类不同，则第一次分类不正确，进行重新分类。

2.根据权利要求1所述的一种音频节目分类的修正方法，其特征在于，建立fasttext分类模型步骤具体为：

收集音频节目，对音频节目进行人工分类；

利用已进行人工分类的音频节目，训练fasttext分类模型。