CN111177454B - 一种音频节目分类的修正方法 - Google Patents

一种音频节目分类的修正方法 Download PDF

Info

Publication number
CN111177454B
CN111177454B CN201911269615.3A CN201911269615A CN111177454B CN 111177454 B CN111177454 B CN 111177454B CN 201911269615 A CN201911269615 A CN 201911269615A CN 111177454 B CN111177454 B CN 111177454B
Authority
CN
China
Prior art keywords
classification
audio
user
programs
audio program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911269615.3A
Other languages
English (en)
Other versions
CN111177454A (zh
Inventor
杜春河
丁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Lizhi Network Technology Co ltd
Original Assignee
Guangzhou Lizhi Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Lizhi Network Technology Co ltd filed Critical Guangzhou Lizhi Network Technology Co ltd
Priority to CN201911269615.3A priority Critical patent/CN111177454B/zh
Publication of CN111177454A publication Critical patent/CN111177454A/zh
Application granted granted Critical
Publication of CN111177454B publication Critical patent/CN111177454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Circuits Of Receivers In General (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种音频节目分类的修正方法,包括:建立fasttext分类模型;通过fasttext分类模型对未分类的新音频节目进行第一次分类;判断新音频节目通过fasttext分类模型得出的第一次分类是否正确;若第一次分类不正确,则进行重新分类。可修正音频节目的分类信息,提高音频节目分类的正确率。

Description

一种音频节目分类的修正方法
技术领域
本发明涉及一种音频节目分类的修正方法。
背景技术
在音频推荐场景中,音频分类技术是一项十分重要的技术。传统对音频分类的方法有两种,一种是人工审核分类,另一种是利用音频的文本信息及机器学习技术进行机器分类。虽然人工分类有准确率高的优点,但是由于它成本过高,效率也低,所以机器分类技术是较常使用的方法。
但使用机器分类技术易出现分类错误的情况,若不及时修正,音频分类错误,也会错误的将其推送给对其不感兴趣的用户。推荐错误会导致用户使用的好感度降低。
发明内容
本发明旨在至少在一定程度上解决现有相关技术中存在的问题之一,为此,本发明的目的在于提出一种音频节目分类的修正方法,可修正音频分类信息。
上述目的是通过如下技术方案来实现的:
一种音频节目分类的修正方法,包括:建立fasttext分类模型;通过fasttext分类模型对未分类的新音频节目进行第一次分类;判断新音频节目通过fasttext分类模型得出的第一次分类是否正确;若第一次分类不正确,则进行重新分类。
作为本发明的进一步改进,判断新音频节目通过fasttext分类模型得出的第一次分类是否正确的步骤具体为:收集收听新音频节目的用户;对收听新音频节目用户进行用户权重分类;根据用户权重分类对音频节目进行第二次分类;若第二次分类与第一次分类不同,则第一次分类不正确。
作为本发明的进一步改进,对收听新音频节目用户进行用户权重分类的步骤具体为:收集收听新音频节目的用户曾经收听的音频节目;对用户曾经收听的音频节目通过fasttext分类模型进行分类;根据对曾经收听的音频节目的分类,计算得出用户每个分类的权重;将用户每个音频节目分类的权重标记为用户权重分类。
作为本发明的进一步改进,根据用户各类音频节目的权重分类对音频节目进行第二次分类的步骤具体为:将若干用户权重分类信息传递给新音频节目;对所有用户的同一音频节目分类进行加权平均;比较每个音频节目分类的加权平均数的大小;将加权平均数最大的音频节目分类标记为新音频节目的第二次分类。
作为本发明的进一步改进,建立fasttext分类模型步骤具体为:收集音频节目,对音频节目进行人工分类;利用已进行人工分类的音频节目,训练fasttext分类模型。
与现有技术相比,本发明的至少包括以下有益效果:
1.本发明提出一种音频节目分类的修正方法,通过fasttext分类模型对音频节目进行分类后可修正音频节目的分类信息,提高音频节目分类的正确率,利于将音频推荐给适合的用户,增加用户体验感。
附图说明
图1是本发明一种音频节目分类的修正方法的流程图。
具体实施方式
以下实施例对本发明进行说明,但本发明并不受这些实施例所限制。对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换,而不脱离本发明方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。
参见附图1示出本发明的一种音频节目分类的修正方法,包括:建立fasttext分类模型S1;通过fasttext分类模型对未分类的新音频节目进行第一次分类S2;判断新音频节目通过fasttext分类模型得出的第一次分类是否正确S3;若第一次分类不正确,则进行重新分类S4。
建立fasttext分类模型步骤具体为:收集音频节目,对音频节目进行人工分类;利用已进行人工分类的音频节目,训练fasttext分类模型。建立fasttext分类模型并对模型进行训练。
判断新音频节目通过fasttext分类模型得出的第一次分类是否正确的步骤具体为:收集收听新音频节目的用户;对收听新音频节目用户进行用户权重分类;根据用户权重分类对音频节目进行第二次分类;若第二次分类与第一次分类不同,则第一次分类不正确,则将音频节目的分类改为第二次分类。若第二次分类与第一次分类相同,则第一次分类正确,维持第一次分类不变。
对收听新音频节目用户进行用户权重分类的步骤具体为:收集收听新音频节目的用户曾经收听的音频节目;对用户曾经收听的音频节目通过fasttext分类模型进行分类,若用户曾经收听的音频节目较少,也可选择使用人工分类对用户曾经收听的音频节目进行分类;根据对曾经收听的音频节目的分类,计算得出用户每个分类的权重;将用户每个音频节目分类的权重标记为用户权重分类。若一个用户曾经收听过100个节目,将其收听过的100个节目通过fasttext分类模型进行分类,其中分别有90个历史类节目和10个旅游类节目,则计算初用户历史类节目的权重为0.9,旅游类节目的权重为0.1,用户分类为历史和旅游,用户权重分类为0.9和0.1。
根据用户各类音频节目的权重分类对音频节目进行第二次分类的步骤具体为:将若干用户权重分类信息传递给新音频节目;对所有用户的同一音频节目分类进行加权平均;比较每个音频节目分类的加权平均数的大小;将加权平均数最大的音频节目分类标记为新音频节目的第二次分类。
若收听新音频节目总共有两个用户,其中第一个用户分类为历史和旅游,其权重分类为0.9和0.1;第二个用户分类为历史和旅游,其权重分类为0.8和0.2。则对用户的同一音频节目分类进行加权平均得出,历史和旅游的权重分别为(0.9+0.8)/2和(0.1+0.2)/2,即历史和旅游的权重分别为0.85和0.15。将加权平均数最大的音频分类标记为新音频节目的第二次分类,即此新音频节目的第二分类为历史。
若收听新音频节目总共有两个用户,其中第一个用户分类为历史和旅游,其权重分类为0.9和0.1;第二个用户分类为历史、旅游和科学,其权重分类为0.7、0.2和0.1。则对用户的同一音频节目分类进行加权平均得出,历史、旅游和科学的权重分别为(0.9+0.7)/2、(0.1+0.2)/2和(0+0.1)/2,即历史、旅游和科学的权重分别为0.8、0.15、0.05。将加权平均数最大的音频分类标记为新音频节目的第二次分类,即此新音频节目的第二分类为历史。
通过fasttext分类模型对音频节目进行分类,其正确率高,但也会存在失误。通过对音频节目分类信息进行修正,可进一步提高音频节目分类的正确率。
上述优选实施方式应视为本申请方案实施方式的举例说明,凡与本申请方案雷同、近似或以此为基础作出的技术推演、替换、改进等,均应视为本专利的保护范围。

Claims (2)

1.一种音频节目分类的修正方法,其特征在于,包括:
建立fasttext分类模型;
通过fasttext分类模型对未分类的新音频节目进行第一次分类;
收集收听新音频节目的用户;
收集收听新音频节目的用户曾经收听的音频节目;对用户曾经收听的音频节目通过fasttext分类模型进行分类;根据对用户曾经收听的音频节目的分类,计算得出用户每个分类的权重;将用户每个音频节目分类的权重标记为用户权重分类;
将若干用户权重分类信息传递给新音频节目;对所有用户的同一音频节目分类进行加权平均;比较每个音频节目分类的加权平均数的大小;将加权平均数最大的音频节目分类标记为新音频节目的第二次分类;
若第二次分类与第一次分类不同,则第一次分类不正确,进行重新分类。
2.根据权利要求1所述的一种音频节目分类的修正方法,其特征在于,建立fasttext分类模型步骤具体为:
收集音频节目,对音频节目进行人工分类;
利用已进行人工分类的音频节目,训练fasttext分类模型。
CN201911269615.3A 2019-12-11 2019-12-11 一种音频节目分类的修正方法 Active CN111177454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911269615.3A CN111177454B (zh) 2019-12-11 2019-12-11 一种音频节目分类的修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911269615.3A CN111177454B (zh) 2019-12-11 2019-12-11 一种音频节目分类的修正方法

Publications (2)

Publication Number Publication Date
CN111177454A CN111177454A (zh) 2020-05-19
CN111177454B true CN111177454B (zh) 2023-05-30

Family

ID=70646322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911269615.3A Active CN111177454B (zh) 2019-12-11 2019-12-11 一种音频节目分类的修正方法

Country Status (1)

Country Link
CN (1) CN111177454B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022040282A1 (en) 2020-08-18 2022-02-24 Dolby Laboratories Licensing Corporation Audio content identification

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751920A (zh) * 2008-12-19 2010-06-23 数维科技(北京)有限公司 基于再次分类的音频分类装置及其实现方法
CN106256001A (zh) * 2014-02-24 2016-12-21 三星电子株式会社 信号分类方法和装置以及使用其的音频编码方法和装置
CN107943865A (zh) * 2017-11-10 2018-04-20 阿基米德(上海)传媒有限公司 一种适用于多场景、多类型的音频分类标签方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751920A (zh) * 2008-12-19 2010-06-23 数维科技(北京)有限公司 基于再次分类的音频分类装置及其实现方法
CN106256001A (zh) * 2014-02-24 2016-12-21 三星电子株式会社 信号分类方法和装置以及使用其的音频编码方法和装置
CN107943865A (zh) * 2017-11-10 2018-04-20 阿基米德(上海)传媒有限公司 一种适用于多场景、多类型的音频分类标签方法及***

Also Published As

Publication number Publication date
CN111177454A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
US10146811B2 (en) Method and device for presenting application programs
JP5401633B2 (ja) データ推薦方法及びデータ推薦装置
CN104915327B (zh) 一种文本信息的处理方法及装置
CN103426042B (zh) 社交网络的分组方法及***
US10235680B2 (en) System and method for populating a database with user input
CN105574159A (zh) 一种基于大数据的用户画像建立方法和用户画像管理***
CN103336766A (zh) 短文本垃圾识别以及建模方法和装置
CN111860605A (zh) 一种工艺节拍处理方法、***、装置及存储介质
WO2010034259A1 (zh) 提供在线服务的方法和装置
CN111177454B (zh) 一种音频节目分类的修正方法
CN107015993B (zh) 一种用户类型识别方法及装置
CN105654198B (zh) 具有最优阈值筛选的品牌广告效果优化的方法
CN103970802A (zh) 一种歌曲推荐的方法及装置
CN111294819A (zh) 一种网络优化方法及装置
CN103389995B (zh) 一种垃圾内容识别方法及装置
Xie et al. Using machine learning to support resource quality assessment: an adaptive attribute-based approach for health information portals
CN104866490A (zh) 一种视频智能推荐方法及其***
CN103544314A (zh) 一种搜索数据质量统计方法
CN112417088B (zh) 一种社群内文本价值的评估方法及装置
CN110516151B (zh) 有效行为检测和个性化推荐方法
CN104142997A (zh) 基于逆向词频的贝叶斯文本分类器
CN111754111A (zh) 办公绩效评估方法、装置和计算机存储介质
CN113837514A (zh) 用户满意度的评估方法、装置、计算设备及存储介质
CN106610991A (zh) 数据处理方法和装置
CN109829492A (zh) 一种用于不平衡数据的分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant