CN110019921B - 音频与属性的关联方法及装置、音频搜索方法及装置 - Google Patents

音频与属性的关联方法及装置、音频搜索方法及装置 Download PDF

Info

Publication number
CN110019921B
CN110019921B CN201711137185.0A CN201711137185A CN110019921B CN 110019921 B CN110019921 B CN 110019921B CN 201711137185 A CN201711137185 A CN 201711137185A CN 110019921 B CN110019921 B CN 110019921B
Authority
CN
China
Prior art keywords
data
attributes
audio
attribute
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711137185.0A
Other languages
English (en)
Other versions
CN110019921A (zh
Inventor
孙浩华
王朝阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201711137185.0A priority Critical patent/CN110019921B/zh
Publication of CN110019921A publication Critical patent/CN110019921A/zh
Application granted granted Critical
Publication of CN110019921B publication Critical patent/CN110019921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了音频与属性的关联方法及装置、音频搜索方法及装置,其中,音频与属性的关联方法包括:获取音频的至少两种初始属性;依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系。采用本申请实施例的方法或装置,使得音频的关联关系更具有广度和深度。此外,本申请实施例还可以基于建立的关联关系来搜索音频,从而给用户提供更有可能符合用户需求的音频。

Description

音频与属性的关联方法及装置、音频搜索方法及装置
技术领域
本申请涉及互联网数据处理技术领域,特别涉及一种音频与属性的关联方法及装置,一种音频搜索方法及装置,一种数据处理方法及装置,以及,一种数据检索方法及装置。
背景技术
目前,越来越多的用户使用播放软件听取音乐、播放视频等,通过各种播放软件来进行日常的学习或娱乐。如果用户希望搜索到一个歌曲,一般情况下,会输入关键词进行检索,那些名字中包括用户输入的关键词的歌曲就会被作为搜索结果展示给用户。在某些情况下,关键词检索还可以被用于搜索专辑名称、歌手名称,等等。
现有技术无法满足用户对电子流派、背景乐器等更广度的音频搜索需求。
发明内容
发明人在研究过程中发现,对于现有技术中的关键词检索,只能实现对某些歌名、专辑、艺人和歌词等包括关键词的音频才能实现检索,而其他的情况,例如,用户希望精确找一些电子流派,背景乐器,分类的歌曲,则无法给用户更广度的搜索结果,导致现有技术无法满足用户更广度的音频搜索需求。
基于此,本申请提供了一种音频和音频属性的关联方法、一种音频搜索方法、一种数据处理方法和一种数据检索方法,针对用户标记的音频属性之间的相似性,从待关联的音频属性中提取出有效属性,并且参考有效属性之间的冲突关系,建立有效属性与音频的关联关系,基于该方式建立的关联关系,可以将用户对音频的各种音频属性,例如人声分解,情感标记,主体场景定位等,都建立与音频之间的关联,使得音频的关联关系更具有广度和深度。此外,本申请实施例还可以基于建立的关联关系来搜索音频,从而给用户提供更有可能符合用户需求的音频。
本申请还提供了一种音频和音频属性的关联装置、一种音频搜索装置、一种数据处理装置和一种数据检索装置,用以保证上述方法在实际中的实现及应用。
为了解决上述问题,本申请公开了一种音频与属性的关联方法,其特征在于,该方法包括:
获取音频的至少两种初始属性;
依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;
参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系。
其中,所述依据所述初始属性之间的相似性,从所述初始属性中提取有效属性,包括:
针对各初始属性,执行以下获取流程:获取所述初始属性所属的所有音频,并依据各音频的固有属性和非固有属性,确定各音频相对该初始属性的权重;以及,获取所述初始属性在其所属的各音频中的标记次数;
依据所述各音频相对该初始属性的权重和标记次数,通过多分类模型对所述初始属性进行聚类;
依据所述聚类的结果以及各初始属性之间的距离,提取有效属性。
其中,所述依据所述聚类的结果以及各音频属性间的距离,提取有效属性,包括:
从所述聚类的结果中删除所述初始属性的被标记次数小于预设阈值的结果,得到待处理的聚类结果;
依据用户等级和/或被标记次数,从各所述待处理的聚类结果中选取出最优属性作为所述有效属性,一个聚类结果对应一个有效属性;
记录各聚类结果中其他初始属性与所述有效属性的转化关系。
其中,所述参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系,包括:
依据音频与所述有效属性之间的关系,确定包括所述有效属性的待处理音频;
从所述待处理音频的有效属性中确定存在冲突的冲突属性对;
依据所述冲突属性对涉及的冲突参数,从所述冲突属性对中确定一目标属性;所述冲突参数包括:用户等级和/或被打标次数;
建立所述音频与所述目标属性之间的关联。
其中,该方法还包括:
依据搜索***得到的各有效属性对应音频的点击信息,对所述关联关系进行修正。
其中,所述依据搜索***得到的各音频属性对应音频的点击信息,对所述关联关系进行修正,包括:
依据历史行为数据统计各有效属性作为搜索词进行搜索时,得到的各音频的总点击次数;
判断所述音频的总点击次数是否小于预设阈值,如果是,则删除该有效属性与该音频的关联关系。
其中,该方法还包括:
将所述有效属性与音频的关联关系采用音乐图谱进行表示。
本申请还公开了一种音频搜索方法,该方法包括:
获取输入的搜索词;
依据预先建立的、有效属性与音频的关联关系,确定与所述搜索词关联的音频;
将所述音频进行展示。
其中,所述关联关系通过以下方式建立:
获取音频的至少两种初始属性;
依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;
参考所述有效属性之间的冲突关系,建立所述有效属性与音频的关联关系。
本申请还公开了一种数据处理方法,包括:
获取对象数据的标记数据;
对所述标记数据进行相似性比较,得到有效标记数据;
获取有效标记数据之间的冲突关系;
基于所述冲突关系,选择目标标记数据;
建立所述目标标记数据与所述对象数据的关联关系。
其中,所述对所述标记数据进行相似性比较,得到有效标记数据,包括:
获取所述标记数据所属的对象数据,并依据所述对象数据固有属性和非固有属性,确定所述对象数据相对所述标记数据的权重,以及,所述标记数据在其所属的对象数据中的标记次数;
依据所述对象数据的权重和标记次数,通过多分类模型对所述标记数据进行聚类;
依据所述聚类的结果和所述标记数据之间的距离,提取有效标记数据。
其中,所述基于所述冲突关系,选择目标标记数据,包括:
依据所述对象数据与有效标记数据之间的关系,确定包括所述有效标记数据的对象数据;
从所述确定的对象数据的有效标记数据中确定存在冲突的冲突数据对;
依据所述冲突数据对涉及的冲突参数,从所述冲突数据对中确定一目标标记数据;所述冲突参数包括:用户等级和/或被打标次数。
本申请还公开了一种数据检索方法,包括:
获取检索输入数据,其中,所述检索输入数据为目标标记数据;
基于所述目标标记数据,获取对象数据;
反馈所述对象数据作为检索结果。
其中,所述目标标记数据与所述对象数据的关联关系的建立包括:
获取对象数据的标记数据;
对所述标记数据进行相似性比较,得到有效标记数据;
获取有效标记数据之间的冲突关系;
基于所述冲突关系,选择目标标记数据;
建立所述目标标记数据与所述对象数据的关联关系。
本申请还公开了一种音频与属性的关联装置,其特征在于,包括:
通信接口,用于获取待关联的音频的初始属性;
处理器,用于依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;以及,参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系。
其中,所述处理器用于依据所述初始属性之间的相似性,从所述初始属性中提取有效属性,包括:
针对各初始属性,执行以下获取流程:获取所述初始属性所属的所有音频,并依据各音频的固有属性和非固有属性,确定各音频相对该初始属性的权重;以及,获取所述初始属性在其所属的各音频中的标记次数;
依据所述各音频相对该初始属性的权重和标记次数,通过多分类模型对所述初始属性进行聚类;
依据所述聚类的结果以及各初始属性之间的距离,提取有效属性。
其中,所述处理器用于依据所述聚类的结果以及各音频属性间的距离,提取有效属性,包括:
从所述聚类的结果中删除所述初始属性的被标记次数小于预设阈值的结果,得到待处理的聚类结果;
依据用户等级和/或被标记次数,从各所述待处理的聚类结果中选取出最优属性作为所述有效属性,一个聚类结果对应一个有效属性;
记录各聚类结果中其他初始属性与所述有效属性的转化关系。
其中,所述处理器用于参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系,包括:
依据音频与所述有效属性之间的关系,确定包括所述有效属性的待处理音频;
从所述待处理音频的有效属性中确定存在冲突的冲突属性对;
依据所述冲突属性对涉及的冲突参数,从所述冲突属性对中确定一目标属性;所述冲突参数包括:用户等级和/或被打标次数;
建立所述音频与所述目标属性之间的关联。
其中,所述处理器还用于:
依据搜索***得到的各有效属性对应音频的点击信息,对所述关联关系进行修正。
其中,所述处理器用于依据搜索***得到的各音频属性对应音频的点击信息,对所述关联关系进行修正,包括:
依据历史行为数据统计各有效属性作为搜索词进行搜索时,得到的各音频的总点击次数;
判断所述音频的总点击次数是否小于预设阈值,如果是,则删除该有效属性与该音频的关联关系。
其中,所述处理器还用于:
将所述有效属性与音频的关联关系采用音乐图谱进行表示。
本申请还公开了一种音频搜索装置,包括:
通信接口,用于获取输入的搜索词;
处理器,用于依据预先建立的、有效属性与音频的关联关系,确定与所述搜索词关联的音频;
显示屏,用于将所述音频进行展示。
其中,所述关联关系通过以下方式建立:
获取音频的至少两种初始属性;
依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;
参考所述有效属性之间的冲突关系,建立所述有效属性与音频的关联关系。
本申请还公开了一种数据处理装置,包括:
通信接口,用于获取对象数据的标记数据;
处理器,用于对所述标记数据进行相似性比较,得到有效标记数据;获取有效标记数据之间的冲突关系;基于所述冲突关系,选择目标标记数据;以及,建立所述目标标记数据与所述对象数据的关联关系。
其中,所述处理器用于对所述标记数据进行相似性比较,得到有效标记数据,包括:
获取所述标记数据所属的对象数据,并依据所述对象数据固有属性和非固有属性,确定所述对象数据相对所述标记数据的权重,以及,所述标记数据在其所属的对象数据中的标记次数;
依据所述对象数据的权重和标记次数,通过多分类模型对所述标记数据进行聚类;
依据所述聚类的结果和所述标记数据之间的距离,提取有效标记数据。
其中,所述处理器用于基于所述冲突关系,选择目标标记数据,包括:
依据所述对象数据与有效标记数据之间的关系,确定包括所述有效标记数据的对象数据;
从所述确定的对象数据的有效标记数据中确定存在冲突的冲突数据对;
依据所述冲突数据对涉及的冲突参数,从所述冲突数据对中确定一目标标记数据;所述冲突参数包括:用户等级和/或被打标次数。
本申请还提供了一种数据检索装置,包括:
通信接口,用于获取检索输入数据,其中,所述检索输入数据为目标标记数据;
处理器,用于基于所述目标标记数据,获取对象数据;以及,反馈所述对象数据作为检索结果。
其中,所述目标标记数据与所述对象数据的关联关系的建立包括:
获取对象数据的标记数据;
对所述标记数据进行相似性比较,得到有效标记数据;
获取有效标记数据之间的冲突关系;
基于所述冲突关系,选择目标标记数据;
建立所述目标标记数据与所述对象数据的关联关系。
与现有技术相比,本申请实施例包括以下优点:
在本申请实施例中,因为音频属性可以表示音频的非结构化信息,所以将用户对各个音频所标记的音频属性也作为音频的搜索维度,只要用户输入的内容属于音频的某一个音频属性,即便输入的内容不在音频的名称或者歌词中,也能因为关联关系的建立而被检索出来,这样就能帮助用户搜索到更关联的音频文件,不仅提高了音频检索的深度和精确度,还提高了用户的音频搜索体验。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的音频和属性的关联方法实施例的示例性流程图;
图2是本申请的音乐图谱的示例性示意图;
图3是本申请的音频搜索方法实施例的示例性流程图;
图4是本申请的数据处理方法实施例的示例性流程图;
图5是本申请的数据检索方法实施例的示例性流程图;
图6是本申请的装置实施例的示例性结构框图;
图7是本申请的装置实施例的另一示例性结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例中,音乐行业的音频文件,都有其属性,属性可以包括固有属性和非固有属性,其中,固有信息例如可以包括:用户、唱片公司、专辑、歌曲、演唱者、作曲、作词、歌词、mv等,这些都是音频的固有属性。固有属性可以由唱片公司提供,在音频上线的时候,通过获取唱片公司提供的数据即可得到音频的固有属性,固有属性一般包括不变的属性。
除了固有属性,音频还可以包括非固有属性,非固有属性一般包括变化的属性。非固有属性可以包括:乐器、流派、人声分解、用户对音频的打标信息等,其中,用户对音频的打标信息完全由用户自主输入。乐器指的是音频的主旋律采用何种乐器演奏而成(同一首歌曲可以采用不同的乐器演绎),而流派则可以包括:电子、流行或者古典等曲风流派(随着细分流派的不断增加,这个属性也可以随着时间不断变化),人声分解则可以是男低音、女高音等(同一个歌手也可以对同一首歌曲进行不同的演绎),这些非固有属性可以通过机器学习方式训练获得,打标数据是用户在听音频的时候为音频标注的属性内容。
其中,对于音频的固有属性来说,可以根据唱片公司等提供的源数据,来直接构建固有属性与各音频之间的关联关系。例如,专辑、艺人、歌词、作词、作曲等。而对于非固有属性来说,可以通过本申请实施例提供的方式构建非固有属性与音频之间的关联关系。例如:演奏乐器,人声,流派,节奏,用户打标数据。本实施例中将音频与非固有属性进行关联,即是,将这些用户为音频所标记的各个非固有属性与各个音频进行关联。
参考图1所示,为本申请中一种音频与属性的关联方法实施例的流程图,本实施例可以包括以下步骤101~步骤104:
步骤101:获取音频的至少两种初始属性。
在本实施例中,可以从数据库中保存的用户数据中获取到所有音频的非固有属性作为初始属性。例如,对于音频服务器来说,从其保存用户数据的数据库中获取到每一个音频涉及的每一个非固有属性作为所述的待关联的初始属性。例如,非固有属性可以包括各用户为音频进行评论或者标记的用户数据,例如,用户为一首伤心情歌的音频打上了标签“伤心”,则“伤心”就是该音频的属性。对于情感类的非固有属性,可以进行人工标记,例如,将“伤心”、“难过”等属性标记为“悲伤”类的情感,然后为该类别设置一个类别标识(例如0),然后将类别标识与该类别的情感属性分别进行保存。以此类推,“开心”类的属性可以设置类别标识为1,“激动”类的属性可以设置类别标识为2,等等。
在实际应用中,有时由于用户误操作可能会将一些特殊符号等也输入为音频的属性,所以为了过滤掉用户误操作时标记的属性,例如一些符号“&”、“¥”等,或者一些与音频本身没有关系的属性,例如“今天是个好天气”等,针对一个音频,可以将那些被标记的次数小于一定阀值的属性过滤掉,再将过滤之后的属性作为音频的初始属性。
步骤102:依据所述初始属性之间的相似性,从所述初始属性中提取有效属性。
在本步骤中,根据初始属性之间的相似性即各个属性之间的相似程度,从初始属性中提取出有效属性。例如,初始属性“伤感”和“伤心”通过聚类算法可以聚到同一类中,则可以确认这两个初始属性具有相似性,即属于同一类感情的属性,则从两个中选取出一个作为有效属性;而属性“伤感”和“开心”通过聚类算法没有聚到同一类中,则可以确认这两个初始属性不具有相似性,则“开心”可以作为另外一种情感的有效属性,等等。
相应的,根据相似性来提取有效属性的时候,可以通过神经网络模型来对各个初始属性进行聚类实现,具体的步骤102可以包括步骤A1~步骤A4:
步骤A1:针对各初始属性,执行以下获取流程:获取所述初始属性所属的所有音频,并依据各音频的固有属性和非固有属性,确定各音频相对该初始属性的权重;以及,获取所述初始属性在其所属的各音频中的标记次数。
针对各个初始属性,先根据用户数据来获得该初始属性所涉及的音频即被用户打上该初始属性的所有音频,并组成一个音频列表,然后针对该初始属性的音频列表中各音频的固有属性和非固有属性,确定每一个音频相对于该初始属性的权重,权重越大,则表示该音频越有可能关联该初始属性,或者,该音频与该初始属性之间存在关联关系的可能性就越大。
具体的,在确定该音频的权重的时候,可以依据该音频涉及的歌词、演唱者、电台等固有属性,或者依据用户标记的非固有属性来确定。例如,一个演唱者经常演唱伤感的歌曲,则在“伤感”的属性的音频列表中,该演唱者的音频就比非该演唱者的音频的权重更大。当然,这仅仅是示例性的示意,本领域技术人员可以依据历史数据等来确定各音频的权重。
在确定了一个初始属性的音频列表中各音频的权重之后,可以在从用户数据中获取该初始属性在其所涉及的各音频中的标记次数。例如,在属性“伤感”的音频列表中,对于音频A“伤感”一共被标记了1568次,而音频B“伤感”一共被标记了186次的标记次数。
步骤A2:依据所述各音频相对该初始属性的权重和标记次数,通过多分类模型对所述初始属性进行聚类。
接着依据各音频相对该初始属性的权重和标记次数,来通过机器学习中的多分类模型对所有的初始属性进行聚类。例如,可以采用支持向量机(SVM)模型等。在进行聚类之前,对于较长的初始属性,还可以进行分词,例如假设初始属性的内容“今天的心情很感伤”,则可以对该内容进行分词,并将分词后的“感伤”作为聚类的对象,这样不仅能提高聚类的速度还能提高聚类的准确度。具体分词算法可以采用基于字符串匹配的分词方法等。
具体的,聚类的时候,可以按照初始属性的类别或者初始属性的情感来进行,例如,初始属性的类别是儿歌、戏曲、流行还是摇滚等等,初始属性的情感则是伤感、高兴、激动等。同一个初始属性,由于所属类别或者所属情感都可以作为聚类的维度,则可以分属于不同的聚类的结果。具体的,每一类相同情感的初始属性都会聚到一类中,例如“开心”和“高兴”,“难过”和“伤心”,等等;而不同类情感的初始属性则会聚到不同类中,例如“哭泣”和“开心”,“悲伤”和“兴奋”等等,聚类后,各类初始属性的聚类结果都分别表示一类情感。
步骤A3:依据所述聚类的结果以及各初始属性之间的距离,提取有效属性。
接着,依据聚类的结果以及各初始属性之间的距离提取有效属性。其中,各个初始属性之间的距离,指的是两两属性之间相似性的分数,分数高的两个属性就可以进行合并,例如“伤心”和“伤感”的相似性的分数较高,则最后可以合并为“伤心”或“伤感”。此外,聚类结果中初始属性的个数特别少的聚类结果可以忽略,最终从剩余的各聚类结果中分别选取一个初始属性作为有效属性,因为各类聚类结果之间的初始属性表示的感情都是不同的,所以每一类初始属性中各提取出一个最优属性作为有效属性。
具体的,针对聚类结果,可以预先设置一个预设个数阈值,例如5个,或者10个,即如果聚类的结果中初始属性个数小于5个或10个,则将这类聚类结果删除,针对删除之后的多个待处理的聚类结果,依据用户等级和/或初始属性次数等参数,从各聚类结果中选取出最优属性作为有效属性,其中,一个聚类结果对应一个有效属性。
例如,删除了初始属性个数小于预设个数阈值的聚类结果后有10个聚类结果,则从每一个聚类结果中选取出最能表示该类聚类结果的感情的初始属性作为有效属性,最终得到分别与10个聚类结果对应的10个有效属性。其中,用户等级指的是为音频标记内容作为属性的用户的信任程度,例如,达人用户因为登录时间比普通用户的时间更长,因此可以为同一个聚类结果中达人用户所标记的初始属性的内容赋予更高的权重。被标记次数指的是该初始属性被所有用户所标记的总次数,在同一个聚类结果中,被标记次数越高,则对应的初始属性的权重就越高,最终,可以选取同一个聚类结果中权重最高的那个初始属性作为该聚类结果对应的有效属性。
步骤A4:记录各聚类结果中其他初始属性与有效属性的转化关系。
同时,对于各类聚类结果,还可以将其中除了作为有效属性的最优属性之外的其他初始属性,与有效属性之间的转化关系记录下来。例如,在一类聚类结果中有10个初始属性,其中一个初始属性的内容是“伤心”最终作为有效属性,而另外有一个初始属性的内容是“伤感”,则可以记录下“伤感”与“伤心”之间的转化关系,以便后续用户在搜索“伤心”或者该类聚类结果中的其他音频属性的时候,在后台可以用“伤感”来进行搜索,以便能够根据该转化关系更全面覆盖用户的搜索。
步骤103:参考所述有效属性之间是否存在冲突,建立有效属性与音频的关联关系。
在从待关联属性中提取出有效属性之后,依据得到的各个有效属性之间是否存在冲突,来建立各有效属性与音频之间的关联关系。其中,不同的有效属性之间存在冲突,用于表示不同属性所表示的情感所属类别不一致。例如,有效属性同时包括:“伤心”、“高兴”、“激动”等,而“伤心”属于伤感的情感,“高兴”属于开心的情感,则“伤心”与“高兴”之间就有冲突,而“高兴”和属于兴奋的情感的“激动”之间就不存在冲突。在实际应用中,除了为各类别的情感的属性设置类别标识,还可以为存在冲突关系的两类情感标识设置冲突标识,如果两类情感的属性涉及的冲突标识一致(例如,冲突标识都为00),则确定这两类情感的属性存在冲突,反之则确定不存在冲突。当然,以上内容都是示例性方式,不应将其理解为本申请的限定。
在本步骤中,则依据这些有效属性两两之间是否存在冲突,来建立各个有效属性与音频的关联关系,即,各音频都应该与哪些有效属性相关联。
具体的,本步骤的实现可以包括步骤B1~步骤B4:
步骤B1:依据音频与有效属性之间的关系,确定包括所述有效属性的待处理音频。
在本步骤中,针对各个有效属性,从数据库中保存的用户数据中获取包括了一个或多个有效属性的各个音频,作为待处理音频。
步骤B2:从所述待处理音频的有效属性中确定存在冲突的冲突属性对。
针对各个待处理音频,因为可能在同一个音频上出现两个互斥(即存在冲突关系)的属性,从该待处理音频包括的有效属性中确定冲突属性对,其中,冲突属性对包括情绪或者感情等存在冲突关系的两个属性,例如,“伤心”和“高兴”,等等。如果待处理音频中的有效属性中不存在冲突属性对,则可以直接建立音频与有效属性之间的关联关系。
步骤B3:依据冲突属性对涉及的冲突参数,从冲突属性对中确定一目标属性。
在本步骤中,例如,选择由高等级用户标记的属性数据作为目标属性。再例如,选择更多用户标记的属性数据。再例如,选择近期更多用户标记的属性数据。再例如,选择职业背景为音乐相关的用户标记的属性数据。
依据冲突属性对中各属性涉及的用户等级,以及该属性被评论的次数,来从冲突属性对中确定一个属性作为目标属性。例如,对于冲突属性对“伤心”和“高兴”来说,更多的达人用户认为某个音频的感情是“伤心”而非“高兴”,并且属性“伤心”被标记的次数要大于“高兴”被标记的次数,则针对该冲突属性对可以从中选择“伤心”作为目标属性。其中,冲突参数也可以包括用户等级和/或属性次数等。
步骤B4:建立所述音频与所述目标属性之间的关联。
建立音频与目标属性之间的关联,例如,可以采用Key-Value的方式建立两者之间的关联,也可以采用其他方式建立关系,只需要根据目标属性可以关联到相对应的音频,或者能够根据音频关联到其被标记的目标属性即可。
参考图2所示,为对音频和属性进行关联的属性示意图。假设对于一个音频的全部非固有属性为:{电子、激动、伤感、今天是个好天气、悲伤、难过},经过对“今天是个好天气”的过滤,得到该音频的初始属性:{电子、激动、伤感、悲伤、难过}。而通过对初始属性的聚类等,得到该音频的有效属性分别为{电子、激动、伤感},而在这些有效属性中,“激动”和“伤感”属于冲突属性对,因此,从该冲突属性对中决策出一个目标属性为“伤感”。然后就可以建立“伤感”和“电子”与该音频的关联。
在步骤103建立关联关系之后,在实际应用中,还可以对步骤103中的关联关系进行修正,以提高关联关系的准确性,则步骤103之后还可以包括:
步骤104:依据搜索***得到的各有效属性对应音频的点击信息,对所述关联关系进行修正。
在本步骤中,可以从数据库中所有用户数据中的点击数据,该点击可以反映用户在搜索音频时的点击信息,例如:用户在搜索有效属性得到各个音频之后,点击了哪些音频进行了试听,又有哪些音频未被用户点击的信息,以及在一个视频上试听的停留时长,针对哪些音频进行了下载等等。以点击次数为例,例如,假设有效属性“伤心”被用户搜索过,得到了10个音频结果,其中8个音频都被用户点击试听过,而另外2个则未被用户点击试听过,则可以认为未被用户点击的这2个音频并不能与属性“伤心”建立关联。因为用户数据反映了所有用户的点击信息,所以依据点击信息对步骤103建立的关联关系进行修正,就更能保证了关联关系的准确性。
具体的步骤104的实现可以包括:先获得依据历史行为数据(即数据库中保存的历史的用户数据)统计各有效属性作为搜索词进行搜索时,得到的各音频被用户点击的总点击次数,然后判断所述音频的总点击次数是否小于预设阈值,如果是,则删除该有效属性与该搜索结果音频的关联关系。例如,设置一个预设点击阈值为5,则假设搜索“伤心”得到的搜索得到的有音频A,而该音频A被所有用户点击的次数都小于5次,则将该音频A与有效属性“伤心”之间的关联关系进行删除。
通过本实施例建立的关联关系,因为属性可以表示音频的非固有属性,将用户对各个音频所标记的属性内容也作为音频的搜索维度,只要用户输入的内容属于音频的某一个属性,即便输入的内容不在音频的名称或者歌词中,也能因为关联关系的建立而被检索出来,这样就能帮助用户搜索到更关联的音频文件,不仅提高了音频检索的深度和精确度,还提高了用户的音频搜索体验。
在步骤103或者步骤104之后,对于得到的关联关系还可以采用音乐图谱来表示,即将各个音频建立关联的属性,以及各个音频的固有属性都采用音乐图谱来表示,从而更能形象化的表示音频与固有属性或非固有属性等之间的关系。
参考图3,示出了本申请一种音频搜索方法实施例的流程图,本实施例可以包括以下步骤:
步骤301:获取输入的搜索词。
本申请实施例可以应用于音频服务器上。假设用户在音频APP或者音频软件打开了搜索页面,输入“伤感”这个属性,希望搜索到伤感的歌曲试听,则“伤感”就是搜索词。
步骤302:依据预先建立的、有效属性与音频的关联关系,确定与所述搜索词关联的音频。
在本步骤中,音频与有效属性之间的关联关系可以通过图1所示的方式建立。则音频APP可以将“伤感”发送至音频服务器,由音频服务器依据预先建立的有效属性与音频的关联关系,来搜索那些被打了“伤感”属性的音频,作为搜索结果。
步骤303:将所述音频进行展示。
接着服务器可以将搜索结果发送至音频APP的结果显示页面展示给用户。
可见,在本申请实施例中,只要是预先建立的关联关系中包括有某个音频和某个被用户标记的属性,无论用户标记的是音乐流派、还是歌曲情感或者人声分解等等,都可以将其与音频建立关联,从而在用户输入的搜索词与相应的属性匹配时,就可以将属性对应的音频作为搜索结果展示给用户,从而使得给用户提供更符合其需求的音频成为可能。
参考图4,示出了本申请一种数据处理方法实施例的流程图,本实施例可以包括以下步骤:
步骤401:获取对象数据的标记数据。
在本申请实施例中,对象可以是电商领域的商品,则对象数据可以是电商领域的商品数据,而标记数据则可以是用户对商品的评论数据等;或者,对象也可以是直播的音频或视频等,则对象数据可以是音频或视频本身的属性数据,标记数据则可以是在直播过程中用户发出的弹幕数据等。因此,对于一些包括了用户评论等非固有属性的对象,只要能将其评论数据获取到作为标记数据,都可以应用本实施例的方法进行标记数据与对象数据的关联。
在本步骤中,以电商领域的商品为例,获取商品的固有属性,例如商品的简介数据等,以及获取商品的非固有数据例如商品的用户评论数据等,这些固有属性和非固有属性都属于对象数据,再从对象数据中提取出用户评论数据作为标记数据。
步骤402:对所述标记数据进行相似性比较,得到有效标记数据。
在本步骤中,依据各个标记数据之间的相似性即各个标记数据之间的相似程度,来从标记数据中确定出有效标记数据。例如,标记数据“质量好”和“质感不错”通过聚类算法可以聚到同一类中,则可以确定这两个标记数据具有相似性,则可以从这两个标记数据中选取出一个作为有效标记数据。同理,“质量好”和“穿着效果不好”通过聚类算法没有聚到同一类中,则可以确认这两个标记数据不具有相似性,则“穿着效果不好”可以作为另外一个有效标记数据,等待。
具体的,本步骤在实现时可以先获取各个标记数据即用户评论数据所属的对象数据(即商品数据),并依据商品数据中的那些固有属性和非固有属性,来确定各个商品数据相对用户评论数据的权重,例如,商品的大小对于“穿着效果不错”的权重等,以及,用户评论数据在其所属的商品数据中的标记次数,例如,“穿着效果不错”在一件衣服的商品数据中一共被标记了59次等。
然后,依据商品数据的权重和标记次数,通过多分类模型对各个用户评论数据进行聚类(聚类方式可以参考步骤A2的介绍,在此不再赘述),并依据聚类的结果和用户评论数据之间的距离,提取有效标记数据(提取过程可以参考步骤A3的介绍,在此不再赘述)。
步骤403:获取有效标记数据之间的冲突关系。
在有效标记数据即有效用户评论数据中,可能会有一些用户评论数据之间存在冲突。例如,有的用户评论数据为“穿着效果好”,有的用户评论数据为“穿着效果不好”,等等。其中,不同的有效用户评论数据之间存在冲突,用于表示不同有效用户评论数据所表示的用户观点不一致。冲突关系的获取可以参考步骤103的介绍,在此不再赘述。
步骤404:基于所述冲突关系,选择目标标记数据。
在步骤403获取到冲突关系之后,基于冲突关系选择目标标记数据。
具体的,首先,依据对象数据与有效标记数据之间的关系,确定包括有效标记数据的对象数据,例如,有效标记数据为“穿着效果好”、“穿着效果不好”、“质量好”等,则获取到那些包括这些有效标记数据的商品数据。再从这些有效标记数据中确定存在冲突的冲突数据对,例如针对上述有效标记数据,存在冲突的冲突数据对为“穿着效果好”和“穿着效果不好”。然后,依据冲突数据对涉及的用户等级和/或被打标次数,从冲突数据对中确定一目标标记数据。例如,对于“穿着效果好”这个有效标记数据来讲,被打标次数有59次,而“穿着效果不好”被打标次数有8次,且“穿着效果好”被打标时的用户等级为VIP,级别普遍高于“穿着效果不好”被打标时的用户等级,则从该冲突数据对中选择的目标标记数据即为“穿着效果好”。
当然,以上具体数据仅为示例性的内容,不应将其理解为本申请的限定。
步骤405:建立目标标记数据与对象数据的关联关系。
本步骤建立对象数据与目标标记数据之间的关联,例如,可以采用Key-Value的方式建立两者之间的关联,也可以采用其他方式建立关系,只需要根据目标标记数据可以关联到相对应的对象数据,或者能够根据对象数据关联到其被标记的目标标记数据即可。
通过本实施例建立的关联关系,因为用户评论数据等可以表示音频的非固有属性,将用户对各个商品所标记的属性内容也作为商品的搜索维度,只要用户输入的内容属于商品的某一个属性,即便输入的内容不在商品的名称或者简介中,也能因为关联关系的建立而使该商品被检索出来,这样就能帮助用户搜索到更关联的商品,不仅提高了商品检索的深度和精确度,还提高了用户的商品搜索体验。
参考图5,示出了本申请一种数据检索方法实施例的流程图,本实施例可以包括以下步骤:
步骤501:获取检索输入数据,其中,所述检索输入数据为目标标记数据。
在采用图4所示的实施例建立了标记数据与对象数据之间的关联关系之后,可以利用该关联关系对商品等进行搜索,或者利用音视频的弹幕数据对音视频进行搜索等。例如,用户进行商品搜索时输入的搜索内容为“穿着效果好”,则“穿着效果好”就可以作为目标标记数据。
步骤502:基于所述目标标记数据,获取对象数据。
然后根据目标标记数据与对象数据之间的关联关系,获取相对于的对象数据。其中,该关联关系的建立可以采用图4所示的实施例的方式,在此不再赘述。
步骤503:反馈所述对象数据作为检索结果。
接着可以将搜索到的商品或者商品数据等作为检索结果,反馈给用户。
在本实施例中,只要是预先建立的关联关系中包括有某个商品和某个被用户标记的标记数据,无论用户标记的是穿着效果、还是商品质量等,都可以将其与商品建立关联,从而在用户输入的搜索词与相应的用户标记数据进行匹配时,就可以将标记数据对应的商品或者商品数据等作为搜索结果展示给用户,从而使得给用户提供更符合其需求的商品等成为可能。
对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
与上述本申请一种音频与属性的关联方法实施例所提供的方法相对应,参见图6,本申请还提供了一种音频与属性的关联装置实施例,在本实施例中,该装置可以包括:
通信接口601,用于获取待关联的音频的初始属性;
通信总线602,以及,处理器603,通过读取所述存储器604中存储的指令和/或数据,用于执行以下操作:依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;以及,参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系。
其中,所述处理器603用于依据所述初始属性之间的相似性,从所述初始属性中提取有效属性,包括:
针对各初始属性,执行以下获取流程:获取所述初始属性所属的所有音频,并依据各音频的固有属性和非固有属性,确定各音频相对该初始属性的权重;以及,获取所述初始属性在其所属的各音频中的标记次数;
依据所述各音频相对该初始属性的权重和标记次数,通过多分类模型对所述初始属性进行聚类;
依据所述聚类的结果以及各初始属性之间的距离,提取有效属性。
其中,所述处理器603用于依据所述聚类的结果以及各音频属性间的距离,提取有效属性,包括:
从所述聚类的结果中删除所述初始属性的被标记次数小于预设阈值的结果,得到待处理的聚类结果;
依据用户等级和/或被标记次数,从各所述待处理的聚类结果中选取出最优属性作为所述有效属性,一个聚类结果对应一个有效属性;
记录各聚类结果中其他初始属性与所述有效属性的转化关系。
其中,所述处理器603用于参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系,包括:
依据音频与所述有效属性之间的关系,确定包括所述有效属性的待处理音频;
从所述待处理音频的有效属性中确定存在冲突的冲突属性对;
依据所述冲突属性对涉及的冲突参数,从所述冲突属性对中确定一目标属性;所述冲突参数包括:用户等级和/或被打标次数;
建立所述音频与所述目标属性之间的关联。
其中,所述处理器603还可以用于:
依据搜索***得到的各有效属性对应音频的点击信息,对所述关联关系进行修正。
其中,所述处理器603可以用于依据搜索***得到的各音频属性对应音频的点击信息,对所述关联关系进行修正,包括:
依据历史行为数据统计各有效属性作为搜索词进行搜索时,得到的各音频的总点击次数;
判断所述音频的总点击次数是否小于预设阈值,如果是,则删除该有效属性与该音频的关联关系。
其中,所述处理器603还可以用于:
将所述有效属性与音频的关联关系采用音乐图谱进行表示。
参考图7所示,本申请还提供了一种音频搜索装置实施例,在本实施例中,该装置可以包括:
通信接口701,用于获取输入的搜索词;
通信总线702,以及处理器703,通过读取所述存储器704中存储的指令和/或数据,用于执行以下操作:依据预先建立的、有效属性与音频的关联关系,确定与所述搜索词关联的音频;以及,
显示屏705,用于将所述音频进行展示。
其中,所述关联关系可以通过以下方式建立:
获取音频的至少两种初始属性;依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;以及,参考所述有效属性之间的冲突关系,建立所述有效属性与音频的关联关系。
本申请还公开了一种数据处理装置,该数据处理装置可以包括:
通信接口,用于获取对象数据的标记数据;以及,处理器,用于对所述标记数据进行相似性比较,得到有效标记数据;获取有效标记数据之间的冲突关系;基于所述冲突关系,选择目标标记数据;以及,建立所述目标标记数据与所述对象数据的关联关系。
其中,所述处理器用于对所述标记数据进行相似性比较,得到有效标记数据,可以包括:
获取所述标记数据所属的对象数据,并依据所述对象数据固有属性和非固有属性,确定所述对象数据相对所述标记数据的权重,以及,所述标记数据在其所属的对象数据中的标记次数;
依据所述对象数据的权重和标记次数,通过多分类模型对所述标记数据进行聚类;以及,
依据所述聚类的结果和所述标记数据之间的距离,提取有效标记数据。
其中,所述处理器用于基于所述冲突关系,选择目标标记数据,可以包括:
依据所述对象数据与有效标记数据之间的关系,确定包括所述有效标记数据的对象数据;
从所述确定的对象数据的有效标记数据中确定存在冲突的冲突数据对;以及,
依据所述冲突数据对涉及的冲突参数,从所述冲突数据对中确定一目标标记数据;所述冲突参数包括:用户等级和/或被打标次数。
本申请还提供了一种数据检索装置,该装置可以包括:
通信接口,用于获取检索输入数据,其中,所述检索输入数据为目标标记数据;以及,处理器,用于基于所述目标标记数据,获取对象数据;以及,反馈所述对象数据作为检索结果。
其中,所述目标标记数据与所述对象数据的关联关系的建立可以包括以下步骤:
获取对象数据的标记数据;对所述标记数据进行相似性比较,得到有效标记数据;获取有效标记数据之间的冲突关系;基于所述冲突关系,选择目标标记数据;以及,建立所述目标标记数据与所述对象数据的关联关系。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的音频与属性的关联方法及装置、音频搜索方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种音频与属性的关联方法,其特征在于,该方法包括:
获取音频的至少两种初始属性;
依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;
参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系,
其中,所述依据所述初始属性之间的相似性,从所述初始属性中提取有效属性,包括:
针对各初始属性,执行以下获取流程:获取所述初始属性所属的所有音频,并依据各音频的固有属性和非固有属性,确定各音频相对该初始属性的权重;以及,获取所述初始属性在其所属的各音频中的标记次数;
依据所述各音频相对该初始属性的权重和标记次数,通过多分类模型对所述初始属性进行聚类;
依据所述聚类的结果以及各初始属性之间的距离,提取有效属性。
2.根据权利要求1所述的方法,其特征在于,所述依据所述聚类的结果以及各音频属性间的距离,提取有效属性,包括:
从所述聚类的结果中删除所述初始属性的被标记次数小于预设阈值的结果,得到待处理的聚类结果;
依据用户等级和/或被标记次数,从各所述待处理的聚类结果中选取出最优属性作为所述有效属性,一个聚类结果对应一个有效属性;
记录各聚类结果中其他初始属性与所述有效属性的转化关系。
3.根据权利要求1所述的方法,其特征在于,所述参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系,包括:
依据音频与所述有效属性之间的关系,确定包括所述有效属性的待处理音频;
从所述待处理音频的有效属性中确定存在冲突的冲突属性对;
依据所述冲突属性对涉及的冲突参数,从所述冲突属性对中确定一目标属性;所述冲突参数包括:用户等级和/或被打标次数;
建立所述音频与所述目标属性之间的关联。
4.根据权利要求1所述的方法,其特征在于,还包括:
依据搜索***得到的各有效属性对应音频的点击信息,对所述关联关系进行修正。
5.根据权利要求4所述的方法,其特征在于,所述依据搜索***得到的各音频属性对应音频的点击信息,对所述关联关系进行修正,包括:
依据历史行为数据统计各有效属性作为搜索词进行搜索时,得到的各音频的总点击次数;
判断所述音频的总点击次数是否小于预设阈值,如果是,则删除该有效属性与该音频的关联关系。
6.根据权利要求1所述的方法,其特征在于,还包括:
将所述有效属性与音频的关联关系采用音乐图谱进行表示。
7.一种音频搜索方法,其特征在于,该方法包括:
获取输入的搜索词;
依据预先建立的、有效属性与音频的关联关系,确定与所述搜索词关联的音频;将所述音频进行展示,
其中,所述关联关系通过以下方式建立:
获取音频的至少两种初始属性;
依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;
参考所述有效属性之间的冲突关系,建立所述有效属性与音频的关联关系,
其中,所述依据所述初始属性之间的相似性,从所述初始属性中提取有效属性,包括:
针对各初始属性,执行以下获取流程:获取所述初始属性所属的所有音频,并依据各音频的固有属性和非固有属性,确定各音频相对该初始属性的权重;以及,获取所述初始属性在其所属的各音频中的标记次数;
依据所述各音频相对该初始属性的权重和标记次数,通过多分类模型对所述初始属性进行聚类;
依据所述聚类的结果以及各初始属性之间的距离,提取有效属性。
8.一种数据处理方法,其特征在于,包括:
获取对象数据的标记数据;
对所述标记数据进行相似性比较,得到有效标记数据;
获取有效标记数据之间的冲突关系;
基于所述冲突关系,选择目标标记数据;
建立所述目标标记数据与所述对象数据的关联关系,
其中,所述对所述标记数据进行相似性比较,得到有效标记数据,包括:
获取所述标记数据所属的对象数据,并依据所述对象数据固有属性和非固有属性,确定所述对象数据相对所述标记数据的权重,以及,所述标记数据在其所属的对象数据中的标记次数;
依据所述对象数据的权重和标记次数,通过多分类模型对所述标记数据进行聚类;
依据所述聚类的结果和所述标记数据之间的距离,提取有效标记数据。
9.根据权利要求8所述的方法,其特征在于,所述基于所述冲突关系,选择目标标记数据,包括:
依据所述对象数据与有效标记数据之间的关系,确定包括所述有效标记数据的对象数据;
从所述确定的对象数据的有效标记数据中确定存在冲突的冲突数据对;
依据所述冲突数据对涉及的冲突参数,从所述冲突数据对中确定一目标标记数据;所述冲突参数包括:用户等级和/或被打标次数。
10.一种数据检索方法,其特征在于,包括:
获取检索输入数据,其中,所述检索输入数据为目标标记数据;
基于所述目标标记数据,获取对象数据;
反馈所述对象数据作为检索结果,
其中,所述目标标记数据与所述对象数据的关联关系的建立包括:
获取对象数据的标记数据;
对所述标记数据进行相似性比较,得到有效标记数据;
获取有效标记数据之间的冲突关系;
基于所述冲突关系,选择目标标记数据;
建立所述目标标记数据与所述对象数据的关联关系,
其中,所述对所述标记数据进行相似性比较,得到有效标记数据,包括:
获取所述标记数据所属的对象数据,并依据所述对象数据固有属性和非固有属性,确定所述对象数据相对所述标记数据的权重,以及,所述标记数据在其所属的对象数据中的标记次数;
依据所述对象数据的权重和标记次数,通过多分类模型对所述标记数据进行聚类;
依据所述聚类的结果和所述标记数据之间的距离,提取有效标记数据。
11.一种音频与属性的关联装置,其特征在于,包括:
通信接口,用于获取待关联的音频的初始属性;
处理器,用于依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;以及,参考所述有效属性之间的冲突关系,建立有效属性与音频的关联关系,
其中,所述处理器依据所述初始属性之间的相似性,从所述初始属性中提取有效属性,包括:
针对各初始属性,执行以下获取流程:获取所述初始属性所属的所有音频,并依据各音频的固有属性和非固有属性,确定各音频相对该初始属性的权重;以及,获取所述初始属性在其所属的各音频中的标记次数;
依据所述各音频相对该初始属性的权重和标记次数,通过多分类模型对所述初始属性进行聚类;
依据所述聚类的结果以及各初始属性之间的距离,提取有效属性。
12.一种音频搜索装置,其特征在于,包括:
通信接口,用于获取输入的搜索词;
处理器,用于依据预先建立的、有效属性与音频的关联关系,确定与所述搜索词关联的音频;
显示屏,用于将所述音频进行展示,
其中,所述关联关系通过以下方式建立:
获取音频的至少两种初始属性;
依据所述初始属性之间的相似性,从所述初始属性中提取有效属性;
参考所述有效属性之间的冲突关系,建立所述有效属性与音频的关联关系,
其中,所述依据所述初始属性之间的相似性,从所述初始属性中提取有效属性,包括:
针对各初始属性,执行以下获取流程:获取所述初始属性所属的所有音频,并依据各音频的固有属性和非固有属性,确定各音频相对该初始属性的权重;以及,获取所述初始属性在其所属的各音频中的标记次数;
依据所述各音频相对该初始属性的权重和标记次数,通过多分类模型对所述初始属性进行聚类;
依据所述聚类的结果以及各初始属性之间的距离,提取有效属性。
13.一种数据处理装置,其特征在于,包括:
通信接口,用于获取对象数据的标记数据;
处理器,用于对所述标记数据进行相似性比较,得到有效标记数据;获取有效标记数据之间的冲突关系;基于所述冲突关系,选择目标标记数据;以及,建立所述目标标记数据与所述对象数据的关联关系,
其中,所述对所述标记数据进行相似性比较,得到有效标记数据,包括:
获取所述标记数据所属的对象数据,并依据所述对象数据固有属性和非固有属性,确定所述对象数据相对所述标记数据的权重,以及,所述标记数据在其所属的对象数据中的标记次数;
依据所述对象数据的权重和标记次数,通过多分类模型对所述标记数据进行聚类;
依据所述聚类的结果和所述标记数据之间的距离,提取有效标记数据。
14.一种数据检索装置,其特征在于,包括:
通信接口,用于获取检索输入数据,其中,所述检索输入数据为目标标记数据;处理器,用于基于所述目标标记数据,获取对象数据;以及,反馈所述对象数据作为检索结果,
其中,所述目标标记数据与所述对象数据的关联关系的建立包括:
获取对象数据的标记数据;
对所述标记数据进行相似性比较,得到有效标记数据;
获取有效标记数据之间的冲突关系;
基于所述冲突关系,选择目标标记数据;
建立所述目标标记数据与所述对象数据的关联关系,
其中,所述对所述标记数据进行相似性比较,得到有效标记数据,包括:
获取所述标记数据所属的对象数据,并依据所述对象数据固有属性和非固有属性,确定所述对象数据相对所述标记数据的权重,以及,所述标记数据在其所属的对象数据中的标记次数;
依据所述对象数据的权重和标记次数,通过多分类模型对所述标记数据进行聚类;
依据所述聚类的结果和所述标记数据之间的距离,提取有效标记数据。
CN201711137185.0A 2017-11-16 2017-11-16 音频与属性的关联方法及装置、音频搜索方法及装置 Active CN110019921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711137185.0A CN110019921B (zh) 2017-11-16 2017-11-16 音频与属性的关联方法及装置、音频搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711137185.0A CN110019921B (zh) 2017-11-16 2017-11-16 音频与属性的关联方法及装置、音频搜索方法及装置

Publications (2)

Publication Number Publication Date
CN110019921A CN110019921A (zh) 2019-07-16
CN110019921B true CN110019921B (zh) 2023-01-13

Family

ID=67185914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711137185.0A Active CN110019921B (zh) 2017-11-16 2017-11-16 音频与属性的关联方法及装置、音频搜索方法及装置

Country Status (1)

Country Link
CN (1) CN110019921B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113395580B (zh) * 2020-10-08 2022-06-24 广州广迅信息科技有限公司 一种基于视频通信的音视频同步方法
CN112784098A (zh) * 2021-01-28 2021-05-11 百果园技术(新加坡)有限公司 一种音频搜索方法、装置、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149950A (zh) * 2007-11-15 2008-03-26 北京中星微电子有限公司 实现分类播放的媒体播放器及分类播放方法
JP2008186504A (ja) * 2007-01-29 2008-08-14 Matsushita Electric Ind Co Ltd 楽曲ファイル判別方法および装置
CN101925898A (zh) * 2008-01-25 2010-12-22 Nxp股份有限公司 在数据库中组织媒体数据的方法和装置
CN103383694A (zh) * 2012-12-14 2013-11-06 李博文 一种组织、管理、标识音乐文件的***和方法
CN104951485A (zh) * 2014-09-02 2015-09-30 腾讯科技(深圳)有限公司 音乐文件的数据处理方法和装置
CN105550308A (zh) * 2015-12-14 2016-05-04 联想(北京)有限公司 一种信息处理方法,检索方法及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008186504A (ja) * 2007-01-29 2008-08-14 Matsushita Electric Ind Co Ltd 楽曲ファイル判別方法および装置
CN101149950A (zh) * 2007-11-15 2008-03-26 北京中星微电子有限公司 实现分类播放的媒体播放器及分类播放方法
CN101925898A (zh) * 2008-01-25 2010-12-22 Nxp股份有限公司 在数据库中组织媒体数据的方法和装置
CN103383694A (zh) * 2012-12-14 2013-11-06 李博文 一种组织、管理、标识音乐文件的***和方法
CN104951485A (zh) * 2014-09-02 2015-09-30 腾讯科技(深圳)有限公司 音乐文件的数据处理方法和装置
CN105550308A (zh) * 2015-12-14 2016-05-04 联想(北京)有限公司 一种信息处理方法,检索方法及电子设备

Also Published As

Publication number Publication date
CN110019921A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
Levy et al. Music information retrieval using social tags and audio
CN105956053B (zh) 一种基于网络信息的搜索方法及装置
TWI631474B (zh) Method and device for product identification label and method for product navigation
CN109710841B (zh) 评论推荐方法和装置
TWI553494B (zh) 基於多模態融合之智能高容錯視頻識別系統及其識別方法
Chang et al. Large-scale multimodal semantic concept detection for consumer video
Hyung et al. Music recommendation using text analysis on song requests to radio stations
US20070276733A1 (en) Method and system for music information retrieval
US20070282860A1 (en) Method and system for music information retrieval
Liu et al. Background music recommendation based on latent factors and moods
JP2011039811A (ja) 情報処理装置、情報処理方法、およびプログラム
CN107665188B (zh) 一种语义理解方法及装置
CN111090771B (zh) 歌曲搜索方法、装置及计算机存储介质
Wang et al. Are tags better than audio features? The effect of joint use of tags and audio content features for artistic style clustering
CN107145509B (zh) 一种信息搜索方法及其设备
JP2011165131A (ja) 情報処理装置および方法、並びにプログラム
TW200834355A (en) Information processing apparatus and method, and program
Knees et al. Music retrieval and recommendation: A tutorial overview
Celma et al. If you like radiohead, you might like this article
Hyung et al. Utilizing context-relevant keywords extracted from a large collection of user-generated documents for music discovery
CN110019921B (zh) 音频与属性的关联方法及装置、音频搜索方法及装置
Oh et al. Music mood classification using intro and refrain parts of lyrics
US9569532B1 (en) Melody recognition systems
CN103136221B (zh) 一种生成需求模板的方法、需求识别的方法及其装置
CN109992694A (zh) 一种音乐智能推荐方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40010890

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant