CN114420158A - 模型训练方法及装置、目标频响信息确定方法及装置 - Google Patents
模型训练方法及装置、目标频响信息确定方法及装置 Download PDFInfo
- Publication number
- CN114420158A CN114420158A CN202110944000.7A CN202110944000A CN114420158A CN 114420158 A CN114420158 A CN 114420158A CN 202110944000 A CN202110944000 A CN 202110944000A CN 114420158 A CN114420158 A CN 114420158A
- Authority
- CN
- China
- Prior art keywords
- frequency response
- target frequency
- audio file
- response information
- information corresponding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004044 response Effects 0.000 title claims abstract description 202
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012549 training Methods 0.000 title claims abstract description 56
- 238000012545 processing Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000003454 tympanic membrane Anatomy 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请提供了一种模型训练方法及装置、目标频响信息确定方法及装置,涉及数据处理技术领域。该模型训练方法包括:确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息;建立初始网络模型,并基于多个音频文件样本和多个音频文件样本各自对应的目标频响信息训练初始网络模型,得到目标频响模型。其中,目标频响模型用于基于待播放音频文件确定待播放音频文件对应的目标频响信息。本申请实施例能够利用多个音频文件样本和多个音频文件样本各自对应的目标频响信息定制所生成的目标频响模型的特性,进而进一步满足针对目标频响信息的个性化需求。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及模型训练方法及装置、目标频响信息确定方法及装置。
背景技术
近年来,随着智能科技的迅速发展,无线耳机凭借其无需借助耳机线的优势,日益受到广泛关注,尤其是真无线立体声(True Wireless Stereo,TWS)耳机。
然而,在利用无线耳机播放音频文件时,音频文件对应的频响信息(即目标频响信息)能够极大影响音频文件的音质效果,进而降低用户体验好感度。
发明内容
为了解决上述技术问题,提出了本申请。本申请实施例提供了一种模型训练方法及装置、目标频响信息确定方法及装置。
第一方面,本申请一实施例提供了一种模型训练方法,该模型训练方法包括:确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息;建立初始网络模型,并基于多个音频文件样本和多个音频文件样本各自对应的目标频响信息训练初始网络模型,得到目标频响模型。其中,目标频响模型用于基于待播放音频文件确定待播放音频文件对应的目标频响信息。
结合第一方面,在第一方面的某些实现方式中,确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息,包括:基于用户的历史播放数据,确定用户对应的多个历史音频文件和多个历史音频文件各自对应的目标频响信息;基于多个历史音频文件确定多个音频文件样本,并且,基于多个历史音频文件各自对应的目标频响信息确定多个音频文件样本各自对应的目标频响信息。
结合第一方面,在第一方面的某些实现方式中,确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息,包括:确定多个音频文件样本;基于多个音频文件样本确定多个音频文件样本各自对应的音频特征信息;基于多个音频文件样本各自对应的音频特征信息确定多个音频文件样本各自对应的目标频响信息。
结合第一方面,在第一方面的某些实现方式中,音频特征信息包括曲种信息、曲风信息、音乐人信息、专辑信息和词句信息中的至少一种信息。
结合第一方面,在第一方面的某些实现方式中,上述提及的模型训练方法在与耳机连接的云端服务器中执行。
第二方面,本申请一实施例提供了一种目标频响信息确定方法,该目标频响信息确定方法包括:确定目标频响模型,其中,所述目标频响模型利用上述第一方面提及的模型训练方法训练得到;利用目标频响模型,确定待播放音频文件对应的目标频响信息,以便基于待播放音频文件对应的目标频响信息播放待播放文件。
第三方面,本申请一实施例提供了一种模型训练装置,该模型训练装置包括:样本确定模块,用于确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息;训练模块,用于建立初始网络模型,并基于多个音频文件样本和多个音频文件样本各自对应的目标频响信息训练初始网络模型,得到目标频响模型。其中,目标频响模型用于基于待播放音频文件确定待播放音频文件对应的目标频响信息。
第四方面,本申请一实施例提供了一种目标频响信息确定装置,该目标频响信息确定装置包括:模型确定模块,用于确定目标频响模型,其中,目标频响模型利用上述第一方面提及的模型训练方法训练得到;目标频响信息确定模块,用于利用目标频响模型,确定待播放音频文件对应的目标频响信息,以便基于待播放音频文件对应的目标频响信息播放待播放文件。
第五方面,本申请一实施例提供了一种计算机可读存储介质,该存储介质存储有计算机程序,所述计算机程序用于执行上述第一方面和/或第二方面所提及的方法。
第六方面,本申请一实施例提供了一种电子设备,该电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于执行上述第一方面和/或第二方面所提及的方法。
本申请实施例提供的模型训练方法,能够借助多个音频文件样本和多个音频文件样本各自对应的目标频响信息训练初始网络模型,进而得到能够确定待播放音频文件对应的目标频响信息的目标频响模型。与所有待播放音频文件均对应同一目标频响信息的现有技术相比,本申请实施例能够充分顾及待播放音频文件的实际情况,进而利用目标频响模型确定与待播放音频文件更契合的目标频响信息,降低了用户反复调试的几率。换言之,本申请实施例能够利用多个音频文件样本和多个音频文件样本各自对应的目标频响信息定制所生成的目标频响模型的特性,进而进一步满足针对目标频响信息的个性化需求。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1所示为本申请一示例性实施例提供的模型训练方法的流程示意图。
图2所示为本申请一示例性实施例提供的确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息的流程示意图。
图3所示为本申请另一示例性实施例提供的确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息的流程示意图。
图4所示为本申请一示例性实施例提供的目标频响信息确定方法的流程示意图。
图5所示为本申请一示例性实施例提供的模型训练装置的结构示意图。
图6所示为本申请一示例性实施例提供的目标频响信息确定装置的结构示意图。
图7所示为本申请一示例性实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1所示为本申请一示例性实施例提供的模型训练方法的流程示意图。如图1所示,本申请实施例提供的模型训练方法包括如下步骤。
步骤S100,确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息。
示例性地,目标频响信息代表耳机蓝牙接收的数字音频由电信号最终转换为人耳鼓膜接收的声信号所经过的***(包含电路与空间)的频率响应信息。
在本申请实施例中,音频文件样本对应的目标频响信息可以是用户预先设定的,也可以是根据用户的历史播放习惯自动生成的。即,可以理解为,不同的待播放音频文件对应有不同的目标频响信息。举例说明,当无线耳机的播放音频由音频文件A被切换至音频文件B时,目标频响信息也会随之切换,由音频文件A对应的目标频响信息切换至音频文件B对应的目标频响信息。
示例性地,用户可通过如下方式确定待播放音频文件对应的目标频响信息。下述方式均是以音频文件A切换至音频文件B为例进行的解释说明。
a.用户通过预设手势操控无线耳机进行音频文件的切换操作,无线耳机本地响应该切换指令,并获得音频文件B对应的目标频响信息,进而无线耳机本地根据音频文件B对应的目标频响信息确定并调整均衡器的均衡参数。
b.用户通过无线耳机应用程序进行音频文件的切换操作,无线耳机本地响应该切换指令,并获得音频文件B对应的目标频响信息,进而无线耳机本地根据音频文件B对应的目标频响信息确定并调整均衡器的均衡参数。
c.用户通过无线耳机应用程序进行音频文件的切换操作,电子设备端获得音频文件B对应的目标频响信息,并根据音频文件B对应的目标频响信息确定均衡器的均衡参数,从而发送至无线耳机本地进行均衡参数的调整操作。
步骤S200,建立初始网络模型,并基于多个音频文件样本和多个音频文件样本各自对应的目标频响信息训练初始网络模型,得到目标频响模型。其中,目标频响模型用于基于待播放音频文件确定待播放音频文件对应的目标频响信息。
示例性地,步骤S200中提及的目标频响模型为深度学习网络模型。在一些实施例中,目标频响模型的输入数据为待播放音频文件,输出数据为待播放音频文件对应的目标频响信息。
在实际应用过程中,首先确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息,继而建立初始网络模型,并基于多个音频文件样本和多个音频文件样本各自对应的目标频响信息训练初始网络模型,得到目标频响模型。
本申请实施例提供的模型训练方法,能够借助多个音频文件样本和多个音频文件样本各自对应的目标频响信息训练初始网络模型,进而得到能够确定待播放音频文件对应的目标频响信息的目标频响模型。与所有待播放音频文件均对应同一目标频响信息的现有技术相比,本申请实施例能够充分顾及待播放音频文件的实际情况,进而利用目标频响模型确定与待播放音频文件更契合的目标频响信息,降低了用户反复调试的几率。换言之,本申请实施例能够利用多个音频文件样本和多个音频文件样本各自对应的目标频响信息定制所生成的目标频响模型的特性,进而进一步满足针对目标频响信息的个性化需求。
在一些实施例中,基于目标频响信息确定均衡器的均衡参数,包括:确定无线耳机的扬声路径传递函数信息,基于目标频响信息和扬声路径传递函数信息确定均衡参数。本申请实施例通过对待播放音频文件进行频谱均衡操作的方式,能够优化待播放音频文件的音质,从而使待播放音频文件以优化后的音质的状态进行播放。
示例性地,扬声路径传递函数信息基于扬声器输入端至人耳鼓膜之间的电声转换***的频率响应确定。
示例性地,目标频响信息为Tg(f),扬声路径传递函数信息为G(f),均衡参数为EQe(f)。那么,目标频响信息与扬声路径传递函数信息的比值即为均衡参数,即下述公式(1)。
在实际应用过程中,首先确定待播放音频文件对应的目标频响信息,继而确定无线耳机的扬声路径传递函数信息,然后基于目标频响信息和扬声路径传递函数信息确定均衡参数。
进一步地,在一些实施例中,可根据用户的自定义均衡参数更新上述实施例确定的均衡参数。具体地,主要步骤包括:获取用户的自定义均衡参数,基于自定义均衡参数确定待播放音频文件对应的均衡参数。
在本申请一实施例中,用户的自定义均衡参数由用户主观调节虚拟均衡器而生成。示例性地,用户在无线耳机应用程序中根据个性化需求调节虚拟均衡器,即可生成对应的自定义均衡参数。
在本申请一实施例中,当获取用户的自定义均衡参数后,电子设备将该自定义均衡参数发送至无线耳机本地,无线耳机基于自定义均衡参数和用户自定义调节前的均衡参数确定用户自定义调节后的均衡参数。
示例性地,用户的自定义均衡参数为EQa(f),目标频响信息为Tg(f),用户自定义调节前的均衡参数为EQe(f),用户自定义调节后的均衡参数为EQ’e(f),公式表示如下。
EQa(f)·EQe(f)·G(f)=EQ’e(f)·G(f)=EQa(f)·Tg(f) (2)
基于公式(2)可知,当用户未调节虚拟均衡器时,均衡参数被设置为目标频响信息为Tg(f),在用户调节虚拟均衡器后,调节后的均衡参数被设置为EQ’e(f)=EQa(f)·EQe(f),调节后的目标频响信息被设置为Tg’(f)=EQa(f)·Tg(f),其中,Tg’(f)可视为目标频响信息Tg(f)经用户自定义调节后的专用目标频响信息。
本申请实施例提供的音频处理方法,能够支持用户自定义均衡参数,进而能够满足用户的即兴要求,从而进一步提高了用户的听觉体验。
下面结合图2和图3举例说明确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息的具体实现方式。
图2所示为本申请一示例性实施例提供的确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息的流程示意图。在图1所示实施例基础上延伸出图2所示实施例,下面着重叙述图2所示实施例与图1所示实施例的不同之处,相同之处不再赘述。
如图2所示,在本申请实施例提供的模型训练方法中,确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息步骤,包括如下步骤。
步骤S110,基于用户的历史播放数据,确定用户对应的多个历史音频文件和多个历史音频文件各自对应的目标频响信息。
示例性地,基于用户对应的用户终端中的音乐播放器,获取用户的历史播放数据,并从历史播放数据中解析出多个历史音频文件和多个历史音频文件各自对应的目标频响信息。由于历史音频文件对应的目标频响信息是从用户的历史播放数据中解析得到的,因此,可以理解,所确定的目标频响信息是经用户认可或调整的、符合用户喜好的目标频响信息。
步骤S120,基于多个历史音频文件确定多个音频文件样本,并且,基于多个历史音频文件各自对应的目标频响信息确定多个音频文件样本各自对应的目标频响信息。
示例性地,将多个历史音频文件确定为多个音频文件样本,并且,将多个历史音频文件各自对应的目标频响信息确定为多个音频文件样本各自对应的目标频响信息。
本申请实施例提供的模型训练方法,通过基于用户的历史播放数据,确定用户对应的多个历史音频文件和多个历史音频文件各自对应的目标频响信息,继而基于多个历史音频文件确定多个音频文件样本,并且,基于多个历史音频文件各自对应的目标频响信息确定多个音频文件样本各自对应的目标频响信息的方式,实现了确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息的目的。如前所述,由于用于训练模型的音频文件样本和音频文件样本对应的目标频响信息是基于用户的历史播放数据确定的,因此,本申请实施例能够使目标频响模型学习到用户的偏好等信息,进而使基于目标频响模型确定的目标频响信息更符合用户需求。
基于上述图2所示实施例,在一示例性应用场景中,将用户划分为少年、青年和老年三种类型,并分别获取三种类型的用户各自的历史播放数据,进而分别训练得到三种类型的用户各自对应的目标频响模型。如此设置,能够根据用户的具体类型为用户选取合适的目标频响模型,进而在保证用户与目标频响模型的匹配度的前提下,避免了针对每位新用户均重新训练模型的情况,且也能够避免在新用户没有历史播放数据的情况下,不能为其匹配合适的目标频响模型的情况。
图3所示为本申请另一示例性实施例提供的确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息的流程示意图。在图1所示实施例基础上延伸出图3所示实施例,下面着重叙述图3所示实施例与图1所示实施例的不同之处,相同之处不再赘述。
如图3所示,在本申请实施例提供的模型训练方法中,确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息步骤,包括如下步骤。
步骤S130,确定多个音频文件样本。
步骤S140,基于多个音频文件样本确定多个音频文件样本各自对应的音频特征信息。
示例性地,音频特征信息包括曲种信息、曲风信息、音乐人信息、专辑信息和词句信息中的至少一种信息。
步骤S150,基于多个音频文件样本各自对应的音频特征信息确定多个音频文件样本各自对应的目标频响信息。
在一些实施例中,基于音频文件样本对应的曲风信息,确定音频文件样本对应的目标频响信息。在另外一些实施例中,基于音频文件样本对应的曲种信息,确定音频文件样本对应的目标频响信息。
本申请实施例提供的模型训练方法,通过确定多个音频文件样本,基于多个音频文件样本确定多个音频文件样本各自对应的音频特征信息,继而基于多个音频文件样本各自对应的音频特征信息确定多个音频文件样本各自对应的目标频响信息的方式,实现了确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息的目的。由于音频文件样本对应的音频特征信息能够表征音频文件样本的音频特性,因此,本申请实施例所确定的目标频响信息能够充分顾及音频文件样本的音频特性,进而能够使后续训练得到的目标频响模型具备更高地精准度。
可选地,上述实施例提及的模型训练方法在与耳机连接的云端服务器中执行。也就是说,云端服务器利用多个音频文件样本和多个音频文件样本各自对应的目标频响信息训练初始网络模型,进而得到以供耳机和/或用户终端调用的目标频响模型。如此设置,不仅能够极大降低耳机和/或用户终端的计算量,而且在多个耳机和/或用户终端共用同一云端服务器时,能够极大优化资源配置,避免资源浪费的情况。
图4所示为本申请一示例性实施例提供的目标频响信息确定方法的流程示意图。示例性地,本申请实施例提供的目标频响信息可在用户终端或耳机中执行。如图4所示,本申请实施例提供的目标频响信息确定方法包括如下步骤。
步骤S300,确定目标频响模型。
示例性地,步骤S300提及的目标频响模型利用上述任一实施例提及的模型训练方法训练得到。
步骤S400,利用目标频响模型,确定待播放音频文件对应的目标频响信息,以便基于待播放音频文件对应的目标频响信息播放待播放文件。
在一些实施例中,在步骤S400之后,还包括基于待播放音频文件对应的目标频响信息播放待播放文件。
本申请实施例提供的目标频响信息确定方法,通过确定目标频响模型,继而利用目标频响模型,确定待播放音频文件对应的目标频响信息,以便基于待播放音频文件对应的目标频响信息播放待播放文件的方式,实现了基于待播放音频文件的自身特性确定与其匹配的目标频响信息的目的。
上文结合图1至图4,详细描述了本申请的方法实施例,下面结合图5至图7,详细描述本申请的装置实施例。应理解,方法实施例的描述与装置实施例的描述相互对应,因此,未详细描述的部分可以参见前面方法实施例。
图5所示为本申请一示例性实施例提供的模型训练装置的结构示意图。如图5所示,本申请实施例提供的模型训练装置包括:样本确定模块100和训练模块200。样本确定模块100用于确定多个音频文件样本和多个音频文件样本各自对应的目标频响信息。训练模块200用于建立初始网络模型,并基于多个音频文件样本和多个音频文件样本各自对应的目标频响信息训练初始网络模型,得到目标频响模型。其中,目标频响模型用于基于待播放音频文件确定待播放音频文件对应的目标频响信息。
在一些实施例中,样本确定模块100还用于基于用户的历史播放数据,确定用户对应的多个历史音频文件和多个历史音频文件各自对应的目标频响信息,继而基于多个历史音频文件确定多个音频文件样本,并且,基于多个历史音频文件各自对应的目标频响信息确定多个音频文件样本各自对应的目标频响信息。
在一些实施例中,样本确定模块100还用于确定多个音频文件样本,基于多个音频文件样本确定多个音频文件样本各自对应的音频特征信息,继而基于多个音频文件样本各自对应的音频特征信息确定多个音频文件样本各自对应的目标频响信息。
图6所示为本申请一示例性实施例提供的目标频响信息确定装置的结构示意图。如图6所示,本申请实施例提供的目标频响信息确定装置包括:模型确定模块300和目标频响信息确定模块400。模型确定模块300用于确定目标频响模型。目标频响信息确定模块400用于利用目标频响模型,确定待播放音频文件对应的目标频响信息,以便基于待播放音频文件对应的目标频响信息播放待播放文件。
下面,参考图7来描述根据本申请实施例的电子设备。图7所示为本申请一示例性实施例提供的电子设备的结构示意图。如图7所示,本申请实施例提供的电子设备500包括一个或多个处理器510和存储器520。
处理器510可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备500中的其他组件以执行期望的功能。
存储器520可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器510可以运行所述程序指令,以实现上文所述的本申请的各个实施例的模型训练方法和/或目标频响信息确定方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如音频文件样本等各种内容。
在一个示例中,电子设备500还可以包括:输入装置530和输出装置540,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
该输入装置530可以包括例如音频切换按键等等。
该输出装置540可以向外部输出各种信息,包括待播放音频文件对应的目标频响信息等。该输出装置540可以包括例如显示器、通信网络、扬声器及其所连接的远程输出设备等等。
当然,为了简化,图7中仅示出了该电子设备500中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备500还可以包括任何其他适当的组件。
示例性地,电子设备500可以为音箱、录音笔以及助听器中的至少一种。
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的模型训练方法和/或目标频响信息确定方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的模型训练方法和/或目标频响信息确定方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种模型训练方法,其特征在于,包括:
确定多个音频文件样本和所述多个音频文件样本各自对应的目标频响信息;
建立初始网络模型,并基于所述多个音频文件样本和所述多个音频文件样本各自对应的目标频响信息训练所述初始网络模型,得到目标频响模型,其中,所述目标频响模型用于基于待播放音频文件确定所述待播放音频文件对应的目标频响信息。
2.根据权利要求1所述的模型训练方法,其特征在于,所述确定多个音频文件样本和所述多个音频文件样本各自对应的目标频响信息,包括:
基于用户的历史播放数据,确定所述用户对应的多个历史音频文件和所述多个历史音频文件各自对应的目标频响信息;
基于所述多个历史音频文件确定所述多个音频文件样本,并且,基于所述多个历史音频文件各自对应的目标频响信息确定所述多个音频文件样本各自对应的目标频响信息。
3.根据权利要求1所述的模型训练方法,其特征在于,所述确定多个音频文件样本和所述多个音频文件样本各自对应的目标频响信息,包括:
确定多个音频文件样本;
基于所述多个音频文件样本确定所述多个音频文件样本各自对应的音频特征信息;
基于所述多个音频文件样本各自对应的音频特征信息确定所述多个音频文件样本各自对应的目标频响信息。
4.根据权利要求3所述的模型训练方法,其特征在于,所述音频特征信息包括曲种信息、曲风信息、音乐人信息、专辑信息和词句信息中的至少一种信息。
5.根据权利要求1至4任一项所述的模型训练方法,其特征在于,所述模型训练方法在与耳机连接的云端服务器中执行。
6.一种目标频响信息确定方法,其特征在于,包括:
确定目标频响模型,其中,所述目标频响模型利用上述权利要求1至5任一项所述的模型训练方法训练得到;
利用所述目标频响模型,确定待播放音频文件对应的目标频响信息,以便基于所述待播放音频文件对应的目标频响信息播放所述待播放文件。
7.一种模型训练装置,其特征在于,包括:
样本确定模块,用于确定多个音频文件样本和所述多个音频文件样本各自对应的目标频响信息;
训练模块,用于建立初始网络模型,并基于所述多个音频文件样本和所述多个音频文件样本各自对应的目标频响信息训练所述初始网络模型,得到目标频响模型,其中,所述目标频响模型用于基于待播放音频文件确定所述待播放音频文件对应的目标频响信息。
8.一种目标频响信息确定装置,其特征在于,包括:
模型确定模块,用于确定目标频响模型,其中,所述目标频响模型利用上述权利要求1至5任一项所述的模型训练方法训练得到;
目标频响信息确定模块,用于利用所述目标频响模型,确定待播放音频文件对应的目标频响信息,以便基于所述待播放音频文件对应的目标频响信息播放所述待播放文件。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有指令,当所述指令由电子设备的处理器执行时,使得所述电子设备能够执行上述权利要求1至6任一项所述的方法。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述计算机可执行指令的存储器;
所述处理器,用于执行所述计算机可执行指令,以实现上述权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110944000.7A CN114420158A (zh) | 2021-08-17 | 2021-08-17 | 模型训练方法及装置、目标频响信息确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110944000.7A CN114420158A (zh) | 2021-08-17 | 2021-08-17 | 模型训练方法及装置、目标频响信息确定方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114420158A true CN114420158A (zh) | 2022-04-29 |
Family
ID=81260663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110944000.7A Pending CN114420158A (zh) | 2021-08-17 | 2021-08-17 | 模型训练方法及装置、目标频响信息确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114420158A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116156390A (zh) * | 2023-04-18 | 2023-05-23 | 荣耀终端有限公司 | 一种音频处理方法和电子设备 |
-
2021
- 2021-08-17 CN CN202110944000.7A patent/CN114420158A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116156390A (zh) * | 2023-04-18 | 2023-05-23 | 荣耀终端有限公司 | 一种音频处理方法和电子设备 |
CN116156390B (zh) * | 2023-04-18 | 2023-09-12 | 荣耀终端有限公司 | 一种音频处理方法和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9613028B2 (en) | Remotely updating a hearing and profile | |
CN106664473B (zh) | 信息处理装置、信息处理方法和程序 | |
CN1972524B (zh) | 再现音乐文件的方法和设备 | |
EP3867741B1 (en) | Conversation assistance audio device personalization | |
WO2019033987A1 (zh) | 提示方法、装置、存储介质及终端 | |
WO2019033438A1 (zh) | 音频信号调节方法、装置、存储介质及终端 | |
CN112118485B (zh) | 音量自适应调整方法、***、设备及存储介质 | |
EP3678388A1 (en) | Customized audio processing based on user-specific and hardware-specific audio information | |
US11595766B2 (en) | Remotely updating a hearing aid profile | |
WO2019233361A1 (zh) | 对音乐进行音量调节的方法及设备 | |
US9053710B1 (en) | Audio content presentation using a presentation profile in a content header | |
WO2021238458A1 (zh) | 扬声设备音质的优化方法 | |
US20210306734A1 (en) | Hearing sensitivity acquisition methods and devices | |
CN112687286A (zh) | 音频设备的降噪模型的调整方法和装置 | |
CN114420158A (zh) | 模型训练方法及装置、目标频响信息确定方法及装置 | |
WO2020019844A1 (zh) | 语音数据处理方法及相关产品 | |
WO2024067782A1 (zh) | 声场扩展方法、音频设备及计算机可读存储介质 | |
CN111800699B (zh) | 音量调节提示方法、装置、耳机设备及存储介质 | |
CN114257910A (zh) | 音频处理方法及装置、计算机可读存储介质及电子设备 | |
CN113518284A (zh) | 音频处理方法、无线耳机及计算机可读存储介质 | |
CN113596677A (zh) | 参数确定方法及无线耳机、存储介质及电子设备 | |
CN114586378A (zh) | 用于入耳式麦克风阵列的部分hrtf补偿或预测 | |
KR101051036B1 (ko) | 사용자 개개인의 청력에 맞추어 오디오 기기의 음질을 제어하는 장치 및 방법 | |
CN113613142A (zh) | 音频处理方法及无线耳机 | |
JP6954905B2 (ja) | オーディオ信号を出力するためのシステム及びそれぞれの方法と設定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |