CN116743925B - 一种***的生产***及方法 - Google Patents

一种***的生产***及方法 Download PDF

Info

Publication number
CN116743925B
CN116743925B CN202311021494.7A CN202311021494A CN116743925B CN 116743925 B CN116743925 B CN 116743925B CN 202311021494 A CN202311021494 A CN 202311021494A CN 116743925 B CN116743925 B CN 116743925B
Authority
CN
China
Prior art keywords
audio
user
interval
file
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311021494.7A
Other languages
English (en)
Other versions
CN116743925A (zh
Inventor
冯昊怡
杨震宇
王浩
谢文津
侯荡荡
刘文博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Chaofa Network Technology Co ltd
Original Assignee
Tianjin Chaofa Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Chaofa Network Technology Co ltd filed Critical Tianjin Chaofa Network Technology Co ltd
Priority to CN202311021494.7A priority Critical patent/CN116743925B/zh
Publication of CN116743925A publication Critical patent/CN116743925A/zh
Application granted granted Critical
Publication of CN116743925B publication Critical patent/CN116743925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M19/00Current supply arrangements for telephone systems
    • H04M19/02Current supply arrangements for telephone systems providing ringing current or supervisory tones, e.g. dialling tone or busy tone
    • H04M19/04Current supply arrangements for telephone systems providing ringing current or supervisory tones, e.g. dialling tone or busy tone the ringing-current being generated at the substations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72442User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for playing music files
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用于音频处理技术领域,提供了一种***的生产***及方法,所述***包括:文件识别模块、信息收集模块、音频加工模块和铃声提取模块。整个铃声制作流程可以实现自动化,大大简化了用户的操作流程。通过识别用户选择的音频文件的音频信息和音频波形,***可以在网络中搜索相似的音频信息,并根据每个铃声区间在网络中的选取率向用户推荐铃声选取区间。这样可以提供个性化的推荐,帮助用户更快速地找到符合自己喜好的铃声区间。可以识别用户所选取的音频区间,并获取当前音频区间两端的音频信息和音频波形。通过对选取的区间端点进行自动调整,可以确保选取的区间在音频上的连续性和平滑性,提高铃声的质量和听感。

Description

一种***的生产***及方法
技术领域
本发明属于音频处理技术领域,尤其涉及一种***的生产***及方法。
背景技术
音频处理技术是指对音频信号进行各种处理和操作的技术方法和工具如:对音频信号进行剪辑、裁剪或分割,选择所需的部分;将多个音频信号混合在一起,创建新的音频合成;通过调整音频频谱中的不同频段的增益,改变音频的音色和平衡;应用各种音频效果器,如混响、均衡器、压缩器、失真器等,改变音频的声音特性;通过使用降噪算法和滤波器,减少或消除背景噪音和杂音;通过应用声音增强算法和音频修复技术,提升音频的清晰度、音质和音量;将音频信号转换为不同的音频格式,以适应不同的播放设备和应用场景。
这些音频处理技术可以应用于音乐制作、语音识别、音频编辑、音频修复、音频传输等领域,为用户提供更好的音频体验和应用效果。
在音频处理技术领域中,通过上述方式对音频进行加工处理,通过剪切、裁剪或分割音频文件来选择所需的铃声部分,用户可以精确地选择起始和结束时间,以获得符合个人喜好的铃声长度。
当用户想要选取一段音频作为铃声时,只能够自己手动选取想要的区间,虽然符合用户自己的喜好,用户无法得知自己所选取的区间是否是该音频的最佳区间,且选取区间后,由于移动端的操作不便,手指的选取精度有限,虽然截取出的音频片段处于一个合理区间,但是对于端点处的划分不够精细,且在移动端的细化调整难度较大,容易导致选取的音频区间连贯性差,同时在对多个音频进行处理时,无法将其合成,功能性差。
发明内容
本发明实施例的目的在于提供一种***的生产***,旨在解决背景技术中确定的现有技术存在的技术问题。
本发明实施例是这样实现的,一种***的生产***,所述***包括:
文件识别模块,用于获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形;
信息收集模块,用于依据所识别出的音频信息和音频波形,获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间;
音频加工模块,用于识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,并输出音频;
铃声提取模块,用于将输出的音频转换为铃声文件。
作为本发明更近一步的方案,所述文件识别模块具体包括:
读取单元,用于获取用户选择的全部音频文件,包括但不限于用户自主录制的音频文件和上传的音频文件;
解码单元,用于通过音频处理框架读取音频文件,并对其进行解码,将音频文件转换为数字音频信号;
信息提取单元,用于对数字音频信号进行提取,获取音频的基本信息,所述基本信息包括但不限于采样率、声道数和比特率;
波形转化单元,用于将数字音频信号转换为波形图,其中波形图以时间为横轴,以音频信号的振幅为纵轴。
作为本发明更近一步的方案,所述信息收集模块具体包括:
模型建立单元,用于根据网络存在的音频数据,构建音频相似性模型;
数据计算单元,用于通过音频相似性模型计算比较用户所选择的音频文件与网络中的音频数据之间的相似度,并依据相似度数据识别出该音频在网络中的数据;
推荐单元,用于当识别出音频文件在网络中无数据记录时,将该音频文件定义为个人音频,同时根据音频波形将音频进行节奏划分,并将划分后的音频段落进行编号并推荐给用户;
当识别出该音频文件在网络中的音频信息时,分析网络用户针对该音频文件所选择的铃声区间,并根据每个铃声区间的选取率向用户按序推荐。
作为本发明更近一步的方案,所述音频加工模块具体包括:
区间识别单元,用于识别用户针对某音频文件所选取的音频区间,并获取该音频文件中处于该音频区间两端的音频信息和音频波形;
自动修整单元,用于识别音频区间两端的音频连续性,并自动对选取的区间端点进行调整;
合成单元,用于当用户选取多个音频文件时,获取用户的合成指令,并根据用户的合成指令对多个音频文件进行加工,加工步骤如下:其中,/>为最终输出音频, />表示需要连接的音频文件,/>、/> 表示需要相互叠加的音频文件。
作为本发明更近一步的方案,所述识别音频区间两端的音频连续性,具体包括:
根据音频信号特性设定阈值,并获取音频的短时过零率,获取公式为:其中/>表示音频信号的采样值,/>表示短时段内的采样点数;判断用户所选取的音频区间端点处的短时过零率/>与阈值的大小,当短时过零率/>大于阈值时,则直接在该端点处对音频进行截断;
当短时过零率小于阈值时,根据音频信息和音频波形,向当短时过零率/>增大的一侧移动区间端点,直至端点处的短时过零率/>大于阈值,并在此区间的端点处对音频进行截断。
本发明实施例的另一目的在于提供一种***的生产方法,所述方法包括:
获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形;
依据所识别出的音频信息和音频波形,获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间;
识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,并输出音频;
将输出的音频转换为铃声文件。
作为本发明更近一步的方案,所述获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形,具体包括:
获取用户选择的全部音频文件,包括但不限于用户自主录制的音频文件和上传的音频文件;
通过音频处理框架读取音频文件,并对其进行解码,将音频文件转换为数字音频信号;
对数字音频信号进行提取,获取音频的基本信息,所述基本信息包括但不限于采样率、声道数和比特率;
将数字音频信号转换为波形图,其中波形图以时间为横轴,以音频信号的振幅为纵轴。
作为本发明更近一步的方案,所述获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间,具体包括:
根据网络存在的音频数据,构建音频相似性模型;
通过音频相似性模型计算比较用户所选择的音频文件与网络中的音频数据之间的相似度,并依据相似度数据识别出该音频在网络中的数据;
当识别出音频文件在网络中无数据记录时,将该音频文件定义为个人音频,同时根据音频波形将音频进行节奏划分,并将划分后的音频段落进行编号并推荐给用户;
当识别出该音频文件在网络中的音频信息时,分析网络用户针对该音频文件所选择的铃声区间,并根据每个铃声区间的选取率向用户按序推荐。
作为本发明更近一步的方案,所述识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,具体包括:
识别用户针对某音频文件所选取的音频区间,并获取该音频文件中处于该音频区间两端的音频信息和音频波形;
识别音频区间两端的音频连续性,并自动对选取的区间端点进行调整;
当用户选取多个音频文件时,获取用户的合成指令,并根据用户的合成指令对多个音频文件进行加工。
本发明实施例的有益效果是:
1.整个铃声制作流程可以实现自动化,无需用户手动选择和编辑音频文件。用户只需选择所喜欢的音频文件,***将自动识别和处理,大大简化了用户的操作流程。
2.通过识别用户选择的音频文件的音频信息和音频波形,***可以在网络中搜索相似的音频信息,并根据每个铃声区间在网络中的选取率向用户推荐铃声选取区间。这样可以提供个性化的推荐,帮助用户更快速地找到符合自己喜好的铃声区间。
3.可以识别用户所选取的音频区间,并获取当前音频区间两端的音频信息和音频波形。通过对选取的区间端点进行自动调整,可以确保选取的区间在音频上的连续性和平滑性,提高铃声的质量和听感。
4.可以提高制作效率、准确切割音频、保留音频特征,并且具有灵活调整的优势。这些有益效果可以帮助制作出更好的***,提升用户体验。
附图说明
图1为本发明实施例提供的***的生产***的结构框图;
图2为本发明实施例提供的文件识别模块的结构框图;
图3为本发明实施例提供的信息收集模块的结构框图;
图4为本发明实施例提供的音频加工模块的结构框图;
图5为本发明实施例提供的***的生产方法的流程图;
图6为本发明实施例提供的获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形的流程图;
图7为本发明实施例提供的获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间的流程图;
图8为本发明实施例提供的识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
图1为本发明实施例提供的***的生产***的结构框图,如图1所示,一种***的生产***,所述***包括:
文件识别模块100,用于获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形;
在本模块中,用户可以通过浏览文件***或上传文件的方式选择音频文件,也可以直接进行音频录制,且音频的选择不受限制,可以按需选择不同数量的音频,但在音频上传时需要保持格式统一,并且上传数量也会设有上限;
在读取音频后需要将音频转化为数字音频信号,以便获取音频的各种信息,获取的信息包括采样率、声道数、比特率、时长等,同时还会获取音频的波形图,这些信息主要用于后续的音频信息对比以及划分区间。
信息收集模块200,用于依据所识别出的音频信息和音频波形,获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间;
在本模块中,从网络搜索音频信息的目的是为了给用户提供参考,部分用户可能只是觉得该音乐很好听,想用作铃声,但是不知道应该选取哪一段音频,或者缺少对比,因此通过该模块可以将该音频在网络上的信息进行收集,并获取大量的网络用户常用的铃声区间并推荐给用户,用户可以以此来进行对比筛选,获取自己最想要的铃声区间;
而针对在网络上搜索不到的音频,大多都是用户自己录制或者编辑出的音频文件,此时会自动对音频的信息进行分析,筛选出音频的高潮部分和过渡部分,并自动推荐给用户,方便用户选择。
音频加工模块300,用于识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,并输出音频;
在本模块中,在用户选取音频区间时,由于大部分用户都是在移动端上进行操作的,手指的选取精度有限,虽然截取出的音频片段处于一个合理区间,但是对于端点处的划分不够精细,且在移动端的细化调整难度较大,因此本模块用于对选取后的音频区间进行自动规整,通过分析音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,调整区间端点可以保证输出的音频更加准确地包含用户所选取的音频内容;
当然调整后的音频区间会反馈给用户,并不会直接覆盖掉用户所选取的区间,用户可以对调整后的区间进行参考,最终使用的区间以用户所选择的为准;
且在面对多个音频文件时,在每一个音频文件的区间都调整完成后,会对多个音频文件进行合成,合成方式分为叠加式合成(即将多个音频文件相互覆盖,使声道、波形相重合)和连接式合成(即将多个音频文件首尾相连,且连接)。
铃声提取模块400,用于将输出的音频转换为铃声文件。
图2为本发明实施例提供的文件识别模块的结构框图,如图2所示,所述文件识别模块100具体包括:
读取单元110,用于获取用户选择的全部音频文件,包括但不限于用户自主录制的音频文件和上传的音频文件;
解码单元120,用于通过音频处理框架读取音频文件,并对其进行解码,将音频文件转换为数字音频信号;
信息提取单元130,用于对数字音频信号进行提取,获取音频的基本信息,所述基本信息包括但不限于采样率、声道数和比特率;
波形转化单元140,用于将数字音频信号转换为波形图,其中波形图以时间为横轴,以音频信号的振幅为纵轴。
图3为本发明实施例提供的信息收集模块的结构框图,如图3所示,所述信息收集模块200具体包括:
模型建立单元210,用于根据网络存在的音频数据,构建音频相似性模型;
数据计算单元220,用于通过音频相似性模型计算比较用户所选择的音频文件与网络中的音频数据之间的相似度,并依据相似度数据识别出该音频在网络中的数据;
在本单元中,通过波形分析,可以得到一些关于歌曲的信息,包括高潮部分和节奏。波形中的能量变化、频率特征等可以反映出歌曲的动态变化和节奏感。
高潮部分通常在音乐中是能量、音量和强度较大的部分。通过波形的能量变化,可以较为粗略地判断出歌曲中的高潮部分。在波形中,能量较高的部分可能对应着歌曲的副歌、大合唱或架构性转折等。
至于歌曲的节奏感,可以通过波形的频率特征分析来获得。节奏感通常体现在波形的周期性或重复性上,通过观察波形的周期性变化、峰值的分布以及节奏节拍的规律性,可以推测出歌曲的节奏。
通过上述分析,即可在缺少音频摘要信息的情况下找出该音频的网络文件。
推荐单元230,用于当识别出音频文件在网络中无数据记录时,将该音频文件定义为个人音频,同时根据音频波形将音频进行节奏划分,并将划分后的音频段落进行编号并推荐给用户;
当识别出该音频文件在网络中的音频信息时,分析网络用户针对该音频文件所选择的铃声区间,并根据每个铃声区间的选取率向用户按序推荐。
图4为本发明实施例提供的音频加工模块的结构框图,如图4所示,所述音频加工模块300具体包括:
区间识别单元310,用于识别用户针对某音频文件所选取的音频区间,并获取该音频文件中处于该音频区间两端的音频信息和音频波形;
自动修整单元320,用于识别音频区间两端的音频连续性,并自动对选取的区间端点进行调整;
合成单元330,用于当用户选取多个音频文件时,获取用户的合成指令,并根据用户的合成指令对多个音频文件进行加工,加工步骤如下:其中,/>为最终输出音频, />表示需要连接的音频文件,/>、/> 表示需要相互叠加的音频文件。
在本单元中,识别音频的音频信息可以包括:
起始时间和结束时间:根据用户选择的片段在整个音频中的起始时间和结束时间进行识别。这样可以确保选取的片段不超出整个音频的范围,保证完整性。
节奏和节拍:识别音频中的节奏和节拍信息,以便对用户选择的片段进行校准。通过分析音频的节奏和节拍,可以保证选取的片段在整个音频中的节奏和节拍连贯。
音频过渡点:识别音频中的过渡点,例如音频的渐入和渐出部分,以及乐曲中的转换部分。在进行音频校准时,可以参考这些过渡点,使得选取的片段与音频其他部分的过渡更加平滑。
音频特征:分析音频的频谱特征、时域特征和频域特征,例如能量变化、频谱分布等。通过比较选取的片段与整个音频的特征,可以确保选取的部分在频谱和能量分布上与整个音频保持一致。
根据这些关键信息进行校准,能够确保选取的音频片段在连续播放时的完整性和连贯性,使铃声听起来更加自然和流畅。
在本发明实施例中,具体包括:根据音频信号特性设定阈值,并获取音频的短时过零率,获取公式为:/>其中/>表示音频信号的采样值,/>表示短时段内的采样点数;音频信号的采样值指的是在离散时间点上对音频波形进行采样时所得到的振幅值。音频信号是连续的模拟信号,为了进行数字化处理和存储,需要对其进行采样和量化。
在采样过程中,音频信号在连续时间轴上被离散成一系列的时间点,这些时间点通常是均匀分布的。在每个采样时间点上,音频信号的振幅值被测量并记录下来,这个振幅值就是采样值。
采样值的大小表示了在特定时间点上音频信号的振幅大小,以二进制表示,可以用8位、16位、24位等表示。
判断用户所选取的音频区间端点处的短时过零率与阈值的大小,当短时过零率大于阈值时,则直接在该端点处对音频进行截断;
当短时过零率小于阈值时,根据音频信息和音频波形,向当短时过零率/>增大的一侧移动区间端点,直至端点处的短时过零率/>大于阈值,并在此区间的端点处对音频进行截断。
使用短时过零率来判断音频的连续性,将短时过零率与预先设定的阈值进行比较。如果短时过零率大于阈值,表示音频在该时间段内存在较多的零交叉点,可能表示音频存在断裂或间隔。
在这种情况下,将音频在断裂或间隔处进行分段,当然针对铃声制作来说,此处所说的断裂和间隔并不是音乐领域常用的完全失音的情况,而是根据波谱和音频信息来判断出的音乐高潮期和平缓期,在平缓期至高潮期过度的过程中,选出最靠近高潮期的音频连接处作为间隔点,以此来保证音频的完整性,同时最大程度的使音乐过度更加流畅。
图5为本发明实施例提供的***的生产方法的流程图,如图5所示,一种***的生产方法,所述方法包括:
S100,获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形;
在本步骤中,用户可以通过浏览文件***或上传文件的方式选择音频文件,也可以直接进行音频录制,且音频的选择不受限制,可以按需选择不同数量的音频,但在音频上传时需要保持格式统一,并且上传数量也会设有上限;
在读取音频后需要将音频转化为数字音频信号,以便获取音频的各种信息,获取的信息包括采样率、声道数、比特率、时长等,同时还会获取音频的波形图,这些信息主要用于后续的音频信息对比以及划分区间。
S200,依据所识别出的音频信息和音频波形,获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间;
在本步骤中,从网络搜索音频信息的目的是为了给用户提供参考,部分用户可能只是觉得该音乐很好听,想用作铃声,但是不知道应该选取哪一段音频,或者缺少对比,因此通过该模块可以将该音频在网络上的信息进行收集,并获取大量的网络用户常用的铃声区间并推荐给用户,用户可以以此来进行对比筛选,获取自己最想要的铃声区间;
而针对在网络上搜索不到的音频,大多都是用户自己录制或者编辑出的音频文件,此时会自动对音频的信息进行分析,筛选出音频的高潮部分和过渡部分,并自动推荐给用户,方便用户选择。
S300,识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,并输出音频;
在本步骤中,在用户选取音频区间时,由于大部分用户都是在移动端上进行操作的,手指的选取精度有限,虽然截取出的音频片段处于一个合理区间,但是对于端点处的划分不够精细,且在移动端的细化调整难度较大,因此本模块用于对选取后的音频区间进行自动规整,通过分析音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,调整区间端点可以保证输出的音频更加准确地包含用户所选取的音频内容;
当然调整后的音频区间会反馈给用户,并不会直接覆盖掉用户所选取的区间,用户可以对调整后的区间进行参考,最终使用的区间以用户所选择的为准;
且在面对多个音频文件时,在每一个音频文件的区间都调整完成后,会对多个音频文件进行合成,合成方式分为叠加式合成(即将多个音频文件相互覆盖,使声道、波形相重合)和连接式合成(即将多个音频文件首尾相连,且连接)。
S400,将输出的音频转换为铃声文件。
图6为本发明实施例提供的获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形的流程图,如图6所示,所述获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形,具体包括:
S110,获取用户选择的全部音频文件,包括但不限于用户自主录制的音频文件和上传的音频文件;
S120,通过音频处理框架读取音频文件,并对其进行解码,将音频文件转换为数字音频信号;
S130,对数字音频信号进行提取,获取音频的基本信息,所述基本信息包括但不限于采样率、声道数和比特率;
S140,将数字音频信号转换为波形图,其中波形图以时间为横轴,以音频信号的振幅为纵轴。
图7为本发明实施例提供的获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间的流程图,如图7所示,所述获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间,具体包括:
S210,根据网络存在的音频数据,构建音频相似性模型;
S220,通过音频相似性模型计算比较用户所选择的音频文件与网络中的音频数据之间的相似度,并依据相似度数据识别出该音频在网络中的数据;
S230,当识别出音频文件在网络中无数据记录时,将该音频文件定义为个人音频,同时根据音频波形将音频进行节奏划分,并将划分后的音频段落进行编号并推荐给用户;
当识别出该音频文件在网络中的音频信息时,分析网络用户针对该音频文件所选择的铃声区间,并根据每个铃声区间的选取率向用户按序推荐。
图8为本发明实施例提供的识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整的流程图,如图8所示,所述识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,具体包括:
S310,识别用户针对某音频文件所选取的音频区间,并获取该音频文件中处于该音频区间两端的音频信息和音频波形;
S320,识别音频区间两端的音频连续性,并自动对选取的区间端点进行调整;
S330,当用户选取多个音频文件时,获取用户的合成指令,并根据用户的合成指令对多个音频文件进行加工。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种***的生产***,其特征在于,所述***包括:
文件识别模块,用于获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形;
信息收集模块,用于依据所识别出的音频信息和音频波形,获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间;
音频加工模块,用于识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,并输出音频;
铃声提取模块,用于将输出的音频转换为铃声文件;
所述文件识别模块具体包括:
读取单元,用于获取用户选择的全部音频文件,包括用户自主录制的音频文件和上传的音频文件;
解码单元,用于通过音频处理框架读取音频文件,并对其进行解码,将音频文件转换为数字音频信号;
信息提取单元,用于对数字音频信号进行提取,获取音频的基本信息,所述基本信息包括采样率、声道数和比特率;
波形转化单元,用于将数字音频信号转换为波形图,其中波形图以时间为横轴,以音频信号的振幅为纵轴;
所述信息收集模块具体包括:
模型建立单元,用于根据网络存在的音频数据,构建音频相似性模型;
数据计算单元,用于通过音频相似性模型计算比较用户所选择的音频文件与网络中的音频数据之间的相似度,并依据相似度数据识别出该音频在网络中的数据;
推荐单元,用于当识别出音频文件在网络中无数据记录时,将该音频文件定义为个人音频,同时根据音频波形将音频进行节奏划分,并将划分后的音频段落进行编号并推荐给用户;
当识别出该音频文件在网络中的音频信息时,分析网络用户针对该音频文件所选择的铃声区间,并根据每个铃声区间的选取率向用户按序推荐;
所述音频加工模块具体包括:
区间识别单元,用于识别用户针对某音频文件所选取的音频区间,并获取该音频文件中处于该音频区间两端的音频信息和音频波形;
自动修整单元,用于识别音频区间两端的音频连续性,并自动对选取的区间端点进行调整;
合成单元,用于当用户选取多个音频文件时,获取用户的合成指令,并根据用户的合成指令对多个音频文件进行加工,加工步骤如下:其中,/>为最终输出音频,/>表示需要连接的音频文件,/>表示需要相互叠加的音频文件;
所述识别音频区间两端的音频连续性,具体包括:
根据音频信号特性设定阈值,并获取音频的短时过零率,获取公式为:/>其中/>表示音频信号的采样值,/>表示短时段内的采样点数;
判断用户所选取的音频区间端点处的短时过零率与阈值的大小,当短时过零率/>大于阈值时,则直接在该端点处对音频进行截断;
当短时过零率小于阈值时,根据音频信息和音频波形,向当短时过零率/>增大的一侧移动区间端点,直至端点处的短时过零率/>大于阈值,并在此区间的端点处对音频进行截断。
2.一种***的生产方法,其特征在于,所述方法包括:
获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形;
依据所识别出的音频信息和音频波形,获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间;
识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,并输出音频;
将输出的音频转换为铃声文件;
所述获取当前用户所选择的全部音频文件,并识别出当前音频文件的音频信息和音频波形,具体包括:
获取用户选择的全部音频文件,包括用户自主录制的音频文件和上传的音频文件;
通过音频处理框架读取音频文件,并对其进行解码,将音频文件转换为数字音频信号;
对数字音频信号进行提取,获取音频的基本信息,所述基本信息包括采样率、声道数和比特率;
将数字音频信号转换为波形图,其中波形图以时间为横轴,以音频信号的振幅为纵轴;
所述获取网络中与用户选择的音频文件相似的音频信息,并根据每个铃声区间在网络中的选取率向用户按序推荐铃声选取区间,具体包括:
根据网络存在的音频数据,构建音频相似性模型;
通过音频相似性模型计算比较用户所选择的音频文件与网络中的音频数据之间的相似度,并依据相似度数据识别出该音频在网络中的数据;
当识别出音频文件在网络中无数据记录时,将该音频文件定义为个人音频,同时根据音频波形将音频进行节奏划分,并将划分后的音频段落进行编号并推荐给用户;
当识别出该音频文件在网络中的音频信息时,分析网络用户针对该音频文件所选择的铃声区间,并根据每个铃声区间的选取率向用户按序推荐;
所述识别用户所选取的音频区间,同时获取当前音频区间两端的音频信息和音频波形,自动对选取的区间端点进行调整,具体包括:
识别用户针对某音频文件所选取的音频区间,并获取该音频文件中处于该音频区间两端的音频信息和音频波形;
识别音频区间两端的音频连续性,并自动对选取的区间端点进行调整;
当用户选取多个音频文件时,获取用户的合成指令,并根据用户的合成指令对多个音频文件进行加工。
CN202311021494.7A 2023-08-15 2023-08-15 一种***的生产***及方法 Active CN116743925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311021494.7A CN116743925B (zh) 2023-08-15 2023-08-15 一种***的生产***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311021494.7A CN116743925B (zh) 2023-08-15 2023-08-15 一种***的生产***及方法

Publications (2)

Publication Number Publication Date
CN116743925A CN116743925A (zh) 2023-09-12
CN116743925B true CN116743925B (zh) 2024-01-26

Family

ID=87911838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311021494.7A Active CN116743925B (zh) 2023-08-15 2023-08-15 一种***的生产***及方法

Country Status (1)

Country Link
CN (1) CN116743925B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030069135A (ko) * 2003-07-14 2003-08-25 (주)유토포스 오디오신호의 변환이 가능한 휴대폰 및 통신망을 이용한 오디오 서비스 방법
KR20040095840A (ko) * 2003-04-28 2004-11-16 주식회사 신지소프트 휴대 단말의 벨소리를 위한 음원 변환 서비스 제공 방법및 시스템
CN101625857A (zh) * 2008-07-10 2010-01-13 新奥特(北京)视频技术有限公司 一种自适应的语音端点检测方法
CN103220407A (zh) * 2013-03-06 2013-07-24 广东欧珀移动通信有限公司 铃声截取方法及终端
CN204408456U (zh) * 2015-03-20 2015-06-17 宁波萨瑞通讯有限公司 移动终端的铃声合成***
CN105426397A (zh) * 2015-10-29 2016-03-23 深圳市创想天空科技股份有限公司 一种铃声制作方法及装置
CN110248028A (zh) * 2019-07-30 2019-09-17 深圳市趣创科技有限公司 基于已设置为铃声的音频保护方法、装置和计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040095840A (ko) * 2003-04-28 2004-11-16 주식회사 신지소프트 휴대 단말의 벨소리를 위한 음원 변환 서비스 제공 방법및 시스템
KR20030069135A (ko) * 2003-07-14 2003-08-25 (주)유토포스 오디오신호의 변환이 가능한 휴대폰 및 통신망을 이용한 오디오 서비스 방법
CN101625857A (zh) * 2008-07-10 2010-01-13 新奥特(北京)视频技术有限公司 一种自适应的语音端点检测方法
CN103220407A (zh) * 2013-03-06 2013-07-24 广东欧珀移动通信有限公司 铃声截取方法及终端
CN204408456U (zh) * 2015-03-20 2015-06-17 宁波萨瑞通讯有限公司 移动终端的铃声合成***
CN105426397A (zh) * 2015-10-29 2016-03-23 深圳市创想天空科技股份有限公司 一种铃声制作方法及装置
CN110248028A (zh) * 2019-07-30 2019-09-17 深圳市趣创科技有限公司 基于已设置为铃声的音频保护方法、装置和计算机设备

Also Published As

Publication number Publication date
CN116743925A (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
JP3815347B2 (ja) 歌唱合成方法と装置及び記録媒体
US8076566B2 (en) Beat extraction device and beat extraction method
US7626112B2 (en) Music editing apparatus and method and program
JP4487958B2 (ja) メタデータ付与方法及び装置
KR100472904B1 (ko) 음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생장치 및 그 방법
CN101996627B (zh) 语音处理装置、语音处理方法和程序
US7676361B2 (en) Apparatus, method and program for voice signal interpolation
US20110112672A1 (en) Systems and Methods of Constructing a Library of Audio Segments of a Song and an Interface for Generating a User-Defined Rendition of the Song
JP2004530153A6 (ja) 信号を特徴付ける方法および装置、および、索引信号を生成する方法および装置
JP2004530153A (ja) 信号を特徴付ける方法および装置、および、索引信号を生成する方法および装置
KR20040026634A (ko) 특징량 추출장치
WO2015114216A2 (en) Audio signal analysis
US6915261B2 (en) Matching a synthetic disc jockey's voice characteristics to the sound characteristics of audio programs
JP2012108451A (ja) 音声処理装置および方法、並びにプログラム
KR100512143B1 (ko) 멜로디 기반 음악 검색방법과 장치
CN113781989B (zh) 一种音频的动画播放、节奏卡点识别方法及相关装置
CN112420015A (zh) 一种音频合成方法、装置、设备及计算机可读存储介质
CN116743925B (zh) 一种***的生产***及方法
JP2004334160A (ja) 特徴量抽出装置
JP2010078984A (ja) 楽曲抽出装置および楽曲記録装置
JP2931059B2 (ja) 音声合成方式およびこれに用いる装置
WO2004109660A1 (ja) 音声データを選択するための装置、方法およびプログラム
JP2000276194A (ja) 波形圧縮方法及び波形生成方法
JP2005003912A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法及びプログラム
JP3788096B2 (ja) 波形圧縮方法及び波形生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant