CN107452361B - 歌曲分句方法及装置 - Google Patents

歌曲分句方法及装置 Download PDF

Info

Publication number
CN107452361B
CN107452361B CN201710670846.XA CN201710670846A CN107452361B CN 107452361 B CN107452361 B CN 107452361B CN 201710670846 A CN201710670846 A CN 201710670846A CN 107452361 B CN107452361 B CN 107452361B
Authority
CN
China
Prior art keywords
time difference
playing
note
adjacent
song
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710670846.XA
Other languages
English (en)
Other versions
CN107452361A (zh
Inventor
赵伟峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Music Entertainment Technology Shenzhen Co Ltd
Original Assignee
Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Music Entertainment Technology Shenzhen Co Ltd filed Critical Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority to CN201710670846.XA priority Critical patent/CN107452361B/zh
Publication of CN107452361A publication Critical patent/CN107452361A/zh
Application granted granted Critical
Publication of CN107452361B publication Critical patent/CN107452361B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • G10H1/0041Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
    • G10H1/0058Transmission between separate instruments or between individual components of a musical system
    • G10H1/0066Transmission between separate instruments or between individual components of a musical system using a MIDI interface
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/061Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of musical phrases, isolation of musically relevant segments, e.g. musical thumbnail generation, or for temporal structure analysis of a musical piece, e.g. determination of the movement sequence of a musical work
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

本发明实施例提供了一种歌曲分句方法及装置,其中,歌曲分句方法包括:对当前歌曲的乐器数字接口midi文件进行解析,以获取所述midi文件中的音符信息,所述音符信息包括所述当前歌曲中每个音符的播放开始时间、播放持续时间和音高值;根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值;根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值;从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句。本发明实施例能够在没有歌词的情况下,实现对歌曲进行分句。

Description

歌曲分句方法及装置
技术领域
本发明实施例涉及音频处理领域,具体涉及一种歌曲分句方法及装置。
背景技术
通常情况下,可以根据歌曲的歌词,对歌曲进行分句。但在一些特殊情况下,例如,没有下发歌词、或者缺少歌词的情况下,就无法实现对歌曲进行分句。针对这一问题,目前尚未提出有效的解决方案。
发明内容
有鉴于此,本发明实施例提供了一种歌曲分句方法及装置,能够在没有歌词的情况下,实现对歌曲进行分句。
本发明实施例提供的歌曲分句方法,包括:
对当前歌曲的乐器数字接口midi文件进行解析,以获取所述midi文件中的音符信息,所述音符信息包括所述当前歌曲中每个音符的播放开始时间、播放持续时间和音高值;
根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值;
根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值;
从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句。
本发明实施例提供的歌曲分句装置,包括:
解析单元,用于对当前歌曲的乐器数字接口midi文件进行解析,以获取所述midi文件中的音符信息,所述音符信息包括所述当前歌曲中每个音符的播放开始时间、播放持续时间和音高值;
计算单元,用于根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值;
获取单元,用于根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值;
分句单元,用于从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句。
本发明实施例中,可以通过对当前歌曲的midi文件进行解析,以获取所述midi文件中的音符信息,根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值,根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值,从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句;即本发明实施例,可以通过对当前歌曲的midi文件进行解析,实现对当前歌曲进行分句,从而解决了在没有歌词的情况下,实现对当前歌曲进行分句。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例所提供的歌曲分句方法的一个应用场景示意图。
图2是本发明实施例所提供的歌曲分句方法的一个流程示意图。
图3是本发明一实施例所建立的直方图示意图。
图4是本发明实施例所提供的歌曲分句装置的一个结构示意图。
图5是本发明实施例所提供的歌曲分句装置的另一结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于现有技术缺乏在没有歌词的情况下,对歌曲进行分句的实现方案,因而本发明实施例提供了一种歌曲分句方法及装置,本发明实施例提供的歌曲分句方法可实现在歌曲分句装置中,歌曲分句装置具体可以集成在终端或其他可以进行音频数据处理的设备中。以歌曲分句装置集成在终端中为例,参见图1,终端可以通过网络与服务器进行交互,所述网络可以是移动通信网络、广域网、局域网等。具体在本发明实施例中,终端可以通过网络从服务器下载歌曲,下载完成之后,终端对需要分句的歌曲(即当前歌曲)的midi文件进行解析,以获取所述midi文件中的音符信息,所述音符信息包括所述当前歌曲中每个音符的播放开始时间、播放持续时间和音高值;根据所述音符信息可以计算所述当前歌曲的各个相邻音符之间的播放时间差值;根据所述各个相邻音符之间的播放时间差值的分布情况可以获取时间差值阈值,然后从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句。即本发明实施例,可以通过对当前歌曲的midi文件进行解析,实现对当前歌曲进行分句,从而解决了在没有歌词的情况下,实现对当前歌曲进行分句。
以下将分别进行详细说明,以下各个实施例的描述先后顺序并不构成对具体实施先后顺序的限定。
实施例一
如图2所示,本实施例的歌曲分句方法包括以下步骤:
步骤201、对当前歌曲的乐器数字接口midi文件进行解析,以获取所述midi文件中的音符信息,所述音符信息包括所述当前歌曲中每个音符的播放开始时间、播放持续时间和音高值;
乐器数字接口(music instrument digital interface,简称midi),是一个工业标准的电子通信协议,为电子乐器等演奏设备(如合成器)定义各种音符或者弹奏码,容许电子乐器、电脑、手机或其他的舞台演出设备彼此连接,调整和同步,得以实时交换演奏数据。midi文件以数字信息的形式存储了音乐信息,是一首歌曲的音乐旋律文件。
对当前歌曲的midi文件进行解析时,可以采用程序的方法定义一个结构体来存储音符信息,具体方法可如下:
Tydef struct tag_note{
int start_ms;
int end_ms;
int note_value;
}Tnote
Tnote note;
采用上述结构体将midi文件解析出来之后,可以得到表1所示的音符信息。
播放开始时间(ms) 播放持续时间(ms) 音高值
38210 311 71
38524 309 69
38837 622 67
40711 309 64
41024 309 67
…… …… ……
表1
表1示出了从midi文件中获取的部分音符信息,这部分音符信息可以是midi文件中的任意一段。
解析出来的音符信息包括音符的播放开始时间、播放持续时间和音高值。其中,音高值一般位于区间[21,108],音高值越大,音调越高。每个音高值对应音乐中的“do、re、mi……”中的一个音符。如表1所示,一个音高值对应一组具有关联关系的播放开始时间和播放持续时间。例如,表1中的第一行的音高值“71”,对应的播放开始时间为38210,播放持续时间为311。也就是说,音符以71的音高值,从38210ms开始播放,播放的时长为311ms。播放开始时间和播放持续时间是关联的,根据播放开始时间和播放持续时间,可以得到一个音符的播放结束时间,在上面的例子中,表1中的第一行,音符以71的音高值持续播放311秒,播放结束时间是38521ms。
步骤202、根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值;
具体地,可以根据每个音符的播放开始时间和播放持续时间,计算每个音符的播放结束时间;根据每个音符的播放结束时间,以及每个音符的相邻音符的播放开始时间,计算各个相邻音符之间的播放时间差值。如表1中第一行与第二行所示,第一个音符的播放结束时间是38521ms,第二个音符的播放开始时间是38524ms,可知,这两个相邻音符的播放时间差值为3ms。
步骤203、根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值;
相邻音符之间是有一定的播放时间间隔(即播放时间差值)的,如果间隔比较小,则该相邻音符可能在一个句子内,如果间隔比较大,则该相邻音符可能是前后句子的停顿处,因此需要一个合理的时间差值阈值进行区隔。
本实施例提供了一种时间差值阈值的具体求解方法,如下:
(1)根据所述各个相邻音符之间的播放时间差值的分布情况建立直方图。
为便于处理,可以先将所有的播放时间差值除以1000,以将播放时间差值的单位从毫秒ms转化成秒s,并通过四舍五入或取整操作将差值转为整数。
建立直方图函数hist(x)=y,x表示各个所述播放时间差值,y表示各个所述播放时间差值的出现次数。例如,播放时间差值10,在计算所得的所有播放时间差值中,出现了5次,则hist(10)=5,根据所建立的直方图函数hist绘制直方图。理论上来说,计算所得的播放时间差值,大部分会集中在极小的范围内,而在较大的值上,也会有一个小高峰,因此,绘制的直方图大概会如图3所示,有两个峰值。
(2)根据所述直方图求解时间差值阈值;
具体地,可以先利用预设滑窗寻找所述直方图中的两个峰值点。例如,可以预设一个滑窗Q,记录下Q滑动期间内的所有峰值点。滑窗Q可以取3、5等值。以滑窗Q取5为例,Q的中心值是Q(n),Q左边的值是Q(n-1)和Q(n-2),Q右边的值是Q(n+1)和Q(n+2),峰值点的条件可以是:同时大于两边(左、右两边)的值,或者大于一边而等于另一边的值。
在寻找到两个峰值点之后,可以在两个峰值点之间寻找谷值点。谷值点的定义与峰值点相反,需要同时小于两边的值,或者是小于一边而等于另一边的值。寻找到的谷值点可如图3所示,本实施例中,将寻找到的谷值点对应的播放时间差值,确定为时间差值阈值。
此时间差值阈值的单位是s,可以将其乘以1000,以将时间差值阈值的单位从s转为ms。
步骤204、从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句。
具体地,例如,第6、第7个音符之间的播放时间间隔大于所述时间差值阈值,则从第6、第7个音符之间进行分句,将第6个音符作为前一句中的音符,将第7个音符作为后一句中的音符。
对歌曲分句之后,可以根据分句情况对歌曲进行填词,或者对比歌曲的每句与其他歌曲的每句的音律相似度等,具体用途,此处不做具体限定。
本实施例中,可以通过对当前歌曲的midi文件进行解析,以获取所述midi文件中的音符信息,根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值,根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值,从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句;即本实施例,可以通过对当前歌曲的midi文件进行解析,实现对当前歌曲进行分句,从而解决了在没有歌词的情况下,实现对当前歌曲进行分句。
实施例二
为了更好地实施以上方法,本发明还提供了一种歌曲分句装置,如图4所示,本实施例的装置包括:解析单元401、计算单元402,获取单元403以及分句单元404,如下:
(1)解析单元401;
解析单元401,用于对当前歌曲的乐器数字接口midi文件进行解析,以获取所述midi文件中的音符信息,所述音符信息包括所述当前歌曲中每个音符的播放开始时间、播放持续时间和音高值。
乐器数字接口(music instrument digital interface,简称midi),是一个工业标准的电子通信协议,为电子乐器等演奏设备(如合成器)定义各种音符或者弹奏码,容许电子乐器、电脑、手机或其他的舞台演出设备彼此连接,调整和同步,得以实时交换演奏数据。midi文件以数字信息的形式存储了音乐信息,是一首歌曲的音乐旋律文件。
对当前歌曲的midi文件进行解析时,可以采用程序的方法定义一个结构体来存储音符信息,具体方法可如下:
Tydef struct tag_note{
int start_ms;
int end_ms;
int note_value;
}Tnote
Tnote note;
采用上述结构体将midi文件解析出来之后,可以得到表1所示的音符信息。
解析出来的音符信息包括音符的播放开始时间、播放持续时间和音高值。其中,音高值一般位于区间[21,108],音高值越大,音调越高。每个音高值对应音乐中的“do、re、mi……”中的一个音符。如表1所示,一个音高值对应一组具有关联关系的播放开始时间和播放持续时间。例如,表1中的第一行的音高值“71”,对应的播放开始时间为38210,播放持续时间为311。也就是说,音符以71的音高值,从38210ms开始播放,播放的时长为311ms。播放开始时间和播放持续时间是关联的,根据播放开始时间和播放持续时间,可以得到一个音符的播放结束时间,在上面的例子中,表1中的第一行,音符以71的音高值持续播放311秒,播放结束时间是38521ms。
(2)计算单元402;
计算单元402,用于根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值。
具体地,计算单元402可以根据每个音符的播放开始时间和播放持续时间,计算每个音符的播放结束时间;根据每个音符的播放结束时间,以及每个音符的相邻音符的播放开始时间,计算各个相邻音符之间的播放时间差值。如表1中第一行与第二行所示,第一个音符的播放结束时间是38521ms,第二个音符的播放开始时间是38524ms,计算可得,这两个相邻音符的播放时间差值为3ms。
(3)获取单元403;
获取单元403,用于根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值。
相邻音符之间是有一定的播放时间间隔(即播放时间差值)的,如果间隔比较小,则该相邻音符可能在一个句子内,如果间隔比较大,则该相邻音符可能是前后句子的停顿处,因此需要一个合理的时间差值阈值进行区隔。
本实施例中,获取单元403用来获取此时间差值阈值,具体地,获取单元403可以包括建立子单元和求解子单元,如下:
建立子单元,可以根据所述各个相邻音符之间的播放时间差值的分布情况建立直方图。
为便于处理,建立子单元可以先将所有的播放时间差值除以1000,以将播放时间差值的单位从毫秒ms转化成秒s,并通过四舍五入或取整操作将差值转为整数。
建立子单元建立直方图函数hist(x)=y,x表示各个所述播放时间差值,y表示各个所述播放时间差值的出现次数。例如,播放时间差值10,在计算所得的所有播放时间差值中,出现了5次,则hist(10)=5,根据直方图函数hist绘制直方图。理论上来说,计算所得的播放时间差值,大部分会集中在极小的范围内,而在较大的值上,也会有一个小高峰,因此,绘制的直方图大概会如图3所示,有两个峰值。
求解子单元,可以根据建立子单元建立的所述直方图求解时间差值阈值。
具体地,求解子单元可以先利用预设滑窗寻找所述直方图中的两个峰值点。例如,可以预设一个滑窗Q,记录下Q滑动期间内的所有峰值点。滑窗Q可以取3、5等值。以滑窗Q取5为例,Q的中心值是Q(n),Q左边的值是Q(n-1)和Q(n-2),Q右边的值是Q(n+1)和Q(n+2),峰值点的条件可以是:同时大于两边(左、右两边)的值,或者大于一边而等于另一边的值。
在寻找到两个峰值点之后,求解子单元可以在两个峰值点之间寻找谷值点。谷值点的定义与峰值点相反,需要同时小于两边的值,或者小于一边而等于另一边的值。寻找到的谷值点可如图3所示,将寻找到的谷值点对应的播放时间差值,确定为时间差值阈值。
此时间差值阈值的单位是s,可以将其乘以1000,以将时间差值阈值的单位从s转为ms。
(4)分句单元404;
分句单元404,可以从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句。
具体地,例如,第6、第7个音符之间的时间间隔大于所述时间差值阈值,则分句单元从第6、第7个音符之间进行分句,将第6个音符作为前一句中的音符,将第7个音符作为后一句中的音符。
对歌曲分句之后,可以根据分句情况对歌曲进行填词,或者对比歌曲的每句与其他歌曲的每句的音律相似度等,具体用途,此处不做具体限定。
需要说明的是,上述实施例提供的歌曲分句装置在进行歌曲分句时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的歌曲分句装置与歌曲分句方法属于同一构思,其具体实现过程详见方法实施例,此处不再赘述。
本实施例中,解析单元可以通过对当前歌曲的midi文件进行解析,以获取所述midi文件中的音符信息,计算单元可以根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值,获取单元根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值,最后分句单元从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句;即本实施例,可以通过对当前歌曲的midi文件进行解析,实现对当前歌曲进行分句,从而解决了在没有歌词的情况下,实现对当前歌曲进行分句。
实施例三
相应的,本发明实施例还提供了一种歌曲分句装置,如图5所示,该装置可以包括射频(RF,Radio Frequency)电路501、包括有一个或一个以上计算机可读存储介质的存储器502、输入单元503、显示单元504、传感器505、音频电路506、无线保真(WiFi,WirelessFidelity)模块507、包括有一个或者一个以上处理核心的处理器508、以及电源509等部件。本领域技术人员可以理解,图5中示出的装置结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路501可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器508处理;另外,将涉及上行的数据发送给基站。通常,RF电路501包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路501还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯***(GSM,Global System of Mobile communication)、通用分组无线服务(GPRS,GeneralPacket Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器502可用于存储软件程序以及模块,处理器508通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据装置的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器508和输入单元503对存储器502的访问。
输入单元503可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元503可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器508,并能接收处理器508发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元503还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元504可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元504可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器508以确定触摸事件的类型,随后处理器508根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图5中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
装置还可包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在装置移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路506、扬声器,传声器可提供用户与终端之间的音频接口。音频电路506可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路506接收后转换为音频数据,再将音频数据输出处理器508处理后,经RF电路501以发送给比如另一装置,或者将音频数据输出至存储器502以便进一步处理。音频电路506还可能包括耳塞插孔,以提供外设耳机与装置的通信。
WiFi属于短距离无线传输技术,装置通过WiFi模块507可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图5示出了WiFi模块507,但是可以理解的是,其并不属于装置的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器508是装置的控制中心,利用各种接口和线路连接整个装置的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行终端的各种功能和处理数据,从而对装置进行整体监控。可选的,处理器508可包括一个或多个处理核心;优选的,处理器508可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器508中。
装置还包括给各个部件供电的电源509(比如电池),优选的,电源可以通过电源管理***与处理器508逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源509还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,装置还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,装置中的处理器508会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器508来运行存储在存储器502中的应用程序,从而实现各种功能:
对当前歌曲的乐器数字接口midi文件进行解析,以获取所述midi文件中的音符信息,所述音符信息包括所述当前歌曲中每个音符的播放开始时间、播放持续时间和音高值;
根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值;
根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值;
从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句。
在一些实施例中,在根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值时,处理器508用于执行以下步骤:
根据每个音符的播放开始时间和播放持续时间,计算每个音符的播放结束时间;
根据每个音符的播放结束时间,以及每个音符的相邻音符的播放开始时间,计算各个相邻音符之间的播放时间差值。
在一些实施例中,在根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值时,处理器508用于执行以下步骤:
根据所述各个相邻音符之间的播放时间差值的分布情况建立直方图;
根据所述直方图求解时间差值阈值。
在一些实施例中,在根据所述各个相邻音符之间的播放时间差值的分布情况建立直方图时,处理器508用于执行以下步骤:
用横轴表示各个所述播放时间差值,用纵轴表示各个所述播放时间差值的出现次数,建立所述直方图。
在一些实施例中,在根据所述直方图求解时间差值阈值时,处理器508用于执行以下步骤:
以预设滑窗寻找所述直方图中的两个峰值点;
在所述两个峰值点之间寻找谷值点;
将所述谷值点对应的播放时间差值,确定为所述时间差值阈值。
本实施例的歌曲分句装置,可以通过对当前歌曲的midi文件进行解析,以获取所述midi文件中的音符信息,根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值,根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值;从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句;即本实施例的装置,可以通过对当前歌曲的midi文件进行解析,实现对当前歌曲进行分句,从而解决了在没有歌词的情况下,实现对当前歌曲进行分句。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,装置,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种歌曲分句方法,其特征在于,包括:
对当前歌曲的乐器数字接口midi文件进行解析,以获取所述midi文件中的音符信息,所述音符信息包括所述当前歌曲中每个音符的播放开始时间、播放持续时间和音高值;
根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值;
根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值,获取方法包括:根据所述各个相邻音符之间的播放时间差值的分布情况建立直方图,根据所述直方图求解时间差值阈值;
从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句。
2.根据权利要求1所述的方法,其特征在于,所述根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值,包括:
根据每个音符的播放开始时间和播放持续时间,计算每个音符的播放结束时间;
根据每个音符的播放结束时间,以及每个音符的相邻音符的播放开始时间,计算各个相邻音符之间的播放时间差值。
3.根据权利要求1所述的方法,其特征在于,所述根据所述各个相邻音符之间的播放时间差值的分布情况建立直方图,包括:
用横轴表示各个所述播放时间差值,用纵轴表示各个所述播放时间差值的出现次数,建立所述直方图。
4.根据权利要求1所述的方法,其特征在于,根据所述直方图求解时间差值阈值,包括:
以预设滑窗寻找所述直方图中的两个峰值点;
在所述两个峰值点之间寻找谷值点;
将所述谷值点对应的播放时间差值,确定为所述时间差值阈值。
5.一种歌曲分句装置,其特征在于,包括:
解析单元,用于对当前歌曲的乐器数字接口midi文件进行解析,以获取所述midi文件中的音符信息,所述音符信息包括所述当前歌曲中每个音符的播放开始时间、播放持续时间和音高值;
计算单元,用于根据所述音符信息计算所述当前歌曲的各个相邻音符之间的播放时间差值;
获取单元,用于根据所述各个相邻音符之间的播放时间差值的分布情况获取时间差值阈值,所述获取单元包括建立子单元和求解子单元,所述建立子单元用于,根据所述各个相邻音符之间的播放时间差值的分布情况建立直方图;所述求解子单元用于,根据所述直方图求解时间差值阈值;
分句单元,用于从所述各个相邻音符中,寻找播放时间差值大于所述时间差值阈值的相邻音符,将所述当前歌曲从寻找到的相邻音符处进行分句。
6.根据权利要求5所述的装置,其特征在于,
所述计算单元具体用于,根据每个音符的播放开始时间和播放持续时间,计算每个音符的播放结束时间;根据每个音符的播放结束时间,以及每个音符的相邻音符的播放开始时间,计算各个相邻音符之间的播放时间差值。
7.根据权利要求5所述的装置,其特征在于,
所述建立子单元具体用于,用横轴表示各个所述播放时间差值,用纵轴表示各个所述播放时间差值的出现次数,建立所述直方图。
8.根据权利要求5所述的装置,其特征在于,
所述求解子单元具体用于,以预设滑窗寻找所述直方图中的两个峰值点;在所述两个峰值点之间寻找谷值点;将所述谷值点对应的播放时间差值,确定为所述时间差值阈值。
9.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至4任一项所述的歌曲分句方法。
CN201710670846.XA 2017-08-08 2017-08-08 歌曲分句方法及装置 Active CN107452361B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710670846.XA CN107452361B (zh) 2017-08-08 2017-08-08 歌曲分句方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710670846.XA CN107452361B (zh) 2017-08-08 2017-08-08 歌曲分句方法及装置

Publications (2)

Publication Number Publication Date
CN107452361A CN107452361A (zh) 2017-12-08
CN107452361B true CN107452361B (zh) 2020-07-07

Family

ID=60489560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710670846.XA Active CN107452361B (zh) 2017-08-08 2017-08-08 歌曲分句方法及装置

Country Status (1)

Country Link
CN (1) CN107452361B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112581976B (zh) * 2019-09-29 2023-06-27 骅讯电子企业股份有限公司 以串流媒体为基础的歌唱评分方法和歌唱评分***
CN112735429B (zh) * 2020-12-28 2023-11-14 腾讯音乐娱乐科技(深圳)有限公司 确定歌词时间戳信息的方法和声学模型的训练方法
CN113255348B (zh) * 2021-05-26 2023-02-28 腾讯音乐娱乐科技(深圳)有限公司 一种歌词分段方法、装置、设备、介质
CN113377992A (zh) * 2021-06-21 2021-09-10 腾讯音乐娱乐科技(深圳)有限公司 歌曲分段方法、设备和存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1379898A (zh) * 1999-09-16 2002-11-13 汉索尔索弗特有限公司 基于一个数字音乐文件演奏乐器的方法和装置
CN1703734A (zh) * 2002-10-11 2005-11-30 松下电器产业株式会社 从声音确定音符的方法和装置
CN101093661A (zh) * 2006-06-23 2007-12-26 凌阳科技股份有限公司 一种音高跟踪和播放方法及其***
CN101720006A (zh) * 2009-11-20 2010-06-02 张立军 一种适用于视频关键帧提取的代表帧定位方法
CN102682752A (zh) * 2011-03-07 2012-09-19 卡西欧计算机株式会社 乐谱信息生成装置及其方法、乐音生成控制装置及其方法
CN103824555A (zh) * 2012-11-19 2014-05-28 腾讯科技(深圳)有限公司 音频段提取方法及提取装置
CN105280206A (zh) * 2014-06-23 2016-01-27 广东小天才科技有限公司 一种音频的播放方法、装置
CN105513583A (zh) * 2015-11-25 2016-04-20 福建星网视易信息***有限公司 一种歌曲节奏的显示方法及其***
CN106448630A (zh) * 2016-09-09 2017-02-22 腾讯科技(深圳)有限公司 歌曲的数字乐谱文件的生成方法和装置
CN106649644A (zh) * 2016-12-08 2017-05-10 腾讯音乐娱乐(深圳)有限公司 一种歌词文件生成方法及装置
CN106652986A (zh) * 2016-12-08 2017-05-10 腾讯音乐娱乐(深圳)有限公司 一种歌曲音频拼接方法及设备
CN106653037A (zh) * 2015-11-03 2017-05-10 广州酷狗计算机科技有限公司 音频数据处理方法和装置
CN106782460A (zh) * 2016-12-26 2017-05-31 广州酷狗计算机科技有限公司 生成乐谱的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8907193B2 (en) * 2007-02-20 2014-12-09 Ubisoft Entertainment Instrument game system and method
KR101504522B1 (ko) * 2008-01-07 2015-03-23 삼성전자 주식회사 음악 저장/검색 장치 및 방법

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1379898A (zh) * 1999-09-16 2002-11-13 汉索尔索弗特有限公司 基于一个数字音乐文件演奏乐器的方法和装置
CN1703734A (zh) * 2002-10-11 2005-11-30 松下电器产业株式会社 从声音确定音符的方法和装置
CN101093661A (zh) * 2006-06-23 2007-12-26 凌阳科技股份有限公司 一种音高跟踪和播放方法及其***
CN101720006A (zh) * 2009-11-20 2010-06-02 张立军 一种适用于视频关键帧提取的代表帧定位方法
CN102682752A (zh) * 2011-03-07 2012-09-19 卡西欧计算机株式会社 乐谱信息生成装置及其方法、乐音生成控制装置及其方法
CN103824555A (zh) * 2012-11-19 2014-05-28 腾讯科技(深圳)有限公司 音频段提取方法及提取装置
CN105280206A (zh) * 2014-06-23 2016-01-27 广东小天才科技有限公司 一种音频的播放方法、装置
CN106653037A (zh) * 2015-11-03 2017-05-10 广州酷狗计算机科技有限公司 音频数据处理方法和装置
CN105513583A (zh) * 2015-11-25 2016-04-20 福建星网视易信息***有限公司 一种歌曲节奏的显示方法及其***
CN106448630A (zh) * 2016-09-09 2017-02-22 腾讯科技(深圳)有限公司 歌曲的数字乐谱文件的生成方法和装置
CN106649644A (zh) * 2016-12-08 2017-05-10 腾讯音乐娱乐(深圳)有限公司 一种歌词文件生成方法及装置
CN106652986A (zh) * 2016-12-08 2017-05-10 腾讯音乐娱乐(深圳)有限公司 一种歌曲音频拼接方法及设备
CN106782460A (zh) * 2016-12-26 2017-05-31 广州酷狗计算机科技有限公司 生成乐谱的方法和装置

Also Published As

Publication number Publication date
CN107452361A (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
CN107481706B (zh) 歌曲串烧方法及装置
CN109256146B (zh) 音频检测方法、装置及存储介质
CN106782600B (zh) 音频文件的评分方法及装置
CN106210755B (zh) 一种播放直播视频的方法、装置和***
CN107452361B (zh) 歌曲分句方法及装置
CN110633067B (zh) 一种音效参数的调节方法及移动终端
CN107507628B (zh) 唱歌评分方法、装置及终端
CN106528545B (zh) 一种语音信息的处理方法及装置
CN106847307B (zh) 信号检测方法及装置
CN109872710B (zh) 音效调制方法、装置及存储介质
CN109817241B (zh) 音频处理方法、装置及存储介质
CN107229629B (zh) 音频识别方法及装置
CN106328176B (zh) 一种生成歌曲音频的方法和装置
CN109032491B (zh) 数据处理方法、装置以及移动终端
CN107680614B (zh) 音频信号处理方法、装置和存储介质
CN108492837B (zh) 音频突发白噪声的检测方法、装置及存储介质
CN107885718B (zh) 语义确定方法及装置
CN110335629B (zh) 音频文件的音高识别方法、装置以及存储介质
CN109389977B (zh) 一种语音交互方法及装置
CN105550316A (zh) 音频列表的推送方法及装置
CN109688611B (zh) 一种频段参数的配置方法、装置、终端和存储介质
CN106294087B (zh) 一种对业务执行操作的操作频率的统计方法及装置
CN105095161B (zh) 一种显示富文本信息的方法及装置
CN110597973B (zh) 一种人机对话的方法、装置、终端设备和可读存储介质
CN110277097B (zh) 数据处理方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant