CN108109634B - 歌曲音高的生成方法、装置及设备 - Google Patents

歌曲音高的生成方法、装置及设备 Download PDF

Info

Publication number
CN108109634B
CN108109634B CN201711353128.6A CN201711353128A CN108109634B CN 108109634 B CN108109634 B CN 108109634B CN 201711353128 A CN201711353128 A CN 201711353128A CN 108109634 B CN108109634 B CN 108109634B
Authority
CN
China
Prior art keywords
song
lyric
pitch
lyrics
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711353128.6A
Other languages
English (en)
Other versions
CN108109634A (zh
Inventor
劳振锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kugou Computer Technology Co Ltd
Original Assignee
Guangzhou Kugou Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kugou Computer Technology Co Ltd filed Critical Guangzhou Kugou Computer Technology Co Ltd
Priority to CN201711353128.6A priority Critical patent/CN108109634B/zh
Publication of CN108109634A publication Critical patent/CN108109634A/zh
Application granted granted Critical
Publication of CN108109634B publication Critical patent/CN108109634B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本申请是关于一种歌曲音高的生成方法、装置及设备,属于计算机技术领域。所述方法包括:获取第一歌曲的歌词信息和第二歌曲的歌词信息;根据第一歌曲的歌词信息和第二歌曲的歌词信息,获取第一歌曲和第二歌曲的歌曲整体相似度;当歌曲整体相似度符合第一预设条件时,获取第一歌曲和第二歌曲中每一组相对应的歌词的时间偏移值;根据第一歌曲的每一句歌词的音高信息和时间偏移值,确定第二歌曲的每一句歌词的音高信息。本申请通过根据第一歌曲的音高信息和时间偏移值,确定第二歌曲的音高信息。由于是根据第一歌曲的音高信息自动生成第二歌曲的音高信息,无需人工手动提取,节省了人力成本,还能够减少获取音高信息的耗时,提高获取音高信息的效率。

Description

歌曲音高的生成方法、装置及设备
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种歌曲音高的生成方法、装置及设备。
背景技术
在用户使用音乐播放软件播放歌曲,或使用点歌软件演唱歌曲时,音乐播放软件或点歌软件通常会显示歌曲歌词的音高,方便用户了解歌曲的音调走向。
在相关技术中,显示歌曲歌词的音高时,需要先获取该歌曲的音高信息。音高信息中包括每句歌词对应的音高值。通常情况下,同一首歌曲通常有多个版本,例如,一首歌曲由多个演唱者演唱。由于不同版本之间存在差异,所以一个版本的音高信息无法适用于同一首歌曲的其它版本。因此,每次出现一首歌曲的新版本,都需要重新获取该版本的音高信息。对于需要重新获取音高信息的新版本歌曲,通常情况下采用人工提取的方式,逐字获取歌词的音高信息。
相关技术中对于新版本歌曲,采用人工提取的方式获取音高信息,由于是逐字获取歌词的音高信息,因此获取一首新版本歌曲的音高信息需要耗费过多的时间和人力成本。
发明内容
本申请实施例提供了一种歌曲音高的生成方法、装置及设备,可用于解决获取新版本歌曲的音高信息时,耗费过多的时间和人力成本的问题。所述技术方案如下:
第一方面,提供了一种歌曲音高的生成方法,所述方法包括:
获取第一歌曲的歌词信息和第二歌曲的歌词信息;
根据所述第一歌曲的歌词信息和所述第二歌曲的歌词信息,获取所述第一歌曲和所述第二歌曲的歌曲整体相似度;
当所述歌曲整体相似度符合第一预设条件时,获取所述第一歌曲和所述第二歌曲中每一组相对应的歌词的时间偏移值;
根据所述第一歌曲的每一句歌词的音高信息和时间偏移值,确定所述第二歌曲的每一句歌词的音高信息,其中,每一句歌词的音高信息包括:音高的起始时间戳、音高的持续时长和音高值。
第二方面,提供了歌曲音高的生成装置,所述装置包括:
歌词获取模块,用于获取第一歌曲的歌词信息和第二歌曲的歌词信息;
相似获取模块,用于根据所述第一歌曲的歌词信息和所述第二歌曲的歌词信息,获取所述第一歌曲和所述第二歌曲的歌曲整体相似度;
时间获取模块,用于当所述歌曲整体相似度符合第一预设条件时,获取所述第一歌曲和所述第二歌曲中每一组相对应的歌词的时间偏移值;
音高确定模块,用于根据所述第一歌曲的每一句歌词的音高信息和时间偏移值,确定所述第二歌曲的每一句歌词的音高信息,其中,每一句歌词的音高信息包括:音高的起始时间戳、音高的持续时长和音高值。
第三方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序在被所述处理器加载并执行时实现如第一方面所述的歌曲音高的生成方法。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如第一方面所述的歌曲音高的生成方法。
第五方面,提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于执行上述第一方面所述的歌曲音高的生成方法。
本申请实施例提供的技术方案可以包括以下有益效果:
通过在确定歌曲整体相似度符合第一预设条件后,获取第一歌曲和第二歌曲中每一组相对应的歌词的时间偏移值,从而能够根据第一歌曲的每一句歌词的音高信息和时间偏移值,确定第二歌曲的每一句歌词的音高信息。由于是计算机设备根据第一歌曲的音高信息自动生成第二歌曲的音高信息,相较于人工提取的方式,无需人工手动提取,节省了人力成本,并且能够减少获取一首新版本歌曲的音高信息的耗时,提高获取音高信息的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的一种歌曲音高的生成方法的流程图;
图2是根据另一示例性实施例示出的一种歌曲音高的生成方法的流程图;
图3是根据一示例性实施例示出的一种歌曲音高的生成装置的框图;
图4是根据一示例性实施例示出的一种计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请实施例提供的方法,各步骤的执行主体可以是计算机设备,例如该计算机设备可以是PC(Personal Computer,个人计算机)、服务器或者手机。为了便于说明,在下述方法实施例中,仅以各步骤的执行主体为计算机设备进行介绍说明,但对此不构成限定。
请参考图1,其示出了本申请一个实施例提供的歌曲音高的生成方法的流程图。该方法可以包括如下几个步骤:
步骤101,获取第一歌曲的歌词信息和第二歌曲的歌词信息。
第一歌曲和第二歌曲为同一首歌曲的不同版本。版本不同可以是演唱者不同,也可以是演唱者相同但演唱出处不同,对于版本不同的具体类型本申请实施例不做具体限定。示例性地,第一歌曲为张三演唱的歌曲A,第二歌曲为李四演唱的歌曲A,则第一歌曲与第二歌曲的演唱者不同。或者,第一歌曲是张三在专辑中演唱的歌曲A,第二歌曲是张三在演唱会上演唱的歌曲A,则第一歌曲和第二歌曲的演唱出处不同。此外,第一歌曲的音高信息是已经确定的,而第二个歌曲的音高信息尚未确定。
计算机设备在获取第一歌曲的歌词信息时,还会获取第一歌曲的音高信息。其中,音高信息包括:音高的起始时间戳、音高的持续时长和音高值。音高的起始时间戳用于指示该句歌词的音高的起始时间。第一歌曲的音高信息可以包括每一句歌词的音高信息,还可以包括歌词中每一个字的音高信息。示例性地,一句歌词的音高的起始时间戳指示的起始时间是1:00、音高的持续时长是2秒、音高值为c4,则演唱者在歌曲的1:00开始演唱该句歌词,音高值为c4,2秒后,于1:02结束了该句歌词的演唱。需要说明的是,一句歌词或歌词中的一个字的音高值在持续时长内可以固定不变,也可以发生变化。例如,一句歌词的音高的持续时长是2秒,第1秒的音高值是c4,第2秒的音高值是d4
可选地,歌词信息包括:每一句歌词的起始时间戳、持续时长和歌词内容。歌词的起始时间戳用于指示该句歌词的起始时间。
步骤102,根据第一歌曲的歌词信息和第二歌曲的歌词信息,获取第一歌曲和第二歌曲的歌曲整体相似度。
计算机设备能够根据歌词信息中包括的第一句歌词的起始时间戳、最后一句歌词的起始时间戳以及最后一句歌词的持续时长计算出全部歌词的持续时长。计算机设备将最后一句歌词的起始时间戳指示的起始时间加上最后一句歌词的持续时长,得到最后一句歌词的结束时间。计算机设备再将最后一句歌词的结束时间减去第一句歌词的起始时间戳指示的起始时间,得到全部歌词的持续时长。计算机设备根据第一歌曲的全部歌词的持续时长以及歌词内容和第二歌曲的全部歌词的持续时长以及歌词内容,获取第一歌曲和第二歌曲的歌曲整体相似度。
可选地,上述步骤102包括如下子步骤:
1、根据第一歌曲的歌词内容和第二歌曲的歌词内容,确定第一歌曲和第二歌曲的内容相似度。
歌曲的内容相似度是指两首歌曲在歌词内容上的相似程度。计算机设备根据第一歌曲的歌词内容和第二歌曲的歌词内容确定两者之间相同歌词的字数,再确定第一歌曲和第二歌曲中歌词的字数较少的歌曲,并将该歌曲的歌词的字数作为总字数。计算机设备将相同歌词的字数除以总字数得到第一歌曲和第二歌曲的内容相似度。示例性地,第一歌曲的歌词内容为:今天没有作业啊,好开心啊。第二歌曲的歌词内容为:今天没有作业啦,好开心。相同歌词的字数为9,总字数为10,则内容相似度为0.9。
2、根据第一歌曲的全部歌词的持续时长和第二歌曲的全部歌词的持续时长,确定第一歌曲和第二歌曲的时长相似度。
歌曲的时长相似度是指两首歌曲的全部歌词的持续时长的相似程度。
在一种可能的实施方式中,计算机设备计算第一歌曲的全部歌词的持续时长和第二歌曲的全部歌词的持续时长的差值的第二绝对值,则第二绝对值与全部歌词的持续时长的相似程度呈负相关关系。第二绝对值越大,相似程度越低;第二绝对值越小,相似程度越高。
在另一种可能的实施方式中,计算机设备将第一歌曲的全部歌词的持续时长和第二歌曲的全部歌词的持续时长中较小的持续时长除以较长的持续时长,得到全部歌词的时长比值。全部歌词的时长比值与全部歌词的持续时长的相似程度呈正相关关系。全部歌词的时长比值越大,相似程度越高;全部歌词的时长比值越小,相似程度越低。
通过上述确定歌曲的内容相似度和时长相似度的方式,能够确保获取的第一歌曲和第二歌曲的歌曲整体相似度的准确性。
步骤103,当歌曲整体相似度符合第一预设条件时,获取第一歌曲和第二歌曲中每一组相对应的歌词的时间偏移值。
当计算机设备获取第一歌曲和第二歌曲的歌曲整体相似度后,检测该歌曲整体相似度是否符合第一预设条件。该第一预设条件可以根据实际经验设定。当歌曲整体相似度符合第一预设条件时,计算机设备确定第一歌曲和第二歌曲相似,则能够通过第一歌曲的音高信息生成第二歌曲的音高信息。当歌曲整体相似度不符合第一预设条件时,计算机设备确定第一歌曲和第二歌曲不相似,则不能够通过第一歌曲的音高信息生成第二歌曲的音高信息,结束流程。例如,第一歌曲是由张三演唱的歌曲A,第二歌曲是由李四演唱的歌曲A,但李四改写了歌词和旋律。此时,第一歌曲和第二歌曲不相似,则不能够通过第一歌曲的音高信息生成第二歌曲的音高信息。
可选地,当歌曲整体相似度包括歌曲的内容相似度和歌曲的时长相似度时,第一预设条件为歌曲的内容相似度大于第一阈值,且歌曲的时长相似度大于第二阈值。第一阈值和第二阈值均可以根据实际经验设定。
由于第一歌曲和第二歌曲为同一首歌曲不同版本,并且歌曲整体相似度符合第一预设条件,因此第一歌曲的歌词和第二歌曲的歌词之间存在对应关系。当歌曲整体相似度符合第一预设条件时,计算机设备获取第一歌曲和第二歌曲中每一组相对应的歌词的时间偏移值。时间偏移值是指每一组相对应的歌词的起始时间的时间差。由于第一歌曲和第二歌曲为同一首歌曲不同版本,虽然歌曲整体相似度符合第一预设条件,但每一组相对应的歌词的起始时间也可能不同。例如,第一歌曲是由张三演唱的歌曲A,第二歌曲是由李四演唱的歌曲A。张三在歌曲的1:00开始演唱第一句歌词,而李四在歌曲的1:02开始演唱第一句歌词,则第一歌曲和第二歌曲中相对应的第一句歌词的时间偏移值为2秒。需要说明的是,每一组相对应的歌词的时间偏移值可能相同,也可能不同。
步骤104,根据第一歌曲的每一句歌词的音高信息和时间偏移值,确定第二歌曲的每一句歌词的音高信息。
由于每一句歌词的起始时间戳与该句歌词的音高的起始时间戳相对应,所以当第二歌曲的一句歌词的起始时间戳相较于在第一歌曲中对应的歌词的起始时间戳发生变化时,该句歌词的音高的起始时间戳也会发生变化。音高的起始时间戳变化的值与歌词起始时间戳变化的值相同,即时间偏移值。因此,计算机设备能够根据第一歌曲的每一句歌词的音高信息和上述时间偏移值,确定第二歌曲的每一句歌词的音高信息。
可选地,上述步骤104包括如下子步骤:
1、对于第二歌曲的第k句歌词,根据第一歌曲的目标歌词的音高的起始时间戳和时间偏移值,计算第二歌曲的第k句歌词的音高的起始时间戳。
目标歌词是指第一歌曲中与第k句歌词相对应的一句歌词,k为正整数。因为音高的起始时间戳变化的值与歌词起始时间戳变化的值相同,所以计算机设备将第一歌曲的目标歌词的音高的起始时间戳加上第k句歌词和目标歌词的时间偏移值,得到第k句歌词的音高的起始时间戳。
可选地,在确定第k句歌词的音高的起始时间后,计算机设备检测第k句歌词的音高的起始时间戳是否大于第二歌曲前k-1句歌词中任意一句歌词的音高的起始时间戳。若不大于,则计算机设备确定无法根据第一歌曲的音高信息确定第二歌曲的音高信息,结束流程;若大于,则继续流程。
2、将目标歌词的音高的持续时长,确定为第k句歌词的音高的持续时长。
由于目标歌词和第k句歌词时同一首歌曲不同版本中对应的歌词,所以即使音高的起始时间不同,但音高的持续时长相同。因此,计算机设备能够直接将目标歌词的音高的持续时长,确定为第k句歌词的音高的持续时长。
需要说明的是,第二歌曲的歌词会因为排版问题与第一歌曲的歌词不同。示例性地,在第一歌曲中,“来世再相见”为一句歌词,而在第二歌曲中该句歌词被排版为两句歌词:“来世”和“再相见”。此时,计算机设备将“来世再相见”和“来世”作为一组对应的歌词,而“再相见”没有对应的歌词。计算机设备确定“来世”的音高的持续时长时仍然使用“来世再相见”的音高的持续时长,但无法确定“再相见”的音高信息。但由于在第二歌曲中仅仅是因为排版问题将“来世再相见”作为两句歌词,所以“来世”和“再相见”在播放时仍然是连续播放。因此,计算机设备在“来世”播放结束时继续沿用“来世再相见”的音高信息即可。
3、根据目标歌词的音高值,确定第k句歌词的音高值。
由于目标歌词和第k句歌词为一组对应的歌词,因此,计算机设备能够根据目标歌词的音高值,确定第k句歌词的音高值。
在一种可能的实施方式中,计算机设备直接将目标歌词的音高值作为第k句歌词的音高值。示例性地,第一歌曲和第二歌曲为演唱者相同但演唱出处不同的两个版本。由于演唱者为同一人,音高值不发生变化,因此计算机设备直接将目标歌词的音高值作为第k句歌词的音高值。
在另一种可能的实施方式中,目标歌词的音高值和第k句歌词的音高值并不相同,例如第一歌曲的演唱者为男性,而第二歌曲的演唱者为女性,由于男女之间声音的差异,音高值会发生变化。在该种情况下,计算机设备对第二歌曲的人声音频进行分析,确定第二歌曲的至少一个歌词的音高值,再根据至少一个歌词的音高值,以及至少一个歌词在第一歌曲中的音高值,确定第一歌曲和第二歌曲的音高差值。最终,计算机设备将目标歌词的音高值加上音高差值得到第k句歌词的音高值。计算机设备可以根据一个歌词确定音高差值,例如歌词中的第一个字。计算机设备也可以确定多个歌词的音高差值,再计算该多个歌词的音高差值的平均值,将该平均值作为最终的音高差值,以确保音高差值的准确性。
通过上述确定音高的起始时间戳、持续时长和音高值的方式,能够根据第一歌曲的每一句歌词的音高信息准确地生成第二歌曲的每一句歌词的音高信息。
在本申请实施例中,通过在确定歌曲整体相似度符合第一预设条件后,获取第一歌曲和第二歌曲中每一组相对应的歌词的时间偏移值,从而能够根据第一歌曲的每一句歌词的音高信息和时间偏移值,确定第二歌曲的每一句歌词的音高信息。由于是计算机设备根据第一歌曲的音高信息自动生成第二歌曲的音高信息,相较于人工提取的方式,无需人工手动提取,节省了人力成本,并且能够减少获取一首新版本歌曲的音高信息的耗时,提高获取音高信息的效率。
请参考图2,其示出了本申请另一个实施例提供的歌曲音高的生成方法的流程图。该方法可以包括如下几个步骤:
步骤201,获取第一歌曲的歌词文件和第二歌曲的歌词文件。
第一歌曲的歌词文件中包括p个句子,第二歌曲的歌词文件中包括q个句子,p和q均为正整数。歌曲的歌词文件包括多个句子和每个句子的起始时间戳。歌词文件包括的多个句子的句子内容是计算机设备在播放歌曲是显示的文字内容,包括歌词内容和其它内容。其它内容是指歌词之外的文字内容,例如歌曲专辑名,演唱者名称,作词者名称和作曲者名称等等。通常情况下上述其它内容位于歌词文件包括的多个句子的开始位置或结束位置。歌词文件中还包括了每一个句子的句子信息,该句子信息包括每一个句子的起始时间戳、持续时长和句子内容。当一个句子为歌曲的一句歌词时,句子信息即为歌词信息。
步骤202,从第一歌曲的歌词文件中,确定第一歌曲的第1句歌词和最后一句歌词。
计算机设备要获取第一歌曲的歌词信息,就需要从第一歌曲的歌词文件中包括的p个句子中确定句子内容为歌词内容的句子。由于歌曲的歌词是连续的,歌词中间不会出现上述其它内容。因此,在第一歌曲的歌词文件中,第一歌曲的第1句歌词至最后一句歌词的所有句子的句子信息即为第一歌曲的歌词信息。
计算机设备从第一歌曲的歌词文件中获取p个句子各自的起始时间戳,再计算第一歌曲的音高信息中第1句歌词的音高的起始时间戳与第一歌曲的歌词文件中的每一个句子的起始时间戳的差值的第一绝对值。最后,计算机设备选择第一绝对值最小的句子,确定为第一歌曲的第1句歌词。第一绝对值最小的句子是起始时间戳与音高信息中第1句歌词的音高的起始时间戳最接近的句子,又由于每一句歌词的起始时间戳与该句歌词的音高的起始时间戳相对应,因此确定第一绝对值最小的句子为第一歌曲的第1句歌词。
与上述确定第一歌曲的第1句歌词的原理相同,计算机设备计算第一歌曲的音高信息中最后一句歌词的音高的起始时间戳与第一歌曲的歌词文件中的每一个句子的起始时间戳的差值的第二绝对值。最后,选择第二绝对值最小的句子,确定为第一歌曲的最后一句歌词。
计算机设备在第一歌曲的歌词文件包括的p个句子中,能够根据第一歌曲的第1句歌词和最后一句歌词,获取第一歌曲的歌词信息。
步骤203,从第二歌曲的歌词文件中,确定第二歌曲的第1句歌词和最后一句歌词。
由于第二歌曲的第一句歌词的音高信息尚未确定,因此计算机设备无法通过确定第一歌曲的第1句歌词和最后一句歌词的方式确定第二歌曲的第1句歌词和最后一句歌词。
对于第二歌曲的第1句歌词,计算机设备根据第一歌曲的第1句至第1+w句歌词的歌词信息,以及第二歌曲的歌词文件中的第s个至第s+w个句子的句子信息,计算两者的第一匹配度,其中,s的初始值为1,w为正整数。第一匹配度可以是第一歌曲的第1句至第1+w句歌词的歌词和第二歌曲的歌词文件中的第s个至第s+w个句子的句子之间的内容相似度。具体地,计算机设备根据第一歌曲的第1句至第1+w句歌词的歌词内容和第二歌曲的歌词文件中的第s个至第s+w个句子的句子内容,确定两者之间相同内容的字数,再确定两者各自内容的字数,并将较小的字数作为总字数。计算机设备将相同内容的字数除以总字数得到第一匹配度。
若第一匹配度小于第一门限值,则令s=s+1,并且计算机设备再次根据第一歌曲的第1句至第1+w句歌词的歌词信息,以及第二歌曲的歌词文件中的第s个至第s+w个句子的句子信息,计算两者的第一匹配度,并检测是否小于第一门限值;若第一匹配度大于第一门限值,则确定第s个句子为第二歌曲的第1句歌词。其中,第一门限值可以根据实际经验设定。计算机设备从第二歌曲的歌词文件中的第1个句子至第1+w个句子开始,依次将第二歌曲的歌词文件中的连续w+1个句子与第一歌曲的第1句至第1+w句歌词进行匹配,直至确定出第一匹配度大于第一门限值的第s个至第s+w个句子。此时,第s个句子即为第二歌曲的第1句歌词。示例性地,第一歌曲有10句歌词,第二歌曲的歌词文件中有12个句子,其中,第1个和第2个句子的句子内容为歌曲名和演唱者,第3个至第12个句子是与第一歌曲的10句歌词对应的歌词。计算机设备计算第二歌曲的歌词文件中第1个至第2个句子与第一歌曲的前两句歌词的第一匹配度,确定第一匹配度小于第一门限值。计算机设备再计算第二歌曲的歌词文件中第2个至第3个句子与第一歌曲的前两句歌词的第一匹配度,第一匹配度仍然小于第一门限值。计算机设备又计算第二歌曲的歌词文件中第3个至第4个句子与第一歌曲的前两句歌词的第一匹配度,确定第一匹配度大于第一门限值。最终,计算机设备将第二歌曲的歌词文件中第3个句子为第二歌曲的第1句歌词。
对于第二歌曲的最后一句歌词,与确定第一歌曲的第1句歌词的原理相同,计算机设备根据第一歌曲的最后x句歌词的歌词信息,以及第二歌曲的歌词文件中的第q-x-1个至第q个句子的句子信息,计算两者的第二匹配度,其中,x为正整数。若第二匹配度小于第二门限值,则令q=q-1,并且计算机设备再次根据第一歌曲的最后x句歌词的歌词信息,以及第二歌曲的歌词文件中的第q-x-1个至第q个句子的句子信息,计算两者的第二匹配度,并检测是否小于第二门限值;若第二匹配度大于第二门限值,计算机设备则确定第q个句子为第二歌曲的最后一句歌词。其中,第二门限值可以根据实际经验设定,可以与第一门限值相同,也可以与第一门限值不同。
计算机设备在第二歌曲的歌词文件包括的q个句子中,能够根据第二歌曲的第1句歌词和最后一句歌词,获取第二歌曲的歌词信息。
可选地,计算机设备在获取每一句歌词的歌词内容时,检测歌词内容是否存在冒号。若存在,则计算机设备将冒号后的内容作为该句歌词的歌词内容。因为,一句歌词中出现冒号时,冒号前的内容通常不是歌词内容。示例性,一首歌曲由男女两位演唱者,此时,每句歌词前都会加上“男:”或“女:”用于表示该句歌词的演唱者,而冒号之后的内容才是歌词内容。
通过上述方式,计算机设备能够准确地从歌词文件中获取歌词信息,避免歌词文件中的其它内容对后续音高信息的获取造成干扰。
步骤204,根据第一歌曲的歌词信息和第二歌曲的歌词信息,获取第一歌曲和第二歌曲的歌曲整体相似度。
上述步骤204与图1提供的实施例中的步骤102相同,详情请参照图1实施例,本实施例对此不再进行赘述。
步骤205,当歌曲整体相似度符合第一预设条件时,获取第一歌曲和第二歌曲中每一组相对应的歌词的时间偏移值。
当计算机设备获取第一歌曲和第二歌曲的歌曲整体相似度后,检测该歌曲整体相似度是否符合第一预设条件。当歌曲整体相似度不符合第一预设条件时,计算机设备确定不能够通过第一歌曲的音高信息生成第二歌曲的音高信息,结束流程。当歌曲整体相似度符合第一预设条件时,计算机设备获取第一歌曲的第i句歌词和第二歌曲的第j句歌词的歌词整体相似度,i的初始值为1,j的初始值为1。
可选地,歌词整体相似度包括:歌词的内容相似度和时长相似度。歌词的内容相似度是指两句歌词在歌词内容上的相似程度。计算机设备确定两句歌词之间相同歌词的字数,再两句歌词之中的字数较少的一句歌词,并将该句歌词的字数作为总字数。计算机设备将相同歌词的字数除以总字数得到两句歌词的内容相似度。歌词的时长相似度是指两句歌词的持续时长的相似程度。计算机设备可以通过计算两句歌词的持续时长的差值的第三绝对值来获取时长相似度,也可以通过计算两句歌词的时长比值来获取时长相似度。
若歌词整体相似度不符合第二预设条件,则计算机设备确定第一歌曲的第i句歌词和第二歌曲的第j句歌词不是相对应的歌词,令j=j+1,并再次获取第一歌曲的第i句歌词和第二歌曲的第j句歌词的歌词整体相似度,即确定第一歌曲的第i句歌词与第二歌曲中的下一句歌词是否对应。
若歌词整体相似度符合第二预设条件,则计算机设备确定第i句歌词和第j句歌词相对应。计算机设备在确定第i句歌词和第j句歌词为一组相对应的歌词后,根据第i句歌词的起始时间戳和第j句歌词的起始时间戳,确定第i句歌词和第j句歌词的时间偏移值。
计算机设备在确定一组相对应的歌词的时间偏移值后,令i=i+1,j=j+1,再次获取第一歌曲的第i句歌词和第二歌曲的第j句歌词的歌词整体相似度,即从第二歌曲的下一句歌词开始搜索与第一歌曲的下一句歌词相对应的歌词。示例性地,计算机设备确定第一歌曲的第1歌词与第二歌曲的第1歌词为一组相对应的歌词,则计算机设备需确定第二歌曲中从第2句歌词至最后一句歌词中与第一歌曲的第2歌词对应的歌词。
当i=a+1或j=b+1时,计算机设备停止获取第一歌曲和第二歌曲中每一组相对应的歌词的时间偏移值。当i=a+1时,表示计算机设备已经遍历完第一歌曲的每一句歌词。其中,a表示第一歌曲的歌词信息中包括的句子总数。当j=b+1时,计算机设备已经遍历完第二歌曲的每一句歌词。其中,b表示第二歌曲的歌词信息中包括的句子总数。a、b均为正整数。
可选地,当歌词整体相似度包括歌词的内容相似度和时长相似度时,第二预设条件为歌词的内容相似度大于第三阈值,且歌词的时长相似度大于第四阈值。第三阈值和第四阈值均可以根据实际经验设定。
可选地,对于第一歌曲中的同一句歌词,若计算机设备执行上述获取第一歌曲的第i句歌词和第二歌曲的第j句歌词的歌词整体相似度的步骤的次数大于预设次数,则计算机设备确定第一歌曲和第二歌曲不相似,无法通过第一歌曲的音高信息生成第二歌曲的音高信息,结束流程。其中,预设次数可以根据实际经验设定。
步骤206,根据第一歌曲的每一句歌词的音高信息和时间偏移值,确定第二歌曲的每一句歌词的音高信息。
上述步骤206与图1提供的实施例中的步骤103相同,详情请参照图1实施例,本实施例对此不再进行赘述。
在本申请实施例中,通过在确定歌曲整体相似度符合第一预设条件后,获取第一歌曲和第二歌曲中每一组相对应的歌词的时间偏移值,从而能够根据第一歌曲的每一句歌词的音高信息和时间偏移值,确定第二歌曲的每一句歌词的音高信息。由于是计算机设备根据第一歌曲的音高信息自动生成第二歌曲的音高信息,相较于人工提取的方式,无需人工手动提取,节省了人力成本,并且能够减少获取一首新版本歌曲的音高信息的耗时,提高获取音高信息的效率。
另外,通过逐句检测歌词整体相似度的方式,准确地获取每一组相对应的歌词的时间偏移值,从而能够准确地生成第二歌曲的每一句歌词的音高信息。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图3,其示出了本申请一个实施例提供的歌曲音高的生成装置的框图。该装置具有实现上述实施例中歌曲音高的生成方法的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以包括:歌词获取模块301、相似获取模块302、时间获取模块303和音高确定模块304。
歌词获取模块301,用于获取第一歌曲的歌词信息和第二歌曲的歌词信息。
相似获取模块302,用于根据所述第一歌曲的歌词信息和所述第二歌曲的歌词信息,获取所述第一歌曲和所述第二歌曲的歌曲整体相似度。
时间获取模块303,用于当所述歌曲整体相似度符合第一预设条件时,获取所述第一歌曲和所述第二歌曲中每一组相对应的歌词的时间偏移值。
音高确定模块304,用于根据所述第一歌曲的每一句歌词的音高信息和时间偏移值,确定所述第二歌曲的每一句歌词的音高信息,其中,每一句歌词的音高信息包括:音高的起始时间戳、音高的持续时长和音高值。
在本申请实施例中,通过在确定歌曲整体相似度符合第一预设条件后,获取第一歌曲和第二歌曲中每一组相对应的歌词的时间偏移值,从而能够根据第一歌曲的每一句歌词的音高信息和时间偏移值,确定第二歌曲的每一句歌词的音高信息。由于是计算机设备根据第一歌曲的音高信息自动生成第二歌曲的音高信息,相较于人工提取的方式,无需人工手动提取,节省了人力成本,并且能够减少获取一首新版本歌曲的音高信息的耗时,提高获取音高信息的效率。
可选地,所述音高确定模块304,用于:对于所述第二歌曲的第k句歌词,根据所述第一歌曲的目标歌词的音高的起始时间戳和时间偏移值,计算所述第二歌曲的第k句歌词的音高的起始时间戳,其中,所述目标歌词是指所述第一歌曲中与所述第k句歌词相对应的一句歌词,所述k为正整数;将所述目标歌词的音高的持续时长,确定为所述第k句歌词的音高的持续时长。以及,根据所述目标歌词的音高值,确定所述第k句歌词的音高值。
可选地,所述音高确定模块304,用于:对所述第二歌曲的人声音频进行分析,确定所述第二歌曲的至少一个歌词的音高值;根据所述至少一个歌词的音高值,以及所述至少一个歌词在所述第一歌曲中的音高值,确定所述第一歌曲和所述第二歌曲的音高差值;根据所述目标歌词的音高值和所述音高差值,确定所述第k句歌词的音高值。
可选地,所述相似获取模块302,用于:获取所述第一歌曲的第i句歌词和所述第二歌曲的第j句歌词的歌词整体相似度,其中,所述i的初始值为1,所述j的初始值为1。所述时间获取模块303,用于:当所述歌词整体相似度不符合第二预设条件时,令j=j+1,并再次从所述获取所述第一歌曲的第i句歌词和所述第二歌曲的第j句歌词的歌词整体相似度的步骤开始执行;当所述歌词整体相似度符合所述第二预设条件时,确定所述第i句歌词和所述第j句歌词相对应;根据所述第i句歌词的起始时间戳和所述第j句歌词的起始时间戳,确定所述第i句歌词和所述第j句歌词的时间偏移值;令i=i+1,j=j+1,并再次从所述获取所述第一歌曲的第i句歌词和所述第二歌曲的第j句歌词的歌词整体相似度的步骤开始执行,直至i=a+1或j=b+1时,结束流程,其中,所述a表示所述第一歌曲的歌词信息中包括的句子总数,所述b表示所述第二歌曲的歌词信息中包括的句子总数,a、b均为正整数。
可选地,所述歌词信息包括:每一句歌词的起始时间戳、持续时长和歌词内容。所述相似获取模块302,用于:根据所述第一歌曲的歌词内容和所述第二歌曲的歌词内容,确定所述第一歌曲和所述第二歌曲的内容相似度;根据所述第一歌曲的全部歌词的持续时长和所述第二歌曲的全部歌词的持续时长,确定所述第一歌曲和所述第二歌曲的时长相似度;其中,所述歌曲整体相似度包括所述内容相似度和所述时长相似度。
可选地,所述相似获取模块302,用于:根据所述第一歌曲的歌词内容和所述第二歌曲的歌词内容,获取所述第一歌曲和所述第二歌曲中相同歌词的字数;根据所述相同歌词的字数和总字数,计算得到所述内容相似度;其中,当所述第一歌曲的歌词的字数大于所述第二歌曲的歌词的字数时,所述总字数为所述第二歌曲的字数;当所述第一歌曲的歌词的字数小于所述第二歌曲的歌词的字数时,所述总字数为所述第一歌曲的字数;当所述第一歌曲的歌词的字数等于所述第二歌曲的歌词的字数时,所述总字数为所述第一歌曲或者所述第二歌曲的字数。
可选地,所述歌词获取模块301,还用于:获取所述第一歌曲的歌词文件和所述第二歌曲的歌词文件,其中,所述第一歌曲的歌词文件中包括p个句子,所述第二歌曲的歌词文件中包括q个句子,所述p和所述q均为正整数;从所述第一歌曲的歌词文件中,确定所述第一歌曲的第1句歌词和最后一句歌词;从所述第二歌曲的歌词文件中,确定所述第二歌曲的第1句歌词和最后一句歌词。
可选地,所述歌词获取模块301,用于:计算所述第一歌曲的音高信息中第1句歌词的音高的起始时间戳,与所述第一歌曲的歌词文件中的每一个句子的起始时间戳的差值的第一绝对值;选择所述第一绝对值最小的句子,确定为所述第一歌曲的第1句歌词;以及,计算所述第一歌曲的音高信息中最后一句歌词的音高的起始时间戳,与所述第一歌曲的歌词文件中的每一个句子的起始时间戳的差值的第二绝对值;选择所述第二绝对值最小的句子,确定为所述第一歌曲的最后一句歌词。
可选地,所述歌词获取模块301,用于:根据所述第一歌曲的第1句至第1+w句歌词的歌词信息,以及所述第二歌曲的歌词文件中的第s个至第s+w个句子的句子信息,计算两者的第一匹配度,其中,所述s的初始值为1,所述w为正整数;当所述第一匹配度小于第一门限值时,令s=s+1,并再次从所述根据所述第一歌曲的第1句至第1+w句歌词的歌词信息,以及所述第二歌曲的歌词文件中的第s个至第s+w个句子的句子信息,计算两者的第一匹配度的步骤开始执行;当所述第一匹配度大于所述第一门限值时,确定所述第s个句子为所述第二歌曲的第1句歌词;以及,根据所述第一歌曲的最后x句歌词的歌词信息,以及所述第二歌曲的歌词文件中的第q-x-1个至第q个句子的句子信息,计算两者的第二匹配度,其中,所述x为正整数;当所述第二匹配度小于第二门限值时,令q=q-1,并再次从所述根据所述第一歌曲的最后x句歌词的歌词信息,以及所述第二歌曲的歌词文件中的第q-x-1个至第q个句子的句子信息,计算两者的第二匹配度的步骤开始执行;当所述第二匹配度大于所述第二门限值时,确定所述第q个句子为所述第二歌曲的最后一句歌词。
图4示出了本发明一个示例性实施例提供的计算机设备400的结构框图。该计算机设备400可以是PC、服务器或者手机。
通常,计算机设备400包括有:处理器401和存储器402。
处理器401可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器401可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器401可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器401还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器402中的非暂态的计算机可读存储介质用于存储计算机程序,该计算机程序用于被处理器401所执行以实现本申请中方法实施例提供的歌曲音高的生成方法。
在一些实施例中,计算机设备400还可选包括有:***设备接口403和至少一个***设备。处理器401、存储器402和***设备接口403之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口403相连。具体地,***设备包括:射频电路404、触摸显示屏405、摄像头406、音频电路407、定位组件408和电源409中的至少一种。
***设备接口403可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器401和存储器402。在一些实施例中,处理器401、存储器402和***设备接口403被集成在同一芯片或电路板上;在一些其他实施例中,处理器401、存储器402和***设备接口403中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路404用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路404将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路404包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路404可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路404还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏405用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏405是触摸显示屏时,显示屏405还具有采集在显示屏405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器401进行处理。此时,显示屏405还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏405可以为一个,设置计算机设备400的前面板;在另一些实施例中,显示屏405可以为至少两个,分别设置在计算机设备400的不同表面或呈折叠设计;在再一些实施例中,显示屏405可以是柔性显示屏,设置在计算机设备400的弯曲表面上或折叠面上。甚至,显示屏405还可以设置成非矩形的不规则图形,也即异形屏。显示屏405可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
摄像头组件406用于采集图像或视频。可选地,摄像头组件406包括前置摄像头和后置摄像头。通常,前置摄像头设置在计算机设备的前面板,后置摄像头设置在计算机设备的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件406还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器401进行处理,或者输入至射频电路404以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在计算机设备400的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器401或射频电路404的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路407还可以包括耳机插孔。
定位组件408用于定位计算机设备400的当前地理位置,以实现导航或LBS(Location Based Service,基于位置的服务)。定位组件408可以是基于美国的GPS(GlobalPositioning System,全球定位***)、中国的北斗***或俄罗斯的伽利略***的定位组件。
电源409用于为计算机设备400中的各个组件进行供电。电源409可以是交流电、直流电、一次性电池或可充电电池。当电源409包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
本领域技术人员可以理解,图4中示出的结构并不构成对计算机设备400的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于执行上述歌曲音高的生成方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (12)

1.一种歌曲音高的生成方法,其特征在于,所述方法包括:
获取第一歌曲的歌词信息和第二歌曲的歌词信息;
根据所述第一歌曲的歌词信息和所述第二歌曲的歌词信息,获取所述第一歌曲和所述第二歌曲的歌曲整体相似度;
当所述歌曲整体相似度符合第一预设条件时,获取所述第一歌曲和所述第二歌曲中每一组相对应的歌词的时间偏移值;
根据所述第一歌曲的每一句歌词的音高信息和时间偏移值,确定所述第二歌曲的每一句歌词的音高信息,其中,每一句歌词的音高信息包括:音高的起始时间戳、音高的持续时长和音高值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一歌曲的每一句歌词的音高信息和时间偏移值,确定所述第二歌曲的每一句歌词的音高信息,包括:
对于所述第二歌曲的第k句歌词,根据所述第一歌曲的目标歌词的音高的起始时间戳和时间偏移值,计算所述第二歌曲的第k句歌词的音高的起始时间戳,其中,所述目标歌词是指所述第一歌曲中与所述第k句歌词相对应的一句歌词,所述k为正整数;
将所述目标歌词的音高的持续时长,确定为所述第k句歌词的音高的持续时长;以及,
根据所述目标歌词的音高值,确定所述第k句歌词的音高值。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标歌词的音高值,确定所述第k句歌词的音高值,包括:
对所述第二歌曲的人声音频进行分析,确定所述第二歌曲的至少一个歌词的音高值;
根据所述至少一个歌词的音高值,以及所述至少一个歌词在所述第一歌曲中的音高值,确定所述第一歌曲和所述第二歌曲的音高差值;
根据所述目标歌词的音高值和所述音高差值,确定所述第k句歌词的音高值。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述获取所述第一歌曲和所述第二歌曲中每一组相对应的歌词的时间偏移值,包括:
获取所述第一歌曲的第i句歌词和所述第二歌曲的第j句歌词的歌词整体相似度,其中,所述i的初始值为1,所述j的初始值为1;
若所述歌词整体相似度不符合第二预设条件,则令j=j+1,并再次从所述获取所述第一歌曲的第i句歌词和所述第二歌曲的第j句歌词的歌词整体相似度的步骤开始执行;
若所述歌词整体相似度符合所述第二预设条件,则确定所述第i句歌词和所述第j句歌词相对应;根据所述第i句歌词的起始时间戳和所述第j句歌词的起始时间戳,确定所述第i句歌词和所述第j句歌词的时间偏移值;令i=i+1,j=j+1,并再次从所述获取所述第一歌曲的第i句歌词和所述第二歌曲的第j句歌词的歌词整体相似度的步骤开始执行,直至i=a+1或j=b+1时,结束流程,其中,所述a表示所述第一歌曲的歌词信息中包括的句子总数,所述b表示所述第二歌曲的歌词信息中包括的句子总数,a、b均为正整数。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述歌词信息包括:每一句歌词的起始时间戳、持续时长和歌词内容;
所述根据所述第一歌曲的歌词信息和所述第二歌曲的歌词信息,确定所述第一歌曲和所述第二歌曲的歌曲整体相似度,包括:
根据所述第一歌曲的歌词内容和所述第二歌曲的歌词内容,确定所述第一歌曲和所述第二歌曲的内容相似度;
根据所述第一歌曲的全部歌词的持续时长和所述第二歌曲的全部歌词的持续时长,确定所述第一歌曲和所述第二歌曲的时长相似度;
其中,所述歌曲整体相似度包括所述内容相似度和所述时长相似度。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一歌曲的歌词内容和所述第二歌曲的歌词内容,确定所述第一歌曲和所述第二歌曲的内容相似度,包括:
根据所述第一歌曲的歌词内容和所述第二歌曲的歌词内容,获取所述第一歌曲和所述第二歌曲中相同歌词的字数;
根据所述相同歌词的字数和总字数,计算得到所述内容相似度;
其中,当所述第一歌曲的歌词的字数大于所述第二歌曲的歌词的字数时,所述总字数为所述第二歌曲的字数;当所述第一歌曲的歌词的字数小于所述第二歌曲的歌词的字数时,所述总字数为所述第一歌曲的字数;当所述第一歌曲的歌词的字数等于所述第二歌曲的歌词的字数时,所述总字数为所述第一歌曲或者所述第二歌曲的字数。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取所述第一歌曲的歌词文件和所述第二歌曲的歌词文件,其中,所述第一歌曲的歌词文件中包括p个句子,所述第二歌曲的歌词文件中包括q个句子,所述p和所述q均为正整数;
从所述第一歌曲的歌词文件中,确定所述第一歌曲的第1句歌词和最后一句歌词;
从所述第二歌曲的歌词文件中,确定所述第二歌曲的第1句歌词和最后一句歌词。
8.根据权利要求7所述的方法,其特征在于,所述从所述第一歌曲的歌词文件中,确定所述第一歌曲的第1句歌词和最后一句歌词,包括:
计算所述第一歌曲的音高信息中第1句歌词的音高的起始时间戳,与所述第一歌曲的歌词文件中的每一个句子的起始时间戳的差值的第一绝对值;选择所述第一绝对值最小的句子,确定为所述第一歌曲的第1句歌词;
以及,
计算所述第一歌曲的音高信息中最后一句歌词的音高的起始时间戳,与所述第一歌曲的歌词文件中的每一个句子的起始时间戳的差值的第二绝对值;选择所述第二绝对值最小的句子,确定为所述第一歌曲的最后一句歌词。
9.根据权利要求7所述的方法,其特征在于,所述从所述第二歌曲的歌词文件中,确定所述第二歌曲的第1句歌词和最后一句歌词,包括:
根据所述第一歌曲的第1句至第1+w句歌词的歌词信息,以及所述第二歌曲的歌词文件中的第s个至第s+w个句子的句子信息,计算两者的第一匹配度,其中,所述s的初始值为1,所述w为正整数;若所述第一匹配度小于第一门限值,则令s=s+1,并再次从所述根据所述第一歌曲的第1句至第1+w句歌词的歌词信息,以及所述第二歌曲的歌词文件中的第s个至第s+w个句子的句子信息,计算两者的第一匹配度的步骤开始执行;若所述第一匹配度大于所述第一门限值,则确定所述第s个句子为所述第二歌曲的第1句歌词;
以及,
根据所述第一歌曲的最后x句歌词的歌词信息,以及所述第二歌曲的歌词文件中的第q-x-1个至第q个句子的句子信息,计算两者的第二匹配度,其中,所述x为正整数;若所述第二匹配度小于第二门限值,则令q=q-1,并再次从所述根据所述第一歌曲的最后x句歌词的歌词信息,以及所述第二歌曲的歌词文件中的第q-x-1个至第q个句子的句子信息,计算两者的第二匹配度的步骤开始执行;若所述第二匹配度大于所述第二门限值,则确定所述第q个句子为所述第二歌曲的最后一句歌词。
10.一种歌曲音高的生成装置,其特征在于,所述装置包括:
歌词获取模块,用于获取第一歌曲的歌词信息和第二歌曲的歌词信息;
相似获取模块,用于根据所述第一歌曲的歌词信息和所述第二歌曲的歌词信息,获取所述第一歌曲和所述第二歌曲的歌曲整体相似度;
时间获取模块,用于当所述歌曲整体相似度符合第一预设条件时,获取所述第一歌曲和所述第二歌曲中每一组相对应的歌词的时间偏移值;
音高确定模块,用于根据所述第一歌曲的每一句歌词的音高信息和时间偏移值,确定所述第二歌曲的每一句歌词的音高信息,其中,每一句歌词的音高信息包括:音高的起始时间戳、音高的持续时长和音高值。
11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序在被所述处理器加载并执行时实现如权利要求1至9任一项所述的歌曲音高的生成方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至9任一项所述的歌曲音高的生成方法。
CN201711353128.6A 2017-12-15 2017-12-15 歌曲音高的生成方法、装置及设备 Active CN108109634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711353128.6A CN108109634B (zh) 2017-12-15 2017-12-15 歌曲音高的生成方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711353128.6A CN108109634B (zh) 2017-12-15 2017-12-15 歌曲音高的生成方法、装置及设备

Publications (2)

Publication Number Publication Date
CN108109634A CN108109634A (zh) 2018-06-01
CN108109634B true CN108109634B (zh) 2020-12-04

Family

ID=62217369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711353128.6A Active CN108109634B (zh) 2017-12-15 2017-12-15 歌曲音高的生成方法、装置及设备

Country Status (1)

Country Link
CN (1) CN108109634B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108172206B (zh) * 2017-12-27 2021-05-07 广州酷狗计算机科技有限公司 音频处理方法、装置及***
CN109446317B (zh) * 2018-10-31 2022-08-02 广州酷狗计算机科技有限公司 显示歌词的方法、装置、设备及可读存储介质
CN110033791B (zh) * 2019-03-26 2021-04-09 北京雷石天地电子技术有限公司 一种歌曲基频提取方法及装置
CN111159465B (zh) * 2019-12-31 2023-09-29 杭州网易云音乐科技有限公司 一种歌曲分类方法及装置
CN111339350B (zh) * 2020-03-27 2023-11-28 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法、装置、存储介质及电子设备
CN111429949B (zh) * 2020-04-16 2023-10-13 广州繁星互娱信息科技有限公司 音高线生成方法、装置、设备及存储介质
CN112309435B (zh) * 2020-10-30 2024-06-07 北京有竹居网络技术有限公司 一种主旋律的生成方法、装置、电子设备及存储介质
CN113140230B (zh) * 2021-04-23 2023-07-04 广州酷狗计算机科技有限公司 音符音高值的确定方法、装置、设备及存储介质
CN113436591B (zh) * 2021-06-24 2023-11-17 广州酷狗计算机科技有限公司 音高信息生成方法、装置、计算机设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0723256B1 (en) * 1995-01-17 2001-10-24 Yamaha Corporation Karaoke apparatus modifying live singing voice by model voice
CN104715760A (zh) * 2015-02-13 2015-06-17 朱威 一种k歌匹配分析方法及***
CN105788589A (zh) * 2016-05-04 2016-07-20 腾讯科技(深圳)有限公司 一种音频数据的处理方法及装置
CN105825872A (zh) * 2016-03-15 2016-08-03 腾讯科技(深圳)有限公司 歌曲的难度确定方法和装置
CN106057213A (zh) * 2016-06-30 2016-10-26 广州酷狗计算机科技有限公司 一种显示人声音高数据的方法和装置
CN106157979A (zh) * 2016-06-24 2016-11-23 广州酷狗计算机科技有限公司 一种获取人声音高数据的方法和装置
CN107122493A (zh) * 2017-05-19 2017-09-01 北京金山安全软件有限公司 歌曲播放方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3319211B2 (ja) * 1995-03-23 2002-08-26 ヤマハ株式会社 音声変換機能付カラオケ装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0723256B1 (en) * 1995-01-17 2001-10-24 Yamaha Corporation Karaoke apparatus modifying live singing voice by model voice
CN104715760A (zh) * 2015-02-13 2015-06-17 朱威 一种k歌匹配分析方法及***
CN105825872A (zh) * 2016-03-15 2016-08-03 腾讯科技(深圳)有限公司 歌曲的难度确定方法和装置
CN105788589A (zh) * 2016-05-04 2016-07-20 腾讯科技(深圳)有限公司 一种音频数据的处理方法及装置
CN106157979A (zh) * 2016-06-24 2016-11-23 广州酷狗计算机科技有限公司 一种获取人声音高数据的方法和装置
CN106057213A (zh) * 2016-06-30 2016-10-26 广州酷狗计算机科技有限公司 一种显示人声音高数据的方法和装置
CN107122493A (zh) * 2017-05-19 2017-09-01 北京金山安全软件有限公司 歌曲播放方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Automatic Evaluation of Karaoke Singing Based on Pitch, Volume, and Rhythm Features";W. Tsai 等;《IEEE Transactions on Audio, Speech, and Language Processing》;20111118;全文 *
"人声演唱评分***的设计与实现";白杰;《http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=D727530》;20160504;全文 *

Also Published As

Publication number Publication date
CN108109634A (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN108109634B (zh) 歌曲音高的生成方法、装置及设备
CN107978323B (zh) 音频识别方法、装置及存储介质
CN108008930B (zh) 确定k歌分值的方法和装置
CN108538302B (zh) 合成音频的方法和装置
WO2021068903A1 (zh) 确定音量的调节比例信息的方法、装置、设备及存储介质
CN110931053B (zh) 检测录音时延、录制音频的方法、装置、终端及存储介质
CN109448761B (zh) 播放歌曲的方法和装置
CN109346111B (zh) 数据处理方法、装置、终端及存储介质
CN110209871B (zh) 歌曲评论发布方法及装置
CN109192218B (zh) 音频处理的方法和装置
CN109033335A (zh) 音频录制方法、装置、终端及存储介质
CN109616090B (zh) 多音轨序列生成方法、装置、设备及存储介质
CN109327707B (zh) 转移虚拟资源的方法、装置及存储介质
CN111625682B (zh) 视频的生成方法、装置、计算机设备及存储介质
CN111524501A (zh) 语音播放方法、装置、计算机设备及计算机可读存储介质
CN111081277B (zh) 音频测评的方法、装置、设备及存储介质
CN108922562A (zh) 演唱评价结果显示方法及装置
CN108053832B (zh) 音频信号处理方法、装置、电子设备及存储介质
CN111933098A (zh) 伴奏音乐的生成方法、装置及计算机可读存储介质
CN112667844A (zh) 检索音频的方法、装置、设备和存储介质
CN111428079A (zh) 文本内容处理方法、装置、计算机设备及存储介质
CN110349559A (zh) 进行音频合成的方法、装置、***、设备及存储介质
CN112435643A (zh) 生成电音风格歌曲音频的方法、装置、设备及存储介质
CN108922533A (zh) 确定是否是真唱的方法和装置
CN108717849A (zh) 拼接多媒体数据的方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant