CN101652808A - 基于表演情景来修改卡拉ok***中的视听输出 - Google Patents
基于表演情景来修改卡拉ok***中的视听输出 Download PDFInfo
- Publication number
- CN101652808A CN101652808A CN200780052706.0A CN200780052706A CN101652808A CN 101652808 A CN101652808 A CN 101652808A CN 200780052706 A CN200780052706 A CN 200780052706A CN 101652808 A CN101652808 A CN 101652808A
- Authority
- CN
- China
- Prior art keywords
- context information
- karaoke
- equipment
- lyrics
- performance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 33
- 230000003044 adaptive effect Effects 0.000 claims description 20
- 230000004048 modification Effects 0.000 claims description 18
- 238000012986 modification Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 abstract description 6
- 230000008859 change Effects 0.000 description 20
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 14
- 241001342895 Chorus Species 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 229940056345 tums Drugs 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 235000013405 beer Nutrition 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- GICIECWTEWJCRE-UHFFFAOYSA-N 3,4,4,7-tetramethyl-2,3-dihydro-1h-naphthalene Chemical compound CC1=CC=C2C(C)(C)C(C)CCC2=C1 GICIECWTEWJCRE-UHFFFAOYSA-N 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000036626 alertness Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001631 hypertensive effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
- G10H1/368—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems displaying animated or moving pictures synchronized with the music or audio part
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/046—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/005—Non-interactive screen display of musical or status data
- G10H2220/011—Lyrics displays, e.g. for karaoke applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明允许表演者和观众与卡拉OK***交互以便控制或者修改卡拉OK表演的视听输出。获得与当前卡拉OK表演有关的情景信息。作为响应,基于获得的情景信息来修改当前卡拉OK表演的至少一个视听输出方面。
Description
技术领域
本发明主要地涉及多媒体娱乐***。具体而言,本发明涉及卡拉OK***。
背景技术
卡拉OK是源于日本的一种娱乐形式,其中通常为业余爱好者的一个或者多个演唱者在麦克风上随着记录音乐来演唱。该音乐常常是一首无原唱者话音或者原唱者话音音量减少的流行或者公知歌曲。歌词通常也显示给一个或者多个表演者(例如在音乐视频上)以指导演唱下去。
常规卡拉OK***包含至少一个麦克风、扬声器、音频放大器和/或混合器,该混合器可选地配备有用于例如创建回响效果的效果单元、用于表演者的视频显示器以及某种视听回放***,如例如视频回放***或者具有视频回放能力的本地或者远程基于计算机的***。常规卡拉OK***也可以包括用于观众的多个视频屏幕和用于在视频屏幕上显示表演者的摄像机。
通常,除了显示歌词之外,卡拉OK***也具有用于在表演者的视频显示器上(并且有时也在观众视频屏幕上)表明在给定瞬间应当演唱歌词的哪些字词以进一步指导演唱下去的可视方法。这些可视方法例如包括与回放音乐同步地改变歌词的颜色以及与回放音乐同步地在当前字词的上方弹跳的球。
通常以多轨道格式记录音乐,该格式包括例如各自具有它自己的乐器的分立音轨。音乐作品可以是乐器版本。取而代之,音乐作品也可以包含具有领唱唱音的音轨,其中领唱唱音在演唱者演唱之时被消音或者抑制。换而言之,卡拉OK歌曲或者音乐作品包括数个音轨,其中多数或者所有音轨是乐器背景音乐音轨。除了乐器背景音乐音轨之外,卡拉OK歌曲或者音乐作品可以包括背景唱音音轨以及领唱唱音音轨。乐器背景音乐音轨可以是预先记录的音轨,如例如数字音频音轨,或者乐器背景音乐音轨可以是合成音轨,如例如MIDI(音乐乐器数字接口)音轨。
然而,现有技术的卡拉OK***为演唱者和观众提供用以与卡拉OK***交互以便控制或者修改卡拉OK表演的视听输出的很有限的(如果有的话)选项。例如,尽管表演者可以演唱他/她选择的任何歌曲,仍然在视频显示器和屏幕上示出原歌词。也就是说,现有技术没有教导或者提出在逐个场所的基础上适配所显示的歌词。类似地,现有技术没有教导或者提出基于当前卡拉OK表演周围的情景或者境况来交互地修改乐器背景音乐音轨。
发明内容
本发明的第一方面是一种其中获得与当前卡拉OK表演有关的情景信息的方法。作为响应,基于获得的情景信息来修改当前卡拉OK表演的至少一个视听输出方面。
本发明的第二方面是一种设备,该设备包括:情景信息获得器,配置为获得与当前卡拉OK表演有关的情景信息。第二方面的设备还包括:卡拉OK输出修改器,配置为基于获得的情景信息来修改当前卡拉OK表演的至少一个视听输出方面。
本发明的第三方面是一种设备,该设备包括:情景信息获得装置,用于获得与当前卡拉OK表演有关的情景信息。第三方面的装置还包括:卡拉OK输出修改装置,用于基于获得的情景信息来修改当前卡拉OK表演的至少一个视听输出方面。
本发明的第四方面是一种在计算机可读介质上体现的计算机程序,该计算机程序控制数据处理进行以下操作:
获得与当前卡拉OK表演有关的情景信息,并且
基于获得的情景信息来修改当前卡拉OK表演的至少一个视听输出方面。
本发明的第五方面是一种***,该***包括:至少一个麦克风,配置为接收进行当前卡拉OK表演的至少一个卡拉OK表演者的发生。第五方面的***还包括:卡拉OK设备,配置为产生包括视频部分和音频部分的卡拉OK信号并且混合麦克风接收的发声与音频部分。第五方面的***还包括:至少一个扬声器,配置为输出混合的音频部分;以及显示器,配置为输出视频部分。第五方面的***还包括:情景信息获得器,配置为获得与当前卡拉OK表演有关的情景信息。第五方面的***还包括:卡拉OK输出修改器,配置为基于获得的情景信息来修改视频部分和混合的音频部分中的至少一个部分。
在本发明的一个实施方式中,第一方面的方法由数据处理设备进行,该数据处理设备由在计算机可读介质上体现的计算机程序控制。
在本发明的一个实施方式中,对进行当前卡拉OK表演的卡拉OK表演者发声的字词进行语言识别。
在本发明的一个实施方式中,通过接收对发声和语音识别的字词中包括的预定关键字的指示来获得情景信息。
在本发明的一个实施方式中,通过接收将预定歌词部分语音识别为已经用取代歌词部分来发声的指示来获得情景信息。
在本发明的一个实施方式中,获得外部输入数据作为情景信息。
在本发明的一个实施方式中,从外部设备获得外部输入数据作为情景信息。
在本发明的一个实施方式中,获得外部表演传感器数据作为情景信息。
在本发明的一个实施方式中,获得与当前卡拉OK表演的至少一个参与者关联的个人信息管理器数据作为情景信息。
在本发明的一个实施方式中,通过基于获得的情景信息适配当前卡拉OK表演的至少一个音轨来修改至少一个视听输出方面。
在本发明的一个实施方式中,通过基于获得的情景信息在下次显示时替换当前卡拉OK表演的至少一个预定歌词部分来修改至少一个视听输出方面。
将理解可以在相互之间的任何组合中运用上述本发明的方面和实施方式。数个方面和实施方式可以组合在一起形成本发明的更多实施方式。作为本发明一个方面的方法、设备、***或者计算机程序包括上述本发明的至少一个实施方式。
本发明允许表演者和观众与卡拉OK***交互以便控制或者修改卡拉OK表演的视听输出。例如,本发明允许在逐个场所的基础上修改所显示的歌词。作为又一例子,本发明允许基于当前卡拉OK表演周围的情景或者境况来交互地修改乐器背景音乐音轨。
附图说明
所含用来提供对本发明的进一步理解并且构成本说明书一部分人的附图图示了本发明的实施方式并且与说明书一起帮助说明本发明的原理。在附图中:
图1是图示了根据本发明一个实施方式的卡拉OK***的框图,并且
图2a-2e是图示了根据本发明实施方式的各种方法的流程图。
具体实施方式
现在将具体参照在附图中图示其例子的本发明实施方式。
图1是图示了根据本发明一个实施方式的卡拉OK***的框图。
图1中所示***包括麦克风1540,该麦克风被配置为接收进行当前卡拉OK表演的卡拉OK表演者的发声。图1中所示***还包括连接到麦克风1540的卡拉OK设备1500。
卡拉OK设备1500可以包括音频/视频回放部分,该部分被配置为回放包括多个音轨的预先记录的卡拉OK歌曲,这些音轨至少包括乐器背景音乐音轨并且可选地包括背景唱音音轨和/或领唱唱音音轨。可选地,预先记录的卡拉OK歌曲可以包括图形,这些图形包括当前演唱的歌曲的歌词。卡拉OK设备1500还可以包括放大器部分,该部分被配置为在回放的音轨输出到扬声器1521和1522之前放大它们。卡拉OK设备1500还可以包括混合器部分,该部分配置为混合从麦克风1540接收的演唱者的发声与音频部分。预先记录的卡拉OK歌曲可以存储于卡拉OK设备1500中,或者它们可以存储于***中的别处并且随需提供给卡拉OK设备1500以供回放。
将理解图1中所示***的各种部件可以相互集成。例如在本发明的一个实施方式中,麦克风1540可以与移动设备1610、1620、1630中的至少一个移动设备集成以允许一个或者多个参与者将他们的移动设备麦克风(在图1中未示出)与卡拉OK表演结合利用而不是利用专用麦克风。
卡拉OK设备1500可以是常规卡拉OK机,比如在卡拉OK吧和卡拉OK包厢中普遍使用的现有技术的卡拉OK机。作为替代,卡拉OK设备1500可以是具有用于实现上述特征的适当软件/硬件的游戏控制台。在另一替代方式中,卡拉OK设备1500可以是具有用于实现上述特征的适当软件/硬件的个人计算机。在又一替代方式中,卡拉OK设备1500可以是具有用于实现上述特征的适当软件/硬件的移动计算设备,如例如智能电话。
图1中所示***还包括配置为输出混合的音频信号、连接到卡拉OK设备1500的扬声器1521和1522。自然而言,扬声器数量不限于两个。实际上可以有任何数目的扬声器。图1中所示***还包括显示器1510,比如视频监视器或者屏幕,该显示器被配置为显示当前表演的歌曲的歌词以便指导表演者演唱下去。除了既定用于表演者的显示器1510之外,可以有用于观众的附加显示器(在图1中未示出)。图1中所示***还包括可以用来记录当前表演者的摄像机1530,该记录例如可以在表演者表演之时实况显示于观众显示器上。将理解摄像机1530为可选而不是本发明所必需的。***也可以包括各自配置为显示当前活跃的卡拉OK参与者的数个摄像机。
在本发明的一个实施方式中,显示器1510或者至少一个附加显示器可以分别与移动设备1610、1620、1630中的至少一个移动设备集成以允许一个或者多个参与者将他们的移动设备显示器(在图1中未示出)与卡拉OK表演结合利用而不是利用专用显示器。
类似地,在本发明的一个实施方式,摄像机1530可以与移动设备1610、1620、1630中的至少一个移动设备集成以允许一个或者多个参与者将他们的移动设备摄像机(在图1中未示出)与卡拉OK表演结合利用而不是利用专用摄像机。
图1中所示***还包括个人计算机1000。在图1中所示本发明的实施方式中,个人计算机1000包括构成本发明一部分的下文更具体描述的多个特征。然而将理解可以使用另一适当设备而不是个人计算机1000。个人计算机1000可以例如由游戏控制台或者移动计算设备取代。在另一实施方式中,个人计算机1000和卡拉OK设备1500可以集成到单个设备中。
在图1中所示本发明的实施方式中,个人计算机1000包括根据本发明的设备1100,该设备包括情景信息获得器1110、卡拉OK输出修改器1120以及语音识别器1130,该识别器被配置为对进行当前卡拉OK表演的卡拉OK表演者经由麦克风1540发声的字词进行语音识别。
情景信息获得器1110被配置为获得与当前卡拉OK表演有关的情景信息。在本发明的一个实施方式中,情景信息获得器1110被配置为通过从语音识别器1130接收在发声和语音识别的字词中包括预定关键字这一指示来获得情景信息。在本发明的另一实施方式中,情景信息获得器1110被配置为通过从语音识别器1130接收将预定歌词部分被语音识别为已经用取代歌词部分来发声这一指示来获得情景信息。在本发明的又一实施方式中,情景信息获得器1110被配置为获得外部输入数据作为情景信息。
在一个实施方式中,例如可以经由与个人计算机1000关联的键盘、鼠标或者另一输入设备(在图1中未示出)接收这一外部输入数据。在另一实施方式中,例如可以经由连接到个人计算机100的通信网络(在图1中未示出)如因特网或者局域网接收这一外部输入数据。在又一实施方式中,可以例如从外部设备、比如传感器器件1300、与表演者关联的移动设备1610或者与观众参与者关联的移动设备1620和1630中的至少一个移动设备接收这一外部输入数据。从移动设备1610、1620和/或1630接收的外部输入数据例如可以包括与当前卡拉OK表演的至少一个参与者(表演者或者观众)关联的个人信息关联器数据。外部输入数据也可以包括关于至少一个参与者的设备上的媒体文件的信息。外部输入数据也可以包括至少一个参与者向他的/她的移动电话的麦克风输入(演唱或者讲话)的音频数据。从传感器器件1300接收的外部输入数据例如可以是外部表演传感器数据。将理解术语“外部”在这里用来指代“在常规卡拉OK***以外”。将参照图2a-2e更具体地描述用于获得情景信息的这些各种选项。
在本发明的一个实施方式中,与至少一个参与者关联的个人信息管理器数据可以包括日历数据、联系人列表数据和存在服务数据中的至少一项。如本领域中所知,术语“存在服务”指代一种维护与用户有空进行通信有关的状态信息的信息服务。给定用户有空进行通信的状态可以经由存在服务针对其他用户来分发或者发布。用户可以随需更新他的她的有空状态(availability status)。这里将理解术语“存在服务”也涵盖例如XMPP标准基金会于2006年8月在协议组XEP-0119和XEP-0163中公开的“扩展存在”(http://www.xmpp.org/xsf/)。
卡拉OK输出放大器1120被配置为基于获得的情景信息来修改当前卡拉OK表演的至少一个视频输出方面。在本发明的一个实施方式中,卡拉OK输出放大器1120可以包括音轨适配器1121,该适配器被配置为基于获得的情景信息来适配当前卡拉OK表演的至少一个音轨。将理解在本文中术语“音轨”包括预先记录的轨道(比如音乐轨道)和实际卡拉OK表演者在卡拉OK表演期间演唱的唱音以及观众成员演唱的伴唱唱音。
另外,卡拉OK输出放大器1120还可以包括歌词适配器1122,该适配器被配置为基于获得的情景信息在下次显示时替换当前卡拉OK表演的至少一个预定歌词部分。同样,将参照图2a-2e更具体地描述用于修改当前卡拉OK表演的视听输出方面的这些各种选项。
在图1中所示本发明的实施方式中,个人计算机1000还包括音轨储存器1210、歌词储存器1220、规则储存器1230、话音命令储存器1240和可修改字词储存器1250。将理解这些储存器无需布置于个人计算机1000内。实际上,可以结合卡拉OK***在另一适当位置提供储存器1210-1250中的至少一个储存器。另外,这些储存器中的至少两个储存器可以相互集成。
图2a是图示了根据本发明一个实施方式的方法的流程图。在步骤200获得与当前卡拉OK表演有关的情景信息。然后在步骤201基于获得的情景信息来修改当前卡拉OK表演的至少一个视听输出方面。
可以用数种方式实施图2a中所示本发明的实施方式。图2b-2e图示了这样的实施方式的例子。在图2b中所示实施方式中,对进行当前卡拉OK表演的卡拉OK表演者发声的字词进行语音识别,步骤210。在步骤211确定在目前为止发声和语音识别的字词中是否包括一个或者多个预定关键字。如果不包括,则该方法返回到其中继续语音识别的步骤210。如果包括,则基于识别的关键字来适配当前卡拉OK表演的至少一个音轨,步骤212。
如本领域中所知,术语“语音识别”指代借助计算机程序来识别用户讲话或者演唱的字词或者短语这一领域。与语音识别领域有关的是话音控制领域,后者指代利用计算机***来实现与识别的字词关联的命令。在Rabiner,Juang于1993年由Prentice-Hall出版的“Fundamentals of Speech Recognition”中描述了例如用于识别孤立字词的各种形式的语音识别***。为了使语音识别***对于形式为演唱的输入而言更稳健,可以使用演唱来训练语音识别***中普遍使用的声学模型。取而代之或者除此之外,例如还可以使用如Hosoya,Suzuki,Ito,Makino在英国伦敦第6次International Conference onMusic Information Retrieval(2005年9月11-15日)的学报中描述的最大似然度线性回归方法针对利用语音训练的声学模型进行对演唱数据的适配。另外,数个约束可以用来提高识别性能,比如对可以用作识别语法的歌曲歌词的了解、对用以表明当前字词的当前歌曲位置的了解以及用于可能关键字和/或字词备选的有限词汇表。
如上所述,卡拉OK歌曲或者音乐作品可以包括多个音轨,这些音轨包括乐器背景音乐音轨以及可选背景唱音音轨和/或可选领唱唱音音轨。然而,音乐作品通常是乐器版本或者已经去除领唱唱音。音乐作品例如可以是MIDI(音乐乐器数字接口)或者多轨道数字音频格式。也就是说,音乐作品可以包括各自具有其自己的乐器的分立轨道。
根据本发明,音轨适配器1121可以在步骤212(或者在图2d的步骤231)至少用以下方式修改音乐作品的回放:将轨道并且因此将乐器消音或者解除消音;将乐曲从一个流派(例如grunge)改变为另一流派(例如爵士);将回放从一个歌曲部分改变为另一歌曲部分(为了有助于这一改变,例如可以在下文更具体描述的数字音频文件的元数据段中标注歌曲部分如引子、章节、合声和尾声的开始位置);添加或者去除效果,比如失真或者回音;增加或者减少效果如失真或者回音的水平;增加或者减少回放速度或者拍子;以及增加或者减少发音与背景歌曲相比的音量。
另外根据本发明,对卡拉OK表演中将要使用的音乐作品的修改可以包括根据情景信息来选择适当伴奏轨道。例如,可以有各自用不同音乐风格来播放的各音乐作品的数个版本。当获得情景信息如表演者职业时,可以选择关联风格的伴奏轨道。例如,可以针对以工程师为职业的表演者选择合成通俗风格的伴奏轨道。
另外根据本发明,例如可以在话音命令储存器1240中提供一组预先限定的话音命令,如例如“更多鼓声”、“更少铜管”、“带我到合声”、“表演更快”和“伙计们再来一次(one more time boys)”。可以例如在显示器1510上示出话音命令以便允许表演者学习他们。
在卡拉OK表演期间,本发明的设备1100观察-经由由语音识别器1130进行的语音识别(步骤210)-表演者演唱或者讲话的字词或者短语。当情景信息获得器1110检测到(步骤211)表演者已经给出在上述一组预先限定的话音命令中包括的话音命令时,音轨适配器1121执行与检测到的话音命令关联的预定动作。例如,当用户呼喊“更多鼓声”时,音轨适配器1121可以将具有附加鼓声的轨道解除消音。作为另一例子,当表演者喊叫“带我到合声”时,回放可以跳转到当前音乐作品的合声部分的开头。例如可以在规则储存器1230中提供用于修改回放的规则,这些规则例如可以是布置于个人计算机1000的硬驱动(在图1中未示出)中的数据文件。这些规则可以限定通过激活相应MIDI或者多轨道数字音频文件的某个轨道来执行话音命令“更多鼓声”。
此外,设备1100也可以具有用以例如在演唱者忘记歌曲旋律的情况下支持演唱者的能力。用于这一功能的预先限定的话音命令例如可以是“求助”。当激活这一命令时,音轨适配器1121例如可以播放作为乐器或者发音版本的旋律。
另外,在话音命令中有与音乐作品的歌词相似的字词的情况下,设备1100可以比较歌词中包括的字词与识别的字词以有助于避免对回放的非所需修改。
可选地,可以提供用户在发出话音命令时激活的专用按钮或者其它这样的设备。这样,用户可以向设备1100明确地表明在按压按钮之时出声的字词代表话音命令而不是正常演唱。这可以提高性能,因为设备1100无需持续地记录话音输入并且比较它与关键字词汇表而是实际上接收出声的关键字的明确指示。类似地,这一种按钮或者其它这样的设备可以可选地用来表明用户希望何时修改歌词中的字词。因此,因此,用户可以在演唱取代歌词部分之前激活按钮。
在图2c中所示实施方式中,对进行当前卡拉OK表演的卡拉OK表演者发声的字词进行语音识别,步骤220。在步骤221确定是否将预定歌词部分识别为已经用取代歌词部分来发声。如果不是,则该方法返回到其中继续语音识别的步骤220。如果是,则在下次显示时用发声的取代歌词部分替换当前卡拉0K表演的至少一个预定歌词部分,步骤222。
图2c中所示本发明的实施方式允许卡拉OK表演者改变-在仍然同时进行表演当前歌曲知识-显示器1510上示出的原歌词的至少部分。在一个实施方式中,表演者可以改变预定类别的字词。例如,许多歌曲的歌词包含人名和地名。卡拉OK表演者例如可以改变在音乐作品中提到的人名或者地名。
可以通过允许某些类别的字词如人名和地名由其它字词取代来实施这一点。可以实施这一点使得本发明的设备1100经由语音识别器1130所进行的语音识别(步骤220)来识别表演者演唱或者讲话的字词、比较这些字词与原歌词(步骤221),并且如果(被允许改变的那些字词中的)一些字词不同,则只要该字词在卡拉OK表演期间再次出现就在屏幕上示出的歌词中替换它们(步骤222)。
设备1100可以被配置为在显示器1510上呈现被允许例如由特殊文字颜色取代的字词。
可选地,***可以针对可以替换的各字词提供预定数目的替代。可以实施这一点以限制将要语音识别的替代字词的数量并且例如在有噪声的环境中增加语音识别的稳健性。在这一情况下,***被布置为从有限一组可能替代字词中识别发声的字词。可以使用收集的情景信息来获得用于字词的替代:例如,可以提供来自表演者的联系人列表中的姓名作为用于歌词中的人名的替代,可以提供表演者拜访的地名作为用于地名的替代,等等。可以向表演者示出替代,表演者然后可以将替代之一(原字词或者改变的字词之一)发声。当字词下次出现在歌词中时,它由用户发声的版本取代。
例如可以在歌词储存器1220中提供用于各种歌曲的歌词,这些歌词可以例如是布置于个人计算机1000的硬盘(在图1中未示出)中的文本文件。在歌词储存器1220中,可以用适当方式标记人名和地名。可以有用于被允许取代的各类字词的标记。此外,可以提供包含如下字词的可修改字词储存器1250(例如适当数据库),这些字词是被允许的取代。例如可以基于上述标记来组织这些字词。
可选地,设备1100可以被配置为识别何时在发声上用女性名取代男性名(或者相反)并且因而在显示的歌词中用“她”替换他(或者相反)。
在图2d中所示实施方式中,取读或者接收外部输入数据用于作为表演情景信息来使用,步骤230。作为响应,基于取读或者接收的外部输入数据来适配当前卡拉OK表演的至少一个音轨,步骤231。
换而言之,本发明的设备1100使用情景信息获得器1110来获得卡拉OK表演场所周围的情景(即境况和条件)(步骤230)并且使用音轨适配器1121基于检测到的表演情景的性质来适配背景音乐音轨(步骤231)。
如上所述,例如可以经由与个人计算机1000关联的键盘、鼠标或者另一输入设备(在图1中未示出);或者经由连接到个人计算机1000的通信网络(在图1中未示出)(比如因特网或者局域网);或者例如从外部设备(比如传感器器件1300、与表演者关联的移动设备610或者与观众参与者关联的移动设备1620和1630中的至少一个移动设备)接收外部输入数据作为这一情景信息。
可以使用的传感器器件1300例如包括麦克风、摄像机、定位设备(例如全球定位***设备)以及照度、湿度、温度、血压和心率计。这些传感器器件将数据提供给情景信息获得器1110,该获得器然后可以确定卡拉OK表演的情景性质。情景信息获得器1110也例如可以经由蓝牙获取卡拉OK表演者的移动设备1610和观众参与者的移动设备1620-1630上的个人信息管理器数据(如上所述包括存在服务数据、日历数据和联系人列表数据)并且使用这一数据以确定表演情景。情景信息获得器1110也可以访问其他个人数据(比如已经拍摄参与者的一些画面时的位置)以例如确定最新旅行目的地。情景信息获得器1110也可以访问关于表演者和参与者的移动设备1610-1630上的媒体文件的信息,比如他们最喜爱的歌曲、艺术家和/或音乐流派。情景信息获得器1110也例如可以通过用GPS位置进行查询从外部服务器获得情景信息。作为例子,外部服务器可以搜索已经居住于当前位置附近(例如在相同城市中)或者与特定位置具有某一其它关系的音乐艺术家和乐队并且提供与将要在适配音乐表演时使用的他们的音乐的风格和流派有关的信息。
表演情景的性质例如可以包括时间日/月/年、参与卡拉OK表演或者在观众中的人员、人数、卡拉OK表演者的生理状态、人员的背景(例如他们的性别、他们的当日犹如什么、他们认识什么人等)以及他们最近已经旅行的位置。这一信息然后可以用来修改音乐的性质。
传感器可以附着到设备1100或者附着到将数据传送到设备1100的远程设备(比如移动设备1610-1630)。例如,一些人可以在他们的腕表中具有心率构件,并且设备1100可以直接地或者经由移动设备访问来自腕表的心率数据。
例如可以在规则储存器1230中提供一组规则,这些规则限定如何基于情景的性质来适配音乐。一般而言,可以用上文结合图2b的步骤212描述的方式相似的方式修改背景音乐的回放。
具体而言,例如可以用以下方式基于检测到的表演情景的性质来适配背景音乐的回放:
情景性质 | 可适配的音乐特征 |
卡拉OK表演的位置 | 选择音乐作品的不同乐曲,例如使得乐曲遵循已经居住于特定位置的一些艺术家的风格。取而代之,***可以提出将来自与该位置关联的艺术家或者乐队的歌曲用于卡拉OK表演。 |
卡拉OK表演者或者一个或多个观众参与者的最新旅行位置。 | 例如,可以选择乐曲或者某一音乐元素以遵循在旅行位置的共同风格。例如,如果演唱者刚好已经在夏威夷度假,则所选乐曲可以具有与传统夏威夷歌曲共同的元素,并且一些乐曲可以由夏威夷乐器取代。 |
卡拉OK表演的时间 | 例如,如果表演出现于深夜,则可以自动增加表演的音量以使表演更具可听性。对应地,如果表演发生于白天,则更适度的音量水平可能足够了。作为另一例子,一周某日可能影响表演的风格:在周一可以用小调和/或用更慢拍子播放歌曲以反映开始其工作的工作者的感觉,而在周五和在周末可以使用大调和更快拍子。 |
表演者的年龄 | 改变拍子(例如,如果表演者很年长,则可以在更慢拍子播放音乐)。表演者的年龄也可以限定音乐风格以例如匹配于来自表演者的青年时期的风格。除了乐曲的风格之外,音乐风格还可以涉及到使用来自给定时期的乐器和声音。 |
表演者的血压和/或心率和/或情绪。 | 改变拍子:例如对于具有高血压的表演者,可以用更慢拍子播放音乐。对于具有高心率的焦急表演者,可以在更慢拍子播放音乐以使他/她平静。 |
表演者的职业(例如可以根据用户在他的/她的移动设备上的数字商务卡来检测)或者爱好。 | 给定的职业可以映射到给定的音乐风格。例如,工程师=合成-通俗;农场主=乡村音乐。给定的爱好可以映射到某些音乐风格,比如滑板=hip hop或者朋克;计算机游戏=techno。 |
在观众参与者之间的最普遍职业或者爱好。 | 例如类似于表演者的职业的情况。 |
卡拉OK表演位置周围的天气。 | 向音乐作品生成新的结尾,从而愉快结尾由哀伤结尾取代(在阴天的情况下)或者相反(在晴天的情况下)。 |
表演者的日历中用于表演日的日历条目数量或者所有参与者的日历中的条目平均数目。 | 例如,如果表演者(或者观众的成员)在他的日历中有用于当日的许多条目,则可能意味着它在当日期间已经很忙。在这一情况下,可以用更慢拍子播放音乐以使他和观众平静或者代之以用更快拍子播放音乐以更好地反映他的或者观众的感觉。 |
表演者或者参与者的最喜爱或者最频繁播放的艺术家/专辑/歌曲/音乐流派。 | 可以修改音乐乐曲以类似于最喜爱歌曲或者最喜爱音乐流派。例如,乐曲中的独唱部分可以由来自表演者的最喜爱歌曲的独唱部分取代,或者乐曲可以遵循表演者或者多数参与者的共同最喜爱风格。取而代之,可以建议将用户或者观众的最喜爱音乐轨道用于卡拉OK表演。取而代之,***可以建议卡拉OK表演由表演者的最喜爱歌曲的集锦构成;在这一情况下,***播放在无缝序列中播放表演者或者观众的最喜爱歌曲的部分、即在一首卡拉OK歌曲与下一首之间的过渡无间断地出现。可选地,可以请求当前播放其最喜爱歌曲的卡拉OK参与者演唱该歌曲。 |
可选地,***可以请求多个卡拉OK参与者(观众的成员)参与卡拉OK表演。例如,一个或者多个观众成员可以通过演唱歌曲的合声部分来参与。观众成员可以向他们的移动终端的麦克风演唱合声部分,该部分然后混合到卡拉OK表演者的伴奏和演唱。利用相同原理,观众成员也可以在主要卡拉OK表演者演唱领唱旋律之时提供伴唱音。可以用比如音调移位这样的效果来处理伴唱音以便创建复杂的合声声音。另外,可以不同地处理各背景演唱者的唱音。例如,女性伴唱音可以音调下移八音度以使她们听起来更具男子气。
与上表中的最后例子有关,***可以根据卡拉OK参与者的最喜爱歌曲构造卡拉OK播放列表。播放列表可以由全部歌曲构成,或者取而代之,***可以播放完整歌曲的集锦,从而它以无缝方式级联参与者的最喜爱歌曲的部分(例如合声或者章节),并且歌曲之间的过渡无间断地出现。还可以请求各参与者轮流演唱他的最喜爱歌曲。在这一情况下,在表演期间改变卡拉OK表演者。当参与者X的最喜爱歌曲开始播放时,卡拉OK***可以激活参与者X的移动设备的麦克风、开始将来自参与者X的麦克风的音频输入混合到音乐伴奏并且将先前参与者的麦克风消音。可选地,***可以向参与者X的移动终端发送用以让他知道轮到他演唱的指示。这一指示例如可以是可视指示(比如参与者X的移动终端的屏幕上的文字)或者例如是振动报警。
可选地,***也可以在主要卡拉OK屏幕上示出文字,比如“X先生,现在播放您的最喜爱歌曲,请开始演唱”。在参与者X注意到轮到他演唱时,***可以循环当前歌曲的前几个小节直至请求的参与者向麦克风演唱前几个短语。
可选地,卡拉OK设备可以基于参与者有多警觉向他们赋予点分数:尤其是在使卡拉OK播放列表成为卡拉OK参与者的最喜爱歌曲的集锦的情况下,参与者可以根据他们开始演唱的速度来接收得分。可以在视频屏幕上示出最佳得分和/或响应时间以奖励最具警觉性(最快响应)的参与者。
可选地,***可以在卡拉OK表演的主要屏幕上示出当前活跃参与者的视频画面。当无间断地改变卡拉OK歌曲和表演者时,使用来自当前表演者的移动设备的视频流。当数个参与者演唱合声部分时,***可以示出来自演唱合声的所有演唱者的移动设备的视频流。
另外,***也可以示出如下视频,其中背景上的主要视频示出表演音乐轨道的原音乐表演者、但是原音乐视频的部分由来自参与者的移动设备的视频流取代。例如,原音乐视频中的主要演唱者的头部可以由示出卡拉OK表演者的头部的视频流取代。当数个参与者演唱合声部分时,合声演唱者的头部可以由示出当前演唱合声的卡拉OK参与者的面部的视频流取代。取而代之,可以在原卡拉OK视频上在表演者的头部上方描绘代表卡拉OK参与者的静止画面。
在图2e中所示实施方式中,取读或者接收外部输入数据用于作为表演情景信息来使用,步骤240。作为响应,基于取读或者接收的外部输入输入在下次显示时替换当前卡拉OK表演的至少一个预定歌词部分,步骤241。
换而言之,本发明的设备1100使用情景信息获得器1100来检测卡拉OK表演场所周围的情景(即境况和条件)(步骤240)并且使用歌词适配器1122基于检测到的表演情景的性质来适配歌词(步骤241)。
同样,上文结合图2d的步骤230描述的各种设备可以用来在图2e的步骤240中获得表演情景。情景信息本身也可以类似于与图2d的实施方式结合使用的情景信息。然而它在这时用来适配或者修改所显示的歌词。
同样,可以提供被允许在音乐作品的歌词中改变的字词类别。这样的类别例如可以包括人名和地名。
例如可以用以下方式基于检测到的情景的性质来适配歌词。
情景性质 | 歌词中的可适配特征 |
表演者的性别 | “他”由“她”取代或者相反 |
表演者认识的人 | 歌词中的人名由表演者认识的人名(例如存储于表演者的电话簿应用中的姓名)取代 |
卡拉OK表演的位置 | 歌词中的位置名称如城市名由表演位置的名称或者附近地点取代。 |
表演者的年龄 | 诸如车辆型号、配件等出现于歌词中的一些项目名称可以由在表演者年轻时流行的项目取代。例如,如果表演者很年长,则车型可以改变为T型号福特,移动电话可以改变为电话,等等。对应地,对于年轻表演者,旧配件的名称可以改变为最新对应名称,比如电话改变为移动电话。 |
表演者的职业 | 代表活动的一些字词可以改变为特定职业的人士 |
常常进行的活动。例如,如果表演者是工程师,则字词“运行”可以改变为“编程”,但是如果表演者是牙医,则它可以改变为“钻孔”,或者如果表演者是航空公司飞行员,则它可以改变为“飞行”。 | |
表演者的背景 | 当***了解卡拉OK表演者的背景(例如年龄和他/她来自何处)时,一些字词例如可以由对应俚语字词取代。 |
近程无限***(例如蓝牙、无限局域网(WLAN)、超宽带(UWB)或者Wibree)邻域 | 卡拉OK表演场所中的人名可以用来取代歌词中的人名。 |
表演者的先前卡拉OK历史 | 个人的先前卡拉OK历史可能影响新卡拉OK歌曲中的结果:例如,如果用户先前已经多次演唱相同歌曲,则它可以具有较新歌曲而言更激进的改变。 |
表演者的最喜爱音乐或者其它媒体内容 | 当***了解表演者的最喜爱音乐或者其它媒体内容(例如诗篇、书籍、电影)时,可以用来自最喜爱媒体作品的短语改变卡拉OK歌曲中的一些歌词。 |
可选地,观众例如可以通过经由蓝牙或者短消息服务(SMS)将字词从移动设备1620-1630发送到设备1100来影响所显示的歌词。例如,观众可以用以下方式影响卡拉OK表演中的歌词内容:标记卡拉OK歌词中的某些字词使得可以改变它们。例如可以在制作卡拉OK内容时的某一点已经提前进行这一标记。现在例如假设已经标记歌词中的一些或者所有名词以允许替换,然后观众例如可以通过经由他们的移动设备1620-1630发送他们想要在卡拉OK表演中包括的字词来参与卡拉OK表演。例如在这一情况下,人们将名词发送到设备1100。设备1100维护从观众接收的名词的列表并且随着卡拉OK表演进展而用观众提供的名词取代歌词中的名词。可选地,设备1100可以遍历观众提供的名词列表并且选择将是押韵的此类新字词。
自然而言,也可以取代其它字词类别,比如动词和专有名词。可以有用以允许观众通过从菜单的选择来选择单词属于哪个类别(比如名词、动词、专有名词)的选项。也可能在歌词中已经标记对应字词类别。在这一情况下,设备1100将用观众在给定类别中提供的字词取代相同类别中的歌词字词。例如,每个专有名词(比如人名)为观众提供的人名所取代。在这一情况下,也可以从参与者的联系人列表应用中取得姓名,从而例如歌词中的每个人名由卡拉OK观众总的某一参与者的姓名取代。
设备1100也可以被配置为从人们发送的歌词和字词自动识别字词类别。在这一情况下,设备1100可以从正确字词类别中自动挑选字词以取代歌词中的字词。
另外,当接收用于字词取代的多个建议时,设备1100可以针对情景随机选择字词、让观众投票选出最佳解决方案或者选择最佳匹配字词。事件组织者例如可以决定这些方法中的哪个方法是用于字词选择的优选方法。
此外,观众可以从设备100接收与可以改变的字词有关或者与可以改变字词类别有关的信息。设备1100例如可以经由短消息服务、蓝牙或者经由网页浏览器来递送这一信息。例如,设备1100可以返回能够改变的字词的列表或者返回用特殊颜色示出可改变的歌词的全部歌词。作为另一例子,设备1100可以发送观众现在应当将名词或者动词发送到设备1100这一观众信息。
如果观众了解歌曲的歌词或者设备1100将这一信息发送到观众,则观众可以控制取代哪些字词。例如,观众的成员可以发送命令“取代猫->啤酒”以明确地迫使用字词啤酒取代字词猫。取而代之,观众的成员例如可以设备1100提供的网页(其中写下歌词并且文本框在可以改变的字词之处)、将替代字词写入到文本框、然后作为网页形式将信息提交到设备1100。
另外,除了能够调节诸如回声、失真、延迟、合声等来自不同乐器轨道的参数之外还可以允许观众实现音乐表演的平衡。
可以实施实际调节使得观众成员能够例如通过利用与主机计算机的蓝牙连接来列举可以修改的可用参数。当选择参数以供修改时,将适当用户接口或者UI传送到用户的移动设备(或者计算机)。UI例如可以包含用于控制用于乐器轨道的失真数量的滑块。可以立刻施加修改,从而用户可以立即听到他的动作的结果。改变音乐表演作品的平衡以相似方式工作:将UI发送到用户的移动设备。UI包括用于各所选音乐轨道的音量滑块。此外,观众成员可以通过发送具有简易指令如“更多低音”或者“更少回声”来实现音乐表演的平衡。
另外,***可以可选地改变来自用户麦克风并且去往扬声器的音频信号。例如,当用户演唱“Bill”时,***可以修改音频信号使得观众可以从扬声器提到“Jill”。观众可以用于指定所显示的歌词相同的方式通过他们的连接到***的设备来指定改变哪些字词。***可以合成观众限定的字词的演唱并且将它混合到输出中代替演唱者输出,或者它可以过滤演唱者输出以便改变某些音位以使演唱声音如同观众指定的字词。
可以相应于从观众成员接收的请求来进行上述领唱唱音和伴唱音。
示例实施方式例如可以包括能够执行示例实施方式的过程的任何适当服务器、工作站、游戏控制台、个人计算机、卡拉OK设备、移动设备等。示例实施方式的设备和子***可以使用任何适当协议来相互通信并且可以使用一个或者多个编程的计算机***或者设备来实施。
一个或者多个接口机制可以与示例实施方式一起使用,这些接口机制例如包括因特网接入、任何适当形式(例如话音、调制解调器等)的远程通信、无限通信介质等。例如,所用通信网络或者链路可以包括一个或者多个无线通信网络、蜂窝通信网络、3G通信网络、公共交换电话网络(PSTN)、分组数据网络(PDN)、因特网、内部网及其组合等。
将理解示例实施方式用于示例目的,因为用来实施示例实施方式的具体硬件的许多变化是可能的,这将是硬件和/或软件领域的技术人员将会理解的。例如,可以经由一个或者多个硬件和/或软件设备实施一个或者多个示例实施方式的功能。
示例实施方式可以存储与这里描述的各种过程有关的信息。这一信息可以存储于诸如硬盘、光盘、磁光盘、RAM等一个或者多个存储器中。一个或者多个数据库可以存储用来实施本发明示例实施方式的信息。可以使用一个或者多个这里列举的存储器或者存储设备中包括的数据结构(例如记录、表、数组、字段、图形、树、列表等)来组织数据库。参照示例实施方式描述的过程可以包括用于在一个或者多个数据库中存储通过示例实施方式的设备和子***的过程来收集和/或生成的数据的适当数据结构。
如计算机和/或软件领域的技术人员将理解的那样,可以使用根据本发明示例实施方式的教导来编程的一个或者多个通用处理器、微处理器、数字信号处理器、微控制器便利地实施示例实施方式的全部或者部分。如软件领域的技术人员将理解的那样,普通技能的程序员可以基于示例实施方式的教导来容易地预备适当软件。另外,可以在万维网上实施示例实施方式。此外,如电领域的技术人员将理解的那样,可以通过预备专用集成电路或者通过互连常规部件电路的适当网络来实施示例实施方式。因此,示例实施方式不限于硬件和/或软件的任何具体组合。
本发明的示例实施方式可以包括计算机可读介质中的任一介质或者介质组合上存储的如下软件,该软件用于控制示例实施方式的部件、用于驱动示例实施方式的部件、用于使示例实施方式的部件能够与人类用户交互等。这样的软件可以包括但不限于设备驱动器、固件、操作***、开发工具、应用软件等。这样的计算机可读介质还可以包括本发明一个实施方式的计算机程序产品,该产品用于精心在实施本发明时进行的处理的全部或者部分(如果处理为分布式)。本发明示例实施方式的计算机代码设备可以包括任何适当可解释或者可执行代码机制,该代码机制包括但不限于脚本、可解释程序、动态链接库(DLL)、Java类和小应用程序、完整的可执行程序、共同对象请求代理架构(CORBA)对象等。另外,本发明示例实施方式的处理的部分可以是分布式以求更佳性能、可靠性、成本等。
如上所言,示例实施方式的部件可以包括计算机可读介质或者存储器,这些介质或者存储器用于保持根据本发明的教导来编程的指令并且用于保持这里描述的数据结构、表、记录和/或其它数据。计算机可读介质可以包括任何适当的如下介质,该介质参与将指令提供给处理器以供执行。这样的介质可以采用包括但不限于非易失性介质、易失性介质、传输介质等的任何形式。非易失性介质例如可以包括光盘或者磁盘、磁光盘等。易失性介质可以包括动态存储器等。传输介质可以包括同轴线缆、铜线、光纤等。传输介质也可以采用声学、光学、电磁波等形式,比如在射频通信(RF)、红外线(IR)数据通信等期间生成的声学、光学、电磁波等形式。普遍的计算机可读介质形式例如可以包括软盘、柔性盘、硬盘、磁带、任何其他适当磁介质、CD-ROM、CDR、CD-RW、DVD、DVD-ROM、DVD±RW、DVD±R、任何其它适当光学介质、穿孔卡、纸带、光学标记片、具有孔图案或者其它光学可识别标志的任何其它适当物理介质、RAM、PROM、EPROM、快速EPROM、任何其它适当存储器芯片或者盒带、载波或者计算机可以从其读取的任何其它适当介质。
尽管已经结合多个示例实施方式和实施方式描述本发明,但是本发明不限于此而实际上覆盖落入保护权利要求的范围内的各种修改和等效布置。
Claims (38)
1.一种方法,包括:
获得与当前卡拉OK表演有关的情景信息,并且
基于所述获得的情景信息来修改所述当前卡拉OK表演的至少一个视听输出方面。
2.根据权利要求1所述的方法,还包括:
对进行所述当前卡拉OK表演的卡拉OK表演者发声的字词进行语音识别。
3.根据权利要求2所述的方法,其中所述获得所述情景信息还包括通过接收对所述发声和语音识别的字词中所包括的预定关键字的指示来获得所述情景信息。
4.根据权利要求2所述的方法,其中获得所述情景信息还包括通过接收将预定歌词部分语音识别为已经用取代歌词部分来发声的指示来获得所述情景信息。
5.根据权利要求1-4中的任一权利要求所述的方法,其中所述获得所述情景信息还包括获得外部输入数据作为所述情景信息。
6.根据权利要求5所述的方法,其中所述获得所述外部输入数据作为所述情景信息还包括从外部设备获得所述外部输入数据作为所述情景信息。
7.根据权利要求6所述的方法,其中从所述外部设备获得所述外部输入数据作为所述情景信息还包括获得外部表演传感器数据作为所述情景信息。
8.根据权利要求6或者7所述的方法,其中从所述外部设备获得所述外部输入数据作为所述情景信息还包括获得与所述当前卡拉OK表演的至少一个参与者关联的个人信息管理器数据作为所述情景信息。
9.根据权利要求1-8中的任一权利要求所述的方法,其中所述修改所述至少一个视听输出方面还包括基于所述获得的情景信息来适配所述当前卡拉OK表演的至少一个音轨。
1O.根据权利要求1-9中的任一权利要求所述的方法,其中所述修改所述至少一个视听输出方面还包括基于所述获得的情景信息在下次显示时替换所述当前卡拉OK表演的至少一个预定歌词部分。
11.根据权利要求1-1O中的任一权利要求所述的方法,其中所述方法由数据处理设备进行,所述数据处理设备由计算机可读介质上体现的计算机程序控制。
12.一种设备,包括:
情景信息获得器,配置为获得与当前卡拉OK表演有关的情景信息,以及
卡拉OK输出修改器,配置为基于所述获得的情景信息来修改所述当前卡拉OK表演的至少一个视听输出方面。
13.根据权利要求12所述的设备,还包括:
语音识别器,配置为对进行所述当前卡拉OK表演的卡拉OK表演者发声的字词进行语音识别。
14.根据权利要求13所述的设备,其中所述情景信息获得器还被配置为通过接收对所述发声和语音识别的字词中所包括的预定关键字的指示来获得所述情景信息。
15.根据权利要求13所述的设备,其中所述情景信息获得器还被配置为通过接收将预定歌词部分语音识别为已经用取代歌词部分来发声的指示来获得所述情景信息。
16.根据权利要求12-15中的任一权利要求所述的设备,其中所述情景信息获得器还被配置为获得外部输入数据作为所述情景信息。
17.根据权利要求16所述的设备,其中所述情景信息获得器还被配置为从外部设备获得所述外部输入数据作为所述情景信息。
18.根据权利要求17所述的设备,其中所述情景信息获得器还被配置为从外部表演传感器器件获得外部表演传感器数据作为所述情景信息。
19.根据权利要求17或者18所述的设备,其中所述情景信息获得器还被配置为获得与所述当前卡拉OK表演的至少一个参与者关联的个人信息管理器数据作为所述情景信息。
20.根据权利要求12-19中的任一权利要求所述的设备,其中所述卡拉OK输出修改器还包括:音轨适配器,配置为基于所述获得的情景信息来适配所述当前卡拉OK表演的至少一个音轨。
21.根据权利要求12-20中的任一权利要求所述的设备,其中所述卡拉OK输出修改器还包括:歌词适配器,配置为基于所述获得的情景信息在下次显示时替换所述当前卡拉OK表演的至少一个预定歌词部分。
22.一种设备,包括:
情景信息获得装置,用于获得与当前卡拉OK表演有关的情景信息,以及
卡拉OK输出修改装置,用于基于所述获得的情景信息来修改所述当前卡拉OK表演的至少一个视听输出方面。
23.根据权利要求22所述的设备,还包括:
语音识别装置,用于对进行所述当前卡拉OK表演的卡拉OK表演者发声的字词进行语音识别。
24.根据权利要求23所述的设备,其中所述情景信息获得装置还适合于通过接收对所述发声和语音识别的字词中包括的预定关键字的指示来获得所述情景信息。
25.根据权利要求23所述的设备,其中所述情景信息获得装置还适合于通过接收将预定歌词部分语音识别为已经用取代歌词部分来发声的指示来获得所述情景信息。
26.根据权利要求22-25中的任一权利要求所述的设备,其中所述情景信息获得装置还适合于获得外部输入数据作为所述情景信息。
27.根据权利要求26所述的设备,其中所述情景信息获得装置还适合于从外部设备获得所述外部输入数据作为所述情景信息。
28.根据权利要求27所述的设备,其中所述情景信息获得装置还适合于从外部表演传感器器件获得外部表演传感器数据作为所述情景信息。
29.根据权利要求27或者28所述的设备,其中所述情景信息获得装置还适于获得与所述当前卡拉OK表演的至少一个参与者关联的个人信息管理器数据作为所述情景信息。
30.根据权利要求22-29中的任一权利要求所述的设备,其中所述卡拉OK输出修改装置还包括:音轨适配装置,用于基于所述获得的情景信息来适配所述当前卡拉OK表演的至少一个音轨。
31.根据权利要求22-30中的任一权利要求所述的设备,其中所述卡拉OK输出修改装置还包括:歌词适配装置,用于基于所述获得的情景信息在下次显示时替换所述当前卡拉OK表演的至少一个预定歌词部分。
32.一种在计算机可读介质上体现的计算机程序,所述计算机程序控制数据处理设备以进行以下操作:
获得与当前卡拉OK表演有关的情景信息,并且
基于所述获得的情景信息来修改所述当前卡拉OK表演的至少一个视听输出方面。
33.根据权利要求32所述的计算机程序,还控制所述数据处理设备以进行以下操作:
对进行所述当前卡拉OK表演的卡拉OK表演者发声的字词进行语音识别。
34.根据权利要求33所述的计算机程序,还控制所述数据处理设备以执行通过接收对所述发声和语音识别的字词中包括的预定关键字的指示来获得所述情景信息。
35.根据权利要求33所述的计算机程序,还控制所述数据处理设备以执行通过接收将预定歌词部分语音识别为已经用取代歌词部分来发声的指示来获得所述情景信息。
36.根据权利要求32-35中的任一权利要求所述的计算机程序,还控制所述数据处理设备以进行通过获得外部输入数据作为所述情景信息来获得所述情景信息。
37.根据权利要求32-36中的任一权利要求所述的计算机程序,还控制所述数据处理设备以进行通过基于所述获得的情景信息适配所述当前卡拉OK表演的至少一个音轨来修改所述至少一个视听输出方面。
38.根据权利要求32-37中的任一权利要求所述的计算机程序,还控制所述数据处理设备以进行通过基于所述获得的情景信息在下次显示时替换所述当前卡拉OK表演的至少一个预定歌词部分来修改所述至少一个视听输出方面。
39.一种卡拉OK***,包括:
麦克风,配置为接收进行当前卡拉OK表演的卡拉OK表演者的发声,
卡拉OK设备,配置为产生包括视频部分和音频部分的卡拉OK信号并且混合所述麦克风接收的所述发声与所述音频部分,
扬声器,配置为输出所述混合的音频部分,
显示器,配置为输出所述视频部分,
情景信息获得器,配置为获得与所述当前卡拉OK表演有关的情景信息,以及
卡拉OK输出修改器,配置为基于所述获得的情景信息来修改所述视频部分和所述混合的音频部分中的至少一个部分。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/FI2007/000113 WO2008132265A1 (en) | 2007-04-27 | 2007-04-27 | Modifying audiovisual output in a karaoke system based on performance context |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101652808A true CN101652808A (zh) | 2010-02-17 |
Family
ID=39925229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780052706.0A Pending CN101652808A (zh) | 2007-04-27 | 2007-04-27 | 基于表演情景来修改卡拉ok***中的视听输出 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN101652808A (zh) |
WO (1) | WO2008132265A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103916433A (zh) * | 2013-01-04 | 2014-07-09 | 中兴通讯股份有限公司 | 一种卡拉ok数据处理方法、装置、物联网服务平台及终端 |
CN103941717A (zh) * | 2014-05-14 | 2014-07-23 | 福建星网视易信息***有限公司 | 外接设备控制***及方法 |
CN104219556A (zh) * | 2014-09-12 | 2014-12-17 | 北京阳光视翰科技有限公司 | 一种四音轨卡拉ok识别播放***的使用方法 |
CN106463104A (zh) * | 2014-03-17 | 2017-02-22 | 新贡公司 | 为用户提供关于卡拉ok歌曲表演的反馈的方法 |
CN107533806A (zh) * | 2015-02-02 | 2018-01-02 | Gn 股份有限公司 | 被配置为实现对包括具有多个可选择的专家知识变化的内容在内的交互技能训练内容的传送的框架、设备和方法 |
CN108491464A (zh) * | 2018-03-05 | 2018-09-04 | 广东小天才科技有限公司 | 一种基于掌纹识别的内容推送方法及*** |
CN109963092A (zh) * | 2017-12-26 | 2019-07-02 | 深圳市优必选科技有限公司 | 一种字幕的处理方法、装置及终端 |
CN110632898A (zh) * | 2018-06-22 | 2019-12-31 | 广州艾美网络科技有限公司 | 一种演绎*** |
US10806982B2 (en) | 2015-02-02 | 2020-10-20 | Rlt Ip Ltd | Frameworks, devices and methodologies configured to provide of interactive skills training content, including delivery of adaptive training programs based on analysis of performance sensor data |
US10942968B2 (en) | 2015-05-08 | 2021-03-09 | Rlt Ip Ltd | Frameworks, devices and methodologies configured to enable automated categorisation and/or searching of media data based on user performance attributes derived from performance sensor units |
US11074826B2 (en) | 2015-12-10 | 2021-07-27 | Rlt Ip Ltd | Frameworks and methodologies configured to enable real-time adaptive delivery of skills training data based on monitoring of user performance via performance monitoring hardware |
US11417319B2 (en) * | 2017-09-21 | 2022-08-16 | Kabushiki Kaisha Toshiba | Dialogue system, dialogue method, and storage medium |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103916521A (zh) * | 2013-01-05 | 2014-07-09 | 浪潮乐金数字移动通信有限公司 | 一种移动通信终端 |
JP6944365B2 (ja) * | 2017-12-27 | 2021-10-06 | 株式会社第一興商 | カラオケ装置 |
JP7041534B2 (ja) * | 2018-01-31 | 2022-03-24 | 株式会社第一興商 | カラオケ装置 |
US20230186937A1 (en) * | 2020-05-29 | 2023-06-15 | Sony Group Corporation | Audio source separation and audio dubbing |
JP7423164B2 (ja) | 2020-07-29 | 2024-01-29 | 株式会社第一興商 | カラオケ装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10282970A (ja) * | 1997-04-01 | 1998-10-23 | Brother Ind Ltd | 音声情報表示装置 |
JP4789227B2 (ja) * | 2001-04-04 | 2011-10-12 | Necディスプレイソリューションズ株式会社 | 音声認識機能を内蔵した映像表示装置 |
JP2002351473A (ja) * | 2001-05-24 | 2002-12-06 | Mitsubishi Electric Corp | 音楽配信システム |
-
2007
- 2007-04-27 CN CN200780052706.0A patent/CN101652808A/zh active Pending
- 2007-04-27 WO PCT/FI2007/000113 patent/WO2008132265A1/en active Application Filing
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103916433B (zh) * | 2013-01-04 | 2017-08-01 | 中兴通讯股份有限公司 | 一种卡拉ok数据处理方法、装置、物联网服务平台及终端 |
CN103916433A (zh) * | 2013-01-04 | 2014-07-09 | 中兴通讯股份有限公司 | 一种卡拉ok数据处理方法、装置、物联网服务平台及终端 |
CN106463104A (zh) * | 2014-03-17 | 2017-02-22 | 新贡公司 | 为用户提供关于卡拉ok歌曲表演的反馈的方法 |
CN103941717A (zh) * | 2014-05-14 | 2014-07-23 | 福建星网视易信息***有限公司 | 外接设备控制***及方法 |
CN104219556A (zh) * | 2014-09-12 | 2014-12-17 | 北京阳光视翰科技有限公司 | 一种四音轨卡拉ok识别播放***的使用方法 |
US10806982B2 (en) | 2015-02-02 | 2020-10-20 | Rlt Ip Ltd | Frameworks, devices and methodologies configured to provide of interactive skills training content, including delivery of adaptive training programs based on analysis of performance sensor data |
CN107533806A (zh) * | 2015-02-02 | 2018-01-02 | Gn 股份有限公司 | 被配置为实现对包括具有多个可选择的专家知识变化的内容在内的交互技能训练内容的传送的框架、设备和方法 |
US10918924B2 (en) | 2015-02-02 | 2021-02-16 | RLT IP Ltd. | Frameworks, devices and methodologies configured to enable delivery of interactive skills training content, including content with multiple selectable expert knowledge variations |
CN107533806B (zh) * | 2015-02-02 | 2020-11-06 | Gn 股份有限公司 | 被配置为实现对包括具有多个可选择的专家知识变化的内容在内的交互技能训练内容的传送的框架、设备和方法 |
US10942968B2 (en) | 2015-05-08 | 2021-03-09 | Rlt Ip Ltd | Frameworks, devices and methodologies configured to enable automated categorisation and/or searching of media data based on user performance attributes derived from performance sensor units |
US11074826B2 (en) | 2015-12-10 | 2021-07-27 | Rlt Ip Ltd | Frameworks and methodologies configured to enable real-time adaptive delivery of skills training data based on monitoring of user performance via performance monitoring hardware |
US11417319B2 (en) * | 2017-09-21 | 2022-08-16 | Kabushiki Kaisha Toshiba | Dialogue system, dialogue method, and storage medium |
CN109963092A (zh) * | 2017-12-26 | 2019-07-02 | 深圳市优必选科技有限公司 | 一种字幕的处理方法、装置及终端 |
CN109963092B (zh) * | 2017-12-26 | 2021-12-17 | 深圳市优必选科技有限公司 | 一种字幕的处理方法、装置及终端 |
CN108491464A (zh) * | 2018-03-05 | 2018-09-04 | 广东小天才科技有限公司 | 一种基于掌纹识别的内容推送方法及*** |
CN110632898A (zh) * | 2018-06-22 | 2019-12-31 | 广州艾美网络科技有限公司 | 一种演绎*** |
Also Published As
Publication number | Publication date |
---|---|
WO2008132265A1 (en) | 2008-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101652808A (zh) | 基于表演情景来修改卡拉ok***中的视听输出 | |
US9817551B2 (en) | System and method for recording and sharing music | |
Starkey | Radio in context | |
US11580941B2 (en) | Music compilation systems and related methods | |
Dunaway | The forgotten 1979 MOMA sound art exhibition | |
Gopinath | Ringtones, or the auditory logic of globalization | |
JPH1063281A (ja) | 音響映像装置及びこれを用いた楽曲のアレンジ方法 | |
KR20150137117A (ko) | 음악 세션 관리 방법 및 음악 세션 관리 장치 | |
Howlett | The record producer as nexus: Creative inspiration, technology and the recording industry | |
JP2010008847A (ja) | 選曲者に対応したローレベル楽曲検索システム | |
JP2008522212A (ja) | 音響機器の個人設定情報管理方法 | |
JP5498444B2 (ja) | 動画情報配信システム | |
KR101790107B1 (ko) | 음악 종합 서비스 방법 및 서버 | |
JP5823313B2 (ja) | カラオケ装置 | |
JP2021190895A (ja) | 制御方法および制御システム | |
JP2007188175A (ja) | サーバ装置、端末装置およびプログラム | |
JP2011095438A (ja) | カラオケ採点システム | |
Chimbudzi et al. | The evolution of music recording technologies in Zimbabwe | |
JP2007121550A (ja) | 上位歌唱者歌声を再生聴取できるカラオケコンクールシステム、カラオケ装置、コンクールサーバー | |
KR100726756B1 (ko) | 퍼블릭 가수양성 방법 및 시스템 | |
Armstrong | Hot collecting off the record: ralph J. Gleason’s start in music journalism | |
JP5551983B2 (ja) | カラオケ演奏制御システム | |
JP2012194316A (ja) | カラオケ装置 | |
JP2002041063A (ja) | カラオケ装置及び記録媒体 | |
TW200416667A (en) | Music composition system, method for controlling music composition system, program, information storage medium and music composition method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20100217 |