JP6358018B2 - カラオケ装置、及びプログラム - Google Patents

カラオケ装置、及びプログラム Download PDF

Info

Publication number
JP6358018B2
JP6358018B2 JP2014199914A JP2014199914A JP6358018B2 JP 6358018 B2 JP6358018 B2 JP 6358018B2 JP 2014199914 A JP2014199914 A JP 2014199914A JP 2014199914 A JP2014199914 A JP 2014199914A JP 6358018 B2 JP6358018 B2 JP 6358018B2
Authority
JP
Japan
Prior art keywords
evaluation
singing
coincidence
music
reference value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014199914A
Other languages
English (en)
Other versions
JP2016071122A (ja
Inventor
伸行 浅野
伸行 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2014199914A priority Critical patent/JP6358018B2/ja
Publication of JP2016071122A publication Critical patent/JP2016071122A/ja
Application granted granted Critical
Publication of JP6358018B2 publication Critical patent/JP6358018B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、カラオケ装置、及びプログラムに関する。
従来、カラオケ装置において、利用者が楽曲を歌唱した歌声の声質を、当該楽曲のオリジナル歌手の声質へと変換して出力するカラオケ装置が知られている(特許文献1参照)。具体的に、特許文献1に記載されたカラオケ装置では、利用者が歌唱することで入力された歌唱信号と、オリジナル歌手の歌声を表すオリジナル信号との差分を算出し、その算出した差分をオリジナル信号に加算することで出力信号を生成している。そして、特許文献1に記載されたカラオケ装置では、生成された出力信号に基づく音声を放音する。
特開平08−263077号公報
ところで、特許文献1に記載されたカラオケ装置においてオリジナル歌手の歌声の特徴へと変換されるパラメータは、声質だけであり、音高や音量、歌い回しなどの歌声におけるその他のパラメータは変換されない。このため、特許文献1に記載されたカラオケ装置から出力される音声は、オリジナル歌手の声質でありながら、例えば、音高がズレていたり音量が小さかったりする可能性があった。
つまり、従来のカラオケ装置においては、当該カラオケ装置から出力される音声に対する評価は、特定の評価項目については高いものの、特定の評価項目以外のその他の評価項目については低くなる可能性があった。
換言すれば、従来のカラオケ装置では、カラオケ装置から出力される音声がアンバランスなものとなるという課題があった。
そこで、本発明は、カラオケ装置から出力される音声におけるバランスを改善することを目的とする。
上記目的を達成するためになされた本発明は、音声取得手段と、基準取得手段と、特徴算出手段と、一致度算出手段と、補正手段と、出力手段とを備えたカラオケ装置に関する。
本発明における音声取得手段は、指定楽曲の演奏中にマイクを介して入力された音声を表す歌唱音声データを取得する。ここで言う指定楽曲とは、音高と音価との組み合わせからなる複数の音符のうちの少なくとも一部に歌詞が割り当てられた少なくとも1つの楽曲のうち、指定された楽曲である。
基準取得手段は、評価基準データの中から、指定楽曲の評価基準データを取得する。ここで言う評価基準データとは、楽曲の歌唱を評価する項目として規定された複数の評価項目それぞれの評価基準を楽曲ごとに表したデータである。
さらに、本発明における特徴算出手段は、音声取得手段で取得した歌唱音声データに基づいて、歌唱音声データにおける評価項目ごとの評価を表す歌唱特徴量を算出する。一致度算出手段は、特徴算出手段で算出した歌唱特徴量と、基準取得手段で取得した評価基準データによって表された評価基準との一致度である評価一致度を、評価項目ごとに算出する。
そして、補正手段は、一致度算出手段で算出された評価一致度が、規定された特定基準値よりも低い少なくとも1つの評価項目について、評価一致度が特定基準値に近づくように、音声取得手段で取得した歌唱音声データを補正する。さらに、出力手段は、補正手段で補正した歌唱音声データを出力する。
このようなカラオケ装置によれば、指定楽曲の演奏中にマイクを介して入力された音声(即ち、カラオケ装置の利用者の歌唱音声)において、評価一致度が特定基準値よりも低い評価項目(即ち、評価が低い評価項目)について高評価となるように補正することができる。一方、本発明のカラオケ装置では、評価一致度が特定基準値以上である評価項目(即ち、評価が高い評価項目)については、マイクを介して入力された音声を補正していない。
すなわち、本発明のカラオケ装置によれば、歌唱音声の中で、評価が低い評価項目だけを補正して出力することができる。したがって、本発明のカラオケ装置によれば、当該カラオケ装置から出力される音声における各評価項目に対する評価を均一化することができ、歌唱音声全体の評価を向上させることができる。換言すれば、本発明のカラオケ装置によれば、当該カラオケ装置から出力される音声におけるバランスを改善することができる。
以上のことから、本発明のカラオケ装置によれば、楽曲を歌唱している歌唱者の満足度合いを向上させることができる。さらに、本発明のカラオケ装置の聴取者は、バランスの良い音声を聴くことができるため、満足度合いが向上する。したがって、本発明のカラオケ装置によれば、歌唱者と聴取者との双方の満足度合いを向上させることができる。
また、本発明における補正手段は、評価一致度が特定基準値よりも低い全ての評価項目について、評価一致度が特定基準値に近づくように補正しても良い。
このようなカラオケ装置によれば、よりバランスの良い音声を出力できる。
さらに、本発明においては、最も高い評価項目の評価一致度を特定基準値としても良い。この場合、本発明における補正手段は、評価一致度が特定基準値よりも低い評価項目について、評価一致度が特定基準値に近づくように補正しても良い。
このようなカラオケ装置によれば、評価項目の中で最も評価が高い評価項目に近づくように歌唱音声データにおける他の評価項目を補正できる。
この結果、カラオケ装置によれば、出力する音声のバランスをより向上させることができ、歌唱者と聴取者との双方の満足度合いをより向上させることができる。
また、本発明のカラオケ装置においては、表示手段を備えていても良い。この場合の表示手段は、一致度算出手段で算出された評価一致度が特定基準値よりも低い少なくとも1つの評価項目と、評価一致度が特定基準値以上である少なくとも1つの評価項目とを識別可能な態様で表示しても良い。
このようなカラオケ装置では、当該カラオケ装置から出力される歌唱音声において、補正が実施された評価項目と、補正が未実施である評価項目とが識別可能な態様で表示される。
この結果、カラオケ装置の利用者は、補正された評価項目と、補正を未実施である評価項目とを認識できる。
ところで、本発明は、音声取得ステップと、基準取得ステップと、特徴算出ステップと、一致度算出ステップと、補正ステップと、出力ステップとを、コンピュータに実行させるプログラムとしてなされていても良い。
このようなプログラムにおける音声取得ステップでは、指定楽曲の演奏中にマイクを介して入力された音声を表す歌唱音声データを取得する。基準取得ステップでは、指定楽曲の評価基準データを取得する。
特徴算出ステップでは、音声取得ステップで取得した歌唱音声データに基づいて歌唱特徴量を算出する。さらに、一致度算出ステップでは、歌唱特徴量と、評価基準データによって表された評価基準との一致度である評価一致度を、評価項目ごとに算出する。
そして、補正ステップでは、評価一致度が特定基準値よりも低い少なくとも1つの評価項目について、評価一致度が特定基準値に近づくように歌唱音声データを補正する。出力ステップでは、補正ステップで補正した歌唱音声データを出力する。
本発明は、コンピュータが実行するプログラムとしてなされていても良い。
このように、本発明がプログラムとしてなされていれば、記録媒体から必要に応じてコンピュータにロードさせて起動することや、必要に応じて通信回線を介してコンピュータに取得させて起動することにより用いることができる。そして、コンピュータに各手順を実行させることで、そのコンピュータを、請求項1に記載されたカラオケ装置として機能させることができる。
なお、ここで言う記録媒体には、例えば、DVD−ROM、CD−ROM、ハードディスク等のコンピュータ読み取り可能な電子媒体を含む。
本発明が適用されたカラオケ装置を備えたカラオケシステムの概略構成を示すブロック図である。 カラオケ演奏処理の処理手順を示すフローチャートである。 カラオケ演奏処理における評価一致度の算出方法を説明する図である。 カラオケ演奏処理において音圧を評価項目とした補正方法の一例を示す図である。 カラオケ演奏処理においてビブラートを評価項目とした補正方法の一例を示す図である。
以下に本発明の実施形態を図面と共に説明する。
<カラオケシステム>
図1に示すカラオケシステム1は、ユーザが指定した楽曲(以下、「指定楽曲」と称す)を演奏すると共に、その指定楽曲の演奏中に入力された音声を、予め規定された評価項目である歌唱評価項目ごとに評価する。そして、カラオケシステム1は、その評価結果が特定基準値以下である少なくとも1つの歌唱評価項目について、指定楽曲の演奏中に入力された音声を補正して出力する。なお、以下では、指定楽曲の演奏中に入力された音声を、歌唱音声データと称す。
これを実現するために、カラオケシステム1は、情報処理サーバ10と、カラオケ装置30とを備えている。
情報処理サーバ10は、通信部12と、記憶部14と、制御部16とを備えている。
このうち、通信部12は、通信網を介して、情報処理サーバ10が外部との間で通信を行う。すなわち、情報処理サーバ10は、通信網を介してカラオケ装置30と接続されている。なお、ここで言う通信網は、有線による通信網であっても良いし、無線による通信網であっても良い。
記憶部14は、記憶内容を読み書き可能に構成された周知の記憶装置である。この記憶部14には、少なくとも、複数のMIDI楽曲MDが記憶される。さらに、記憶部14には、歌唱音声データを評価する評価基準を、歌唱評価項目ごと、かつ楽曲ごとに表す評価基準データASが記憶されている。この評価基準データASは、対応する楽曲ごとにMIDI楽曲MDと対応付けて記憶部14に記憶されている。
なお、図1に示す符号「n」は、情報処理サーバ10の記憶部14に記憶されているMIDI楽曲MD及び評価基準データASを識別する識別子であり、楽曲ごとに割り当てられている。この符号「n」は、1以上の自然数である。
制御部16は、ROM18,RAM20,CPU22を備えた周知のマイクロコンピュータを中心に構成された周知の制御装置である。ROM18は、電源が切断されても記憶内容を保持する必要がある処理プログラムやデータを記憶する。RAM20は、処理プログラムやデータを一時的に記憶する。CPU22は、ROM18やRAM20に記憶された処理プログラムに従って各処理を実行する。
<MIDI楽曲>
MIDI楽曲MDは、楽曲ごとに予め用意されたものであり、楽曲データと、歌詞データとを有している。
このうち、楽曲データは、周知のMIDI(Musical Instrument Digital Interface)規格によって、一つの楽曲の楽譜を表したデータである。この楽曲データは、楽曲IDと、当該楽曲にて用いられる楽器ごとの楽譜を表す楽譜トラックとを少なくとも有している。
そして、楽譜トラックには、MIDI音源から出力される個々の演奏音について、少なくとも、音高(いわゆるノートナンバー)と、MIDI音源が演奏音を出力する期間(以下、音符長と称す)とが規定されている。楽譜トラックにおける音符長は、当該演奏音の出力を開始するまでの当該楽曲の演奏開始からの時間を表す演奏開始タイミング(いわゆるノートオンタイミング)と、当該演奏音の出力を終了するまでの当該楽曲の演奏開始からの時間を表す演奏終了タイミング(いわゆるノートオフタイミング)とによって規定されている。
すなわち、楽譜トラックでは、ノートナンバーと、ノートオンタイミング及びノートオフタイミングによって表される音符長とによって、1つの音符NOが規定される。そして、楽譜トラックは、音符NOが演奏順に配置されることによって、1つの楽譜として機能する。
一方、歌詞データは、楽曲の歌詞に関するデータであり、歌詞テロップデータと、歌詞出力データとを備えている。歌詞テロップデータは、楽曲の歌詞を構成する文字(以下、歌詞構成文字とする)を表す。歌詞出力データは、歌詞構成文字の出力タイミングである歌詞出力タイミングを、演奏データの演奏と対応付けるタイミング対応関係が規定されたデータである。
具体的に、本実施形態におけるタイミング対応関係では、演奏データの演奏を開始するタイミングに、歌詞テロップデータの出力を開始するタイミングが対応付けられている。さらに、タイミング対応関係では、楽曲の時間軸に沿った各歌詞構成文字の歌詞出力タイミングが、演奏データの演奏開始からの経過時間によって規定されている。これにより、楽譜トラックに規定された個々の演奏音(即ち、音符NO)と、歌詞構成文字それぞれとが対応付けられる。
<評価基準データ>
評価基準データASは、歌唱音声データの評価基準を、楽曲それぞれに規定された所定期間ごと、かつ、歌唱評価項目ごとに表したデータである。この評価基準データASは、例えば、楽曲を歌唱した模範的な歌唱音声に基づいて予め規定された採点基準データであっても良いし、楽曲を歌唱した模範的な歌唱音声であるガイドボーカルそのものであっても良い。
本実施形態における歌唱評価項目として、歌唱音声における歌い方の特徴(以下、「歌唱特徴」と称す)と、その歌唱音声を発声した歌唱者の声質(以下、「歌唱声質」と称す)とが含まれる。
本実施形態における歌唱特徴には、歌唱音声における音高の推移を表す音高推移と、歌唱音声における音圧の推移を表す音圧推移と、歌唱音声にて表現された歌唱技巧とを含む。ここで言う歌唱技巧には、少なくとも“ビブラート”を含む。
具体的に、本実施形態の評価基準データASは、楽曲を歌唱した模範的な歌唱音声における歌唱特徴を表す模範特徴情報と、その模範的な歌唱音声における歌唱声質を表す模範声質情報とを備えている。
模範特徴情報は、模範的な歌唱音声における歌唱特徴の特徴量を表すデータである。模範特徴情報は、歌唱音声における音高の推移を表す音高推移情報と、歌唱音声における音圧の推移を表す音圧推移情報と、歌唱音声にて表現された歌唱技巧を表す技巧情報とを含む。その技巧情報は、歌唱音声において用いられた歌唱技巧の種類と、その歌唱技巧が用いられたタイミングと、その用いられた歌唱技巧の特徴量を表す技巧特徴量とを対応付けたものである。
なお、“ビブラート”についての技巧特徴量(以下、「ビブラート特徴量」と称す)vibは、以下の手順で算出すれば良い。
ビブラート特徴量vibの算出手順では、まず、歌詞が割り当てられた音符NO(i)に対する歌唱音声(以下、音符ボーカルと称す)Vo(a,i)について周波数解析(DFT(discrete Fourier transform))を実施する。そして、下記(1)式に従って、ビブラート特徴量vibを算出する。
vib(a,i)=vib_per(a,i)×vip_dep(a,i) (1)
ただし、上記(1)式におけるvib_per(a,i)は、各音符ボーカルVo(a,i)におけるスペクトルピークの突出精度を表す指標である。このvib_perは、周波数解析結果(即ち、振幅スペクトル)のピーク値を、周波数解析結果の平均値で除すことで求めれば良い。また、上記(1)式におけるvip_depは、各音符ボーカルVo(a,i)の標準偏差である。
なお、本実施形態において、符号“a”は、楽曲を識別する符号であり、符号“i”は、当該楽曲を構成し歌詞が割り当てられた音符を識別する符号である。
模範声質情報は、歌唱音声を発声した歌唱者の声質の特徴量を表すデータである。ここで言う声質の特徴量とは、例えば、メル周波数ケプストラム(MFCC)である。
この模範声質情報は、楽曲を構成する音符ごとに表されていても良いし、楽曲に規定され、複数の音符を含む所定区間ごとに表されていても良いし、楽曲ごとに表されていても良い。
<カラオケ装置>
カラオケ装置30は、情報処理サーバ10に記憶されたMIDI楽曲MDに基づいて、指定楽曲を演奏すると共に、歌唱音声データを歌唱評価項目ごとに評価する。そして、カラオケ装置30は、その評価結果が特定基準値以下である少なくとも1つの歌唱評価項目について、評価結果が特定基準値に近づくように歌唱音声データを補正して出力する。
これを実現するために、カラオケ装置30は、通信部32と、入力受付部34と、楽曲再生部36と、記憶部38と、音声制御部40と、映像制御部46と、制御部50とを備えている。
通信部32は、通信網を介して、カラオケ装置30が外部との間で通信を行う。入力受付部34は、外部からの操作に従って情報や指令の入力を受け付ける入力機器である。ここでの入力機器とは、例えば、キーやスイッチ、リモコンの受付部などである。
楽曲再生部36は、情報処理サーバ10からダウンロードしたMIDI楽曲MDに基づく楽曲の演奏を実行する。この楽曲再生部36は、例えば、MIDI音源である。
音声制御部40は、音声の入出力を制御するデバイスであり、出力部42と、マイク入力部44とを備えている。マイク入力部44には、マイク62が接続される。これにより、マイク入力部44は、マイク62を介して入力された音声を取得する。出力部42にはスピーカ60が接続されている。出力部42は、楽曲再生部36によって再生される楽曲の音源信号、マイク入力部44からの歌唱音声の音源信号をスピーカ60に出力する。スピーカ60は、出力部42から出力される音源信号を音に換えて出力する。
映像制御部46は、制御部50から送られてくる映像データに基づく映像または画像の出力を行う。映像制御部46には、映像または画像を表示する表示部64が接続されている。
制御部50は、ROM52,RAM54,CPU56を少なくとも有した周知のコンピュータを中心に構成されている。ROM52は、電源が切断されても記憶内容を保持する必要がある処理プログラムやデータを記憶する。RAM54は、処理プログラムやデータを一時的に記憶する。CPU56は、ROM52やRAM54に記憶された処理プログラムに従って各処理を実行する。
本実施形態のROM52には、カラオケ演奏処理を制御部50が実行するための処理プログラムが格納されている。ここで言うカラオケ演奏処理は、MIDI楽曲MDに基づいて指定楽曲を演奏すると共に、その指定楽曲の評価基準データASに基づいて歌唱音声データを評価し、その評価結果が特定基準値以下である少なくとも1つの歌唱評価項目について、評価結果が特定基準値に近づくように歌唱音声データを補正して出力する処理である。
<カラオケ演奏処理>
次に、制御部50が実行するカラオケ演奏処理について説明する。
このカラオケ演奏処理は、予め規定された起動指令が入力受付部34を介して入力されると起動される。
そして、図2に示すカラオケ演奏処理が起動されると、制御部50は、まず、入力受付部34を介して指定された楽曲(即ち、指定楽曲)に対応するMIDI楽曲MDを、情報処理サーバ10の記憶部14から取得する(S110)。続いて、制御部50は、情報処理サーバ10の記憶部14に格納されている全ての評価基準データASの中から、S110で取得したMIDI楽曲MDに対応する楽曲と対応付けられた評価基準データASを取得する(S120)。
さらに、制御部50は、S110にて取得したMIDI楽曲MDに基づいて指定楽曲の演奏を開始し、歌詞を含む各種情報を表示部64に表示する(S130)。具体的にS130における指定楽曲の演奏では、制御部50は、楽曲再生部36にMIDI楽曲MDを時間軸に沿って順次出力する。そのMIDI楽曲MDを取得した楽曲再生部36は、楽曲の演奏を行う。そして、楽曲再生部36によって演奏された楽曲の音源信号が、出力部42を介してスピーカ60へと出力される。すると、スピーカ60は、音源信号を音に換えて出力する。
また、S130では、制御部50は、各種情報を表す画像信号を映像制御部46に出力する。その画像信号を取得した映像制御部46は、楽曲再生部36での指定楽曲の演奏に同期させて、各種情報を表示部64に表示する。なお、表示部64に表示される各種情報には、指定楽曲を構成する各音符NOに割り当てられた歌詞の他に、本カラオケ演奏処理による歌唱音声信号の評価結果を含む。
そして、カラオケ演奏処理では、制御部50は、マイク62及びマイク入力部44を介して入力された音声を歌唱音声データとして取得する(S140)。そして、制御部50は、S140にて取得した歌唱音声データを記憶部38に記憶する(S150)。
さらに、カラオケ演奏処理では、制御部50は、演奏中の指定楽曲が、予め規定された所定期間内であるか否かを判定する(S160)。ここで言う所定期間とは、歌唱音声データを評価する期間として、楽曲それぞれに予め規定された少なくとも1つの期間である。本実施形態における所定期間は、楽曲における時間軸に沿って連続するように、複数設定されている。
このS160での判定の結果、現時点で演奏している指定楽曲におけるタイミング(以下、「現演奏タイミング」と称す)が所定期間外であれば(S160:NO)、制御部50は、カラオケ演奏処理をS220へと移行させる。そのS220では、制御部50は、S140にて取得した歌唱音声データを補正することなく、音声制御部40に出力する。その音声制御部40は、歌唱音声データによって表される音声を、出力部42を介してスピーカ60へと出力される。すると、スピーカ60は、歌唱音声データによって表される音声を出力する。
その後、制御部50は、詳しくは後述するS230へとカラオケ演奏処理を移行させる。
一方、S160での判定の結果、現演奏タイミングが所定期間内であれば(S160:YES)、制御部50は、カラオケ演奏処理をS170へと移行させる。そのS170では、制御部50は、S150にて記憶部38に記憶された歌唱音声データに基づいて、所定期間での歌唱特徴量を算出する(S170)。
この歌唱特徴量は、歌唱評価項目ごとの特徴量を表したデータである。この歌唱特徴量には、歌唱音声データにおける歌唱特徴を表す歌唱音声特徴情報と、歌唱音声データにおける発声者(即ち、カラオケ装置30の利用者)の声質を表す歌唱声質情報とを含む。
このうち、歌唱音声特徴情報は、歌唱音声データにおける音高の推移を表す歌唱音高推移と、歌唱音声データにおける音圧の推移を表す歌唱音圧推移と、歌唱音声データにて表現された歌唱技巧を表す歌唱技巧情報とを含む。
本実施形態においては、歌唱音高推移は、以下の手順で算出すれば良い。
歌唱音高推移の算出では、制御部50は、規定された時間長を有した分析時間窓を、時間軸に沿って連続するように歌唱音声データに設定し、各分析時間窓における歌唱音声データを周波数解析(例えば、DFT)する。そして、周波数解析の結果を自己相関した結果、最も強い周波数成分を基本周波数f0、即ち、分析時間窓における音高とし、時間軸に沿って配置することで、歌唱音高推移を算出する。
また、本実施形態においては、歌唱音圧推移は、以下の手順で算出すれば良い。
歌唱音圧推移の算出では、制御部50は、規定された時間長を有した分析時間窓を、時間軸に沿って連続するように歌唱音声データに設定する。そして、各分析時間窓における歌唱音声データの振幅の二乗平均平方根(RMS(Root Mean Square))を、その分析時間窓における音圧とし、時間軸に沿って配置することで、歌唱音圧推移を算出する。
また、本実施形態における歌唱技巧情報の算出手法は、ビブラート特徴量vibの算出手順と同様であるため、ここでの詳しい説明は省略する。
さらに、歌唱声質情報の算出では、各分析時間窓における歌唱音声データの周波数解析の結果に基づいて、メル周波数ケプストラム(MFCC)を算出し、そのメル周波数ケプストラムを歌唱声質情報として算出する。
カラオケ演奏処理では、続いて、制御部50は、S170で算出した歌唱特徴量と、S20で取得した評価基準データとの一致度である評価一致度を、歌唱評価項目それぞれについて算出する(S180)。具体的にS180では、制御部50は、歌唱特徴量と評価基準データとの歌唱評価項目ごとの相関値それぞれを、評価一致度として算出する。なお、相関値の算出方法は、周知であるため、ここでの詳しい説明は省略する。
そして、カラオケ演奏処理では、制御部50は、S180にて算出した全ての評価一致度の中で少なくとも1つの評価一致度が、規定された補正実施条件に適合しているか否かを判定する(S190)。このS190では、制御部50は、少なくとも1つの歌唱評価項目についての評価一致度が、規定された特定基準値以下であれば、その評価一致度が補正実施条件に適合しているものと判定する。なお、本実施形態においては、S180にて歌唱評価項目ごとに算出された全ての評価一致度、即ち、音高推移の評価一致度、音圧推移の評価一致度、歌唱技巧の評価一致度、声質の評価一致度の中で、最も高い評価一致度を特定基準値とする。
そして、S190での判定の結果、S180にて算出した全ての評価一致度が補正実施条件に適合していなければ(S190:NO)、制御部50は、カラオケ演奏処理をS220へと移行させる。そのS220では、制御部50は、S140にて取得した歌唱音声データを補正することなく、音声制御部40に出力する。その音声制御部40は、歌唱音声データによって表される音声を、出力部42を介してスピーカ60へと出力される。すると、スピーカ60は、歌唱音声データによって表される音声を出力する。
その後、制御部50は、カラオケ演奏処理をS230へと移行させる。
一方、S190での判定の結果、S180にて算出した全ての評価一致度の中で、少なくとも1つの評価一致度が補正実施条件に適合していれば(S190:YES)、制御部50は、カラオケ演奏処理をS200へと移行させる。そのS200では、制御部50は、評価一致度が特定基準値よりも低い全ての歌唱評価項目(以下、「補正対象項目」と称す)について、各補正対象項目の評価一致度が特定基準値に近づくように歌唱音声データを補正する。なお、本実施形態においては、S180にて歌唱評価項目ごとに算出された全ての評価一致度の中で、最も高い評価一致度を特定基準値としているため、最も高い評価一致度に対応する評価項目以外の評価項目が、補正対象項目となる。
本実施形態におけるS190、及びS200では、例えば、図3に示すように、所定期間よりも短い期間である最小評価期間ごとに、ガイドボーカルと歌唱音声データとの歌唱評価項目ごとの一致度を最小単位一致度として算出する。そして、最小評価期間それぞれにおける最小単位一致度に基づいて、規定回数以上の最小評価期間の最小単位一致度の和を評価一致度(即ち、点数)として算出する。この算出した評価一致度が最も高い歌唱評価項目以外の歌唱評価項目を補正対象項目として、各補正対象項目の評価一致度が特定基準値に合致するように、歌唱音声データを補正する。
歌唱音声データを補正する具体的な方法として、音圧推移を歌唱評価項目とした補正方法(図4参照)と、ビブラートを歌唱評価項目とした補正方法(図5参照)とについて説明する。
まず、図4に示す音圧推移を補正対象項目とした補正方法の前提条件として、音圧推移に関する歌唱評価項目は、例えば、歌唱音圧推移と模範音圧推移との音圧差の階級に応じて、評価一致度が分類されている(即ち、点数化されている)ものとする。そして、最も高い評価の評価一致度(即ち、特定基準値)が「α点」であり、歌唱音圧推移に関する評価一致度が「β点(α>β)」である場合を図4に示す。この場合のS200では、制御部50は、補正後の歌唱音圧推移と模範音圧推移との音圧差が「α点」の階級に対応する音圧差となるように、歌唱音声における音圧推移を増幅する(図4に示す例では、「−y[dB]」まで増幅する。)。
また、図5に示すビブラートを補正対象項目とした補正方法の前提条件として、ビブラートに関する歌唱評価項目は、例えば、ビブラートの振幅の変動における最高振幅と最低振幅との差分であるビブラート振幅、及びビブラートにおける周波数変動の速度であるビブラート速度とに応じて、評価一致度が分類されている(即ち、点数化されている)ものとする。そして、最高評価の評価一致度が「α点」であり、ビブラートの評価一致度が「β点(α>β)」である場合を図5に示す。この場合のS200では、制御部50は、ビブラート振幅及びビブラート速度の組が、「α点」に対応するビブラート振幅及びビブラート速度の組となるように、歌唱音声におけるビブラートを付与する。このビブラートの付与では、まず、歌唱音声データによって表される歌唱音声から、時間軸に沿ったビブラートの振幅の変動を除去する。そして、振幅の変動を除去した歌唱音声に、「α点」に対応するビブラート振幅及びビブラート速度の組が形成されるように、ビブラートの振幅の変動を加える。
続いて、制御部50は、補正対象項目と、特定基準値に対応する歌唱評価項目である非補正対象項目とを識別可能な態様である識別アイコンを表示する(S210)。ここで言う識別アイコンは、補正対象項目を認識可能な態様の文字や、各種マークであっても良い。また、ここで言う識別アイコンは、非補正対象項目を認識可能な態様の文字や、各種マークであっても良い。
その後、制御部50は、S200にて補正された歌唱音声データを音声制御部40に出力する。その音声制御部40は、補正された歌唱音声データによって表される音声信号を、出力部42を介してスピーカ60へと出力される。すると、スピーカ60は、補正された歌唱音声データによって表される音声を出力する。
その後、制御部50は、カラオケ演奏処理をS230へと移行させる。
そのS230では、制御部50は、指定楽曲の演奏が終了したか否かを判定する。このS230での判定の結果、指定楽曲の演奏が終了していなければ(S230:NO)、制御部50は、カラオケ演奏処理をS140へと戻す。そのS140では、マイク62及びマイク入力部44を介して入力された音声を歌唱音声データとして取得する(S140)。
一方、S230での判定の結果、指定楽曲の演奏が終了していれば(S230:YES)、制御部50は、カラオケ演奏処理を終了する。そして、制御部50は、起動指令が入力されるまで待機する。
[実施形態の効果]
以上説明したように、本実施形態のカラオケ演奏処理では、歌唱音声データの中で、評価が低い歌唱評価項目だけを補正対象項目として補正して出力することができる。したがって、本実施形態のカラオケ演奏処理によれば、カラオケ装置30から出力される歌唱音声における各歌唱評価項目に対する評価を均一化することができ、歌唱音声全体の評価を向上させることができる。
換言すれば、カラオケ装置30によれば、当該カラオケ装置30から出力される音声におけるバランスを改善することができる。この結果、カラオケ装置30によれば、楽曲を歌唱している歌唱者の満足度合いを向上させることができる。
さらに、カラオケ装置30からの歌唱音声の聴取者は、バランスの良い音声を聴くことができるため、満足度合いが向上する。したがって、カラオケ装置30によれば、歌唱者と聴取者との双方の満足度合いを向上させることができる。
ところで、カラオケ演奏処理においては、全ての歌唱評価項目に対する評価一致度の中で、特定基準値よりも低い全ての評価一致度に対応する歌唱評価項目を補正対象項目とし、全て補正対象項目について、その補正対象項目の評価一致度が特定基準値に近づくように補正している。しかも、カラオケ演奏処理においては、全ての歌唱評価項目に対する評価一致度の中で、最も高い評価一致度を特定基準値としている。
このため、カラオケ演奏処理においては、最も高い評価の歌唱評価項目を基準として、歌唱音声データにおける他の全ての歌唱評価項目を補正できる。
この結果、カラオケ装置30によれば、カラオケ装置30から出力される歌唱音声を、よりバランスの良い音声とすることができ、歌唱者と聴取者との双方の満足度合いをより向上させることができる。
なお、本実施形態のカラオケ演奏処理においては、補正対象項目と、特定基準値に対応する歌唱評価項目である非補正対象項目とを識別可能な態様である識別アイコンを表示している。
したがって、カラオケ装置30の利用者は、補正された歌唱評価項目と、補正を未実施である歌唱評価項目とを認識できる。
[その他の実施形態]
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、様々な態様にて実施することが可能である。
例えば、上記実施形態における所定期間は、楽曲における時間軸に沿って連続するように複数設定されていたが、本発明における所定期間は、これに限るものではない。すなわち、本発明における所定期間は、楽曲において1つだけ設定されていても良い。
また、本発明において、所定期間が複数設定されている場合には、それらの複数の所定期間は、楽曲における時間軸に沿って連続するように設定される場合に限らない。例えば、複数の所定期間は、楽曲における時間軸に沿って不連続となるように予め規定されたタイミングごとに設定されていても良い。
また、上記実施形態のカラオケ演奏処理では、指定楽曲の演奏中に入力される音声を順次評価していたが、歌唱音声データを評価する評価タイミングは、これに限るものではない。例えば、指定楽曲の演奏中に入力された歌唱音声データを記憶部に記憶し、指定楽曲の演奏が終了した後、その記憶部に記憶された歌唱音声データをまとめて評価しても良い。
なお、上記実施形態の構成の一部を省略した態様も本発明の実施形態である。また、上記実施形態と変形例とを適宜組み合わせて構成される態様も本発明の実施形態である。また、特許請求の範囲に記載した文言によって特定される発明の本質を逸脱しない限度において考え得るあらゆる態様も本発明の実施形態である。
また、本発明は、前述したカラオケ装置の他、歌唱音声を評価してその評価結果を反映した歌唱音声へと補正するためにコンピュータが実行するプログラム、歌唱音声を評価してその評価結果を反映した歌唱音声へと補正する方法等、種々の形態で実現することができる。
[実施形態と特許請求の範囲との対応関係]
最後に、上記実施形態の記載と、特許請求の範囲の記載との関係を説明する。
上記実施形態におけるカラオケ演奏処理のS140を実行することで得られる機能が、特許請求の範囲に記載された音声取得手段の一例であり、カラオケ演奏処理のS120を実行することで得られる機能が、特許請求の範囲に記載された基準取得手段の一例である。また、カラオケ演奏処理のS170を実行することで得られる機能が、特許請求の範囲に記載された特徴算出手段の一例であり、カラオケ演奏処理のS180を実行することで得られる機能が、特許請求の範囲に記載された一致度算出手段の一例である。
そして、カラオケ演奏処理のS190,S200を実行することで得られる機能が、特許請求の範囲に記載された補正手段の一例であり、S220を実行することで得られる機能が、特許請求の範囲に記載された出力手段の一例である。また、カラオケ演奏処理のS210を実行することで得られる機能が、特許請求の範囲に記載された表示手段の一例である。
1…カラオケシステム 10…情報処理サーバ 12,32…通信部 14…記憶部 16,50…制御部 18,52…ROM 20,54…RAM 22,56…CPU 30…カラオケ装置 34…入力受付部 36…楽曲再生部 38…記憶部 40…音声制御部 42…出力部 44…マイク入力部 46…映像制御部 60…スピーカ 62…マイク 64…表示部

Claims (5)

  1. 音高と音価との組み合わせからなる複数の音符のうちの少なくとも一部に歌詞が割り当てられた少なくとも1つの楽曲のうち、指定された楽曲である指定楽曲の演奏中にマイクを介して入力された音声を表す歌唱音声データを取得する音声取得手段と、
    前記楽曲の歌唱を評価する項目として規定された複数の評価項目それぞれの評価基準を前記楽曲ごとに表した評価基準データの中から、前記指定楽曲の前記評価基準データを取得する基準取得手段と、
    前記音声取得手段で取得した歌唱音声データに基づいて、前記歌唱音声データにおける前記評価項目ごとの歌唱の評価を表す歌唱特徴量を算出する特徴算出手段と、
    前記特徴算出手段で算出した歌唱特徴量と、前記基準取得手段で取得した評価基準データによって表された前記評価基準との一致度である評価一致度を、前記評価項目ごとに算出する一致度算出手段と、
    前記一致度算出手段で算出された評価一致度が、規定された特定基準値よりも低い少なくとも1つの評価項目について、前記評価一致度が特定基準値に近づくように、前記音声取得手段で取得した歌唱音声データを補正する補正手段と、
    前記補正手段で補正した歌唱音声データを出力する出力手段と
    を備えることを特徴とするカラオケ装置。
  2. 前記補正手段は、
    前記評価一致度が前記特定基準値よりも低い全ての評価項目について、前記評価一致度が前記特定基準値に近づくように補正する
    ことを特徴とする請求項1に記載のカラオケ装置。
  3. 前記補正手段は、
    最も高い評価項目の評価一致度を前記特定基準値とし、
    前記評価一致度が前記特定基準値よりも低い評価項目について、前記評価一致度が特定基準値に近づくように補正する
    ことを特徴とする請求項1または請求項2に記載のカラオケ装置。
  4. 前記一致度算出手段で算出された評価一致度が前記特定基準値よりも低い少なくとも1つの評価項目と、前記評価一致度が前記特定基準値以上である少なくとも1つの評価項目とを識別可能な態様で表示する表示手段と
    を備えることを特徴とする請求項1から請求項3までのいずれか一項に記載のカラオケ装置。
  5. 音高と音価との組み合わせからなる複数の音符のうちの少なくとも一部に歌詞が割り当てられた少なくとも1つの楽曲のうち、指定された楽曲である指定楽曲の演奏中にマイクを介して入力された音声を表す歌唱音声データを取得する音声取得ステップと、
    前記楽曲の歌唱を評価する項目として規定された複数の評価項目それぞれの評価基準を前記楽曲ごとに表した評価基準データの中から、前記指定楽曲の前記評価基準データを取得する基準取得ステップと、
    前記音声取得ステップで取得した歌唱音声データに基づいて、前記歌唱音声データにおける前記評価項目ごとの歌唱の評価を表す歌唱特徴量を算出する特徴算出ステップと、
    前記特徴算出ステップで算出した歌唱特徴量と、前記基準取得ステップで取得した評価基準データによって表された前記評価基準との一致度である評価一致度を、前記評価項目ごとに算出する一致度算出ステップと、
    前記一致度算出ステップで算出された評価一致度が、規定された特定基準値よりも低い少なくとも1つの評価項目について、前記評価一致度が特定基準値に近づくように、前記音声取得ステップで取得した歌唱音声データを補正する補正ステップと、
    前記補正ステップで補正した歌唱音声データを出力する出力ステップとを
    コンピュータに実行させることを特徴とするプログラム。
JP2014199914A 2014-09-30 2014-09-30 カラオケ装置、及びプログラム Active JP6358018B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014199914A JP6358018B2 (ja) 2014-09-30 2014-09-30 カラオケ装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014199914A JP6358018B2 (ja) 2014-09-30 2014-09-30 カラオケ装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016071122A JP2016071122A (ja) 2016-05-09
JP6358018B2 true JP6358018B2 (ja) 2018-07-18

Family

ID=55864518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014199914A Active JP6358018B2 (ja) 2014-09-30 2014-09-30 カラオケ装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP6358018B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6798253B2 (ja) * 2016-11-02 2020-12-09 ヤマハ株式会社 信号処理方法、および信号処理装置
CN110010162A (zh) * 2019-02-28 2019-07-12 华为技术有限公司 一种歌曲录制方法、修音方法及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11338480A (ja) * 1998-05-22 1999-12-10 Yamaha Corp カラオケ装置
JP2007316416A (ja) * 2006-05-26 2007-12-06 Casio Comput Co Ltd カラオケ装置およびカラオケ処理プログラム
JP6118528B2 (ja) * 2012-09-28 2017-04-19 株式会社第一興商 カラオケシステム

Also Published As

Publication number Publication date
JP2016071122A (ja) 2016-05-09

Similar Documents

Publication Publication Date Title
JP6358018B2 (ja) カラオケ装置、及びプログラム
JP5311069B2 (ja) 歌唱評価装置及び歌唱評価プログラム
JP5125958B2 (ja) 音域特定システム、プログラム
JP6260565B2 (ja) 音声合成装置、及びプログラム
JP6406273B2 (ja) カラオケ装置,及びプログラム
JP6098422B2 (ja) 情報処理装置、及びプログラム
WO2019180830A1 (ja) 歌唱評価方法及び装置、プログラム
JP6075314B2 (ja) プログラム,情報処理装置,及び評価方法
JP6788560B2 (ja) 歌唱評価装置、歌唱評価プログラム、歌唱評価方法及びカラオケ装置
JP6056799B2 (ja) プログラム、情報処理装置、及びデータ生成方法
JP6252517B2 (ja) 音声合成装置、及びプログラム
JP6365483B2 (ja) カラオケ装置,カラオケシステム,及びプログラム
JP5125957B2 (ja) 音域特定システム、プログラム
JP4553013B2 (ja) カラオケ装置
JP6380305B2 (ja) データ生成装置、カラオケシステム、及びプログラム
JP5805474B2 (ja) 音声評価装置,音声評価方法,及びプログラム
JP6304092B2 (ja) 表示制御装置、及びプログラム
JP7117229B2 (ja) カラオケ装置
JP5125956B2 (ja) 音域特定システム、プログラム
JP6252408B2 (ja) 表示制御装置,及び表示制御システム
JP5262908B2 (ja) 歌詞表示装置,プログラム
JP6281447B2 (ja) 音声合成装置,及び音声合成システム
JP2017049538A (ja) カラオケ装置、及びカラオケシステム
JP6365561B2 (ja) カラオケシステム、カラオケ装置、及びプログラム
JP5549651B2 (ja) 歌詞出力データ修正装置,及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180604

R150 Certificate of patent or registration of utility model

Ref document number: 6358018

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150