JP6073649B2 - 音声自動認識・音声変換システム - Google Patents

音声自動認識・音声変換システム Download PDF

Info

Publication number
JP6073649B2
JP6073649B2 JP2012245779A JP2012245779A JP6073649B2 JP 6073649 B2 JP6073649 B2 JP 6073649B2 JP 2012245779 A JP2012245779 A JP 2012245779A JP 2012245779 A JP2012245779 A JP 2012245779A JP 6073649 B2 JP6073649 B2 JP 6073649B2
Authority
JP
Japan
Prior art keywords
voice
recognition
charge
person
customer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012245779A
Other languages
English (en)
Other versions
JP2014095753A (ja
Inventor
聡 岩垣
聡 岩垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems Ltd
Original Assignee
Hitachi Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems Ltd filed Critical Hitachi Systems Ltd
Priority to JP2012245779A priority Critical patent/JP6073649B2/ja
Publication of JP2014095753A publication Critical patent/JP2014095753A/ja
Application granted granted Critical
Publication of JP6073649B2 publication Critical patent/JP6073649B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Description

本発明は、音声自動認識・音声変換システムに関する。例えばコールセンタに提供して好適な音声自動認識・音声変換システムに関する。
本技術分野の背景技術として、特開2005−12833号公報(特許文献1)や特開2011−9902号公報(特許文献2)がある。
前者の公報には、「音声応答により利用者との対話形式で処理を行う音声応答サービス装置において、前記利用者の属性を記憶する属性記憶部と、前記属性記憶部に記憶された利用者の属性情報に基づいて、利用者に応答する音声の音質を変更する利用者音質変更部とを備え、テレフォンサービスの利用者の性別や年齢区分などの属性や相手の操作環境に合わせて、音質を変更することにより快適性の高いサービスを提供する音声応答サービス装置。」と記載されている(要約参照)。
また、後者の公報には、「店舗に対する顧客からの電話の音声を取得する第1音声取得手段と、前記第1音声取得手段により取得した音声から感情を認識する感情認識手段と、前記感情認識手段により認識した感情の種別が、「怒り」および「興奮」の少なくとも一方を表すか否かに基づいて、音声内容が苦情か否かを判別する苦情判別手段と、前記苦情の対応を行う担当者の連絡先を記憶する連絡先記憶手段と、前記苦情判別手段により、前記音声内容が苦情であると判別した場合、前記連絡先記憶手段に記憶されている連絡先へ通知を行う第1通知手段と、顧客からの苦情を自動で判別し、適切な応対者に通知することができる顧客対応装置を提供する顧客対応装置。」と記載されている(要約参照)。
特開2005−12833号公報 特開2011−9902号公報
前記特許文献1には、テレフォンサービスの利用者の性別や年齢区分などの属性や相手の操作環境に合わせて、音量と音速度を変更、例えば利用者がプッシュボタンの入力誤りをしたときに音量を上げ、音速度を遅くする音声応答サービス装置が記載されている。しかし、特許文献1の音声応答サービス装置は事前に登録されたナレーションの音声変換を行うテレフォンサービスにおいては有効であるが、リアルタイムで複雑なサポート対応が必要とされる担当者の会話音声を変換するような、例えばコールセンタでは利用できない。
また、前記特許文献2には、電話対応中の顧客の電話音声から感情を認識し、苦情を自動で判別し、声紋を分析し、お客の年齢、性別に適したクレーム処理担当者を割り当てる顧客対応装置が記載されている。しかし、担当者を割り当てた後の対応については特に考慮されていない。
つまり、各特許文献には、会話中に顧客(相手)の感情等の変化が感じ取れた場合、会話中の担当者(顧客対応者)音声を顧客の感情等の変化に対応した適当と思われる音声にリアルタイムで変更し、顧客のストレスを低減させようとすることまでは考慮されていない。
そこで、本発明は、会話時の顧客の感情状態に応じて、顧客対応担当者の音声をリアルタイムで変更し、顧客のストレスを低減させることが可能な音声自動認識・音声変換システムを提供する。
上記課題を解決するために、本発明は、電話対応開始後における会話中の顧客の音声から感情変化が感じ取れた場合、当該顧客の感情変化に対応して、担当者音声をリアルタイムで変更する音声変換チューニング(音声変換の再構築)を行う音声変換手段を有する。
音声通信手段を介して通話相手と音声による会話を行うサービス提供システムに用いられる音声自動認識・音声変換システムであって、
前記音声自動認識・音声変換システムは、
前記通話相手の入力音声の声紋を認識する機能を有する声紋認識手段と、
前記入力音声から前記通話相手の感情を認識する機能を有する感情認識手段と、
前記通話相手の声紋、年齢、性別を示す顧客情報を蓄積する顧客DBと、
前記通話相手に対応する担当者の音声パラメータを蓄積する担当者DBと、
年齢、性別、感情に対応する音声パラメータを蓄積する音声DBと、
前記声紋認識手段の声紋認識及び前記感情認識手段の感情認識の分析結果を受け、前記担当者DBの音声パラメータと前記音声DBのパラメータの差分を算出し、当該差分を出力する音声分析手段と、
前記音声分析手段により抽出された前記差分を受け、当該差分に基に前記担当者の音声を変換し、前記通信手段に出力する音声変換手段と、
を有し、
前記通話相手と前記担当者間の通話状態において、前記感情認識手段が、前記通話相手の感情変化を検知し、前記音声分析手段が、前記音声DBの音声パラメータと前記担当者の音声パラメータとの差分を算出したとき、前記音声変換手段は、当該差分に基づき前記担当者の音声をリアルタイムで変換する
ことを特徴とする音声自動認識・音声変換システム。
前記音声自動認識・音声変換システムであって、
前記サービス提供システムがコールセンタからなり、当該コールセンタは、前記音声分析手段の分析結果を表示する表示手段を有する
ことを特徴とする音声自動認識・音声変換システム。
前記音声自動認識・音声変換システムであって、
前記音声自動認識・音声変換システムは、
更に、前記通話相手の入力音声から聞き直しに関連するキーワードを認識するキーワード認識手段を有し、
前記キーワード認識手段が前記キーワードを認識し、前記音声分析手段が、前記キーワードを検知したとき、前記音声変換手段は、前記キーワードに応じた各属性のパラメータ値を変更し、当該パラメータに従い、前記担当者の音声の音量、及び/又は速度を変換する
ことを特徴とする音声自動認識・音声変換システム。
本発明によれば、お客様(顧客)の感情に応じた担当者音声をリアルタイムで生成することができ、その結果として顧客のストレスを低減させることが可能な音声自動認識・音声変換システムを提供することができる。
本発明の音声自動認識・音声変換システムを利用したサービス提供装置(コールセンタ装置)に適用したときの全体構成を示す構成図である。 音声自動認識・音声変換システムの処理を説明するフローチャートである。 顧客とコールセンタ間の音声の流れ、及びコールセンタ側での概略処理例を示す図である。 音声自動認識・音声変換システムが感情変化を検知した場合のチューニングの例を示す図である。 音声自動認識・音声変換システムが聞き直しのキーワードを検知した場合のチューニングの例を示す図である。
以下、実施例を、図面を用いて説明する。
コンタクトセンタ又はコールセンタ受付システム(以下、コールセンタと言う)、電話対応の良し悪しが、対象の製品、サービス、会社自体の印象に大きく左右する。従って、お客様(以下、顧客と言う)に分かり易く、かつストレスを与えることがないような音声対応が要求される。
しかし、電話対応は、担当者により、ばらつきがあるのが現状である。電話対応が悪いだけで、製品、サービス、会社自体の印象も悪くなり、大きな損失を抱えるリスクある。
本実施例では、係るコールセンタにおける上述したリスクを軽減する例について説明する。
図1は、本発明の音声自動認識・音声変換システムをコールセンタ装置に適用したときの全体構成を示す構成図である。
コールセンタ100は、通信部(通信手段)110、表示部(表示手段)120、音声自動認識・音声変換システム130、を有する。
通信手段110は、顧客側の電話等の通信端末(通信手段)200との間で音声の送受信を行う。受信した顧客の音声(入力音声)は、表示手段120及び音声自動認識・音声変換システム130に供給する。
音声自動認識・音声変換システム130は、声紋認識部(声紋認識手段)1301、感情認識部(感情認識手段)1302、キーワード認識部(キーワード認識手段)1303、音声分析部(音声分析手段)1304、音声変換部(音声変換手段)1305、顧客DB1306、担当者DB1307、音声DB1308、を有する。
声紋認識手段1301は、通信手段110からの電話音声(入力音声)を受け、当該音声の声紋を認識する。この声紋認識から、年齢、性別、注意点(履歴がある場合)を判別する。
この声紋認識は、例えば、顧客DB1306に登録された声紋と照合して行う。顧客DB1306に登録されていない場合には、声紋認識手段1301において、入力音声の声紋から年齢、性別等を判定し、その結果を顧客DB1306に登録する。
感情認識手段1302は、入力音声の音色(声色)から、対象顧客の「喜怒哀楽」等の感情を判別する。
キーワード認識手段1303は、顧客の音声の中から、キーワードとなる音声、例えば聞き直しに関連する「声が小さい」などのキーワードを検出する。
音声分析手段1304は、声紋認識手段1301による年齢、性別を示すデータや感情認識手段1302による感情を示すデータを基に音声DB1308や担当者DB1307を検索する。
そして、当該音声DBから、顧客(相手)の聞き取り易い音声情報(音量、音声速度、音程、音質等の音声パラメータ)を抽出する。
また、音声分析手段1304は、当該担当者DB1307から、担当者の音声情報(音量、音声速度、音程、音質等の音声パラメータ)を抽出する。また、キーワード認識手段1303が、例えば顧客から「声が小さい」、「聞き取れない」等のキーワードを検知した場合、それに対応した音声情報(音量、音声速度等の音声パラメータ)を当該音声DB1308から、抽出する。
要するに音声分析手段1304は、対象顧客の状態、年齢、性別等に合わせ、顧客が聞き取り易い音量、音声速度、音程、音質に変換可能な音声情報(属性のパラメータ)を抽出し、その分析結果は、表示装置120に表示する。
音声変換手段1305は、担当者の音声(出力音声)を、音声分析手段1304による音声分析情報を基に顧客(相手)が聞き取り易い音声(音量、音声速度、音程、音質)に変換する。また、会話中で聞き直す仕草や「声が小さい」、「早口」などの会話内容から「音量を上げる」、「音声速度を遅くする」等の音声変換のチューニングをリアルタイムで実施する。
換言すれば、音声分析手段からの属性のパラメータ値に従い、顧客20の状態に応じた音声のチューニングを行う。この変換音声は、通信手段110を介して顧客側の通信手段200に送信する。
顧客DB1306は、顧客(お客様)の個人情報のほか、声紋、声紋から判別される年齢、性別等を示す情報を蓄積する。
担当者DB1307は、各担当者の音声パラメータ、担当者Aとして、例えば「音量:50、音声速度:70.音程20、音質:−40」等のパラメータ、担当者Bとして、「音量:30、音声速度:30.音程70、音質:+20」等のパラメータを蓄積する。
音声DB1308は、年齢、性別、感情に対応する音声パラメータ、例えば「年齢50才、性別:男性、感情:平常」の場合には、「音量:65、音声速度:45、音程:60、音質:+30」、「年齢20才、性別:女性、感情:怒」の場合には、「音量:45、音声速度:55、音程:40、音質:+10」等のように顧客にとって最良(聞くのに適している)と思われる音声となるようなパラメータの組合せを蓄積する。
図2は、本発明の音声自動認識・音声変換システムにおける処理フローを示す図である。
同図において、電話対応および音声変換、変更内容の更新などについて説明する。
まず、ステップS13001において、事前に音声変換元の担当者の音声パラメータを担当者DB1307に登録する。
次に、ステップS13002において、お客様(以下、顧客と言う)20側の通信手段200からの音声31をサービス提供事業者側100の通信手段110で受信する。
このとき、音声自動認識・音声変換システム100は、以下のステップによる処理を実行する。
声紋認識手段1301は、ステップS13003において、顧客20の音声31から、声紋、声色の情報を取得する。
また、声紋認識手段1301は、ステップS13004において、顧客DB1306の声紋を検索し、ステップS1305において、当該声紋に一致する声紋が顧客DB1306に登録済みか否かを判定する。つまり、顧客の音声31が顧客DB1306に登録されている既存ユーザか否かを判定する。
その判定結果、顧客DB1306に登録されていない場合(No)には、声紋認識手段1301は、ステップS13006において、当該声紋から年齢、性別を判定し、ステップS13007において、当該判定結果を顧客DB1306に登録する。
判定結果、声紋が顧客DB1306に登録されている場合(Yes)には、声紋認識手段1301は、ステップS13008において、顧客DB1306から個人(顧客)を特定し、年齢、性別、注意点等を抽出する。
次に、感情認識手段1302は、ステップS13009において、声色から顧客の感情、つまり「喜怒哀楽」を判定する。
音声分析手段1304は、ステップS13010において、年齢、性別、感情のデータを基に音声DB1308を検索し、次いでステップS13011において、当該音声DBから相手の年齢、性別、感情に応じた最適と思われる音声パラメータを抽出する。また、ステップS13012において、担当者DB1307から、担当者の音声パラメータ(音量、音声速度、音程、音質等の情報)を抽出する。
また、音声分析手段1304は、ステップS13013において、担当者10の音声パラメータと最適な音声パラメータとの差分を取り、当該差分(変更値)を抽出する。
音声変換手段1305は、ステップS13014において、音声分析手段1304から受取った属性のパラメータ値に従い担当者10の音声を変換する。
次に、通信手段110は、ステップS13015において、音声変換手段1305により変換した変換音声33を顧客20側の通信手段200に送信する。
また、ステップS13016において、顧客20の年齢、性別、感情、注意点(履歴がある場合)などの情報を表示手段120に表示する。
以上のステップを実行している状態において、感情認識手段1302は、ステップS13017において、顧客20との会話中から、顧客の感情変化を監視する。また、ステップS1308において、感情変化があるか否かを判定する。
その監視結果、感情認識がある場合(Yes)には、ステップS13019において、感情変化を検出し、注意すべき点を表示手段120に表示する。例えば、顧客20が平常状態から突然怒りだした怒り状態に変化した場合、その旨を示すメッセージを表示手段120に表示し、担当者10に対して顧客対応に注意を払うことように喚起する。
また、この場合には、感情認識手段1302は、ステップS13020において、年齢、性別、変化した感情を元に音声DB1308を再検索し、再度この感情変化状態における最適と思われる音声パラメータを抽出する。
また、音声分析手段1304は、ステップS13021において、担当者の音声パラメータと最適な音声パラメータとの差分を取り、当該差分(変更値)を抽出する。
また、音声変換手段1305は、ステップS13022において、音声分析手段1304から受取った属性のパラメータ値に従い、担当者10の音声を変換する。この変換音声33は、ステップS13023において、通信手段110を介して顧客20側の通信手段200に送信する。
また、音声分析手段1304は、この変更内容をステップS13024において、顧客DB1306に反映する。
ステップS13018において、感情変化がない場合には、次段のキーワード認識手段1303により、ステップS13025において、会話中のキーワードを監視する。また、ステップS13026において、聞き直すキーワードがあるか否かを判定する。
その判定の結果、聞き直すキーワードがある場合(Yes)には、キーワード認識手段1303は、ステップS13027において、聞き直すキーワードを検出し、注意すべき点、例えば、声が小さいならば、その旨を表示手段120に表示する。
また、音声分析手段1304は、ステップS13028において、キーワード認識手段1303により抽出したキーワードに応じた各属性のパラメータ値を変更する。
例えば、担当者10の声が小さい場合には、音量を上げる(+10)。また、早口である場合には、音声速度を下げる(−15)等のチューニングを行う。
また、音声変換手段1305は、ステップS13029において、音声分析手段1304から受取った属性のパラメータ値に従い、担当者10の音声を変換する。
この変換音声33は、ステップS13030において、通信手段110を介して顧客20側の通信手段200に送信する。
また、音声分析手段1304は、この変更内容をステップS13031において、顧客DB1306に反映する。
最後に、ステップS13032において、電話対応が終了したか否かを判定し、終了していない場合(No)には、ステップ13017に戻る。
電話対応が終了した場合(Yes)には、ステップS13033において、電話対応を終了、つまり電話を切る。次いで、ステップS13034において、顧客DB1306を更新し、履歴追加を行う。
図3〜図5は、お客様(顧客端末)と担当者(コールセンタ)との音声による通信(やり取り)の一例を模式的に示す図である。
まず、感情変化前の状態について図3を用いて説明する。図3は、サービス提供事業者側(コールセンタ)100がお客様に提供した運用管理ソフトウェアに関して問題があり、顧客からコールセンタに連絡が入ったことを想定したときの担当者による対応を摸式的に示す図である。
お客様から電話により、製品に関する問合せがあったとき、音声自動認識・音声変換システム130は、このときのお客様の音声、例えば「もしもし〜」等の音声の声紋が顧客DB1306に登録されている場合には、その情報を参照して認識する。またお客様の音声から感情認識も行う。
これらの認識結果は、例えばコールセンタ側の表示装置120のPCモニターに表示する。本例では、「X商事 YY様 契約:Jソフトウェア 年齢:50、性別:男性、感情:正常」を示している。このモニターは、コールセンタ側の担当者が見られるようにする。
次に、これらの情報を基に、つまり「X商事 YY様 契約:Jソフトウェア 年齢:50、性別:男性、感情:正常」に最適値であると思われる「音量:65、音声速度:45、音程:60:音質:30」のパラメータを音声DB1308から抽出する。また、担当者の担当者値である「担当者A 音量:50、音声速度:70、音程:20、音質:40」のパラメータを担当者DB1307から抽出する。
そして、これらのパレメータの差分を計算する。本例では、「音量:+15、音声速度:−25、音質:+40、音質+70」となる。この差分を基に担当者Aの音声を、顧客に対して適した音声となるように変換を行う。お客様とは、この音声変換された音声により、例えば「X商事のYYさんですね。いつもありがとうございます。Jソフトウェアのお問合せでしょうか?」等の音声により応対する。
次に、顧客の感情変化を検知した場合について図4を用いて説明する。図4は、感情認識が、例えば、入力音声の音量が通常より3%上がり、音程が通常より5%高くなった場合を想定した例である。
以上のような両者の会話において、お客様の音声から感情の変化、例えば「平常」から「怒り」が感じられた場合には、当該お客様の感情状態「怒り」に応じて、音声DB1308から、「音量:55、音声速度:35、音程:40:音質:+10」のパラメータを抽出し、担当者Aのパラメータとの差分「音量:+5、音声速度:−35、音程:+20:音質:+50」を計算する。そして、この差分を基に担当者Aの音声を、音声変換の再構築(チューニング)を行う。本例によれば、きめ細かな音声変換のチューニングも可能である。
なお、感情認識の判定方法としては、単純な判定方式を採用してもよい。
次に、聞き直し等の場合について図5を参照して説明する。
お客様が「聞き取れなかったので、もう1度お願いします。少しお声が小さいのですが。」等の音声の場合には、キーワード認識機能により、つまり「声が小さい」の音声を検出し、担当者Aの音量を、例えば「音量:+10」とする。
このときのお客様の感情変化やキーワード音声は、PCモニターに表示し、担当者Aが、その様子をPCモニターから察知できるようにする。
上述した実施例によれば、以下のような効果を期待することができる。
(1)
お客様(顧客)の年齢、性別、感情に応じた最適な音声(音量、音声速度、音程、音質)で会話することができ、電話対応の印象を向上させることができる(製品、サービス、会社自体の印象向上が期待できる)。また、ストレスのない電話対応により、電話対応のトラブル(クレーム)を低減させることができる。
(2)
全ての担当者が上記の対応が可能となり、担当者の対応ばらつきを是正することができる。
(3)
人の耳では判別できないようなお客様の感情変化を適確に検知することができ、音声変換のチューニングを施すと共に担当者への慎重な対応意識を上げることができる。
(4)
年配者ハンディキャップを有するお客様に対しても、担当者の音声を最適な音声に変換して聞かせることができるため、お客様にストレスを与えないサービスを提供することができる。
(5)
また、付随的効果として、声紋で個人を特定することが可能なため、当該個人に関する情報をモニターすることにより、例えばサポートサービスにおいて、契約確認が容易になると共にお客様側に契約確認の手間が軽減できる。例えば、担当者は、「○○社の××さんですね。いつもありがとうございます。△△製品のお問合せでしょうか?」等の応答ができ、お客様から「よく分かったね〜。契約確認が楽で助かるよ」等の返答が期待できる。
(6)
また、付随効果として、声紋で個人を特定することが可能なため、契約情報を不正に取得してサービスを利用する、所謂「なりすまし」を防止することができる。
なお、本発明は上記した実施例限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。
また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
本発明は、コールセンタに特定することなく、音声による顧客対応システムであれば適用可能である。
100 サービス提供システム(コールセンタ)
110 通信手段(コールセンタ側)
120 表示手段
130 音声自動認識・音声変換システム
1301 声紋認識手段
1302 感情認識手段
1303 キーワード認識手段
1304 音声分析手段
1305 音声変換手段
1306 顧客DB
1307 担当者DB
1308 音声DB
200 通信手段(顧客側)

Claims (3)

  1. 音声通信手段を介して通話相手と音声による会話を行うサービス提供システムに用いられる音声自動認識・音声変換システムであって、
    前記音声自動認識・音声変換システムは、
    前記通話相手の入力音声の声紋を認識する機能を有する声紋認識手段と、
    前記入力音声から前記通話相手の感情を認識する機能を有する感情認識手段と、
    前記通話相手の声紋、年齢、性別を示す顧客情報を蓄積する顧客DBと、
    前記通話相手に対応する担当者の音声パラメータを蓄積する担当者DBと、
    年齢、性別、感情に対応する音声パラメータを蓄積する音声DBと、
    前記声紋認識手段の声紋認識及び前記感情認識手段の感情認識の分析結果を受け、前記担当者DBの音声パラメータと前記音声DBのパラメータの差分を算出し、当該差分を出力する音声分析手段と、
    前記音声分析手段により抽出された前記差分を受け、当該差分に基に前記担当者の音声を変換し、前記通信手段に出力する音声変換手段と、
    を有し、
    前記通話相手と前記担当者間の通話状態において、前記感情認識手段が、前記通話相手の感情変化を検知し、前記音声分析手段が、前記音声DBの音声パラメータと前記担当者の音声パラメータとの差分を算出したとき、前記音声変換手段は、当該差分に基づき前記担当者の音声をリアルタイムで変換する
    ことを特徴とする音声自動認識・音声変換システム。
  2. 請求項1に記載の音声自動認識・音声変換システムであって、
    前記サービス提供システムがコールセンタからなり、当該コールセンタは、前記音声分析手段の分析結果を表示する表示手段を有する
    ことを特徴とする音声自動認識・音声変換システム。
  3. 請求項1又は請求項2に記載の音声自動認識・音声変換システムであって、
    前記音声自動認識・音声変換システムは、
    更に、前記通話相手の入力音声から聞き直しに関連するキーワードを認識するキーワード認識手段を有し、
    前記キーワード認識手段が前記キーワードを認識し、前記音声分析手段が、前記キーワードを検知したとき、前記音声変換手段は、前記キーワードに応じた各属性のパラメータ値を変更し、当該パラメータに従い、前記担当者の音声の音量、及び/又は速度を変換する
    ことを特徴とする音声自動認識・音声変換システム。

JP2012245779A 2012-11-07 2012-11-07 音声自動認識・音声変換システム Active JP6073649B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012245779A JP6073649B2 (ja) 2012-11-07 2012-11-07 音声自動認識・音声変換システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012245779A JP6073649B2 (ja) 2012-11-07 2012-11-07 音声自動認識・音声変換システム

Publications (2)

Publication Number Publication Date
JP2014095753A JP2014095753A (ja) 2014-05-22
JP6073649B2 true JP6073649B2 (ja) 2017-02-01

Family

ID=50938874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012245779A Active JP6073649B2 (ja) 2012-11-07 2012-11-07 音声自動認識・音声変換システム

Country Status (1)

Country Link
JP (1) JP6073649B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11170763B2 (en) 2018-05-31 2021-11-09 Toyota Jidosha Kabushiki Kaisha Voice interaction system, its processing method, and program therefor

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015184563A (ja) * 2014-03-25 2015-10-22 シャープ株式会社 対話型家電システム、サーバ装置、対話型家電機器、家電システムが対話を行なうための方法、当該方法をコンピュータに実現させるためのプログラム
JP6149230B2 (ja) * 2014-03-28 2017-06-21 学校法人塚本学院 脳機能障害者生活支援装置
CN104102627B (zh) * 2014-07-11 2016-10-26 合肥工业大学 一种多模态的非接触情感分析记录***
JP2016189158A (ja) 2015-03-30 2016-11-04 富士フイルム株式会社 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP6798484B2 (ja) * 2015-05-07 2020-12-09 ソニー株式会社 情報処理システム、制御方法、およびプログラム
JP7151181B2 (ja) 2018-05-31 2022-10-12 トヨタ自動車株式会社 音声対話システム、その処理方法及びプログラム
WO2020204948A1 (en) * 2019-04-05 2020-10-08 Futurewei Technologies, Inc. Methods and systems that provide emotion modifications during video chats
JPWO2022208711A1 (ja) * 2021-03-31 2022-10-06

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3936351B2 (ja) * 1995-01-11 2007-06-27 富士通株式会社 音声応答サービス装置
JP2004252085A (ja) * 2003-02-19 2004-09-09 Fujitsu Ltd 音声変換システム及び音声変換プログラム
JP2004280158A (ja) * 2003-03-12 2004-10-07 Fujitsu Ltd オペレータ支援方法
JP4559335B2 (ja) * 2005-09-30 2010-10-06 株式会社みずほ銀行 音声ガイドシステム及び音声ガイド方法
JP5189354B2 (ja) * 2007-12-28 2013-04-24 株式会社富士通エフサス オペレータ受付監視・切替システム
JP4438014B1 (ja) * 2008-11-06 2010-03-24 株式会社ネイクス 有害顧客検知システム、その方法及び有害顧客検知プログラム
JP5169918B2 (ja) * 2009-03-06 2013-03-27 富士通モバイルコミュニケーションズ株式会社 話速変換装置
JP5326711B2 (ja) * 2009-03-19 2013-10-30 富士通株式会社 督促支援システム、その方法、及びプログラム
JP2011009902A (ja) * 2009-06-24 2011-01-13 Seiko Epson Corp 顧客対応装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11170763B2 (en) 2018-05-31 2021-11-09 Toyota Jidosha Kabushiki Kaisha Voice interaction system, its processing method, and program therefor

Also Published As

Publication number Publication date
JP2014095753A (ja) 2014-05-22

Similar Documents

Publication Publication Date Title
JP6073649B2 (ja) 音声自動認識・音声変換システム
US7665024B1 (en) Methods and apparatus for controlling a user interface based on the emotional state of a user
US8326624B2 (en) Detecting and communicating biometrics of recorded voice during transcription process
JP5532598B2 (ja) オペレータ管理システム、その方法、及びプログラム
JP6341092B2 (ja) 表現分類装置、表現分類方法、不満検出装置及び不満検出方法
CN107818798A (zh) 客服服务质量评价方法、装置、设备及存储介质
CN107454536B (zh) 用于自动化地确定助听设备的参数值的方法
US20150149169A1 (en) Method and apparatus for providing mobile multimodal speech hearing aid
US11115539B2 (en) Smart voice system, method of adjusting output voice and computer readable memory medium
JP5864285B2 (ja) 電話応対業務支援システムおよびその方法
US6738457B1 (en) Voice processing system
US10789954B2 (en) Transcription presentation
TWI624183B (zh) 電話語音處理之方法及其電腦程式
JPWO2015083741A1 (ja) 中継装置、表示装置および通信システム
CN111212189A (zh) 一种基于手机端的智能外呼***
US11783837B2 (en) Transcription generation technique selection
JP6842227B1 (ja) グループ通話システム、グループ通話方法及びプログラム
CN115118820A (zh) 一种通话处理方法、装置、计算机设备及存储介质
US20190372824A1 (en) Changing a communication session
CN111179943A (zh) 一种对话辅助设备及获取信息的方法
JP2013207508A (ja) 自動音声応答装置
WO2014019952A1 (en) Self awareness assistant
JP7334467B2 (ja) 対応支援装置および対応支援方法
US11445056B1 (en) Telephone system for the hearing impaired
US20220172231A1 (en) Speech analysis models as a service

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170105

R150 Certificate of patent or registration of utility model

Ref document number: 6073649

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250