JP6963497B2 - 音声認識システム、通話評価設定方法 - Google Patents

音声認識システム、通話評価設定方法 Download PDF

Info

Publication number
JP6963497B2
JP6963497B2 JP2017250873A JP2017250873A JP6963497B2 JP 6963497 B2 JP6963497 B2 JP 6963497B2 JP 2017250873 A JP2017250873 A JP 2017250873A JP 2017250873 A JP2017250873 A JP 2017250873A JP 6963497 B2 JP6963497 B2 JP 6963497B2
Authority
JP
Japan
Prior art keywords
call
customer
evaluation
result
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017250873A
Other languages
English (en)
Other versions
JP2019118015A (ja
Inventor
由子 金築
隆司 杉山
輝美 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Information and Telecommunication Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information and Telecommunication Engineering Ltd filed Critical Hitachi Information and Telecommunication Engineering Ltd
Priority to JP2017250873A priority Critical patent/JP6963497B2/ja
Priority to US16/181,388 priority patent/US10924611B2/en
Publication of JP2019118015A publication Critical patent/JP2019118015A/ja
Application granted granted Critical
Publication of JP6963497B2 publication Critical patent/JP6963497B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5175Call or contact centers supervision arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Psychiatry (AREA)
  • Hospice & Palliative Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Child & Adolescent Psychology (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、音声認識システム、通話評価設定方法に関する。
従来から、コールセンタにおいて、顧客とオペレータとの間の通話を評価する技術が存在する。例えば、特許文献1では、オペレータと顧客の通話を録音した通話録音ファイルに基づく音声分析テキストと、モニタリングチェック項目の評価基準とを比較し、オペレータを評価している。
特開2017−135642号公報
顧客とオペレータとの間の通話をシステムが認識した結果には、通常、通話を録音してテキスト化したテキスト情報、通話音量等の非言語情報、あらかじめシステム側で定められた評価基準にしたがって通話を評価した通話評価情報が含まれる。管理者は、これらの情報を元に、顧客やオペレータの通話を評価する。したがって、システム側で定められた評価基準に照らし合わせて評価されるため、通話者が通常の会話でも声が大きい顧客の場合、当該顧客が感情的であるなどとして、平均的な声の大きさの顧客より評価が下がる場合がある。
また、同じ顧客であっても通話の内容や環境、場面によって声の大きさが異なるため、管理者がシステム側で定められた評価基準を示す評価値を手動で修正することがある。この場合、当該顧客との間で通話が行われる都度修正が必要となるため、手間や時間がかかってしまう。このような点は、顧客の場合だけでなくオペレータについても同様のことがいえる。
特許文献1では、オペレータと顧客との間で行われた通話を所定の基準で評価しているが、基準を修正する場合は手動で行う必要があり、その修正に手間や時間がかかるという問題があった。
本発明は、手間や時間をかけることなく、オペレータと顧客との間で行われる通話の評価基準を設定することが可能な音声認識システム、通話評価設定方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明にかかる音声認識システムは、顧客とオペレータとの間で行われる通話を録音する通話録音部と、前記通話録音部により録音された通話および当該通話における通話者の特徴を示す非言語情報の値を認識し、認識した結果を記憶部に蓄積する音声認識部と、前記認識した結果に含まれる前記非言語情報の値に基づいて、通話者を評価するための基準値を設定する音声認識結果管理部と、を備えることを特徴とする音声認識システムとして構成される。
また、本発明は、上記音声認識システムで実行される通話評価設定方法としても把握される。
本発明によれば、手間や時間をかけることなく、オペレータと顧客との間で行われる通話の評価基準を設定することができる。
コールセンタの構成例を示す図である。 共通評価値テーブルの例を示す図である。 顧客別評価値テーブルの例を示す図である。 オペレータ別評価値テーブルの例を示す図である。 通話評価結果テーブルの例を示す図である。 通話情報テーブルの例を示す図である。 録音情報テーブルの例を示す図である。 認識結果情報テーブルの例を示す図である。 管理者端末の表示装置に表示される評価画面の例を示す図である(認識結果画面)。 管理者端末の表示装置に表示される評価画面の例を示す図である(通話評価画面)。 図3に示した顧客別評価値テーブルの作成手順を示すフローチャートである。 図11に示した顧客別評価値テーブルの作成手順におけるステップS1104の処理手順を示すフローチャートである。 通話時に用いる評価値テーブルを選択し、通話を評価する処理の処理手順を示すフローチャートである。
以下に添付図面を参照して、本発明にかかる音声認識システム、通話評価設定方法の実施の形態を詳細に説明する。
図1は、本実施の形態における音声認識システムが用いられるコールセンタの構成例を示す図である。図1に示すように、コールセンタ1000は、IP−PBX(Internet Protocol−Private Branch eXchange、IP回線対応構内交換機)装置100と、CTI(Computer Telephony Integration)サーバ200と、オペレータ端末300と、管理者端末400と、通話音声処理システム500とを有して構成されている。顧客の通話端末TとIP−PBX装置100との間は公衆網N1により接続され、IP−PBX装置100、CTIサーバ200、オペレータ端末300、管理者端末400、通話音声処理システム500は、コールセンタ1000の構内のIP回線網N2により接続されている。
IP−PBX装置100は、顧客の通話端末Tからの呼を受けて、IP網と公衆網N1のプロトコル変換、発着信の呼制御などの処理を行う装置である。
CTIサーバ200は、オペレータ端末300への呼制御を行う装置である。CTIサーバ200は、コールセンタ1000全体を管理し、IP−PBX装置100から受取った呼をオペレータ端末300や管理者端末400に送信したり、呼状態が接続中(通話中)になると、必要な指示を通話音声処理システム500に与えるなどの処理を実行する。
オペレータ端末300は、コールセンタ1000のオペレータが操作する端末であり、例えば、通話機能を有したコンピュータから構成される。オペレータ端末300は、CTIサーバ200からの指示に従って、IP−PBX装置100から受け取った呼に対して応答し、オペレータが顧客の通話端末Tと公衆網11を介した外線による通話を行う。
管理者端末400は、コールセンタ1000の管理者が操作する端末であり、例えば、通話の再生機能を有したコンピュータから構成される。管理者端末400は、オペレータ端末300の稼働状況やオペレータの作業状況を監視したり、通話音声処理システム500に対して通話を評価するための評価要求や録音ファイルの取得要求を行い、通話の評価や録音された通話を取得して再生することができる。管理者端末400の動作や画面例については後述する。
通話音声処理システム500は、顧客とオペレータとの間の通話を録音および認識し、録音結果および認識結果を管理するシステムである。
図1に示すように、通話音声処理システム500は、通話録音情報管理装置501と、通話録音装置502と、音声認識制御装置503と、音声認識装置504と、音声認識結果管理装置505とを有して構成されている。
通話録音情報管理装置501は、顧客の通話端末Tから発せられた発番号やオペレータ端末300から発せられた内線番号等のCTI情報や、当該発番号の顧客端末Tや当該オペレータ端末300から発せられた内線番号から発せられ、通話録音装置502によりミラーリングされた通話音声を含む録音情報を蓄積する。また、通話録音情報管理装置501は、上記録音情報を通話録音装置502から受け取ると、その旨を音声認識制御装置503に通知する。
通話録音装置502は、上記通話音声をミラーリングし、ミラーリングした通話音声を録音する。また、通話録音装置502は、当該通話音声を含む録音情報を通話録音情報管理装置501および音声認識装置504に出力する。
音声認識制御装置503は、通話録音情報管理装置501から、上記録音情報を通話録音装置502から受け取った旨の通知を受けると、音声認識装置504に対して、上記通話音声を認識するための認識処理を実行する指示をする。
音声認識装置504は、上記認識処理を実行する音声認識エンジンを有し、当該処理の結果として得られた認識結果と、通話録音装置502から受け取った上記録音情報に含まれるCTI情報や通話音声を音声認識結果管理装置505に出力する。
音声認識結果管理装置505は、上記認識結果を管理する装置であり、本システムで使用する各種データを蓄積するデータベース5051を有している。データベース5051には、共通評価値テーブル5052と、顧客別評価値テーブル5053と、オペレータ別評価値テーブル5054と、通話評価結果テーブル5055と、通話情報テーブル5056と、録音情報テーブル5057と、認識結果情報テーブル5058とが蓄積される。また、音声認識結果管理装置505は、管理者端末400からの要求などに従って、上記認識結果や通話評価の結果、評価値設定画面を出力する。データベース5051に蓄積されるデータや上記認識結果、通話評価の結果、評価値設定画面については後述するが、認識結果には、通話を録音してテキスト化したテキスト情報、通話音量や話速等の通話者の特徴を示す非言語情報が含まれる。また、評価値は、通話者を評価するための基準となる項目の値である。
通話音声処理システム500を構成する上記の各装置は、ハードウェアとしては、一般的なコンピュータにより構成される。本実施例では、通話録音情報管理装置501と、通話録音装置502と、音声認識制御装置503と、音声認識装置504と、音声認識結果管理装置505とが、それぞれ別の装置である前提で説明しているが、利用環境に応じて、これらを1または複数の装置により実現することとしてもよい。
図2は、共通評価値テーブル5052の例を示す図である。共通評価値テーブル5052は、通話音声処理システム500に共通の評価基準としてシステム側であらかじめ設定された評価値を記憶するテーブルである。図2に示すように、共通評価値テーブル5052には、あらかじめ、通話者と、通話者の評価値とが対応付けて記憶されている。
図2では、例えば、通話時の顧客やオペレータの音量の大きさが50であり、話速の速さが50であれば、標準的な顧客やオペレータであると評価されることを示している。したがって、これらの値に対して一定の閾値以上乖離している場合、システム側の判断により評価が下がることとなる。
図3は、顧客別評価値テーブル5053の例を示す図である。顧客別評価値テーブル5053は、顧客の特徴に基づいて設定した顧客別の評価基準である評価値を記憶するテーブルである。図3に示すように、顧客別評価値テーブル5053には、通話者である顧客の発番号と、当該顧客の評価値とが対応付けて記憶されている。
図3では、例えば、発番号が「090−3333−4444」の顧客の通話時における音量の大きさは50であり、話速の速さは50であることを示している。また、発番号が「090−1111−2222」の顧客の通話時における音量の大きさは、発番号が「090−3333−4444」の顧客よりも大きい60であり、話速の速さは、発番号が「090−3333−4444」の顧客と同じ50であることを示している。
図4は、オペレータ別評価値テーブル5054の例を示す図である。オペレータ別評価値テーブル5054は、オペレータの特徴に基づいて設定したオペレータ別の評価基準である評価値を記憶するテーブルである。図4に示すように、オペレータ別評価値テーブル5054には、通話者であるオペレータを識別するためのオペレータIDと、当該オペレータの評価値とが対応付けて記憶されている。
図4では、例えば、オペレータIDが「オペレータA」で識別されるオペレータの通話時における音量の大きさは50であり、話速の速さは50であることを示している。また、オペレータIDが「オペレータB」で識別されるオペレータの通話時における音量の大きさは、オペレータIDが「オペレータA」のオペレータと同じ50であり、話速の速さは、オペレータIDが「オペレータA」のオペレータよりも速い55であることを示している。
図3および図4では、通話者の特徴に基づく評価値の例として、通話者の音量および話速を例示しているが、例えば、発話時間や無音時間、会話かぶりの有無、キーワードの有無等、通話を評価するための他の項目を評価値として設定してもよい。
図5は、通話評価結果テーブル5055の例を示す図である。通話評価結果テーブル5055は、顧客とオペレータとの間で行われた通話ごとに、上記評価値に基づく評価結果を記憶するテーブルである。図5に示すように、通話評価結果テーブル5055には、通話を識別するための通話IDと、当該通話における顧客の発番号と、当該顧客の評価結果と、当該顧客を評価するにあたり用いられたテーブルを識別するための顧客別評価フラグとが対応付けて記憶されている。
図5では、例えば、通話IDが「1」で識別される通話は、発番号が「090−3333−4444」の顧客との間で行われた通話であり、当該顧客の音量および話速の評価は、いずれも良好であることを示す「Good」であったことを示している。また、当該通話の評価は、図3に示した顧客別評価値テーブル5053を用いて行われたことを示している。また、通話IDが「2」で識別される通話は、発番号が「090−1111−2222」の顧客との間で行われた通話であり、当該顧客の話速の評価は「Good」であるものの、音量についての評価は良好でないことを示す「Bad」であったことを示している。また、当該通話の評価は、図2に示した共通評価値テーブル5052を用いて行われたことを示している。
なお、図5では、顧客についての通話評価結果を記憶する場合について例示したが、オペレータについての通話評価結果を記憶する場合も同様に考えることができる。この場合、図5における発番号を内線番号に読み替えるとともに、顧客別評価フラグをオペレータ別評価フラグには図4に示したオペレータ別評価値テーブル5054を用いたことを示すフラグを設定すればよい。
図6は、通話情報テーブル5056の例を示す図である。通話情報テーブル5056は、顧客とオペレータとの間で行われた通話ごとに、当該通話の発着信等のCTI情報を記憶するテーブルである。図6に示すように、通話情報テーブル5056には、通話を識別するための通話IDと、当該通話の開始日時および終了日時と、当該通話における顧客の発番号と、当該通話におけるオペレータの内線番号と、当該内線番号に対する通話を担当するオペレータとが対応付けて記憶されている。
図6では、例えば、通話IDが「1」で識別される通話は、11月1日の10時00分01秒に開始され、11月1日の10時00分01秒に終了したことを示している。また、当該通話の発番号は「090−3333−4444」の顧客と内線番号「1001」を担当するオペレータBとの間で行われた通話であることを示している。
図7は、録音情報テーブル5057の例を示す図である。録音情報テーブル5057は、顧客とオペレータとの間で行われた通話ごとに、当該通話が録音されたときの通話音声を記憶するテーブルである。図7に示すように、録音情報テーブル5057には、通話の開始日時および終了日時と、通話を識別するための通話IDと、録音された当該通話における通話音声の保管場所を示す録音ファイルパスとが対応付けて記憶されている。
図7では、例えば、11月1日の10時00分01秒に開始され、11月1日の10時00分01秒に終了した通話は、通話IDが「1」で識別される通話であり、当該通話の録音データは、「E:¥Voice¥xxx1.waw」に記憶されていることを示している。
図8は、認識結果情報テーブル5058の例を示す図である。認識結果情報テーブル5058は、現在までの顧客とオペレータとの間で行われた通話ごとに、当該通話において音声認識装置504により認識された結果を蓄積して記憶するテーブルである。図8に示すように、認識結果情報テーブル5058には、通話に含まれる単語を発話したタイミングを示す単語列開始日時と、当該通話を識別するための通話IDと、当該通話の通話者と、当該通話者が発話した単語と、当該単語を発話したときの音量と、当該単語を発話したときの話速とが対応付けて記憶されている。
図8では、例えば、11月1日の10時00分01秒に開始された通話IDが「1」で識別される通話では、まず、オペレータBが「お電話ありがとうございます。」と発話し、その音量が52、話速が50であったことを示している。また、その後、顧客1が「質問があります。」と発話し、そのときの実際の音量が52、話速が49であったことを示している。続いて、管理者端末400の動作や画面例について説明する。
上述のとおり、管理者端末400は、ハードウェアとしては一般的なコンピュータから構成され、キーボードやマウスといった入力装置や、LCD(Liquid Crystal Display)等の表示装置が接続されている。
図9、10は、管理者端末400の表示装置に表示される評価画面の例を示す図である。評価画面には、音声認識装置400により認識された結果を表示する認識結果画面(図9)と、認識された通話が評価される通話評価画面(図10)とが含まれる。これらの画面は、管理者によって入力装置を介してタブがクリックされることにより、表示が切りかえられる。これらの画面は、音声認識結果管理装置505が、当該管理者端末400の表示装置に表示する。
図9は、認識結果画面の例を示す図である。図9に示すように、認識結果画面には、オペレータと顧客との間で行われた通話がテキスト表示された通話表示領域901と、当該通話の話速を変更する話速変更領域902とが表示される。通話表示領域901に表示されるテキストは、音声認識装置504によって認識され、認識結果情報テーブル5058に記憶された結果を時系列に表示した情報である。音声認識結果管理装置505は、例えば、管理者端末400から受け取った要求などに従って、認識結果情報テーブル5058を読み出し、該当する通話の認識結果を管理者端末400に送信する。上記要求には、通話を評価するための通話IDや通話者、通話開始日時、通話終了日時等、認識結果情報テーブル5058の各項目が含まれる。
また、話速変更領域902には、当該通話の話速を変更するためのカーソルキー(矢印キー)が表示され、管理者が入力装置を操作してカーソルキーをクリック等すると、音声認識結果管理装置505は、当該操作にしたがって、録音された通話音声の再生速度を遅くしたり、速くする。図9では、図8に示した認識結果情報テーブル5058に記憶されているオペレータBと顧客1との間の通話が表示されていることを示している。
図10は、通話評価画面の例を示す図である。図10に示すように、通話評価画面には、顧客の発番号ごとにシステムが通話を評価した結果を示す通話評価結果領域1001と、過去の当該顧客の発番号における評価値の統計値を示す過去通話参考値領域1002と、通話評価結果領域1001と過去通話参考値領域1002とを参照して今回の通話の評価値を設定する評価値設定領域1003とが表示される。
通話評価結果領域1001には、認識結果情報テーブル5058に記憶されているデータのうち、図9に示した認識結果画面に表示されている通話の通話IDに対応する発番号と、当該発番号に対応する評価結果とが表示される。図10では、発番号が「090−3333−4444」である顧客に対するこれまでの評価結果は、音量については「Good」(良好)、話速については「Fair」(適正)であったことを示している。
これらの評価結果は、音声認識結果管理装置505が、図8に示した認識結果情報テーブル5058に記憶されている通話の通話IDに対応する音量および話速と、図3に示した顧客別評価値テーブル5053に記憶されているデータのうち当該通話IDに対応する発番号の評価値として記憶されている音量および話速、または図2に示した共通評価値テーブル5052に記憶されているデータのうちの顧客の評価値として記憶されている音量および話速を読み出し、両者の乖離度が一定の閾値以上であるか否かを判定することにより得ることができ、その結果が図5に示した通話評価結果テーブル5055に記憶される。
例えば、音声認識結果管理装置505は、図8に示した認識結果情報テーブル5058に蓄積されているレコードの中から発番号が「090−3333−4444」である通話における顧客の音量および話速を読み出し、読み出した音量および話速が、図2に示した共通評価値テーブル5052に記憶された音量及び話速、または図3に示した顧客別評価値テーブル5053に記憶された音量および話速と比べて一定の閾値以上乖離しているか否かを判定し、一定の閾値以上乖離していると判定した場合には「Bad(良好でない)」と評価したり、一定の閾値以上乖離していないと判定した場合には「Good(良好である)」と評価する。さらに、音声認識結果管理装置505は、一定の閾値との乖離度が所定の数値未満である(すなわち、閾値近傍である)と判定した場合には、「Fair(適正である)」と評価し、これらの結果を図5に示した通話評価結果テーブル5055に記憶する。
また、過去通話参考値領域1002には、通話評価結果領域1001に表示されている発番号に対応する通話IDにより識別される認識結果を、図8に示した認識結果情報テーブル5058の中から特定し、特定した認識結果に対応付けられている音量および話速の統計値が表示されている。図10では、○月○日〜○月○日までに「090−3333−4444」を発番号とする通話の認識結果がn件あり、それらの通話における音量および話速の統計値は、それぞれ50および60であったことを示している。
これらの参考値は、例えば、次のように算出される。音声認識結果管理装置505が、通話評価結果領域1001に表示されている発番号(例えば、発番号「090−3333−4444」)をキーにして図6に示した通話情報テーブル5056にアクセスし、当該発番号に対応する通話IDを特定する。さらに、音声認識結果管理装置505は、特定した通話IDをキーにして図8に示した認識結果情報テーブル5058にアクセスし、当該通話IDに対応する音量および話速を読み取る。音声認識結果管理装置505は、読み取った音量および話速についてそれぞれの統計値(例えば、平均値)を算出する。
また、評価値設定領域1003には、通話評価結果領域1001に表示されている発番号の通話における音量および話速の評価値が表示される。当該評価値の設定は、音声認識結果管理装置505が、通話評価結果領域1001に表示されている評価結果および過去通話参考値領域1002に表示されている音量や話速の統計値を参照し、これらの値を比較するなどして設定する。過去通話参考値領域1002に表示されている音量や話速の統計値が、それぞれ50および60であり、通話評価結果領域1001に表示されている音量および話速の評価結果が、それぞれ「Good(良好である)」および「Fair(適正である)」である場合には、音声認識結果管理装置505は、音量が50のときには「Good(良好である)」と学習し、話速が60のときには「Fair(適正である)」と学習する。
上記学習により、どのような評価値を設定すればどのような評価結果が得られるのかを判断することができる。したがって、音声認識結果管理装置505は、当該学習により、「Good(良好である)」との評価が得られる値(例えば、音量であれが「60」)を、図3に示した顧客別評価値テーブル5053に設定すべき評価値と判断し、当該テーブルの評価値とする。図10では、評価対象とされた今回の通話における音量および話速は、通話評価結果領域1001に表示されている評価結果や過去通話参考値領域1002に表示されている音量や話速の統計値を学習した結果、それぞれ50および60として設定されたことがわかる。
なお、図10では、顧客についての通話評価画面を例示したが、オペレータの通話評価画面についても同様に考えることができる。この場合、CTI情報として表示される発番号にかえて内線番号が表示され、オペレータについての通話評価の結果や過去通話の参考値や評価値が表示される。
図11は、図3に示した顧客別評価値テーブル5053の作成手順を示すフローチャートである。図11に示すように、音声認識結果管理装置505は、まず、確認対象期間の評価結果を抽出する(ステップS1101)。確認対象期間は、顧客の評価対象となる期間のことである。例えば、ある発番号について、2017年11月1日10時00分00秒〜2017年11月10日09時59分59秒というような期間を定め、当該期間の日時をキーにして図8に示した認識結果情報テーブル5058にアクセスし、当該期間内の単語列開始日時を含むレコードを抽出する。
そして、抽出したレコードに含まれる通話IDをキーにして図5に示した通話評価結果テーブル5055にアクセスし、当該通話IDに対応する顧客別評価フラグが「0」であるか否かを判定する(ステップS1102)。
音声認識結果管理装置505は、当該通話IDに対応する顧客別評価フラグが「0」でないと判定した場合(ステップS1102;No)、ステップS1106に進み、当該通話IDに対応する顧客別評価フラグが「0」であると判定した場合(ステップS1102;Yes)、顧客別評価フラグが「0」である当該レコードを抽出する(ステップS1103)。
音声認識結果管理装置505は、抽出した顧客別評価フラグが「0」であるレコードの通話IDをキーにして図8に示した認識結果情報テーブル5058にアクセスし、当該通話IDの通話時に認識された音量および話速を読み取り、当該通話IDにおける過去の音量および話速の統計値である過去通話参考値を算出する(ステップS1104)。過去通話参考値の算出方法については、図12を用いて後述する。
音声認識結果管理装置505は、過去通話参考値として算出した音量および話速の値を、当該通話IDにより識別される通話の発番号の音量および話速の値を、図3に示した顧客別評価値テーブル5053の評価値として記憶する(ステップS1105)。音声認識結果管理装置505は、同じ発番号について図8に示した認識結果情報テーブル5058にレコードがあるか否かを判定し(ステップS1106)、レコードがあると判定した場合(ステップS1106;Yes)、ステップS1102に戻り、対象となるレコードがなくなるまで処理を続ける。一方、音声認識結果管理装置505は、レコードがないと判定した場合(ステップS1106;No)、処理を終了させる。
図12は、図11に示した顧客別評価値テーブル5053の作成手順におけるステップS1104の処理手順を示すフローチャートである。
図12に示すように、音声認識結果管理装置505は、あらかじめシステムにより定義されている過去通話の参考期間を取得する(ステップS1201)。当該参考期間としては、例えば、2017年11月1日10時00分00秒〜2017年11月10日09時59分59秒というように、過去の通話のうち、過去通話参考値として用いる対象となる通話の期間が定められている。
音声認識結果管理装置505は、上記参考期間をキーにして図8に示した認識結果情報テーブル5058にアクセスし、当該期間内に評価対象とされた通話の発番号に対応する通話IDを含むレコードを抽出する(ステップS1202)。音声認識結果管理装置505は、当該期間内のレコードが1件以上存在するか否かを判定し(ステップS1203)、当該期間内のレコードが1件以上存在しないと判定した場合(ステップS1203;No)、ステップS1204に進む。
一方、音声認識結果管理装置505は、当該期間内のレコードが1件以上存在すると判定した場合(ステップS1203;Yes)、抽出したレコードにおける音量および話速のそれぞれについての平均値を算出する(ステップS1204)。音声認識結果管理装置505は、算出した音量および話速のそれぞれについての平均値を、図10に示した通話評価画面の過去通話参考値領域1002に表示する(ステップS1205)。なお、図12に示した処理では、音量および話速の統計値として平均値を算出しているが、中央値や最頻値等の他の統計値を算出してもよい。
なお、図12では、顧客別評価値テーブル5053の作成手順におけるステップS1104の処理手順を例示したが、オペレータ別評価値テーブル5054の場合についても同様に考えることができる。この場合、ステップS1202において抽出するレコードを評価対象とされた通話の内線番号に対応する通話IDを含むレコードとすればよい。
図13は、通話時に用いる評価値テーブルを選択し、通話を評価する処理の処理手順を示すフローチャートである。図13に示すように、音声認識結果管理装置505は、音声認識装置400が認識した認識結果を図8に示した認識結果情報テーブル5058の中から取得し(ステップS1301)、認識結果に含まれる通話IDに対応する発番号と、図3に示した顧客別評価値テーブル5053に記憶されている発番号とを比較し、一致する発番号があるか否かを判定する(ステップS1302)。
音声認識結果管理装置505は、上記一致する発番号がないと判定した場合(ステップS1302;No)、図2に示した共通評価値テーブル5052に記憶されている評価値のうち、顧客用の評価値を読み出して評価を実行する(ステップS1303)。一方、音声認識結果管理装置505は、上記一致する発番号があると判定した場合(ステップS1302;Yes)、図3に示した顧客別評価値テーブル5053に記憶されている評価値を読み出して評価を実行する(ステップS1304)。ステップS1303およびステップS1304における評価では、システムが設定することを前提に説明したが、管理者が管理者端末400の入力装置から手動で設定してもよい。
音声認識結果管理装置505は、ステップS1302またはステップS1303で行われた評価の結果を、図5に示した通話評価結果テーブル5055に記憶するとともに、図10に示した通話評価画面を管理者端末400の表示装置に表示する(ステップS1305)。
なお、図12では、顧客別評価値テーブル5053を用いた場合について説明したが、オペレータ別評価値テーブル5054を用いた場合も同様に考えることができる。この場合、ステップS1304において、図4に示したオペレータ別評価値テーブル5054に記憶されている評価値を読み出して評価を実行すればよい。
このように、本実施例では、上述した処理を行うので、手間や時間をかけることなく、オペレータと顧客との間で行われる通話の評価基準を設定することができる。すなわち、本システムでは、システム側で定義した通話評価の評価値に加えて、顧客・オペレータ別に管理者が定義した評価値を使用して通話を評価し、定義後の通話評価の修正を不要とした。従来の音声認識システムでは、システムで一律に定義した評価値でしか通話を評価できないため、顧客やオペレータの特徴には対応できず、評価が下がったり、偏ったりする場合があり、同じ顧客・オペレータの通話評価の修正に、毎回手動で修正しなければならず時間がかかっていたが、このような手間や時間を削減することができる。また、本システムでは、システム側で定義する共通の評価値に加え、顧客やオペレータごとの特徴に合わせて評価値を定義しているため、より通話者の通話状況や通話環境に近い状態で評価することができる。
1000 コールセンタ
100 IP−PBX装置
200 CTIサーバ
300 オペレータ端末
400 管理者端末
500 通話音声処理システム
501 通話録音情報管理装置
502 通話録音装置
503 音声認識制御装置
504 音声認識装置
505 音声認識結果管理装置
5051 データベース
5052 共通評価値テーブル
5053 顧客別評価値テーブル
5054 オペレータ別評価値テーブル
5055 通話評価結果テーブル
5056 通話情報テーブル
5057 録音情報テーブル
5058 認識結果情報テーブル

Claims (5)

  1. 顧客とオペレータとの間で行われる通話を録音する通話録音部と、
    前記通話録音部により録音された通話および当該通話における通話者の特徴を示す非言語情報の値を認識し、認識した結果を記憶部に蓄積する音声認識部と、
    前記認識した結果に含まれる前記非言語情報の値に基づいて、通話者を評価するための基準値を設定する音声認識結果管理部と、を有し、
    前記音声認識部は、前記通話録音部によって録音された通話と、前記音声認識部によって認識された前記非言語情報の値とを含む前記認識した結果を認識結果情報テーブルに蓄積し、
    前記音声認識結果管理部は、前記認識結果情報テーブルから前記認識した結果を取得し、当該認識した結果に含まれる発番号が、顧客別評価値テーブルに記憶されている発番号と一致するか否かを判定し、当該認識した結果に含まれる発番号が、顧客別評価値テーブルに一致する発番号がないと判定した場合、共通評価値テーブルに記憶されている前記基準値の中から顧客用の前記基準値を読み取り、評価を行う第1の処理と、当該認識した結果に含まれる発番号が、顧客別評価値テーブルに一致する発番号があると判定した場合、顧客別評価値テーブルに記憶されている前記基準値を読み取り、評価を行う第2の処理と、を実行し、前記第1の処理または前記第2の処理で行われた評価の結果を、顧客ごとの通話評価結果テーブルに記憶する、
    ことを特徴とする音声認識システム。
  2. 前記音声認識結果管理部は、前記通話者の過去の前記認識した結果に含まれる前記言語情報の統計値に基づいて、当該通話者の前記基準値を設定する、
    ことを特徴とする請求項1に記載の音声認識システム。
  3. 前記音声認識結果管理部は、あらかじめ定められた前記統計値を算出するための期間における前記認識した結果を前記記憶部から取得し、当該期間の前記非言語情報の値を対象として前記統計値を算出する、
    ことを特徴とする請求項2に記載の音声認識システム。
  4. 前記音声認識結果管理部は、設定した前記基準値に基づいて、前記通話者の通話を評価する、
    ことを特徴とする請求項1〜3のいずれか1項に記載の音声認識システム。
  5. 顧客とオペレータとの間で行われる通話を録音し、
    前記録音された通話および当該通話における通話者の特徴を示す非言語情報の値を認識し、認識した結果を記憶部に蓄積し、
    前記認識した結果に含まれる前記非言語情報の値に基づいて、通話者を評価するための基準値を設定する、通話評価設定方法において、
    録音された通話と、認識された前記非言語情報の値とを含む前記認識した結果を認識結果情報テーブルに蓄積し、
    前記認識結果情報テーブルから前記認識した結果を取得し、当該認識した結果に含まれる発番号が、顧客別評価値テーブルに記憶されている発番号と一致するか否かを判定し、
    前記認識した結果に含まれる発番号が、顧客別評価値テーブルに一致する発番号がないと判定した場合、共通評価値テーブルに記憶されている前記基準値の中から顧客用の前記基準値を読み取り、評価を行う第1の処理を実行し、
    前記認識した結果に含まれる発番号が、顧客別評価値テーブルに一致する発番号があると判定した場合、顧客別評価値テーブルに記憶されている前記基準値を読み取り、評価を行う第2の処理を実行し、
    前記第1の処理または前記第2の処理で行われた評価の結果を、顧客ごとの通話評価結果テーブルに記憶する、
    ことを特徴とする通話評価設定方法。
JP2017250873A 2017-12-27 2017-12-27 音声認識システム、通話評価設定方法 Active JP6963497B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017250873A JP6963497B2 (ja) 2017-12-27 2017-12-27 音声認識システム、通話評価設定方法
US16/181,388 US10924611B2 (en) 2017-12-27 2018-11-06 Voice recognition system and call evaluation setting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017250873A JP6963497B2 (ja) 2017-12-27 2017-12-27 音声認識システム、通話評価設定方法

Publications (2)

Publication Number Publication Date
JP2019118015A JP2019118015A (ja) 2019-07-18
JP6963497B2 true JP6963497B2 (ja) 2021-11-10

Family

ID=66949051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017250873A Active JP6963497B2 (ja) 2017-12-27 2017-12-27 音声認識システム、通話評価設定方法

Country Status (2)

Country Link
US (1) US10924611B2 (ja)
JP (1) JP6963497B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210029217A1 (en) * 2019-07-24 2021-01-28 Sony Corporation Communication support device, communication support method, and program
JP2021044735A (ja) * 2019-09-12 2021-03-18 第一生命保険株式会社 サーバ装置、サーバ装置のプログラム、及び情報処理システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6275806B1 (en) * 1999-08-31 2001-08-14 Andersen Consulting, Llp System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters
JP5585720B2 (ja) * 2011-03-17 2014-09-10 富士通株式会社 オペレータ評価支援装置、オペレータ評価支援方法及びオペレータ評価支援プログラムを記録した記憶媒体
WO2014107141A1 (en) * 2013-01-03 2014-07-10 Sestek Ses Ve Iletişim Bilgisayar Teknolojileri Sanayii Ve Ticaret Anonim Şirketi Speech analytics system and methodology with accurate statistics
US9105042B2 (en) * 2013-02-07 2015-08-11 Verizon Patent And Licensing Inc. Customer sentiment analysis using recorded conversation
JP6435150B2 (ja) * 2014-10-03 2018-12-05 みずほ情報総研株式会社 通話評価システム、通話評価方法及び通話評価プログラム
JP2017135642A (ja) 2016-01-29 2017-08-03 株式会社日立システムズ 電話音声モニタリング評価システム
US10244113B2 (en) * 2016-04-26 2019-03-26 Fmr Llc Determining customer service quality through digitized voice characteristic measurement and filtering

Also Published As

Publication number Publication date
US10924611B2 (en) 2021-02-16
US20190199858A1 (en) 2019-06-27
JP2019118015A (ja) 2019-07-18

Similar Documents

Publication Publication Date Title
US9992336B2 (en) System for analyzing interactions and reporting analytic results to human operated and system interfaces in real time
US8494149B2 (en) Monitoring device, evaluation data selecting device, agent evaluation device, agent evaluation system, and program
US9848082B1 (en) Agent assisting system for processing customer enquiries in a contact center
US8332231B2 (en) Apparatus and method for processing service interactions
US9880807B1 (en) Multi-component viewing tool for contact center agents
US8457964B2 (en) Detecting and communicating biometrics of recorded voice during transcription process
US10237405B1 (en) Management of checkpoint meta-data for call recordings in a contact center
US11336770B2 (en) Systems and methods for analyzing coaching comments
EP2840767A1 (en) Speaker recognition and voice tagging for improved service
US9031209B2 (en) Divided call history user interface
US20160358115A1 (en) Quality assurance analytics systems and methods
US10735592B1 (en) Routing of calls based on analysis of digital voice data in a data-communications server system
US9344565B1 (en) Systems and methods of interactive voice response speed control
JP6963497B2 (ja) 音声認識システム、通話評価設定方法
JP2015528678A (ja) 呼分析を学習する方法およびシステム
US9986076B1 (en) Closed loop calling process in an automated communication link establishment and management system
JP2014178381A (ja) 音声認識装置、音声認識システムおよび音声認識方法
US11025568B2 (en) Customized response messages
US9876886B1 (en) System and method for automatic update of calls with portable device
US20110112879A1 (en) Method and apparatus to manage a workforce
JP7164372B2 (ja) 音声認識システム及び音声認識方法
US20240259339A1 (en) Communications apparatus using channel-communications management
JP5167020B2 (ja) 留守番電話装置
WO2022256028A1 (en) Communications apparatus using channel-communications management

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211015

R150 Certificate of patent or registration of utility model

Ref document number: 6963497

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150