JP2022141599A - コンテキストアウェアオーディオエンハンスメントのためのシステムおよび方法 - Google Patents

コンテキストアウェアオーディオエンハンスメントのためのシステムおよび方法 Download PDF

Info

Publication number
JP2022141599A
JP2022141599A JP2022036751A JP2022036751A JP2022141599A JP 2022141599 A JP2022141599 A JP 2022141599A JP 2022036751 A JP2022036751 A JP 2022036751A JP 2022036751 A JP2022036751 A JP 2022036751A JP 2022141599 A JP2022141599 A JP 2022141599A
Authority
JP
Japan
Prior art keywords
customer
communication
audio
agent
audio enhancement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022036751A
Other languages
English (en)
Other versions
JP7392017B2 (ja
Inventor
シャー シャミク
Shah Shamik
シー. マチュラ ヴァレンタイン
C Matula Valentine
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Avaya Management LP
Original Assignee
Avaya Management LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Avaya Management LP filed Critical Avaya Management LP
Publication of JP2022141599A publication Critical patent/JP2022141599A/ja
Application granted granted Critical
Publication of JP7392017B2 publication Critical patent/JP7392017B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/30Aspects of automatic or semi-automatic exchanges related to audio recordings in general
    • H04M2203/305Recording playback features, e.g. increased speed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/30Aspects of automatic or semi-automatic exchanges related to audio recordings in general
    • H04M2203/306Prerecordings to be used during a voice call

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Evolutionary Computation (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】顧客のサービス経験を改善するオーディオエンハンスメントを提供すること。【解決手段】コンタクトセンターは、積極的で生産的な顧客エージェントインタラクションを提供して、通話の問題を正常に解決する。保留中の音楽やメッセージなどのオーディオコンテンツは一般的である一方、顧客エージェントは、挿入するオーディオエンハンスメントを選択し、同時に、顧客および/またはエージェントに、通話の正常な完了を促進するためのキューと動機を提供する。エージェントの到着または出発をアナウンスしたり、顧客をある場所から別の場所へ仮想的に移動させてインタラクションの異なる部分を実現したり、実際のイベントの予兆となる音声経験、神経のほつれを静める、またはその他の目的を提供することによって、次のイベントに興奮と期待を追加したりするためのキューが提供される。【選択図】図1

Description

[著作権表示]
本特許文献の開示の一部は、著作権保護の対象となる資料を含む。著作権者は、特許商標庁の特許ファイルまたは記録に現れるような特許文献または特許開示を誰でも複製することに異議を唱えていないが、その他の点において、すべての著作権を保有する。
本発明は、概して、混合モード通信のためのシステムおよび方法に関し、特に、通話において提供されるオーディオエンハンスメントに関する。
企業の構成要素であるか、または企業をサポートするコンタクトセンター等のものは、製品を販売するか、または問題を解決するため等、顧客対話を成功させるために利用可能なツールを利用することはコンタクトセンターの一般的な目的である。そうする際に、多くの場合、顧客満足度、調査スコア、インタラクションを完了するために必要とされる時間、およびインタラクションを結論にするために利用されるリソース(例えば、追加のエージェント)の観点から成功が測定される。同時に、企業はまた、エージェント満足度、士気、およびポジティブな態度を維持しながら、エージェントのパフォーマンスを最大にしたい。さらに、顧客および代理人の経験および期待は、それらが見て聞くものによって形作られる。生のショッピング、生のサービス(例えば、空港カウンター、宝石店など)、オンラインビデオ、放送TV、ラジオおよびポッドキャスト、TEDトークなどの個人的経験は、顧客とエージェントとのインタラクション中に望まれるもの、または期待されないものの知覚に寄与する。
従来技術の解決策は、しばしば、インタラクションのセルフサービス部分の間、例えば、顧客が保留中であるか、またはインタラクティブ音声応答(IVR)もしくは自動システムとの他のインタラクションをナビゲートしているときに、特定の気分を促進するため、または「経験」を提供するために、オーディオエンハンスメントを利用する。一般的なオーディオエンハンスメントの1つは、音楽オンホールドである。オーディオエンハンスメントは、システム全体の設定、インタラクションの属性、またはワークフローによって判断されることが多い。
オーディオおよび他のエンハンスメントもまた、通話中のエージェント指導のために利用される。例えば、コールセンターは、しばしば、改善された顧客サービス経験を促進するためのインタラクションおよび/または現在の会話のコンテキストに基づくヒントをエージェントに提供する、動的エージェントスクリプト、スクリーンポップ、およびメモをエージェントに提示する。
顧客エージェントの間、(少なくとも意図的に)提供される唯一のオーディオは、エージェントおよび顧客のスピーチであり、またはある状況では、エージェントおよび/または顧客による発話である。追加のオーディオが顧客に提供されるが、エージェントとのインタラクション中には提供されない。エージェントに提供されるオーディオは、エージェントのみのオーディオに限定される(例えば、「ウィスパ」チャネルメッセージまたは顧客サービス「ヒント」)に限定される。その結果、会話は平易であり、しばしば退屈する。顧客の気分を変更することがしばしば望ましいが、顧客およびエージェントの音声に限定されたオーディオ、または無音は、会話の「感情」を変更し、結果として顧客の気分を改善する能力が限られている。
加えて、特定のオーディオエンハンスメント(例えば、サウンド、音楽、ボリューム、フェードイン、フェードアウト、導入のタイミング、終了のタイミングなど)は、所望の影響を有しても有さなくてもよい。ニューラルネットワークまたは他の機械学習などの人工知能エージェントを利用することによって、特定の顧客、顧客状況、特定のエージェント、および過去の通話で過去に観察されたおよび/または現在の通話で観察され、現在の通話に適用された通話の軌道をターゲットにするために、オーディオエンハンスメントが選択され展開され得る。
これらおよび他の必要性は、本発明の様々な実施形態および構成によって対処される。本発明は、特定の構成に応じて多くの利点を提供することができる。これらおよび他の利点は、本明細書に含まれる本発明の開示から明らかになるであろう。
一実施形態では、人間の心理学に影響を及ぼし、気分および/または意思決定に影響を及ぼすために、顧客エージェント通信へのオーディオエンハンスメントの選択的適用が適用される。オーディオエンハンスメントは、顧客属性、トピック、目的、過去の履歴、エージェント属性、所望の結果などのうちの1つまたは複数に基づき得る、特定の通話に対する人工知能(AI)エージェント決定モチベーションおよび/または所望の影響に基づいて選択され得る。
別の実施形態では、オーディオエンハンスメントは、背景音楽または他のサウンド(例えば、自然音、産業音、交通、背景チャッター、動物など)を含んでもよい。オーディオエンハンスメントは、顧客部分のみ、エージェント部分のみ、またはエージェントおよび顧客部分の両方に適用されてもよい。しかしながら、エージェントおよび顧客に適用されるオーディオエンハンスメントは、同じであっても異なっていてもよい。差異は、コンテンツ、ボリューム、導入ポイント、終了ポイント、フェードイン速度、フェードアウト速度などのうちの1つまたは複数を含み得る。
オーディオの選択は、通話のコンテキストの1つまたは複数に基づくアルゴリズムまたは記憶されたルールまたはAI決定因子に基づき得ることであって、顧客の好みまたは任意の明示的な選択と、ソーシャルメディア、過去の履歴などのリソースから取り込むことができる顧客の関心と、使用される言語、トーン、ピッチ、地域、または他の人口統計学的詳細から識別され得る顧客の気分とを含む。
一例では、テーマパークの背景サウンドは、パークチケットを購入するときに、通話の顧客の部分、および任意選択でエージェントの部分に追加され得る。同様に、動物園は、動物の音、スポーツイベントのための群衆のノイズ、映画または映画の音楽またはノイズムービーチケットなどを利用してもよい。
選択された背景音楽またはサウンドは、顧客に癒し経験を提供するために選択されてもよく、また、顧客に所望の心理的効果を有するために使用されてもよい。例えば、顧客が怒っている/失望していると思われる場合、顧客がエージェントとの加熱された主張を有するので、背景で静かな音楽を流すことができる。したがって、背景音楽は、会話を補完するためだけでなく、会話を推進するためにも使用され得る。速いテンポ、ロック、または同様の音楽は、加熱された会話中に回避され、これは、使用される場合、緊張状況を悪化させ得る。
別の例では、会話がデッドエンドに達しているにもかかわらず、顧客が会話を引き伸ばしている場合、背景の速い音楽を追加して、賞の受取人に自分の受賞スピーチを終わらせるように促すために賞のセレモニーで使用される「再生」音楽と同様に、顧客の脳でハリーアップ信号をトリガすることができる。
音楽は、エージェントからのバックグラウンドノイズをオーバーレイもしくはマスクするため、またはサイレンス中に「不快なノイズ」を提供するためなどにサイレンスを埋めるために追加され得る。
別の実施形態では、オーディオエンハンスメントを挿入することは、関連する心理学的指標またはキューをエージェントに提供するためなどに、通話の際にエージェントに向けられてもよい。例えば、音楽を挿入して、エージェントの脳において「ハリーアップ」信号をトリガすることができる。同様に、穏やかな音楽は、怒った顧客がエージェントと会話している間にエージェントがリラックスするのを助けることができ、モチベーション音楽は、エージェントの危険を増大させ、および/またはエージェントが長期間その穏やかなエネルギーレベルを保持するのを助ける。
同一のオーディオエンハンスメントが顧客とエージェントの両方に提供されてもよいが、別の実施形態では、顧客とエージェントは、同じ通話にわたって背景音楽等の異なるオーディオエンハンスメントを提供されてもよい。他の差異は、背景音楽が提示されるボリューム、フェードイン/フェードアウトのタイミングおよび/または速度、音楽/サウンドの変化などを含むことができる。別の実施形態では、異なるエージェントが通話に加わるか、または通話が異なるエージェントに転送されようとしているか、または転送された場合、音楽/サウンドは、通話上の新しいエージェントおよび/または出発する既存のエージェントへの導入の手段としてフェードまたは上昇し得る。別の実施形態では、保留中の音楽をフェードインして、エージェントがまだ顧客と会話している間に開始し、次いで、通話が実際に保留または転送されるときに全ボリュームに達するようにすることができる。
顧客エージェントインタラクションが好適に変更される場合、特定のオーディオエンハンスメントの適用は成功したと考えられることであって、そのようなものは、改善された顧客満足度、販売の終了、問題の解決、顧客調査のより肯定的な結果、エージェント調査のより肯定的な結果、オーディオエンハンスメントが有用であったかまたは有益であったかに関するエージェントからのより肯定的なリアルタイムフィードバック、人間による好都合な通話後レビューおよび/または自動システム(例えば、AI)によるより肯定的な通話後又はリアルタイムのレビューの1つまたは複数によって判断され得る。
一実施形態では、AIは、音楽などのオーディオエンハンスメントを完全に自律的に選択することができる。AIは、キューまたはエージェントからの制限された入力(例えば、ペースを速める/通話をまとめる、ペースを遅くする、お客様を落ち着かせるなど)に基づいてオーディオエンハンスメントを選択できる。さらにまたは代替的に、特定のジャンルの音楽(カントリーミュージック、クラシックなど)またはカテゴリー(例えば、癒し、エネルギッシュなど)を選択し、人間のエージェントがジャンルまたはカテゴリー内の音楽の選択を最終判断することを可能にするように、キューまたは制限された入力をAIによって提供することができる。音楽やその他のサウンドの選択と同様に、AIは完全に制御したり、上限/下限を設定したり、オーディオエンハンスのためにボリューム、フェードイン/フェードアウト、ペース、またはその他のレベルのみを提案したりできる。AIは、エージェントおよび/または顧客のオーディオレベルを監視し、オーディオレベルを動的に調整して、エージェント、顧客、それらの組み合わせ、および/または他の通知(例えば、マイクロフォンによって誤って拾われる可能性のある環境ノイズをマスクするため)のオーディオレベルに対して、絶対的にまたは相対的に適切なレベルにすることができる。
AIは、スピーチテキスト変換および後続のコンテキスト分析を通して、またはエネルギーレベル、ペーシング、方向転換等の会話の属性を判断することによって、エージェントと顧客との間の議論を分析し、その結果を使用して、オーディオ、選択されるコンテンツ、ボリュームレベル等を導入する判断を選択および/または制御してもよい。
ルールベースのオーディオ制御と同様に、顧客へのAI制御オーディオは、入力ファクタとして取り得る。通話のコンテキストであって、リアルタイム分析または事前通信を介して提供され(人間エージェントに接続される前のIVRセッション中に提供されてもよい)、通話の目的(例えば、ヘルプクエリ、予約など)を識別するもの、顧客の明示的または事前の嗜好/選択の指示、さまざまなリソース、例えば、ソーシャルメディア、過去の履歴などからキャプチャされた顧客の関心、および/または、言語、トーン、ピッチ、音声、地域および他の人口統計の詳細、通話がビデオを更に含む場合の表情から識別される顧客の気分のうちの1つまたは複数を入力ファクタは含む。AIは、人間のエージェントによって要求された場合、または自動的に、エージェントからのいかなる要求または他の入力も伴わずに、オーディオエンハンスメントを提供してもよい。
例示的な態様は、以下を対象とする。
ネットワークへのネットワークインターフェースと、
非一時的記憶媒体に維持された機械可読命令とともに構成されたプロセッサとを備えるシステムであって、前記機械可読命令は、
エージェント通信デバイスを利用するエージェントと顧客通信デバイスを利用する顧客との間の通信を監視するステップであって、前記通信は前記ネットワークを介して送信される符号化オーディオ信号を備えるステップと、
前記通信の目的にアクセスするステップと、
複数のオーディオエンハンスメントから、前記通信の目的に対応するオーディオエンハンスメントを選択するステップと、
前記符号化オーディオ信号の一部に備えるために、前記オーディオエンハンスメントを前記通信に挿入するステップとを前記プロセッサにさせることを特徴とするシステム。
ネットワークへのネットワークインターフェースと、
非一時的記憶媒体に維持された機械可読命令とともに構成されたプロセッサとを備えるシステムであって、前記機械可読命令は、
エージェント通信デバイスを利用するエージェントと顧客通信デバイスを利用する顧客との間の通信を監視するステップであって、前記通信は前記ネットワークを介して送信される符号化オーディオ信号を備えるステップと、
前記通信の目的にアクセスするステップと、
複数のオーディオエンハンスメントから、前記通信の目的に対応するオーディオエンハンスメントを選択するように訓練されたニューラルネットワークに前記通信の前記目的を提供するステップと、
前記ニューラルネットワークから、前記オーディオエンハンスメントを取得するステップと、
前記符号化オーディオ信号の一部に備えるために、前記オーディオエンハンスメントを前記通信に挿入するステップとを前記プロセッサにさせることを特徴とするシステム。
エージェント通信デバイスを利用するエージェントと顧客通信デバイスを利用する顧客との間の通信を監視するステップであって、前記通信はネットワークを介して送信される符号化オーディオ信号を備えるステップと、
前記通信の目的にアクセスするステップと、
複数のオーディオエンハンスメントから、前記通信の目的に対応するオーディオエンハンスメントを選択するステップと、
前記符号化オーディオ信号の一部に備えるために、前記オーディオエンハンスメントを前記通信に挿入するステップとを備えることを特徴とする方法。
上記の態様のいずれかを含む。
前記符号化オーディオ信号は、前記エージェントまたは前記顧客の少なくとも1つからのスピーチと同時にオーディオエンハンスメントを備える。
前記オーディオエンハンスメントは、ボリューム、テンポ、ペース、ピッチ、フェードイン速度、フェードアウト速度、最大ボリュームまたは最小ボリュームのうちの少なくとも1つを備える前記オーディオエンハンスメントの属性をさらに備える。
前記命令は、
前記顧客の現在の感情を判断するステップであって、前記現在の感情は前記通信中に前記顧客によって提示される明示的な感情であるステップをさらに備える前記通信の前記目的にアクセスするステップと、
前記顧客の所望の感情を判断するステップと、
前記現在の感情を有する対象者が前記所望の感情に移行するという結果になると過去に判断された感情鎮静属性に対応する前記オーディオエンハンスメントを選択するステップとを前記プロセッサにさらにさせる。
前記オーディオエンハンスメントを選択するステップを前記プロセッサにさせる前記命令は、前記顧客の人口統計学的属性に従って前記オーディオエンハンスメントを選択するステップを前記プロセッサにさせるステップをさらに備える。
前記命令は、
前記顧客にタスクを実行させるステップをさらに備える前記通信の前記目的にアクセスするステップと、
前記タスクの関連サウンドに対応する前記オーディオエンハンスメントを選択するステップとを前記プロセッサにさらにさせる。
前記オーディオエンハンスメントは、前記顧客通信デバイスまたは前記エージェント通信デバイスの一方に提供され、両方に提供されない。
前記命令は、
前記エージェントと前記顧客との間の前記通信の第2の部分を監視するステップであって、前記通信の前記第2の部分は、前記オーディオエンハンスメントの挿入と同時に生じるステップと、
前記顧客によって提供される前記通信のコンテンツに従って前記通信の前記目的を更新するステップと、
前記顧客によって提供される前記通信の前記コンテンツが前記オーディオエンハンスメントと矛盾することを判断すると、前記オーディオエンハンスメントを修正するステップとを前記プロセッサにさらにさせる。
前記命令は、前記オーディオエンハンスメントの挿入を終了すること、前記オーディオエンハンスメントの前記コンテンツを変更すること、前記オーディオエンハンスメントの前記ペースを変更すること、前記オーディオエンハンスメントの前記ボリュームを変更すること、または前記オーディオエンハンスメントの前記ピッチを変更することの1つまたは複数を備えるオーディオエンハンスメントの修正を前記プロセッサにさせる。
前記ニューラルネットワークはオーディオエンハンスメントを選択するように訓練され、
過去のいくつかの顧客と対応する数の過去のエージェントとの間の過去の通信のセットにアクセスするステップと、
過去の通信の修正されたセットを生成するために、ワードを同義のワードに置換すること、ワードを同義のフレーズに置換すること、前記通信の前記目的に関連する前記オブジェクトを目的に置換すること、少なくとも1つの冗長ワードを挿入すること、または少なくとも1つの冗長ワードを除去することの1つまたは複数を含む1つまたは複数の変換を過去の通信の前記セットの各過去の通信を適用するステップと、
前記過去の通信のセット、前記修正された過去の通信のセットおよび前記目的に関連しないと過去に判断された異なる目的のセットを備える第1の訓練セットを作成するステップと、
前記第1の訓練セットを使用して第1の状態の前記ニューラルネットワークを訓練するステップと、
前記第1の訓練セットおよび前記目的に関連すると誤って識別された前記目的に関連がないと過去に判断された異なる目的の前記セットを備える第2の訓練状態のための第2の訓練セットを作成するステップと、
前記第2の訓練セットを使用して前記第2の状態の前記ニューラルネットワークを訓練するステップとをさらに備える。
前記オーディオエンハンスメントは、ボリューム、テンポ、ペース、ピッチ、フェードイン速度、フェードアウト速度、最大ボリュームまたは最小ボリュームのうちの少なくとも1つを備える前記オーディオエンハンスメントの属性をさらに備える。
前記命令は、
前記顧客の現在の感情を判断するステップであって、前記現在の感情は前記通信中に前記顧客によって提示される明示的な感情である前記通信の前記目的にアクセスするステップと、
前記顧客の所望の感情を判断するステップと、
前記顧客が前記所望の感情を持つように移行することを備える前記目的を変更するステップとを前記プロセッサにさらにさせる。
前記命令は、
前記顧客にタスクを実行させるステップをさらに備える前記通信の前記目的にアクセスするステップと、
前記タスクの関連サウンドに対応する前記オーディオエンハンスメントを選択するステップとを前記プロセッサにさらにさせる。
前記オーディオエンハンスメントは、前記顧客通信デバイスまたは前記エージェント通信デバイスの一方に提供され、両方に提供されない。
前記命令は、
前記エージェントと前記顧客との間の前記通信の第2の部分を監視するステップであって、前記通信の前記第2の部分は、前記オーディオエンハンスメントの挿入と同時に生じるステップと、
前記顧客によって提供される前記通信のコンテンツに従って前記通信の前記目的を更新するステップと、
前記顧客によって提供される前記通信の前記コンテンツが前記オーディオエンハンスメントと矛盾することを判断すると、前記オーディオエンハンスメントを修正するステップとを前記プロセッサにさらにさせる。
前記命令は、前記オーディオエンハンスメントの挿入を終了すること、前記オーディオエンハンスメントの前記コンテンツを変更すること、前記オーディオエンハンスメントの前記ペースを変更すること、前記オーディオエンハンスメントの前記ボリュームを変更すること、または前記オーディオエンハンスメントの前記ピッチを変更することの1つまたは複数を備えるオーディオエンハンスメントの修正を前記プロセッサにさせる。
前記オーディオエンハンスメントは、ボリューム、テンポ、ペース、ピッチ、フェードイン速度、フェードアウト速度、最大ボリュームまたは最小ボリュームのうちの少なくとも1つを備える前記オーディオエンハンスメントの属性をさらに備える。
システムオンチップ(SoC)は、上記の態様のうちのいずれか1つまたは複数を含む。
上記の態様のうちのいずれか1つまたは複数を実行するための1つまたは複数の手段。
任意の1つまたは複数の他の態様と組み合わせた任意の態様。
本明細書に開示される特徴のうちのいずれか1つまたは複数。
本明細書に実質的に開示される特徴のうちの任意の1つまたは複数。
本明細書において実質的に開示される特徴の任意の1つまたは複数は、本明細書において実質的に開示される他の特徴の任意の1つまたは複数と組み合わされる。
態様/特徴/実施形態のいずれか1つは、任意の1つまたは複数の他の態様/特徴/実施形態と組み合わせられる。
本明細書に開示される態様または特徴のいずれか1つまたは複数の使用。
上記の態様のいずれかであって、データ記憶装置は、プロセッサ内のオンチップメモリと、プロセッサのレジスタと、プロセッサと処理ボード上に共同配置されたオンボードメモリと、バスを介してプロセッサにアクセス可能なメモリと、磁気媒体と、光学媒体と、固体媒体と、入出力バッファと、プロセッサと通信する入出力構成要素のメモリと、ネットワーク通信バッファと、ネットワークインターフェースを介してプロセッサと通信するネットワーク構成要素とのうちの少なくとも1つを備える非一時記憶媒体を備える。
本明細書で説明される任意の特徴は、特徴が同じ説明される実施形態に由来するかどうかにかかわらず、本明細書で説明される任意の他の特徴と組み合わせて請求され得ることを理解されたい。
「少なくとも1つ」、「1つまたは複数の」、「または」および「および/または」は、動作において結合的および非結合的の両方であるオープンエンド表現である。例えば、「A、BおよびCのうちの少なくとも1つ」、「A、BまたはCのうちの少なくとも1つ」、「A、BおよびCのうちの1つまたは複数」、「A、BまたはCのうちの1つまたは複数」、「A、Bおよび/またはC」ならびに「A、BまたはC」という表現の各々は、Aのみ、Bのみ、Cのみ、AおよびBの両方、AおよびCの両方、BおよびCの両方またはA、BおよびCのすべてを意味する。
「a」または「an」エンティティは、そのエンティティの1つまたは複数を指す。したがって、「a」(または「an」)、「1つまたは複数」および「少なくとも1つ」は、本明細書では互換的に使用することができる。また、「備える」、「含む」および「有する」は、交換可能に使用され得ることにも留意されたい。
「自動」およびその変形は、本明細書で使用する場合、任意のプロセスまたは動作を指し、典型的には、プロセスまたは動作を実行する際に、実質的な人的入力なしで行われる連続または半連続のプロセスまたは動作である。しかし、プロセスまたは動作の実行前に入力を受信すれば、プロセスまたは動作の実行が物質的または非物質的な人的入力を使用する場合であっても、プロセスまたは動作は自動であり得る。人的入力は、そのような入力がプロセスまたは動作の実行方法に影響を及ぼす場合は、物質的と見なされる。プロセスまたはオペレーションの実行を受け入れる人的入力は、「物質的」とは見なされない。
本開示の態様は、完全にハードウェアである実施形態、完全にソフトウェア(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)である実施形態、またはソフトウェアおよびハードウェアの態様を組み合わせた実施形態の形態をとってもよく、これらはすべて、本明細書において「回路」、「モジュール」、または「システム」と一般に呼ばれ得る。1つまたは複数のコンピュータ可読媒体の任意の組合せを利用することができる。コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であり得る。
コンピュータ可読記憶媒体は、例えば、電子、磁気、光学、電磁気、赤外線、もしくは半導体のシステム、装置、もしくはデバイス、または前述のものの任意の好適な組み合わせであり得るが、それらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的なリスト)は、1つまたは複数のワイヤを有する電気接続、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、消去可能プログラマブル読取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読取り専用メモリ(CD‐ROM)、光記憶デバイス、磁気記憶デバイスであり得る。本明細書の文脈では、コンピュータ可読記憶媒体は、命令実行システム、装置、もしくはデバイスによって、またはそれらに関連して使用するためのプログラムを含有または記憶することができる任意の有形の非一時的媒体であり得る。
コンピュータ可読信号媒体は、例えば、ベースバンドで、または搬送波の一部として、コンピュータ可読プログラムコードがその中に具現化された伝搬データ信号を含み得る。そのような伝搬信号は、電磁、光学、またはそれらの任意の好適な組み合わせを含むが、それらに限定されない、種々の形態のうちのいずれかを成してもよい。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体ではなく、命令実行システム、装置、またはデバイスによって、またはそれらに関連して使用するためのプログラムを通信、伝搬、または輸送することができる、任意のコンピュータ可読媒体であり得る。コンピュータ可読媒体上に具現化されたプログラムコードは、限定はしないが、ワイヤレス、ワイヤライン、光ファイバケーブル、RFなど、または前述のものの任意の適切な組合せを含む、任意の適切な媒体を使用して送信され得る。
「判断する」、「計算する」、「算出する」およびその変形は、本明細書で使用する場合、交換可能に使用され、任意のタイプの方法論、プロセス、数学演算または技法を含む。
「手段」は、本明細書で使用される場合、35 U.S.C., Section 112(f) および/または Section 112, Paragraph 6に従って、可能な限り最も広い解釈が与えられるものとする。それに応じて、「手段」を組み込む請求項は、本明細書に記載されるすべての構造、材料または行為およびその均等物のすべてを対象とするものとする。さらに、構造、材料または行為及びその均等物は、発明の概要、図面の簡単な説明、発明を実施するための形態、要約書及び特許請求の範囲自体で説明されたすべてのものを含むものとする。
上記は、本発明のいくつかの態様の理解を提供するための本発明の簡略化された概要である。この概要は、本発明及びその様々な実施形態の概要の広範なものでも包括的なものでもない。この概要は、本発明の主要な、または重要な要素を特定することも、本発明の範囲を詳しく説明することも意図していないが、以下で提示するより詳細な説明の導入部として、本発明の選択された概念を簡略化した形で提示することを意図している。理解されるように、本発明の他の実施形態は、単独で、または組み合わせて、上記で説明される、または以下で詳細に説明される特徴のうちの1つまたは複数を利用することが可能である。また、本開示は例示的な実施形態に関して提示されているが、本開示の個々の態様を別々に請求できることを理解されたい。
本開示は、添付の図面と併せて説明される。
図1は、本開示の実施形態による第1のシステムを示す。 図2は、本開示の実施形態による第2のシステムを示す。 図3は、本開示の実施形態による第1のデータ構造を示す。 図4は、本開示の実施形態による第2のデータ構造を示す。 図5は、本開示の実施形態による第1のプロセスを示す。 図6は、本開示の実施形態による第2のプロセスを示す。 図7は、本開示の実施形態による第3のシステムを示す。
以下の説明は、実施形態のみを提供するものであり、特許請求の範囲、適用性、または構成を限定することを意図するものではない。むしろ、以下の説明は、実施形態を実施するための実施可能な説明を当業者に提供するであろう。添付の特許請求の範囲の趣旨および範囲から逸脱することなく、要素の機能および配置において様々な変更が行われ得ることが理解されよう。
サブ参照識別子が図面に存在する場合、アルファベットのサブ参照識別子を伴わない、数字参照番号を含む説明における任意の参照は、複数で使用される場合、同様の参照番号を伴う任意の2つ以上の要素への参照である。そのような参照が単数形で行われる場合、ただしサブ参照識別子の識別なしに、同様の番号が付された要素のうちの参照であるが、要素のうちの特定の要素に関しては限定されない。反対に、またはさらなる資格もしくは識別を提供する本明細書における任意の明示的な使用が優先されるものとする。
本開示の例示的なシステムおよび方法はまた、分析ソフトウェア、モジュールおよび関連する分析ハードウェアに関連して説明される。しかし、本開示を不必要に不明瞭にすることを避けるために、以下の説明では、よく知られている構造、構成要素、およびデバイスを省略するが、これらの構造、構成要素、およびデバイスは、図から省略されるかまたは図において簡略化された形態で示されるか、もしくは別様に要約され得る。
説明の目的で、本開示の完全な理解を提供するために、多数の詳細が記載される。しかしながら、本開示は、本明細書に記載される具体的な詳細を超える様々な方法で実施され得ることを理解されたい。
図1は、本開示の少なくともいくつかの実施形態による通信システム100を示す。通信システム100は、分散型システムであってもよく、いくつかの実施形態では、1つまたは複数の顧客通信デバイス108を、作業割り当て機構116に接続してもよく、作業割り当て機構は、顧客通信デバイス108からの(コンタクトの形態での)着信作業項目を処理するために複数のリソース112が分散されている企業管理コンタクトセンター102によって所有および操作され得る。
コンタクトセンター102は、様々に具体化され、1つまたは複数のリソース112によって作業項目に関連するメッセージならびに作業項目の処理および管理(例えば、スケジューリング、割り当て、ルーティング、生成、アカウンティング、受信、監視、レビューなど)を受信および/または送信する。作業項目は、一般的に、電子的および/または電磁的に伝達されるメッセージとして具体化される処理リソース112またはその構成要素に対する生成および/または受信要求である。コンタクトセンター102は、図示されるよりも多いまたは少ない構成要素を含んでもよく、および/または図示されるよりも多いまたは少ないサービスを提供してもよい。コンタクトセンター102を示す境界は、物理的境界(例えば、建物、キャンパス等)、法的境界(例えば、会社、企業など)、および/または論理的境界(例えば、リソース112は、コンタクトセンター102の顧客のためのサービスを顧客に提供するために利用される)であってもよい。
さらに、コンタクトセンター102を示す境界は、図示されるように示されてもよく、または他の実施形態では、図示されるよりも多くのおよび/または少ない変更および/または構成要素を含んでもよい。例えば、他の実施形態では、1つまたは複数のリソース112、顧客データベース118および/または他の構成要素のうちの1つまたは複数は、そのような構成要素が公衆ネットワーク(例えば、Internet)を介して接続する場合等に、通信ネットワーク104を介してルーティングエンジン132に接続してもよい。別の実施形態では、通信ネットワーク104は、少なくとも部分的に、公衆ネットワーク(例えば、VPN)のプライベート利用であってもよく、少なくとも部分的にコンタクトセンター102内に位置するプライベートネットワークであってもよく、または、本明細書で説明される構成要素の電子通信を提供するために利用され得るプライベートおよび公衆ネットワークの混合物であってもよい。さらに、ソーシャルメディアサーバー130および/または他の外部データソース134などの外部として示される構成要素は、物理的および/または論理的にコンタクトセンター102内にあってもよいが、依然として他の目的のために外部と見なされることを理解されたい。例えば、コンタクトセンター102は、顧客通信デバイス108を介して顧客とインタラクションするための1つの手段として、ソーシャルメディアサーバー130(例えば、顧客および/またはリソース112からユーザメッセージを受信するように動作可能なウェブサイト)を動作させてもよい。
顧客通信デバイス108は、それぞれのユーザまたは顧客のより直接的な制御下にあるので、コンタクトセンター102の外部として具体化される。しかしながら、顧客がキオスクで顧客通信デバイス108を利用し、コンタクトセンター102内またはそれによって制御されるコンタクトセンター102のプライベートネットワーク(例えば、キオスクへのWiFi接続など)に付属するときなど、1つまたは複数の顧客通信デバイス108が、物理的および/または論理的にコンタクトセンター102内に位置し、依然としてコンタクトセンター102の外部にあると見なされる実施形態が提供されてもよい。
コンタクトセンター102の説明は、少なくとも1つの実施形態を提供し、それによって、以下の実施形態は、そのような実施形態を限定することなく、より容易に理解され得ることを理解されたい。コンタクトセンター102は、明示的に提供される場合を除き、本明細書に説明される任意の実施形態の範囲から逸脱することなく、かつ実施形態または請求項の範囲を限定することなく、さらに変更、追加、および/またはそこから差し引かれてもよい。
加えて、コンタクトセンター102は、ソーシャルメディアサーバー130を組み込みおよび/または利用してもよく、および/または他の外部データソース134は、リソース112がコンタクトを受信し、および/または検索し、コンタクトセンター102の顧客に接続するための1つの手段を提供するために利用されてもよい。他の外部データソース134は、サービスビュアー、第三者データプロバイダ(例えば、クレジット機関、公開および/または私的記録など)などのデータソースを含んでもよい。顧客は、ソーシャルメディアサーバー130を利用して通信を送信/受信するために、それぞれの顧客通信デバイス108を利用することができる。
本開示の少なくともいくつかの実施形態によれば、通信ネットワーク104は、任意のタイプの既知の通信媒体または通信媒体の集合を含むことができ、任意のタイプのプロトコルを使用してエンドポイント間で電子メッセージをトランスポートすることができる。通信ネットワーク104は、有線および/または無線通信技術を含み得る。Internetは、多くのコンピュータ、コンピューティングネットワークおよび世界各地に配置され、多くの電話システムおよび他の手段を介して接続されている他の通信デバイスを含むIP(Internet Protocol)ネットワークを構成する通信ネットワーク104の一例である。通信ネットワーク104の他の例は、標準的なPOTS(Plain Old Telephone S ystem)、ISDN(Integrated Services Digital Network)、PSTN(Public Switched Telephone Network)、LAN(Local Area Network)、WAN(Wide Area Network)、SIP(Session Initiation Protocol)ネットワーク、VoIP(Voice over IP)ネットワーク、セルラーネットワーク、当技術分野で知られている任意の他のタイプのパケット交換または回路交換ネットワークを含むが、これらに限定されない。さらに、通信ネットワーク104は、任意の1つのネットワークタイプに限定される必要はなく、代わりに、いくつかの異なるネットワークおよび/またはネットワークタイプから構成され得ることを理解されたい。一例として、本開示の実施形態は、グリッドベースのコンタクトセンター102の効率を増加させるために利用されてもよい。グリッドベースのコンタクトセンター102の例は、米国特許出願公開2010/0296417(Steiner)においてより完全に説明され、その全内容は、参照することによって本明細書に組み込まれる。さらに、通信ネットワーク104は、同軸ケーブル、銅ケーブル/ワイヤ、光ファイバケーブル、ワイヤレスメッセージを送信/受信するためのアンテナ、およびそれらの組合せなど、いくつかの異なる通信媒体を備えてもよい。
顧客通信デバイス108は、顧客通信デバイスに対応し得る。本開示の少なくともいくつかの実施形態によれば、顧客は自分の顧客通信デバイス108を利用して作業項目を開始してもよい。例示的な作業項目は、コンタクトセンター102に向けられ、そこで受信されるコンタクト、サーバーファーム(例えば、サーバーの集合)に向けられ、そこで受信されるウェブページ要求、メディア要求、アプリケーション要求(例えば、SIPアプリケーションサーバーなどのリモートアプリケーションサーバー上のアプリケーションリソース位置の要求)等を含むが、それらに限定されない。作業項目は、通信ネットワーク104を介して送信されるメッセージまたはメッセージの集合の形態であってもよい。例えば、作業項目は、電話通話、パケットまたはパケットの集合(例えば、IPネットワークを介して送信されるIPパケット)、電子メールメッセージ、インスタントメッセージ、SMSメッセージ、ファックス、およびこれらの組み合わせとして送信されてもよい。いくつかの実施形態では、通信は、必ずしも作業割り当て機構116に向けられなくてもよく、むしろ、ソーシャルメディアサーバー130などの、収穫された通信のための作業項目を生成する作業割り当て機構116によって収穫される通信ネットワーク104内の他の何らかのサーバー上にあってもよい。そのような収穫された通信の例は、ソーシャルメディアサーバー130またはサーバーのネットワークから作業割り当て機構116によって収穫されるソーシャルメディア通信を含む。ソーシャルメディア通信を収穫し、それに基づいて作業項目を生成するための例示的なアーキテクチャは、それぞれ、米国特許出願12/784,369、12/706,942、および12/707,277であって、2010年3月20日、2010年2月17日および2010年2月17日にそれぞれ記載されている各々は、参照によりその全体が本明細書に組み込まれる。
作業項目のフォーマットは、顧客通信デバイス108の能力および通信のフォーマットに依存してもよい。特に、作業項目は、コンタクトセンター102(より具体的には、作業割り当て機構116)において受信された通信にサービスすることに関連して行われる作業のコンタクトセンター102内の論理的表現である。通信を表す作業項目にリソース112が割り当てられるまで、通信は作業割り当て機構116あるいは作業割り当て機構116に接続されたスイッチまたはサーバーなどで受信および維持されてもよい。その時点で、作業割り当て機構116は、作業項目をルーティングエンジン132に渡し、通信を開始した顧客通信デバイス108を割り当てられたリソース112に接続する。
しかし、ルーティングエンジン132は、作業割り当て機構116とは別個のものとして示されていることであって、ルーティングエンジン132は、作業割り当て機構116に組み込まれてもよく、またはその機能性は、作業割り当てエンジン120によって実行されてもよい。
本開示の少なくともいくつかの実施形態によれば、顧客通信デバイス108は、任意のタイプの既知の通信機器または通信機器の集合を備え得る。好適な顧客通信デバイス108の例は、パーソナルコンピュータ、ラップトップ、PDA(Personal Digital Assistant)、携帯電話、スマートフォン、電話またはそれらの組み合わせを含むが、それらに限定されない。概して、各顧客通信デバイス108は、他の顧客通信デバイス108ならびに処理リソース112とのビデオ、オーディオ、テキスト、および/またはデータ通信をサポートするように適合され得る。他の顧客通信デバイス108または処理リソース112と通信するために顧客通信デバイス108によって使用される媒体のタイプは、顧客通信デバイス108上で利用可能な通信アプリケーションに依存し得る。
本開示の少なくともいくつかの実施形態によれば、作業項目は、作業割り当て機構116およびルーティングエンジン132の協力を介して処理リソース112の集合に向けて送信される。リソース112は、完全に自動化されたリソース(例えば、IVR(Interactive Voice Response)ユニット、マイクロプロセッサ、サーバーなど)、通信デバイスを利用する人間のリソース(例えば、コンピュータ、電話、ラップトップ等を利用する人間エージェント)、またはコンタクトセンター102で使用されることが知られている任意の他のリソースのいずれかであり得る。
上述のように、作業割り当て機構116およびリソース112は、コンタクトセンター102フォーマットで共通のエンティティによって所有および運用され得る。いくつかの実施形態では、作業割り当て機構116は、複数の企業によって管理されてもよく、企業のそれぞれは、作業割り当て機構116に接続された独自の専用リソース112を有する。
いくつかの実施形態では、作業割り当て機構116は、作業割り当て機構116が作業項目のインテリジェントルーティング判断を行うことを可能にする作業割り当てエンジン120を含む。いくつかの実施形態では、作業割り当てエンジン120は、米国特許出願12/882,950に記載されるように、待ち行列のないコンタクトセンター102において作業割り当て判断を管理および行うように構成され、その内容全体は、参照することによって本明細書に組み込まれる。他の実施形態では、作業割り当てエンジン120は、従来の待ち行列ベースの(またはスキルベースの)コンタクトセンター102において作業割り当て判断を実行するように構成されてもよい。
作業割り当てエンジン120およびその様々な構成要素は、作業割り当て機構116内に、またはいくつかの異なるサーバーもしくは処理デバイス内に常駐し得る。いくつかの実施形態では、クラウドベースのコンピューティングアーキテクチャを採用することができ、それによって、作業割り当て機構116の1つまたは複数のハードウェア構成要素は、複数の異なるユーザの間でリソースを共有することができるように、クラウドまたはネットワーク内で利用可能にされる。作業割り当て機構116は、レコード、プロファイル、購入履歴、過去の作業項目、および/またはコンタクトセンター102に知られている顧客の他の態様を検索するためなどに、顧客データベース118にアクセスすることができる。顧客データベース118は、作業項目および/または作業項目を処理するリソース112からの入力に応答して更新されてもよい。
コンタクトセンター102の1つまたは複数の構成要素は、完全に構内にある実施形態に加えて、全体としてクラウドベースのアーキテクチャ、またはその構成要素(例えば、ハイブリッド)で実装されてもよいことを理解されたい。一実施形態では、顧客通信デバイス108は、クラウドベースのサービスプロバイダによって完全にホストされる構成要素を介してリソース112のうちの1つに接続されることであって、処理およびデータ記憶ハードウェア構成要素は、コンタクトセンター102のオペレータ専用であるか、または1つがコンタクトセンター102である複数のサービスプロバイダ顧客間で共有または分散されてもよい。
一実施形態では、メッセージは、顧客通信デバイス108によって生成され、通信ネットワーク104を介して、作業割り当て機構116において受信される。作業割り当て機構116などにおいてコンタクトセンター102によって受信されるメッセージは、概して、本明細書では、「コンタクト」と呼ばれる。ルーティングエンジン132は、処理のためにリソース112の少なくとも1つにコンタクトをルーティングする。
本明細書では、「通話」は、オーディオを含み、通信ネットワーク104などのネットワークを介してデバイス間で行われるリアルタイムフルデュプレックス通信である。通話は、あるデバイス(またはその周辺機器)によってキャプチャされ符号化され、通信ネットワーク104を介して送信され、別のデバイス(またはその周辺機器)によって復号され提示されるオーディオを含む。通話は、ビデオチャネルを介して送信され得るビデオ、および/または他の形態の通信(例えば、テキストチャット)を任意選択で含み得る。通話は、様々な形態における様々な人間制御および自動化されたデバイスを含み得るが、本明細書の実施形態は、エージェント通信デバイスを利用する人間エージェントとして具体化される場合のみにおいては、顧客通信デバイス108を利用する人間と1つまたは複数のリソースとの間の通話に完全に向けられる。用語「顧客」が利用され得るが、そのような用語は、一実施形態として、およびある人間ユーザを他の人間、すなわちエージェントと区別するための手段として、そのような人間の役割を限定することなく提供される。加えて、本明細書で説明される実施形態は、顧客および/またはエージェントによって発声される通話のコンテンツ(例えば、話された言葉、抑揚、トーン、ペース、感情等)を監視するため、およびオーディオエンハンスメントの挿入のために等、自動リソースを備えてもよい。しかしながら、顧客に加えて、少なくとも1人の人間エージェントは、それらのそれぞれの通信デバイスを介して通話に接続されたままである。単独で自動エージェントまたは他のコンピュータ化されたリソースとして具体化される場合の顧客通信デバイス108を利用する顧客とリソース112との間の通話は、本明細書の実施形態から除外される。しかしながら、通話は、通信の部分(例えば、エージェントのためにエンキューされる、保留中、決定木をナビゲートする、IVR、インタラクション後調査等)中に自動リソースのみと接続される顧客を備え得るが、そのような部分は、本明細書では「通話」から除外されることを理解されたい。
図2は、本開示の実施形態によるシステム200を示す。一実施形態では、顧客202は、通信ネットワーク104を介して通信するために、顧客通信デバイス108およびエージェント通信デバイス210をそれぞれ利用してエージェント212との通話に関与している。エージェント212およびエージェント通信デバイス210は、少なくとも1つの人間エージェントを備えるように具体化される場合のリソース112の実施形態である。例えば、顧客202は、提示された顧客スピーチ216としてエージェント212に提示される顧客スピーチ204を提供してもよく、エージェント212は、提示されたエージェントスピーチ226として顧客202に提示されるエージェントスピーチ218を提供してもよい。
通話は、いくつかの目的を有し得る。1つの目的は、顧客202が問題を解決する、フライトを予約する、口座残高をチェックするなどのための技術的サポートを要求するなど、通話の動機付けであり得る。さらに、通話の少なくとも1つの目的は、サーバー208などによって、コンタクトセンター102によって判断され得る。その結果、目的または追加の目的は、より良好な顧客サービス経験を提供すること、怒った顧客を落ち着かせること、販売を行うこと、売り上げること、通話を終わりにすることなどであり得る。一実施形態では、サーバー208は、顧客202とエージェント212との間の通信のコンテンツを監視する。コンテンツは、明示的に話されたワード、話すペース、トーン、感情、姿勢、サウンド、抑揚、アクセントおよび/または他の発声されたコンテンツ、あるいは通話中に顧客202および/またはエージェント212によって提供される任意の発声されたコンテンツの変化のうちの1つまたは複数を含んでもよい。例えば、通話が成功して終了した可能性がある、すなわち、通話を動機付ける目的が満たされた可能性があるが、顧客202は、顧客スピーチ204のコンテンツなどの無関係なトピックについて話すことなどによって通話を伸ばしている可能性がある。サーバー208は、通話を監視し、とりわけ、通話状態206を判断し、その結果、通話を終わらせるまたは終了するなどの追加の目的を含む通話目的214を判断することができる。したがって、提示されたオーディオエンハンスメント224として通話に挿入するためのオーディオエンハンスメント(例えば、サウンドコンテンツおよび/またはサウンドコンテンツの属性)を含むデータレコード222がアクセスされる。
オーディオエンハンスメントの利点として、アクションまたは他の挙動を促進するためのキューが提供される。上記の例を続けると、「話続けている」可能性のある顧客202は、コーダを聞き始めてフェードインし、音量を徐々に増加させることができ、これとほぼ同じように、賞の受領者による受賞スピーチが、割り当てられた時間が満了したことを示す信号として、コーダとともに提示され得る。オーディオエンハンスメントは、様々に具体化され、以下の実施形態に関してより完全に論じられ、興奮、落ち着き、緊急性、または他のアクションもしくは反応を引き出すためのサウンドを含み得る。オーディオエンハンスメントは、顧客通信デバイス108のみに、エージェント通信デバイス210のみに、またはその両方に提示され得る。例えば、サーバー208は、エージェント212が素早く話していること、および/または、エージェント212のワードカウントが過去に判断された閾値を上回っているなど、顧客202がラッシュされていることを示すこと、または、「保留中」もしくは「そのことを考えるために少し時間が必要だ」などのワードを含む顧客スピーチ204に基づいて、判断することができる。したがって、サーバー208は、通話の目的がエージェント212によって提供されるコンテンツのペースを減速させることであり、その結果、データストレージ220からレコードを選択することであり、その結果、エージェント212が減速するように明示的に命令することなく、エージェント212によるスピーチのペースを減速させるように選択されたエージェント通信デバイス210にのみオーディオエンハンスメントが提示されることになり得る。同様に、エージェント212が無気力であるとサーバー208が判断した場合、通話の目的は、エージェント212にエネルギーを与えることであり得、その結果、サーバー208は、エージェント通信デバイス210のみにエネルギー音楽または他のサウンドを提示する。
別の目的は、顧客経験を改善すること、または売り上げることであり得る。例えば、顧客202は、エージェント212とともにテーマパークにチケットを予約している場合がある。サーバー208は、テーマパークのキャラクターと一緒に朝食などの旅行の追加品が利用可能であることを判断し、顧客202の旅行日程に適合するか、または他の方法が望ましい場合がある。したがって、テーマパークのキャラクターと朝食をする機会を顧客202に知らせる目的が通話に追加されてもよい。その結果、顧客通信デバイス108は、レストランシーンから出演するまたはキャラクターを含む、提示されたオーディオエンハンスメント224を提供され得る。エージェント212および/またはオーディオエンハンスメント224は、次いで、追加情報を提示し、例えば、顧客202をキャラクターと朝食するように招待してもよい。提示されたオーディオエンハンスメント224のいくつかまたはすべては、顧客通信デバイス108にのみ提示されてもよく、これは、エージェント通信デバイス210上のポップアップまたは他のメッセージによって示されてもよい(例えば、「お客様には、料理が提供されています。3、2、1でキャラクターと一緒の朝食が始まります。」)。その結果、顧客202には、実際の経験に関する興味、予想および興奮を生成するために選択されたオーディオ経験が提示される。
コンタクトセンターは、しばしば、ワークフローを利用して、顧客を「ジャーニー」に通し、通話の特定の目的を解決する。ホームローンに適用するなどの複雑なタスクは、基本情報を収集すること、銀行または他のリソースから検証可能な情報を収集すること、サービス(例えば、検査、ローンクロージングなど)をスケジューリングすること、アンダーライティングすること、および/または他のタスクなどのいくつかのステップのジャーニーを必要とし得る。多くの場合、ジャーニーの異なるステップは異なるエージェントによって処理される。従来のコンタクトセンターでは、ジャーニーの次のエージェントが利用可能になるのを待つ間、顧客を保留にすることを意味している。別の実施形態では、サーバー208は、通話の目的が、現在、あるステップから別のステップへの顧客202の「テイキング」を含むと判断することができる。結果として、提示されたオーディオエンハンスメント224は、実際のジャーニーをシミュレートするための足音のサウンドを含んでもよい。足音は、通話への別のエージェントの到着をアナウンスする手段としてフェードインし、退出エージェントの出発をアナウンスする手段としてフェードアウトし、またはエージェントをある仮想場所から別の仮想場所へ顧客202と「歩かせる」手段として一定にすることができる。ノッキング、ドアラッチ、ドア閉めなどの他の音は、目的をさらに満たすために、単独で、または、1つまたは複数の他のオーディオエンハンスメントと並列にまたは直列に利用することができる。
利益として、顧客202は、現在のまたは差し迫った移行に対するキューとして働き、顧客202を単に保留にして次のエージェントが加わるまで待つことよりも、顧客経験を概して改善する1つまたは複数のオーディオエンハンスメントからの「経験」が提供される。
背景ノイズは、顧客サービス経験をさらに改善するためにおよび/またはジャーニーにおける現在のステップに対するキューとして、通話に提供され得る。例えば、オーディオエンハンスメントは、最初に、テーマパーク予約プロセス選択ホテルの宿泊施設のステップ中に、キャラクター音声にいびきを付けることと、次いで、レストラン予約を行うときに、クランキングディッシュおよび他のレストラン音およびバンタに遷移し、次いで、予約が乗車および通過するときに、テーマパークのサウンドに遷移することとを含んでもよい。その結果、顧客202および任意選択でエージェント212は、顧客202とエージェント212との間の会話を中断し得るが、キューにより、より自然な会話を促進する明示的なアナウンス(例えば、「次に、テーマパークのパスを予約する必要があります」)を提供することなく、予約プロセスにおける現在のステップに関するキューを提供されることによって、ジャーニー中の次のステップに移行する可能性が高いと判断される。
別の実施形態では、特定の気分または感情を促進すると判断されたオーディオエンハンスメントが会話に提供される。例えば、群衆のサウンドは、スポーツイベントへのチケットを予約する通話中に提供されてもよい。エネルギー音楽は、顧客202が、怒っているか、混乱しているか、またはいらいらしていると判断すると、より軟らかい音楽に遷移し得る。同様に、オーディオエンハンスメントは、他のオーディオエンハンスメントに単独でまたは並列にまたは直列に追加され得る音楽または非音楽サウンド(例えば、泡立つ噴水、鳥のチャーピングなど)を含み得る。同様に、エージェント212は、特定の困難な通話を有し、いくつかのよくほつれた神経を有し得る。エージェント通信デバイス210は、次いで、エージェント212の精神状態を落ち着かせる、動機付ける、または別様に改善するように選択されたオーディオエンハンスメントを提供されてもよい。
オーディオエンハンスメントは、それに対する変更を含んでもよい。例えば、スポーツイベントにチケットを予約するとき、オーディオエンハンスメントは、イベントに関連する群衆のノイズおよび/または一般的なサウンドを含んでもよい。購入が完了に近づくと、オーディオエンハンスメントは変更され、例えば、群衆が活気づけられ、購入が完了すると、群衆チームは目標を得点付けするチームに類似し、エージェント212は、情報を収集し、購入を処理する明示的なタスクを実行するだけでよい。しかしながら、オーディオエンハンスメントが、所望の効果を付与しないか、または反対の効果を有する(例えば、顧客202がより怒っているか、または刺激されている)と判断された場合、オーディオエンハンスメントは、ペースを遅くするか、ボリュームを減少させるか、または完全に終了するように変更されてもよい。オーディオエンハンスメントに対する変更は、通話の少なくとも1つの目的に従って顧客通信デバイス108、エージェント通信デバイス210、または顧客通信デバイス108とエージェント通信デバイス210の両方に提示されるボリューム、テンポ、ペース、ピッチ、フェードイン速度、フェードアウト速度、最大ボリューム、または最小ボリュームの変化のうちの1つまたは複数を含むことができる。
さらに別の実施形態では、特定のオーディオエンハンスメントは、人口統計学的情報に少なくとも部分的に基づいて選択され得る。例えば、サーバー208は、通話の目的が顧客202を落ち着かせることであり、それに応じてオーディオエンハンスメントを選択することであると判断することができる。選択はさらに、年齢、地理的領域、および/または他の人口統計的属性に基づき得る。利点として、オーディオエンハンスメントは、人口統計属性を有する特定の個人に対する適切性に基づいて選択されてもよく、またはより具体的に選択されてもよい。
図3は、本開示の実施形態によるデータ構造300を示す。一実施形態では、サーバー208のプロセッサにアクセス可能なデータストレージ220などのデータストレージ内に維持され得るいくつかのレコード316がデータ構造300内に提供される。レコード316は、レコード316A~iよって示される例を含む(小文字「i」は、大文字「I」が使用された結果として生じ得る数字1との混同を回避するために本明細書で使用される)。データ構造300は、列として示されるいくつかのフィールド302~314を含み、より具体的には、レコードフィールド302、目的フィールド304、コンテンツフィールド306、開始ボリュームフィールド308、ボリューム変更フィールド310、持続時間フィールド312および次のフィールド314を含む。本明細書で提供される実施形態の範囲から逸脱することなく、追加のフィールド、より少ないフィールド、および/または代替のフィールドが利用され得る。
一実施形態では、レコードフィールド302は、各レコード316の一意の識別子を含む。目的フィールド304は、サーバー208などによって通話内に存在することが見出された場合に、対応するレコード316を選択して、コンテンツフィールド306内で維持または識別されたオーディオエンハンスメントコンテンツを提供し、サーバー208によって顧客通信デバイス108および/またはエージェント通信デバイス210に提示させることができる関連する目的を維持する。特定のオーディオエンハンスメントの提示は、開始ボリュームフィールド308に維持される開始ボリューム、およびボリューム変更フィールド310によって維持される、オーディオエンハンスメントの挿入中に適用される(もしあれば)ボリュームの変化および/またはボリューム変化の速度などのデフォルト属性を含み得る。他のエンハンスメント(例えば、トーン、ペースなど)が、容量および容量変化に加えて、またはその代わりに適用されてもよいことを理解されたい。追加または代替として、あるレコード316のコンテンツは、別のレコードからのコンテンツと直列または並列に提供され得る。例えば、通話の目的は、新しいエージェントまたは次のエージェントを通話に導入することであってもよく、コンテンツフィールド306から選択された足音を通話に挿入させるためにレコード316Aの目的フィールド304の値にマッチすると判断され得る。開始ボリュームフィールド308、ボリューム変更フィールド310、および持続時間フィールド312によってそれぞれ示されるように、3の初期ボリューム(0から10のスケールなど)の後、ボリュームは増加され、合計で11秒間再生される。いくつかのオーディオエンハンスメントは、通話が終了するまで挿入(例えば、生成またはループ)され得るが、他のオーディオエンハンスメントは、明確な終了(例えば、曲又はトラックの長さである)を有する。持続時間フィールド314内の持続時間値の終了時または終了時に、次のフィールド314によって示される次のレコードが選択される。停止し、椅子に座ることに関連する音が続く大きな足音を挿入すること(例えば、スクイーク、チェアホイールローリングなど)。
オーディオエンハンスメントは、直列または並列に挿入され得る。例えば、レコード316Fは、ドアラッチ音を1回再生し、次いで、レコード316G(レコード「7」)およびレコード316H(レコード「8」)のコンテンツフィールド306に維持されているコンテンツを挿入する。オフセットはまた、2つ以上のオーディオエンハンスメントが、1つの部分において同時に、および別の部分において連続的に提供されるように、部分的重複を可能にするように実装されてもよい。さらなるオプションとして、あるオーディオエンハンスメントが挿入されることを可能にするために遅延が提供されてもよく、終了すると、次のオーディオエンハンスメントが挿入される前の遅延が提供され得る。
図4は、本開示の実施形態によるデータ構造400を示す。一実施形態では、データ構造400は、サーバー208のプロセッサにアクセス可能なデータストレージ220内に維持される。オーディオエンハンスメントは、過去に判断された目的または新たに判断された目的に基づく特定のサウンドの属性または属性の変化を含むことができる。データ構造400は、列として示されるいくつかのフィールド302~312を含み、より具体的には、レコードフィールド402、目的フィールド404、コンテンツフィールド406、開始ボリュームフィールド408、ボリューム変更フィールド410および持続時間フィールド412を含む。本明細書で提供される実施形態の範囲から逸脱することなく、追加のフィールド、より少ないフィールド、および/または代替のフィールドが利用され得る。
データ構造400は、現在のオーディオエンハンスメントのためのデフォルト値を変更するためにアクセスされ得る。例えば、顧客202および/またはエージェント212をなだめるために通話の目的がサーバー208によって判断される場合、コンテンツフィールド406に示されるコンテンツは、ストレスレベルが増加している場合、ボリュームを増分するように再生されるか、またはすでに再生されている場合、変更されてもよい。オーディオエンハンスメントは、レコード416Bによって示される「ta da」などの任意の他のオーディオエンハンスメントに加えて挿入されてもよく、個々に挿入されてもよく、または徐々にもしくは急激に終了してもよい。例えば、顧客202またはエージェント212の一方または両方を「元気づける」またはさらに元気づけるという通話の目的がサーバー208によって判断された場合、コンテンツフィールド406に示されるコンテンツのボリュームをさらに増加させるレコード416Dが選択され得る。しかしながら、通話が否定的(例えば、怒り、いらだちなど)になった場合、通話の目的は、通話の否定的側面を漸増解除することであり得る。その結果、ボリューム変更フィールド410によって示されるように、ボリュームを減少させ、ペースを半分にするレコード416Fが選択され得る。追加的または代替的に、レコード416Gは、「レコードI」(例えば、レコード416Aのコンテンツフィールド406内のコンテンツ)を再生するためなど、コンテンツを変更するために選択され得る。さらなる追加または代替として、オーディオエンハンスメントを完全に終了させるレコード416Hが選択される。
図5は、本開示の実施形態によるプロセス500を示す。プロセス500は、サーバー208および/またはエージェント通信デバイス210のプロセッサ等のプロセッサによって読み取られると、プロセッサにプロセス500のステップを実行させる、機械可読命令として具現化されてもよい。一実施形態では、プロセス500が開始し、ステップ502は、顧客通信デバイス108を利用する顧客202などの顧客と、エージェント通信デバイス210を利用するエージェント212との間の通信を監視する。通信は、エージェント通信デバイス210が通話に接続されているのと実質的に同時に行われるように、新たに開始されてもよい。他の実施形態では、ステップ502は、通話が開始された後、および/または通話の持続時間全体にわたって行われる。
ステップ504は、通話の目的にアクセスする。目的は、エージェント212を含む通話の前に判断されてもよく、および/または通話の監視された内容に基づいてリアルタイムで判断されてもよい。ステップ506は、ステップ508において通話に挿入される通話のためのオーディオエンハンスメントを選択する。テスト510は、通話が終了したかどうかを判断し、否定的であると判断された場合、ステップ502にループバックし、そうでない場合、プロセス500は、終了し、および/または別の通話に対して再開始され得る。
図6は、本開示の実施形態によるプロセス600を示す。プロセス600は、サーバー208および/またはエージェント通信デバイス210のプロセッサなどのプロセッサによって読み取られるとき、機械可読命令として具体化され得ることであって、プロセッサにプロセス600のステップを実行させる。一実施形態では、通話が目的を有するかどうかの判断は、そのような判断を行うように訓練されたニューラルネットワークからの出力としてアクセスされる。
ニューラルネットワークは、従来技術で知られており、一実施形態では、入力および出力を有する論理ノードのレイヤを自己構成する。出力が自己判断閾値レベルを下回る場合、出力は省略され(すなわち、入力はスケールの非アクティブ応答部分内にあり、出力を提供しない)、自己判断閾値レベルが閾値を上回る場合、出力が提供される(すなわち、入力はスケールのアクティブ応答部分内にあり、出力を提供する)、アクティブおよび非アクティブ描写の特定の配置は、訓練ステップとして提供される。ノードへの複数の入力は、多次元平面(例えば、超平面)を生成し、アクティブまたは非アクティブである入力の組み合わせを描写する。
一実施形態では、プロセス600が開始し、ステップ602で過去の通信のセットにアクセスする。ステップ604は、過去の通信のセット内の各通信に1つまたは複数の変換を適用する。変換は、ワードを同義のワードに置換すること、ワードを同義のフレーズに置換すること、通信の目的を目的に関連付けられたオブジェクトに置換すること、通信の目的に関連付けられたオブジェクトを目的に置換すること、少なくとも1つの冗長ワードを挿入すること、少なくとも1つの冗長ワードを除去すること、欠落感情を挿入すること、現在の感情を除去すること、現在の感情の強度を変更すること、発声を挿入すること、発声を除去すること、および/または発声の強度を変更することの1つまたは複数を含み得る。
次に、ステップ606は、過去の通信のセット、過去の通信の修正されたセット、および目的に無関係であると過去に判断された異なる目的のセットから第1の訓練セットを作成する。次いで、ステップ608は、第1の訓練セットを用いてニューラルネットワークを訓練する。ステップ610において、第2の訓練セットが、第1の訓練セットと、目的に無関係であると過去に判断され、目的に関連すると誤って識別された目的のセットとから作成される。
図7は、本開示の実施形態によるシステム700内のデバイス702を示す。一実施形態では、サーバー208および/またはエージェント通信デバイス210は、全体的または部分的に、種々の構成要素と、他の構成要素および/またはシステムへの接続とを備える、デバイス702として具体化されてもよい。構成要素は、様々に具体化され、プロセッサ704を備え得る。本明細書で使用する「プロセッサ」という用語は、専ら、符号化された電気信号を電気回路に、および電気回路から伝達するための接続(例えば、ピンアウト)を有する電気回路を備える電子ハードウェア構成要素を指す。プロセッサ704は、制御ユニット、入力/出力ユニット、算術論理ユニット、レジスタ、一次メモリ、および/またはバス714を介して受信されるような情報(例えば、データ、命令等である)にアクセスし、命令を実行し再びバス714を介してデータを出力する他の構成要素をさらに備え得る電気回路をその中に有する単一の電子マイクロプロセッサまたはマルチプロセッサデバイス(例えば、マルチコア)としてさらに具体化され得る。他の実施形態では、プロセッサ704は、システム(例えば、ブレード、マルチプロセッサボードなど)または分散処理システム(例えば、「クラウド」、「ファーム」など)内の処理アレイなど、他のプロセスおよび/またはプロセス所有者によって利用され得る共有処理デバイスを備え得る。プロセッサ704は、非一時的コンピューティングデバイス(例えば、電子機械は、他の構成要素およびデバイスと通信するための回路および接続を備える)であることを理解されたい。プロセッサ704は、プロセッサ(例えば、VAXオペレーティングシステムおよびVAX機械命令コードセットをIntel(登録商標)9xxチップセットコードに変換し、VAX特有のアプリケーションが仮想VAXプロセッサ上で実行できるようにする)に固有でない機械命令を処理するなど、仮想プロセッサを動作させることができるが、当業者が理解するように、そのような仮想プロセッサは、ハードウェア、より具体的には、基礎をなす電気回路およびプロセッサ(例えば、プロセッサ704)の他のハードウェアによって実行されるアプリケーションである。プロセッサ704は、アプリケーション(すなわち、Pod)がKubernetsによって統合されるときなどに、仮想プロセッサによって実行され得る。仮想プロセッサは、アプリケーションの命令を実行する静的および/または専用プロセッサであるように見えるものをアプリケーションに提示することを可能にするが、下層の非仮想プロセッサは、命令を実行しており、動的であってもよく、および/またはいくつかのプロセッサ間で分割され得る。
プロセッサ704の構成要素に加えて、デバイス702は、命令、値などのアクセス可能なデータの記憶のためにメモリ706および/またはデータストレージ708を利用し得る。通信インターフェース710は、バス714を介してプロセッサ704などの構成要素と、バス714を介してアクセス不可能な構成要素との通信を容易にする。通信インターフェース710は、ネットワークポート、カード、ケーブル、または他の構成されたハードウェアデバイスとして具体化され得る。追加または代替として、人間入力/出力インターフェース712は、1つまたは複数のインターフェース構成要素に接続して、人間および/または電子デバイスとの間で情報(例えば、命令、データ、値など)を受信および/または提示する。入力/出力インターフェースに接続され得る入力/出力デバイス730の例としては、キーボード、マウス、トラックボール、プリンタ、ディスプレイ、センサ、スイッチ、リレー、スピーカ、マイクロフォン、スチルカメラおよび/またはビデオカメラなどが挙げられるが、これらに限定されない。別の実施形態では、通信インターフェース710は、人間入力/出力インターフェース712を備えるか、またはそれに含まれ得る。通信インターフェース710は、ネットワーク化された構成要素と直接通信するように、またはネットワーク720および/またはネットワーク724等の1つまたは複数のネットワークを利用するように構成されてもよい。
通信ネットワーク104は、全体的または部分的に、ネットワーク720として具体化されてもよい。ネットワーク720は、有線ネットワーク(例えば、Ethernet)、無線(例えば、WiFi、Bluetooth(登録商標)、セルラー等)ネットワーク、またはそれらの組み合わせであってもよく、デバイス702がネットワーク構成要素722と通信することを可能にする。他の実施形態では、ネットワーク720は、全体的または部分的に、電話ネットワーク(例えば、PSTN(public switched telephone network)、PBX(private branch exchange)、携帯電話ネットワーク等)として具体化されてもよい。
追加または代替として、1つまたは複数の他のネットワークが利用され得る。例えば、ネットワーク724は、デバイス702によって利用される構成要素との通信を容易にし得る第2のネットワークを表し得る。例えば、ネットワーク724は、コンタクトセンター102等のビジネスエンティティまたは他の組織への内部ネットワークであってもよいことであって、構成要素は信頼され(または少なくともより信頼され)、ネットワーク構成要素722は、信頼され得ない公衆ネットワーク(例えば、Internet)を備えるネットワーク720に接続され得る。
ネットワーク724に取り付けられた構成要素は、メモリ726、データストレージ728、入力/出力デバイス730、および/またはプロセッサ704がアクセス可能であり得る他の構成要素を含み得る。例えば、メモリ726および/またはデータストレージ728は、メモリ706および/またはデータストレージ708を完全にまたは特定のタスク若しくは目的のために補完または置き換えることができる。例えば、メモリ726および/またはデータストレージ728は、外部データリポジトリ(例えば、サーバーファーム、アレイ、「クラウド」など)であってもよく、デバイス702および/または他のデバイスがその上のデータにアクセスすることを可能にし得る。同様に、入力/出力デバイス730は、直接、ネットワーク724を介して、ネットワーク720のみを介して(不図示)、またはネットワーク724および720を介してのいずれかで、人間入力/出力インターフェース712を介して、および/または通信インターフェース710を介して、プロセッサ704によってアクセスされてもよい。メモリ706、データストレージ708、メモリ726、データストレージ728の各々は、データストレージデバイスを備える非一時的データストレージを備える。
コンピュータ可読データは、様々な構成要素によって送信、受信、記憶、処理、および提示され得ることを理解されたい。また、図示される構成要素は、本明細書に図示されるかどうかにかかわらず、他の構成要素を制御し得ることも理解されたい。例えば、1つの入力/出力デバイス730は、ルータ、スイッチ、ポート、または他の通信構成要素であってもよく、プロセッサ704の特定の出力が、ネットワーク720および/またはネットワーク724に関連付けられ得る入力/出力デバイス730を可能にして(または不可能にして)、ネットワーク720および/またはネットワーク724上の2つ以上のノード間の通信を可能にする(または不可能にする)ようになっている。例えば、特定の顧客通信デバイス108を使用する、ある特定の顧客間の接続は、特定のネットワーク構成要素722および/または特定のリソース112と可能(または不可能)にされ得る。同様に、ある特定のネットワーク構成要素722および/またはリソース112は、特定の実施形態において、デバイス702を含む特定の他のネットワーク構成要素722および/またはリソース112と通信することを可能(または不可能)にされてもよく、またはその逆であってもよい。当業者は、実施形態の範囲から逸脱することなく、本明細書で説明されるものに加えて、または代替として、他の通信機器が利用され得ることを理解するであろう。
前述の説明では、例示を目的として、方法を特定の順序で記載した。代替的な実施形態では、本方法は、実施形態の範囲から逸脱することなく、説明される順序とは異なる順序で実行され得ることを理解されたい。上述の方法は、本明細書で説明された1つまたは複数のアルゴリズムまたはその部分を実行する目的で構築されたハードウェア構成要素(例えば、回路)によって実行されるアルゴリズムとして実行され得ることも理解されたい。別の実施形態では、ハードウェア構成要素は、最初に専用マイクロプロセッサに変換される汎用マイクロプロセッサ(例えば、CPU、GPU)を備えてもよい。専用マイクロプロセッサは、次いで、符号化された信号をロードし、現在専用のマイクロプロセッサに機械可読命令を維持させ、マイクロプロセッサが、本明細書で説明されるアルゴリズムおよび/または他の命令から導出される機械可読命令のセットを読み取り、実行することを可能にした。アルゴリズムまたはその部分を実行するために利用される機械可読命令は、無制限ではないが、マイクロプロセッサに知られている命令の有限セットを利用する。機械可読命令は、信号生成構成要素内の信号または値としてマイクロプロセッサ内に符号化されてもよく、1つまたは複数の実施形態では、メモリ回路内の電圧、スイッチング回路の構成および/または特定の論理ゲート回路の選択的使用によって含まれてもよい。加えて、または代替として、機械可読命令は、マイクロプロセッサにアクセス可能であってもよく、磁場、電圧値、電荷値、反射/非反射部分、および/または物理的表示として媒体またはデバイスに符号化されてもよい。
別の実施形態では、マイクロプロセッサはさらに、単一のマイクロプロセッサ、マルチコアプロセッサ、複数のマイクロプロセッサ、分散処理システム(例えば、アレイ、ブレード、サーバーファーム、クラウド、多目的プロセッサアレイ、クラスタなど)のうちの1つまたは複数を備えてもよく、および/または他の処理動作を実行するマイクロプロセッサと同じ場所に配置されてもよい。任意の1つまたは複数のマイクロプロセッサは、単一の処理機器(例えば、コンピュータ、サーバー、ブレードなど)に統合されてもよく、または通信リンク(例えば、バス、ネットワーク、バックプレーン等、またはそれらの複数)を介して接続される個別構成要素に全体的または部分的に位置してもよい。
汎用マイクロプロセッサの例は、命令レジスタ(または命令を維持する他の回路)に符号化されたデータ値、またはメモリロケーションを備えるデータ値を有する中央処理装置(CPU)を備えることができ、メモリロケーションは命令として利用される値を備える。メモリロケーションは、CPUの外部にあるメモリロケーションをさらに含み得る。そのようなCPU外部構成要素は、フィールドプログラマブルゲートアレイ(FPGA)、読取り専用メモリ(ROM)、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、ランダムアクセスメモリ(RAM)、バスアクセス可能ストレージ、ネットワークアクセス可能ストレージなどのうちの1つまたは複数として具体化され得る。
これらの機械実行可能命令は、CD‐ROMまたは他のタイプの光ディスク、フロッピーディスク、ROM、RAM、EPROM、EEPROM、磁気もしくは光カード、フラッシュメモリまたは電子命令を記憶するのに適した他のタイプの機械可読媒体などの1つまたは複数の機械可読媒体に記憶されてもよい。代替的に、方法は、ハードウェアとソフトウェアとの組合せによって実行されてもよい。
別の実施形態では、マイクロプロセッサは、クライアントデバイス上のマイクロプロセッサおよびサーバー上のマイクロプロセッサ、それぞれのマイクロプロセッサを有するデバイスの集合、または共有もしくは遠隔処理サービス(例えば、クラウドベースのマイクロプロセッサ)等のシステムまたは処理ハードウェア構成要素の集合であってもよい。マイクロプロセッサのシステムは、処理タスクおよび/または共有もしくは分散処理タスクのタスク特有の割り当てを備えてもよい。さらに別の実施形態では、マイクロプロセッサは、ソフトウェアを実行して、異なるマイクロプロセッサまたは複数のマイクロプロセッサをエミュレートするためのサービスを提供することができる。その結果、ハードウェア構成要素の第1のセットから構成される第1のマイクロプロセッサは、第2のマイクロプロセッサのサービスを仮想的に提供することができ、それによって、第1のマイクロプロセッサに関連するハードウェアは、第2のマイクロプロセッサに関連する命令セットを使用して動作することができる。
機械実行可能命令は、特定の機械(例えば、パーソナルコンピュータ、モバイルコンピューティングデバイス、ラップトップなど)にローカルに記憶および実行され得るが、データおよび/または命令の記憶ならびに/あるいは命令の少なくとも一部分の実行は、遠隔データストレージおよび/もしくは処理デバイスまたはデバイスの集合への接続を介して提供され得ることを理解されたい、一般に「クラウド」として知られているが、パブリック、プライベート、専用、共有および/または他のサービスビュアー、コンピューティングサービスおよび/または「サーバーファーム」を含むことができる。
本明細書に記載されるマイクロプロセッサの例は、Qualcomm(登録商標)Snapdragon(登録商標)800および801、4G LTE統合および64ビットコンピューティングを伴うQualcomm(登録商標)Snapdragon(登録商標)610および615、64ビットアーキテクチャを伴うApple(登録商標)A7マイクロプロセッサ、Apple(登録商標)M7モーションコマイクロプロセッサ、Samsung(登録商標)Exynos(登録商標)シリーズ、Intel(登録商標)Core(商標)ファミリーのマイクロプロセッサ、マイクロプロセッサのIntel(登録商標)Xeon(登録商標)ファミリー、マイクロプロセッサのIntel(登録商標)Atom(商標)ファミリー、マイクロプロセッサのIntel Itanium(登録商標)ファミリー、Intel(登録商標)Core(登録商標)i5-4670Kおよびi7-4770K 22nm Haswell、Intel(登録商標)Core(登録商標)i5-3570K 22nm Ivy Bridge、マイクロプロセッサのAMD(登録商標)FX(登録商標)ファミリー、AMD(登録商標)FX-4300、FX-6300、およびFX-8350 32nm Vishera、AMD(登録商標)Kaveriマイクロプロセッサ、Texas Instruments(登録商標)Jacinto C6000(商標)オートモーティブインフォテインメントマイクロプロセッサ、Texas Instruments(登録商標)OMAP(商標)オートモーティブグレードモバイルマイクロプロセッサ、ARM(登録商標)Cortex(商標)-Mマイクロプロセッサ、ARM(登録商標)Cortex-AおよびARM926EJ-S(商標)マイクロプロセッサ、他の業界等価マイクロプロセッサは、任意の既知または将来開発される規格、命令セット、ライブラリ、および/またはアーキテクチャを使用して計算機能を実行し得る他の業界等価のマイクロプロセッサのうちの少なくとも1つを含み得るが、それらに限定されない。
本明細書で議論されるステップ、機能、および動作のうちのいずれかは、継続的かつ自動的に行われることができる。
本発明の例示的なシステムおよび方法は、通信およびメッセージを監視、向上、および装飾するための通信システムおよび構成要素ならびに方法に関連して説明された。しかし、本発明を不必要に曖昧にすることを避けるため、前の記述では多くの公知の構造およびデバイスを省略する。この省略は、特許請求される発明の範囲を限定するものと解釈してはならない。具体的な詳細は、本発明の理解を提供するために記載される。しかし、本発明は、本明細書に記載される具体的な詳細を越えて様々な方法で実施され得ることを理解されたい。
さらに、本明細書に示される例示的な実施形態は、並置されるシステムの様々な構成要素を示すが、システムのいくつかの構成要素は、LANおよび/もしくはInternetなどの分散型ネットワークの遠隔部分に、または専用システム内に遠隔配置することができる。したがって、システムの構成要素またはその部分(例えば、マイクロプロセッサ、メモリ/ストレージ、インターフェースなど)は、サーバー、複数のサーバー、コンピュータ、コンピューティングデバイス、端末、「クラウド」または他の分散処理などの1つまたは複数のデバイスに組み合わせることができ、あるいは分散型ネットワークの特定のノード上にコロケートすることができることを理解されたい。分散型ネットワークは、例えば、アナログおよび/またはデジタル電気通信ネットワーク、パケット交換ネットワーク、または回線交換ネットワークであり得る。別の実施形態では、構成要素は、複数の構成要素にわたって物理的または論理的に分散されてもよい(例えば、マイクロプロセッサは、1つの構成要素上の第1のマイクロプロセッサおよび別の構成要素上の第2のマイクロプロセッサを備えてもよく、それぞれ、共有タスクおよび/または割り当てられたタスクの一部分を実施する)。前の記述から、演算効率のため、システムの構成要素は、システムの動作に影響を及ぼすことなく、構成要素の分散型ネットワーク内のいずれの位置にも配置できることが理解されよう。例えば、さまざまな構成要素は、PBXおよびメディアサーバー、ゲートウェイなどのスイッチに、1つもしくは複数の通信デバイスに、1つもしくは複数のユーザの構内で、または、それらのいくつかの組合せで配置することができる。同様に、システムの1つまたは複数の機能部分は、電気通信デバイスと関連コンピューティングデバイスとの間で分散されてもよい。
さらに、要素を接続するさまざまなリンクは、有線リンクでも無線リンクでも、その任意の組合せでも、接続された要素へのおよび接続された要素からのデータの供給および/または通信が可能な他の任意の公知のまたは後に開発された要素でもあり得ることを理解されたい。これらの有線または無線リンクは、保護されたリンクであってもよく、暗号化された情報を通信できる場合もある。リンクとして使用される伝送媒体は、例えば、同軸ケーブル、銅線および光ファイバを含む任意の適切な電気信号のキャリアであってもよく、電波および赤外線データ通信中に生成されるものなどの音波または光波の形をとることができる。
また、特定のイベントシーケンスとの関連でフローチャートについて論じ示してきたが、本発明の動作に実質的に影響を及ぼすことなく、このシーケンスに対する変更、追加および省略が起こり得ることを理解されたい。
本発明の多くの変形および修正を使用することができる。他のものを提供することなく、本発明のいくつかの特徴を提供することが可能であろう。
さらに別の実施形態では、本発明のシステムおよび方法は、専用コンピュータ、プログラムされたマイクロプロセッサもしくはマイクロコントローラおよび周辺集積回路素子、ASICもしくは他の集積回路、デジタル信号マイクロプロセッサ、個別素子回路などの配線電子もしくは論理回路、PLD、PLA、FPGA、PALなどのプログラム可能論理デバイスもしくはゲートアレイ、専用コンピュータ、任意の同等の手段などと併せて実施することができる。一般的に、本明細書で説明される方法論を実装することが可能な任意のデバイスまたは手段が、本発明の様々な態様を実装するために使用されることができる。本発明に使用できる例示的なハードウェアは、コンピュータ、携帯用デバイス、電話(例えば、携帯電話、インターネット可能な電話、デジタル、アナログ、ハイブリッドおよびその他)および当技術分野で知られている他のハードウェアを含む。これらのデバイスのいくつかは、マイクロプロセッサ(例えば、単一または複数のマイクロプロセッサ)、メモリ、不揮発性記憶装置、入力デバイスおよび出力デバイスを含む。さらに、これらに限定されないが、分散処理もしくは構成要素/オブジェクト分散処理、並列処理または仮想マシン処理を含む代替のソフトウェア実装形態は、1つまたは複数の処理構成要素によって提供される本明細書に記載される方法を実施するよう構築することもできる。
さらに別の実施形態では、開示される方法は、さまざまなコンピュータまたはワークステーションプラットフォームで使用することができるポータブルソースコードを提供するオブジェクトまたはオブジェクト指向ソフトウェア開発環境を使用するソフトウェアと併せて容易に実施することができる。または、開示されるシステムは、標準論理回路またはVLSI設計を使用してハードウェアで部分的または完全に実装することができる。本発明に従ってシステムの実装にソフトウェアまたはハードウェアを使用するかどうかは、システムの速度および/または効率要件、特定の機能ならびに利用する特定のソフトウェアまたはハードウェアシステムまたはマイクロプロセッサまたはマイクロコンピュータシステムに依存する。
さらなる別の実施形態では、開示される方法は、記憶媒体に記憶することができ、コントローラおよびメモリと協働してプログラムされた汎用コンピュータ、専用コンピュータ、マイクロプロセッサおよび同様のもの上で実行されるソフトウェアで部分的に実施することができる。これらの例では、本発明のシステムおよび方法は、アプレット、JAVA(登録商標)またはCGIスクリプトなどのパーソナルコンピュータに組み込まれたプログラムとして、サーバーまたはコンピュータワークステーション上に常駐するリソースとして、専用測定システム、システム構成要素または同様のものに組み込まれたルーチンとして実施することができる。また、システムは、ソフトウェアおよび/またはハードウェアシステムにシステムおよび/または方法を物理的に組み込むことによっても実装することができる。
ソフトウェアを備える本明細書の実施形態は、1つまたは複数のマイクロプロセッサによって、実行され、後続の実行のために記憶されまたは実行可能コードとして実行される。実行可能コードは、特定の実施形態を備える命令を実行するように選択される。実行される命令は、マイクロプロセッサによって理解され、実行前にマイクロプロセッサアクセス可能メモリにコミットされるネイティブ命令の個別的なセットから選択される命令の制約セットである。別の実施形態では、人間が読み取り可能な「ソースコード」ソフトウェアは、1つまたは複数のマイクロプロセッサによる実行の前に、最初にシステムソフトウェアに変換されて、プラットフォームのネイティブ命令セットから選択される命令のプラットフォーム(例えば、コンピュータ、マイクロプロセッサ、データベースなど)固有セットを備える。
本発明は、特定の規格およびプロトコルを参照して、実施形態で実装される構成要素および機能を説明するが、本発明は、そのような規格およびプロトコルに限定されない。本明細書で言及されない他の同様の規格およびプロトコルも存在し、本発明に含まれるものと考えられる。さらに、本明細書で言及される規格およびプロトコルならびに本明細書で言及されない他の同様の規格およびプロトコルは、本質的に同じ機能を有するより速いまたはより効果的な均等物に定期的に取って代わられる。同じ機能を有するそのような取って代わる規格およびプロトコルは、本発明に含まれる均等物と考えられる。
本発明は、さまざまな実施形態、構成および態様において、さまざまな実施形態、サブコンビネーションおよびそれらのサブセットを含む、実質的に本明細書に描写および記載される構成要素、方法、プロセス、システムおよび/または装置を含む。当業者は、本開示を理解した後、本発明をどのように生産し使用するかを理解するであろう。本発明は、様々な実施形態、構成、および態様において、本明細書に描写および/または記載されていない項目なしで、または本明細書の様々な実施形態、構成、または態様において、デバイスおよびプロセスを提供することを含み、例えば、性能を改善し、容易さを達成し、および/または実装コストを低減するために、過去のデバイスまたはプロセスで使用された可能性があるようなアイテムなしを含む。
本発明の上述の記載は、例示と説明を目的として提示してきた。上述の記載は、本発明を本明細書に開示される単数または複数の形態に限定することを意図しない。上述の発明を実施するための形態は、例えば、本開示を合理化する目的で、1つまたは複数の実施形態、構成、または態様で、本発明のさまざまな特徴が一緒に分類される。本発明の実施形態、構成、または態様の特徴は、上述の記載で論じられたもの以外の代替の実施形態、構成、または態様で組み合わせられてもよい。この開示の方法は、特許請求される発明が、各請求項に明確に列挙されるよりも多くの特徴を必要とするという意図を反映するものとして解釈されるべきではない。むしろ、以下の特許請求の範囲が反映するように、発明の態様は、単一の前述の開示された実施形態、構成、または態様のすべての特徴よりも少ないことにある。したがって、以下の請求項は、本明細書によって、この発明を実施するための形態に組み込まれ、各請求項は、本発明の別個の好ましい実施形態としてそれ自体を主張する。
さらに、本発明の説明は、1つまたは複数の実施形態、構成、または態様の説明ならびに変形形態および変更形態を含み、例えば、本開示を理解した後で、当業者の技能および知識の範囲内となり得るような他の変形形態、組合せおよび変更形態は本発明の範囲内である。許可される範囲の代替の実施形態、構成または態様を含む権利を得ることを意図し、そのような代替的な、交換可能なおよび/または均等な構造、機能、範囲または工程が本明細書で開示されるか否かにかかわらず、いかなる特許可能な対象物も公的に献納することを意図することなく、特許請求されたものに対する代替的な、交換可能なおよび/または均等な構造、機能、範囲または工程を含む。

Claims (10)

  1. ネットワークへのネットワークインターフェースと、
    非一時的記憶媒体に維持された機械可読命令とともに構成されたプロセッサとを備えるシステムであって、前記機械可読命令は、
    エージェント通信デバイスを利用するエージェントと顧客通信デバイスを利用する顧客との間の通信を監視するステップであって、前記通信は前記ネットワークを介して送信される符号化オーディオ信号を備えるステップと、
    前記通信の目的にアクセスするステップと、
    複数のオーディオエンハンスメントから、前記通信の目的に対応するオーディオエンハンスメントを選択するステップと、
    前記符号化オーディオ信号の一部に備えるために、前記オーディオエンハンスメントを前記通信に挿入するステップとを前記プロセッサにさせることを特徴とするシステム。
  2. 前記符号化オーディオ信号は、前記エージェントまたは前記顧客の少なくとも1つからのスピーチと同時にオーディオエンハンスメントを備えることを特徴とする請求項1に記載のシステム。
  3. 前記オーディオエンハンスメントは、ボリューム、テンポ、ペース、ピッチ、フェードイン速度、フェードアウト速度、最大ボリュームまたは最小ボリュームのうちの少なくとも1つを備える前記オーディオエンハンスメントの属性をさらに備えることを特徴とする請求項1に記載のシステム。
  4. 前記命令は、
    前記顧客の現在の感情を判断するステップであって、前記現在の感情は前記通信中に前記顧客によって提示される明示的な感情であるステップをさらに備える前記通信の前記目的にアクセスするステップと、
    前記顧客の所望の感情を判断するステップと、
    前記現在の感情を有する対象者が前記所望の感情に移行するという結果になると過去に判断された感情鎮静属性に対応する前記オーディオエンハンスメントを選択するステップとを前記プロセッサにさらにさせることを特徴とする請求項1に記載のシステム。
  5. 前記オーディオエンハンスメントを選択するステップを前記プロセッサにさせる前記命令は、前記顧客の人口統計学的属性に従って前記オーディオエンハンスメントを選択するステップを前記プロセッサにさせるステップをさらに備えることを特徴とする請求項1に記載のシステム。
  6. 前記命令は、
    前記顧客にタスクを実行させるステップをさらに備える前記通信の前記目的にアクセスするステップと、
    前記タスクの関連サウンドに対応する前記オーディオエンハンスメントを選択するステップとを前記プロセッサにさらにさせることを特徴とする請求項1に記載のシステム。
  7. 前記命令は、
    前記エージェントと前記顧客との間の前記通信の第2の部分を監視するステップであって、前記通信の前記第2の部分は、前記オーディオエンハンスメントの挿入と同時に生じるステップと、
    前記顧客によって提供される前記通信のコンテンツに従って前記通信の前記目的を更新するステップと、
    前記顧客によって提供される前記通信の前記コンテンツが前記オーディオエンハンスメントと矛盾することを判断すると、前記オーディオエンハンスメントを修正するステップとを前記プロセッサにさらにさせることを特徴とする請求項1に記載のシステム。
  8. 前記命令は、前記オーディオエンハンスメントの挿入を終了すること、前記オーディオエンハンスメントの前記コンテンツを変更すること、前記オーディオエンハンスメントの前記ペースを変更すること、前記オーディオエンハンスメントの前記ボリュームを変更すること、または前記オーディオエンハンスメントの前記ピッチを変更することの1つまたは複数を備えるオーディオエンハンスメントの修正を前記プロセッサにさせることを特徴とする請求項7に記載のシステム。
  9. ネットワークへのネットワークインターフェースと、
    非一時的記憶媒体に維持された機械可読命令とともに構成されたプロセッサとを備えるシステムであって、前記機械可読命令は、
    エージェント通信デバイスを利用するエージェントと顧客通信デバイスを利用する顧客との間の通信を監視するステップであって、前記通信は前記ネットワークを介して送信される符号化オーディオ信号を備えるステップと、
    前記通信の目的にアクセスするステップと、
    複数のオーディオエンハンスメントから、前記通信の目的に対応するオーディオエンハンスメントを選択するように訓練されたニューラルネットワークに前記通信の前記目的を提供するステップと、
    前記ニューラルネットワークから、前記オーディオエンハンスメントを取得するステップと、
    前記符号化オーディオ信号の一部に備えるために、前記オーディオエンハンスメントを前記通信に挿入するステップとを前記プロセッサにさせることを特徴とするシステム。
  10. 前記ニューラルネットワークはオーディオエンハンスメントを選択するように訓練され、
    過去のいくつかの顧客と対応する数の過去のエージェントとの間の過去の通信のセットにアクセスするステップと、
    過去の通信の修正されたセットを生成するために、ワードを同義のワードに置換すること、ワードを同義のフレーズに置換すること、前記目的に関連するオブジェクトに対する前記通信の目的を置換すること、前記通信の前記目的に関連する前記オブジェクトを目的に置換すること、少なくとも1つの冗長ワードを挿入すること、または少なくとも1つの冗長ワードを除去することの1つまたは複数を含む1つまたは複数の変換を過去の通信の前記セットの各過去の通信に適用するステップと、
    前記過去の通信のセット、前記修正された過去の通信のセットおよび前記目的に関連しないと過去に判断された異なる目的のセットを備える第1の訓練セットを作成するステップと、
    前記第1の訓練セットを使用して第1の状態の前記ニューラルネットワークを訓練するステップと、
    前記第1の訓練セットおよび前記目的に関連すると誤って識別された前記目的に関連がないと過去に判断された異なる目的の前記セットを備える第2の状態のための第2の訓練セットを作成するステップと、
    前記第2の訓練セットを使用して前記第2の状態の前記ニューラルネットワークを訓練するステップとをさらに備えることを特徴とする請求項11に記載のシステム。
JP2022036751A 2021-03-15 2022-03-10 コンテキストアウェアオーディオエンハンスメントのためのシステムおよび方法 Active JP7392017B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/201,238 2021-03-15
US17/201,238 US11743380B2 (en) 2021-03-15 2021-03-15 System and method for context aware audio enhancement

Publications (2)

Publication Number Publication Date
JP2022141599A true JP2022141599A (ja) 2022-09-29
JP7392017B2 JP7392017B2 (ja) 2023-12-05

Family

ID=83005698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022036751A Active JP7392017B2 (ja) 2021-03-15 2022-03-10 コンテキストアウェアオーディオエンハンスメントのためのシステムおよび方法

Country Status (4)

Country Link
US (1) US11743380B2 (ja)
JP (1) JP7392017B2 (ja)
DE (1) DE102022202150A1 (ja)
FR (1) FR3120725A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220270626A1 (en) * 2021-02-22 2022-08-25 Tencent America LLC Method and apparatus in audio processing
US20230153054A1 (en) * 2021-11-12 2023-05-18 Twitter, Inc. Audio processing in a social messaging platform

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004320573A (ja) * 2003-04-18 2004-11-11 Matsushita Electric Ind Co Ltd コンピュータテレホニーシステム
US20050119893A1 (en) * 2000-07-13 2005-06-02 Shambaugh Craig R. Voice filter for normalizing and agent's emotional response
JP2005352151A (ja) * 2004-06-10 2005-12-22 National Institute Of Information & Communication Technology 人間の感情状態に応じた音楽出力装置及び音楽出力方法
JP2006171133A (ja) * 2004-12-14 2006-06-29 Sony Corp 楽曲データ再構成装置、楽曲データ再構成方法、音楽コンテンツ再生装置および音楽コンテンツ再生方法
CN111489765A (zh) * 2019-01-28 2020-08-04 国家电网有限公司客户服务中心 一种基于智能语音技术的话务服务质检方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5425130A (en) * 1990-07-11 1995-06-13 Lockheed Sanders, Inc. Apparatus for transforming voice using neural networks
US6125175A (en) * 1997-09-18 2000-09-26 At&T Corporation Method and apparatus for inserting background sound in a telephone call
US20040125965A1 (en) * 2002-12-27 2004-07-01 William Alberth Method and apparatus for providing background audio during a communication session
US20070041582A1 (en) * 2005-08-22 2007-02-22 Lam Bin W Methods and systems for enabling users to inject sound effects into telephone conversations
WO2007095238A2 (en) * 2006-02-10 2007-08-23 Razz, Inc. Inserting content into a connection using an intermediary
US7983910B2 (en) * 2006-03-03 2011-07-19 International Business Machines Corporation Communicating across voice and text channels with emotion preservation
US8229078B2 (en) * 2007-04-19 2012-07-24 At&T Mobility Ii Llc Background noise effects
US20100235218A1 (en) 2008-09-29 2010-09-16 Avaya Inc. Pre-qualified or history-based customer service
US8964958B2 (en) 2009-05-20 2015-02-24 Avaya Inc. Grid-based contact center
US20110125826A1 (en) 2009-11-20 2011-05-26 Avaya Inc. Stalking social media users to maximize the likelihood of immediate engagement
US20110125793A1 (en) 2009-11-20 2011-05-26 Avaya Inc. Method for determining response channel for a contact center from historic social media postings
US8634543B2 (en) 2010-04-14 2014-01-21 Avaya Inc. One-to-one matching in a contact center
WO2014028891A1 (en) 2012-08-17 2014-02-20 Be Labs, Llc Music generator
US9031838B1 (en) * 2013-07-15 2015-05-12 Vail Systems, Inc. Method and apparatus for voice clarity and speech intelligibility detection and correction
US9728202B2 (en) * 2013-08-07 2017-08-08 Vonage America Inc. Method and apparatus for voice modification during a call
US9578070B2 (en) * 2014-07-17 2017-02-21 Cellco Partnersip Method for inserting background audio into voice/video call
US9172805B1 (en) * 2014-12-03 2015-10-27 United Services Automobile Association (Usaa) Edge injected speech in call centers
US9596349B1 (en) * 2015-06-29 2017-03-14 State Farm Mutual Automobile Insurance Company Voice and speech recognition for call center feedback and quality assurance
US10382609B1 (en) * 2016-06-28 2019-08-13 Steve Antoine System for sharing sounds from a smartphone during a voice call
US10586079B2 (en) * 2016-12-23 2020-03-10 Soundhound, Inc. Parametric adaptation of voice synthesis
US11133010B1 (en) * 2018-01-23 2021-09-28 United Services Automobile Association (Usaa) Intelligent agent for interactive service environments
US10922738B2 (en) 2018-05-15 2021-02-16 Dell Products, L.P. Intelligent assistance for support agents
US11120812B1 (en) * 2020-07-31 2021-09-14 Cresta Intelligence Inc. Application of machine learning techniques to select voice transformations

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050119893A1 (en) * 2000-07-13 2005-06-02 Shambaugh Craig R. Voice filter for normalizing and agent's emotional response
JP2004320573A (ja) * 2003-04-18 2004-11-11 Matsushita Electric Ind Co Ltd コンピュータテレホニーシステム
JP2005352151A (ja) * 2004-06-10 2005-12-22 National Institute Of Information & Communication Technology 人間の感情状態に応じた音楽出力装置及び音楽出力方法
JP2006171133A (ja) * 2004-12-14 2006-06-29 Sony Corp 楽曲データ再構成装置、楽曲データ再構成方法、音楽コンテンツ再生装置および音楽コンテンツ再生方法
CN111489765A (zh) * 2019-01-28 2020-08-04 国家电网有限公司客户服务中心 一种基于智能语音技术的话务服务质检方法

Also Published As

Publication number Publication date
FR3120725A1 (fr) 2022-09-16
US20220294904A1 (en) 2022-09-15
US11743380B2 (en) 2023-08-29
JP7392017B2 (ja) 2023-12-05
DE102022202150A1 (de) 2022-09-15

Similar Documents

Publication Publication Date Title
US11563850B2 (en) Automated call requests with status updates
US11915707B1 (en) Outcome-oriented dialogs on a speech recognition platform
US11922925B1 (en) Managing dialogs on a speech recognition platform
US10171659B2 (en) Customer portal of an intelligent automated agent for a contact center
AU2014233357B2 (en) Intelligent automated agent for a contact center
US10827064B2 (en) Automated call requests with status updates
JP7392017B2 (ja) コンテキストアウェアオーディオエンハンスメントのためのシステムおよび方法
CN112313930A (zh) 管理保持的方法和装置
US11663791B1 (en) Dynamic avatars for customer support applications
US20230388420A1 (en) Adaptive cloud conversation ecosystem
US11743387B2 (en) System and method for an adaptive cloud conversation platform
US20230328121A1 (en) Modular Technologies for Servicing Telephony Systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220427

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231122

R150 Certificate of patent or registration of utility model

Ref document number: 7392017

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150