JP5860085B2 - 通話録音サーバ、通話データ管理システム、および通話データ管理方法 - Google Patents

通話録音サーバ、通話データ管理システム、および通話データ管理方法 Download PDF

Info

Publication number
JP5860085B2
JP5860085B2 JP2014053355A JP2014053355A JP5860085B2 JP 5860085 B2 JP5860085 B2 JP 5860085B2 JP 2014053355 A JP2014053355 A JP 2014053355A JP 2014053355 A JP2014053355 A JP 2014053355A JP 5860085 B2 JP5860085 B2 JP 5860085B2
Authority
JP
Japan
Prior art keywords
call
voice
data
server
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014053355A
Other languages
English (en)
Other versions
JP2015177411A (ja
Inventor
政悟 新井
政悟 新井
満 堤
満 堤
健 森脇
健 森脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Media Inc
Original Assignee
Advanced Media Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Media Inc filed Critical Advanced Media Inc
Priority to JP2014053355A priority Critical patent/JP5860085B2/ja
Priority to KR1020167022114A priority patent/KR20160100412A/ko
Priority to CN201580012625.2A priority patent/CN106068641B/zh
Priority to KR1020177024362A priority patent/KR101826918B1/ko
Priority to PCT/JP2015/001338 priority patent/WO2015141189A1/ja
Priority to TW104108398A priority patent/TWI569619B/zh
Publication of JP2015177411A publication Critical patent/JP2015177411A/ja
Application granted granted Critical
Publication of JP5860085B2 publication Critical patent/JP5860085B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1083In-session procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、IP電話網における通話音声のデータを記録して管理する、通話録音サーバ、通話データ管理システム、および通話データ管理方法に関する。
従来、コールセンターにおけるサービス品質の向上等の様々な目的で、通話内容を確認あるいは監視(以下「監視」という)することが行われている。また、近年、VoIP(Voice over Internet Protocol)技術を使用したIP電話の普及が進んでいる。このため、IP電話網における通話音声のデータを記録して管理するための様々な技術が存在している(例えば、特許文献1参照)。
特許文献1に記載の技術(以下「従来技術」という)において、コールセンターのオペレータ端末は、電話対応が終了した後にオペレータによって作成される業務履歴情報と、通話音声の音声データに対する音声認識処理の結果である音声認識情報とを、サーバに送信する。管理者の端末は、業務履歴情報および音声認識情報を取得し、管理者に提示する。
かかる従来技術によれば、IP電話網における通話音声に対する音声認識結果を、通話が終了した後に管理者が確認することができる。すなわち、従来技術を用いることにより、IP電話の通話内容を監視することができる。
特開2008−211271号公報
しかしながら、各通話が終了した後に、確認が必要な通話をピックアップし、ピックアップされた通話の音声データを検索して、蓄積された音声認識結果や音声データを確認するといった作業は、手間が掛かる。大規模なコールセンターのようにIP電話機の個数が多い場合、サーバに蓄積される上記業務履歴情報および音声認識情報の量も多くなり、かかる作業は、非常に煩雑なものとなる。したがって、従来技術は、監視対象となるIP電話機の個数が多いケースに適用することが難しい。
本発明の目的は、より簡単に多数のIP電話機の通話内容を監視することを可能にする、通話録音サーバ、通話データ管理システム、および通話データ管理方法を提供することである。
本開示の通話録音サーバは、IP電話網で伝送される通話の音声データを、順次取得してメモリに記録する音声記録制御部と、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、取得された前記通話開始タイミングの直後に、記録された前記音声データに対する音声認識処理を開始させる音声認識制御部と、を有する。
本開示の通話データ管理システムは、IP電話網で伝送される通話の音声データを記録する通話録音サーバと、記録された前記音声データに対する音声認識処理を行い、前記音声認識処理の結果であるテキストデータを生成する音声認識サーバと、記録された前記音声データと生成された前記テキストデータとを、対応付けて提示するモニタリング装置と、を有する通話データ管理システムであって、前記通話録音サーバは、IP電話網から前記音声データを順次取得してメモリに記録する音声記録制御部と、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、記録された前記音声データを前記音声認識サーバへ出力し、前記音声認識サーバに対して、取得された前記通話開始タイミングの直後に、前記音声データに対する音声認識処理を開始させる音声認識制御部と、を有する。
本開示の通話データ管理方法は、IP電話網で伝送される通話の音声データを、順次取得してメモリに記録するステップと、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得するステップと、取得された前記通話開始タイミングの直後に、記録された前記音声データに対する音声認識処理を開始させるステップと、を有する。
本開示によれば、IP電話網で伝送される通話の音声データに対する音声認識処理を、通話開始タイミングの直後から開始するので、音声認識結果を、通話の最中に、ほぼリアルタイムに提示することができる。したがって、本開示によれば、より簡単に多数のIP電話機の通話内容を監視することを可能にする。
本発明の一実施の形態に係る通話データ管理システムを含む通信システムの構成の一例を示すシステム構成図 本実施の形態に係る通話録音サーバの構成の一例を示すブロック図 本実施の形態に係る通話録音サーバの動作の一例を示すフローチャート 本実施の形態に係る通信システムの動作の流れの一例を示すシーケンス図
以下、本発明の一実施の形態について、図面を参照して詳細に説明する。本実施の形態は、本発明を、多数のIP電話機を配置したコールセンターの通話監視システムに適用した場合の、具体的態様の一例である。
<システム構成>
まず、本実施の形態に係る通話データ管理システムを含む通信システムの構成について説明する。
図1は、本実施の形態に係る通話データ管理システムを含む通信システムの構成の一例を示すシステム構成図である。
図1において、通信システム100は、外線網200、内線網300、および通話管理網400を有する。
外線網200は、インターネット等の公共網であり、コールセンターの顧客が使用するIP端末(図示せず)が接続された通信ネットワークである。すなわち、外線網200は、コールセンターが形成するIP電話網の一部を構成する。
内線網300は、コールセンターに構築されたLAN(Local Area Network)等の通信ネットワークの一部である。内線網300は、第1〜第Nの電話機310〜310、ネットワーク機器320、およびPBX(Private Branch eXchange)装置330を有する。
各電話機310は、顧客対応を行うオペレータが使用するIP電話機である。第1〜第Nの電話機310〜310は、ネットワーク機器320を介してそれぞれPBX(Private Branch eXchange)装置330に接続されている。
ネットワーク機器320は、各電話機310とPBX330との間で、IPパケットの転送を行う中継装置であり、例えば、スイッチングハブ、TAPボックス、あるいはルータである。但し、ネットワーク機器320は、ポートミラーリング等の機能により、転送するIPパケットの複製を、通話管理網400へ送信する。
PBX装置330は、構内交換機であり、外線網200に接続されている。PBX装置330は、第1〜第Nの電話機310〜310を宛先とするIPパケットを外線網200から受信し、ネットワーク機器320へ転送する。また、PBX装置330は、外線網200のIP電話機(図示せず)を宛先とするIPパケットをネットワーク機器320から受信し、外線網200へ転送する。
すなわち、内線網300は、IP電話網の一部を構成し、コールセンターで行われる多数の通話のIPパケットを伝送しつつ、伝送するIPパケットの複製を通話管理網400へ送信する。
通話管理網400は、例えば、コールセンターに構築されたLAN等の通信ネットワークの一部であり、本発明の通話データ管理システムに対応する部分である。通話管理網400は、通話録音サーバ410、管理サーバ420、音声認識サーバ430、およびモニタリング装置440を有する。
なお、各装置の接続関係は、図1に示す接続線に限定されない。各装置は、例えば、LANにそれぞれ接続されており、どの装置の間でも通信が可能となっている。
通話録音サーバ410は、内線網300のネットワーク機器320に接続されている。通話録音サーバ410は、ネットワーク機器320から送信されるIPパケットを受信し、受信したIPパケットから通話の音声データを抽出して、記録する。すなわち、通話録音サーバ410は、IP電話網で伝送される通話の音声データを記録する。
図2は、通話録音サーバ410の構成の一例を示すブロック図である。
図2において、通話録音サーバ410は、電話網通信部411、管理網通信部412、メモリ413、音声記録制御部414、通話開始取得部415、および音声認識制御部416を有する。
電話網通信部411は、内線網300の通信ネットワークに接続するための通信インタフェースであり、ネットワーク機器320に接続されている。電話網通信部411は、ネットワーク機器320から送信されるIPパケットを受信し、受信したIPパケットを、逐次、音声記録制御部414および通話開始取得部415へ出力する。
管理網通信部412は、通話管理網400の通信ネットワークに接続するための通信インタフェースであり、管理サーバ420、音声認識サーバ430、およびモニタリング装置440に接続されている。
メモリ413は、ハードディスク等の記録媒体であり、音声記録制御部414から格納される情報を、読み出し可能に保持する。
音声記録制御部414は、入力されたIPパケットを解析し、IPパケットのそれぞれから、音声データ(通話音声信号)および制御情報(通信制御信号)を抽出する。そして、音声記録制御部414は、抽出した音声データを、制御情報等の音声データを特定する情報と対応付けて、逐次、メモリ413に格納させる。すなわち、音声記録制御部414は、IP電話網から音声データを順次取得して、メモリ413に記録する。
音声データは、通話における双方の話者の発話音声を含む音響データである。制御情報は、音声データに付随する情報であり、通話識別情報、話者識別情報、および時刻情報を含む。通話識別情報は、通話を識別するための情報である。話者識別情報は、音声データに含まれる発話音声の話者(IP電話機)を識別するための情報である。時刻情報は、音声データが対応する時刻を示す情報である。制御情報は、IPパケットのヘッダ部分から取得されてもよいし、IPパケットのペイロード部分から取得されてもよい。
通話開始取得部415は、入力されたIPパケットを解析し、IPパケットのそれぞれから、通話識別情報を含む制御情報を抽出する。通話開始取得部415は、抽出した制御情報に基づいて、通話毎に、電話網通信部411が当該通話のIPパケットを最初に受信したタイミングを特定する。通話開始取得部415は、特定された前記タイミングを、当該通話が開始されたタイミング(以下「通話開始タイミング」という)として取得する。そして、通話開始取得部415は、通話開始タイミングを取得する毎に、通話開始タイミングである事を、対応する通話の制御情報と共に、音声認識制御部416へ通知する。
なお、通話開始取得部415は、制御情報に、通話開始時刻を示す情報等、通話開始タイミングを直接的に示す情報が含まれている場合、かかる情報から通話開始タイミングを取得してもよい。
また、IPパケットからの音声データおよび制御情報の抽出は、電話網通信部411で行われてもよい。
音声認識制御部416は、通話開始タイミングである事を通知されると、音声データ管理網通信部412を介して、管理サーバ420に対し、通話開始タイミングである事を示す通話開始通知を送信する。通話開始通知には、例えば、制御情報が含まれる。
また、音声認識制御部416は、音声データ管理網通信部412を介して、音声データの送信の要求(以下「音声送信要求」という)を受信すると、メモリ413に記録された、要求の対象となる音声データを、要求元へ返信する。音声送信要求には、制御情報等の音声データを特定する情報が含まれる。また、音声送信要求は、例えば、音声認識サーハ゛430およびモニタリング装置440から送信される。音声送信要求は、例えば、通話識別情報を指定して、対応する通話の音声データが格納され次第、当該音声データを逐次返信することを要求する内容である。
後述するが、通話開始通知が送信されると、管理サーバ420の管理機能により、音声認識サーバ430は、通話録音サーバ410に対して音声データを要求し、返信された音声データに対する音声認識処理を開始する。
すなわち、音声認識制御部416は、通話開始通知の送信の結果、記録された音声データを音声認識サーバ430へ出力し、通話開始タイミングの直後に、メモリ413に記録された音声データに対する音声認識サーバ430の音声認識処理を、開始させる。
図1の管理サーバ420は、通話録音サーバ410から送信された通話開始通知を受信することにより、通話開始タイミングを取得する。そして、管理サーバ420は、取得された通話開始タイミングに基づいて、通話録音サーバ410、音声認識サーバ430、およびモニタリング装置440のそれぞれの動作タイミングを制御する。
より具体的には、管理サーバ420は、通話開始通知を受信すると、通話開始通知に含まれる制御情報に基づいて、通話開始通知が示す通話の音声データに対して、音声認識処理を行うか否かを決定する。
そして、管理サーバ420は、音声認識を行うと判断した場合、音声認識サーバ430に対して、通話録音サーバ410に記録された音声データに対する音声認識処理の開始の要求(以下「認識開始要求」という)を送信する。認識開始要求には、制御情報等の音声データを特定する情報が含まれる。
また、管理サーバ420は、音声認識を行うと判断した場合、モニタリング装置440に対して、通話開始通知を転送する。更に、管理サーバ420は、音声認識サーバ430から、音声認識処理が開始された旨の通知(以下「認識開始通知」という)を受信すると、当該認識開始通知を、モニタリング装置へ転送する。認識開始通知には、制御情報等の音声データを特定する情報が含まれる。
音声認識サーバ430は、認識開始要求を受信すると、通話録音サーバ410に対して、認識開始要求と同一の音声データを対象とした、音声送信要求を送信する。そして、音声認識サーバ430は、通話録音サーバ410から返信された音声データに対する音声認識処理を行い、音声認識処理の結果であるテキストデータを生成し、音声認識サーバ430のメモリ(図示)に格納する。
音声認識サーバ430は、公知の音声認識技術による音声認識処理を行う。例えば、音声認識サーバは、音声認識データベース、音響分析部、および認識デコーダ部を有する(いずれも図示せず)。
音声認識データベースは、音響モデル、辞書、および言語モデルを予め格納している。音響モデルは、音声の特徴量と発音記号との確率的な対応付けをデータ化したものである。辞書は、音声認識処理による音声認識結果の候補群として、複数のテキスト配列を記述したものである。言語モデルは、辞書に記述されたテキスト配列のそれぞれについて、出現確率や接続確率をデータ化したものである。
音響分析部は、音声信号に対してフレーム処理を行い、フレームごとにフーリエ解析を含む所定の処理を行って、音声特徴量を抽出する。そして、音響分析部は、解析結果から、発話音声が含まれている音声区間を検出し、音声区間の音声特徴量のみによる時系列データを生成する。
認識デコーダ部は、音響分析部が生成した音声特徴量の時系列データに基づき、音声認識データベースの音響モデル、辞書、および言語モデルを参照して、音声認識結果を決定する。
なお、音声認識結果には、音声認識が成功した場合、発話音声をテキスト化したテキストデータが含まれる。すなわち、音声認識サーバ430は、通話録音サーバ410に記録された音声データに対する音声認識処理を行い、音声認識処理の結果であるテキストデータを生成する。
また、音声認識サーバ430は、モニタリング装置440から、テキストデータ送信の要求(以下「認識結果送信要求」という)を受信すると、保存された、要求の対象となる音声データの音声認識結果を、モニタリング装置440へ返信する。認識結果送信要求には、基の音声データの制御情報等の音声データを特定する情報が含まれる。認識結果送信要求は、例えば、通話識別情報を指定して、対応する通話の音声認識結果が生成され次第、当該音声認識結果を逐次返信することを要求する内容である。
モニタリング装置440は、コールセンターの各通話を監視する管理者が使用するパーソナルコンピュータのうち、ウェブブラウザとして機能する部分である。モニタリング装置440は、管理サーバ420から通話開始通知を受信すると、通話録音サーバ410に対して音声送信要求を送信し、音声認識サーバ430に対して認識結果送信要求を送信する。
そして、モニタリング装置440は、通話録音サーバ410から返信された音声データと、音声認識サーバ430から返信された音声認識結果のうち少なくともテキストデータとを、液晶ディスプレイ等の表示部に対応付けて表示する。すなわち、モニタリング装置440は、通話開始タイミングの直後から、音声データとその音声認識結果(テキストデータ)とを、管理者に対し、対応付けて提示する。
なお、通話録音サーバ410、管理サーバ420、音声認識サーバ430、およびモニタリング装置440のそれぞれは、図示しないが、例えば、CPU(Central Processing Unit)、制御プログラムを格納したROM(Read Only Memory)等の記憶媒体、RAM(Random Access Memory)等の作業用メモリ、および通信回路等を有する。この場合、上記した各装置および各部の機能は、CPUが制御プログラムを実行することにより実現される。
このような通信システム100において、通話録音サーバ410は、IP電話網で伝送される通話の音声データを、ストリーミングで音声認識サーバ430に提供することができる。そして、音声認識サーバ430は、音声データに対する音声認識結果を、ストリーミングでモニタリング装置440に提供することができる。
すなわち、通信システム100は、音声認識処理および音声認識結果の提示を、通話開始タイミングの直後から開始することができるので、音声認識結果を、通話の最中にほぼリアルタイムに提示することができる。
<通話録音サーバの動作>
次に、通話録音サーバの動作について説明する。
図3は、通話録音サーバ410の動作の一例を示すフローチャートである。
まず、ステップS1100において、電話網通信部411は、外線網200からIPパケットを受信したか否かを判断する。電話網通信部411は、IPパケットを受信した場合(S1100:YES)、処理をステップS1200へ進める。また、電話網通信部411は、IPパケットを受信していない場合(S1100:NO)、処理を後述のステップS1500へ進める。
ステップS1200において、音声記録制御部414は、IPパケットから音声データを抽出し、音声データを、制御情報等の音声データを特定する情報と対応付けて、メモリ413に記録する。また、通話開始取得部415は、IPパケットから制御情報を抽出する。
そして、ステップS1300において、通話開始取得部415は、制御情報に基づき、通話開始タイミングであるか否かを判断する。通話開始取得部415は、通話開始タイミングである場合(S1300:YES)、処理をステップS1400へ進める。また、通話開始取得部415は、通話開始タイミングではない場合(S1300:NO)、処理を後述のステップS1500へ進める。
ステップS1400において、音声認識制御部416は、管理網通信部412を介して、通話開始通知を管理サーバ420へ送信する。
そして、ステップS1500において、音声認識制御部416は、管理網通信部412を介して、音声送信要求を受信したか否かを判断する。音声認識制御部416は、音声送信要求を受信した場合(S1500:YES)、処理をステップS1600へ進める。また、音声認識制御部416は、音声送信要求を受信していない場合(S1500:NO)、処理を後述のステップS1700へ進める。
ステップS1600において、音声認識制御部416は、音声送信要求の送信元(要求元)への音声データの転送を開始する。
そして、ステップS1700において、音声認識制御部416は、管理者の操作等により、通話データを監視する処理の終了を指示されたか否かを判断する。音声認識制御部416は、処理の終了を指示されていない場合(S1700:NO)、処理をステップS1100へ戻す。また、音声認識制御部416は、処理の終了を指示された場合(S1700:YES)、一連の処理を終了する。
このような動作により、通話録音サーバ410は、IP電話網で伝送される通話の通話開始タイミングを取得し、通話開始タイミングの直後に、IP電話網で伝送される通話の音声データに対する音声認識処理を開始させることができる。
<システム全体の動作>
次に、通信システム100全体の動作の流れの一例について説明する。
図4は、通信システム100の動作の流れの一例を示すシーケンス図である。
まず、モニタリング装置440は、音声認識処理の対象となる音声データの条件を、管理サーバ420へ送信して予め設定しておく(S2010)。かかる条件は、例えば、話者識別情報、通話の時間帯、通話に所定の単語が含まれることである。すなわち、モニタリング装置440は、音声認識処理の対象を、予め、管理サーバ420に登録する。そして、通話が開始されると、ネットワーク機器320は、IPパケットの通話録音サーバ410への送信を開始する(S2020)。
通信録音サーバ410は、送られてくるIPパケットのそれぞれから音声データおよび制御情報を抽出する処理と音声データの記録とを開始すると共に(S2030)、通話開始通知を管理サーバ420へ送信する(S2040)。この時点で、通話録音サーバ410には、少なくとも通話の最初の部分の音声データが格納されている。
管理サーバ420は、通話開始通知に含まれる制御情報と、S2010で設定された条件とに基づいて、音声データに対する音声認識を行うか否かを判断する(S2050)。管理サーバ420は、音声認識を行うと判断した場合、認識開始要求を音声認識サーバ430へ送信すると共に(S2060)、通話開始通知をモニタリング装置440へ送信する(S2070)。音声認識サーバ430は、認識開始要求を受けて、音声送信要求を通話録音サーバ410へ送信する(S2080)。
上述の通り、通話録音サーバ410には、通話の最初の部分の音声データが、少なくとも格納されている。したがって、通話録音サーバ410は、音声送信要求を受けて、格納している音声データを音声認識サーバ430へ返信する(S2090)。なお、高精度な音声認識結果が得られるように、音声認識サーバ430へ送信される音声データは、IPパケットから抽出された音声データの品質が維持されていることが望ましい。
このようにして、音声認識サーバ430は、通話録音サーバ410に格納された音声データに対する音声認識処理を開始する(S2100)。この時点で、音声認識サーバ430には、少なくとも通話の最初の部分の音声認識結果が格納されている。また、音声認識サーバ430は、認識開始通知を管理サーバ420へ送信する(S2110)。
かかる認識開始通知が行われることにより、ウェブブラウザのようにプル型の動作によって表示対象を取得するモニタリング装置440であっても、音声データおよび音声認識結果をリアルタイムに取得して表示することが可能となる。
管理サーバ420は、音声認識サーバ430から受信した認識開始通知を、モニタリング装置440へ転送する(S2120)。なお、かかる認識開始通知、あるいは、ステップ2070で送信される通話開始通知には、音声認識結果の取得先を示す情報として、音声認識サーバ430の識別情報が含まれていることが望ましい。モニタリング装置440は、認識開始通知を受けて、認識結果送信要求を音声認識サーバ430へ送信する(S2130)。
上述の通り、音声認識サーバ430には、少なくとも通話の最初の部分の音声認識結果が格納されている。したがって、音声認識サーバ430は、認識結果送信要求を受けて、格納している音声認識結果をモニタリング装置440へ送信する(S2140)。
モニタリング装置440は、更に、音声送信要求を通話録音サーバ410へ送信し(S2150)、通話録音サーバ410から音声データを受信する(S2160)。なお、通話録音サーバ410は、音声認識制御部416において、モニタリング装置440へ送信される音声データを、ウェブブラウザで出力可能な形式の音声データに変換することが望ましい。そして、モニタリング装置440は、受信した音声データおよび音声認識結果を、対応付けて表示する(S2170)。
モニタリング装置440は、例えば、監視対象となる通話が複数同時に行われている場合、各音声データの制御情報に含まれる通話識別情報あるいは話者識別情報に基づいて、これら複数の通話についての音声認識結果を、通話毎に取得することができる。この場合、モニタリング装置440は、これら複数の通話についての音声認識結果を、1つのウェブブラウザ画面に同時表示することが望ましい。
このような動作により、通信システム100は、音声認識の対象を必要なものに絞りつつ、音声認識処理および音声認識結果の提示を、通話開始タイミングの直後から開始することができる。また、通信システム100は、ウェブブラウザにおいて、通話の音声データおよび音声認識結果をリアルタイムに表示することができる。
なお、通信システム100で送信される各種要求は、1回の要求で通話全体のデータに対する処理を要求するものであってもよいし、パケット、フレーム、あるいは一まとまりの音声認識結果等を単位として、通話の一部のデータ毎に処理を要求するものであってもよい。後者の場合、例えば、フレーム番号や音声認識結果のイベント番号等を、処理対象を指定する識別情報として用いることができる。
<本実施の形態の効果>
以上のように、本実施の形態に係る通話データ管理システムを含む通信システム100によれば、IP電話網を形成する内線網300で伝送される通話の音声データに対する音声認識処理を、通話開始タイミングの直後から開始する。これにより、通信システム100は、IP電話網の通話の音声データに対する音声認識結果を、通話の最中に、ほぼリアルタイムに提示することができる。
上述の通り、各通話が終了した後に、確認が必要な通話をピックアップし、通話の音声データを検索して、蓄積された音声認識結果や音声データを確認するといった作業は、IP電話機の個数が膨大な場合、非常に煩雑なものとなる。
この点、本実施の形態に係る通信システム100は、管理者に対して、各通話の内容をリアルタイムに提示するので、このような煩雑な作業を回避しつつ、各通話を効率良く監視することが可能となる。したがって、本実施の形態に係る通信システム100によれば、より簡単に、多数のIP電話機の通話内容をリアルタイムに監視することができる。
また、管理者がオペレータにアドバイスを与える等のアクションを行う場合、従来技術のように、通話が終了してから通話内容を確認すると、かかるアクションが適切なタイミングから遅れてしまう。この点、本実施の形態にかかる通信システム100は、各IP電話機の通話内容をリアルタイムに監視することができるので、通話内容に応じたアクションを的確なタイミングで行うことを可能にする。
また、本実施の形態に係る通信システム100は、管理サーバ420において、制御情報に基づいて、通話毎に、通話録音サーバ410、音声認識サーバ430、およびモニタリング装置440のそれぞれの動作タイミングを制御する。これにより、本実施の形態に係る通信システム100は、通話録音サーバ410、音声認識サーバ430、およびモニタリング装置440が独立した装置であっても、これらの装置に対する最小限の改変により、これらを連携して動作させ、上記効果を得ることができる。
また、本実施の形態に係る通信システム100において、モニタリング装置440は、音声認識サーバ430から、音声認識サーバ430に格納された音声認識結果を取得して提示する。したがって、本実施の形態に係る通信システム100は、複数のモニタリング装置440が存在する場合であっても、各モニタリング装置440で独立して音声認識結果を提示することができる。
また、本実施の形態に係る通信システム100は、音声認識の対象となる音声データ(通話、IP電話機、あるいは話者等)を動的に選択することができるので、多数のIP電話機の通話内容の監視を、更に効率良く行うことを可能にする。
また、本実施の形態に係る通信システム100は、IP電話網から通話の音声データを取得するので、各通話の音声データを高品質にかつ効率良く取得することができる。例えば、各IP電話機に音声データ取得のための設備を設ける場合に比べて、本実施の形態に係る通信システム100は、必要な設備コストおよび設備スペースを低減することができる。また、本実施の形態に係る通信システム100は、送話音声と受話音声とが完全に分離録音された高品質な音声データを取得することができるため、精度の高いテキストデータを音声認識結果として得ることができ、より高い信頼性を実現することができる。
なお、IP電話網で伝送される通話の音声データの取得の仕方は、上述の例に限定されない。例えば、通話録音サーバ410は、各通話の音声データの伝送路上に配置されている場合、音声データを転送する際にその複製を取得してもよい。
また、管理サーバ420の機能、音声認識サーバ430、およびモニタリング装置440の機能の、一部または全部が、通話録音サーバ410に配置されていてもよい。
例えば、通話録音サーバ410は、取得され制御情報に基づいて、記録された記音声データに対して音声認識処理を行うか否かを決定する、処理対象決定部、を有してもよい。この場合、音声認識対象の絞り込みを、通話録音サーバ410で行うことができ、通話開始通知の送信回数を低減することができる。
また、本発明の適用は、コールセンターに限定されるものではない。本発明は、公官庁あるいは企業における、受付および営業等の各種窓口代表電話や、社内内線電話網等、複数の通話が行われ得る各種のIP電話網に適用することが可能である。
本開示の通話録音サーバは、IP電話網で伝送される通話の音声データを、順次取得してメモリに記録する音声記録制御部と、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、取得された前記通話開始タイミングの直後に、記録された前記音声データに対する音声認識処理を開始させる音声認識制御部と、を有する。
なお、上記通話録音サーバは、取得された前記制御情報に基づいて、記録された前記音声データに対して前記音声認識処理を行うか否かを決定する処理対象決定部、を有してもよい。
また、上記通話録音サーバは、前記IP電話網から、前記音声データを格納し前記通話の識別情報を含む前記制御情報が付与されたパケットを受信する電話網通信部、を有し、前記通話開始取得部は、前記制御情報に基づいて、前記電話網通信部が前記通話の前記パケットを最初に受信したタイミングを特定し、特定された前記タイミングを、前記通話開始タイミングとして取得してもよい。
また、上記通話録音サーバにおいて、前記音声認識制御部は、前記制御情報に基づいて、前記通話毎に、前記音声認識処理の結果であるテキストデータを、記録された前記音声データと対応付けて管理してもよい。
本開示の通話データ管理システムは、IP電話網で伝送される通話の音声データを記録する通話録音サーバと、記録された前記音声データに対する音声認識処理を行い、前記音声認識処理の結果であるテキストデータを生成する音声認識サーバと、記録された前記音声データと生成された前記テキストデータとを、対応付けて提示するモニタリング装置と、を有する通話データ管理システムであって、前記通話録音サーバは、IP電話網から前記音声データを順次取得してメモリに記録する音声記録制御部と、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、記録された前記音声データを前記音声認識サーバへ出力し、前記音声認識サーバに対して、取得された前記通話開始タイミングの直後に、前記音声データに対する音声認識処理を開始させる音声認識制御部と、を有してもよい。
なお、上記通話データ管理システムにおいて、前記音声認識制御部は、前記モニタリング装置からの要求に応じて、記録された前記音声データを前記モニタリング装置へ出力し、前記音声認識サーバは、前記モニタリング装置からの要求に応じて、生成された前記テキストデータを、前記モニタリング装置へ出力し、前記通話録音サーバから、前記通話開始タイミングを取得し、取得された前記通話開始タイミングに基づいて、前記通話録音サーバ、前記音声認識サーバ、および前記モニタリング装置のそれぞれの動作タイミングを制御する管理サーバ、を有してもよい。
また、上記通話データ管理システムにおいて、前記通話録音サーバは、前記IP電話網から、前記音声データを格納し前記通話の識別情報を含む前記制御情報が付与されたパケットを受信する電話網通信部、を有し、前記管理サーバは、前記制御情報に基づいて、前記通話毎に、前記通話録音サーバ、前記音声認識サーバ、および前記モニタリング装置のそれぞれの動作タイミングを制御してもよい。
また、上記通話データ管理システムにおいて、前記管理サーバは、前記制御情報に基づいて、前記通話録音サーバに通話記録された前記音声データに対して前記音声認識処理を行うか否かを決定してもよい。
本開示の通話データ管理方法は、IP電話網で伝送される通話の音声データを、順次取得してメモリに記録するステップと、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得するステップと、取得された前記通話開始タイミングの直後に、記録された前記音声データに対する音声認識処理を開始させるステップと、を有してもよい。
本発明は、より簡単に多数のIP電話機の通話内容を監視することを可能にする、通話録音サーバ、通話データ管理システム、および通話データ管理方法として有用である。
100 通信システム
200 外線網
300 内線網
310 電話機
320 ネットワーク機器
330 PBX装置
400 通話管理網
410 通話録音サーバ
411 電話網通信部
412 管理網通信部
413 メモリ
414 音声記録制御部
415 通話開始取得部
416 音声認識制御部
420 管理サーバ
430 音声認識サーバ
440 モニタリング装置

Claims (9)

  1. IP電話網で伝送される通話の音声データを、順次取得してメモリに記録する音声記録制御部と、
    取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、
    前記通話開始タイミングが取得されたとき、記録された前記音声データに対する音声認識処理および前記音声認識処理の結果であるテキストデータの記録を開始させる音声認識制御部と、
    前記音声データの記録および前記テキストデータの記録が開始されたとき、記録された前記音声データおよび前記テキストデータをプル型の動作により取得して提示するモニタリング装置に対して、前記通話の前記音声データおよび前記テキストデータの取得が可能となったことを示す通知を行う管理部と、を有する、
    通話録音サーバ。
  2. 取得された前記制御情報に基づいて、記録された前記音声データに対して前記音声認識処理を行うか否かを決定する処理対象決定部、を有する、
    請求項1に記載の通話録音サーバ。
  3. 前記IP電話網から、前記音声データを格納し前記通話の識別情報を含む前記制御情報が付与されたパケットを受信する電話網通信部、を有し、
    前記通話開始取得部は、
    前記制御情報に基づいて、前記電話網通信部が前記通話の前記パケットを最初に受信したタイミングを特定し、特定された前記タイミングを、前記通話開始タイミングとして取得する、
    請求項1に記載の通話録音サーバ。
  4. 前記音声認識制御部は、
    前記制御情報に基づいて、前記通話毎に、前記音声認識処理の結果であるテキストデータを、記録された前記音声データと対応付けて管理する、
    請求項1に記載の通話録音サーバ。
  5. 通話録音サーバ、音声認識サーバ、管理サーバ、およびモニタリング装置を有する通話データ管理システムであって、
    前記通話録音サーバは、
    IP電話網から前記IP電話網で伝送される通話の音声データを順次取得してメモリに記録し、取得された前記音声データに付随する制御情報に基づいて前記通話が開始された通話開始タイミングを取得し、
    前記音声認識サーバは、
    前記通話開始タイミングが取得されたとき、記録された前記音声データに対する音声認識処理および前記音声認識処理の結果であるテキストデータの記録を開始し、
    前記管理サーバは、
    前記音声データの記録および前記テキストデータの記録が開始されたとき、前記モニタリング装置に対して、前記通話の前記音声データおよび前記テキストデータの取得が可能となったことを示す通知を行い、
    前記モニタリング装置は、
    記録された前記音声データおよび前記テキストデータをプル型の動作により取得して提示する、
    通話データ管理システム。
  6. 前記通話録音サーバは、
    前記モニタリング装置からの要求に応じて、記録された前記音声データを前記モニタリング装置へ出力し、
    前記音声認識サーバは、
    前記モニタリング装置からの要求に応じて、記録された前記テキストデータを前記モニタリング装置へ出力し、
    前記管理サーバは、
    前記通話録音サーバから、前記通話開始タイミングを取得し、取得された前記通話開始タイミングに基づいて、前記通話録音サーバ、前記音声認識サーバ、および前記モニタリング装置のそれぞれの動作タイミングを制御する、
    請求項5に記載の通話データ管理システム。
  7. 前記通話録音サーバは、
    前記IP電話網から、前記音声データを格納し前記通話の識別情報を含む前記制御情報が付与されたパケットを受信し、
    前記管理サーバは、
    前記制御情報に基づいて、前記通話毎に、前記通話録音サーバ、前記音声認識サーバ、および前記モニタリング装置のそれぞれの動作タイミングを制御する、
    請求項6に記載の通話データ管理システム。
  8. 前記管理サーバは、
    前記制御情報に基づいて、前記通話録音サーバに通話記録された前記音声データに対して前記音声認識処理を行うか否かを決定する、
    請求項6に記載の通話データ管理システム。
  9. 音声記録制御部が、IP電話網で伝送される通話の音声データを、順次取得してメモリに記録するステップと、
    通話開始取得部が、前記音声記録制御部により取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得するステップと、
    音声認識制御部が、前記通話開始取得部により前記通話開始タイミングが取得されたとき、前記音声記録制御部により記録された前記音声データに対する音声認識処理および前記音声認識処理の結果であるテキストデータの記録を開始させるステップと、
    管理部が、前記音声記録制御部による前記音声データの記録および前記音声認識制御部による前記テキストデータの記録が開始されたとき、記録された前記音声データおよび前記テキストデータをプル型の動作により取得して提示するモニタリング装置に対して、前記通話の前記音声データおよび前記テキストデータの取得が可能となったことを示す通知を行うステップと、を有する、
    通話データ管理方法。
JP2014053355A 2014-03-17 2014-03-17 通話録音サーバ、通話データ管理システム、および通話データ管理方法 Active JP5860085B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2014053355A JP5860085B2 (ja) 2014-03-17 2014-03-17 通話録音サーバ、通話データ管理システム、および通話データ管理方法
KR1020167022114A KR20160100412A (ko) 2014-03-17 2015-03-11 통화녹음 서버, 통화 데이터 관리 시스템, 및 통화 데이터 관리 방법
CN201580012625.2A CN106068641B (zh) 2014-03-17 2015-03-11 通话数据管理***
KR1020177024362A KR101826918B1 (ko) 2014-03-17 2015-03-11 통화녹음 서버, 통화 데이터 관리 시스템, 및 통화 데이터 관리 방법
PCT/JP2015/001338 WO2015141189A1 (ja) 2014-03-17 2015-03-11 通話録音サーバ、通話データ管理システム、および通話データ管理方法
TW104108398A TWI569619B (zh) 2014-03-17 2015-03-17 通話錄音伺服器、通話資料管理系統及通話資料管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014053355A JP5860085B2 (ja) 2014-03-17 2014-03-17 通話録音サーバ、通話データ管理システム、および通話データ管理方法

Publications (2)

Publication Number Publication Date
JP2015177411A JP2015177411A (ja) 2015-10-05
JP5860085B2 true JP5860085B2 (ja) 2016-02-16

Family

ID=54144173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014053355A Active JP5860085B2 (ja) 2014-03-17 2014-03-17 通話録音サーバ、通話データ管理システム、および通話データ管理方法

Country Status (5)

Country Link
JP (1) JP5860085B2 (ja)
KR (2) KR101826918B1 (ja)
CN (1) CN106068641B (ja)
TW (1) TWI569619B (ja)
WO (1) WO2015141189A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6767796B2 (ja) 2016-07-08 2020-10-14 株式会社日立情報通信エンジニアリング 通話管理システム及びその音声認識制御方法
JP6875905B2 (ja) * 2017-03-29 2021-05-26 株式会社日立情報通信エンジニアリング 通話制御システム及び通話制御方法
JP6749645B2 (ja) * 2017-04-07 2020-09-02 株式会社Widsley 通話システム、通話方法およびプログラム
JP6927614B2 (ja) * 2017-04-07 2021-09-01 株式会社Widsley 通話システム、通話方法およびプログラム
JP6433003B1 (ja) 2017-09-04 2018-12-05 Necプラットフォームズ株式会社 通話録音システム、通話録音方法および通話録音プログラム
TWI672690B (zh) * 2018-03-21 2019-09-21 塞席爾商元鼎音訊股份有限公司 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置
KR101952730B1 (ko) * 2018-06-20 2019-05-22 (주)넥타르소프트 교신 내용을 보팅으로 선별하여 음성인식하는 무선 교신 시스템
CN108833727A (zh) * 2018-07-04 2018-11-16 广东商路信息科技有限公司 基于电话交换机的录音管理方法及***
JP7355996B2 (ja) * 2019-05-17 2023-10-04 アイコム株式会社 中継装置および音声通信の録音方法
CN112822249A (zh) * 2020-12-31 2021-05-18 盐城数智科技有限公司 一种基于WebRTC的实时语音采集方法
KR102241532B1 (ko) 2021-01-15 2021-04-16 (주)두타위즈 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법
JP7380620B2 (ja) * 2021-03-15 2023-11-15 株式会社ナカヨ 通話録音システム、主装置、音声認識依頼端末、プログラム、および電話機の通話録音方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4662861B2 (ja) * 2006-02-07 2011-03-30 日本電気株式会社 モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム
JP2008060785A (ja) 2006-08-30 2008-03-13 Oki Electric Ind Co Ltd Ip電話通話録音システム
JP4773946B2 (ja) * 2006-12-28 2011-09-14 富士通株式会社 モニタ制御システム、モニタ装置、モニタ制御方法およびモニタ制御プログラム
JP2008211271A (ja) 2007-02-23 2008-09-11 Nomura Research Institute Ltd コールセンタ管理システム、コールセンタ管理方法、プログラム及び記録媒体
CN101247432B (zh) * 2007-07-18 2011-12-07 北京九合创胜网络科技有限公司 一种VoIP语音数据实时监控的方法及装置
US8463606B2 (en) * 2009-07-13 2013-06-11 Genesys Telecommunications Laboratories, Inc. System for analyzing interactions and reporting analytic results to human-operated and system interfaces in real time
WO2011074260A1 (ja) * 2009-12-17 2011-06-23 日本電気株式会社 音声認識システム
CN101834931B (zh) * 2010-05-06 2012-11-28 沈阳帝信通信股份有限公司 Ip集中录音***及方法
JP2012120120A (ja) * 2010-12-03 2012-06-21 Toshiba Corp コールセンタシステム及びエスカレーション通知方法
CN102364925A (zh) * 2011-08-31 2012-02-29 北京天和恒力科技发展有限公司 在手机端自动通话内容记录及选择保存内容的方法和***
CN103260152B (zh) * 2012-02-20 2016-08-03 东南大学常州研究院 一种移动终端语音通信***的设备和方法
JP5957249B2 (ja) * 2012-03-08 2016-07-27 株式会社日立情報通信エンジニアリング 通話録音システム
JP2014042128A (ja) 2012-08-22 2014-03-06 Hitachi Ltd 通話録音システム

Also Published As

Publication number Publication date
KR20170102394A (ko) 2017-09-08
CN106068641B (zh) 2018-05-29
CN106068641A (zh) 2016-11-02
KR20160100412A (ko) 2016-08-23
TWI569619B (zh) 2017-02-01
WO2015141189A1 (ja) 2015-09-24
KR101826918B1 (ko) 2018-02-07
JP2015177411A (ja) 2015-10-05
TW201540041A (zh) 2015-10-16

Similar Documents

Publication Publication Date Title
JP5860085B2 (ja) 通話録音サーバ、通話データ管理システム、および通話データ管理方法
US10194029B2 (en) System and methods for analyzing online forum language
US9699307B2 (en) Method and system for automatically routing a telephonic communication
TWI249923B (en) Method and apparatus for implementing call processing in packet telephony networks
US20070265990A1 (en) Multi-party information analysis in a VoIP system
US11758053B2 (en) Method and system for managing routing across multiple networks with separate routing masters
JP2016143909A (ja) 通話内容分析表示装置、通話内容分析表示方法、及びプログラム
RU2317645C1 (ru) Способ обслуживания голосовых вызовов в коммуникационной сети
JP2017163198A (ja) 音声認識システム、コネクト装置および音声認識方法
WO2006001200A1 (ja) 通信装置、通信方法、および通信用プログラム
JP2001268135A (ja) 情報取得システムおよび情報取得方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151217

R150 Certificate of patent or registration of utility model

Ref document number: 5860085

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250