JP2023079353A - 対話管理装置、対話管理システム及び対話管理方法 - Google Patents

対話管理装置、対話管理システム及び対話管理方法 Download PDF

Info

Publication number
JP2023079353A
JP2023079353A JP2021192783A JP2021192783A JP2023079353A JP 2023079353 A JP2023079353 A JP 2023079353A JP 2021192783 A JP2021192783 A JP 2021192783A JP 2021192783 A JP2021192783 A JP 2021192783A JP 2023079353 A JP2023079353 A JP 2023079353A
Authority
JP
Japan
Prior art keywords
topic
dialogue
record
digital
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021192783A
Other languages
English (en)
Other versions
JP2023079353A5 (ja
Inventor
遼 曾我
Ryo Soga
英人 山本
Hideto Yamamoto
雅彦 安井
Masahiko Yasui
秀行 柏瀬
Hideyuki Kashiwase
実 河野
Minoru Kono
正彦 井上
Masahiko Inoue
大輔 福井
Daisuke Fukui
英美 斎藤
Emi Saito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2021192783A priority Critical patent/JP2023079353A/ja
Priority to PCT/JP2022/041906 priority patent/WO2023095629A1/ja
Publication of JP2023079353A publication Critical patent/JP2023079353A/ja
Publication of JP2023079353A5 publication Critical patent/JP2023079353A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】話題が様々に展開される場合であっても、対話記録において、関心のある部分を速やかに特定することが可能な対話管理手段を提供すること。【解決手段】複数の話者との間でデジタル対話を行うための対話インターフェースを提供し、前記デジタル対話の対話記録を取得する対話インターフェース部(212)と、前記デジタル対話の最中に、前記デジタル対話における話題を指定するための話題指定情報の入力を受け付ける話題管理部(214)と、前記話題指定情報に基づいて前記対話記録を編集することで、話題毎に整理した編集済み対話記録を生成する対話編集部(216)とを含む対話管理装置(210)。【選択図】図1

Description

本発明は、対話管理装置、対話管理システム及び対話管理方法に関する。
近年、インターネット回線等の通信ネットワークを介したオンライン上での会議や面談が行われている。特に最近では、テレワークの普及等により、人と人とが直接対面することなく、オンライン上で会議や面談を行うことが一般的となりつつある。
このようなオンライン会議システム(オンライン面談システム)については、様々な機能が提案されている。例えば、オンライン会議システム上で行われた会議の動画を記録し、保存しておき、会議が終了してからも再び見返す機能が知られている。
このように録画した会議動画を見返す際、関心のある部分を速やかに特定し、視聴を容易にすることが望まれている。
オンライン面談システムの関連技術の一つとして、例えば特開2021-175155号公報(特許文献1)が存在する。
特許文献1には、「撮像部と、通信部と、を有する携帯電話装置(スマートフォン100)を、面談部として機能させる。通信部は、電話網及びインターネットを介して他の装置と通信可能に構成される。面談部は、面談制御部を有する。面談制御部は、面談相手の電話番号が入力された場合、面談に関するライブ配信の接続情報を、通信部及び電話網を介して面談相手に送信する。接続情報を介して面談相手から接続があった場合、通信部及び電話網を介した面談相手との面談に関するライブ配信における音声の送受信は、携帯電話装置の電話部を用いて行われる。面談制御部は、通信部及びインターネットを介して面談相手との面談に関するライブ配信における画像の送受信を制御する。」技術が開示されている。
特開2021-175155号公報
特許文献1には、面談に関するライブ配信における通話の録音データに基づき通話の内容をテキスト化し、これにより得られたテキストデータを解析することで、面談の参加者に発言内容等に基づいて、面談の雰囲気を判断する手段が開示されている。この解析の結果に基づいて、参加者は、次の面談の際、表情、話し方、話す内容等を修正し、より良い雰囲気で面談を実施することができる。
しかしながら、特許文献1には、電話やオンライン会議システム等で行われた対話の記録を話題毎に整理することが想定されていない。話題毎に進む対話記録を得るために、話題毎に対話を実施しながら記録することが考えられるが、実際には、複数人で行われる対話においては、話題が他の話題に飛んだり、また、他の話題から元の話題に戻るなど、話題が様々に展開されることがある。このため、対話の内容をシスステムを用いて整理しようとすると、話題の分析が困難となったり、異なる話題が混じりあってしまうことがある。この結果、対話記録を視聴する際、関心のある部分を速やかに特定することが困難となる課題が存在する。
そこで、本開示は、話題が様々に展開される場合であっても、対話記録において、関心のある部分を速やかに特定することが可能な対話管理手段を提供することを目的とする。
上記の課題を解決するために、代表的な本発明の対話管理装置は、複数の話者との間でデジタル対話を行うための対話インターフェースを提供し、前記デジタル対話の対話記録を取得する対話インターフェース部と、前記デジタル対話の最中に、前記デジタル対話における話題を指定するための話題指定情報の入力を受け付ける話題管理部と、前記話題指定情報に基づいて前記対話記録を編集することで、話題毎に整理した編集済み対話記録を生成する対話編集部とを含む。
本開示によれば、話題が様々に展開される場合であっても、対話記録において、関心のある部分を速やかに特定することが可能な対話管理手段を提供することができる。
上記以外の課題、構成及び効果は、以下の発明を実施するための形態における説明により明らかにされる。
図1は、本開示の実施形態を実施するためのコンピュータシステムを示す図である。 図2は、本開示の実施形態に係る対話管理システムの構成の一例を示す図である。 図3は、本開示の実施形態に係る話題毎対話記録生成処理の流れの一例を示す図である。 図4は、本開示の実施形態に係る対話インターフェース及び話題毎の対話記録部分の一例を示す図である。 図5は、本開示の実施形態に係る対話インターフェース描画処理の流れの一例を示す図である。 図6は、本開示の実施形態に係る話題整形処理及び関連情報整形処理を説明するための図である。 図7は、本開示の実施形態に係る対話記録タイミング補正処理の流れの一例を示す図である。 図8は、本開示の実施形態に係る有用話題遷移データ登録処理の流れの一例を示す図である。
以下、図面を参照して、本発明の実施例について説明する。なお、この実施例により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
上述したように、電話やオンライン会議システム等で行われた対話の記録において、関心のある部分を速やかに特定することが望まれている。
そこで、本開示では、対話を実施している最中に、現在の話題を予め用意された候補から選択するためのメニュー(話題選択一覧)をインターフェースにおいて表示し、現在の話題を示す話題タグと、現在の話題の開始時刻及び終了時刻とを指定する入力を対話の参加者から受け付ける。この入力に基づいて、話題毎にラベル付けされた対話記録を得ることができる。そして、この話題毎にラベル付けされた対話記録を編集し、同一の話題に対応する部分(対話記録部分)をまとめることで、話題毎に整理した、編集済み対話記録を生成することができる。
これにより、話題が様々に展開される場合であっても、対話記録において、関心のある部分を速やかに特定することが可能となる。
まず、図1を参照して、本開示の実施例を実施するためのコンピュータシステム100について説明する。本明細書で開示される様々な実施例の機構及び装置は、任意の適切なコンピューティングシステムに適用されてもよい。コンピュータシステム100の主要コンポーネントは、1つ以上のプロセッサ102、メモリ104、端末インターフェース112、ストレージインタフェース113、I/O(入出力)デバイスインタフェース114、及びネットワークインターフェース115を含む。これらのコンポーネントは、メモリバス106、I/Oバス108、バスインターフェースユニット109、及びI/Oバスインターフェースユニット110を介して、相互的に接続されてもよい。
コンピュータシステム100は、プロセッサ102と総称される1つ又は複数の汎用プログラマブル中央処理装置(CPU)102A及び102Bを含んでもよい。ある実施例では、コンピュータシステム100は複数のプロセッサを備えてもよく、また別の実施例では、コンピュータシステム100は単一のCPUシステムであってもよい。各プロセッサ102は、メモリ104に格納された命令を実行し、オンボードキャッシュを含んでもよい。
ある実施例では、メモリ104は、データ及びプログラムを記憶するためのランダムアクセス半導体メモリ、記憶装置、又は記憶媒体(揮発性又は不揮発性のいずれか)を含んでもよい。メモリ104は、本明細書で説明する機能を実施するプログラム、モジュール、及びデータ構造のすべて又は一部を格納してもよい。例えば、メモリ104は、対話管理アプリケーション150を格納していてもよい。ある実施例では、対話管理アプリケーション150は、後述する機能をプロセッサ102上で実行する命令又は記述を含んでもよい。
ある実施例では、対話管理アプリケーション150は、プロセッサベースのシステムの代わりに、またはプロセッサベースのシステムに加えて、半導体デバイス、チップ、論理ゲート、回路、回路カード、および/または他の物理ハードウェアデバイスを介してハードウェアで実施されてもよい。ある実施例では、対話管理アプリケーション150は、命令又は記述以外のデータを含んでもよい。ある実施例では、カメラ、センサ、または他のデータ入力デバイス(図示せず)が、バスインターフェースユニット109、プロセッサ102、またはコンピュータシステム100の他のハードウェアと直接通信するように提供されてもよい。
コンピュータシステム100は、プロセッサ102、メモリ104、表示システム124、及びI/Oバスインターフェースユニット110間の通信を行うバスインターフェースユニット109を含んでもよい。I/Oバスインターフェースユニット110は、様々なI/Oユニットとの間でデータを転送するためのI/Oバス108と連結していてもよい。I/Oバスインターフェースユニット110は、I/Oバス108を介して、I/Oプロセッサ(IOP)又はI/Oアダプタ(IOA)としても知られる複数のI/Oインタフェースユニット112,113,114、及び115と通信してもよい。
表示システム124は、表示コントローラ、表示メモリ、又はその両方を含んでもよい。表示コントローラは、ビデオ、オーディオ、又はその両方のデータを表示装置126に提供することができる。また、コンピュータシステム100は、データを収集し、プロセッサ102に当該データを提供するように構成された1つまたは複数のセンサ等のデバイスを含んでもよい。
例えば、コンピュータシステム100は、心拍数データやストレスレベルデータ等を収集するバイオメトリックセンサ、湿度データ、温度データ、圧力データ等を収集する環境センサ、及び加速度データ、運動データ等を収集するモーションセンサ等を含んでもよい。これ以外のタイプのセンサも使用可能である。表示システム124は、単独のディスプレイ画面、テレビ、タブレット、又は携帯型デバイスなどの表示装置126に接続されてもよい。
I/Oインタフェースユニットは、様々なストレージ又はI/Oデバイスと通信する機能を備える。例えば、端末インタフェースユニット112は、ビデオ表示装置、スピーカテレビ等のユーザ出力デバイスや、キーボード、マウス、キーパッド、タッチパッド、トラックボール、ボタン、ライトペン、又は他のポインティングデバイス等のユーザ入力デバイスのようなユーザI/Oデバイス116の取り付けが可能である。ユーザは、ユーザインターフェースを使用して、ユーザ入力デバイスを操作することで、ユーザI/Oデバイス116及びコンピュータシステム100に対して入力データや指示を入力し、コンピュータシステム100からの出力データを受け取ってもよい。ユーザインターフェースは例えば、ユーザI/Oデバイス116を介して、表示装置に表示されたり、スピーカによって再生されたり、プリンタを介して印刷されたりしてもよい。
ストレージインタフェース113は、1つ又は複数のディスクドライブや直接アクセスストレージ装置117(通常は磁気ディスクドライブストレージ装置であるが、単一のディスクドライブとして見えるように構成されたディスクドライブのアレイ又は他のストレージ装置であってもよい)の取り付けが可能である。ある実施例では、ストレージ装置117は、任意の二次記憶装置として実装されてもよい。メモリ104の内容は、ストレージ装置117に記憶され、必要に応じてストレージ装置117から読み出されてもよい。I/Oデバイスインタフェース114は、プリンタ、ファックスマシン等の他のI/Oデバイスに対するインターフェースを提供してもよい。ネットワークインターフェース115は、コンピュータシステム100と他のデバイスが相互的に通信できるように、通信経路を提供してもよい。この通信経路は、例えば、ネットワーク130であってもよい。
ある実施例では、コンピュータシステム100は、マルチユーザメインフレームコンピュータシステム、シングルユーザシステム、又はサーバコンピュータ等の、直接的ユーザインターフェースを有しない、他のコンピュータシステム(クライアント)からの要求を受信するデバイスであってもよい。他の実施例では、コンピュータシステム100は、デスクトップコンピュータ、携帯型コンピューター、ノートパソコン、タブレットコンピュータ、ポケットコンピュータ、電話、スマートフォン、又は任意の他の適切な電子機器であってもよい。
次に、図2を参照して、本開示の実施形態に係る対話管理システムについて説明する。
図2は、本開示の実施形態に係る対話管理システム200の構成の一例を示す図である。本開示の実施形態に係る対話管理システム200は、複数人の間で行われるデジタル対話について、話題毎に整理した編集済み対話記録を生成するためのシステムであり、図2に示すように、対話管理装置210と、第1の対話装置220と、第2の対話装置230とから主に構成される。対話管理装置210と、第1の対話装置220と、第2の対話装置230とは、例えばインターネット等の通信ネットワーク225を介して互いに通信可能に接続されている。
対話管理装置210は、第1の対話装置220と、第2の対話装置230との間でのデジタル対話を行うプラットフォームを提供すると共に、デジタル対話について、話題毎に整理した編集済み対話記録を生成するための装置である。ここでのデジタル対話とは、電話、オンライン会議システム、アプリ等を介して、少なくとも二人の話者間で言葉を用いて行われる情報の共有を意味する。ここでのデジタル対話は、例えば電話等のように音声情報の共有のみで行われてもよく、動画通話等のように音声情報及び映像情報の両方の共有で行われてもよい。
また、ここでの「話者」とは、デジタル対話に参加する人を意味する。以下、説明の便宜上、二人の話者(第1の話者及び第2の話者)で行われるデジタル対話を一例として説明するが、本開示はこれに限定されず、話者の人数は任意であってもよい。
図2に示すように、対話管理装置210は、対話インターフェース部212と、話題管理部214と、対話編集部216とを含む。
対話インターフェース部212は、第1の話者と第2の話者との間でデジタル対話を行うための対話インターフェースを提供し、当該デジタル対話の対話記録を取得する機能部である。ここでの対話インターフェースは、例えば後述する第1の対話装置220及び第2の対話装置230のディスプレイ等に表示され、対話に関する情報及び設定を提供するGUI(Graphical User Interface)画面を意味する。一例として、対話インターフェースは、例えばカメラによって取得されている各話者の映像、テキストチャットのウインドウ、カメラ及びマイクロフォンの設定項目等を含んでもよい。また、後述するように、本開示の実施形態に係る対話インターフェースには、現在の話題を予め用意された候補から選択するためのメニューや、現在の話題に関する関連資料を表示してもよい。
話題管理部214は、デジタル対話の最中に、デジタル対話における話題を指定するための話題指定情報の入力を受け付ける機能部である。より具体的には、話題管理部214は、複数の話題候補を含む話題選択一覧を対話管理装置210によって生成されている対話インターフェースにおいて表示し、話者(例えば面接官等)からの入力に基づいて、話題選択一覧から選択された第1の話題タグと、第1の話題の第1の開始時刻と、第1の話題の第1の終了時刻とを話題指定情報として受け付けてもよい。
その後、話題管理部214は、受け付けた第1の話題の第1の開始時刻と、第1の話題の第1終了時刻とに対応する第1の対話記録部分に対して、第1の話題タグを対応付けてもよい。話題管理部214は、デジタル対話が終了するまで、話者からの話題指定情報の入力を受け付け、指定されている話題タグを指定されている対話記録部分に対して対応付けることで、話題毎にラベル付けされた対話記録を得ることができる。ここでの対話記録部分とは、対話記録における一部分を意味する。
対話編集部216は、デジタル対話が終了した後、話題管理部214によって取得された話題指定情報に基づいて対話管理装置210によって記録された対話記録を編集することで、話題毎に整理した編集済み対話記録を生成する機能部である。より具体的には、対話編集部216は、話題毎にラベル付けされた対話記録から、同一の話題タグ(例えば、第1の話題タグ)に対応付けられている対話記録部分を抽出し、まとめることで、話題毎に整理した編集済み対話記録を生成してもよい。
ここで、「対話記録部分を抽出し、まとめる」との表現は、例えば、各話題タグに対応している対話記録部分を、既存の映像又は音声編集手段を用いて対話記録から切り出し、同一の話題タグに対応する対話記録部分を一つのグループとして結合することを意味する。それぞれのグループにおける対話記録部分は時間順に並べられてもよく、予め決まった話題の優先順位に基づいて並べられてもよい。
なお、以上では、対話管理装置210に含まれる機能部の概要及び主な機能について説明したが、本開示はこれに限定されず、後述するように、他の機能を有してもよい。
また、本実施形態において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェア(例えば、図1に示す対話管理アプリケーション150)の情報処理とを合わせたものも含みうる。また、本実施形態においては様々な情報を取り扱うが、これら情報は、例えば電圧・電流を表す信号値の物理的な値、0又は1で構成される2進数のビット集合体としての信号値の高低、又は量子的な重ね合わせ(いわゆる量子ビット)によって表され、広義の回路上で通信・演算が実行されうる。
第1の対話装置220及び第2の対話装置230は、デジタル対話に参加する話者によって用いられる端末であり、通信ネットワーク225を介して対話管理装置210によって提供されるデジタル対話プラットフォームに接続する。第1の対話装置220及び第2の対話装置230は、デジタル対話において送受信される音声情報及び/又は映像情報を取得・提供するための機能を有する端末であり、例えばスマートフォン、タブレット、パソコン等であってもよい。より具体的には、第1の対話装置220及び第2の対話装置230は、対話インターフェース部212によって生成される対話インターフェースを画面に表示し、ユーザからの情報入力(例えば話題指定情報の入力)を受け付けるように構成されてもよい。
なお、図2では、説明の便宜上、対話装置を2つ含む対話管理システム200の構成を一例として示しているが、実際には、対話装置の数はデジタル対話に参加する話者の人数に応じて決まってもよい。
以上説明したように構成した対話管理システム200によれば、話題毎に整理した編集済み対話記録を生成することで、話題が様々に展開される場合であっても、対話記録において、関心のある部分を速やかに特定することが可能となる。
なお、図2では、対話管理装置210は、対話インターフェース部212と、話題管理部214及び対話編集部216の機能が通信ネットワーク225を介してアクセス可能な対話管理装置210において実施される場合を一例として説明したが、本開示はこれに限定されず、例えば対話インターフェース部212と、話題管理部214及び対話編集部216が第1の対話装置220及び第2の対話装置230上に作動するソフトウェアによって実施される構成も可能である。
次に、図3を参照して、本開示の実施形態に係る話題毎の対話記録生成処理(以下、「話題毎対話記録生成処理」ということがある。)について説明する。
図3は、本開示の実施形態に係る話題毎対話記録生成処理300の流れの一例を示す図である。図3に示す話題毎対話記録生成処理300は、話題毎に整理した編集済み対話記録を生成するための処理であり、上述した対話管理装置210における対話インターフェース部212、話題管理部214及び対話編集部216によって実施される。
まず、ステップS304では、対話インターフェース部212は、話題選択一覧302の情報を取得し、取得した話題選択一覧302を含む対話インターフェース306を描画する。話題選択一覧302は、複数の話題候補を含む情報であり、デジタル対話を行う前に、例えばデジタルの主催者等によって予め作成されてもよい。話題選択一覧302に含まれる話題候補は、例えば、特定のデジタル対話において議論する予定の議題情報等に基づいて作成されてもよい。一例として、デジタル対話が企業の採用面接の場合、話題選択一覧302は、例えば「前職での人付き合い」や「前職で担当した案件」等を含んでもよい。
ここで、対話インターフェース部212は、各話者の映像、テキストチャットのウインドウ、カメラ及びマイクロフォンの設定項目等に加えて、取得した話題選択一覧302を含む対話インターフェース306を生成してもよい。上述したように、この対話インターフェース306は、デジタル対話に参加している話者の対話装置(第1の対話装置220及び第2の対話装置230)に表示されてもよい。
次に、ステップS312では、対話インターフェース部212は、対話記録308を取得し、話題管理部214は、話題指定情報310を取得する。ここで、対話記録308及び話題指定情報310を含む情報のセットは、「対話情報314」と総称する。
対話記録308は、デジタル対話を記録した情報であり、音声情報、映像情報、又はその両方を含んでもよい。例えば、デジタル対話が電話で行われた場合、対話記録308は、デジタル対話に参加した話者からの音声情報を録音した記録であってもよく、デジタル対話が動画通話の場合、対話記録308は、デジタル対話に参加した話者からの音声情報及び映像情報を録音・録画した記録であってもよい。
話題指定情報310は、対話インターフェース306において表示される話題選択一覧302から選択された第1の話題タグと、第1の話題の第1の開始時刻と、第1の話題の第1の終了時刻とを含む情報である。
ここで、話題管理部214は、話題選択一覧302に対する話者(例えば面接官等)からの入力に基づいて、話題選択一覧302から選択された第1の話題タグと、第1の話題の第1の開始時刻と、第1の話題の第1の終了時刻とを話題指定情報として受け付けることとしてもよい。その後、話題管理部214は、受け付けた第1の話題の第1の開始時刻と、第1の話題の第1終了時刻とに対応する第1の対話記録部分に対して、第1の話題タグを対応付けてもよい。話題管理部214は、デジタル対話が終了するまで、話者からの話題指定情報の入力を受け付け、指定されている話題タグを指定されている対話記録部分に対して対応付けることで、話題毎にラベル付けされた対話記録を得ることができる。
なお、本開示では、デジタル対話中、特定の話者から取得した全ての話題指定情報の集合を「話題選択履歴」という。
次に、ステップS316では、対話編集部216は、ステップS312で取得された対話情報に基づいて、話題毎に整理した編集済み対話記録を生成する。デジタル対話が終了した後、対話編集部216は、話題指定情報310に基づいて対話記録308を編集することで、話題毎に整理した編集済み対話記録を生成する。より具体的には、対話編集部216は、話題毎にラベル付けされた対話記録から、同一の話題タグ(例えば、第1の話題タグ)に対応付けられている対話記録部分を抽出し、まとめることで、話題毎に整理した編集済み対話記録を生成してもよい。
以上説明した話題毎対話記録生成処理300によれば、話題毎に整理した編集済み対話記録を生成することができるため、話題が様々に展開される場合であっても、対話記録において、関心のある部分を速やかに特定することが可能となる。
次に、図4を参照して、本開示の実施形態に係る対話インターフェース及び編集済み対話記録について説明する。
図4は、本開示の実施形態に係る対話インターフェース306及び編集済み対話記録318の一例を示す図である。
図4に示すように、対話インターフェース306において、デジタル対話の相手の映像405や、上述した話題選択一覧302が表示される。また、話題選択一覧302において、「前職での人付き合い」や「前職で担当した案件」等の話題候補の話題タグが含まれる。対話インターフェース306を用いてデジタル対話に参加している話者(例えば、第1の話者)は、デジタル対話がリアルタイムで進んでいる最中に、現在の話題(第1の話題)に対応する話題タグ(第1の話題タグ)を選択してもよい。これにより、選択された第1の話題タグが、対話記録における現在時刻(第1の話題の第1の開始時刻)に対応付けられる。
また、デジタル対話が進むにつれて、話題が変わる度に、話者は、話題選択一覧302から新たな話題タグ(第2の話題タグ)を選択してもよい。そして、選択された第2の話題タグが、対話記録における現在時刻(第1の話題の第1の終了時刻及び第2の話題の第1の開始時刻)に対応付けられると共に、第1の話題が終了したと仮定される。
デジタル対話が終了するまで、話者からの話題指定情報の入力を受け付け、指定されている話題タグを指定されている対話記録部分に対して対応付けることで、話題毎にラベル付けされた対話記録を得ることができる。
また、デジタル対話が終了した後、対話編集部216は、話題毎にラベル付けされた対話記録から、同一の話題タグ(例えば、第1の話題タグや第2の話題タグ)に対応付けられている対話記録部分を抽出し、まとめることで、図4に示す話題毎に整理した編集済み対話記録318を生成してもよい。
例えば、対話記録において、「前職での人付き合い」との第1の話題タグが、00:00-02:00に対応する第1の対話記録部分と、03:30-04:00に対応する第3の対話記録部分に対応付けられ、「前職で担当した案件」との第2の話題タグが02:00-03:30に対応する第2の対話記録部分に対応付けられている場合があるとする。この場合、対話編集部216は、対話記録を編集することで、第1の話題タグに対応付けられている第1の対話記録部分及び第3の対話記録部分を時間順に基づいて連結させ、第2の話題タグに対応付けられている第2の対話記録部分を第3の対話記録部分の後方に連結させ、話題毎に整理した編集済み対話記録318を生成してもよい。
なお、対話記録318における話題の順番は、例えば話題がデジタル対話において登場した順番としてもよいし、予め決定された優先順位に基づいた順番としてもよい。
次に、図5を参照して、本開示の実施形態に係る対話インターフェース描画処理の流れについて説明する。
図5は、本開示の実施形態に係る対話インターフェース描画処理500の流れの一例を示す図である。図5に示す対話インターフェース描画処理500は、話題選択一覧302や対話の相手の映像等を含む対話インターフェースを生成するための処理であり、上述した対話管理装置210における対話インターフェース部212及び話題管理部214によって実施される。
上述したように、本開示の一態様では、対話を実施している最中に、現在の話題を予め用意された候補から選択するための話題選択一覧302を対話インターフェース306において表示し、現在の話題を示す話題タグと、現在の話題の開始時刻及び終了時刻とを指定する話題指定情報の入力を対話の参加者から受け付ける。
しかし、話題指定情報を入力する際、話題選択一覧302において多数の話題候補が表示される場合、所望の話題を探して選択することは手間を要することがある。そこで、本開示の実施形態に係る対話インターフェース描画処理500の一態様は、現在の話題に関連性が高い話題候補を話題選択一覧302において強調表示するための話題整形処理に関する。これにより、所望の話題を探して選択する手間が省け、話題指定情報を入力する対話の参加者は、現在の話題に関連性が高い話題候補を容易に選択することができる。
また、対話を行う際、対話に参加する話者は、対話における特定の内容を評価又は分析したい場合がある。一例として、対話が企業の採用面接の場合、対話に参加する話者である面接官は、候補者の適正や能力等について、所定の評価項目を評価したい場合が考えられる。したがって、対話インターフェース描画処理500のもう一態様は、現在の話題に関連性が高い関連資料(例えば、評価項目の評価基準等)を対話インターフェース306において表示することに関する。これにより、対話の参加者は、対話を行いながら関連性の高い資料を容易に確認することが可能となる。
まず、ステップS510では、話題管理部214は、話題遷移データ502と、話題選択一覧302とを入力し、入力した話題遷移データ502及び話題選択一覧302に基づいて、現在の話題に関連性が高い話題候補を話題選択一覧302において強調表示するための話題整形処理を行う。また、ここで、話題管理部214は、上述した入力情報に加えて、以前に取得した対話情報524を入力してもよい。
ここでの話題遷移データ502は、ある話題(第1の話題)から別の話題(第2の話題)への遷移に関する情報であり、例えば現在の話題を識別するための対話IDと、当該遷移を識別するための遷移IDと、それぞれの話題を識別するための話題IDと、対話の内容を示す対話内容(本開示において、「照合テキスト情報」ともいう)と、補正前の話題開始時刻(第1の話題の第1の開始時刻)、補正前の話題終了時刻(第1の話題の第1の終了時刻)、補正後の話題開始時刻(第1の話題の第2の開始時刻)、補正後の話題終了時刻(第1の話題の第2の終了時刻)を含んでもよい。
話題選択一覧302については、上述したため、ここではその説明を省略する。
なお、現在の話題に関連性が高い話題候補を話題選択一覧302において強調表示するための話題整形処理の詳細については後述するため、ここではその説明を省略する。
ステップS512では、話題管理部214は、関連資料506と、評価項目・話題対応表508とを入力し、入力した関連資料506と、評価項目・話題対応表508とに基づいて、現在の話題に関連性が高い関連資料を対話インターフェース306に表示するための関連情報整形処理を行う。
また、ここで、話題管理部214は、上述した入力情報に加えて、以前に取得した対話情報524を入力してもよい。
ここでの関連資料506は、デジタル対話より前に作成され、デジタル対話に関連する資料であり、例えばデジタル対話の議題に関連するプレゼンテーション資料や、参考資料等であってもよい。一例として、デジタル対話が採用面接の場合、この関連資料506は、候補者に対して実施したアンケートへの回答や、候補者の職務経歴書等を含んでもよい。
評価項目・話題対応表508は、話題と評価項目との対応関係を示す表形式の情報である。一例として、デジタル対話が採用面接の場合、評価項目・話題対応表508は、「前職で担当した案件」との話題が「業務経験」との評価項目に対応することを示してもよい。
なお、現在の話題に関連性が高い関連資料を対話インターフェース306に表示するための関連情報整形処理の詳細については後述するため、ここではその説明を省略する。
次に、ステップS514では、対話インターフェース部212は、ステップS510の話題整形処理及びステップS512の関連情報整形処理から取得した情報に基づいて、対話インターフェース306を描画する。
上述したように、ここで、対話インターフェース部212は、各話者の映像、テキストチャットのウインドウ、カメラ及びマイクロフォンの設定項目等に加えて、現在の話題に関連性が高い話題候補を強調表示した話題選択一覧302と、現在の話題に関連性が高い関連情報とを含む対話インターフェース306を生成してもよい。この対話インターフェース306は、デジタル対話に参加している話者の対話装置(第1の対話装置220及び/又は第2の対話装置230)に表示されてもよい。
次に、ステップS516では、対話インターフェース部212は、対話記録308及び参加者メモ522を取得し、話題管理部214は、話題指定情報310を取得する。ここで、対話記録308、参加者メモ522及び話題指定情報310を含む情報のセットは、「対話情報」524と総称する。
上述したように、対話記録308は、デジタル対話を記録した情報であり、音声情報、映像情報、又はその両方を含んでもよい。
また、上述したように、話題指定情報310は、対話インターフェース306において表示される話題選択一覧302から選択された第1の話題タグと、第1の話題の第1の開始時刻と、第1の話題の第1の終了時刻とを含む情報である。
参加者メモ522は、対話インターフェース306において、デジタル対話に参加している話者によって入力されたノートである。この参加者メモ522の情報は、話題毎に記録されてもよい。
ここで取得される対話情報524は、ステップS510の話題整形処理及びステップS512の関連情報整形処理へフィードバックされる。このように、以降に実施された話題整形処理及び関連情報整形処理は、対話情報524を用いることで、より精度の高い話題整形の結果及び関連情報整形の結果を提供することができる。
次に、図6を参照して、本開示の実施形態に係る話題整形処理及び関連情報整形処理について説明する。
図6は、本開示の実施形態に係る話題整形処理及び関連情報整形処理を説明するための図である。図6には、話題整形処理を用いて作成された対話インターフェース610の一例と、関連情報整形処理を用いて作成された対話インターフェース620の一例とが示されている。
上述したように、話題整形処理は、現在の話題に関連性が高い話題候補を話題選択一覧302において強調表示するための処理であり、話題管理部214によって実施される。
ここで、対話インターフェース部212は、所定の親近基準(例えば現時点から遡って所定の期間を指定する基準)を満たす第1の発話(例えば、直近10秒間以内に発せられた発言)を取得し、この第1の発話をテキスト情報に変換することで第1の発話テキスト情報を生成する。この第1の発話は、デジタル対話に参加している話者のいずれかに発せられた発言であってもよい。また、この第1の発話をテキスト情報に変換するために、既存の自動音声認識手段を用いてもよい。
次に、話題管理部214は、第1の発話テキスト情報と、話題選択一覧302に含まれる話題候補との関連度を判定する。ここで、関連度を判定する方法として、以下の2通りの内のいずれかを用いてもよい。
1通り目の関連度判定方法では、話題管理部214は、事前に収集された話題遷移データの中から、現在の話題遷移に対応する話題遷移データを検索する。その後、話題管理部214は、検索した話題遷移データに含まれ、話題選択一覧302の話題候補のそれぞれに対応付けられている照合テキスト情報と、第1の発話テキスト情報とを、比較することで、第1の発話の、複数の話題候補のそれぞれに対する関連度を一致する単語数に基づいて計算する。ここでの照合テキストは、特定の話題候補に関連性が高いと判断され、当該話題を話す際に登場する確率が高いと予測され、事前に用意したテキスト情報であり、上述した話題遷移データに含まれる情報である。
また、ここでは、一致する単語数の他にも、自然言語処理によって判定される意味的情報の類似度を用いて第1の発話テキスト情報と、話題選択一覧302に含まれる話題候補との関連度を判定してもよい。
また、2通り目の関連度判定方法では、話題管理部214は、事前に収集された話題遷移データの中から、現在の話題遷移に対応する話題遷移データを検索し、検索した話題遷移データによって指定される次の遷移先に対応する話題候補を関連度の高い話題候補として出力してもよい。
このように、第1の発話テキスト情報と、話題遷移データとに基づいて、現在の対話の内容と、話題候補との関連性を判定することができる。
次に、話題管理部214は、第1の発話との関連度が所定の関連度基準を満たす話題候補(例えば、関連度が最も高い候補等)を判定し、対話インターフェース部212は、判定した話題候補を話題選択一覧302において強調表示する。
図6に示すように、対話インターフェース部212は、話題整形処理を用いて作成された対話インターフェース610において、第1の発話との関連度が所定の関連度基準を満たす話題候補について、上位の位置に表示してもよく、色を変えて強調表示してもよく、「推奨」等の文字タグを追加して強調表示してもよく、強調表示の方法は特に限定されない。また、対話インターフェース610に示すように、対話インターフェース部212は、一定の関連度を有する他の話題候補について「候補」等の文字タグを表示してもよい。
また、上述したように、関連情報整形処理は、現在の話題に関連性が高い関連資料を対話インターフェースに表示するための処理であり、話題管理部214によって実施される。
ここで、話題管理部214は、話題整形処理と同様に、所定の親近基準(例えば現時点から遡って所定の期間を指定する基準)を満たす第2の発話(例えば、直近10秒間以内に発せられた発言)を取得し、当該第2の発話をテキスト情報に変換することで第2の発話テキスト情報を生成してもよい。この第2の発話は、デジタル対話に参加している話者のいずれかに発せられた発言であってもよい。また、この第2の発話をテキスト情報に変換するために、既存の自動音声認識手段を用いてもよい。
次に、話題管理部214は、第2の発話テキスト情報を、現在のデジタル対話に関連する関連資料に比較することで、第2の発話の、関連資料に含まれる項目のそれぞれに対する関連度を計算する。ここで、第2の発話の、関連資料に含まれる複数の項目のそれぞれに対する関連度を計算するためには、対話インターフェース部212は、関連資料に含まれる項目毎に、第2の発話テキスト情報と一致する単語数に基づいて計算してもよく、自然言語処理によって得られる意味的情報の類似度に基づいて計算してもよい。
次に、話題管理部214は、第2の発話との関連度が所定の関連度基準を満たす関連資料の項目(例えば、関連度が最も高い項目等)を判定し、対話インターフェース部212は、判定した項目を対話インターフェース306において表示する。
図6に示すように、対話インターフェース部212は、関連情報整形処理を用いて作成された対話インターフェース620において、第2の発話との関連度が所定の関連度基準を満たす関連資料の項目626として、事前に実施されたアンケートへの回答を表示してもよい。また、対話インターフェース部212は、対話インターフェース620において、デジタル対話に参加している話者によって入力された参加者メモ522を入力するウインドウを表示してもよい。
更に、本開示の一態様において、表示される関連資料の項目626の情報が対話インターフェース620に収まらない場合、対話インターフェース部212は、デジタル対話の現在の話題の内容に基づいて、関連資料の項目626を自動的にスクロールしてもよい。ここで、対話インターフェース部212は、上述したように、現時点から遡って所定の時間以内に発せられた発話をテキスト情報に変換し、当該テキスト情報と関連資料の項目626とで一致する単語数が最も高い関連資料の項目626を容易に視認可能な位置となるようにスクロールを行ってもよい。
上述した話題整形処理によれば、話題指定情報を入力する際、話題選択一覧302において多数の話題候補が表示される場合であっても、現在の話題に関連性が高い話題候補を話題選択一覧302において強調表示することができる。これにより、所望の話題を探して選択する手間が省け、話題指定情報を入力する対話の参加者は、現在の話題に関連性が高い話題候補を容易に選択することができる。
また、上述した関連情報整形処理によれば、現在の話題に関連性が高い関連資料を対話インターフェース306において表示することができる。これにより、対話の参加者は、対話を行いながら関連性の高い資料を容易に確認することが可能となる。
次に、図7を参照して、本開示の実施形態に係る対話記録タイミング補正処理について説明する。
図7は、本開示の実施形態に係る対話記録タイミング補正処理700の流れの一例を示す図である。図7に示す対話記録タイミング補正処理700は、デジタル対話の参加者である話者によって指定された話題の開始及び終了時刻(第1の開始及び終了時刻)を、より正確な時刻(第2の開始及び終了時刻)に補正するための処理であり、対話管理装置210における対話編集部216によって実施される。
上述したように、本開示の一態様では、対話を実施している最中に、現在の話題を予め用意された候補から選択するための話題選択一覧302を対話インターフェース306において表示し、現在の話題を示す話題タグと、現在の話題の開始時刻及び終了時刻とを指定する話題指定情報の入力を対話の参加者から受け付ける。
しかし、話題指定情報を入力する際、話者によって指定された話題の開始時刻及び終了時刻が実際の話題の開始時刻及び終了時刻からずれてしまうことがある。これは、例えば、話者が誤って新たな話題の開始時刻を早く選択した場合や、話者が話題の開始時刻の選択を忘れてしまい、遅れて選択した場合等が考えられる。
そこで、本開示の実施形態に係る対話記録タイミング補正処理700の一態様は、デジタル対話の参加者である話者によって指定された話題の開始及び終了時刻を、より正確な時刻に補正することに関する。話題のより正確な変更時刻は、例えば対話記録に示される話者の表情の変化、口の動き、単語の変化等を解析することで判定することができる。このように、話題の開始及び終了時刻を、より正確な時刻に補正することで、より正確にラベル付けされた編集済み対話記録を生成することができる。
まず、ステップS704では、対話編集部216は、後述する話題無効判定に用いられる最小話題時間706を、話題遷移データ502及び最小話題時間算出係数702に基づいて計算する。
対話記録タイミング補正処理700を行う際、デジタル対話の参加者である話者によって指定された話題の開始及び終了時刻を、より正確な時刻に補正するためには、所定の長さ閾値を満たさない話題(つまり、話が短すぎる話題)を排除することが望ましい。最小話題時間706は、タイミング補正を行うに当たって有効な話題及び無効な話題を区別するための長さ閾値を示す情報である。以下では、説明の便宜上、特定の話題の開始時刻から終了時刻までの時間を「話題時間」という。
この最小話題時間706は、事前に管理者等により設定されてもよく、話題遷移データ502及び最小話題時間算出係数702から計算されてもよい。この場合、対話編集部216は、事前に収集された話題遷移データの中から、最も短い話題時間を、当該話題遷移データに含まれる補正前・補正後の時刻に基づいて判定し、判定した最も短い話題時間に対して、予め設定された最小話題時間算出係数702を掛算することで最小話題時間706を計算してもよい。
ステップS708では、対話編集部216は、話題遷移データ502に基づいて、補正前後話題変更タイミング差分710を計算する。
対話記録タイミング補正処理700を行う際、デジタル対話の参加者である話者によって指定された話題の開始及び終了時刻を、話者によって指定された話題の開始及び終了時刻との差分が小さい話題変更タイミング候補に補正することが望ましい。したがって、ここでは、対話編集部216は、話題変更タイミング候補の内、話者によって指定された話題の開始及び終了時刻との差分が大きい話題変更タイミング候補を排除するための閾値として、補正前後話題変更タイミング差分710を計算する。
ここで、対話編集部216は、補正前後話題変更タイミング差分710を、過去の話題遷移データ502における補正前の話題開始時刻及び話題終了時刻と、補正後の話題開始時刻及び話題終了時刻との差分の平均値を算出し、算出した平均値を補正前後話題変更タイミング差分710(時刻差分閾値)としてもよい。
ステップS714では、対話編集部216は、対象の対話記録の話題選択履歴712(つまり、当該対話記録について指定された全ての話題開始時刻及び話題終了時刻を示す情報)に基づいて、話題毎の話題時間を算出する。一例として、対話編集部216は、第1の話題の話題時間が3分47秒であり、第2の話題の話題時間が27秒であり、第3の話題の話題時間が8分16秒であると判定し、これらの情報を話題毎時間716として出力してもよい。
ステップS718では、対話編集部216は、ステップS704で計算された最小話題時間706と、ステップS714で計算された話題毎時間716とに基づいて、話題無効判定を行う。ここでの話題無効判定とは、タイミング補正を行うに当たって有効な話題及び無効な話題を区別するための判定である。対話編集部216は、ステップS714で計算された話題毎時間716を、ステップS704で計算された最小話題時間706に比較することで、対話記録に含まれる話題毎に、当該話題の話題時間が最小話題時間706を満たすか否かを判定する。最小話題時間706を満たさない話題を無効な話題として排除し、最小話題時間706を満たす話題のみを含む有効話題選択履歴720を出力する。
ステップS724では、対話編集部216は、対話記録308を解析することで、話題の新たな開始時刻及び終了時刻(つまり、デジタル対話の参加者である話者によって指定された話題の開始及び終了時刻より正確な開始時刻及び終了時刻)の候補である話題変更タイミング候補726を判定する。ここで、対話編集部216は、所定の顔認識手段や音声分析手段を用いて対話記録308を解析してもよい。例えば、対話編集部216は、話者の話し出し、表情の変化、及び/又は単語の変化を話者分離、音声分析、自動音声認識等の解析手段で解析することで話題変更タイミング候補726を判定してもよい。
ステップS730では、対話編集部216は、ステップS708で計算された補正前後話題変更タイミング差分710と、ステップS718で生成された有効話題選択履歴720と、ステップS724で計算された話題変更タイミング候補726とに基づいて、補正後話題選択履歴732を生成する。
より具体的には、対話編集部216は、有効話題選択履歴720において、話題変更タイミング候補726との差分が補正前後話題変更タイミング差分710以内の話題開始・終了時刻が存在する場合、当該話題開始・終了時刻を、話題変更タイミング候補726に補正する。
一例として、有効話題選択履歴720において、話者によって指定された第1の話題の開始時刻として「01:30」が含まれており、話題変更タイミング候補726において、第1の話題の開始時刻の変更タイミング候補として「01:28」、「02:30」、「03:30」が含まれており、補正前後話題変更タイミング差分710が「5秒」である場合を検討する。この場合、「01:28」との変更タイミング候補は、「01:30」との話者によって指定された第1の話題の開始時刻との差分が補正前後話題変更タイミング差分710に規定される「5秒」以内であるため、「01:28」との変更タイミング候補が採用され、「01:30」との第1の話題の開始時刻が「01:28」へ補正される。
以上説明した処理を、有効話題選択履歴720に含まれる全ての話題開始・終了時刻に対して実施することで、デジタル対話の参加者である話者によって指定された話題の開始及び終了時刻を、より正確な時刻に補正した補正後話題選択履歴732を生成することができる。
次に、ステップS316では、対話編集部216は、ステップS730で生成された補正後話題選択履歴732に基づいて対話記録308を編集することで、デジタル対話の参加者である話者によって指定された話題の開始及び終了時刻がより正確な時刻に補正され、且つ話題毎に整理した編集済み対話記録318を生成する。
上述した対話記録タイミング補正処理700によれば、話者によって指定された話題の開始時刻及び終了時刻が実際の話題の開始時刻及び終了時刻からずれてしまった場合において、話者によって指定された話題の開始時刻及び終了時刻を、顔認識や音声分析等の解析手段によって判定された時刻に補正することで、より正確にラベル付けされた編集済み対話記録を生成することができる。
次に、図8を参照して、本開示の実施形態に係る有用話題遷移データ登録処理について説明する。
図8は、本開示の実施形態に係る有用話題遷移データ登録処理800の流れの一例を示す図である。図8に示す有用話題遷移データ登録処理800は、有用話題遷移データを登録するための処理であり、対話管理装置210における対話編集部216によって実施される。
上述した対話インターフェース描画処理500及び対話記録タイミング補正処理700において、ある話題(第1の話題)から別の話題(第2の話題)への遷移に関する情報を示す話題遷移データ502が用いられる。例えば、対話インターフェース描画処理500においては、話題遷移データ502は、現在の話題に関連性が高い話題候補を話題選択一覧302において強調表示するための話題整形処理に用いられる。また、対話記録タイミング補正処理700においては、話題遷移データ502は、適切な補正前後話題変更タイミング差分710を計算するために用いられる。
しかし、話題遷移が適切でない(例えば、話題遷移が論理的に不自然な)話題遷移データ502を用いると、上述した処理の精度が低下してしまうことがある。そこで、本開示の実施形態に係る有用話題遷移データ登録処理800は、適切な話題遷移を含み、対話インターフェース描画処理500及び対話記録タイミング補正処理700の精度を向上させる有用な話題遷移データを選別し、登録することに関する。
まず、ステップS802では、対話編集部216は、編集済み対話記録318、関連資料506、評価項目・話題対応表508及び参加者メモ522とに基づいて、評価項目毎に整理した対話記録である評価項目毎対話記録804を生成する。この評価項目毎対話記録804は、評価項目毎に整理されている点において、話題毎に整理した編集済み対話記録318と異なる。
より具体的には、対話編集部216は、編集済み対話記録318、関連資料506、評価項目・話題対応表508及び参加者メモ522とに基づいて、同一の評価項目に該当する話題を特定し、特定した話題に対応する対話記録部分をまとめることで評価項目毎対話記録804を生成してもよい。この評価項目毎対話記録804において、複数の異なる話題が同一の評価項目に対応する場合、これらの複数の話題が1つの「話題グループ」として結合されてもよい。
次に、ステップS806では、対話編集部216は、評価項目毎対話記録804に基づいて、評価項目毎の話題グループの確信度である評価項目毎確信度808を計算する。ここでの評価項目毎確信度808は、評価項目毎対話記録804における各話題グループ毎に、当該話題グループが所定の評価項目を評価するための有用性を示す尺度である。
ここで、評価項目毎確信度808を計算する方法として、以下の2通りの内のいずれかを用いてもよい。
1通り目では、対話編集部216は、過去の評価項目毎対話記録804からの特徴量(例えば、表情の特徴、音声の特徴)及び当該評価項目毎対話記録804に対応する評価結果を学習データとして、xgboost等を用いて予測モデルを学習しておく。その後、このように学習した予測モデルに対して、処理対象の評価項目毎対話記録804を入力し、評価項目毎対話記録804の特徴量を算出する(フレームごとに表情や音声を識別し、表情又は音声毎のフレーム数を算出する)際の予測モデルの確信度を評価項目毎確信度808としてもよい。
2通り目では、対話編集部216は、上述したように学習した予測モデルを用いて、評価項目毎対話記録804からの新規の特徴量(例えば、表情の特徴、音声の特徴)を算出し、評価結果を予測し、予測モデルの予測確率を評価項目毎確信度808としてもよい。
次に、ステップS810では、対話編集部216は、評価項目毎確信度808に基づいて、話題毎の確信度を示す話題毎確信度812を計算する。上述したように、評価項目毎確信度808は、各評価項目に該当する複数の話題を結合した話題グループ毎の確信度を示す値であるが、有用性の高い話題遷移データを選別するためには、各話題毎の確信度を算出することが望ましい。
ここで、対話編集部216は、評価項目毎確信度808に示す話題グループ毎の確信度を話題毎に平均することで話題毎確信度812を計算してもよい。
一例として、第1の評価項目について、第1の話題及び第3の話題からなる第1の話題グループの確信度が「0.3」であり、第2の評価項目について、第2の話題及び第3の話題からなる第2話題グループの確信度が「0.8」であるとする。
この場合、第1の話題は、第1の評価項目に対応する第1の話題グループのみに登場するため、確信度が「0.3」となる。また、第2の話題は、第2の評価項目に対応する第2の話題グループのみに登場するため、確信度が「0.8」となる。また、第3の話題は、第1の評価項目に対応する第1の話題グループ及び第2の評価項目に対応する第2の話題グループの両方に登場するため、確信度が「0.3」と「0.8」との平均値である「0.55」となる。
次に、ステップS816では、対話編集部216は、ステップS810で計算した話題毎確信度812と、予め設定される話題毎確信度遷移閾値814と、上述した対話記録タイミング補正処理700において生成された補正後話題選択履歴732とに基づいて、有用な話題遷移データ502を選別する。ここで、対話編集部216は、ステップS810で話題毎確信度812を計算した話題を用いて全ての組み合わせを生成し、各組み合わせについて、話題毎確信度812の平均値を、当該組み合わせを話題遷移とした場合の有用性を示す話題遷移確信度とする。
一例として、確信度が「0.3」である第1の話題と確信度が「0.8」である第2の話題とからなる組み合わせの場合、第1の話題から第2の話題へ遷移した場合の有効性を示す話題遷移確信度は、「0.3」と「0.8」との平均値である「0.55」となる。また、確信度が「0.8」である第2の話題と確信度が「0.55」である第3の話題とからなる組み合わせの場合、第2の話題から第3の話題へ遷移した場合の有効性を示す話題遷移確信度は、「0.8」と「0.55」との平均値である「0.675」となる。
話題遷移確信度を計算した後、対話編集部216は、予め設定した話題毎確信度遷移閾値814以上の話題遷移確信度を有する話題の組み合わせを有効な話題遷移データ502として登録し、予め設定した話題毎確信度遷移閾値814未満の話題遷移確信度を有する話題の組み合わせを対話記録タイミング補正処理700から除去する。
ここで、対話編集部216は、例えば、有効と判定された話題遷移データ502を、対話インターフェース描画処理500及び対話記録タイミング補正処理700において使用可能なデータベースに保存しておくことで話題遷移データ502を登録してもよい。
以上説明した有用話題遷移データ登録処理800によれば、適切な話題遷移を含み、対話インターフェース描画処理500及び対話記録タイミング補正処理700の精度を向上させる有用話題遷移データを選別し、登録することができる。
本開示の実施形態に係る対話管理手段によれば、例えば話題が様々に展開される対話であっても、話題毎に整理した、編集済み対話記録を生成することができる。
また、本開示の実施形態の一態様によれば、現在の話題に関連性が高い話題候補を話題選択一覧において強調表示することができる。これにより、所望の話題を探して選択する手間が省け、話題指定情報を入力する対話の参加者は、現在の話題に関連性が高い話題候補を容易に選択することができる。
また、本開示の実施形態の一態様によれば、現在の話題に関連性が高い関連資料(例えば、評価項目の評価基準等)を対話インターフェースにおいて表示することができる。これにより、対話の参加者は、対話を行いながら関連性の高い資料を容易に確認することが可能となる。
更に、本開示の実施形態の一態様によれば、デジタル対話の参加者である話者によって指定された話題の開始及び終了時刻を、例えば対話記録に示される話者の表情の変化、口の動き、単語の変化等によって判定したより正確な時刻に補正することができる。これにより、より正確にラベル付けされた編集済み対話記録を生成することができる。
以上、本発明の実施の形態について説明したが、本発明は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
200 対話管理システム
210 対話管理装置
212 対話インターフェース部
214 話題管理部
216 対話編集部
220 第1の対話装置
225 通信ネットワーク
230 第2の対話装置
300 話題毎対話記録生成処理
500 対話インターフェース描画処理
700 対話記録タイミング補正処理
800 有用話題遷移データ登録処理

Claims (12)

  1. 対話管理装置であって、
    複数の話者との間でデジタル対話を行うための対話インターフェースを提供し、前記デジタル対話の対話記録を取得する対話インターフェース部と、
    前記デジタル対話の最中に、前記デジタル対話における話題を指定するための話題指定情報の入力を受け付ける話題管理部と、
    前記話題指定情報に基づいて前記対話記録を編集することで、話題毎に整理した編集済み対話記録を生成する対話編集部と、
    を含むことを特徴とする対話管理装置。
  2. 前記対話記録は、
    前記デジタル対話に対応する音声情報又は映像情報又はその両方を含む、
    ことを特徴とする、請求項1に記載の対話管理装置。
  3. 前記話題管理部は、
    複数の話題候補を含む話題選択一覧を前記対話インターフェースにおいて表示し、
    前記話者からの入力に基づいて、前記話題選択一覧から選択された第1の話題タグと、第1の話題の第1の開始時刻と、前記第1の話題の第1の終了時刻とを前記話題指定情報として受け付け、
    前記第1の話題の第1の開始時刻と、前記第1の話題の第1終了時刻とに対応する第1の対話記録部分に対して、前記第1の話題タグを対応付ける、
    ことを特徴とする、請求項1に記載の対話管理装置。
  4. 前記対話編集部は、
    前記対話記録を所定の解析手段によって解析することで、前記第1の話題の第2の開始時刻と、前記第1の話題の第2の終了時刻とを判定し、
    前記第1の話題の第2の開始時刻と、前記話題指定情報に含まれる前記第1の話題の第1の開始時刻とを比較することで、前記第1の話題の第2の開始時刻と、前記第1の話題の第1の開始時刻との時刻差分を計算し、
    過去の対話における話題間の遷移に関する情報を示す話題遷移データに基づいて、時刻差分閾値を計算し、
    前記時刻差分が前記時刻差分閾値を満たす場合、前記第1の対話記録部分から前記第1の話題タグを削除すると共に、前記第1の話題タグを、前記第1の話題の第2の開始時刻と、前記第1の話題の第2の終了時刻とに対応する第2の対話記録部分に対して対応付ける、
    ことを特徴とする、請求項3に記載の対話管理装置。
  5. 前記対話編集部は、
    前記対話記録から、前記第1の話題タグに対応付けられている対話記録部分を抽出し、まとめることで、話題毎に整理した編集済み対話記録を生成する、
    ことを特徴とする、請求項3に記載の対話管理装置。
  6. 前記解析手段は、
    前記話者の表情の変化、口の動き、及び単語の変化のいずれか一方を解析するように構成された解析手段である、
    ことを特徴とする、請求項4に記載の対話管理装置。
  7. 前記話題管理部は、
    前記話題遷移データの中から、前記第1の話題タグに対応する第1の話題遷移データを検索し、
    検索した前記第1の話題遷移データによって指定される遷移先に対応する話題候補を判定し、
    前記対話インターフェース部は、
    判定した前記話題候補を前記話題選択一覧において強調表示する、
    ことを特徴とする、請求項4に記載の対話管理装置。
  8. 前記話題管理部は、
    前記デジタル対話において、所定の親近基準を満たす第1の発話を取得し、前記第1の発話をテキスト情報に変換することで第1の発話テキスト情報を生成し、
    前記話題遷移データの中から、前記第1の話題タグに対応し、前記話題選択一覧に含まれる前記複数の話題候補のそれぞれに対応付けられている照合テキスト情報を含む第2の話題遷移データを検索し、
    前記第1の発話テキスト情報を、前記第2の話題遷移データに含まれる前記照合テキスト情報に比較することで、前記第1の発話の前記複数の話題候補のそれぞれに対する関連度を計算し、
    前記第1の発話との前記関連度が所定の関連度基準を満たす話題候補を判定し、
    前記対話インターフェース部は、
    判定した前記話題候補を前記話題選択一覧において強調表示する、
    ことを特徴とする、請求項4に記載の対話管理装置。
  9. 前記話題管理部は、
    前記デジタル対話において、所定の親近基準を満たす第2の発話を取得し、前記第2の発話をテキスト情報に変換することで第2の発話テキスト情報を生成し、
    前記第2の発話テキスト情報を、前記デジタル対話に関連する関連資料に比較することで、前記第2の発話の、前記関連資料に含まれる複数の項目のそれぞれに対する関連度を計算し、
    前記第2の発話との前記関連度が所定の関連度基準を満たす項目を判定し、
    前記対話インターフェース部は、
    判定した前記項目を前記対話インターフェースにおいて表示する、
    ことを特徴とする、請求項1に記載の対話管理装置。
  10. 前記対話編集部は、
    話題毎に整理した前記編集済み対話記録と、評価の対象となる評価項目及び話題の対応関係を示す評価項目・話題対応表とに基づいて、評価項目毎に整理した評価項目毎対話記録を生成し、
    前記評価項目毎対話記録を所定の解析手段によって解析することで、第1の話題及び第2の話題からなる話題グループの、評価項目を評価するための有用性を示す評価項目毎確信度を計算し、
    前記評価項目毎確信度に基づいて、前記評価項目を評価するための有用性を示す第1の話題毎確信度及び第2の話題毎確信度を計算し、
    前記第1の話題毎確信度と、前記第2の話題毎確信度とに基づいて、前記第1の話題から前記第2の話題への第1の話題遷移に関する第1の話題遷移確信度を計算し、
    前記第1の話題遷移確信度が所定の話題遷移確信度基準を満たす場合、前記第1の話題遷移を、所定の評価項目を評価するため有用な話題遷移として判定し、登録する、
    ことを特徴とする、請求項1に記載の対話管理装置。
  11. 第1の話者に用いられる第1の対話装置と、第2の話者に用いられる第2の対話装置と、前記第1の話者及び前記第2の話者との間でデジタル対話を行うための対話管理装置とが通信ネットワークを介して接続される対話管理システムにおいて、
    前記対話管理装置は、
    前記第1の話者及び前記第2の話者との間でデジタル対話を行うための対話インターフェースを前記第1の対話装置及び前記第2の対話装置へ提供し、前記デジタル対話の対話記録を取得する対話インターフェース部と、
    前記デジタル対話の最中に、前記デジタル対話における話題を指定するための話題指定情報の入力を受け付ける話題管理部と、
    前記話題指定情報に基づいて前記対話記録を編集することで、話題毎に整理した編集済み対話記録を生成する対話編集部と、
    を含むことを特徴とする対話管理システム。
  12. 対話管理方法であって、
    複数の話者との間でデジタル対話を行うための対話インターフェースを提供する工程と、
    複数の話題候補を含む話題選択一覧を前記対話インターフェースにおいて表示する工程と、
    前記デジタル対話の記録を開始する工程と、
    前記話者からの入力に基づいて、前記話題選択一覧から選択された第1の話題タグと、第1の話題の第1の開始時刻と、前記第1の話題の第1の終了時刻とを話題指定情報として受け付ける工程と、
    前記第1の話題の第1の開始時刻と、前記第1の話題の第1終了時刻とに対応する第1の対話記録部分に対して、前記第1の話題タグを対応付ける工程と、
    前記デジタル対話の記録を終了し、対話記録を取得する工程と、
    前記対話記録から、前記第1の話題タグに対応付けられている対話記録部分を抽出し、まとめることで、話題毎に整理した編集済み対話記録を生成する工程と、
    を含むことを特徴とする対話管理方法。
JP2021192783A 2021-11-29 2021-11-29 対話管理装置、対話管理システム及び対話管理方法 Pending JP2023079353A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021192783A JP2023079353A (ja) 2021-11-29 2021-11-29 対話管理装置、対話管理システム及び対話管理方法
PCT/JP2022/041906 WO2023095629A1 (ja) 2021-11-29 2022-11-10 対話管理装置、対話管理システム及び対話管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021192783A JP2023079353A (ja) 2021-11-29 2021-11-29 対話管理装置、対話管理システム及び対話管理方法

Publications (2)

Publication Number Publication Date
JP2023079353A true JP2023079353A (ja) 2023-06-08
JP2023079353A5 JP2023079353A5 (ja) 2024-04-25

Family

ID=86539492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021192783A Pending JP2023079353A (ja) 2021-11-29 2021-11-29 対話管理装置、対話管理システム及び対話管理方法

Country Status (2)

Country Link
JP (1) JP2023079353A (ja)
WO (1) WO2023095629A1 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259389A (ja) * 1999-03-09 2000-09-22 Fuji Xerox Co Ltd 対話記録システム及び対話記録合成装置
JP2004007561A (ja) * 2002-04-15 2004-01-08 Sumitomo Electric Ind Ltd テレビ会議システム、それに含まれる端末装置、及びデータ配信方法
US10645035B2 (en) * 2017-11-02 2020-05-05 Google Llc Automated assistants with conference capabilities
JP2019139572A (ja) * 2018-02-13 2019-08-22 キヤノン株式会社 会議システム、要約装置、会議システムの制御方法、要約装置の制御方法、並びにプログラム
JP2021117759A (ja) * 2020-01-27 2021-08-10 株式会社日立製作所 テキスト情報編集装置及びテキスト情報編集方法

Also Published As

Publication number Publication date
WO2023095629A1 (ja) 2023-06-01

Similar Documents

Publication Publication Date Title
JP7464098B2 (ja) 電子会議システム
CN106685916B (zh) 电子会议智能装置及方法
EP3309730A1 (en) Creating agendas for electronic meetings using artificial intelligence
US20170169822A1 (en) Dialog text summarization device and method
US20140278405A1 (en) Automatic note taking within a virtual meeting
US11522730B2 (en) Customized meeting notes
CN116368785A (zh) 智能查询缓冲机制
KR20210095609A (ko) 회의록 열람 문서 생성 방법 및 그 장치
US20220172147A1 (en) System and method for facilitating an interviewing process
WO2023235580A1 (en) Video-based chapter generation for a communication session
WO2023095629A1 (ja) 対話管理装置、対話管理システム及び対話管理方法
TW202109388A (zh) 依據同目標求職者履歷產生履歷修改建議之系統及方法
CN114936001A (zh) 交互方法、装置及电子设备
US11514913B2 (en) Collaborative content management
JP6913995B1 (ja) 情報処理システム、情報処理方法及びプログラム
JP2023079353A5 (ja)
JP7496098B1 (ja) 情報処理システム、情報処理方法及びプログラム
US20230334427A1 (en) Information processing system
US20230230588A1 (en) Extracting filler words and phrases from a communication session
WO2023122319A1 (en) Method and apparatus for assessing participation in a multi-party communication
CN118355377A (zh) 建立语用行动项***

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240417